CN114005440A - 基于语音交互的问答方法、系统、电子设备及存储介质 - Google Patents
基于语音交互的问答方法、系统、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114005440A CN114005440A CN202111196270.0A CN202111196270A CN114005440A CN 114005440 A CN114005440 A CN 114005440A CN 202111196270 A CN202111196270 A CN 202111196270A CN 114005440 A CN114005440 A CN 114005440A
- Authority
- CN
- China
- Prior art keywords
- user
- question
- answer
- information
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 65
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000013475 authorization Methods 0.000 claims abstract description 119
- 238000004590 computer program Methods 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 9
- 230000006399 behavior Effects 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 description 16
- 230000004044 response Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/221—Announcement of recognition results
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种基于语音交互的问答方法、系统、电子设备及可存储介质,本方法通过获取用户授权状态,基于所述授权状态获取用户属性信息,所述用户属性信息用于表征用户的基本信息和用户当前所处的场景信息;根据所述用户属性信息获取目标问答资源;通过语音询问用户是否愿意参加所述目标问答资源的问答,响应于用户同意,基于预设播放规则语音播报所述目标问答资源;接收用户语音输入信息,将所述语音输入信息转换为文本信息,根据所述文本信息确定所述用户对当前问答题目的答案。本申请解决相关技术中现有问答方法基于文字交互的不便捷问题,提升了用户问答交互的积极性。
Description
技术领域
本申请属于计算机技术领域,具体而言,涉及一种基于语音交互的问答方法、系统、电子设备及存储介质。
背景技术
随着互联网的大力发展,线上进行问卷调查和服务评价已成为人们维护自己权益和提升服务质量的重要手段。
目前,现有的问卷调查和服务评价,通常是通过问卷的形式以文字展示于用户终端屏幕上,用户只能通过操作终端逐个浏览、按键输入进行反馈和填写,用户得一直盯着终端屏幕才可以进行反馈,需要花费用户的一些时间,且操作不便捷,导致用户积极性不高。
发明内容
本申请实施例的第一目的在于提供一种基于语音交互的问答方法,旨在解决上述现有技术存在的至少一个问题。
本申请实施例是这样实现的,一种基于语音交互的问答方法,应用于客户端,包括:
获取用户授权状态,基于所述授权状态获取用户属性信息,所述用户属性信息用于表征用户的基本信息和用户当前所处的场景信息;
根据所述用户属性信息获取目标问答资源;
通过语音询问用户是否愿意参加所述目标问答资源的问答,响应于用户同意,基于预设播放规则语音播报所述目标问答资源;
接收用户语音输入信息,将所述语音输入信息转换为文本信息,根据所述文本信息确定所述用户对当前问答题目的答案。
在一个实施例中,所述获取用户授权状态,基于所述授权状态获取用户属性信息包括:获取用户ID信息,发送所述用户ID信息的授权提示,接收用户对所述用户ID信息的授权操作,判断所述授权操作是否为同意授权,基于用户同意授权获取用户基本信息和用户当前所处的场景信息。
在一个实施例中,所述基本信息包括用户历史操作行为,所述根据所述用户属性信息获取问答资源包括:根据所述基本信息和场景信息从数据库中获取和所述场景信息相匹配的问答资源,获取所述用户的历史问答资源交互信息,若所述问答资源不属于历史问答资源交互信息,则将所述问答资源确定为目标问答资源,若所述问答资源属于历史问答资源交互信息,则从所述数据库中重新获取问答资源。
在一个实施例中,获取用户ID信息后,获取用户授权状态的方式包括:通过所述客户端的人机交互界面展示授权按钮,接收用户对所述授权按钮的授权操作;和/或通过所述客户端进行语音提示用户进行授权操作,接收用户语音输入的授权操作。
在一个实施例中,所述基于预设播放规则语音播报所述目标问答资源包括:识别所述目标问答资源的内容得到若干问答题目,依次播报所述若干问答题目,且当播报每个问答题目时,接收到每个问答题目的用户语音输入信息并确定答案后进行播放下一个问答题目,所述问答方法还包括,根据所述若干问答题目及对应的答案生成所述目标问答资源的结果资源。
在一个实施例中,所述预设播放规则包括多种播报语音包、答案提示、剩余题目提示和预估问答时间提示,在播报所述若干问答题目时,从所述多种播报语音包中随机确定一种播报语音包播报问答题目;在预设时间内未接收到用户语音输入时,语音播报答案提示;每次播报问答题目前,对剩余问答题目数量和预估问答时间进行语音播报。
在一个实施例中,所述根据所述文本信息确定所述用户对当前问答题目的答案包括:根据所述文本信息与数据库中预存的当前问题的答案进行比对,将与所述文本信息相同或相似度最高的答案确定为所述当前问答题目的答案。
本申请实施例的另一目的在于提供一种基于语音交互的问答系统,应用于客户端,包括:
请求模块,用于获取用户授权状态,基于所述授权状态获取用户属性信息所述用户属性信息用于表征用户的基本信息和用户当前所处的场景信息;
问答资源获取模块,用于根据所述用户属性信息获取目标问答资源;
播报模块,用于通过语音询问用户是否愿意参加所述目标问答资源的问答,响应于用户同意,基于预设播放规则语音播报所述目标问答资源;
答案处理模块,用于接收用户语音输入信息,将所述语音输入信息转换为文本信息,根据所述文本信息确定所述用户对当前问答题目的答案。
本申请实施例的又一目的在于提供一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述基于语音交互的问答方法的步骤。
本申请实施例的再一目的在于一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述基于语音交互的问答方法的步骤。
本申请实施例提供的一种基于语音交互的问答方法、系统、电子设备及存储介质,通过构建问卷调查或者服务评价数据库,取得用户授权后,个性化的将问卷调查推送至用户进行答复,且用户可以直接通过语音进行问卷调查和服务评价的回复,无需用户一直盯着终端屏幕进行答复,尤其是在车机场景和电话服务场景具有较好的体验,节省用户的时间的同时可以收集用户真实的反馈。
附图说明
图1为本申请一个实施例提供的基于语音交互的问答方法的实现流程;
图2为本申请实施例提供的基于语音交互的问答方法的核心流程图;
图3为本申请一个实施例提供的基于语音交互的问答系统的主要模块示意图;
图4为本申请实施例提供的可以应用于其中的示例性系统架构图;
图5为适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。
需要指出的是,在不冲突的情况下,本申请中的实施例以及实施例中的特征可以互相组合。
为了进一步阐述本申请为实现预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本申请的具体实施方式、结构、特征及其功效,详细说明如下。
图1示出了本申请一个实施例提供的一种基于语音交互的问答方法的实现流程,为了便于说明,仅示出与本申请实施例相关的部分,详述如下:
一种基于语音交互的问答方法,应用于客户端,包括以下步骤:
S101:获取用户授权状态,基于所述授权状态获取用户属性信息,所述用户属性信息用于表征用户的基本信息和用户当前所处的场景信息;
S102:根据所述用户属性信息获取目标问答资源;
S103:通过语音询问用户是否愿意参加所述目标问答资源的问答,响应于用户同意,基于预设播放规则语音播报所述目标问答资源;
S104:接收用户语音输入信息,将所述语音输入信息转换为文本信息,根据所述文本信息确定所述用户对当前问答题目的答案。
在步骤S101中:获取用户授权状态,基于所述授权状态获取用户属性信息,所述用户属性信息用于表征用户的基本信息和用户当前所处的场景信息。在取得用户授权后,获取到用户对应的属性信息,属性信息可以包括基本信息和用户当前所处环境的场景信息,以形成用户的基本画像以便后续对用户进行个性化的推送问答资源,以及推送适合用户当前场景所适合的问答资源。
在一个实施例中,所述获取用户授权状态,基于所述授权状态获取用户属性信息包括:获取用户ID信息,发送所述用户ID信息的授权提示,使得用户当前所使用终端上展示授权提示,接收用户对所述用户ID信息的授权操作,判断所述授权操作是否为同意授权,基于用户同意授权获取用户属性信息。在这里,可以通过获取用户ID信息(用户账户信息),然后发送该用户ID信息的登录提示或授权提示等和授权相关的内容作为授权提示,当用户进行登录或授权后,接收用户对该ID信息的授权操作,并判断该授权操作是否为同意授权,当用户同意授权后基于该授权进一步获取到用户的基本信息和用户当前所处的场景信息,以便于后续对用户的个性化推送问答资源。比如,用户可以主动登录用户ID以获得用户的授权,当用户登录后获得用户ID信息,进而获取用户的属性信息;也可以是获取到用户的ID信息后,提示用户是否同意授权或登录,当取得用户授权后获取用户属性信息。在这里,用户的授权操作可以是登录用户ID、同意登录用户ID或者不同意登录用户ID。
进一步,获取用户ID信息后,获取用户授权状态的方式包括:通过所述客户端的人机交互界面展示授权按钮,接收用户对所述授权按钮的授权操作;和/或通过所述客户端进行语音提示用户进行授权操作,接收用户语音输入的授权操作。比如,可以在获取到用户的ID信息后,在手机界面或者车载终端等终端设备上展示授权按钮,该授权按钮可以是提示用户进行登录操作或者提示用户是否同意登录、不同意登录等操作,还可以是在用户ID已经登录的情况下,提示用户是否同意为用户推送问答资源,当用户对授权按钮进行操作后,接收到用户是否同意的操作后进行相应的触发操作;还可以是在获取到用户的ID信息后,以语音交互的方式提示用户进行授权操作,比如通过车载终端或者手机终端提示用户对用户ID账户进行登录,或者在用户登录的情况下语音提示用户是否同意推送问答资源,用户可以直接通过语音和终端进行交互实现授权操作。由此提高用户交互的便捷性,避免用户在开车或走路等状态下无法进行操作终端,提高用户体验。
在步骤S102中:根据所述用户属性信息获取目标问答资源。当获取到用户的授权同意后,可根据用户的属性信息为用户获取适合用户的目标问答资源为用户推送。在本实施例中,可以预先在数据库中存储有多个问答资源,在得到用户授权后为用户在数据库中匹配到问答资源后推送给用户进行问答,也可以是通过系统直接将问答资源上传至数据库中,当获取到用户信息后为用户进行推送。在这里,问答资源可以通过后台系统进行建立然后存储至数据库中,当获取到用户属性信息后可以在数据库中进行调用为用户推送。
具体的,问答资源可以是调查问卷、用户服务评价等收集用户对某一事相、问题或者服务的观点和体验,比如针对某一产品的使用体验。问答资源可以以若干问答题目的形式构成,然后存储于数据库中。
在一个实施例中,所述基本信息包括用户历史操作行为,所述根据所述用户属性信息获取问答资源包括:根据所述基本信息和场景信息从数据库中获取和所述场景信息相匹配的问答资源,获取所述用户的历史问答资源交互信息,若所述问答资源不属于历史问答资源交互信息,则将所述问答资源确定为目标问答资源,若所述问答资源属于历史问答资源交互信息,则从所述数据库中重新获取问答资源。具体的,可以通过用户基本信息获取到用户历史的问答资源答复记录,由此在为用户推送问答资源可以避免问答资源的重复推送,浪费用户时间使得用户反感,可以提高问答资源的问答有效率。场景信息在这里可以包括用户当前所处环境的各种场景信息,比如可以准备多份问卷,比如上班时间要问的问卷,下班时间要问的问卷,周末要问的问卷,在景区的问卷,在商场的问卷,根据不同的场景,使用不同的问卷。由此可以使得推送适合用户当前场景所适合的问答资源,提高用户问答成功率。
在一个实施例中,基本信息还可以包括性别、年龄、职业等信息,以便为用户推送更加适合用户答复的问答资源。
在步骤S103中:通过语音询问用户是否愿意参加所述目标问答资源的问答,响应于用户同意,基于预设播放规则语音播报所述目标问答资源。在获取到目标问答资源后,通过语音询问用户是否愿意参加所述目标问答资源的问答,响应于用户同意,通过语音播报的形式为用户进行播报推送,可以使得用户在开车走路等场景时,便于用户的交互,提高用户问答的积极性和趣味性。
在一个实施例中,所述基于预设播放规则语音播报所述目标问答资源包括:识别所述目标问答资源的内容得到若干问答题目,依次播报所述若干问答题目,且当播报每个问答题目时,接收到每个问答题目的用户语音输入信息并确定答案后进行播放下一个问答题目,所述问答方法还包括,根据所述若干问答题目及对应的答案生成所述目标问答资源的结果资源。由此可以给于用户一定的答复时间,提高问答有效性。当一个问答资源的所有题目的答案均确定后,生成该问答资源的结果资源,然后将结果资源存储于数据库中,便于后续的统计分析。
进一步,所述预设播放规则包括多种播报语音包、答案提示、剩余题目提示和预估问答时间提示,在播报所述若干问答题目时,从所述多种播报语音包中随机确定一种播报语音包播报问答题目;在预设时间内未接收到用户语音输入时,语音播报答案提示;每次播报问答题目前,对剩余问答题目数量和预估问答时间进行语音播报。由此可以提高用户答题的有效性和趣味性。
在步骤S104中:接收用户语音输入信息,将所述语音输入信息转换为文本信息,根据所述文本信息确定所述用户对当前问答题目的答案。在用户收到终端播报的问答资源的问答题目时,用户可以通过语音直接讲出相应的答案,在接收到用户的语音输出信息时,对该语音信息进行语音识别将其转换为文本信息,然后根据检测出的文本信息确定用户对当前问答题目的答复答案。由此可以通过将用户通过语音作答的答案匹配出答案选项。
进一步,所述根据所述文本信息确定所述用户对当前问答题目的答案包括:根据所述文本信息与数据库中预存的当前问题的答案进行比对,将与所述文本信息相同或相似度最高的答案确定为所述当前问答题目的答案。在这里,在建立每个问答资源时,每个问答题目相应的建立有一定的选项或者答案,会将该选项或者答案以结构化语句存储在数据库中,当收到用户对题目的语音答复后,将其转换为文本信息,然后在数据库中进行查询对比,并通过语义识别模型找出最接近用户答复的选项或者答案,作为用户的输入答案。由此可以提高用户答复的准确性。
由此,本申请实施例提供的基于语音交互的问答方法,通过构建问卷调查或者服务评价数据库,取得用户授权后,个性化的将问卷调查推送至用户进行答复,且用户可以直接通过语音进行问卷调查和服务评价的回复,无需用户一直盯着终端屏幕进行答复,尤其是在车机场景和电话服务场景具有较好的体验,节省用户的时间的同时可以收集用户真实的反馈。
如图2所示,为本申请实施例提供的基于语音交互的问答方法的核心流程图,当问答开始前,可以通过用户的当前场景和基本信息得到对应的问卷,然后通过语音询问用户是否愿意参加问答调查,若用户不同意则结束流程,若用户同意,则语音播报题目内容,然后等待用户作答,用户语音作答后分析用户作答语音,匹配答案选项,确定好一个题目的答案后,判断是否有下一个题目,若有则继续语音播报,确定后续所有的题目答案选项,若没有下一个题目则语音感谢用户作答,流程结束。
在一个具体的实施例中,本基于语音交互的问答方法,应用于车载终端,问答资源为调查问卷,可以预先在数据库中建立若干调查问卷,也可以通过系统或者存储设备将调查问卷直接导入车载终端,当用户在车内时,可以在取得用户授权后,根据用户的信息为用户选择一套调查问卷进行播报和用户进行语音交互完成对问卷的收集。由此可以节省用户时间,还可以提高问卷答题的趣味性和用户的积极性。
在另一个具体的场景中,本基于语音交互的问答方法,应用于手机,问答资源为待用户对服务做出评价的评价列表,比如“非常满意”、“满意”、“不满意”等,用户授权可以是用户对相应的电话的拨通或者触发相应的对话服务等,当服务结束后,通过语音和用户进行交互实现服务评价。由此提高用户评价的积极性。
图3示出了本申请实施例提供的基于语音交互的问答系统的主要模块示意图,为了便于说明,仅示出与本申请实施例相关的部分,详述如下:
一种基于语音交互的问答系统200,应用于客户端,包括:
请求模块201,用于获取用户授权状态,基于所述授权状态获取用户属性信息,所述用户属性信息用于表征用户的基本信息和用户当前所处的场景信息;
问答资源获取模块202,用于根据所述用户属性信息获取目标问答资源;
播报模块203,通过语音询问用户是否愿意参加所述目标问答资源的问答,响应于用户同意,用于基于预设播放规则语音播报所述目标问答资源;
答案处理模块204,用于接收用户语音输入信息,将所述语音输入信息转换为文本信息,根据所述文本信息确定所述用户对当前问答题目的答案。
对于请求模块201:获取用户授权状态,基于所述授权状态获取用户属性信息,所述用户属性信息用于表征用户的基本信息和用户当前所处的场景信息。在取得用户授权后,获取到用户对应的属性信息,属性信息可以包括基本信息和用户当前所处环境的场景信息,以形成用户的基本画像以便后续对用户进行个性化的推送问答资源,以及推送适合用户当前场景所适合的问答资源。
在一个实施例中,所述获取用户授权状态,基于所述授权状态获取用户属性信息包括:获取用户ID信息,发送所述用户ID信息的授权提示,使得用户当前所使用终端上展示授权提示,接收用户对所述用户ID信息的授权操作,判断所述授权操作是否为同意授权,基于用户同意授权获取用户属性信息。在这里,可以通过获取用户ID信息(用户账户信息),然后发送该用户ID信息的登录提示或授权提示等和授权相关的内容作为授权提示,当用户进行登录或授权后,接收用户对该ID信息的授权操作,并判断该授权操作是否为同意授权,当用户同意授权后基于该授权进一步获取到用户的基本信息和用户当前所处的场景信息,以便于后续对用户的个性化推送问答资源。比如,用户可以主动登录用户ID以获得用户的授权,当用户登录后获得用户ID信息,进而获取用户的属性信息;也可以是获取到用户的ID信息后,提示用户是否同意授权或登录,当取得用户授权后获取用户属性信息。在这里,用户的授权操作可以是登录用户ID、同意登录用户ID或者不同意登录用户ID。
进一步,获取用户ID信息后,获取用户授权状态的方式包括:通过所述客户端的人机交互界面展示授权按钮,接收用户对所述授权按钮的授权操作;和/或通过所述客户端进行语音提示用户进行授权操作,接收用户语音输入的授权操作。比如,可以在获取到用户的ID信息后,在手机界面或者车载终端等终端设备上展示授权按钮,该授权按钮可以是提示用户进行登录操作或者提示用户是否同意登录、不同意登录等操作,还可以是在用户ID已经登录的情况下,提示用户是否同意为用户推送问答资源,当用户对授权按钮进行操作后,接收到用户是否同意的操作后进行相应的触发操作;还可以是在获取到用户的ID信息后,以语音交互的方式提示用户进行授权操作,比如通过车载终端或者手机终端提示用户对用户ID账户进行登录,或者在用户登录的情况下语音提示用户是否同意推送问答资源,用户可以直接通过语音和终端进行交互实现授权操作。由此提高用户交互的便捷性,避免用户在开车或走路等状态下无法进行操作终端,提高用户体验。
对于问答资源获取模块202:用于根据所述用户属性信息获取目标问答资源。当获取到用户的授权同意后,可根据用户的属性信息为用户获取适合用户的目标问答资源为用户推送。在本实施例中,可以预先在数据库中存储有多个问答资源,在得到用户授权后为用户在数据库中匹配到问答资源后推送给用户进行问答,也可以是通过系统直接将问答资源上传至数据库中,当获取到用户信息后为用户进行推送。在这里,问答资源可以通过后台系统进行建立然后存储至数据库中,当获取到用户属性信息后可以在数据库中进行调用为用户推送。
具体的,问答资源可以是调查问卷、用户服务评价等收集用户对某一事相、问题或者服务的观点和体验,比如针对某一产品的使用体验。问答资源可以以若干问答题目的形式构成,然后存储于数据库中。
在一个实施例中,所述基本信息包括用户历史操作行为,所述根据所述用户属性信息获取问答资源包括:根据所述基本信息和场景信息从数据库中获取和所述场景信息相匹配的问答资源,获取所述用户的历史问答资源交互信息,若所述问答资源不属于历史问答资源交互信息,则将所述问答资源确定为目标问答资源,若所述问答资源属于历史问答资源交互信息,则从所述数据库中重新获取问答资源。具体的,可以通过用户基本信息获取到用户历史的问答资源答复记录,由此在为用户推送问答资源可以避免问答资源的重复推送,浪费用户时间使得用户反感,可以提高问答资源的问答有效率。场景信息在这里可以包括用户当前所处环境的各种场景信息,比如可以准备多份问卷,比如上班时间要问的问卷,下班时间要问的问卷,周末要问的问卷,在景区的问卷,在商场的问卷,根据不同的场景,使用不同的问卷。由此可以使得推送适合用户当前场景所适合的问答资源,提高用户问答成功率。
在一个实施例中,基本信息还可以包括性别、年龄、职业等信息,以便为用户推送更加适合用户答复的问答资源。
对于播报模块203:通过语音询问用户是否愿意参加所述目标问答资源的问答,响应于用户同意,基于预设播放规则语音播报所述目标问答资源。在获取到目标问答资源后,通过语音询问用户是否愿意参加所述目标问答资源的问答,响应于用户同意,通过语音播报的形式为用户进行播报推送,可以使得用户在开车走路等场景时,便于用户的交互,提高用户问答的积极性和趣味性。
在一个实施例中,所述基于预设播放规则语音播报所述目标问答资源包括:识别所述目标问答资源的内容得到若干问答题目,依次播报所述若干问答题目,且当播报每个问答题目时,接收到每个问答题目的用户语音输入信息并确定答案后进行播放下一个问答题目,所述问答方法还包括,根据所述若干问答题目及对应的答案生成所述目标问答资源的结果资源。由此可以给于用户一定的答复时间,提高问答有效性。当一个问答资源的所有题目的答案均确定后,生成该问答资源的结果资源,然后将结果资源存储于数据库中,便于后续的统计分析。
进一步,所述预设播放规则包括多种播报语音包、答案提示、剩余题目提示和预估问答时间提示,在播报所述若干问答题目时,从所述多种播报语音包中随机确定一种播报语音包播报问答题目;在预设时间内未接收到用户语音输入时,语音播报答案提示;每次播报问答题目前,对剩余问答题目数量和预估问答时间进行语音播报。由此可以提高用户答题的有效性和趣味性。
对于答案处理模块204:用于接收用户语音输入信息,将所述语音输入信息转换为文本信息,根据所述文本信息确定所述用户对当前问答题目的答案。在用户收到终端播报的问答资源的问答题目时,用户可以通过语音直接讲出相应的答案,在接收到用户的语音输出信息时,对该语音信息进行语音识别将其转换为文本信息,然后根据检测出的文本信息确定用户对当前问答题目的答复答案。由此可以通过将用户通过语音作答的答案匹配出答案选项。
进一步,所述根据所述文本信息确定所述用户对当前问答题目的答案包括:根据所述文本信息与数据库中预存的当前问题的答案进行比对,将与所述文本信息相同或相似度最高的答案确定为所述当前问答题目的答案。在这里,在建立每个问答资源时,每个问答题目相应的建立有一定的选项或者答案,会将该选项或者答案以结构化语句存储在数据库中,当收到用户对题目的语音答复后,将其转换为文本信息,然后在数据库中进行查询对比,并通过语义识别模型找出最接近用户答复的选项或者答案,作为用户的输入答案。由此可以提高用户答复的准确性。
由此,本申请实施例提供的基于语音交互的问答系统,通过构建问卷调查或者服务评价数据库,取得用户授权后,个性化的将问卷调查推送至用户进行答复,且用户可以直接通过语音进行问卷调查和服务评价的回复,无需用户一直盯着终端屏幕进行答复,尤其是在车机场景和电话服务场景具有较好的体验,节省用户的时间的同时可以收集用户真实的反馈。
在一个具体的实施例中,本基于语音交互的问答系统,应用于车载终端,问答资源为调查问卷,可以预先在数据库中建立若干调查问卷,也可以通过系统或者存储设备将调查问卷直接导入车载终端,当用户在车内时,可以在取得用户授权后,根据用户的信息为用户选择一套调查问卷进行播报和用户进行语音交互完成对问卷的收集。由此可以节省用户时间,还可以提高问卷答题的趣味性和用户的积极性。
在另一个具体的场景中,本基于语音交互的问答系统,应用于手机,问答资源为待用户对服务做出评价的评价列表,比如“非常满意”、“满意”、“不满意”等,用户授权可以是用户对相应的电话的拨通或者触发相应的对话服务等,当服务结束后,通过语音和用户进行交互实现服务评价。由此提高用户评价的积极性。
本申请实施例还提供一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现本申请实施例的基于语音交互的问答方法
本申请实施例还提供一种计算机可读介质,其上存储有计算机程序,程序被处理器执行时实现本申请实施例的基于语音交互的问答方法。
图4示出了可以应用本申请实施例的基于语音交互的问答方法或系统的示例性系统架构300。
如图4所示,系统架构300可以包括终端设备301、302、303,网络304和服务器305。网络304用以在终端设备301、302、303和服务器305之间提供通信链路的介质。网络304可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备301、302、303通过网络304与服务器305交互,以接收或发送消息等。终端设备301、302、303上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备301、302、303可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于车载智能屏、智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器305可以是提供各种服务的服务器,例如对用户利用终端设备301、302、303所发送的往来消息提供支持的后台管理服务器。后台管理服务器可以在接收到终端设备请求后进行分析等处理,并将处理结果反馈给终端设备。
需要说明的是,本申请实施例所提供的基于语音交互的问答方法一般由终端设备301、302、303执行,相应地,基于语音交互的问答系统一般设置于终端设备301、302、303中。
应该理解,图4中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图5,其示出了适于用来实现本申请实施例的电子设备的计算机系统400的结构示意图。图5示出的计算机系统仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图5所示,计算机系统400包括中央处理单元(CPU)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储部分408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有系统400操作所需的各种程序和数据。CPU 401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。
以下部件连接至I/O接口405:包括键盘、鼠标等的输入部分406;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分407;包括硬盘等的存储部分408;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分409。通信部分409经由诸如因特网的网络执行通信处理。驱动器410也根据需要连接至I/O接口405。可拆卸介质411,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器410上,以便于从其上读出的计算机程序根据需要被安装入存储部分408。
特别地,根据本申请公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分409从网络上被下载和安装,和/或从可拆卸介质411被安装。在该计算机程序被中央处理单元(CPU)401执行时,执行本申请的系统中限定的上述功能。
需要说明的是,本申请所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括确定模块、提取模块、训练模块和筛选模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,确定模块还可以被描述为“确定候选用户集的模块”。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种基于语音交互的问答方法,应用于客户端,其特征在于,包括:
获取用户授权状态,基于所述授权状态获取用户属性信息,所述用户属性信息用于表征用户的基本信息和用户当前所处的场景信息;
根据所述用户属性信息获取目标问答资源;
通过语音询问用户是否愿意参加所述目标问答资源的问答,响应于用户同意,基于预设播放规则语音播报所述目标问答资源;
接收用户语音输入信息,将所述语音输入信息转换为文本信息,根据所述文本信息确定所述用户对当前问答题目的答案。
2.根据权利要求1所述的基于语音交互的问答方法,其特征在于,所述获取用户授权状态,基于所述授权状态获取用户属性信息包括:获取用户ID信息,发送所述用户ID信息的授权提示,接收用户对所述用户ID信息的授权操作,判断所述授权操作是否为同意授权,基于用户同意授权获取用户基本信息和用户当前所处的场景信息。
3.根据权利要求2所述的基于语音交互的问答方法,其特征在于,所述基本信息包括用户历史操作行为,所述根据所述用户属性信息获取问答资源包括:根据所述基本信息和场景信息从数据库中获取和所述场景信息相匹配的问答资源,获取所述用户的历史问答资源交互信息,若所述问答资源不属于历史问答资源交互信息,则将所述问答资源确定为目标问答资源,若所述问答资源属于历史问答资源交互信息,则从所述数据库中重新获取问答资源。
4.根据权利要求2所述的基于语音交互的问答方法,其特征在于,获取用户ID信息后,获取用户授权状态的方式包括:通过所述客户端的人机交互界面展示授权按钮,接收用户对所述授权按钮的授权操作;和/或通过所述客户端进行语音提示用户进行授权操作,接收用户语音输入的授权操作。
5.根据权利要求1所述的基于语音交互的问答方法,其特征在于,所述基于预设播放规则语音播报所述目标问答资源包括:识别所述目标问答资源的内容得到若干问答题目,依次播报所述若干问答题目,且当播报每个问答题目时,接收到每个问答题目的用户语音输入信息并确定答案后进行播放下一个问答题目,所述问答方法还包括,根据所述若干问答题目及对应的答案生成所述目标问答资源的结果资源。
6.根据权利要求5所述的基于语音交互的问答方法,其特征在于,所述预设播放规则包括多种播报语音包、答案提示、剩余题目提示和预估问答时间提示,在播报所述若干问答题目时,从所述多种播报语音包中随机确定一种播报语音包播报问答题目;在预设时间内未接收到用户语音输入时,语音播报答案提示;每次播报问答题目前,对剩余问答题目数量和预估问答时间进行语音播报。
7.根据权利要求1所述的基于语音交互的问答方法,其特征在于,所述根据所述文本信息确定所述用户对当前问答题目的答案包括:根据所述文本信息与数据库中预存的当前问题的答案进行比对,将与所述文本信息相同或相似度最高的答案确定为所述当前问答题目的答案。
8.一种基于语音交互的问答系统,应用于客户端,其特征在于,包括:
请求模块,用于获取用户授权状态,基于所述授权状态获取用户属性信息,所述用户属性信息用于表征用户的基本信息和用户当前所处的场景信息;
问答资源获取模块,用于根据所述用户属性信息获取目标问答资源;
播报模块,用于通过语音询问用户是否愿意参加所述目标问答资源的问答,响应于用户同意,基于预设播放规则语音播报所述目标问答资源;
答案处理模块,用于接收用户语音输入信息,将所述语音输入信息转换为文本信息,根据所述文本信息确定所述用户对当前问答题目的答案。
9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1至7中任一项所述的基于语音交互的问答方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行权利要求1至7中任一项所述的基于语音交互的问答方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111196270.0A CN114005440A (zh) | 2021-10-14 | 2021-10-14 | 基于语音交互的问答方法、系统、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111196270.0A CN114005440A (zh) | 2021-10-14 | 2021-10-14 | 基于语音交互的问答方法、系统、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114005440A true CN114005440A (zh) | 2022-02-01 |
Family
ID=79922803
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111196270.0A Pending CN114005440A (zh) | 2021-10-14 | 2021-10-14 | 基于语音交互的问答方法、系统、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114005440A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114520003A (zh) * | 2022-02-28 | 2022-05-20 | 安徽淘云科技股份有限公司 | 语音交互方法、装置、电子设备和存储介质 |
CN114566167A (zh) * | 2022-02-28 | 2022-05-31 | 安徽淘云科技股份有限公司 | 语音答题方法、装置、电子设备和存储介质 |
-
2021
- 2021-10-14 CN CN202111196270.0A patent/CN114005440A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114520003A (zh) * | 2022-02-28 | 2022-05-20 | 安徽淘云科技股份有限公司 | 语音交互方法、装置、电子设备和存储介质 |
CN114566167A (zh) * | 2022-02-28 | 2022-05-31 | 安徽淘云科技股份有限公司 | 语音答题方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109190114B (zh) | 用于生成回复信息的方法和装置 | |
CN110378749B (zh) | 客户端相似性的评估方法、装置、终端设备及存储介质 | |
US20100324961A1 (en) | Method and system of providing service assistance using a hierarchical order of communication channels | |
JP5242794B2 (ja) | 会話に結び付いたサービスの順序を特定するための通信方法および通信システム | |
CN104603769A (zh) | 基于用户中心网络的会议系统 | |
CN111010527B (zh) | 一种通过短信链接建立视频通话的方法及相关装置 | |
US20130124631A1 (en) | Apparatus, system, and method for digital communications driven by behavior profiles of participants | |
CN113971243A (zh) | 应用于问卷调查的数据处理方法、系统、设备及存储介质 | |
US20180060788A1 (en) | System and method for attribute matching | |
CN108491188A (zh) | 语音对话产品的开发资源的管理方法及装置 | |
CN113760145A (zh) | 一种互动方法、装置、电子设备及存储介质 | |
JP2019175464A (ja) | 情報処理装置、情報処理方法及びプログラム | |
CN114244793B (zh) | 信息处理方法、装置、设备及存储介质 | |
CN114005440A (zh) | 基于语音交互的问答方法、系统、电子设备及存储介质 | |
CN113724036A (zh) | 提供问题咨询服务的方法及电子设备 | |
US20170214611A1 (en) | Sip header configuration for identifying data for language interpretation/translation | |
CN113450230A (zh) | 一种理财风险评估方法及装置、存储介质及电子设备 | |
CN112331201A (zh) | 语音的交互方法和装置、存储介质、电子装置 | |
JP2009187163A (ja) | 質問回答装置 | |
CN113947166A (zh) | 问卷统计实时处理方法、系统、电子设备及存储介质 | |
CN113961769A (zh) | 一种会话通信方法、装置、设备及存储介质 | |
CN114006987A (zh) | 可视化交互方法及装置 | |
CN109150696B (zh) | 信息处理方法、服务器、客户端及计算机可读存储介质 | |
CN113138702A (zh) | 信息处理方法、装置、电子设备及存储介质 | |
CN113077325A (zh) | 多方会话处理方法、装置、存储介质与电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |