CN113099054A - 语音交互的方法、装置、设备和计算机可读介质 - Google Patents
语音交互的方法、装置、设备和计算机可读介质 Download PDFInfo
- Publication number
- CN113099054A CN113099054A CN202110342588.9A CN202110342588A CN113099054A CN 113099054 A CN113099054 A CN 113099054A CN 202110342588 A CN202110342588 A CN 202110342588A CN 113099054 A CN113099054 A CN 113099054A
- Authority
- CN
- China
- Prior art keywords
- user
- service
- voice
- analysis model
- predictive analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 230000003993 interaction Effects 0.000 title claims abstract description 36
- 238000005516 engineering process Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 7
- 230000007613 environmental effect Effects 0.000 claims description 6
- 238000003058 natural language processing Methods 0.000 claims description 6
- 230000003542 behavioural effect Effects 0.000 claims description 2
- 238000013473 artificial intelligence Methods 0.000 abstract description 4
- 230000006399 behavior Effects 0.000 description 24
- 238000010586 diagram Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 230000004044 response Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/50—Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
- H04M3/527—Centralised call answering arrangements not requiring operator intervention
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
- G10L15/07—Adaptation to the speaker
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0631—Creating reference templates; Clustering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0635—Training updating or merging of old and new templates; Mean values; Weighting
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了语音交互的方法、装置、设备和计算机可读介质,涉及人工智能技术领域。该方法的一具体实施方式包括:以用户信息、用户的历史行为数据和用户的历史环境数据,建立所述用户的个性化预测分析模型;所述用户登录业务系统,从个性化预测分析模型中获知并播放所述用户的推荐业务话术;结合所述用户的语音指令、所述推荐业务话术和个性化预测分析模型,向所述用户播放办理业务话术,以及接收用户的语音操作指令;所述用户退出所述业务系统后,以所述语音操作指令更新所述个性化预测分析模型。该实施方式能够为不同的用户提供个性化的语音服务。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种语音交互的方法、装置、设备和计算机可读介质。
背景技术
近年来在热线电话服务中采用智能交互式语音应答(Interactive VoiceResponse,IVR)已逐渐成为趋势。智能IVR系统是在热线电话中,采用智能语音交互技术替代原有传统IVR按键菜单操作的,为客户提供热线电话自助服务。
用户只需要说话就能办理业务,智能IVR系统先通过语音识别技术将客户语音转写为文本,再通过语义理解技术识别出文本中的客户意图,然后再根据识别出的意图执行对应操作处理,可极大减少原有按键操作流程并提升用户体验。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:难以为不同的用户提供个性化的语音服务。
发明内容
有鉴于此,本发明实施例提供一种语音交互的方法、装置、设备和计算机可读介质,能够为不同的用户提供个性化的语音服务。
为实现上述目的,根据本发明实施例的一个方面,提供了一种语音交互的方法,包括:
以用户信息、用户的历史行为数据和用户的历史环境数据,建立所述用户的个性化预测分析模型;
所述用户登录业务系统,从个性化预测分析模型中获知并播放所述用户的推荐业务话术;
结合所述用户的语音指令、所述推荐业务话术和个性化预测分析模型,向所述用户播放办理业务话术,以及接收用户的语音操作指令;
所述用户退出所述业务系统后,以所述语音操作指令更新所述个性化预测分析模型。
所述用户信息包括以下一种或多种,年龄、性别、地理位置和资产数据。
所述用户的历史行为数据包括以下一种或多种,交易记录、业务记录和业务办理渠道。
所述用户的历史环境数据包括以下一种或多种,归属地、时间信息和历史事件。
所述以用户信息、用户的历史行为数据和用户的历史环境数据,建立所述用户的个性化预测分析模型,包括:
以所述用户信息、所述用户的历史行为数据和所述用户的历史环境数据,作为训练数据,训练得到所述用户的个性化预测分析模型。
所述个性化预测分析模型是采用自然语言处理技术建立的模型,或采用知识图谱推理技术建立的模型。
所述用户登录业务系统,从个性化预测分析模型中获知并播放所述用户的推荐业务话术,包括:
所述用户通过语音登录业务系统,从个性化预测分析模型中获知并播放所述用户的推荐业务话术。
所述用户的推荐业务话术是预设话术。
所述用户登录业务系统,从个性化预测分析模型中获知并播放所述用户的推荐业务话术,包括:
所述用户通过语音登录业务系统,从个性化预测分析模型中获知并播放所述用户的首次推荐业务话术;
响应于用户的语音指令,从所述个性化预测分析模型中再次获知并播放所述用户的下一次推荐业务话术。
所述方法还包括:
以所述下一次推荐业务话术更新所述个性化预测分析模型。
所述结合所述用户的语音指令、所述推荐业务话术和个性化预测分析模型,向所述用户播报办理业务话术,以及接收用户的语音操作指令,包括:
根据所述用户的语音指令和所述推荐业务话术,确定所述业务系统中的业务种类;
将所述业务种类输入所述个性化预测分析模型,获知所述业务种类中的业务;
向所述用户播报所述业务种类中的业务的办理业务话术,以及接收用户的语音操作指令。
所述根据所述用户的语音指令和所述推荐业务话术,确定所述业务系统中的业务种类,包括:
基于所述推荐业务话术,初步确定所述业务系统中的业务大类;
按照所述用户的语音指令,在所述业务大类中确定所述业务系统中的业务种类。
所述将所述业务种类输入所述个性化预测分析模型,获知所述业务种类中的业务,包括:
将所述业务种类的标识,输入所述个性化预测分析模型,获知所述业务种类中的业务的标识;
按照所述业务种类中的业务的标识,获知所述业务种类中的业务。
所述向所述用户播报所述业务种类中的业务的办理业务话术,以及接收用户的语音操作指令,包括:
获取并向所述用户播报所述业务种类中的业务的办理业务话术;
接收所述用户的语音操作指令以执行所述业务种类中的业务。
所述用户退出所述业务系统,包括:
在预设交互时间段内,未接收到所述用户的语音操作指令,则确定所述用户退出所述业务系统。
所述以所述语音操作指令更新所述个性化预测分析模型,包括:
从所述语音操作指令中获知所述用户的行为数据;
以所述用户的行为数据,更新所述个性化预测分析模型。
所述播放所述用户的推荐业务话术,包括:以预设音色播放所述用户的推荐业务话术;
向所述用户播放办理业务话术,包括:以预设音色向所述用户播放办理业务话术。
根据本发明实施例的第二方面,提供了一种语音交互的装置,包括:
建立模块,用于以用户信息、用户的历史行为数据和用户的历史环境数据,建立所述用户的个性化预测分析模型;
推荐模块,用于所述用户登录业务系统,从个性化预测分析模型中获知并播放所述用户的推荐业务话术;
操作模块,用于结合所述用户的语音指令、所述推荐业务话术和个性化预测分析模型,向所述用户播放办理业务话术,以及接收用户的语音操作指令;
更新模块,用于所述用户退出所述业务系统后,以所述语音操作指令更新所述个性化预测分析模型。
根据本发明实施例的第三方面,提供了一种语音交互的电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述的方法。
根据本发明实施例的第四方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述的方法。
上述发明中的一个实施例具有如下优点或有益效果:以用户信息、用户的历史行为数据和用户的历史环境数据,建立所述用户的个性化预测分析模型;所述用户登录业务系统,从个性化预测分析模型中获知并播放所述用户的推荐业务话术;结合所述用户的语音指令、所述业务话术和个性化预测分析模型,向所述用户播放办理业务话术,以及接收用户的语音操作指令;所述用户退出所述业务系统后,以所述语音操作指令更新所述个性化预测分析模型。针对每个用户建立并更新个性化预测分析模型,采用个性化预测分析模型能够为不同的用户提供个性化的语音服务。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的语音交互的方法的主要流程的示意图;
图2是根据本发明实施例的获知并播放用户的推荐业务话术的流程示意图;
图3是根据本发明实施例的向用户播报办理业务话术,以及接收用户的语音操作指令的流程示意图;
图4是根据本发明实施例的确定业务系统中的业务种类的流程示意图;
图5是根据本发明实施例的获知业务种类中的业务的流程示意图;
图6是根据本发明实施例的播报办理业务话术和接收语音操作指令的流程示意图;
图7是根据本发明实施例的语音交互的装置的主要结构的示意图;
图8是本发明实施例可以应用于其中的示例性系统架构图;
图9是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
目前,主流的智能IVR系统提供的智能服务主要还属于“被动服务”,即需从客户侧先发起交互请求然后再进行系统处理。可以采用以下方式从系统侧主动发起服务流程。
方式一:客户在拨通电话后通过预制的固定话术进行引导客户提问。
方式二:客户在办理某项业务后,通过设定规则发起一项关联的业务,如:查询信用卡账单,固定关联并发起账单分期交易。
以上解决方案都不具备“个性化”的特点。所谓“个性化”是需要针对客户提供千人千面的服务。因此,存在难以为不同的用户提供个性化的语音服务。
为了解决难以为不同的用户提供个性化的语音服务,可以采用以下本发明实施例中的技术方案。
参见图1,图1是根据本发明实施例的语音交互的方法主要流程的示意图,针对每个用户建立并更新个性化预测分析模型,采用个性化预测分析模型能够为不同的用户提供个性化的语音服务。如图1所示,具体包括以下步骤:
S101、以用户信息、用户的历史行为数据和用户的历史环境数据,建立用户的个性化预测分析模型。
在本发明实施例中,技术方案应用于IVR系统。IVR系统能够提高呼叫服务的质量并节省费用。IVR系统是一种功能强大的电话自动服务系统。在一体化呼叫中心平台中,IVR系统首先是一个子系统,它与其他子系统协同来实现一个呼叫中心平台的标准功能;其次IVR系统又是一个可以单独运行、维护和升级的独立系统,可以在只需要IVR系统的场合单独使用。
对于用户而言,每个用户的用户信息不同,因此在登录业务系统时,每个用户的推荐业务话术也可能是不同的。为了向用户提供个性化语音交互,需要建立针对用户的个性化预测分析模型。
在本发明实施例中,以用户信息、用户的历史行为数据和用户的历史环境数据,建立用户的个性化预测分析模型。
用户信息是表征用户的信息。作为一个示例,用户信息包括以下一种或多种,年龄、性别、地理位置和资产数据。以用户信息能够唯一确定用户。可以以用户信息建立用户画像。
用户的历史行为数据是表征用户已发生的业务行为。作为一个示例,用户的历史行为数据包括以下一种或多种,交易记录、业务记录和业务办理渠道。交易记录包括交易时间和交易种类。业务记录包括业务种类和业务金额。业务办理渠道包括应用(APP)、网站和电话。
用户的历史环境数据是发生业务行为涉及的数据。作为一个示例,用户的历史环境数据包括以下一种或多种,归属地、时间信息和历史事件。归属地是指用户所使用业务账户的归属地。如:用户所使用银行账户的归属地是上海。历史事件是发生业务行为时的相关规定。如:贷款市场报价利率(Loan Prime Rate,LPR)的实施。
在本发明的一个实施例中,个性化预测分析模型是采用自然语言处理技术建立的模型,或采用知识图谱推理技术建立的模型。
自然语言处理(Natural Langunge Possns,NLP)是计算机科学领域以及人工智能领域的一个重要的研究方向,它研究用计算机来处理、理解以及运用人类语言,达到人与计算机之间进行有效通讯。
知识图谱推理可以分为基于符号的推理和基于统计的推理。在人工智能的研究中,基于符号的推理一般是基于经典逻辑或者经典逻辑的变异。基于符号的推理可以从一个已有的知识图谱推理出新的实体间关系,可用于建立新知识或者对知识图谱进行逻辑的冲突检测。
在本发明的一个实施例中,对于个性化预测分析模型需要训练才能得到。那么,以用户信息、用户的历史行为数据和用户的历史环境数据,作为训练数据,训练得到用户的个性化预测分析模型。
S102、用户登录业务系统,从个性化预测分析模型中获知并播放用户的推荐业务话术。
在本发明的实施例的应用中,用户登录业务系统。作为一个示例,业务系统是电话银行系统。作为另一个示例,业务系统是通信业务系统。其中,用户可以采用已注册信息登录业务系统。已注册信息包括登录名和登录密钥。
在本发明的一个实施例中,用户通过语音登录业务系统,从个性化预测分析模型中获知并播放用户的推荐业务话术。
具体来说,用户通过语音输入登录名和登录密钥,进而登录业务系统。其中,语音可以是通过网络传输,也可以通过电话传输。
需要说明的是,从个性化预测分析模型中获知并播放用户的推荐业务话术。上述推荐业务话术是针对用户播放的。也就是说,用户不同,则推荐业务话术有可能是不同的。这是因为,每个用户的个性化预测分析模型不同。作为一个示例,用户A每月10日发工资,在11月10日,用户A登录业务系统,则用户A的个性化预测分析模型分析用户A查询账户余额的可能性较大。因此推荐业务话术是:是否需要查询余额。
在本发明的一个实施例中,为了提高语音交互的效率,用户的推荐业务话术是预设话术。可以理解的是,对于相同业务,即使是不同用户推荐业务话术是相同的,即推荐业务话术是预设话术。作为一个示例,用户A查询账户余额的推荐业务话术是:是否需要查询余额;用户B查询账户余额的推荐业务话术是:是否需要查询余额。
在本发明的一个实施例中,对于首次推荐业务话术并未得到用户进一步指令或用户指示其他业务的情况下,还可以向用户播放下一次推荐业务话术。
参见图2,图2是根据本发明实施例的获知并播放用户的推荐业务话术的流程示意图,具体包括以下步骤:
S201、用户通过语音登录业务系统,从个性化预测分析模型中获知并播放用户的首次推荐业务话术。
用户通过语音登录业务系统后,基于用户的登录名获知该用户的个性化预测分析模型。从该用户的个性化预测分析模型中,获知并播放用户的首次推荐业务话术。首次推荐业务话术是该用户的个性化预测分析模型中首次输出的推荐业务话术。
S202、响应于用户的语音指令,从个性化预测分析模型中再次获知并播放用户的下一次推荐业务话术。
播放首次推荐业务话术后,并未得到用户进一步指令,即用户不需要办理推荐业务话术涉及的业务。或,用户通过语音指令指示其他业务,那么需要播放下一次推荐业务话术。即,从个性化预测分析模型中再次获知并播放用户的下一次推荐业务话术。
在本发明的一个实施例中,由于首次推荐业务话术,并未得到用户的确认,因此需要播放下一次推荐业务话术,在下一次推荐业务话术得到用户确认的情况下,可以以下一次推荐业务话术更新个性化预测分析模型,进而完善个性化预测分析模型。
在图2的实施例中,针对用户的响应,及时播放推荐业务话术,以满足用户需求。
S103、结合用户的语音指令、业务话术和个性化预测分析模型,向用户播放办理业务话术,以及接收用户的语音操作指令。
在接收到用户的语音指令后,结合用户的语音指令、业务话术和个性化预测分析模型,向用户播放办理业务话术,以及接收用户的语音操作指令。
参见图3,图3是根据本发明实施例的向用户播报办理业务话术,以及接收用户的语音操作指令的流程示意图,具体包括以下步骤:
S301、根据用户的语音指令和推荐业务话术,确定业务系统中的业务种类。
推荐业务话术从个性化预测分析模型中获知,根据推荐业务话术能够获知业务系统中的业务大类。用户的语音指令中包括针对推荐业务话术的响应。用户对于推荐业务话术的响应说明用户是在推荐业务话术的基础上,进一步确定业务种类。
参见图4,图4是根据本发明实施例的确定业务系统中的业务种类的流程示意图,具体包括以下步骤:
S401、基于推荐业务话术,初步确定业务系统中的业务大类。
在业务系统中包括多种业务,可以将业务分为多个业务大类。作为一个示例,在银行业务系统中,包括以下几个业务大类,存款、贷款和理财。
基于推荐业务话术,就能够初步确定业务系统中的业务大类。
S402、按照用户的语音指令,在业务大类中确定业务系统中的业务种类。
用户的语音指令对于推荐业务话术的响应,按照用户的语音指令,在业务大类中确定业务系统中的业务种类。作为一个示例,基于推荐业务话术,初步确定业务系统中的业务大类是理财业务。用户的语音指令涉及3年期限,则确定业务种类是3年期理财产品。
在图4的实施例中,基于语音指令和推荐业务话术,能够确定业务种类。
S302、将业务种类输入个性化预测分析模型,获知业务种类中的业务。
为了获知业务种类中的业务,可以将业务种类输入个性化预测分析模型中。
参见图5,图5是根据本发明实施例的获知业务种类中的业务的流程示意图,具体包括以下步骤:
S501、将业务种类的标识,输入个性化预测分析模型,获知业务种类中的业务的标识。
业务种类下述多种业务,每种业务有对应的办理业务话术。通过个性化预测分析模型,输入业务种类的标识,就能够获知业务种类中业务的标识。作为一个示例,业务种类是3年期理财产品,业务种类的标识是03,将03输入个性化预测分析模型,输出业务的标识是033。033对应业务是编号为033的业务。
S502、按照业务种类中的业务的标识,获知业务种类中的业务。
按照业务种类中的业务的标识,就能够获知业务种类中的业务。
在图5的实施例中,采用个性化预测分析模型获知业务。
S303、向用户播报业务种类中的业务的办理业务话术,以及接收用户的语音操作指令。
确定业务后,就可以向用户播报业务种类中的业务的办理业务话术,以及接收用户的语音操作指令。
参见图6,图6是根据本发明实施例的播报办理业务话术和接收语音操作指令的流程示意图,具体包括以下步骤:
S601、获取并向用户播报业务种类中的业务的办理业务话术。
获取向用户播报业务种类中的业务的办理业务话术,并播报上述办理业务话术,以引导用户操作。
S602、接收用户的语音操作指令以执行业务种类中的业务。
接收用户的语音操作指令,按照上述语音操作指令执行业务种类中的业务。
在图6的实施例中,响应于办理业务话术,通过用户的语音操作指令能够执行业务。
S104、用户退出业务系统后,以语音操作指令更新个性化预测分析模型。
执行业务后,用户退出业务系统。在本发明实施例中,采用以下方式确定用户退出业务系统。在预设交互时间段内,未接收到用户的语音操作指令,则确定用户退出业务系统。如:在20分钟内,没有收到用户的任何语音操作指令,则确定该用户退出业务系统。
用户退出业务系统后,此次语音交互结束。为了提高个性化预测分析模型预测准确性,语音操作指令体现用户的选择,则以语音操作指令更新个性化预测分析模型。
在具体实现时,从语音操作指令中获知用户的行为数据;以用户的行为数据,更新个性化预测分析模型。作为一个示例,从语音操作指令获知交易记录和业务记录。
在本发明的一个实施例中,为了满足用户对于音色的喜好,建立包括多种音色的音色库播报话术。这样,以预设音色播放用户的推荐业务话术;以预设音色向用户播放办理业务话术。
在上述本发明的实施例中,以用户信息、用户的历史行为数据和用户的历史环境数据,建立所述用户的个性化预测分析模型;所述用户登录业务系统,从个性化预测分析模型中获知并播放所述用户的推荐业务话术;结合所述用户的语音指令、所述业务话术和个性化预测分析模型,向所述用户播放办理业务话术,以及接收用户的语音操作指令;所述用户退出所述业务系统后,以所述语音操作指令更新所述个性化预测分析模型。针对每个用户建立并更新个性化预测分析模型,采用个性化预测分析模型能够为不同的用户提供个性化的语音服务。
参见图7,图7是根据本发明实施例的语音交互的装置的主要结构的示意图,语音交互的装置可以实现语音交互的方法,如图7所示,语音交互的装置具体包括:
建立模块701,用于以用户信息、用户的历史行为数据和用户的历史环境数据,建立所述用户的个性化预测分析模型;
推荐模块702,用于所述用户登录业务系统,从个性化预测分析模型中获知并播放所述用户的推荐业务话术;
操作模块703,用于结合所述用户的语音指令、所述推荐业务话术和个性化预测分析模型,向所述用户播放办理业务话术,以及接收用户的语音操作指令;
更新模块704,用于所述用户退出所述业务系统后,以所述语音操作指令更新所述个性化预测分析模型。
在本发明的一个实施例中,所述用户信息包括以下一种或多种,年龄、性别、地理位置和资产数据。
在本发明的一个实施例中,所述用户的历史行为数据包括以下一种或多种,交易记录、业务记录和业务办理渠道。
在本发明的一个实施例中,所述用户的历史环境数据包括以下一种或多种,归属地、时间信息和历史事件。
在本发明的一个实施例中,建立模块701,具体用于以所述用户信息、所述用户的历史行为数据和所述用户的历史环境数据,作为训练数据,训练得到所述用户的个性化预测分析模型。
在本发明的一个实施例中,所述个性化预测分析模型是采用自然语言处理技术建立的模型,或采用知识图谱推理技术建立的模型。
在本发明的一个实施例中,推荐模块702,具体用于所述用户通过语音登录业务系统,从个性化预测分析模型中获知并播放所述用户的推荐业务话术。
在本发明的一个实施例中,所述用户的推荐业务话术是预设话术。
在本发明的一个实施例中,推荐模块702,具体用于所述用户通过语音登录业务系统,从个性化预测分析模型中获知并播放所述用户的首次推荐业务话术;
响应于用户的语音指令,从所述个性化预测分析模型中再次获知并播放所述用户的下一次推荐业务话术。
在本发明的一个实施例中,更新模块704,还用于以所述下一次推荐业务话术更新所述个性化预测分析模型。
在本发明的一个实施例中,操作模块703,具体用于根据所述用户的语音指令和所述推荐业务话术,确定所述业务系统中的业务种类;
将所述业务种类输入所述个性化预测分析模型,获知所述业务种类中的业务;
向所述用户播报所述业务种类中的业务的办理业务话术,以及接收用户的语音操作指令。
在本发明的一个实施例中,操作模块703,具体用于基于所述推荐业务话术,初步确定所述业务系统中的业务大类;
按照所述用户的语音指令,在所述业务大类中确定所述业务系统中的业务种类。
在本发明的一个实施例中,操作模块703,具体用于将所述业务种类的标识,输入所述个性化预测分析模型,获知所述业务种类中的业务的标识;
按照所述业务种类中的业务的标识,获知所述业务种类中的业务。
在本发明的一个实施例中,操作模块703,具体用于获取并向所述用户播报所述业务种类中的业务的办理业务话术;
接收所述用户的语音操作指令以执行所述业务种类中的业务。
在本发明的一个实施例中,更新模块704,具体用于在预设交互时间段内,未接收到所述用户的语音操作指令,则确定所述用户退出所述业务系统。
在本发明的一个实施例中,更新模块704,具体用于从所述语音操作指令中获知所述用户的行为数据;
以所述用户的行为数据,更新所述个性化预测分析模型。
在本发明的一个实施例中,推荐模块702,具体用于以预设音色播放所述用户的推荐业务话术;
操作模块703,具体用于以预设音色向所述用户播放办理业务话术。
图8示出了可以应用本发明实施例的语音交互的方法或语音交互的装置的示例性系统架构800。
如图8所示,系统架构800可以包括终端设备801、802、803,网络804和服务器805。网络804用以在终端设备801、802、803和服务器805之间提供通信链路的介质。网络804可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备801、802、803通过网络804与服务器805交互,以接收或发送消息等。终端设备801、802、803上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备801、802、803可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器805可以是提供各种服务的服务器,例如对用户利用终端设备801、802、803所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。
需要说明的是,本发明实施例所提供的语音交互的方法一般由服务器805执行,相应地,语音交互的装置一般设置于服务器805中。
应该理解,图8中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图9,其示出了适于用来实现本发明实施例的终端设备的计算机系统900的结构示意图。图9示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图9所示,计算机系统900包括中央处理单元(CPU)901,其可以根据存储在只读存储器(ROM)902中的程序或者从存储部分908加载到随机访问存储器(RAM)903中的程序而执行各种适当的动作和处理。在RAM 903中,还存储有系统900操作所需的各种程序和数据。CPU 901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(I/O)接口905也连接至总线904。
以下部件连接至I/O接口905:包括键盘、鼠标等的输入部分906;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分907;包括硬盘等的存储部分908;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器910也根据需要连接至I/O接口905。可拆卸介质911,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器910上,以便于从其上读出的计算机程序根据需要被安装入存储部分908。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分909从网络上被下载和安装,和/或从可拆卸介质911被安装。在该计算机程序被中央处理单元(CPU)901执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括建立模块、推荐模块、操作模块和更新模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,推荐模块还可以被描述为“用于所述用户登录业务系统,从个性化预测分析模型中获知并播放所述用户的推荐业务话术”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:
以用户信息、用户的历史行为数据和用户的历史环境数据,建立所述用户的个性化预测分析模型;
所述用户登录业务系统,从个性化预测分析模型中获知并播放所述用户的推荐业务话术;
结合所述用户的语音指令、所述推荐业务话术和个性化预测分析模型,向所述用户播放办理业务话术,以及接收用户的语音操作指令;
所述用户退出所述业务系统后,以所述语音操作指令更新所述个性化预测分析模型。
根据本发明实施例的技术方案,以用户信息、用户的历史行为数据和用户的历史环境数据,建立所述用户的个性化预测分析模型;所述用户登录业务系统,从个性化预测分析模型中获知并播放所述用户的推荐业务话术;结合所述用户的语音指令、所述业务话术和个性化预测分析模型,向所述用户播放办理业务话术,以及接收用户的语音操作指令;所述用户退出所述业务系统后,以所述语音操作指令更新所述个性化预测分析模型。针对每个用户建立并更新个性化预测分析模型,采用个性化预测分析模型能够为不同的用户提供个性化的语音服务。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (20)
1.一种语音交互的方法,其特征在于,包括:
以用户信息、用户的历史行为数据和用户的历史环境数据,建立所述用户的个性化预测分析模型;
所述用户登录业务系统,从个性化预测分析模型中获知并播放所述用户的推荐业务话术;
结合所述用户的语音指令、所述推荐业务话术和个性化预测分析模型,向所述用户播放办理业务话术,以及接收用户的语音操作指令;
所述用户退出所述业务系统后,以所述语音操作指令更新所述个性化预测分析模型。
2.根据权利要求1所述语音交互的方法,其特征在于,所述用户信息包括以下一种或多种,年龄、性别、地理位置和资产数据。
3.根据权利要求1所述语音交互的方法,其特征在于,所述用户的历史行为数据包括以下一种或多种,交易记录、业务记录和业务办理渠道。
4.根据权利要求1所述语音交互的方法,其特征在于,所述用户的历史环境数据包括以下一种或多种,归属地、时间信息和历史事件。
5.根据权利要求1所述语音交互的方法,其特征在于,所述以用户信息、用户的历史行为数据和用户的历史环境数据,建立所述用户的个性化预测分析模型,包括:
以所述用户信息、所述用户的历史行为数据和所述用户的历史环境数据,作为训练数据,训练得到所述用户的个性化预测分析模型。
6.根据权利要求1所述语音交互的方法,其特征在于,所述个性化预测分析模型是采用自然语言处理技术建立的模型,或采用知识图谱推理技术建立的模型。
7.根据权利要求1所述语音交互的方法,其特征在于,所述用户登录业务系统,从个性化预测分析模型中获知并播放所述用户的推荐业务话术,包括:
所述用户通过语音登录业务系统,从个性化预测分析模型中获知并播放所述用户的推荐业务话术。
8.根据权利要求1所述语音交互的方法,其特征在于,所述用户的推荐业务话术是预设话术。
9.根据权利要求1所述语音交互的方法,其特征在于,所述用户登录业务系统,从个性化预测分析模型中获知并播放所述用户的推荐业务话术,包括:
所述用户通过语音登录业务系统,从个性化预测分析模型中获知并播放所述用户的首次推荐业务话术;
响应于用户的语音指令,从所述个性化预测分析模型中再次获知并播放所述用户的下一次推荐业务话术。
10.根据权利要求1所述语音交互的方法,其特征在于,所述方法还包括:
以所述下一次推荐业务话术更新所述个性化预测分析模型。
11.根据权利要求1所述语音交互的方法,其特征在于,所述结合所述用户的语音指令、所述推荐业务话术和个性化预测分析模型,向所述用户播报办理业务话术,以及接收用户的语音操作指令,包括:
根据所述用户的语音指令和所述推荐业务话术,确定所述业务系统中的业务种类;
将所述业务种类输入所述个性化预测分析模型,获知所述业务种类中的业务;
向所述用户播报所述业务种类中的业务的办理业务话术,以及接收用户的语音操作指令。
12.根据权利要求11所述语音交互的方法,其特征在于,所述根据所述用户的语音指令和所述推荐业务话术,确定所述业务系统中的业务种类,包括:
基于所述推荐业务话术,初步确定所述业务系统中的业务大类;
按照所述用户的语音指令,在所述业务大类中确定所述业务系统中的业务种类。
13.根据权利要求11所述语音交互的方法,其特征在于,所述将所述业务种类输入所述个性化预测分析模型,获知所述业务种类中的业务,包括:
将所述业务种类的标识,输入所述个性化预测分析模型,获知所述业务种类中的业务的标识;
按照所述业务种类中的业务的标识,获知所述业务种类中的业务。
14.根据权利要求11所述语音交互的方法,其特征在于,所述向所述用户播报所述业务种类中的业务的办理业务话术,以及接收用户的语音操作指令,包括:
获取并向所述用户播报所述业务种类中的业务的办理业务话术;
接收所述用户的语音操作指令以执行所述业务种类中的业务。
15.根据权利要求1所述语音交互的方法,其特征在于,所述用户退出所述业务系统,包括:
在预设交互时间段内,未接收到所述用户的语音操作指令,则确定所述用户退出所述业务系统。
16.根据权利要求1所述语音交互的方法,其特征在于,所述以所述语音操作指令更新所述个性化预测分析模型,包括:
从所述语音操作指令中获知所述用户的行为数据;
以所述用户的行为数据,更新所述个性化预测分析模型。
17.根据权利要求1所述语音交互的方法,其特征在于,所述播放所述用户的推荐业务话术,包括:以预设音色播放所述用户的推荐业务话术;
向所述用户播放办理业务话术,包括:以预设音色向所述用户播放办理业务话术。
18.一种语音交互的装置,其特征在于,包括:
建立模块,用于以用户信息、用户的历史行为数据和用户的历史环境数据,建立所述用户的个性化预测分析模型;
推荐模块,用于所述用户登录业务系统,从个性化预测分析模型中获知并播放所述用户的推荐业务话术;
操作模块,用于结合所述用户的语音指令、所述推荐业务话术和个性化预测分析模型,向所述用户播放办理业务话术,以及接收用户的语音操作指令;
更新模块,用于所述用户退出所述业务系统后,以所述语音操作指令更新所述个性化预测分析模型。
19.一种语音交互的电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-17中任一所述的方法。
20.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-17中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110342588.9A CN113099054A (zh) | 2021-03-30 | 2021-03-30 | 语音交互的方法、装置、设备和计算机可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110342588.9A CN113099054A (zh) | 2021-03-30 | 2021-03-30 | 语音交互的方法、装置、设备和计算机可读介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113099054A true CN113099054A (zh) | 2021-07-09 |
Family
ID=76671294
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110342588.9A Pending CN113099054A (zh) | 2021-03-30 | 2021-03-30 | 语音交互的方法、装置、设备和计算机可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113099054A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116994565A (zh) * | 2023-09-26 | 2023-11-03 | 深圳琪乐科技有限公司 | 一种智能语音助手及其语音控制方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100191658A1 (en) * | 2009-01-26 | 2010-07-29 | Kannan Pallipuram V | Predictive Engine for Interactive Voice Response System |
CN110175012A (zh) * | 2019-04-17 | 2019-08-27 | 百度在线网络技术(北京)有限公司 | 技能推荐方法、装置、设备及计算机可读存储介质 |
CN110913085A (zh) * | 2018-09-18 | 2020-03-24 | 北京京东尚科信息技术有限公司 | 定位用户需求的方法和装置 |
CN111031185A (zh) * | 2019-12-19 | 2020-04-17 | 易谷网络科技股份有限公司 | 一种基于人工智能导航的坐席分配方法及相关装置 |
CN111666380A (zh) * | 2020-06-12 | 2020-09-15 | 北京百度网讯科技有限公司 | 一种智能呼叫方法、装置、设备和介质 |
CN111858892A (zh) * | 2020-07-24 | 2020-10-30 | 中国平安人寿保险股份有限公司 | 基于知识图谱的语音交互方法、装置、设备及介质 |
CN112397062A (zh) * | 2019-08-15 | 2021-02-23 | 华为技术有限公司 | 语音交互方法、装置、终端及存储介质 |
-
2021
- 2021-03-30 CN CN202110342588.9A patent/CN113099054A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100191658A1 (en) * | 2009-01-26 | 2010-07-29 | Kannan Pallipuram V | Predictive Engine for Interactive Voice Response System |
CN110913085A (zh) * | 2018-09-18 | 2020-03-24 | 北京京东尚科信息技术有限公司 | 定位用户需求的方法和装置 |
CN110175012A (zh) * | 2019-04-17 | 2019-08-27 | 百度在线网络技术(北京)有限公司 | 技能推荐方法、装置、设备及计算机可读存储介质 |
CN112397062A (zh) * | 2019-08-15 | 2021-02-23 | 华为技术有限公司 | 语音交互方法、装置、终端及存储介质 |
CN111031185A (zh) * | 2019-12-19 | 2020-04-17 | 易谷网络科技股份有限公司 | 一种基于人工智能导航的坐席分配方法及相关装置 |
CN111666380A (zh) * | 2020-06-12 | 2020-09-15 | 北京百度网讯科技有限公司 | 一种智能呼叫方法、装置、设备和介质 |
CN111858892A (zh) * | 2020-07-24 | 2020-10-30 | 中国平安人寿保险股份有限公司 | 基于知识图谱的语音交互方法、装置、设备及介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116994565A (zh) * | 2023-09-26 | 2023-11-03 | 深圳琪乐科技有限公司 | 一种智能语音助手及其语音控制方法 |
CN116994565B (zh) * | 2023-09-26 | 2023-12-15 | 深圳琪乐科技有限公司 | 一种智能语音助手及其语音控制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11301908B2 (en) | System and method for providing contextual summaries in interaction transfer | |
US10171659B2 (en) | Customer portal of an intelligent automated agent for a contact center | |
CA2917294C (en) | Intelligent automated agent for a contact center | |
US20160189558A1 (en) | Learning Based on Simulations of Interactions of a Customer Contact Center | |
US20210157989A1 (en) | Systems and methods for dialog management | |
US20210350385A1 (en) | Assistance for customer service agents | |
US11798539B2 (en) | Systems and methods relating to bot authoring by mining intents from conversation data via intent seeding | |
US11620656B2 (en) | System and method for personalization as a service | |
US20240146844A1 (en) | Methods, apparatuses, and systems for dynamically navigating interactive communication systems | |
KR102311296B1 (ko) | 인공지능을 이용한 콜센터 업무 자동화 시스템 및 그 방법 | |
CN113099054A (zh) | 语音交互的方法、装置、设备和计算机可读介质 | |
KR20180042763A (ko) | 채팅형 금융 로봇 및 이를 이용한 금융 서비스 제공방법 | |
US20220366427A1 (en) | Systems and methods relating to artificial intelligence long-tail growth through gig customer service leverage | |
CN111556096A (zh) | 信息推送方法、装置、介质及电子设备 | |
US20230409616A1 (en) | Hybrid guided communication session with artificial intelligence | |
US11810125B1 (en) | Systems and methods for a hybrid guided communication session | |
WO2022270603A1 (en) | A system and method for delivering domain or use-case switch suggestion for an ongoing conversation | |
CN113570324A (zh) | 外呼流程编辑方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210709 |
|
RJ01 | Rejection of invention patent application after publication |