CN110970021B - 一种问答控制方法、装置及系统 - Google Patents

一种问答控制方法、装置及系统 Download PDF

Info

Publication number
CN110970021B
CN110970021B CN201811159936.3A CN201811159936A CN110970021B CN 110970021 B CN110970021 B CN 110970021B CN 201811159936 A CN201811159936 A CN 201811159936A CN 110970021 B CN110970021 B CN 110970021B
Authority
CN
China
Prior art keywords
voice
answer
question
context information
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811159936.3A
Other languages
English (en)
Other versions
CN110970021A (zh
Inventor
杨硕
林文辉
孙科武
王芳
王志刚
赖新明
王亚平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aisino Corp
Original Assignee
Aisino Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aisino Corp filed Critical Aisino Corp
Priority to CN201811159936.3A priority Critical patent/CN110970021B/zh
Publication of CN110970021A publication Critical patent/CN110970021A/zh
Application granted granted Critical
Publication of CN110970021B publication Critical patent/CN110970021B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L15/222Barge in, i.e. overridable guidance for interrupting prompts
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种问答控制方法、装置及系统,用以解决现有的机器人客服存在多轮问答咨询中断后需重新开始进行问答,而造成的咨询流程繁琐冗长,服务效率低的问题。该方法包括:服务器接收终端发送的携带有语音消息的问答请求;将语音消息转换为文字,从语音消息中提取声音特征;对文字提取关键词;根据存储的声音特征与语音输入者的身份标识的对应关系确定与声音特征相匹配的语音输入者的身份标识;根据存储的语音输入者的身份标识与上下文信息的对应关系获取所述语音输入者的身份标识对应的上下文信息;将关键词、上下文信息与存储的语料库进行匹配;当确定从语料库中匹配到与关键词和上下文信息对应的问题的答案信息时,将答案信息发送至终端。

Description

一种问答控制方法、装置及系统
技术领域
本发明涉及计算机技术领域,尤其涉及一种问答控制方法、装置及系统。
背景技术
智能客服在公共服务领域的应用越来越广泛,机器人客服可以在低成本的条件下完成一部分简单的咨询、取号、查询等工作,减轻了人工客服压力。
然而,目前公共服务领域的大多数机器人客服只能完成一些简单的咨询工作,如一些单轮问答,而少数可以加入上下文的多轮问答则无法中断,需要咨询者长时间占用一台公共机器人客服装置,如果咨询者在中途需要根据提示去办理一个业务,则回来后需要重新咨询一遍,使得咨询流程繁琐冗长,服务效率较低。
发明内容
为了解决现有的机器人客服存在多轮问答咨询中断后需重新开始进行问答,而造成的咨询流程繁琐冗长,服务效率低的问题,本发明实施例提供了一种问答控制方法、装置及系统,简化了咨询流程,提高了服务效率。
第一方面,本发明实施例提供了一种服务器侧实施的问答控制方法,包括:
服务器接收终端发送的问答请求,其中,所述问答请求中携带有语音消息;
将所述语音消息转换为文字,并从所述语音消息中提取声音特征;
对所述文字进行语义识别提取关键词;
根据存储的声音特征与语音输入者的身份标识的对应关系确定与所述提取的声音特征相匹配的语音输入者的身份标识;
根据存储的语音输入者的身份标识与上下文信息的对应关系获取所述语音输入者的身份标识对应的上下文信息,其中,所述上下文信息包括所述用户的问答主题、问题的上下文内容;
将所述关键词、所述上下文信息与预先存储的语料库进行匹配;
当确定从所述语料库中匹配到与所述关键词和所述上下文信息对应的问题的答案信息时,将所述答案信息发送至所述终端。
采用本发明实施例提供的问答控制方法,终端将采集的语音消息携带在问答请求中发送给服务器,服务器接收到终端发送的问答请求后,对所述语音消息进行识别后转换为文字,并从该语言消息中提取声音特征,对所述文字进行语义识别提取关键词,进而,根据存储的声音特征与语音输入者的身份标识的对应关系确定与所述提取的声音特征相匹配的语音输入者的身份标识,根据存储的语音输入者的身份标识与上下文信息的对应关系获取所述用户身份信息对应的上下文信息,其中,所述上下文信息包括所述用户的问答主题、问题的上下文内容,将所述关键词、所述上下文信息与预先存储的语料库进行匹配,当确定从所述语料库中匹配到与所述关键词和所述上下文信息对应的问题的答案信息时,将该答案信息发送至终端,与现有技术相比,本发明实施例提供的问答控制方法中,终端采集到语音消息后,若此用户最近进行过相关的咨询,在服务器中预先存储上下文信息,根据关键词和上下文信息匹配对应的问题以及问题所对应的答案信息后,返回至机器人客服,使咨询者可以流畅地继续与终端进行交流对话,达到无缝衔接,不必在终端上重新开始新一轮的咨询,有效地节省了咨询时间,提高了服务效率,且由于本发明实施例中在服务器中预先存储上下文信息以及问题及其对应的答案,当咨询者上次使用的终端被占用时,无需进行等待,只要找到任一台空闲的机器人客服继续咨询即可,进一步节省了时间。
第二方面,本发明实施例提供了一种服务器,包括:
接收单元,接收终端发送的问答请求,其中,所述问答请求中携带有语音消息;
处理单元,用于将所述语音消息转换为文字,并从所述语音消息中提取声音特征;
语义识别单元,用于对所述文字进行语义识别提取关键词;
确定单元,用于根据存储的声音特征与语音输入者的身份标识的对应关系确定与所述提取的声音特征相匹配的语音输入者的身份标识;
获取单元,用于根据存储的语音输入者的身份标识与上下文信息的对应关系获取所述语音输入者的身份标识对应的上下文信息,其中,所述上下文信息包括所述用户的问答主题、问题的上下文内容;
匹配单元,用于将所述关键词、所述上下文信息与预先存储的语料库进行匹配;
发送单元,用于当确定从所述语料库中匹配到与所述关键词和所述上下文信息对应的问题的答案信息时,将所述答案信息发送至所述终端。
本发明提供的服务器的技术效果可以参见上述第一方面或第一方面的各个实现方式的技术效果,此处不再赘述。
第三方面,本发明实施例提供了一种终端侧实施的问答控制方法,包括:
当终端接收到语音采集指令时采集语音消息;
将所述语音消息发送至服务器,令所述服务器将所述语音消息转换为文字,并从所述语音消息中提取声音特征,对所述文字进行语义识别提取关键词,根据存储的声音特征与语音输入者的身份标识的对应关系确定与所述提取的声音特征相匹配的语音输入者的身份标识,根据存储的语音输入者的身份标识与上下文信息的对应关系获取所述语音输入者的身份标识对应的上下文信息,其中,所述上下文信息包括所述用户的问答主题、问题的上下文内容,将所述关键词、所述上下文信息与预先存储的语料库进行匹配,当确定从所述语料库中匹配到与所述关键词和所述上下文信息对应的问题的答案信息时,将所述答案信息发送至所述终端。
可选地,所述方法还包括:
接收所述服务器返回的答案信息;
将所述答案信息生成语音进行播放。
本发明提供的终端侧实施的问答控制方法的技术效果可以参见上述第一方面或第一方面的各个实现方式的技术效果,此处不再赘述。
第四方面,本发明实施例提供了一种问答控制装置,包括:
语音采集单元,用于当接收到语音采集指令时采集语音;
发送单元,用于将所述语音消息发送至服务器,令所述服务器将所述语音消息转换为文字,并从所述语音消息中提取声音特征,对所述文字进行语义识别提取关键词,根据存储的声音特征与语音输入者的身份标识的对应关系确定与所述提取的声音特征相匹配的语音输入者的身份标识,根据存储的语音输入者的身份标识与上下文信息的对应关系获取所述语音输入者的身份标识对应的上下文信息,其中,所述上下文信息包括所述用户的问答主题、问题的上下文内容,将所述关键词、所述上下文信息与预先存储的语料库进行匹配,当确定从所述语料库中匹配到与所述关键词和所述上下文信息对应的问题的答案信息时,将所述答案信息发送至所述终端。
可选地,所述装置还包括:
接收单元,用于接收所述服务器返回的答案信息;
语音生成单元,用于将所述答案信息生成语音进行播放。
本发明提供的问答控制装置的技术效果可以参见上述第一方面或第一方面的各个实现方式的技术效果,此处不再赘述。
第五方面,本发明实施例提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现本发明所述的服务器侧实施的问答控制方法或者终端侧实施的问答控制方法。
第六方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明所述的服务器侧实施的问答控制方法或者终端侧实施的问答控制方法中的步骤。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例中提供的问答控制方法的应用场景示意图;
图2为本发明实施例提供的问答控制方法的实施流程示意图;
图3为本发明实施例提供的服务器侧实施的问答控制方法的实施流程示意图;
图4为本发明实施例提供的服务器的结构示意图;
图5为本发明实施例提供的终端侧实施的问答控制方法的实施流程示意图;
图6为本发明实施例提供的问答控制装置的结构示意图;
图7为本发明实施例提供的问答控制系统的结构示意图;
图8为本发明实施例提供的电子设备的结构示意图。
具体实施方式
为了解决现有的机器人客服存在多轮问答咨询中断后需重新开始进行问答,而造成的咨询流程繁琐冗长,服务效率低的问题,本发明提出了一种问答控制方法、装置及系统,简化了咨询流程,提高了服务效率。
本发明实施例提供的问答控制方法的实施原理是:终端将采集的语音消息携带在问答请求中发送给服务器,服务器接收到终端发送的问答请求后,对所述语音消息进行识别后转换为文字,并从该语言消息中提取声音特征,对所述文字进行语义识别提取关键词,进而,根据存储的声音特征与语音输入者的身份标识的对应关系确定与所述提取的声音特征相匹配的语音输入者的身份标识,根据存储的语音输入者的身份标识与上下文信息的对应关系获取所述用户身份信息对应的上下文信息,其中,所述上下文信息包括所述用户的问答主题、问题的上下文内容,将所述关键词、所述上下文信息与预先存储的语料库进行匹配,当确定从所述语料库中匹配到与所述关键词和所述上下文信息对应的问题的答案信息时,将该答案信息发送至终端,与现有技术相比,本发明实施例提供的问答控制方法中,终端采集到语音消息后,若此用户最近进行过相关的咨询,在服务器中预先存储上下文信息,根据关键词和上下文信息匹配对应的问题以及问题所对应的答案信息后,返回至机器人客服,使咨询者可以流畅地继续与终端进行交流对话,达到无缝衔接,不必在终端上重新开始新一轮的咨询,有效地节省了咨询时间,提高了服务效率,且由于本发明实施例中在服务器中预先存储上下文信息以及问题及其对应的答案,当咨询者上次使用的终端被占用时,无需进行等待,只要找到任一台空闲的机器人客服继续咨询即可,进一步节省了时间。
以下结合说明书附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明,并且在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
首先参考图1,其为本发明实施例提供的问答控制方法的应用场景示意图。终端11与服务器12通过网络进行连接,其中,终端11可以为1个或多个,咨询者通过语音输入终端11中进行问答,服务器12中预先存储有问题及对应的答案,终端11每采集到咨询者输入的语音时,从语音中提取声音特征,并将所述声音特征及对应的上下文信息发送至服务器12中,服务器12存储所述声音特征及对应的上下文信息,供咨询者再次通过终端11进行咨询时返回给终端11,使咨询者可以继续与终端11进行对话。
需要说明的是,本发明实施例中的终端可以为机器人客服装置,对此不作限定。
下面结合图1的应用场景,参考图2来描述根据本发明示例性实施方式的问答控制方法。需要注意的是,上述应用场景仅是为了便于理解本发明的精神和原理而示出,本发明的实施方式在此不受任何限制。相反,本发明的实施方式可以应用于适用的任何场景。
如图2所示,其为本发明实施例提供的问答控制方法的实施流程示意图,可以包括以下步骤:
S21、当终端接收到语音采集指令时采集语音消息。
具体实施时,当终端接收到语音采集指令时,采集咨询者输入的语音消息。
S22、终端将所述语音消息携带在问答请求中发送至服务器。
S23、服务器接收到终端发送的问答请求后,将所述语音消息转换为文字,并从所述语音消息中提取声音特征。
具体实施时,服务器接收终端发送的问答请求,将所述问答请求中携带的语音消息进行识别转换为文字,并从所述语音消息中提取声音特征。
具体地,可以通过提取所述语音消息的MFCC(mel频率倒谱系数)的特征值作为声音特征,声音特征用于识别语音输入者的身份。
需要说明的是,本发明实施例中也可以终端采集语音消息后,在终端将语音消息直接转换为文字,并从所述语音消息中提取声音特征后,再将转换的文字和提取的声音特征发送至服务器,本发明实施例对此不作限定。
S24、服务器对所述文字进行语义识别提取关键词。
具体实施时,服务器可以对转换后的文字进行分词处理后,进行语义识别提取关键词。
S25、服务器根据存储的声音特征与语音输入者的身份标识的对应关系确定与所述提取的声音特征相匹配的语音输入者的身份标识。
具体实施时,服务器预先存储声音特征与语音输入者的身份标识的对应关系,服务器根据存储的所述声音特征与语音输入者的身份标识的对应关系确定与所述提取的声音特征相匹配的语音输入者的身份标识。
S26、服务器根据存储的语音输入者的身份标识与上下文信息的对应关系获取所述语音输入者的身份标识对应的上下文信息。
具体实施时,其中,所述上下文信息包括所述用户的问答主题、问题的上下文内容。上下文信息还可以包括如问答双方身份、前一条问答内容、前一条问答主语等,保存这些上下文信息,可以用于在对话中断的情况下,将对话进行恢复。
具体地,服务器预先存储语音输入者的身份标识与上下文信息的对应关系,当确定与所述提取的声音特征相匹配的语音输入者的身份标识后,服务器根据所述存储的语音输入者的身份标识与上下文信息的对应关系获取所述语音输入者的身份标识对应的上下文信息。
如果所述服务器中不包含与所述声音特征相匹配的声音特征,则直接从预先存储的语料库中根据关键词匹配相应的问题,将匹配的问题答案返回给终端。并将所述声音特征、语音输入者的身份标识及其上下文信息进行存储,供下次同一咨询者咨询时使用。
S27、服务器将所述关键词、所述上下文信息与预先存储的语料库进行匹配。
具体实施时,服务器将所述关键词、所述上下文信息与预先存储的语料库进行匹配,其中,所述语料库中存储有问题及问题对应的答案信息。
S28、当服务器确定从所述语料库中匹配到与所述关键词和所述上下文信息对应的问题的答案信息时,将所述答案信息发送至所述终端。
具体实施时,当服务器确定从所述语料库中匹配到所述关键词和所述上下文信息对应的问题的答案信息时,将所述答案信息发送至所述终端。
S29、终端接收到服务器返回的答案信息后,将所述答案信息生成语音进行播放。
本发明实施例提供的问答控制方法,终端将采集的语音消息携带在问答请求中发送给服务器,服务器接收到终端发送的问答请求后,对所述语音消息进行识别后转换为文字,并从该语言消息中提取声音特征,对所述文字进行语义识别提取关键词,进而,根据存储的声音特征与语音输入者的身份标识的对应关系确定与所述提取的声音特征相匹配的语音输入者的身份标识,根据存储的语音输入者的身份标识与上下文信息的对应关系获取所述用户身份信息对应的上下文信息,其中,所述上下文信息包括所述用户的问答主题、问题的上下文内容,将所述关键词、所述上下文信息与预先存储的语料库进行匹配,当确定从所述语料库中匹配到与所述关键词和所述上下文信息对应的问题的答案信息时,将该答案信息发送至终端,与现有技术相比,本发明实施例提供的问答控制方法中,终端采集到语音消息后,若此用户最近进行过相关的咨询,在服务器中预先存储上下文信息,根据关键词和上下文信息匹配对应的问题以及问题所对应的答案信息后,返回至机器人客服,使咨询者可以流畅地继续与终端进行交流对话,达到无缝衔接,不必在终端上重新开始新一轮的咨询,有效地节省了咨询时间,提高了服务效率,且由于本发明实施例中在服务器中预先存储上下文信息以及问题及其对应的答案,当咨询者上次使用的终端被占用时,无需进行等待,只要找到任一台空闲的机器人客服继续咨询即可,进一步节省了时间。
基于同一发明构思,本发明实施例还提供了一种服务器侧实施的问答控制方法,由于上述服务器侧实施的问答控制方法解决问题的原理与上述问答控制方法相似,因此上述服务器侧实施的问答控制方法的实施可以参见上述问答控制方法的实施,重复之处不再赘述。
如图3所示,其为本发明实施例提供的服务器侧实施的问答控制方法的实施流程示意图,可以包括以下步骤:
S31、服务器接收终端发送的问答请求,其中,所述问答请求中携带有语音消息。
S32、将所述语音消息转换为文字,并从所述语音消息中提取声音特征。
S33、对所述文字进行语义识别提取关键词。
S34、根据存储的声音特征与语音输入者的身份标识的对应关系确定与所述提取的声音特征相匹配的语音输入者的身份标识。
S35、根据存储的语音输入者的身份标识与上下文信息的对应关系获取所述语音输入者的身份标识对应的上下文信息。
其中,所述上下文信息包括所述用户的问答主题、问题的上下文内容。
S36、将所述关键词、所述上下文信息与预先存储的语料库进行匹配。
S37、当确定从所述语料库中匹配到与所述关键词和所述上下文信息对应的问题的答案信息时,将所述答案信息发送至所述终端。
基于同一发明构思,本发明实施例还提供了一种服务器,由于上述服务器解决问题的原理与问答控制方法相似,因此上述服务器的实施可以参见方法的实施,重复之处不再赘述。
如图4所示,其为本发明实施例提供的服务器的结构示意图,可以包括:
接收单元41,接收终端发送的问答请求,其中,所述问答请求中携带有语音消息;
处理单元42,用于将所述语音消息转换为文字,并从所述语音消息中提取声音特征;
语义识别单元43,用于对所述文字进行语义识别提取关键词;
确定单元44,用于根据存储的声音特征与语音输入者的身份标识的对应关系确定与所述提取的声音特征相匹配的语音输入者的身份标识;
获取单元45,用于根据存储的语音输入者的身份标识与上下文信息的对应关系获取所述语音输入者的身份标识对应的上下文信息,其中,所述上下文信息包括所述用户的问答主题、问题的上下文内容;
匹配单元46,用于将所述关键词、所述上下文信息与预先存储的语料库进行匹配;
发送单元47,用于当确定从所述语料库中匹配到与所述关键词和所述上下文信息对应的问题的答案信息时,将所述答案信息发送至所述终端。
基于同一发明构思,本发明实施例还提供了一种终端侧实施的问答控制方法,由于上述终端侧实施的问答控制方法解决问题的原理与上述问答控制方法相似,因此上述终端侧实施的问答控制方法的实施可以参见上述问答控制方法的实施,重复之处不再赘述。
如图5所示,其为本发明实施例提供的终端侧实施的问答控制方法的实施流程示意图,可以包括以下步骤:
S51、当终端接收到语音采集指令时采集语音消息;
S52、将所述语音消息发送至服务器。
令所述服务器将所述语音消息转换为文字,并从所述语音消息中提取声音特征,对所述文字进行语义识别提取关键词,根据存储的声音特征与语音输入者的身份标识的对应关系确定与所述提取的声音特征相匹配的语音输入者的身份标识,根据存储的语音输入者的身份标识与上下文信息的对应关系获取所述语音输入者的身份标识对应的上下文信息,其中,所述上下文信息包括所述用户的问答主题、问题的上下文内容,将所述关键词、所述上下文信息与预先存储的语料库进行匹配,当确定从所述语料库中匹配到与所述关键词和所述上下文信息对应的问题的答案信息时,将所述答案信息发送至所述终端。
S53、接收所述服务器返回的答案信息;
S54、将所述答案信息生成语音进行播放。
基于同一发明构思,本发明实施例还提供了一种问答控制装置,由于上述问答控制装置解决问题的原理与问答控制方法相似,因此上述问答控制装置的实施可以参见方法的实施,重复之处不再赘述。
如图6所示,其为本发明实施例提供的问答控制装置的结构示意图,可以包括:
语音采集单元61,用于当接收到语音采集指令时采集语音;
发送单元62,用于将所述语音消息发送至服务器,令所述服务器将所述语音消息转换为文字,并从所述语音消息中提取声音特征,对所述文字进行语义识别提取关键词,根据存储的声音特征与语音输入者的身份标识的对应关系确定与所述提取的声音特征相匹配的语音输入者的身份标识,根据存储的语音输入者的身份标识与上下文信息的对应关系获取所述语音输入者的身份标识对应的上下文信息,其中,所述上下文信息包括所述用户的问答主题、问题的上下文内容,将所述关键词、所述上下文信息与预先存储的语料库进行匹配,当确定从所述语料库中匹配到与所述关键词和所述上下文信息对应的问题的答案信息时,将所述答案信息发送至所述终端。
可选地,所述装置还可以包括:
接收单元63,用于接收所述服务器返回的答案信息;
语音生成单元64,用于将所述答案信息生成语音进行播放。
基于同一技术构思,本发明实施例还提供了一种问答控制系统,包括本发明实施例提供的服务器和问答控制装置。如图7所示,其为本发明实施例提供的问答控制系统的结构示意图。
基于同一技术构思,本发明实施例还提供了一种电子设备700,参照图8所示,电子设备700用于实施上述方法实施例记载的问答控制方法,该实施例的电子设备700可以包括:存储器701、处理器702以及存储在所述存储器中并可在所述处理器上运行的计算机程序,例如客服程序。所述处理器执行所述计算机程序时实现上述各个问答控制方法实施例中的步骤,例如图4所示的步骤S31。或者,所述处理器执行所述计算机程序时实现上述各装置实施例中各模块/单元的功能,例如41。
本发明实施例中不限定上述存储器701、处理器702之间的具体连接介质。本申请实施例在图8中以存储器701、处理器702之间通过总线703连接,总线703在图8中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。所述总线703可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器701可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器701也可以是非易失性存储器(non-volatilememory),例如只读存储器,快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD)、或者存储器701是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器701可以是上述存储器的组合。
本申请实施例还提供了一种计算机可读存储介质,存储为执行上述处理器所需执行的计算机可执行指令,其包含用于执行上述处理器所需执行的程序。
在一些可能的实施方式中,本发明提供的问答控制方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在电子设备上运行时,所述程序代码用于使所述电子设备执行本说明书上述描述的根据本发明各种示例性实施方式的问答控制方法中的步骤。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本发明的实施方式的用于客服的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在计算设备上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)-连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。
此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(装置)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (9)

1.一种问答控制方法,其特征在于,包括:
服务器接收终端发送的问答请求,其中,所述问答请求中携带有语音消息;
将所述语音消息转换为文字,并从所述语音消息中提取声音特征;
对所述文字进行语义识别提取关键词;
根据存储的声音特征与语音输入者的身份标识的对应关系确定与所述提取的声音特征相匹配的语音输入者的身份标识;
根据存储的语音输入者的身份标识与上下文信息的对应关系获取所述语音输入者的身份标识对应的上下文信息,其中,所述上下文信息包括所述语音输入者的问答主题、问题的上下文内容,所述问题的上下文内容包括前一条问答内容和前一条问答主语;
将所述关键词、所述上下文信息与预先存储的语料库进行匹配,所述语料库中存储有问题及问题对应的答案信息;
当确定从所述语料库中匹配到与所述关键词和所述上下文信息对应的问题的答案信息时,将所述答案信息发送至所述终端。
2.一种服务器,其特征在于,包括:
接收单元,接收终端发送的问答请求,其中,所述问答请求中携带有语音消息;
处理单元,用于将所述语音消息转换为文字,并从所述语音消息中提取声音特征;
语义识别单元,用于对所述文字进行语义识别提取关键词;
确定单元,用于根据存储的声音特征与语音输入者的身份标识的对应关系确定与所述提取的声音特征相匹配的语音输入者的身份标识;
获取单元,用于根据存储的语音输入者的身份标识与上下文信息的对应关系获取所述语音输入者的身份标识对应的上下文信息,其中,所述上下文信息包括所述语音输入者的问答主题、问题的上下文内容,所述问题的上下文内容包括前一条问答内容和前一条问答主语;
匹配单元,用于将所述关键词、所述上下文信息与预先存储的语料库进行匹配,所述语料库中存储有问题及问题对应的答案信息;
发送单元,用于当确定从所述语料库中匹配到与所述关键词和所述上下文信息对应的问题的答案信息时,将所述答案信息发送至所述终端。
3.一种问答控制方法,其特征在于,包括:
当终端接收到语音采集指令时采集语音消息;
将所述语音消息发送至服务器,令所述服务器将所述语音消息转换为文字,并从所述语音消息中提取声音特征,对所述文字进行语义识别提取关键词,根据存储的声音特征与语音输入者的身份标识的对应关系确定与所述提取的声音特征相匹配的语音输入者的身份标识,根据存储的语音输入者的身份标识与上下文信息的对应关系获取所述语音输入者的身份标识对应的上下文信息,其中,所述上下文信息包括所述语音输入者的问答主题、问题的上下文内容,所述问题的上下文内容包括前一条问答内容和前一条问答主语,将所述关键词、所述上下文信息与预先存储的语料库进行匹配,所述语料库中存储有问题及问题对应的答案信息,当确定从所述语料库中匹配到与所述关键词和所述上下文信息对应的问题的答案信息时,将所述答案信息发送至所述终端。
4.如权利要求3所述的方法,其特征在于,还包括:
接收所述服务器返回的答案信息;
将所述答案信息生成语音进行播放。
5.一种问答控制装置,其特征在于,包括:
语音采集单元,用于当接收到语音采集指令时采集语音;
发送单元,用于将所述语音消息发送至服务器,令所述服务器将所述语音消息转换为文字,并从所述语音消息中提取声音特征,对所述文字进行语义识别提取关键词,根据存储的声音特征与语音输入者的身份标识的对应关系确定与所述提取的声音特征相匹配的语音输入者的身份标识,根据存储的语音输入者的身份标识与上下文信息的对应关系获取所述语音输入者的身份标识对应的上下文信息,其中,所述上下文信息包括所述语音输入者的问答主题、问题的上下文内容,所述问题的上下文内容包括前一条问答内容和前一条问答主语,将所述关键词、所述上下文信息与预先存储的语料库进行匹配,所述语料库中存储有问题及问题对应的答案信息,当确定从所述语料库中匹配到与所述关键词和所述上下文信息对应的问题的答案信息时,将所述答案信息发送至所述问答控制装置。
6.如权利要求5所述的装置,其特征在于,还包括:
接收单元,用于接收所述服务器返回的答案信息;
语音生成单元,用于将所述答案信息生成语音进行播放。
7.一种问答控制系统,其特征在于,包括权利要求2所述的服务器和权利要求5或6任一项所述的问答控制装置。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1或权利要求3~4任一项所述的问答控制方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1或权利要求3~4任一项所述的问答控制方法中的步骤。
CN201811159936.3A 2018-09-30 2018-09-30 一种问答控制方法、装置及系统 Active CN110970021B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811159936.3A CN110970021B (zh) 2018-09-30 2018-09-30 一种问答控制方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811159936.3A CN110970021B (zh) 2018-09-30 2018-09-30 一种问答控制方法、装置及系统

Publications (2)

Publication Number Publication Date
CN110970021A CN110970021A (zh) 2020-04-07
CN110970021B true CN110970021B (zh) 2022-03-08

Family

ID=70028997

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811159936.3A Active CN110970021B (zh) 2018-09-30 2018-09-30 一种问答控制方法、装置及系统

Country Status (1)

Country Link
CN (1) CN110970021B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112035655B (zh) * 2020-09-02 2023-11-21 中国银行股份有限公司 银行人力资源系统及工作方法
CN112201238A (zh) * 2020-09-25 2021-01-08 平安科技(深圳)有限公司 智能问答中语音数据的处理方法、装置及相关设备
CN112297019B (zh) * 2020-10-12 2022-04-15 杭州横竖科技有限公司 泛在问询机器人及其问询方法
CN112200898A (zh) * 2020-10-27 2021-01-08 平潭诚信智创科技有限公司 教育机器人的课程展示方法
CN112650838B (zh) * 2020-12-31 2023-07-14 南京视察者智能科技有限公司 一种基于历史案件大数据的智能问答方法及系统
CN112929499B (zh) * 2021-02-02 2023-04-07 深圳追一科技有限公司 对话交互方法和装置、计算机设备、计算机可读存储介质
CN113205808A (zh) * 2021-04-27 2021-08-03 无锡星凝互动科技有限公司 一种基于ai咨询云计算搭建方法及系统
CN114168722B (zh) * 2021-11-23 2022-06-14 安徽经邦软件技术有限公司 基于人工智能技术的财务问答机器人

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101309327A (zh) * 2007-04-16 2008-11-19 索尼株式会社 语音聊天系统、信息处理装置、话语识别和关键字检测
CN103024530A (zh) * 2012-12-18 2013-04-03 天津三星电子有限公司 智能电视语音应答系统及方法
CN103413549A (zh) * 2013-07-31 2013-11-27 深圳创维-Rgb电子有限公司 语音交互的方法、系统以及交互终端
CN105075230A (zh) * 2013-03-15 2015-11-18 国际商业机器公司 交互式语音应答会话的声纹标注
CN106128453A (zh) * 2016-08-30 2016-11-16 深圳市容大数字技术有限公司 一种机器人的智能识别语音自动应答方法及机器人
CN106326452A (zh) * 2016-08-26 2017-01-11 宁波薄言信息技术有限公司 一种基于上下文的人机对话方法
CN106357942A (zh) * 2016-10-26 2017-01-25 广州佰聆数据股份有限公司 基于上下文对话语义识别的智能应答方法及系统
CN106354835A (zh) * 2016-08-31 2017-01-25 上海交通大学 基于上下文语义理解的人工对话辅助系统
CN106448670A (zh) * 2016-10-21 2017-02-22 竹间智能科技(上海)有限公司 基于深度学习和强化学习的自动回复对话系统
CN106992012A (zh) * 2017-03-24 2017-07-28 联想(北京)有限公司 语音处理方法及电子设备
CN206672635U (zh) * 2017-01-15 2017-11-24 北京星宇联合投资管理有限公司 一种基于图书服务机器人的语音交互装置
CN107493353A (zh) * 2017-10-11 2017-12-19 宁波感微知著机器人科技有限公司 一种基于上下文信息的智能机器人云计算方法
CN108170792A (zh) * 2017-12-27 2018-06-15 北京百度网讯科技有限公司 基于人工智能的问答引导方法、装置和计算机设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3994368B2 (ja) * 2000-01-25 2007-10-17 ソニー株式会社 情報処理装置および情報処理方法、並びに記録媒体
JP2003255991A (ja) * 2002-03-06 2003-09-10 Sony Corp 対話制御システム、対話制御方法及びロボット装置
CN105740244A (zh) * 2014-12-08 2016-07-06 阿里巴巴集团控股有限公司 一种提供会话快捷消息的方法及设备
KR102643501B1 (ko) * 2016-12-26 2024-03-06 현대자동차주식회사 대화 처리 장치, 이를 포함하는 차량 및 대화 처리 방법

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101309327A (zh) * 2007-04-16 2008-11-19 索尼株式会社 语音聊天系统、信息处理装置、话语识别和关键字检测
CN103024530A (zh) * 2012-12-18 2013-04-03 天津三星电子有限公司 智能电视语音应答系统及方法
CN105075230A (zh) * 2013-03-15 2015-11-18 国际商业机器公司 交互式语音应答会话的声纹标注
CN103413549A (zh) * 2013-07-31 2013-11-27 深圳创维-Rgb电子有限公司 语音交互的方法、系统以及交互终端
CN106326452A (zh) * 2016-08-26 2017-01-11 宁波薄言信息技术有限公司 一种基于上下文的人机对话方法
CN106128453A (zh) * 2016-08-30 2016-11-16 深圳市容大数字技术有限公司 一种机器人的智能识别语音自动应答方法及机器人
CN106354835A (zh) * 2016-08-31 2017-01-25 上海交通大学 基于上下文语义理解的人工对话辅助系统
CN106448670A (zh) * 2016-10-21 2017-02-22 竹间智能科技(上海)有限公司 基于深度学习和强化学习的自动回复对话系统
CN106357942A (zh) * 2016-10-26 2017-01-25 广州佰聆数据股份有限公司 基于上下文对话语义识别的智能应答方法及系统
CN206672635U (zh) * 2017-01-15 2017-11-24 北京星宇联合投资管理有限公司 一种基于图书服务机器人的语音交互装置
CN106992012A (zh) * 2017-03-24 2017-07-28 联想(北京)有限公司 语音处理方法及电子设备
CN107493353A (zh) * 2017-10-11 2017-12-19 宁波感微知著机器人科技有限公司 一种基于上下文信息的智能机器人云计算方法
CN108170792A (zh) * 2017-12-27 2018-06-15 北京百度网讯科技有限公司 基于人工智能的问答引导方法、装置和计算机设备

Also Published As

Publication number Publication date
CN110970021A (zh) 2020-04-07

Similar Documents

Publication Publication Date Title
CN110970021B (zh) 一种问答控制方法、装置及系统
US9990591B2 (en) Automated assistant invocation of appropriate agent
CN109514586B (zh) 实现智能客服机器人的方法及系统
CN107741976B (zh) 智能应答方法、装置、介质和电子设备
WO2017016104A1 (zh) 问答信息的处理方法、装置、存储介质及设备
US11189267B2 (en) Intelligence-driven virtual assistant for automated idea documentation
CN111566638B (zh) 向应用编程接口添加描述性元数据以供智能代理使用
US7949651B2 (en) Disambiguating residential listing search results
CN111898643A (zh) 一种语义匹配方法及装置
CN111178081B (zh) 语义识别的方法、服务器、电子设备及计算机存储介质
TWI674517B (zh) 資訊交互的方法及裝置
CN111312230A (zh) 用于语音对话平台的语音交互监测方法及装置
CN116361431A (zh) 模型训练方法、对话生成方法、电子设备和相关装置
CN111400463B (zh) 对话响应方法、装置、设备和介质
CN111339282A (zh) 智能在线应答方法及智能客服系统
CN113051389B (zh) 知识推送方法及装置
CN114064943A (zh) 会议管理方法、装置、存储介质及电子设备
KR20090076318A (ko) 실시간 대화 서비스 시스템 및 그 방법
CN113132214B (zh) 一种对话方法、装置、服务器及存储介质
US11443117B2 (en) Contextual question answering using human chat logs
CN116821290A (zh) 面向多任务对话的大语言模型训练方法和交互方法
US20200159824A1 (en) Dynamic Contextual Response Formulation
CN111222322B (zh) 信息处理方法和电子设备
CN112084768A (zh) 一种多轮交互方法、装置及存储介质
CN112925889A (zh) 自然语言处理方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant