CN116010569A - 在线答疑方法、系统、电子设备及存储介质 - Google Patents

在线答疑方法、系统、电子设备及存储介质 Download PDF

Info

Publication number
CN116010569A
CN116010569A CN202211698537.0A CN202211698537A CN116010569A CN 116010569 A CN116010569 A CN 116010569A CN 202211698537 A CN202211698537 A CN 202211698537A CN 116010569 A CN116010569 A CN 116010569A
Authority
CN
China
Prior art keywords
questions
question
test
answered
interaction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211698537.0A
Other languages
English (en)
Inventor
丁亮
沙晶
王士进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN202211698537.0A priority Critical patent/CN116010569A/zh
Publication of CN116010569A publication Critical patent/CN116010569A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明涉及在线教育技术领域,提供一种在线答疑方法、系统、电子设备及存储介质,首先获取交互数据,并识别交互数据对应的交互意图;然后在交互意图属于答疑类意图的情况下,从交互数据中抽取待答疑试题,从试题库中确定待答疑试题的相关试题,并基于相关试题,对交互数据进行响应。该方法结合交互数据确定的交互意图,从交互数据中抽取待答疑试题,进而基于试题库中待答疑试题的相关试题,对交互数据进行响应,可以根据提问者的不同需求进行专题解决,缩短提问者的无效等待时间以及答疑者的工作时长,可以降低答疑成本以及对答疑者的自身要求,进一步提升答疑者的工作效率,提升提问者的体验感。

Description

在线答疑方法、系统、电子设备及存储介质
技术领域
本发明涉及在线教育技术领域,尤其涉及一种在线答疑方法、系统、电子设备及存储介质。
背景技术
近几年,在线教育这种以网络为介质的教学方式,突破了时间和空间的限制,使学生与教师即使相隔万里也可以开展教学活动,不仅实现了随时随地的学习,还能够为学生提供更多个性化选择,获得了爆发式增长。
在线答疑作为在线教育的一种形式,由于其不需要提前生产太多的内容,只要有答疑者,并在提问者和答疑者之间配置简单的交流界面的优势,广泛被很多商家关注。然而,在线答疑对及时性要求很高,提问者习惯于面对面交流快速解决,但商家更关注于自身成本,进而会出现一个答疑者需要解答大量提问者的疑问的情况,这不仅增加了提问者的无效等待时间,使提问者的体验较差,也增加了答疑者的工作时长,进而增加了答疑成本,同时对答疑者的自身要求也较高。
为此,现急需提供一种在线答疑方法。
发明内容
本发明提供一种在线答疑方法、系统、电子设备及存储介质,用以解决现有技术中存在的缺陷。
本发明提供一种在线答疑方法,包括:
获取交互数据,并识别所述交互数据对应的交互意图;
在所述交互意图属于答疑类意图的情况下,从所述交互数据中抽取待答疑试题,从试题库中确定所述待答疑试题的相关试题,并基于所述相关试题,对所述交互数据进行响应。
根据本发明提供的一种在线答疑方法,所述从试题库中确定所述待答疑试题的相关试题,包括:
提取所述待答疑试题的语义特征;
将所述待答疑试题的语义特征与所述试题库中各候选试题的语义特征进行匹配,得到与所述待答疑试题相匹配的候选试题,作为所述相关试题。
根据本发明提供的一种在线答疑方法,所述基于所述相关试题,对所述交互数据进行响应,包括:
在所述交互意图为机器答疑的情况下,基于所述相关试题,或者,基于所述相关试题以及所述相关试题的解题步骤,对所述交互数据进行响应;
在所述交互意图为人工答疑的情况下,将所述待答疑试题、所述相关试题和所述相关试题的解题步骤中的至少一种,以及所述交互数据发送到答疑终端,并接收所述答疑终端返回的答疑信息,基于所述答疑信息进行响应。
根据本发明提供的一种在线答疑方法,所述将所述待答疑试题、所述相关试题和所述相关试题的解题步骤中的至少一种,以及所述交互数据发送到答疑终端,包括:
将所述待答疑试题和/或所述相关试题进行结构化处理,得到结构化试题;
将所述结构化试题和/或所述解题步骤,以及所述交互数据发送到答疑终端。
根据本发明提供的一种在线答疑方法,所述识别所述交互数据对应的交互意图,之后还包括:
在所述交互意图属于非答疑类意图的情况下,基于所述交互意图对应的下游处理引擎,对所述交互数据进行响应。
根据本发明提供的一种在线答疑方法,所述基于所述交互意图对应的下游处理引擎,对所述交互数据进行响应,包括:
从所述交互数据中抽取查询问题,并从问答库中匹配所述查询问题对应的答案,基于所述答案,对所述交互数据进行响应。
根据本发明提供的一种在线答疑方法,所述对所述交互数据进行响应,包括:
确定待响应文本;
对所述待响应文本进行话术润色,得到润色文本;
基于所述润色文本,对所述交互数据进行响应。
本发明还提供一种在线答疑系统,包括:
数据识别模块,用于获取交互数据,并识别所述交互数据对应的交互意图;
数据响应模块,用于在所述交互意图属于答疑类意图的情况下,从所述交互数据中抽取待答疑试题,从试题库中确定所述待答疑试题的相关试题,并基于所述相关试题,对所述交互数据进行响应。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述的在线答疑方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述的在线答疑方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述的在线答疑方法。
本发明提供的在线答疑方法、系统、电子设备及存储介质,首先获取交互数据,并识别交互数据对应的交互意图;然后在交互意图属于答疑类意图的情况下,从交互数据中抽取待答疑试题,从试题库中确定待答疑试题的相关试题,并基于相关试题,对交互数据进行响应。该方法结合交互数据确定的交互意图,从交互数据中抽取待答疑试题,进而基于试题库中待答疑试题的相关试题,对交互数据进行响应,可以根据提问者的不同需求进行专题解决,缩短提问者的无效等待时间以及答疑者的工作时长,可以降低答疑成本以及对答疑者的自身要求,进一步提升答疑者的工作效率,提升提问者的体验感。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的在线答疑方法的流程示意图之一;
图2是本发明提供的在线答疑方法的流程示意图之二;
图3是本发明提供的在线答疑方法中答疑辅助工具的结构示意图;
图4是本发明提供的在线答疑方法中话术润色前后变化对比图;
图5是本发明提供的在线答疑方法中自动答疑全流程示意图;
图6是本发明提供的在线答疑系统的结构示意图;
图7是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
当前,在线教育相关产品的定位一般是“帮助中小学生解决学习过程中的难题,提供学习辅导、练习,让学习更简单”,如作业帮、小猿搜题等,这类产品背靠千万级别题库,初期以一种拍照搜题工具,可快速方便学生找到作业或考试中的做错题、不会原题以及相似题中至少一项的答案,为家长提供了极大的便利。
但随着使用用户剧增及管控懈怠化,开始出现搜题工具抄袭答案、考试作弊等各类问题,搜题工具需要在家长管控下才能使用,以方便家长协助孩子学习,这虽然能减少上述问题的出现,但是会带来新的问题:1)家长手机不在自己身边;2)家长没时间管自己;3)答案无法理解;4)找不到答案等等。因此在线教育中的在线答疑被广泛关注,其原因在于:第一、刚需;因为学生都有问问题的诉求,在线下学生会不好意思去问老师或者问同学,到了线上能天然的把这部分人的提问能力都激发出来,线上的天然屏障让不善于交流的学生担忧完全过滤;第二,不需要生产内容;无论是做视频课程教学、做题库,还是做老师教学辅助,都需要生产大量的内容去支撑用户的使用,即便是做平台,也需要不断的去找内容来填充,才能支撑起这个产品。但在线答疑却是互联网人很容易切入的,它不需要提前生产太多的内容,只要有答疑者,并在提问者和答疑者之间配置简单的交流界面即可,不仅合理的避开了互联网人不懂教育这个弊端,还能吸引大流量。
但是,由于在线答疑对及时性要求很高,提问者习惯于面对面交流快速解决,但商家更关注于自身成本,因此会出现一个答疑者需要解答大量提问者的疑问的情况,这不仅大大增加了提问者的等待时间,使提问者的体验较差,也增加了答疑者的工作时长,进而增加了答疑成本,对答疑者的自身要求也较高。而且,在线答疑对准确度要求也较高,用户来答疑就是自己不想再花时间去甄选,一旦错了,整个产品就会失去用户的信任;所以想继续生存下去,就得大量堆人,还得是有教育经验、有解题能力且熟悉电脑编辑的老师;这样也存在答疑成本高、对答疑者的自身要求高的问题。
目前在线答疑的技术方案实现上,考虑在线答疑的快速反应及准确性的需求,仍然趋向使用真人形式建立线上答疑形式,主流形式包括如下三种:1)传统式线上真人老师辅助,通过一个互联网平台,学生通过输入/拍照自己得问题,老师在线获得信息后,通过语音/文字/图片/视频等形式进行解答。如一些教培机构上网课、直播课、录播课等形式,以及老师不在身边,学生学习遇到困难,心中有了疑惑却无从求教,这时教育云平台“线上答疑”应运而生;2)在线答疑的衍生物,即社区答疑。通过建群(QQ、微信等)或者建立线上部落,通过一定社区管理模式,鼓励学生互帮互助,并设立相应激励吸引优质老师/学生在社区内帮助别人解决作业/学习上得难题;3)搜题类学习辅助工具的用户基数非常大,将搜题平台的搜题功能转化为拍照答疑,如“小猿搜题”、作业帮,为一些经常被搜试题制作讲解视频/记录用户历史讲解记录;在学生模式下,无法看到原题的解答,只有同类题讲解视频。
上述三类形式中,第一类形式完全属于堆高水平老师方式,但学生上线时间不可控,老师工作时间也有限精力也有限,且不同学科、学段老师还不能复用,要快速回复学生问题,则需要付出大量人力,因此这类方式不利于商业大规模推广,只适合产品初期/小规模VIP服务;第二类形式一定程度上解决了学生不同时间、年级、教材版本、学科的问答诉求,但是重点面临是问答时间、社区管理以及问答质量控制;若能很好的管理社区,并做到智能分配学生问答给在线学生,并有非常好的激励模式鼓励师生互帮互助,这是个非常好的商业模型,但很显然这是个非常困难的综合性问题。第三类形式本质上说不属于直接答疑,更属于资源加工及复用调度问题;这类形式是将部分试题与已建讲解视频、学生历史答疑记录进行后台挂接,通过相似题映射方式将相关资源复用,因此学生在搜寻试题时并不能看到本题答案,而是相似题解题视频/历史其他学生问答过程,这类模式依靠少量商家加工结合用户加工(UGC模式)结合,从而不断扩充。在资源积累一段时间后可能靠谱,但时间不可控,且更重要是无法解决不同学生个性化痛点,即每个学生不会做的原因不同,无法针对性回答,复用率极低。基于此,本发明实施例中提供了一种在线答疑方法。
图1为本发明实施例中提供的一种在线答疑方法的流程示意图,如图1所示,该方法包括:
S1,获取交互数据,并识别所述交互数据对应的交互意图;
S2,在所述交互意图属于答疑类意图的情况下,从所述交互数据中抽取待答疑试题,从试题库中确定所述待答疑试题的相关试题,并基于所述相关试题,对所述交互数据进行响应。
具体地,本发明实施例中提供的在线答疑方法,其执行主体为在线答疑系统,该系统可以配置于计算机内,该计算机可以为本地计算机或云计算机,本地计算机可以是电脑、平板等,此处不作具体限定。
首先执行步骤S1,获取交互数据,该交互数据可以是提问者与答题者之间的多轮对话过程中的交互数据。如图2所示,多轮对话可以是各种对话场景,某一时刻的交互数据可以输入至文本预处理层,通过文本预处理层对交互数据进行身份标注、去噪声数据、停顿词等预处理操作。此后将预处理操作所得结果输入至文本表征层,通过文本表征层将预处理操作所得结果转换为高维向量。文本表征层可采用常见的如Macbert中文预训练模型+相关学科领域问答模型微调获得。
接着,按照时间发生高维向量的序列重组,并将重组结果输入至意图识别模型,得到提问者在某个时刻的交互意图。该意图识别模型可以是常见通过语义匹配的排序方式、意图分类与槽填充模型等;意图标签可通过对现有百万对话数据进行人工标注,也可以通过半监督/无监督方式进行聚类生成。
在提问者与答题者之间的多轮对话过程中,可以体现出提问者的不同意图,进而通过对交互数据进行识别,可以得到交互数据对应的交互意图。该交互意图可以包括答疑类意图和非答疑类意图,答疑类意图可以包括询问解题步骤、寻找相似题以及人工服务等类别,非答疑类意图可以包括询问知识概念、闲聊以及询问具体业务等类别。
当意图识别模型获得某一交互时刻的交互意图后,则自动触发对应的下游处理引擎。此处,下游处理引擎是一种插拔式的功能模块,主要用于对不同交互意图的交互数据进行响应。下游处理引擎的插拔式设计,可以满足不同业务场景的模块需求。
每个类别的交互意图均对应有一个下游处理引擎,则询问知识概念、闲聊、询问具体业务、询问解题步骤、寻找相似题以及人工服务分别连接有下游处理引擎1、下游处理引擎2、下游处理引擎3、下游处理引擎4、下游处理引擎5以及下游处理引擎6。
然后,执行步骤S2,在交互意图属于答疑类意图的情况下,对应的下游处理引擎(例如包括上述的下游处理引擎4、下游处理引擎5以及下游处理引擎6)可以从交互数据中抽取待答疑试题。该待答疑试题可以是拍照试题、手写试题以及语音试题中的至少一项。其中,下游处理引擎4可以对询问解题步骤的提问者结合答疑辅助工具获得的结构化解答过程进行解题步骤输出,下游处理引擎5可以是检索引擎,用于输出待答疑试题的相似题,下游处理引擎6可以用于埋点。
进而,可以借助于答疑辅助工具,从试题库中确定待答疑试题的相关试题。可以利用答疑辅助工具对待答疑试题进行文本转换,得到待答疑试题的文本表示,并基于待答疑试题的文本表示,将待答疑试题与试题库中各候选试题进行匹配,得到试题库中待答疑试题的相关试题。该相关试题可以是待答疑试题的相同题或相似题等,此处不作具体限定。试题库可以是持续更新的高质量K12学科的试题题库,试题库内包含有大量候选试题以及每个候选试题的解题步骤。
答疑辅助工具的文本转换功能可以通过特征处理模块实现,若待答疑试题为拍照试题或手写试题,则特征处理模块对待答疑试题进行OCR转义,若待答疑试题为语音试题,则特征处理模块对待答疑试题进行语音转写。
得到待答疑试题的相关试题之后,根据相关试题,对交互数据进行响应。例如,可以从试题库中确定相关试题的解题步骤,并将相关试题中相同题的解题步骤作为待答疑试题的解题步骤提供给提问者,或者根据相关试题中相似题的解题步骤确定出待答疑试题的解题步骤,并将待答疑试题的解题步骤提供给提问者,以实现对交互数据的响应。
本发明实施例中提供的在线答疑方法,首先获取交互数据,并识别交互数据对应的交互意图;然后在交互意图属于答疑类意图的情况下,从交互数据中抽取待答疑试题,从试题库中确定待答疑试题的相关试题,并基于相关试题,对交互数据进行响应。该方法结合交互数据确定的交互意图,从交互数据中抽取待答疑试题,进而基于试题库中待答疑试题的相关试题,对交互数据进行响应,可以根据提问者的不同需求进行专题解决,缩短提问者的无效等待时间以及答疑者的工作时长,可以降低答疑成本以及对答疑者的自身要求,进一步提升答疑者的工作效率,提升提问者的体验感。
在上述实施例的基础上,本发明实施例中提供的在线答疑方法,所述从试题库中确定所述待答疑试题的相关试题,包括:
提取所述待答疑试题的语义特征;
将所述待答疑试题的语义特征与所述试题库中各候选试题的语义特征进行匹配,得到与所述待答疑试题相匹配的候选试题,作为所述相关试题。
具体地,在确定待答疑试题的相关试题时,可以先提取待答疑试题的语义特征,即答疑辅助工具还包括学科试题编码模块,学科试题编码模块可以是BERT模型。
学科试题编码模块可以将待答疑试题的文本表示编码成表征语义特征的高维向量,进而可以将待答疑试题的语义特征与试题库中各候选试题的语义特征进行匹配,即进行相似度计算,并将各候选试题按相似度降序排列,可以认为前K个候选试题与待答疑试题相匹配,即作为待答疑试题的相关试题。其中,若前K个候选试题中存在待答疑试题的相同题,则可以直接使用,若前K个候选试题中不存在待答疑试题的相同题,则认为前K个候选试题待答疑试题的相似题,也可以辅助答疑者快速找到原题的解题步骤。
本发明实施例中,通过提取待答疑试题的语义特征,可以提高匹配效率以及准确性,进而使相关试题更加准确,且确定效率更高。
在上述实施例的基础上,本发明实施例中提供的在线答疑方法,所述基于所述相关试题,对所述交互数据进行响应,包括:
在所述交互意图为机器答疑的情况下,基于所述相关试题,或者,基于所述相关试题以及所述相关试题的解题步骤,对所述交互数据进行响应;
在所述交互意图为人工答疑的情况下,将所述待答疑试题、所述相关试题和所述相关试题的解题步骤中的至少一种,以及所述交互数据发送到答疑终端,并接收所述答疑终端返回的答疑信息,基于所述答疑信息进行响应。
具体地,在对交互数据进行响应时,可以分两种情况进行响应,一种情况是交互意图为机器答疑,在此情况下,可以基于相关试题,或者,基于相关试题以及相关试题的解题步骤,对交互数据进行响应。该过程不需要答疑者的参与,使答疑者释放的人力专注到难解决复杂问题上,进一步提升在线答疑效率。
此处,若交互意图为寻找相似题,则可以直接将相关试题中的相似题发送至提问者,以实现对交互数据的响应。
若交互意图为询问解题步骤,且相关试题为相同题时,则可以从试题库中确定相关试题的解题步骤,并可以将该相关试题的解题步骤作为待答疑试题的解题步骤发送至提问者,以实现对交互数据的响应。
若交互意图为询问解题步骤,且相关试题为相似题时,可以根据相关试题以及相关试题的解题步骤,为待答疑试题提供解题思路,进而确定待答疑试题的解题步骤,并将待答疑试题的解题步骤发送至提问者,以实现对交互数据的响应。
另一种情况是交互意图为人工答疑,在此情况下,将待答疑试题、相关试题和相关试题的解题步骤中的至少一种,以及交互数据发送到答疑终端,答疑者可以通过答疑终端查看到接收的数据。
若交互意图为寻找相似题,则答疑者可以直接将相关试题中的相似题作为答疑信息返回在线答疑系统。
若交互意图为询问解题步骤,且相关试题为相同题时,则答疑者可以将相关试题的解题步骤作为答疑信息返回在线答疑系统。
若交互意图为询问解题步骤,且相关试题为相似题时,则答疑者可以根据相关试题以及相关试题的解题步骤提供的解题思路,确定待答疑试题的解题步骤,并将待答疑试题的解题步骤答疑信息返回在线答疑系统。
在线答疑系统则可以接收答疑信息,并将接收到的答疑信息作为对交互数据的响应结果发送至提问者。
此处,只有交互意图为人工答疑时,答疑者才会进行答疑工作,如此可以进一步减少答疑者的工作量,提高提问者的需求响应效率。
由于实际场景下,答疑者会面临多个提问者,答题者需要看题,理解再作答则非常耗时,基本读题+确定作答思路则至少需要2min,若进一步考虑打字、公式编辑等耗时则基本无法应付,因此很多答疑者编辑会出现中文代替公式,或语音/拍照讲述;若能自动辅助答疑者得到解答过程及讲解思路,再将数学符号转义成常见对话平台可展示模式,再进行智能解答分段,则直接免除解题及编写过程。
基于此,在上述实施例的基础上,本发明实施例中提供的在线答疑方法,所述将所述待答疑试题、所述相关试题和所述相关试题的解题步骤中的至少一种,以及所述交互数据发送到答疑终端,包括:
将所述待答疑试题和/或所述相关试题进行结构化处理,得到结构化试题;
将所述结构化试题和/或所述解题步骤,以及所述交互数据发送到答疑终端。
具体地,在将待答疑试题、相关试题和相关试题的解题步骤中的至少一种,以及交互数据发送到答疑终端时,可以先将待答疑试题和/或相关试题进行结构化处理,得到结构化试题。
结构化处理是指将待答疑试题和/或相关试题转成对话框可正常展示模式(对话框无公式渲染),主要包含特殊数学符号需要做转义,以及常见分数、根式等数学特殊公式;其次,需要根据常见书写数学解答过程及说话人习惯,自动给文本进行断句分段,方便后续答疑者选择性复制;此处具体技术不限制,如最简单分段方法可以根据常见数学符号“∵”、“∴”等进行,而解析等话术可以根据句号和分号等进行分段。本发明实施例中,结构化处理可以采用试题结构化处理Pipeline引擎实现,也可以通过其他单元实现,此处不作具体限定。
如图3所示,答疑辅助工具包括特征处理模块以及学科试题编码模块,特征处理模块可以对拍照试题或手写试题进行OCR转义,对语音试题进行语音转写,得到各类型的待答疑试题的文本表示。经学科试题编码模块将待答疑试题的文本表示编码成表征语义特征的高维向量,并将待答疑试题的语义特征与试题库中各候选试题的语义特征进行相似度计算,确定相关试题。此后,还可以对待答疑试题和/或相关试题进行结构化处理,得到结构化试题。
经结构化处理得到的结构化试题,不仅可以具有较高的可读性,还可以用于答疑者选择性复制,进而辅助答疑者快速对交互数据进行响应。
由于有些提问者并不是需要答案,而是有不同意图,如想知道如何学习该类知识点、一些概念如何理解、如何定制具体业务、想找某个确定答疑师等;这些问题如能根据意图自动分流到不同下游处理引擎,则完全不用触发答疑者对接,可以快速解决提问者的问题。
基于此,在上述实施例的基础上,本发明实施例中提供的在线答疑方法,所述识别所述交互数据对应的交互意图,之后还包括:
在所述交互意图属于非答疑类意图的情况下,基于所述交互意图对应的下游处理引擎,对所述交互数据进行响应。
具体地,当交互意图属于非答疑类意图时,可以直接根据交互意图对应的下游处理引擎,对交互数据进行响应。例如,询问知识概念时,即某提问者在询问某个科普知识点后,意图分类其要询问科普知识,则可以利用下游处理引擎1调用后台已存储好的科普知识库进行回答。该下游处理引擎1可以是知识库匹配引擎。闲聊则需要在下游处理引擎2中引入闲聊机器人模型(ChitChat-Bot),对询问具体业务的提问者则在下游处理引擎3中设计任务推荐机器人或以FAQ形式进行对答。
将各下游处理引擎设计成插拔式是为了满足不同业务场景模块需求,如有些业务在无闲聊机器人时,则直接可以触发模块缺失,打包历史记录进入人工服务,这样答疑者可快速接到需求,快速响应而不需要重复询问。此处对走到人工服务的历史进行埋点,是为了答疑机器人在处理问题过程中出现的异常进行数据积累,用于后续持续训练各个下游处理引擎。
本发明实施例中,根据用户意图自动连接下游任务,利用各下游处理引擎,自动对交互数据进行响应,不需要借助于答疑者,可以快速减少在无关问题上等待回复时间,大大提升在线答疑效率,也可以降低答疑者的负担。比如学生问个知识点概念,就完全不用排队等答疑师,而是直接通过下游的下游处理引擎1完成。
在上述实施例的基础上,本发明实施例中提供的在线答疑方法,所述基于所述交互意图对应的下游处理引擎,对所述交互数据进行响应,包括:
从所述交互数据中抽取查询问题,并从问答库中匹配所述查询问题对应的答案,基于所述答案,对所述交互数据进行响应。
具体地,在利用交互意图对应的下游处理引擎,对交互数据进行响应时,可以先从交互数据中抽取查询问题,并从预先构建的问答库中匹配查询问题对应的答案,并将该答案发送至提问者,以实现对交互数据的响应。
以交互意图是询问知识概念为例,由于在线答疑大多情况面对学科问题,如学生问如何给三角形作辅助线,这类问题常规百科库搜索匹配无法很好匹配相关答案,因此本发明实施例中通过历史海量在校上课记录、问答数据等构建问答库。此后,通过相似语义快速匹配方式进行检索,从而完成学科专业问题问答。
本发明实施例中,通过将交互数据中抽取的查询问题与问答库进行匹配以得到答案,实现对交互数据的响应,可以提升响应准确性。
在上述实施例的基础上,本发明实施例中提供的在线答疑方法,所述对所述交互数据进行响应,包括:
确定待响应文本;
对所述待响应文本进行话术润色,得到润色文本;
基于所述润色文本,对所述交互数据进行响应。
具体地,由于各下游处理引擎生成的响应数据可能存在过于生硬的问题,因此接入AI润色,并完成回答后和提问者确认是否理解,若理解则完成任务,未理解则引入答疑者校验,数据同样加入埋点。
可以理解的是,待响应文本是指各下游处理引擎输出的响应数据。可以将该响应数据输入至润色模型,通过润色模型进行话术润色,并得到润色模型输出的润色文本。最后,可以将该润色文本发送至提问者,以实现对交互数据的响应。
润色模型可以基于训练样本对初始模型进行训练得到,初始模型可以是端到端的encoder-decoder模型。该训练样本可以是基于如下步骤确定:将数十万场K12领域直播课、在校上课语音转成对话文字,同时对于历史积累的近百万答疑场景下师生对话进行处理,构建有学科知识嵌入的(原始话术,润色话术)的pair对,该pair对结合专家话术库共同作为训练样本。
图4显示了话术润色前后改变,部分符号会转成文字、也会增加一些寒暄词等,就是尽量让学生觉得是人在回答,即便出些打字错误等;后续同样考虑可以将部分话术转为语音等,借助语音生成模拟答疑者声音,则更加拟人化。
在训练样本中引入专家话术库,主要是考虑初始模型无法生成置信度高的语句,如提问者问“老师是机器人吗”,面对此类问题在训练样本中存在很少或者不存在,这样仅仅靠初始模型则会生成出乎意料的话。评分系统主要考察原始的待响应文本与润色文本的语义相似度、流畅度及合理性等。基于人工模板和检索的混合技术,通过专家话术库的语义相似度匹配方式/模糊匹配进行,如专家话术库中有“老师是自然人咯”,或者“同学好,这里是答疑场景”等话术,这样解决了模型冷启动难预测问题。
本发明实施例中,由于引入了话术润色步骤,营造真人答疑场景,可以保证良好的响应效果,提高提问者体验感。
图5为本发明实施例中提供的自动答疑全流程示意图,如图5所示,该方法包括:
确定提问者问题,提问者问题的意图包括询问知识概念、闲聊、询问具体业务、询问解题步骤、寻找相似题以及人工服务。
对提问者问题进行问题分析,并基于分析结果进行问题确认;其中,问题分析可以包括对交互数据的关键词抽取、语义理解以及标准化发问过程。
利用答疑辅助工具确定提问者问题对应的相关问题。
对于具有询问解题步骤以及寻找相似题意图的提问者问题,利用相关问题以及分析结果,并分别结合下游处理引擎4、下游处理引擎5对提问者问题进行答复,得到初始答复文本。
对于询问知识概念、闲聊、询问具体业务以及人工服务意图的提问者问题,利用分析结果,并分别结合下游处理引擎1、下游处理引擎2、下游处理引擎3以及下游处理引擎4,对提问者问题进行答复,得到初始答复文本。
对初始答复文本进行AI润色,并进行点评埋点,最终确认结束,生成最终答复文本发送至提问者。
综上所述,本发明实施例中提供了一种面向K12学段的作业在线答疑方法,该方法通过建模用户特征及问答意图,为用户智能分流到需要解决问题的队列中,从而快速找到对应老师/对应资源,最后通过学科文本结构化输出,能有效在对话框展示各类公式及字符,减少理解误差,实现教师人力减负、专人专事,学生减少无效等待。为营造真人氛围及便于商业推广,更是对生成答案进行拟人化输出,让答疑过程变成常态化交流。
如图6所示,在上述实施例的基础上,本发明实施例中提供了一种在线答疑系统,包括:
数据识别模块61,用于获取交互数据,并识别所述交互数据对应的交互意图;
数据响应模块62,用于在所述交互意图属于答疑类意图的情况下,从所述交互数据中抽取待答疑试题,从试题库中确定所述待答疑试题的相关试题,并基于所述相关试题,对所述交互数据进行响应。
在上述实施例的基础上,本发明实施例中提供的在线答疑系统,所述数据响应模块,具体用于:
提取所述待答疑试题的语义特征;
将所述待答疑试题的语义特征与所述试题库中各候选试题的语义特征进行匹配,得到与所述待答疑试题相匹配的候选试题,作为所述相关试题。
在上述实施例的基础上,本发明实施例中提供的在线答疑系统,所述数据响应模块,具体用于:
在所述交互意图为机器答疑的情况下,基于所述相关试题,或者,基于所述相关试题以及所述相关试题的解题步骤,对所述交互数据进行响应;
在所述交互意图为人工答疑的情况下,将所述待答疑试题、所述相关试题和所述相关试题的解题步骤中的至少一种,以及所述交互数据发送到答疑终端,并接收所述答疑终端返回的答疑信息,基于所述答疑信息进行响应。
在上述实施例的基础上,本发明实施例中提供的在线答疑系统,所述数据响应模块,具体用于:
将所述待答疑试题和/或所述相关试题进行结构化处理,得到结构化试题;
将所述结构化试题和/或所述解题步骤,以及所述交互数据发送到答疑终端。
在上述实施例的基础上,本发明实施例中提供的在线答疑系统,所述数据响应模块,还具体用于:
在所述交互意图属于非答疑类意图的情况下,基于所述交互意图对应的下游处理引擎,对所述交互数据进行响应。
在上述实施例的基础上,本发明实施例中提供的在线答疑系统,所述数据响应模块,还具体用于:
从所述交互数据中抽取查询问题,并从问答库中匹配所述查询问题对应的答案,基于所述答案,对所述交互数据进行响应。
在上述实施例的基础上,本发明实施例中提供的在线答疑系统,所述数据响应模块,还具体用于:
确定待响应文本;
对所述待响应文本进行话术润色,得到润色文本;
基于所述润色文本,对所述交互数据进行响应。
具体地,本发明实施例中提供的在线答疑系统中各模块的作用与上述方法类实施例中各步骤的操作流程是一一对应的,实现的效果也是一致的,具体参见上述实施例,本发明实施例中对此不再赘述。
图7示例了一种电子设备的实体结构示意图,如图7所示,该电子设备可以包括:处理器(Processor)710、通信接口(Communications Interface)720、存储器(Memory)730和通信总线740,其中,处理器710,通信接口720,存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器730中的逻辑指令,以执行上述各实施例中提供的在线答疑方法,该方法包括:获取交互数据,并识别所述交互数据对应的交互意图;在所述交互意图属于答疑类意图的情况下,从所述交互数据中抽取待答疑试题,从试题库中确定所述待答疑试题的相关试题,并基于所述相关试题,对所述交互数据进行响应。
此外,上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各实施例中提供的在线答疑方法,该方法包括:获取交互数据,并识别所述交互数据对应的交互意图;在所述交互意图属于答疑类意图的情况下,从所述交互数据中抽取待答疑试题,从试题库中确定所述待答疑试题的相关试题,并基于所述相关试题,对所述交互数据进行响应。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例中提供的在线答疑方法,该方法包括:获取交互数据,并识别所述交互数据对应的交互意图;在所述交互意图属于答疑类意图的情况下,从所述交互数据中抽取待答疑试题,从试题库中确定所述待答疑试题的相关试题,并基于所述相关试题,对所述交互数据进行响应。
以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种在线答疑方法,其特征在于,包括:
获取交互数据,并识别所述交互数据对应的交互意图;
在所述交互意图属于答疑类意图的情况下,从所述交互数据中抽取待答疑试题,从试题库中确定所述待答疑试题的相关试题,并基于所述相关试题,对所述交互数据进行响应。
2.根据权利要求1所述的在线答疑方法,其特征在于,所述从试题库中确定所述待答疑试题的相关试题,包括:
提取所述待答疑试题的语义特征;
将所述待答疑试题的语义特征与所述试题库中各候选试题的语义特征进行匹配,得到与所述待答疑试题相匹配的候选试题,作为所述相关试题。
3.根据权利要求1所述的在线答疑方法,其特征在于,所述基于所述相关试题,对所述交互数据进行响应,包括:
在所述交互意图为机器答疑的情况下,基于所述相关试题,或者,基于所述相关试题以及所述相关试题的解题步骤,对所述交互数据进行响应;
在所述交互意图为人工答疑的情况下,将所述待答疑试题、所述相关试题和所述相关试题的解题步骤中的至少一种,以及所述交互数据发送到答疑终端,并接收所述答疑终端返回的答疑信息,基于所述答疑信息进行响应。
4.根据权利要求3所述的在线答疑方法,其特征在于,所述将所述待答疑试题、所述相关试题和所述相关试题的解题步骤中的至少一种,以及所述交互数据发送到答疑终端,包括:
将所述待答疑试题和/或所述相关试题进行结构化处理,得到结构化试题;
将所述结构化试题和/或所述解题步骤,以及所述交互数据发送到答疑终端。
5.根据权利要求1所述的在线答疑方法,其特征在于,所述识别所述交互数据对应的交互意图,之后还包括:
在所述交互意图属于非答疑类意图的情况下,基于所述交互意图对应的下游处理引擎,对所述交互数据进行响应。
6.根据权利要求5所述的在线答疑方法,其特征在于,所述基于所述交互意图对应的下游处理引擎,对所述交互数据进行响应,包括:
从所述交互数据中抽取查询问题,并从问答库中匹配所述查询问题对应的答案,基于所述答案,对所述交互数据进行响应。
7.根据权利要求1-6中任一项所述的在线答疑方法,其特征在于,所述对所述交互数据进行响应,包括:
确定待响应文本;
对所述待响应文本进行话术润色,得到润色文本;
基于所述润色文本,对所述交互数据进行响应。
8.一种在线答疑系统,其特征在于,包括:
数据识别模块,用于获取交互数据,并识别所述交互数据对应的交互意图;
数据响应模块,用于在所述交互意图属于答疑类意图的情况下,从所述交互数据中抽取待答疑试题,从试题库中确定所述待答疑试题的相关试题,并基于所述相关试题,对所述交互数据进行响应。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7中任一项所述的在线答疑方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7任一项所述的在线答疑方法。
CN202211698537.0A 2022-12-28 2022-12-28 在线答疑方法、系统、电子设备及存储介质 Pending CN116010569A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211698537.0A CN116010569A (zh) 2022-12-28 2022-12-28 在线答疑方法、系统、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211698537.0A CN116010569A (zh) 2022-12-28 2022-12-28 在线答疑方法、系统、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN116010569A true CN116010569A (zh) 2023-04-25

Family

ID=86034898

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211698537.0A Pending CN116010569A (zh) 2022-12-28 2022-12-28 在线答疑方法、系统、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116010569A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116737883A (zh) * 2023-08-15 2023-09-12 科大讯飞股份有限公司 人机交互方法、装置、设备及存储介质
CN117876036A (zh) * 2024-03-12 2024-04-12 成都信通信息技术有限公司 一种贸易问题线上问答积分奖励管理方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116737883A (zh) * 2023-08-15 2023-09-12 科大讯飞股份有限公司 人机交互方法、装置、设备及存储介质
CN117876036A (zh) * 2024-03-12 2024-04-12 成都信通信息技术有限公司 一种贸易问题线上问答积分奖励管理方法及系统
CN117876036B (zh) * 2024-03-12 2024-05-07 成都信通信息技术有限公司 一种贸易问题线上问答积分奖励管理方法及系统

Similar Documents

Publication Publication Date Title
Kim et al. Design principles and architecture of a second language learning chatbot
JP6793975B2 (ja) 動画基盤求人求職マッチングサーバーおよび方法ならびにその方法を遂行するためのプログラムが記録されたコンピュータ読み取り可能記録媒体
CN116010569A (zh) 在线答疑方法、系统、电子设备及存储介质
CN106777257B (zh) 基于话术的智能对话模型的构建系统及方法
CN111833672B (zh) 一种教学视频的展示方法、装置及系统
CN111831831A (zh) 一种基于知识图谱的个性化学习平台及其构建方法
Mehta et al. Automated 3D sign language caption generation for video
CN110795917A (zh) 个性化讲义生成方法、系统及电子设备、存储介质
KR101227131B1 (ko) 대화형 언어 교육 시스템
CN112233477A (zh) 一种智能答疑教育系统
CN117252259A (zh) 基于深度学习的自然语言理解方法及ai助教系统
Ball et al. Research, Principles, and Practices in Visual Communication.
CN116825288A (zh) 孤独症康复课程记录方法、装置、电子设备及存储介质
CN110321414A (zh) 一种基于深度学习的人工智能咨询服务方法及系统
CN117556057A (zh) 知识问答方法、向量数据库构建方法及装置
CN112966518A (zh) 一种面向大规模在线学习平台的优质答案识别方法
CN116416839A (zh) 一种基于物联网实训系统的实训辅助教学的方法
CN115860998A (zh) 基于实操业务的学习配置方法、装置、设备及存储介质
CN115730607A (zh) 对话检测模型训练方法及装置
CN116127028A (zh) 一种基于引入对比学习的对话系统及前端实现方法
CN116011413B (zh) 用于教育一体机多方批注数据的综合管理系统及方法
CN117453895B (zh) 一种智能客服应答方法、装置、设备及可读存储介质
Jindal et al. Utilization of Chabot in an Educational System
Gupta et al. Fostering Interdisciplinary Learning for Elementary Students Through Developing Interactive Digital Stories
CN117648408B (zh) 基于大模型的智能问答方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination