CN111666394A - 一种文本处理方法及装置 - Google Patents

一种文本处理方法及装置 Download PDF

Info

Publication number
CN111666394A
CN111666394A CN202010368448.4A CN202010368448A CN111666394A CN 111666394 A CN111666394 A CN 111666394A CN 202010368448 A CN202010368448 A CN 202010368448A CN 111666394 A CN111666394 A CN 111666394A
Authority
CN
China
Prior art keywords
question
module
answering
answer
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010368448.4A
Other languages
English (en)
Inventor
左充
李健
武卫东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sinovoice Technology Co Ltd
Original Assignee
Beijing Sinovoice Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sinovoice Technology Co Ltd filed Critical Beijing Sinovoice Technology Co Ltd
Priority to CN202010368448.4A priority Critical patent/CN111666394A/zh
Publication of CN111666394A publication Critical patent/CN111666394A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种文本处理方法及装置,该方法包括:智能客服系统中的中控模块接收输入文本并根据该输入文本,从至少两个问答模块中确定与输入文本匹配的第一问答模块;中控模块然后将所述输入文本发送至所述第一问答模块并获取第一问答模块返回的第一答案和第一置信度;在第一置信度满足预设条件的情况下,中控模块将第一答案作为目标答案,并输出该目标答案。这样,本发明实施例通过将接收的输入文本发送至匹配的第一问答模块,实现了每个输入问题只分发给一个特定的问答模块,能够提高智能客服系统的性能,节省运算资源;同时本发明实施例也无需对问答模块进行裁减,能够提升问答效果,减少人力介入。

Description

一种文本处理方法及装置
技术领域
本发明涉及智能客服系统领域,特别是涉及一种文本处理方法及装置。
背景技术
目前,智能客服系统被广泛应用于知识管理、自动问答系统、推理等行业,可以用于回答不同形式的问题。现有技术中的智能问答处理过程往往是:智能客服系统接收到一个问题后,将该问题发送至系统内的所有问答模块同时进行处理,获取每个问答模块返回的答案和置信度后,在其中选择置信度最高的答案作为最优答案返回给用户。但多个问答模块的并行处理,使得智能客服系统耗费大量资源,运算性能下降。
发明内容
本发明实施例提供一种文本处理方法及装置,以解决现有技术中智能客服系统运算性能不佳、问答效果有限的问题。
为了解决上述问题,本发明实施例是这样实现的:
第一方面,本发明实施例公开了一种文本处理方法,应用于智能客服系统,所述智能客服系统包括中控模块以及至少两个问答模块,该方法包括:
所述中控模块获取输入文本;
所述中控模块根据所述输入文本,从所述至少两个问答模块中确定与所述输入文本匹配的第一问答模块;
所述中控模块将所述输入文本发送至所述第一问答模块;
所述中控模块获取所述第一问答模块返回的第一答案和第一置信度;
在所述第一置信度满足预设条件的情况下,所述中控模块将所述第一答案作为目标答案,并输出所述目标答案。
第二方面,本发明实施例公开了一种文本处理装置,应用于智能客服系统,所述智能客服系统包括中控模块以及至少两个问答模块,该装置包括:
第一获取模块,用于获取输入文本;
确定模块,用于根据所述输入文本,从所述至少两个问答模块中确定与所述输入文本匹配的第一问答模块;
第一发送模块,用于将所述输入文本发送至所述第一问答模块;
第二获取模块,用于获取所述第一问答模块返回的第一答案和第一置信度;
第一输出模块,用于在所述第一置信度满足预设条件的情况下,将所述第一答案作为目标答案,并输出所述目标答案。
第三方面,本发明实施例公开了一种智能客服系统,包括中控模块以及至少两个问答模块,所述中控模块被配置为执行第一方面所述的文本处理方法的步骤。
第四方面,本发明实施例还提供了一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现第一方面所述的文本处理方法的步骤。
第五方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现第一方面所述的文本处理的步骤。
在本发明实施例中,智能客服系统中的中控模块获取输入文本并根据该输入文本,从至少两个问答模块中确定与输入文本匹配的第一问答模块;中控模块然后将所述输入文本发送至所述第一问答模块并获取第一问答模块返回的第一答案和第一置信度;在第一置信度满足预设条件的情况下,中控模块将第一答案作为目标答案,并输出该目标答案。这样,本发明实施例通过将接收的输入文本发送至匹配的第一问答模块,实现了每个输入问题只分发给一个特定的问答模块,能够提高智能客服系统的性能,节省运算资源;同时相较于现有技术中裁减模块以提高系统运算性能的方式,本发明实施例无需对问答模块进行裁减,能够提升问答效果,减少人力介入。
附图说明
图1示出了本发明的一种文本处理方法的步骤流程图;
图2示出了本发明的一种智能客服系统的结构示意图;
图3示出了本发明的另一种文本处理方法的步骤流程图;
图4示出了本发明的一种文本处理方法实例的流程示意图;
图5示出了本发明一种预设分类模型的更新优化方法示意图
图6示出了本发明的一种文本处理装置的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1,示出了本发明的一种文本处理方法的步骤流程图,所述方法应用于智能客服系统,所述智能客服系统包括中控模块以及至少两个问答模块。
图2示出了本发明实施例的一种智能客服系统的结构示意图。如图2所示,智能客服系统20包括中控模块201和202~205四个问答模块,该智能客服系统可以适用于大规模知识处理、自然语言理解、知识管理、自动问答系统、推理等技术行业。其中,中控模块201可以用于调度智能客服系统20其他各模块,将任务分发给智能客服系统下的各个问答模块,并基于问答模块返回的结果输出最终答案。问答模块202~205可以用于处理输入问题并返回该问题对应的答案和置信度。问答模块的数量为至少两个,具体可以为2个、3个、4个或更多,本发明实施例对此不作限定。
当然,智能客服系统也还包括实现其必要功能的显示模块等其他模块,本发明实施例对此不作限定。
该文本处理方法包括:
步骤101、所述中控模块获取输入文本。
本发明实施例中,输入文本可以是用户在智能客服系统输入的问题对应的文本。具体的,当用户通过键盘等输入设备以文本方式输入问题时,中控模块可以直接将接收到的文本作为输入文本;当用户通过麦克风等输入设备以语音方式输入问题时,智能客服系统可以将该语音输入通过语音识别的方式转换为文本,中控模块可以将该语音输入转换得到的文本作为输入文本。这样,用户可以通过文本或者语音的方式在智能客服系统中输入想问的问题,提高了人机交互的灵活性。
步骤102、所述中控模块根据所述输入文本,从所述至少两个问答模块中确定与所述输入文本匹配的第一问答模块。
本发明实施例中,由于用户问题的多样化,单一的问答模块无法进行处理,因此,本发明实施例中的智能客服系统中设置有至少两个问答模块,可以用于回答不同种类的问题。例如,问答模块可以包括知识库问答模块、场景问答模块、知识图谱模块、闲聊对话模块等,可以分别用于回答知识库种类、不同场景种类、知识图谱种类、闲聊对话种类的问题。其中,知识库可以是与智能客服系统实际使用环境相关的知识和信息的有序存储集合;不同场景可以是与用户不同问题对应的的多种语境;知识图谱可以是在智能客服系统实际使用环境下各对象的逻辑关联关系,例如在银行环境下的智能客服系统,知识图谱可以是各类基金的关系;闲聊对话可以是不属于前述三种种类对应的问题。
当然,用户也可以根据实际需求以其他方式灵活设置问答模块,也可以对问答模块处理的问题种类进行灵活调整,本发明实施例对此不作限定。
本步骤中,第一问答模块可以是与输入文本相匹配的问答模块。具体的,中控模块可以对输入文本进行分类,从至少两个问答模块中确定出最有可能回答正确的问答模块作为第一问答模块。
步骤103、所述中控模块将所述输入文本发送至所述第一问答模块。
本步骤中,中控模块确定出输入文本匹配的第一问答模块后,将输入文本发送给第一问答模块进行处理。这样,相较于现有技术中对于同一个问题多个问答模块并行处理的方式,本发明实施例仅将输入文本分发给第一问答模块处理,可以提升系统性能、节省运算资源。
步骤104、所述中控模块获取所述第一问答模块返回的第一答案和第一置信度。
本步骤中,第一答案可以是第一问答模块对输入文本进行处理后得到的答案。置信度可以用于表示问答模块返回答案的可靠程度,可以用百分数表示,例如第一答案对应的第一置信度可以为70%、80%等。
具体的,第一问答模块接收到输入文本之后,可以先对输入文本进行分词处理并提取出关键词,之后根据该关键词在第一问答模块存储的数据中进行检索并进行深度语义匹配,再根据语义得分、关键词得分等指标对匹配到的多个答案进行排序打分,并且过滤掉不合理的答案,之后返回排序最高的第一答案和第一答案对应的第一置信度。
步骤105、在所述第一置信度满足预设条件的情况下,所述中控模块将所述第一答案作为目标答案,并输出所述目标答案。
本步骤中,预设条件可以是预设的置信度阈值,该置信度阈值可以是用户根据实际需求设置的,也可以是智能客服系统默认的置信度阈值,本发明实施例对此不作限定。示例的,用户可以将智能客服系统的置信度阈值设置为70%。
本步骤中,目标答案可以是置信度满足预设条件的答案。当第一问答模块返回的第一答案高于置信度阈值时,则中控模块判定该第一答案是可靠的,第一答案与输入文本的相关性较高,中控模块可以将第一答案作为目标答案并返回给用户。
当然,也可以采用其他预设条件对第一置信度进行判断,本发明实施例对此不作限定。
综上所述,本发明实施例提供的一种文本处理方法,智能客服系统中的中控模块获取输入文本并根据该输入文本,从至少两个问答模块中确定与输入文本匹配的第一问答模块;中控模块然后将所述输入文本发送至所述第一问答模块并获取第一问答模块返回的第一答案和第一置信度;在第一置信度满足预设条件的情况下,中控模块将第一答案作为目标答案,并输出该目标答案。这样,本发明实施例通过将接收的输入文本发送至匹配的第一问答模块,实现了每个输入问题只分发给一个特定的问答模块,能够提高智能客服系统的性能,节省运算资源;同时,相较于现有技术中裁减模块以提高系统运算性能的方式,本发明实施例无需对问答模块进行裁减,能够提升问答效果,减少人力介入。
参照图3,示出了本发明另一种文本处理方法的步骤流程图,该方法应用于智能客服系统,该智能客服系统包括中控模块以及至少两个问答模块,该方法包括:
步骤301、所述中控模块获取输入文本。
具体的,本步骤的实现方式可以参照前述步骤101,本发明实施例在此不做赘述。
步骤302、所述中控模块根据所述输入文本,从所述至少两个问答模块中确定与所述输入文本匹配的第一问答模块。
本步骤具体可以通过下述步骤3021~步骤3022实现:
步骤3021、所述中控模块基于预设分类模型,根据所述输入文本从预设类别中确定所述输入文本对应的第一类别;一个所述问答模块对应至少一个所述预设类别。
本步骤中,预设分类模型可以用于对输入文本进行分类,具体可以是基于概率的朴素贝叶斯分类模型或者基于卷积神经网络的分类模型等,本发明对于分类模型的具体种类并不做限定。具体的,分类模型可以包括特征提取器和分类器两部分,特征提取器从输入文本中提取文本特征,之后将该文本特征输入到分类器,分类器可以输出该输入文本对应的第一类别。
本步骤中,预设类别的具体种类可以根据智能客服系统的使用场景灵活设置,例如银行场景中的预设类别可以包括办卡流程、基金问答、理财业务等。问答模块与预设类别的对应关系为可以是一个问答模块对应一个类别,也可以一个问答模块对应多个类别,本发明实施例对此不作限定。
示例的,以银行使用的智能客服系统为例,不同的问答模块可以对应处理相应预设类别的输入文本。例如,知识库问答模块对应的预设类别可以是办卡业务,可以用于处理办卡流程、业务信息咨询等问题;场景问答模块对应的预设类别可以是交互流程,可以用于设计业务的交互流程,比如实际办理信用卡时,收集客户的年龄、姓名等信息,并根据客户的回答进行下一轮对话;知识图谱模块对应的预设类别可以是逻辑关联关系,可以用于处理各类基金以及每类基金间的关系,可以用来处理可能涉及到逻辑推理的问题,例如“现在利率最高的基金是什么?”此类的问题;闲聊模块对应的预设类别可以是闲聊对话,可以用于处理未编辑在其他问答模块中的问题。
本发明实施例中通过设置预设类别与问答模块的对应关系,可以方便后续对输入文本的准确分类。
步骤3022、所述中控模块将所述第一类别对应的问答模块作为所述第一问答模块。
本步骤中,中控模块通过预设分类模型确定出输入文本对应的第一类别之后,将该第一类别对应的问答模块作为第一问答模块。例如,在前述银行场景的智能客服系统中,当输入文本为“办卡有什么要求”时,此时确定出的第一类别为办卡业务,该第一类别对应的问答模块为知识库问答模块,中控模块则将知识库问答模块确定为第一问答模块。
本发明实施例中,中控模块通过确定出输入文本对应的第一类别并确定出第一问答模块,能够实现将每个输入问题只分发给一个特定的问答模块,能够提升智能客服系统的性能,节省运算资源。
步骤303、所述中控模块将所述输入文本发送至所述第一问答模块。
具体的,本步骤的实现方式可以参照前述步骤103,本发明实施例在此不做赘述。
步骤304、所述中控模块获取所述第一问答模块返回的第一答案和第一置信度。
具体的,本步骤的实现方式可以参照前述步骤104,本发明实施例在此不做赘述。
步骤305、在所述第一置信度满足预设条件的情况下,所述中控模块将所述第一答案作为目标答案,并输出所述目标答案。
具体的,本步骤的实现方式可以参照前述步骤105,本发明实施例在此不做赘述。
步骤306、在所述第一置信度不满足所述预设条件的情况下,所述中控模块将所述输入文本发送至第二问答模块;所述第二问答模块为所述至少两个问答模块中除所述第一问答模块外的其他问答模块。
本步骤中,第一置信度不满足要求时,中控模块判定该第一答案并不可靠,无法针对输入文本返回用户所需要的信息。此时,中控模块可以将输入文本发送至除第一问答模块之外的其他问答模块,由其他问答模块对输入文本进行处理。本步骤中,在第一置信度不满足预设条件时,中控模块将输入文本发送至其他问答模块,可以确保能够为用户提供准确的答案,保证答案的可靠程度,并且中控模块不再将输入文本重复分配给第一问答模块,可以减少对智能客服系统资源的占用、提高智能客服系统的运算性能。
步骤307、所述中控模块获取所述第二问答模块返回的第二答案和第二置信度。
本步骤中,第二问答模块接收到输入文本后,对输入文本进行处理,得到该输入文本对应的答案和置信度。需要注意的是,不同的智能客服系统的问答模块的设置数量不同,第二问答模块可能有多个,接收到输入文本后,多个第二问答模块对输入文本并行处理,并分别返回多个第二答案和第二置信度。
步骤308、基于所述第二答案和第二置信度以及所述第一答案和所述第一置信度,所述中控模块将置信度最高的答案作为目标答案,并输出所述目标答案。
本步骤中,中控模块在第一置信度与第二置信度中,确定出最高的置信度,并将最高置信度对应的答案确定为目标答案。这样,能够保证目标答案与输入文本的契合程度,能够最大程度地确保目标答案的准确度。
步骤309、所述中控模块将所述输入文本作为更新文本,记录所述更新文本与所述更新文本对应的真实类别;所述真实类别为生成所述目标答案的模块对应的类别。
本步骤中,更新文本可以是用户使用智能客服系统时输入的问题对应的文本数据。真实类别可以是输出目标答案的问答模块对应的预设类别。具体的,若第一置信度满足预设条件,则第一问答模块输出的答案即为目标答案,该第一问答模块对应的预设类别则为真实类别;若第一置信度不满足预设条件,则置信度最高的答案为目标答案,输出该目标答案的问答模块对应的预设类别则为真实类别。
示例的,输入文本为“办卡有什么要求”时,该输入文本对应的目标答案是由知识库问答模块生成的,该知识库问答模块对应的类别为办卡业务,则中控模块可以记录更新文本“办卡有什么要求”及其对应的真实类别“办卡业务”这一真实样本对。
本步骤中,中控模块通过直接记录更新文本和真实类别,能够形成包含多对更新文本-真实类别的样本数据,无需额外收集用于更新的样本数据,可以减少样本数据获取的成本。
步骤310、在所述更新文本及所述更新文本对应的真实类别达到预设数量的情况下,所述中控模块基于所述更新文本与所述真实类别,更新所述预设分类模型。
本步骤中,预设数量可以是用户预先设置的更新文本-真实类别这一真实样本对的数量。在真实样本对的数量积累到预设数量时,中控模块可以对预设分类模型进行更新和优化。
需要注意的是,常规的分类模型中的分类器的建立方式,往往需要一个经由人工标注好的训练数据集,该训练数据集中包括训练数据与类别的对应关系,该对应关系需要人工进行标注,效率较低且工作量较大。
而本发明实施例中的预设分类模型建立时无需利用该人工标注好的训练数据集,即,预设分类模型可以为未训练的初始模块,这样,虽然预设分类模型开始确定第一问答模块的准确率可能会较低,但是随着后续在用户的多次问答过程中,记录一定量的更新文本-真实类别的真实样本对,然后对预设分类模型进行优化更新。中控模块通过不断更新,可以以自学习的方式优化预设分类模型,能够对预设分类模型持续优化,无需用户人工干预,可以有效保证分类模型分类的准确率。
具体的,本步骤310可以通过以下子步骤3101~3103实现:
步骤3101、所述中控模块将所述更新文本输入所述预设分类模型,得到预测类别。
本步骤中,在更新预设分类模型时,中控模块可以将更新文本输入预设分类模型,该预设分类模型基于更新文本的内容进行分类处理,得到该更新文本对应的预测类别。
步骤3102、所述中控模块基于所述预测类别与所述真实类别,计算所述预设分类模型的偏差程度。
本步骤中,偏差程度可以用于表征预测类别与真实类别之间的偏差,具体偏差程度可以用预设分类模型的损失值表示、该损失值可以是基于预测类别、真实类别以及预设的损失函数计算得到,本发明实施例对此不作限定。
步骤3103、所述中控模块基于所述偏差程度,调整所述预设分类模型的参数。
本步骤中,基于预测类别和真实类别之间的偏差程度,中控模块可以调整该预设分类模型的各种参数,然后对调整后的预设分类模型进行迭代训练,不断减小二者之间的偏差值,使得预测类别逐渐趋近于真实类别,进而提高预设分类模型的准确度。
本发明实施例中,中控模块通过利用更新文本和真实类别对预设分类模型进行更新,能够以自学习的方式不断提高预设分类模型的分类准确率,无需人工进行标注,也能够有效地保证分类效果。
图4示出了本发明的一种文本处理方法实例的流程示意图。如图4所示,中控模块在获取到输入文本后,将输入文本输入预设分类模型之后确定出第一类别,该第一类别对应的问答模块为知识库问答模块,则中控模块将知识库问答模块确定为第一问答模块。之后,中控模块判断第一问答模块返回的第一答案对应的第一置信度是否满足预设条件,若第一置信度高于预设阈值,则中控模块将第一答案作为目标答案并输出;若第一置信度不高于预设阈值,则中控模块将输入文本分发至除知识库问答模块之外的第二问答模块,即场景问答模块、知识图谱模块、闲聊对话模块并行处理。最后,中控模块在第一答案以及第二问答模块分别返回的第二答案中确定出置信度最高的答案,将该最高置信度对应的答案作为目标答案并输出。
图5示出了本发明一种预设分类模型的更新优化方法示意图。如图5所示,中控模块在积累了预设数量的更新文本-真实类别样本对后,将其作为更新训练样本,输入预设分类模型中,对预设分类模型进行更新和优化,这样,中控模块可以以自学习的方式不断记录更新训练样本,并持续对预设分类模型进行更新和优化,可以保证预设分类模型分类的准确率。
综上所述,本发明实施例提供的文本处理方法,中控模块获取输入文本并根据该输入文本,从至少两个问答模块中确定与输入文本匹配的第一问答模块;中控模块然后将所述输入文本发送至所述第一问答模块并获取第一问答模块返回的第一答案和第一置信度;在第一置信度满足预设条件的情况下,中控模块将第一答案作为目标答案,并输出该目标答案;之后,中控模块将输入文本作为更新文本,记录更新文本与更新文本对应的真实类别;该真实类别为生成目标答案的模块对应的类别;在更新文本及更新文本对应的真实类别达到预设数量的情况下,中控模块基于更新文本与真实类别,更新预设分类模型。这样,本发明实施例通过将接收的输入文本发送至匹配的第一问答模块,实现了每个输入问题只分发给一个特定的问答模块,能够提高智能客服系统的性能,节省运算资源;并且,相较于现有技术中裁减模块以提高系统运算性能的方式,本发明实施例无需对问答模块进行裁减,能够提升问答效果,减少人力介入;此外,中控模块可以记录更新文本和真实类别作为优化样本对预设分类模型进行更新,能够实现对预设分类模型的训练和优化,能够提升对于输入文本分类的准确率。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图6,示出了本发明的一种文本处理装置的结构框图,应用于智能客服系统,所述智能客服系统包括中控模块以及至少两个问答模块,该装置60可以包括如下模块:
第一获取模块601,用于获取输入文本;
确定模块602,用于根据所述输入文本,从所述至少两个问答模块中确定与所述输入文本匹配的第一问答模块;
第一发送模块603,用于将所述输入文本发送至所述第一问答模块;
第二获取模块604,用于获取所述第一问答模块返回的第一答案和第一置信度;
第一输出模块605,用于在所述第一置信度满足预设条件的情况下,将所述第一答案作为目标答案,并输出所述目标答案。
可选的,装置60还包括:
第二发送模块,用于在所述第一置信度不满足所述预设条件的情况下,将所述输入文本发送至第二问答模块;所述第二问答模块为所述至少两个问答模块中除所述第一问答模块外的其他问答模块;第三获取模块,用于获取所述第二问答模块返回的第二答案和第二置信度;第二输出模块,用于基于所述第二答案和第二置信度以及所述第一答案和所述第一置信度,将置信度最高的答案作为目标答案,并输出所述目标答案。
可选的,所述确定模块602,用于:
基于预设分类模型,根据所述输入文本从预设类别中确定所述输入文本对应的第一类别;一个所述问答模块对应至少一个所述预设类别;将所述第一类别对应的问答模块作为所述第一问答模块。
可选的,所述装置60还包括:
记录模块,用于将所述输入文本作为更新文本,记录所述更新文本与所述更新文本对应的真实类别;所述真实类别为生成所述目标答案的模块对应的类别;更新模块,用于在所述更新文本及所述更新文本对应的真实类别达到预设数量的情况下,基于所述更新文本与所述真实类别,更新所述预设分类模型。
可选的,所述更新模块,用于:
将所述更新文本输入所述预设分类模型,得到预测类别;基于所述预测类别与所述真实类别,计算所述预设分类模型的偏差程度;基于所述偏差程度,调整所述预设分类模型的参数。
综上所述,本发明实施例提供的文本处理装置,获取输入文本并根据该输入文本,从至少两个问答模块中确定与输入文本匹配的第一问答模块;然后将所述输入文本发送至所述第一问答模块并获取第一问答模块返回的第一答案和第一置信度;在第一置信度满足预设条件的情况下,将第一答案作为目标答案,并输出该目标答案。这样,本发明实施例通过将接收的输入文本发送至匹配的第一问答模块,实现了每个输入问题只分发给一个特定的问答模块,能够提高智能客服系统的性能,节省运算资源;同时相较于现有技术中裁减模块以提高系统运算性能的方式,本发明实施例无需对问答模块进行裁减,能够提升问答效果,减少人力介入。
可选的,本发明实施例还提供一种智能客服系统,包括中控模块以及至少两个问答模块,所述中控模块被配置为实现上述文本处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
可选的,本发明实施例还提供了一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述文本处理方法各实施例的步骤。
可选的,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现上述文本处理方法各实施例的步骤。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域技术人员易于想到的是:上述各个实施例的任意组合应用都是可行的,故上述各个实施例之间的任意组合都是本发明的实施方案,但是由于篇幅限制,本说明书在此就不一一详述了。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (10)

1.一种文本处理方法,应用于智能客服系统,所述智能客服系统包括中控模块以及至少两个问答模块,其特征在于,包括:
所述中控模块获取输入文本;
所述中控模块根据所述输入文本,从所述至少两个问答模块中确定与所述输入文本匹配的第一问答模块;
所述中控模块将所述输入文本发送至所述第一问答模块;
所述中控模块获取所述第一问答模块返回的第一答案和第一置信度;
在所述第一置信度满足预设条件的情况下,所述中控模块将所述第一答案作为目标答案,并输出所述目标答案。
2.根据权利要求1所述的方法,其特征在于,在所述中控模块获取所述第一问答模块返回的第一答案和第一置信度之后,所述方法还包括:
在所述第一置信度不满足所述预设条件的情况下,所述中控模块将所述输入文本发送至第二问答模块;所述第二问答模块为所述至少两个问答模块中除所述第一问答模块外的其他问答模块;
所述中控模块获取所述第二问答模块返回的第二答案和第二置信度;
基于所述第二答案和第二置信度以及所述第一答案和所述第一置信度,所述中控模块将置信度最高的答案作为目标答案,并输出所述目标答案。
3.根据权利要求1所述的方法,其特征在于,所述中控模块根据所述输入文本,从所述至少两个问答模块中确定与所述输入文本匹配的第一问答模块,包括:
所述中控模块基于预设分类模型,根据所述输入文本从预设类别中确定所述输入文本对应的第一类别;一个所述问答模块对应至少一个所述预设类别;
所述中控模块将所述第一类别对应的问答模块作为所述第一问答模块。
4.根据权利要求1-3所述的方法,其特征在于,在输出所述目标答案之后,所述方法还包括:
所述中控模块将所述输入文本作为更新文本,记录所述更新文本与所述更新文本对应的真实类别;所述真实类别为生成所述目标答案的模块对应的类别;
在所述更新文本及所述更新文本对应的真实类别达到预设数量的情况下,所述中控模块基于所述更新文本与所述真实类别,更新所述预设分类模型。
5.根据权利要求4所述的方法,其特征在于,所述中控模块基于所述更新文本与所述真实类别,更新所述预设分类模型,包括:
所述中控模块将所述更新文本输入所述预设分类模型,得到预测类别;
所述中控模块基于所述预测类别与所述真实类别,计算所述预设分类模型的偏差程度;
所述中控模块基于所述偏差程度,调整所述预设分类模型的参数。
6.一种文本处理装置,应用于智能客服系统,所述智能客服系统包括中控模块以及至少两个问答模块,其特征在于,包括:
第一获取模块,用于获取输入文本;
确定模块,用于根据所述输入文本,从所述至少两个问答模块中确定与所述输入文本匹配的第一问答模块;
第一发送模块,用于将所述输入文本发送至所述第一问答模块;
第二获取模块,用于获取所述第一问答模块返回的第一答案和第一置信度;
第一输出模块,用于在所述第一置信度满足预设条件的情况下,将所述第一答案作为目标答案,并输出所述目标答案。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第二发送模块,用于在所述第一置信度不满足所述预设条件的情况下,将所述输入文本发送至第二问答模块;所述第二问答模块为所述至少两个问答模块中除所述第一问答模块外的其他问答模块;
第三获取模块,用于获取所述第二问答模块返回的第二答案和第二置信度;
第二输出模块,用于基于所述第二答案和第二置信度以及所述第一答案和所述第一置信度,将置信度最高的答案作为目标答案,并输出所述目标答案。
8.根据权利要求6所述的装置,其特征在于,所述确定模块,用于:
基于预设分类模型,根据所述输入文本从预设类别中确定所述输入文本对应的第一类别;一个所述问答模块对应至少一个所述预设类别;
将所述第一类别对应的问答模块作为所述第一问答模块。
9.根据权利要求6-8所述的装置,其特征在于,所述装置还包括:
记录模块,用于将所述输入文本作为更新文本,记录所述更新文本与所述更新文本对应的真实类别;所述真实类别为生成所述目标答案的模块对应的类别;
更新模块,用于在所述更新文本及所述更新文本对应的真实类别达到预设数量的情况下,基于所述更新文本与所述真实类别,更新所述预设分类模型。
10.根据权利要求9所述的装置,其特征在于,所述更新模块,用于:
将所述更新文本输入所述预设分类模型,得到预测类别;
基于所述预测类别与所述真实类别,计算所述预设分类模型的偏差程度;
基于所述偏差程度,调整所述预设分类模型的参数。
CN202010368448.4A 2020-04-30 2020-04-30 一种文本处理方法及装置 Pending CN111666394A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010368448.4A CN111666394A (zh) 2020-04-30 2020-04-30 一种文本处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010368448.4A CN111666394A (zh) 2020-04-30 2020-04-30 一种文本处理方法及装置

Publications (1)

Publication Number Publication Date
CN111666394A true CN111666394A (zh) 2020-09-15

Family

ID=72383164

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010368448.4A Pending CN111666394A (zh) 2020-04-30 2020-04-30 一种文本处理方法及装置

Country Status (1)

Country Link
CN (1) CN111666394A (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102792320A (zh) * 2010-01-18 2012-11-21 苹果公司 智能自动化助理
CN105159996A (zh) * 2015-09-07 2015-12-16 百度在线网络技术(北京)有限公司 基于人工智能的深度问答服务提供方法和装置
CN107783970A (zh) * 2016-08-25 2018-03-09 武汉聚蜗网络科技有限公司 一种专家问答系统及其操作方法
CN108319599A (zh) * 2017-01-17 2018-07-24 华为技术有限公司 一种人机对话的方法和装置
CN109522393A (zh) * 2018-10-11 2019-03-26 平安科技(深圳)有限公司 智能问答方法、装置、计算机设备和存储介质
CN110008330A (zh) * 2019-04-04 2019-07-12 深圳追一科技有限公司 智能客服设备的应答方法、装置、设备和存储介质
CN110069607A (zh) * 2017-12-14 2019-07-30 株式会社日立制作所 用于客户服务的方法、装置、电子设备、计算机可读存储介质
CN110737763A (zh) * 2019-10-18 2020-01-31 成都华律网络服务有限公司 一种融合知识图谱和深度学习的中文智能问答系统及方法
CN110990544A (zh) * 2019-11-01 2020-04-10 上海百事通信息技术股份有限公司 一种用于法务咨询的智能问答平台

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102792320A (zh) * 2010-01-18 2012-11-21 苹果公司 智能自动化助理
CN105159996A (zh) * 2015-09-07 2015-12-16 百度在线网络技术(北京)有限公司 基于人工智能的深度问答服务提供方法和装置
CN107783970A (zh) * 2016-08-25 2018-03-09 武汉聚蜗网络科技有限公司 一种专家问答系统及其操作方法
CN108319599A (zh) * 2017-01-17 2018-07-24 华为技术有限公司 一种人机对话的方法和装置
CN110069607A (zh) * 2017-12-14 2019-07-30 株式会社日立制作所 用于客户服务的方法、装置、电子设备、计算机可读存储介质
CN109522393A (zh) * 2018-10-11 2019-03-26 平安科技(深圳)有限公司 智能问答方法、装置、计算机设备和存储介质
CN110008330A (zh) * 2019-04-04 2019-07-12 深圳追一科技有限公司 智能客服设备的应答方法、装置、设备和存储介质
CN110737763A (zh) * 2019-10-18 2020-01-31 成都华律网络服务有限公司 一种融合知识图谱和深度学习的中文智能问答系统及方法
CN110990544A (zh) * 2019-11-01 2020-04-10 上海百事通信息技术股份有限公司 一种用于法务咨询的智能问答平台

Similar Documents

Publication Publication Date Title
CN110334201B (zh) 一种意图识别方法、装置及系统
US11144827B1 (en) Cooperatively operating a network of supervised learning processors to concurrently distribute supervised learning processor training and provide predictive responses to input data
US20230222366A1 (en) Systems and methods for semantic analysis based on knowledge graph
US11544639B2 (en) Data source-based service customizing device, method and system, and storage medium
CN110717023B (zh) 面试回答文本的分类方法及装置、电子设备、存储介质
CN108268450B (zh) 用于生成信息的方法和装置
CN110516057B (zh) 一种信访问题答复方法及装置
CN112579733B (zh) 规则匹配方法、规则匹配装置、存储介质及电子设备
CN112417158A (zh) 文本数据分类模型的训练方法、分类方法、装置和设备
CN113407677B (zh) 评估咨询对话质量的方法、装置、设备和存储介质
CN112163081A (zh) 标签确定方法、装置、介质及电子设备
CN111832305B (zh) 一种用户意图识别方法、装置、服务器和介质
CN111723180A (zh) 一种面试方法和装置
CN110633410A (zh) 信息处理方法及装置、存储介质、电子装置
CN113569018A (zh) 问答对挖掘方法及装置
CN111382265B (zh) 搜索方法、装置、设备和介质
CN116881730A (zh) 基于语境的聊天场景匹配系统、方法、设备及存储介质
CN113010664B (zh) 一种数据处理方法、装置及计算机设备
CN111666394A (zh) 一种文本处理方法及装置
CN113870998A (zh) 问诊方法、装置、电子设备和存储介质
CN113609833A (zh) 文件的动态生成方法、装置、计算机设备及存储介质
CN118093839B (zh) 基于深度学习的知识运营问答对话处理方法及系统
CN116578682B (zh) 一种法务服务的智能咨询方法及系统
US11914844B2 (en) Automated processing and dynamic filtering of content for display
CN117422473A (zh) 一种事务转接方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200915