CN116595148A - 一种利用大型语言模型实现对话流程的方法及系统 - Google Patents

一种利用大型语言模型实现对话流程的方法及系统 Download PDF

Info

Publication number
CN116595148A
CN116595148A CN202310601516.0A CN202310601516A CN116595148A CN 116595148 A CN116595148 A CN 116595148A CN 202310601516 A CN202310601516 A CN 202310601516A CN 116595148 A CN116595148 A CN 116595148A
Authority
CN
China
Prior art keywords
language model
dialogue
user
large language
knowledge base
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310601516.0A
Other languages
English (en)
Other versions
CN116595148B (zh
Inventor
蒋卓
陈�光
王新涵
樊鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kuaiu Zhiying Technology Co ltd
Original Assignee
Beijing Kuaiu Zhiying Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kuaiu Zhiying Technology Co ltd filed Critical Beijing Kuaiu Zhiying Technology Co ltd
Priority to CN202310601516.0A priority Critical patent/CN116595148B/zh
Publication of CN116595148A publication Critical patent/CN116595148A/zh
Application granted granted Critical
Publication of CN116595148B publication Critical patent/CN116595148B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明提供一种利用大型语言模型实现对话流程的方法及系统,其中方法包括:利用大型语言模型,冷启动搭建对话知识库;利用所述大型语言模型和所述对话知识库,实现与发起聊天的用户进行对话。本发明通过自动帮助企业构造对话知识库,大幅减少企业冷启动和运营的投入。同时,将中间过程展示给企业,让其需要修改的时候也拥有自己的主动性。将大型语言模型的通用能力和业务模型的垂直行业的分析能力结合在一起,提供一套极少投入就可以触发的完整的对话和业务处理能力。将大型语言模型回复多样性和垂直行业的分析能力结合在一起,同时提供了可控的业务场景,丰富、多样化的兜底回复。整体提升企业+用户的体验。

Description

一种利用大型语言模型实现对话流程的方法及系统
技术领域
本发明涉及计算机数据处理技术领域,特别涉及一种利用大型语言模型实现对话流程的方法及系统。
背景技术
目前,对话机器人中常用的一种问答引擎是FAQ引擎,其采用的方式是数据库中预存有企业想要支持的常用问答对,多个含义相同的问题对应一个答案。当企业的客户对对话机器人提出问题时,会寻找数据库中与其含义相同的问题Q,并使用Q对应的答案A回答给用户。但是这个流程中存在一个痛点,就是集成对话机器人(尤其是saas平台提供的对话机器人)的企业一般对对话机器人的运作原理没那么了解,不愿意或者需要时间来整理其所需的问答对,整理问答对并添加到对话机器人知识库中这个过程常称为冷启动,这个冷启动的过程对企业来说是耗时且“痛苦”的。
发明内容
本发明目的之一在于提供了一种利用大型语言模型实现对话流程的方法,通过自动帮助企业构造对话知识库,大幅减少企业冷启动和运营的投入。
本发明实施例提供的一种利用大型语言模型实现对话流程的方法,包括:
利用大型语言模型,冷启动搭建对话知识库;
利用大型语言模型和对话知识库,实现与发起聊天的用户进行对话。
优选的,利用大型语言模型,冷启动搭建对话知识库,包括:
当企业触发冷启动时,获取企业主页URL;
通过企业主页URL,访问企业网站,并从企业网站中提取FAQ URL;
通过FAQ URL,访问FAQ页面,并从FAQ页面中抽取文本;
将文本通过提示工程输入至大型语言模型中,由大型语言模型抽取文本中的QA对;
将QA对中的问题通过提示工程输入至大型语言模型中,由大型语言模型生成问题的相似问题,并补入到对应QA对中;
基于QA对,搭建对话知识库。
优选的,利用大型语言模型,冷启动搭建对话知识库,还包括:
基于意图模型或相似度模型分析QA对的可能类别;
尝试从预设的流程机器人库中确定可能类别对应的流程机器人;
当尝试成功时,将QA对与流程机器人进行绑定。
优选的,利用大型语言模型和对话知识库,实现与发起聊天的用户进行对话,包括:
获取用户的聊天语境;
基于聊天语境,确定是否触发流程机器人;
当为是时,由被触发的流程机器人引导用户进入被触发的流程机器人对应的预设的第一业务流程;否则,基于意图模型判断聊天语境是否存在预设的第二业务流程;
当为是时,引导用户进入第二业务流程;否则,从对话知识库中尝试确定聊天语境对应的答案;
当尝试成功时,基于答案,回复用户,同时,向用户回复推荐答案对应的预设的第三业务流程;否则,基于大型语言模型,与用户进行对话。
优选的,利用大型语言模型和对话知识库,实现与发起聊天的用户进行对话,还包括:
当用户输入请求人工客服指令时,为用户接入空闲的在线人工客服。
优选的,利用大型语言模型实现对话流程的方法,还包括:
向用户推送预设的组群许可请求窗口;
当用户基于组群许可请求窗口输入组群许可指令时,获取与用户对话的对话历史;
基于预设的第一特征值化模板,对对话历史进行特征值化处理,获得对话特征值集;
基于预设的用户匹配规则生成模板,根据对话特征值集,生成用户匹配规则;
基于用户匹配规则,为用户匹配目标用户;
将用户与目标用户接入对话群组;
获取对话群组中产生的用户对话;
基于预设的问询内容生成模板,根据用户对话,生成第一问询内容;
将第一问询内容输入至大型语言模型中,将大型语言模型返回的第一问询结果与预设的标准问询结果库中的标准问询结果进行匹配;
当匹配符合时,获取匹配符合的标准问询结果对应的预设的第二问询内容;
将第二问询内容输入至大型语言模型中,将大型语言模型返回的第二问询结果在对话群组内进行广播。
优选的,基于预设的问询内容生成模板,根据用户对话,生成第一问询内容之前,对用户对话进行预处理;
其中,对用户对话进行预处理,包括:
从用户对话中提取人声时间区间和对应的发言人;
将人声时间区间设置于预设的时间轴线上;
基于区间簇划定条件,在时间轴线上划定区间簇;
基于预设的第二特征值化模板,对区间簇进行特征值化处理,获得簇特征集;
将簇特征集与预设的标准簇特征集库中的标准簇特征集进行匹配;
当匹配符合时,获取匹配符合的标准簇特征集对应的预设的无关人声时间区间确定策略;
基于无关人声时间区间确定策略,在区间簇中的人声时间区间中确定无关人声时间区间;
从用户对话中剔除无关人声时间区间对应的局部对话;
其中,区间簇划定条件,包括:
区间簇中两两人声时间区间之间在时间轴线上的最短距离小于等于预设的距离阈值;
区间簇中的人声时间区间对应的发言人的类别数大于1;
区间簇中首尾的人声时间区间对应的发言人不同。
本发明实施例提供的一种利用大型语言模型实现对话流程的系统,包括:
对话知识库搭建模块,用于利用大型语言模型,冷启动搭建对话知识库;
与用户聊天实现模块,用于利用大型语言模型和对话知识库,实现与发起聊天的用户进行对话。
优选的,对话知识库搭建模块利用大型语言模型,冷启动搭建对话知识库,包括:
当企业触发冷启动时,获取企业主页URL;
通过企业主页URL,访问企业网站,并从企业网站中提取FAQ URL;
通过FAQ URL,访问FAQ页面,并从FAQ页面中抽取文本;
将文本通过提示工程输入至大型语言模型中,由大型语言模型抽取文本中的QA对;
将QA对中的问题通过提示工程输入至大型语言模型中,由大型语言模型生成问题的相似问题,并补入到对应QA对中;
基于QA对,搭建对话知识库。
优选的,对话知识库搭建模块利用大型语言模型,冷启动搭建对话知识库,还包括:
基于意图模型或相似度模型分析QA对的可能类别;
尝试从预设的流程机器人库中确定可能类别对应的流程机器人;
当尝试成功时,将QA对与流程机器人进行绑定。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种利用大型语言模型实现对话流程的方法的示意图;
图2为本发明实施例中电商场景弃购挽单示例图;
图3为本发明实施例中一种利用大型语言模型实现对话流程的具体应用示意图;
图4为本发明实施例中一种利用大型语言模型实现对话流程的系统的示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
本发明实施例提供了一种利用大型语言模型实现对话流程的方法,如图1所示,包括:
步骤S1:利用大型语言模型,冷启动搭建对话知识库;
步骤S2:利用大型语言模型和对话知识库,实现与发起聊天的用户进行对话。
利用大型语言模型,冷启动搭建对话知识库,包括:
当企业触发冷启动时,获取企业主页URL;
通过企业主页URL,访问企业网站,并从企业网站中提取FAQ URL;
通过FAQ URL,访问FAQ页面,并从FAQ页面中抽取文本;
将文本通过提示工程输入至大型语言模型中,由大型语言模型抽取文本中的QA对;
将QA对中的问题通过提示工程输入至大型语言模型中,由大型语言模型生成问题的相似问题,并补入到对应QA对中;
基于QA对,搭建对话知识库。
利用大型语言模型,冷启动搭建对话知识库,还包括:
基于意图模型或相似度模型分析QA对的可能类别;
尝试从预设的流程机器人库中确定可能类别对应的流程机器人;
当尝试成功时,将QA对与流程机器人进行绑定。
利用大型语言模型和对话知识库,实现与发起聊天的用户进行对话,包括:
获取用户的聊天语境;
基于聊天语境,确定是否触发流程机器人;
当为是时,由被触发的流程机器人引导用户进入被触发的流程机器人对应的预设的第一业务流程;否则,基于意图模型判断聊天语境是否存在预设的第二业务流程;
当为是时,引导用户进入第二业务流程;否则,从对话知识库中尝试确定聊天语境对应的答案;
当尝试成功时,基于答案,回复用户,同时,向用户回复推荐答案对应的预设的第三业务流程;否则,基于大型语言模型,与用户进行对话。
利用大型语言模型和对话知识库,实现与发起聊天的用户进行对话,还包括:
当用户输入请求人工客服指令时,为用户接入空闲的在线人工客服。
上述技术方案的工作原理及有益效果为:
大型语言模型具体为:例如OpenAI、百度文心一言、Facebook llama、斯坦福Alpaca等的拥有通用对话能力的语言模型,在使用大型语言模型的过程中,通过输入文本的构造(称为提示工程),让其以期望的方式输出期望的内容。
对话知识库包括QA(问题-答案)对。
流程机器人具体为:流程式机器人,主要拥有触发节点、条件/选择节点、回复节点、动作节点等,可用于实现丰富的业务场景;
触发节点为当满足某些条件,开启对应的机器人流程,满足这些条件包括但不限于用户画像、用户行为、企业数据指标等。
条件/选择节点为提供给用户各种选项,根据用户的选择进行对应的下一步机器人流程。
动作节点为做出某一种动作,可以是执行设置的内部流程、请求三方接口、更新或者获取数据等;也可以触发其他流程机器人。
回复节点为一种特殊的动作节点,直接回复用户预置的内容。
如图2所示,用电商场景弃购挽单为示例。
意图模型具体为:为文本根据某种业务场景进行分类的模型;比如:输入意图模型的文本为“我想取消订单”,则意图模型分类的结果为“CancelOrder”;
相似度模型具体为:判断多条文本是否相似的模型;比如:输入意图的两个文本分别为“我想取消订单”和“取消订单”,则相似度模型判断结果为相似;又比如:输入意图的两个文本分别为“我想取消订单”和“我想退货”,则相似度模型判断结果为不相似。
提示工程具体为:根据任务定义将不同的数据转换为文本的处理方式。大型语言模型的输入就是纯文本,因此,对于特定目的的特定任务,需要将任务转换为对应的文本形式,这种转换的方式有很多,只要表达的意思与想要达到的目的是一致的。然后将提示工程处理后的文本作为大型语言模型的输入。通常,提示工程建议包含需要的任务描述、返回结果形式、表达方式、语言等。例如:
(目的:普通对话;
原始内容:世界上最高的山峰是什么;
提示工程后(不做任何处理就可以):世界上最高的山峰是什么;
大型语言模型返回:珠穆朗玛峰;)、
(目的:俏皮对话;
原始内容:我不知道您说的什么意思,换个问法;
提示工程结果:你是一个客服,对于客户的问题要用俏皮的方式回答;
客户:我不知道您说的什么意思,换个问法;
大型语言模型返回:
哎呀,人家不太懂呢,可不可以换个表达方式让我明白呢;)、
(目的:抽取FAQ;
原始内容:
如果您想取消订单,可以打我们的电话0086-123456789
如果您想退货,可以发邮件给example@example.com;
提示工程结果:
请帮我抽取以下内容中的常用问答对,问题和答案一一对应,用列表的方式返回,问题以“Q:”开头,答案以“A:”开头:
如果您想取消订单,可以打我们的电话0086-123456789
如果您想退货,可以发邮件给example@example.com;
大型语言模型返回:
以下是抽取的常用问答对:
Q:如何取消订单?
A:打我们的电话0086-123456789
Q:如何退货?
A:发邮件给example@example.com;)、
(“目的:生成相似问;
原始内容:如何取消订单;
提示工程结果:请用英文的3种不同的方式表达“如何取消订单”,返回相似问题用"sim:"开头;
大型语言模型返回:
如何取消订单
sim:How to cancel order?
sim:How can I cancel my order?
sim:What's the process to canceo order?”)。
在具体应用的时候,如图3所示,左边为冷启动流程,右边为对话流程。
冷启动流程包括如下步骤:
1.1、企业主动触发冷启动,获取主页URL:企业首次注册时会通过注册渠道获取到企业的主页网址;已有的企业用户已知其主页网址;
1.2、获取FAQ URL:爬取主页中包含的各种页面,并判断并返回可能是包含企业常用信息、常用问答的页面链接,例如FAQ页面、介绍页面、各种数据政策页面、合作介绍页面等;
1.3、获取FAQ页面文本:爬取1.2中的FAQ URL对应的页面,抽取文本;
1.4、抽取问答对:将FAQ页面抽取的文本通过提示工程传入大型语言模型,让其抽取文本中的QA对;
1.5、生成相似问:将1.4中生成的所有问答对中的问题通过提示构造,传入大型语言模型,让其生成语义相似但是句式多样的相似问题;
1.6、意图/相似度计算:通过意图模型或相似度模型判断每条记录可能的类别,如果该类别有对应的业务机器人,可与业务机器人自动绑定。
最终得到多条结果,每条形式如下:
(意图:CancelOrder
问题:我想要取消订单
相似问题:
取消订单
请帮我取消订单
谁帮我把订单给取消一下
答案:取消订单可以触发);
问题、相似问题、答案添加到对话知识库;
意图如果存在现有流程机器人,答案同步给该流程机器人,实现机器人自动适配企业知识。
冷启动流程通过自动帮助企业构造对话知识库,大幅减少企业冷启动和运营的投入。同时,将中间过程展示给企业,让其需要修改的时候也拥有自己的主动性。将大型语言模型的通用能力和业务模型的垂直行业的分析能力结合在一起,提供一套极少投入就可以触发的完整的对话和业务处理能力。
对话流程包括如下步骤:
2.1、用户发起聊天,例如,说我想要取消订单,聊天语境除了用户说的话,还包括很多其他信息,例如用户信息、聊天的渠道等等;
2.2、根据聊天语境看现有业务机器人是否能够触发,如果触发直接引导用户进入对应的业务流程,例如,发现是VIP客户,直接转给高级客服;
2.3、根据意图模型判断是否存在对应的业务流程,例如,认为是CancelOrder并且有对应的取消订单业务流程,直接引导用户进入取消订单业务流程;
2.4、根据知识库中的知识判断是否有对应问题的相似问,如果有,返回对应的答案,同时可以调起更多业务流程。例如,发现数据库中存在问题=取消订单与用户问题语义相似,返回该问题对应的答案。同时可以推荐更多相关问题,或者弹出服务评价、或者弹出一些相关业务流程等。
2.5、个性化回复:当用户的问题与业务无关或者不在常用业务的范畴内时,可以构造一些机器人人设、语言、表达方式等的指导提示,让大型语言模型生成多样的回复给到用户。
2.6、为了多次个性化非业务类回复导致没有为用户提供有效的业务帮助,可以条件性地触发人工客服。
对话流程将大型语言模型回复多样性和垂直行业的分析能力结合在一起,同时提供了可控的业务场景,丰富、多样化的兜底回复。整体提升企业+用户的体验。
在一个实施例中,利用大型语言模型实现对话流程的方法,还包括:
向用户推送预设的组群许可请求窗口;组群许可请求窗口为一弹窗,上附有“即将将您与和您有相同意图的用户进行组群,是否同意”这一信息以及“是”和“否”两个选项;
当用户基于组群许可请求窗口输入组群许可指令时,获取与用户对话的对话历史;相应的,当用户选择“是”选项时,即输入组群许可指令;对话历史包括:用户历史上请求对话的意图,比如:J商品售后维修等;
基于预设的第一特征值化模板,对对话历史进行特征值化处理,获得对话特征值集;对话特征值集包括:用户历史上请求对话的意图中的相同意图、及相同意图的出现次数等;
基于预设的用户匹配规则生成模板,根据对话特征值集,生成用户匹配规则;用户匹配规则是为了匹配同样具备对话特征值集的其他用户,比如:用户历史上请求对话的意图中的相同意图为J商品售后维修,出现次数为3,则生成的用户匹配规则为,匹配历史上对话请求有J商品售后维修意图且请求3次的其他用户;
基于用户匹配规则,为用户匹配目标用户;
将用户与目标用户接入对话群组;
获取对话群组中产生的用户对话;
基于预设的问询内容生成模板,根据用户对话,生成第一问询内容;第一问询内容是询问大型语言模型用户对话反应对话群组中用户有什么共同意见的内容,比如:用户对话为“才用3天就坏了”、“是的,我也是”、“得找他们原额赔偿”,则第一问询内容为“我的客户现在交流说‘才用3天就坏了’、‘是的,我也是’、‘得找他们原额赔偿’,他们有什么共同意见?”;
将第一问询内容输入至大型语言模型中,将大型语言模型返回的第一问询结果与预设的标准问询结果库中的标准问询结果进行匹配;标准问询结果为反应系统需要介入回答对话群组中各用户的结果,比如:客户购买商品损坏,需要原额赔偿;
当匹配符合时,获取匹配符合的标准问询结果对应的预设的第二问询内容;第二问询内容为询问大型语言模型用户为标准问询结果这一情况时如何进行应对处理的内容,比如:标准问询结果为客户购买商品损坏,需要原额赔偿,则第二问询内容为“客户说购买商品损坏,需要原额赔偿,该怎么回复他们呢?”;
将第二问询内容输入至大型语言模型中,将大型语言模型返回的第二问询结果在对话群组内进行广播。比如:第二问询结果为“请各位客户将损坏处进行拍照,我方会尽快核实,核实若是非人为损坏,我方将原额退款!”。
上述技术方案的工作原理及有益效果为:
一般的,对用户进行对话接待时,多是一对一进行对话接待,但是,有的用户请求对话的意图可能是相同的,比如:一些用户均是提出购买的相同商品损坏,需要售后,此时,可以对请求对话的意图相同的用户进行组群,同时进行对话接待。本发明实施例可以实现这一点,减少了对话接待的资源。
另外,对用户进行一对一对话接待时,需要对话询问用户的诉求,但是,用户对话回答的诉求不一定是最终诉求,比如:某用户提出某商品损坏需要维修,但之后听闻别的购买用户是赔偿方案,出于公平性考虑,后又提出该商品损坏需要赔偿,这样的话,会增加企业的对话接待成本。本发明实施例可以解决这一问题,为用户匹配目标用户,将他们进行组群,在群内他们可以自由进行谈话,此时,他们会讨论各自使用商品的情况、协商诉求等,最后,本发明实施例基于共同意见统一进行回复(在对话群组内进行广播),降低了企业的对话接待成本,更特别具有适用性。其次,引入标准问询结果,当第一问询结果与标准问询结果匹配符合时,再进行统一回复,减少了统一回复资源。
在一个实施例中,基于预设的问询内容生成模板,根据用户对话,生成第一问询内容之前,对用户对话进行预处理;
其中,对用户对话进行预处理,包括:
从用户对话中提取人声时间区间和对应的发言人;人声时间区间的边界用户对话中出现人声片段的起止时间;
将人声时间区间设置于预设的时间轴线上;设置时,人声时间区间与时间轴线上的时间参数对应即可;
基于区间簇划定条件,在时间轴线上划定区间簇;
基于预设的第二特征值化模板,对区间簇进行特征值化处理,获得簇特征集;簇特征集包括:发言人的发言次序(比如:人声片段分别是Q、W、E三个人发出,则发言次序为QWE),发言人的发言时长(比如:Q、W、E三个人发出的人声时长为3秒、15秒、20秒);
将簇特征集与预设的标准簇特征集库中的标准簇特征集进行匹配;当簇特征集与标准簇特征集匹配时,说明簇特征集中存在无关发言对应的无关人声时间区间,比如:发言次序为ABB,发言人的发言时长为,3秒、5秒、17秒(说明A首先发言3秒,B回复了A,发言5秒,后B持续发言17秒,A未回复,说明B是在现实中与现实中的其他人对话);
当匹配符合时,获取匹配符合的标准簇特征集对应的预设的无关人声时间区间确定策略;无关人声时间区间确定策略为确定标准簇特征集反应的簇特征集中无关发言对应的无关人声时间区间的策略,相应的,则B持续发言17秒的人声片段的时间区间为无关人声时间区间;
基于无关人声时间区间确定策略,在区间簇中的人声时间区间中确定无关人声时间区间;
从用户对话中剔除无关人声时间区间对应的局部对话;
其中,区间簇划定条件,包括:
区间簇中两两人声时间区间之间在时间轴线上的最短距离小于等于预设的距离阈值;距离阈值可以为,比如:1.5秒;一般的,发言用户突然在现实中与现实中其他的人对话时,对话也是突然岔进来的,因此,不会与之前的人声的相隔时长较长,设置这一条件,提升从区间簇中确定用户在现实中与现实中其他的人对话产生的人声的时间区间的有效性;
区间簇中的人声时间区间对应的发言人的类别数大于1;一般的,发言用户突然在现实中与现实中其他的人对话时,多是之前是与对话群组的用户对话时,被现实中突然岔掉,因此,发言人的类别数需大于1,设置这一条件,进一步提升从区间簇中确定用户在现实中与现实中其他的人对话产生的人声的时间区间的有效性;
区间簇中首尾的人声时间区间对应的发言人不同。往往当用户突然在现实中与现实中其他的人对话时,之后会是该用户的持续发言,最先是与其他用户对话,因此,首尾的人声时间区间对应的发言人不同。
上述技术方案的工作原理及有益效果为:
一般的,用户在对话群组内进行对话时,由于是网络对话,用户端的声音输入装置可能会将用户现实中非用户发言的内容录入进来,若将该用户对话输入大型语言模型,不仅会造成资源浪费,还有可能造成共同意见的确定误差。因此,需要对用户对话进行无关对话剔除。
传统的,进行无关对话剔除均需一一识别用户对话的语义,基于语义确定无关对话,这样做,识别资源巨大,实现难度较大。本发明实施例可以低成本解决这一问题。根据用户突然在现实中与现实中其他的人对话时的情境,设置标准簇特征集,快速确定无关人声时间区间,剔除对应局部对话。其次,引入区间簇划定条件,提升了区间簇划定的精准性和有效性。
本发明实施例提供了一种利用大型语言模型实现对话流程的系统,如图4所示,包括:
对话知识库搭建模块1,用于利用大型语言模型,冷启动搭建对话知识库;
与用户聊天实现模块2,用于利用大型语言模型和对话知识库,实现与发起聊天的用户进行对话。
对话知识库搭建模块1利用大型语言模型,冷启动搭建对话知识库,包括:
当企业触发冷启动时,获取企业主页URL;
通过企业主页URL,访问企业网站,并从企业网站中提取FAQ URL;
通过FAQ URL,访问FAQ页面,并从FAQ页面中抽取文本;
将文本通过提示工程输入至大型语言模型中,由大型语言模型抽取文本中的QA对;
将QA对中的问题通过提示工程输入至大型语言模型中,由大型语言模型生成问题的相似问题,并补入到对应QA对中;
基于QA对,搭建对话知识库。
对话知识库搭建模块1利用大型语言模型,冷启动搭建对话知识库,还包括:
基于意图模型或相似度模型分析QA对的可能类别;
尝试从预设的流程机器人库中确定可能类别对应的流程机器人;
当尝试成功时,将QA对与流程机器人进行绑定。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种利用大型语言模型实现对话流程的方法,其特征在于,包括:
利用大型语言模型,冷启动搭建对话知识库;
利用所述大型语言模型和所述对话知识库,实现与发起聊天的用户进行对话。
2.如权利要求1所述的一种利用大型语言模型实现对话流程的方法,其特征在于,所述利用大型语言模型,冷启动搭建对话知识库,包括:
当企业触发冷启动时,获取企业主页URL;
通过所述企业主页URL,访问企业网站,并从所述企业网站中提取FAQ URL;
通过所述FAQ URL,访问FAQ页面,并从所述FAQ页面中抽取文本;
将所述文本通过提示工程输入至所述大型语言模型中,由所述大型语言模型抽取所述文本中的QA对;
将所述QA对中的问题通过提示工程输入至所述大型语言模型中,由所述大型语言模型生成所述问题的相似问题,并补入到对应所述QA对中;
基于所述QA对,搭建所述对话知识库。
3.如权利要求2所述的一种利用大型语言模型实现对话流程的方法,其特征在于,所述利用大型语言模型,冷启动搭建对话知识库,还包括:
基于意图模型或相似度模型分析所述QA对的可能类别;
尝试从预设的流程机器人库中确定所述可能类别对应的流程机器人;
当尝试成功时,将所述QA对与所述流程机器人进行绑定。
4.如权利要求3所述的一种利用大型语言模型实现对话流程的方法,其特征在于,所述利用所述大型语言模型和所述对话知识库,实现与发起聊天的用户进行对话,包括:
获取所述用户的聊天语境;
基于所述聊天语境,确定是否触发所述流程机器人;
当为是时,由被触发的所述流程机器人引导所述用户进入被触发的所述流程机器人对应的预设的第一业务流程;否则,基于意图模型判断所述聊天语境是否存在预设的第二业务流程;
当为是时,引导所述用户进入所述第二业务流程;否则,从所述对话知识库中尝试确定所述聊天语境对应的答案;
当尝试成功时,基于所述答案,回复所述用户,同时,向所述用户回复推荐所述答案对应的预设的第三业务流程;否则,基于所述大型语言模型,与所述用户进行对话。
5.如权利要求4所述的一种利用大型语言模型实现对话流程的方法,其特征在于,所述利用所述大型语言模型和所述对话知识库,实现与发起聊天的用户进行对话,还包括:
当所述用户输入请求人工客服指令时,为所述用户接入空闲的在线人工客服。
6.如权利要求1所述的一种利用大型语言模型实现对话流程的方法,其特征在于,还包括:
向所述用户推送预设的组群许可请求窗口;
当所述用户基于所述组群许可请求窗口输入组群许可指令时,获取与所述用户对话的对话历史;
基于预设的第一特征值化模板,对所述对话历史进行特征值化处理,获得对话特征值集;
基于预设的用户匹配规则生成模板,根据所述对话特征值集,生成用户匹配规则;
基于所述用户匹配规则,为所述用户匹配目标用户;
将所述用户与所述目标用户接入对话群组;
获取所述对话群组中产生的用户对话;
基于预设的问询内容生成模板,根据所述用户对话,生成第一问询内容;
将所述第一问询内容输入至所述大型语言模型中,将所述大型语言模型返回的第一问询结果与预设的标准问询结果库中的标准问询结果进行匹配;
当匹配符合时,获取匹配符合的所述标准问询结果对应的预设的第二问询内容;
将所述第二问询内容输入至所述大型语言模型中,将所述大型语言模型返回的第二问询结果在所述对话群组内进行广播。
7.如权利要求6所述的一种利用大型语言模型实现对话流程的方法,其特征在于,基于预设的问询内容生成模板,根据所述用户对话,生成第一问询内容之前,对所述用户对话进行预处理;
其中,对所述用户对话进行预处理,包括:
从所述用户对话中提取人声时间区间和对应的发言人;
将所述人声时间区间设置于预设的时间轴线上;
基于区间簇划定条件,在所述时间轴线上划定区间簇;
基于预设的第二特征值化模板,对所述区间簇进行特征值化处理,获得簇特征集;
将所述簇特征集与预设的标准簇特征集库中的标准簇特征集进行匹配;
当匹配符合时,获取匹配符合的所述标准簇特征集对应的预设的无关人声时间区间确定策略;
基于所述无关人声时间区间确定策略,在所述区间簇中的所述人声时间区间中确定无关人声时间区间;
从所述用户对话中剔除所述无关人声时间区间对应的局部对话;
其中,所述区间簇划定条件,包括:
所述区间簇中两两所述人声时间区间之间在时间轴线上的最短距离小于等于预设的距离阈值;
所述区间簇中的所述人声时间区间对应的所述发言人的类别数大于1;
所述区间簇中首尾的所述人声时间区间对应的所述发言人不同。
8.一种利用大型语言模型实现对话流程的系统,其特征在于,包括:
对话知识库搭建模块,用于利用大型语言模型,冷启动搭建对话知识库;
与用户聊天实现模块,用于利用所述大型语言模型和所述对话知识库,实现与发起聊天的用户进行对话。
9.如权利要求1所述的一种利用大型语言模型实现对话流程的系统,其特征在于,所述对话知识库搭建模块利用大型语言模型,冷启动搭建对话知识库,包括:
当企业触发冷启动时,获取企业主页URL;
通过所述企业主页URL,访问企业网站,并从所述企业网站中提取FAQ URL;
通过所述FAQ URL,访问FAQ页面,并从所述FAQ页面中抽取文本;
将所述文本通过提示工程输入至所述大型语言模型中,由所述大型语言模型抽取所述文本中的QA对;
将所述QA对中的问题通过提示工程输入至所述大型语言模型中,由所述大型语言模型生成所述问题的相似问题,并补入到对应所述QA对中;
基于所述QA对,搭建所述对话知识库。
10.如权利要求9所述的一种利用大型语言模型实现对话流程的系统,其特征在于,所述对话知识库搭建模块利用大型语言模型,冷启动搭建对话知识库,还包括:
基于意图模型或相似度模型分析所述QA对的可能类别;
尝试从预设的流程机器人库中确定所述可能类别对应的流程机器人;
当尝试成功时,将所述QA对与所述流程机器人进行绑定。
CN202310601516.0A 2023-05-25 2023-05-25 一种利用大型语言模型实现对话流程的方法及系统 Active CN116595148B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310601516.0A CN116595148B (zh) 2023-05-25 2023-05-25 一种利用大型语言模型实现对话流程的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310601516.0A CN116595148B (zh) 2023-05-25 2023-05-25 一种利用大型语言模型实现对话流程的方法及系统

Publications (2)

Publication Number Publication Date
CN116595148A true CN116595148A (zh) 2023-08-15
CN116595148B CN116595148B (zh) 2023-12-29

Family

ID=87604308

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310601516.0A Active CN116595148B (zh) 2023-05-25 2023-05-25 一种利用大型语言模型实现对话流程的方法及系统

Country Status (1)

Country Link
CN (1) CN116595148B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117093699A (zh) * 2023-10-20 2023-11-21 北京中关村科金技术有限公司 智能问答方法、装置、设备及介质
CN117592489A (zh) * 2023-11-30 2024-02-23 北京快牛智营科技有限公司 一种利用大语言模型实现电商商品信息交互的方法及系统

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106295792A (zh) * 2016-08-05 2017-01-04 北京光年无限科技有限公司 基于多模型输出的对话数据交互处理方法及装置
US20170316775A1 (en) * 2016-04-27 2017-11-02 Conduent Business Services, Llc Dialog device with dialog support generated using a mixture of language models combined using a recurrent neural network
US20180025726A1 (en) * 2016-07-22 2018-01-25 International Business Machines Corporation Creating coordinated multi-chatbots using natural dialogues by means of knowledge base
US20180308487A1 (en) * 2017-04-21 2018-10-25 Go-Vivace Inc. Dialogue System Incorporating Unique Speech to Text Conversion Method for Meaningful Dialogue Response
CN109710772A (zh) * 2018-11-13 2019-05-03 国云科技股份有限公司 一种基于深度学习的问答库知识管理系统及其实现方法
CN110019149A (zh) * 2019-01-30 2019-07-16 阿里巴巴集团控股有限公司 一种客服知识库的建立方法、装置及设备
WO2020111329A1 (ko) * 2018-11-29 2020-06-04 주식회사 라이크어로컬 유사 사용자 매칭을 이용한 자동 답변 방법 및 시스템
CN111309889A (zh) * 2020-02-27 2020-06-19 支付宝(杭州)信息技术有限公司 用于文本处理的方法和装置
CN111625641A (zh) * 2020-07-30 2020-09-04 浙江大学 一种基于多维度语义交互表征模型的对话意图识别方法及系统
CN112115238A (zh) * 2020-10-29 2020-12-22 电子科技大学 一种基于bert和知识库的问答方法和系统
CN112784022A (zh) * 2020-12-31 2021-05-11 北京智源人工智能研究院 一种政务faq知识库自动构建方法、装置和电子设备
CN113761109A (zh) * 2020-06-02 2021-12-07 华为技术有限公司 一种问答库构建方法以及相关装置
CN114625858A (zh) * 2022-03-25 2022-06-14 中国电子产业工程有限公司 一种基于神经网络的政务问答智能回复方法及装置

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170316775A1 (en) * 2016-04-27 2017-11-02 Conduent Business Services, Llc Dialog device with dialog support generated using a mixture of language models combined using a recurrent neural network
US20180025726A1 (en) * 2016-07-22 2018-01-25 International Business Machines Corporation Creating coordinated multi-chatbots using natural dialogues by means of knowledge base
CN106295792A (zh) * 2016-08-05 2017-01-04 北京光年无限科技有限公司 基于多模型输出的对话数据交互处理方法及装置
US20180308487A1 (en) * 2017-04-21 2018-10-25 Go-Vivace Inc. Dialogue System Incorporating Unique Speech to Text Conversion Method for Meaningful Dialogue Response
CN109710772A (zh) * 2018-11-13 2019-05-03 国云科技股份有限公司 一种基于深度学习的问答库知识管理系统及其实现方法
WO2020111329A1 (ko) * 2018-11-29 2020-06-04 주식회사 라이크어로컬 유사 사용자 매칭을 이용한 자동 답변 방법 및 시스템
CN110019149A (zh) * 2019-01-30 2019-07-16 阿里巴巴集团控股有限公司 一种客服知识库的建立方法、装置及设备
CN111309889A (zh) * 2020-02-27 2020-06-19 支付宝(杭州)信息技术有限公司 用于文本处理的方法和装置
CN113761109A (zh) * 2020-06-02 2021-12-07 华为技术有限公司 一种问答库构建方法以及相关装置
CN111625641A (zh) * 2020-07-30 2020-09-04 浙江大学 一种基于多维度语义交互表征模型的对话意图识别方法及系统
CN112115238A (zh) * 2020-10-29 2020-12-22 电子科技大学 一种基于bert和知识库的问答方法和系统
CN112784022A (zh) * 2020-12-31 2021-05-11 北京智源人工智能研究院 一种政务faq知识库自动构建方法、装置和电子设备
CN114625858A (zh) * 2022-03-25 2022-06-14 中国电子产业工程有限公司 一种基于神经网络的政务问答智能回复方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SENTHILKUMAR CHANDRAMOHAN.ET AL: "Clustering behaviors of Spoken Dialogue Systems users", 2012 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, pages 4981 - 4984 *
谭孟华等: "文本聊天机器人对话回复策略研究", 软件, pages 51 - 54 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117093699A (zh) * 2023-10-20 2023-11-21 北京中关村科金技术有限公司 智能问答方法、装置、设备及介质
CN117093699B (zh) * 2023-10-20 2024-01-02 北京中关村科金技术有限公司 智能问答方法、装置、设备及介质
CN117592489A (zh) * 2023-11-30 2024-02-23 北京快牛智营科技有限公司 一种利用大语言模型实现电商商品信息交互的方法及系统

Also Published As

Publication number Publication date
CN116595148B (zh) 2023-12-29

Similar Documents

Publication Publication Date Title
CN116595148B (zh) 一种利用大型语言模型实现对话流程的方法及系统
CN110096191B (zh) 一种人机对话方法、装置及电子设备
CN107846350B (zh) 一种语境感知网络聊天的方法、计算机可读介质和系统
RU2690199C1 (ru) Управление поставщиками данных для диалога
US11551804B2 (en) Assisting psychological cure in automated chatting
KR101793355B1 (ko) 연락 센터용 지능형 자동 에이전트
CN110580282B (zh) 通过仿真用户与客服交互的方法及装置
CN108268450B (zh) 用于生成信息的方法和装置
CN106407198A (zh) 问答信息的处理方法及装置
Vijayakumar et al. AI based student bot for academic information system using machine learning
CN112199486A (zh) 一种办公场景的任务型多轮对话方法及系统
US20200227038A1 (en) Apparatus, method and system for conducting surveys
CN111651554A (zh) 基于自然语言理解及处理的保险问答回答的方法和装置
US20190179902A1 (en) Systems and methods for task automation using natural language processing
Mauny et al. A prototype of smart virtual assistant integrated with automation
CN111556096B (zh) 信息推送方法、装置、介质及电子设备
KR102120115B1 (ko) 대화 능력 기반의 답변 시스템 및 그 방법
KR20060117860A (ko) 이미지를 이용하여 대화 에이전트 서비스를 제공하는 방법및 시스템
CN111046151A (zh) 一种消息处理方法及装置
CN113782022B (zh) 基于意图识别模型的通信方法、装置、设备及存储介质
CN117573834B (zh) 一种用于面向软件即服务平台的多机器人对话方法及系统
CN116741143B (zh) 基于数字分身的个性化ai名片的交互方法及相关组件
JP7462595B2 (ja) 人材育成支援システム、連携支援システム、方法及びコンピュータプログラム
CN111368533B (zh) 一种基于神经网络识别对话信息的方法及系统
Slisarenko et al. Model of Integration of Voice Assistants in the Construction of Web Applications

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant