CN116644145B - 会话数据处理方法、装置、设备和存储介质 - Google Patents

会话数据处理方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN116644145B
CN116644145B CN202310922740.XA CN202310922740A CN116644145B CN 116644145 B CN116644145 B CN 116644145B CN 202310922740 A CN202310922740 A CN 202310922740A CN 116644145 B CN116644145 B CN 116644145B
Authority
CN
China
Prior art keywords
session data
data
language model
target
target session
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310922740.XA
Other languages
English (en)
Other versions
CN116644145A (zh
Inventor
于鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Renke Interactive Network Technology Co Ltd
Original Assignee
Beijing Renke Interactive Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Renke Interactive Network Technology Co Ltd filed Critical Beijing Renke Interactive Network Technology Co Ltd
Priority to CN202310922740.XA priority Critical patent/CN116644145B/zh
Publication of CN116644145A publication Critical patent/CN116644145A/zh
Application granted granted Critical
Publication of CN116644145B publication Critical patent/CN116644145B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及数据处理技术领域,提供一种会话数据处理方法、装置、设备和存储介质,该方法包括:获取待处理的目标会话数据;对目标会话数据进行预处理,得到目标会话数据对应的目标文本;利用大语言模型根据目标文本和原始提示词,得到目标会话数据对应的第一提示结果;原始提示词中至少包含标签;大语言模型为利用统一的第一应用编程接口API与第一业务系统进行交互的大语言模型;利用大语言模型根据第一提示结果,进行相应的业务处理操作。本发明提高了对目标会话数据进行分析处理的效率。

Description

会话数据处理方法、装置、设备和存储介质
技术领域
本发明涉及数据处理技术领域,尤其涉及一种会话数据处理方法、装置、设备和存储介质。
背景技术
企业即时通讯应用程序是企业连接用户的重要渠道,是私域流量运营的核心工具。用户通过企业即时通讯应用程序,可以和企业的运营人员进行高频触达和实时沟通。在获得用户授权后,企业可以对沟通过程中产生的会话数据进行分析处理。
现有技术中,通常采用人工的方式对会话数据进行逐条处理和分析,但在面对海量的会话数据时,人工处理的方式处理效率较低。
发明内容
本发明提供一种会话数据处理方法、装置、设备和存储介质,用以解决现有技术中处理效率较低的缺陷,实现提高会话数据处理的效率。
第一方面,本发明提供一种会话数据处理方法,该方法包括:
获取待处理的目标会话数据;
对所述目标会话数据进行预处理,得到所述目标会话数据对应的目标文本;
利用大语言模型根据所述目标文本和原始提示词,得到所述目标会话数据对应的第一提示结果;所述原始提示词中至少包含标签;所述大语言模型为利用统一的第一应用编程接口API与第一业务系统进行交互的大语言模型;
利用所述大语言模型根据所述第一提示结果,进行相应的业务处理操作。
可选地,所述利用大语言模型根据所述目标文本和原始提示词,得到所述目标会话数据对应的第一提示结果,包括:
利用所述大语言模型对所述原始提示词进行标签提取,得到所述原始提示词中包含的标签;所述标签包括创建第一工单的需求,以及以下至少一项:客户满意度和客户诉求;
利用所述大语言模型根据所述原始提示词中包含的标签,将所述目标文本转化为与所述原始提示词中包含的标签对应的结构化数据;
利用所述大语言模型将与所述原始提示词中包含的标签对应的结构化数据确定为所述第一提示结果。
可选地,所述利用所述大语言模型根据所述第一提示结果,进行相应的业务处理操作,包括:
当所述第一提示结果中创建第一工单的需求为需要创建第一工单,所述利用所述大语言模型根据所述第一提示结果,进行相应的业务处理操作,包括:
基于业务场景,得到所述目标会话数据对应的第二业务系统;
利用所述大语言模型调用所述第二业务系统对应的第二应用编程接口API;
根据所述第一提示结果和所述第二业务系统,利用所述第二业务系统进行创建第二工单的操作;
当所述第一提示结果中所述创建第一工单的需求为不需要创建第一工单,所述利用所述大语言模型根据所述第一提示结果,进行相应的业务处理操作,包括:
将所述第一提示结果同步给所述目标会话数据关联的目标人员。
可选地,所述第一业务系统包括以下至少一项:客户关系管理CRM系统、生产制造ERP系统、协同管理OA系统、销售系统。
可选地,所述目标会话数据的类型包括第一文本类型的数据、语音类型的数据以及图片类型的数据中的至少一项,所述对所述目标会话数据进行预处理,得到所述目标会话数据对应的目标文本,包括:
确定所述目标会话数据中的数据的类型;
当所述目标会话数据包括语音类型的数据时,将所述目标会话数据中包含的语音类型的数据转换成第二文本数据;
当所述目标会话数据包括图片类型的数据时,将所述目标会话数据中包含的图片类型的数据转换成第三文本数据;
根据所述目标会话数据中包含的第一文本类型的数据、第二文本数据和第三文本数据,得到所述目标文本。
可选地,所述利用大语言模型根据所述目标文本和原始提示词,得到所述目标会话数据对应的第一提示结果之前,还包括:
利用大语言模型对所述原始提示词进行优化,得到优化后的提示词。
可选地,所述大语言模型为基于长链LangChain应用开发框架构建的大语言模型。
第二方面,本发明提供一种会话数据处理装置,该装置包括:
获取模块,用于获取待处理的目标会话数据;
处理模块,用于对所述目标会话数据进行预处理,得到所述目标会话数据对应的目标文本;
利用大语言模型根据所述目标文本和原始提示词,得到所述目标会话数据对应的第一提示结果;所述原始提示词中至少包含标签;所述大语言模型为利用统一的第一应用编程接口API与第一业务系统进行交互的大语言模型;
利用所述大语言模型根据所述第一提示结果,进行相应的业务处理操作。
第三方面,本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述会话数据处理方法。
第四方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述会话数据处理方法。
第五方面,本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述会话数据处理方法。
本发明提供的一种会话数据处理方法、装置、设备和存储介质,通过获取待处理的目标会话数据,对目标会话数据进行预处理,得到目标会话数据对应的目标文本;然后,利用大语言模型根据目标文本和原始提示词,得到目标会话数据对应的第一提示结果,其中,大语言模型为利用统一的第一应用编程接口API与第一业务系统进行交互的大语言模型;进而,利用大语言模型根据第一提示结果,进行相应的业务处理操作。本发明中通过对目标会话数据进行预处理,得到目标会话数据对应的目标文本,然后基于目标文本和原始提示词和大语言模型进行交互,因原始提示词中至少包含标签,基于原始提示词中的标签和目标文本可以得到第一提示结果,进而,基于得到的第一提示结果,利用大语言模型调用统一的第一应用编程接口API与第一业务系统进行交互,执行相应的业务处理操作,实现了与第一业务系统的高效交互,提高了对目标会话数据进行分析处理的效率。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的会话数据处理方法的流程示意图之一;
图2是本发明提供的会话数据处理方法的流程示意图之二;
图3是本发明提供的会话数据处理装置的结构示意图;
图4是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”所区别的对象通常为一类,并不限定对象的个数,例如第一节点可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”一般表示前后关联对象是一种“或”的关系。
为了便于更加清晰地理解本发明提供的各实施例,首先对一些相关的背景知识进行如下介绍。
企业即时通讯应用程序:企业即时通讯应用程序,是一种面向企业终端使用者的网络营销、网络沟通和内容管理的工具服务,使用者可以通过安装了即时通信的终端软件进行两人或多人之间的实时沟通及企业内容管理。交流内容包括文字、语音及图片等。
企业即时通讯应用程序是企业连接用户的重要渠道,是私域流量运营的核心工具。用户通过企业即时通讯应用程序,可以和企业的运营人员进行高频触达和实时沟通。在获得用户授权后,企业可以对沟通过程中产生的会话数据也即聊天记录进行分析处理。
应用编程接口(Application Program Interface,API):应用程序接口是一组定义、程序及协议的集合,通过API接口实现计算机软件之间的相互通信。API的一个主要功能是提供通用功能集,程序员通过调用API函数对应用程序进行开发,可以减轻编程任务,API同时也是一种中间件,为各种不同平台提供数据共享。
大模型(Foundation models):大模型,通常指的是一类被广泛使用的基础模型(或称基础架构模型),是在海量数据和计算资源的基础上训练出来的通用、通用性较强的深度学习模型。这些模型被广泛应用于自然语言处理、计算机视觉、语音识别等领域的各种任务。Foundation Model通常由大型科技公司、研究机构或者开源社区开发,目的是提供一种共享的基础架构,为更广泛的应用和开发人员提供更好的机会和资源,这些模型的预训练需要大量的数据和计算资源。
提示(prompt)词:prompt简单来说就是你给人工智能(ArtificialIntelligence,AI)模型的指令,可以是一段文字,比如你和生成式预训练转化器GPT对话的文字,也可以是按照一定的格式的参数进行描述,比如AI绘图的软件,使用参数输入提示的情况比较多。
下面结合图1-图4描述本发明提供的会话数据处理的解决方案。
图1是本发明提供的会话数据处理方法的流程示意图之一,如图1所示,该方法包括:
步骤101、获取待处理的目标会话数据;
具体地,电子设备可以从例如企业微信、飞书等企业即时通讯应用程序对应的会话存档文件中获取待处理的目标会话数据,其中,目标会话数据例如客服1和客户A在2023年6月这一时间段的聊天数据,或客服2和客户C在2023年7月这一时间段的聊天数据。
可选地,目标会话数据包括文本数据、语音数据以及图片数据中的至少一项。
步骤102、对目标会话数据进行预处理,得到目标会话数据对应的目标文本;
具体地,在得到目标会话数据后,可以对该目标会话数据进行预处理,例如目标会话数据的类型包括第一文本类型的数据和语音类型的数据,首先,对语音类型的数据进行转化,得到语音类型的数据对应的第二文本数据,进一步地,将第一文本数据和语音数据对应的第二文本数据进行汇总,得到所述目标文本,目标文本例如为“客服1、客户A、购买产品B、100件”。
步骤103、利用大语言模型根据目标文本和原始提示词,得到目标会话数据对应的第一提示结果;原始提示词中至少包含标签;大语言模型为利用统一的第一应用编程接口API与第一业务系统进行交互的大语言模型;
具体地,可以理解的是,原始提示词也即人工创建的原始提示词,原始提示词中至少包含标签,该原始提示词也是后续输入至大语言模型的初始指令信息,便于大语言模型根据原始提示词对目标文本进行相应的处理。
进一步地,基于所述目标文本,以及人工创建的原始提示词,可以得到第一提示结果,例如根据第一提示结果中的标签提取目标文本中与所述标签对应的结构化数据,原始提示词也即人工创建的提示词例如“从客服1那里了解下,客户A对产品B的满意度和购买意向”,标签可以是“是否需要创建第一工单:是,以及客户诉求、客户满意度中至少一项”,目标文本例如为“客服1、客户A、购买产品B、100件”,可以得到第一提示结果为:
“创建第一工单的需求:需要创建第一工单;
客户满意度:客户A对产品B的满意度为10分;
客户诉求:客户A购买产品B,购买数量为100件”;
也就是说基于目标文本,可以利用大语言模型根据原始提示词得到原始提示词对应的第一提示结果。
可以理解的是,所述大语言模型是指在自然语言处理领域的基础模型,也是通过大规模的语料库预训练出来的基础模型,可以在多种自然语言处理NLP任务中表现出色,如文本分类、机器翻译、摘要生成等。大语言模型例如生成式预训练转换器(Generative Pre-trained Transformer,GPT)模型、星火大模型等。
其中,大语言模型为利用统一的第一应用编程接口API与第一业务系统进行交互的大语言模型。
步骤104、利用大语言模型根据第一提示结果,进行相应的业务处理操作。
具体地,在得到目标会话数据对应的第一提示结果后,可以进一步利用大语言模型根据第一提示结果进行相应的业务操作。例如,根据第一提示结果对应的业务场景,确定第一业务系统,然后利用大语言模型调用第一业务系统的API进行创建第二工单,进行第二工单对应的业务处理操作。
本实施例提供的方法中,通过获取待处理的目标会话数据,对目标会话数据进行预处理,得到目标会话数据对应的目标文本;然后,利用大语言模型根据目标文本和原始提示词,得到目标会话数据对应的第一提示结果,其中,大语言模型为利用统一的第一应用编程接口API与第一业务系统进行交互的大语言模型;进而,利用大语言模型根据第一提示结果,进行相应的业务处理操作。本发明中通过对目标会话数据进行预处理,得到目标会话数据对应的目标文本,然后基于目标文本和原始提示词和大语言模型进行交互,因原始提示词中至少包含标签,基于原始提示词中的标签和目标文本可以得到第一提示结果,进而,基于得到的第一提示结果,利用大语言模型调用统一的第一应用编程接口API与第一业务系统进行交互,执行相应的业务处理操作,实现了与第一业务系统的高效交互,提高了对目标会话数据进行分析处理的效率。
可选地,利用大语言模型根据目标文本和原始提示词,得到目标会话数据对应的第一提示结果,包括:
利用大语言模型对原始提示词进行标签提取,得到原始提示词中包含的标签;标签包括创建第一工单的需求,以及以下至少一项:客户满意度和客户诉求;
利用大语言模型根据原始提示词中包含的标签,将目标文本转化为与原始提示词中包含的标签对应的结构化数据;
利用大语言模型将与原始提示词中包含的标签对应的结构化数据确定为第一提示结果。
具体地,步骤103可以通过如下步骤实现:
首先,利用大语言模型对原始提示词进行标签提取,得到原始提示词中包含的标签;然后,利用大语言模型根据原始提示词中包含的标签对目标文本进行处理,更准确地说,是将目标文本转化为与原始提示词中包含的标签对应的结构化数据;进而,利用大语言模型将与原始提示词中包含的标签对应的结构化数据确定为第一提示结果。
示例性地,例如原始提示词为“客户A对产品B的购买意向”,对原始提示词进行标签提取,得到原始提示词中包含的标签为“创建第一工单的需求、客户诉求”;
利用大语言模型根据原始提示词中包含的标签对所述目标文本进行转化,得到与原始提示词中包含的标签对应的结构化数据,例如转化后的目标文本也即目标文本中与原始提示词中包含的标签对应的结构化数据为:
“创建第一工单的需求:需要创建第一工单;
客户诉求:购买产品B,数量为100件”;
可选地,还可以对所述结构化数据进行优化处理等,例如为:
“创建第一工单的需求:需要创建第一工单;
客户满意度:满意;
客户诉求:客户A需续购产品B,数量为100件”;
进一步地,可以利用大语言模型将与原始提示词中包含的标签对应的结构化数据确定为第一提示结果,也即第一提示结果为:
“创建第一工单的需求:需要创建第一工单;
客户满意度:满意;
客户诉求:客户A需续购产品B,数量为100件”。
本实施例提供的方法中,通过利用大语言模型对原始提示词进行标签提取,得到原始提示词中包含的标签,其中标签包括创建第一工单的需求,以及客户满意度和客户诉求中至少一项,然后利用大语言模型根据原始提示词中包含的标签,将目标文本转化为与原始提示词中包含的标签对应的结构化数据,进一步地,利用大语言模型将与原始提示词中包含的标签对应的结构化数据确定为第一提示结果。本实施例中基于原始提示词中的标签信息对目标文本进行处理,得到结构化的标签数据,将结构化的标签数据作为第一提示结果,利用大语言模型处理得到第一提示结果的数据处理效率较高,得到的第一提示结果也更为准确。
可选地,利用大语言模型根据第一提示结果,进行相应的业务处理操作,包括:
当第一提示结果中创建第一工单的需求为需要创建第一工单,利用大语言模型根据第一提示结果,进行相应的业务处理操作,包括:
基于业务场景,得到目标会话数据对应的第二业务系统;
利用大语言模型调用第二业务系统对应的第二应用编程接口API;
根据第一提示结果和第二业务系统,利用第二业务系统进行创建第二工单的操作;
当第一提示结果中创建第一工单的需求为不需要创建第一工单,利用大语言模型根据第一提示结果,进行相应的业务处理操作,包括:
将第一提示结果同步给目标会话数据关联的目标人员。
具体地,其中,步骤103得到的第一提示结果为基于业务场景得到的包括多个标签的结构化数据,其中标签包括创建第一工单的需求,以下客户满意度和客户诉求中的至少一项。
进一步地,步骤104可以通过如下步骤实现:
第一种情况:当第一提示结果中创建第一工单的需求为需要创建第一工单,可以利用大语言模型调用第二业务系统对应的第二应用编程接口API,进而,根据第一提示结果和第二业务系统,利用第二业务系统进行创建第二工单的操作。
示例性地,得到的第一提示结果为:
“创建第一工单的需求:需要创建第一工单;
客户满意度:满意;
客户诉求:客户A续购产品B,数量为100件”。
根据上述第一提示结果调用第二业务系统执行相应的业务操作的过程如下:
首先,根据上述客服1和客户A进行对话的业务场景,确定第二业务系统例如为销售系统;
进一步地,调用销售系统对应的第二应用编程接口API;
进一步地,销售系统接收调用,执行创建第二工单。其中,第二工单为:“为客户A创建商品订单;商品订单的订单信息为:产品名称:B,产品数量为100件,订购客户:客户A”。
第二种情况:当第一提示结果中创建第一工单的需求为不需要创建第一工单,仅将第一提示结果同步给目标会话数据关联的目标人员。
示例性地,根据客服2和客户C的会话数据,得到第一提示结果为:
“创建第一工单的需求:不需要创建第一工单;
客户满意度:不满意;
客户诉求:客户C反馈产品/服务D的使用过程中系统容易卡顿”。
根据上述第一提示结果执行的操作的过程如下:
根据上述步骤103得到的第一提示结果调用第二业务系统执行相应的业务操作的过程如下:
将所述第一提示结果“创建第一工单的需求:不需要创建第一工单;客户满意度:不满意;客户诉求:客户C反馈产品/服务D的使用过程中系统容易卡顿”同步给目标会话数据关联的目标人员,所述目标人员例如包括客服C、产品/服务D的售后人员等。
本实施例提供的方法中,利用大语言模型根据第一提示结果,进行相应的业务处理操作,提高了分析处理效率;此外,通过大语言模型调用第一提示结果对应的第一业务系统,实现了会话数据的高效分析和相应的业务处理,提高了会话数据的利用价值。
可选地,第一业务系统包括以下至少一项:客户关系管理CRM系统、生产制造ERP系统、协同管理OA系统、销售系统。
具体地,所述第一业务系统根据实际应用场景确定,第一业务系统例如是客户关系管理CRM系统、生产制造ERP系统、协同管理OA系统、销售系统等。
其中,针对CRM系统,本实施例可以基于第一提示结果调用CRM系统的应用编程接口实现例如创建客户、更新客户需求、创建商机的业务操作;针对ERP系统,本实施例可以基于第一提示结果调用ERP系统的应用编程接口实现例如创建生产订单的业务操作;针对OA系统,本实施例可以基于第一提示结果调用OA系统的应用编程接口实现例如合同印章申请的业务操作;针对销售系统,本实施例可以基于第一提示结果调用销售系统的应用编程接口实现例如创建商品订单的业务操作。
本实施例提供的方法中,通过利用大模型对第一提示结果进行判断,当第一提示结果中创建第一工单的需求为需要创建第一工单,也即大模型在判断需要后续业务操作的处理,自动调用业务场景对应的第一业务系统,进行相应的业务处理操作,实现了会话数据处理和业务系统的打通。
可选地,目标会话数据的类型包括第一文本类型的数据、语音类型的数据以及图片类型的数据中的至少一项;对目标会话数据进行预处理,得到目标会话数据对应的目标文本,包括:
确定目标会话数据中的数据的类型;
当目标会话数据包括语音类型的数据时,将目标会话数据中包含的语音类型的数据转换成第二文本数据;
当目标会话数据包括图片类型的数据时,将目标会话数据中包含的图片类型的数据转换成第三文本数据;
根据目标会话数据中包含的第一文本类型的数据、第二文本数据和第三文本数据,得到目标文本。
具体地,目标会话数据可以是从企业即时通讯应用例如企业微信存档提取的会话数据,目标会话数据可能包含多种类型的数据,例如文本数据、语音数据、图片数据、视频数据等等。
在获取到所述包含多种类型的目标会话数据后,可以首先对目标会话数据进行预处理,得到目标会话数据对应的目标文本。具体地,针对目标会话数据中包含的文本数据,将目标会话数据中的文本数据直接作为第一文本数据;针对目标会话数据中包含的语音数据,例如利用自动语音识别(Automatic Speech Recognition,ASR)技术将目标会话数据中包含的语音数据转化为第二文本数据;针对目标会话数据中包含的图片数据,例如利用光学字符识别(Optical Character Recognition,OCR)技术将目标会话数据中包含的图片数据转化为第三文本数据。然后,将第一文本数据、第二文本数据和第三文本数据进行汇总,可以得到目标会话数据对应的目标文本。
本实施例提供的方法中,通过获取目标会话数据对应的目标文本,其中,目标文本包括文本数据、语音数据以及图片数据中的至少一项对应的文本数据,然后基于目标会话数据对应的目标文本,利用原始提示词与大语言模型进行交互,实现与大语言模型的交流。
可选地,利用大语言模型根据目标文本和原始提示词,得到目标会话数据对应的第一提示结果之前,方法还包括:
利用大语言模型对原始提示词进行优化,得到优化后的提示词。
具体地,步骤102中的原始提示词可以理解为人工创建的提示词。人工创建的提示词通常比较零散,缺少结构化标签,大模型语言模型基于原始提示词进行匹配得到的第一提示结果准确性会稍差。
因而,可以利用大语言模型对原始提示词进行优化,例如包括补充上下文、请求结构化输出、规范输出格式等,其中:
(1)补充上下文:指的是用户可能会与大语言模型发起多轮对话,可以将本轮之前的会话也作为上下文提示词,和本轮的原始提示词一并输入给大语言模型,这将有利于大语言模型更好的理解用户需求;
(2)请求结构化输出:指的是将大语言模型输出的结果转化为结构化的标签数据,然后再通过调用API实现和第一业务系统的协作。具体地,原始提示词需要添加附加信息,要求大模型的输出符合结构化数据的特征。比如请输出标准的JSON数据,该JSON数据如下:抽取工单名称到name、抽取工单类型(待处理、处理中、已完成)到casetype,以及抽取50字以内总结到caseDescription;
(3)规范输出格式:指的是因大语言模型的每次输出偏差较大,可以对输出内容的长度、语言类型或者语气等进行规范。比如可以要求输出内容不超过300字,只能为中文或者要求大语言模型严格提取目标文本中的信息,而无需加入一些总结类的信息等。
经过对原始提示词进行上述优化操作,可以得到优化后的提示词,优化后的提示词为便于大语言模型理解的包括多个标签的结构化数据,例如,该优化后的提示词包含:1、如何对原始提示词对应的内容进行分析;2、分析后输出基于哪些标签的结构化数据,如标签为客户诉求、客户满意度、创建第一工单的需求等等。
本实施例提供的方法中,利用大语言模型将原始提示词转化为优化后的提示词,其中,优化后的提示词为便于大语言模型理解的包括多个标签的结构化数据,然后,基于优化后的提示词创造性的利用大语言模型实现会话数据的场景化处理,处理效率更高,得到的提示结果也更为准确。
可选地,大语言模型为基于长链LangChain应用开发框架构建的大语言模型。
具体地,其中大语言模型是大模型的一种,本实施例中的大语言模型基于LangChain应用开发框架构建,LangChain是一个开源的应用开发框架,目前支持Python和TypeScript两种编程语言。它赋予大语言模型两大核心能力:数据感知,将大语言模型与其他数据源相连接;代理能力,允许大语言模型与其所在的环境互动;更重要的是,可以实现对多种大模型的封装和管理,屏蔽了各个类型大模型之间的差异点,提供统一的API与上层业务模块例如第一业务系统进行交互。
在自然语言处理领域,最著名的大模型是GPT模型。GPT模型采用了预训练加微调的方式,通过大规模的语料库训练出来的模型,可以在多种NLP任务中表现出色,如文本分类、机器翻译、摘要生成等。
本实施例提供的方法中,大语言模型为基于LangChain应用开发框架构建的大语言模型,程序设计人员可以对大语言模型进行自定义开发,更好适应不同的业务场景,此外,可以提供统一的API与上层业务模块例如第一业务系统进行交互,便于统一管理,交互效率较高。
图2是本发明提供的会话数据处理方法的流程示意图之二,如图2所示,该方法包括:
步骤201、获取目标会话数据;
步骤202、对目标会话数据进行预处理,得到目标文本;
步骤203、利用大语言模型对原始提示词进行优化,得到优化后的提示词;
步骤204、利用大语言模型根据优化后的提示词和目标文本,得到第一提示结果;
步骤205、判断是否需要创建第一工单;
若判断结果为否,则执行下述步骤206:
步骤206、将第一提示结果同步给目标会话数据关联的目标人员;
若判断结果为是,则执行下述步骤207:
步骤207、利用大语言模型基于第一提示结果对应的JSON数据进行相应的业务处理操作。
具体地,首先,从例如企业微信、飞书等企业即时通讯应用程序对应的会话存档文件中获取待处理的目标会话数据,目标会话数据例如客服1和客户A在2023年6月这一时间段的聊天数据;对该目标会话数据进行预处理,得到目标文本;可选地,利用大语言模型对人工创建的原始提示词进行优化,得到优化后的提示词;
然后,利用大模型根据目标文本和优化后的提示词,得到第一提示结果;进而,可以基于第一提示结果判断是否需要创建第一工单。
若判断结果为否,则执行:将第一提示结果同步给目标会话数据关联的目标人员,例如将第一提示结果输出到目标人员关注的系统的前端界面,用于提示或警告;
若判断结果为是,则执行:利用大语言模型基于第一提示结果对应的JSON数据进行相应的业务处理操作,业务处理操作例如创建第二工单、创建客户、创建商品订单等。
下面对本发明提供的会话数据处理装置进行描述,下文描述的会话数据处理装置与上文描述的会话数据处理方法可相互对应参照。
图3是本发明提供的会话数据处理装置300的结构示意图,如图3所示,该装置包括:
获取模块310,用于获取待处理的目标会话数据;
处理模块320,用于对所述目标会话数据进行预处理,得到所述目标会话数据对应的目标文本;
利用大语言模型根据所述目标文本和原始提示词,得到所述目标会话数据对应的第一提示结果;所述原始提示词中至少包含标签;所述大语言模型为利用统一的第一应用编程接口API与第一业务系统进行交互的大语言模型;
利用所述大语言模型根据所述第一提示结果,进行相应的业务处理操作。
本实施例提供的装置中,通过获取模块310获取待处理的目标会话数据,对目标会话数据进行预处理,得到目标会话数据对应的目标文本;然后,处理模块320利用大语言模型根据目标文本和原始提示词,得到目标会话数据对应的第一提示结果,其中,大语言模型为利用统一的第一应用编程接口API与第一业务系统进行交互的大语言模型;进而,处理模块320利用大语言模型根据第一提示结果,进行相应的业务处理操作。本发明中通过对目标会话数据进行预处理,得到目标会话数据对应的目标文本,然后基于目标文本和原始提示词和大语言模型进行交互,因原始提示词中至少包含标签,基于原始提示词中的标签和目标文本可以得到第一提示结果,进而,基于得到的第一提示结果,利用大语言模型调用统一的第一应用编程接口API与第一业务系统进行交互,执行相应的业务处理操作,实现了与第一业务系统的高效交互,提高了对目标会话数据进行分析处理的效率。
可选地,所述处理模块320,具体用于:
利用所述大语言模型对所述原始提示词进行标签提取,得到所述原始提示词中包含的标签;所述标签包括创建第一工单的需求,以及以下至少一项:客户满意度和客户诉求;
利用所述大语言模型根据所述原始提示词中包含的标签,将所述目标文本转化为与所述原始提示词中包含的标签对应的结构化数据;
利用所述大语言模型将与所述原始提示词中包含的标签对应的结构化数据确定为所述第一提示结果。
可选地,所述处理模块320,还用于:
当所述第一提示结果中创建第一工单的需求为需要创建第一工单,基于业务场景,得到所述目标会话数据对应的第二业务系统;
利用所述大语言模型调用所述第二业务系统对应的第二应用编程接口API;
根据所述第一提示结果和所述第二业务系统,利用所述第二业务系统进行创建第二工单的操作;
所述处理模块320,还用于:
当所述第一提示结果中所述创建第一工单的需求为不需要创建第一工单,将所述第一提示结果同步给所述目标会话数据关联的目标人员。
可选地,所述第一业务系统包括以下至少一项:客户关系管理CRM系统、生产制造ERP系统、协同管理OA系统、销售系统。
可选地,所述目标会话数据的类型包括第一文本类型的数据、语音类型的数据以及图片类型的数据中的至少一项;
所述处理模块320,还用于:
确定所述目标会话数据中的数据的类型;
当所述目标会话数据包括语音类型的数据时,将所述目标会话数据中包含的语音类型的数据转换成第二文本数据;
当所述目标会话数据包括图片类型的数据时,将所述目标会话数据中包含的图片类型的数据转换成第三文本数据;
根据所述目标会话数据中包含的第一文本类型的数据、第二文本数据和第三文本数据,得到所述目标文本。
可选地,所述装置还包括提示词管理模块;
所述提示词管理模块,用于:
利用大语言模型对所述原始提示词进行优化,得到优化后的提示词。
可选地,所述大语言模型为基于长链LangChain应用开发框架构建的大语言模型。
图4示例了一种电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和通信总线440,其中,处理器410,通信接口420,存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令,以执行会话数据处理方法,该方法包括:
获取待处理的目标会话数据;
对所述目标会话数据进行预处理,得到所述目标会话数据对应的目标文本;
利用大语言模型根据所述目标文本和原始提示词,得到所述目标会话数据对应的第一提示结果;所述原始提示词中至少包含标签;所述大语言模型为利用统一的第一应用编程接口API与第一业务系统进行交互的大语言模型;
利用所述大语言模型根据所述第一提示结果,进行相应的业务处理操作。
此外,上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,计算机程序被处理器执行时,计算机能够执行上述各方法所提供的会话数据处理方法,该方法包括:
获取待处理的目标会话数据;
对所述目标会话数据进行预处理,得到所述目标会话数据对应的目标文本;
利用大语言模型根据所述目标文本和原始提示词,得到所述目标会话数据对应的第一提示结果;所述原始提示词中至少包含标签;所述大语言模型为利用统一的第一应用编程接口API与第一业务系统进行交互的大语言模型;
利用所述大语言模型根据所述第一提示结果,进行相应的业务处理操作。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的会话数据处理方法,该方法包括:
获取待处理的目标会话数据;
对所述目标会话数据进行预处理,得到所述目标会话数据对应的目标文本;
利用大语言模型根据所述目标文本和原始提示词,得到所述目标会话数据对应的第一提示结果;所述原始提示词中至少包含标签;所述大语言模型为利用统一的第一应用编程接口API与第一业务系统进行交互的大语言模型;
利用所述大语言模型根据所述第一提示结果,进行相应的业务处理操作。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种会话数据处理方法,其特征在于,包括:
获取待处理的目标会话数据;
对所述目标会话数据进行预处理,得到所述目标会话数据对应的目标文本;
利用大语言模型对原始提示词进行标签提取,得到所述原始提示词中包含的标签;所述标签包括创建第一工单的需求,以及以下至少一项:客户满意度和客户诉求;
利用所述大语言模型根据所述原始提示词中包含的标签,将所述目标文本转化为与所述原始提示词中包含的标签对应的结构化数据;
利用所述大语言模型将与所述原始提示词中包含的标签对应的结构化数据确定为第一提示结果;所述原始提示词中至少包含标签;所述大语言模型为利用统一的第一应用编程接口API与第一业务系统进行交互的大语言模型;
当所述第一提示结果中创建第一工单的需求为需要创建第一工单,基于业务场景,得到所述目标会话数据对应的第二业务系统;
利用所述大语言模型调用所述第二业务系统对应的第二应用编程接口API;
根据所述第一提示结果和所述第二业务系统,利用所述第二业务系统进行创建第二工单的操作;
当所述第一提示结果中所述创建第一工单的需求为不需要创建第一工单,将所述第一提示结果同步给所述目标会话数据关联的目标人员。
2.根据权利要求1所述的会话数据处理方法,其特征在于,所述第一业务系统包括以下至少一项:客户关系管理CRM系统、生产制造ERP系统、协同管理OA系统、销售系统。
3.根据权利要求1所述的会话数据处理方法,其特征在于,所述目标会话数据的类型包括第一文本类型的数据、语音类型的数据以及图片类型的数据中的至少一项,所述对所述目标会话数据进行预处理,得到所述目标会话数据对应的目标文本,包括:
确定所述目标会话数据中的数据的类型;
当所述目标会话数据包括语音类型的数据时,将所述目标会话数据中包含的语音类型的数据转换成第二文本数据;
当所述目标会话数据包括图片类型的数据时,将所述目标会话数据中包含的图片类型的数据转换成第三文本数据;
根据所述目标会话数据中包含的第一文本类型的数据、第二文本数据和第三文本数据,得到所述目标文本。
4.根据权利要求1所述的会话数据处理方法,其特征在于,所述利用大语言模型根据所述目标文本和原始提示词,得到所述目标会话数据对应的第一提示结果之前,还包括:
利用大语言模型对所述原始提示词进行优化,得到优化后的提示词。
5.根据权利要求1所述的会话数据处理方法,其特征在于,所述大语言模型为基于长链LangChain应用开发框架构建的大语言模型。
6.一种会话数据处理装置,其特征在于,包括:
获取模块,用于获取待处理的目标会话数据;
处理模块,用于对所述目标会话数据进行预处理,得到所述目标会话数据对应的目标文本;
利用大语言模型对原始提示词进行标签提取,得到所述原始提示词中包含的标签;所述标签包括创建第一工单的需求,以及以下至少一项:客户满意度和客户诉求;
利用所述大语言模型根据所述原始提示词中包含的标签,将所述目标文本转化为与所述原始提示词中包含的标签对应的结构化数据;
利用所述大语言模型将与所述原始提示词中包含的标签对应的结构化数据确定为第一提示结果;所述原始提示词中至少包含标签;所述大语言模型为利用统一的第一应用编程接口API与第一业务系统进行交互的大语言模型;
当所述第一提示结果中创建第一工单的需求为需要创建第一工单,基于业务场景,得到所述目标会话数据对应的第二业务系统;
利用所述大语言模型调用所述第二业务系统对应的第二应用编程接口API;
根据所述第一提示结果和所述第二业务系统,利用所述第二业务系统进行创建第二工单的操作;
当所述第一提示结果中所述创建第一工单的需求为不需要创建第一工单,将所述第一提示结果同步给所述目标会话数据关联的目标人员。
7.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5任一项所述会话数据处理方法。
8.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述会话数据处理方法。
CN202310922740.XA 2023-07-26 2023-07-26 会话数据处理方法、装置、设备和存储介质 Active CN116644145B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310922740.XA CN116644145B (zh) 2023-07-26 2023-07-26 会话数据处理方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310922740.XA CN116644145B (zh) 2023-07-26 2023-07-26 会话数据处理方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN116644145A CN116644145A (zh) 2023-08-25
CN116644145B true CN116644145B (zh) 2023-10-13

Family

ID=87625067

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310922740.XA Active CN116644145B (zh) 2023-07-26 2023-07-26 会话数据处理方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN116644145B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117636855A (zh) * 2023-09-19 2024-03-01 深圳市西迪特科技股份有限公司 设备配置方法、计算机设备及计算机可读存储介质
CN116992006B (zh) * 2023-09-26 2024-01-12 武汉益模科技股份有限公司 一种大语言模型驱动的链式自然语言交互方法与系统
CN117474090A (zh) * 2023-11-20 2024-01-30 北京传通科技有限公司 一种提示词分享的方法与装置
CN117349275B (zh) * 2023-12-04 2024-03-01 中电数创(北京)科技有限公司 一种基于大语言模型的文本结构化方法和系统
CN117475449A (zh) * 2023-12-28 2024-01-30 思创数码科技股份有限公司 Pdf文档处理方法、装置、可读存储介质及电子设备
CN117827804B (zh) * 2024-02-22 2024-06-14 北京仁科互动网络技术有限公司 线索生成方法、装置、设备和存储介质
CN118297564A (zh) * 2024-06-06 2024-07-05 北京仁科互动网络技术有限公司 客服工单创建方法、装置、设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112434501A (zh) * 2020-10-23 2021-03-02 杭州未名信科科技有限公司 工单智能生成的方法、装置、电子设备及介质
CN113962315A (zh) * 2021-10-28 2022-01-21 北京百度网讯科技有限公司 模型预训练方法、装置、设备、存储介质以及程序产品
CN114358736A (zh) * 2022-01-04 2022-04-15 杭州网易智企科技有限公司 客服工单生成方法、装置、存储介质和电子设备
CN116432665A (zh) * 2023-06-15 2023-07-14 北京中关村科金技术有限公司 对话模型构建方法、文本生成方法、装置、系统及设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11676067B2 (en) * 2020-02-14 2023-06-13 Nice Ltd. System and method for creating data to train a conversational bot

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112434501A (zh) * 2020-10-23 2021-03-02 杭州未名信科科技有限公司 工单智能生成的方法、装置、电子设备及介质
CN113962315A (zh) * 2021-10-28 2022-01-21 北京百度网讯科技有限公司 模型预训练方法、装置、设备、存储介质以及程序产品
CN114358736A (zh) * 2022-01-04 2022-04-15 杭州网易智企科技有限公司 客服工单生成方法、装置、存储介质和电子设备
CN116432665A (zh) * 2023-06-15 2023-07-14 北京中关村科金技术有限公司 对话模型构建方法、文本生成方法、装置、系统及设备

Also Published As

Publication number Publication date
CN116644145A (zh) 2023-08-25

Similar Documents

Publication Publication Date Title
CN116644145B (zh) 会话数据处理方法、装置、设备和存储介质
WO2018224034A1 (zh) 智能问答方法、服务器、终端及存储介质
US11749255B2 (en) Voice question and answer method and device, computer readable storage medium and electronic device
CN107784033B (zh) 一种基于会话进行推荐的方法和装置
CN109922213A (zh) 语音咨询时的数据处理方法、装置、存储介质及终端设备
CN115643341A (zh) 人工智能客服应答系统
CN115033677A (zh) 基于对话机器人的事件处理方法、装置、设备和介质
CN117688165B (zh) 多边缘协同的客服方法、装置、设备和可读存储介质
CN112860873A (zh) 智能应答方法、装置及存储介质
RU2755781C1 (ru) Интеллектуальное рабочее место оператора и способ его взаимодействия для осуществления интерактивной поддержки сессии обслуживания клиента
CN115905490B (zh) 人机交互对话方法、装置以及设备
CN116860938A (zh) 一种基于大语言模型的语音问答构建方法、装置及介质
CN114202363B (zh) 基于人工智能的话术调用方法、装置、计算机设备及介质
CN114356860A (zh) 对话生成方法及装置
CN117827804B (zh) 线索生成方法、装置、设备和存储介质
CN114254088A (zh) 自动应答模型的构建方法和自动应答方法
CN114118937A (zh) 基于任务的信息推荐方法、装置、电子设备及存储介质
CN112131379A (zh) 用于识别问题类别的方法、装置、电子设备及存储介质
CN110852799A (zh) 基于意图标签的用户筛选方法、装置、电子设备及介质
CN112163078A (zh) 智能应答方法、装置、服务器及存储介质
CN117349425B (zh) 知识条目的生成方法、装置、设备和存储介质
CN118227770B (zh) 任务处理方法、法律问答方法及任务处理模型训练方法
CN117648986B (zh) 任务处理和代码处理方法、计算设备、介质和程序产品
CN118071310B (zh) 一种基于流程引擎的业务处理方法及系统
CN118297564A (zh) 客服工单创建方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant