CN116737910A - 智能对话处理方法、装置、设备及存储介质 - Google Patents
智能对话处理方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN116737910A CN116737910A CN202311003972.1A CN202311003972A CN116737910A CN 116737910 A CN116737910 A CN 116737910A CN 202311003972 A CN202311003972 A CN 202311003972A CN 116737910 A CN116737910 A CN 116737910A
- Authority
- CN
- China
- Prior art keywords
- text
- dialogue
- task
- interface
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 25
- 238000012545 processing Methods 0.000 claims abstract description 64
- 238000000034 method Methods 0.000 claims description 56
- 230000006870 function Effects 0.000 claims description 40
- 238000013507 mapping Methods 0.000 claims description 13
- 238000013473 artificial intelligence Methods 0.000 abstract description 20
- 238000005516 engineering process Methods 0.000 description 24
- 238000012549 training Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 7
- 238000010801 machine learning Methods 0.000 description 6
- 238000003058 natural language processing Methods 0.000 description 6
- 238000011160 research Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 241000070023 Phoenicopterus roseus Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Machine Translation (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请提供了一种智能对话处理方法、装置、设备及存储介质,可以应用于人工智能、智慧交通等各种场景。该方法包括通过经训练的大语言模型,在识别第一对话文本对应的当前对话的类型为任务对话类型的情况下,基于当前对话的类型所属的目标任务类型和第一对话文本中包含的任务参数值生成第一对话文本对应的应用程序接口令牌;获取与目标任务类型对应的目标调用接口针对应用程序接口令牌所返回的第一接口反馈信息;在第一接口反馈信息指示第一对话文本存在目标任务参数值缺失的情况下,输出至少与第一对话文本和第一接口反馈信息对应的参数询问文本。从而通过端到端的大语言模型实现智能对话处理,提高对话回复速率。
Description
技术领域
本申请涉及计算机领域,尤其涉及一种智能对话处理方法、装置、设备及存储介质。
背景技术
随着人工智能技术在日常生活中的广泛应用,智能对话成为人工智能领域的重要研究方向之一。
相关技术中,主要采用先通过一个模型来识别用户对话的意图,再通过另一个模型来获取用户对话中的完整信息,最后通过又一个模型来针对该完整信息生成对话回复,这样需要同时训练三个模型来完成不同的任务,对话回复速率较慢,且在用户对话的信息不丰富的情况下,无法准确生成恰当的回复内容。
发明内容
本申请提供了一种智能对话处理方法、装置、设备及存储介质,以解决现有技术中至少一种技术问题。
一方面,本申请提供了一种智能对话处理方法,包括:
获取第一对话文本;
将所述第一对话文本输入至经训练的大语言模型,通过所述大语言模型基于所述第一对话文本识别当前对话的类型;
在所述当前对话的类型为任务对话类型的情况下,基于所述当前对话的类型所属的目标任务类型和所述第一对话文本中包含的任务参数值,生成所述第一对话文本对应的应用程序接口令牌;
调用与所述目标任务类型对应的目标调用接口,获取所述目标调用接口针对所述应用程序接口令牌返回的第一接口反馈信息;
在所述第一接口反馈信息指示所述第一对话文本存在目标任务参数值缺失的情况下,输出至少与所述第一对话文本和所述第一接口反馈信息对应的参数询问文本,所述参数询问文本用于询问缺失的目标任务参数值。
另一方面还提供了一种智能对话处理装置,所述装置包括:
第一获取模块,用于获取第一对话文本;
第一处理模块,用于将所述第一对话文本输入至经训练的大语言模型,通过所述大语言模型基于所述第一对话文本识别当前对话的类型;
第二处理模块,用于在所述当前对话的类型为任务对话类型的情况下,基于所述当前对话的类型所属的目标任务类型和所述第一对话文本中包含的任务参数值,生成所述第一对话文本对应的应用程序接口令牌;
第三处理模块,用于调用与所述目标任务类型对应的目标调用接口,获取所述目标调用接口针对所述应用程序接口令牌返回的第一接口反馈信息;
第四处理模块,用于在所述第一接口反馈信息指示所述第一对话文本存在目标任务参数值缺失的情况下,输出至少与所述第一对话文本和所述第一接口反馈信息对应的参数询问文本,所述参数询问文本用于询问缺失的目标任务参数值。
另一方面还提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现上述任一所述的智能对话处理方法。
另一方面还提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现上述任一所述的智能对话处理方法。
另一方面还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述任一所述的智能对话处理方法。
本申请提供的一种智能对话处理方法、装置、设备及存储介质,具有如下技术效果:
本申请实施例通过将获取的第一对话文本输入至经训练的大语言模型,通过大语言模型基于第一对话文本识别当前对话的类型,在当前对话的类型为任务对话类型的情况下,基于当前对话的类型所属的目标任务类型和第一对话文本中包含的任务参数值,生成第一对话文本对应的应用程序接口令牌;应用程序接口令牌是基于第一对话文本的目标任务类型和提取的任务参数值所构建的;调用与应用程序接口令牌的目标任务类型对应的目标调用接口,获取目标调用接口针对应用程序接口令牌返回的第一接口反馈信息;在第一接口反馈信息指示第一对话文本存在目标任务参数值缺失的情况下,输出至少与第一对话文本和第一接口反馈信息对应的参数询问文本,参数询问文本用于询问缺失的目标任务参数值。从而无需同时训练三个模型来完成对话任务,通过端到端的大语言模型实现智能对话处理,提高对话回复速率。此外,在用户对话的信息不丰富的情况下,基于对话信息缺失的接口反馈信息,生成对应的参数询问文本,提高回复内容的准确性,同时也提高人机对话的轮次和智能对话的灵活性,避免因信息缺失而导致的智能对话的中断,促进智能对话处理的顺利执行。此外,应用程序接口令牌是基于当前对话的目标任务类型和提取的任务参数值所生成的,避免生成过程中的错误,进一步提高回复内容的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1是本申请实施例提供的一种实施环境示意图;
图2是本申请实施例提供的一种智能对话处理方法的流程示意图;
图3是本申请实施例提供的另一种智能对话处理方法的流程示意图;
图4是本申请实施例提供的另一种智能对话处理方法的流程示意图;
图5是本申请实施例提供的另一种智能对话处理方法的流程示意图;
图6示意了本申请实施例提供的一种智能对话处理方法的交互过程图;
图7是本申请实施例提供的一种执行整个酒店的预定流程的智能对话示意图;
图8是本申请实施例提供的一种智能对话处理装置的结构框图;
图9是本申请提供的一种用于实现本申请实施例所提供的方法的电子设备的硬件结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
为了便于理解本申请实施例上述的技术方案,针对本申请实施例中涉及的技术或关键名词进行简单介绍:
人工智能(Artificial Intelligence, AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
自然语言处理(Nature Language processing, NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
自动驾驶技术通常包括高精地图、环境感知、行为决策、路径规划、运动控制等技术,自定驾驶技术有着广泛的应用前景。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
预训练模型(Pre-training model),也称基石模型、大模型,指具有大参量的深度神经网络(Deep neural network,DNN),在海量未标记的数据上对其进行训练,利用大参量DNN的函数近似能力使PTM在数据上提取共性特征,经微调(fine tune)、参数高效微调(PEFT)、prompt-tuning等技术,适用于下游任务。因此,预训练模型可以在小样本(Few-shot)或零样本(Zero-shot)场景下达到理想效果。PTM按照处理的数据模态可以分为语言模型(例如ELMO、BERT、GPT)、视觉模型(例如swin-transformer、ViT、V-MOE)、语音模型(例如VALL-E)、多模态模型(例如ViBERT、CLIP、Flamingo、Gato)等,其中多模态模型指建立两种或以上数据模态特征表示的模型。预训练模型是输出人工智能生成内容(AIGC)重要工具,也可以作为连接多个具体任务模型的通用接口。
本申请实施例提供的方案涉及人工智能的自然语言处理、机器学习等技术。现有的主要采用先通过一个模型来识别用户对话的意图,再通过另一个模型来获取用户对话中的完整信息,最后通过又一个模型来针对该完整信息生成对话回复,这样需要同时训练三个模型来完成不同的任务,对话回复速率较慢,且在用户对话的信息不丰富的情况下,无法准确生成恰当的回复内容。
鉴于此,本申请提供一种智能对话处理方法、装置、设备及存储介质,在该方法中,通过大语言模型基于第一对话文本识别当前对话的类型,在当前对话的类型为任务对话类型的情况下,基于当前对话的类型所属的目标任务类型和第一对话文本中包含的任务参数值,生成第一对话文本对应的应用程序接口令牌;应用程序接口令牌是基于第一对话文本的目标任务类型和提取的任务参数值所构建的;调用与应用程序接口令牌的目标任务类型对应的目标调用接口,获取目标调用接口针对应用程序接口令牌返回的第一接口反馈信息;在第一接口反馈信息指示第一对话文本存在目标任务参数值缺失的情况下,输出至少与第一对话文本和第一接口反馈信息对应的参数询问文本,参数询问文本用于询问缺失的目标任务参数值。从而无需同时训练三个模型来完成对话任务,通过端到端的大语言模型实现智能对话处理,提高对话回复速率。此外,在用户对话的信息不丰富的情况下,基于对话信息缺失的接口反馈信息,生成对应的参数询问文本,提高回复内容的准确性,同时也提高人机对话的轮次和智能对话的灵活性,避免因信息缺失而导致的智能对话的中断,促进智能对话处理的顺利执行。此外,应用程序接口令牌是基于当前对话的目标任务类型和提取的任务参数值所生成的,避免生成过程中的错误,进一步提高回复内容的准确性。
下面介绍一下本申请实施例提供的智能对话处理方法的实施环境,图1是本申请实施例提供的一种智能对话处理方法的实施环境示意图。如图1所示,该实施环境可以包括终端110和服务器120。
在一些实施例中,终端110包括但不限于手机、电脑、智能语音交互设备、智能家电、车载终端、飞行器等。终端110安装和运行有支持智能对话功能的应用程序。服务器120可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还能够是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)以及大数据和人工智能平台等基础云计算服务的云服务器。服务器120用于为支持智能对话的应用程序提供后台服务。终端110与服务器120能够通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
在一些实施例中,服务器120还可以实现为区块链系统中的节点。区块链(Blockchain)是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链,本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。
在一些实施例中,本申请实施例提供的智能对话处理方法可以在服务器或终端中单独实现,或者由终端和服务器共同实现。
此外,本申请实施例可以包括但不限于云技术、人工智能、智慧交通、辅助驾驶等场景。具体地,本申请实施例涉及的智能对话可以应用于包括但不限于生活服务、旅游、餐饮、教育等各种领域,如旅游中的酒店预定、餐饮中的美食预定、教育行业中的知识问答等等。
当然,本申请实施例提供的方法并不限用于图1所示的实施环境中,还可以用于其它可能的实施环境,本申请实施例并不进行限制。对于图1所示的实施环境的各个设备所能实现的功能将在后续的方法实施例中一并进行描述,在此先不过多赘述。
需要说明的是,本申请涉及到用户信息等相关的数据,当本申请以下实施例运用到具体产品或技术中时,需要获得用户许可授权或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
图2是本申请实施例提供的一种智能对话处理方法的流程示意图。本申请提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。该智能对话处理方法的执行主体可以是本申请实施例提供的智能对话处理装置,或者集成了该智能对话处理装置的电子设备,其中,该智能对话处理装置可以采用硬件或者软件的方式实现。以执行主体为上述图1中的服务器为例进行说明,如图2所示,该方法可以包括:
S201:获取第一对话文本。
其中,第一对话文本可以是用户通过键盘、鼠标、手势等手动输入的,也可以是通过将用户输入语音转换后的文本等等。
S203:将第一对话文本输入至经训练的大语言模型,通过大语言模型基于第一对话文本识别当前对话的类型。
其中,经训练的大语言模型可以是通过对预训练语言模型进行微调训练得到。该预训练语言模型可以是任一用于生成文本的语言模型,示例性的,大规模预训练语言模型(LargeLanguage Model,LLM)、预训练模型(generative pre-training,GPT)、预训练语言模型(Pre-trained Language Model,PLM)、语言模型嵌入模型(Embedding from LanguageModel,ELMo)等等。
预训练语言模型通常是通过各领域的通用训练数据进行预训练得到,为了使得模型针对智能对话处理的效果更好,可以采用应用领域的专用训练数据对预训练语言模型进行模型参数微调,得到经训练的大语言模型。例如,针对旅游应用领域,可以通过旅游相关的训练数据对预训练语音模型进行微调。
在实际应用中,以在用户与智能对话设备(例如智能对话机器人)进行聊天场景,用户在聊天界面输入第一对话文本,智能对话设备获取该第一对话文本,并将该第一对话文本输入至经训练的大语言模型,通过该大语言模型对该第一对话文本进行后续处理,以端到端的生成对应的回复内容。
可选地,将获取的第一对话文本输入至经训练的大语言模型,通过大语言模型基于第一对话文本识别当前对话的类型。其中,当前对话的对话类型可以包括闲聊对话类型和任务对话类型,其中,闲聊对话类型是指不需要触发执行特定任务的智能对话。任务对话类型是指性需要触发执行特定任务的智能对话。
以天气话题为例,若第一对话文本是“今天天气真晴朗”,则通过大语言模型基于该第一对话文本识别当前对话的对话类型为闲聊对话类型。若第一对话文本是“A市明天的天气如何?”,这里该第一对话文本需要触发查询天气的任务,则通过大语言模型基于该第一对话文本识别当前对话的对话类型为任务对话类型。
S205:在当前对话的类型为任务对话类型的情况下,基于当前对话的类型所属的目标任务类型和第一对话文本中包含的任务参数值,生成第一对话文本对应的应用程序接口令牌。
其中,任务对话类型用于反映第一对话文本对应的当前对话是非闲聊的对话类型。
可选地,在通过大语言模型来识别第一对话文本对应的当前对话的类型所属的对话类型,若识别到该当前对话的类型为任务对话类型,也即非闲聊对话类型,则模型可以生成应用程序接口令牌。该应用程序接口令牌可以是基于当前对话的类型所属的目标任务类型和第一对话文本中包含的任务参数值所生成的。
目标任务类型可以是指第一对话文本所指示的细分任务意向。以旅游领域为例,目标任务类型可以为与旅游相关的预定旅游团、预定酒店、预定机票、预定门票等任务。
任务参数值可以是第一对话文本中与执行目标任务类型相关的实体对应的值。以预定酒店为例,任务参数值可以包括入住对象的昵称、入住时间、入住地点、入住人数等。
仅作为示例,应用程序接口令牌可以表示为{目标任务类型(任务参数值1,任务参数值2...)},或者,也可以表示为{目标任务类型,任务参数值1,任务参数值2...}。
在一可选实施方式中,基于当前对话的类型所属的目标任务类型和第一对话文本中包含的任务参数值,生成第一对话文本对应的应用程序接口令牌包括:
S301:基于当前对话的类型所属的目标任务类型确定任务函数名;
S303:从第一对话文本中提取与任务函数名相关的任务参数值;
S305:基于任务函数名和任务参数值,生成应用程序接口令牌。
可选地,在生成应用程序接口令牌的过程中,可以先基于当前对话的类型所属的目标任务类型,确定与该目标任务类型对应的任务意图相关的任务函数名。接着,从第一对话文本中提取与任务函数名相关的任务参数值,例如提取任务参数值1和任务参数值2。接着,将任务函数名和任务参数值进行组合,生成应用程序接口令牌。
在一可选实施方式中,在任务参数值包括第一数量个实体参数对应的参数值。上述步骤S305,基于任务函数名和任务参数值,生成应用程序接口令牌包括:
基于任务函数名和和与任务函数名相关的第二数量个实体参数,构造任务函数;第二数量大于或等于第一数量,第二数量个实体参数至少包括任务参数值对应的各实体参数;
将任务参数值填充至任务函数中各自对应的实体参数所在的槽位,生成应用程序接口令牌。
示例性的,若用户输入的第一对话文本为:“预定酒店,张三,1391azbge”。上述生成应用程序接口令牌可以划分为以下步骤:
step1:基于该第一对话文本的目标任务类型的意图为“预定酒店”,其对应的任务函数名可以为例如“url_or_other_function_booking”。
Step2:可以获取目标任务类型的意图对应的第二数量个实体参数,例如包括name=""、phonenum=""、time=""、hotelname=""、price_range=""这五个实体参数。
Step3:结合前面两步骤,构造任务函数,如下所示:
url_or_other_function_booking(
name="",
phonenum="",
time="",
hotelname="",
price_range="",
)
Step4:任务参数值中的张三、1391azbge两个槽位信息,分别对应name=""、phonenum=""这两个实体参数,这里的第一数量为两个。基于目标任务类型对应的实体参数及对应的参数值的数据格式,从第一对话文本中提取与该任务函数名相关的任务参数值,例如张三、1391azbge,添加至任务函数中各自对应的实体参数所在的槽位,具体的,将"张三"填充至name=""的槽位,将"1391azbge"填充至phonenum=""的槽位,生成的应用程序接口令牌,如下所示:
url_or_other_function_booking(
name="张三",
phonenum="1391azbge",
time="",
hotelname="",
price_range="",
)
上述实施例中,构造函数中的实体参数的第二数量大于任务参数值的实体参数的第一数量。在其他实施例中,可以设置构造函数的实体参数与任务参数值中的实体参数的数量相同,也即设置第一数量等于第二数量。
另一示例性的,若用户输入的第一对话文本为:“我已预订,如何查询酒店电话?”
Step1:基于该第一对话文本的目标任务类型的意图为“订单询问”,其对应的任务函数名可以为例如“inquiry_order”。
Step2:该第一对话文本为酒店电话,则其对应的实体参数为hotel_phone=""。
Step3:结合前面2步骤,构造任务函数[inquiry_order(hotel_phone="")]。由于该酒店电话没有对应的目标任务参数值,则基于槽位填充得到的应用程序接口令牌,也为[inquiry_order(hotel_phone="")]。
上述实施例,通过将生成应用程序接口令牌的过程通过思维链的方式拆解为多个步骤,逐步生成应用程序接口令牌,以减少直接生成应用程序接口令牌的错误几率,提高了智能对话处理的准确率。
在一可选实施方式中,将第一对话文本输入至经训练的大语言模型之后,方法还包括:
在识别第一对话文本为闲聊对话类型,获得大语言模型的输出作为对话回复文本。
可选地,将第一对话文本输入至经训练的大语言模型,通过大语言模型来识别第一对话文本所属的对话类型,若识别到该第一对话文本为闲聊对话类型,则大语言模型可以基于该闲聊对话类型对应的第一对话文本来输出对话回复文本,并返回给用户。
S207:调用与目标任务类型对应的目标调用接口,获取目标调用接口针对应用程序接口令牌返回的第一接口反馈信息。
在一可选实施方式中,调用与目标任务类型对应的目标调用接口包括:
获取任务类型与调用接口的映射关系;
基于映射关系,查询与应用程序接口令牌的目标任务类型对应的目标调用接口;不同的调用接口适配执行不同的任务类型;
调用目标调用接口。
可选地,任务类型与调用接口的映射关系可以事先设置。这里的大语言模型可以支持支持众多接口工具,通过将每个接口API和任务类型进行映射,如:
View_weather →查看天气
View_train_info →查看火车票信息
Calculator →调用计算器
…
基于任务类型与调用接口的映射关系,该映射关系可以通过映射表反映,通过查表的方式查询与应用程序接口令牌的目标任务类型对应的目标调用接口;不同的调用接口适配执行不同的任务类型。例如,以上面的预定酒店为例,模型生成的API->url_or_other_function_booking,确定酒店预定对应的目标调用接口即Reserve_hotel接口,调用该目标调用接口对应的接口工具来执行相应的任务,如预定酒店的任务。接着,模型获取目标调用接口返回的针对应用程序接口令牌返回的第一接口反馈信息。
S209:在第一接口反馈信息指示第一对话文本存在目标任务参数值缺失的情况下,输出至少与第一对话文本和第一接口反馈信息对应的参数询问文本,参数询问文本用于询问缺失的目标任务参数值。
其中,参数值缺失是指第一对话文本中缺少执行目标任务类型对应的任务的关键实体的参数值。以预定酒店为例,通过调用预定酒店的接口,返回预定的信息,包括调用不成功的信息或失败的信息,例如参数不全等。继续上面的例子,返回的第一接口反馈信息为“时间和酒店名字没有提供”信息,也即第一接口反馈信息指示第一对话文本中缺失“时间”和“酒店名字”这两个关键实体的目标任务参数值,调用的接口会提示模型哪些参数不全。
可选地,大语言模型获取到第一接口反馈信息后,在确认第一接口反馈信息指示接口调用失败的情况下,根据第一接口反馈信息中的提示信息生成参数询问文本,参数询问文本用于指示模型生成与目标任务参数值缺失相关的询问文本,也即数询问文本用于询问缺失的目标任务参数值,例如生成“好的,您要入住的位置和入住的时间是?”,去引导用户提供酒店和对应的入住日期。
在一可选实施方式中,在第一接口反馈信息指示第一对话文本存在目标参数值缺失的情况下,输出至少与第一对话文本和第一接口反馈信息对应的参数询问文本包括:将第一对话文本和第一接口反馈信息输入至大语言模型;通过大语言模型判断第一接口反馈信息是否存在关键实体的目标任务参数值缺失;在确定第一接口反馈信息指示第一对话文本存在目标任务参数值缺失的情况下,获得大语言模型的输出作为参数询问文本。
在一可选实施方式中,在第一接口反馈信息指示第一对话文本存在关键实体的目标任务参数值缺失的情况下,输出至少与第一对话文本和第一接口反馈信息对应的参数询问文本包括:将第一对话文本、应用程序接口令牌和第一接口反馈信息输入至大语言模型;在确定第一接口反馈信息指示第一对话文本存在关键实体的目标任务参数值缺失的情况下,获得大语言模型的输出作为参数询问文本。这里输入至大语言模型的输入数据中,除了包括第一对话文本和第一接口反馈信息之前,还包括应用程序接口令牌,也即将第一对话文本、应用程序接口令牌和第一接口反馈信息一起输入至大语言模型中,如此通过丰富模型的输入数据内容,以提高模型的输出预测的准确性,进而提高参数询问文本的准确性。
在一可选实施方式中,上述方法还包括:
S401:获得基于参数询问文本输入的第二对话文本;
S403:将第二对话文本输入至大语言模型,将第二对话文本中新增任务参数值添加至应用程序接口令牌中,生成更新的应用程序接口令牌;
S405:获取目标调用接口针对更新的应用程序接口令牌返回的第二接口反馈信息;
S407:在第二接口反馈信息指示当前对话对应的目标任务参数值完整的情况下,输出至少与第一对话文本、第二对话文本和第二接口反馈信息对应的对话回复文本。
可选地,第二对话文本可以是用户通过键盘、鼠标、手势等手动输入的,也可以是通过将用户输入语音转换后的文本。该第二对话文本设置在第一对话文本之后,也即第二对话文本是第一对话文本的下文。
在实际应用中,在模型返回参数询问文本的情况下,用户在聊天界面可以继续输入第二对话文本,智能对话设备获取该第二对话文本,并将该第二对话文本继续输入至经训练的大语言模型,通过该大语言模型对该第二对话文本进行后续处理。
在一可选实施方式中,将第二对话文本中新增任务参数值添加至应用程序接口令牌中,生成更新的应用程序接口令牌包括:提取第二对话文本中与目标任务类型相关的新增任务参数值;将新增任务参数值添加至应用程序接口令牌中,生成更新的应用程序接口令牌。
示例性的,若第二对话文本是“xyz路,哪个酒店无所谓,要便宜的”,则从该第二对话文本中提取与目标任务类型相关的新增任务参数值,例如包括xyz路和价格便宜。该新增任务参数值用于辅助大语言模型执行该目标任务类型对应的任务,该新增任务参数值也可以与缺失的目标任务参数值对应的关键实体相关。接着,通过大语言模型将该新增任务参数值增加至应用程序接口令牌中,生成更新的应用程序接口令牌。具体的,若应用程序接口令牌中包含新增任务参数值对应的任务参数,则将新增任务参数值对应的参数值添加至对应的槽位中,保留应用程序接口令牌对应的槽位不变,得到更新的应用程序接口令牌。若应用程序接口令牌中不包含新增任务参数值对应的任务参数,则在保留应用程序接口令牌对应的槽位不变的同时,增加新增任务参数值对应的任务参数和对应的参数值,生成更新的应用程序接口令牌。示例性的,通过在应用程序接口令牌中添加loction="xyz路"和order_method="price_asc"这两个新增任务参数值,生成的更新的应用程序接口令牌,该更新的应用程序接口令牌可以表示为:
url_or_other_function_booking(
name="张三",
phonenum="1391azbge",
time="",
hotelname="",
price_range="",
loction="xyz路",
order_method="price_asc",
)
接着,获取目标调用接口针对更新的应用程序接口令牌返回的第二接口反馈信息。在第二接口反馈信息指示当前对话的目标任务参数值完整的情况下,至少输出与第一对话文本、第二对话文本和第二接口反馈信息对应的对话回复文本。可选地,将第一对话文本、第二对话文本和第二接口反馈信息输入至大语言模型,在第二接口反馈信息指示当前对话的目标任务参数值完整的情况下,获取大语言模型的输出作为针对第一对话文本和第二对话文本的对话回复文本。另一可选地,将第一对话文本、第二对话文本、更新的应用程序接口令牌和第二接口反馈信息输入至大语言模型,在第二接口反馈信息指示当前对话的目标任务参数值完整的情况下,获取大语言模型的输出作为针对第一对话文本和第二对话文本的对话回复文本。
上述第二对话文本的数量可以为一个或多个,两个第二对话文本之间可以是紧邻设置,也可以是间隔设置的,后面的第二对比文本可以设置在智能对话设备反馈的参数询问文本或回复文本之后。
而在第二接口反馈信息指示当前对话的目标任务参数值缺失的情况下,可以继续输出对应的参数询问文本。例如,若第二接口反馈信息反馈缺失入住日期,则返回“请问您入住的日期”的参数询问文本。接着,获取用户输入的另一个第二对话文本,例如“3月2日到3月3日”,此时目标调用接口的接口调用成功,返回对应的预定酒店信息的第二接口反馈信息。模型获取到第二接口反馈信息之后,可以基于该第二接口反馈信息和第一对话文本、第二对话文本生成对应的对话回复文本,例如针对以上例子,对话回复文本可以为:
“好的,为您推荐以下酒店:
酒店a 价格123 距离xyz路100米
酒店b 价格145 距离xyz路200米
酒店c 价格160 距离xyz路150米
酒店d 价格170 距离xyz路200米”
如上,模型挑选4个酒店供用户选择。接着,若用户针对对话回复文本回复“第二个”即选择酒店b,则可以调用接口为用户预定酒店b,并向用户反馈对应的酒店预定成功的回复,例如“好的,已经为您预定”。
在一可选实施方式中,如图5所示,上述方法还包括:
S501:在第一接口反馈信息指示第一对话文本对应的目标任务参数值完整的情况下,基于大语言模型输出至少与第一对话文本和第一接口反馈信息对应的对话回复文本。
可选地,将第一对话文本和第一接口反馈信息输入至大语言模型,在确定第一接口反馈信息指示第一对话文本对应的关键实体的目标任务参数值完整的情况下,获取大语言模型的输出作为针对该第一对话文本的对话回复文本。
另一可选地,将第一对话文本、应用程序接口令牌和第一接口反馈信息输入至大语言模型,在确定第一接口反馈信息指示第一对话文本对应的目标任务参数值完整的情况下,获取大语言模型的输出作为针对该第一对话文本的对话回复文本。这里输入至大语言模型的输入数据中,除了包括第一对话文本和第一接口反馈信息之前,还包括应用程序接口令牌,也即将第一对话文本、应用程序接口令牌和第一接口反馈信息一起输入至大语言模型中,如此通过丰富模型的输入数据内容,以提高模型的输出预测的准确性,进而提高参数询问文本的准确性。
为了便于理解,图6示意了本申请实施例提供的一种智能对话处理方法的交互过程图,其包括应用程序接口令牌生成模块,调用应用程序接口模块,接口返回信息模块和生成回复用户的话术模块这四个模块,具体如下:
1.应用程序接口令牌生成模块:
用户与机器人对话时,机器人会自动判断是否是闲聊;
如果判断是闲聊,那么机器人会自动产生对应的闲聊回复。
如果判断是非闲聊,那么机器人会生成应用程序接口令牌,即API Token信息,其格式可以为<API_token(参数1,参数2,…)>。
2 调用应用程序接口模块:
本申请涉及的大语言模型是可以支持众多接口工具,通过将每个接口和应用程序接口令牌进行映射,如:
View_weather →查看天气
View_train_info →查看火车票信息
Calculator →调用计算器
…
以上面的预定酒店为例,通过应用程序接口令牌和工具的映射表,去调用酒店预定的接口来进行酒店的预定。
3. 接口返回信息模块:
通过接口的调用,返回预定的信息,也即通过判断是否存在目标任务参数值缺失,以得到对应的接口反馈信息,其可以包括调用成功的信息,或者调用失败的信息,例如缺失某些目标任务参数等。具体的,若接口返回“时间和酒店名字没有提供”信息,则接口会提示模型哪些参数不全。
4. 生成回复用户的话术模块:
示例性的,可以结合用户的对话文本+应用程序接口令牌+接口反馈信息,最终生成回复用户的话术,例如,在确定接口反馈信息指示对话文本存在关键实体的目标任务参数值缺失的情况下,生成“好的,您要入住的位置和入住的日期是?”的参数询问文本,去引导用户提供酒店和对应的入住日期。又例如,在确定接口反馈信息指示对话文本不存在关键实体的目标任务参数值缺失的情况下,生成“好的,已经为您预定”的对话回复文本。
如图7所示,其为不断调用上述步骤,执行整个酒店的预定流程的智能对话示意图,其中显示的虚线框中内容为生成的任务信息和接口反馈信息,这些信息是不展示给用户的;而实线框中内容为用于展示给用户的参数询问文本或对话回复文本。
应理解,在一些语音交互场景下,参数询问文本或对话回复文本可以转换为语音的形式传递给用户,以实现与用户之间的智能语音对话。
在一可选实施方式中,将第一对话文本输入至经训练的大语言模型包括:
获取推理提示信息;推理提示信息包括预测任务提示文本和执行预测任务的推理样本;推理样本包括输入对话样本信息和生成式任务样本信息;
将第一对话文本和推理提示信息作为输入,输入至经训练的大语言模型。
可选地,获取推理提示信息,该推理提示信息包括预测任务提示文本和执行预测任务的推理样本,推理样本包括输入对话样本信息和生成式任务样本信息。其中,输入对话样本信息是指输入至大语言模型中的模型输入,例如用户的询问对话。生成式任务样本信息是指大语言模型执行当前预测任务所需的生成信息,例如可以包括基于输入对话样本信息生成的样本应用程序接口令牌,该样本应用程序接口令牌是基于输入对话样本信息的目标任务类型和提取的任务参数值所生成的。预测任务提示文本用于提示模型执行的预测任务。例如,若预测任务为“酒店预定”,则该预测任务提示文本可以为“你现在是一个任务型对话机器人,你可以处理应用程序接口令牌生成的问题”。
接着,将第一对话文本和推理提示信息进行拼接,将拼接信息输入至大语言模型,通过大语言模型进行后续的上下文推理。这里通过引入推理提示信息,发挥大语言模型的语境学习能力,降低模型训练所需的样本量,大大提升模型的泛化能力,进一步提高智能对话处理的准确率。
应理解,上述需要输入至大语言模型执行相关任务处理的任一输入步骤,均可以引入类似的推理提示信息一起作为模型输入,例如在通过大语言模型生成对话回复文本任务或生成参数询问文本任务时,这里引入类似的推理提示信息可以包括预测任务提示文本m和执行预测任务的推理样本m,推理样本m包括输入对话样本信息、生成式任务样本信息和模型推理对话样本信息。其中,输入对话样本信息是指输入至大语言模型中的模型输入,例如用户的询问对话。生成式任务样本信息是指大语言模型执行当前预测任务所需的生成信息,例如可以包括基于输入对话样本信息生成的样本任务信息、模型调用接口所反馈的样本接口反馈信息中一种或多种,该样本任务信息是基于输入对话样本信息的目标任务类型和对话样本信息中包含的任务参数值所生成的。模型推理对话样本信息可以是模型基于该输入对话样本信息所反馈的对话回复。预测任务提示文本m用于提示模型执行的预测任务。例如,若预测任务为“酒店预定”,则该预测任务提示文本m可以为“你现在是一个任务型对话机器人,你可以处理任务信息生成的问题”。如此,通过引入推理提示信息,发挥大语言模型的语境学习能力,降低模型训练所需的样本量,大大提升模型的泛化能力,进一步提高智能对话处理的准确率。
上述实施例,通过大语言模型基于第一对话文本识别当前对话的类型,在当前对话的类型为任务对话类型的情况下,基于当前对话的类型所属的目标任务类型和第一对话文本中包含的任务参数值,生成第一对话文本对应的应用程序接口令牌;应用程序接口令牌是基于第一对话文本的目标任务类型和提取的任务参数值所构建的;调用与应用程序接口令牌的目标任务类型对应的目标调用接口,获取目标调用接口针对应用程序接口令牌返回的第一接口反馈信息;在第一接口反馈信息指示第一对话文本存在目标任务参数值缺失的情况下,输出至少与第一对话文本和第一接口反馈信息对应的参数询问文本,参数询问文本用于询问缺失的目标任务参数值。从而无需同时训练三个模型来完成对话任务,通过端到端的大语言模型实现智能对话处理,提高对话回复速率。此外,在用户对话的信息不丰富的情况下,基于对话信息缺失的接口反馈信息,生成对应的参数询问文本,提高回复内容的准确性,同时也提高人机对话的轮次和智能对话的灵活性,避免因信息缺失而导致的智能对话的中断,促进智能对话处理的顺利执行。此外,应用程序接口令牌是基于当前对话的目标任务类型和提取的任务参数值所生成的,避免生成过程中的错误,进一步提高回复内容的准确性。
下述为本申请装置实施例,可以用于执行本申请方法实施例中的步骤。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
图8是本申请实施例提供的一种智能对话处理装置的结构框图。该智能对话处理装置具有实现上述方法示例中的功能,功能可以由硬件实现,也可以由硬件执行相应的软件实现。参见图8所示,智能对话处理装置可以包括:
第一获取模块810,用于获取第一对话文本;
第一处理模块820,用于将所述第一对话文本输入至经训练的大语言模型,通过所述大语言模型基于所述第一对话文本识别当前对话的类型;
第二处理模块830,用于在所述当前对话的类型为任务对话类型的情况下,基于所述当前对话的类型所属的目标任务类型和所述第一对话文本中包含的任务参数值,生成所述第一对话文本对应的应用程序接口令牌;
第三处理模块840,用于调用与所述目标任务类型对应的目标调用接口,获取所述目标调用接口针对所述应用程序接口令牌返回的第一接口反馈信息;
第四处理模块850,用于在所述第一接口反馈信息指示所述第一对话文本存在目标任务参数值缺失的情况下,输出至少与所述第一对话文本和所述第一接口反馈信息对应的参数询问文本,所述参数询问文本用于询问缺失的目标任务参数值。
在一可选实施方式中,所述装置还包括:
第二获取模块,用于获得基于所述参数询问文本输入的第二对话文本;
第四处理模块,用于将所述第二对话文本输入至所述大语言模型,将所述第二对话文本中新增任务参数值添加至所述应用程序接口令牌中,生成更新的应用程序接口令牌;
第五处理模块,用于获取所述目标调用接口针对所述更新的应用程序接口令牌返回的第二接口反馈信息;
第六处理模块,用于在所述第二接口反馈信息指示当前对话对应的目标任务参数值完整的情况下,输出至少与所述第一对话文本、所述第二对话文本和所述第二接口反馈信息对应的对话回复文本。
在一可选实施方式中,所述装置还包括:
第七处理模块,用于在所述第一接口反馈信息指示所述第一对话文本对应的目标任务参数值完整的情况下,基于所述大语言模型输出至少与所述第一对话文本和所述第一接口反馈信息对应的对话回复文本。
在一可选实施方式中,所述第一处理模块具体用于:
基于所述当前对话的类型所属的目标任务类型确定任务函数名;
从所述第一对话文本中提取与所述任务函数名相关的任务参数值;
基于所述任务函数名和所述任务参数值,生成所述应用程序接口令牌。
在一可选实施方式中,在所述任务参数值包括第一数量个实体参数和对应的参数值;所述第一处理模块还具体用于:
基于所述任务函数名和和与所述任务函数名相关的第二数量个实体参数,构造任务函数;所述第二数量大于或等于所述第一数量,所述第二数量个实体参数至少包括所述任务参数值对应的各实体参数;
将所述任务参数值填充至所述任务函数中各自对应的实体参数所在的槽位,生成所述应用程序接口令牌。
在一可选实施方式中,所述第四处理模块具体用于:
提取所述第二对话文本中与所述目标任务类型相关新增任务参数值;
将所述新增任务参数值添加至所述应用程序接口令牌中,生成所述更新的应用程序接口令牌。
在一可选实施方式中,所述第二处理模块具体用于:
获取任务类型与调用接口的映射关系;
基于所述映射关系,查询与所述应用程序接口令牌的目标任务类型对应的目标调用接口;不同的调用接口适配执行不同的任务类型;
调用所述目标调用接口。
在一可选实施方式中,所述第三处理模块具体用于:
将所述第一对话文本、所述应用程序接口令牌和所述第一接口反馈信息输入至所述大语言模型;
在确定所述第一接口反馈信息指示所述第一对话文本存在目标任务参数值缺失的情况下,获得所述大语言模型的输出作为所述参数询问文本。
在一可选实施方式中,所述第一处理模块具体用于:
获取推理提示信息;所述推理提示信息包括预测任务提示文本和执行预测任务的推理样本;所述推理样本包括输入对话样本信息和生成式任务样本信息;
将所述第一对话文本和所述推理提示信息作为输入,输入至经训练的大语言模型。
在一可选实施方式中,所述装置还包括:
第八处理模块,用于在识别所述第一对话文本为闲聊对话类型,获得所述大语言模型的输出作为对话回复文本。
需要说明的是:上述实施例提供的智能对话处理装置在执行过程时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。此外,上述实施例提供的智能对话处理装置与智能对话处理方法实施例属于同一构思,未在上述装置实施例中详尽描述的技术细节,可参见本申请任意实施例所提供的方法,在此不再赘述。
本申请实施例提供了一种电子设备,该设备可以包括处理器和存储器,该存储器中存储有至少一条指令、至少一段程序、代码集或指令集,该至少一条指令、该至少一段程序、该代码集或指令集由该处理器加载并执行以实现如上述方法实施例任一所述的方法。
进一步地,图9是提供的一种用于实现本申请实施例所提供的方法的电子设备的硬件结构示意图。参照图9,电子设备包括处理器;用于存储处理器可执行指令的存储器;其中,处理器被配置为执行存储器上所存放的指令时,实现上述实施例中任一方法的步骤。
该电子设备可以终端、服务器或者类似的运算装置,以该电子设备是服务器为例,图9是根据一示例性实施例示出的一种用于智能对话处理的电子设备的框图,该电子设备1000可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(Central Processing Units,CPU)1010(处理器1010可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器1030,一个或一个以上存储应用程序1023或数据1022的存储介质1020(例如一个或一个以上海量存储设备)。其中,存储器1030和存储介质1020可以是短暂存储或持久存储。存储在存储介质1020的程序可以包括一个或一个以上模块,每个模块可以包括对电子设备中的一系列指令操作。更进一步地,中央处理器1010可以设置为与存储介质1020通信,在电子设备1000上执行存储介质1020中的一系列指令操作。
电子设备1000还可以包括一个或一个以上电源1060,一个或一个以上有线或无线网络接口1050,一个或一个以上输入输出接口1040,和/或,一个或一个以上操作系统1021,例如Windows Server,Mac OS X,Unix, Linux,FreeBSD等等。
输入输出接口1040可以用于经由一个网络接收或者发送数据。上述的网络具体实例可包括电子设备1000的通信供应商提供的无线网络。在一个实例中,输入输出接口1040包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个示例性实施例中,输入输出接口1040可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
本领域普通技术人员可以理解,图9所示的结构仅为示意,其并不对上述电子设备的结构造成限定。例如,电子设备1000还可包括比图9中所示更多或者更少的组件,或者具有与图9所示不同的配置。
本申请实施例还提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现上述任一所述的方法。例如,存储介质包括指令的存储器,上述指令可由电子设备1000的处理器执行以完成上述方法。可选地,计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述任一所述的方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是:上述本申请实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置和电子设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (13)
1.一种智能对话处理方法,其特征在于,包括:
获取第一对话文本;
将所述第一对话文本输入至经训练的大语言模型,通过所述大语言模型基于所述第一对话文本识别当前对话的类型;
在所述当前对话的类型为任务对话类型的情况下,基于所述当前对话的类型所属的目标任务类型和所述第一对话文本中包含的任务参数值,生成所述第一对话文本对应的应用程序接口令牌;
调用与所述目标任务类型对应的目标调用接口,获取所述目标调用接口针对所述应用程序接口令牌返回的第一接口反馈信息;
在所述第一接口反馈信息指示所述第一对话文本存在目标任务参数值缺失的情况下,输出至少与所述第一对话文本和所述第一接口反馈信息对应的参数询问文本,所述参数询问文本用于询问缺失的目标任务参数值。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获得基于所述参数询问文本输入的第二对话文本;
将所述第二对话文本输入至所述大语言模型,将所述第二对话文本中新增任务参数值添加至所述应用程序接口令牌中,生成更新的应用程序接口令牌;
获取所述目标调用接口针对所述更新的应用程序接口令牌返回的第二接口反馈信息;
在所述第二接口反馈信息指示当前对话对应的目标任务参数值完整的情况下,输出至少与所述第一对话文本、所述第二对话文本和所述第二接口反馈信息对应的对话回复文本。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述第一接口反馈信息指示所述第一对话文本对应的目标任务参数值完整的情况下,基于所述大语言模型输出至少与所述第一对话文本和所述第一接口反馈信息对应的对话回复文本。
4.根据权利要求1-3任一所述的方法,其特征在于,所述基于所述当前对话的类型所属的目标任务类型和所述第一对话文本中包含的任务参数值,生成所述第一对话文本对应的应用程序接口令牌包括:
基于所述当前对话的类型所属的目标任务类型确定任务函数名;
从所述第一对话文本中提取与所述任务函数名相关的任务参数值;
基于所述任务函数名和所述任务参数值,生成所述应用程序接口令牌。
5.根据权利要求4所述的方法,其特征在于,在所述任务参数值包括第一数量个实体参数对应的参数值;
所述基于所述任务函数名和所述任务参数值,生成所述应用程序接口令牌包括:
基于所述任务函数名和与所述任务函数名相关的第二数量个实体参数,构造任务函数;所述第二数量大于或等于所述第一数量,所述第二数量个实体参数至少包括所述任务参数值对应的各实体参数;
将所述任务参数值填充至所述任务函数中各自对应的实体参数所在的槽位,生成所述应用程序接口令牌。
6.根据权利要求2所述的方法,其特征在于,所述将所述第二对话文本中新增任务参数值添加至所述应用程序接口令牌中,生成更新的应用程序接口令牌包括:
提取所述第二对话文本中与所述目标任务类型相关的新增任务参数值;
将所述新增任务参数值添加至所述应用程序接口令牌中,生成所述更新的应用程序接口令牌。
7.根据权利要求1-3任一所述的方法,其特征在于,所述调用与所述目标任务类型对应的目标调用接口包括:
获取任务类型与调用接口的映射关系;
基于所述映射关系,查询与所述应用程序接口令牌的目标任务类型对应的目标调用接口;不同的调用接口适配执行不同的任务类型;
调用所述目标调用接口。
8.根据权利要求1-3任一所述的方法,其特征在于,所述在所述第一接口反馈信息指示所述第一对话文本存在目标任务参数值缺失的情况下,输出至少与所述第一对话文本和所述第一接口反馈信息对应的参数询问文本包括:
将所述第一对话文本、所述应用程序接口令牌和所述第一接口反馈信息输入至所述大语言模型;
在确定所述第一接口反馈信息指示所述第一对话文本存在目标任务参数值缺失的情况下,获得所述大语言模型的输出作为所述参数询问文本。
9.根据权利要求1-3任一所述的方法,其特征在于,所述将所述第一对话文本输入至经训练的大语言模型包括:
获取推理提示信息;所述推理提示信息包括预测任务提示文本和执行预测任务的推理样本;所述推理样本包括输入对话样本信息和生成式任务样本信息;
将所述第一对话文本和所述推理提示信息作为输入,输入至经训练的大语言模型。
10.根据权利要求1-3任一所述的方法,其特征在于,所述将所述第一对话文本输入至经训练的大语言模型之后,所述方法还包括:
在识别所述第一对话文本为闲聊对话类型,获得所述大语言模型的输出作为对话回复文本。
11.一种智能对话处理装置,其特征在于,所述装置包括:
第一获取模块,用于获取第一对话文本;
第一处理模块,用于将所述第一对话文本输入至经训练的大语言模型,通过所述大语言模型基于所述第一对话文本识别当前对话的类型;
第二处理模块,用于在所述当前对话的类型为任务对话类型的情况下,基于所述当前对话的类型所属的目标任务类型和所述第一对话文本中包含的任务参数值,生成所述第一对话文本对应的应用程序接口令牌;
第三处理模块,用于调用与所述目标任务类型对应的目标调用接口,获取所述目标调用接口针对所述应用程序接口令牌返回的第一接口反馈信息;
第四处理模块,用于在所述第一接口反馈信息指示所述第一对话文本存在目标任务参数值缺失的情况下,输出至少与所述第一对话文本和所述第一接口反馈信息对应的参数询问文本,所述参数询问文本用于询问缺失的目标任务参数值。
12.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如权利要求1-10任一项所述的智能对话处理方法。
13.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如权利要求1-10任一项所述的智能对话处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311003972.1A CN116737910B (zh) | 2023-08-10 | 2023-08-10 | 智能对话处理方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311003972.1A CN116737910B (zh) | 2023-08-10 | 2023-08-10 | 智能对话处理方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116737910A true CN116737910A (zh) | 2023-09-12 |
CN116737910B CN116737910B (zh) | 2024-03-29 |
Family
ID=87915425
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311003972.1A Active CN116737910B (zh) | 2023-08-10 | 2023-08-10 | 智能对话处理方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116737910B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117556864A (zh) * | 2024-01-12 | 2024-02-13 | 阿里云计算有限公司 | 信息处理方法、电子设备及存储介质 |
CN117708337A (zh) * | 2024-02-05 | 2024-03-15 | 杭州杰竞科技有限公司 | 一种面向复杂定域的人机交互方法和系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018149326A1 (zh) * | 2017-02-16 | 2018-08-23 | 阿里巴巴集团控股有限公司 | 一种自然语言问句答案的生成方法、装置及服务器 |
CN109815321A (zh) * | 2018-12-26 | 2019-05-28 | 出门问问信息科技有限公司 | 问答方法、装置、设备及存储介质 |
US20190213244A1 (en) * | 2018-01-09 | 2019-07-11 | International Business Machines Corporation | Interpreting conversational authoring of information models |
CN111680148A (zh) * | 2020-08-14 | 2020-09-18 | 支付宝(杭州)信息技术有限公司 | 针对用户问句进行智能应答的方法和装置 |
CN112328776A (zh) * | 2021-01-04 | 2021-02-05 | 北京百度网讯科技有限公司 | 对话生成方法、装置、电子设备和存储介质 |
US20230084583A1 (en) * | 2020-05-20 | 2023-03-16 | Huawei Technologies Co., Ltd. | Response method in human-computer dialogue, dialogue system, and storage medium |
CN116521841A (zh) * | 2023-04-18 | 2023-08-01 | 百度在线网络技术(北京)有限公司 | 用于生成回复信息的方法、装置、设备及介质 |
-
2023
- 2023-08-10 CN CN202311003972.1A patent/CN116737910B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018149326A1 (zh) * | 2017-02-16 | 2018-08-23 | 阿里巴巴集团控股有限公司 | 一种自然语言问句答案的生成方法、装置及服务器 |
US20190213244A1 (en) * | 2018-01-09 | 2019-07-11 | International Business Machines Corporation | Interpreting conversational authoring of information models |
CN109815321A (zh) * | 2018-12-26 | 2019-05-28 | 出门问问信息科技有限公司 | 问答方法、装置、设备及存储介质 |
US20230084583A1 (en) * | 2020-05-20 | 2023-03-16 | Huawei Technologies Co., Ltd. | Response method in human-computer dialogue, dialogue system, and storage medium |
CN111680148A (zh) * | 2020-08-14 | 2020-09-18 | 支付宝(杭州)信息技术有限公司 | 针对用户问句进行智能应答的方法和装置 |
CN112328776A (zh) * | 2021-01-04 | 2021-02-05 | 北京百度网讯科技有限公司 | 对话生成方法、装置、电子设备和存储介质 |
CN116521841A (zh) * | 2023-04-18 | 2023-08-01 | 百度在线网络技术(北京)有限公司 | 用于生成回复信息的方法、装置、设备及介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117556864A (zh) * | 2024-01-12 | 2024-02-13 | 阿里云计算有限公司 | 信息处理方法、电子设备及存储介质 |
CN117556864B (zh) * | 2024-01-12 | 2024-04-16 | 阿里云计算有限公司 | 信息处理方法、电子设备及存储介质 |
CN117708337A (zh) * | 2024-02-05 | 2024-03-15 | 杭州杰竞科技有限公司 | 一种面向复杂定域的人机交互方法和系统 |
CN117708337B (zh) * | 2024-02-05 | 2024-04-26 | 杭州杰竞科技有限公司 | 一种面向复杂定域的人机交互方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116737910B (zh) | 2024-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116737910B (zh) | 智能对话处理方法、装置、设备及存储介质 | |
CN112106056A (zh) | 构造虚构的话语树来提高回答聚敛性问题的能力 | |
WO2021109690A1 (zh) | 多类型问题智能问答方法、系统、设备及可读存储介质 | |
CN110807566A (zh) | 人工智能模型评测方法、装置、设备及存储介质 | |
CN110597992A (zh) | 基于知识图谱的语义推理方法及装置、电子设备 | |
CN110727761B (zh) | 对象信息获取方法、装置及电子设备 | |
WO2020073533A1 (zh) | 自动问答方法及装置 | |
EP4113357A1 (en) | Method and apparatus for recognizing entity, electronic device and storage medium | |
CN114281957A (zh) | 自然语言数据查询方法、装置、电子设备及存储介质 | |
CN116541493A (zh) | 基于意图识别的交互应答方法、装置、设备、存储介质 | |
CN112836521A (zh) | 问答匹配方法、装置、计算机设备及存储介质 | |
CN116737908A (zh) | 知识问答方法、装置、设备和存储介质 | |
CN112199486A (zh) | 一种办公场景的任务型多轮对话方法及系统 | |
CN112784024B (zh) | 一种人机对话的方法、装置、设备以及存储介质 | |
Haqimi et al. | Timeline reminder system bot and telegram assistant chatbot for a university student and lecturer | |
CN114020886A (zh) | 语音意图识别方法、装置、设备及存储介质 | |
CN111931503A (zh) | 信息抽取方法及装置、设备、计算机可读存储介质 | |
CN112749556B (zh) | 多语言模型的训练方法和装置、存储介质和电子设备 | |
CN115238945A (zh) | 行程指引生成方法、装置、设备及存储介质 | |
CN111914077A (zh) | 定制化话术推荐方法、装置、计算机设备及存储介质 | |
CN111723188A (zh) | 用于问答系统的基于人工智能的语句显示方法、电子设备 | |
CN112149426A (zh) | 阅读任务处理方法及相关设备 | |
Huang | Optimization and simulation of an English-assisted reading system based on wireless sensor networks | |
CN109885647A (zh) | 用户履历验证方法、装置、电子设备及存储介质 | |
CN116561288B (zh) | 事件查询方法、装置、计算机设备、存储介质及程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |