CN116700839B - 一种任务处理方法、装置、设备、存储介质及程序产品 - Google Patents

一种任务处理方法、装置、设备、存储介质及程序产品 Download PDF

Info

Publication number
CN116700839B
CN116700839B CN202310950974.5A CN202310950974A CN116700839B CN 116700839 B CN116700839 B CN 116700839B CN 202310950974 A CN202310950974 A CN 202310950974A CN 116700839 B CN116700839 B CN 116700839B
Authority
CN
China
Prior art keywords
task
target
processing
target task
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310950974.5A
Other languages
English (en)
Other versions
CN116700839A (zh
Inventor
刘刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202310950974.5A priority Critical patent/CN116700839B/zh
Publication of CN116700839A publication Critical patent/CN116700839A/zh
Application granted granted Critical
Publication of CN116700839B publication Critical patent/CN116700839B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/448Execution paradigms, e.g. implementations of programming paradigms
    • G06F9/4482Procedural
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Stored Programmes (AREA)

Abstract

本申请提供了一种任务处理方法、装置、设备、存储介质及程序产品;本申请实施例可以应用于人工智能、大数据、云计算等的任务处理场景中;该方法包括:依据业务场景中的目标任务所对应任务提示信息,生成目标任务所对应的系统交互参数;其中,任务提示信息用于以自然语言的形式对目标任务进行描述,系统交互参数用于以机器指令的形式对目标任务进行描述;调用目标任务的任务系统,并通过目标任务的任务系统对系统交互参数进行处理;基于目标任务的任务系统对于系统交互参数的输出信息,确定目标任务所对应的处理结果。通过本申请,能够提升任务处理的效率,并降低任务处理的难度。

Description

一种任务处理方法、装置、设备、存储介质及程序产品
技术领域
本申请涉及人工智能技术,尤其涉及一种任务处理方法、装置、设备、存储介质及程序产品。
背景技术
随着移动互联网的快速发展,各类社交应用平台细分了非常多的业务场景,例如社交交友场景、兴趣扩展场景、内容推广场景等。每个业务场景均会涉及到大量的信息,每个业务场景中均需要对信息进行一定的业务处理。
相关技术中,对于不同业务场景中的具体任务,通常需要专门进行代码开发,调用图神经网络处理的接口,以进行相应的处理。然而,代码开发需要一定的时间才能完成,效率较低,若针对业务场景采用代码开发的方式以实现相应的任务处理,不仅会影响任务处理的效率,还会加大任务处理的操作难度。
发明内容
本申请实施例提供一种任务处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够提升任务处理的效率,并降低任务处理的难度。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种任务处理方法,包括:
依据业务场景中的目标任务所对应任务提示信息,生成所述目标任务所对应的系统交互参数;
其中,所述任务提示信息用于以自然语言的形式对所述目标任务进行描述,所述系统交互参数用于以机器指令的形式对所述目标任务进行描述;
调用所述目标任务的任务系统,并通过所述目标任务的任务系统对所述系统交互参数进行处理;
基于所述目标任务的任务系统对于所述系统交互参数的输出信息,确定所述目标任务所对应的处理结果。
本申请实施例提供一种任务处理装置,包括:
参数生成模块,用于依据业务场景中的目标任务所对应任务提示信息,生成所述目标任务所对应的系统交互参数;其中,所述任务提示信息用于以自然语言的形式对所述目标任务进行描述,所述系统交互参数用于以机器指令的形式对所述目标任务进行描述;
参数处理模块,用于调用所述目标任务的任务系统,并通过所述目标任务的任务系统对所述系统交互参数进行处理;
结果确定模块,用于基于所述目标任务的任务系统对于所述系统交互参数的输出信息,确定所述目标任务所对应的处理结果。
在本申请的一些实施例中,所述参数生成模块,还用于通过自然语言处理模型,对所述任务提示信息进行语义解析,得到解析结果;其中,所述自然语言处理模型的参数数量大于数量阈值;针对所述解析结果进行参数生成,得到所述目标任务所对应的所述系统交互参数。
在本申请的一些实施例中,所述输出信息包括:多个子输出信息;所述结果确定模块,还用于通过评价模型,针对每个所述子输出信息生成评价信息;依据所述评价信息,对多个所述子输出信息进行筛选,并基于筛选出的子输出信息,确定所述目标任务所对应的处理结果。
在本申请的一些实施例中,所述任务处理装置还包括:模型生成模块,用于依据所述业务场景中的训练任务所对应的训练提示信息,生成所述训练任务所对应的训练交互参数;调用所述训练任务的任务系统,并通过所述训练任务的任务系统对所述训练交互参数进行处理;基于所述训练任务的任务系统对于所述训练交互参数的多个子训练输出信息,确定所述训练任务所对应的多个训练处理结果;利用多个所述训练处理结果的多个基准打分信息,以及初始模型针对所述多个训练处理结果所生成的多个训练打分信息,对所述初始模型进行参数调整,直至训练结束时,得到所述评价模型。
在本申请的一些实施例中,所述结果确定模块,还用于通过自然语言处理模型,为所述目标任务的任务系统对于所述系统交互参数的输出信息,生成匹配文本;其中,所述匹配文本用于以自然语言的形式对所述输出信息进行描述;将所述匹配文本确定为所述目标任务所对应的所述处理结果。
在本申请的一些实施例中,所述任务处理装置还包括:提示确定模块,用于获取针对所述业务场景中的所述目标任务所输入的自然语言信息;基于所述自然语言信息,确定所述业务场景中的所述目标任务所对应的所述任务提示信息。
在本申请的一些实施例中,所述提示确定模块,还用于依据所述业务场景中的所述目标任务的任务定义,生成任务定义提示;从所述业务场景的场景数据中,提取得到所述目标任务的任务输入数据,并依据所述任务输入数据生成所述目标任务的任务输入提示;将所述任务定义提示和所述任务输入提示的整合结果,确定为所述任务提示信息。
在本申请的一些实施例中,所述提示确定模块,还用于针对所述业务场景中的所述目标任务的任务定义,在指示模板库中进行匹配,并将匹配到的指示确定为任务定义指示,完成所述任务定义指示的生成。
在本申请的一些实施例中,所述提示确定模块,还用于基于所述目标任务的预设回复样式,生成所述目标任务的任务输出提示;其中,所述预设回复样式用于对所述目标任务的处理结果的样式进行约束;将所述任务定义提示、所述任务输入提示和所述任务输出提示的整合结果,确定为所述任务提示信息。
在本申请的一些实施例中,所述结果确定模块,还用于基于所述目标任务的任务系统对于所述系统交互参数的输出信息,以及所述任务提示信息中的所述任务输出提示,确定所述目标任务所对应的所述处理结果。
在本申请的一些实施例中,所述结果确定模块,还用于利用所述目标任务的任务系统对于所述系统交互参数的输出信息,将所述任务输出提示中的掩码部分进行补全,并将补全后的任务输出提示确定为所述目标任务所对应的所述处理结果。
本申请实施例提供一种电子设备,包括:
存储器,用于存储计算机可执行指令;
处理器,用于执行所述存储器中存储的计算机可执行指令时,实现本申请实施例提供的任务处理方法。
本申请实施例提供一种计算机可读存储介质,存储有计算机可执行指令,用于引起处理器执行时,实现本申请实施例提供的任务处理方法。
本申请实施例提供一种计算机程序产品,包括计算机程序或计算机可执行指令,所述计算机程序或计算机可执行指令被处理器执行时实现本申请实施例提供的任务处理方法。
本申请实施例具有以下有益效果:电子设备会先针对以自然语言的形式存在的目标任务的任务提示信息,生成以机器指令的形式存在的系统交互参数,即将人类可以理解的任务提示信息,转换为机器可理解的参数指令,然后调用目标任务的任务系统,通过任务系统读入系统交互参数并进行相应的处理,最后再基于任务系统针对系统交互参数的输出信息,为目标任务生成处理结果,从而完成目标任务的任务处理。如此,仅基于自然语言的指令,就能够触发并完成对目标任务的任务处理,而无需针对目标任务进行代码开发,不仅节省了代码开发所需要的时间,更快速地开始对目标任务进行任务处理,提升了任务处理的效率,而且相比于代码,自然语言的指令更加容易生成和使用,从而还能够降低任务处理的操作难度。
附图说明
图1是本申请实施例提供的任务处理系统的架构示意图;
图2是本申请实施例提供的图1中的服务器的结构示意图;
图3是本申请实施例提供的任务处理方法的流程示意图一;
图4是本申请实施例提供的任务处理方法的流程示意图二;
图5是本申请实施例提供的任务处理方法的流程示意图三;
图6是本申请实施例提供的任务处理方法的流程示意图四;
图7是本申请实施例提供的社交关系和兴趣点进行扩展的系统架构示意图;
图8是本申请实施例提供的大型语言预训练模型和社交关系系统模型的协同工作示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
对本申请实施例进行进一步详细说明之前,对本申请实施例中涉及的名词和术语进行说明,本申请实施例中涉及的名词和术语适用于如下的解释。
1)人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生成出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
2)自然语言处理(Nature Language Processing,NLP)是计算机科学领域与人工智能领域中的重要方向。其研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理涉及自然语言,即人们日常使用的语言,与语言学研究密切。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
3)机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法度复杂度理论等多门学科。机器学习专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或既能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。预训练模型是深度学习的最新发展成果,融合了以上技术。
4)大语言模型(Large Language Model,LLM)是指能够处理和生成自然语言的计算机模型,预训练模型,即是从NLP领域的LLM发展而来。经过微调,LLM可以广泛应用于下游任务。LLM可以通过学习语言数据的统计规律和语义信息来预测下一个单词或句子,随着输入数据集与参数空间的不断扩大,LLM的能力也会相应提高。
5)指令微调(Instruction Tuning),是指针对每个任务,单独生成指令,通过在若干个任务上进行full-shot微调(即对预训练模型的所有参数均进行微调),然后在具体的任务上评估泛化性能。其中,预训练模型的参数是在公开的大量NLP任务数据集上训练得到的,用于激发模型的理解能力。通过给出更明显的指令,可以使模型理解并作出正确的反馈。
6)提示学习(Prompt Tuning),是指在不显著改变预训练模型的结构和参数的情况下,以“提示信息”进行信息增强,从而大幅改善模型的效果。提示学习可以看作是一种对任务的指令,同时也是一种对预训练目标的复用,其本质可以看作是参数有效性训练的增强,通过单独生成提示模板,并在每个人物上进行full-shot微调与评估。
7)人类反馈强化学习(Reinforcement Learning with Human Feedback)是强化学习的一个扩展,其将人类的反馈纳入训练过程,为机器提供一种自然的,人性化的互动学习过程。除了奖励信号外,RLHF代理会从人类得到反馈,以更广泛的视角和更高效的效率学习知识,该过程与人类从另一个人类的专业知识中学习的方式较为相似。
通过在代理和人类之间架起桥梁,RLHF允许人类直接指导机器,并允许机器掌握明显嵌入人类经验中的决策要素,作为一种有效的对齐技术,RLHF能够在一定程度上帮助减轻LLM产生有害内容并提高信息完整性。
8)推荐内容,是指推荐给用户阅读的内容,可以包含图文、图片或者短视频。其中,图文可以由创作者主动编辑发布,而短视频则可以由PGC或UGC内容生产者提供。推荐内容最终会基于用户的兴趣点,以Feeds流(信息流)的形式提供给用户。
9)专业生成内容(Professional Generated Content,PGC),是指由专业的机构或组织所生产的内容。
10)用户生成内容(User Generated Content,UGC),是指由用户原创的内容。
11)社交分发,是指通过社交媒体平台、社交应用或者其他社交网络向用户推荐内容。通过这种方式,可以将信息流推荐给用户的朋友、关注者或群组,以使信息流获得更多的曝光率和可见度。社交分发可以根据用户的兴趣、行为和社交关系等因素实现,也可以通过用户自主分享来实现。
随着移动互联网的快速发展,各类社交应用平台细分了非常多的业务场景,例如社交交友场景、兴趣扩展场景、内容推广场景等。每个业务场景均会涉及到大量的信息,每个业务场景中均需要对信息进行一定的业务处理,例如,社交交友场景中的好友推荐任务,需要为用户确定其可能认识的人、好友感兴趣的人等信息,兴趣扩展场景中的信息推荐任务,需要从海量短视频、图文信息中,筛选出用户可能会感兴趣的信息以推荐给用户,内容推广场景中的定向投放任务,需要为等待推广的内容确定合适的投放用户等。
相关技术中,在针对业务场景中的信息进行任务处理时,通常是获取到不同业务场景的数据(例如用户的兴趣标签、信息的内容标签等)之后,先分业务场景进行处理,然后通过构造图网络,以整合不同业务场景的数据,并采用图神经网络(Graph NeuralNetworks,GNN)的算法,例如邻居采样算法、聚合算法、更新算法等,从图网络中提取得到用户的兴趣和社交关系的特征表示,并将该特征输入到不同业务场景所对应的应用层的算法模型中,例如推荐系统的召回模型、搜索系统的特征匹配模型中,以进行后续处理。例如,依据特征表示召回用户可能感兴趣的短视频,或者是依据特征表示针对某个推广信息确定定向推送的用户等等。
可见,相关技术中,对于不同业务场景中的具体任务,通常需要专门进行代码开发,以调用图神经网络处理的接口,以进行相应的处理。然而,代码开发需要一定的时间才能完成,效率较低,若针对业务场景采用代码开发的方式以实现相应的任务处理,不仅会影响任务处理的效率,还会加大任务处理的操作难度。
进一步的,不同的任务所需要处理的数据可能会存在不同,例如一些任务需要对用户的兴趣数据进行处理,而另一些任务则需要对用户的社交关系数据进行处理,另外针对数据的处理方式也可能会存在不同,例如一些任务需要求取邻居节点,而另一些任务则需要求取向量表征。可见,不同的任务涉及到的业务场景、数据进行均可能不同,若是将不同的业务场景、不同的数据进行组合,所得到组合的数量会十分繁多,而针对每个组合单独进行代码开发是不现实的,从而会导致一些任务难以被正常处理。
另外,不同业务场景中的同一数据的含义可能并不相同,例如,在游戏论坛场景中,精华是指质量优良的论坛帖子,而在内容推广场景中,精华可能就指的是护肤品;在游戏论坛场景中,钻石指的是游戏段位,而在兴趣扩展场景中,钻石为一种宝石类型。由此可见,将不同的业务场景中的同一数据的含义之间存在差距,而通过构造图网络整合不同业务场景的数据,无法消除不同业务场景的数据之间的语义鸿沟,使得任务处理的准确率降低。
最后,从图网络中提取到的特征表征是隐式的向量表征,缺乏直观的语义特征,通过将从图网络中提取得到的特征表征不便于直接在一些任务中使用(这是因为其没有人类所能理解的语义特征,无法直接应用于需要向人类展示和描述的任务),从而使得针对业务场景中的数据所能进行的任务处理的种类较少。
本申请实施例提供一种任务处理方法、装置、电子设备、计算机可读存储介质和计算机程序产品,能够提升任务处理的效率,并降低任务处理的难度。下面说明本申请实施例提供的电子设备的示例性应用,本申请实施例提供的电子设备可以实施为笔记本电脑,平板电脑,台式计算机,机顶盒,移动设备(例如,移动电话,便携式音乐播放器,个人数字助理,专用消息设备,便携式游戏设备)等各种类型的终端,也可以实施为服务器。下面,将说明电子设备实施为服务器时的示例性应用。
参见图1,图1是本申请实施例提供的任务处理系统的架构示意图,为实现支撑一个任务处理应用,在任务处理系统100中,终端(示例性示出了终端400-1和终端400-2)通过网络300连接服务器200,网络300可以是广域网或者局域网,又或者是二者的组合。任务处理系统100还设置有数据库500,用于向服务器200提供数据支持,其中,数据库500可以独立于服务器200,也可以配置在服务器200中。图1示出的是数据库500独立于服务器200的情况。
终端400-1和终端400-2用于分别响应于运营人员在图形界面410-1和图形界面410-2上显示的信息输入界面上的输入操作,获取的输入信息,并通过网络300将输入信息传输给服务器200。
服务器200用于从输入信息中,针对业务场景中的目标任务,确定对应的任务提示信息,依据业务场中的目标任务所对应的任务提示信息,生成目标任务所对应的系统交互参数;其中,任务提示信息用于以自然语言的形式对目标任务进行描述,系统交互参数用于以机器指令的形式对目标任务进行描述;调用目标任务的任务系统,并通过目标任务的任务系统对系统交互参数进行处理;基于目标任务的任务系统对于系统交互参数的输出信息,确定目标任务所对应的处理结果,并通过网络300将处理结果返回给终端400-1和终端400-2。
终端400-1和终端400-2还分别用于在图形界面410-1和图形界面410-2上显示处理结果。
本申请实施例可以借助于云技术(Cloud Technology)实现,云技术是指在广域网内或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、存储、处理和共享的一种托管技术。
云计算是基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台、以及应用技术等的总称,可以组成资源池,按需所用,灵活便利。云计算技术将变成重要支撑。技术网络的系统后台服务需要大量的计算和存储资源,需要通过云计算实现。
示例性的,服务器200可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端400-1和终端400-2可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能家电、车载终端等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请实施例中不做限制。
参见图2,图2是本申请实施例提供的图1中的服务器(电子设备的一种实施)的结构示意图,图2所示的服务器200包括:至少一个处理器210、存储器250、至少一个网络接口220和用户接口230。服务器200中的各个组件通过总线系统240耦合在一起。可理解,总线系统240用于实现这些组件之间的连接通信。总线系统240除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2中将各种总线都标为总线系统240。
处理器210可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
用户接口230包括使得能够呈现媒体内容的一个或多个输出装置231,包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口230还包括一个或多个输入装置232,包括有助于用户输入的用户接口部件,比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。
存储器250可以是可移除的,不可移除的或其组合。示例性的硬件设备包括固态存储器,硬盘驱动器,光盘驱动器等。存储器250可选地包括在物理位置上远离处理器210的一个或多个存储设备。
存储器250包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM,Read Only Memory),易失性存储器可以是随机存取存储器(RAM,Random Access Memory)。本申请实施例描述的存储器250旨在包括任意适合类型的存储器。
在一些实施例中,存储器250能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
操作系统251,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;
网络通信模块252,用于经由一个或多个(有线或无线)网络接口220到达其他计算设备,示例性的网络接口220包括:蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB,Universal Serial Bus)等;
呈现模块253,用于经由一个或多个与用户接口230相关联的输出装置231(例如,显示屏、扬声器等)使得能够呈现信息(例如,用于操作外围设备和显示内容和信息的用户接口);
输入处理模块254,用于对一个或多个来自一个或多个输入装置232之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。
在一些实施例中,本申请实施例提供的任务处理装置可以采用软件方式实现,图2示出了存储在存储器250中的任务处理装置255,其可以是程序和插件等形式的软件,包括以下软件模块:参数生成模块2551、参数处理模块2552、结果确定模块2553、模型生成模块2554和提示确定模块2555,这些模块是逻辑上的,因此根据所实现的功能可以进行任意的组合或进一步拆分。将在下文中说明各个模块的功能。
在另一些实施例中,本申请实施例提供的任务处理装置可以采用硬件方式实现,作为示例,本申请实施例提供的任务处理装置可以是采用硬件译码处理器形式的处理器,其被编程以执行本申请实施例提供的任务处理方法,例如,硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC,Application Specific IntegratedCircuit)、DSP、可编程逻辑器件(PLD,Programmable Logic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable Logic Device)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)或其他电子元件。
在一些实施例中,终端或服务器(均为电子设备可能的实施)可以通过运行计算机程序来实现本申请实施例提供的任务处理方法。举例来说,计算机程序可以是操作系统中的原生程序或软件模块;可以是本地(Native)应用程序(APP,Application),即需要在操作系统中安装才能运行的程序,如即时通信APP;也可以是小程序,即只需要下载到浏览器环境中就可以运行的程序;还可以是能够嵌入至任意APP中的小程序。总而言之,上述计算机程序可以是任意形式的应用程序、模块或插件。
本申请实施例可以应用于人工智能、大数据、云计算等的任务处理场景中。下面,说明本申请实施例提供的任务处理方法,如前所述,实现本申请实施例的任务处理方法的电子设备可以实施为终端、服务器、又或者是二者的结合。因此,在下文中不再重复说明各个步骤的执行主体。
参见图3,图3是本申请实施例提供的任务处理方法的流程示意图一,将结合图3示出的步骤进行说明。
S101、依据业务场景中的目标任务所对应的任务提示信息,生成目标任务所对应的系统交互参数。
本申请实施例是在对业务场景中进行目标任务的处理的场景下实现的。本申请实施例中,当电子设备得到与目标任务相对应的任务提示信息之后,会对任务提示信息进行转换,以得到机器所能够理解的系统交互参数。
也就是说,本申请实施例中,系统交互参数是用于以机器指令的形式对目标任务进行描述。也即,任务提示信息用于以自然语言的形式对目标任务进行描述,目标任务具体所要实现的处理,以及目标任务的任务要求等内容,均可以通过自然语言进行体现,从而,任务提示信息具有一定的语言特征,是人类能够理解的信息。系统交互参数用于以机器指令的形式对目标任务进行描述,从而,在经过本步骤之后,目标任务具体所要实现的处理,以及目标任务的任务要求等内容均能够以机器所能理解的指令参数进行体现,如此,能够便于目标任务所对应的任务系统进行目标任务的处理。
也即,本申请实施例中,电子设备会将自然语言形式,即人类可以理解的任务提示信息,转换为机器所能理解的指令参数,该指令参数与针对目标任务所开发的代码的作用类似,均用于调用任务系统以进行相应的任务处理。
需要说明的是,本申请实施例中的业务场景,可以是任意一个能够基于用户的操作生成相应的数据的,或者具有与用户相关联的数据的场景。例如,业务场景可以是社交交友场景(例如社交应用中的朋友推荐),也可以是游戏论坛场景(例如在网站的游戏频道上讨论游戏战术、游戏战队),还可以是兴趣扩展场景(例如社交应用中感兴趣的内容推荐)、内容推广场景(例如开屏广告)等等,本申请实施例在此不做限定。
本申请实施例中的目标任务可以按照实际业务场景的需求进行设置,本申请实施例在此不做限定。例如,当业务场景是社交交友场景时,目标任务可以是给用户推荐其可能感兴趣的人,或者附近的人;当业务场景是游戏论坛场景时,目标任务可以是对用户上传的图文内容进行敏感词检测;当业务场景是兴趣扩展场景时,目标任务可以是为用户筛选其所感兴趣的短视频(一般指视频时长小于预设时长的视频);当业务场景是内容推广场景时,目标任务可以是为为广告确定合适的用户,以定向投放。
需要说明的是,目标任务是人工指定的任务,例如运营人员针对业务场景所指定的任务,也可以是电子设备依据不同任务的指定运行时间所确定出的任务。
本申请实施例中,电子设备可以通过多种方式生成目标任务所对应的系统交互参数。
参见图4,图4是本申请实施例提供的任务处理方法的流程示意图二。在本申请的一些实施例中,图3中S101,即依据业务场景中的目标任务所对应任务提示信息,生成目标任务所对应的系统交互参数,可以通过以下处理实现:
S1011、通过自然语言处理模型,对任务提示信息进行语义解析,得到解析结果。
本申请实施例中,电子设备可以直接利用所获取到的自然语言处理模型来对任务提示信息进行语义解析,其中,自然语言处理模型的语义解析能力是经过用大量的语料数据进行预训练之后所具备的,并且,自然语言处理模型的参数数量大于数量阈值。由此可见,本申请实施例中的自然语言处理模型,实质上一个经过预训练,且参数量较大的大语言模型,从而,自然语言处理模型具备消除同一数据在不同业务场景下的语义歧义的能力,因此,通过自然语言处理模型对任务提示信息进行语义解析,消除同一数据在不同业务场景中的语义鸿沟,能够得到更为准确的解析结果。
S1012、针对解析结果进行参数生成,得到目标任务所对应的系统交互参数。
电子设备借助于解析结果,就会明确目标任务的任务提示信息中所表达的具体需求,并依据该需求进行参数指令的创建,所得到的参数指令,即为目标任务的任务系统所能够理解的系统交互参数。
在本申请的一些实施例中,图3中S101,即依据业务场景中的目标任务所对应任务提示信息,生成目标任务所对应的系统交互参数,还可以通过以下处理实现:将任务提示信息与多个预设交互参数所对应的多个预设提示信息进行匹配,将匹配上的(可以是相似度达到阈值)预设提示信息所对应的预设交互参数,作为系统交互参数,完成目标任务所对应的系统交互参数的生成。
S102、调用目标任务的任务系统,并通过任务系统对系统交互参数进行处理。
电子设备调用目标任务所对应的任务系统,并将系统交互参数传输给任务系统。之后,电子设备通过任务系统对该系统交互参数进行解析,以确定目标任务的意图和要求,并开始相应的处理。
需要说明的是,目标任务的任务系统,是与目标任务相互关联的系统。当目标任务为给用户推荐其可能感兴趣的人,那么任务系统就会为社交关系解析系统,当目标任务为对用户上传的图文内容进行敏感词检测时,任务系统就为敏感词检测系统,而当目标任务为用户筛选其所感兴趣的短视频时,任务系统就为短视频的召回系统和排序系统。以上这些系统,可以是基于图神经网络实现的,也可以是卷积神经网络、循环神经网络等模型实现的,本申请实施例在此不做限定。
S103、基于目标任务的任务系统对于系统交互参数的输出信息,确定目标任务所对应的处理结果。
当目标任务的任务系统完成对系统交互参数的处理之后,就会针对系统交互参数生成对应的输出信息。电子设备依据所得到的输出信息,针对目标任务进行结果生成,从而得到目标任务所对应的处理结果,以完成针对业务场景中的目标任务的任务处理流程。
在本申请的一些实施例中,图3中的S103,即基于目标任务的任务系统对于系统交互参数的输出信息,确定目标任务所对应的处理结果,可以通过以下处理实现:通过自然语言处理模型,为目标任务的任务系统对于系统交互参数的输出信息,生成匹配文本;将匹配文本确定为目标任务所对应的处理结果。
其中,匹配文本用于以自然语言的形式对输出信息进行描述。也即,电子设备会直接调用自然语言处理模型,针对输出信息进行文本生成,并将所生成的匹配文本,作为目标任务最终的处理结果。如此,能够使得目标任务的处理结果具有直观的、人类可理解的语义信息,从而便于与人类进行交互。
在本申请的另一些实施例中,图3中的S103,即基于目标任务的任务系统对于系统交互参数的输出信息,确定目标任务所对应的处理结果,还可以通过以下处理实现:直接将输出信息确定为目标任务所对应的处理结果。
也即,电子设备可以在不进行任何处理的情况下,将目标任务的任务系统对于系统交互参数的输出信息,从而得到相应的处理结果。如此,处理结果的生成过程更加简便,更加易于实现。
需要说明的是,本申请实施例中,系统交互参数中可以仅有一个子交互参数,即自然语言处理模型针对任务提示信息可以只生成一个子交互参数,此时,目标任务的任务系统可以仅对该子交互参数进行信息生成并输出,从而所得的输出信息中仅有一个子输出信息。系统交互参数中还可以有多个子交互参数,这可能是由于自然语言处理模型针对任务提示信息所有可能的语义,均生成了相应的子交互参数,此时,目标任务的任务系统会针对每个子交互参数进行信息生成并输出,从而输出信息中会包括多个子输出信息。
在本申请的一些实施例中,输出信息包括:多个子输出信息,在此情况下,图3中S103,即基于目标任务的任务系统对于系统交互参数的输出信息,确定目标任务所对应的处理结果,可以通过以下处理实现:通过评价模型,针对每个子输出信息生成评价信息;依据评价信息,对多个子输出信息进行筛选,并基于筛选出的子输出信息,确定目标任务所对应的处理结果。
也就是说,当任务系统输出了多个子输出信息时,电子设备会根据每个子输出信息的评价信息,判断每个子输出信息是否为目标任务真实所需要的信息,从而确定是否要利用其为目标任务确定最终的处理结果。其中,电子设备可以将评价信息最高的子输出信息筛选出来,以进行处理结果的生成,也可以将评价信息高于评价阈值的子输出信息筛选出来,以进行处理结果的生成。
需要说明的是,本申请实施例中的评价模型,可以通过以下处理得到:依据业务场景中的训练任务所对应的训练提示信息,生成训练任务所对应的训练交互参数;调用训练任务的任务系统,并通过训练任务的任务系统对训练交互参数进行处理;基于训练任务的任务系统对于训练交互参数的多个子训练输出信息,确定训练任务所对应的多个训练处理结果;利用多个训练处理结果的多个基准打分信息,以及初始模型针对多个训练处理结果所生成的多个训练打分信息,对初始模型进行参数调整,直至训练结束时,得到评价模型。
其中,训练任务可以与目标任务相同,也可以是与目标任务同属于一个业务场景的其他任务,本申请实施例在此不做限定。训练交互参数、训练处理结果的生成过程,分别于系统交互参数和处理结果的生成过程类似,在此不再赘述。需要说明的是,训练处理结果的基准打分信息,是指人类针对训练处理结果所生成的打分信息,从而基准打分信息中蕴含了训练处理结果是否符合人类期望的信息,从而,基准打分信息和训练打分信息之间的差异,其实就是人类的期望和机器的预测结果之间的差异。基于此,电子设备可以利用基准打分信息和训练打分信息之间的差异,对初始模型进行参数调整,以使得初始模型能够学习到人类的知识,即实现利用人类的知识对初始模型进行参数调整的效果,从而基于所得到的评价模,能够实现将任务系统的输出与人类期望进行对齐,使得最终的处理结果符合人类的期望。
可以理解的是,相比于相关技术中,需要针对任务进行专门的代码开发才能够实现任务处理,从而导致任务处理的效率降低,且任务处理的操作难度也较高的问题,本申请实施例中,电子设备会先针对以自然语言的形式存在的目标任务的任务提示信息,生成以机器指令的形式存在的系统交互参数,即将人类可以理解的任务提示信息,转换为机器可理解的参数指令,然后调用目标任务的任务系统,通过任务系统读入系统交互参数并进行相应的处理,最后再基于任务系统针对系统交互参数的输出信息,为目标任务生成处理结果,从而完成目标任务的任务处理。如此,仅基于自然语言的指令,就能够触发并完成对目标任务的任务处理,而无需针对目标任务进行代码开发,不仅节省了代码开发所需要的时间,更快速地开始对目标任务进行任务处理,提升了任务处理的效率,而且相比于代码,自然语言的指令更加容易生成和使用,从而还能够降低任务处理的操作难度。
进一步的,通过本申请实施例,若是业务场景、数据所构成的组合发生改变,即所需要处理的任务发生变更时,只需要对自然语言的任务交互提示信息进行变更即可,如此,能够使得各类任务均能够被正常处理,也就扩宽了所能够处理的任务的范围。
基于图3,参见图5,图5是本申请实施例提供的任务处理方法的流程示意图三。在本申请的一些实施例中,在图3中的S101之前,即依据业务场景中的目标任务所对应任务提示信息,生成目标任务所对应的系统交互参数之前,该方法还可以包括以下处理:
S104、获取针对业务场景中的目标任务所输入的自然语言信息。
本申请实施例中,电子设备可以基于人类针对目标任务所输入的自然语言信息,确定目标任务相对应的任务提示信息。更详细的,电子设备首先会检测人类(可以是运营人员,也可以是普通用户,其具体由业务场景所决定)人类是否在输入设备,例如键盘,或者是触摸屏上,针对目标任务进行信息输入。当电子设备检测到人类在输入设备上进行信息输入时,并判断所输入的信息为自然语言类型时,就会从输入设备上获取人类所输入的信息,该信息即为自然语言信息。
例如,当电子设备检测到人类在触摸屏上输入“向我推荐同个学校的校友”的中文语句时,就会将该语句确定为自然语言信息。
S105、基于自然语言信息,确定业务场景中的目标任务所对应的任务提示信息。
电子设备在获取到自然语言信息之后,可以通过直接将获取到的自然语言信息,确定为目标任务所对应的任务提示信息,也可以针对自然语言进行一定的精简,例如关键词提取或者冗余剔除,将精简后自然语言信息确定为目标任务的任务提示信息,还可以针对自然语言进行语义提取,并利用提取到的语义信息,和人类的基础属性信息等重新进整合为自然语言的指令,该指令即为得到最终的任务提示信息。
例如,电子设备可以从“想我推荐同个学校的校友”提取到人类是需要查找与其属于同一个学校的用户,并将该信息与人类的基础属性信息,例如用户UID相整合,就能够得到人类可以理解的任务提示信息“与用户UID=XXX,同个学校的用户UID”。
可以理解的是,本申请实施例中,电子设备可以从人类输入的自然语言信息中得到目标任务的任务提示信息,从而能够使得任务提示信息满足人类的需求。
基于图3,参见图6,图6是本申请实施例提供的任务处理方法的流程示意图四。在本申请的一些实施例中,在图3中的S101之前,即依据业务场景中的目标任务所对应任务提示信息,生成目标任务所对应的系统交互参数之前,该方法还可以包括以下处理:
S106、依据业务场景中的目标任务的任务定义,生成任务定义提示。
本申请实施例中,电子设备可以针对目标任务,自动构造任务提示信息。首先,电子设备会先获取目标任务的任务定义,该任务定义可以描述目标任务的具体定义和任务要求,例如描述目标任务具体是需要进行何种处理,或者是目标任务在处理过程中所需要注意的事项等等。之后,电子设备会将针对该任务定义,进行提示信息生成,所得到的提示信息即为任务定义提示。
需要说明的是,目标任务的任务定义,可以是目标任务在创建时,由创建人员通过自然语言的定义文本所指定的,从而电子设备可以根据对该定义文本进行语义解析,得到目标任务的定义,例如,当定义文本为“查询与输入的条件相匹配的用户”,电子设备可以将“查询符合条件的UID”作为任务定义;也可以是对定义文本进行关键词抽取,将抽取到的关键词作为目标任务的定义。
在本申请的一些实施例中,图6中的S106,即依据业务场景中的目标任务的任务定义,生成任务定义提示,可以通过以下处理实现:针对业务场景中的目标任务的任务定义,在指示模板库中进行匹配,并将匹配到的指示确定为任务定义指示,完成任务定义指示的生成。
电子设备可以将指示模板库中包含任务定义的信息的指示,例如包含任务定义的关键词或者语言信息的指示,作为与任务定义相匹配的指示,从而得到任务定义指示。电子设备也可以将指示模板库中,对包含了整个任务定义的全部内容的指示,作为与任务定义相匹配的指示,从而得到任务定义指示。
在本申请的另一些实施例中,图6中的S106,即依据业务场景中的目标任务的任务定义,生成任务定义提示,还可以通过以下处理实现:按照提示的预设格式,对任务定义进行格式调整,得到任务定义提示。
也即,提示一般存在特有的格式,电子设备按照该格式对任务定义进行调整,并将调整后的结果确定为任务定义提示。该调整可以包括字符对齐、标准语言转化等等(例如将中文转换为英文等等)。
S107、从业务场景的场景数据中,提取得到目标任务的任务输入数据,并依据任务输入数据生成目标任务的任务输入提示。
电子设备对业务场景所涉及到的数据进行获取,从而得到业务场景的场景数据。之后,电子设备会在所得到的场景数据中,提取完成目标任务所需要的数据,并将这些数据作为目标任务的任务输入数据。接着,电子设备会利用任务输入数据,针对目标任务进行输入提示的构建,从而得到相应的任务输入提示。
在一些实施例中,电子设备可以将所提取到的任务输入数据,整合为一个自然语言文本,并将该文本作为任务输入提示。例如,任务输入数据为“女性”、“年龄不超过30岁”、“旅游”、“读书”、“美食”时,电子设备可以将“年龄不超过30岁的女性,喜欢读书、旅游和美食”作为任务输入提示。当然,在另一些实施例中,电子设备还可以直接将提取到的任务输入数据作为任务输入提示,本申请实施例在此不做限定。
S108、将任务定义提示和任务输入提示的整合结果,确定为任务提示信息。
电子设备在得到任务定义提示和任务输入提示之后,可以将任务定义提示和任务输入提示整合为一个文本,或者是整合为一个语句,所得到的即为任务提示信息。
当然,任务提示信息中除了任务定义提示和任务输入提示之外,还可以存在一些其他的提示,比如说任务输出提示。
在本申请的一些实施例中,在图6的S107之后,即在从业务场景的场景数据中,提取得到目标任务的任务输入数据,并依据任务输入数据生成目标任务的任务输入提示之后,该方法还可以包括以下处理:基于目标任务的预设回复样式,生成目标任务的任务输出提示;将任务定义提示、任务输入提示和任务输出提示的整合结果,确定为任务提示信息。
其中,预设回复样式用于对目标任务的处理结果的样式进行约束。从而,本申请实施例中,电子设备会通过预设回复样式,对目标任务的处理结果的样式进行约束,以使得目标任务的处理结果更加标准。
当然,除了对处理结果的样式进行约束之外,预设回复样式中还可以存在部其他的内容,这部分内容可以用于指示输出信息从什么地方开始,也可以是用于和输出信息一同合并为人类可以理解的语句。
在此基础下,图3中的S102之后,即调用目标任务的任务系统,并通过目标任务的任务系统对系统交互参数进行处理之后,该方法还可以包括以下处理:基于目标任务的任务系统对于系统交互参数的输出信息,以及任务提示信息中的任务输出提示,确定目标任务所对应的处理结果。
也即,当任务提示信息中存在任务输出提示时,电子设备需要按照任务输出提示对输出信息进行处理,使得所得到的处理结果符合预设回复样式的约束,以便于处理结果能够更加规范化。
在本申请的一些实施例中,基于目标任务的任务系统对于系统交互参数的输出信息,以及任务提示信息中的任务输出提示,确定目标任务所对应的处理结果,可以通过以下处理实现:利用目标任务的任务系统对于系统交互参数的输出信息,将任务输出提示中的掩码部分进行补全,并将补全后的任务输出提示确定为目标任务所对应的处理结果。
本申请实施例中,任务输出提示中针对任务系统对于系统交互参数的输出信息,专门预留了需要进行填补的掩码部分,电子设备利用输出信息对该掩码部分进行替换,以实现对任务输出提示的补全,补全后的任务提示信息即为目标任务最终的处理结果。
示例性的,任务输出提示可以为“您所要查询的UID=[mask]”,而任务系统对于系统交互参数的输出信息为1000,那么,最终目标任务的处理结果可以为“您所要查询的UID=1000”。
在本申请的另一些实施例中,基于目标任务的任务系统对于系统交互参数的输出信息,以及任务提示信息中的任务输出提示,确定目标任务所对应的处理结果,还可以通过以下处理实现:按照任务输出提示的要求,为输出信息进行自然语言文本的生成,并将生成的文本确定为目标任务的处理结果。
也即,任务输出提示中规定了需要呈现给人类的自然语言文本的要求,电子设备按照该要求为输出信息所生成的自然语言文本,直接作为最终的处理结果。
示例性的,任务输出提示中可以为“展示输出信息,针对任务系统的输出信息添加一定的说明,以表明已经取到了输出信息”。此时,电子设备可以针对输出信息,生成“您所要求的处理已经完成,所得到的结果为UID=1000”的文本,该文本即为目标任务的处理结果。
可以理解的是,本申请实施例中,电子设备可以提供将输出信息和任务输出提示相结合,得到具有直观的语义特征的处理结果,从而能够便于直接应用在需要向人类展示和描述的任务中,也就增加了针对业务场景中的数据所能进行的任务处理的种类。
下面,将说明本申请实施例在一个实际的应用场景中的示例性应用。
本申请实施例是在针对用户进行社交关系和兴趣点进行扩展的场景下实现的,也即,本申请实施例可以有两个不同的社交分发任务,一个是针对社交社交场景进行好友推荐(称为目标任务),另一个是针对兴趣扩展场景进行内容推荐(称为目标任务)。
首先,对本申请实施例中的社交关系和兴趣点进行扩展时的整体系统架构进行说明。
图7是本申请实施例提供的社交关系和兴趣点进行扩展的系统架构示意图。参见图7,该系统中包括多个用户端7-1,消息与内容业务接入服务器7-2、消息与内容数据库7-3、消息系统7-4、上报与分析接口服务7-5、统计分析数据库7-6、特征提取服务7-7、增强社交关系与兴趣处理模型7-8、增强社交关系与兴趣处理服务7-9、平台系统业务服务7-10、指令微调样本库7-11、大型语言预训练模型7-12。
其中,用户端7-1通过和消息与内容业务接入服务器7-2通讯,发送消息或者获取内容,以完成消息功能上下行,另外,PCG或UGC等内容生产者,通过移动端或者后端接口API,提供分发的内容,例如拍摄的视频,图文等;用户端7-1是各种场景的功能的载体,用户端7-1在发布内容时,会获取上传服务器的接口地址,然后上传本地文件;用户端7-1和上报与分析接口服务7-5通讯,实现用户全场景行为与反馈上报,即收集不同的全业务场景下各个子业务场景的行为数据。
消息与内容接入服务器7-2用于向用户端7-1同步消息和下发内容;将消息内容通过消息系统7-4与消息与内容数据库7-3进行对接,以写入消息或访问不同的业务;与用户端7-1进行通讯,将用户端7-1提交的内容,例如内容的标题、发布者、摘要、封面图、发布时间或者是视频的文件大小、封面图连接、码率、文件格式、标题、发布时间、作者等信息直接通过该服务器接入服务端,并将存储内容存入消息与内容数据库7-3,以实现对信息的写入存储。
消息与内容数据库7-3用于临时保存用户端7-1的消息,以及实现消息的漫游和多端同步;对内容原本的元信息进行保存;对内容经过标准的转码操作之后元信息(例如文件大小、码率、规则、封面图等信息)进行保存。
消息系统7-4用于与消息与内容接入服务器7-2通讯,以实现消息分发。
上报与分析接口服务7-5和用户端7-1通讯,接收上报的用户全场景行为与反馈,比如关于内容分发质量的举报和反馈等;写入统计信息和样本至统计分析数据库7-6。
统计分析数据库7-6用于与上报与分析接口服务7-5对接,保存脱敏处理后的消息和内容,同时对不同子业务场景的数据做清洗和校验等初步处理;基于不同子业务场景的数据(例如社交数据、行为数据、用户和内容的属性数据等)分析用户的兴趣点。
特征提取服务7-7用于基于统计分析数据库7-6中的数据,提取用户的基础特征,例如年龄、性别、学历等特征;所提取到的基础特征,作为构建增强社交关系与兴趣处理模型7-8的数据来源。
增强社交关系与兴趣处理模型7-8,是利用大型语言预训练模型7-12所构建得到,即利用构建好的提示语(称为任务提示信息)注入到大语言预训练模型7-12之后所得到的模型,提示语在构建时的输入包括用户的社交关系、社交关系对、兴趣点、基础特征及相关描述,用户对话查询历史以及预设的回复结果样式(称为预设回复样式)。
增强社交关系与兴趣处理服务7-9是指将增强社交关系与兴趣处理模型7-8服务化之后所得到的服务。
平台系统业务服务7-10通常是指平台的运营系统,例如内容推荐系统、好友推荐系统、定向投放系统等等。其在工作时会调用增强社交关系与兴趣处理服务7-9,以得到业务推荐结果(称为处理结果),并通过消息与内容接入服务器7-2将业务推荐结果进行下发。
指令微调样本库7-11用于从上报与分析接口服务7-5获得用户的反馈和行为数据,对于自然语言的交互访问和实际生成结果构成样本对。大型语言预训练模型7-12从指令微调样本库7-11中可以读取微调样本以进行数据对齐,即以指令微调的方式对基础语言模型进行增强,确保生成的结果能被下一级的社交关系系统很好的协同。
大型语言预训练模型7-12,是指使用海量的基础预料所构造的生成式Transform架构的模型,例如LlaMa和GLM均可以作为大型语言预训练模型7-12。大型语言预训练模型7-12。
下面,对增强社交关系与兴趣处理模型的进行说明。
本申请实施例中,增强社交关系与兴趣处理模型是指将大型语言预训练模型(称为自然语言处理模型)和既有的社交关系系统模型(称为任务系统)整合所得到的。更详细的,本申请实施例中,将大型语言预训练模型和社交关系系统模型的入口融合到一起,以使这两个模型能够协同工作,从而能够吸取和利用各自模型的优点,同时将线上用户的使用反馈结果(称为基准打分信息)通过RLHF引入到大型语言预训练模型中,以使得输出能够和用户的期望结果相对齐。
示例性的,图8是本申请实施例提供的大型语言预训练模型和社交关系系统模型的协同工作示意图。首先,需要从子业务场景的数据8-1中,提取得到用户的社交关系对8-2、社交关系8-3、兴趣点8-4和基础特征8-5,然后基于这些所提取到的信息进行提示语构建8-6,并将构建得到的提示语8-7(称为任务提示信息)注入到大型语言预训练模型8-8中。然后,通过协同工作插件系统8-9调用社交关系模型系统8-10,例如排序系统8-101(依据关系亲密度+个性化偏好+多样性+负反馈进行排序)和召回系统8-102(进行关系链召回、陌生人兴趣召回、关系+兴趣召回),并利用社交关系模型系统8-10对大型语言预训练模型8-8针对提示语8-7的所生成的参数指令(称为系统交互参数)进行运算,将结果再次输入到大型语言预训练模型8-8(包含Transformers-解码器模型结构L1-L12),以得到定向用户挖掘/好友推荐/认识的人推荐的结果(称为处理结果),并展示给用户。为了能够使得实际的任务输出和人类期望的输出对齐,在模型正式上线前,会通过人工对大型语言预训练模型8-8和人工期望结果进行对齐,在对齐时会调用针对已有的任务(称为训练任务)所提供给用户的最终结果,以及针对该结果的用户反馈8-11,然后通过强化学习的方式改善结果。例如,通过用户反馈8-11中的用户打分分数,构建打分模型(称为评价模型),在上线之后的实际使用过程中,例如打分模型对社交关系模型系统所输出的多个结果(称为多个子输出信息)进行打分,选择分数最高的提供给用户。
当然,提示语8-7的构造输入,除了用户的社交关系、社交关系对、兴趣点和基础信息之外,还可以包括用户对话查询历史和预设的回复结果样式(通常是按照社交关系模型系统的插件访问协议和需要的参数得到详细参数,兴趣点、场景、地点、目标检索结果形式、关系请密度、位置属性等及其组合)。构造好的提示语会注入到大型语言预训练模型中进行调试,在调试对齐后,将所输入的自然语言的交互指令转换为社交关系模型系统的对应参数,按照插件接口的协议和描述进行调用即可。
提示语8-7的说明如下:
提示语在结构上可以分为任务定义提示(Task Definition Prompt)、任务输入提示(Task Input Prompt)和任务输出提示(Task Output Prompt)。每个提示可以自由设计占位个数。这里任务输入提示通常比较长,可以设置较大的空间,例如占位个数可以设置为1024。
其中,任务定义提示标识所有具体社交关系与兴趣增强任务定义的描述提示方式和要求,比如得到相关的全部用户,对用户本身的约束,或者得到相关兴趣点及兴趣点的扩展等等;任务输入提示具体表述任务输入的信息,比如用户社交关系的标记、社交关系对及用户兴趣点、用户的基础特征及其描述等;任务输出提示用于定义任务输出结果的样式和部分内容,例如用户ID、兴趣点、场景、地点、目标检索结果形式、关系亲密度、位置属性等及其组合。
示例性的,以下给出了提示语8-7的例子:
1)用户UID=XXXXX 最亲密的20个用户UID,女性,年龄不超过30岁,喜欢读书、旅游和美食;
2)与用户UID=XXXXX 同个学校,同个公司的用户UID;
3)与用户UID=XXXXX 同住在B城,喜欢滑雪、电影和音乐的用户UID;
4)在C城工作,年龄30岁以下,女性,喜欢动漫和美食的用户UID;
5)用户UID=XXXXX 的一度人脉、二度人脉。
本申请实施例的社交关系模型系统,可以采用两层系统实现,这两层系统为分别为图存储层和算子操作层。其中,图存储层用于存储图网络的拓扑结构、节点属性信息、快速采用的索引机制以及缓存机制;算子操作层可以将GNN算法的基本算子融入至现有机器学习框架中,以简化算子的调用过程。
可以理解的是,在本申请实施例中,涉及到用户信息,例如社交关系、社交关系对、兴趣点、基础特征等相关的数据,当本申请实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。另外,在本申请实施例中,涉及到的数据抓取技术方案实施,在本申请以上实施例运用到具体产品或技术中时,相关数据收集、使用和处理过程应该遵守国家法律法规要求,符合合法、正当、必要的原则,不涉及获取法律法规禁止或限制的数据类型,不会妨碍相关应用的正常运行。
下面继续说明本申请实施例提供的任务处理装置255的实施为软件模块的示例性结构,在一些实施例中,如图2所示,存储在存储器250的任务处理装置255中的软件模块可以包括:
参数生成模块2551,用于依据业务场景中的目标任务所对应任务提示信息,生成所述目标任务所对应的系统交互参数;其中,所述任务提示信息用于以自然语言的形式对所述目标任务进行描述,所述系统交互参数是用于以机器指令的形式对所述目标任务进行描述;
参数处理模块2552,用于调用所述目标任务的任务系统,并通过所述目标任务的任务系统对所述系统交互参数进行处理;
结果确定模块2553,用于基于所述目标任务的任务系统对于所述系统交互参数的输出信息,确定所述目标任务所对应的处理结果。
在本申请的一些实施例中,所述参数生成模块2551,还用于通过自然语言处理模型,对所述任务提示信息进行语义解析,得到解析结果;其中,所述自然语言处理模型的参数数量大于数量阈值;针对所述解析结果进行参数生成,得到所述目标任务所对应的所述系统交互参数。
在本申请的一些实施例中,所述输出信息包括:多个子输出信息;所述结果确定模块2553,还用于通过评价模型,针对每个所述子输出信息生成评价信息;依据所述评价信息,对多个所述子输出信息进行筛选,并基于筛选出的子输出信息,确定所述目标任务所对应的处理结果。
在本申请的一些实施例中,所述任务处理装置255还包括:模型生成模块2554,用于依据所述业务场景中的训练任务所对应的训练提示信息,生成所述训练任务所对应的训练交互参数;调用所述训练任务的任务系统,并通过所述训练任务的任务系统对所述训练交互参数进行处理;基于所述训练任务的任务系统对于所述训练交互参数的多个子训练输出信息,确定所述训练任务所对应的多个训练处理结果;利用多个所述训练处理结果的多个基准打分信息,以及初始模型针对所述多个训练处理结果所生成的多个训练打分信息,对所述初始模型进行参数调整,直至训练结束时,得到所述评价模型。
在本申请的一些实施例中,所述结果确定模块2553,还用于通过自然语言处理模型,为所述目标任务的任务系统对于所述系统交互参数的输出信息,生成匹配文本;其中,所述匹配文本用于以自然语言的形式对所述输出信息进行描述;将所述匹配文本确定为所述目标任务所对应的所述处理结果。
在本申请的一些实施例中,所述任务处理装置255还包括:提示确定模块2555,用于获取针对所述业务场景中的所述目标任务所输入的自然语言信息;基于所述自然语言信息,确定所述业务场景中的所述目标任务所对应的所述任务提示信息。
在本申请的一些实施例中,所述提示确定模块2555,还用于依据所述业务场景中的所述目标任务的任务定义,生成任务定义提示;从所述业务场景的场景数据中,提取得到所述目标任务的任务输入数据,并依据所述任务输入数据生成所述目标任务的任务输入提示;将所述任务定义提示和所述任务输入提示的整合结果,确定为所述任务提示信息。
在本申请的一些实施例中,所述提示确定模块2555,还用于针对所述业务场景中的所述目标任务的任务定义,在指示模板库中进行匹配,并将匹配到的指示确定为任务定义指示,完成所述任务定义指示的生成。
在本申请的一些实施例中,所述提示确定模块2555,还用于基于所述目标任务的预设回复样式,生成所述目标任务的任务输出提示;其中,所述预设回复样式用于对所述目标任务的处理结果的样式进行约束;将所述任务定义提示、所述任务输入提示和所述任务输出提示的整合结果,确定为所述任务提示信息。
在本申请的一些实施例中,所述结果确定模块2553,还用于基于所述目标任务的任务系统对于所述系统交互参数的输出信息,以及所述任务提示信息中的所述任务输出提示,确定所述目标任务所对应的所述处理结果。
在本申请的一些实施例中,所述结果确定模块2553,还用于利用所述目标任务的任务系统对于所述系统交互参数的输出信息,将所述任务输出提示中的掩码部分进行补全,并将补全后的任务输出提示确定为所述目标任务所对应的所述处理结果。
本申请实施例提供了一种计算机程序产品,该计算机程序产品包括计算机程序或计算机可执行指令,该计算机程序或计算机可执行指令存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机可执行指令,处理器执行该计算机可执行指令,使得该电子设备执行本申请实施例上述的任务处理方法。
本申请实施例提供一种存储有计算机可执行指令的计算机可读存储介质,其中存储有计算机可执行指令,当计算机可执行指令被处理器执行时,将引起处理器执行本申请实施例提供的任务处理方法,例如,如图3示出的任务处理方法。
在一些实施例中,计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
在一些实施例中,计算机可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,计算机可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(HTML,HyperText Markup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
作为示例,计算机可执行指令可被部署为在一个电子设备上执行,或者在位于一个地点的多个电子设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个电子设备上执行。
综上所述,通过本申请实施例,仅基于自然语言的指令,就能够触发并完成对目标任务的任务处理,而无需针对目标任务进行代码开发,不仅节省了代码开发所需要的时间,更快速地开始对目标任务进行任务处理,提升了任务处理的效率,而且相比于代码,自然语言的指令更加容易生成和使用,从而还能够降低任务处理的操作难度。进一步的,通过本申请实施例,若是业务场景、数据所构成的组合发生改变,即所需要处理的任务发生变更时,只需要对自然语言的任务交互提示信息进行变更即可,如此,能够使得各类任务均能够被正常处理,也就扩宽了所能够处理的任务的范围;通过自然语言处理模型对任务提示信息进行语义解析,消除同一数据在不同业务场景中的语义鸿沟,能够得到更为准确的解析结果。
以上所述,仅为本申请的实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本申请的保护范围之内。

Claims (12)

1.一种任务处理方法,其特征在于,所述方法包括:
针对业务场景中目标任务的任务定义,在指示模板库中进行匹配,并将匹配到的指示确定为任务定义指示;
从所述业务场景的场景数据中,提取得到所述目标任务的任务输入数据,并依据所述任务输入数据生成所述目标任务的任务输入提示;
基于所述目标任务的预设回复样式,生成所述目标任务的任务输出提示;其中,所述预设回复样式用于对所述目标任务的处理结果的样式进行约束;所述预设回复样式中包括其他内容,所述其他内容用于指示输出信息的开始位置,以及,用于与所述输出信息合并为自然语言文本;
将所述任务定义提示、所述任务输入提示和所述任务输出提示的整合结果,确定为任务提示信息;
依据所述任务提示信息,生成所述目标任务所对应的系统交互参数;
其中,所述任务提示信息用于以自然语言的形式对所述目标任务进行描述,所述系统交互参数用于以机器指令的形式对所述目标任务进行描述;
调用所述目标任务的任务系统,并通过所述目标任务的任务系统对所述系统交互参数进行处理;
基于所述目标任务的任务系统对于所述系统交互参数的输出信息,确定所述目标任务所对应的处理结果。
2.根据权利要求1所述的方法,其特征在于,所述依据所述任务提示信息,生成所述目标任务所对应的系统交互参数,包括:
通过自然语言处理模型,对所述任务提示信息进行语义解析,得到解析结果;其中,所述自然语言处理模型的参数数量大于数量阈值;
针对所述解析结果进行参数生成,得到所述目标任务所对应的所述系统交互参数。
3.根据权利要求1所述的方法,其特征在于,所述输出信息包括:多个子输出信息;所述基于所述目标任务的任务系统对于所述系统交互参数的输出信息,确定所述目标任务所对应的处理结果,包括:
通过评价模型,针对每个所述子输出信息生成评价信息;
依据所述评价信息,对多个所述子输出信息进行筛选,并基于筛选出的子输出信息,确定所述目标任务所对应的处理结果。
4.根据权利要求3所述的方法,其特征在于,所述评价模型通过以下处理得到:
依据所述业务场景中的训练任务所对应的训练提示信息,生成所述训练任务所对应的训练交互参数;
调用所述训练任务的任务系统,并通过所述训练任务的任务系统对所述训练交互参数进行处理;
基于所述训练任务的任务系统对于所述训练交互参数的多个子训练输出信息,确定所述训练任务所对应的多个训练处理结果;
利用多个所述训练处理结果的多个基准打分信息,以及初始模型针对所述多个训练处理结果所生成的多个训练打分信息,对所述初始模型进行参数调整,直至训练结束时,得到所述评价模型。
5.根据权利要求1所述的方法,其特征在于,所述基于所述目标任务的任务系统对于所述系统交互参数的输出信息,确定所述目标任务所对应的处理结果,包括:
通过自然语言处理模型,为所述目标任务的任务系统对于所述系统交互参数的输出信息,生成匹配文本;其中,所述匹配文本用于以自然语言的形式对所述输出信息进行描述;
将所述匹配文本确定为所述目标任务所对应的所述处理结果。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述依据所述任务提示信息,生成所述目标任务所对应的系统交互参数之前,所述方法还包括:
获取针对所述业务场景中的所述目标任务所输入的自然语言信息;
基于所述自然语言信息,确定所述业务场景中的所述目标任务所对应的所述任务提示信息。
7.根据权利要求1所述的方法,其特征在于,所述调用所述目标任务的任务系统,并通过所述目标任务的任务系统对所述系统交互参数进行处理之后,所述方法还包括:
基于所述目标任务的任务系统对于所述系统交互参数的输出信息,以及所述任务提示信息中的所述任务输出提示,确定所述目标任务所对应的所述处理结果。
8.根据权利要求7所述的方法,其特征在于,所述基于所述目标任务的任务系统对于所述系统交互参数的输出信息,以及所述任务提示信息中的所述任务输出提示,确定所述目标任务所对应的所述处理结果,包括:
利用所述目标任务的任务系统对于所述系统交互参数的输出信息,将所述任务输出提示中的掩码部分进行补全,并将补全后的任务输出提示确定为所述目标任务所对应的所述处理结果。
9.一种任务处理装置,其特征在于,所述装置包括:
参数生成模块,用于针对业务场景中目标任务的任务定义,在指示模板库中进行匹配,并将匹配到的指示确定为任务定义指示;从所述业务场景的场景数据中,提取得到所述目标任务的任务输入数据,并依据所述任务输入数据生成所述目标任务的任务输入提示;基于所述目标任务的预设回复样式,生成所述目标任务的任务输出提示;其中,所述预设回复样式用于对所述目标任务的处理结果的样式进行约束;所述预设回复样式中包括其他内容,所述其他内容用于指示输出信息的开始位置,以及,用于与所述输出信息合并为自然语言文本;将所述任务定义提示、所述任务输入提示和所述任务输出提示的整合结果,确定为任务提示信息;依据所述任务提示信息,生成所述目标任务所对应的系统交互参数;其中,所述任务提示信息用于以自然语言的形式对所述目标任务进行描述,所述系统交互参数用于以机器指令的形式对所述目标任务进行描述;
参数处理模块,用于调用所述目标任务的任务系统,并通过所述目标任务的任务系统对所述系统交互参数进行处理;
结果确定模块,用于基于所述目标任务的任务系统对于所述系统交互参数的输出信息,确定所述目标任务所对应的处理结果。
10.一种电子设备,其特征在于,所述电子设备包括:
存储器,用于存储计算机可执行指令;
处理器,用于执行所述存储器中存储的计算机可执行指令时,实现权利要求1至8任一项所述的任务处理方法。
11.一种计算机可读存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令被处理器执行时实现权利要求1至8任一项所述的任务处理方法。
12.一种计算机程序产品,包括计算机程序或计算机可执行指令,其特征在于,所述计算机程序或计算机可执行指令被处理器执行时实现权利要求1至8任一项所述的任务处理方法。
CN202310950974.5A 2023-07-31 2023-07-31 一种任务处理方法、装置、设备、存储介质及程序产品 Active CN116700839B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310950974.5A CN116700839B (zh) 2023-07-31 2023-07-31 一种任务处理方法、装置、设备、存储介质及程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310950974.5A CN116700839B (zh) 2023-07-31 2023-07-31 一种任务处理方法、装置、设备、存储介质及程序产品

Publications (2)

Publication Number Publication Date
CN116700839A CN116700839A (zh) 2023-09-05
CN116700839B true CN116700839B (zh) 2023-10-24

Family

ID=87829589

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310950974.5A Active CN116700839B (zh) 2023-07-31 2023-07-31 一种任务处理方法、装置、设备、存储介质及程序产品

Country Status (1)

Country Link
CN (1) CN116700839B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117332823B (zh) * 2023-11-28 2024-03-05 浪潮电子信息产业股份有限公司 目标内容自动生成方法、装置、电子设备及可读存储介质
CN117743545B (zh) * 2023-12-20 2024-05-17 北京橡数科技有限公司 一种基于toB企服项目交付系统业务数据获取方法和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109564592A (zh) * 2016-08-16 2019-04-02 电子湾有限公司 在多轮对话中生成接下来的用户提示
CN111581919A (zh) * 2020-04-02 2020-08-25 联想(北京)有限公司 一种任务处理方法及装置
CN115756610A (zh) * 2022-11-24 2023-03-07 上海中广核工程科技有限公司 一种自然语言指令信息的处理方法、装置、设备及介质
CN116402057A (zh) * 2023-03-28 2023-07-07 深圳市人马互动科技有限公司 一种基于自然语言的人机交互系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200410056A1 (en) * 2019-06-27 2020-12-31 Microsoft Technology Licensing, Llc Generating machine learning training data for natural language processing tasks
US20230185799A1 (en) * 2021-12-14 2023-06-15 Oracle International Corporation Transforming natural language to structured query language based on multi-task learning and joint training

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109564592A (zh) * 2016-08-16 2019-04-02 电子湾有限公司 在多轮对话中生成接下来的用户提示
CN111581919A (zh) * 2020-04-02 2020-08-25 联想(北京)有限公司 一种任务处理方法及装置
CN115756610A (zh) * 2022-11-24 2023-03-07 上海中广核工程科技有限公司 一种自然语言指令信息的处理方法、装置、设备及介质
CN116402057A (zh) * 2023-03-28 2023-07-07 深圳市人马互动科技有限公司 一种基于自然语言的人机交互系统

Also Published As

Publication number Publication date
CN116700839A (zh) 2023-09-05

Similar Documents

Publication Publication Date Title
US20200410401A1 (en) System and Method for Searching and Matching Content Over Social Networks to an Individual
US10832008B2 (en) Computerized system and method for automatically transforming and providing domain specific chatbot responses
US8285654B2 (en) Method and system of providing a personalized performance
CN116700839B (zh) 一种任务处理方法、装置、设备、存储介质及程序产品
CN112106056A (zh) 构造虚构的话语树来提高回答聚敛性问题的能力
CN114072832A (zh) 用于助理系统的基于记忆的对话推理和问答
US11861319B2 (en) Chatbot conducting a virtual social dialogue
CN116702737B (zh) 文案生成方法、装置、设备、存储介质及产品
KR102064292B1 (ko) 개인화된 소셜네트워크서비스 컨텐츠 추천 방법 및 장치
CN110309114B (zh) 媒体信息的处理方法、装置、存储介质和电子装置
Vergara et al. Building cognitive applications with IBM watson services: Volume 7 natural language understanding
KR20180009408A (ko) 소셜 네트워크 분석과 온톨로지를 이용한 장소성 추출 시스템 및 방법
Wanner et al. Getting the environmental information across: from the Web to the user
KR102372429B1 (ko) 창작자 및 다중참여자에게 수익을 분배하는 이야기 콘텐츠 플랫폼 서비스 제공 시스템
CN112100501A (zh) 信息流的处理方法、装置及电子设备
CN111813816B (zh) 数据处理方法、装置、计算机可读存储介质和计算机设备
Wu et al. Catering to your concerns: automatic generation of personalised security-centric descriptions for Android apps
Ruichen [Retracted] The Basic Principles of Marxism with the Internet as a Carrier
Kotsakis et al. A web framework for information aggregation and management of multilingual hate speech
CN117574920A (zh) 文本预测模型的训练方法、装置及存储介质
Vadhera et al. Chatbot on COVID-19 for sustaining good health during the pandemic
Rybchak et al. Reengineering Support and Decision-Making System Based on Twitter Analysis.
CN115952348A (zh) 一种兴趣推送方法、装置、设备及计算机可读存储介质
Kanakasabai et al. Google Dorking Commands-based Approach for Assisting Forensic Investigators in Gender Identification of Social Media Text Data
Brandon Data mining twitter for COVID-19 sentiments concerning college online education

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40092370

Country of ref document: HK