CN116894192A - 大模型训练方法及相关方法、装置、设备、系统和介质 - Google Patents

大模型训练方法及相关方法、装置、设备、系统和介质 Download PDF

Info

Publication number
CN116894192A
CN116894192A CN202311161510.2A CN202311161510A CN116894192A CN 116894192 A CN116894192 A CN 116894192A CN 202311161510 A CN202311161510 A CN 202311161510A CN 116894192 A CN116894192 A CN 116894192A
Authority
CN
China
Prior art keywords
data
task
sample
large model
sample data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311161510.2A
Other languages
English (en)
Inventor
殷俊
黄鹏
岑鑫
虞响
钱康
李琦
郭佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Dahua Technology Co Ltd
Original Assignee
Zhejiang Dahua Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Dahua Technology Co Ltd filed Critical Zhejiang Dahua Technology Co Ltd
Priority to CN202311161510.2A priority Critical patent/CN116894192A/zh
Publication of CN116894192A publication Critical patent/CN116894192A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

本申请公开了一种大模型训练方法及相关方法、装置、设备、系统和介质,用于数据标注的大模型训练方法包括:接收用户端对第一样本数据的第一提示文本,将第一样本数据及其第一提示文本输入大模型,得到大模型输出的第一样本数据的第一预测标注,以及发送第一预测标注至用户端;接收用户端对第一预测标注进行校核之后的校核标注;基于第一样本数据及其第一样本信息训练大模型。上述方案,能够降低数据标注成本,并提升数据标注精度,以及拓宽数据标注的应用范围。

Description

大模型训练方法及相关方法、装置、设备、系统和介质
技术领域
本申请涉及数据标注技术领域,特别是涉及一种大模型训练方法及相关方法、装置、设备、系统和介质。
背景技术
现阶段,机器学习和深度学习中需要大量的标注数据仅神经网络模型的训练。
但是,现有技术中样本数据通常多为标注人员人工手动标注。由于数据标注需求量大,数据标注又通常较为繁琐且耗时,故数据标注的成本开销极大,且在长时间持续标注下,标注人员也容易疲劳而造成标注失误。有鉴于此,如何降低数据标注成本,并提升数据标注精度,成为亟待解决的问题。
发明内容
本申请主要解决的技术问题是提供一种大模型训练方法及相关方法、装置、设备、系统和介质,能够降低数据标注成本,并提升数据标注精度。
为了解决上述问题,本申请第一方面提供了一种用于数据标注的大模型训练方法,包括:接收用户端对第一样本数据的第一提示文本,并基于将所述第一样本数据及其第一提示文本输入大模型,得到所述大模型输出的所述第一样本数据的第一预测标注,以及发送第一预测标注至用户端;其中,第一提示文本用于指示大模型对第一样本数据所执行的标注任务,且大模型能够执行任务集合中任一任务,第一提示文本所指示的第一标注任务为任务集合中任一任务;接收用户端对第一预测标注进行校核之后的校核标注;基于第一样本数据及其第一样本信息训练大模型;其中,第一样本信息包括第一样本数据的校核标注和第一提示文本,训练之后的大模型用于处理待标注数据及其提示文本输出待标注数据的预测标注,且提示文本所指示的标注任务为第一标注任务,或任务集合中不同于第一标注任务的任一任务。
为了解决上述问题,本申请第二方面提供了一种用于数据标注的大模型训练方法,包括:发送对第一样本数据的第一提示文本,并接收服务器将第一样本数据及其第一提示文本输入大模型之后由大模型输出的第一样本数据的第一预测标注;其中,第一提示文本用于指示大模型对第一样本数据所执行的标注任务,且大模型能够执行任务集合中任一任务,第一提示文本所指示的第一标注任务为任务集合中任一任务;获取对第一预测标注进行校核之后的校核标注,并发送第一样本数据的校核标注至服务器;其中,服务器基于第一样本数据及其第一样本信息训练大模型,且第一样本信息包括第一样本数据的校核标注和第一提示文本,训练之后的大模型用于处理待标注数据及其提示文本输出待标注数据的预测标注,提示文本所指示的标注任务为第一标注任务,或任务集合中不同于第一标注任务的任一任务。
为了解决上述问题,本申请第三方面提供了一种数据标注方法,包括:获取待标注数据及其提示文本;其中,提示文本用于指示大模型对待标注数据所执行的标注任务,大模型由上述第一方面或第二方面中的训练方法得到;将待标注数据及其提示文本输入大模型,获取由大模型输出的待标注数据的预测标注。
为了解决上述问题,本申请第四方面提供了一种用于数据标注的大模型训练装置,包括:第一接收模块、标注预测模块、标注发送模块、标注接收模块和训练模块,第一接收模块,用于接收用户端对第一样本数据的第一提示文本;其中,第一提示文本用于指示大模型对第一样本数据所执行的标注任务,且大模型能够执行任务集合中任一任务,第一提示文本所指示的第一标注任务为任务集合中任一任务;标注预测模块,用于将第一样本数据及其第一提示文本输入大模型,得到大模型输出的第一样本数据的第一预测标注;标注发送模块,用于发送第一预测标注至用户端;标注接收模块,用于接收用户端对第一预测标注进行校核之后的校核标注;训练模块,用于基于第一样本数据及其第一样本信息训练大模型;其中,第一样本信息包括第一样本数据的校核标注和第一提示文本,且训练之后的大模型用于处理待标注数据及其提示文本输出待标注数据的预测标注,且提示文本所指示的标注任务为第一标注任务,或任务集合中不同于第一标注任务的任一任务。
为了解决上述问题,本申请第五方面提供了一种用于数据标注的大模型训练装置,包括:第一发送模块、标注接收模块、标注校核模块和标注发送模块,第二发送模块,用于发送对第一样本数据的第一提示文本;其中,第一提示文本用于指示大模型对第一样本数据所执行的标注任务,且大模型能够执行任务集合中任一任务,第一提示文本所指示的第一标注任务为任务集合中任一任务;标注接收模块,用于接收服务器将所述第一样本数据及其第一提示文本输入大模型之后由所述大模型输出的所述第一样本数据的第一预测标注;标注校核模块,用于获取对第一预测标注进行校核之后的校核标注;标注发送模块,用于发送第一样本数据的校核标注至服务器;其中,服务器基于第一样本数据及其第一样本信息训练大模型,且第一样本信息包括第一样本数据的校核标注和第一提示文本,训练之后的大模型用于处理待标注数据及其提示文本输出待标注数据的预测标注,且提示文本所指示的标注任务为第一标注任务,或任务集合中不同于第一标注任务的任一任务。
为了解决上述问题,本申请第六方面提供了一种数据标注装置,包括:获取模块和标注模块,获取模块,用于获取待标注数据及其提示文本;其中,提示文本用于指示大模型对待标注数据所执行的标注任务,大模型由上述第四方面或第五方面中用于数据标注的大模型训练装置得到,标注模块,用于将待标注任务及其提示文本输入大模型,获取由大模型输出的待标注数据的预测标注。
为了解决上述问题,本申请第七方面提供了一种电子设备,包括通信电路、存储器和处理器,通信电路、存储器分别耦接于处理器,存储器存储有程序指令,处理器用于执行程序指令以实现上述第一方面或第二方面中的用于数据标注的大模型训练方法,或实现上述第三方面中的数据标注方法。
为了解决上述问题,本申请第八方面提供了一种数据标注系统,包括通信连接的服务器和用户端,服务器用于执行上述第一方面或第三方面中的方法,用户端用于执行上述第二方面中的方法。
为了解决上述问题,本申请第九方面提供了一种计算机可读存储介质,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面或第二方面中的用于数据标注的大模型训练方法,或实现上述第三方面中的数据标注方法。
上述方案,接收用户端对第一样本数据的第一提示文本,且第一提示文本用于指示大模型对第一样本数据所执行的标注任务,大模型能够执行任务集合中任一任务,第一提示文本所指示的第一标注任务为任务集合中任一任务,从而将第一样本数据及其第一提示文本输入大模型,得到大模型输出的第一样本数据的第一预测标注,并发送第一预测标注至用户端,进而接收用户端对第一预测标注进行校核之后的校核标注,以基于第一样本数据及其第一样本信息训练大模型,且第一样本信息包括第一样本数据的校核标注和第一提示文本,训练之后的大模型用于处理待标注数据及其提示文本输出待标注数据的预测标注,且提示文本所指示的标注任务为第一标注任务,或任务集合中不同于第一标注任务的任一任务,一方面在大模型训练过程中第一样本数据无需再依赖于样本标注,能够尽可能降低对人工标注的依赖,有助于降低数据标注成本,另一方面通过对预测标注的校核标注重新对大模型进行训练,从而能够自动实现对大模型的迭代优化,有助于提升数据标注精度。此外,区别于传统网络模型,训练阶段对第一样本数据的标注任务和推理阶段对待标注数据的标注任务不拘于必须相同,故应用场景得到极大拓宽。故此,能够降低数据标注成本,并提升数据标注精度,以及扩宽数据标注的适用范围。
附图说明
图1是本申请用于数据标注的大模型训练方法一实施例的流程示意图;
图2是本申请用于数据标注的大模型训练方法另一实施例的流程示意图;
图3是本申请数据标注一实施例的流程示意图;
图4是本申请用于数据标注的大模型训练装置一实施例的框架示意图;
图5是本申请用于数据标注的大模型训练装置另一实施例的框架示意图;
图6是本申请数据标注装置一实施例的框架示意图;
图7是本申请电子设备一实施例的框架示意图;
图8是本申请数据标注系统一实施例的框架示意图;
图9是本申请计算机可读存储介质一实施例的框架示意图。
具体实施方式
下面结合说明书附图,对本申请实施例的方案进行详细说明。
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。
本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
请参阅图1,图1是本申请用于数据标注的大模型训练方法一实施例的流程示意图。需要说明的是,本公开实施例中方法步骤由服务器执行。此外,服务器可以部署有大模型。本申请公开实施例中,对大模型的网络结构不做限定。示例性地,大模型可以包括但不限于GPT等。具体而言,可以包括如下步骤:
步骤S11:接收用户端对第一样本数据的第一提示文本,基于将第一样本数据及其第一提示文本输入大模型,得到大模型输出的第一样本数据的第一预测标注,以及发送第一预测标注至用户端。
本公开实施例中,第一提示文本用于指示大模型对第一样本数据所执行的标注任务。需要说明的是,第一样本数据可以为文本、音频、图像等数据类型,在此不做限定。第一提示文本可以以自然语言形式描述。此外,大模型能够执行任务集合中任一任务,第一提示文本所指示的第一标注任务为任务集合中任一任务。大模型所能够支持的任务集合内可以包括但不限于如下任务:目标检测、图像分割、目标分类、文本翻译等等,在此不做限定。关于大模型所能够执行的任务集合,可以参阅诸如GPT、LLaMa等大模型的技术细节,在此不再赘述。示例性地,对于目标检测来说,提示文本可以设为如“请框出图像中车辆”,大模型可以检出图像中车辆的检测框,而在标注任务中,检测框即可视标注信息;或者,对于图像分割来说,提示文本可以设为如“请分割出图像中行人”,大模型可以检出图像中行人的外形轮廓,而在标注任务中,外形轮廓即可视为标注信息;或者,对于目标分类来说,提示文本可以设为如“请检出图像中车辆具体类别”,大模型可以检出图像中车辆的具体类型,而在标注任务中,对象类型即可视为标注信息,其他情况可以以此类推,在此不再一一举例。
在一个实施场景中,为了获取第一预测标注,可以预先提取第一样本数据的数据特征,从而可以获取大模型结合第一样本数据的数据特征和第一提示文本所分析得到的第一预测标注。具体地,可以将第一样本数据的数据特征和第一提示文本一同输入至大模型,以得到大模型输出的第一预测标注。
在另一个实施场景中,不同于前述方式,也可以直接将第一样本数据和第一提示文本输入至大模型,从而可以由大模型根据第一提示文本对第一样本数据进行分析,进而可以得到大模型输出的第一预测标注。
步骤S12:接收用户端对第一预测标注进行校核之后的校核标注。
在一个实施场景中,在得到第一样本数据的第一预测标注之后,服务器可以将第一预测标注及其唯一标识符发送至用户端,从而用户端可以根据唯一标识符在本地调出对应的第一样本数据,并同时输出第一预测标注,以供校核人员在用户端校核该第一预测标注是否正确标注第一样本数据。进一步地,若第一预测标注正确标注第一样本数据,则可以在用户端触发“校核无误”,此时校核标注即为第一预测标注本身;反之,若第一预测标注错误标注第一样本数据,则可以在用户端触发“校核有误”,并对第一预测标注进行调整,调整后的第一预测标注即为校核标注。
在另一个实施场景中,区别于前述实施方式,为了在用户端直观体现第一预测标注是否正确标注,用户端可以在第一样本数据上叠加显示第一预测标注。以第一样本数据为样本图像为例,可以将第一预测标注叠加于样本图像并重新编码,得到样本图像的标注后图像,并显示该标注后图像,且为了便于校核,第一预测标注在标注后图像中可以为可编辑状态,以在第一预测标注校核有误的情况下,支持用户端直接在标注后图像上对第一预测标注进行调整。当然,也不局限于此,第一预测标注在标注后图像中也可以为不可编辑状态。此时若第一预测标注校核有误,则可以直接在用户端上所显示的标注后图像(或样本图像,即标注前图像)中重新标注,作为校核标注。在第一样本数据为文本、音频等其他数据的情况下,在第一样本数据上叠加显示第一预测标注的具体过程,可以以此类推,在此不再一一举例。上述方式,在校核之前,在第一样本数据上叠加显示第一预测标注,有助于在校核过程中提升第一预测标注是否标注正确的直观性。此外,在第一样本数据为样本图像的情况下,将第一预测标注叠加于样本图像并重新编码,得到样本图像的标注后图像,并显示标注后图像,且第一预测标注在标注后图像中为可编辑状态,有助于提升标注校核的便利性。
需要说明的是,在标注校核之后,可以将第一样本数据的校核标注进行存储。示例性地,为了提升校核标注的存储效率,校核标注可以以JSON格式存储。当然,在实际应用过程中,校核标注的存储格式也不限于此,如还可以采用诸如XML等格式存储,在此不做限定。
步骤S13:基于第一样本数据及其第一样本信息训练大模型。
本公开实施例中,第一样本信息包括第一样本数据的校核标注和第一提示文本,具体含义可以参阅前述相关描述,在此不再赘述。具体地,既可以提取第一样本数据的数据特征,并获取大模型结合第一样本数据的数据特征和第一提示文本所分析得到的第三预测标注,也可以直接将第一样本数据及其第一提示文本输入至大模型,以得到大模型所输出的第三预测标注。在此基础上,可以基于第一样本数据的校核标注和第三预测标注之间的差异,对大模型进行参数优化。
在一个实施场景中,为了提升大模型训练后的数据标注能力,可以先判断具备校核标注的第一样本数据当前已累积的总数目是否超出预设阈值。需要说明的是,预设阈值可以根据实际应用需要进行设置。例如,在对大模型的精度要求相对较高的情况下,预设阈值可以设置适当大一些,如可以设置为1000等;或者,在对大模型的精度要求相对宽松的情况下,预设阈值可以设置地适当小一些,如可以设置为500等。当然,预设阈值的数值举例仅仅是几种可能数值,并不因此而限定预设数值的具体取值。在此基础上,若总数目大于预设阈值,则可以基于第一样本数据及其第一样本信息再训练大模型,具体过程可以参阅前述相关描述,在此不再赘述。需要说明的是,与前述情况相反地,若总数目不大于预设阈值,则可以继续积累直至总数目大于预设阈值为止。上述方式,在基于第一样本数据及其第一样本信息再训练大模型之前,先判断具备校核标注的第一样本数据当前已累积的总数目是否超出预设阈值,并响应于总数目超出预设阈值,基于第一样本数据及其第一样本信息训练大模型,能够有助于提升大模型在再训练之后的数据标注能力。
在一个实施场景中,在训练之后,还可以对训练后的大模型进行测试,以得到训练后的大模型其数据标注的当前精度,在当前精度满足预设条件的情况下,可以停止训练流程,否则可以继续执行前述流程,以不断优化大模型,直至其精度满足预设条件为止。
当然,为了进一步提升用于数据标注的大模型其标注性能以及训练效率,作为一种可能的实施方式,在前述步骤S11之前,还可以接收用户端对第二样本数据的第二样本信息,再基于第二样本数据及其第二样本信息预训练大模型。
需要说明的是,第二样本信息包括样本标注和用于指示大模型对第二样本数据所执行标注任务的第二提示文本,而第二提示文本所指示的第二标注任务可以为第一标注任务,或任务集合中不同于第一标注任务的任一任务。本申请公开实施例中诸如“第二样本数据”、“第一样本数据”等数据可以包括但不限于:图像、文本、音频等,具体可以根据实际应用需要进行设置。示例性地,在目标检测任务中,上述数据可以为图像;或者,在语音识别任务中,上述数据可以为音频;或者,在阅读理解任务中,上述数据可以为文本。其他应用场景可以以此类推,在此不再一一举例。
在一个实施场景中,用户可以在用户端执行数据导入操作,从而用户端可以将第二样本数据发送至服务器。示例性地,在数据为图像时,用户可以在用户端执行图像导入操作,当然,也可以执行视频导入操作,从而服务器可以将视频进行分帧处理,得到单帧图像;或者,在数据为音频时,用户可以在用户端执行音频导入操作;或者,在数据文本时,用户可以在用户端执行文本导入操作,如可以将篇章文本、语句文本等执行导入操作,在此不做限定。此外,用户端可以包括但不限于:手机、平板电脑、笔记本电脑等,在此不做限定。
在一个实施场景中,为了便于用户在用户端对第二样本数据进行标注,可以在用户端输出第二样本数据,从而响应于对第二样本数据的标注操作,生成样本批注。需要说明的是,标注操作可以包括如下至少一者:对第二样本数据中至少部分数据的勾选操作、对第二样本数据中若干位置的点选操作、对第二样本数据或第二样本数据中所选数据的备注操作。上述方式,通过在用户端输出第二样本数据并响应于对第二样本数据的标注操作,生成第二样本数据的样本标注,故能够在标注过程中充分利用大模型对多模态数据的理解能力,提升标注便利性。
在一个具体的实施场景中,以第二样本数据是图像为例,可以在用户端显示图像,从而可以响应于在图像中对至少部分图像的勾选操作,生成表征勾选区域的样本标注。示例性地,在勾选区域为矩形的情况下,可以获取勾选区域上角点(如左上角点和右下角点)的位置坐标,从而样本标注可以包含前述角点的位置坐标。此外,也可以响应于对图像中若干位置的点选操作,生成表征点选位置的样本标注。示例性地,用户可以在图像中对诸如嘴角、瞳孔等关键点执行点选操作,从而样本标注可以包含前述嘴角、瞳孔等关键点的位置坐标。此外,还可以响应于对图像中前述勾选区域的备注操作,输入诸如勾选区域中对象的类别、属性等内容的备注信息,从而可以生成包含备注信息的样本标注。示例性地,用户可以对图像中车辆的勾选区域执行备注操作,并输入包含车辆的类型“卡车”的备注信息,从而样本标注可以包含该备注信息“卡车”。此外,还可以响应于对图像的备注操作,输入诸如图像类别、图像属性等内容的备注信息,从而生成包含备注信息的样本标注。示例性地,用户可以对图像执行备注操作,并输入包含图像类别“红外图像”或“可见光图像”的备注信息,从而样本标注可以包含该备注信息。其他情况可以以此类推,在此不再一一举例。当然,第二样本数据的样本其标注具体内容,可以根据第二样本数据后续具体的下游任务而设置。例如,在第二样本数据后续下游任务为目标检测时,样本标注可以包含前述角点的位置坐标;或者,在第二样本数据后续下游任务为关键点检测时,样本标注可以包含前述关键点的位置坐标;或者,在第二样本数据后续下游任务为目标分类时,样本标注可以包含前述对象类别;或者,在第二样本数据后续下游任务为图像分类的情况下,样本标注可以包含前述图像类别。也就是说,本公开实施例中对样本标注的具体内容不做具体限定。
在一个具体的实施场景中,以第二样本数据是音频为例,可以在用户端播放音频,当然与此同时可以显示播放进度条,以支持用户自由点选其中任意音频段。在此基础上,可以响应于对音频中至少部分音频的勾选操作,生成表征勾选区段的样本标注。示例性地,用户可以在音频中勾选其中的有效语音段,从而样本标注可以包含前述有效语音段的时刻区间。此外,也可以响应于对音频中若干位置的点选操作,生成表征点选位置的样本标注。示例性地,用户可以在音频中对诸如有效语音段的开始时刻和结束时刻执行点选操作,从而样本标注可以包含前述开始时刻和结束时刻。此外,还可以响应于对音频中前述勾选区段的备注操作,输入诸如勾选区段的对应文本等备注信息,从而可以生成包含备注信息的样本标注。示例性地,用户可以对音频中勾选的有效语音段执行备注操作,并输入包含其对应文本如“今天天气不错”的备注信息,从而样本标注中可以包含该备注信息“今天天气不错”。此外,还可以响应于对音频的备注操作,输入诸如音频来源、对应文本等内容的备注信息,从而生成包含备注信息的样本标注。示例性地,用户可以对音频执行备注操作,并输入包含音频来源“通过移动通信接听”、“通过即时通讯接听”或“通过现场录音”的备注信息,从而样本标注可以包含该备注信息。其他情况可以以此类推,在此不再一一举例。需要说明的是,本公开实施例对样本标注的具体内容不做限定,具体可以参阅前述第二样本数据是图像时对样本标注的相关描述,在此不再赘述。
在一个具体的实施场景中,以第二样本数据是文本为例,可以在用户端显示文本,从而可以响应于在文本中对至少部分字符的勾选操作,生成表征勾选区段的样本标注。示例性地,用户可以在文本中勾选其中表征人名、地名、机构名等实体的提及(mention),从而样本标注可以包含前述提及对应的字符。此外,也可以响应于对文本中若干位置的点选操作,生成表征点选位置的样本标注。示例性地,对于篇章与问题的文本对,用户可以在篇章文本中对能够回答问题文本的词句执行点选操作,从而样本标注可以包含前述词句的开始字符和结束字符。此外,还可以响应于对前述勾选区段的备注操作,输入诸如勾选区段对应实体类别等备注信息,从而可以生成包含备注信息的样本标注。示例性地,用户可以对在文本中勾选的提及执行备注操作,并输入包含其对应实体类别如“人名”的备注信息,从而样本标注中可以包含该备注信息“人名”。此外,还可以响应于对文本的备注操作,输入诸如文本意图、规整文本等内容的备注信息,从而生成包含备注信息的样本标注。示例性地,用户可以对文本“天气怎么样今天”执行备注操作,并输入包含文本意图“询问天气”或规整文本“今天天气怎么样”等备注信息,从而样本标注可以包含该备注信息。其他情况可以以此类推,在此不再一一举例。需要说明的是,本公开实施例对样本标注的具体内容不做限定,具体可以参阅前述第二样本数据是图像时对样本标注的相关描述,在此不再赘述。
在一个实施场景中,与前述样本标注类似地,用户也可以根据第二样本数据候选下游任务向服务器发送对应的第二提示文本,以指示大模型对第二样本数据进行数据标注,并将第二样本数据的样本标注作为大模型的目标输出。示例性地,以第二样本数据是图像为例,如前所述,在下游任务为目标检测时,样本标注可以包含勾选区域角点的位置坐标,则在此情况下,第二提示文本可以是“请框出图像中目标对象”,此处目标对象可以任意期望目标,如车、行人等。其他情况可以以此类推,在此不再一一举例。
在一个实施场景中,为了提升大模型的处理效率,可以预先提取第二样本数据的数据特征。示例性地,在第二样本数据为图像时,可以预先提取图像特征,图像特征可以通过诸如卷积神经网络等深度学习技术提取得到,也可以通过诸如HOG等传统图像特征提取技术提取得到,在此不做限定;或者,在第二样本数据为音频时,可以预先提取音频特征,音频特征可以通过长短期记忆网络等深度学习技术提取得到,也可以通过诸如梅尔频率倒谱系数等传统音频特征提取技术提取得到,在此不做限定;或者,在第二样本数据为文本时,可以预先提取文本特征,文本特征可以通过诸如BERT等深度学习技术提取得到,也可以通过诸如word2vec特征提取工具提取得到,在此不做限定。在此基础上,可以获取大模型结合第二样本数据的数据特征和第二提示文本所分析得到的第二预测标注,从而可以基于第二样本数据的样本标注与第二预测标注之间的差异,调整大模型的网络参数。需要说明的是,差异的具体度量方式,可以参阅诸如交叉熵、均方误差等损失函数的技术细节,在此不再赘述。此外,参数的具体调整过程,可以参阅诸如梯度下降等优化方式的技术细节,在此亦不再赘述。上述方式,预先提取第二样本数据的数据特征,并获取大模型结合第二样本数据的数据特征和第二提示文本所分析得到的第二预测标注,从而基于第二样本数据的样本标注与第二预测标注之间的差异,调整大模型的网络参数,进而能够在大模型正式处理之前,预先储备第二样本数据的数据特征,有助于提升后续大模型处理效率。
在另一个实施场景中,区别于前述实施方式,得益于大模型对不同模态数据优异的兼容性,也可以直接将第二样本数据及其第二提示文本输入至大模型,从而可以由大模型根据第二提示文本对第二样本数据执行相应分析,进而可以获取大模型所输出的第二预测标注。在此基础上,与前述实施方式类似地,可以基于第二样本数据的样本标注与第二预测标注之间的差异,调整大模型的网络参数。
需要说明的是,上述过程中先通过带有样本标注的第二样本数据进行“半自动流程”的预训练,能够对大模型进行初始训练,以使大模型初步具备根据用户需求进行数据标注的模型能力,再利用不带样本标注的第一样本数据进行第二阶段“全自动流程”的模型训练,能够在尽可能地减少人工参与的情况下,进一步提升大模型的标注能力。
上述方案,接收用户端对第一样本数据的第一提示文本,且第一提示文本用于指示大模型对第一样本数据所执行的标注任务,大模型能够执行任务集合中任一任务,第一提示文本所指示的第一标注任务为任务集合中任一任务,从而将第一样本数据及其第一提示文本输入大模型,得到大模型输出的第一样本数据的第一预测标注,并发送第一预测标注至用户端,进而接收用户端对第一预测标注进行校核之后的校核标注,以基于第一样本数据及其第一样本信息训练大模型,且第一样本信息包括第一样本数据的校核标注和第一提示文本,训练之后的大模型用于处理待标注数据及其提示文本输出待标注数据的预测标注,且提示文本所指示的标注任务为第一标注任务,或任务集合中不同于第一标注任务的任一任务,一方面在大模型训练过程中第一样本数据无需再依赖于样本标注,能够尽可能降低对人工标注的依赖,有助于降低数据标注成本,另一方面通过对预测标注的校核标注重新对大模型进行训练,从而能够自动实现对大模型的迭代优化,有助于提升数据标注精度。此外,区别于传统网络模型,训练阶段对第一样本数据的标注任务和推理阶段对待标注数据的标注任务不拘于必须相同,故应用场景得到极大拓宽。故此,能够降低数据标注成本,并提升数据标注精度,以及扩宽数据标注的适用范围。
请参阅图2,图2是本申请用于数据标注的大模型训练方法另一实施例的流程示意图。需要说明的是,本公开实施例中方法步骤由用户端执行。此外,用户端可以包括但不限于:手机、平板电脑、笔记本电脑等,在此对用户端的具体形式不做限定。具体而言,可以包括如下步骤:
步骤S21:发送对第一样本数据的第一提示文本,并接收服务器将第一样本数据及其第一提示文本输入大模型之后大模型输出的第一样本数据的第一预测标注。
本公开实施例中,第一提示文本用于指示大模型对第一样本数据所执行的标注任务,且大模型能够执行任务集合中任一任务,第一提示文本所指示的第一标注任务为任务集合中任一任务,具体可以参阅前述公开实施例中相关描述,在此不再赘述。
步骤S22:获取对第一预测标注进行校核之后的校核标注,并发送第一样本数据的校核标注至服务器。
本公开实施例中,服务器基于第一样本数据及其第一样本信息训练大模型,且第一样本信息包括第一样本数据的校核标注和第一提示文本,具体可以参阅前述公开实施例中相关描述,在此不再赘述。此外,训练之后的大模型用于处理待标注数据及其提示文本输出待标注数据的预测标注,提示文本所指示的标注任务为第一标注任务,或任务集合中不同于第一标注任务的任一任务。
在一个实施场景中,在接收服务器反馈的第一预测标注之后,以及在获取对第一预测标注进行校核之后的校核标注之前,还可以在第一样本数据上叠加显示第一预测标注。以第一样本数据为样本图像为例,可以将第一预测标注叠加于样本图像并重新编码,得到样本图像的标注后图像,并显示标注后图像,且第一预测标注在标注后图像中为可编辑状态,当然,第一预测标注在标注后图像中也可以为不可编辑状态,在此不做限定。具体可以参阅前述公开实施例中相关描述,在此不再赘述。
当然,作为一种可能的实施方式,在步骤S21之前,还可以先发送第二样本数据的第二样本信息至服务器。需要说明的是,第二样本信息包括样本标注和用于指示大模型对第二样本数据所执行标注任务的第二提示文本,且服务器基于第二样本数据及其第二样本信息预训练大模型,具体可以参阅前述公开实施例中相关描述,在此不再赘述。第二提示文本所指示的第二标注任务可以为第一标注任务,或任务集合中不同于第一标注任务的任一任务。此外,在发送第二样本数据的第二样本信息至服务器之前,可以先输出第二样本数据,并响应于对第二样本数据的标注操作,生成样本标注,且标注操作包括以下至少一者:对第二样本数据中至少部分数据的勾选操作、对第二样本数据中若干位置的点选操作、对第二样本数据或第二样本数据中所选数据的备注操作。具体可以参阅前述公开实施例中相关描述,在此不再赘述。
需要说明的是,本公开实施例与前述公开实施例中相似或相同之处,可以参阅前述公开实施例中相关描述,在此不再赘述。
上述方案,一方面在大模型训练过程中第一样本数据无需再依赖于样本标注,能够尽可能降低对人工标注的依赖,有助于降低数据标注成本,另一方面通过对预测标注的校核标注重新对大模型进行训练,从而能够自动实现对大模型的迭代优化,有助于提升数据标注精度。此外,区别于传统网络模型,训练阶段对第一样本数据的标注任务和推理阶段对待标注数据的标注任务不拘于必须相同,故应用场景得到极大拓宽。故此,能够降低数据标注成本,并提升数据标注精度,以及扩宽数据标注的适用范围。
请参阅图3,图3是本申请数据标注方法一实施例的流程示意图。具体而言,可以包括如下步骤:
步骤S31:获取待标注数据及其提示文本。
本公开实施中,提示文本用于指示大模型对待标注数据所执行的标注任务,大模型基于前述任一训练方法实施例中的训练流程得到,具体可以参阅前述公开实施例,在此不再赘述。此外,如前述公开实施例所述,根据待标注数据后续下游任务的不同,待标注可以是图像、文本、音频中任一者,而提示文本也可以根据下游任务而进行设置。具体亦可以参阅前述公开实施例中相关描述,在此亦不再赘述。当然,提示文本所指示的标注任务具体可以为大模型所能够执行任务集合中任一任务。关于任务集合的具体含义,可以参阅前述公开实施例,在此不再赘述。
步骤S32:将待标注数据及其提示文本输入大模型,获取由大模型输出的待标注数据的预测标注。
具体地,可以将提示文本与待标注数据一同摄入至大模型,以得到大模型所输出的预测标注。当然,如前述公开实施例中所述,也可以先提取待标注数据的数据特征,并将待标注数据的数据特征和提示文本输入至大模型,以得到大模型所输出的预测标注。具体过程可以参阅前述公开实施例中相关描述,在此不再赘述。
此外,需要说明的是,如前述公开实施例中所述,用户端可以通过导入操作,将待标注数据发送至服务器,并将提示文本也发送至服务器,从而服务器可以利用大模型按照提示文本所指示对待标注数据进行标注,得到待标注数据的预测标注,并将待标注数据的预测标注发送至用户端,从而用户端在收集到带有预测标注的待标注数据之后,可以基于此再进行后续下游任务的模型训练。下游任务具体可以如前述公开实施例中所述,在此亦不再赘述。
上述方案,获取待标注数据及其提示文本,且提示文本用于指示大模型对待标注数据所执行的标注任务,大模型基于前述任一训练方法实施例中的训练流程得到,大模型能够执行任务集合中任一任务,且提示文本所指示的标注任务为任务集合中任一任务,故能够降低数据标注成本,并提升数据标注精度,基于此再将待标注数据及其提示文本输入大模型,获取由大模型输出的待标注数据的预测标注,能够提升带有预测标注的待标注数据后续在下游任务中进行模型训练的准确性。
请参阅图4,图4是本申请用于数据标注的大模型训练装置40一实施例的框架示意图。用于数据标注的大模型训练装置40可以包括:第一接收模块41、标注预测模块42、标注发送模块43、标注接收模块44和训练模块45,第一接收模块41,用于接收用户端对第一样本数据的第一提示文本;其中,第一提示文本用于指示大模型对第一样本数据所执行的标注任务;标注预测模块42,用于将第一样本数据及其第一提示文本输入大模型,得到大模型输出的第一样本数据的第一预测标注;其中,大模型能够执行任务集合中任一任务,第一提示文本所指示的第一标注任务为任务集合中任一任务;标注发送模块43,用于发送第一预测标注至用户端;标注接收模块44,用于接收用户端对第一预测标注进行校核之后的校核标注;训练模块45,用于基于第一样本数据及其第一样本信息训练大模型;其中,第一样本信息包括第一样本数据的校核标注和第一提示文本,训练之后的大模型用于处理待标注数据及其提示文本输出待标注数据的预测标注,且提示文本所指示的标注任务为第一标注任务,或任务集合中不同于第一标注任务的任一任务。
上述方案,用于数据标注的大模型训练装置40一方面在大模型训练过程中第一样本数据无需再依赖于样本标注,能够尽可能降低对人工标注的依赖,有助于降低数据标注成本,另一方面通过对预测标注的校核标注重新对大模型进行训练,从而能够自动实现对大模型的迭代优化,有助于提升数据标注精度。此外,区别于传统网络模型,训练阶段对第一样本数据的标注任务和推理阶段对待标注数据的标注任务不拘于必须相同,故应用场景得到极大拓宽。故此,能够降低数据标注成本,并提升数据标注精度,以及扩宽数据标注的适用范围。
在一些公开实施例中,用于数据标注的大模型训练装置40还包括第二接收模块,用于接收用户端对第二样本数据的第二样本信息,第二样本信息包括样本标注和用于指示大模型对第二样本数据所执行标注任务的第二提示文本,第二提示文本所指示的第二标注任务为第一标注任务,或任务集合中不同于第一标注任务的任一任务,用于数据标注的大模型训练装置40还包括预训练模块,用于基于第二样本数据及其第二样本信息预训练大模型。
在一些公开实施例中,预训练模块包括特征提取子模块,用于提取第二样本数据的数据特征;预训练模块包括标注获取子模块,用于获取大模型结合第二样本数据的数据特征和第二提示文本所输出的第二预测标注;预训练模块包括参数调整子模块,用于基于第二样本数据的样本标注与第二预测标注之间的差异,调整大模型的网络参数。
在一些公开实施例中,用于数据标注的大模型训练装置40包括数目判断模块,用于判断具备校核标注的第一样本数据当前已累积的总数目是否超出预设阈值;再训练模块45具体用于响应于总数目超出预设阈值,基于第一样本数据及其第一样本信息训练大模型。
请参阅图5,图5是本申请用于数据标注的大模型训练装置50另一实施例的框架示意图。用于数据标注的大模型训练装置50包括:第一发送模块51、标注接收模块52、标注校核模块53和标注发送模块54,第一发送模块51,用于发送对第一样本数据的第一提示文本;其中,第一提示文本用于指示大模型对第一样本数据所执行的标注任务;标注接收模块52,用于接收服务器将第一样本数据及其第一提示文本输入大模型之后由大模型输出的第一样本数据的第一预测标注,大模型能够执行任务集合中任一任务,第一提示文本所指示的第一标注任务为任务集合中任一任务;标注校核模块53,用于获取对第一预测标注进行校核之后的校核标注;标注发送模块54,用于发送第一样本数据的校核标注至服务器;其中,服务器基于第一样本数据及其第一样本信息训练大模型,且第一样本信息包括第一样本数据的校核标注和第一提示文本,训练之后的大模型用于处理待标注数据及其提示文本输出待标注数据的预测标注,提示文本所指示的标注任务为第一标注任务,或任务集合中不同于第一标注任务的任一任务。
上述方案,用于数据标注的大模型训练装置50一方面在大模型训练过程中第一样本数据无需再依赖于样本标注,能够尽可能降低对人工标注的依赖,有助于降低数据标注成本,另一方面通过对预测标注的校核标注重新对大模型进行训练,从而能够自动实现对大模型的迭代优化,有助于提升数据标注精度。此外,区别于传统网络模型,训练阶段对第一样本数据的标注任务和推理阶段对待标注数据的标注任务不拘于必须相同,故应用场景得到极大拓宽。故此,能够降低数据标注成本,并提升数据标注精度,以及扩宽数据标注的适用范围。
在一些公开实施例中,用于数据标注的大模型训练装置50还包括第二发送模块,用于发送第二样本数据的第二样本信息至服务器,第二样本信息包括样本标注和用于指示大模型对第二样本数据所执行标注任务的第二提示文本,第二提示文本所指示的第二标注任务为第一标注任务,或任务集合中不同于第一标注任务的任一任务,服务器基于第二样本数据及其第二样本信息预训练大模型。
在一些公开实施例中,用于数据标注的大模型训练装置50还包括数据输出模块,用于输出第二样本数据;用于数据标注的大模型训练装置50还包括标注生成模块,用于响应于对第二样本数据的标注操作,生成样本标注;其中,标注操作包括以下至少一者:对第二样本数据中至少部分数据的勾选操作、对第二样本数据中若干位置的点选操作、对第二样本数据或第二样本数据中所选数据的备注操作。
在一些公开实施例中,用于数据标注的大模型训练装置50还包括标注叠加模块,用于在第一样本数据上叠加显示第一预测标注。
在一些公开实施例中,第一样本数据为样本图像,标注叠加模块包括重编码子模块,用于将第一预测标注叠加于样本图像并重新编码,得到样本图像的标注后图像;标注叠加模块包括图像显示子模块,用于显示标注后图像;其中,第一预测标注在标注后图像中为可编辑状态。
请参阅图6,图6是本申请数据标注装置60一实施例的框架示意图。数据标注装置60包括:获取模块61和标注模块62,获取模块61,用于获取待标注数据及其提示文本;其中,提示文本用于指示大模型对待标注数据所执行的标注任务,大模型由上述任一用于数据标注的大模型训练装置得到,大模型能够执行任务集合中任一任务,提示文本所指示的标注任务为任务集合中任一任务,标注模块62,用于将待标注任务及其提示文本输入大模型,获取由大模型输出的待标注数据的预测标注。
上述方案,数据标注装置60获取待标注数据及其提示文本,且提示文本用于指示大模型对待标注数据所执行的标注任务,大模型基于前述任一训练装置得到,大模型能够执行任务集合中任一任务,提示文本所指示的标注任务为任务集合中任一任务,故能够降低数据标注成本,并提升数据标注精度,基于此再将待标注任务及其提示文本输入大模型,获取由大模型输出的待标注数据的预测标注,能够提升带有预测标注的待标注数据后续在下游任务中进行模型训练的准确性。
请参阅图7,图7是本申请电子设备70一实施例的框架示意图。电子设备70包括通信电路71、存储器72和处理器73,通信电路71、存储器72分别耦接于处理器73,存储器72存储有程序指令,处理器73用于执行程序指令以实现上述任一用于数据标注的大模型训练方法实施例中步骤,或实现上述任一数据标注方法实施例中步骤,具体可以参阅前述公开实施例,在此不再赘述。需要说明的是,电子设备70可以包括但不限于:服务器、台式计算机、笔记本电脑等,在此不做限定。
具体地,处理器73还可以称为CPU(Central Processing Unit,中央处理单元)。处理器73可能是一种集成电路芯片,具有信号的处理能力。处理器73还可以是通用处理器、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外,处理器73可以由多个成电路芯片共同实现。
上述方案,电子设备70中处理器73实现上述任一用于数据标注的大模型训练方法实施例中步骤,或实现上述数据标注方法实施例中步骤,一方面在大模型训练过程中第一样本数据无需再依赖于样本标注,能够尽可能降低对人工标注的依赖,有助于降低数据标注成本,另一方面通过对预测标注的校核标注重新对大模型进行训练,从而能够自动实现对大模型的迭代优化,有助于提升数据标注精度。此外,区别于传统网络模型,训练阶段对第一样本数据的标注任务和推理阶段对待标注数据的标注任务不拘于必须相同,故应用场景得到极大拓宽。故此,能够降低数据标注成本,并提升数据标注精度,以及扩宽数据标注的适用范围。
请参阅图8,图8是本申请数据标注系统80一实施例的框架示意图。数据标注系统80包括通信连接的服务器81和用户端82,服务器81用于执行前述由服务器执行的训练方法实施例中步骤或数据标注方法实施例中步骤,用户端82用于执行前述由用户端执行的训练方法实施例中步骤,具体可以参阅前述方法实施例中步骤,在此不再赘述。需要说明的是,数据标注系统80中服务器81可以采用分布式架构,也可以采用集中式架构,在此不做限定。数据标注系统80中用户端82可以为一台、两台、三台或三台以上,在此对用户端82的数量亦不做限定。
上述方案,数据标注系统80能够降低数据标注成本,并提升数据标注精度,以及拓宽数据标注的应用范围。此外,基于此进行数据标注,能够提高后续在下游任务中进行模型训练的准确性。
请参阅图9,图9是本申请计算机可读存储介质90一实施例的框架示意图。计算机可读存储介质90存储有处理器可运行的程序指令91,该程序指令91能够被执行,用以实现上述任一用于数据标注的大模型训练方法实施例中步骤,或实现上述任一数据标注方法实施例中步骤。
需要说明的是,计算机可读存储介质90具体可以为U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等可以存储程序指令91的介质,或者也可以为存储有该程序指令91的服务器,该服务器可将存储的程序指令91发送给其他设备运行,或者也可以自运行该存储的程序指令91。
上述方案,计算机可读存储介质90能够降低数据标注成本,并提升数据标注精度,以及拓宽数据标注的应用范围。此外,基于此进行数据标注,能够提高后续在下游任务中进行模型训练的准确性。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
若本申请技术方案涉及个人信息,应用本申请技术方案的产品在处理个人信息前,已明确告知个人信息处理规则,并取得个人自主同意。若本申请技术方案涉及敏感个人信息,应用本申请技术方案的产品在处理敏感个人信息前,已取得个人单独同意,并且同时满足“明示同意”的要求。例如,在摄像头等个人信息采集装置处,设置明确显著的标识告知已进入个人信息采集范围,将会对个人信息进行采集,若个人自愿进入采集范围即视为同意对其个人信息进行采集;或者在个人信息处理的装置上,利用明显的标识/信息告知个人信息处理规则的情况下,通过弹窗信息或请个人自行上传其个人信息等方式获得个人授权;其中,个人信息处理规则可包括个人信息处理者、个人信息处理目的、处理方式以及处理的个人信息种类等信息。

Claims (16)

1.一种用于数据标注的大模型训练方法,其特征在于,包括:
接收用户端对第一样本数据的第一提示文本,并将所述第一样本数据及其第一提示文本输入大模型,得到所述大模型输出的所述第一样本数据的第一预测标注,以及发送所述第一预测标注至用户端;其中,所述第一提示文本用于指示所述大模型对所述第一样本数据所执行的标注任务,且所述大模型能够执行任务集合中任一任务,所述第一提示文本所指示的第一标注任务为所述任务集合中任一任务;
接收用户端对所述第一预测标注进行校核之后的校核标注;
基于所述第一样本数据及其第一样本信息训练所述大模型;其中,所述第一样本信息包括所述第一样本数据的校核标注和第一提示文本,训练之后的大模型用于处理对待标注数据及其提示文本输出所述待标注数据的预测标注,且所述提示文本所指示的标注任务为所述第一标注任务,或所述任务集合中不同于所述第一标注任务的任一任务。
2.根据权利要求1所述的方法,其特征在于,在所述接收用户端对第一样本数据的第一提示文本之前,所述方法还包括:
接收用户端对第二样本数据的第二样本信息;其中,所述第二样本信息包括样本标注和用于指示大模型对所述第二样本数据所执行标注任务的第二提示文本,所述第二提示文本所指示的第二标注任务为所述第一标注任务,或所述任务集合中不同于所述第一标注任务的任一任务;
基于所述第二样本数据及其第二样本信息预训练所述大模型。
3.根据权利要求2所述的方法,其特征在于,所述基于所述第二样本数据及其第二样本信息预训练所述大模型,包括:
提取所述第二样本数据的数据特征;
获取所述大模型结合所述第二样本数据的数据特征和第二提示文本所输出的第二预测标注;
基于所述第二样本数据的样本标注与第二预测标注之间的差异,调整所述大模型的网络参数。
4.根据权利要求1所述的方法,其特征在于,在所述基于所述第一样本数据及其第一样本信息训练所述大模型之前,所述方法还包括:
判断具备所述校核标注的第一样本数据当前已累积的总数目是否超出预设阈值;
所述基于所述第一样本数据及其第一样本信息训练所述大模型,包括:
响应于所述总数目超出所述预设阈值,基于所述第一样本数据及其第一样本信息训练所述大模型。
5.一种用于数据标注的大模型训练方法,其特征在于,包括:
发送对第一样本数据的第一提示文本,并接收服务器将所述第一样本数据及其第一提示文本输入大模型之后由所述大模型输出的所述第一样本数据的第一预测标注;其中,所述第一提示文本用于指示所述大模型对所述第一样本数据所执行的标注任务,且所述大模型能够执行任务集合中任一任务,所述第一提示文本所指示的第一标注任务为所述任务集合中任一任务;
获取对所述第一预测标注进行校核之后的校核标注,并发送所述第一样本数据的校核标注至服务器;其中,所述服务器基于所述第一样本数据及其第一样本信息训练所述大模型,且所述第一样本信息包括所述第一样本数据的校核标注和第一提示文本,训练之后的大模型用于处理待标注数据及其提示文本输出所述待标注数据的预测标注,所述提示文本所指示的标注任务为所述第一标注任务,或所述任务集合中不同于所述第一标注任务的任一任务。
6.根据权利要求5所述的方法,其特征在于,所述发送对第一样本数据的第一提示文本之前,所述方法还包括:
发送第二样本数据的第二样本信息至服务器;其中,所述第二样本信息包括样本标注和用于指示大模型对所述第二样本数据所执行标注任务的第二提示文本,所述第二提示文本所指示的第二标注任务为所述第一标注任务,或所述任务集合中不同于所述第一标注任务的任一任务,且服务器基于所述第二样本数据及其第二样本信息预训练所述大模型。
7.根据权利要求6所述的方法,其特征在于,在所述发送第二样本数据的第二样本信息至服务器之前,所述方法还包括:
输出所述第二样本数据;
响应于对所述第二样本数据的标注操作,生成所述样本标注;其中,所述标注操作包括以下至少一者:对所述第二样本数据中至少部分数据的勾选操作、对所述第二样本数据中若干位置的点选操作、对所述第二样本数据或所述第二样本数据中所选数据的备注操作。
8.根据权利要求5所述的方法,其特征在于,在所述接收服务器将所述第一样本数据及其第一提示文本输入大模型之后由所述大模型输出的所述第一样本数据的第一预测标注之后,以及在所述获取对所述第一预测标注进行校核之后的校核标注之前,所述方法还包括:
在所述第一样本数据上叠加显示所述第一预测标注。
9.根据权利要求8所述的方法,其特征在于,所述第一样本数据为样本图像,所述在所述第一样本数据上叠加显示所述第一预测标注,包括:
将所述第一预测标注叠加于所述样本图像并重新编码,得到所述样本图像的标注后图像,并显示所述标注后图像;其中,所述第一预测标注在所述标注后图像中为可编辑状态。
10.一种数据标注方法,其特征在于,包括:
获取待标注数据及其提示文本;其中,所述提示文本用于指示大模型对所述待标注数据所执行的标注任务,所述大模型由权利要求1至9任一项所述的训练方法得到,所述大模型能够执行任务集合中任一任务,且所述提示文本所指示的标注任务为所述任务集合中任一任务;
将待标注数据及其提示文本输入所述大模型,获取由所述大模型输出的所述待标注数据的预测标注。
11.一种用于数据标注的大模型训练装置,其特征在于,包括:
第一接收模块,用于接收用户端对第一样本数据的第一提示文本;其中,所述第一提示文本用于指示所述大模型对所述第一样本数据所执行的标注任务,且所述大模型能够执行任务集合中任一任务,所述第一提示文本所指示的第一标注任务为所述任务集合中任一任务;
标注预测模块,用于将所述第一样本数据及其第一提示文本输入大模型,得到所述大模型输出的所述第一样本数据的第一预测标注;
标注发送模块,用于发送所述第一预测标注至用户端;
标注接收模块,用于接收用户端对所述第一预测标注进行校核之后的校核标注;
训练模块,用于基于所述第一样本数据及其第一样本信息训练所述大模型;其中,所述第一样本信息包括所述第一样本数据的校核标注和第一提示文本,且训练之后的大模型用于处理待标注数据及其提示文本输出所述待标注数据的预测标注,且所述提示文本所指示的标注任务为所述第一标注任务,或所述任务集合中不同于所述第一标注任务的任一任务。
12.一种用于数据标注的大模型训练装置,其特征在于,包括:
第一发送模块,用于发送对第一样本数据的第一提示文本;其中,所述第一提示文本用于指示所述大模型对所述第一样本数据所执行的标注任务,且所述大模型能够执行任务集合中任一任务,所述第一提示文本所指示的第一标注任务为所述任务集合中任一任务;
标注接收模块,用于接收服务器将所述第一样本数据及其第一提示文本输入大模型之后由所述大模型输出的所述第一样本数据的第一预测标注;
标注校核模块,用于获取对所述第一预测标注进行校核之后的校核标注;
标注发送模块,用于发送所述第一样本数据的校核标注至服务器;其中,服务器基于所述第一样本数据及其第一样本信息训练所述大模型,所述第一样本信息包括所述第一样本数据的校核标注和第一提示文本,训练之后的大模型用于处理待标注数据及其提示文本输出所述待标注数据的预测标注,且所述提示文本所指示的标注任务为所述第一标注任务,或所述任务集合中不同于所述第一标注任务的任一任务。
13.一种数据标注装置,其特征在于,包括:
获取模块,用于获取待标注数据及其提示文本;其中,所述提示文本用于指示大模型对所述待标注数据所执行的标注任务,所述大模型由权利要求11或12所述的训练装置得到,所述大模型能够执行任务集合中任一任务,且所述提示文本所指示的标注任务为所述任务集合中任一任务;
标注模块,用于将待标注任务及其提示文本输入所述大模型,获取由所述大模型输出的按照所述提示文本分析得到。
14.一种电子设备,其特征在于,包括通信电路、存储器和处理器,所述通信电路、所述存储器分别耦接于所述处理器,所述存储器存储有程序指令,所述处理器用于执行所述程序指令以实现权利要求1至10任一项所述的方法。
15.一种数据标注系统,其特征在于,包括通信连接的服务器和用户端,所述服务器用于执行权利要求1至4任一项所述的方法,或执行权利要求10所述的方法,所述用户端用于执行权利要求5至9任一项所述的方法。
16.一种计算机可读存储介质,其特征在于,存储有能够被处理器运行的程序指令,所述程序指令用于实现权利要求1至10任一项所述的方法。
CN202311161510.2A 2023-09-11 2023-09-11 大模型训练方法及相关方法、装置、设备、系统和介质 Pending CN116894192A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311161510.2A CN116894192A (zh) 2023-09-11 2023-09-11 大模型训练方法及相关方法、装置、设备、系统和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311161510.2A CN116894192A (zh) 2023-09-11 2023-09-11 大模型训练方法及相关方法、装置、设备、系统和介质

Publications (1)

Publication Number Publication Date
CN116894192A true CN116894192A (zh) 2023-10-17

Family

ID=88315254

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311161510.2A Pending CN116894192A (zh) 2023-09-11 2023-09-11 大模型训练方法及相关方法、装置、设备、系统和介质

Country Status (1)

Country Link
CN (1) CN116894192A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114417974A (zh) * 2021-12-22 2022-04-29 北京百度网讯科技有限公司 模型训练方法、信息处理方法、装置、电子设备和介质
CN114925748A (zh) * 2022-04-20 2022-08-19 北京市商汤科技开发有限公司 模型训练及模态信息的预测方法、相关装置、设备、介质
CN115658885A (zh) * 2022-08-25 2023-01-31 粤港澳大湾区数字经济研究院(福田) 文本智能标注方法、系统、智能终端及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114417974A (zh) * 2021-12-22 2022-04-29 北京百度网讯科技有限公司 模型训练方法、信息处理方法、装置、电子设备和介质
CN114925748A (zh) * 2022-04-20 2022-08-19 北京市商汤科技开发有限公司 模型训练及模态信息的预测方法、相关装置、设备、介质
CN115658885A (zh) * 2022-08-25 2023-01-31 粤港澳大湾区数字经济研究院(福田) 文本智能标注方法、系统、智能终端及存储介质

Similar Documents

Publication Publication Date Title
EP3432197B1 (en) Method and device for identifying characters of claim settlement bill, server and storage medium
CN109271401B (zh) 一种题目搜索、批改方法、装置、电子设备和存储介质
CN110147726B (zh) 业务质检方法和装置、存储介质及电子装置
CN111144191B (zh) 字体识别方法、装置、电子设备及存储介质
CN109034069B (zh) 用于生成信息的方法和装置
CN107423278B (zh) 评价要素的识别方法、装置及系统
CN111582241A (zh) 视频字幕识别方法、装置、设备及存储介质
CN109284355B (zh) 一种批改试卷中口算题的方法及装置
CN112800848A (zh) 票据识别后信息结构化提取方法、装置和设备
CN104915420B (zh) 知识库数据处理方法及系统
CN112149663A (zh) 结合rpa和ai的图像文字的提取方法、装置及电子设备
CN110874534A (zh) 数据处理方法和数据处理装置
CN111144079A (zh) 一种智能获取学习资源的方法、装置、打印机和存储介质
CN112488222B (zh) 一种众包数据标注方法、系统、服务器及存储介质
CN116244410B (zh) 一种基于知识图谱和自然语言的指标数据分析方法及系统
CN113221918A (zh) 目标检测方法、目标检测模型的训练方法及装置
CN107844531B (zh) 答案输出方法、装置和计算机设备
CN114357206A (zh) 基于语义分析的教育类视频彩色字幕生成方法及系统
CN111488737B (zh) 文本识别方法、装置及设备
CN111369294A (zh) 软件造价估算方法及装置
CN117891940B (zh) 多模态讽刺检测方法、装置、计算机设备以及存储介质
CN112699671B (zh) 一种语言标注方法、装置、计算机设备和存储介质
CN117709317A (zh) 报表文件的处理方法、装置及电子设备
CN111986259B (zh) 颜文字检测模型的训练、视频数据的审核方法及相关装置
CN112542163B (zh) 智能语音交互方法、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20231017