CN116910252A - 一种大模型风险管理框架构建的方法、装置及设备 - Google Patents
一种大模型风险管理框架构建的方法、装置及设备 Download PDFInfo
- Publication number
- CN116910252A CN116910252A CN202310835478.5A CN202310835478A CN116910252A CN 116910252 A CN116910252 A CN 116910252A CN 202310835478 A CN202310835478 A CN 202310835478A CN 116910252 A CN116910252 A CN 116910252A
- Authority
- CN
- China
- Prior art keywords
- corpus
- label
- large model
- topic
- keywords
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000010276 construction Methods 0.000 claims description 33
- 238000012545 processing Methods 0.000 claims description 10
- 239000000463 material Substances 0.000 claims description 7
- 230000000153 supplemental effect Effects 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 description 18
- 238000003860 storage Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 12
- 238000012549 training Methods 0.000 description 12
- 238000004590 computer program Methods 0.000 description 10
- 230000002265 prevention Effects 0.000 description 10
- 238000000605 extraction Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000006399 behavior Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 239000013589 supplement Substances 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- 241000282414 Homo sapiens Species 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 238000011269 treatment regimen Methods 0.000 description 2
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Library & Information Science (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Machine Translation (AREA)
Abstract
本说明书一个或多个实施例公开了一种大模型风险管理框架构建的方法、装置及设备。所述方法包括:基于原始语料集中各个语料类型对应的原始文本语料,确定各个所述语料类型的语料标签和对所述语料标签进行解释的标签定义,基于所述语料标签构建所述大模型风险管理框架的语料标签层;从所述语料类型对应的所述标签定义中,提取标记所述语料类型对应的风险的标签关键词,基于所述标签关键词构建所述大模型风险管理框架的关键词层;根据所述语料标签对应的所述标签定义,生成包含与所述语料标签对应的所述标签关键词的文本语料,基于所述文本语料构建所述大模型风险管理框架的文本语料层。
Description
技术领域
本说明书涉及数据处理技术领域,尤其涉及一种大模型风险管理框架构建的方法、装置及设备。
背景技术
随着人工智能的发展,大模型被广泛应用于自然语言处理领域的人机交互中。大模型通常根据它在训练数据中学到的上下文来生成回答。训练数据的质量、数量和多样性对于大模型的表现至关重要。如果有足够的多样化数据,大模型就能够生成有用、有趣和正确的回答。
目前,人们对自己的隐私数据越来越关注,但是如果训练数据中包括了敏感和隐私的个人信息,大模型可能就会在不经意间将这些个人信息转换为生成内容。同样的,如果训练数据中存在意识形态与价值取向、不良信息、虚假信息、歧视等安全缺陷,大模型可能就会在生成内容中重现这些安全缺陷。现有的用于对大模型进行风险管控优化的大模型风险管理框架的难以满足风险管控需求。因此,目前亟需提供一种更优的大模型风险管理框架构建方案。
发明内容
本说明书实施例提供一种大模型风险管理框架构建的方法、装置及设备,以提供一种符合风险防控相关人员预期的大模型风险管理框架构建方案。
第一方面,本说明书一个或多个实施例提供一种大模型风险管理框架构建的方法,包括:基于原始语料集中各个语料类型对应的原始文本语料,确定各个所述语料类型的语料标签和对所述语料标签进行解释的标签定义,基于所述语料标签构建所述大模型风险管理框架的语料标签层;从所述语料类型对应的所述标签定义中,提取标记所述语料类型对应的风险的标签关键词,基于所述标签关键词构建所述大模型风险管理框架的关键词层;根据所述语料标签对应的所述标签定义,生成包含与所述语料标签对应的所述标签关键词的文本语料,基于所述文本语料构建所述大模型风险管理框架的文本语料层。
第二方面,本说明书实施例提供了一种大模型风险管理框架构建的装置,包括:基于原始语料集中各个语料类型对应的原始文本语料,确定各个所述语料类型的语料标签和对所述语料标签进行解释的标签定义,基于所述语料标签构建所述大模型风险管理框架的语料标签层;从所述语料类型对应的所述标签定义中,提取标记所述语料类型对应的风险的标签关键词,基于所述标签关键词构建所述大模型风险管理框架的关键词层;根据所述语料标签对应的所述标签定义,生成包含与所述语料标签对应的所述标签关键词的文本语料,基于所述文本语料构建所述大模型风险管理框架的文本语料层。
第三方面,本说明书实施例提供了一种电子设备,该电子设备包括:基于原始语料集中各个语料类型对应的原始文本语料,确定各个所述语料类型的语料标签和对所述语料标签进行解释的标签定义,基于所述语料标签构建所述大模型风险管理框架的语料标签层;从所述语料类型对应的所述标签定义中,提取标记所述语料类型对应的风险的标签关键词,基于所述标签关键词构建所述大模型风险管理框架的关键词层;根据所述语料标签对应的所述标签定义,生成包含与所述语料标签对应的所述标签关键词的文本语料,基于所述文本语料构建所述大模型风险管理框架的文本语料层。
第四方面,本说明书实施例提供一种存储介质,用于存储计算机程序,所述计算机程序能够被处理器执行以实现以下流程:基于原始语料集中各个语料类型对应的原始文本语料,确定各个所述语料类型的语料标签和对所述语料标签进行解释的标签定义,基于所述语料标签构建所述大模型风险管理框架的语料标签层;从所述语料类型对应的所述标签定义中,提取标记所述语料类型对应的风险的标签关键词,基于所述标签关键词构建所述大模型风险管理框架的关键词层;根据所述语料标签对应的所述标签定义,生成包含与所述语料标签对应的所述标签关键词的文本语料,基于所述文本语料构建所述大模型风险管理框架的文本语料层。
附图说明
为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个实施例中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本说明书一实施例的一种大模型风险管理框架构建的方法的示意性流程图。
图2是根据本说明书一实施例的一种大模型风险管理框架构建的方法的应用场景示意图。
图3是根据本说明书一实施例的一种风险管理四级框架的结构示意图。
图4是根据本说明书一实施例的一种大模型风险管理框架构建的方法的示意性流程图。
图5是根据本说明书一实施例的一种大模型风险管理框架构建的装置的结构示意图。
图6是根据本说明书一实施例的一种电子设备的结构示意图。
具体实施方式
下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本说明书的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
下面结合附图,通过具体的实施例及其应用场景对本说明书实施例提供的大模型风险管理框架构建的方法、装置及设备进行详细地说明。
大模型可以是模型参数超过预设数量阈值和/或模型结构的复杂度超过预设复杂度阈值的模型,在实际应用中,大模型往往可以是具有大规模模型参数的深度学习模型,通常包含上亿、上百亿、上千亿、上万亿甚至十万亿以上的模型参数。大模型又可以通过大规模无标注的语料进行大模型的预训练,产出亿级以上参数的预训练模型,这种模型能适应广泛的下游任务,模型具有较好的泛化能力,例如大规模语言模型(Large LanguageModel,LLM)、多模态预训练模型(multi-modal pre-training model)等。通常,大模型可以包括对话类大规模语言模型。
大模型主要的应用场景包括数字助理、智能机器人、搜索、在线教育、办公软件、电子商务、智能设计等。应用于人机交互场景(如智能机器人)时,大模型基于用户给出的指令生成答复。
目前大模型的训练数据来源是互联网的公开数据,包含海量互联网文本数据、代码、对话等。大模型的数据来源和质量可能影响其输出的准确性和公正性,如果大模型的训练数据和/或用户指令中存在恶意偏见、虚假信息、隐私外泄等问题,那么大模型就可能会放大这些问题,造成误导或歧视,甚至向用户输出不合规的答复。更重要的是,大模型当前的内部逻辑和工作原理往往难以解释和理解,这可能会导致其在某些情况下出现意外或错误的行为,给人类造成伤害或危害,例如大模型生成的虚假或极端的数据可能会引起公众恐慌、伤害企业的声誉和利益。
当前的大模型风险管理工作中,通常使用专家设计的大模型风险管理框架来管控大模型内容风险水位(例如,是否有偏见、是否有害等)。该专家设计的大模型风险管理框架的缺点主要有:
①成本较高:专家设计的大模型风险管理框架的成本较高,需要大量专门的人才支持;
②难以维护:专家设计的大模型风险管理框架需要不断地进行调整和维护,否则将难以保持其完整性和可靠性;
③准确性低:专家设计的大模型风险管理框架为标签-语料两级,对不同风险的区分度不足,进而无法精确识别各类风险。
为了避免或减少大模型带来的风险,需要构建新的大模型风险管理框架,进而利用大模型风险管理框架实现对大模型进行风险防控方面的优化,以使优化后的大模型能够高效识别风险,进而生成更可靠、更可控的内容,提高大模型对人类社会的贡献和价值。
为了更好的说明本发明,凸显本发明的主旨,本说明书中的具体实施例以优化大模型风险防控能力这一大模型风险管理框架的应用方向为描述对象,本领域技术人员应当理解,对于大模型风险管理框架的其他应用方向(如对大模型进行风险评测等),本说明书也同样可以实施。
图1示出本发明的一个实施例提供的一种大模型风险管理框架构建的方法,该方法可以由电子设备执行,该电子设备可以包括:服务器和/或终端设备,其中终端设备可以例如车载终端或手机终端等。换言之,该方法可以由安装在前述电子设备的软件或硬件来执行,该方法包括如下步骤:
S102,基于原始语料集中各个语料类型对应的原始文本语料,确定各个语料类型的语料标签和对语料标签进行解释的标签定义,基于语料标签构建大模型风险管理框架的语料标签层。
其中,原始语料集是用于构建大模型风险管理框架的原始文本语料的集合。原始语料集可以包括明确规定且需要遵守的法律法规文本,以使根据构建的大模型风险管理框架优化后的大模型具备规避生成法律明令禁止的文本的能力;原始语料集可以包括未明确规定且需要遵守的公序良俗文本,以使根据构建的大模型风险管理框架优化后的大模型具备规避生成违背公共秩序/善良风俗的文本的能力;原始语料集可以包括新出现的人工智能等方面的政策文本,以使根据构建的大模型风险管理框架优化后的大模型具备生成符合相关政策规定的文本的能力。本说明书中对原始语料集中包含的原始文本语料的内容不做具体限定,可以根据实际情况进行选择。在一示例中,可以根据大模型风险管理框架的应用方向收集一种或多种原始文本语料作为原始语料集。
其中,语料类型是对原始文本语料进行粗分类得到的类型。语料标签是基于语料类型对原始文本语料进行标记风险、以便后续进行相应处置的标签。标签定义是以简短的文字对语料标签的解释,以便清晰、明确的确定语料标签对应的语料类型的范围。
例如,原始语料集可以包括歧视、辱骂、偏见、不合规等语料类型的原始文本语料,各个语料类型的标签可以分别是歧视、偏见、辱骂、不合规等。具体的,歧视的标签定义可以是:不平等地看待;辱骂的标签定义可以是:用粗暴的语言谩骂;偏见的标签定义可以是:不客观或不公正的见解。
具体的,对于法律法规类型的原始文本语料,由于原始文本语料中已经明确规定了各种违法犯罪行为的类型,可以直接从原始文本语料中抽取语料标签;对于公序良俗类型的原始文本语料,由于原始文本语料中未明确规定各种公序良俗的类型,可以在去除低质量的原始文本语料后,生成语料标签。生成语料标签的方式可以参考后面说明书中的内容,此处不再赘述。进一步的,可以根据语料标签,直接使用相关模型从原始语料集或互联网公开的文本数据中,检索、提取与语料标签对应的标签定义。
步骤S102先利用语料标签实现了对原始文本语料的初步标记,再利用标签定义划定了各个语料类型的明确范围,有助于接下来生成符合各个语料类型的标签定义的准确的文本语料。本说明书中对基于语料标签构建大模型风险管理框架的语料标签层的方法不做具体限定,可以根据实际情况进行选择。
S104,从语料类型对应的标签定义中,提取标记语料类型对应的风险的标签关键词,基于标签关键词构建大模型风险管理框架的关键词层。
其中,标签关键词是能够标记语料标签的词或短语。例如,对偏见这一语料类型,其标签关键词可以是:不客观、不公正和见解。具体的,可以直接使用关键词抽取模型从标签定义中提取标签关键词,进而构建关键词层。
S106,根据语料标签对应的标签定义,生成包含与语料标签对应的标签关键词的文本语料,基于文本语料构建大模型风险管理框架的文本语料层。
具体的,可以利用模型根据标签定义生成包含标签关键词的文本语料。由于标签定义规定了各个语料类型的范围且标签关键词明确了各个语料类型的重点,因此,根据语料标签的标签定义生成的包含语料标签对应的标签关键词的文本语料,相比于没有进行设置关键词的原始语料集中的原始文本语料,具有更高的类型区分度和类型代表性,进而可以实现原始文本语料的类型与处置策略的对应,生成高质量的可以对大模型进行训练的文本语料。
通常,利用大模型风险管理框架优化的生成式大模型生成的是针对问题的答案,因此,在本说明书中,文本语料的形式可以是问题、答案或问答对。本说明书中对文本语料的形式不做具体限定,可以根据风险管理的模式进行确定。具体的,可以使用相关模型根据标签定义生成包含标签关键词的文本语料。本说明书中对基于文本语料构建大模型风险管理框架的文本语料层的方法不做具体限定,可以根据实际情况进行选择。
进一步的,可以根据构建的大模型风险管理框架对大模型进行训练。具体的,对大模型的训练内容,可以是识别输入大模型的文本数据(包括训练数据和/或用户给出的指令)的风险、和/或避免大模型输出具有风险的文本数据。
在本说明书实施例中,对原始语料集中各个语料类型的原始文本语料,分别确定语料标签、标签定义和标签关键词,进而根据标签定义生成包含该标签定义的标签关键词的文本语料,进而构建了语料标签-关键词-文本语料的大模型风险管理框架。该过程无需专家参与,降低了人力成本投入,并且由于构建的三级大模型风险管理框架增加了关键词层,使得生成的文本语料具有明确风险标识(风险关键词)且符合标签定义,提高了构建的大模型风险管理框架的完整性和可靠性,进而可以提高利用大模型风险管理框架进行风险防控的准确度和精度。
图2提供了一个大模型风险管理框架构建的方法的应用场景示意图,如图2所示,大模型服务器201向大模型风险管理框架构建服务器202发出框架构建命令,大模型风险管理框架构建服务器202在收到大模型风险管理框架构建命令后,读取第一数据库203中的原始语料集,使用本说明书中的大模型风险管理框架构建的方法构建大模型风险管理框架,并将大模型风险管理框架存放到第二数据库204中,进而大模型服务器201可以从第二数据库204中读取大模型风险管理框架,进行风险识别等优化,并使用优化后的大模型进行风险防控。
其中,大模型服务器201和大模型风险管理框架构建服务器202可以为同一服务器,第一数据库203和第二数据库204可以为同一数据库。
在一种实现方式中,步骤S104中提取标签关键词的步骤,可以执行为如下步骤A1-A2:
步骤A1,根据标签定义,获取每个语料标签对应的主题和对主题进行解释的主题定义;
步骤A2,从主题对应的主题定义中,提取标记主题对应的风险的主题关键词;
步骤S106中生成文本语料的步骤,可以执行为如下步骤B1:
步骤B1,根据主题定义和主题定义对应的标签定义,生成包含从主题定义中提取的主题关键词的文本语料。
其中,主题是某个风险标签下可能存在的风险情景或风险因素,主题是利用语料标签对语料类型的进一步细化。主题定义是以简短的文字对主题的解释,以便清晰、明确的确定主题在对应的语料类型中的范围。主题关键词是能够标记主题的词或短语。
具体的,获取主题的方式,可以是直接根据各个标签定义划定的范围,使用相关模型从原始语料集或互联网公开的文本数据中,检索、提取与标签定义对应的至少一个主题。例如,对于偏见这一语料类型,可以根据相关数据细化为地区偏见、文化偏见等主题。
进一步的,可以根据确定的主题,使用相关模型从原始语料集或互联网公开的文本数据中,检索、提取与主题对应的主题定义。例如,对于地区偏见这一主题的主题定义可以是:基于地理位置而对某个地区内的人、事、物产生偏见和歧视的行为。
进一步的,可以使用相关模型从主题定义中提取主题关键词。例如,对地区偏见这一主题,其主题关键词可以是地区、偏见等。
在得到主题定义后,可以利用模型根据主题定义、标签定义,生成包括主题关键词的文本语料。由于主题是在语料类型的基础上对原始文本语料进一步细分类得到的类型,因此,主题定义规定了同一语料类型内各个主题的范围。同时,由于主题关键词明确了同一语料类型内各个主题的重点,因此,根据主题的主题定义和标签定义生成的包含主题关键词的文本语料,相比于根据标签定义生成的包含标签关键词的文本语料,具有更高的主题区分度和主题代表性,进而可以实现原始文本语料的主题与处置策略的对应,生成高质量的文本语料。
如图3所示,本说明书实施例构建了语料标签-主题-关键词-文本语料的四级大模型风险管理框架。
在本说明书实施例中,对各个语料类型的原始文本语料进行了主题划分,分别确定主题、主题定义和主题关键词,进而根据主题定义和标签定义生成包含该主题定义的主题关键词的文本语料。该过程中生成各个主题的具有明确风险标识(主题关键词)的、符合标签定义和文本定义的文本语料,该文本语料中各个主题之间的差别明确,进一步提高了构建的大模型风险管理框架的风险防控的完整性和可靠性。
在一种实现方式中,步骤A1,可以执行为如下步骤C1-C3:
步骤C1,基于主题,对各个语料类型对应的原始文本语料进行主题标记处理;
步骤C2,对不存在对应的主题的原始文本语料,设置至少一个补充主题并进行标记,标记有同一补充主题的原始文本语料的补充主题相同;
步骤C3,基于标记有同一补充主题的原始文本语料,确定对补充主题进行解释的主题定义。
其中,补充主题是对已有主题不能标记的原始文本语料对应的主题。具体的,在根据标签定义获取与语料标签对应的主题后,获取的主题可能并不能完全覆盖原始语料集中的所有原始文本语料,或者新的原始文本语料出现后,已有的主题不能覆盖新的原始文本语料。此时,可以根据已有主题不能覆盖的原始文本语料,进行主题的补充。在一示例中,可以根据已有主题不能覆盖的原始文本语料在数学表征的差距,将已有主题不能覆盖的原始文本语料进行聚类,根据聚类得到的聚类簇,确定至少一个补充主题。其中,每个聚类簇中的原始文本语料对应的补充主题相同。
进一步的,可以根据补充主题对应的原始文本语料,确定该补充主题的主题定义。具体的,可以使用相关模型,根据原始语料集或互联网公开的文本数据中,明确主题对应的主题定义。
在本说明书实施例中,根据已有主题不能覆盖的原始语料集中的原始文本语料,进行了原始语料集的主题补充。该过程实现了对从标签定义获取的主题的补充,保证了同一语料类型的主题划分的准确度,提高了生成的各个主题的文本语料的准确度,进一步提高了大模型风险管理框架的完整性和可靠性,提高了大模型风险管理框架对新的风险形式的快速适应。
在一种实现方式中,步骤A2,可以执行为如下步骤D1-D3:
步骤D1,从原始语料集的原始文本语料中,提取标记原始文本语料对应的风险的原始关键词;
步骤D2,将具有相同主题的原始文本语料的主题关键词与原始关键词进行比对,得到目标关键词,目标关键词为主题关键词中不存在且原始关键词中存在的关键词;
步骤D3,将目标关键词作为标记目标主题对应的风险的主题关键词,目标主题为目标关键词所属的原始文本语料对应的主题。
其中,原始关键词是直接从原始语料集包含的原始文本语料中提取的与风险相关的关键词。主题定义是对通过标签定义间接获取的主题的解释,由于该获取过程不是从主题对应的原始语料文本中直接获取,而是间接获取的过程,获取过程可能会遗漏与风险相关的主题关键词,另一方面,随着新的原始文本语料的出现,已有的主题关键词也可能会出现不能覆盖新的原始文本语料的情况。在一示例中,可以直接从主题对应的原始文本语料中进行原始关键词的提取,将原始关键词也作为目标主题对应的风险的主题关键词,以进行主题关键词的补充,提高主题关键词的完整性。
在本公开实施例中,从原始文本语料中提取原始关键词,进而将原始文本语料中提取的主题关键词中没有的关键词补入主题关键词中。该过程在已有的主题定义不能覆盖所有原始文本语料的情况下,没有重新生成主题定义以更新主题关键词,而是直接从原始文本语料中提取原始关键词进行主题关键词的补充,实现了对从主题定义获取的主题关键词的快速补充,进而可以实现与补充的关键词对应的文本语料的生成,提高了关键词层的关键词以及文本语料层的文本语料的完整性,提高了大模型风险管理框架的完整性和可靠性,进一步实现了大模型风险管理框架对新的风险形式的快速适应。
在一种实现方式中,大模型风险管理框架构建的方法还包括:
根据标签定义,对原始语料集的每个语料标签进行风险等级划分操作;
将语料标签的风险等级作为具有语料标签的文本语料的风险等级。
其中,风险等级是各个语料标签代表的语料类型对应的风险的等级。对语料标签进行风险等级划分,能够使生成的文本语料带有风险等级数据,进而可以使利用大模型风险管理框架优化的大模型可以识别输入数据的风险等级。
具体的,可以使用模型,根据标签定义对语料标签进行风险等级划分。风险等级可以划分为一般风险、敏感风险、高危风险等。例如,对法律法规明令禁止的原始文本语料对应的语料标签可以设置为高危风险,对公序良俗涉及的原始文本语料对应的语料标签可以设置为敏感风险或一般风险。
在本说明书实施例中,将各个语料标签与风险等级进行关联,提高了大模型风险管理框架的完整性,进而可以使利用大模型风险管理框架进行优化的大模型,不仅能够输出语料标签,还能同时输出语料标签对应的风险等级,提升了风险防控的效率。
进一步的,在对语料类型进行主题划分后,还可以根据主题定义和对应的标签定义,对语料标签对应的每个主题进行进一步的风险等级划分,进一步提高风险防控的准确度和效率。例如,对地区歧视这一主题可以设置为敏感风险,对文化歧视这一主题可以设置为一般风险。
在一示例中,还可以将不同主题对应的风险等级与处置措施进行对应,以进一步提高风险防控的效率。具体的,处置措施可以包括删除、屏蔽等。
不同大模型风险管理框架的应用场景可能不同,而不同应用场景的大模型风险管理框架对应的原始文本语料也不同,因此,可以根据大模型风险管理框架的业务场景,确定所需要的原始文本语料。在一种实现方式中,步骤S102中确定语料标签的步骤,可以执行为如下步骤E1-E3:
步骤E1,获取大模型风险管理框架的应用场景信息;
步骤E2,根据应用场景信息,从原始语料集中筛选出与大模型风险管理框架的应用场景相关的目标文本语料;
步骤E3,基于目标文本语料,确定各个语料类型的语料标签。
其中,应用场景信息可以是与应用场景相关的关键词或相关定义。具体的,可以由各个领域具有实际经验和理论素养的专家,确定该领域应用场景的分类以及各个应用场景的信息,以提高应用场景分类的准确性,进而提高应用场景信息的准确性。
在获取应用场景信息后,可以利用应用场景信息,进行与大模型风险管理框架相关的原始文本语料的筛选。进一步的,可以依照前述实施例,根据筛选出的目标文本语料,进而生成目标文本语料的语料标签。
该过程在原始语料集中进行与大模型风险管理框架的应用场景相关的原始文本语料的筛选,降低了构建大模型风险管理框架所使用的原始语料集中原始文本语料的数量,进一步提高了构建大模型风险管理框架的速度。
在一种实现方式中,步骤S106中生成文本语料的步骤,可以执行为如下步骤F1-F2:
步骤F1,获取各个语料标签对应的示例语料,示例语料为指示文本语料的生成效果的语料;
步骤F2,根据语料标签对应的标签定义和语料标签对应的示例语料,生成与语料标签对应的包含标签关键词的文本语料。
其中,示例语料可以是公开的人工数据、代表性的语料或大模型筛选的质量较高的语料。具体的,判断示例语料的标准可以包括内容是否通顺、逻辑是否跳跃、前后文是否一致等。本说明书中对示例语料的获取方式以及示例语料的判断标准不做具体限定,可以根据实际情况进行确定。
由于示例语料的质量较高,根据示例语料生成的文本语料也可能具有较高的质量,进而可以提高构建的大模型风险管理框架的可靠性。
在一种实现方式中,在确定语料标签前,方法还包括:
对原始语料集中的原始文本语料进行聚类,得到至少一个聚类簇,同一聚类簇中的任意两个原始文本语料之间的语义距离小于预设语义距离;
将每个聚类簇中的原始文本语料,作为具有相同语料类型的原始文本语料。
其中,由于不同类型的原始文本语料在数学表征的差距很大,在一示例中,可以根据原始语料集中各个原始文本语料之间的语义距离,进行聚类,得到聚类簇,将同一聚类簇中的原始文本语料作为相同语料类型的原始文本语料,进而实现原始语料集中各个语料类型的原始文本的划分。具体的,可以设置预设语义距离,同一聚类簇中的任意两个原始文本语料之间的语义距离可以设置为小于预设语义距离。
在本说明书实施例中,通过聚类方式实现原始文本语料的分类,得到多个聚类簇,再将同一聚类簇中的原始文本语料作为同一语料类型的原始文本语料。该过程利用聚类算法提高了原始语料集中原始文本语料分类结果的准确度,进一步提高了构建的大模型风险管理框架的可靠性。
由前述大模型风险管理框架的实施例可以看出,构建大模型风险管理框架的过程需要进行多次特征提取,如果对每次特征提取都设计一个普通模型,会产生极大的工作量。由于基于深度学习的大模型可以提供强大的预训练特征提取能力,可以直接用大模型来进行大模型风险管理框架的构建。
图4示出本发明的一个实施例提供的一种大模型风险管理框架构建的方法,该方法可以由电子设备执行,该电子设备可以包括:服务器和/或终端设备,其中终端设备可以例如车载终端或手机终端等。换言之,该方法可以由安装在前述电子设备的软件或硬件来执行,该方法包括如下步骤:
S402:将原始语料集中各个语料类型对应的原始文本语料输入第一生成式大模型,得到第一生成式大模型确定的各个语料类型的语料标签和对语料标签进行解释的标签定义,基于语料标签构建大模型风险管理框架的语料标签层;
S404:将语料类型对应的标签定义输入第二生成式大模型,得到第二生成式大模型提取的标记语料类型对应的风险的标签关键词,基于标签关键词构建大模型风险管理框架的关键词层;
S406:将语料标签对应的标签定义输入第三生成式大模型,得到第三生成式大模型生成的包含与语料标签对应的标签关键词的文本语料,基于文本语料构建大模型风险管理框架的文本语料层。
该过程中,步骤S402-步骤S406,均使用大模型(包括第一生成式大模型、第二生成式大模型和第三生成式大模型)来构建语料标签-关键词-文本语料的三级风险框架体系,降低了风险框架体系构建过程中的人力成本投入,同时由于大模型本身的强大数据处理能力、生成结果准确率高等优点,该实施例中的大模型风险管理框架构建方法能够实现大模型风险管理框架的高质量快速生成,进一步提高了使用构建的大模型风险管理框架进行内容风险防控的准确性和效率。
本说明书中对第一生成式大模型、第二生成式大模型和第三生成式大模型的选择不做限定,可以根据实际情况进行确定。在一示例中,第一生成式大模型、第二生成式大模型和第三生成式大模型可以为相同的大模型,以降低大模型风险管理框架构建过程的复杂度。在一示例中,第一生成式大模型、第二生成式大模型和第三生成式大模型可以为不同的大模型,具体的,可以根据实际需要,分别进行第一生成式大模型、第二生成式大模型和第三生成式大模型的选择。
本说明书实施例提供的大模型风险管理框架构建的方法,执行主体可以为大模型风险管理框架构建的装置,或者该大模型风险管理框架构建的装置中的用于执行大模型风险管理框架构建的方法的控制模块。本说明书实施例中以大模型风险管理框架构建的装置执行大模型风险管理框架构建的方法为例,说明本说明书实施例提供的大模型风险管理框架构建的装置。
图5是根据本发明实施例的大模型风险管理框架构建的装置的结构示意图。如图5所示,大模型风险管理框架构建的装置500包括:
语料标签层构建模块510,用于基于原始语料集中各个语料类型对应的原始文本语料,确定各个语料类型的语料标签和对语料标签进行解释的标签定义,基于语料标签构建大模型风险管理框架的语料标签层;
关键词层构建模块520,用于从语料类型对应的标签定义中,提取标记语料类型对应的风险的标签关键词,基于标签关键词构建大模型风险管理框架的关键词层;
文本语料层构建模块530,用于根据语料标签对应的标签定义,生成包含与语料标签对应的标签关键词的文本语料,基于文本语料构建大模型风险管理框架的文本语料层。
在一个实施例中,关键词层构建模块520,包括:
主题获取单元,用于根据标签定义,获取每个语料标签对应的主题和对主题进行解释的主题定义;
关键词提取单元,用于从主题对应的主题定义中,提取标记主题对应的风险的主题关键词;
文本语料层构建模块530,包括:
第一生成单元,用于根据主题定义和主题定义对应的标签定义,生成包含从主题定义中提取的主题关键词的文本语料。
在一个实施例中,主题获取单元,用于:
基于主题,对各个语料类型对应的原始文本语料进行主题标记处理;
对不存在对应的主题的原始文本语料,设置至少一个补充主题并进行标记,标记有同一补充主题的原始文本语料的补充主题相同;
基于标记有同一补充主题的原始文本语料,确定对补充主题进行解释的主题定义。
在一个实施例中,关键词提取单元,用于:
从原始语料集的原始文本语料中,提取标记原始文本语料对应的风险的原始关键词;
将具有相同主题的原始文本语料的主题关键词与原始关键词进行比对,得到目标关键词,目标关键词为主题关键词中不存在且原始关键词中存在的关键词;
将目标关键词作为标记目标主题对应的风险的主题关键词,目标主题为目标关键词所属的原始文本语料对应的主题。
在一个实施例中,大模型风险管理框架构建的装置500,包括:
风险等级划分模块,用于根据标签定义,对原始语料集的每个语料标签进行风险等级划分操作;
风险等级确定模块,用于将语料标签的风险等级作为具有语料标签的文本语料的风险等级。
在一个实施例中,语料标签层构建模块510,包括:
场景信息获取单元,用于获取大模型风险管理框架的应用场景信息;
语料筛选单元,用于根据应用场景信息,从原始语料集中筛选出与大模型风险管理框架的应用场景相关的目标文本语料;
语料标签确定单元,用于基于目标文本语料,确定各个语料类型的语料标签。
在一个实施例中,文本语料层构建模块530,包括:
示例语料获取单元,用于获取各个语料标签对应的示例语料,示例语料为指示文本语料的生成效果的语料;
第二生成单元,用于根据语料标签对应的标签定义和语料标签对应的示例语料,生成与语料标签对应的包含标签关键词的文本语料。
在一个实施例中,大模型风险管理框架构建的装置500包括:
聚类模块,用于对原始语料集中的原始文本语料进行聚类,得到至少一个聚类簇,同一聚类簇中的任意两个原始文本语料之间的语义距离小于预设语义距离;
语料确定模块,用于将每个聚类簇中的原始文本语料,作为具有相同语料类型的原始文本语料。
本说明书实施例中的大模型风险管理框架构建的装置可以是装置,也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personal digital assistant,PDA)等,非移动电子设备可以为服务器、网络附属存储器(Network Attached Storage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本说明书实施例不作具体限定。
本说明书实施例中的大模型风险管理框架构建的装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统,可以为IOS操作系统,还可以为其他可能的操作系统,本说明书实施例不作具体限定。
本说明书实施例提供的大模型风险管理框架构建的装置能够实现图1的方法实施例中实现的各个过程,为避免重复,这里不再赘述。
基于同样的思路,本说明书一个或多个实施例还提供一种电子设备,如图6所示。电子设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器601和存储器602,存储器602中可以存储有一个或一个以上存储应用程序或数据。其中,存储器602可以是短暂存储或持久存储。存储在存储器602的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对电子设备中的一系列计算机可执行指令。更进一步地,处理器601可以设置为与存储器602通信,在电子设备上执行存储器602中的一系列计算机可执行指令。电子设备还可以包括一个或一个以上电源603,一个或一个以上有线或无线网络接口604,一个或一个以上输入输出接口605,一个或一个以上键盘606。
具体在本实施例中,电子设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对电子设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
基于原始语料集中各个语料类型对应的原始文本语料,确定各个语料类型的语料标签和对语料标签进行解释的标签定义,基于语料标签构建大模型风险管理框架的语料标签层;
从语料类型对应的标签定义中,提取标记语料类型对应的风险的标签关键词,基于标签关键词构建大模型风险管理框架的关键词层;
根据语料标签对应的标签定义,生成包含与语料标签对应的标签关键词的文本语料,基于文本语料构建大模型风险管理框架的文本语料层。
本说明书一个或多个实施例还提出了一种存储介质,该存储介质存储一个或多个计算机程序,该一个或多个计算机程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行上述大模型风险管理框架构建的方法实施例的各个过程,并具体用于执行:
基于原始语料集中各个语料类型对应的原始文本语料,确定各个语料类型的语料标签和对语料标签进行解释的标签定义,基于语料标签构建大模型风险管理框架的语料标签层;
从语料类型对应的标签定义中,提取标记语料类型对应的风险的标签关键词,基于标签关键词构建大模型风险管理框架的关键词层;
根据语料标签对应的标签定义,生成包含与语料标签对应的标签关键词的文本语料,基于文本语料构建大模型风险管理框架的文本语料层。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于上述一种存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述实施例阐明的方法、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书一个或多个实施例可提供为方法、系统、或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书一个或多个实施例是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书一个或多个实施例而已,并不用于限制本申请。对于本领域技术人员来说,本说明书一个或多个实施例可以有各种更改和变化。凡在本说明书一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书个或多个实施例的权利要求范围之内。
Claims (12)
1.一种大模型风险管理框架构建的方法,所述大模型风险管理框架用于开发风险管理应用,所述方法,包括:
基于原始语料集中各个语料类型对应的原始文本语料,确定各个所述语料类型的语料标签和对所述语料标签进行解释的标签定义,基于所述语料标签构建所述大模型风险管理框架的语料标签层;
从所述语料类型对应的所述标签定义中,提取标记所述语料类型对应的风险的标签关键词,基于所述标签关键词构建所述大模型风险管理框架的关键词层;
根据所述语料标签对应的所述标签定义,生成包含与所述语料标签对应的所述标签关键词的文本语料,基于所述文本语料构建所述大模型风险管理框架的文本语料层。
2.根据权利要求1所述的方法,所述从所述语料类型对应的所述标签定义中,提取标记所述语料类型对应的风险的标签关键词,包括:
根据所述标签定义,获取每个所述语料标签对应的主题和对所述主题进行解释的主题定义;
从所述主题对应的所述主题定义中,提取标记所述主题对应的风险的主题关键词;
所述根据所述语料标签对应的所述标签定义,生成包含与所述语料标签对应的所述标签关键词的文本语料,包括:
根据所述主题定义和所述主题定义对应的所述标签定义,生成包含从所述主题定义中提取的所述主题关键词的所述文本语料。
3.根据权利要求2所述的方法,所述根据所述标签定义,获取每个所述语料标签对应的主题和对所述主题进行解释的主题定义,包括:
基于所述主题,对各个所述语料类型对应的所述原始文本语料进行主题标记处理;
对不存在对应的主题的所述原始文本语料,设置至少一个补充主题并进行标记,标记有同一所述补充主题的原始文本语料的补充主题相同;
基于标记有同一所述补充主题的所述原始文本语料,确定对所述补充主题进行解释的主题定义。
4.根据权利要求2所述的方法,所述从所述主题对应的所述主题定义中,提取标记所述主题对应的风险的主题关键词,包括:
从所述原始语料集的所述原始文本语料中,提取标记所述原始文本语料对应的风险的原始关键词;
将具有相同所述主题的所述原始文本语料的主题关键词与原始关键词进行比对,得到目标关键词,所述目标关键词为所述主题关键词中不存在且所述原始关键词中存在的关键词;
将所述目标关键词作为标记目标主题对应的风险的主题关键词,所述目标主题为所述目标关键词所属的所述原始文本语料对应的主题。
5.根据权利要求1所述的方法,在生成文本语料后,所述方法,还包括:
根据所述标签定义,对所述原始语料集的每个所述语料标签进行风险等级划分操作;
将所述语料标签的风险等级作为具有所述语料标签的所述文本语料的风险等级。
6.根据权利要求1所述的方法,所述基于原始语料集中各个语料类型对应的原始文本语料,确定各个所述语料类型的语料标签,包括:
获取所述大模型风险管理框架的应用场景信息;
根据所述应用场景信息,从所述原始语料集中筛选出与所述大模型风险管理框架的应用场景相关的目标文本语料;
基于所述目标文本语料,确定各个所述语料类型的语料标签。
7.根据权利要求1所述的方法,所述根据所述语料标签对应的所述标签定义,生成包含与所述语料标签对应的所述标签关键词的文本语料,包括:
获取各个所述语料标签对应的示例语料,所述示例语料为指示所述文本语料的生成效果的语料;
根据所述语料标签对应的所述标签定义和所述语料标签对应的所述示例语料,生成与所述语料标签对应的包含所述标签关键词的所述文本语料。
8.根据权利要求1所述的方法,在确定所述语料标签前,所述方法,还包括:
对所述原始语料集中的所述原始文本语料进行聚类,得到至少一个聚类簇,同一所述聚类簇中的任意两个所述原始文本语料之间的语义距离小于预设语义距离;
将每个所述聚类簇中的所述原始文本语料,作为具有相同所述语料类型的所述原始文本语料。
9.一种大模型风险管理框架构建的方法,所述大模型风险管理框架用于开发风险管理应用,所述方法,包括:
将原始语料集中各个语料类型对应的原始文本语料输入第一生成式大模型,得到所述第一生成式大模型确定的各个所述语料类型的语料标签和对所述语料标签进行解释的标签定义,基于所述语料标签构建所述大模型风险管理框架的语料标签层;
将所述语料类型对应的所述标签定义输入第二生成式大模型,得到所述第二生成式大模型提取的标记所述语料类型对应的风险的标签关键词,基于所述标签关键词构建所述大模型风险管理框架的关键词层;
将所述语料标签对应的所述标签定义输入第三生成式大模型,得到所述第三生成式大模型生成的包含与所述语料标签对应的所述标签关键词的文本语料,基于所述文本语料构建所述大模型风险管理框架的文本语料层。
10.根据权利要求9所述的方法,所述第一生成式大模型、所述第二生成式大模型和所述第三生成式大模型相同。
11.一种大模型风险管理框架构建的装置,所述大模型风险管理框架用于开发风险管理应用,所述装置,包括:
语料标签层构建模块,用于基于原始语料集中各个语料类型对应的原始文本语料,确定各个所述语料类型的语料标签和对所述语料标签进行解释的标签定义,基于所述语料标签构建所述大模型风险管理框架的语料标签层;
关键词层构建模块,用于从所述语料类型对应的所述标签定义中,提取标记所述语料类型对应的风险的标签关键词,基于所述标签关键词构建所述大模型风险管理框架的关键词层;
文本语料层构建模块,用于根据所述语料标签对应的所述标签定义,生成包含与所述语料标签对应的所述标签关键词的文本语料,基于所述文本语料构建所述大模型风险管理框架的文本语料层。
12.一种电子设备,包括:
处理器,以及
被安排成存储计算机可执行指令的存储器,在所述可执行指令被执行时,能够使得所述处理器:
基于原始语料集中各个语料类型对应的原始文本语料,确定各个所述语料类型的语料标签和对所述语料标签进行解释的标签定义,基于所述语料标签构建所述大模型风险管理框架的语料标签层;
从所述语料类型对应的所述标签定义中,提取标记所述语料类型对应的风险的标签关键词,基于所述标签关键词构建所述大模型风险管理框架的关键词层;
根据所述语料标签对应的所述标签定义,生成包含与所述语料标签对应的所述标签关键词的文本语料,基于所述标签关键词构建所述大模型风险管理框架的关键词层。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310835478.5A CN116910252A (zh) | 2023-07-07 | 2023-07-07 | 一种大模型风险管理框架构建的方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310835478.5A CN116910252A (zh) | 2023-07-07 | 2023-07-07 | 一种大模型风险管理框架构建的方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116910252A true CN116910252A (zh) | 2023-10-20 |
Family
ID=88355682
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310835478.5A Pending CN116910252A (zh) | 2023-07-07 | 2023-07-07 | 一种大模型风险管理框架构建的方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116910252A (zh) |
-
2023
- 2023-07-07 CN CN202310835478.5A patent/CN116910252A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108920654B (zh) | 一种问答文本语义匹配的方法和装置 | |
CN110069709B (zh) | 意图识别方法、装置、计算机可读介质及电子设备 | |
US9672467B2 (en) | Systems and methods for creating and implementing an artificially intelligent agent or system | |
CN113627447B (zh) | 标签识别方法、装置、计算机设备、存储介质及程序产品 | |
CN113221747B (zh) | 一种基于隐私保护的隐私数据处理方法、装置及设备 | |
CN115408525B (zh) | 基于多层级标签的信访文本分类方法、装置、设备及介质 | |
CN111767714B (zh) | 一种文本通顺度确定方法、装置、设备及介质 | |
CN111291551B (zh) | 文本处理方法、装置、电子设备及计算机可读存储介质 | |
CN111507726A (zh) | 一种报文生成方法、装置及设备 | |
CN115374259A (zh) | 一种问答数据挖掘方法、装置及电子设备 | |
CN113705192B (zh) | 文本处理方法、装置与存储介质 | |
CN116662522B (zh) | 问题答案推荐方法、存储介质和电子设备 | |
CN113988195A (zh) | 一种私域流量线索挖掘方法、装置、车辆、可读介质 | |
CN112667791A (zh) | 潜在事件预测方法、装置、设备及存储介质 | |
CN116701636A (zh) | 一种数据分类方法、装置、设备及存储介质 | |
CN116910252A (zh) | 一种大模型风险管理框架构建的方法、装置及设备 | |
CN115033229A (zh) | 活动模型生成方法、装置、电子设备及存储介质 | |
CN114254622A (zh) | 一种意图识别方法和装置 | |
CN114036289A (zh) | 一种意图识别方法、装置、设备及介质 | |
CN113010573A (zh) | 一种关联关系提取方法、装置及电子设备 | |
Zhu et al. | A Performance Comparison of Fake News Detection Approaches | |
CN118051828B (zh) | 模型训练方法、装置及存储介质 | |
CN115269851B (zh) | 文章分类方法、装置、电子设备、存储介质及程序产品 | |
CN117093715B (zh) | 词库扩充方法、系统、计算机设备及存储介质 | |
CN114385903B (zh) | 应用账号的识别方法、装置、电子设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |