CN117034019B - 一种业务处理方法、装置、电子设备和存储介质 - Google Patents
一种业务处理方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN117034019B CN117034019B CN202311295895.1A CN202311295895A CN117034019B CN 117034019 B CN117034019 B CN 117034019B CN 202311295895 A CN202311295895 A CN 202311295895A CN 117034019 B CN117034019 B CN 117034019B
- Authority
- CN
- China
- Prior art keywords
- language model
- training
- activity
- sample
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title abstract description 25
- 230000000694 effects Effects 0.000 claims abstract description 437
- 238000010586 diagram Methods 0.000 claims abstract description 367
- 238000012549 training Methods 0.000 claims abstract description 272
- 238000000605 extraction Methods 0.000 claims abstract description 137
- 238000000034 method Methods 0.000 claims abstract description 74
- 230000008569 process Effects 0.000 claims abstract description 38
- 230000000875 corresponding effect Effects 0.000 claims description 121
- 230000015654 memory Effects 0.000 claims description 38
- 238000004590 computer program Methods 0.000 claims description 25
- 238000012545 processing Methods 0.000 claims description 14
- 230000003993 interaction Effects 0.000 claims description 13
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 238000007781 pre-processing Methods 0.000 claims description 7
- 238000013473 artificial intelligence Methods 0.000 abstract description 18
- 238000005516 engineering process Methods 0.000 abstract description 15
- 230000009471 action Effects 0.000 description 37
- 230000006870 function Effects 0.000 description 23
- 239000000284 extract Substances 0.000 description 22
- 238000004891 communication Methods 0.000 description 13
- 230000001680 brushing effect Effects 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 11
- 238000010801 machine learning Methods 0.000 description 9
- 230000003287 optical effect Effects 0.000 description 7
- 230000006399 behavior Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 230000000873 masking effect Effects 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000009960 carding Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 238000010521 absorption reaction Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000003339 best practice Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/20—Software design
- G06F8/24—Object-oriented
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0895—Weakly supervised learning, e.g. semi-supervised or self-supervised learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Machine Translation (AREA)
Abstract
本申请涉及人工智能技术领域,尤其涉及一种业务处理方法、装置、电子设备和存储介质。方法包括:将目标业务的目标活动图输入已训练的业务逻辑提取模型,获得业务序列图;业务逻辑提取模型是通过以下训练过程获得的:基于目标领域的语料文本集对预训练语言模型进行训练,获得用于进行目标领域的文本语义提取的第一语言模型,以及基于第一样本活动图集对第一语言模型进行训练,获得用于进行活动图逻辑提取的第二语言模型;基于第二样本活动图集对第二语言模型进行训练,获得用于进行活动图实体及实体职责提取的第三语言模型;基于第三样本活动图集对第三语言模型进行训练,获得业务逻辑提取模型。本申请可以准确地将活动图转化为业务序列图。
Description
技术领域
本申请涉及人工智能技术领域,尤其涉及一种业务处理方法、装置、电子设备和存储介质。
背景技术
在软件开发领域,通常根据业务序列图进行软件设计。业务序列图是一种软件过程建模工具,用于描绘业务流程中的各参与者之间的消息交互顺序,它关注不同参与者之间基于消息传递进行协作,以完成特定业务目标的动态过程,通过顺序的消息流表示业务步骤的逻辑流转。
目前,在一些业务系统中增加新的业务时,针对该业务的描述可能只有活动图,而没有业务序列图,需要将活动图转化为业务序列图,以指导业务功能的软件设计;这是因为,活动图与业务序列图存在差异,活动图关注人的行为,而业务序列图把人当作系统,需要思考动作背后的目的,因此,根据活动图不能确定活动图中相关动作的目的,因而不能确定参与者的职责分配。
相关技术中,通常由相关人员对活动图进行理解,从而将活动图转化为业务序列图。但是,相关人员通常不具备完善的专业知识,可能无法准确理解活动图,导致不能准确地将活动图转化为业务序列图,影响业务的软件设计。
发明内容
本申请实施例提供一种业务处理方法、装置、电子设备和存储介质,用以准确地将活动图转化为业务序列图,以指导业务的软件设计。
一方面,本申请实施例提供的一种业务处理方法,所述方法包括:
将目标业务的目标活动图,输入已训练的业务逻辑提取模型,获得相应的业务序列图;其中,所述目标活动图表征:所述目标业务的逻辑实现流程,所述业务序列图表征:所述逻辑实现流程涉及的各实体的交互流程,所述业务逻辑提取模型是通过以下训练过程获得的:
基于目标领域的语料文本集,对预训练语言模型进行训练,获得用于进行所述目标领域的文本语义提取的第一语言模型,以及基于第一样本活动图集对所述第一语言模型进行训练,获得用于进行活动图逻辑提取的第二语言模型;
基于第二样本活动图集对所述第二语言模型进行训练,获得用于进行活动图实体及实体职责提取的第三语言模型;其中,所述第二样本活动图集包括各第二样本活动图以及相应的实体标签;
基于第三样本活动图集对所述第三语言模型进行训练,获得所述业务逻辑提取模型;其中,所述第三样本活动图集包括各第三样本活动图以及相应的业务序列图标签。
一方面,本申请实施例提供的一种业务处理装置,包括:
转化单元,用于将目标业务的目标活动图,输入已训练的业务逻辑提取模型,获得相应的业务序列图;其中,所述目标活动图表征:所述目标业务的逻辑实现流程,所述业务序列图表征:所述逻辑实现流程涉及的各实体的交互流程;
训练单元,用于通过以下方式训练获得所述业务逻辑提取模型:
基于目标领域的语料文本集,对预训练语言模型进行训练,获得用于进行所述目标领域的文本语义提取的第一语言模型,以及基于第一样本活动图集对所述第一语言模型进行训练,获得用于进行活动图逻辑提取的第二语言模型;
基于第二样本活动图集对所述第二语言模型进行训练,获得用于进行活动图实体及实体职责提取的第三语言模型;其中,所述第二样本活动图集包括各第二样本活动图以及相应的实体标签;
基于第三样本活动图集对所述第三语言模型进行训练,获得所述业务逻辑提取模型;其中,所述第三样本活动图集包括各第三样本活动图以及相应的业务序列图标签。
可选的,所述采用自监督的训练方式,基于所述第一语料文本子集,对所述预训练语言模型进行训练,获得用于进行语料编码的中间语言模型时,所述训练单元具体用于:
基于所述第一语料文本子集,对所述预训练语言模型进行多轮迭代训练,获得所述中间语言模型,其中,每次训练执行以下操作:
从所述第一语料文本子集中选取第一语料文本,并基于预设的自监督任务,对所述第一语料文本进行文本预处理,获得处理后的第一语料文本,以及构建所述第一语料文本对应的自监督标签;
将所述处理后的第一语料文本输入所述预训练语言模型,获得相应的语料文本预测信息;
基于所述语料文本预测信息以及相应的自监督标签,获得自监督损失值,并基于所述自监督损失值对所述预训练语言模型进行参数调整。
可选的,所述基于所述第二语料文本子集,对所述中间语言模型进行训练,获得用于进行文本语义提取的第一语言模型时,所述训练单元具体用于:
基于所述第二语料文本子集,对所述中间语言模型进行多轮迭代训练,获得所述第一语言模型,其中,每次训练执行以下操作:
将从所述第二语料文本子集中选取的第二语料文本,输入所述中间语言模型,获得相应的文本语义信息;
基于所述文本语义信息以及所述第二语料文本对应的语义标签,获得语义提取损失值,并基于所述语义提取损失值对所述中间语言模型进行参数调整。
可选的,所述基于第一样本活动图集对所述第一语言模型进行训练,获得用于进行活动图逻辑提取的第二语言模型时,所述训练单元具体用于:
针对所述第一样本活动图集中的各第一样本活动图,分别执行以下操作:将一个第一样本活动图由流程图格式转换为文本格式,获得相应的样本文本,以及获得所述一个第一样本活动图关联的业务场景信息;
采用自监督的训练方式,基于各样本文本以及相应的业务场景信息,对所述第一语言模型进行训练,获得用于进行活动图逻辑提取的所述第二语言模型。
可选的,所述采用自监督的训练方式,基于各样本文本以及相应的业务场景信息,对所述第一语言模型进行训练,获得用于进行活动图逻辑提取的所述第二语言模型时,所述训练单元具体用于:
基于所述各样本文本以及相应的业务场景信息,对所述第一语言模型进行多轮迭代训练,获得所述第二语言模型,其中,每次训练执行以下操作:
从所述各样本文本中选取样本文本,并基于预设的自监督任务,将选取的样本文本进行文本预处理,获得处理后的样本文本,以及构建所述样本文本对应的自监督标签;
将所述处理后的样本文本以及相应的业务场景信息,输入所述第一语言模型,获得相应的活动图预测信息;
基于所述活动图预测信息以及相应的自监督标签,获得自监督损失值,并基于所述自监督损失值对所述第一语言模型进行参数调整。
可选的,所述将一个第一样本活动图由流程图格式转换为文本格式,获得相应的样本文本时,所述训练单元具体用于:
获得所述一个第一样本活动图中的各活动信息,以及所述各活动信息的执行顺序;
基于设定描述语言,将所述各活动信息按照所述执行顺序进行描述,获得所述样本文本。
可选的,所述基于第二样本活动图集对所述第二语言模型进行训练,获得用于进行活动图实体及实体职责提取的第三语言模型时,所述训练单元具体用于:
基于所述第二样本活动图集对所述第二语言模型进行多轮迭代训练,获得所述第三语言模型;其中,每次训练执行以下操作:
将从所述第二样本活动图集中选取第二样本活动图,并获得所述第二样本活动图的业务逻辑信息;
将所述第二样本活动图的业务逻辑信息,输入所述第二语言模型,获得相应的实体信息;其中,所述实体信息包括预测的各实体以及各实体职责;
基于所述实体信息以及所述第二样本活动图对应的实体标签,获得实体提取损失值,并基于所述实体提取损失值对所述第二语言模型进行参数调整。
可选的,所述基于第三样本活动图集对所述第三语言模型进行训练,获得所述业务逻辑提取模型时,所述训练单元具体用于:
基于所述第三样本活动图集对所述第三语言模型进行多轮迭代训练,获得所述业务逻辑提取模型;其中,每次训练执行以下操作:
从所述第三样本活动图集中选取第三样本活动图,并获得所述第三样本活动图的业务逻辑信息和实体信息;其中,所述实体信息包括所述第三样本活动图涉及的各实体以及各实体职责;
将所述第三样本活动图的业务逻辑信息和实体信息,输入所述第二语言模型,获得相应的业务序列图;
基于所述业务序列图以及所述第三样本活动图对应的业务序列图标签,获得序列生成损失值,并基于所述序列生成损失值对所述第三语言模型进行参数调整。
可选的,所述转化单元具体用于:
通过业务逻辑提取模型,提取所述目标活动图中的各活动信息以及相应的执行顺序,并基于所述各活动信息以及相应的执行顺序,获得所述目标活动图的业务逻辑信息;
通过所述业务逻辑提取模型,基于所述业务逻辑信息,识别所述目标活动图涉及的各实体和各实体职责,以及将所述各实体和各实体职责,按照所述各活动信息的执行顺序进行编排,获得相应的业务序列图。
本申请实施例提供的一种电子设备,包括处理器和存储器,其中,所述存储器存储有计算机程序,当所述计算机程序被所述处理器执行时,使得所述处理器执行上述任意一种业务处理方法的步骤。
本申请实施例提供一种计算机可读存储介质,其包括计算机程序,当所述计算机程序在电子设备上运行时,所述计算机程序用于使所述电子设备执行上述任意一种业务处理方法的步骤。
本申请实施例提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序存储在计算机可读存储介质中;当电子设备的处理器从计算机可读存储介质读取所述计算机程序时,所述处理器执行所述计算机程序,使得所述电子设备执行上述任意一种业务处理方法的步骤。
本申请的上述方案至少具有以下有益效果:
本申请实施例中,通过已训练的业务逻辑提取模型将目标业务的目标活动图,转化为相应的业务序列图,该业务逻辑提取模型的训练过程包括几个阶段,第一阶段,基于目标领域的语料文本集对预训练语言模型进行训练,使得训练后的第一语言模型学习到目标领域的语料知识;第二阶段,基于第一样本活动图集对第一语言模型进行训练,使训练后的二语言模型学习到活动图知识;第三阶段,基于第二样本活动图集对第二语言模型进行训练,使训练后的第三语言模型可以提取活动图中的实体和实体职责;第四阶段,基于第三样本活动图集对第三语言模型进行训练,使训练后的业务逻辑提取模型可以生成业务序列图。
在上述训练过程中,利用预训练语言模型的学习能力,首先使模型学习目标领域的知识,为后续的活动图分析提供知识基础;然后使模型基于对目标领域知识的理解,学习活动图知识,以提取活动图的业务逻辑信息;接着,使模型基于对活动图和领域知识的理解,学习提取活动图涉及的各实体和各实体职责,最终使模型学习构建基于各实体的业务序列图。因此,本申请实施例训练获得的业务逻辑提取模型可以准确提取活动图的业务逻辑信息,进而准确提取活动图涉及的各实体和各实体职责,以准确地将活动图转化为业务序列图,以指导业务的软件设计。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例中的一种业务处理方法的应用场景示意图;
图2为本申请实施例中的一种业务处理方法的流程图;
图3为本申请实施例中的一种目标活动图的示意图;
图4为本申请实施例中的一种业务序列图的示意图;
图5为本申请实施例中的一种业务逻辑提取模型的训练过程示意图;
图6为本申请实施例中的一种训练预训练语言模型的过程示意图;
图7为本申请实施例中的一种活动图转换为文本的示意图;
图8为本申请实施例中的一种训练第一语言模型的过程示意图;
图9为本申请实施例中的一种训练第二语言模型的过程示意图;
图10为本申请实施例中的一种训练第三语言模型的过程示意图;
图11为本申请实施例中的一种目标活动图转化为业务序列图的示意图;
图12为本申请实施例中的一种应用业务处理方法的建模系统的示意图;
图13为本申请实施例中的一个可选的交互实现时序流程示意图;
图14为本申请实施例中的一种装置业务处理的组成结构示意图;
图15为应用本申请实施例的另一种电子设备的一个硬件组成结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请技术方案的一部分实施例,而不是全部的实施例。基于本申请文件中记载的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请技术方案保护的范围。
下面对本申请实施例中涉及的部分概念进行介绍。
活动图:可以用来描述业务的工作流程和并发行为,用于展现实现业务的各种活动的顺序关系。活动图类似于流程图,可以描述过程逻辑、业务流程和工作流,但活动图支持并发行为。
业务序列图:是一种软件过程建模工具,用于描绘业务流程中的各参与者(实体)之间的消息交互顺序,它关注不同参与者之间基于消息传递进行协作,以完成特定业务目标的动态过程。消息是业务序列图中的核心元素,它表示两个参与者之间请求执行某项操作的信息传递。
实体:实体是业务过程中的参与者,是承担职责和信息交互的主体。实体是对业务领域中的核心概念的抽象,具有职责和属性。实体可以是人员、系统组件、组织等。
职责:定义了参与者在业务流程中的作用。职责在代码实现层面对应类的方法。例如“掌图”的职责是执行“支付识别”、“注册用户”等操作,这些职责在代码中将映射为“掌图”类中的方法。
自监督学习(Self-Supervised Learning):是无监督学习的一种,也被称作(pretext task)。自监督学习主要是利用辅助任务(pretext)从大规模的无监督数据中挖掘自身的监督信息,通过这种构造的监督信息对网络进行训练,从而可以学习到对下游任务有价值的表征。
下文中所用的词语“示例性”的意思为“用作例子、实施例或说明性”。作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
文中的术语“第一”、“第二”仅用于描述目的,而不能理解为明示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征,在本申请实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。
本申请实施例涉及人工智能(ArtificialIntelligence,AI)和机器学习技术,基于人工智能中的机器学习(MachineLearning,ML)而设计。
人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能是一门综合学科,涉及的领域广泛,既有硬件层面的技术,也有软件层面的技术。人工智能的基础技术一般包括传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、预训练模型技术、操作交互系统、机电一体化等技术;其中,预训练模型又称大模型、基础模型,经过微调后可以广泛应用于人工智能各大方向下游任务。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术、以及机器学习/深度学习等几大方向。
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。预训练模型是深度学习的最新发展成果,融合了以上技术。
随着人工智能的发展与进步,人工智能在多个领域中进行研究和应用,如常见的智能家居、智能穿戴设备、智能客服、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、数字孪生、虚拟人、机器人、人工智能生成内容(AIGC)、对话式交互、智能医疗、游戏AI等,相信随着未来技术的进一步发展,人工智能将在更多的领域中得到应用,发挥出越来越重要的价值。
本申请实施例中的业务逻辑提取模型是通过预训练语言模型获得的。
下面对本申请实施例的设计思想进行介绍。
相关技术中,通常由相关人员对活动图进行理解,将活动图转化为业务序列图。但是,相关人员通常不具备完善的专业知识,可能无法准确理解活动图,导致不能准确地将活动图转化为业务序列图,影响业务功能的软件设计。
有鉴于此,本申请实施例提供一种业务处理方法、装置、电子设备和存储介质,通过已训练的业务逻辑提取模型将目标业务的目标活动图,转化为相应的业务序列图,为了获得已训练的业务逻辑提取模型,利用预训练语言模型的学习能力,首先使模型学习目标领域的知识,为后续的活动图分析提供知识基础;然后使模型基于对领域知识的理解,学习活动图知识,以提取活动图的业务逻辑信息;接着,使模型基于对活动图和领域知识的理解,学习提取活动图涉及的各实体,最终使模型学习构建基于各实体的业务序列图。因此,本申请实施例训练获得的业务逻辑提取模型可以准确提取活动图的业务逻辑信息,进而准确提取活动图涉及的各实体和各实体职责,以准确地将活动图转化为业务序列图,以指导业务功能的软件设计。
以下结合说明书附图对本申请的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本申请,并不用于限定本申请,并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
如图1所示,其为本申请实施例的应用场景示意图。该应用场景图中包括终端设备110和服务器120。终端设备110与服务器120之间可以通过通信网络进行通信。
在一种可选的实施方式中,通信网络可以是有线网络或无线网络,因此,终端设备110以及服务器120可通过有线或无线通信方式进行直接或间接地连接,本申请实施例在此不做具体限制。
在本申请实施例中,终端设备110包括但不限于手机、平板电脑、笔记本电脑、台式电脑、电子书阅读器、智能语音交互设备、智能家电、车载终端等设备。服务器120可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
需要说明的是,本申请实施例中的业务处理方法可以由服务器120或者终端设备110单独执行,也可以由服务器120或者终端设备110配合执行,对此不作限定。下面分别对不同的应用场景进行示例性介绍。
在一些可能的实施例中,以服务器120单独执行为例,当需要在业务系统中增加目标业务的业务功能时,开发人员将设计的目标业务的目标活动图上传至服务器120后,服务器120可以通过已训练的业务逻辑提取模型,将该目标活动图转化为业务序列图,以指导该目标业务的业务功能设计;其中,该业务逻辑提取模型可以是服务器120对预训练语言模型进行训练获得的。
在一些可能的实施例中,以终端设备110和服务器120配合执行为例,开发人员将设计的目标业务的目标活动图上传至终端设备110后,终端设备110可以通过已训练的业务逻辑提取模型,将该目标活动图转化为业务序列图,或者,终端设备110还可以将目标活动图上传至服务器120中,由服务器120通过已训练的业务逻辑提取模型,将该目标活动图转化为业务序列图,以指导该目标业务的业务功能设计;其中,该业务逻辑提取模型可以是服务器120对预训练语言模型进行训练获得的。
需要说明的是,图1所示只是举例说明,实际上终端设备和服务器的数量不受限制,在本申请实施例中不做具体限定。
应当说明的是,图1是对本申请实施例中的方法的应用场景进行示例性介绍,实际可以适用的应用场景并不限于此。
下面结合上述描述的应用场景,参考附图来描述本申请示例性实施方式提供的业务处理方法,需要注意的是,上述应用场景仅是为了便于理解本申请的精神和原理而示出,本申请的实施方式在此方面不受任何限制。
参阅图2所示,为本申请实施例提供的一种业务处理方法的实施流程图,以服务器为执行主体为例,该方法的具体实施流程包括以下S21-S25:
S21:将目标业务的目标活动图,输入已训练的业务逻辑提取模型,获得相应的业务序列图;其中,目标活动图表征目标业务的逻辑实现流程,业务序列图表征逻辑实现流程涉及的各实体的交互流程,业务逻辑提取模型是通过以下S22-S25获得的。
其中,目标业务可以是任一业务系统中的业务,具体可以根据业务需求确定。例如:业务系统为网上购物系统,目标业务可以是网上购物系统中的支付业务、查询订单业务等;又例如:业务系统为网上订票系统,目标业务可以是网上订票系统中的订票业务、查票业务;又例如:业务系统为网上银行系统,目标业务可以上网上转账业务、余额查询业务等;目标业务还可以是上述各业务系统中的登录业务、注册业务等。本申请实施例对目标业务的类型不作限定。
在业务系统中增加目标业务或者对目标业务进行升级时,需要根据目标业务的业务序列图进行目标业务的软件设计,当只存在目标业务的目标活动图时,可以通过已训练的业务逻辑提取模型将该目标活动图转化为业务序列图。下面对目标活动图和对应的业务序列图进行示例性介绍。
假设,目标业务为网上购物系统中的支付业务,具体为刷掌支付业务,图3示出了该刷掌支付业务的目标活动图,包含用户通过刷掌进行支付以完成交易的逻辑实现流程,在该目标活动图中,用户刷掌成功后,查询掌图信息,然后提取支付账户,进行预授权扣款,如果支付成功则完成交易,如果支付失败则取消交易,最后生成交易记录并归档掌图信息。
图3所示的目标活动图转化后的业务序列图如图4所示,展示了刷掌用户、刷掌购物控制类、掌图(即掌纹)、支付账户、商品等参与者(即实体)之间的消息交互过程。刷掌用户向刷掌购物控制类发起刷掌支付,刷掌购物控制类校验掌图质量后,识别掌图,掌图识别成功后,校验用户支付权限以及校验余额,然后发起支付,支付账户创建扣款单后进行扣款,并创建完结扣款单,刷掌购物控制类发起出货后,反馈用户完成刷掌买单。
本申请实施例的业务逻辑提取模型是对预训练语言模型进行训练获得的,下面结合S22-S25对业务逻辑提取模型的训练过程进行介绍。
S22:基于目标领域的语料文本集,对预训练语言模型进行训练,获得用于进行目标领域的文本语义提取的第一语言模型。
本申请实施例中,目标领域可以包括多个领域,具体可以根据业务需求选择,例如包括:生物识别领域、支付领域、购物领域、订票领域、金融领域等等,该目标领域可以包含目标业务所属的一个或多个领域。例如,目标业务为上述刷掌支付业务,该刷掌支付业务属于支付领域、生物识别领域和购物领域。目标领域的语料文本集可以从知识库中获得,知识库可以提供目标领域的文档、报告等语料数据。
具体的,从知识库中获得语料数据后,可以对语料数据进行预处理,获得语料文本集。预处理包括但不限于为语料数据中数据打标签、对数据进行格式化处理等,其中,为数据打标签比如:标注数据所属的领域,格式化处理比如:提供一些概念的解释,如什么是实体,什么是核心域等。
例如,语料文本集可以包含以下内容:领域背景知识,包括目标领域的定义、职责、涉及的概念和实体等;行业知识,涵盖目标领域的相关标准、流程、业务规则、最佳实践等;领域术语,目标领域中使用的专有名词和术语。领域案例,目标领域涉及的具体业务案例,涵盖典型业务场景;领域结构化知识,如目标领域的概念之间的关系等结构化信息;领域专家知识,目标领域专家提供的领域内涵和细节信息。
在获得语料文本集后,可以基于该语料文本集对预训练语言模型进行训练,使该预训练语言模型学习获得对目标领域的知识的上下文理解,包括关键实体、业务逻辑等。可选的,可以采用自监督的训练方式对预训练语言模型进行训练,也可以采用自监督和监督结合的训练方式对预训练语言模型进行训练。
其中,预训练语言模型可以采用已有的预训练语言模型,例如基于transformer的预训练语言模型,具体可以为GPT(Generative Pre-trained Transformer,预训练生成式转换器)模型,对此不作限定。基于transformer的预训练语言模型,可以通过自注意力机制学习语义信息,融合先前内容和后续内容的关联,获得对上下文的理解。基于语料文本集不断对预训练语言模型进行训练,可以逐步完善预训练语言模型对目标领域的知识的学习,获得的第一语言模型可以对目标领域的文本进行编码,获得文本语义向量,从而传递语义信息,为后续的活动图理解提供知识基础。
S23:基于第一样本活动图集对第一语言模型进行训练,获得用于进行活动图逻辑提取的第二语言模型。
其中,第一样本活动图集中的各第一样本活动图可以从活动图库中获得,该活动图库中可以包括目标领域的大量活动图。本申请实施例可以采用自监督的训练方式对第一语言模型进行训练,使第一语言模型通过学习第一样本活动图集,获取对第一样本活动图的上下文理解,形成理解活动图的能力,可以提取活动图表达的业务逻辑信息,该业务逻辑信息包括活动图中的各活动信息表达的动作等。例如,以图3所示的刷掌支付活动图为例,第一语言模型通过读取该活动图中的各活动信息,如用户刷掌、查询掌图信息、提取支付账户等,结合学习到的目标领域知识,可以分析出用户刷掌以及查询掌图信息是进行身份识别这一动作,提取支付账户是进行支付这一动作,因此可以提取出身份识别及支付这两个动作。
需要说明的是,为了使第一语言模型更好的学习活动图表达的业务逻辑,针对上述第一样本活动图集中的各第一样本活动图,还可以获得每个第一样本活动图相关的业务场景信息,该业务场景信息可以包括对第一样本活动图中的各活动信息(即第一样本活动图中的各步骤)的解释信息或者背景信息等,比如,某个活动信息中包括某个角色的行为,该活动信息的解释信息可以是这个角色通常负责什么工作,这些工作对应什么职责等;以活动信息为用户刷掌为例,解释信息可以是刷掌设备执行采集掌图这一动作,实际的职责是收款,采集掌图是收款这个职责里的一个部分。因此,上述第一样本活动图集除了包括各第一样本活动图,还可以包括各第一样本活动图的业务场景信息,这样,第一语言模型通过学习该第一样本活动图集,可以更好的提取活动图的业务逻辑信息。
本申请实施例中,通过第一样本活动图集对第一语言模型进行自监督训练,使得训练获得的第二语言模型可以提取活动图的业务逻辑信息,以形成理解活动图的能力,为后续的活动图实体和实体职责提取提供知识基础。
S24:基于第二样本活动图集对第二语言模型进行训练,获得用于进行活动图实体及实体职责提取的第三语言模型;其中,第二样本活动图集包括各第二样本活动图以及相应的实体标签。
其中,第二样本活动图集也可以从上述活动图库中获得,各第二样本活动图可以与上述第一样本活动图相同,也可以不同。每个第二样本活动图的实体标签可以包含第二样本活动图涉及的真实的各实体以及各实体职责,其中,各实体可以理解为第二样本活动图表达的各动作的参与者;例如,第二样本活动图中包含查询掌图信息和提取支付账户这两个步骤,表达的动作为身份识别和支付,则可以提取出掌图和支付账户这两个实体,掌图的职责是身份识别,支付账户的职责是付款。
在上述S23的基础上,获得的第二语言模型具有提取活动图的业务逻辑信息的能力,进一步地,在S24中,基于第二样本活动图集对第二语言模型进行训练。具体的,通过第二语言模型提取第二样本活动图涉及的实体信息(包括各实体和各实体职责),然后基于该实体信息与相应的实体标签可以计算损失值,从而对第二语言模型进行参数调整。最后训练获得的第三语言模型可以结合学习到的目标领域知识以及活动图知识,提取活动图的业务逻辑信息,进而基于业务逻辑信息提取活动图涉及的各实体以及各实体职责。
需要说明的是,为了使第二语言模型更好的学习活动图涉及的各实体以及各实体职责,针对第二样本活动图集中的各第二样本活动图,还可以获得每个第二样本活动图相关的业务场景信息,该业务场景信息与上述第一样本活动图相关的业务场景信息类似。在对第二语言模型进行训练过程中,可以将第二样本活动图和相关的业务场景信息同时输入第二语言模型,以提取第二样本活动图涉及的实体信息。
本申请实施例中,通过第一样本活动图集对第一语言模型进行训练,使得训练获得的第三语言模型可以提取活动图涉及的各实体以及各实体职责,为后续生成业务序列图提供知识基础。
S25:基于第三样本活动图集对第三语言模型进行训练,获得业务逻辑提取模型;其中,第三样本活动图集包括各第三样本活动图以及相应的业务序列图标签。
其中,第三样本活动图集也可以从上述活动图库中获得,各第三样本活动图可以与上述第一样本活动图或者第二样本活动图相同,也可以不同。每个第三样本活动图的业务序列图标签可以包含该第三样本活动图转换后的真实的业务序列图。
在上述S24的基础上,获得的第三语言模型具有提取活动图涉及的各实体以及各实体职责的能力,进一步地,在S25中,基于第三样本活动图集对第三语言模型进行训练。具体的,通过第三语言模型将第三样本活动图转化为相应的业务序列图,然后基于该业务序列图与相应的业务序列图标签可以计算损失值,从而对第三语言模型进行参数调整。最后训练获得的业务逻辑提取模型可以准确地将活动图转化为相应的业务序列图。
下面结合图5对本申请上述实施例中的业务逻辑提取模型的训练过程进行整体说明。
如图5所示,本申请实施例利用预训练语言模型的学习能力,首先使预训练语言模型学习目标领域的知识,获得第一语言模型,为后续的活动图分析提供知识基础;然后使第一语言模型基于对领域知识的理解,学习活动图知识,以提取活动图的业务逻辑信息,获得第二语言模型;接着,使第二语言模型基于对活动图和领域知识的理解,学习提取活动图涉及的各实体和各实体职责,获得第三语言模型,最终使第三语言模型学习构建基于各实体的业务序列图,获得业务逻辑提取模型。基于上述过程训练获得的业务逻辑提取模型可以准确地将活动图转化为业务序列图,以指导业务的软件设计。
下面对上述实施例中的S22的具体实施过程进行介绍。
在一些实施例中,上述S22中基于语料文本集对预训练语言模型进行训练的过程可以包括两个训练阶段,可以将语料文本集划分为第一语料文本子集和第二语料文本子集,如图6所示,第一训练阶段基于第一语料文本子集对预训练语言模型进行自监督训练,以使预训练语言模型学习目标领域的基础知识,获得中间语言模型;第二训练阶段基于第二语料文本子集对中间语言模型进行监督训练,以对中间语言模型进行微调,使中间语言模型学习目标领域的细节知识,获得第一语言模型。
上述S22中基于目标领域的语料文本集,对预训练语言模型进行训练,获得用于进行目标领域的文本语义提取的第一语言模型,可以包括以下步骤A1-A2:
A1、采用自监督的训练方式,基于第一语料文本子集,对预训练语言模型进行训练,获得用于进行语料编码的中间语言模型。
在一种可选的实施方式中,在执行步骤A1时,可以基于第一语料文本子集,对预训练语言模型进行多轮迭代训练,直至达到迭代收敛条件,获得中间语言模型,其中,每次训练可以执行以下步骤A11-A13:
A11、从第一语料文本子集中选取第一语料文本,并基于预设的自监督任务,对第一语料文本进行文本预处理,获得处理后的第一语料文本,以及构建第一语料文本对应的自监督标签。
其中,自监督任务包括但不限于遮掩词预测、前后句预测等任务。其中,对于遮掩词预测,可以将第一语料文本中的指定词语进行遮掩,使预训练语言模型预测该指定词语,将遮掩后的第一语料文本作为处理后的第一语料文本,将指定词语作为自监督标签;对于前后句预测,可以给定第一语料文本中的前一个句子,使预训练语言模型预测后一个句子,这样,可以将第一语料文本中给定的句子作为处理后的第一语料文本,将需要预测的句子作为自监督标签。
A12将处理后的第一语料文本输入预训练语言模型,获得相应的语料文本预测信息。
该步骤中,预训练语言模型可以基于处理后的第一语料文本,预测第一语料文本中的缺失内容,获得语料文本预测信息,缺失内容可以是上述遮掩词或者句子等。
A13、基于语料文本预测信息以及相应的自监督标签,获得自监督损失值,并基于自监督损失值对预训练语言模型进行参数调整。
可选的,可以使用交叉熵损失函数,计算语料文本预测信息以及自监督标签的自监督损失值,然后基于该自监督损失值采用梯度下降算法对预训练语言模型进行参数调整。
A2、基于第二语料文本子集,对中间语言模型进行训练,获得用于进行文本语义提取的第一语言模型;其中,第二语料文本子集中的每个语料文本具有相应的语义标签。
在执行步骤A2时,可以基于第二语料文本子集,对中间语言模型进行多轮迭代训练,直至达到迭代收敛条件,获得第一语言模型,其中,每次训练可以执行以下步骤A21-A22:
A21、将从第二语料文本子集中选取的第二语料文本,输入中间语言模型,获得相应的文本语义信息。
其中,中间语言模型可以对第二语料文本进行编码,获得文本语义向量,即获得文本语义信息。
A22、基于文本语义信息以及第二语料文本对应的语义标签,获得语义提取损失值,并基于语义提取损失值对中间语言模型进行参数调整。
可选的,可以使用交叉熵损失函数,计算文本语义信息以及语义标签的差异,获得语义提取损失值,然后基于该语义提取损失值采用梯度下降算法对中间语言模型进行参数调整。
本申请实施例中,通过自监督和监督相结合的训练方式,使预训练语言模型学习目标领域的基础知识和细节知识,从而逐步完善对目标领域知识的吸收,实现知识的沉淀,获得训练后的第一语言模型,为后续的活动图学习提供知识基础。
下面对本申请上述实施例中的S23的具体实施过程进行介绍。
在一些实施例中,S23中基于第一样本活动图集对第一语言模型进行训练,获得用于进行活动图逻辑提取的第二语言模型,可以包括以下步骤B1-B2:
B1、针对第一样本活动图集中的各第一样本活动图,分别执行以下操作:将一个第一样本活动图由流程图格式转换为文本格式,获得相应的样本文本,以及获得一个第一样本活动图关联的业务场景信息。
本申请实施例中,为了便于第一语言模型读取第一样本活动图,可以将第一样本活动图由流程图格式转换为文本格式,获得样本文本。并且,为了使第一语言模型更好的学习第一样本活动图的业务逻辑信息,可以获得第一样本活动图关联的业务场景信息,该业务场景信息可以包括对第一样本活动图中的各活动信息的解释信息或者背景信息等,使第一语言模型可以同时读取样本文本及相应的业务场景信息。
可选的,将一个第一样本活动图由流程图格式转换为文本格式时,可以获得一个第一样本活动图中的各活动信息,以及各活动信息的执行顺序;基于设定描述语言,将各活动信息按照执行顺序进行描述,获得样本文本。
其中,第一样本活动图中的各步骤即为各活动信息,可以通过活动图转换器,读取第一样本活动图中的各活动信息以及各活动信息的执行顺序,并基于该活动图转换器的设定描述语言,将各活动信息按照执行顺序进行描述,获得样本文本。例如,设定描述语言可以为UML(Unified Modeling Language ,统一建模语言),是用来对软件密集系统进行可视化建模的一种语言。
示例性的,如图7所示,假设第一样本活动图中的各活动信息依次包括准备训练数据集、构建掌图分割模型、定义损失函数、定义优化算法、训练掌图分割模型,则基于UML语言将该第一样本活动图转换为文本格式后,获得的样本文本为: plantUmlData:{“data”:\n:“准备训练数据集;\n:构建掌图分割模型;\n:定义损失函数\n:定义优化算法;\n:训练掌图分割模型”。
B2、采用自监督的训练方式,基于各样本文本以及相应的业务场景信息,对第一语言模型进行训练,获得用于进行活动图逻辑提取的第二语言模型。
在一种可选的实施方式中,在执行步骤B2时,可以基于各样本文本以及相应的业务场景信息,对第一语言模型进行多轮迭代训练,获得第二语言模型,其中,每次训练执行以下步骤B21-B23:
B21、从各样本文本中选取样本文本,并基于预设的自监督任务,将选取的样本文本进行文本预处理,获得处理后的样本文本,以及构建样本文本对应的自监督标签。
该步骤与本申请上述实施例中的步骤A11的自监督训练的实施过程类似,自监督任务包括但不限于遮掩词预测、前后句预测等任务。其中,对样本文本进行文本预处理的过程,与上述步骤A11中对第一语料文本进行文本预处理的过程类似。对于遮掩词预测,可以将样本文本中的指定词语进行遮掩,使第一练语言模型预测该指定词语,将遮掩后的样本文本作为处理后的样本文本,将指定词语作为自监督标签;对于前后句预测,可以给定样本文本中的前一个句子,使第一语言模型预测后一个句子,这样,可以将样本文本中给定的句子作为处理后的样本文本,将需要预测的句子作为自监督标签。
B22、将处理后的样本文本以及相应的业务场景信息,输入第一语言模型,获得相应的活动图预测信息。
该步骤中,第一语言模型可以基于处理后的样本文本,预测样本文本中的缺失内容,获得活动图预测信息,缺失内容可以是样本文本种的遮掩词或者句子等。
B23、基于活动图预测信息以及相应的自监督标签,获得自监督损失值,并基于自监督损失值对第一语言模型进行参数调整。
可选的,可以使用交叉熵损失函数,计算活动图预测信息以及自监督标签的差异,获得自监督损失值,然后基于该自监督损失值采用梯度下降算法对第一语言模型进行参数调整。
下面结合图8对第一语言模型的训练过程进行整体介绍。
如图8所示,基于第一样本活动图集对第一语言模型进行训练时,将第一样本活动图集中转换为各样本文本,并获得每个第一样本活动图关联的业务场景信息,采用自监督训练的方式,基于各样本文本和相应的业务场景信息,对第一语言模型进行训练,使得第一语言模型学习到活动图知识,能够提取活动图的业务逻辑信息,获得训练后的第二语言模型。
下面对本申请上述实施例中的S24的具体实施过程进行介绍。
在一些实施例中,在执行S24时,可以基于第二样本活动图集对第二语言模型进行多轮迭代训练,获得用于进行活动图实体及实体职责提取的第三语言模型;其中,每次训练执行以下步骤C1-C3:
C1、将从第二样本活动图集中选取第二样本活动图,并获得第二样本活动图的业务逻辑信息。
其中,第二样本活动图的业务逻辑信息可以预先获得,也可以通过第二语言模型从第二样本活动图中提取获得,该第二语言模型通过学习到的目标领域知识和活动图知识,可以提取到第二样本活动图的业务逻辑信息。
C2、将第二样本活动图的业务逻辑信息,输入第二语言模型,获得相应的实体信息;其中,实体信息包括预测的各实体以及各实体职责。
具体的,第二语言模型读取第二样本活动图的业务逻辑信息,提取到活动图中的各活动信息所表达的动作,然后结合学习到的目标领域的知识,分析承担各动作的实体,进而确定各实体的职责。
C3、基于实体信息以及第二样本活动图对应的实体标签,获得实体提取损失值,并基于实体提取损失值对第二语言模型进行参数调整。
其中,实体标签包含真实的各实体以及各实体职责。可选的,可以使用交叉熵损失函数,计算实体信息以及实体标签的差异,获得实体提取损失值,然后基于该实体提取损失值采用梯度下降算法对第二语言模型进行参数调整。
下面结合图9对第二语言模型的训练过程进行整体介绍。
如图9所示,基于第二样本活动图集对第二语言模型进行训练时,获得各第二样本活动图的业务逻辑信息,该业务逻辑信息包括第二样本活动图中的各活动信息所表达的动作等,将第二样本活动图的业务逻辑信息输入第二语言模型,获得第二样本活动图涉及的实体信息(包括预测的各实体和各实体职责),然后基于实体信息与相应的实体标签(包括真实的各实体和各实体职责)计算实体提取损失值,并基于实体提取损失值对第二语言模型进行参数调整,直至实体提取损失值满足设定条件,停止训练,获得训练后的第三语言模型。
下面对本申请上述实施例中的S25的具体实施过程进行介绍。
在一些实施例中,在S25中基于第三样本活动图集对第三语言模型进行训练时,可以基于第三样本活动图集对第三语言模型进行多轮迭代训练,获得业务逻辑提取模型;其中,每次训练执行以下步骤D1-D3:
D1、从第三样本活动图集中选取第三样本活动图,并获得第三样本活动图的业务逻辑信息和实体信息;其中,实体信息包括第三样本活动图涉及的各实体以及各实体职责。
其中,第三样本活动图的业务逻辑信息和实体信息可以预先获得,也可以通过第三语言模型从第三样本活动图中提取获得,该第三语言模型通过学习到的目标领域知识、活动图知识以及活动图实体及实体职责学习,可以提取到第三样本活动图的业务逻辑信息和实体信息。
D2、将第三样本活动图的业务逻辑信息和实体信息,输入第二语言模型,获得相应的业务序列图。
具体的,第三语言模型读取第二样本活动图的业务逻辑信息和实体信息,获得活动图中的各活动信息所表达的动作,以及承担各动作的实体和各实体的职责,进而基于各实体和各实体职责生成相应的业务序列图。
D3、基于业务序列图以及第三样本活动图对应的业务序列图标签,获得序列生成损失值,并基于序列生成损失值对第三语言模型进行参数调整。
可选的,可以使用交叉熵损失函数,计算语料文本预测信息以及自监督标签的自监督损失值,然后基于该自监督损失值采用梯度下降算法对预训练语言模型进行参数调整。
下面结合图10对第二语言模型的训练过程进行介绍。
如图10所示,基于第三样本活动图集对第三语言模型进行训练时,获得各第三样本活动图的业务逻辑信息和实体信息,将第三样本活动图的业务逻辑信息和实体信息输入第三语言模型,获得预测的业务序列图,然后计算预测的业务序列图和业务序列图标签(即真实的业务序列图)的差异,获得序列生成损失值,并基于序列生成损失值对第三语言模型进行参数调整,直至序列生成损失值满足设定条件,停止训练,获得训练后的业务逻辑提取模型。
在一些实施例中,在训练获得业务逻辑提取模型后,可以将目标业务的目标活动图,输入已训练的业务逻辑提取模型,获得相应的业务序列图,具体可以包括以下步骤E1-E2:
E1、通过业务逻辑提取模型,提取目标活动图中的各活动信息以及相应的执行顺序,并基于各活动信息以及相应的执行顺序,获得目标活动图的业务逻辑信息。
其中,基于各活动信息以及相应的执行顺序,分析出各活动信息表达的动作以及含义,获得目标活动图的业务逻辑信息。
E2、通过业务逻辑提取模型,基于业务逻辑信息,识别目标活动图涉及的各实体和各实体职责,以及将各实体和各实体职责,按照各活动信息的执行顺序进行编排,获得相应的业务序列图。
其中,针对各活动信息表达的动作,分析执行每个动作的实体,并根据实体执行的动作确定实体职责,在获得各实体和各实体职责后,按照各活动信息的执行顺序,基于各实体职责编排各实体的交互流程,获得业务序列图。
示例性的,如图11所示,以目标活动图为刷掌支付活动图为例,将刷掌支付活动图输入业务逻辑提取模型,业务逻辑提取模型首先提取刷掌支付活动图的业务逻辑信息,包括身份识别和支付等动作,然后分析承担这些动作的实体,例如,掌图、支付账户等,进而为实体分配职责,例如,掌图的职责是身份识别,支付账户的职责是付款,最后,基于掌图的职责、支付账户的职责等编排掌图、支付账户等的交互流程图,获得刷掌支付业务序列图。
需要说明的是,目标活动图可以是任意业务的活动图,任意业务包括但不限支付业务、查询订单业务、订票业务、查票业务、网上转账业务、余额查询业务、登录业务、注册业务等等。可以理解是,本申请实施例的业务处理方法可以应用于任意业务场景。
下面结合具体的例子对本申请的业务逻辑提取模型的训练过程进行详细介绍。
本申请实施例可以通过建模系统,基于预训练语言模型训练获得业务逻辑提取模型,如图12所示,该建模系统包括领域知识学习模块1201、活动图学习模块1202、实体提取和职责分配模块1203以及业务逻辑梳理模块1204;其中,领域知识学习模块1201,用于基于目标领域的语料文本集对预训练语言模型进行训练,获得第一语言模型;活动图学习模块1202,用于基于第一样本活动图集对第一语言模型进行训练,获得第二语言模型;实体提取和职责分配模块1203,用于基于第二样本活动图集对第二语言模型进行训练,获得第三语言模型;业务逻辑梳理模块1204,用于基于第三样本活动图集对第三语言模型进行训练,获得业务逻辑提取模型。
一、领域知识学习模块
领域知识学习模块,基于深度学习进行训练,学习目标领域(可以包括多个领域)知识,包括领域背景、行业知识、行业规则等,从而理解目标领域的内容,作为活动图学习模块、实体提取和职责分配模块以及业务逻辑梳理模块的基础能力。比如,领域知识学习模块通过学习大量的生物识别领域、支付领域的内容,可以分析出刷掌支付业务中,刷掌的本质是进行身份识别,然后基于身份识别的结果进行支付等后续工作。
领域知识学习模块基于预训练语言模型实现,下面实施例中以预训练语言模型为GPT模型为例,GPT模型包含自注意力机制,通过训练一个大规模的转换器模型来获得对语言的理解,可以生成高质量的文本。领域知识学习模块的训练过程具体包括以下两阶段:
第一阶段,在目标领域的语料文本集上,对GPT模型进行自监督训练,获得对语料文本集的上下文理解,学习目标领域知识。
第二阶段,微调阶段,进一步增强对目标领域的细节知识的学习。
领域知识学习模块包含GPT模型、目标领域的知识库、语料处理器。知识库提供目标领域的文档、报告等语料,语料处理器可以对语料数据进行预处理,即将语料数据进行规则化,获得语料文本集,具体可以包含以下内容:
领域背景知识:包括目标领域的定义、职责、涉及的概念和实体等。
行业知识:涵盖目标领域的相关标准、流程、业务规则、最佳实践等。
领域术语:目标领域中使用的专有名词和术语。
领域案例:目标领域涉及的具体业务案例,涵盖典型业务场景。
领域结构化知识:如目标领域的概念之间的关系等结构化信息。
领域专家知识:目标领域专家提供的领域内涵和细节信息。
具体的,在第一阶段,GPT模型读取语料文本集中的第一语料文本子集进行自监督训练,通过自注意力机制学习语义信息,融合先前内容和后续内容的关联,获得对上下文的理解包括涉及的实体、业务逻辑等。重复这个过程,不断训练GPT模型,逐步完善对目标领域知识的吸收,实现知识的沉淀。
在第二阶段,可以基于语料文本集中的第二语料文本子集,采用监督训练方式,对第一阶段训练后的GPT模型进行监督训练,增强对目标领域的细节知识的学习。
上述领域知识学习模块可以持续学习目标领域知识,训练后的GPT模型作为第一语言模型,可以用于编码目标领域的文本,输出文本语义向量,传递语义信息,对目标领域知识建立系统性理解,为后续的活动图分析提供知识基础。
二、活动图学习模块
活动图学习模块可以获得领域知识学习模块训练后的第一语言模型,通过第一语言模型学习大量活动图及其业务场景信息(可以理解为对活动图的解释信息),形成理解活动图的能力,比如,提取活动图包含的各活动信息,进而提取活动图表达的动作和含义等。
具体的,利用第一样本活动图集,对第一语言模型进行自监督训练,获取对各第一样本活动图的上下文理解。在该训练过程中,第一语言模型不但学习第一样本活动图包含的各活动信息,如动作、决策、开始、结束等,还学习各活动信息表达的动作及含义。
第一样本活动图集包含大量的第一样本活动图及其业务场景信息。具体的,还可以通过活动图转换器将第一样本活动图转换为文本格式,获得样本文本。基于各样本文本及其业务场景信息,对第一语言模型进行自监督训练,实现对第一样本活动图的理解。
对第一语言模型训练完成后,获得第二语言模型,第二语言模型可以理解活动图,提取活动图的业务逻辑信息,即活动图的各活动信息表达的动作和含义,为后续的实体提取和职责分配提供知识基础。例如:第二语言模型从刷掌支付活动图中可以提取身份识别及支付两个动作,抽象除掌图和支付账户两个实体概念。
三、实体提取和职责分配模块
实体提取和职责分配模块,通过第二语言模型学习从活动图中提取实体以及为实体分配职责,即基于活动图中的各活动信息表达的动作,分析动作的职责是什么,职责应该由哪些实体承担,从而将活动图中的活动信息与业务序列图中的实体职责进行对应。
具体的,获得第二样本活动图集,每个第二样本活动图对应有实体标签(包括真实的各实体和各实体职责),将各第二样本活动图的业务逻辑信息输入第二语言模型进行训练,基于输出的每个第二样本活动图的实体信息(预测的各实体和各实体职责)以及相应的实体标签,计算实体提取损失值,以对第二语言模型进行参数调整,最终获得训练后的第三语言模型。
第三语言模型可以从活动图中提取实体以及为实体分配职责,具体如下:
(1)实体提取
第三语言模型基于学习到的目标领域知识和活动图知识,结合活动图的业务场景信息等,对活动图表达的动作进行细粒度解析,提炼出涉及的实体。
以刷掌支付业务为例:
基于学习的目标领域知识,分析出刷掌是指生物识别,用来识别某个人;
基于学习的活动图知识,分析出活动图分为身份识别和支付两个动作;
查阅活动图的业务场景信息,分析出身份识别基于用户的掌图进行生物识别,支付基于支付账户;
因此,提取出掌图(掌纹)和支付账户两个实体。
(2)实体职责分配
第三语言模型基于学习到的目标领域知识和活动图知识,对活动图表达的每个动作进行细粒度解析,获得执行每个动作的实体,比如,对于录掌这一动作来说,可以分析出刷掌设备执行录掌这个动作。
还以刷掌支付业务为例:身份识别这一动作对应掌图(掌纹)识别;支付这一动作对应支付账户付款;因此,分析出掌图的职责是身份识别,支付账户的职责是付款。
通过第三语言模型可以提取活动图涉及的各实体,并确定每个实体的职责,为后续的业务序列图的生成提供知识基础。
四、业务逻辑梳理模块
业务逻辑梳理模块,基于第三样本活动图集对第三语言模型进行训练,使得第三语言模型在学习到活动图的实体提取以及实体职责分配的基础上,继续学习生成业务序列图。具体的,在已知活动图的各实体和各实体职责的基础上,根据活动图中各活动信息的执行顺序(即执行路径,包括主分支、次要分支、条件判断等),来梳理出业务序列图。
具体的,在第三语言模型的训练过程中,将各第三样本活动图的业务逻辑信息和实体信息,输入第三语言模型,获得预测的每个第三样本活动图对应的业务序列图,然后计算预测的业务序列图和业务序列图标签(即真实的业务序列图)的差异,获得序列生成损失值,以对第三语言模型进行参数调整,最终获得训练后的业务逻辑提取模型。
业务逻辑提取模型可以根据活动图提取业务逻辑信息,将业务逻辑信息包含的各动作转化为实体所承担的职责,进而基于各实体和各实体职责生成业务序列图。
例如,业务逻辑梳理模块从刷掌支付业务活动图中,分析出:
用户刷掌-->身份识别(掌图职责);
身份通过后-->查询用户账号(支付账户职责);
查询账号后-->进行支付(支付账户职责);
支付成功-->商品出货(其他职责)。
业务逻辑梳理模块获得的业务逻辑提取模型,通过对活动图表达的动作进行细粒度解析,得到各实体和各实体职责,然后,基于活动图的执行路径分析得到的业务流程,将业务流程映射到实体职责,最终重新构建基于实体和职责的业务序列图。
综上,本申请实施例利用GPT模型的学习能力,基于对活动图和领域知识的理解,可以自动提取代表原有业务逻辑的实体、职责和流程,帮助专家理解仅有活动图的老旧业务系统。
本申请实施例的方案至少具有以下有益效果:
解决仅有活动图而没有序列图的老旧业务系统分析难题。基于对活动图和领域知识的学习,自动推理活动图中的实体、职责和业务逻辑,重现系统的业务本质。
为专家提供辅助分析工具。基于GPT模型,能够理解复杂领域的活动图,指导专家深入解读系统。有助于系统重构和转型,构建符合业务本质的新方案。
实现专家知识复用和降低维护成本。提取的领域知识能重复使用,减少工作量;分析结果为系统维护提供参考,降低成本。
总之,本申请的方案通过自动理解活动图,提取其隐藏的实体、职责和逻辑,重现仅有活动图的老旧系统的业务本质。同时为系统演进提供支撑,有效降低维护成本。
基于相同的发明构思,本申请实施例还提供一种业务处理装置。如图13所示,其为业务处理装置1300的结构示意图,可以包括:
转化单元1301,用于将目标业务的目标活动图,输入已训练的业务逻辑提取模型,获得相应的业务序列图;其中,目标活动图表征:目标业务的逻辑实现流程,业务序列图表征:逻辑实现流程涉及的各实体的交互流程;
训练单元1302,用于通过以下方式训练获得业务逻辑提取模型:
基于目标领域的语料文本集,对预训练语言模型进行训练,获得用于进行目标领域的文本语义提取的第一语言模型,以及基于第一样本活动图集对第一语言模型进行训练,获得用于进行活动图逻辑提取的第二语言模型;
基于第二样本活动图集对第二语言模型进行训练,获得用于进行活动图实体及实体职责提取的第三语言模型;其中,第二样本活动图集包括各第二样本活动图以及相应的实体标签;
基于第三样本活动图集对第三语言模型进行训练,获得业务逻辑提取模型;其中,第三样本活动图集包括各第三样本活动图以及相应的业务序列图标签。
可选的,语料文本集包括第一语料文本子集和第二语料文本子集;
则基于目标领域的语料文本集,对预训练语言模型进行训练,获得用于进行目标领域的文本语义提取的第一语言模型时,训练单元1302具体用于:
采用自监督的训练方式,基于第一语料文本子集,对预训练语言模型进行训练,获得用于进行语料编码的中间语言模型;
基于第二语料文本子集,对中间语言模型进行训练,获得用于进行文本语义提取的第一语言模型;其中,第二语料文本子集中的每个语料文本具有相应的语义标签。
可选的,采用自监督的训练方式,基于第一语料文本子集,对预训练语言模型进行训练,获得用于进行语料编码的中间语言模型时,训练单元1302具体用于:
基于第一语料文本子集,对预训练语言模型进行多轮迭代训练,获得中间语言模型,其中,每次训练执行以下操作:
从第一语料文本子集中选取第一语料文本,并基于预设的自监督任务,对第一语料文本进行文本预处理,获得处理后的第一语料文本,以及构建第一语料文本对应的自监督标签;
将处理后的第一语料文本输入预训练语言模型,获得相应的语料文本预测信息;
基于语料文本预测信息以及相应的自监督标签,获得自监督损失值,并基于自监督损失值对预训练语言模型进行参数调整。
可选的,基于第二语料文本子集,对中间语言模型进行训练,获得用于进行文本语义提取的第一语言模型时,训练单元1302具体用于:
基于第二语料文本子集,对中间语言模型进行多轮迭代训练,获得第一语言模型,其中,每次训练执行以下操作:
将从第二语料文本子集中选取的第二语料文本,输入中间语言模型,获得相应的文本语义信息;
基于文本语义信息以及第二语料文本对应的语义标签,获得语义提取损失值,并基于语义提取损失值对中间语言模型进行参数调整。
可选的,基于第一样本活动图集对第一语言模型进行训练,获得用于进行活动图逻辑提取的第二语言模型时,训练单元1302具体用于:
针对第一样本活动图集中的各第一样本活动图,分别执行以下操作:将一个第一样本活动图由流程图格式转换为文本格式,获得相应的样本文本,以及获得一个第一样本活动图关联的业务场景信息;
采用自监督的训练方式,基于各样本文本以及相应的业务场景信息,对第一语言模型进行训练,获得用于进行活动图逻辑提取的第二语言模型。
可选的,采用自监督的训练方式,基于各样本文本以及相应的业务场景信息,对第一语言模型进行训练,获得用于进行活动图逻辑提取的第二语言模型时,训练单元1302具体用于:
基于各样本文本以及相应的业务场景信息,对第一语言模型进行多轮迭代训练,获得第二语言模型,其中,每次训练执行以下操作:
从各样本文本中选取样本文本,并基于预设的自监督任务,将选取的样本文本进行文本预处理,获得处理后的样本文本,以及构建样本文本对应的自监督标签;
将处理后的样本文本以及相应的业务场景信息,输入第一语言模型,获得相应的活动图预测信息;
基于活动图预测信息以及相应的自监督标签,获得自监督损失值,并基于自监督损失值对第一语言模型进行参数调整。
可选的,将一个第一样本活动图由流程图格式转换为文本格式,获得相应的样本文本时,训练单元1302具体用于:
获得一个第一样本活动图中的各活动信息,以及各活动信息的执行顺序;
基于设定描述语言,将各活动信息按照执行顺序进行描述,获得样本文本。
可选的,基于第二样本活动图集对第二语言模型进行训练,获得用于进行活动图实体及实体职责提取的第三语言模型时,训练单元1302具体用于:
基于第二样本活动图集对第二语言模型进行多轮迭代训练,获得第三语言模型;其中,每次训练执行以下操作:
将从第二样本活动图集中选取第二样本活动图,并获得第二样本活动图的业务逻辑信息;
将第二样本活动图的业务逻辑信息,输入第二语言模型,获得相应的实体信息;其中,实体信息包括预测的各实体以及各实体职责;
基于实体信息以及第二样本活动图对应的实体标签,获得实体提取损失值,并基于实体提取损失值对第二语言模型进行参数调整。
可选的,基于第三样本活动图集对第三语言模型进行训练,获得业务逻辑提取模型时,训练单元1302具体用于:
基于第三样本活动图集对第三语言模型进行多轮迭代训练,获得业务逻辑提取模型;其中,每次训练执行以下操作:
从第三样本活动图集中选取第三样本活动图,并获得第三样本活动图的业务逻辑信息和实体信息;其中,实体信息包括第三样本活动图涉及的各实体以及各实体职责;
将第三样本活动图的业务逻辑信息和实体信息,输入第二语言模型,获得相应的业务序列图;
基于业务序列图以及第三样本活动图对应的业务序列图标签,获得序列生成损失值,并基于序列生成损失值对第三语言模型进行参数调整。
可选的,转化单元1301具体用于:
通过业务逻辑提取模型,提取目标活动图中的各活动信息以及相应的执行顺序,并基于各活动信息以及相应的执行顺序,获得目标活动图的业务逻辑信息;
通过业务逻辑提取模型,基于业务逻辑信息,识别目标活动图涉及的各实体和各实体职责,以及将各实体和各实体职责,按照各活动信息的执行顺序进行编排,获得相应的业务序列图。
为了描述的方便,以上各部分按照功能划分为各模块(或单元)分别描述。当然,在实施本申请时可以把各模块(或单元)的功能在同一个或多个软件或硬件中实现。
在介绍了本申请示例性实施方式的业务处理方法和装置之后,接下来,介绍根据本申请的另一示例性实施方式的电子设备。
所属技术领域的技术人员能够理解,本申请的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
与上述方法实施例基于同一发明构思,本申请实施例中还提供了一种电子设备。在一种实施例中,该电子设备可以是服务器,如图1所示的服务器120。在该实施例中,电子设备的结构可以如图14所示,包括存储器1401,通讯模块1403以及一个或多个处理器1402。
存储器1401,用于存储处理器1402执行的计算机程序。存储器1401可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统,以及运行即时通讯功能所需的程序等;存储数据区可存储各种即时通讯信息和操作指令集等。
存储器1401可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器1401也可以是非易失性存储器(non-volatilememory),例如只读存储器,快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD);或者存储器1401是能够用于携带或存储具有指令或数据结构形式的期望的计算机程序并能够由计算机存取的任何其他介质,但不限于此。存储器1401可以是上述存储器的组合。
处理器1402,可以包括一个或多个中央处理单元(central processing unit,CPU)或者为数字处理单元等等。处理器1402,用于调用存储器1401中存储的计算机程序时实现上述业务处理方法。
通讯模块1403用于与终端设备和其他服务器进行通信。
本申请实施例中不限定上述存储器1401、通讯模块1403和处理器1402之间的具体连接介质。本申请实施例在图14中以存储器1401和处理器1402之间通过总线1404连接,总线1404在图14中以粗线描述,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线1404可以分为地址总线、数据总线、控制总线等。为便于描述,图14中仅用一条粗线描述,但并不描述仅有一根总线或一种类型的总线。
存储器1401中存储有计算机存储介质,计算机存储介质中存储有计算机可执行指令,计算机可执行指令用于实现本申请实施例的业务处理方法。处理器1402用于执行上述的业务处理方法,如图4所示。
在另一种实施例中,电子设备也可以是其他电子设备,如图1所示的终端设备110。在该实施例中,电子设备的结构可以如图15所示,包括:通信组件1510、存储器1520、显示单元1530、摄像头1540、传感器1550、音频电路1560、蓝牙模块1570、处理器1580等部件。
通信组件1510用于与服务器进行通信。在一些实施例中,可以包括电路无线保真(Wireless Fidelity,WiFi)模块,WiFi模块属于短距离无线传输技术,电子设备通过WiFi模块可以帮助用户收发信息。
存储器1520可用于存储软件程序及数据。处理器1580通过运行存储在存储器1520的软件程序或数据,从而执行终端设备110的各种功能以及数据处理。存储器1520可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。存储器1520存储有使得终端设备110能运行的操作系统。本申请中存储器1520可以存储操作系统及各种应用程序,还可以存储执行本申请实施例业务处理方法的计算机程序。
显示单元1530还可用于显示由用户输入的信息或提供给用户的信息以及终端设备110的各种菜单的图形用户界面(graphical user interface,GUI)。具体地,显示单元1530可以包括设置在终端设备110正面的显示屏1532。其中,显示屏1532可以采用液晶显示器、发光二极管等形式来配置。显示单元1530可以用于显示本申请实施例中的目标活动图和业务序列图等。
显示单元1530还可用于接收输入的数字或字符信息,产生与终端设备110的用户设置以及功能控制有关的信号输入,具体地,显示单元1530可以包括设置在终端设备110正面的触控屏1531,可收集用户在其上或附近的触摸操作,例如点击按钮,拖动滚动框等。
其中,触控屏1531可以覆盖在显示屏1532之上,也可以将触控屏1531与显示屏1532集成而实现终端设备110的输入和输出功能,集成后可以简称触摸显示屏。本申请中显示单元1530可以显示应用程序以及对应的操作步骤。
摄像头1540可用于捕获静态图像,用户可以将摄像头1540拍摄的图像通过应用发布。摄像头1540可以是一个,也可以是多个。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给处理器1580转换成数字图像信号。
终端设备还可以包括至少一种传感器1550,比如加速度传感器1551、距离传感器1552、指纹传感器1553、温度传感器1554。终端设备还可配置有陀螺仪、气压计、湿度计、温度计、红外线传感器、光传感器、运动传感器等其他传感器。
音频电路1560、扬声器1561、传声器1562可提供用户与终端设备110之间的音频接口。音频电路1560可将接收到的音频数据转换后的电信号,传输到扬声器1561,由扬声器1561转换为声音信号输出。终端设备110还可配置音量按钮,用于调节声音信号的音量。另一方面,传声器1562将收集的声音信号转换为电信号,由音频电路1560接收后转换为音频数据,再将音频数据输出至通信组件1510以发送给比如另一终端设备110,或者将音频数据输出至存储器1520以便进一步处理。
蓝牙模块1570用于通过蓝牙协议来与其他具有蓝牙模块的蓝牙设备进行信息交互。例如,终端设备可以通过蓝牙模块1570与同样具备蓝牙模块的可穿戴电子设备(例如智能手表)建立蓝牙连接,从而进行数据交互。
处理器1580是终端设备的控制中心,利用各种接口和线路连接整个终端的各个部分,通过运行或执行存储在存储器1520内的软件程序,以及调用存储在存储器1520内的数据,执行终端设备的各种功能和处理数据。在一些实施例中,处理器1580可包括一个或多个处理单元;处理器1580还可以集成应用处理器和基带处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,基带处理器主要处理无线通信。可以理解的是,上述基带处理器也可以不集成到处理器1580中。本申请中处理器1580可以运行操作系统、应用程序、用户界面显示及触控响应,以及本申请实施例的业务处理方法。另外,处理器1580与显示单元1530耦接。
在一些可能的实施方式中,本申请提供的业务处理方法的各个方面还可以实现为一种程序产品的形式,其包括计算机程序,当程序产品在电子设备上运行时,计算机程序用于使电子设备执行本说明书上述描述的根据本申请各种示例性实施方式的业务处理方法中的步骤,例如,电子设备可以执行如图4中所示的步骤。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本申请的实施方式的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括计算机程序,并可以在电子设备上运行。然而,本申请的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被命令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由命令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的计算机程序,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。计算机程序可以完全地在用户电子设备上执行、部分地在用户电子设备上执行、作为一个独立的软件包执行、部分在用户电子设备上部分在远程电子设备上执行、或者完全在远程电子设备或服务器上执行。在涉及远程电子设备的情形中,远程电子设备可以通过任意种类的网络包括局域网(LAN)或广域网(WAN)连接到用户电子设备,或者,可以连接到外部电子设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。
此外,尽管在附图中以特定顺序描述了本申请方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用计算机程序的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (14)
1.一种业务处理方法,其特征在于,所述方法包括:
将目标业务的目标活动图,输入已训练的业务逻辑提取模型,获得相应的业务序列图;其中,所述目标活动图表征:所述目标业务的逻辑实现流程,所述业务序列图表征:所述逻辑实现流程涉及的各实体的交互流程,所述业务逻辑提取模型是通过以下训练过程获得的:
基于目标领域的语料文本集,对预训练语言模型进行训练,获得用于进行所述目标领域的文本语义提取的第一语言模型,以及基于第一样本活动图集对所述第一语言模型进行训练,获得用于进行活动图逻辑提取的第二语言模型;
基于第二样本活动图集对所述第二语言模型进行训练,获得用于进行活动图实体及实体职责提取的第三语言模型;其中,所述第二样本活动图集包括各第二样本活动图以及相应的实体标签;
基于第三样本活动图集对所述第三语言模型进行训练,获得所述业务逻辑提取模型;其中,所述第三样本活动图集包括各第三样本活动图以及相应的业务序列图标签。
2.根据权利要求1所述的方法,其特征在于,所述语料文本集包括第一语料文本子集和第二语料文本子集;
则所述基于目标领域的语料文本集,对预训练语言模型进行训练,获得用于进行所述目标领域的文本语义提取的第一语言模型,包括:
采用自监督的训练方式,基于所述第一语料文本子集,对所述预训练语言模型进行训练,获得用于进行语料编码的中间语言模型;
基于所述第二语料文本子集,对所述中间语言模型进行训练,获得用于进行文本语义提取的第一语言模型;其中,所述第二语料文本子集中的每个语料文本具有相应的语义标签。
3.根据权利要求2所述的方法,其特征在于,所述采用自监督的训练方式,基于所述第一语料文本子集,对所述预训练语言模型进行训练,获得用于进行语料编码的中间语言模型,包括:
基于所述第一语料文本子集,对所述预训练语言模型进行多轮迭代训练,获得所述中间语言模型,其中,每次训练执行以下操作:
从所述第一语料文本子集中选取第一语料文本,并基于预设的自监督任务,对所述第一语料文本进行文本预处理,获得处理后的第一语料文本,以及构建所述第一语料文本对应的自监督标签;
将所述处理后的第一语料文本输入所述预训练语言模型,获得相应的语料文本预测信息;
基于所述语料文本预测信息以及相应的自监督标签,获得自监督损失值,并基于所述自监督损失值对所述预训练语言模型进行参数调整。
4.根据权利要求2所述的方法,其特征在于,所述基于所述第二语料文本子集,对所述中间语言模型进行训练,获得用于进行文本语义提取的第一语言模型,包括:
基于所述第二语料文本子集,对所述中间语言模型进行多轮迭代训练,获得所述第一语言模型,其中,每次训练执行以下操作:
将从所述第二语料文本子集中选取的第二语料文本,输入所述中间语言模型,获得相应的文本语义信息;
基于所述文本语义信息以及所述第二语料文本对应的语义标签,获得语义提取损失值,并基于所述语义提取损失值对所述中间语言模型进行参数调整。
5.根据权利要求1所述的方法,其特征在于,所述基于第一样本活动图集对所述第一语言模型进行训练,获得用于进行活动图逻辑提取的第二语言模型,包括:
针对所述第一样本活动图集中的各第一样本活动图,分别执行以下操作:将一个第一样本活动图由流程图格式转换为文本格式,获得相应的样本文本,以及获得所述一个第一样本活动图关联的业务场景信息;
采用自监督的训练方式,基于各样本文本以及相应的业务场景信息,对所述第一语言模型进行训练,获得用于进行活动图逻辑提取的所述第二语言模型。
6.根据权利要求5所述的方法,其特征在于,所述采用自监督的训练方式,基于各样本文本以及相应的业务场景信息,对所述第一语言模型进行训练,获得用于进行活动图逻辑提取的所述第二语言模型,包括:
基于所述各样本文本以及相应的业务场景信息,对所述第一语言模型进行多轮迭代训练,获得所述第二语言模型,其中,每次训练执行以下操作:
从所述各样本文本中选取样本文本,并基于预设的自监督任务,将选取的样本文本进行文本预处理,获得处理后的样本文本,以及构建所述样本文本对应的自监督标签;
将所述处理后的样本文本以及相应的业务场景信息,输入所述第一语言模型,获得相应的活动图预测信息;
基于所述活动图预测信息以及相应的自监督标签,获得自监督损失值,并基于所述自监督损失值对所述第一语言模型进行参数调整。
7.根据权利要求5所述的方法,其特征在于,所述将一个第一样本活动图由流程图格式转换为文本格式,获得相应的样本文本,包括:
获得所述一个第一样本活动图中的各活动信息,以及所述各活动信息的执行顺序;
基于设定描述语言,将所述各活动信息按照所述执行顺序进行描述,获得所述样本文本。
8.根据权利要求1~7任一项所述的方法,其特征在于,所述基于第二样本活动图集对所述第二语言模型进行训练,获得用于进行活动图实体及实体职责提取的第三语言模型,包括:
基于所述第二样本活动图集对所述第二语言模型进行多轮迭代训练,获得所述第三语言模型;其中,每次训练执行以下操作:
将从所述第二样本活动图集中选取第二样本活动图,并获得所述第二样本活动图的业务逻辑信息;
将所述第二样本活动图的业务逻辑信息,输入所述第二语言模型,获得相应的实体信息;其中,所述实体信息包括预测的各实体以及各实体职责;
基于所述实体信息以及所述第二样本活动图对应的实体标签,获得实体提取损失值,并基于所述实体提取损失值对所述第二语言模型进行参数调整。
9.根据权利要求1~7任一项所述的方法,其特征在于,所述基于第三样本活动图集对所述第三语言模型进行训练,获得所述业务逻辑提取模型,包括:
基于所述第三样本活动图集对所述第三语言模型进行多轮迭代训练,获得所述业务逻辑提取模型;其中,每次训练执行以下操作:
从所述第三样本活动图集中选取第三样本活动图,并获得所述第三样本活动图的业务逻辑信息和实体信息;其中,所述实体信息包括所述第三样本活动图涉及的各实体以及各实体职责;
将所述第三样本活动图的业务逻辑信息和实体信息,输入所述第三语言模型,获得相应的业务序列图;
基于所述业务序列图以及所述第三样本活动图对应的业务序列图标签,获得序列生成损失值,并基于所述序列生成损失值对所述第三语言模型进行参数调整。
10.根据权利要求1~7任一项所述的方法,其特征在于,所述将目标业务的目标活动图,输入已训练的业务逻辑提取模型,获得相应的业务序列图,包括:
通过业务逻辑提取模型,提取所述目标活动图中的各活动信息以及相应的执行顺序,并基于所述各活动信息以及相应的执行顺序,获得所述目标活动图的业务逻辑信息;
通过所述业务逻辑提取模型,基于所述业务逻辑信息,识别所述目标活动图涉及的各实体和各实体职责,以及将所述各实体和各实体职责,按照所述各活动信息的执行顺序进行编排,获得相应的业务序列图。
11.一种业务处理装置,其特征在于,包括:
转化单元,用于将目标业务的目标活动图,输入已训练的业务逻辑提取模型,获得相应的业务序列图;其中,所述目标活动图表征:所述目标业务的逻辑实现流程,所述业务序列图表征:所述逻辑实现流程涉及的各实体的交互流程;
训练单元,用于通过以下方式训练获得所述业务逻辑提取模型:
基于目标领域的语料文本集,对预训练语言模型进行训练,获得用于进行所述目标领域的文本语义提取的第一语言模型,以及基于第一样本活动图集对所述第一语言模型进行训练,获得用于进行活动图逻辑提取的第二语言模型;
基于第二样本活动图集对所述第二语言模型进行训练,获得用于进行活动图实体及实体职责提取的第三语言模型;其中,所述第二样本活动图集包括各第二样本活动图以及相应的实体标签;
基于第三样本活动图集对所述第三语言模型进行训练,获得所述业务逻辑提取模型;其中,所述第三样本活动图集包括各第三样本活动图以及相应的业务序列图标签。
12.根据权利要求11所述的装置,其特征在于,所述语料文本集包括第一语料文本子集和第二语料文本子集;
则所述基于目标领域的语料文本集,对预训练语言模型进行训练,获得用于进行所述目标领域的文本语义提取的第一语言模型时,所述训练单元具体用于:
采用自监督的训练方式,基于所述第一语料文本子集,对所述预训练语言模型进行训练,获得用于进行语料编码的中间语言模型;
基于所述第二语料文本子集,对所述中间语言模型进行训练,获得用于进行文本语义提取的第一语言模型;其中,所述第二语料文本子集中的每个语料文本具有相应的语义标签。
13.一种电子设备,其特征在于,其包括处理器和存储器,其中,所述存储器存储有计算机程序,当所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1~10中任一所述方法的步骤。
14.一种计算机可读存储介质,其特征在于,其包括计算机程序,当所述计算机程序在电子设备上运行时,所述计算机程序用于使所述电子设备执行权利要求1~10中任一所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311295895.1A CN117034019B (zh) | 2023-10-09 | 2023-10-09 | 一种业务处理方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311295895.1A CN117034019B (zh) | 2023-10-09 | 2023-10-09 | 一种业务处理方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117034019A CN117034019A (zh) | 2023-11-10 |
CN117034019B true CN117034019B (zh) | 2024-01-09 |
Family
ID=88645353
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311295895.1A Active CN117034019B (zh) | 2023-10-09 | 2023-10-09 | 一种业务处理方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117034019B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117611094B (zh) * | 2023-12-06 | 2024-06-07 | 阿帕数字科技有限公司 | 基于业务流程编排实现供应链体系设计方法及系统 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20100060483A (ko) * | 2008-11-27 | 2010-06-07 | 주식회사 케피코 | Can 통신의 사용자 인터페이스 방법 및 인터페이스 구현장치 |
CN101794227A (zh) * | 2010-03-08 | 2010-08-04 | 浙江大学 | 从uml模型到autosar软件组件模型的转换方法 |
CN106484972A (zh) * | 2016-09-26 | 2017-03-08 | 杭州杉石科技有限公司 | 一种基于uml的系统行为逻辑建模工具 |
CN106547685A (zh) * | 2015-09-23 | 2017-03-29 | 中兴通讯股份有限公司 | 一种基于自动生成序列图的测试方法及装置 |
CN112699643A (zh) * | 2020-12-23 | 2021-04-23 | 车智互联(北京)科技有限公司 | 一种生成语言模型的方法和文章自动生成方法 |
CN115033280A (zh) * | 2022-06-29 | 2022-09-09 | 杨双远 | 一种基于知识图谱的需求规格文档自动化生成方法及存储介质 |
CN115409454A (zh) * | 2021-05-27 | 2022-11-29 | 腾讯科技(深圳)有限公司 | 基于人工智能的业务处理方法、装置及电子设备 |
CN115470705A (zh) * | 2022-09-19 | 2022-12-13 | 贵州航天云网科技有限公司 | 基于ai算法的智能业务建模方法 |
CN116167605A (zh) * | 2023-04-26 | 2023-05-26 | 北京中关村科金技术有限公司 | 业务流程生成方法、装置、设备及介质 |
CN116796857A (zh) * | 2023-06-30 | 2023-09-22 | 平安科技(深圳)有限公司 | 一种llm模型训练方法、装置、设备及其存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170109657A1 (en) * | 2011-05-08 | 2017-04-20 | Panaya Ltd. | Machine Learning-Based Model for Identifying Executions of a Business Process |
FR2984561B1 (fr) * | 2011-12-15 | 2014-01-10 | Commissariat Energie Atomique | Procede et dispositif de conception solide d'un systeme |
US8676825B2 (en) * | 2011-12-22 | 2014-03-18 | Infosys Limited | Systems and methods for extracting business process metrics from a UML model |
US11210472B2 (en) * | 2019-05-08 | 2021-12-28 | Tata Consultancy Services Limited | Automated extraction of message sequence chart from textual description |
-
2023
- 2023-10-09 CN CN202311295895.1A patent/CN117034019B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20100060483A (ko) * | 2008-11-27 | 2010-06-07 | 주식회사 케피코 | Can 통신의 사용자 인터페이스 방법 및 인터페이스 구현장치 |
CN101794227A (zh) * | 2010-03-08 | 2010-08-04 | 浙江大学 | 从uml模型到autosar软件组件模型的转换方法 |
CN106547685A (zh) * | 2015-09-23 | 2017-03-29 | 中兴通讯股份有限公司 | 一种基于自动生成序列图的测试方法及装置 |
CN106484972A (zh) * | 2016-09-26 | 2017-03-08 | 杭州杉石科技有限公司 | 一种基于uml的系统行为逻辑建模工具 |
CN112699643A (zh) * | 2020-12-23 | 2021-04-23 | 车智互联(北京)科技有限公司 | 一种生成语言模型的方法和文章自动生成方法 |
CN115409454A (zh) * | 2021-05-27 | 2022-11-29 | 腾讯科技(深圳)有限公司 | 基于人工智能的业务处理方法、装置及电子设备 |
CN115033280A (zh) * | 2022-06-29 | 2022-09-09 | 杨双远 | 一种基于知识图谱的需求规格文档自动化生成方法及存储介质 |
CN115470705A (zh) * | 2022-09-19 | 2022-12-13 | 贵州航天云网科技有限公司 | 基于ai算法的智能业务建模方法 |
CN116167605A (zh) * | 2023-04-26 | 2023-05-26 | 北京中关村科金技术有限公司 | 业务流程生成方法、装置、设备及介质 |
CN116796857A (zh) * | 2023-06-30 | 2023-09-22 | 平安科技(深圳)有限公司 | 一种llm模型训练方法、装置、设备及其存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN117034019A (zh) | 2023-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111026842B (zh) | 自然语言处理方法、自然语言处理装置及智能问答系统 | |
AU2020385264B2 (en) | Fusing multimodal data using recurrent neural networks | |
US11942075B2 (en) | System and method for automated digital twin behavior modeling for multimodal conversations | |
CN113704388A (zh) | 多任务预训练模型的训练方法、装置、电子设备和介质 | |
US20240296021A1 (en) | Natural solution language | |
CN117034019B (zh) | 一种业务处理方法、装置、电子设备和存储介质 | |
CN114707513A (zh) | 一种文本语义识别方法、装置、电子设备和存储介质 | |
CN112463968B (zh) | 文本分类方法、装置和电子设备 | |
CN113704460A (zh) | 一种文本分类方法、装置、电子设备和存储介质 | |
CN113362852A (zh) | 一种用户属性识别方法和装置 | |
CN114255502B (zh) | 人脸图像生成方法及装置、人脸识别方法、设备、介质 | |
Wen et al. | From generative ai to generative internet of things: Fundamentals, framework, and outlooks | |
Gong et al. | What is the intended usage context of this model? An exploratory study of pre-trained models on various model repositories | |
CN113609866A (zh) | 文本标记方法、装置、设备及存储介质 | |
Trivedi et al. | Deep learning applications on edge computing | |
Zhang et al. | Business chatbots with deep learning technologies: State-of-the-art, taxonomies, and future research directions | |
CN117033626A (zh) | 一种文本审核方法、装置、设备及存储介质 | |
CN116680399A (zh) | 通话交互多级意图识别方法、装置、电子设备及介质 | |
KR20180042763A (ko) | 채팅형 금융 로봇 및 이를 이용한 금융 서비스 제공방법 | |
Sun et al. | Similar modality completion-based multimodal sentiment analysis under uncertain missing modalities | |
CN116259311A (zh) | 一种语音处理方法及其相关设备 | |
CN115129865A (zh) | 一种工单分类方法、装置、电子设备和存储介质 | |
CN116052714A (zh) | 一种数据处理方法及其装置 | |
CN115309882A (zh) | 基于多模态特征的交互信息生成方法、系统及存储介质 | |
Muhammed Kunju et al. | A transformer based real-time photo captioning framework for visually impaired people with visual attention |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40097755 Country of ref document: HK |