CN116974626A - 分析序列图生成方法、装置、设备和计算机可读存储介质 - Google Patents

分析序列图生成方法、装置、设备和计算机可读存储介质 Download PDF

Info

Publication number
CN116974626A
CN116974626A CN202311233333.4A CN202311233333A CN116974626A CN 116974626 A CN116974626 A CN 116974626A CN 202311233333 A CN202311233333 A CN 202311233333A CN 116974626 A CN116974626 A CN 116974626A
Authority
CN
China
Prior art keywords
service
business
target
entity
sequence diagram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311233333.4A
Other languages
English (en)
Other versions
CN116974626B (zh
Inventor
张镇鸿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202311233333.4A priority Critical patent/CN116974626B/zh
Publication of CN116974626A publication Critical patent/CN116974626A/zh
Application granted granted Critical
Publication of CN116974626B publication Critical patent/CN116974626B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/70Software maintenance or management
    • G06F8/74Reverse engineering; Extracting design information from source code
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Abstract

本申请公开了一种分析序列图生成方法、装置、设备和计算机可读存储介质。本申请实施例可应用于云技术、人工智能、智慧交通、辅助驾驶、地图等各种场景。通过获取目标业务的业务描述文本;对业务描述文本进行语义分析,以确定目标业务涉及的业务实体、每个业务实体的职责以及目标业务的业务流程交互信息;基于目标业务涉及的业务实体、每个业务实体的职责以及业务流程交互信息,生成目标业务对应的分析序列图。以此,无需通过人工方式进行绘制,可解决分析序列图的绘制效率低的问题,且确保所生成分析序列图的质量稳定性,以提高分析序列图的准确性。

Description

分析序列图生成方法、装置、设备和计算机可读存储介质
技术领域
本申请涉及人工智能技术领域,具体涉及一种分析序列图生成方法、装置、设备和计算机可读存储介质。
背景技术
领域建模是指基于对应领域的术语、实体、实体的职责和流程构建该领域的抽象化表达,以便后续指示该特定领域的软件应用的设计。然而,在构建该领域的抽象化表达时,一般通过绘制该领域的分析序列图,以分析序列图的形式来表示该领域的抽象化表达。
相关技术通过专业人员的经验,结合业务领域的相关信息来手动绘制该领域的分析序列图,以用于后续的领域建模。
在对相关技术的研究和实践过程中,本申请的发明人发现相关技术在绘制分析序列图时,通过人工方式进行绘制,这使得分析序列图的绘制效率低,且由于人工绘制可能存在随机性,使得绘制的分析序列图的质量不稳定,容易出现绘制的分析序列图与实际情况不符合的现象,降低了分析序列图的准确性,影响了后续领域软件应用设计的开展。
发明内容
本申请实施例提供一种分析序列图生成方法、装置、设备和计算机可读存储介质,可解决分析序列图的绘制效率低的问题,且提高分析序列图的准确性。
本申请实施例提供一种分析序列图生成方法,包括:
获取目标业务的业务描述文本;
对所述业务描述文本进行语义分析,以确定所述目标业务涉及的业务实体、每个所述业务实体的职责以及所述目标业务的业务流程交互信息;
基于所述目标业务涉及的业务实体、每个所述业务实体的职责以及所述业务流程交互信息,生成所述目标业务对应的分析序列图。
相应的,本申请实施例提供一种分析序列图生成装置,包括:
获取单元,用于获取目标业务的业务描述文本;
确定单元,用于对所述业务描述文本进行语义分析,以确定所述目标业务涉及的业务实体、每个所述业务实体的职责以及所述目标业务的业务流程交互信息;
生成单元,用于基于所述目标业务涉及的业务实体、每个所述业务实体的职责以及所述业务流程交互信息,生成所述目标业务对应的分析序列图。
在一些实施方式中,所述生成单元,还用于:
基于所述业务流程交互信息和所述目标业务涉及的业务实体,确定所述目标业务中多个业务步骤之间的交互时序和参与各业务步骤的业务实体之间的交互方向;
根据每个业务实体的职责,确定各业务实体在所参与的业务步骤中的目标职责;
根据所述目标业务中多个业务步骤之间的交互时序和参与各业务步骤的业务实体之间的交互方向、以及各业务实体在所参与的业务步骤中的目标职责,生成所述目标业务对应的分析序列图。
在一些实施方式中,所述生成单元,还用于:
创建每个所述业务实体对应的实体图标,以及为每个所述实体图标创建对应的所述业务实体的生命线;
按照多个业务步骤之间的交互时序、各业务步骤的交互方向和参与各业务步骤的业务实体,为多个所述生命线之间建立各业务步骤对应的消息箭头;
按照各业务实体在所参与的业务步骤中的目标职责,在各业务步骤对应的消息箭头上添加该业务步骤对应的交互消息,得到所述目标业务对应的分析序列图。
在一些实施方式中,所述生成单元,还用于:
针对每个业务步骤,在参与该业务步骤的业务实体中确定作为执行者的执行者实体,并将各业务实体在所参与的业务步骤中的目标职责确定为执行者实体在该业务步骤中的目标职责;
根据每个业务步骤对应的执行者实体在该业务步骤中的目标职责,确定该业务步骤对应的控制类;
确定每个业务步骤所对应控制类的业务参数;
根据每个业务步骤对应的控制类和每个业务步骤所对应控制类的业务参数,确定每个业务步骤对应的交互消息;
在各业务步骤对应的消息箭头上添加对应业务步骤的交互消息,得到目标业务对应的分析序列图。
在一些实施方式中,所述确定单元,还用于:
通过目标模型对所述业务描述文本进行语义分析,以确定所述目标业务涉及的业务实体、每个所述业务实体的职责以及所述目标业务的业务流程交互信息;
则所述分析序列图生成装置还包括训练单元,用于:
获取与所述样本业务所属领域关联的领域知识语料;
基于所述领域知识语料对预设模型进行预训练,得到初始模型;
根据多个样本业务分别对应的样本业务描述文本和各样本业务对应的标签信息,对所述初始模型进行微调训练,得到所述目标模型;样本业务对应的标签信息包括所述样本业务涉及的样本业务实体和各样本业务实体的职责和所述样本业务对应的业务流程交互信息。
在一些实施方式中,所述分析序列图生成装置还包括校验单元,用于:
对所述目标业务涉及的业务实体、每个所述业务实体的职责以及所述业务流程交互信息进行校验,得到校验结果;
则所述生成单元,还用于:
若所述校验结果为校验通过,则基于所述目标业务涉及的业务实体、每个所述业务实体的职责以及所述业务流程交互信息,生成所述目标业务对应的分析序列图。
在一些实施方式中,所述校验单元,还用于:
基于所述业务流程交互信息,确定所述目标业务中多个业务步骤之间的交互时序和参与各业务步骤的业务实体之间的交互方向,以及每个业务步骤对应的业务参数;
基于序列图规范知识库,对所述目标业务涉及的业务实体、每个所述业务实体的职责、目标业务中多个业务步骤之间的交互时序和参与各业务步骤的业务实体之间的交互方向,以及每个业务步骤对应的业务参数,在至少一个校验维度上进行校验对比,得到每个校验维度对应的对比结果;
当所述至少一个校验维度中每个校验维度对应的所述对比结果均为相匹配时,确定校验结果为校验通过;
当所述至少一个校验维度中存在对比结果为不匹配的校验维度时,确定校验结果为校验不通过。
在一些实施方式中,所述生成单元,还用于:
当所述校验结果为校验不通过时,从所述目标业务涉及的业务实体、每个所述业务实体的职责以及所述目标业务的业务流程交互信息中确定校验通过的第一内容信息;
基于所述第一内容信息,生成所述目标业务对应的分析序列图。
在一些实施方式中,所述生成单元,还用于:
当所述校验结果为校验不通过时,从所述目标业务涉及的业务实体、每个所述业务实体的职责以及所述目标业务的业务流程交互信息中确定校验通过的第一内容信息,以及确定校验不通过的第二内容信息;
基于序列图规范知识库,对所述第二内容信息进行调整,获得满足所述序列图规范知识库的第三内容信息;
基于所述第一内容信息和所述第三内容信息,生成所述目标业务对应的分析序列图。
此外,本申请实施例还提供一种计算机设备,包括处理器和存储器,所述存储器存储有计算机程序,所述处理器用于运行所述存储器内的计算机程序实现本申请实施例提供的任一种分析序列图生成方法中的步骤。
此外,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本申请实施例所提供的任一种分析序列图生成方法中的步骤。
此外,本申请实施例还提供一种计算机程序产品,包括计算机指令,所述计算机指被执行时实现本申请实施例所提供的任一种分析序列图生成方法中的步骤。
本申请实施例可先获取目标业务的业务描述文本,然后,对该文本中的内容进行语义识别,以识别出对应的业务实体、实体职责、业务流程交互信息等图像要素,最后,对基于以上图像要素自动生成出该目标业务对应的分析序列图;以此,无需通过人工方式进行绘制,可解决分析序列图的绘制效率低的问题,实现了自动基于目标业务的业务描述文本生成目标业务的分析序列图,且确保所生成分析序列图的质量稳定性,以提高分析序列图的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的分析序列图生成系统的场景示意图;
图2是本申请实施例提供的分析序列图生成方法的步骤流程示意图;
图3是本申请实施例提供的分析序列图生成方法的另一步骤流程示意图;
图4是本申请实施例提供的分析序列图生成系统的架构示意图;
图5是本申请实施例提供的分析序列图的示意图;
图6是本申请实施例提供的分析序列图生成装置的结构示意图;
图7是本申请实施例提供的计算机设备的结构示意图。
具体实施方式
下面详细描述本申请的实施方式,实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性地,仅用于解释本申请,而不能理解为对本申请的限制。
在说明书、权利要求书和上述附图所描述的一些流程中,包含了按照特定顺序出现的多个步骤,但应该清楚了解,这些步骤可以不按照其在本文中出现的顺序来执行或并行执行,步骤序号仅仅是用于区分开各个不同的步骤,序号本身不代表任何的执行顺序。此外,本文中的“第一”和“第二”等描述,是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种分析序列图生成方法、装置、设备和计算机可读存储介质。具体地,本申请实施例将从分析序列图生成装置的维度进行描述,该分析序列图生成装置具体可以集成在计算机设备中,该计算机设备可以是服务器,也可以是用户终端等设备。其中,该服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。其中,用户终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能家电、车载终端、智能语音交互设备、飞行器等,但并不局限于此。
可以理解的是,在本申请的具体实施方式中,涉及到用户信息、用户使用记录、用户状况等相关的数据,当本申请以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
需要说明的是,本申请实施例提供的分析序列图生成方法可应用于任意一种业务领域或业务场景,这些场景不限于通过云服务、大数据、人工智能或多种技术结合等方式实现,具体通过如下实施例进行说明:
本申请实施例提供的分析序列图生成方法涉及人工智能(ArtificialIntelligence, AI)技术,人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、预训练模型技术、操作/交互系统、机电一体化等。其中,预训练模型又称大模型、基础模型,经过微调后可以广泛应用于人工智能各大方向下游任务。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
其中,自然语言处理(Nature Language processing, NLP)是计算机科学领域与人工智能领域中的重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理涉及自然语言,即人们日常使用的语言,与语言学研究密切;同时涉及 计算机科学和数学。人工智能领域模型训练的重要技术,预训练模型,即是从NLP领域的大语言模型(Large Language Model)发展而来。经过微调,大语言模型可以广泛应用于下游任务。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
然而,本申请实施例可通过自然语言处理技术中的文本处理和语义理解等技术来参与实现分析序列图生成方法流程。具体通过如下实施例进行说明:
需要说明的是,在该分析序列图生成场景中,其主要通过神经网络(ArtificialNeural Networks,ANNs)模型来实现的,以下简称为“模型”。而该分析序列图生成过程可包括模型的训练阶段(A)和应用阶段(B)。该训练阶段和应用阶段可通过分析序列图的生成系统中的一个或多个设备组合来实现。
例如,参见图1,为本申请实施例提供的分析序列图生成系统的场景示意图,该场景系统可以包括服务器和/或终端;当系统仅包括服务器或终端时,服务器或终端上包括目标数据库、模型训练装置和模型应用装置;当系统为终端和服务器的组合时,服务器上可包括目标数据库、模型训练装置和模型应用装置。
其中,该目标数据库可以理解为业务领域或目标业务关联的知识语料库,该库中存储有业务领域或目标业务对应的的知识语料,该知识语料不限于包括该行业的知识背景、业务逻辑、基础知识等内容,用于对模型进行语义理解的训练,使得模型可以学习和沉淀业务领域或目标业务的相关知识,以便后续用于理解目标业务的规则。
(A)模型的训练阶段:
在模型的训练阶段中,模型训练装置可以包含领域知识学习模块,其可从目标数据库中读取所属领域对应的大规模领域知识语料后,可通过预设模型来学习该大规模的领域知识语料。其中,该模型的训练过程不限于包括无监督学习和监督学习两个阶段。
其中,该模型可以是预训练语言模型,其可以是基于转换器(transformer)的模块架构,包含自注意力机制。
在无监督学习阶段,通过大规模的领域知识语料(文本)对预训练语言模型进行无监督学习,使得模型以自然语言方式理解该领域知识语料,具体的,通过自注意力机制来学习语义信息,以融合先前的知识内容与后续的知识内容之间的关联,获得对上下文的理解,持续重复该过程,以不断地对该模型的无监督的预训练,逐步完善度对领域知识的续收,使得模型能够学习和沉淀该业务领域或目标业务对应的知识,该知识不限于包括业务相关的实体、实体的职责、实体之间的业务交互流程、交互信息、相关术语等等,以此,使得经过无监督学习后的语音模型能够理解理解该业务领域或目标业务相关的文本,得到初始模型。
进一步的,为了能够精准理解该目标业务或业务领域对应的业务场景内容,可对经过无监督学习得到的初始模型作进一步微调,该微调过程可以视为监督学习训练,具体是结合模型的下游任务来对初始模型进行微调,以增强对领域知识的学习。具体的,基于目标业务的下游任务,设定用于输入模型的样本文本(如样本业务或领域对应的业务描述规则的文本)和模型输出的样本标签信息,将样本文本输入至初始模型,使得初始模型输出预测标签信息,获取预测标签信息与样本标签信息之间预测损失,基于预测损失对初始模型进行微调,直至迭代训练收敛,得到目标模型。
结合图1所示,该模型训练的过程为:模型训练装置从目标数据库获取样本业务所属业务领域关联的大规模领域知识语料,按照大量的领域知识语料(文本)对预设模型进行预训练,得到初始模型;进一步的,模型训练装置可以获取下游任务对应的样本业务描述文本和样本标签信息,以样本业务描述文本作为初始模型的输入,以样本标签信息作为初始模型的输出目标,对初始模型进行微调训练,持续迭代,直至达到预设条件,该预设条件可以是初始模型输出的预测标签结果与本标签信息一致或无限接近,或者迭代训练的次数达到一定数量,又或者初始模型输出的预测标签结果不再变化,等等,至此,基于模型训练装置的训练过程结束,得到训练后的目标模型。
(B)模型的应用阶段:
在模型的应用阶段中,可将训练好的目标模型上传或部署至模型应用装置中,以使得模型应用装置在分析序列图的生成过程中运行该目标模型,以配合完成分析序列图的生成的相关流程。具体的,该分析序列图的生成流程包括:获取目标业务的业务描述文本;对业务描述文本进行语义分析,以确定目标业务涉及的业务实体、每个业务实体的职责以及目标业务的业务流程交互信息;基于目标业务涉及的业务实体、每个业务实体的职责以及业务流程交互信息,生成目标业务对应的分析序列图。
通过以上模型的训练阶段和应用阶段的场景,可以实现本申请的分析序列图的生成方法。
例如,假设服务器或终端上包括目标数据库、模型训练装置和模型应用装置,服务器或终端可以基于目标数据库中样本业务所属业务领域的领域知识语料作为训练数据,以对预设模型进行无监督学习训练,从语料中汲取业务领域相关的知识,实现对领域知识(如专业术语、流程等)的理解,并针对下游任务对模型做进一步微调,得到训练完毕的目标模型,进而,将训练完毕的目标模型传输到模型应用装置上运行。此时,终端或服务器可以实现如下:获取目标业务的业务描述文本;通过目标模型对业务描述文本进行语义分析,以确定目标业务涉及的业务实体、每个业务实体的职责以及目标业务的业务流程交互信息;基于目标业务涉及的业务实体、每个业务实体的职责以及业务流程交互信息,生成目标业务对应的分析序列图。
又如,以终端和服务器组合的系统为例,终端与服务器之间建立有通信连接。其中,服务器可以是由多个物理服务机构成的分布式服务系统,其至少包含目标数据库、模型训练装置和模型应用装置,可在服务器上完成对模型的训练后,通过服务器上运行训练后的目标模型,或者,通过服务器上运行训练后的目标模型,以实现分析序列图的生成流程。具体的,在应用阶段,可通过终端上的客户端向服务器发送目标业务对应的业务描述文本。而服务器在获取目标业务的业务描述文本后,可通过训练后的目标模型对业务描述文本进行语义分析,以确定目标业务涉及的业务实体、每个业务实体的职责以及目标业务的业务流程交互信息;基于目标业务涉及的业务实体、每个业务实体的职责以及业务流程交互信息,生成目标业务对应的分析序列图。此后,服务器可将调整得到的分析序列图返回给终端。
示例性的,结合图1所示,假设终端上安装有分析序列图的生成应用(客户端),用户可在分析序列图的生成应用上选定或输入目标业务的业务描述文本,并将目标业务的业务描述文本发送至服务器,以执行分析序列图的生成过程。然后,服务器在获取目标业务的业务描述文本后,可对业务描述文本进行语义分析,以确定目标业务涉及的业务实体、每个业务实体的职责以及目标业务的业务流程交互信息;基于目标业务涉及的业务实体、每个业务实体的职责以及业务流程交互信息,生成目标业务对应的分析序列图。最后,服务器将目标业务对应的分析序列图返回至客户端,以便后续基于分析序列图开展领域软件应用设计。
需要说明的是,以上仅为示例,还可应用于其他业务中,此处不做一一赘述。
为了便于理解,以下将分别对分析序列图的生成方法的各步骤进行详细说明。需说明的是,以下实施例的顺序不作为对实施例优选顺序的限定。
在本申请实施例中,将从分析序列图的生成装置的维度进行描述,以该分析序列图的生成装置具体可以集成在计算机设备如终端或服务器中。参见图2,图2为本申请实施例提供的一种分析序列图生成方法的步骤流程示意图,本申请实施例以分析序列图生成装置具体集成在服务器上为例,服务器上的处理器执行分析序列图的生成方法对应的程序指令时,具体流程如下:
101、获取目标业务的业务描述文本。
本申请实施例为了能够实现自动生成相关业务的分析序列图,可先获取该业务的相关规则的业务描述文本,以便后续从该业务描述文本中提取用于构建该目标业务的分析序列图的图像元素的内容信息,该图像元素对应的内容信息后续会以相应图像形态表示在所构建的分析序列图,以完成分析序列图的构建。
需要说明的是,生成分析序列图的过程可以理解为业务建模,具体是指利用业务领域语言,结合业务领域的相关术语、实体、实体职责等内容来构建该领域对应的抽象化表达,该抽象化表达可通过图像形式进行表示,即分析序列图,完成业务建模。该分析可用于指示软件应用的设计。
其中,该目标业务可以是任意一个业务领域中的业务,该业务领域可以理解为任意行业领域,例如,该业务领域可以是编程、电子商务、网上购物、建筑规划、土木工程、印刷、制造、环卫、汽车、信息验证等各种行业领域。例如,以车辆业务领域为例,该目标业务可以是自动驾驶、汽车影像、车辆控制类、电子地图等业务;又如,以数字验证下的资源交互业务领域为例,该目标业务可以是基于生物特征信息验证下的资源交互、基于数字密码验证下的资源交互等各种形式的业务。以上仅为示例,不作为实施本申请的限定方式。
其中,该业务描述文本可以是包含相应的业务领域或目标业务对应的业务知识的文本,其至少包含对业务进行建模的内容信息,例如,该业务知识不限于包括用于执行业务的规则、业务逻辑、业务术语等内容,用于表示在对目标业务进行建模时的相关描述。示例性的,以生物特征信息验证下的资源交互业务为例,该生物特征不限于为瞳孔信息特征、人脸信息特征、指纹信息特征、掌纹信息特征、姿态信息特征等,假设需要对掌纹信息特征验证下的资源交互业务进行建模,需要获取该业务对应的业务描述文本,该业务描述文本不限于包括实体、业务逻辑等,该实体不限于包括用户、掌纹信息特征的采集实体、掌纹信息特征的存储实体、掌纹信息特征的验证实体、资源交互服务实体、服务中间实体等,该业务逻辑不限于包括掌纹信息特征的采集、存储、特征识别、查询服务、查询中间实体、授权、返回识别结果或验证结果等逻辑;此外,该业务描述文本还可包括掌纹信息特征验证的术语、背景等的相关介绍,如“掌纹信息特征是什么、掌纹信息特征识别是什么、刷掌是什么、刷掌本质是为了实现什么业务逻辑”等等,此处不做限定;以上仅为示例,不作为实施本申请的限定方式。
需要说明的是,在获取目标业务的业务描述文本时,该获取方式可以是接收用户在客户端导入的业务描述文本;还可以是接收用户在客户端输入的目标业务的业务关键词,并基于业务关键词查询该目标业务对应的业务描述文本。例如,以掌纹信息特征验证作为目标业务为例,假设用户在客户端上输入“掌纹信息特征验证”或“刷掌识别”的业务关键词,则可从该业务对应的知识库或相应数据库中查询“掌纹信息特征验证”或“刷掌识别”对应的业务描述文本,以用于后续从该业务描述文本中识别、提取出用于建模的相关信息,即提取出用于构建分析序列图的图像元素。需要说明的是,以上仅为获取业务描述文本的其中一种示例,还可通过其他方式获取业务描述文本,以及获取其他业务的业务描述文本。
通过以上方式,可获取得到目标业务对应的业务描述文本,以便后续从该文本所包含的内容中提取出针对目标业务建模时所需的关键信息,以此,用户仅需输入目标业务的业务关键词或业务描述文本,即可在后续实现自动化生成分析序列图,具有便捷性和可靠性。
102、对业务描述文本进行语义分析,以确定目标业务涉及的业务实体、每个业务实体的职责以及目标业务的业务流程交互信息。
在本申请实施例中,为了实现自动生成目标业务的分析序列图,在得到目标业务的业务描述文本后,需要从该文本中提取出用于构建分析序列图的图像元素,由于业务描述文本中的内容一般是通过文字形式表达,因此,可以通过语言理解的处理方式,对业务描述文本进行语义分析,以获取图像元素对应的文字描述,以便后续基于该图像元素的文字描述来进一步构建分析序列图。
需要说明的是,图像元素对应的文字描述不限于包括目标业务的业务实体、业务实体的职责、业务流程交互信息等等,这些都是在建模中所需的文字版的图像元素,即通过文字形式表示的图像元素。
其中,该业务实体可以是目标业务的业务过程中的参与者,其在业务交互流程中作为消息交互的主体或系统组件,不同的参与者在业务交互流程中具有不同的职责;该业务实体可以是人员(个体)、系统组件或组织(集体)等,例如,业务实体可以是用户、系统平台、机构或服务中台等。
其中,该业务实体的职责可以表示业务实体在业务交互流程中的作用、功能或角色,该职责在业务交互流程中的代码层面表示类的方法,如控制类的方法。例如,在掌纹信息特征验证业务中,用户的职责是提供掌纹信息特征,采集实体(或采集组件,如具有摄像功能的设备)的职责是采集用户提供的掌纹信息特征的图像,验证实体的职责可以是对掌纹信息特征进行识别和验证,服务实体的职责可以是确定当前掌纹信息特征所关联的业务服务,等等;以上仅为示例,不作为实施本申请的限定方式。
其中,该业务流程交互信息可以包括运行目标业务时所需执行的业务步骤,业务步骤之间的交互时序,以及业务步骤在业务实体之间的交互方向,等等。需要说明的是,每个业务步骤可以表示对应的两个业务实体之间请求执行某项操作时的信息传递,该业务步骤对应的消息可具有特定语法,不限于包括消息名称和参数,业务步骤具有从发起者到接收者的方向性。
在一些实施方式中,在通过语言理解方式来分析业务描述文本中的语义信息时,具体可通过相关的语言处理模型来实现,以便从理解的语义信息中获取目标业务所涉及的业务实体、业务实体的职责以及目标业务的业务流程交互信息等。例如,步骤102,可以包括:
(102.A)通过目标模型对业务描述文本进行语义分析,以确定目标业务涉及的业务实体、每个业务实体的职责以及目标业务的业务流程交互信息。
为了实现通过语言模型对业务描述文本中的内容进行语义分析,需要对模型进行训练,该训练过程可以包括预训练和微调两部分,经过训练后得到的语言处理模型可以更好的理解目标业务关联的内容信息,使得模型输出的文本内容能够更精细、准确地表达了建模所需的图像元素。因此,则在步骤(102.A)之前,需要进行模型训练,该训练过程包括:
(102.B.1)获取与样本业务所属领域关联的领域知识语料;
(102.B.2)基于领域知识语料对预设模型进行预训练,得到初始模型;
(102.B.3)根据多个样本业务分别对应的样本业务描述文本和各样本业务对应的标签信息,对初始模型进行微调训练,得到目标模型;样本业务对应的标签信息包括样本业务涉及的样本业务实体和各样本业务实体的职责和样本业务对应的业务流程交互信息。
具体的,为了使得训练得到的目标模型对目标业务具有更宽泛的知识沉淀,可选择目标业务所属于业务领域中大量的领域知识语料来对预设模型进行预训练,该领域知识语料不限于包括该领域的一种或多种业务的基础知识、业务背景、业务逻辑等内容,通过大量的领域知识语料来对预设模型进行无监督学习训练,使得模型能够学习和沉淀相关的知识,得到初始模型,该初始模型可以基于输入的文本知识来输出对知识的理解。进一步的,为了使得模型能够在对目标业务相关的内容更具有专业性,可在完成模型的预训练后,可对模型做进一步微调处理,具体的,基于业务领域的下游任务,设定多个样本业务的样本数据对,每个样本数据对包含当前样本业务对应的样本业务描述文本以及与该样本业务描述文本匹配的样本标签信息,该样本标签信息不限于包含样本业务涉及的样本业务实体和各样本业务实体的职责和样本业务对应的业务流程交互信息,针对每个样本数据对,通过监督学习的方式,将每个样本业务对应的样本业务描述文本输入至初始模型,并将初始模型输出的预测标签信息与当前样本数据对中的样本标签信息进行对比,以确定预测损失,并根据预测损失来微调初始模型,持续以上微调训练过程,直至迭代收敛,得到目标模型。以此,可将目标模型应用于对目标业务的业务描述文本的语义分析,输出更贴合目标业务的内容,即业务实体、每个业务实体的职责以及业务流程交互信息等描述图像元素的信息,使得输出的内容更精确,具有可靠性,且通过模型的语言理解能力来取代人工提取图像元素的描述信息,具有便捷性,初步提高了建模的效率。
在一些实施方式中,在对模型进行预训练时,为了提高预训练效率,可对用于模型预训练的领域知识语料进行预处理,以规范模型的输入,从而,使得模型基于预处理后的内容进行语义信息学习,达到更好的训练效果。例如,步骤(102.B.2)可以包括:将领域知识语料进行预处理,得到语料文本序列;将语料文本序列输入至预设模型进行无监督学习,无监督学习的过程包括:对语料文本序列进行编码处理,得到语义向量;通过自注意力机制对语义向量进行上下文的理解学习,得到初始模型。
示例性的,该预设模型可以生成式预训练转换器模型(Generative Pre-TrainedTransformer,GPT),或者与GPT相类似的语言模型,该模型可具有问答式功能,模型的训练过程可具体为:对语料进行预处理,该预处理过程可以是对语料数据进行清洗、格式处理等,可实现去除停用词、标点符号、以及词嵌入处理,从而获得语料文本序列,并将该语料文本序列输入预设模型,使得预设模型读取预处理后的语料文本序列进行编码,以获得对应的语义向量,进而,基于自注意力机制从语义向量中获得对语料文本序列中的上下文理解,实现自监督学习,需要说明的是,模型学习得到的知识不限于包括业务实体、业务背景、业务逻辑等等。至此,得到预训练的初始模型。此后,结合下游任务确定模型的输出标签,以对初始模型进行微调,使得微调得到的目标模型可以输出贴合下游任务的高质量文本,以在模型应用阶段可输出更贴合目标业务的业务实体、实体职责和业务流程交互信息,提高模型在业务上的专业能力。
通过以上方式,可通过语言理解技术对业务描述文本进行语义分析,以获取图像元素对应的文字描述,以便后续基于该图像元素的文字描述来进一步构建分析序列图,具有便捷性,初步提高了建模的效率。
103、基于目标业务涉及的业务实体、每个业务实体的职责以及业务流程交互信息,生成目标业务对应的分析序列图。
在本申请实施例中,从业务描述文本中识别出目标业务中的业务实体、业务实体的职责以及业务流程交互信息后,可利用以上信息来生成对应的图像元素,以自动生成目标业务的分析序列图,不需要进行人工绘制,确保所生成的分析序列图的质量稳定性,且提高了分析序列图的生成效率和准确性。
其中,该分析序列图可以是一种描述目标业务的业务交互流程的图像,该分析序列图中包含多个图像元素,每个图像元素都具有特定的意义,如该图像元素可以包括每个业务实体的图像元素、业务实体的生命线、表示业务实体之间的业务交互方向的消息箭头、业务交互流程中多个业务步骤之间的交互时序、表示业务实体在对应业务步骤中的职责的交互消息等等;通过分析序列图可以通过图文形式描述各个业务实体之间的消息交互顺序,以通过特定交互时序的消息流来表示各个业务步骤之间的业务逻辑,其可表示各个业务实体之间基于消息传递来协作完成业务目标的动态过程。因此,业务步骤的交互时序和交互方向在构建分析序列图时具有重要意义。
在一些实施方式中,可先确定业务流程中各个业务步骤之间的交互时序以及每个业务步骤在对应的两个业务实体之间的业务方向,并确定各个业务实体在对应业务步骤中的具体职责,从而,基于以上信息生成分析序列图。例如,步骤103可以包括:
(103.1)基于业务流程交互信息和目标业务涉及的业务实体,确定目标业务中多个业务步骤之间的交互时序和参与各业务步骤的业务实体之间的交互方向;
(103.2)根据每个业务实体的职责,确定各业务实体在所参与的业务步骤中的目标职责;
(103.3)根据目标业务中多个业务步骤之间的交互时序和参与各业务步骤的业务实体之间的交互方向、以及各业务实体在所参与的业务步骤中的目标职责,生成目标业务对应的分析序列图。
其中,目标业务的业务流程中包含多个业务步骤,而该交互时序表示多个业务步骤之间的执行顺序。
其中,该交互方向表示每个业务步骤在对应的两个业务实体之间的传递方向,即表示业务步骤的消息传递方向,该消息传递方向由消息的发起者指向消息的接收方。
具体的,由于同一业务实体在业务流程中可能涉及一个或多个业务步骤,当一个业务实体涉及多个业务步骤时,则不同时序下的业务实体需要承担不同的职能或工作,因此,需要结合业务流程交互信息和所有的业务实体来确定业务步骤之间的交互时序,以及确定各业务步骤在对应两个业务实体之间的交互方向,提高在确定多个业务步骤之间的交互时序时的准确性。
进而,由于一个业务实体可能涉及多个职责,当一个业务实体涉及多个业务步骤时,其在不同业务步骤中的职责可能不同。例如,以掌纹信息特征验证业务为例,掌纹信息特征的验证实体需要执行的业务步骤包括识别掌纹信息特征,查询该掌纹信息特征的代表用户所开通的服务,以及查询该代表用户授权的服务实体(如服务机构、服务平台等),基于此,该验证实体的职责可以包括信息识别(验证)、查询服务和查询授权信息等。因此,在得到业务实体的职责后,还需确定当前业务实体在每个业务步骤中的职责,此外,为了更准确地确定业务实体在所参与的业务步骤中的职责,还可结合交互时序和业务实体的职责来确定每个业务实体在所参与的业务步骤的目标职责,此处不做限定。此后,可基于业务步骤的时序关系、业务步骤的交互方向、各个业务实体在对应业务步骤中的目标职责,生成目标业务对应的分析序列图。
在一些实施方式中,生成分析序列图的过程主要包括绘制各个图像元素,其不限于包括业务实体的图标、生命线、表示业务步骤的消息箭头、交互消息等等,需要说明的是,此处不限制各个图像元素之间的生成顺序。例如,步骤(103.3)可以包括:
(103.3.1)创建每个业务实体对应的实体图标,以及为每个实体图标创建对应的业务实体的生命线;
(103.3.2)按照多个业务步骤之间的交互时序、各业务步骤的交互方向和参与各业务步骤的业务实体,为多个生命线之间建立各业务步骤对应的消息箭头;
(103.3.3)按照各业务实体在所参与的业务步骤中的目标职责,在各业务步骤对应的消息箭头上添加该业务步骤对应的交互消息,得到目标业务对应的分析序列图。
具体的,首先,可获取表示每个业务实体的实体图标,例如,按照业务实体的名称或标识从目标业务所属领域中查询对应的实体图标,或者,随机生成每个业务实体的实体图标,还可以从自定义的图标库选取个性化的实体图标,此时,可在图像生成区域中创建每个业务实体对应的实体图标,这多个实体图标之间可按照目标距离均衡分布在同一横向水平线上或竖向垂直方向上。进而,在完成每个业务实体的实体图标创建后,为每个实体图标建立生命线,该生命线的长度表示对应的业务实体在业务流程中的存在时长,可以理解的是,该生命线的长度去决定于对应的业务实体在业务流程中的作用,每个业务实体的生命线可自所参与的第一个业务步骤开始以及至参与最后一个业务步骤截止。
进一步的,为多个业务实体之间添加交互信息,具体的,业务流程中包含多个业务步骤,确定参与每个业务步骤的发送者和接收者,按照交互时序和交互方向,为每个业务步骤添加消息箭头,用于表示业务步骤的消息传输方向。需要说明的是,参与一个业务步骤的业务实体仅为一个时,该业务步骤关联的业务实体可以先后作为发送者和接收者。例如,以掌纹信息特征验证为例,识别实体可以执行“识别掌纹信息特征”的业务步骤,该业务步骤对应的消息箭头的发送者和接收者都是“识别实体”本体,具体的,该消息箭头的始点由“识别实体”的生命线处出发,该消息箭头的终点到“识别实体”的生命线处停止,即该消息箭头指向“识别实体”本体。需要说明的是,参与一个业务步骤的业务实体包含两个时,则其中一个业务实体作为发送者,另一个业务实体作为接收者,为这两个业务实体之间添加业务步骤对应的消息箭头。
需要说明的是,由于业务流程中涉及多个业务步骤,多个业务步骤之间按照交互时序对应的先后顺序来排布,具体的,业务步骤的时序关系可以结合生命线来表示,例如,生命线的时序关系为以靠近业务实体的一端为时序顺序的始发点,按照交互时序反映的先后顺序,将各个业务步骤进行排布。
最后,基于各业务实体在所参与的业务步骤中的目标职责,为对应的业务步骤关联的消息箭头添加上交互消息,直至所有的业务步骤都添加上交互消息,得到的分析序列图可描述各个业务步骤之间的业务逻辑,并表示了各个业务实体之间基于消息传递来协作完成业务目标的动态过程。
在一些实施方式中,交互消息不限于包括消息名称和业务参数,该消息名称绑定有对应的控制类,该控制类表示对应的业务实体在当前所参与的业务步骤中的职责或控制行为,该控制类可以是函数的形式;其中,该业务参数可以从目标业务描述文本中经过语义分析获取得到,可结合消息名称(或控制类)与业务参数来生交互消息。例如,步骤(103.3.3)可以包括:针对每个业务步骤,在参与该业务步骤的业务实体中确定作为执行者的执行者实体,并根据各业务实体在所参与的业务步骤中的目标职责确定为执行者实体在该业务步骤中的目标职责;根据每个业务步骤对应的执行者实体在该业务步骤中的目标职责,确定该业务步骤对应的控制类;确定每个业务步骤所对应控制类的业务参数;根据每个业务步骤对应的控制类和每个业务步骤所对应控制类的业务参数,确定每个业务步骤对应的交互消息;在各业务步骤对应的消息箭头上添加对应业务步骤的交互消息,得到目标业务对应的分析序列图。
需要说明的是,业务步骤中作为执行者的执行者实体一般是业务步骤的发送方实体。例如,当业务步骤仅涉及一个业务实体时,则该执行者实体为该业务实体本体,参与业务步骤的业务实体的数量为两个时,该执行者实体为作为发送方的业务实体。
需要说明的是,业务步骤对应的控制类是业务步骤对应的执行者实体在该业务步骤中的职责的函数表示,或者在代码层面的函数表示。
在一些实施方式中,该函数可结合特定的业务参数来表示执行者实体的具体职责行为,反映了交互消息,而函数中的业务参数可结合具体的业务步骤而定,即不同的业务步骤中函数和业务参数一般都不同。例如,该业务参数的确定方式可以包括:在确定每个业务实体在所参与的业务步骤中的目标职责后,按照该目标职责从业务描述文本中识别出该业务实体所参与的业务步骤中的业务参数。以此,可按照每个业务步骤来确定业务实体在对应时刻的业务参数,有效避免一个业务实体存在多个职责(即参与多个业务步骤)时的业务参数紊乱现象,确保业务参数的准确性。
通过以上方式,可在获得业务实体、实体职责以及业务流程交互信息后,利用以上信息来构建对应的图像元素,以自动生成目标业务的分析序列图,以此,无需人工参与图像绘制,确保所生成的分析序列图的质量稳定性,且提高了分析序列图的生成效率和准确性。
在本申请实施例中,为了确保所生成的分析序列图中的业务实体、职责、以及业务步骤的交互时序和交互方向等要素的准确性,在生成分析序列图之前,可对获取到的业务实体、实体职责以及业务流程交互信息进行校验,以便基于符合校验通过的内容信息(即业务实体、实体职责以及业务流程交互信息等)来生成分析序列图,进一步提高所生成的分析序列图的质量。
在一些实施方式中,在生成分析序列图之前,还可对获得的业务实体、实体职责以及业务流程交互信息进行校验,以便基于校验结果来确定用于生成分析序列图的元素,并生成分析序列图,以此,进一步提高生成的分析序列图的质量和准确性。例如,在步骤103之前,还可以包括:(A.1)对目标业务涉及的业务实体、每个业务实体的职责以及业务流程交互信息进行校验,得到校验结果。进一步的,当校验结果为校验通过时,执行步骤103,此时,步骤103可以包括:若校验结果为校验通过,则基于目标业务涉及的业务实体、每个业务实体的职责以及业务流程交互信息,生成目标业务对应的分析序列图。
在一些实施方式中,具体可对基于业务实体、实体职责和业务流程交互信息得到的图像元素进行校验。例如,步骤(A.1)可以包括:基于业务流程交互信息,确定目标业务中多个业务步骤之间的交互时序和参与各业务步骤的业务实体之间的交互方向,以及每个业务步骤对应的业务参数;基于序列图规范知识库,对目标业务涉及的业务实体、每个业务实体的职责、目标业务中多个业务步骤之间的交互时序和参与各业务步骤的业务实体之间的交互方向,以及每个业务步骤对应的业务参数,在至少一个校验维度上进行校验对比,得到每个校验维度对应的对比结果;当至少一个校验维度中每个校验维度对应的对比结果均为相匹配时,确定校验结果为校验通过;当至少一个校验维度中存在对比结果为不匹配的校验维度时,确定校验结果为校验不通过。
其中,该业务参数可以是组成相应交互消息的元素,具体可与函数相结合,构成交互消息。示例性,假设业务实体在一个业务步骤中的职责是“检测出超额数量的资源订单”,假若业务参数为“5000”,则交互消息为“检测出超过5000个数量的资源订单”;又如,假设业务实体在一个业务步骤中的职责是“扫描掌纹特征信息”,假若业务参数为“3”,则交互消息为“扫描3次掌纹信息特征”;以上仅为示例,不作为实施本申请的限定方式。
其中,该序列图规范知识库可以构成分析序列图对应的规范数据库,其包含构建分析序列图的图像元素的标准,例如,序列图规范知识库包括:业务实体与职责之间的分配关系,即每个业务实体可承担什么职责,或业务实体不可承担什么职责;序列图规范知识库还包括业务步骤的所限制的交互方向标准,业务参数的判断阈值,业务实体的数量限制,等等,基于以上,实现对各个图像元素的相关信息进行校验。
具体的,首先,确定目标业务中多个业务步骤之间的交互时序、参与各业务步骤的业务实体之间的交互方向、以及每个业务步骤对应的业务参数等图像元素的文字描述信息,需要说明的是,业务实体和实体职责也属于图像元素的文字描述信息。进而,针对业务实体、实体职责、业务步骤的交互时序和交互方向、业务参数等图像元素的描述信息,在至少一个维度上进行校验;例如,基于目标业务对应的序列图规范知识库中的知识,获取实体数量阈值、业务参数阈值、实体与职责之间的职责匹配关系,以及任意两个业务实体之间的消息方向矢量,将实体数量与实体数量阈值进行匹配性对比,将业务参数与业务参数阈值进行匹配性对比,将实体职责与职责匹配关系进行匹配性对比,以及将业务交互流程的交互方向与信息方向矢量进行匹配性对比,得到多个匹配性对比的对比结果,以此,实现针对每个图像元素的描述信息进行一个维度的校验;又如,针对业务实体的这个图像元素的信息,还可通过在实体数量、实体与职责之间的匹配性、业务实体的名称是否准确等多个维度来进行校验。最后,基于对比结果来确定校验结果,如,当每个匹配性的校验对比结果均为相匹配时方可确定校验通过,反之,当存在任意一个匹配性的校验对比结果为不通过时都任务校验不通过。
在一些实施方式中,在生成分析序列图之前,除了对业务实体、实体职责、业务步骤的交互时序和交互方向进行校验外,还业务步骤对应的业务消息内容进行校验,进一步提高生成的分析序列图的质量和准确性。例如,在步骤103之前,还可以包括:(A.2)基于业务流程交互信息,确定业务流程所包含的业务步骤以及每个业务步骤对应的业务参数;根据业务实体的职责,确定各业务实体在所参与的业务步骤中的目标职责;针对每个业务实体在所参与的业务步骤中的目标职责,确定该业务步骤所涉及的控制类,该控制类可以是逻辑函数;根据业务步骤所涉及的控制类以及该业务步骤对应的业务参数,生成业务消息,业务消息包括至少一个逻辑指令;确定业务消息包含的逻辑指令的数量;若业务消息包含的逻辑指令的数量大于或等于序列图规范知识库中该业务步骤对应的消息指令数量阈值,则确定校验结果为校验通过;若业务消息包含的逻辑指令的数量小于序列图规范知识库中该业务步骤对应的消息指令数量阈值,则确定校验结果为校验不通过。
需要说明的是,在后续生成的分析序列图中,业务步骤对应的业务消息可表示一个业务逻辑对应的业务事件,每个业务逻辑可由一个或多个逻辑指令组成。为了确保分析序列图中内容更为清楚、描述更为精确,对于部分较为复杂的业务逻辑,可要求将该业务逻辑细分为多个子逻辑指令,即存在多个消息层级,并绘制在分析序列图的对应业务步骤中。因此,在对业务消息内容进行校验时,可理解为对业务消息所对应的逻辑指令的数量进行校验,具体的,针对每个业务步骤,确定参与该业务步骤的业务实体的目标职责,以便根据目标职责确定该业务步骤的控制类,进而结合对应的业务参数来生成业务消息,通过分析该业务消息以确定其所包含的逻辑指令的数量,从序列图规范知识库中查找出该业务步骤对应的消息指令数量阈值,并将逻辑指令的数量与消息指令数量阈值进行对比,以确定校验结果。
在一些实施方式中,在生成分析序列图之前,除了对业务实体、实体职责、业务步骤的交互时序和交互方向进行校验外,还业务步骤对应的业务消息层级进行校验,进一步提高生成的分析序列图的质量和准确性。例如,在步骤103之前,还可以包括:基于业务流程交互信息,确定业务流程所包含的业务步骤以及每个业务步骤对应的业务参数;根据业务实体的职责,确定各业务实体在所参与的业务步骤中的目标职责;针对每个业务实体在所参与的业务步骤中的目标职责,确定该业务步骤所涉及的控制类,该控制类可以是逻辑函数;根据业务步骤所涉及的控制类以及该业务步骤对应的业务参数,生成业务消息,业务消息包括至少一个逻辑指令;将业务消息中的逻辑指令进行业务逻辑层级归类,以得到业务消息对应的业务层级集合;当业务层级集合中的业务层级数量大于或等于序列图规范知识库中该业务步骤对应的业务逻辑层级阈值时,则确定校验结果为校验通过;反之,则确定校验结果为校验不通过。
其中,该消息层级可以理解为业务逻辑层级,每个业务逻辑层级都可独立表示对应的业务步骤,每个业务逻辑层级可由一个或多个逻辑指令组成,不同的是,每个业务逻辑层级所包含的逻辑指令的数量不同。示例性的,以掌纹信息特征验证的场景为例,该场景包括识别实体,该识别实体的职责是识别(验证)掌纹信息特征,由于识别掌纹信息特征的业务逻辑较为复杂,为了避免存在技术差异,可要求该业务步骤的业务消息包含两个消息层级(业务逻辑层级),第一消息层级为“识别(验证)掌纹信息特征”,第二消息层级为“读取掌纹信息图像、分析掌纹信息图像中包含的掌纹特征、对比掌纹特征、确定识别结果”,可以理解的是,第二消息层级属于第一消息层级下级分类,也可以理解为“父子层级关系”,第一消息层级为父逻辑层级,第二消息层级为子逻辑层级,即第二业务逻辑层级属于第一业务逻辑层级的业务逻辑的细化表示。
需要说明的是,对于要求多个消息层级的业务步骤,可对业务消息所包含的层级数量进行校验,通过消息层级数量校验,进一步确保图像元素的文字描述信息的准确性,进而,提高后续生成的分析序列图的质量和准确性。
需要说明的是,当校验结果为校验不通过时,需要重新确定符合校验通过的图像元素的文字描述信息,以便基于正确的信息来生成分析序列图。
在一些实施方式中,当校验不通过时,可从已获得的图像元素的文字描述信息中筛选出校验通过的内容信息,以便基于校验通过的内容信息来构建分析序列图,确保图像的准确性。例如,本申请实施例提供的分析序列图的生成方法还可以包括:当校验结果为校验不通过时,从目标业务涉及的业务实体、每个业务实体的职责以及目标业务的业务流程交互信息中确定校验通过的第一内容信息;基于第一内容信息,生成目标业务对应的分析序列图。
其中,该第一内容信息可以是符合序列图规范知识库的正确信息,该第一内容信息不限于包含业务实体、实体职责、业务步骤的交互方向或交互时序等。
示例性的,对业务实体、实体职责、业务参数、业务步骤的交互方向和交互时序等信息进行校验时,其中,以校验业务实体为例,假设分析序列图所要求的业务实体数量不超过7个,即实体数量阈值为7,假设从业务描述文本中识别得到的业务实体总数为8个,超出了实体数量阈值,这会导致校验结果不通过。又如,以业务实体与职责之间的匹配性校验为例,假设业务实体包括用户、采集实体、识别实体、服务实体等,实体与职责之间的关系:用户向采集实体提供生物特征信息,采集实体存储生物特征信息后向识别实体发送生物特征信息验证请求,识别实体响应信息验证请求对生物特征信息进行验证,识别实体可以向服务实体请求查询用户开通的服务;假设除了以上的业务实体与职责之间的匹配关系外,还包括采集实体直接向服务实体请求查询用户开通的服务,则存在实体与职责之间不匹配的情况,此时,存在校验不通过的现象,可剔除校验不通过的某一内容信息,以便基于校验通过的信息来生成分析序列图。
在一些实施方式中,当校验不通过时,可对校验不通过的信息进行修正,并结合修正后的内容信息和已经校验通过部分的内容信息,以生成分析序列图,确保图像的准确性。例如,本申请实施例提供的分析序列图的生成方法还可以包括:当校验结果为校验不通过时,从目标业务涉及的业务实体、每个业务实体的职责以及目标业务的业务流程交互信息中确定校验通过的第一内容信息,以及确定校验不通过的第二内容信息;基于序列图规范知识库,对第二内容信息进行调整,获得满足序列图规范知识库的第三内容信息;基于第一内容信息和第三内容信息,生成目标业务对应的分析序列图。
需要说明的是,该第二内容信息可以为校验不通过的图像元素的描述信息,其不限为业务实体、实体职责、业务参数、业务步骤的交互时序或交互方向中的一个或多个信息,针对校验不通过部分的第二内容信息,需要对其进行调整,以修正这部分内容信息,直至其符合序列图规范知识库。例如,步骤“基于序列图规范知识库,对第二内容信息进行调整”,可以包括:从序列图规范知识库中获取第二内容信息对应的规范内容,按照规范内容对第二内容信息进行调整,以获得符合序列图规范知识库的第三内容信息。
具体的,针对校验不通过部分的第二内容信息,其主要是根据第二内容信息同类别的规范内容进行调整。示例性的,假若第二内容信息为业务实体的名称,假若校验不通过的原因是业务实体的名称有误,此时,可从序列图规范知识库获取业务实体的实体名称集合,并从实体名称集合中选取与该业务实体名称最为相似的目标业务实体,按照目标业务实体的名称来修改当前有误的业务实体的名称,得到调整后的业务实体。示例性的,假若第二内容信息为业务参数,假若校验不通过的原因是业务参数的数值大于业务参数阈值,此时,可将业务参数调整至小于或等于业务参数阈值,得到调整后的业务参数。关于实体职责、业务步骤的交互方向和交互时序等内容信息,其调整可参照以上描述和示例,此处不做一一赘述。
需要说明的是,关于“基于第一内容信息生成目标业务对应的分析序列图”、“基于第一内容信息和第三内容信息生成目标业务对应的分析序列图”的描述与前述中步骤103的描述等同,此处不做赘述。
由上可知,本申请实施例可先获取目标业务的业务描述文本,然后,对该文本中的内容进行语义识别,以识别出对应的业务实体、实体职责、业务流程交互信息等图像要素,最后,对基于以上图像要素自动生成出该目标业务对应的分析序列图;以此,无需通过人工方式进行绘制,可解决分析序列图的绘制效率低的问题,实现了自动基于目标业务的业务描述文本生成目标业务的分析序列图,且确保所生成分析序列图的质量稳定性,以提高分析序列图的准确性。
根据上面实施例所描述的方法,以下将举例作进一步详细说明。
本申请实施例以分析序列图的生成为例,对本申请实施例提供的分析序列图的生成方法作进一步叙述。
图3是本申请实施例提供的分析序列图生成方法的另一步骤流程示意图,图4是本申请实施例提供的分析序列图的生成系统的架构示意图,图5是本申请实施例提供的分析序列图的示意图。为了便于理解,本申请实施例结合图3-5进行描述。
在本申请实施例中,将从分析序列图的生成装置的维度进行描述,该分析序列图的生成装置具体可以集成在计算机设备如服务器中。例如,该计算机设备上的处理器执行分析序列图的生成方法对应的程序时,该分析序列图的生成方法的具体流程如下:
201、获取目标业务的业务描述文本。
本申请实施例为了能够实现自动生成相关业务的分析序列图,可先获取该业务的相关规则描述文本,以便后续从该规则描述文本中提取用于构建分析序列图的基础信息,以进行校验无误后,完成分析序列图的构建。
需要说明的是,生成分析序列图的过程可以理解为业务建模,具体是指利用业务领域语言,结合业务领域的相关术语、实体、实体职责等内容来构建该领域对应的抽象化表达。
其中,在获取目标业务的业务描述文本时,可接收用户在客户端上导入的业务描述文本;还可以是接收用户在客户端输入的业务关键词,并基于业务关键词查询该目标业务对应的业务描述文本。例如,以掌纹信息特征验证作为目标业务为例,假设用户在客户端上输入“掌纹信息特征验证”或“刷掌识别”的业务关键词,则可从该业务对应的知识库或相应数据库中查询“掌纹信息特征验证”或“刷掌识别”对应的业务描述文本,以用于后续从该业务描述文本中识别出用于建模的相关信息,即提取出用于构建分析序列图的图像元素。
202、通过训练后的目标模型对业务描述文本进行语义分析,以确定目标业务涉及的业务实体、每个业务实体的职责以及目标业务的业务流程交互信息。
在本申请实施例中,在得到目标业务的业务描述文本后,需要从该业务描述文本中提取出目标业务所涉及的多个业务实体、实体职责、业务流程交互信息等反映图像元素的内容信息,为了提高分析序列图的生成效率,可通过语言理解处理方式来分析业务描述文本中语义信息,从而基于理解的语义信息来确定构建分析序列图所需的图像元素的内容信息。
具体的,可以通过语言处理模型来对目标业务的业务描述文本中的内容进行语义分析。为了得到能够理解目标业务的业务描述文本的语言处理模型,在模型投入应用之前,需要对模型进行训练。示例性的,可选用预训练转换器模型(Generative Pre-TrainedTransformer,GPT)作为本申请实施例所使用的模型,此外,还可使用与GPT模型相类似的其他模型,此处不作限定;在对模型训练时,可使用目标业务所属的业务领域的大规模知识语料来输入至模型中,以对模型进行无监督学习(预训练),使得该模型能够不断学习和沉淀该领域的知识,如行业背景、相关术语、业务逻辑等等,初步获得对该领域各个业务的知识理解能力,进一步的,为了使得模型的性能更贴合目标业务,还可针对目标业务的下游任务设定输出的标签信息,以对无监督学习后的模型进行微调,得到微调后的目标模型。此后,可基于目标模型来对业务描述文本进行语义分析,以提取出各种图像元素的文字版描述信息。以此,可从目标业务的业务描述文本中提取出相关信息,无需人工参与,实现快速获得参与分析序列图的图像元素,为提高了分析序列图的生成效率奠定了基础。
203、对目标业务涉及的业务实体、每个业务实体的职责以及业务流程交互信息进行校验,得到校验结果。
在本申请实施例中,生成分析序列图之前,可对获得的业务实体、实体职责以及业务流程交互信息进行校验,以便基于校验结果来确定用于生成分析序列图的元素,以此,确保各个图像元素的文字描述信息的准确性,以利于后续准确生成分析序列图。
具体的,在对目标业务涉及的业务实体、每个业务实体的职责以及业务流程交互信息进行校验时,主要是从多个方面对获取到的文字版图像元素进行校验,例如,除了需要校验业务实体的名称、总数外,校验事项还包括业务实体与职责是否匹配、业务步骤的时序是否正确、业务步骤的交互方向是否正确、业务步骤的消息参数(业务参数)是否符合要求等等。
需要说明的是,针对以上校验事项,若存在一项以上的校验事项不通过时,则校验结果为校验不通过;若所有的校验事项都通过时,则校验结果为校验通过,此时,可基于模型识别出的图像元素的文字描述信息,以文图像形式表示出来。
需要说明的是,对于以上多方面的校验事项,其主要是基于序列图规范知识库中的标准来作为校验依据的。以此,通过对以上个校验事项进行校验,以便确定符合序列图规范知识库标准的文字版图像元素,以确保各个图像元素的文字描述信息的准确性。
204、若校验结果为校验通过,则基于目标业务涉及的业务实体、每个业务实体的职责以及业务流程交互信息,生成目标业务对应的分析序列图。
在本申请实施例中,当对业务实体、实体职责、业务步骤的交互时序、业务步骤交互方向、业务消息对应的业务参数等事项的校验通过时,可基于以上信息来生成目标业务的分析序列图。
需要说明的是,生成分析序列图的图像元素不限于包括业务实体、业务步骤的交互时序和交互方向、交互消息等。关于分析序列图的生成过程具体如下:
首先,需要确定多个业务步骤之间的交互时序以及每个业务步步骤的交互方向。需要说明的是,由于同一业务实体在业务流程中可能涉及一个或多个业务步骤,当一个业务实体涉及多个业务步骤时,则不同时序下的业务实体需要承担不同的职能或工作,因此,需要结合业务流程交互信息和所有的业务实体来确定业务步骤之间的交互时序,以及确定各业务步骤在对应两个业务实体之间的交互方向。
然后,确定业务实体在实际业务步骤中的目标职责。具体的,由于一个业务实体可能涉及多个职责,当一个业务实体涉及多个业务步骤时,其在不同业务步骤中的职责可不同。例如,以掌纹信息特征验证业务为例,掌纹信息特征的验证实体需要执行的业务步骤包括识别掌纹信息特征,查询该掌纹信息特征的代表用户所开通的服务,以及查询该代表用户授权的服务实体(如服务机构、服务平台等),基于此,该验证实体的职责可以包括信息识别(验证)、查询服务和查询授权信息等。因此,在得到业务实体的职责后,还需确定当前业务实体在每个业务步骤中的真实职责,此外,为了更准确地确定业务实体在所参与的业务步骤中的职责,还可结合交互时序和业务实体的职责来确定每个业务实体在所参与的业务步骤的目标职责,此处不做限定。
进而,按照各业务实体在所参与的业务步骤中的目标职责,在各业务步骤对应的消息箭头上添加该业务步骤对应的交互消息。具体的,交互消息不限于包括消息名称和业务参数,该消息名称过绑定有对应的控制类,该控制类表示对应的业务实体在当前所参与的业务步骤中的职责或控制行为,该控制类可以是函数的形式;其中,该业务参数可以从目标业务描述文本中经过语义分析获取得到,可结合消息名称(或控制类)与业务参数来生交互消息。
此后,生成分析序列图,该过程为:可获取表示每个业务实体的实体图标,在图像生成区域中创建每个业务实体对应的实体图标,这多个实体图标之间可按照目标距离均衡分布在同一横向水平线上或竖向垂直方向上,并为每个实体图标建立生命线,该生命线的长度表示对应的业务实体在业务流程中的存在时长。进而,确定参与每个业务步骤的两个业务实体,按照交互时序和交互方向,为每个业务步骤关联的两个业务实体之间添加交互图标,该交互图标可以是箭头线段的形状,用于表示业务实体之间的消息传输方向。最后,为对应的业务步骤关联的消息箭头添加上交互消息,直至所有的业务步骤都添加上交互消息,得到的分析序列图可描述各个业务步骤之间的业务逻辑,并表示了各个业务实体之间基于消息传递来协作完成业务目标的动态过程。
此外,在本申请实施例中,当校验结果为校验不通过时,可从已获得的图像元素的文字描述信息中筛选出校验通过的内容信息,以便基于校验通过的内容信息来构建分析序列图;还可对校验不通过的信息进行修正,以便基于校验通过部分的信息和修正后的信息来生成分析序列图,确保图像的准确性。
为了便于对本申请实施例的理解,将以具体的应用场景实例对本申请实施例进行描述。具体的,通过执行以上步骤201-204,以及结合图3-图5,对该应用场景实例进行描述。
具体的,该分析序列图的生成方法可应用于各种领域、业务建模的场景,例如,以掌纹信息特征验证下的资源交互服务场景为例,该分析序列图的生成的场景实例具体如下:
结合图4所示,该分析序列图的生成系统在架构上可以包括:(1)领域知识学习模块、(2)领域建模模块、(3)校验模块以及(4)分析序列图绘制模块,分别结合以上各模块,对分析序列图的生成示例进行介绍。
(1)领域知识学习模块,用于对模型进行训练,该模型可以是基于transformer解码器的预训练语言模型(Generative Pre-Trained Transformer,GPT),该模块通过训练一个大规模的转换器模型来获得对语言的理解,以生成高质量的文本。需要说明的是,本场景实例主要基于语言处理模型来识别出图像元素的文字描述信息,为了获得可准确理解业务领域、目标业务的知识的语言处理模型,需要对模型进行两步训练。
具体的,第一步,领域知识学习模块获取领域中大量的知识语料,该语料包括但不限于行业知识背景、业务逻辑、基础知识等内容,此后,对语料进行预处理得到语料文本序列,GPT模型读取语料文本序列,通过自注意力机制学习语料中的语义信息,融合先前内容和后续内容的关联,获得对上下文的理解;重复以上过程,不断预训练GPT模型,逐步完善对领域知识的吸收,实现知识的沉淀。第二步,对预训练后的模型做进一步微调,在微调过程中,可以结合具体下游任务来设定用于微调训练的标签信息,以对模型进行微调,微调可以增强对领域术语的理解。至此,模型训练完毕,经过训练的GPT模型可以对输入的目标业务的业务描述文本进行编码,以基于编码向量来获取语义信息,从而输出符合相应业务的高质量内容文本。
示例性的,以刷掌(掌纹信息特征验证)下资源交互的领域为例,该模块需要沉淀与学习相关的领域内容,比如“刷掌是什么意思,什么是刷掌识别,做一次刷掌本质是为了实现什么业务逻辑”等等。以上仅为示例。
因此,该领域知识学习模块可以持续学习领域知识,GPT模型训练可以用于编码输入文本,输出表示对文本语义的向量,传递语义信息,使得GPT模型能够对专业领域知识建立系统性理解,掌握正确的领域实体确定能力,分析序列图的理解能力,为后续的业务分析、决策等提供知识基础。
(2)领域建模模块,用于从业务领域的相关规则中提取出构建分析序列图的文字版图像元素。需要说明的是,GPT模型的自然语言理解能力用于解析业务描述,transformer的注意力机制用于学习抽象业务知识。因此,针对具体业务的描述文本,领域建模模块可以利用GPT模型的语义解析能力识别关键词,形成候选实体集,并结合领域知识确定真实的业务实体,并提取其属性;接着分析业务流程,识别实体职责,如“用户”实体的职责有“提交订单”。在交互流程中,确认实体之间消息传递方向,比如“用户”向“订单”发送“提交订单”消息;此外,确定业务流程交互信息;至此,输出该业务所涉及的业务实体、业务实体的职责、以及业务流程交互信息等等。
示例性的,以刷掌(掌纹信息特征验证)下资源交互的领域为例,该模块可以输出的内容,可以包括:掌图承担识别、查询等职责,机构承担商户查询等职责,执行者有刷掌用户、机构用户等,执行者的动作有识别、提交开通请求等文字内容,相当于文字版的一种对图的描述。
因此,该领域建模模块可以从业务描述文本中自动提取出业务实体、实体属性、职责,并确定业务实体之间消息交互顺序、方向灯,输出文字版的分析序列图,表达业务流程中的交互逻辑,为后续系统设计提供指导。避免人工过程中的疏漏,提高建模效率和质量。
(3)校验模块,用于对GPT模型所输出的内容进行校验,如校验实体与职责之间是否匹配、交互消息是否准确等。具体的,建校验器,提取分析序列图构成要素,将各要素分别与序列图逻辑知识库进行对比,判断实体提取、消息方向、职责分配是否遵循业务顺序图设计规范,以判断是否一致,存在不一致,则返回错误,需要调整,从而完成校验。
示例性的,以刷掌(掌纹信息特征验证)下资源交互的领域为例,序列图逻辑知识库中包含了一些规则逻辑限制,比如,掌图不承担注册图片的职责,该注册图片的职责交给用户类;又如,在消息逻辑上限制消息须包含多个级别,例如,识别的逻辑在掌图实体内需要详细展开至少一个层次,等等。以上仅为示例。
因此,该校验模块可以自动化判断分析序列图在语义逻辑一致性方面的正确性,包括实体抽取、消息传递方向与职责分配的合理性。使分析序列图生成过程中遵循正确的逻辑表达,符合标准规范。避免手工绘制中的错误,提高分析序列图设计的专业程度与质量。
(4)分析序列图绘制模块,用于自动绘制出初版本的分析序列图,以用于后续的软件应用设计以及其他分析研究用途。具体的,在获得前序模块确定的分析序列图构成要素后,包括实体、消息、职责分配、业务流程等,根据分析序列图的基本绘制规范,转换为对应的图形元素,进行自动化绘制。其中,该自动化绘制过程如下:根据识别的业务实体,在图中创建对应的“参与者”符号节点;对消息进行解析,提取消息名称、发送方、接收方信息,在对应实体生命线间创建表达消息传递的箭头连接;分析业务流程顺序,确定消息箭头的时间顺序,绘制业务步骤的流转顺序;对关键业务实体,识别其在流程中的控制职责,在图中以文本形式标识;按标准绘图规范,组织实体、消息、顺序、控制等元素的视觉表达,得到包含图形图像的分析序列图。
示例性的,以刷掌(掌纹信息特征验证)下资源交互的领域为例,自动生成的分析序列图可参见图5所示,图5中包含的业务实体包括“刷掌用户”、“识别控制类”、“掌图”、“刷掌服务”和“机构”。其中,分析序列图表达的动态业务流程如下:“刷掌用户”执行刷掌;“识别控制类”可采集刷掌时的掌纹信息特征,并请求“掌图”识别该掌纹信息特征;“掌图”识别掌纹信息特征,并向“刷掌服务”查询该用户所开通的服务;“刷掌服务”查询已开通服务所涉及的服务机构,以及,“掌图”查询用户当前所授权的服务机构;最后,“识别控制类”返回识别结果。需要说明的是,该识别控制类可以理解为用户的移动终端,其可采集掌纹信息特征和显示识别结果,以上仅为示例,不作为实施本申请的具体限定。
通过执行以上场景实例,可以实现如下:利用GPT模型的自然语言理解能力,自动解析业务描述,识别关键实体及其属性,确定实体间的业务消息和职责分配,实现从文本到分析序列图的自动化转换,提升了建模效率。
通过以上应用场景实例,可实现如下效果:利用GPT自动解析业务描述,识别实体和消息,避免了大量手工提取和确认的过程,节省建模时间成本,提高建模效率;生成的序列图质量稳定,避免人工绘制的随机性。同时结合校验机制,确保正确性,提升建模质量;可快速自动化生成序列图,缩短需求确认和设计阶段周期,具有可靠性。
由以上可知,本申请实施例可先获取目标业务的业务描述文本,然后,对该文本中的内容进行语义识别,以识别出对应的业务实体、实体职责、业务流程交互信息等图像要素,最后,对基于以上图像要素自动生成出该目标业务对应的分析序列图;以此,无需通过人工方式进行绘制,可解决分析序列图的绘制效率低的问题,实现了自动基于目标业务的业务描述文本生成目标业务的分析序列图,且确保所生成分析序列图的质量稳定性,以提高分析序列图的准确性。
为了更好地实施以上方法,本申请实施例还提供一种分析序列图生成装置。例如,如图6所示,该分析序列图生成装置可以包括获取单元401、确定单元402和生成单元403。
获取单元401,用于获取目标业务的业务描述文本;
确定单元402,用于对业务描述文本进行语义分析,以确定目标业务涉及的业务实体、每个业务实体的职责以及目标业务的业务流程交互信息;
生成单元403,用于基于目标业务涉及的业务实体、每个业务实体的职责以及业务流程交互信息,生成目标业务对应的分析序列图。
在一些实施方式中,生成单元403,还用于:基于业务流程交互信息和目标业务涉及的业务实体,确定目标业务中多个业务步骤之间的交互时序和参与各业务步骤的业务实体之间的交互方向;根据每个业务实体的职责,确定各业务实体在所参与的业务步骤中的目标职责;根据目标业务中多个业务步骤之间的交互时序和参与各业务步骤的业务实体之间的交互方向、以及各业务实体在所参与的业务步骤中的目标职责,生成目标业务对应的分析序列图。
在一些实施方式中,生成单元403,还用于:创建每个业务实体对应的实体图标,以及为每个实体图标创建对应的业务实体的生命线;按照多个业务步骤之间的交互时序、各业务步骤的交互方向和参与各业务步骤的业务实体,为多个生命线之间建立各业务步骤对应的消息箭头;按照各业务实体在所参与的业务步骤中的目标职责,在各业务步骤对应的消息箭头上添加该业务步骤对应的交互消息,得到目标业务对应的分析序列图。
在一些实施方式中,生成单元403,还用于:针对每个业务步骤,在参与该业务步骤的业务实体中确定作为执行者的执行者实体,并将各业务实体在所参与的业务步骤中的目标职责确定为执行者实体在该业务步骤中的目标职责;根据每个业务步骤对应的执行者实体在该业务步骤中的目标职责,确定该业务步骤对应的控制类;确定每个业务步骤所对应控制类的业务参数;根据每个业务步骤对应的控制类和每个业务步骤所对应控制类的业务参数,确定每个业务步骤对应的交互消息;在各业务步骤对应的消息箭头上添加对应业务步骤的交互消息,得到目标业务对应的分析序列图。
在一些实施方式中,确定单元402,还用于:通过目标模型对业务描述文本进行语义分析,以确定目标业务涉及的业务实体、每个业务实体的职责以及目标业务的业务流程交互信息;
则分析序列图生成装置还包括训练单元,用于:获取与样本业务所属领域关联的领域知识语料;基于领域知识语料对预设模型进行预训练,得到初始模型;根据多个样本业务分别对应的样本业务描述文本和各样本业务对应的标签信息,对初始模型进行微调训练,得到目标模型;样本业务对应的标签信息包括样本业务涉及的样本业务实体和各样本业务实体的职责和样本业务对应的业务流程交互信息。
在一些实施方式中,分析序列图生成装置还包括校验单元,用于:对目标业务涉及的业务实体、每个业务实体的职责以及业务流程交互信息进行校验,得到校验结果;
则生成单元403,还用于:若校验结果为校验通过,则基于目标业务涉及的业务实体、每个业务实体的职责以及业务流程交互信息,生成目标业务对应的分析序列图。
在一些实施方式中,校验单元,还用于:基于业务流程交互信息,确定目标业务中多个业务步骤之间的交互时序和参与各业务步骤的业务实体之间的交互方向,以及每个业务步骤对应的业务参数;基于序列图规范知识库,对目标业务涉及的业务实体、每个业务实体的职责、目标业务中多个业务步骤之间的交互时序和参与各业务步骤的业务实体之间的交互方向,以及每个业务步骤对应的业务参数,在至少一个校验维度上进行校验对比,得到每个校验维度对应的对比结果;当至少一个校验维度中每个校验维度对应的对比结果均为相匹配时,确定校验结果为校验通过;当至少一个校验维度中存在对比结果为不匹配的校验维度时,确定校验结果为校验不通过。
在一些实施方式中,校验单元,还用于:基于业务流程交互信息,确定业务流程所包含的业务步骤以及每个业务步骤对应的业务参数;根据业务实体的职责,确定各业务实体在所参与的业务步骤中的目标职责;针对每个业务实体在所参与的业务步骤中的目标职责,确定该业务步骤所涉及的控制类,该控制类可以是逻辑函数;根据业务步骤所涉及的控制类以及该业务步骤对应的业务参数,生成业务消息,业务消息包括至少一个逻辑指令;确定业务消息包含的逻辑指令的数量;若业务消息包含的逻辑指令的数量大于或等于序列图规范知识库中该业务步骤对应的消息指令数量阈值,则确定校验结果为校验通过;若业务消息包含的逻辑指令的数量小于序列图规范知识库中该业务步骤对应的消息指令数量阈值,则确定校验结果为校验不通过。
在一些实施方式中,校验单元,还用于:基于业务流程交互信息,确定业务流程所包含的业务步骤以及每个业务步骤对应的业务参数;根据业务实体的职责,确定各业务实体在所参与的业务步骤中的目标职责;针对每个业务实体在所参与的业务步骤中的目标职责,确定该业务步骤所涉及的控制类,该控制类可以是逻辑函数;根据业务步骤所涉及的控制类以及该业务步骤对应的业务参数,生成业务消息,业务消息包括至少一个逻辑指令;将业务消息中的逻辑指令进行业务逻辑层级归类,以得到业务消息对应的业务层级集合;当业务层级集合中的业务层级数量大于或等于序列图规范知识库中该业务步骤对应的业务逻辑层级阈值时,则确定校验结果为校验通过;当业务层级集合中的业务层级数量小于序列图规范知识库中该业务步骤对应的业务逻辑层级阈值时,则确定校验结果为校验不通过。
在一些实施方式中,生成单元403,还用于:当校验结果为校验不通过时,从目标业务涉及的业务实体、每个业务实体的职责以及目标业务的业务流程交互信息中确定校验通过的第一内容信息;基于第一内容信息,生成目标业务对应的分析序列图。
在一些实施方式中,生成单元403,还用于:当校验结果为校验不通过时,从目标业务涉及的业务实体、每个业务实体的职责以及目标业务的业务流程交互信息中确定校验通过的第一内容信息,以及确定校验不通过的第二内容信息;基于序列图规范知识库,对第二内容信息进行调整,获得满足序列图规范知识库的第三内容信息;基于第一内容信息和第三内容信息,生成目标业务对应的分析序列图。
由以上可知,本申请实施例可先获取目标业务的业务描述文本,然后,对该文本中的内容进行语义识别,以识别出对应的业务实体、实体职责、业务流程交互信息等图像要素,最后,对基于以上图像要素自动生成出该目标业务对应的分析序列图;以此,无需通过人工方式进行绘制,可解决分析序列图的绘制效率低的问题,实现了自动基于目标业务的业务描述文本生成目标业务的分析序列图,且确保所生成分析序列图的质量稳定性,以提高分析序列图的准确性。
本申请实施例还提供一种计算机设备,如图7所示,其示出了本申请实施例所涉及的计算机设备的结构示意图,具体来讲:
该计算机设备可以包括一个或者一个以上处理核心的处理器501、一个或一个以上计算机可读存储介质的存储器502、电源503和输入单元504等部件。本领域技术人员可以理解,图7中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器501是该计算机设备的控制中心,利用各种接口和线路连接整个计算机设备的各个部分,通过运行或执行存储在存储器502内的软件程序和/或模块,以及调用存储在存储器502内的数据,执行计算机设备的各种功能和处理数据。可选的,处理器501可包括一个或多个处理核心;优选的,处理器501可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器501中。
存储器502可用于存储软件程序以及模块,处理器501通过运行存储在存储器502的软件程序以及模块,从而执行各种功能应用以及分析序列图生成过程。存储器502可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器502可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器502还可以包括存储器控制器,以提供处理器501对存储器502的访问。
计算机设备还包括给各个部件供电的电源503,优选的,电源503可以通过电源管理系统与处理器501逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源503还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该计算机设备还可包括输入单元504,该输入单元504可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,计算机设备还可以包括显示单元等,在此不再赘述。具体在本申请实施例中,计算机设备中的处理器501会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器502中,并由处理器501来运行存储在存储器502中的应用程序,从而实现各种功能,如下:
获取目标业务的业务描述文本;对业务描述文本进行语义分析,以确定目标业务涉及的业务实体、每个业务实体的职责以及目标业务的业务流程交互信息;基于目标业务涉及的业务实体、每个业务实体的职责以及业务流程交互信息,生成目标业务对应的分析序列图。
以上各个操作的具体实施可参见前面的实施例,在此不作赘述。
由此可得,本方案可先获取目标业务的业务描述文本,然后,对该文本中的内容进行语义识别,以识别出对应的业务实体、实体职责、业务流程交互信息等图像要素,最后,对基于以上图像要素自动生成出该目标业务对应的分析序列图;以此,无需通过人工方式进行绘制,可解决分析序列图的绘制效率低的问题,实现了自动基于目标业务的业务描述文本生成目标业务的分析序列图,且确保所生成分析序列图的质量稳定性,以提高分析序列图的准确性。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请实施例所提供的任一种分析序列图生成方法中的步骤。例如,该指令可以执行如下步骤:
获取目标业务的业务描述文本;对业务描述文本进行语义分析,以确定目标业务涉及的业务实体、每个业务实体的职责以及目标业务的业务流程交互信息;基于目标业务涉及的业务实体、每个业务实体的职责以及业务流程交互信息,生成目标业务对应的分析序列图。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该计算机可读存储介质中所存储的指令,可以执行本申请实施例所提供的任一种分析序列图生成方法中的步骤,因此,可以实现本申请实施例所提供的任一种分析序列图生成方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例提供的各种可选实现方式中提供的方法。
以上对本申请实施例所提供的一种分析序列图生成方法、装置、设备和计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本申请的限制。

Claims (13)

1.一种分析序列图生成方法,其特征在于,包括:
获取目标业务的业务描述文本;
对所述业务描述文本进行语义分析,以确定所述目标业务涉及的业务实体、每个所述业务实体的职责以及所述目标业务的业务流程交互信息;
基于所述目标业务涉及的业务实体、每个所述业务实体的职责以及所述业务流程交互信息,生成所述目标业务对应的分析序列图。
2.根据权利要求1所述的方法,其特征在于,所述基于所述目标业务涉及的业务实体、每个所述业务实体的职责以及所述业务流程交互信息,生成所述目标业务对应的分析序列图,包括:
基于所述业务流程交互信息和所述目标业务涉及的业务实体,确定所述目标业务中多个业务步骤之间的交互时序和参与各业务步骤的业务实体之间的交互方向;
根据每个业务实体的职责,确定各业务实体在所参与的业务步骤中的目标职责;
根据所述目标业务中多个业务步骤之间的交互时序和参与各业务步骤的业务实体之间的交互方向、以及各业务实体在所参与的业务步骤中的目标职责,生成所述目标业务对应的分析序列图。
3.根据权利要求2所述的方法,其特征在于,所述根据所述目标业务中多个业务步骤之间的交互时序和参与各业务步骤的业务实体之间的交互方向、以及各业务实体在所参与的业务步骤中的目标职责,生成所述目标业务对应的分析序列图,包括:
创建每个所述业务实体对应的实体图标,以及为每个所述实体图标创建对应的所述业务实体的生命线;
按照多个业务步骤之间的交互时序、各业务步骤的交互方向和参与各业务步骤的业务实体,为多个所述生命线之间建立各业务步骤对应的消息箭头;
按照各业务实体在所参与的业务步骤中的目标职责,在各业务步骤对应的消息箭头上添加该业务步骤对应的交互消息,得到所述目标业务对应的分析序列图。
4.根据权利要求3所述的方法,其特征在于,所述按照各业务实体在所参与的业务步骤中的目标职责,在各业务步骤对应的消息箭头上添加该业务步骤对应的交互消息,得到所述目标业务对应的分析序列图,包括:
针对每个业务步骤,在参与该业务步骤的业务实体中确定作为执行者的执行者实体,并将各业务实体在所参与的业务步骤中的目标职责确定为执行者实体在该业务步骤中的目标职责;
根据每个业务步骤对应的执行者实体在该业务步骤中的目标职责,确定该业务步骤对应的控制类;
确定每个业务步骤所对应控制类的业务参数;
根据每个业务步骤对应的控制类和每个业务步骤所对应控制类的业务参数,确定每个业务步骤对应的交互消息;
在各业务步骤对应的消息箭头上添加对应业务步骤的交互消息,得到目标业务对应的分析序列图。
5.根据权利要求1所述的方法,其特征在于,所述对所述业务描述文本进行语义分析,以确定所述目标业务涉及的业务实体、每个所述业务实体的职责以及所述目标业务的业务流程交互信息,包括:
通过目标模型对所述业务描述文本进行语义分析,以确定所述目标业务涉及的业务实体、每个所述业务实体的职责以及所述目标业务的业务流程交互信息;
则所述通过目标模型对所述业务描述文本进行语义分析,以确定所述目标业务涉及的业务实体、每个所述业务实体的职责以及所述目标业务的业务流程交互信息之前,所述方法还包括:
获取与样本业务所属领域关联的领域知识语料;
基于所述领域知识语料对预设模型进行预训练,得到初始模型;
根据多个样本业务分别对应的样本业务描述文本和各样本业务对应的标签信息,对所述初始模型进行微调训练,得到所述目标模型;样本业务对应的标签信息包括所述样本业务涉及的样本业务实体和各样本业务实体的职责和所述样本业务对应的业务流程交互信息。
6.根据权利要求1所述的方法,其特征在于,所述基于所述目标业务涉及的业务实体、每个所述业务实体的职责以及所述业务流程交互信息,生成所述目标业务对应的分析序列图之前,所述方法还包括:
对所述目标业务涉及的业务实体、每个所述业务实体的职责以及所述业务流程交互信息进行校验,得到校验结果;
则所述基于所述目标业务涉及的业务实体、每个所述业务实体的职责以及所述业务流程交互信息,生成所述目标业务对应的分析序列图,包括:
若所述校验结果为校验通过,则基于所述目标业务涉及的业务实体、每个所述业务实体的职责以及所述业务流程交互信息,生成所述目标业务对应的分析序列图。
7.根据权利要求6所述的方法,其特征在于,所述对所述目标业务涉及的业务实体、每个所述业务实体的职责以及所述业务流程交互信息进行校验,得到校验结果,包括:
基于所述业务流程交互信息,确定所述目标业务中多个业务步骤之间的交互时序和参与各业务步骤的业务实体之间的交互方向,以及每个业务步骤对应的业务参数;
基于序列图规范知识库,对所述目标业务涉及的业务实体、每个所述业务实体的职责、目标业务中多个业务步骤之间的交互时序和参与各业务步骤的业务实体之间的交互方向,以及每个业务步骤对应的业务参数,在至少一个校验维度上进行校验对比,得到每个校验维度对应的对比结果;
当所述至少一个校验维度中每个校验维度对应的所述对比结果均为相匹配时,确定校验结果为校验通过;
当所述至少一个校验维度中存在对比结果为不匹配的校验维度时,确定校验结果为校验不通过。
8.根据权利要求6或7所述的方法,其特征在于,所述方法还包括:
当所述校验结果为校验不通过时,从所述目标业务涉及的业务实体、每个所述业务实体的职责以及所述目标业务的业务流程交互信息中确定校验通过的第一内容信息;
基于所述第一内容信息,生成所述目标业务对应的分析序列图。
9.根据权利要求6或7所述的方法,其特征在于,所述方法还包括:
当所述校验结果为校验不通过时,从所述目标业务涉及的业务实体、每个所述业务实体的职责以及所述目标业务的业务流程交互信息中确定校验通过的第一内容信息,以及确定校验不通过的第二内容信息;
基于序列图规范知识库,对所述第二内容信息进行调整,获得满足所述序列图规范知识库的第三内容信息;
基于所述第一内容信息和所述第三内容信息,生成所述目标业务对应的分析序列图。
10.一种分析序列图生成装置,其特征在于,包括:
获取单元,用于获取目标业务的业务描述文本;
确定单元,用于对所述业务描述文本进行语义分析,以确定所述目标业务涉及的业务实体、每个所述业务实体的职责以及所述目标业务的业务流程交互信息;
生成单元,用于基于所述目标业务涉及的业务实体、每个所述业务实体的职责以及所述业务流程交互信息,生成所述目标业务对应的分析序列图。
11.一种计算机设备,其特征在于,包括处理器和存储器,所述存储器存储有计算机程序,所述处理器用于运行所述存储器内的计算机程序实现权利要求1至9任一项所述的分析序列图生成方法中的步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至9任一项所述的分析序列图生成方法中的步骤。
13.一种计算机程序产品,其特征在于,包括计算机指令,所述计算机指被执行时,实现权利要求1至9任一项所述的分析序列图生成方法中的步骤。
CN202311233333.4A 2023-09-22 2023-09-22 分析序列图生成方法、装置、设备和计算机可读存储介质 Active CN116974626B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311233333.4A CN116974626B (zh) 2023-09-22 2023-09-22 分析序列图生成方法、装置、设备和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311233333.4A CN116974626B (zh) 2023-09-22 2023-09-22 分析序列图生成方法、装置、设备和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN116974626A true CN116974626A (zh) 2023-10-31
CN116974626B CN116974626B (zh) 2024-01-05

Family

ID=88477101

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311233333.4A Active CN116974626B (zh) 2023-09-22 2023-09-22 分析序列图生成方法、装置、设备和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN116974626B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117608650A (zh) * 2024-01-15 2024-02-27 钱塘科技创新中心 业务流程图生成方法、处理设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060161890A1 (en) * 2005-01-19 2006-07-20 Green Kenneth M Application-generic sequence diagram generator driven by a non-proprietary language
US20070150322A1 (en) * 2005-12-22 2007-06-28 Falchuk Benjamin W Method for systematic modeling and evaluation of application flows
US20130097583A1 (en) * 2011-09-27 2013-04-18 The University Of Texas System Systems and Methods For Automating the Application of a Software Methodology
CN111897890A (zh) * 2020-08-21 2020-11-06 中国工商银行股份有限公司 金融业务处理方法及装置
US20200394365A1 (en) * 2019-05-08 2020-12-17 Tata Consultancy Services Limited Automated extraction of message sequence chart from textual description
CN114218052A (zh) * 2021-11-11 2022-03-22 深圳前海微众银行股份有限公司 一种业务交互图生成方法、装置、设备及存储介质
CN115409454A (zh) * 2021-05-27 2022-11-29 腾讯科技(深圳)有限公司 基于人工智能的业务处理方法、装置及电子设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060161890A1 (en) * 2005-01-19 2006-07-20 Green Kenneth M Application-generic sequence diagram generator driven by a non-proprietary language
CN1808377A (zh) * 2005-01-19 2006-07-26 安捷伦科技有限公司 由非专属语言驱动的通用序列图生成器
US20070150322A1 (en) * 2005-12-22 2007-06-28 Falchuk Benjamin W Method for systematic modeling and evaluation of application flows
US20130097583A1 (en) * 2011-09-27 2013-04-18 The University Of Texas System Systems and Methods For Automating the Application of a Software Methodology
US20200394365A1 (en) * 2019-05-08 2020-12-17 Tata Consultancy Services Limited Automated extraction of message sequence chart from textual description
CN111897890A (zh) * 2020-08-21 2020-11-06 中国工商银行股份有限公司 金融业务处理方法及装置
CN115409454A (zh) * 2021-05-27 2022-11-29 腾讯科技(深圳)有限公司 基于人工智能的业务处理方法、装置及电子设备
CN114218052A (zh) * 2021-11-11 2022-03-22 深圳前海微众银行股份有限公司 一种业务交互图生成方法、装置、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117608650A (zh) * 2024-01-15 2024-02-27 钱塘科技创新中心 业务流程图生成方法、处理设备及存储介质
CN117608650B (zh) * 2024-01-15 2024-04-09 钱塘科技创新中心 业务流程图生成方法、处理设备及存储介质

Also Published As

Publication number Publication date
CN116974626B (zh) 2024-01-05

Similar Documents

Publication Publication Date Title
CN111026842B (zh) 自然语言处理方法、自然语言处理装置及智能问答系统
CN110427461B (zh) 智能问答信息处理方法、电子设备及计算机可读存储介质
CN110598070B (zh) 应用类型识别方法及装置、服务器及存储介质
WO2021109690A1 (zh) 多类型问题智能问答方法、系统、设备及可读存储介质
CN116974626B (zh) 分析序列图生成方法、装置、设备和计算机可读存储介质
CN111666400B (zh) 消息获取方法、装置、计算机设备及存储介质
CN109933792A (zh) 基于多层双向lstm和验证模型的观点型问题阅读理解方法
CN116956116A (zh) 文本的处理方法和装置、存储介质及电子设备
CN110399473B (zh) 为用户问题确定答案的方法和装置
CN113705207A (zh) 语法错误识别方法及装置
CN113821587A (zh) 文本相关性确定方法、模型训练方法、装置及存储介质
CN117313728A (zh) 实体识别方法、模型训练方法、装置、设备和存储介质
CN116975711A (zh) 多视图数据分类方法以及相关设备
CN116431827A (zh) 信息处理方法、装置、存储介质及计算机设备
CN116910190A (zh) 多任务感知模型获取方法、装置、设备及可读存储介质
CN116958622A (zh) 数据的分类方法、装置、设备、介质及程序产品
CN115168609A (zh) 一种文本匹配方法、装置、计算机设备和存储介质
CN114898184A (zh) 模型训练方法、数据处理方法、装置及电子设备
CN112052320A (zh) 一种信息处理方法、装置及计算机可读存储介质
CN116882450B (zh) 问答模型的编辑方法、装置、电子设备和存储介质
CN116561288B (zh) 事件查询方法、装置、计算机设备、存储介质及程序产品
CN117251553B (zh) 基于自定义插件和大语言模型的智能学习交互方法
CN117876940B (zh) 视频语言任务执行及其模型训练方法、装置、设备、介质
US11934794B1 (en) Systems and methods for algorithmically orchestrating conversational dialogue transitions within an automated conversational system
CN117390497B (zh) 基于大语言模型的类目预测方法、装置和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant