CN116151604A - 一种web环境下办公系统流程分析系统及其方法 - Google Patents

一种web环境下办公系统流程分析系统及其方法 Download PDF

Info

Publication number
CN116151604A
CN116151604A CN202310137070.0A CN202310137070A CN116151604A CN 116151604 A CN116151604 A CN 116151604A CN 202310137070 A CN202310137070 A CN 202310137070A CN 116151604 A CN116151604 A CN 116151604A
Authority
CN
China
Prior art keywords
feature vectors
word
vector
candidate
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310137070.0A
Other languages
English (en)
Inventor
韩玮
张莉
吴平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Nanzhi Technology Co ltd
Original Assignee
Nanjing Nanzhi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Nanzhi Technology Co ltd filed Critical Nanjing Nanzhi Technology Co ltd
Priority to CN202310137070.0A priority Critical patent/CN116151604A/zh
Publication of CN116151604A publication Critical patent/CN116151604A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0633Workflow analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computing Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

公开了一种基于web环境下办公系统流程分析系统及其方法,其从目标流转方向确定逐级处理流程中与所述目标流转方向相匹配的下一流程节点,并获取可处理所述下一流程节点的多个候选人信息,从而基于多个候选人信息与上一流程节点的业务描述之间的适配度来给所述多个候选人进行优先级排序,这样,通过数据智能手段来辅助高效选中处理人。

Description

一种web环境下办公系统流程分析系统及其方法
技术领域
本申请涉及办公自动化技术领域,且更为具体地,涉及一种基于web环境下办公系统流程分析系统及其方法。
背景技术
目前,办公自动化(Office Automation,简称OA)是一种利用现代通信技术、办公自动化设备和电子计算机系统或工作站来实现事务处理、信息管理和决策支持的技术。
OA系统的主要功能之一,是实现事务的逐级处理。这里所说的事务,比如包括合同审批事务、员工休假事务、跨部门协同工作事务等等;这里所说的处理,比如包括审批、流转、确收,等等。与事务的逐级处理相对应的用户操作,通常可以包括:逐级处理流程发起、任务分配/传递、获取流程状态、日志流转等。
在事务的逐级处理流程中,通常都会涉及到用户需要选择下一流程的处理人,如何使得用户可以高效选中处理人,同时避免多选处理人,是现有技术亟待解决的问题。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于web环境下办公系统流程分析系统及其方法,其从目标流转方向确定逐级处理流程中与所述目标流转方向相匹配的下一流程节点,并获取可处理所述下一流程节点的多个候选人信息,从而基于多个候选人信息与上一流程节点的业务描述之间的适配度来给所述多个候选人进行优先级排序,这样,通过数据智能手段来辅助高效选中处理人。
相应地,根据本申请的一个方面,提供了一种基于web环境下办公系统流程分析系统,其包括:
上一流程节点数据获取模块,用于获取上一流程节点的业务描述和目标流转方向;
词嵌入模块,用于将所述上一流程节点的业务描述进行分词处理后通过词嵌入层以得到词特征向量的序列;
业务描述语义理解模块,用于将所述词特征向量的序列通过基于转换器的第一上下文编码器以得到上下文词语义特征向量;
候选人信息提取模块,用于基于所述目标流转方向,确定逐级处理流程中与所述目标流转方向相匹配的下一流程节点以及获取可处理所述下一流程节点的多个候选人信息;
候选人语义理解模块,用于将所述多个候选人信息通过包含词嵌入层的第二上下文编码器以得到多个候选人语义特征向量;
特征聚合度优化模块,用于对所述多个候选人语义特征向量进行特征聚合度优化以得到多个校正后候选人语义特征向量;
匹配模块,用于分别计算所述多个校正后候选人语义特征向量与所述上下文词语义特征向量之间的转移矩阵以得到多个分类特征矩阵;
适配度生成模块,用于将所述多个分类特征矩阵通过分类器以得到多个概率值;以及
优先级确定模块,用于基于所述多个概率值之间的排序,确定所述多个候选人的优先级排序。
在上述基于web环境下办公系统流程分析系统中,所述业务描述语义理解模块,包括:第一上下文编码单元,用于将所述词特征向量的序列输入所述基于转换器的第一上下文编码器以得到所述多个词语义特征向量;以及,第一级联单元,用于将所述多个词语义特征向量进行级联以得到所述上下文词语义特征向量。
在上述基于web环境下办公系统流程分析系统中,所述第一上下文编码单元,进一步用于:将所述词特征向量的序列排列为输入向量;将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及,将所述自注意力特征矩阵与以所述词特征向量的序列中各个词特征向量作为值向量分别进行相乘以得到所述多个词语义特征向量。
在上述基于web环境下办公系统流程分析系统中,所述候选人语义理解模块,包括:词嵌入单元,用于将所述多个候选人信息通过嵌入层以将所述多个候选人信息中各个候选人信息转化为候选人信息嵌入向量以得到候选人信息嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个候选人信息进行嵌入编码;以及,第二上下文编码单元,用于将所述候选人信息嵌入向量的序列输入所述包含词嵌入层的第二上下文编码器以得到所述多个候选人语义特征向量。
在上述基于web环境下办公系统流程分析系统中,所述特征聚合度优化模块,进一步用于:以如下公式对所述多个候选人语义特征向量进行特征聚合度优化以得到多个校正后候选人语义特征向量;其中,所述公式为:
Figure SMS_1
其中,Vi是所述各个候选人语义特征向量,Vj是所述多个候选人语义特征向量中与所述候选人语义特征向量Vi之间的距离,即d(Vi,Vj)小于预定阈值,即ε的候选人语义特征向量,α为加权超参数,V'i是所述各个校正后候选人语义特征向量,exp(·)表示数值的指数运算,所述数值的指数运算表示以数值为幂的自然指数函数值。
在上述基于web环境下办公系统流程分析系统中,所述匹配模块,进一步用于:以如下公式分别计算所述多个校正后候选人语义特征向量与所述上下文词语义特征向量之间的转移矩阵以得到多个分类特征矩阵;其中,所述公式为:
Figure SMS_2
其中Va表示所述校正后候选人语义特征向量,Vb表示所述上下文词语义特征向量,M表示所述转移矩阵,
Figure SMS_3
表示矩阵相乘。
在上述基于web环境下办公系统流程分析系统中,所述适配度生成模块,包括:展开单元,用于将所述多个分类特征矩阵中各个分类特征矩阵按照行向量或者列向量展开为分类特征向量以得到多个分类特征向量;全连接编码单元,用于使用所述分类器的全连接层分别对所述多个分类特征向量进行全连接编码以得到多个编码分类特征向量;以及,分类结果生成单元,用于将所述多个编码分类特征向量输入所述分类器的Softmax分类函数以得到所述多个概率值。
根据本申请的另一方面,还提供了一种基于web环境下办公系统流程分析方法,其包括:
获取上一流程节点的业务描述和目标流转方向;
将所述上一流程节点的业务描述进行分词处理后通过词嵌入层以得到词特征向量的序列;
将所述词特征向量的序列通过基于转换器的第一上下文编码器以得到上下文词语义特征向量;
基于所述目标流转方向,确定逐级处理流程中与所述目标流转方向相匹配的下一流程节点以及获取可处理所述下一流程节点的多个候选人信息;
将所述多个候选人信息通过包含词嵌入层的第二上下文编码器以得到多个候选人语义特征向量;
对所述多个候选人语义特征向量进行特征聚合度优化以得到多个校正后候选人语义特征向量;
分别计算所述多个校正后候选人语义特征向量与所述上下文词语义特征向量之间的转移矩阵以得到多个分类特征矩阵;
将所述多个分类特征矩阵通过分类器以得到多个概率值;以及
基于所述多个概率值之间的排序,确定所述多个候选人的优先级排序。
在上述基于web环境下办公系统流程分析方法中,所述将所述词特征向量的序列通过基于转换器的第一上下文编码器以得到上下文词语义特征向量,包括:将所述词特征向量的序列输入所述基于转换器的第一上下文编码器以得到所述多个词语义特征向量;以及,将所述多个词语义特征向量进行级联以得到所述上下文词语义特征向量。
在上述基于web环境下办公系统流程分析方法中,所述将所述词特征向量的序列输入所述基于转换器的第一上下文编码器以得到所述多个词语义特征向量,包括:将所述词特征向量的序列排列为输入向量;将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及,将所述自注意力特征矩阵与以所述词特征向量的序列中各个词特征向量作为值向量分别进行相乘以得到所述多个词语义特征向量。
在上述基于web环境下办公系统流程分析方法中,所述将所述多个候选人信息通过包含词嵌入层的第二上下文编码器以得到多个候选人语义特征向量,包括:将所述多个候选人信息通过嵌入层以将所述多个候选人信息中各个候选人信息转化为候选人信息嵌入向量以得到候选人信息嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个候选人信息进行嵌入编码;以及,将所述候选人信息嵌入向量的序列输入所述包含词嵌入层的第二上下文编码器以得到所述多个候选人语义特征向量。
在上述基于web环境下办公系统流程分析方法中,所述对所述多个候选人语义特征向量进行特征聚合度优化以得到多个校正后候选人语义特征向量,包括:以如下公式对所述多个候选人语义特征向量进行特征聚合度优化以得到多个校正后候选人语义特征向量;其中,所述公式为:
Figure SMS_4
其中,Vi是所述各个候选人语义特征向量,Vj是所述多个候选人语义特征向量中与所述候选人语义特征向量Vi之间的距离,即d(Vi,Vj)小于预定阈值,即ε的候选人语义特征向量,α为加权超参数,V'i是所述各个校正后候选人语义特征向量,exp(·)表示数值的指数运算,所述数值的指数运算表示以数值为幂的自然指数函数值。
在上述基于web环境下办公系统流程分析方法中,所述分别计算所述多个校正后候选人语义特征向量与所述上下文词语义特征向量之间的转移矩阵以得到多个分类特征矩阵,包括:以如下公式分别计算所述多个校正后候选人语义特征向量与所述上下文词语义特征向量之间的转移矩阵以得到多个分类特征矩阵;其中,所述公式为:
Figure SMS_5
其中Va表示所述校正后候选人语义特征向量,Vb表示所述上下文词语义特征向量,M表示所述转移矩阵,
Figure SMS_6
表示矩阵相乘。
在上述基于web环境下办公系统流程分析方法中,所述将所述多个分类特征矩阵通过分类器以得到多个概率值,包括:将所述多个分类特征矩阵中各个分类特征矩阵按照行向量或者列向量展开为分类特征向量以得到多个分类特征向量;使用所述分类器的全连接层分别对所述多个分类特征向量进行全连接编码以得到多个编码分类特征向量;以及,将所述多个编码分类特征向量输入所述分类器的Softmax分类函数以得到所述多个概率值。
根据本申请的再一方面,提供了一种电子设备,包括:处理器;以及,存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的基于web环境下办公系统流程分析方法。
根据本申请的又一方面,提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如上所述的基于web环境下办公系统流程分析方法。
与现有技术相比,本申请提供的一种基于web环境下办公系统流程分析系统及其方法,其从目标流转方向确定逐级处理流程中与所述目标流转方向相匹配的下一流程节点,并获取可处理所述下一流程节点的多个候选人信息,从而基于多个候选人信息与上一流程节点的业务描述之间的适配度来给所述多个候选人进行优先级排序,这样,通过数据智能手段来辅助高效选中处理人。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1为根据本申请实施例的基于web环境下办公系统流程分析系统的框图。
图2为根据本申请实施例的基于web环境下办公系统流程分析系统的架构示意图。
图3为根据本申请实施例的基于web环境下办公系统流程分析系统中适配度生成模块的框图。
图4为根据本申请实施例的基于web环境下办公系统流程分析方法的流程图。
图5为根据本申请实施例的电子设备的框图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
申请概述
如上所述,在事务的逐级处理流程中,通常都会涉及到用户需要选择下一流程的处理人,如何使得用户可以高效选中处理人,同时避免多选处理人,是现有技术亟待解决的问题。
相应地,在本申请的技术方案中,可从目标流转方向确定逐级处理流程中与所述目标流转方向相匹配的下一流程节点,并获取可处理所述下一流程节点的多个候选人信息。并基于多个候选人信息与上一流程节点的业务描述之间的适配度来给所述多个候选人进行优先级排序,从而通过数据智能手段来辅助高效选中处理人。
具体地,首先获取上一流程节点的业务描述和目标流转方向。接着,将所述上一流程节点的业务描述进行分词处理后通过词嵌入层以得到词特征向量的序列,并将所述词特征向量的序列通过基于转换器的第一上下文编码器以得到上下文词语义特征向量。也就是,使用语义编码器对所述上一流程节点的业务描述进行上下文语义理解以得到所述上下文词语义特征向量。具体地,首先对所述上一流程节点的业务描述进行分词处理以将所述上一流程节点的业务描述转化为离散的词序列;接着,使用所述词嵌入层将所述词序列转化为词特征向量的序列,也就是,通过词嵌入将非结构化的文本数据转化为结构化的向量序列;进而,使用所述基于转换器的第一上下文编码器,例如,基于转换器的Bert模型对所述词特征向量的序列进行基于全局的上下文语义编码以得到所述上下文词语义特征向量。
在得到所述上一流程节点的业务描述的语义理解特征表示后,基于所述目标流转方向,确定逐级处理流程中与所述目标流转方向相匹配的下一流程节点以及获取可处理所述下一流程节点的多个候选人信息。继而,将所述多个候选人信息通过包含词嵌入层的第二上下文编码器以得到多个候选人语义特征向量。也就是,对所述多个候选人信息进行基于全局的上下文语义编码以捕捉所述多个候选人信息间的高维语义关联信息。
进一步地,在本申请的技术方案中,分别计算所述多个候选人语义特征向量与所述上下文词语义特征向量之间的转移矩阵以得到多个分类特征矩阵。也就是,以所述候选人语义特征向量与所述上下文词语义特征向量之间的转移矩阵来在高维特征空间中表示两者之间的适配表达。进而,将所述多个分类特征矩阵通过分类器以得到多个概率值,也就是,使用所述分类器来确定各个所述分类特征矩阵属于最高优先级的概率值。继而,基于所述多个概率值之间的排序,确定所述多个候选人的优先级排序。这样,从目标流转方向确定逐级处理流程中与所述目标流转方向相匹配的下一流程节点,并获取可处理所述下一流程节点的多个候选人信息。并基于多个候选人信息与上一流程节点的业务描述之间的适配度来给所述多个候选人进行优先级排序,从而通过数据智能手段来辅助高效选中处理人。
特别地,在本申请的技术方案中,通过计算各个候选人的所述候选人语义特征向量与所述上下文词语义特征向量之间的转移矩阵以得到多个分类特征矩阵,这里,所述分类特征矩阵分别用于表示上一流程节点的业务描述的语义特征与各个候选人信息的语义特征之间的适配度特征表达。但是,因所述多个候选人语义特征向量为通过所述包含词嵌入层的第二上下文编码器进行整体的上下文编码得到,虽然所述多个候选人语义特征向量之间具有相对较佳的长距离依赖,但由于所述包含词嵌入层的第二上下文编码器进行的编码特性,会导致所述多个候选人语义特征向量之间的特征间局部分布差异无法得到充分表达,进而在分别计算所述多个候选人语义特征向量与所述上下文词语义特征向量之间的转移矩阵以得到所述多个分类特征矩阵的过程中,所述多个分类特征矩阵间的特征间局部分布差异无法得到充分得到,这会影响后续将所述多个分类特征矩阵通过分类器得到的多个概率值之间的差异性,进而导致优先级排序产生不良影响。
针对上述问题,在本申请的技术方案中,因此,考虑到如果将所述多个候选人语义特征向量中的每个候选人语义特征向量视为单个节点,则通过节点之间的距离表示,可以基于节点整体的拓扑结构确定节点之间的类概率特征聚合度,由此,计算每个候选人语义特征向量对应的节点间类概率匹配特征向量,表示为:
Figure SMS_7
Vi是所述各个候选人语义特征向量,Vj是所述多个候选人语义特征向量中与所述候选人语义特征向量Vi之间的距离,即d(Vi,Vj)小于预定阈值,即ε的候选人语义特征向量,α为加权超参数。
也就是,如果将Vi作为拓扑结构的节点,则Vj可以被认为是在拓扑结构内部与所述节点Vi相连的节点,即i→j∈E,表示节点i与节点j之间具有边。这样,通过计算节点间类概率匹配特征向量,可以确定拓扑结构内的节点与相邻节点之间在类概率下的交互度,就可以提升多节点组成的拓扑结构内部的各个节点间的类概率特征聚合度,相当于在基于内部特征交互的特征聚合维度上对于节点特征施加注意力机制,从而提升所述多个候选人语义特征向量的各个候选人语义特征向量之间的特征聚合度,也就是,优化所述多个候选人语义特征向量间的特征差异化表达。
基于此,本申请提供了一种基于web环境下办公系统流程分析系统,其包括:上一流程节点数据获取模块,用于获取上一流程节点的业务描述和目标流转方向;词嵌入模块,用于将所述上一流程节点的业务描述进行分词处理后通过词嵌入层以得到词特征向量的序列;业务描述语义理解模块,用于将所述词特征向量的序列通过基于转换器的第一上下文编码器以得到上下文词语义特征向量;候选人信息提取模块,用于基于所述目标流转方向,确定逐级处理流程中与所述目标流转方向相匹配的下一流程节点以及获取可处理所述下一流程节点的多个候选人信息;候选人语义理解模块,用于将所述多个候选人信息通过包含词嵌入层的第二上下文编码器以得到多个候选人语义特征向量;特征聚合度优化模块,用于对所述多个候选人语义特征向量进行特征聚合度优化以得到多个校正后候选人语义特征向量;匹配模块,用于分别计算所述多个校正后候选人语义特征向量与所述上下文词语义特征向量之间的转移矩阵以得到多个分类特征矩阵;适配度生成模块,用于将所述多个分类特征矩阵通过分类器以得到多个概率值;以及,优先级确定模块,用于基于所述多个概率值之间的排序,确定所述多个候选人的优先级排序。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
示例性系统
图1为根据本申请实施例的基于web环境下办公系统流程分析系统的框图。如图1所示,根据本申请实施例的基于web环境下办公系统流程分析系统100,包括:上一流程节点数据获取模块110,用于获取上一流程节点的业务描述和目标流转方向;词嵌入模块120,用于将所述上一流程节点的业务描述进行分词处理后通过词嵌入层以得到词特征向量的序列;业务描述语义理解模块130,用于将所述词特征向量的序列通过基于转换器的第一上下文编码器以得到上下文词语义特征向量;候选人信息提取模块140,用于基于所述目标流转方向,确定逐级处理流程中与所述目标流转方向相匹配的下一流程节点以及获取可处理所述下一流程节点的多个候选人信息;候选人语义理解模块150,用于将所述多个候选人信息通过包含词嵌入层的第二上下文编码器以得到多个候选人语义特征向量;特征聚合度优化模块160,用于对所述多个候选人语义特征向量进行特征聚合度优化以得到多个校正后候选人语义特征向量;匹配模块170,用于分别计算所述多个校正后候选人语义特征向量与所述上下文词语义特征向量之间的转移矩阵以得到多个分类特征矩阵;适配度生成模块180,用于将所述多个分类特征矩阵通过分类器以得到多个概率值;以及,优先级确定模块190,用于基于所述多个概率值之间的排序,确定所述多个候选人的优先级排序。
图2为根据本申请实施例的基于web环境下办公系统流程分析系统的架构示意图。如图2所示,首先,获取上一流程节点的业务描述和目标流转方向;接着,将所述上一流程节点的业务描述进行分词处理后通过词嵌入层以得到词特征向量的序列;然后,将所述词特征向量的序列通过基于转换器的第一上下文编码器以得到上下文词语义特征向量,同时,基于所述目标流转方向,确定逐级处理流程中与所述目标流转方向相匹配的下一流程节点以及获取可处理所述下一流程节点的多个候选人信息;继而,将所述多个候选人信息通过包含词嵌入层的第二上下文编码器以得到多个候选人语义特征向量;接着,对所述多个候选人语义特征向量进行特征聚合度优化以得到多个校正后候选人语义特征向量;然后,分别计算所述多个校正后候选人语义特征向量与所述上下文词语义特征向量之间的转移矩阵以得到多个分类特征矩阵;继而,将所述多个分类特征矩阵通过分类器以得到多个概率值,并基于所述多个概率值之间的排序,确定所述多个候选人的优先级排序。
如上所述,在事务的逐级处理流程中,通常都会涉及到用户需要选择下一流程的处理人,如何使得用户可以高效选中处理人,同时避免多选处理人,是现有技术亟待解决的问题。
在本申请的技术方案中,可从目标流转方向确定逐级处理流程中与所述目标流转方向相匹配的下一流程节点,并获取可处理所述下一流程节点的多个候选人信息。并基于多个候选人信息与上一流程节点的业务描述之间的适配度来给所述多个候选人进行优先级排序,从而通过数据智能手段来辅助高效选中处理人。
在上述基于web环境下办公系统流程分析系统100中,所述上一流程节点数据获取模块110和所述词嵌入模块120,用于获取上一流程节点的业务描述和目标流转方向,并将所述上一流程节点的业务描述进行分词处理后通过词嵌入层以得到词特征向量的序列。也就是,在得到所述上一流程节点的业务描述后,首先对其进行分词处理以将所述上一流程节点的业务描述转化为离散的词序列;然后,使用所述词嵌入层将所述词序列转化为词特征向量的序列,也就是,通过词嵌入将非结构化的文本数据转化为结构化的向量序列。应可以理解,结构化的数据便于计算机进行运算。
在上述基于web环境下办公系统流程分析系统100中,所述业务描述语义理解模块130,用于将所述词特征向量的序列通过基于转换器的第一上下文编码器以得到上下文词语义特征向量。也就是,使用语义编码器对所述上一流程节点的业务描述进行上下文语义理解以得到所述上下文词语义特征向量。在本申请的一个具体示例中,所述基于转换器的第一上下文编码器可以是基于转换器的Bert模型。也就是,在本申请的技术方案中,使用所述基于转换器的Bert模型对所述词特征向量的序列进行基于全局的上下文语义编码以得到所述上下文词语义特征向量。
具体地,在本申请实施例中,所述业务描述语义理解模块130,包括:第一上下文编码单元,用于将所述词特征向量的序列输入所述基于转换器的第一上下文编码器以得到所述多个词语义特征向量;以及,第一级联单元,用于将所述多个词语义特征向量进行级联以得到所述上下文词语义特征向量。
更具体地,在本申请实施例中,所述第一上下文编码单元,进一步用于:将所述词特征向量的序列排列为输入向量;将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及,将所述自注意力特征矩阵与以所述词特征向量的序列中各个词特征向量作为值向量分别进行相乘以得到所述多个词语义特征向量。
在上述基于web环境下办公系统流程分析系统100中,所述候选人信息提取模块140,用于基于所述目标流转方向,确定逐级处理流程中与所述目标流转方向相匹配的下一流程节点以及获取可处理所述下一流程节点的多个候选人信息。这里,逐级处理流程为已有资料,根据不同办公环境,处理流程可以有所不同,在此,并不为本申请所局限。
在上述基于web环境下办公系统流程分析系统100中,所述候选人语义理解模块150,用于将所述多个候选人信息通过包含词嵌入层的第二上下文编码器以得到多个候选人语义特征向量。也就是,对所述多个候选人信息进行基于全局的上下文语义编码以捕捉所述多个候选人信息间的高维语义关联信息。在本申请的一个示例中,所述包含词嵌入层的第二上下文编码器包括嵌入层和基于转换器(Transformer)的Bert模型。
具体地,在本申请实施例中,所述候选人语义理解模块150,包括:词嵌入单元,用于将所述多个候选人信息通过嵌入层以将所述多个候选人信息中各个候选人信息转化为候选人信息嵌入向量以得到候选人信息嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个候选人信息进行嵌入编码;以及,第二上下文编码单元,用于将所述候选人信息嵌入向量的序列输入所述包含词嵌入层的第二上下文编码器以得到所述多个候选人语义特征向量。
在上述基于web环境下办公系统流程分析系统100中,所述特征聚合度优化模块160,用于对所述多个候选人语义特征向量进行特征聚合度优化以得到多个校正后候选人语义特征向量。特别地,在本申请的技术方案中,通过计算各个候选人的所述候选人语义特征向量与所述上下文词语义特征向量之间的转移矩阵以得到多个分类特征矩阵,这里,所述分类特征矩阵分别用于表示上一流程节点的业务描述的语义特征与各个候选人信息的语义特征之间的适配度特征表达。但是,因所述多个候选人语义特征向量为通过所述包含词嵌入层的第二上下文编码器进行整体的上下文编码得到,虽然所述多个候选人语义特征向量之间具有相对较佳的长距离依赖,但由于所述包含词嵌入层的第二上下文编码器进行的编码特性,会导致所述多个候选人语义特征向量之间的特征间局部分布差异无法得到充分表达,进而在分别计算所述多个候选人语义特征向量与所述上下文词语义特征向量之间的转移矩阵以得到所述多个分类特征矩阵的过程中,所述多个分类特征矩阵间的特征间局部分布差异无法得到充分得到,这会影响后续将所述多个分类特征矩阵通过分类器得到的多个概率值之间的差异性,进而导致优先级排序产生不良影响。
针对上述问题,在本申请的技术方案中,因此,考虑到如果将所述多个候选人语义特征向量中的每个候选人语义特征向量视为单个节点,则通过节点之间的距离表示,可以基于节点整体的拓扑结构确定节点之间的类概率特征聚合度,由此,计算每个候选人语义特征向量对应的节点间类概率匹配特征向量,表示为:
Figure SMS_8
其中,Vi是所述各个候选人语义特征向量,Vj是所述多个候选人语义特征向量中与所述候选人语义特征向量Vi之间的距离,即d(Vi,Vj)小于预定阈值,即ε的候选人语义特征向量,α为加权超参数,V'i是所述各个校正后候选人语义特征向量,exp(·)表示数值的指数运算,所述数值的指数运算表示以数值为幂的自然指数函数值。
也就是,如果将Vi作为拓扑结构的节点,则Vj可以被认为是在拓扑结构内部与所述节点Vi相连的节点,即i→j∈E,表示节点i与节点j之间具有边。这样,通过计算节点间类概率匹配特征向量,可以确定拓扑结构内的节点与相邻节点之间在类概率下的交互度,就可以提升多节点组成的拓扑结构内部的各个节点间的类概率特征聚合度,相当于在基于内部特征交互的特征聚合维度上对于节点特征施加注意力机制,从而提升所述多个候选人语义特征向量的各个候选人语义特征向量之间的特征聚合度,也就是,优化所述多个候选人语义特征向量间的特征差异化表达。
在上述基于web环境下办公系统流程分析系统100中,所述匹配模块170,用于分别计算所述多个校正后候选人语义特征向量与所述上下文词语义特征向量之间的转移矩阵以得到多个分类特征矩阵。也就是,以所述校正后候选人语义特征向量与所述上下文词语义特征向量之间的转移矩阵来在高维特征空间中表示两者之间的适配表达。
具体地,在本申请实施例中,所述匹配模块170,进一步用于:以如下公式分别计算所述多个校正后候选人语义特征向量与所述上下文词语义特征向量之间的转移矩阵以得到多个分类特征矩阵;其中,所述公式为:
Figure SMS_9
其中Va表示所述校正后候选人语义特征向量,Vb表示所述上下文词语义特征向量,M表示所述转移矩阵,
Figure SMS_10
表示矩阵相乘。
在上述基于web环境下办公系统流程分析系统100中,所述适配度生成模块180,用于将所述多个分类特征矩阵通过分类器以得到多个概率值。也就是,使用所述分类器来确定各个所述分类特征矩阵属于最高优先级的概率值。
图4为根据本申请实施例的基于web环境下办公系统流程分析方法的流程图。如图4所示,所述适配度生成模块180,包括:展开单元181,用于将所述多个分类特征矩阵中各个分类特征矩阵按照行向量或者列向量展开为分类特征向量以得到多个分类特征向量;全连接编码单元182,用于使用所述分类器的全连接层分别对所述多个分类特征向量进行全连接编码以得到多个编码分类特征向量;以及,分类结果生成单元183,用于将所述多个编码分类特征向量输入所述分类器的Softmax分类函数以得到所述多个概率值。
在上述基于web环境下办公系统流程分析系统100中,所述优先级确定模块190,用于基于所述多个概率值之间的排序,确定所述多个候选人的优先级排序。这样,从目标流转方向确定逐级处理流程中与所述目标流转方向相匹配的下一流程节点,并获取可处理所述下一流程节点的多个候选人信息。并基于多个候选人信息与上一流程节点的业务描述之间的适配度来给所述多个候选人进行优先级排序,从而通过数据智能手段来辅助高效选中处理人。
综上,基于本申请实施例的基于web环境下办公系统流程分析系统100被阐明,其从目标流转方向确定逐级处理流程中与所述目标流转方向相匹配的下一流程节点,并获取可处理所述下一流程节点的多个候选人信息,从而基于多个候选人信息与上一流程节点的业务描述之间的适配度来给所述多个候选人进行优先级排序,这样,通过数据智能手段来辅助高效选中处理人。
如上所述,根据本申请实施例的基于web环境下办公系统流程分析系统100可以实现在各种终端设备中,例如用于基于web环境下办公系统流程分析的服务器等。在一个示例中,根据本申请实施例的基于web环境下办公系统流程分析系统100可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该基于web环境下办公系统流程分析系统100可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该基于web环境下办公系统流程分析系统100同样可以是该终端设备的众多硬件模块之一。
替换地,在另一示例中,该基于web环境下办公系统流程分析系统100与该终端设备也可以是分立的设备,并且该基于web环境下办公系统流程分析系统100可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
示例性方法
图4为根据本申请实施例的基于web环境下办公系统流程分析方法的流程图。如图4所示,根据本申请实施例的基于web环境下办公系统流程分析方法,包括:S110,获取上一流程节点的业务描述和目标流转方向;S120,将所述上一流程节点的业务描述进行分词处理后通过词嵌入层以得到词特征向量的序列;S130,将所述词特征向量的序列通过基于转换器的第一上下文编码器以得到上下文词语义特征向量;S140,基于所述目标流转方向,确定逐级处理流程中与所述目标流转方向相匹配的下一流程节点以及获取可处理所述下一流程节点的多个候选人信息;S150,将所述多个候选人信息通过包含词嵌入层的第二上下文编码器以得到多个候选人语义特征向量;S160,对所述多个候选人语义特征向量进行特征聚合度优化以得到多个校正后候选人语义特征向量;S170,分别计算所述多个校正后候选人语义特征向量与所述上下文词语义特征向量之间的转移矩阵以得到多个分类特征矩阵;S180,将所述多个分类特征矩阵通过分类器以得到多个概率值;以及,S190,基于所述多个概率值之间的排序,确定所述多个候选人的优先级排序。
在一个示例中,在上述基于web环境下办公系统流程分析方法中,所述将所述词特征向量的序列通过基于转换器的第一上下文编码器以得到上下文词语义特征向量,包括:将所述词特征向量的序列输入所述基于转换器的第一上下文编码器以得到所述多个词语义特征向量;以及,将所述多个词语义特征向量进行级联以得到所述上下文词语义特征向量。
在一个示例中,在上述基于web环境下办公系统流程分析方法中,所述将所述词特征向量的序列输入所述基于转换器的第一上下文编码器以得到所述多个词语义特征向量,包括:将所述词特征向量的序列排列为输入向量;将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及,将所述自注意力特征矩阵与以所述词特征向量的序列中各个词特征向量作为值向量分别进行相乘以得到所述多个词语义特征向量。
在一个示例中,在上述基于web环境下办公系统流程分析方法中,所述将所述多个候选人信息通过包含词嵌入层的第二上下文编码器以得到多个候选人语义特征向量,包括:将所述多个候选人信息通过嵌入层以将所述多个候选人信息中各个候选人信息转化为候选人信息嵌入向量以得到候选人信息嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个候选人信息进行嵌入编码;以及,将所述候选人信息嵌入向量的序列输入所述包含词嵌入层的第二上下文编码器以得到所述多个候选人语义特征向量。
在一个示例中,在上述基于web环境下办公系统流程分析方法中,所述对所述多个候选人语义特征向量进行特征聚合度优化以得到多个校正后候选人语义特征向量,包括:以如下公式对所述多个候选人语义特征向量进行特征聚合度优化以得到多个校正后候选人语义特征向量;其中,所述公式为:
Figure SMS_11
其中,Vi是所述各个候选人语义特征向量,Vj是所述多个候选人语义特征向量中与所述候选人语义特征向量Vi之间的距离,即d(Vi,Vj)小于预定阈值,即ε的候选人语义特征向量,α为加权超参数,V'i是所述各个校正后候选人语义特征向量,exp(·)表示数值的指数运算,所述数值的指数运算表示以数值为幂的自然指数函数值。
在一个示例中,在上述基于web环境下办公系统流程分析方法中,所述分别计算所述多个校正后候选人语义特征向量与所述上下文词语义特征向量之间的转移矩阵以得到多个分类特征矩阵,包括:以如下公式分别计算所述多个校正后候选人语义特征向量与所述上下文词语义特征向量之间的转移矩阵以得到多个分类特征矩阵;其中,所述公式为:
Figure SMS_12
其中Va表示所述校正后候选人语义特征向量,Vb表示所述上下文词语义特征向量,M表示所述转移矩阵,
Figure SMS_13
表示矩阵相乘。
在一个示例中,在上述基于web环境下办公系统流程分析方法中,所述将所述多个分类特征矩阵通过分类器以得到多个概率值,包括:将所述多个分类特征矩阵中各个分类特征矩阵按照行向量或者列向量展开为分类特征向量以得到多个分类特征向量;使用所述分类器的全连接层分别对所述多个分类特征向量进行全连接编码以得到多个编码分类特征向量;以及,将所述多个编码分类特征向量输入所述分类器的Softmax分类函数以得到所述多个概率值。
综上,本申请实施例的基于web环境下办公系统流程分析方法被阐明,其从目标流转方向确定逐级处理流程中与所述目标流转方向相匹配的下一流程节点,并获取可处理所述下一流程节点的多个候选人信息,从而基于多个候选人信息与上一流程节点的业务描述之间的适配度来给所述多个候选人进行优先级排序,这样,通过数据智能手段来辅助高效选中处理人。
示例性电子设备
下面,参考图5来描述根据本申请实施例的电子设备。图5为根据本申请实施例的电子设备的框图。如图5所示,电子设备10包括一个或多个处理器11和存储器12。
处理器11可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备10中的其他组件以执行期望的功能。
存储器12可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器11可以运行所述程序指令,以实现上文所述的本申请的各个实施例的基于web环境下办公系统流程分析方法中的功能以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如上一流程节点的业务描述和目标流转方向等各种内容。
在一个示例中,电子设备10还可以包括:输入装置13和输出装置14,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
该输入装置13可以包括例如键盘、鼠标等等。
该输出装置14可以向外部输出各种信息,包括优先级排序等。该输出装置14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图5中仅示出了该电子设备10中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备10还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的基于web环境下办公系统流程分析方法中的功能中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的基于web环境下办公系统流程分析方法中的功能中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (10)

1.一种基于web环境下办公系统流程分析系统,其特征在于,包括:
上一流程节点数据获取模块,用于获取上一流程节点的业务描述和目标流转方向;
词嵌入模块,用于将所述上一流程节点的业务描述进行分词处理后通过词嵌入层以得到词特征向量的序列;
业务描述语义理解模块,用于将所述词特征向量的序列通过基于转换器的第一上下文编码器以得到上下文词语义特征向量;
候选人信息提取模块,用于基于所述目标流转方向,确定逐级处理流程中与所述目标流转方向相匹配的下一流程节点以及获取可处理所述下一流程节点的多个候选人信息;
候选人语义理解模块,用于将所述多个候选人信息通过包含词嵌入层的第二上下文编码器以得到多个候选人语义特征向量;
特征聚合度优化模块,用于对所述多个候选人语义特征向量进行特征聚合度优化以得到多个校正后候选人语义特征向量;
匹配模块,用于分别计算所述多个校正后候选人语义特征向量与所述上下文词语义特征向量之间的转移矩阵以得到多个分类特征矩阵;
适配度生成模块,用于将所述多个分类特征矩阵通过分类器以得到多个概率值;以及
优先级确定模块,用于基于所述多个概率值之间的排序,确定所述多个候选人的优先级排序。
2.根据权利要求1所述的基于web环境下办公系统流程分析系统,其特征在于,所述业务描述语义理解模块,包括:
第一上下文编码单元,用于将所述词特征向量的序列输入所述基于转换器的第一上下文编码器以得到所述多个词语义特征向量;以及
第一级联单元,用于将所述多个词语义特征向量进行级联以得到所述上下文词语义特征向量。
3.根据权利要求2所述的基于web环境下办公系统流程分析系统,其特征在于,所述第一上下文编码单元,进一步用于:
将所述词特征向量的序列排列为输入向量;
将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;
计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;
对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;
将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及
将所述自注意力特征矩阵与以所述词特征向量的序列中各个词特征向量作为值向量分别进行相乘以得到所述多个词语义特征向量。
4.根据权利要求3所述的基于web环境下办公系统流程分析系统,其特征在于,所述候选人语义理解模块,包括:
词嵌入单元,用于将所述多个候选人信息通过嵌入层以将所述多个候选人信息中各个候选人信息转化为候选人信息嵌入向量以得到候选人信息嵌入向量的序列,其中,所述嵌入层使用可学习的嵌入矩阵对所述各个候选人信息进行嵌入编码;以及
第二上下文编码单元,用于将所述候选人信息嵌入向量的序列输入所述包含词嵌入层的第二上下文编码器以得到所述多个候选人语义特征向量。
5.根据权利要求4所述的基于web环境下办公系统流程分析系统,其特征在于,所述特征聚合度优化模块,进一步用于:
以如下公式对所述多个候选人语义特征向量进行特征聚合度优化以得到多个校正后候选人语义特征向量;
其中,所述公式为:
Figure FDA0004086270020000021
其中,Vi是所述各个候选人语义特征向量,Vj是所述多个候选人语义特征向量中与所述候选人语义特征向量Vi之间的距离,即d(Vi,Vj)小于预定阈值,即ε的候选人语义特征向量,α为加权超参数,V'i是所述各个校正后候选人语义特征向量,exp(·)表示数值的指数运算,所述数值的指数运算表示以数值为幂的自然指数函数值。
6.根据权利要求5所述的基于web环境下办公系统流程分析系统,其特征在于,所述匹配模块,进一步用于:
以如下公式分别计算所述多个校正后候选人语义特征向量与所述上下文词语义特征向量之间的转移矩阵以得到多个分类特征矩阵;
其中,所述公式为:
Figure FDA0004086270020000031
其中Va表示所述校正后候选人语义特征向量,Vb表示所述上下文词语义特征向量,M表示所述转移矩阵,
Figure FDA0004086270020000032
表示矩阵相乘。
7.根据权利要求6所述的基于web环境下办公系统流程分析系统,其特征在于,所述适配度生成模块,包括:
展开单元,用于将所述多个分类特征矩阵中各个分类特征矩阵按照行向量或者列向量展开为分类特征向量以得到多个分类特征向量;
全连接编码单元,用于使用所述分类器的全连接层分别对所述多个分类特征向量进行全连接编码以得到多个编码分类特征向量;以及
分类结果生成单元,用于将所述多个编码分类特征向量输入所述分类器的Softmax分类函数以得到所述多个概率值。
8.一种基于web环境下办公系统流程分析方法,其特征在于,包括:
获取上一流程节点的业务描述和目标流转方向;
将所述上一流程节点的业务描述进行分词处理后通过词嵌入层以得到词特征向量的序列;
将所述词特征向量的序列通过基于转换器的第一上下文编码器以得到上下文词语义特征向量;
基于所述目标流转方向,确定逐级处理流程中与所述目标流转方向相匹配的下一流程节点以及获取可处理所述下一流程节点的多个候选人信息;
将所述多个候选人信息通过包含词嵌入层的第二上下文编码器以得到多个候选人语义特征向量;
对所述多个候选人语义特征向量进行特征聚合度优化以得到多个校正后候选人语义特征向量;
分别计算所述多个校正后候选人语义特征向量与所述上下文词语义特征向量之间的转移矩阵以得到多个分类特征矩阵;
将所述多个分类特征矩阵通过分类器以得到多个概率值;以及
基于所述多个概率值之间的排序,确定所述多个候选人的优先级排序。
9.根据权利要求8所述的基于web环境下办公系统流程分析方法,其特征在于,所述将所述词特征向量的序列通过基于转换器的第一上下文编码器以得到上下文词语义特征向量,包括:
将所述词特征向量的序列输入所述基于转换器的第一上下文编码器以得到所述多个词语义特征向量;以及
将所述多个词语义特征向量进行级联以得到所述上下文词语义特征向量。
10.根据权利要求9所述的基于web环境下办公系统流程分析方法,其特征在于,所述将所述词特征向量的序列输入所述基于转换器的第一上下文编码器以得到所述多个词语义特征向量,包括:
将所述词特征向量的序列排列为输入向量;
将所述输入向量通过可学习嵌入矩阵分别转化为查询向量和关键向量;
计算所述查询向量和所述关键向量的转置向量之间的乘积以得到自注意关联矩阵;
对所述自注意关联矩阵进行标准化处理以得到标准化自注意关联矩阵;
将所述标准化自注意关联矩阵输入Softmax激活函数进行激活以得到自注意力特征矩阵;以及
将所述自注意力特征矩阵与以所述词特征向量的序列中各个词特征向量作为值向量分别进行相乘以得到所述多个词语义特征向量。
CN202310137070.0A 2023-02-20 2023-02-20 一种web环境下办公系统流程分析系统及其方法 Pending CN116151604A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310137070.0A CN116151604A (zh) 2023-02-20 2023-02-20 一种web环境下办公系统流程分析系统及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310137070.0A CN116151604A (zh) 2023-02-20 2023-02-20 一种web环境下办公系统流程分析系统及其方法

Publications (1)

Publication Number Publication Date
CN116151604A true CN116151604A (zh) 2023-05-23

Family

ID=86352305

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310137070.0A Pending CN116151604A (zh) 2023-02-20 2023-02-20 一种web环境下办公系统流程分析系统及其方法

Country Status (1)

Country Link
CN (1) CN116151604A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117132218A (zh) * 2023-07-17 2023-11-28 杭州逍邦网络科技有限公司 工作流管理系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117132218A (zh) * 2023-07-17 2023-11-28 杭州逍邦网络科技有限公司 工作流管理系统
CN117132218B (zh) * 2023-07-17 2024-03-19 杭州逍邦网络科技有限公司 工作流管理系统

Similar Documents

Publication Publication Date Title
CN108959246B (zh) 基于改进的注意力机制的答案选择方法、装置和电子设备
CN115796173B (zh) 针对监管报送需求的数据处理方法和系统
CN114647198A (zh) 基于物联网的智能家居控制方法、系统和电子设备
CN115759658B (zh) 适用于智慧城市的企业能耗数据管理系统
CN115783923B (zh) 基于大数据的电梯故障模式识别系统
CN111105029A (zh) 神经网络的生成方法、生成装置和电子设备
CN115994177B (zh) 基于数据湖的知识产权管理方法及其系统
CN115373813A (zh) 云计算环境中基于gpu虚拟化的调度方法、系统和电子设备
CN116257406A (zh) 用于智慧城市的网关数据管理方法及其系统
CN116028098A (zh) 用于非标企业的软件管理系统及方法
CN116579618B (zh) 基于风险管理的数据处理方法、装置、设备及存储介质
CN116307624A (zh) 一种erp系统的资源调度方法及其系统
CN116151604A (zh) 一种web环境下办公系统流程分析系统及其方法
CN116151845A (zh) 基于工业物联网技术的产品全生命周期管理系统及其方法
CN115878330A (zh) 线程的运行控制方法及其系统
CN114884772A (zh) 裸机vxlan的部署方法、系统和电子设备
JP2022003544A (ja) 業界テキスト増分方法、関連装置、およびコンピュータプログラム製品
CN116629211B (zh) 基于人工智能的写作方法及系统
CN115827856B (zh) 一种基于计算机的军工领域消息的传递方法
CN114726870B (zh) 基于可视化拖拽的混合云资源编排方法、系统和电子设备
CN113485829B (zh) 用于微服务集群的数据增量步段的标识值生成方法
KR20230065017A (ko) 인공지능 분석 기반 프로그램 소스코드의 요약문 생성 장치 및 방법
CN113722475A (zh) 基于云存储的文件操作方法、系统和电子设备
CN112800217A (zh) 基于向量关联性矩阵的政务事务处理报告的智能评估方法
CN115994668B (zh) 智慧社区资源管理系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination