CN117436815A - 基于自然语言大模型的流程智能审批方法 - Google Patents
基于自然语言大模型的流程智能审批方法 Download PDFInfo
- Publication number
- CN117436815A CN117436815A CN202311535118.XA CN202311535118A CN117436815A CN 117436815 A CN117436815 A CN 117436815A CN 202311535118 A CN202311535118 A CN 202311535118A CN 117436815 A CN117436815 A CN 117436815A
- Authority
- CN
- China
- Prior art keywords
- approval
- natural language
- data
- analysis module
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 146
- 238000007405 data analysis Methods 0.000 claims abstract description 67
- 238000005457 optimization Methods 0.000 claims abstract description 37
- 238000004364 calculation method Methods 0.000 claims abstract description 7
- 238000013075 data extraction Methods 0.000 claims abstract description 6
- 238000011156 evaluation Methods 0.000 claims description 32
- 238000012797 qualification Methods 0.000 claims description 25
- 238000004140 cleaning Methods 0.000 claims description 11
- 239000013589 supplement Substances 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 5
- 238000012549 training Methods 0.000 abstract description 7
- 238000004458 analytical method Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000010923 batch production Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005111 flow chemistry technique Methods 0.000 description 1
- 239000003999 initiator Substances 0.000 description 1
- 238000004886 process control Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Marketing (AREA)
- Evolutionary Biology (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Life Sciences & Earth Sciences (AREA)
- Operations Research (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及流程审批技术领域,尤其涉及基于自然语言大模型的流程智能审批方法,该方法包括模板数据库、自然语言大模型、数据获取模块、数据分析模块和数据执行模块,所述模板数据库用以存储检索到的审批模板,所述自然语言大模型经过训练后可以根据识别后的文本获取模板数据库里相似的文本,所述数据获取模块包括用以接收申请信息的数据接收单元和用以提取所述申请信息关键词的数据提取单元,所述数据分析模块包括用以计算数据的数据计算单元,所述数据执行模块用以执行自然语言大模型和优化方式的开启;本发明使用经过训练后的自然语言大模型对待审批流程文本进行匹配,针对匹配得到的文本进行审批优化,提高了审批流程的精确性和智能性。
Description
技术领域
本发明涉及流程审批技术领域,尤其涉及基于自然语言大模型的智能流程审批方法。
背景技术
随着信息化技术的发展,越来越多的企业都采用办公系统处理工作,现有的办公系统对流程的审批还不够智能,经常出现流程审批错误导致申请人收到错误的审批结果甚至收不到审批结果,针对这种情况常常需要人工来介入,缺乏精确性和智能性。
中国专利公开号:CN105719104B公开了一种智能审批的方法及装置,包括:预设至少一个审批类型、与所述审批类型对应的场景类别,以及与所述场景类别对应的场景信息和审批决策信息;采集审批流程的状态信息,所述状态信息是与所述审批流程相关的信息;将所述状态信息与所述审批流程对应的审批类型对应的场景类别中的场景信息进行匹配;当所述状态信息与所述场景类别中的场景信息相匹配时,根据与所述场景类别对应的审批决策信息进行自动审批;根据与所述场景类别对应的审批决策信息进行自动审批包括:当所述审批决策信息的类型为同意审批类型时,则同意所述审批流程,并将同意所述审批流程的审批结果和审批后的所述审批流程发送给预先定义的下一个审批节点;当所述审批决策信息为不同意审批类型时,则不同意所述审批流程,并将所述审批结果返回给发送所述审批流程的流程发起人;当所述审批决策信息为沟通审批类型时,则不对所述审批流程进行审批;当所述状态信息与所述场景类别中的场景信息不匹配时,所述智能审批的方法还包括:增加场景类别,作为新增场景类别,其中,将所述状态信息作为与所述新增场景类别对应的场景信息,以及将与所述状态信息相似度最高的场景信息对应的场景类别对应的审批决策信息作为与所述新增场景类别对应的审批决策信息;根据与所述新增场景类别对应的审批决策信息进行自动审批。
由此可见,现有技术存在在审批过程中对流程种类判断准确程度不足,对审批过程控制的精确程度低,从而导致审批流程智能化程度低的问题。
发明内容
为此,本发明提供基于自然语言大模型的流程智能审批方法,用以克服现有技术中在审批过程中对流程种类判断准确程度不足,对审批过程控制的精确程度低,从而导致审批流程智能化程度低的问题。
为实现上述目的,基于自然语言大模型的流程智能审批方法,包括:
数据获取模块的数据接收单元获取待审批流程的申请信息;
数据获取模块的数据提取单元将初步认证完成的所述申请信息进行关键词提取;
数据分析模块根据提取的所述关键词初步确定待审批流程的关联种类数量;
数据分析模块根据所述待审批流程的关联种类数量确定针对待审批流程的申请信息的识别;
数据分析模块对待审批流程的申请信息识别并根据识别结果的准确程度评价值与预设准确程度评价值的比对结果确定执行所述流程审批的执行模式;
数据分析模块根据自然语言大模型匹配到的不合格的模板种类数量和历史审批合格率确定对审批过程的优化。
进一步地,所述确定对所述待审批流程的申请信息的识别包括所述数据分析模块确定以第一识别方式进行申请信息识别,所述第一识别方式包括以申请信息中的符号为节点对申请信息的语句进行分割进而得到识别后的文字,对所述文字去重和清洗得到待审批流程文本。
进一步地,所述确定对所述待审批流程的申请信息的识别包括所述数据分析模块以第二识别方式进行申请信息识别,所述第二识别方式包括以申请信息中的停用词为节点对申请信息的语句进行分割进而得到识别后的文字,对所述文字去重和清洗得到待审批流程文本。
进一步地,当所述数据分析模块根据准确程度评价值与预设准确程度评价值的比对结果确定执行所述流程审批的执行模式时,在准确程度评价值大于等于预设准确程度评价值条件下以第一执行模式执行审批,或在准确程度评价值小于预设准确程度评价值条件下确定以第二执行模式执行审批。
进一步地,所述以第一执行模式执行审批包括所述数据分析模块将所述自然语言大模型的识别结果与审批模板进行匹配,所述数据分析模块根据识别结果与审批模板的匹配度确定是否开启优化,并在所述匹配度小于所述预设匹配度或所述匹配度大于等于所述预设匹配度且审批模板不唯一条件下,数据执行模块开启对审批过程的优化。
进一步地,所述以第二执行模式执行审批包括所述数据分析模块将所述待审批流程文本输入至所述自然语言大模型进行审批流程的语义识别,将识别结果中的审批模板与所述关键词对应的若干审批模板进行比对以确定是否存在相同审批模板且审批模板唯一,并在审批模板不唯一条件下,所述数据执行模块开启对审批过程的优化。
进一步地,当所述数据分析模块根据所述自然语言大模型匹配的不合格模板的种类数量与预设种类数量的比对结果确定对审批过程的优化时,在不合格模板的种类数量大于等于预设种类数量条件下以第一优化方式对审批过程优化,或在不合格模板的种类数量小于预设种类数量条件下以第二优化方式对审批过程优化。
进一步地,所述以第一优化方式对审批过程优化包括所述数据执行模块执行降低所述自然语言大模型对所述识别后的文字去重和清洗的比例。
进一步地,所述以第二优化方式对审批过程优化包括所述数据分析模块的数据计算单元计算历史审批流程文本与该待审批流程文本的余弦相似度,所述数据分析模块将所述余弦相似度与预设余弦相似度对比进而选择合适的相似文本中的文字按照语义添加至待审批流程文本以进行待审批流程的文本补充。
进一步地,所述根据历史审批合格率确定对审批过程的优化包括所述数据分析模块在所述历史审批合格率小于预设合格率条件下,通过调整系数对所述待预设余弦相似度进行调整。
与现有技术相比,本发明的有益效果在于,本发明通过对申请信息的初步分析确定申请人的个人信息,所述数据分析模块判断申请人是否对正确的上级负责人提交了申请信息,避免了申请人因将申请信息提交给错误的对象而得不到审批结果进而保证了审批流程的精确性,从而提高了审批过程的智能化程度性。
进一步地,本发明通过对申请信息的初步分析确定申请人的个人信息,所述数据分析模块判断申请人是否对正确的上级负责人提交了申请信息,避免了申请人因将申请信息提交给错误的对象而得不到审批结果进而保证了审批流程的精确性,从而提高了审批过程的智能化程度性。
进一步地,本发明将所述待审批流程文本输入至自然语言大模型中进行匹配,通过增加匹配度来确定相似文件,提高了对审批流程种类判断的精确性,同时根据匹配度与预设匹配度进行比对来确定是否进行优化,通过上述方法进一步提高了审批流程中控制的精确性。
进一步地,本发明通过增加优化方式对所述审批不合格情况下的所述待审批流程文本进行优化,避免因审批不合格导致所述待审批流程文本搁置以至于不能将申请结果告知申请人的情况发生,通过上述方法实时控制审批流程的过程,进一步提高了审批流程的智能性和灵活性。
进一步地,本发明通过确定审批不合格时的模板种类数量,并且,增加一个基于自然语言大模型的评估结果得到的预设种类数量,进而,将不合格时的模板种类数量与预设种类数量进行比对来确定优化方式,提高了审批流程中控制的精确性进而提升了审批流程的智能性。
进一步地,本发明在第一优化方式对待审批文本进行优化时,对识别后的文字进行去重过程的阈值进行调整,进而增加文本串的数量以降低去重和清洗的比例,提高文本的完整性,通过上述方法来提升匹配精度以使自然语言大模型更精准地匹配到相似文件,提高了对审批流程种类判断的精准性。
进一步地,本发明通过所述数据计算单元计算相似度进而从所述历史审批流程文本中筛选出所述待审批文本的相似文本,数据执行模块将符合条件的相似文本按照语义添加至待审批流程文本以对待审批文本进行补充,从而提高了审批过程的智能性与精确性。
进一步地,本发明通过数据分析模块获取历史审批合格结果确定历史审批合格率,并且,将历史审批合格率与预设合格率进行比对,进而,数据分析模块通过比对结果确定是否对预设余弦相似度调整以对整个审批过程进行优化,通过上述方法,动态调整了审批过程中的精确性,从而提高了审批流程的精确性和智能性。
附图说明
图1为本发明实施例基于自然语言大模型的流程智能审批方法的流程图;
图2为本发明实施例基于自然语言大模型的流程智能审批方法的逻辑框图。
图3为本发明实施例基于自然语言大模型的流程智能审批方法的数据获取模块结构示意图。
具体实施方式
为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
需要说明的是,在本发明的描述中,术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系,这仅仅是为了便于描述,而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,还需要说明的是,在本发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可根据具体情况理解上述术语在本发明中的具体含义。
本发明实施例基于自然语言大模型的智能流程审批方法,包括:
步骤S1、数据获取模块的数据接收单元获取待审批流程的申请信息;
步骤S2、数据获取模块的数据提取单元将初步认证完成的所述申请信息进行关键词提取;
步骤S3、数据分析模块根据提取的所述关键词初步确定待审批流程的关联种类数量;
步骤S4、数据分析模块根据所述待审批流程的关联种类数量确定针对待审批流程的申请信息的识别;
步骤S5、数据分析模块按照相应的识别方式对待审批流程的申请信息识别并根据识别结果准确程度评价值与预设准确程度评价值的比对结果确定执行所述流程审批的执行模式;
步骤S6、数据分析模块根据自然语言大模型匹配到的不合格的文本种类数量与预设种类数量的比对结果确定审批过程的优化。
本发明实施例中,所述申请信息包括申请人的个人信息、申请时间和申请内容,所述初步认证包括当所述数据接收单元接收到申请人发起的申请信息时,所述数据分析模块对申请人进行认证。
具体而言,本发明通过对申请信息的初步分析确定申请人的个人信息,所述数据分析模块判断申请人是否对正确的上级负责人提交了申请信息,避免了申请人因将申请信息提交给错误的对象而得不到审批结果进而保证了审批流程的精确性,从而提高了审批过程的智能化程度性。
具体而言,所述数据提取单元对所述申请信息进行关键词提取,其中关键词包括但不限于“请假”、“出差”、“报销”或“合同审核”;所述数据分析模块根据所述关键词初步确定待审批流程的关联种类数量。
具体而言,当确定针对待审批流程的申请信息的识别方式时,所述数据分析模块根据待审批流程的关联种类数量确定对所述申请信息的识别方式;
当所述待审批流程的关联种类数量大于预设关联种类数量时,所述数据分析模块确定以第一识别方式进行申请信息识别;
当所述待审批流程的关联种类数量小于等于预设关联种类数量时,所述数据分析模块以第二识别方式进行申请信息识别;
其中,所述第一识别方式包括以申请信息中的符号为节点对申请信息的语句进行分割进而得到识别后的文字,对所述文字去重和清洗得到待审批流程文本;所述第二识别方式包括以申请信息中的停用词为节点对申请信息的语句进行分割进而得到识别后的文字,对所述文字去重和清洗得到待审批流程文本。
本发明实施例中,所述预设关联种类数量的取值为审批模板中单个种类审批模板中的审批模板的数量的百分之五十,通过设置预设关联种类数量,可提高数据处理的速度,但上述取值并不限于此,本领域技术人员也可根据实际需要对该取值进行调整。
本发明实施例中,去重方法包括所述数据提取单元对分割识别后的文本进行关键词提取,然后所述数据计算单元针对所述关键词进行权重计算,所述数据获取模块根据所述关键词的权重得到文本串,所述文本串包括阈值个数的关键词,所述阈值由文本中权重较大的关键词数量确定,去除所述文本串中的重复项,所述重复项包括文本串中相同的字或词、语义相近的字或词。
本发明实施例中,自然语言大模型的形成过程包括首先选取原始数据集,包括来源于网络上各个渠道的审批模板,然后利用CCNet对所述原始数据集进行去重和清洗得到若干个训练数据样本,并根据规则对所述训练数据样本进行标签分类,统计数据字符集,将字符输入预训练模型构建的语义字典,将每个字符表示为固定维度的向量;按照语义字典为基础,按文本序列顺序生成特征文本向量;将字符的文本位置特征与得到的文本语义特征向量合并为整体特征;将整体特征输入到自然语言大模型中进行参数训练,在训练过程中根据训练数据集得到评估数据集,所述评估数据集内容为所述自然语言大模型训练时匹配正确的数据集,利用评估数据集对训练完成后的自然语言大模型进行评估输出评估结果得到的自然语言大模型。
具体而言,当确定执行审批过程的执行模式时,所述数据分析模块根据所述准确程度评价值μ与预设准确程度评价值μ0的比对结果确定执行所述流程审批的执行模式;
当μ≥μ0时,所述数据分析模块确定以第一执行模式执行审批;
当μ<μ0时,所述数据分析模块确定以第二执行模式执行审批。
本发明实施例中,所述预设准确程度评价值的取值是根据所述数据分析模块识别历史的待审批流程文本过程对相同字段长度的待审批流程文本识别准确程度的均值,通过设置预设准确程度评价值,可提高审批流程处理的精度,但上述取值并不限于此,本领域技术人员也可根据实际需要对该取值进行调整。
具体而言,所述数据分析模块的数据计算单元根据以下公式计算准确程度评价值,设定:
其中,T i表示所述待审批流程文本中第i段文本的识别时间,T0表示预设识别时间,α表示文字识别时间对准确程度评价值的权重,取值为0.15,N0表示正确识别所述待审批流程文本中语法的文本段数,N表示所述待审批流程文本的总段数,β表示语法识别准确度对准确程度评价值的权重,取值为0.85。
本发明实施例中,预设识别时间为所述数据分析模块识别历史的待审批流程文本过程对相同字段长度的待审批流程文本的识别时长的均值。
具体而言,本发明通过对申请信息的初步分析确定申请人的个人信息,所述数据分析模块判断申请人是否对正确的上级负责人提交了申请信息,避免了申请人因将申请信息提交给错误的对象而得不到审批结果进而保证了审批流程的精确性,从而提高了审批过程的智能化程度性。
具体而言,当所述数据分析模块确定执行模式为第一执行模式时,将所述待审批流程文本输入至所述自然语言大模型进行所述审批流程的语义识别,将识别结果与若干审批模板进行匹配,并确定所述识别结果与若干审批模板的匹配度,所述数据分析模块根据匹配度ε与预设匹配度ε0的比对结果确定审批是否合格;
当ε≥ε0且审批模板不唯一或ε<ε0时,所述数据分析模块确定审批不合格,同时所述数据执行模块开启对审批过程的优化;
当ε≥ε0且审批模板唯一时,所述数据分析模块确定审批合格,所述数据执行模块不开启对审批过程的优化;
其中,预设匹配度ε0的取值为0.85,通过设置预设匹配度,可提高审批流程处理的速度,但上述取值并不限于此,本领域技术人员也可根据实际需要对该取值进行调整。
具体而言,本发明将所述待审批流程文本输入至自然语言大模型中进行匹配,通过增加匹配度来确定相似文件,提高了对审批流程种类判断的精确性,同时根据匹配度与预设匹配度进行比对来确定是否进行优化,通过上述方法进一步提高了审批流程中控制的精确性。
具体而言,当所述数据分析模块确定执行模式为第二执行模式时,所述数据分析模块将所述待审批流程文本输入至所述自然语言大模型进行审批流程的语义识别,将识别结果中的审批模板与所述关键词对应的若干审批模板进行比对以确定是否存在相同审批模板且审批模板唯一;
当审批模板唯一时,所述数据分析模块确定审批合格,所述数据执行模块不开启对审批过程的优化;
当审批模板不唯一时,所述数据分析模块确定审批不合格,所述数据执行模块开启对审批过程的优化。
具体而言,本发明通过增加优化方式对所述审批不合格情况下的所述待审批流程文本进行优化,避免因审批不合格导致所述待审批流程文本搁置以至于不能将申请结果告知申请人的情况发生,通过上述方法实时控制审批流程的过程,进一步提高了审批流程的智能性和灵活性。
具体而言,当所述数据执行模块开启优化时,所述数据分析模块根据所述自然语言大模型匹配到的不合格的模板种类数量M0与预设模板种类数量M进行比对以确定优化方式;
当M0≥M时,所述数据分析模块确定以第一优化方式对审批过程进行优化;
当M0<M时,所述数据分析模块确定以第二优化方式对审批过程进行优化;
其中,所述预设种类数量M的取值是根据对自然语言大模型评估时检索到不合格文件的数量的平均值取得的,但上述取值并不限于此,本领域技术人员也可根据实际需要对该取值进行调整。
具体而言,本发明通过确定审批不合格时的模板种类数量,并且,增加一个基于自然语言大模型的评估结果得到的预设种类数量,进而,将不合格时的模板种类数量与预设种类数量进行比对来确定优化方式,提高了审批流程中控制的精确性进而提升了审批流程的智能性。
具体而言,当数据执行模块执行第一优化方式时,所述数据执行模块降低所述自然语言大模型对所述识别后的文字去重和清洗的比例;所述自然语言大模型对识别后的所述文字进行二次匹配以确定与所述待审批流程文本相匹配的审批模板并进行审批。
其中,降低去重和清洗比例的方法包括增大阈值以增加所述文本串的数量来降低去重和清洗的比例,增大阈值的方法为利用阈值调整系数增大阈值,所述阈值调整系数根据以下公式计算,设定:
其中,F表示阈值调整系数,取值在1到2之间,B表示阈值,Bmax表示历史审批中阈值最大值,Bmin表示历史审批中阈值最小值;
将调整后的阈值设置为B’=F×B。
具体而言,本发明在第一优化方式对待审批文本进行优化时,对识别后的文字进行去重过程的阈值进行调整,进而增加文本串的数量以降低去重和清洗的比例,提高文本的完整性,通过上述方法来提升匹配精度以使自然语言大模型更精准地匹配到相似文件,提高了对审批流程种类判断的精准性。
具体而言,当数据执行模块执行第二优化方式时,所述数据计算单元计算历史审批流程文本与该待审批流程文本的余弦相似度,所述数据分析模块将所述余弦相似度cosθ与预设余弦相似度cosθ0对比进而选择相似文本,当cosθ≥cosθ0时,所述数据分析模块确定该文本为相似文本;当cosθ<cosθ0时,所述数据分析模块确定该文本不是相似文本;所述数据执行模块将所述相似文本中的文字按照语义添加至待审批流程文本以进行待审批流程的文本补充,待补充完成后所述自然语言大模型对补充后的待审批流程文本进行二次匹配以确定所述文本种类并进行审批。
本发明实施例中,若识别后的文字为“我因工作需要到外地处理工作”,“外地”、“工作”相关的相似文本会按照语义对所述内容补充为“我因工作需要到外地处理工作,请求出差”。
本发明实施例中,预设余弦相似度的取值为0.8,所述预设余弦相似度是根据历史数据中匹配正确的相似文本与待审批流程文本的相似度的最小值得到的,通过设置预设余弦相似度的值,可提高审批流程处理的精度,但上述取值并不限于此,本领域技术人员也可根据实际需要对该取值进行调整。
具体而言,本发明通过所述数据计算单元计算相似度进而从所述历史审批流程文本中筛选出所述待审批文本的相似文本,数据执行模块将符合条件的相似文本按照语义添加至待审批流程文本以对待审批文本进行补充,从而提高了审批过程的智能性与精确性。
具体而言,所述数据分析模块根据自然语言大模型的历史审批合格率与预设合格率的比对结果确定是否对审批过程进行优化,若所述历史审批合格率小于预设合格率,所述数据执行模块对所述预设余弦相似度的大小进行调整;
其中,所述调整系数K由以下公式计算:
其中,P表示历史审批合格率,P0表示预设合格率,预设合格率取值为0.7,所述预设合格率是根据所述自然语言大模型的评估平均合格率得到的;
将调整后的预设余弦相似度设置为cosθ0’=K×cosθ0。
具体而言,本发明通过数据分析模块获取历史审批合格结果确定历史审批合格率,将历史审批合格率与预设合格率进行比对,进而,数据分析模块通过比对结果确定是否对预设余弦相似度调整以对整个审批过程进行优化,通过上述方法,动态调整了审批过程中的精确性,从而提高了审批流程的精确性和智能性。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
以上所述仅为本发明的优选实施例,并不用于限制本发明;对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于自然语言大模型的流程智能审批方法,其特征在于,包括:
数据获取模块的数据接收单元获取待审批流程的申请信息;
数据获取模块的数据提取单元将初步认证完成的所述申请信息进行关键词提取;
数据分析模块根据提取的所述关键词初步确定待审批流程的关联种类数量;
数据分析模块根据所述待审批流程的关联种类数量确定针对待审批流程的申请信息的识别;
数据分析模块对待审批流程的申请信息识别并根据识别结果的准确程度评价值与预设准确程度评价值的比对结果确定执行所述流程审批的执行模式;
数据分析模块根据自然语言大模型匹配到的不合格的模板种类数量和历史审批合格率确定对审批过程的优化。
2.根据权利要求1所述的基于自然语言大模型的流程智能审批方法,其特征在于,所述确定对所述待审批流程的申请信息的识别包括所述数据分析模块确定以第一识别方式进行申请信息识别,所述第一识别方式包括以申请信息中的符号为节点对申请信息的语句进行分割进而得到识别后的文字,对所述文字去重和清洗得到待审批流程文本。
3.根据权利要求2所述的基于自然语言大模型的流程智能审批方法,其特征在于,所述确定对所述待审批流程的申请信息的识别包括所述数据分析模块以第二识别方式进行申请信息识别,所述第二识别方式包括以申请信息中的停用词为节点对申请信息的语句进行分割进而得到识别后的文字,对所述文字去重和清洗得到待审批流程文本。
4.根据权利要求3所述的基于自然语言大模型的流程智能审批方法,其特征在于,当所述数据分析模块根据准确程度评价值与预设准确程度评价值的比对结果确定执行所述流程审批的执行模式时,在准确程度评价值大于等于预设准确程度评价值条件下以第一执行模式执行审批,或在准确程度评价值小于预设准确程度评价值条件下确定以第二执行模式执行审批。
5.根据权利要求4所述的基于自然语言大模型的流程智能审批方法,其特征在于,所述以第一执行模式执行审批包括所述数据分析模块将所述自然语言大模型的识别结果与审批模板进行匹配,所述数据分析模块根据识别结果与审批模板的匹配度确定是否开启优化,并在所述匹配度小于所述预设匹配度或所述匹配度大于等于所述预设匹配度且审批模板不唯一条件下,数据执行模块开启对审批过程的优化。
6.根据权利要求5所述的基于自然语言大模型的流程智能审批方法,其特征在于,所述以第二执行模式执行审批包括所述数据分析模块将所述待审批流程文本输入至所述自然语言大模型进行审批流程的语义识别,将识别结果中的审批模板与所述关键词对应的若干审批模板进行比对以确定是否存在相同审批模板且审批模板唯一,并在审批模板不唯一条件下,所述数据执行模块开启对审批过程的优化。
7.根据权利要求6所述的基于自然语言大模型的流程智能审批方法,其特征在于,当所述数据分析模块根据所述自然语言大模型匹配的不合格模板的种类数量与预设种类数量的比对结果确定对审批过程的优化时,在不合格模板的种类数量大于等于预设种类数量条件下以第一优化方式对审批过程优化,或在不合格模板的种类数量小于预设种类数量条件下以第二优化方式对审批过程优化。
8.根据权利要求7所述的基于自然语言大模型的流程智能审批方法,其特征在于,所述以第一优化方式对审批过程优化包括所述数据执行模块执行降低所述自然语言大模型对所述识别后的文字去重和清洗的比例。
9.根据权利要求8所述的基于自然语言大模型的流程智能审批方法,其特征在于,所述以第二优化方式对审批过程优化包括所述数据分析模块的数据计算单元计算历史审批流程文本与该待审批流程文本的余弦相似度,所述数据分析模块将所述余弦相似度与预设余弦相似度对比进而选择合适的相似文本中的文字按照语义添加至待审批流程文本以进行待审批流程的文本补充。
10.根据权利要求9所述的基于自然语言大模型的流程智能审批方法,其特征在于,所述根据历史审批合格率确定对审批过程的优化包括所述数据分析模块在所述历史审批合格率小于预设合格率条件下,通过调整系数对所述待预设余弦相似度进行调整。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311535118.XA CN117436815B (zh) | 2023-11-17 | 基于自然语言大模型的流程智能审批方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311535118.XA CN117436815B (zh) | 2023-11-17 | 基于自然语言大模型的流程智能审批方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117436815A true CN117436815A (zh) | 2024-01-23 |
CN117436815B CN117436815B (zh) | 2024-06-07 |
Family
ID=
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117933950A (zh) * | 2024-03-25 | 2024-04-26 | 浪潮通用软件有限公司 | 一种业务流程自动化审批方法、设备及介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105719104A (zh) * | 2016-05-03 | 2016-06-29 | 陈包容 | 一种智能审批的方法及装置 |
CN107609846A (zh) * | 2017-10-31 | 2018-01-19 | 宁波国技互联信息技术有限公司 | 一种企业审批流程管理方法及其系统 |
CN111192021A (zh) * | 2019-12-31 | 2020-05-22 | 深圳市跨越新科技有限公司 | 一种oa单据审批实现方法及系统 |
CN113590823A (zh) * | 2021-07-30 | 2021-11-02 | 中国平安财产保险股份有限公司 | 一种合同审批方法、装置、存储介质及电子设备 |
CN114169868A (zh) * | 2021-12-16 | 2022-03-11 | 建信金融科技有限责任公司 | 流程审批方法、装置、电子设备及存储介质 |
CN115271637A (zh) * | 2022-07-01 | 2022-11-01 | 上海万向区块链股份公司 | 基于智能合约和人工智能的审批系统及方法 |
CN116823164A (zh) * | 2023-06-29 | 2023-09-29 | 中国联合网络通信集团有限公司 | 一种业务审批方法、装置、设备及存储介质 |
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105719104A (zh) * | 2016-05-03 | 2016-06-29 | 陈包容 | 一种智能审批的方法及装置 |
CN107609846A (zh) * | 2017-10-31 | 2018-01-19 | 宁波国技互联信息技术有限公司 | 一种企业审批流程管理方法及其系统 |
CN111192021A (zh) * | 2019-12-31 | 2020-05-22 | 深圳市跨越新科技有限公司 | 一种oa单据审批实现方法及系统 |
CN113590823A (zh) * | 2021-07-30 | 2021-11-02 | 中国平安财产保险股份有限公司 | 一种合同审批方法、装置、存储介质及电子设备 |
CN114169868A (zh) * | 2021-12-16 | 2022-03-11 | 建信金融科技有限责任公司 | 流程审批方法、装置、电子设备及存储介质 |
CN115271637A (zh) * | 2022-07-01 | 2022-11-01 | 上海万向区块链股份公司 | 基于智能合约和人工智能的审批系统及方法 |
CN116823164A (zh) * | 2023-06-29 | 2023-09-29 | 中国联合网络通信集团有限公司 | 一种业务审批方法、装置、设备及存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117933950A (zh) * | 2024-03-25 | 2024-04-26 | 浪潮通用软件有限公司 | 一种业务流程自动化审批方法、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110096570B (zh) | 一种应用于智能客服机器人的意图识别方法及装置 | |
CN108304372B (zh) | 实体提取方法和装置、计算机设备和存储介质 | |
WO2019214133A1 (zh) | 一种大规模客户投诉数据自动分类方法 | |
CN106598959B (zh) | 一种确定双语语句对互译关系方法及系统 | |
CN111062376A (zh) | 基于光学字符识别与纠错紧耦合处理的文本识别方法 | |
CN111191442B (zh) | 相似问题生成方法、装置、设备及介质 | |
CN109165284A (zh) | 一种基于大数据的金融领域人机对话意图识别方法 | |
CN111062397A (zh) | 一种智能票据处理系统 | |
CN112101010B (zh) | 一种基于bert的电信行业oa办公自动化文稿审核的方法 | |
CN116306317B (zh) | 一种基于人工智能的aigc自动建模系统 | |
CN112307130B (zh) | 一种文档级远程监督关系抽取方法及系统 | |
CN111090735A (zh) | 一种基于知识图谱的智能问答方法及其性能评价方法 | |
CN113886562A (zh) | 一种ai简历筛选方法、系统、设备和存储介质 | |
CN114492926A (zh) | 一种煤矿安全隐患文本分析预测方法和系统 | |
CN115185918A (zh) | 一种系统日志自动化分类的方法及装置 | |
CN112632982A (zh) | 一种能用于供应商评价的对话文本情感分析方法 | |
CN111538823A (zh) | 信息处理方法、模型训练方法、装置、设备及介质 | |
CN110825642A (zh) | 一种基于深度学习的软件代码行级缺陷检测方法 | |
CN113868422A (zh) | 一种多标签稽查工单问题溯源识别方法及装置 | |
CN117436815B (zh) | 基于自然语言大模型的流程智能审批方法 | |
CN111191029B (zh) | 基于监督学习和文本分类的ac构建方法 | |
CN115357718B (zh) | 主题集成服务重复材料发现方法、系统、设备和存储介质 | |
CN117436815A (zh) | 基于自然语言大模型的流程智能审批方法 | |
CN112036179A (zh) | 基于文本分类与语义框架的电力预案信息抽取方法 | |
CN111708810A (zh) | 模型优化推荐方法、装置和计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |