CN108038162B - 基于公文片段和二分图匹配的公文审批人智能推荐方法 - Google Patents

基于公文片段和二分图匹配的公文审批人智能推荐方法 Download PDF

Info

Publication number
CN108038162B
CN108038162B CN201711275900.7A CN201711275900A CN108038162B CN 108038162 B CN108038162 B CN 108038162B CN 201711275900 A CN201711275900 A CN 201711275900A CN 108038162 B CN108038162 B CN 108038162B
Authority
CN
China
Prior art keywords
document
approver
matching
official
official document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711275900.7A
Other languages
English (en)
Other versions
CN108038162A (zh
Inventor
洪微明
王建旭
齐蕾蕾
沈宏杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Information and Telecommunication Branch of State Grid Jiangxi Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Information and Telecommunication Branch of State Grid Jiangxi Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Information and Telecommunication Branch of State Grid Jiangxi Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201711275900.7A priority Critical patent/CN108038162B/zh
Publication of CN108038162A publication Critical patent/CN108038162A/zh
Application granted granted Critical
Publication of CN108038162B publication Critical patent/CN108038162B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于智能信息系统领域,特别涉及一种基于公文片段和二分图匹配的公文审批人智能推荐方法,本发明包括步骤1、提取公文的特征信息和审批人的属性信息;步骤2、分别计算公文的匹配率和公文审批人评分矩阵;步骤3、根据公文整体匹配率确定最优审批人,结合二分图匹配策略确定推荐审批人集合。本发明提供一种基于公文片段和二分图匹配的公文审批人智能推荐方法,能够有效地提升电子公文审批流程的智能性和效率。

Description

基于公文片段和二分图匹配的公文审批人智能推荐方法
技术领域
本发明属于智能信息系统领域,特别涉及一种基于公文片段和二分图匹配的公文审批人智能推荐方法。
背景技术
电子审批系统是近些年来随着电子政务、网上审批和信息服务中心的建设发展起来的,有关电子审批系统的研究主要集中在软件系统的基本模型设计与实现层面,而对电子审批系统的基本概念和基本理论的系统性研究很少。
公文审批是电子审批系统的主要功能之一,是企事业单位日常办公的重要组成部分。公文的收发是企事业单位领会上级精神、发布重要通知、审阅和通过最重要文件的重要手段,也是一种最正式的信息发布渠道。由于其正式性和权威性,公文的审批是行政领导、工作人员相当繁重的一项工作。公文电子流程审批系统的出现,为公文的审批工作带来了极大的便利性。在公文流转过程中,不可避免的要准确选择公文下一审批人。正确的审批人选择要求用户对流程较为熟悉,提高了用户的使用成本。国内外学者有关电子政务系统的研究很多,但涉及新兴的电子审批系统的研究较少,尤其是在提升系统智能性和高效率研究方面相对匮乏。
发明内容
针对现有技术中的缺陷,本发明提供一种基于公文片段和二分图匹配的公文审批人智能推荐方法,能够有效地提升电子公文审批流程的智能性和效率。
本发明提出一种基于公文片段和二分图匹配的公文审批人智能推荐方法,其特征在于:其步骤为:
步骤1、提取公文的特征信息P和审批人的属性信息T;
步骤2、分别计算公文的匹配率s和公文审批人评分矩阵R*;
步骤3、根据公文整体匹配率确定最优审批人,结合二分图匹配策略确定推荐审批人集合;
步骤3-1、根据分块公文的匹配率,采用加权平均的方法计算出公文整体匹配率,根据公文整体匹配率确定最优的审批人;
步骤3-2、根据公文审批人评分矩阵,结合二分图匹配策略确定推荐审批人集合。
优选的,在步骤1中,公文的特征信息包含使用范围、公文性质、紧急程度,审批人的属性信息包括所属部门、范围权限。
优选的,在步骤2中,根据提取公文的特征信息和审批人的属性信息,分别计算公文的整体匹配率和公文审批人评分矩阵;公文的整体匹配率由分块公文的匹配率经加权计算而得;按照根据Factorization CF算法计算预测审批人的评分矩阵R*
优选的,步骤3-1中其详细步骤为:
(1)将总长度为α的公文平均分割成d块,每块公文的平均长度为αave=α/d;
(2)考虑公文块中的部分匹配情况,分析出公文分块长度与特征信息长度之间的关系,确定误差率的上限是部分匹配发生的概率,即2βaveave,根据公文审批流程匹配算法将审批人的属性信息与公文块的特征信息进行匹配,得出每块公文的匹配率,即si=qiave,qi表示第i块公文的特征信息匹配成功的总长度;
(3)确定各公文块匹配率的权值,权值大小xi应与单块公文匹配率si的大小相对应,即匹配率越高权值越大;匹配率最终值即为每块公文匹配率的加权平均值,即
Figure BDA0001496526860000021
(4)根据公文的审批流程匹配率算法,得出审批流程中下一个审批人的匹配率,即
Figure BDA0001496526860000031
其中t为审批人个数;
(5)将匹配率用排序算法进行排序,选择出最高匹配率值
Figure BDA0001496526860000032
即第i位审批人的匹配率值最高,所以公文审批流程中下一审批人选择第i位审批人。
优选的,步骤3-2中其详细步骤为:
(1)确定预测评分矩阵:根据所收集的特征信息集P和审批人的属性信息集T,按照根据Factorization CF算法计算预测审批人的评分矩阵R*
(2)构建推荐二分图:设置评分阈值Tr,按照R*确定候选推荐审批人列表Cu,获得公文候选审批人推荐列表Cu;以非匹配边连接公文f与其Cu中的公文审批人,获得初始状态的推荐二分图;
(3)生成推荐列表:在生成公文审批人推荐列表时,根据不同的情况,分别进行计算。
优选的,在生成公文审批人推荐列表时,根据不同的情况,分别进行计算,详细步骤为:
(Ⅰ)当公文Cu中存在IC≠0的预测公文审批人时,将审批人a添加到Tu中,并从Cu中移除公文审批人a;同时,更新公文审批人a的公文审批人容量,ICa-1;将二分图中公文f与公文审批人a间的边由非匹配边转变为匹配边;
(Ⅱ)当公文Cu中所有公文审批人的IC=0时,采用广度优先搜索策略获得该公文用户节点的一条推荐增广路。在推荐增广路p=v1→v2→...→v2n-1→v2n中,v为公文用户节点,v为公文审批人节点;将该推荐增广路v2k-1→v2k转变为匹配边,v2k→v2k+1转变为非匹配边;并根据边的转换,修改相应公文的Tu与Cu,将v2k代表的公文审批人添加到v2k-1的公文Tu中,将v2k代表的公文审批人从v2k+1的公文用户Cu中移除;对推荐增广路v2n所代表公文审批人的公文审批人容量进行减一操作,IC2n-1;
(Ⅲ)当公文候选推荐列表中的公文审批人容量均为0,且不存在从该公文用户节点出发的推荐增广路时,此时将候选推荐列表中评分最高的公文审批人添加到公文推荐列表中,不改变公文审批人的公文审批人容量值。
由上述技术方案可知,本发明提供一种基于公文片段和二分图匹配的公文审批人智能推荐方法,能够有效地提升电子公文审批流程的智能性和效率。
附图说明
图1示出了本发明提供的基于公文片段和二分图匹配的公文审批人智能推荐方法的示意图;
图2示出了本发明提供的公文片段的审批人匹配推荐流程图;
图3示出了本发明提供的二分图匹配策略的审批人推荐流程图。
具体实施方式
下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只是作为示例,而不能以此来限制本发明的保护范围。
如图1至图3所示,本发明提供一种基于公文片段和二分图匹配的公文审批人智能推荐方法,包括:
步骤1、提取系统公文特征信息和审批人的属性信息;
步骤2、根据所收集的特征信息和属性信息建立公文和审批人的匹配推荐模型;
步骤3、考虑公文和审批人整体匹配情况、审批人推荐的准确性和推荐方案的合理性等要求,基于最优的匹配结果和较高的准确率确定最优的公文审批人推荐结果;
步骤1首先提取公文的使用范围、公文性质、紧急程度等特征信息,审批人包含所属部门、范围权限等内容的属性信息;
步骤2中,假设在公文和审批人模型中有n个公文,构成公文集合F,记作F={f1,f2,...,fn};有m个公文审批人,构成的公文审批人集合A,记作A={a1,a2,...,am}。公文审批流程匹配形式化定义为:给定多个公文特征信息的集合{P1,P2,…,Pk}(k≥2),这里k称为特征信息个数,特征信息Pi用字节串b1b2…bm’表示,其中m’称为特征信息P的长度;用字节串c1c2…cn’表示审批人属性信息T,其中n’称为属性信息的长度。若属性信息T中的某字串ajaj+1…aj+m’-1与特征信息Pi的各个字节一一对应,则称T从j开始匹配Pi,或称Pi匹配T与j。
公文的预测审批人用一个n×m维矩阵相似度评分矩阵描述,记作矩阵R,其中矩阵的每一项R(f,a)表示公文f对公文审批人a的真实相似度评分。公文对未评分公文审批人的预测评分由n×m维矩阵R*表示,其中矩阵的每一项R*(f,a)表示公文f对公文审批人a的预测评分。公文审批人的推荐列表记为Tu,推荐列表长度为N,公文审批人可被推荐的次数记为审批人容量,用IC表示。推荐初始时,所有公文审批人的审批人容量相同。
步骤3-1中根据公文和审批人整体匹配情况,确定最优的公文和审批人匹配结果,算法分为计算公文匹配率和确定最优的公文审批人两个阶段。
1)在根据模型假设,若属性信息T中的某字串ajaj+1…aj+r-1与特征信息Pi的前r个字节b1b2…br一一对应,则称T从j开始前缀匹配Pi,匹配长度为r;若属性信息T中的某字串ajaj+1…aj+r-1与特征信息Pi的后r个字节bm’-r+1bm’-r+2…bm’一一对应,则称T从j开始后缀匹配Pi,匹配长度为r。若T从1起后缀匹配Pi,则称T后缀首匹配Pi;若T从n’-r+1起前缀匹配Pi,则称T前缀末匹配Pi。这2种特征匹配都称为T部分匹配Pi,并将一般的T匹配P称为完全匹配。如图1所示,公文被分成3块,左边一块前缀末匹配属性信息串①,右边一块后缀首匹配属性信息串③,中间这一块不但完全匹配属性信息串②,还部分匹配属性信息串①③。
在公文审批流程匹配中,特征信息集合{P1,P2,…,Pk}中最大特征信息长度为m’,属性信息T可能被分成若干部分{T1,T2,…,Ts},并约定每一部分Tj都不小于最大特征信息长度m’;那么T与某特征信息Pi匹配的必要条件是{T1,T2,…,Ts}中存在某个数据块Tj满足下列3个条件之一:
(1)Tj完全匹配特征信息Pi,其匹配长度为mi’
(2)Tj前缀末匹配特征信息Pi,其匹配长度不小于mi’/2;
(3)Tj后缀首匹配特征信息Pi,其匹配长度不小于mi’/2。
因而,如果公文审批流程匹配算法能在属性信息T中匹配出特征信息Pi,则一定可以在T的一个分块Tj中匹配特征信息Pi的一个长度不小于1/2的子特征信息长度,而且如果匹配上的是Pi的一个真子特征信息,那么匹配字串必定位于Tj的首部或尾部。
在上述过程中,为了避免状态数目剧增,可以用P-1代替P的所有后缀加入状态机,但是在扫描过程中,需要对属性块的前m’个字节做一个逆向扫描。用T-1,P-1表示属性信息和特征信息的逆。那么,T前缀末匹配P,等价于T-1后缀首匹配P-1
假定特征信息集中包含k个特征信息串,特征信息串的平均长度为βave;公文总长为α,匹配时公文被分割成d个分块匹配,则平均长度为αave=α/d。匹配过程中的误差主要受公文分块长度和特征信息长度相互关系的影响:
(Ⅰ)当公文分块长度不小于特征信息长度,即αave≥βave时,无论如何都不可能有匹配长度小于特征信息1/2的部分匹配,此时误差率为0;
(Ⅱ)当公文分块长度不大于特征信息长度的1/2,即αave≤βave/2时,不可能匹配到长度超过特征信息1/2的特征片段,此时误差率为100%;
(Ⅲ)当公文分块长度在以上范围内时,即βave/2≤αave≤βave时,如果特征串落在3个公文块中,就会发生误差,此时误差率为βaveave-1。
在本方法中,完全匹配是不会导致误差的,误差必然发生在部分匹配的情况下,且误差率的上限是部分匹配发生的概率,即2βaveave
根据上述方法,可以得到公文块中的审批流程匹配率为:
si=qiave
式中,si表示第i块公文的审批流程匹配率,qi表示第i块公文的特征信息匹配成功的总长度,αave表示公文块的平均长度。
由于匹配时公文被分割成d个分块,所以完整公文的审批流程匹配率集合为{s1,s2,…sd},记公文审批流程匹配率的权重集合为{x1,x2…,xd},公文的审批流程匹配率的加权平均值为:
Figure BDA0001496526860000071
根据以上分析可知,当匹配率越高时,匹配误差越小。为了减小匹配误差,权值大小xi应与单块文本匹配率si的大小相对应,即匹配率越高权值越大。经过计算得到公文的审批流程匹配率的加权平均值
Figure BDA0001496526860000072
即为最终结果。
2)在确定最优审批人阶段,根据上述公文的审批流程匹配率算法,得出审批流程中下一个审批人的匹配率,即
Figure BDA0001496526860000073
其中t为审批人个数。将匹配率用排序算法进行排序,选择出最高匹配率值
Figure BDA0001496526860000074
即第i位审批人的匹配率值最高,所以公文审批流程中下一审批人选择第i位审批人。
步骤3-2.上述推荐算法是基于公文匹配率的大小确定最优审批人的过程,本部分基于二分图匹配策略提出一种公文审批人智能推荐方法。
在基于二分图匹配策略智能推荐方法中,首先设置相似度评分阈值Tr,公文f的候选审批人推荐列表:Cu={a|a∈A,f∈F and R*(f,a)>Tr},候选列表Cu中的元素a可视为预计审批公文f的审批人。推荐二分图记作G=<F,A,E>,F为公文节点的集合,A为公文审批人节点的集合,E为公文f与公文审批人a间关系的集合。其中,连接公文f与其Cu中公文审批人的边称为匹配边,连接公文f与其Tu中公文审批人的边称为非匹配边。审批人推荐增广路是一组边的集合,要求从一个公文节点出发,依次经过非匹配边、匹配边、…、非匹配边,并且最后的公文审批人节点审批人容量不为0,则这样的路径称为审批人推荐增广路。
与前述方法类似,审批人推荐的过程分为预测公文未评分审批人的评分值与生成Top-N审批推荐列表两个阶段。本方法考虑智能推荐的准确率,兼顾推荐人的多样性因素,寻找从该公文节点开始的推荐增广路,并置换增广路中的推荐的准确率与非匹配边。
假设向每个公文推荐两个公文审批人,公文审批人容量IC为2。此刻f3公文推荐列表未满,且候选推荐列表中公文审批人a1与a5的IC值均为0。AD-Improved算法寻找到f3→a1→f1→a2增广路。将a1推荐给f3,将a2推荐给f1。由此实现了f3公文用户的推荐。并且增加了冷门审批人a2的推荐。将a2推荐给f1虽然可能会有损推荐准确率,然而,由于设置了R*(f1,a2)>Tr,f1公文对a2公文审批人仍然具有较高的预测评分。因此,在增强总体多样性的同时,该算法仍然具有较好准确率。
AD-Improved算法可分为下列步骤:
步骤1)预测评分矩阵:根据已有的评分预测方法,预测未评分审批人的评分,并对公文选取评分最高的N个公文审批人构建Top-N推荐列表。本方法假定预测评分矩阵R*为已知条件。
步骤2)构建推荐二分图:构建推荐二分图过程如下。首先,设置评分阈值Tr,并基于预测评分矩阵R*,获得公文候选审批人推荐列表Cu。其次,以非匹配边连接公文f与其Cu中的公文审批人,即为算法初始状态的推荐二分图。
步骤3)生成推荐列表:向公文生成审批人推荐列表时,可能会出现三种情况:
(Ⅰ)公文Cu中存在IC不为0的预测公文审批人,为了保证推荐准确率,选择预测评分值最高的审批人a推荐给公文,即将审批人a添加到Tu中,并从Cu中移除公文审批人a。同时,由于公文审批人a进行了一次推荐,需要对公文审批人a的公文审批人容量进行更新,ICa-1。最后,二分图中公文f与公文审批人a间的边由非匹配边转变为匹配边;
(Ⅱ)公文Cu中所有公文审批人IC均为0,从该公文用户节点出发点采用广度优先搜索策略可以获得至少一条推荐增广路。推荐增广路起始于公文节点,终止于公文审批人节点。推荐增广路p=v1→v2→…→v2n-1→v2n中,v为公文用户节点,v为公文审批人节点。将该推荐增广路v2k-1→v2k转变为匹配边,v2k→v2k+1转变为非匹配边。并根据边的转换,修改相应公文的Tu与Cu,将v2k代表的公文审批人添加到v2k-1的公文Tu中,将v2k代表的公文审批人从v2k + 1的公文用户Cu中移除。对推荐增广路v2n所代表公文审批人的公文审批人容量进行减一操作,IC2n-1;
(Ⅲ)公文候选推荐列表中的公文审批人容量均为0,且不存在从该公文用户节点出发的推荐增广路。此刻无法提高系统总体多样性,为了保证算法准确率,将候选推荐列表中评分最高的公文审批人添加到公文推荐列表中。不改变公文审批人的公文审批人容量值。
综上所述,基于二分图匹配策略的公文审批人智能推荐过程如下:
输入:R*,Tr,IC
输出:Top-N推荐列表
Figure BDA0001496526860000091
Figure BDA0001496526860000101
算法复杂度分析,对于由n个公文,m个公文审批人构成的智能推荐系统进行算法复杂度分析。假设推荐列表长度为N。以最坏情况进行考虑,假设公文的每次推荐都需要进行寻找推荐增广路,增广路复杂度为O(m*n)。系统有n个公文且需要重复N次,复杂度为O(N*m2*n)。由于N通常为5左右的常数,相对于系统中公文数量与公文审批人数量而言可以忽略不计,因而本算法的时间复杂度为O(m2*n)。
如图2所示,基于公文片段审批流程匹配算法,其步骤为:
步骤1、提取公文中的特征信息P和审批人的属性信息T;
步骤2、将总长度为α的公文平均分割成d块,每块公文的平均长度为αave=α/d;
步骤3、考虑公文块中的部分匹配情况,分析出公文分块长度与特征信息长度之间的关系,确定误差率的上限是部分匹配发生的概率,即2βaveave,根据公文审批流程匹配算法将审批人的属性信息与公文块的特征信息进行匹配,得出每块公文的匹配率,即si=qiave(qi表示第i块公文的特征信息匹配成功的总长度)。
步骤4、确定各公文块匹配率的权值,权值大小xi应与单块公文匹配率si的大小相对应,即匹配率越高权值越大。匹配率最终值即为每块公文匹配率的加权平均值,即
Figure BDA0001496526860000111
步骤5、根据公文的审批流程匹配率算法,得出审批流程中下一个审批人的匹配率,即
Figure BDA0001496526860000112
其中t为审批人个数。
步骤6、将匹配率用排序算法进行排序,选择出最高匹配率值
Figure BDA0001496526860000113
即第i位审批人的匹配率值最高,所以公文审批流程中下一审批人选择第i位审批人。
如图3所示,基于二分图匹配策略的公文审批人智能推荐方法,其步骤为:
步骤1、确定预测评分矩阵:根据所收集的特征信息集P和审批人的属性信息集T,按照根据Factorization CF算法计算预测审批人的评分矩阵R*;
步骤2、构建推荐二分图:设置评分阈值Tr,按照R*确定候选推荐审批人列表Cu,获得公文候选审批人推荐列表Cu。以非匹配边连接公文f与其Cu中的公文审批人,获得初始状态的推荐二分图。
步骤3、生成推荐列表:在生成公文审批人推荐列表时,根据不同的情况,分别进行计算:
(Ⅰ)当公文Cu中存在IC≠0的预测公文审批人时,将审批人a添加到Tu中,并从Cu中移除公文审批人a。同时,更新公文审批人a的公文审批人容量,ICa-1。将二分图中公文f与公文审批人a间的边由非匹配边转变为匹配边;
(Ⅱ)当公文Cu中所有公文审批人的IC=0时,采用广度优先搜索策略获得该公文用户节点的一条推荐增广路。推荐增广路p=v1→v2→...→v2n-1→v2n中,v为公文用户节点,v为公文审批人节点。将该推荐增广路v2k-1→v2k转变为匹配边,v2k→v2k+1转变为非匹配边。并根据边的转换,修改相应公文的Tu与Cu,将v2k代表的公文审批人添加到v2k-1的公文Tu中,将v2k代表的公文审批人从v2k+1的公文用户Cu中移除。对推荐增广路v2n所代表公文审批人的公文审批人容量进行减一操作,IC2n-1;
(Ⅲ)当公文候选推荐列表中的公文审批人容量均为0,且不存在从该公文用户节点出发的推荐增广路时。此时将候选推荐列表中评分最高的公文审批人添加到公文推荐列表中。不改变公文审批人的公文审批人容量值。
在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
需要说明的是,本发明的说明书附图中的框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与获得机指令的组合来实现。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims (5)

1.基于公文片段和二分图匹配的公文审批人智能推荐方法,其特征在于:其步骤为:
步骤1、提取公文的特征信息P和审批人的属性信息T;
步骤2、分别计算公文的匹配率s和公文审批人评分矩阵R*;
步骤3、根据公文整体匹配率确定最优审批人,结合二分图匹配策略确定推荐审批人集合;
步骤3-1、根据分块公文的匹配率,采用加权平均的方法计算出公文整体匹配率,根据公文整体匹配率确定最优的审批人;
步骤3-2、根据公文审批人评分矩阵,结合二分图匹配策略确定推荐审批人集合;
步骤3-1中其详细步骤为:
(1)将总长度为α的公文平均分割成d块,每块公文的平均长度为αave=α/d;
(2)考虑公文块中的部分匹配情况,分析出公文分块长度与特征信息长度之间的关系,确定误差率的上限是部分匹配发生的概率,即2βaveave,根据公文审批流程匹配算法将审批人的属性信息与公文块的特征信息进行匹配,得出每块公文的匹配率,即si=qiave,qi表示第i块公文的特征信息匹配成功的总长度;
(3)确定各公文块匹配率的权值,权值大小xi应与单块公文匹配率si的大小相对应,即匹配率越高权值越大;匹配率最终值即为每块公文匹配率的加权平均值,即
Figure FDA0003343397740000011
(4)根据公文的审批流程匹配率算法,得出审批流程中下一个审批人的匹配率,即
Figure FDA0003343397740000012
其中t为审批人个数;
(5)将匹配率用排序算法进行排序,选择出最高匹配率值
Figure FDA0003343397740000021
即第i位审批人的匹配率值最高,所以公文审批流程中下一审批人选择第i位审批人。
2.根据权利要求1所述的基于公文片段和二分图匹配的公文审批人智能推荐方法,其特征在于:在步骤1中,公文的特征信息包含使用范围、公文性质、紧急程度,审批人的属性信息包括所属部门、范围权限。
3.根据权利要求1所述的基于公文片段和二分图匹配的公文审批人智能推荐方法,其特征在于:在步骤2中,根据提取公文的特征信息和审批人的属性信息,分别计算公文的整体匹配率和公文审批人评分矩阵;公文的整体匹配率由分块公文的匹配率经加权计算而得;按照根据Factorization CF算法计算预测审批人的评分矩阵R*
4.根据权利要求1所述的基于公文片段和二分图匹配的公文审批人智能推荐方法,其特征在于:步骤3-2中其详细步骤为:
(1)确定预测评分矩阵:根据所收集的特征信息集P和审批人的属性信息集T,按照根据Factorization CF算法计算预测审批人的评分矩阵R*
(2)构建推荐二分图:设置评分阈值Tr,按照R*确定候选推荐审批人列表Cu,获得公文候选审批人推荐列表Cu;以非匹配边连接公文f与其Cu中的公文审批人,获得初始状态的推荐二分图;
(3)生成推荐列表:在生成公文审批人推荐列表时,根据不同的情况,分别进行计算。
5.根据权利要求4所述的基于公文片段和二分图匹配的公文审批人智能推荐方法,其特征在于:在生成公文审批人推荐列表时,根据不同的情况,分别进行计算,详细步骤为:
(I)当公文Cu中存在IC≠0的预测公文审批人时,将审批人a添加到Tu中,并从Cu中移除公文审批人a;同时,更新公文审批人a的公文审批人容量,ICa-1;将二分图中公文f与公文审批人a间的边由非匹配边转变为匹配边;
(II)当公文Cu中所有公文审批人的IC=0时,采用广度优先搜索策略获得该公文用户节点的一条推荐增广路;在推荐增广路p=v1→v2→...→v2n-1→v2n中,v为公文用户节点,v为公文审批人节点;将该推荐增广路v2k-1→v2k转变为匹配边,v2k→v2k+1转变为非匹配边;并根据边的转换,修改相应公文的Tu与Cu,将v2k代表的公文审批人添加到v2k-1的公文Tu中,将v2k代表的公文审批人从v2k+1的公文用户Cu中移除;对推荐增广路v2n所代表公文审批人的公文审批人容量进行减一操作,IC2n-1;
(III)当公文候选推荐列表中的公文审批人容量均为0,且不存在从该公文用户节点出发的推荐增广路时,此时将候选推荐列表中评分最高的公文审批人添加到公文推荐列表中,不改变公文审批人的公文审批人容量值。
CN201711275900.7A 2017-12-06 2017-12-06 基于公文片段和二分图匹配的公文审批人智能推荐方法 Active CN108038162B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711275900.7A CN108038162B (zh) 2017-12-06 2017-12-06 基于公文片段和二分图匹配的公文审批人智能推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711275900.7A CN108038162B (zh) 2017-12-06 2017-12-06 基于公文片段和二分图匹配的公文审批人智能推荐方法

Publications (2)

Publication Number Publication Date
CN108038162A CN108038162A (zh) 2018-05-15
CN108038162B true CN108038162B (zh) 2022-02-25

Family

ID=62095435

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711275900.7A Active CN108038162B (zh) 2017-12-06 2017-12-06 基于公文片段和二分图匹配的公文审批人智能推荐方法

Country Status (1)

Country Link
CN (1) CN108038162B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109636345B (zh) * 2018-12-14 2021-07-20 武汉烽火信息集成技术有限公司 一种业务办理工作流的智能管理方法及系统
CN110264147A (zh) * 2019-05-10 2019-09-20 平安科技(深圳)有限公司 审批链审批方法、装置、终端及存储介质
CN110648111A (zh) * 2019-09-09 2020-01-03 杭州博联智能科技股份有限公司 基于工作流的审批任务处理方法、装置、电子设备、介质
CN110609892A (zh) * 2019-09-19 2019-12-24 浩鲸云计算科技股份有限公司 一种基于ai的oa智能化推荐系统
CN110705968A (zh) * 2019-10-12 2020-01-17 南京我爱我家信息科技有限公司 一种基于人工智能的审批流解决方法、装置及计算机设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101320453A (zh) * 2008-07-22 2008-12-10 北京航空航天大学 基于Web服务的电子公文流转自动化方法
CN107122391A (zh) * 2017-03-06 2017-09-01 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种基于历史记录的代码审核人推荐方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101334872B (zh) * 2008-07-22 2011-12-07 北京航空航天大学 基于Web服务的电子公文交换方法
US8856642B1 (en) * 2013-07-22 2014-10-07 Recommind, Inc. Information extraction and annotation systems and methods for documents
US10191893B2 (en) * 2013-07-22 2019-01-29 Open Text Holdings, Inc. Information extraction and annotation systems and methods for documents
US20180025420A9 (en) * 2015-04-17 2018-01-25 Scott Gerard Wolfe, Jr. Electronic Document Management with Requesting and Exchange Protocol Based On User Defined Rules, User Selected Status; Status Indications Automatically Generated Based on User and/or Aggregated Data, and/or Rules Based on User Data and/or Aggregated Data
US10511653B2 (en) * 2015-10-12 2019-12-17 Roman KISIN Discussion-based document collaboration
CN106339906A (zh) * 2016-08-26 2017-01-18 乐山起惠信息科技有限公司 一种基于电子商务的导购系统推广方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101320453A (zh) * 2008-07-22 2008-12-10 北京航空航天大学 基于Web服务的电子公文流转自动化方法
CN107122391A (zh) * 2017-03-06 2017-09-01 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种基于历史记录的代码审核人推荐方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"开发公文管理系统 推进高校办公自动化";潘蕾;《管理信息系统》;20001230;第10-13页 *

Also Published As

Publication number Publication date
CN108038162A (zh) 2018-05-15

Similar Documents

Publication Publication Date Title
CN108038162B (zh) 基于公文片段和二分图匹配的公文审批人智能推荐方法
US8032534B2 (en) Method and system for indexing and searching high-dimensional data using signature file
CN107220343A (zh) 基于局部敏感哈希的中文多关键词模糊排序密文搜索方法
US9916314B2 (en) File extraction method, computer product, file extracting apparatus, and file extracting system
CN108549629B (zh) 一种结合相似度和图匹配的老-汉双语句子对齐方法
CN110427618A (zh) 对抗样本生成方法、介质、装置和计算设备
CN102971729A (zh) 将可操作属性归于描述个人身份的数据
US20090300014A1 (en) Membership checking of digital text
CN110719106B (zh) 一种基于节点分类排序的社交网络图压缩方法及系统
US9720976B2 (en) Extracting method, computer product, extracting system, information generating method, and information contents
CN110442618B (zh) 融合专家信息关联关系的卷积神经网络评审专家推荐方法
JPWO2014132497A1 (ja) データ解析装置、及びその方法
CN112434134B (zh) 搜索模型训练方法、装置、终端设备及存储介质
CN114357120A (zh) 基于faq的无监督式检索方法、系统及介质
US9542427B2 (en) Computer product, generating apparatus, and generating method for generating Huffman tree, and computer product for file compression using Huffman tree
CN114141384A (zh) 用于检索医学数据的方法、设备和介质
CN113626584A (zh) 一种自动文本摘要生成方法、系统、计算机设备和存储介质
CN105474214A (zh) 文本字符串搜索设备、文本字符串搜索方法和文本字符串搜索程序
Shin et al. Fast clustering algorithm for information organization
CN116578696A (zh) 文本摘要生成方法、装置、设备及存储介质
JP2008146162A (ja) 正規表現生成装置及び正規表現生成方法及び正規表現生成プログラム
JP2013069175A (ja) キーワード抽出システム、キーワード抽出方法及びプログラム
JP4208326B2 (ja) 情報索引装置
CN109753662B (zh) 一种基于分层网络的重名作者辨识方法
CN103326731B (zh) 一种基于分布式算术编码的隐马尔科夫相关信源编码方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant