CN102117430A - 一种文件批抄信息化管理的方法和系统 - Google Patents

一种文件批抄信息化管理的方法和系统 Download PDF

Info

Publication number
CN102117430A
CN102117430A CN200910217525XA CN200910217525A CN102117430A CN 102117430 A CN102117430 A CN 102117430A CN 200910217525X A CN200910217525X A CN 200910217525XA CN 200910217525 A CN200910217525 A CN 200910217525A CN 102117430 A CN102117430 A CN 102117430A
Authority
CN
China
Prior art keywords
batch
copy
copying
content
vocabulary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200910217525XA
Other languages
English (en)
Inventor
杨健
周欣
葛雷
张清江
张星
张鸿雁
马艳庄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kfky Information & Technology Co Ltd
Original Assignee
Beijing Kfky Information & Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kfky Information & Technology Co Ltd filed Critical Beijing Kfky Information & Technology Co Ltd
Priority to CN200910217525XA priority Critical patent/CN102117430A/zh
Publication of CN102117430A publication Critical patent/CN102117430A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明公开了一种文件批抄信息化管理的方法,分解用户批抄内容,形成批抄词汇序列并对所述批抄词汇序列进行排序和重组,计算公文的分发数量,对所述批抄内容中的词汇、顺序、表述、分段进行校验;显示批抄词汇对应列表;本发明同时还公开了一种文件信息化管理的系统;根据本发明的方案,对手工录入的批抄内容进行自动校验,并可将错误的批抄内容进行更正,使得信息化管理系统中的公文批抄管理更加符合传统业务的需要。

Description

一种文件批抄信息化管理的方法和系统
技术领域
本发明涉及电子政务技术,尤其涉及一种文件批抄信息化管理的方法和系统。
背景技术
在计算机技术极为发达的现代,电子政务在党政机关中已经普遍使用,随着公文管理信息化系统的不断完善,原本由手工操作的文件处理已经逐步由计算机管理所替代。但是,不论使用何种手段进行管理,文件自身的基本要素都不会减少,在使用计算机管理文件过程中,这些要素便成为了管理的基本要素,计算机系统需要能够妥善管理这些基本要素。
目前,党政机关在正式发文时需要对文件进行管理,以确认文件的分发范围,所谓文件批抄就等同于发送邮件时的抄送操作,即:将同一文件同时发送多份给不同对象。文件的批抄内容近似于自然语,同时批抄范围是正式公文的组成部分,批抄在表述、顺序、措辞等方面具有严格的要求。基于以上原因,公文批抄管理的信息化要求能够识别自然语,能够自动分析自然语中表述的批抄范围,能够对批抄的格式、顺序进行自动校验,并对错误的批抄内容进行自动纠正。
由于公文批抄管理算法复杂、特殊情况多、批抄词库庞大、格式要求严格、识别要求准确等原因,目前还没有针对文件批抄进行自动化、信息化管理的方法和系统,对于文件批抄的管理方法仍然是利用人工进行管理,仅仅是利用手写的方式记录下文件接收的范围,这样的人工化管理方法不仅需要大量的人力,而且还会存在人为的操作失误,导致文件发送的范围错误。因此,人工化的管理方法不能满足党政机关对大量文件进行批抄作业、以及采用严格的批抄格式等要求。
发明内容
有鉴于此,本发明的主要目的在于提供一种文件批抄信息化管理的方法和系统,能按规定要求自动处理大量文件批抄,并能自动校验、自动纠错,满足用户的需求。
为达到上述目的,本发明的技术方案是这样实现的:
本发明提供了一种文件批抄信息化管理方法,包括:
分解用户批抄内容,形成批抄词汇序列,并对所述批抄词汇序列进行排序和重组;计算批抄的分发数量;
显示批抄词汇对应列表。
其中,所述分解用户批抄内容,形成批抄词汇序列具体为:对用户以自然语形式输入的批抄内容对照批抄词库进行分解,通过对所述批抄词库的检索,将所述批抄内容分解为单元词汇和范围词汇,形成批抄词汇序列。
上述方案中,所述对批抄词汇序列进行排序具体为:利用批抄算法中的排序算法,根据所述批抄词汇中的顺序属性,对分析出的所述批抄词汇序列进行重新排序;其中,所述顺序属性是段位数小的排序在前,段位数一样时,顺序数小的排序在前。
上述方案中,所述对批抄词汇序列进行重组具体为:利用批抄算法中的表述算法,对所述重新排序后的批抄词汇序列进行重组,形成可供公文使用的自然语格式,并按照公文的规定,完成拆行、分段工作。
上述方案中,所述计算批抄的分发数量具体为:根据形成的所述批抄词汇序列利用批抄算法中的计算算法自动计算所述批抄范围中批抄的分发数量。
上述方案中,还包括对所述批抄内容进行校验,校验所述批抄范围中的词汇、顺序、表述、分段是否正确,并对不可分析的内容进行提示,对错误的内容进行纠正。
上述方案中,所述显示批抄词汇对应列表具体为:根据经过分析的批抄词汇以及所对应的批抄范围、分发数量,形成所述批抄词汇对应列表并进行显示。
上述方案中,所述显示批抄词汇对应列表还包括:用户编辑所述批抄范围,发现所述批抄范围中不可分析的内容或者错误内容,显示提示并显示推荐性的解决方案。
本发明还提供了一种文件批抄信息化管理的系统,包括:批抄操作模块、批抄管理模块;其中,
批抄操作模块,用于分解用户批抄内容,形成批抄词汇序列,并对序列进行排序和重组;计算批抄的分发数量,对批抄内容进行校验;
批抄管理模块,用于显示批抄词汇对应列表。
所述批抄操作模块进一步包括:批抄解读模块、批抄统计模块、批抄排序模块、批抄表述模块、批抄校验模块;其中,
批抄解读模块,用于将自然语形式的批抄内容进行分解,通过对批抄词库的检索,将所述批抄内容分解为单元词汇和范围词汇,形成批抄词汇序列。
批抄统计模块,用于根据所述批抄解读模块分析出的批抄词汇序列,利用批抄算法中的计算算法自动计算所述批抄范围中批抄的分发数量。
批抄排序模块,用于根据批抄词汇中的顺序属性,利用批抄算法中的排序算法,对所述批抄解读模块分析出的所述批抄词汇序列进行重新排序。
批抄表述模块,用于利用批抄算法中的表述算法,对所述重新排序后的批抄词汇序列进行重组,形成可供公文使用的自然语格式,并按照公文的规定,完成拆行、分段工作。
批抄校验模块,用于校验所述批抄范围中的词汇、顺序、表述、分段是否正确,并对不可分析的内容进行提示,对所述批抄范围中错误的内容进行纠正。
所述批抄管理模块还可以包括:批抄编辑器、批抄提示器;其中,
批抄编辑器,用于让用户编辑所述批抄范围;
批抄提示器,用于显示提示在分析中发现的所述批抄范围中所述不可分析的内容和错误的内容,还用于显示推荐性解决方案。
本发明所提供的文件批抄信息化管理方法和系统,在批抄过程中通过对自然语的分析,识别公文批抄的内容,并将表述性的批抄范围对应到实际范围中;构建了符合党政机关公文批抄管理要求的公文批抄词库,并采用专门的公文批抄算解读自然语性质的批抄内容,对批抄内容进行分析,对录入的批抄内容进行自动校验,进而自动更正错误的批抄内容,如此,不仅能对大批量的文件批抄自动进行处理,而且能使得信息化管理系统中的公文批抄管理更加符合用户的需要。
附图说明
图1为本发明实现文件批抄信息化管理的方法实现流程示意图;
图2为本发明实现文件批抄信息化管理的系统组成结构示意图。
具体实施方式
下面通过附图及具体实施例对本发明再做进一步的详细说明。
实际应用中,对文件批抄实现信息化管理可以有两种方式:一种是调用已有的批抄模板对文件批抄进行管理;另一种是不调用批抄模板完成对文件批抄的管理。
当用户需要调用计算机中已经制定好的批抄模板时,可直接调用批抄模板进行文件批抄作业,将文件发送至批抄模板中的批抄范围。其中,所述批抄模板是在批抄词库的基础上,对常用的固定批抄格式进行数字化模板编排,形成动态的批抄模板。用户在进行公文批抄时,可以调用批抄模板进行批抄,也可以根据需要制定所需模板。
当用户不调用批抄模板对文件批抄进行处理时,如图1所示,图1为不调用批抄模板对文件批抄信息化管理的方法流程图,该方法包括以下几个步骤:
步骤101:获得用户批抄内容;
步骤102:分解用户批抄内容,形成批抄词汇序列,并对序列进行排序和重组;计算批抄的分发数量,对批抄内容进行校验;
具体的,对用户以自然语形式输入的批抄内容对照批抄词库进行分解,并通过对批抄词库的检索,将批抄内容分解为范围词汇中没有的单元词汇和范围词汇,然后将范围词汇分解为单元词汇和分发数量,将所有单元词汇和单元所需的分发数量一一对应,形成批抄词汇序列,该批抄词汇序列只能包含单元词汇和该单元需要分发的文件数量,不能包含范围词汇;利用批抄算法中的排序算法,根据批抄词汇中的顺序属性,即:段位数越小的排序越靠前,段位数一样的,顺序数越小的排序越靠前;对形成的批抄词汇序列进行重新排序;利用批抄算法中的表述算法,对重新排序后的批抄词汇序列进行重组,形成可供公文使用的自然语格式,并按照公文的规定,完成拆行、分段工作;根据形成的批抄词汇序列,利用批抄算法中的计算算法自动计算批抄范围中批抄的分发数量,校验包括对批抄范围中的词汇、顺序、表述、分段等是否正确进行校验,并对不可分析的内容进行提示,根据别名表对错误的内容进行纠正。
其中,利用批抄算法中的计算算法自动计算的方式可以是:对所有需要批抄的文件编号,如1-500号,给公安部需要的文件是100-104号,那么利用批抄算法中的计算算法就可以自动计算出公安部的文件为5份。
其中,批抄词库负责收集、编排公文批抄中的批抄用词,并对批抄用词进行数字化管理,统一汇总、编码和排序,以备在进行文件批抄工作时使用;批抄词库不但规范批抄用语,而且描述了各个批抄词汇间的关系,是批抄信息化的基础。
批抄词库中的批抄用词包括单元词汇和范围词汇,所谓单元词汇,表示可分解的最小批抄词汇;单元词汇包括两部分:被包括在范围词汇中的单元词汇,无法被包括在范围内的单元词汇,例如不属于各大部委的个人等。此类词汇直接对应公文分发范围中的具体分发单位,单元词汇具有一定的批抄属性,比如:批抄名称、单位名称、顺序、段位等;例如,批抄单元词汇“教育”属性如下:
批抄名称:教育局;
单位名称:教育局(实际单位中对应教育局);
顺序:26(在批抄词典中排第26位);
段位:3(在批抄范围中应排在第3段)。
所谓范围词汇,表示一定范围的批抄词汇,此类词汇不对应具体的分发单位,只表示由某些单位组成的特定范围;范围词汇具有范围名称、对应单位范围、顺序、段位等批抄属性,例如,批抄范围词汇“各省、自治区、直辖市”,属性如下:
批抄名称:各省、自治区、直辖市;
单位范围:北京市、天津市、河北省等全国各省、自治区和直辖市
顺序:5(在批抄词典中排第5位);
段位:1(在批抄词典中应排在第1段)。
所谓别名表保存单位的别名,例如最高人民法院的别名是高法,别名表就存储高法,最高人民法院是存储在批抄词库中的但是不是存储在别名表的;在用户输入“高法”时,在对批抄词汇序列进行校验时会对“高法”一词在别名表中搜索,如果有,就自动纠正显示为“最高人民法院”。
步骤103:显示批抄词汇对应列表。
具体的,根据经过分析的批抄词汇以及所对应的批抄范围、分发数量形成批抄词汇对应列表并进行显示;
在步骤103中还可以包括:用户编辑批抄范围,以及如果在分析中发现批抄范围中不可分析的内容或者错误的内容,批抄提示器显示提示,并显示推荐性的解决方案。
为实现上述方法,本发明还提供了一种文件批抄信息化管理的系统,如图2所示,该系统包括:批抄操作模块21、批抄管理模块22;其中,
批抄操作模块21,用于分解用户批抄内容,形成批抄词汇序列,并对序列进行排序和重组;计算公文的分发数量,对批抄内容进行校验;其中,所校验的内容包括词汇、顺序、表述以及分段。
所述批抄操作模块21进一步包括:批抄解读模块211、批抄统计模块212、批抄排序模块213、批抄表述模块214、批抄校验模块215;其中,
批抄解读模块211,用于将自然语形式的批抄内容进行分解,通过对批抄词库的检索,将批抄内容分解为单元词汇和范围词汇,并全部对应至批抄范围,形成批抄词汇序列;
批抄统计模块212,用于根据批抄解读模块211分析出的批抄词汇序列,自动计算批抄范围中公文的分发数量;
批抄排序模块213,用于根据批抄词汇中的顺序属性,利用批抄算法中的排序算法,对批抄解读模块分析出的批抄词汇序列进行重新排序;
批抄表述模块214,用于利用批抄算法中的表述算法,对重新排序后的批抄词汇序列进行重组,形成可供公文使用的自然语格式,并按照公文的规定,完成拆行、分段工作;
批抄校验模块215,用于校验批抄范围中的词汇、顺序、表述、分段是否正确,并对不可分析的内容进行提示,对批抄范围中错误的内容进行纠正。
批抄管理模块22,用于显示批抄词汇对应列表。
所述批抄管理模块22还可以包括:批抄编辑器221、批抄提示器223;其中,
批抄编辑器221,用于让用户编辑批抄范围;
批抄提示器223,用于显示提示在分析中发现的批抄范围中不可分析的内容和错误的内容,还用于显示推荐性解决方案。
下面同样通过一个示例来说明本发明的第一实施例。
在此实施例中,在批抄词典中已备有如下批抄词库:
  批抄名称   单位范围或名称   顺序   段位
  教育   教育局   26   1
  卫生   卫生局   27   1
  各院校   科技大学、理工大学、交通大学、医科大学   1   2
  各处室   办公室、教育处、人事处、财务处   1   3
  档案   档案处   1   10
用户以自然语形式输入以下批抄范围:各处室、存档2、各院校、卫生、教育、区县;
经过批抄解读模块的处理后,用户输入的自然语形式的批抄范围被分解,形成以下批抄词汇序列:
各处室
存档2
各院校
卫生
教育
区县
经批抄排序模块对批抄解读模块处理后形成的批抄词汇序列进行重新排序,形成以下重新排序后的词汇序列:
教育
卫生
各院校
各处室
存档2
区县
经批抄统计模块对批抄解读模块处理后形成的批抄词汇序列,自动计算批抄范围中的公文的分发数量,得到以下内容:
教育:1
卫生:1
各院校:4
各处室:4
存档2:2
统计结果为共12份
因此,在批抄词汇列表中显示出如下内容:
  批抄名称   单位范围或名称   份数
  教育   教育局   1
  卫生   卫生局   1
  各院校   科技大学、理工大学、交通大学、医科大学   4
  各处室   办公室、教育处、人事处、财务处   4
  档案   档案处   2
批抄校验模块对批抄范围中的词汇、顺序、表述、分段进行校验后,发现“区县”未出现在批抄词库中,则在批抄提示器中提示用户:“区县不在批抄词典中,未通过校验”。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (11)

1.一种文件批抄信息化管理方法,其特征在于,该方法包括:
分解用户批抄内容,形成批抄词汇序列,并对所述批抄词汇序列进行排序和重组;计算批抄的分发数量;
显示批抄词汇对应列表。
2.根据权利要求1所述的方法,其特征在于,所述分解用户批抄内容,形成批抄词汇序列具体为:对用户以自然语形式输入的批抄内容对照批抄词库进行分解,通过对所述批抄词库的检索,将所述批抄内容分解为单元词汇和范围词汇,形成批抄词汇序列。
3.根据权利要求1或2所述的方法,其特征在于,所述对批抄词汇序列进行排序具体为:利用批抄算法中的排序算法,根据所述批抄词汇中的顺序属性,对分析出的所述批抄词汇序列进行重新排序;其中,所述顺序属性是段位数小的排序在前,段位数一样时,顺序数小的排序在前。
4.根据权利要求1所述的方法,其特征在于,所述对批抄词汇序列进行重组具体为:利用批抄算法中的表述算法,对所述重新排序后的批抄词汇序列进行重组,形成可供公文使用的自然语格式,并按照公文的规定,完成拆行、分段工作。
5.根据权利要求1所述的方法,其特征在于,所述计算批抄的分发数量具体为:根据形成的所述批抄词汇序列利用批抄算法中的计算算法自动计算所述批抄范围中批抄的分发数量。
6.根据权利要求1所述的方法,其特征在于,该方法还包括对所述批抄内容进行校验,校验所述批抄范围中的词汇、顺序、表述、分段是否正确,并对不可分析的内容进行提示,对错误的内容进行纠正。
7.根据权利要求1所述的方法,其特征在于,所述显示批抄词汇对应列表具体为:根据经过分析的批抄词汇以及所对应的批抄范围、分发数量,形成所述批抄词汇对应列表并进行显示。
8.根据权利要求7所述的方法,其特征在于,所述显示批抄词汇对应列表还包括:用户编辑所述批抄范围,发现所述批抄范围中不可分析的内容或者错误内容,显示提示并显示推荐性的解决方案。
9.一种文件批抄信息化管理的系统,其特征在于,该系统包括:批抄操作模块、批抄管理模块;其中,
批抄操作模块,用于分解用户批抄内容,形成批抄词汇序列,并对序列进行排序和重组;计算批抄的分发数量,对批抄内容进行校验;
批抄管理模块,用于显示批抄词汇对应列表。
10.根据权利要求9所述的系统,其特征在于,所述批抄操作模块进一步包括:批抄解读模块、批抄统计模块、批抄排序模块、批抄表述模块、批抄校验模块;其中,
批抄解读模块,用于将自然语形式的批抄内容进行分解,通过对批抄词库的检索,将所述批抄内容分解为单元词汇和范围词汇,形成批抄词汇序列。
批抄统计模块,用于根据所述批抄解读模块分析出的批抄词汇序列,利用批抄算法中的计算算法自动计算所述批抄范围中批抄的分发数量。
批抄排序模块,用于根据批抄词汇中的顺序属性,利用批抄算法中的排序算法,对所述批抄解读模块分析出的所述批抄词汇序列进行重新排序。
批抄表述模块,用于利用批抄算法中的表述算法,对所述重新排序后的批抄词汇序列进行重组,形成可供公文使用的自然语格式,并按照公文的规定,完成拆行、分段工作。
批抄校验模块,用于校验所述批抄范围中的词汇、顺序、表述、分段是否正确,并对不可分析的内容进行提示,对所述批抄范围中错误的内容进行纠正。
11.根据权利要求9所述的系统,其特征在于,所述批抄管理模块还可以包括:批抄编辑器、批抄提示器;其中,
批抄编辑器,用于让用户编辑所述批抄范围;
批抄提示器,用于显示提示在分析中发现的所述批抄范围中所述不可分析的内容和错误的内容,还用于显示推荐性解决方案。
CN200910217525XA 2009-12-31 2009-12-31 一种文件批抄信息化管理的方法和系统 Pending CN102117430A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910217525XA CN102117430A (zh) 2009-12-31 2009-12-31 一种文件批抄信息化管理的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910217525XA CN102117430A (zh) 2009-12-31 2009-12-31 一种文件批抄信息化管理的方法和系统

Publications (1)

Publication Number Publication Date
CN102117430A true CN102117430A (zh) 2011-07-06

Family

ID=44216189

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910217525XA Pending CN102117430A (zh) 2009-12-31 2009-12-31 一种文件批抄信息化管理的方法和系统

Country Status (1)

Country Link
CN (1) CN102117430A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102693218A (zh) * 2012-05-18 2012-09-26 苏州慧飞信息科技有限公司 一种自动纠正软件
CN108292259A (zh) * 2015-12-04 2018-07-17 微软技术许可有限责任公司 服务引导期间的错误处理
US11256542B2 (en) 2015-12-04 2022-02-22 Microsoft Technology Licensing, Llc Onboarding of a service based on automated supervision of task completion

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102693218A (zh) * 2012-05-18 2012-09-26 苏州慧飞信息科技有限公司 一种自动纠正软件
CN108292259A (zh) * 2015-12-04 2018-07-17 微软技术许可有限责任公司 服务引导期间的错误处理
US10908984B2 (en) 2015-12-04 2021-02-02 Microsoft Technology Licensing, Llc Error handling during onboarding of a service
US11256542B2 (en) 2015-12-04 2022-02-22 Microsoft Technology Licensing, Llc Onboarding of a service based on automated supervision of task completion

Similar Documents

Publication Publication Date Title
Wasi et al. Record linkage using Stata: Preprocessing, linking, and reviewing utilities
CN111930966A (zh) 一种用于数字政务的智能政策匹配方法及系统
Lyon et al. Plagiarism is easy, but also easy to detect
CN108334493B (zh) 一种基于神经网络的题目知识点自动提取方法
CN104463401A (zh) 一种招生信息管理方法及系统
CN101950309A (zh) 一种面向学科领域的新专业词汇识别方法
CN106155652A (zh) 一种多语言数据文件的生成方法和系统
CN105893482A (zh) 发动机试验数据全自动化提取与Word报告生成方法
CN101520693A (zh) 一种批量信息快速输入的方法及系统
CN102117430A (zh) 一种文件批抄信息化管理的方法和系统
CN1722161B (zh) 电子政务协同工作数据标准符合性测试方法
CN111738008B (zh) 基于多层模型的实体识别方法、装置、设备及存储介质
CN113704406A (zh) 一种流行缩略语的中文释义匹配系统与方法
CN102567796A (zh) 数据导入方法和装置
CN110162684B (zh) 基于深度学习的机器阅读理解数据集构建以及评估方法
CN113052544A (zh) 工作流依用户行为智能适配方法、装置以及存储介质
CN110750509A (zh) 一种企业名称查重方法及装置、设备、介质
Shahbaz et al. Automatic generation of extended er diagram using natural language processing
CN115129817A (zh) 一种Word文档大纲抽取的方法
Bezuidenhout et al. A process supported by the utility BBPC for analysing Braun-Blanquet data on a personal computer
CN114118944A (zh) 一种取证实验室分级管理方法、终端设备及存储介质
CN101276331A (zh) 信息统一方法
CN113887345A (zh) 结合ai和rpa的文本信息处理方法、装置及存储介质
KR102009651B1 (ko) 건축관련 법령범위가 전산적으로 설정된 건축규정 법령정보 검색 시스템 및 그 방법
JP2003036261A (ja) 文章自動分類装置、文章自動分類プログラム、文章自動分類方法及び文章自動分類プログラムを記録したコンピュータ読取可能な記録媒体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110706