CN109977073A - 一种法院电子卷宗自动化归档系统及其方法 - Google Patents
一种法院电子卷宗自动化归档系统及其方法 Download PDFInfo
- Publication number
- CN109977073A CN109977073A CN201910180466.7A CN201910180466A CN109977073A CN 109977073 A CN109977073 A CN 109977073A CN 201910180466 A CN201910180466 A CN 201910180466A CN 109977073 A CN109977073 A CN 109977073A
- Authority
- CN
- China
- Prior art keywords
- folder
- electronics
- filing
- catalogue
- electronics folder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000012545 processing Methods 0.000 claims abstract description 18
- 238000012549 training Methods 0.000 claims abstract description 15
- 238000000605 extraction Methods 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 6
- 230000006870 function Effects 0.000 abstract 1
- 239000000463 material Substances 0.000 description 6
- 238000013461 design Methods 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000000739 chaotic effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Tourism & Hospitality (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Technology Law (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种法院电子卷宗自动化归档系统及其方法,使用计算机自动化处理技术,依靠人工智能技术学习训练识别电子卷宗标题的图像特征值,与预设的特征库进行匹配,实现对电子卷宗的自动识别、自动归档功能,并通过学习训练模型不断学习新的种类以获取新的分类特征值,从而不断更新特征库以丰富分类的种类。本发明通过计算机与人工智能想结合的方式,并以人工干预作为辅助,替代原有的人工处理方式对法院的电子卷宗进行归档分类,有效地提高工作效率和归档的准确率;并通过学习训练模型让计算机不断学习适应更多种类的卷宗,进一步完善归档的分类,提升本系统和方法的识别范围。
Description
技术领域
本发明涉及档案管理技术领域,特别是指一种法院电子卷宗自动化归档系统及其方法。
背景技术
目前法院等政府部门存在大量的纸质卷宗材料,将材料进行电子化的工作量非常庞大,电子卷宗的归档一直是采用人工识别文档分类归属,再使用人工将电子卷宗文档拖动到对应分类目录下的方式,不但需要专门的人员进行操作,人工识别分类还存在分类错误、分类不及时、分类信息无存储、检索混乱等问题。
有鉴于此,本发明人针对上述问题上未臻完善所导致的诸多缺失及不便,而深入构思,且积极研究改良试做而开发设计出本发明。
发明内容
本发明的目的在于提供一种法院电子卷宗自动化归档系统及其方法,自动识别电子卷宗文档标题,应用人工智能监督式学习自动按标题分类归档,从而提高电子卷宗归档的效率和准确率。
为了达成上述目的,本发明的解决方案是:
一种法院电子卷宗自动化归档系统,包括待归档目录、归档目录、其它目录,特征库、电子卷宗监视器、处理模块和学习训练模型;
所述待归档目录用以存放待归档的电子卷宗;归档目录用以存放归档成功的电子卷宗;其它目录用以存放归档失败的电子卷宗;特征库用以存放电子卷宗的分类特征值;电子卷宗监视器用以监视待归档目录中的新增电子卷宗并自动编码卷宗号;处理模块用以对编码后的电子卷宗提取图像特征值并将图像特征值与特征库中的分类特征值匹配,根据匹配结果存入归档目录或其它目录;学习训练模型用以学习和训练电子卷宗的图像特征值以获取新的分类特征值并更新特征库;
所述处理模块设有数字特征分类器,用以提取电子卷宗中个人文档的页数的数字特征值并进行计数,与其目录页的信息进行比对。
所述待归档目录中的电子卷宗是通过人工扫描输入的入库卷宗,或是以往未归档的历史电子卷宗。
所述系统设有线程管理器,用以根据卷宗号队列数进行分配线程处理。
基于上述系统,一种法院电子卷宗自动化归档方法,包括以下步骤:
步骤S1.通过电子卷宗自动监视器实时监视待归档目录中的电子卷宗,发现新增电子卷宗时自动编码卷宗号;
步骤S2.处理模块对编码后的电子卷宗的每个文件进行处理:
S2-1.处理模块扫描文件的图像以提取文件的图像特征值,与特征库的分类特征值进行匹配:若匹配成功,转S2-2,若匹配失败,转S2-5;
S2-2.根据匹配的分类特征值,判断文件的属性:若是法院文档,转S2-4,否则转S2-3;
S2-3.通过数字特征分类器,提取目录页以及后续页的文件页数的数字特征值,将后续页的数字特征值与其目录页的信息进行比对:若比对成功,转S2-4,否则转S2-5;
S2-4.将处理过的文件与归档目录进行匹配并存入归档目录;
S2-5.将处理过的文件存入其它目录;
步骤S3.对其他目录的电子卷宗进行处理
S3-1.通过人工干预对其他目录的电子卷宗进行与归档目录匹配并存入归档目录;
S3-2.通过学习训练模型提取其它目录的电子卷宗的图像特征值进行学习和训练,获取新的分类特征值并更新特征库。
采用上述系统和方法后,本发明通过计算机与人工智能想结合的方式,并以人工干预作为辅助,替代原有的人工处理方式对法院的电子卷宗进行归档分类,有效地提高工作效率和归档的准确率;并通过学习训练模型让计算机不断学习适应更多种类的卷宗,进一步完善归档的分类,提升本系统和方法的识别范围。
此外,在处理个人文档时,通过数字特征分类器进行特征值比对,无需遍历扫描整个文件,降低了工作量,加快了特征值比对的速度。
附图说明
图1为本发明具体实施例的系统示意图;
图2为本发明具体实施例的处理流程示意图。
具体实施方式
为了进一步解释本发明的技术方案,下面通过具体实施例来对本发明进行详细阐述。
本发明主要根据法院电子卷宗的特殊性:电子卷宗整体文档中属于法院内部的文书部分,格式和页数都是固定不变的;属于当事人的部分,证据材料相关的文档格式和页数虽然是变化的,但其目录上有提供按顺序索引的各个文档的页数信息。本文中电子卷宗整体文档默认按法院文档和个人文档的顺序摆放。
本发明为一种法院电子卷宗自动化归档系统及其方法,如图1所示,该系统包括待归档目录、归档目录、其它目录,特征库、电子卷宗监视器、处理模块和学习训练模型;
上述待归档目录用以存放待归档的电子卷宗;归档目录用以存放归档成功的电子卷宗;其它目录用以存放归档失败的电子卷宗;特征库用以存放电子卷宗的分类特征值;电子卷宗监视器用以监视待归档目录中的新增电子卷宗并自动编码卷宗号;处理模块用以对编码后的电子卷宗提取图像特征值并将图像特征值与特征库中的分类特征值匹配,并根据匹配结果存入归档目录或其它目录;学习训练模型用以学习和训练电子卷宗的图像特征值以获取新的分类特征值并更新特征库。
上述处理模块设有数字特征分类器,用以提取电子卷宗中个人文档的页数的数字特征值并进行计数,与其目录页的信息进行比对。
上述待归档目录中的电子卷宗是通过人工扫描输入的入库卷宗,或是以往未归档的历史电子卷宗。
上述处理模块还设有线程管理器,用以根据卷宗号队列数进行分配线程处理。
基于上述系统,一种法院电子卷宗自动化归档方法,如图2所示,包括以下步骤:
步骤S1.通过电子卷宗自动监视器实时监视待归档目录中的电子卷宗(包括入库卷宗和历史电子卷宗),发现新增电子卷宗时自动编码卷宗号,线程管理器根据卷宗号队列数分配线程处理。
步骤S2.处理模块对编码后的电子卷宗的每个文件进行处理:
S2-1.处理模块扫描文件的图像以提取文件的图像特征值(相当于获取文件的标题),与特征库的分类特征值进行匹配:若匹配成功,转S2-2;若匹配失败,转S2-5。
S2-2.根据匹配的分类特征值,判断文件的属性:若是法院文档(此时的文件标题为“XX通知书”、“XX判决书”),转S2-4;否则转S2-3。
S2-3.通过数字特征分类器,提取目录页以及后续页的文件页数的数字特征值,将后续页的数字特征值与其目录页的信息进行比对:若比对成功,转S2-4;否则转S2-5。
在步骤S2-2、S2-3中,当扫描到个人文档的图像特征值时,说明接下来的文件是个人文档的目录及其相应材料,则数字特征分类器只需要扫描出目录页的图像特征值并确定所在位置,对后续页只需定位扫描图像特征值以判断当前页是否还属于该类的材料即可,并获取后续页的数字特征值,无需再遍历扫描整个文件。当后续页的数字特征值与其目录页的信息比对失败时,说明个人提交的材料与其目录不一致,或者存在异常情况,这时则需要人工干预。
S2-4.将处理过的文件与归档目录进行匹配并存入归档目录。
S2-5.将处理过的文件存入其它目录。
步骤S3.对其他目录的电子卷宗进行处理
S3-1.通过人工干预对其他目录的电子卷宗进行与归档目录匹配并存入归档目录。
步骤S3-1是为防止打印所导致的纸张模糊、褶皱所导致的图像扫描异常引起的结果偏差,通过人工的方式避免极少数的归档失败的情况发生。
S3-2.通过学习训练模型提取其它目录的电子卷宗的图像特征值进行学习和训练,获取新的分类特征值并更新特征库。
步骤S3-2将归档失败的电子卷宗进行人工智能监督式学习,根据多次提取的特征值及其形态的学习训练和归档目录匹配后达到可识别的程度,转入特征库,以供下一同类的电子卷宗匹配使用。
通过上述系统和方法,本发明采用计算机与人工智能想结合的方式,并以人工干预作为辅助,替代原有的人工处理方式对法院的电子卷宗进行归档分类,有效地提高工作效率和归档的准确率;并通过学习训练模型让计算机不断学习适应更多种类的卷宗,进一步完善归档的分类,提升本系统和方法的识别范围。
此外,在处理个人文档时,通过数字特征分类器进行特征值比对,无需遍历扫描整个文件,降低了工作量,加快了特征值比对的速度。
上述实施例和图式并非限定本发明的产品形态和式样,任何所属技术领域的普通技术人员对其所做的适当变化或修饰,皆应视为不脱离本发明的专利范畴。
Claims (4)
1.一种法院电子卷宗自动化归档系统,其特征在于:包括待归档目录、归档目录、其它目录,特征库、电子卷宗监视器、处理模块和学习训练模型;
所述待归档目录用以存放待归档的电子卷宗;归档目录用以存放归档成功的电子卷宗;其它目录用以存放归档失败的电子卷宗;特征库用以存放电子卷宗的分类特征值;电子卷宗监视器用以监视待归档目录中的新增电子卷宗并自动编码卷宗号;处理模块用以对编码后的电子卷宗提取图像特征值并将图像特征值与特征库中的分类特征值匹配,根据匹配结果存入归档目录或其它目录;学习训练模型用以学习和训练电子卷宗的图像特征值以获取新的分类特征值并更新特征库;
所述处理模块设有数字特征分类器,用以提取电子卷宗中个人文档的页数的数字特征值并进行计数,与其目录页的信息进行比对。
2.如权利要求1所述的一种法院电子卷宗自动化归档系统,其特征在于:所述待归档目录中的电子卷宗是通过人工扫描输入的入库卷宗,或是以往未归档的历史电子卷宗。
3.如权利要求1所述的一种法院电子卷宗自动化归档系统,其特征在于:所述系统设有线程管理器,用以根据卷宗号队列数进行分配线程处理。
4.一种法院电子卷宗自动化归档方法,使用如权利要求1至3任一所述的一种法院电子卷宗自动化归档系统,其特征在于包括以下步骤:
步骤S1.通过电子卷宗自动监视器实时监视待归档目录中的电子卷宗,发现新增电子卷宗时自动编码卷宗号;
步骤S2.处理模块对编码后的电子卷宗的每个文件进行处理:
S2-1.处理模块扫描文件的图像以提取文件的图像特征值,与特征库的分类特征值进行匹配:若匹配成功,转S2-2,若匹配失败,转S2-5;
S2-2.根据匹配的分类特征值,判断文件的属性:若是法院文档,转S2-4,否则转S2-3;
S2-3.通过数字特征分类器,提取目录页以及后续页的文件页数的数字特征值,将后续页的数字特征值与其目录页的信息进行比对:若比对成功,转S2-4,否则转S2-5;
S2-4.将处理过的文件与归档目录进行匹配并存入归档目录;
S2-5.将处理过的文件存入其它目录;
步骤S3.对其他目录的电子卷宗进行处理
S3-1.通过人工干预对其他目录的电子卷宗进行与归档目录匹配并存入归档目录;
S3-2.通过学习训练模型提取其它目录的电子卷宗的图像特征值进行学习和训练,获取新的分类特征值并更新特征库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910180466.7A CN109977073A (zh) | 2019-03-11 | 2019-03-11 | 一种法院电子卷宗自动化归档系统及其方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910180466.7A CN109977073A (zh) | 2019-03-11 | 2019-03-11 | 一种法院电子卷宗自动化归档系统及其方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109977073A true CN109977073A (zh) | 2019-07-05 |
Family
ID=67078508
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910180466.7A Pending CN109977073A (zh) | 2019-03-11 | 2019-03-11 | 一种法院电子卷宗自动化归档系统及其方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109977073A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110020646A (zh) * | 2019-04-16 | 2019-07-16 | 恒生电子股份有限公司 | 文件归档方法、装置、电子设备、及存储介质 |
CN110515929A (zh) * | 2019-08-29 | 2019-11-29 | 掌阅科技股份有限公司 | 书籍展示方法、计算设备及存储介质 |
CN110675289A (zh) * | 2019-09-29 | 2020-01-10 | 四川大学 | 一种随案刑事一审电子卷宗目录编著方法 |
CN110795561A (zh) * | 2019-10-24 | 2020-02-14 | 北京华宇信息技术有限公司 | 一种电子卷宗材料类型自动识别系统及其自主学习方法 |
CN112199330A (zh) * | 2020-09-29 | 2021-01-08 | 广东电网有限责任公司韶关供电局 | 一种混合文档归档方法、归档装置及存储介质 |
CN113139071A (zh) * | 2020-01-30 | 2021-07-20 | 虹光精密工业股份有限公司 | 运用机器学习进行文件分类的文件处理系统及方法 |
CN116991984A (zh) * | 2023-09-27 | 2023-11-03 | 人民法院信息技术服务中心 | 广域协同与体系知识增强的电子卷宗材料处理方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104636469A (zh) * | 2015-02-10 | 2015-05-20 | 广州供电局有限公司 | 文件自动分类管理方法和系统 |
US20160307110A1 (en) * | 2015-04-16 | 2016-10-20 | Data Storage Corporation | Archiving systems and methods using message categorization and classification processes |
CN107833603A (zh) * | 2017-11-13 | 2018-03-23 | 医渡云(北京)技术有限公司 | 电子病历文档分类方法、装置、电子设备及存储介质 |
CN108460130A (zh) * | 2018-03-02 | 2018-08-28 | 北京云知学科技有限公司 | 纸面信息图像化管理方法、装置、电子设备及存储介质 |
-
2019
- 2019-03-11 CN CN201910180466.7A patent/CN109977073A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104636469A (zh) * | 2015-02-10 | 2015-05-20 | 广州供电局有限公司 | 文件自动分类管理方法和系统 |
US20160307110A1 (en) * | 2015-04-16 | 2016-10-20 | Data Storage Corporation | Archiving systems and methods using message categorization and classification processes |
CN107833603A (zh) * | 2017-11-13 | 2018-03-23 | 医渡云(北京)技术有限公司 | 电子病历文档分类方法、装置、电子设备及存储介质 |
CN108460130A (zh) * | 2018-03-02 | 2018-08-28 | 北京云知学科技有限公司 | 纸面信息图像化管理方法、装置、电子设备及存储介质 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110020646A (zh) * | 2019-04-16 | 2019-07-16 | 恒生电子股份有限公司 | 文件归档方法、装置、电子设备、及存储介质 |
CN110020646B (zh) * | 2019-04-16 | 2021-07-27 | 恒生电子股份有限公司 | 文件归档方法、装置、电子设备、及存储介质 |
CN110515929A (zh) * | 2019-08-29 | 2019-11-29 | 掌阅科技股份有限公司 | 书籍展示方法、计算设备及存储介质 |
CN110515929B (zh) * | 2019-08-29 | 2023-03-31 | 掌阅科技股份有限公司 | 书籍展示方法、计算设备及存储介质 |
CN110675289A (zh) * | 2019-09-29 | 2020-01-10 | 四川大学 | 一种随案刑事一审电子卷宗目录编著方法 |
CN110675289B (zh) * | 2019-09-29 | 2023-05-05 | 四川大学 | 一种随案刑事一审电子卷宗目录编著方法 |
CN110795561A (zh) * | 2019-10-24 | 2020-02-14 | 北京华宇信息技术有限公司 | 一种电子卷宗材料类型自动识别系统及其自主学习方法 |
CN113139071A (zh) * | 2020-01-30 | 2021-07-20 | 虹光精密工业股份有限公司 | 运用机器学习进行文件分类的文件处理系统及方法 |
CN113139071B (zh) * | 2020-01-30 | 2023-10-24 | 虹光精密工业股份有限公司 | 运用机器学习进行文件分类的文件处理系统及方法 |
CN112199330A (zh) * | 2020-09-29 | 2021-01-08 | 广东电网有限责任公司韶关供电局 | 一种混合文档归档方法、归档装置及存储介质 |
CN116991984A (zh) * | 2023-09-27 | 2023-11-03 | 人民法院信息技术服务中心 | 广域协同与体系知识增强的电子卷宗材料处理方法及系统 |
CN116991984B (zh) * | 2023-09-27 | 2024-01-12 | 人民法院信息技术服务中心 | 广域协同与体系知识增强的电子卷宗材料处理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109977073A (zh) | 一种法院电子卷宗自动化归档系统及其方法 | |
DE60315506T2 (de) | Identifizierung von kritischen merkmalen in einem geordneten skala-raum | |
US6917709B2 (en) | Automated search on cursive records not having an ASCII index | |
DE69631457T2 (de) | Vorrichtung und verfahren zum übertragbaren indexieren von dokumenten gemäss einer n-gram-wortzerlegung | |
CN103699523B (zh) | 产品分类方法和装置 | |
DE69721951T2 (de) | Verfahren und Gerät zum Fingerabdruckvergleich mit auf lokaler Merkmalübereinstimmung basierter Transformationsparametergruppenbildung | |
DE69731418T2 (de) | Such- und Wiederauffindungssystem für Dokumente mit Suchverfahren von teilweise passenden, benutzergezeichneten Anmerkungen | |
CN103995904B (zh) | 一种影像档案电子资料的识别系统 | |
CN104636469A (zh) | 文件自动分类管理方法和系统 | |
CN108280051B (zh) | 一种文本数据中错误字符的检测方法、装置和设备 | |
CN109658062A (zh) | 一种基于深度学习的电子档案智能处理方法 | |
CN106709032A (zh) | 抽取电子表格文档中结构化信息的方法及装置 | |
US20170193291A1 (en) | System and Methods for Determining Language Classification of Text Content in Documents | |
EP1671262B1 (de) | Verfahren und system zum erfassen von daten aus maschinell lesbaren dokumenten | |
CN104361096B (zh) | 一种基于特征富集区域集合的图像检索方法 | |
Akram et al. | Document Image Processing- A Review | |
CN109583438A (zh) | 电子图像的文字的识别方法及图像处理装置 | |
Seth et al. | Segmenting tables via indexing of value cells by table headers | |
CN113901933B (zh) | 基于人工智能的电子发票信息抽取方法、装置及设备 | |
Chae et al. | Spam filtering email classification (SFECM) using gain and graph mining algorithm | |
FI20176151A1 (en) | A heuristic method for analyzing the contents of an electronic document | |
CN110516674A (zh) | 一种文本图像的手写汉字分割方法及系统 | |
Nion et al. | Handwritten information extraction from historical census documents | |
CN109359090A (zh) | 基于卷积神经网络的文件碎片分类方法及系统 | |
CN102841888B (zh) | 一种快速排版系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190705 |
|
WD01 | Invention patent application deemed withdrawn after publication |