CN117251526B - 一种会议档案数字化管理系统、方法及电子设备 - Google Patents

一种会议档案数字化管理系统、方法及电子设备 Download PDF

Info

Publication number
CN117251526B
CN117251526B CN202311143070.8A CN202311143070A CN117251526B CN 117251526 B CN117251526 B CN 117251526B CN 202311143070 A CN202311143070 A CN 202311143070A CN 117251526 B CN117251526 B CN 117251526B
Authority
CN
China
Prior art keywords
conference
data
digital
archive
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311143070.8A
Other languages
English (en)
Other versions
CN117251526A (zh
Inventor
杨进玉
伍智濂
刘旭峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Yunsi Intelligent Information Technology Co ltd
Original Assignee
Shanghai Yunsi Intelligent Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Yunsi Intelligent Information Technology Co ltd filed Critical Shanghai Yunsi Intelligent Information Technology Co ltd
Priority to CN202311143070.8A priority Critical patent/CN117251526B/zh
Publication of CN117251526A publication Critical patent/CN117251526A/zh
Application granted granted Critical
Publication of CN117251526B publication Critical patent/CN117251526B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Strategic Management (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种会议档案数字化管理系统、方法及电子设备,所述会议档案数字化管理系统包括:档案生成模块,对会议数据信息经过数字化处理生成数字化档案信息;目录管理模块,对所述数字化档案信息基于元数据管理策略建立数字化档案目录;档案管理模块,对所述数字化档案信息基于预设的档案管理规范进行处理,建立数字化档案资源库;档案利用与可视化模块,基于所述数字化档案资源库实现档案可视化和/或多维度检索。本发明通过建立起系统化的数字化档案资源库,提高档案管理效率和准确性;通过减少纸质档案使用和存储,实现绿色环保,降低成本;支持远程共享和访问,便于用户随时随地共享和访问会议资料,实现协同办公,提供工作效率。

Description

一种会议档案数字化管理系统、方法及电子设备
技术领域
本发明属于计算机系统领域,涉及一种会议档案数字化管理系统,特别是涉及一种会议档案数字化管理系统、方法及电子设备。
背景技术
近年来,经济全球化、社会信息化的浪潮深刻影响着人类社会历史发展的进程,同时也深刻地改变着人们工作、生活和思维的方式。随着政府/企事业单位部门规模的不断壮大,内部信息化/数字化系统应运而生。会议系统内部数字化文件(包含结构化/非结构化)数据也在保持持续的增长。会议系统内部会设置相应的业务角色、业务环节、业务规则,业务参数等,并逐渐形成一定的流程和规范。不管是固化的流程,还是动态调整的流程,每个流程节点,必定有数据沉淀下来,这里面蕴含了的巨大的“数据资产的影子”,但很多数据都是来源多样、形式不同、杂乱无章的非结构化数据,不仅没有被有序整合到一起,也没有依据统一的数据标准化规范和流程,进行有效的关联、清洗、处理、细分,甚至从来就没有被应用过,反而增加了存储、服务器方面的成本。
同时,在信息化、数字化之前,政府/企事业单位在会议全生命周期中会产生的大量的纸质文档,包括议程、会议记录、会议决议等,这些文件不仅数量庞大,而且很难管理和存储。传统的管理方式需要大量时间和经费,还容易因为人为原因而导致丢失、错乱和泄露。
发明内容
本发明的目的在于提供一种会议档案数字化管理系统、方法及电子设备,用于解决现有会议文件难以管理和存储、管理成本高以及信息安全性低的问题。
第一方面,本发明提供一种会议档案数字化管理系统,所述会议档案数字化管理系统包括:档案生成模块,对会议数据信息经过数字化处理生成数字化档案信息;目录管理模块,对所述数字化档案信息基于元数据管理策略建立数字化档案目录;档案管理模块,对所述数字化档案信息基于预设的档案管理规范进行处理,建立数字化档案资源库;档案利用与可视化模块,基于所述数字化档案资源库实现档案可视化和/或多维度检索。
在第一方面的一种实现方式中,所述档案生成模块包括:档案生成单元,用于将纸质类数据信息和/或电子类数据信息进行数字化处理转换成数字化档案信息。
在第一方面的一种实现方式中,所述数字化处理包括文本检测和文本识别;所述文本检测用于对会议数据信息进行定位,检测出所述会议数据信息中的文字区域位置;所述文字识别用于对所述文字区域位置的文字进行识别解码,以获取对应的文字信息。
在第一方面的一种实现方式中,所述目录管理模块包括:路径规范单元,对所述数字化档案信息生成规范化存储路径;路径标准化单元,对规范化存储路径的数字化数据档案信息经元数据管理策略处理,生成标准化存储路径。
在第一方面的一种实现方式中,所述元数据管理策略包括元模型、数据处理和数据管理;所述元模型用于将所述数字化数据档案信息中的元数据按照数据驱动管理方式进行存储;所述数据处理基于用户需求对所述数字化数据档案信息中的元数据进行数据处理;所述数据管理用于描述所述数字化数据档案信息中的元数据的全生命周期过程。
在第一方面的一种实现方式中,所述档案管理模块包括:预归档处理单元,根据预设的归档范围和归档规则,用于将所述数字化档案信息进行预归档处理;正式归档处理单元,将经过预归档处理的所述数字化档案信息,基于元数据管理策略生成数字化档案资源库。
在第一方面的一种实现方式中,所述档案管理模块还包括:档案存储单元,用于存储所述数字化档案信息;档案规范化管理单元,基于预设的档案管理规范对所述数字化档案信息进行管理。
在第一方面的一种实现方式中,所述档案管理模块还包括:档案分级分权管理单元,基于所述数字化档案信息的类型进行分级分权。
在第一方面的一种实现方式中,所述档案利用与可视化模块包括:档案检索单元,用于根据用户检索内容在数字化档案资源库内检索;可视化单元,用于展示所述数字化档案相关信息。
在第一方面的一种实现方式中,所述会议档案数字化管理系统还包括:权限管理模块,权限管理模块包括分配系统权限、修改系统权限、分配查询权限、修改查询权限。
第二方面,本发明提供一种会议档案数字化管理方法,所述会议档案数字化管理方法包括:将会议数据信息经过数字化处理生成数字化档案信息;其中,所述会议数据信息包括纸质类档案信息和电子类档案信息;对所述数字化档案信息基于元数据管理策略建立数字化档案目录;对所述数字化档案信息基于预设的档案管理规范进行处理,建立数字化档案资源库;基于所述数字化档案资源库实现档案可视化和/或多维度检索。
第三方面,本发明提供一种电子设备,包括上述所述的会议档案数字化管理系统。
如上所述,本发明所述的一种会议档案数字化管理系统、方法及电子设备,具有以下有益效果:
1、通过将会议的会议数据信息(包括纸质类数据信息和电子类数据信息)进行数字化处理,从而建立起完备、系统化的数字化档案资源库,提高会议档案的管理效率和准确性,便于管理和查阅;通过减少纸质档案的使用和存储,实现绿色环保,降低档案管理成本;数字化档案资源库支持远程共享和访问,便于用户随时随地共享和访问会议资料,实现协同办公,提高了工作效率。
2、通过档案利用与可视化模块,政府工作人员能够实现快速检索和分类存储,大幅减少查找和整理会议档案的时间和成本。同时,还能够实现智能搜索和推荐,帮助公众更加便捷地查阅和获取政府会议资料。
3、构建的数字化档案资源库,具备档案分级分权管理功能,能够实现严格的权限管理,保护会议资料的机密性和完整性。同时,数字化档案资源库还能够实现备份和灾备,避免了因灾难等原因导致会议资料丢失的风险。
附图说明
图1显示为本发明第一实施例所述的会议档案数字化管理系统结构示意图。
图2显示为本发明第二实施例所述的会议档案数字化管理系统结构示意图。
图3显示为本发明第三实施例所述的会议档案数字化管理系统结构示意图。
图4a显示为本发明实施例所述的会议全生命周期内会议创建结构化存储示意图。
图4b显示为本发明实施例所述的会议流程BPM规范化数据模板示意图。
图4c显示为本发明实施例所述的会议全生命周期内会议投票结构化存储示意图。
图4d显示为本发明实施例所述的会议任务表结构化存储示意图。
图5显示为本发明实施例所述的CTPN处理结构示意图。
图6a显示为本发明实施例所述的技术元模型结构示意图。
图6b显示为本发明实施例所述的元模型建模示意图。
图6c显示为本发明实施例所述的会议纪要模型示意图。
图6d显示为本发明实施例所述的会议纪要存储示意图。
图7a显示为本发明实施例所述的DataX Web业务数据ETL处理框架示意图。
图7b显示为本发明实施例所述的会议元数据处理流程示意图。
图7c显示为本发明实施例所述的任务管理示意图。
图8显示为本发明实施例所述的会议纪要结构化档案存储示意图。
图9a显示为本发明实施例所述的会议档案利用与可视化模块结构示意图。
图9b显示为本发明实施例所述的会议数字化档案的星座模型结构示意图。
图9c显示为本发明实施例所述的基于标签的会议数字化档案检索应用示意图。
图9d显示为本发明一实施例会议内容档案可视化看板示意图。
图9e显示为本发明另一实施例中会议内容档案可视化看板示意图。
图10显示为本发明第四实施例所述的会议档案数字化管理系统结构示意图。
图11显示为本发明实施例所述的会议档案数字化管理系统模块间工作原理示意图。
图12显示为本发明实施例所述的会议档案数字化管理方法流程示意图。
图13显示为本发明实施例所述的电子设备结构示意图。
元件标号说明
100 会议档案数字化管理系统系统
110 档案生成模块
111 档案生成单元
120 目录管理模块
121 路径规范单元
122 路径标准化单元
130 档案管理模块
131 预归档处理单元
132 正式归档处理单元
133 档案存储单元
134 档案规范化管理单元
135 档案分级分权管理单元
140 档案利用与可视化模块
141 档案检索单元
142 可视化单元
150 权限管理模块
200 电子设备
S1~S4 步骤
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还能够通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也能够基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征能够相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
数字化会议档案技术,通过将纸质会议档案数字化,实现了全面、高效和安全的会议资料管理。数字化会议档案技术包括了多种技术手段,包括文档扫描、文本识别(OCR)、归档存储、检索查询等功能,能够将传统的纸质档案转换成数字档案,并能够进行分类、存储、检索和共享。
当前政府/企事业单位等,会对会议档案,有“统一规划、统一标准,统一权限”为导向的管理机制,从会议档案收集、会议档案管理、会议档案利用、会议档案存档/销毁等都有明确的要求和管理目标。数字化会议档案技术的出现,不仅大大提高了工作效率,也减少了会议档案管理所需要的空间、时间和人力成本。此外还提高了信息安全性,防止了恶意泄露和误操作的风险,保障了会议档案的机密性和完整性。因此,数字化会议档案技术的出现是信息化时代对会议管理要求的必然产生,有着重要的现实意义和社会意义。
本发明以下实施例提供了一种会议档案数字化管理系统、方法及电子设备,通过将会议数据信息(包括纸质类数据信息和电子类数据信息)进行数字化处理,从而建立起完备、系统化的数字化档案资源库,提高会议档案的管理效率和准确性,便于管理和查阅;通过减少纸质档案的使用和存储,实现绿色环保,降低纸质档案管理成本;数字化档案资源库支持远程共享和访问,便于用户随时随地共享和访问会议资料,实现协同办公,提高了工作效率。通过档案利用与可视化模块,政府工作人员能够实现快速检索和分类存储,大幅减少查找和整理会议档案的时间和成本。同时,还能够实现智能搜索和推荐,帮助公众更加便捷地查阅和获取政府会议资料。构建的数字化档案资源库,具备档案分级分权管理功能,能够实现严格的权限管理,保护会议资料的机密性和完整性。同时,数字化档案资源库还能够实现备份和灾备,避免了因灾难等原因导致会议资料丢失的风险。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行详细描述。
参阅图1所示,本发明一实施例提供一种会议档案数字化管理系统,所述会议档案数字化管理系统100包括档案生成模块110、目录管理模块120、档案管理模块130和档案利用与可视化模块140:其中,所述档案生成模块110对会议数据信息进行数字化处理生成数字化档案信息;所述目录管理模块120基于元数据管理策略对所述数字化档案信息进行处理,建立数字化档案目录;所述档案管理模块130基于预设的档案管理规范进对所述数字化档案信息行处理,建立数字化档案资源库;所述档案利用与可视化模块140基于所述数字化档案资源库实现档案可视化和/或多维度检索。
需要说明的是,会议档案数据(即会议数据信息)收集是可以面向政府/企事业单位等任意类型的组织或单位,例如,包括两方面档案资料收集,一方面是目前还遗留部分纸质化会议材料和档案,另一方面是政府/企事业单位会议管理数字化之后生成的电子类会议材料和档案。
参阅图2所示,于本发明一实施例中,所述档案生成模块110包括档案生成单元111,所述档案生成单元111用于将纸质类数据信息和/或电子类数据信息进行数字化处理转换成数字化档案信息。
于本发明一实施例中,所述数字化处理包括文本检测和文本识别;所述文本检测用于对会议数据信息进行定位,检测出所述会议数据信息中的文字区域位置;所述文字识别用于对所述文字区域位置的文字进行识别解码,以获取对应的文字信息。
例如:参阅图3所示,会议档案数据收集面向政府/企事业单位,一方面,对目前还遗留部分纸质化会议材料和档案,在数字化的进程和趋势中,需要通过OCR技术或高拍扫描等技术,进行数字化加工和转换,将纸质的会议资料转化为数字化的资料,进行会议归档、编目、存储等操作,形成政府/企业的会议档案库。
另一方面,政府/企业会议管理数字化以后(例如,部署了数字化会议管理系统,如云思企会通系统),形成下述10类结构化或非结构化数据,会快速、自动化帮助政府/企业构建会议全过程的会议数字化档案资源库。数字化会议档案是建立会议全生命周期的会议数据档案,使得会议内容可回顾、可追溯,是企业会议知识沉淀的重要一环。
具体地,参阅图4a-4b所示,通过数字化会议档案模块从会议全生命周期的管理为出发点,包含了:10类结构化或非结构化数据,构建包括会议全过程内容的会议档案。
1、会议室的预定信息,包含线下混合场景信息,结构化存储;
2、参会人员、会议角色(主持人、汇报人、参会人、纪要人、会务服务人员)等由发起人在系统创建,结构化存储(参阅图4a所示);
3、会议流程BPM(Business Process Management,业务流程管理)规范化数据(风暴型、议事型、讨论型、广播型)模板,结构化存储(参阅图4b所示);
4、会议基本信息(会议时间、主题、议题、资料)通过会议发起人设置、上传,非结构化存储;
5、会议签到数据(扫码签到、人脸签到、会议无纸化终端笔记签到等),结构化存储;
6、会议过程中,汇报人在会议平板,无纸化终端的“批注&电子白板”数据,会自动同步至会议服务器,做非结构化存储;
7、会议过程中,投票评分数据,通过会议发起人会前设置投票评分表单,会议过程中参会人进行投票评分,统计汇总至应用服务器,结构化存储(参阅图4c所示);
8、会议过程中,产生的语音转写文件和原始音频文件,非结构化存储于服务器;
9、会议过程中,发起“会议录像”(企业培训会议/法院庭审/政府政策法规发布等)的视频文件,非结构化存储于服务器;
10、会议纪要、会议待办通过会议记录员在会后创建并共享发布,结构化存储(参阅图4d所示)。
OCR(Optical Character Recognition,光学字符识别)是指对文本资料进行扫描后对图像文件进行分析处理,以获取文字及版面信息的过程。一般来说,在获取到文字之前需要首先对文字进行定位,即执行文本检测任务,将图像中的文字区域位置检测出来;在找到文本所在区域之后,对该区域中的文字进行文字识别。文字识别就是通过输入文字图片,然后解码成文字的方法。OCR解码是文字识别中最为核心的问题。传统技术解决方案中,分别训练文本检测和文字识别两个模型,然后在实施阶段将这两个模型串联到数据流水线中组成图文识别系统。
文本检测任务,主要包括两种场景,一种是简单场景,另一种是复杂场景。简单场景主要是对印刷文件等的文本检测,例如像书本扫描、屏幕截图,或是清晰度高、规整的照片等。由于印刷字体的排版很规范,背景清晰,现在的检测、识别技术已经很成熟了,检测的效果都比较好。复杂场景主要是指自然场景,由于光照环境以及文字存在着很多样的形式,例如会议文件存在角度倾斜、变形、背景复杂、光线忽明忽暗、清晰度不足等情况,这时要将文本检测出来难度就比较大了,此时主要考虑引入深度学习模型进行检测。
OCR一般由下面的步骤组成:首先是读取输入的图像,提取图像特征,因此,需要有个卷积层用于读取图像和提取特征;然后,由于文本序列是不定长的,因此需要处理不定长序列预测的问题;再次,为了提升模型的适用性,最好不要要求对输入字符进行分割,直接可进行端到端的训练,这样可减少大量的分割标注工作,这时就要引入CTC模型(Connectionist temporal classification,联接时间分类)来解决样本的分割对齐的问题;最后,根据一定的规则,对模型输出结果进行纠正处理,输出正确结果。
CTPN(Connectionist Text Proposal Network,连接文本区域网络)是在ECCV2016中提出的一种文本检测模型。CTPN是从Faster RCNN(Region-based ConvolutionalNeural Network,基于深度学习R-CNN系列目标检测最好的方法)改进而来的,结合了CNN与LSTM深度网络,能有效的检测出复杂场景的横向分布的文字,是非常经典的文本检测模型。CTPN是基于Anchor的算法,在检测横向分布的文字时能得到较好的效果。CTPN结构与Faster R-CNN基本类似,但是加入了LSTM层。
参阅图5所示,假设输入N张图片,首先,利用VGG提取特征,获得大小为N×C×H×W(批次N×通道×高×宽)的conv5feature map;然后,在conv5上做3×3的滑动窗口,即每个点都结合周围3×3区域特征以获得一个长度为3×3×C的特征向量。输出N×9C×H×W的feature map,该特征显然只有CNN学习到的空间特征;再将这个feature map进行Reshape,Reshape:Nx9CxHxW→(NH)xWx9C;然后,以Batch=NH且最大时间长度Tmax=W的数据流输入双向LSTM,学习每一行的序列特征。双向LSTM输出(NH)×W×256,再经Reshape恢复形状:Reshape:(NH)xWx256→Nx256xHxW,该特征既包含空间特征,也包含了LSTM学习到的序列特征;然后经过“FC”卷积层,变为N×512×H×W的特征;最后经过类似Faster R-CNN的RPN(Region Proposal Network,区域候选网络)网络,获得text proposals。其中,LSTM(Longshort-term memory,长短期记忆)是一种特殊的RNN(Recurrent Neural Network,循环神经网络),主要是为了解决长序列训练过程中的梯度消失和梯度爆炸问题。简单来说,就是相比普通的RNN,LSTM能够在更长的序列中有更好的表现。
CTPN网络最后输出的预测参数包括三部分:纵向坐标(vertical coordinates),表示每一个box的中心点x坐标和高度;分数(scores),表示是否是文本区域的置信度;水平偏移量(side-refinement)用于精修文本框的左右边缘部分,表示对于左右两侧边界处box的坐标偏移值。具体的数量如下:2k个vertical coordinate,因为一个anchor用的是中心位置的高(y坐标)和矩形框的高度两个值表示的,所以一共2k个输出。2k个score,因为预测了k个text proposal,所以有2k个分数,text和non-text各有一个分数。k个side-refinement,这部分主要是用来精修文本行的两个端点的,表示的是每个proposal的水平平移量。这样就能够得到一个密集预测的text proposal,接下来使用一个标准的非极大值抑制算法(NMS)来滤除多余的box。最后使用基于图的文本行构造算法,将得到的文本段合并成文本行。构造文本行的方法是,令每两个相近的anchor组成一个pair,然后合并不同的pair直到无法再合并,这就构成了一个文本区域。最后,CTPN的loss分为三部分:(1)预测每个anchor是否包含文本区域的classification loss;(2)文本区域中每个anchor的中心y坐标cy与高度h的regression loss;(3)文本区域两侧anchor的中心x坐标cx的regressionloss。
参阅图2所示,于本发明一实施例中,所述目录管理模块120包括路径规范单元121和路径标准化单元122;所述路径规范单元121对所述数字化档案信息生成规范化存储路径;所述路径标准化单元122对规范化存储路径的数字化数据档案信息经元数据管理策略处理,生成标准化存储路径。
例如,通过字符矩阵,会生成具有2层目录的文件夹,第一层目录包括:256个目录文件夹,每一个目录文件夹中会生成第二层:256个子目录,所以一共为:256*256个路径。其中,字符矩阵是一种由四个符号学要素组成的显示的矩阵图式;字符矩阵是一种不同于数值矩阵的特殊的符号表达式,数值矩阵不能参与符号运算,若要参与的话,应该首先转化为符号矩阵;符号矩阵是一种特殊的符号表达式。
元数据管理标准为:
1、规范和记录档案文件路径:如某个会议资料文件:/5C/91/会议文件.JPG;
2、记录该文件:会议文件.JPG的ETL处理过程,如经过了OCR、数据清洗和文本化,生成了文件/5C/91/会议文件-时间戳.word在数据化档案构建过程后,加了文件标签“XX会”生成了文件:/5C/91/XX会-会议文件-时间戳.pdf以供后续的应用、检索调用;
3、整个会议档案“源文件”,经过了哪些加工,清洗、操作,最终生成“目标文件”供后续应用和程序调用的过程,都叫做元数据管理,这些元数据会按照一定结构存储“元数据映射关系表”。
因此,元数据管理策略即为根据预设的元数据管理标准对数字化档案信息进行处理标记、命名标记、记录标记、存储标记等。
于本发明一实施例中,所述元数据管理策略包括元模型、数据处理和数据管理;所述元模型用于将所述数字化数据档案信息中的元数据按照数据驱动管理方式进行存储;所述数据处理基于用户需求对所述数字化数据档案信息中的元数据进行数据处理;所述数据管理用于描述所述数字化数据档案信息中的元数据的全生命周期过程。
需要说明的是,元数据本身内容非常丰富,包括技术元数据、业务元数据和操作元数据,以技术元数据为例,比如数据库、数据表、字段、分区、视图、索引、函数等。所述元模型用来定义元数据的标准、结构、语义、关键字段的“增删改查”等信息。
具体地,会议数字化档案资产目录,宏观上看具有数据“字典”的作用,能够帮助企业相关业务和技术人员快速定位数据,解释数据,找到数据,并从中提取业务价值。作为梳理工作的核心,构建数据资产目录,首先需要对企业的业务进行分析,来确定该企业数据的价值分布和需求点。
会议档案资产目录,由元模型、控制策略、数据管理三部分组成。数据资产目录,是以元数据为核心,按照分类、主题、应用多个角度对数据进行管理、识别、定位、发现、评估、共享的数据组织管理工具。元模型用来定义元数据的标准、结构、语义、关键字段的“增删改查”等信息。控制策略包括所有数据处理、应用过程,需要基于数据资产目录中的配置信息予以驱动控制。数据管理包括数据质量、问题监控、变更报告、血缘分析、影响分析以及业务术语管理等应用能力。
会议元模型中,数据目录都应该有一个统一的元模型,一些是关系型的(会议预定、待办督办等),一些是非关系型的(会议资料:ppt\pdf\word\excel\音视频等)。但在概念层面,它们都代表相同的实体。诸如数据集、数据表、数据字段、数据系统、应用程序、分类、业务术语表、数据血缘之类的东西。因此,创建会议管理的元模型以按照企业数据驱动管理的要求方式存储元数据是非常必要的。这将元数据处理到集中的数据目录或其他模块需要的接口非常有用。对于会议业务元数据,以系统的方式存储所有元数据而不是维护电子表格。管理元数据并将它们映射到流程、资产、策略和人员中能够为数据资产提供整体概览和语义。这不仅有助于管理层做出明智的决定,还有助于业务和技术掌握数据的核心并保持控制。元数据管理对于风险管理也非常重要,能够帮助最大限度地减少风险,满足合规要求。会议档案管理技术元模型相对思路和方法统一,参阅图6a-6c所示;图6a显示为本发明实施例所述的技术元模型示意图,图6b显示为本发明实施例所述的元模型建模示意图,图6c显示为本发明实施例中会议纪要模型示意图。
具体的,参阅图6d所示,会议纪要的建模和存储,存储了纪要编号、名称、纪要内容、以及语音文本的映射关系。
控制策略提供了端到端会议数据处理视图。让用户能够充分了解会议业务流程或实体如何与IT数据处理技术相关联。例如:当一个应用程序按计划运行时,必须有一个作业用于计划运行,该作业负责创建创建一些业务价值所需的数据集。利用开源ETL工具DataXWeb实现会议业务各类主题域的数据清洗、转换、编码、规范化处理,并加载到档案库(参阅图7a所示)。
参阅图7a所示,DataX Web由datax-admin和datax-executor两服务组成。datax-admin为调度中心,负责任务的调度;datax-executor为任务执行器,负责任务执行处理,支持集群部署,支持执行器多节点路由策略选择,支持超时控制、失败重试、失败告警、任务依赖,执行器CPU、内存、负载的监控等等。
数据管理是对数据采集、存储、加工和展现等数据全生命周期的描述信息,帮助用户理解数据关系和相关属性(例如,参阅图7b所示,显示为会议业务元数据处理基本逻辑的全周期内容)。元数据管理工具能够了解数据资产分布及产生过程。实现元数据的模型定义并存储,在功能层包装成各类元数据功能,最终对外提供应用及展现;提供元数据分类和建模、血缘关系和影响分析,方便数据的跟踪和回溯(参阅图7c所示)。
通过数据资产目录的建立,同样也包含两个方面,历史的存量的纸质档案数字化后的目录编目,和通过智慧会议管理系统自动化生产的数字化档案目录编目。
参阅图2所示,于本发明一实施例中,所述档案管理模块130包括预归档处理单元131和正式归档处理单元132;所述预归档处理单元131根据预设的归档范围和归档规则,用于将所述数字化档案信息进行预归档处理;所述正式归档处理单元132将经过预归档处理的所述数字化档案信息,基于元数据管理策略生成数字化档案资源库。
参阅图2所示,于本发明一实施例中,所述档案管理模块130还包括档案存储单元133和档案规范化管理单元134;所述档案存储单元133用于存储所述数字化档案信息;所述档案规范化管理单元134基于预设的档案管理规范对所述数字化档案信息进行管理。
参阅图2所示,于本发明一实施例中,所述档案管理模块130还包括档案分级分权管理单元135;所述档案分级分权管理单元135基于所述数字化档案信息的类型进行分级分权。
具体的,如前面所述示例1中的智慧会议系统,其中的非机构化会议材料/文件,会在后续处理中进行“预归档”,通过预先配置归档范围,归档元数据(数据来源、归档路径、数据清洗转换逻辑、结构化存储数据字典等)、以及预先设置的归档规则,进行会议材料、文件的预归档处理,最后经过会议资料签署人员的电子签签章/电子签名后,文件固话,结合电子签章,实现电子文件单轨制、会议档案双套制的全生命周期管理;自动化接受正式归档,形成政府/企业会议数字化档案资源库。解决会议全程业务数字化,档案与业务充分解耦,实现数字会议档案资源统一编目、集中管理、分级分权、资源共享,方面后续的管理和再利用。
会议内容预归档,系统提供“预归档库”功能,通过接收接口捕获归档文件和元数据,同时保持电子档案内容、元数据、组件之间的联系,能够按照业务数据的形式管理和展现,通过建立业务元数据和档案元数据的之间的映射规则,实现文件批量成件。支持多类型原文合并成件。
会议内容接收归档,支持在线接收和离线接收的方式,能够保存处理过程信息。支持多种方式自动导入会议数字化档案资源库,保存接收归档的处理记录。包括自动归档失败,进行手动接收归档的数据记录;提供统一标准Web Service/REST接口接收会议内容档案数据,能够提供数据源自动抓取,并且对源数据字段和目标字段实现关联映射,实现数据的自动抓取(参阅图8所示,显示为会议纪要结构化档案存储示意图)。
会议数字化档案管理的最终目的,都是为了对会议信息的集中统一管理,依托于智能化的检索手段以及网络信息优势,提升集中统一管理的效率和政策,推动会议电子档案(会议资料、音频、录像)和会议自动转写文本,纪要、待办等与之间能够相互查询,为实际工作提供更为快捷的会议数字化档案信息管理服务,高效推动信息资源共建共享,避免企业人员之间的信息不平,依托于信息化,将企业会议相关的各类档案包括纸质档案、声像档案、会议纪要档案、会议人事任命、项目工程图纸档案等进行数字化处理,推动档案数字化建设,并将档案信息与其他的管理系统、办公系统进行关联,推动整体工作效率的提升。
参阅图2所示,于本发明一实施例中,所述档案利用与可视化模块140包括档案检索单元141和可视化单元142;所述档案检索单元141用于根据用户检索内容在数字化档案资源库内检索;所述可视化单元142用于展示所述数字化档案相关信息。
具体的,参阅图9a所示,档案利用与可视化模块,核心处理流程分4个环节:
(1)ETL数据清洗与转换环节。通过开源ETL工具Data-X,进行会议电子档案、数字化档案等数据进行,数据清洗、数据转换、处理缺失值、删除重复项、处理离群值、转换格式和类型、归一化数据、集成数据、转换数据、简化数据、清理优化脏数据,统一数据格式,进行数据标准化操作,提高数据质量。保证后续数据建模和模型的高效性和准确性;
(2)数据建模环节。结合会议档案检索、内容可视化等需求,进行星型/雪花型、维度模型等基于单维、多维度分析建模。将会议业务中的数据转化为可理解、可操作的概念的过程。帮助政府/企业管理人员理解数据。通过实体-关系模型(ER模型)讲会议内容、档案数据转化为数学的、可操作的模型,本方法主要使用聚类模型,以会议业务驱动,构建档案事实表与维度表之间的星座模型(参阅图9b所示,显示为本发明所述的会议数字化档案的星座模型结构示意图)。维度表一般是指对应会议业务状态编号的解释表。例如,会议类型表、会议业务分析类型等。
(3)会议数字化档案集市环节。会议档案集市,从会议全生命周期出发,构建了各类分析主题、目标、指标体系,建立基于数据集市的分析模型。数据集市:是一个面向小型的部门或工作组级别的数据消费服务。从长远的角度看,从属型数据集市在体系结构上比独立型数据集市更稳定。
(4)数据服务与可视化环节。一方面,档案利用与可视化模块满足多种检索方式,其中,检索方式包括:支持全文检索、条件检索、结构树检索等多种检索方式(参阅图9c所示,显示为基于条件检索中的标签的会议数字化档案检索应用示意图);不同的检索方式具备不同的数据服务功能,比如全文检索、条件检索、元数据检索等功能来定位目标会议内容档案。档案利用与可视化模块还提供在线检索、浏览、再利用。档案利用与可视化模块还满足多维度检索:支持按照业务板块、时间维度、项目维度等进行检索。另一方面,档案利用与可视化模块,通过各类看板支持多种图表类型,包括柱状图、折线图、饼图、堆积条图、面积图等多种(参阅图9d和9e所示,图9d显示为本发明一实施例会议内容档案可视化看板示意图;
图9e显示为本发明另一实施例中会议内容档案可视化看板示意图)。支持PC和移动两种布局等适配调整。所有的图表都是可视化拖拽设置,包括大小、位置、数据字段等。同时图表也支持数据穿透,能够穿透到具体的数据源中。
档案管理模块130通过案分级分权管理单元135实现了档案的分级分权的管控。以及对于不同全宗之下,档案门类的灵活扩充和调整。不同门类的档案,它的管理要求、分类要求也不一样。有的是基于问题,有的是基于机构,有的是基于时间,我们能够自定义去维护档案的相关分类方法。对于档号的自动生成,自行维护档号的生成规则。在档案全生命周期管理过程中,会产生相应的流程,我们通过内置的流程引擎,以拖拉拽的形式对流程的进行快速调整。
参阅图10所示,于本发明一实施例中,所述会议档案数字化管理系统100还包括权限管理模块150;所述权限管理模块包括分配系统权限、修改系统权限、分配查询权限、修改查询权限。
需要说明的是,对于所述会议档案数字化管理系统各模块间的工作原理,参阅图11所示,如前面所述示例为例,从会议全生命周期管理出发,将政府/企事业单位历史的、存量的纸类档案数字化,通过部署智慧会议管理系统,将10类会议相关数据,进行自动化、程序化归档,构建完整的会议数字化档案。
会议数字化档案生成。需要首先确定会议档案的范围:包括哪些会议记录,是否涉及涉密内容等等。筛选会议档案:将符合要求的会议档案进行筛选,除去重复、无关或过期的文件。数字化处理:使用扫描仪对筛选的会议档案进行扫描,转换为电子文件。文件分类:将数字化的文件进行分类,按照年份、部门、议题等标准进行分类,建立会议数字化档案目录。
会议数字化档案管理。包含:命名规范,对于分类后的文件进行规范命名,方便快速检索和识别;存储和备份,将数字化的会议档案存储在安全可靠的服务器中,并进行定期备份,以防丢失;文档管理系统,能够使用文档管理系统来管理数字化的会议档案,方便文件检索、查看历史记录等操作。档案管理规程。制定数字化会议档案的管理规程,包括权限管理、备份与恢复、安全保密等方面的规定等。
数字化档案利用与可视化。再利用与共享:数字化档案方便了档案的共享和再利用,不仅能够方便地通过电子邮件、共享文件夹等方式进行传递和共享,还能够通过云服务等方式实现在线共享和协作。数据挖掘与分析:数字化档案能够通过数据挖掘和分析来获取更多的信息和洞见,例如,利用机器学习算法对合同文本进行分析,能够更好地了解合同类型、常见的条款和风险点。可视化展示:数字化档案能够通过可视化方式进行展示和呈现,提高信息的可读性和可理解性,例如,利用数据可视化工具将数据呈现成地图、图表等形式,能够更好地了解数据之间的关系和趋势。多维度查询:数字化档案能够通过多维度查询工具来查询、筛选档案信息,例如,通过设置查询条件,快速找到满足条件的档案信息,并进行统计和分析。智能推荐与分类:数字化档案能够通过智能推荐和分类工具来推荐相关的档案信息,例如,基于用户的历史查询记录和偏好来推荐相关的档案信息,提高查询的准确度和效率。
综上所述,数字化会议档案构建,一方面是通过文档扫描、文本识别(OCR)技术将政府/企事业单位的历史的、存量的纸质类文档电子化、数字化;另一方面是通过部署信息化、数字化的智慧会议管理系统,整合AI技术(人脸识别、语音识别、声纹识别、自动摘要等)将会议记录、会议文稿、会议纪要、会议音频频等相关资料数字化处理,建立起完备、系统化的数字化会议档案库。它能够提高会议的效率和准确性,方便管理和查阅,同时也能够减少纸质档案的使用和存储,实现绿色环保。数字化会议档案构建还能够通过网络共享、远程访问等方式,实现协同办公,提高工作效率。
参阅图12所示,于本发明一实施例中,本发明实施例提供一种会议档案数字化管理方法,所述会议档案数字化管理方法包括:
步骤S1、将会议数据信息经过数字化处理生成数字化档案信息;其中,所述会议数据信息包括纸质类档案信息和电子类档案信息;
步骤S2、对所述数字化档案信息基于元数据管理策略建立数字化档案目录;
步骤S3、对所述数字化档案信息基于预设的档案管理规范进行处理,建立数字化档案资源库;
步骤S4、基于所述数字化档案资源库实现档案可视化和/或多维度检索。
本发明实施例所述的会议档案数字化管理方法的保护范围不限于本实施例列举的步骤执行顺序,凡是根据本发明的原理所做的现有技术的步骤增减、步骤替换所实现的方案都包括在本发明的保护范围内。
本发明实施例提供的一种会议档案数字化管理系统,所述会议档案数字化管理系统能够实现本发明所述的会议档案数字化管理方法,但本发明所述的会议档案数字化管理方法的实现装置包括但不限于本实施例列举的会议档案数字化管理系统的结构,凡是根据本发明的原理所做的现有技术的结构变形和替换,都包括在本发明的保护范围内。
本发明通过建设智慧会议数字化档案,帮助政府/企事业单位加强对《档案法》《保密法》的宣传和学习,提高涉密单位会议档案保密意识,帮助政府/企业依据保密法律法规,结合涉密实际业务和情况,通过数字化技术和手段,将会议保密工作责任和制度(坚持“谁主管,谁负责;谁操作,谁负责;谁出问题,谁负责”)能够及时的落地信息化系统;
为政府/企业建立一站式的会议档案管理门户,统一管理,所有文件可归档到一个档案中心,为不同岗位、不同角色的用户提供个性化的服务企业对会议大数据可视化的诉求,是满足内部不同人群对数据查询、分析和探索的需求,从而为管理和业务提供数据依赖和决策支撑。主要是对三类人群:
(1)第一类是管理决策层。让管理决策层能够看到准确、实时的数据,并依据数据去进行科学的决策。(2)第二类是普通业务人员。比如对业务数据统计,业务人员会在业务运营过程中涉及一些比如手工报表、人工统计、逐级取数等操作,使用BI平台能够提升他们的日常数据统计效率,让业务更多关注业务问题本身。(3)第三类是技术人员或分析人员。通过打通各个业务系统,提供统一的查询服务,提升这类人员的日常数据分析效率。
会议业务系统对接自动归档。智慧会议系统与数字化会议档案系统无缝连接与集成,会议档案系统提供多种系统集成方式,提供标准的接口,能够被其他系统调用,用以接收归档数据;也提供调用其他系统接口的能力,主动获取归档数据。接口采集的数据及记录,统一以列表形式展示,采集记录清晰可查。OCR/高拍扫描技术,将纸纸化会议档案,能够快数字化。
档案在线与下线自定义管控机制。通过系统规则与会议档案元数据设置:对超过“保密期限”的档案自动识别,决定该会议档案是继续在线还是控制下线。对超过“保管期限”的会议档案自动筛选,通过保管期限鉴定流程,决定该档案是延期还是销毁。
销毁清册:将鉴定为“销毁”的档案归入待销毁库,并形成“销毁清册”记录。销毁机制:支持定期执行销毁动作,也可根据预设的规则进入回收站,避免档案被错误处理。
政府/企业会议成本总体分析。数据资产标准化,用于解决系统之间数据集成的标准,并解决跨部门数据分析时,对数据的理解一致。只有对数据资产进行数据分类、存储数据敏感等方面的标准化定义后,才能形成完整的数据资产全生命周期的治理。遵循数据生成路径,收集、整理、归类而形成基础财务信息,在数据整合、洞察、建模和分析的过程中,识别管理改进的机会和目标。
综上所述,数字化会议档案的应用对政府工作具有重要的推动作用,能够加强信息化建设,提高工作效率和水平,优化服务体验,有益于政府工作的持续发展和提升。数字化会议档案对政府工作的有益价值和效果包括以下几方面:
1、提高工作效率。通过数字化会议档案的方式,政府工作人员能够实现快速检索和分类存储,大幅减少查找和整理会议档案的时间和成本。此外,数字化会议档案还能够远程共享和访问,首长和工作人员能够随时随地共享和访问会议资料,提高了协同工作的效率。
2、加强信息安全。通过数字化会议档案的方式,政府工作人员能够实现严格的权限管理,保护会议资料的机密性和完整性。此外,数字化会议档案还能够实现备份和灾备,避免了因灾难等原因导致会议资料丢失的风险。
3、提升工作水平。通过数字化会议档案的方式,政府工作人员能够查阅历史档案,及时总结和归纳工作经验,提高工作水平和效能。此外,数字化会议档案还能够实现数据分析和挖掘,帮助政府工作人员了解和把握社情民意,制定更加科学和有效的政策和措施。
4、优化服务体验。通过数字化会议档案的方式,政府工作人员能够实现在线服务,为公众提供更加便捷和高效的服务体验。此外,数字化会议档案还能够实现智能搜索和推荐,帮助公众更加便捷地查阅和获取政府会议资料。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统、装置或方法,能够通过其它的方式实现。例如,以上所描述的装置实施例仅是示意性的,例如,模块/单元的划分,仅仅为一种逻辑功能划分,实际实现时能够有另外的划分方式,例如多个模块或单元能够结合或者能够集成到另一个系统,或一些特征能够忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接能够是通过一些接口,装置或模块或单元的间接耦合或通信连接,能够是电性,机械或其它的形式。
作为分离部件说明的模块/单元能够是或者也能够不是物理上分开的,作为模块/单元显示的部件能够是或者也能够不是物理模块,即能够位于一个地方,或者也能够分布到多个网络单元上。能够根据实际的需要选择其中的部分或者全部模块/单元来实现本发明实施例的目的。例如,在本发明各个实施例中的各功能模块/单元能够集成在一个处理模块中,也能够是各个模块/单元单独物理存在,也能够两个或两个以上模块/单元集成在一个模块/单元中。
本领域普通技术人员应该还能够进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员能够对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
参阅图13所示,于本发明一实施例中,本实施例提供一种电子设备,所述电子设备200包括上述所述的会议档案数字化管理系统100。
本发明实施例还提供了一种计算机可读存储介质。本领域普通技术人员能够理解实现上述实施例的方法中的全部或部分步骤是能够通过程序来指令处理器完成,所述的程序能够存储于计算机可读存储介质中,所述存储介质是非短暂性(non-transitory)介质,例如随机存取存储器,只读存储器,快闪存储器,硬盘,固态硬盘,磁带(magnetic tape),软盘(floppy disk),光盘(optical disc)及其任意组合。上述存储介质能够是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质能够是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如数字视频光盘(digital video disc,DVD))、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
本发明实施例还能够提供一种计算机程序产品,所述计算机程序产品包括一个或多个计算机指令。在计算设备上加载和执行所述计算机指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机指令能够存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令能够从一个网站站点、计算机或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机或数据中心进行传输。
所述计算机程序产品被计算机执行时,所述计算机执行前述方法实施例所述的方法。该计算机程序产品能够为一个软件安装包,在需要使用前述方法的情况下,能够下载该计算机程序产品并在计算机上执行该计算机程序产品。
上述各个附图对应的流程或结构的描述各有侧重,某个流程或结构中没有详述的部分,能够参见其他流程或结构的相关描述。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (11)

1.一种会议档案数字化管理系统,其特征在于,所述会议档案数字化管理系统包括:
档案生成模块,对会议数据信息经过数字化处理生成数字化档案信息;所述数字化档案信息为从会议全生命周期出发,构建包括会议全过程内容的会议档案;确定会议档案的范围,筛选会议档案,对筛选的会议档案进行扫描,转换为电子文件,将数字化的文件进行分类,按照年份、部门、议题标准进行分类,建立会议数字化档案目录;所述数字化档案信息包括结构化或非结构化数据;
目录管理模块,对所述数字化档案信息基于元数据管理策略建立数字化档案目录;元数据管理策略为根据预设的元数据管理标准对所述数字化档案信息进行处理标记、命名标记、记录标记、存储标记;
档案管理模块,对所述数字化档案信息基于预设的档案管理规范进行处理,建立数字化档案资源库;所述档案管理模块包括:预归档处理单元,根据预设的归档范围和归档规则,用于将所述数字化档案信息进行预归档处理;正式归档处理单元,将经过预归档处理的所述数字化档案信息,基于元数据管理策略生成数字化档案资源库;
档案利用与可视化模块,基于所述数字化档案资源库实现档案可视化和/或多维度检索;所述档案利用与可视化模块包括:
ETL数据清洗与转换环节,通过开源ETL工具Data-X对会议电子档案、数字化档案进行数据清洗、数据转换、处理缺失值、删除重复项、处理离群值、转换格式和类型、归一化数据、集成数据、转换数据、简化数据、清理优化脏数据,统一数据格式,进行数据标准化操作;
数据建模环节,使用聚类模型,以会议业务驱动,构建档案事实表与维度表之间的星座模型;
会议数字化档案集市环节,从会议全生命周期出发,构建各类分析主题、目标、指标体系,建立基于数据集市的分析模型;
数据服务与可视化环节,支持全文检索、条件检索、结构树检索、元数据检索、在线检索以及多维度检索方式,支持按照业务板块、时间维度、项目维度进行检索,支持柱状图、折线图、饼图、堆积条图、面积图看板类型。
2.根据权利要求1所述的会议档案数字化管理系统,其特征在于,所述档案生成模块包括:
档案生成单元,用于将纸质类数据信息和/或电子类数据信息进行数字化处理转换成数字化档案信息。
3.根据权利要求2所述的会议档案数字化管理系统,其特征在于,所述数字化处理包括文本检测和文本识别;所述文本检测用于对会议数据信息进行定位,检测出所述会议数据信息中的文字区域位置;所述文本识别用于对所述文字区域位置的文字进行识别解码,以获取对应的文字信息。
4.根据权利要求1所述的会议档案数字化管理系统,其特征在于,所述目录管理模块包括:
路径规范单元,对所述数字化档案信息生成规范化存储路径;
路径标准化单元,对规范化存储路径的数字化数据档案信息经元数据管理策略处理,生成标准化存储路径。
5.根据权利要求4所述的会议档案数字化管理系统,其特征在于,所述元数据管理策略包括元模型、数据处理和数据管理;所述元模型用于将所述数字化数据档案信息中的元数据按照数据驱动管理方式进行存储;所述数据处理基于用户需求对所述数字化数据档案信息中的元数据进行数据处理;所述数据管理用于描述所述数字化数据档案信息中的元数据的全生命周期过程。
6.根据权利要求1所述的会议档案数字化管理系统,其特征在于,所述档案管理模块还包括:
档案存储单元,用于存储所述数字化档案信息;
档案规范化管理单元,基于预设的档案管理规范对所述数字化档案信息进行管理。
7.根据权利要求1所述的会议档案数字化管理系统,其特征在于,所述档案管理模块还包括:
档案分级分权管理单元,基于所述数字化档案信息的类型进行分级分权。
8.根据权利要求1所述的会议档案数字化管理系统,其特征在于,所述档案利用与可视化模块包括:
档案检索单元,用于根据用户检索内容在数字化档案资源库内检索;
可视化单元,用于展示所述数字化档案相关信息。
9.根据权利要求1所述的会议档案数字化管理系统,其特征在于,所述会议档案数字化管理系统还包括:
权限管理模块,权限管理模块包括分配系统权限、修改系统权限、分配查询权限、修改查询权限。
10.一种会议档案数字化管理方法,其特征在于,所述会议档案数字化管理方法包括:
将会议数据信息经过数字化处理生成数字化档案信息;其中,所述会议数据信息包括纸质类档案信息和电子类档案信息;所述数字化档案信息为从会议全生命周期出发,构建包括会议全过程内容的会议档案;确定会议档案的范围,筛选会议档案,对筛选的会议档案进行扫描,转换为电子文件,将数字化的文件进行分类,按照年份、部门、议题标准进行分类,建立会议数字化档案目录;所述数字化档案信息包括结构化或非结构化数据;
对所述数字化档案信息基于元数据管理策略建立数字化档案目录;元数据管理策略为根据预设的元数据管理标准对所述数字化档案信息进行处理标记、命名标记、记录标记、存储标记;
对所述数字化档案信息基于预设的档案管理规范进行处理,建立数字化档案资源库;所述档案管理模块包括:预归档处理单元,根据预设的归档范围和归档规则,用于将所述数字化档案信息进行预归档处理;正式归档处理单元,将经过预归档处理的所述数字化档案信息,基于元数据管理策略生成数字化档案资源库;
基于所述数字化档案资源库实现档案可视化和/或多维度检索;包括:ETL数据清洗与转换环节,通过开源ETL工具Data-X对会议电子档案、数字化档案进行数据清洗、数据转换、处理缺失值、删除重复项、处理离群值、转换格式和类型、归一化数据、集成数据、转换数据、简化数据、清理优化脏数据,统一数据格式,进行数据标准化操作;
数据建模环节,使用聚类模型,以会议业务驱动,构建档案事实表与维度表之间的星座模型;
会议数字化档案集市环节,从会议全生命周期出发,构建各类分析主题、目标、指标体系,建立基于数据集市的分析模型;
数据服务与可视化环节,支持全文检索、条件检索、结构树检索、元数据检索、在线检索以及多维度检索方式,支持按照业务板块、时间维度、项目维度进行检索,支持柱状图、折线图、饼图、堆积条图、面积图看板类型。
11.一种电子设备,其特征在于,包括权利要求1至9任一项所述的会议档案数字化管理系统。
CN202311143070.8A 2023-09-06 2023-09-06 一种会议档案数字化管理系统、方法及电子设备 Active CN117251526B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311143070.8A CN117251526B (zh) 2023-09-06 2023-09-06 一种会议档案数字化管理系统、方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311143070.8A CN117251526B (zh) 2023-09-06 2023-09-06 一种会议档案数字化管理系统、方法及电子设备

Publications (2)

Publication Number Publication Date
CN117251526A CN117251526A (zh) 2023-12-19
CN117251526B true CN117251526B (zh) 2024-09-10

Family

ID=89127251

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311143070.8A Active CN117251526B (zh) 2023-09-06 2023-09-06 一种会议档案数字化管理系统、方法及电子设备

Country Status (1)

Country Link
CN (1) CN117251526B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112506865A (zh) * 2020-12-21 2021-03-16 广东天亿马信息产业股份有限公司 一种档案数字化管理系统及其方法
CN116401432A (zh) * 2023-03-29 2023-07-07 南方精典(重庆)人才服务有限公司 一种数字化档案加工管理系统及方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110320494A1 (en) * 2010-06-28 2011-12-29 Martin Fisher Litigation document management linking unstructured documents with business objects
CN106815340B (zh) * 2017-01-05 2019-10-01 福建亿榕信息技术有限公司 电力营销业务中的存量档案电子化批量处理方法及系统
CN113378916A (zh) * 2021-06-08 2021-09-10 紫光软件系统有限公司 一种基于聚类分析的智慧档案馆分层服务模式
CN116612484A (zh) * 2023-05-26 2023-08-18 浪潮软件股份有限公司 一种档案数字化加工系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112506865A (zh) * 2020-12-21 2021-03-16 广东天亿马信息产业股份有限公司 一种档案数字化管理系统及其方法
CN116401432A (zh) * 2023-03-29 2023-07-07 南方精典(重庆)人才服务有限公司 一种数字化档案加工管理系统及方法

Also Published As

Publication number Publication date
CN117251526A (zh) 2023-12-19

Similar Documents

Publication Publication Date Title
US10791150B2 (en) Data processing and scanning systems for generating and populating a data inventory
US20210042332A1 (en) Data processing systems for generating and populating a data inventory
US20190213407A1 (en) Automated Analysis System and Method for Analyzing at Least One of Scientific, Technological and Business Information
Corallo et al. Understanding and defining dark data for the manufacturing industry
US20110173033A1 (en) Systems and methods for utilizing an enterprise map to determine affected entities
US20150012805A1 (en) Collaborative Matter Management and Analysis
CN110852699A (zh) 一种档案电子化智能管理系统及方法
CN110991707A (zh) 一种云业务管理系统
CN110674206A (zh) 一种应用于企业知识共享平台
CN114202319A (zh) 一种基于混合类元数据方案的档案管理系统
CN114218467B (zh) 一种数字档案管理方法和系统
Astanaliev The process of electronic document management in the system of railway automation and telemechanics
CN108960758A (zh) 建筑工程过程控制管理系统
Pravia et al. Lessons learned in the creation of a data set for hard/soft information fusion
Khan et al. Document management system: An explicit knowledge management system
CN117251526B (zh) 一种会议档案数字化管理系统、方法及电子设备
Lacuata Digitization of Library Resources in Higher Education Institutions in La Union, Philippines
Shayakhmetova et al. Descriptive big data analytics in the field of education
US20210303603A1 (en) Data processing systems for generating and populating a data inventory
TWI595369B (zh) 技術文獻之閱讀系統與產生專利文獻之專利資訊的方法以及電腦可讀取儲存媒體
Raviteja et al. A review on electronic data management in pharmaceutical industry
Troselius et al. A comparative case study on metadata schemes at Swedish governmental agencies
Wan et al. Improving government services using social media feedback
Oliychenko et al. Implementation and improvement of electronic document management in the government administration
CN118643155B (zh) 基于ai的文档管理方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant