CN115033543B - 自助政务数据存储系统及自助政务终端 - Google Patents

自助政务数据存储系统及自助政务终端 Download PDF

Info

Publication number
CN115033543B
CN115033543B CN202210677519.8A CN202210677519A CN115033543B CN 115033543 B CN115033543 B CN 115033543B CN 202210677519 A CN202210677519 A CN 202210677519A CN 115033543 B CN115033543 B CN 115033543B
Authority
CN
China
Prior art keywords
image
file image
self
file
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210677519.8A
Other languages
English (en)
Other versions
CN115033543A (zh
Inventor
朱劲松
刘植
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hubei Jinfu Zhixin Technology Development Co ltd
Original Assignee
Hubei Jinfu Zhixin Technology Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei Jinfu Zhixin Technology Development Co ltd filed Critical Hubei Jinfu Zhixin Technology Development Co ltd
Priority to CN202210677519.8A priority Critical patent/CN115033543B/zh
Publication of CN115033543A publication Critical patent/CN115033543A/zh
Application granted granted Critical
Publication of CN115033543B publication Critical patent/CN115033543B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/172Caching, prefetching or hoarding of files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/116Details of conversion of file system types or formats
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/164File meta data generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/168Details of user interfaces specifically adapted to file systems, e.g. browsing and visualisation, 2d or 3d GUIs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明提供了一种自助政务数据存储系统及自助政务终端,其中所述系统包括,扫描装置,用于获取文件图像;比较器,将获取的文件图像与设置在标准库中的标准图像进行比对,以查看是具有一标准图像的基础格式和文件图像的基础格式相同;基于比较的结果,将扫描后的文件按照文件的基本内容进行分类,并按照分类的结果进行对应的存储,分类后并提取文件内容的主要关键词,基于关键词来建立索引,便于通过索引进行查询。

Description

自助政务数据存储系统及自助政务终端
技术领域
本发明涉及数据存储技术领域,特别是涉及一种自助政务数据存储系统及自助政务终端。
背景技术
现有的自助终端在进行文件存储时,一般都是利用政务管理系统来进行文件的存储,即在自助政务终端安装政务管理软件,根据自助业务的产生来记录相关的文件信息,木点使用的大多数的政务管理软件关于存储的技术中,基本上采用的是“非结构化”数据,这些数据不能进行分类存储和检索,需要政务人员定时的将内部的文件拷贝出来后进行一一整理,造成工作量巨大,且在整理后进行分类过程中容易造成分类错误。
发明内容
有鉴于此,本发明的主要目的在于提供一种自助政务数据存储系统及自助政务终端。
本发明采用的技术方案如下:
自助政务数据存储系统,包括:
扫描装置,用于获取文件图像;
比较器,将获取的文件图像与设置在标准库中的标准图像进行比对,以查看是具有一标准图像的基础格式和文件图像的基础格式相同;
若不同,在处理模块中建立一空白模板;
导入单元,用于将所述文件图像导入至所述空白模板上;
在所述处理模块中设置多个浮动窗口,将多个浮动窗口经导入单元导入到空白模板上;
调整单元,用于通过调整所述浮动窗口的大小来框取文件图像上的基础内容;
标准图像生成单元,用于在调整单元调整完毕后基于每一浮动窗口的大小和每一浮动窗口在空白模板上的位置建立格式参数;抽取文件图像后将所有浮动窗口对应的设置在空白模板上以建立标准图像;基于格式参数建立基础格式,并将基础格式存储在基础库中,将格式参数存储在参数库中;
识别模块,用于接收所述文件图像,并通过加载模块基于基础格式从参数库中加载基础格式对应设置的格式参数至识别模块,识别模块按照格式参数来设定识别框的运动轨迹,基于所述运动轨迹来识别文件图像中每一子单元的数据信息;
人工智能系统,用于将多个片段的所述数据信息依次输入至人工智能系统进行内容识别、理解,基于内容识别、理解的结果形成分类码;还用于基于对多个片段的数据信息的内容识别、理解以提取多个关键词,并基于多个关键词的权重来建立关键词之间的关联关系;
分类模块,基于所述分类码将多个片段的数据信息以及文件图像对应的存储在存储单元中,并使得具有相同的分类码的多个片段的数据信息以及文件图像对应的存储在同一存储单元中;
索引建立单元,用于依据每一关键词的权重和与其他关键词之间的关联关系建立索引,将索引与存储单元的存储路径进行链接,并将所述索引写入至索引目录。
优选的,所述浮动窗口具有调整阈值,在设定的调整阈值内浮动窗口至少按照一个单位量进行拉伸或者收缩来框取文件图像上的基础内容;
在框取时,通过扫描模板扫描文件图像中的基础内容,以获取文件图像中表格以及表格中每一表格单元的边框、文字内容的分段、图形或图像、公式中的一种或者多种,基于获取的文件图像中表格以及表格中每一表格单元的边框、文字内容的分段、图形或图像、公式中的一种或者多种来设定浮动窗口的数量,并使得每一浮动窗口分别能够框取表格以及表格中每一表格单元的边框、文字内容的分段、图形或图像以及公式,其中,每一浮动窗口用于表示文件图像中每一独立的子单元。
优选的,基于所述扫描模板逐一扫描过程中获取文件图像中的表格以及表格中每一表格单元的边框、文字内容的分段、图形或图像、公式中的任意一个来将浮动窗口进行导入。
优选的,所述识别模块具有:
接收部,用于接收所述文件图像;
配置单元,用于基于格式参数来配置识别框的运动轨迹,
识别框,用于基于所述运动轨迹来识别文件图像中每一子单元中数据信息,并基于所述运动轨迹将多个数据信息进行串接形成能够链接的多个片段的所述数据信息。
优选的,所述人工智能系统具有:
识别模型,该识别模型用于基于多个片段的所述数据信息进行迭代训练以进行内容识别、理解,基于内容识别、理解的结果形成分类码;
提取分析模型,该提取分析模型用于基于内容识别、理解提取多个关键词,设置每一关键词的权重,并基于关键词以及关键词的权重进行迭代训练以建立关键词之间的关联关系。
本发明还提供了一种自助政务终端,包含所述的自助政务数据存储系统。
本申请通过在自助政务终端上建立一套自动识别、分类系统,将扫描后的文件按照文件的基本内容进行分类,并按照分类的结果进行对应的存储,分类后并提取文件内容的主要关键词,基于关键词来建立索引,便于通过索引进行查询。
附图说明
以下附图仅对本发明作示意性的说明和解释,并不用于限定本发明的范围,其中:
图1为本发明的框架原理图;
图2为本发明中人工智能系统的原理图;
图3为本发明中实施例的系统原理图。
具体实施方式
为了使本发明的目的、技术方案、设计方法及优点更加清楚明了,以下结合附图通过具体实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明。
参照图1,自助政务数据存储系统,包括:
扫描装置,用于获取文件图像;
比较器,将获取的文件图像与设置在标准库中的标准图像进行比对,以查看是具有一标准图像的基础格式和文件图像的基础格式相同;
若不同,在处理模块中建立一空白模板;
导入单元,用于将所述文件图像导入至所述空白模板上;
在所述处理模块中设置多个浮动窗口,将多个浮动窗口经导入单元导入到空白模板上;
调整单元,用于通过调整所述浮动窗口的大小来框取文件图像上的基础内容;
标准图像生成单元,用于在调整单元调整完毕后基于每一浮动窗口的大小和每一浮动窗口在空白模板上的位置建立格式参数;抽取文件图像后将所有浮动窗口对应的设置在空白模板上以建立标准图像;基于格式参数建立基础格式,并将基础格式存储在基础库中,将格式参数存储在参数库中;
识别模块,用于接收所述文件图像,并通过加载模块基于基础格式从参数库中加载基础格式对应设置的格式参数至识别模块,识别模块按照格式参数来设定识别框的运动轨迹,基于所述运动轨迹来识别文件图像中每一子单元的数据信息;
人工智能系统,用于将多个片段的所述数据信息依次输入至人工智能系统进行内容识别、理解,基于内容识别、理解的结果形成分类码;还用于基于对多个片段的数据信息的内容识别、理解以提取多个关键词,并基于多个关键词的权重来建立关键词之间的关联关系;
分类模块,基于所述分类码将多个片段的数据信息以及文件图像对应的存储在存储单元中,并使得具有相同的分类码的多个片段的数据信息以及文件图像对应的存储在同一存储单元中;
索引建立单元,用于依据每一关键词的权重和与其他关键词之间的关联关系建立索引,将索引与存储单元的存储路径进行链接,并将所述索引写入至索引目录。
优选的,所述浮动窗口具有调整阈值,在设定的调整阈值内浮动窗口至少按照一个单位量进行拉伸或者收缩来框取文件图像上的基础内容;
在框取时,通过扫描模板扫描文件图像中的基础内容,以获取文件图像中表格以及表格中每一表格单元的边框、文字内容的分段、图形或图像、公式中的一种或者多种,基于获取的文件图像中表格以及表格中每一表格单元的边框、文字内容的分段、图形或图像、公式中的一种或者多种来设定浮动窗口的数量,并使得每一浮动窗口分别能够框取表格以及表格中每一表格单元的边框、文字内容的分段、图形或图像以及公式,其中,每一浮动窗口用于表示文件图像中每一独立的子单元。
优选的,基于所述扫描模板逐一扫描过程中获取文件图像中的表格以及表格中每一表格单元的边框、文字内容的分段、图形或图像、公式中的任意一个来将浮动窗口进行导入。
优选的,所述识别模块具有:
接收部,用于接收所述文件图像;
配置单元,用于基于格式参数来配置识别框的运动轨迹,
识别框,用于基于所述运动轨迹来识别文件图像中每一子单元中数据信息,并基于所述运动轨迹将多个数据信息进行串接形成能够链接的多个片段的所述数据信息。
参照图2,所述人工智能系统具有:
识别模型,该识别模型用于基于多个片段的所述数据信息进行迭代训练以进行内容识别、理解,基于内容识别、理解的结果形成分类码;
提取分析模型,该提取分析模型用于基于内容识别、理解提取多个关键词,设置每一关键词的权重,并基于关键词以及关键词的权重进行迭代训练以建立关键词之间的关联关系。
本发明还提供了一种自助政务终端,包含所述的自助政务数据存储系统。
参照图3,在上述的自助政务数据存储系统中还设置有监控模块,该监控模块用于监控使用人员在自助政务终端的触摸屏上的使用操作。
该监控模块具有一记录单元,所述记录单元用于记录每一操作并将每一操作对应的形成监控日志;在本申请中,监控日志按照操作模块对应的目录进行存储。
通过自助政务终端办理线上事务,在自助政务终端上进行操作时,其点击选择的业务、业务范畴、类型等都由监控模块自动的抓取,业务办理过程中形成的基础数据通过串口连接至自助政务数据存储系统,一般的,在自助终端上的基础数据按照业务、业务类型匹配了专用模板,基础信息填入到专用模板后采用JPG格式的图像文件进行保存。这些专用模板在自助政务数据存储系统中均对应匹配有标准图像;因此可以按照自助政务数据存储系统进行识别和存储,具体的,将获取的文件图像与设置在标准库中的标准图像进行比对,加载所述基础格式对应设置的格式参数,基于所述格式参数输入至识别模块中,所述识别模块按照格式参数来设定识别框的运动轨迹,基于所述运动轨迹来识别文件图像中每一子单元的数据信息,识别完成后将多个片段的所述数据信息依次输入至人工智能系统进行内容识别、理解,基于内容识别、理解的结果形成分类码,基于所述分类码将多个片段的数据信息以及文件图像对应的存储在存储单元中,并使得具有相同的分类码的多个片段的数据信息以及文件图像对应的存储在同一存储单元中;
基于所述人工智能系统对多个片段的数据信息的内容识别、理解以提取多个关键词,并基于多个关键词的权重来建立关键词之间的关联关系,并依据每一关键词的权重和与其他关键词之间的关联关系建立索引,将索引与存储单元的存储路径进行链接,并将所述索引写入至索引目录;
本申请通过在自助政务终端上建立一套自动识别、分类系统,将扫描后的文件按照文件的基本内容进行分类,并按照分类的结果进行对应的存储,分类后并提取文件内容的主要关键词,基于关键词来建立索引,便于通过索引进行查询。
在具体的实施时,本发明还提供了一种自助政务数据存储方法,具体包括:扫描装置,用于获取文件图像;
比较器,将获取的文件图像与设置在标准库中的标准图像进行比对,以查看是具有一标准图像的基础格式和文件图像的基础格式相同;基于比较的结果进行如下两种方式进行存储:
第一种方式:
若具有一标准图像的基础格式和文件图像的基础格式相同,加载所述基础格式对应设置的格式参数,基于所述格式参数输入至识别模块中,所述识别模块按照格式参数来设定识别框的运动轨迹,基于所述运动轨迹来识别文件图像中每一子单元的数据信息,识别完成后将多个片段的所述数据信息依次输入至人工智能系统进行内容识别、理解,基于内容识别、理解的结果形成分类码,基于所述分类码将多个片段的数据信息以及文件图像对应的存储在存储单元中,并使得具有相同的分类码的多个片段的数据信息以及文件图像对应的存储在同一存储单元中;
基于所述人工智能系统对多个片段的数据信息的内容识别、理解以提取多个关键词,并基于多个关键词的权重来建立关键词之间的关联关系,并依据每一关键词的权重和与其他关键词之间的关联关系建立索引,将索引与存储单元的存储路径进行链接,并将所述索引写入至索引目录;
第二种方式:
若没有一标准图像的基础格式和文件图像的基础格式相同,加载一空白模板,将所述文件图像融合在空白模板上,
设置多个浮动窗口,将多个浮动窗口加载到空白模板上,通过调整所述浮动窗口的大小来框取文件图像上的基础内容,框取完毕后基于每一浮动矿口的大小和在空白模板上的位置建立格式参数,抽取文件图像后将所有浮动窗口对应的设置在空白模板上以建立标准图像;基于格式参数建立基础格式,并将基础格式存储在基础库中,将格式参数存储在参数库中;
加载所述基础格式对应设置的格式参数,基于所述格式参数输入至识别模块中,所述识别模块按照格式参数来设定识别框的运动轨迹,基于所述运动轨迹来识别文件图像中每一子单元的数据信息,识别完成后将多个片段的所述数据信息依次输入至人工智能系统进行内容识别、理解,基于内容识别、理解的结果形成分类码,基于所述分类码将多个片段的数据信息以及文件图像对应的存储在存储单元中,并使得具有相同的分类码的多个片段的数据信息以及文件图像对应的存储在同一存储单元中;
基于所述人工智能系统对多个片段的数据信息的内容识别、理解以提取多个关键词,并基于多个关键词的权重来建立关键词之间的关联关系,并依据每一关键词的权重和与其他关键词之间的关联关系建立索引,将索引与存储单元的存储路径进行链接,并将所述索引写入至索引目录。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (6)

1.自助政务数据存储系统,其特征在于,包括:
扫描装置,用于获取文件图像;
比较器,将获取的文件图像与设置在标准库中的标准图像进行比对,以查看是具有一标准图像的基础格式和文件图像的基础格式相同;
若不同,在处理模块中建立一空白模板;
导入单元,用于将所述文件图像导入至所述空白模板上;
在所述处理模块中设置多个浮动窗口,将多个浮动窗口经导入单元导入到空白模板上;
调整单元,用于通过调整所述浮动窗口的大小来框取文件图像上的基础内容;
标准图像生成单元,用于在调整单元调整完毕后基于每一浮动窗口的大小和每一浮动窗口在空白模板上的位置建立格式参数;抽取文件图像后将所有浮动窗口对应的设置在空白模板上以建立标准图像;基于格式参数建立基础格式,并将基础格式存储在基础库中,将格式参数存储在参数库中;
识别模块,用于接收所述文件图像,并通过加载模块基于基础格式从参数库中加载基础格式对应设置的格式参数至识别模块,识别模块按照格式参数来设定识别框的运动轨迹,基于所述运动轨迹来识别文件图像中每一子单元的数据信息;
人工智能系统,用于将多个片段的所述数据信息依次输入至人工智能系统进行内容识别、理解,基于内容识别、理解的结果形成分类码;还用于基于对多个片段的数据信息的内容识别、理解以提取多个关键词,并基于多个关键词的权重来建立关键词之间的关联关系;
分类模块,基于所述分类码将多个片段的数据信息以及文件图像对应的存储在存储单元中,并使得具有相同的分类码的多个片段的数据信息以及文件图像对应的存储在同一存储单元中;
索引建立单元,用于依据每一关键词的权重和与其他关键词之间的关联关系建立索引,将索引与存储单元的存储路径进行链接,并将所述索引写入至索引目录。
2.根据权利要求1所述的自助政务数据存储系统,其特征在于,所述浮动窗口具有调整阈值,在设定的调整阈值内浮动窗口至少按照一个单位量进行拉伸或者收缩来框取文件图像上的基础内容;
在框取时,通过扫描模板扫描文件图像中的基础内容,以获取文件图像中表格以及表格中每一表格单元的边框、文字内容的分段、图形或图像、公式中的一种或者多种,基于获取的文件图像中表格以及表格中每一表格单元的边框、文字内容的分段、图形或图像、公式中的一种或者多种来设定浮动窗口的数量,并使得每一浮动窗口分别能够框取表格以及表格中每一表格单元的边框、文字内容的分段、图形或图像以及公式,其中,每一浮动窗口用于表示文件图像中每一独立的子单元。
3.根据权利要求2所述的自助政务数据存储系统,其特征在于,基于所述扫描模板逐一扫描过程中获取文件图像中的表格以及表格中每一表格单元的边框、文字内容的分段、图形或图像、公式中的任意一个来将浮动窗口进行导入。
4.根据权利要求1所述的自助政务数据存储系统,其特征在于,所述识别模块具有:
接收部,用于接收所述文件图像;
配置单元,用于基于格式参数来配置识别框的运动轨迹,
识别框,用于基于所述运动轨迹来识别文件图像中每一子单元中数据信息,并基于所述运动轨迹将多个数据信息进行串接形成能够链接的多个片段的所述数据信息。
5.根据权利要求1所述的自助政务数据存储系统,其特征在于,所述人工智能系统具有:
识别模型,该识别模型用于基于多个片段的所述数据信息进行迭代训练以进行内容识别、理解,基于内容识别、理解的结果形成分类码;
提取分析模型,该提取分析模型用于基于内容识别、理解提取多个关键词,设置每一关键词的权重,并基于关键词以及关键词的权重进行迭代训练以建立关键词之间的关联关系。
6.自助政务终端,其特征在于,包含权利要求1-5所述的自助政务数据存储系统。
CN202210677519.8A 2022-06-16 2022-06-16 自助政务数据存储系统及自助政务终端 Active CN115033543B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210677519.8A CN115033543B (zh) 2022-06-16 2022-06-16 自助政务数据存储系统及自助政务终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210677519.8A CN115033543B (zh) 2022-06-16 2022-06-16 自助政务数据存储系统及自助政务终端

Publications (2)

Publication Number Publication Date
CN115033543A CN115033543A (zh) 2022-09-09
CN115033543B true CN115033543B (zh) 2024-04-26

Family

ID=83124273

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210677519.8A Active CN115033543B (zh) 2022-06-16 2022-06-16 自助政务数据存储系统及自助政务终端

Country Status (1)

Country Link
CN (1) CN115033543B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080041388A (ko) * 2006-11-07 2008-05-13 엔에이치엔(주) 문서 분류 시스템 및 문서 분류 방법
KR101585029B1 (ko) * 2015-05-13 2016-01-13 (주)코드원시스템 문서 인식 분류 시스템
CN109254957A (zh) * 2018-09-21 2019-01-22 安徽和信科技发展有限责任公司 一种基于大数据的档案管理系统
CN112667701A (zh) * 2019-10-16 2021-04-16 北京航天长峰科技工业集团有限公司 一种政务大数据超级搜索方法
CN113204644A (zh) * 2021-01-07 2021-08-03 合肥工业大学 一种基于知识图谱的政务百科构建方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200387533A1 (en) * 2019-03-19 2020-12-10 Zetadata Systems, Inc Systems and methods for structuring metadata

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080041388A (ko) * 2006-11-07 2008-05-13 엔에이치엔(주) 문서 분류 시스템 및 문서 분류 방법
KR101585029B1 (ko) * 2015-05-13 2016-01-13 (주)코드원시스템 문서 인식 분류 시스템
CN109254957A (zh) * 2018-09-21 2019-01-22 安徽和信科技发展有限责任公司 一种基于大数据的档案管理系统
CN112667701A (zh) * 2019-10-16 2021-04-16 北京航天长峰科技工业集团有限公司 一种政务大数据超级搜索方法
CN113204644A (zh) * 2021-01-07 2021-08-03 合肥工业大学 一种基于知识图谱的政务百科构建方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于版式电子文档的全文检索技术在自然资源部机关政务办公系统中的应用初探;李正;咸容禹;余前佳;陈卉;吴玉龙;;国土资源信息化;20190420(02);全文 *
电子政务系统中的档案管理:查询利用;陈永生;杨茜茜;侯衡;苏焕宁;;档案学研究;20151028(05);全文 *
非结构化数据特征建模关键技术研究;蔡宇翔;《电网与清洁能源》;20170125;13-17+23 *

Also Published As

Publication number Publication date
CN115033543A (zh) 2022-09-09

Similar Documents

Publication Publication Date Title
CN103530652B (zh) 一种基于人脸聚类的视频编目方法、检索方法及其系统
CN111914558B (zh) 基于句袋注意力远程监督的课程知识关系抽取方法及系统
US10628459B2 (en) Systems and methods for probabilistic data classification
US20160203209A1 (en) Joint approach to feature and document labeling
US20230052903A1 (en) System and method for multi-task lifelong learning on personal device with improved user experience
WO2020164278A1 (zh) 一种图像处理方法、装置、电子设备和可读存储介质
CN108932343A (zh) 人脸图像数据库的数据集清洗方法与系统
CN113190502A (zh) 基于深度学习的档案管理方法
US20210019511A1 (en) Systems and methods for extracting data from an image
CN115618866A (zh) 一种工程项目投标文件的段落识别与主题提取方法及系统
CN114818718A (zh) 合同文本识别方法及装置
CN110807108A (zh) 一种亚洲人脸数据自动收集及清洗的方法和系统
CN115033543B (zh) 自助政务数据存储系统及自助政务终端
CN111860524A (zh) 一种数字档案智能分类的装置及方法
CN116976321A (zh) 文本处理方法、装置、计算机设备、存储介质和程序产品
CN107169065B (zh) 一种特定内容的去除方法和装置
CN113486171B (zh) 一种图像处理方法及装置、电子设备
TWI793432B (zh) 工程專案文件管理方法與系統
Xin et al. Comic text detection and recognition based on deep learning
Rahul et al. Deep reader: Information extraction from document images via relation extraction and natural language
CN114065751A (zh) 申报要素抽取方法及装置和抽取模型生成方法及装置
CN109344254A (zh) 一种地址信息分类方法及装置
CN116757170B (zh) 一种基于JAVA语言的Excel表格导入方法和系统
CN117954045B (zh) 基于处方数据分析的药品自动分拣管理系统及方法
JP7420578B2 (ja) 帳票仕分システム、帳票仕分方法、及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant