CN114417802A - 一种智能化报表生成系统 - Google Patents

一种智能化报表生成系统 Download PDF

Info

Publication number
CN114417802A
CN114417802A CN202210281893.6A CN202210281893A CN114417802A CN 114417802 A CN114417802 A CN 114417802A CN 202210281893 A CN202210281893 A CN 202210281893A CN 114417802 A CN114417802 A CN 114417802A
Authority
CN
China
Prior art keywords
data
node
matching
report
header
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210281893.6A
Other languages
English (en)
Other versions
CN114417802B (zh
Inventor
覃进千
王震
王勇
陈磊
曹婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Creative Information Technology Co ltd
Original Assignee
Creative Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Creative Information Technology Co ltd filed Critical Creative Information Technology Co ltd
Priority to CN202210281893.6A priority Critical patent/CN114417802B/zh
Publication of CN114417802A publication Critical patent/CN114417802A/zh
Application granted granted Critical
Publication of CN114417802B publication Critical patent/CN114417802B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/177Editing, e.g. inserting or deleting of tables; using ruled lines
    • G06F40/18Editing, e.g. inserting or deleting of tables; using ruled lines of spreadsheets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates

Abstract

本发明公开了一种智能化报表生成系统,包括数据采集模块、数据导入导出模块、数据处理模块、数据匹配模块、任务生成模块和数据存储模块。系统采集报表数据,按预设报表采集格式要求编制excel表头模板导入报表系统获基础信息表,并将已有的基础信息表根据业务领域进行分类,并根据业务规则建立关联关系映射表;用户在解析excel表头模板后与数据中台建立的映射表表头进行匹配,根据匹配结果返回相应的报表数据。系统还可以根据数据匹配返回数据中的缺失数据生成数据采集任务并下发至区域所辖单位。本发明采用自定义模板,导入模板自动关联数据中台数据,以核待采,对数据进行查缺补漏,减少基层工作人员的工作负担,达到减负的目的。

Description

一种智能化报表生成系统
技术领域
本发明涉及计算机软件技术领域,尤其涉及一种智能化报表生成系统。
背景技术
目前,很多政府部门要采集报表数据,首先通过召集镇街工作人员进行开会培训。其次,委办局工作人员制作excel模板并下发给各个镇街填写;镇街接收到数据采集模板后,发现很多数据需要最基层的村社通过实际的入户走访才能获取,于是镇街相关部门又召集各个村社的工作人员进行培训并下发采集模板。最后,村社工作人员填报好数据后提交给镇街部门汇总,镇街道部门再提交给委办局汇总。整个过程不但周期长,还加大了基层工作人员的负担,也不能确保数据的准确性。
原有报表采集工作流程繁琐,工作量大,采集整个过程需要人工全程参与,数据量大容易出错。通过本方案的改进可以大大减少报表采集流程,减少人工干预,降低出错概率,减轻基层工作人员的工作负担。
如申请号为CN201310587182.2的专利申请公开了一种报表生成方法和报表系统,报表系统包括:数据录入单元,适于根据填报方案,接收数据录入方基于授权所录入的本组织的填报项数据,并验证所录入数据的合法性;数据审核单元,适于接收数据审核方对录入的填报方案的审核结果,并根据审核结果决定是否需要重新进行数据录入单元的数据录入;报表生成单元,适于接收报表生成方选择的报表模板文件和报表生成规则;还适于根据报表生成规则,对填报方案中的数据进行处理,并按照报表模板文件生成报表,该报表为注册报表;报表生成单元将注册报表保存在注册报表数据库中。该方案在录入数据时没有对业务数据进行分类,也没有对数据搜索关键词进行深入分析。此外,该方案也没有对缺失报表数据进行补充采集,生成的报表存在数据完整性的问题。
发明内容
本发明的目的在于克服现有技术的不足,提供一种智能化报表生成系统,采用自定义excel模板,导入模板自动关联数据中台数据,以核待采,对数据进行查缺补漏,减少基层工作人员的工作负担,达到减负的目的。
本发明的目的是通过以下技术方案来实现的:
一种智能化报表生成系统,包括:
数据采集模块,用于根据数据采集任务采集各个单位报表系统中的报表数据;
数据导入导出模块,用于按预设报表采集格式要求编制excel表头模板导入报表系统,以及在数据采集任务完成后从报表系统中将采集的报表数据导入到基础信息表中;
数据处理模块,用于将已有的基础信息表根据业务领域进行分类,并根据业务规则建立关联关系映射表;
数据匹配模块,用于解析excel表头模板,获取excel表头信息,通过改进Aho-Corasick算法将解析出的excel表头与数据中台建立的映射表表头进行匹配,根据匹配的结果返回相应的excel数据;
任务生成模块,用于根据数据匹配返回数据中的缺失数据生成数据采集任务并下发至区域所辖单位;
数据存储模块,用于将用户的个人信息和采集的报表数据存储在数据库服务器中。
数据匹配模块包括关键词获取单元、解析单元和匹配查询单元;关键词获取单元用于根据预设条件构建匹配树来分析获取关键词;解析单元用于获取excel表头模板,通过POI工具包解析excel,获取excel表头;匹配查询单元用于通过改进Aho-Corasick算法将解析出的表头信息与数据中台建立的关联关系映射表表头进行匹配,根据匹配条件查询出关键词对应的业务数据。
根据预设条件构建匹配树具体包括:按以下条件建立匹配树:
条件一:存在一个根节点,不代表任何字符,匹配树中其余每个节点保存关键词中的一个字符,并以字符值代指该节点;
条件二:若存在一个关键词,字符A是关键词中的一个字符,字符B是字符A的后继字符,则称字符B是字符A的子节点,所有关键词的第一个字符都是根节点的子节点,其中相同的值,即相同的字符用同一个子节点表示;
条件三:如果从根节点到节点A经过的所有节点组成一条关键词,则把该条关键词的结束标志0也加入到节点A的子节点中,这个0节点称为叶子节点;
条件四:在节点A中记录子节点个数n,对节点A的任一子节点B,将其节点值对n取模,所有模相同的子节点相连组成一个链表;
条件五:所有的链表组成一个数组,节点A通过child指针指向该数组;
条件六:所有从根节点开始通过child指针到达任意结点的路径是唯一的,从根到任一叶子节点可以得到一条关键词;反之,每条关键词都在匹配树中存在一条唯一的从根节点到叶子节点的路径;
条件七:将从根节点到节点A经过的节点相连得到一个字符串,设长度为m,则获得m-1个以节点A结尾的真子串,如果存在最长的真子串S,假设真子串S是某个关键词的起始部份,则在匹配树中存在一条从根节点到达节点F的路径,代表该真子串;节点A通过next指针与节点F相连;节点F就是匹配到A failure后需要继续进行匹配的下一个节点。
匹配查询单元通过改进Aho-Corasick算法将解析出的表头信息与数据中台建立的关联关系映射表表头进行匹配过程具体包括:通过中文分词工具获取表头分词;获取数据中台中数据表所有列信息;通过改进Aho-Corasick算法建立Trie树;根据解析出的excel表头与数据中台建立的映射表表头进行匹配,根据匹配的结果返回相应的excel数据。
通过改进Aho-Corasick算法建立Trie树具体包括:根据数据中台数据表列信息建立起一棵Trie树;设置第一层的不匹配的转移节点;设置其余的不匹配转移节点;设置Trie树的各个节点的输出字符,即当到达预设状态时表明某个模式匹配成功,需要输出对应的字符串;初始化状态到根节点。
根据解析出的excel表头与数据中台建立的映射表表头进行匹配具体包括:逐个输入待搜索字符串;根据状态机的转移结果判断是否有模式匹配成功,若有则取出文本行与Trie树匹配,匹配成功的词加入tagList中,遍历tagList;根据匹配成功的词从关联关系映射表中获取表名,根据表名查询数据库,返回数据并填充到excel。
此外,智能化报表生成系统还包括登录模块,登录模块具体包括:获取单元,获取用户输入的用户名与密码;
匹配单元,查找数据库服务器中是否存在相同的用户名与密码匹配;当数据库服务器内存在相同的用户名与密码时,进入报表系统页面;当数据库服务器内不存在相同的用户名与密码时,提示用户重新输入。
本发明的有益效果:
本发明通过自定义报表模板、自动匹配中台数据,满足报表数据要求则导出数据,不满足报表数据要求则下发填报任务到镇街或者村社,以核待采,对数据进行查缺补漏、不断丰富基础库信息,减轻基层工作人员的工作负担。
附图说明
图1是本发明的系统功能模块图。
图2是本发明的数据流图。
图3是组织机构管理工作流程图。
具体实施方式
为了对本发明的技术特征、目的和有益效果有更加清楚的理解,现对本发明的技术方案精选以下详细说明。显然,所描述的实施案例是本发明一部分实施例,而不是全部实施例,不能理解为对本发明可实施范围的限定。基于本发明的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的其他所有实施例,都属于本发明的保护范围。
目前,很多政府部门要采集报表数据,首先通过召集镇街工作人员进行开会培训。其次,委办局工作人员制作excel模板并下发给各个镇街填写;镇街接收到数据采集模板后,发现很多数据需要最基层的村社通过实际的入户走访才能获取,于是镇街相关部门又召集各个村社的工作人员进行培训并下发采集模板。最后,村社工作人员填报好数据后提交给镇街部门汇总,镇街道部门再提交给委办局汇总。整个过程不但周期长,还加大了基层工作人员的负担,也不能确保数据的准确性。因此,本发明针对上述缺陷设计了一种智能化报表生成系统,采用自定义excel模板,导入模板自动关联数据中台数据,以核待采,对数据进行查缺补漏,减少基层工作人员的工作负担,达到减负的目的。本发明的具体设计内容见下列实施例。
实施例一:
本实施例中,如图1所示,一种智能化报表生成系统,包括:
数据采集模块,用于根据数据采集任务采集各个单位报表系统中的报表数据;
数据导入导出模块,用于按预设报表采集格式要求编制excel表头模板导入报表系统,以及在数据采集任务完成后从报表系统中将采集的报表数据导入到基础信息表中;
数据处理模块,用于将已有的基础信息表根据业务领域进行分类,并根据业务规则建立关联关系映射表;
数据匹配模块,用于解析excel表头模板,获取excel表头信息,通过改进Aho-Corasick算法将解析出的excel表头与数据中台建立的映射表表头进行匹配,根据匹配的结果返回相应的excel数据;
任务生成模块,用于根据数据匹配返回数据中的缺失数据生成数据采集任务并下发至区域所辖单位;
数据存储模块,用于将用户的个人信息和采集的报表数据存储在数据库服务器中。
本实施例中,委办局工作人员通过数据匹配模块查看匹配返回的数据是否满足预设的报表需求,如果满足则直接下载报表数据;如果无法完全满足报表需求则通过任务生成模块下发采集任务到委办局下属的镇街进行缺失报表数据采集,如若镇街工作人员也无法满足缺失报表数据填写,则进一步生成数据采集任务下发至村社进行缺失报表数据采集。
本实施例中,任务生成模块在生成数据采集任务时,是根据各个工作单位所缺失的报表数据信息和数据匹配返回的报表数据进行组合生成的,各单位在处理采集任务时,接收到任务下发的报表数据后,根据各个单元权限查看所属单元的报表数据,并根据已有的报表数据补充采集任务所缺失的报表数据,通过数据导入导出模块上传系统中。
本实施例中,对于缺失的报表数据过程具体包括;委办局查看匹配的数据是否满足报表需求,满足直接下载报表数据;无法完全满足则下发采集任务到镇街进行采集。镇街工作人员登录报表系统,对采集任务进行处理,在线打开excel后,自动带出委办局下发时匹配的数据,但仅能查看自己所在镇街的数据。如果镇街有报表所缺数据则填报提交并生成自己的电子签章,没有则下发任务到自己所辖村社进行数据采集。村社工作人员登录报表系统,对采集任务进行处理,在线打开excel后,自动带出镇街下发时匹配的数据,但仅能查看自己所在村社的数据。村社根据已有报表数据补充缺失数据,提交填报任务并生成自己的电子签章。所有镇街和村社填报完采集任务后,委办局工作人员导出报表数据,同时将采集数据更新到基础信息表,丰富基础信息表中的数据。
本实施例中,数据匹配模块包括关键词获取单元、解析单元和匹配查询单元;关键词获取单元用于根据预设条件构建匹配树来分析获取关键词;解析单元用于获取excel表头模板,通过POI工具包解析excel,获取excel表头;匹配查询单元用于通过改进Aho-Corasick算法将解析出的表头信息与数据中台建立的关联关系映射表表头进行匹配,根据匹配条件查询出关键词对应的业务数据。
本实施例中,关键词获取单元根据预设条件构建匹配树具体包括:按以下条件建立匹配树:
条件一:存在一个根节点,不代表任何字符,匹配树中其余每个节点保存关键词中的一个字符,并以字符值代指该节点;
条件二:若存在一个关键词,字符A是关键词中的一个字符,字符B是字符A的后继字符,则称字符B是字符A的子节点,所有关键词的第一个字符都是根节点的子节点,其中相同的值用同一个子节点表示;
条件三:如果从根节点到节点A经过的所有节点组成一条关键词,则把该条关键词的结束标志0也加入到节点A的子节点中,这个0节点称为叶子节点;
条件四:在节点A中记录子节点个数n,对节点A的任一子节点B,将其节点值对n取模,所有模相同的子节点相连组成一个链表;
条件五:所有的链表组成一个数组,节点A通过child指针指向该数组;
条件六:所有从根节点开始通过child指针到达某个结点,即到任意节点的路径是唯一的,从根到任一叶子节点可以得到一条关键词;反之,每条关键词都在匹配树中存在一条唯一的从根节点到叶子节点的路径;
条件七:将从根节点到节点A经过的节点相连得到一个字符串,设长度为m,则获得m-1个以节点A结尾的真子串,如果存在最长的真子串S,假设真子串S是某个关键词的起始部份,则在匹配树中存在一条从根节点到达节点F的路径,代表该真子串;节点A通过next指针与节点F相连;节点F就是匹配到A failure后需要继续进行匹配的下一个节点。
此外,智能化报表生成系统还包括登录模块,登录模块具体包括:获取单元,获取用户输入的用户名与密码;
匹配单元,查找数据库服务器中是否存在相同的用户名与密码匹配;当数据库服务器内存在相同的用户名与密码时,进入报表系统页面;当数据库服务器内不存在相同的用户名与密码时,提示用户重新输入。
本实施例中,匹配查询单元通过改进Aho-Corasick算法将解析出的excel表头与数据中台建立的映射表表头进行匹配过程具体包括以下流程:
1.用户上excel模板,通过POI工具包解析excel,获取excel表头;
2.通过中文分词工具获取表头分词;
3.获取数据中台中数据表所有列信息;
4.Aho-Corasick建立字典树(Trie树)过程,该流程具体包括:1) 根据中台数据表列信息(即待搜索模式集合)建立起一棵Trie树;2) 设置第一层的不匹配的转移节点;3)设置其余的不匹配转移节点;4) 设置Trie树的各个节点的输出字符,即当到达某个状态时表明某个模式匹配成功,需要输出对应的字符串。 5) 初始化状态到根节点;
5.Aho-Corasick查找匹配过程,该流程包括:1) 逐个输入待搜索字符串;2) 根据状态机的转移结果判断是否有模式匹配成功,若有则取出文本行与字典树匹配,匹配成功的词加入tagList中,遍历tagList;3) 根据匹配成功的词从关联关系映射表中获取表名,根据表名查询数据库,返回数据并填充到excel。
实施例二:
本实施例中,如图2所示,在实施例一提供的系统基础上,本发明的系统数据流动过程包括:初始化Trie树,逐个从待搜索字符串Keyword数据集合中添加字符串到Trie树中,然后根据success函数构建success表,直至所有待搜索字符串添加完成,检查并创建failure表,从输入文本行Input Text中取出文本行与字典树进行匹配,匹配成功的词加入被命中模式串tagList中。
实施例三:
本发明中所提及的报表系统,其功能模块和模块的工作流程如下:
1.组织机构管理模块
如图3所示,组织机构管理主要完成的功能有创建网格队伍、修改网格队伍信息、删除网格队伍信息,实现对本级组织机构的有效管理,并能通过机构队伍管理掌握当前区域下管理工作开展情况。创建新的机构网格队伍,添加队伍名称、创建人信息、队伍成员信息等。通过可视化操作界面,能便捷地修改队伍信息。系统可对误操作创建机构队伍进行删除、也可对正常创建的机构队伍进行删除操作。能对区域内的机构队伍信息进行实时查询。
2.网格管理模块
网格划分综合考虑房屋楼栋构成差异、人口密度以及常住人口和流动人口混居等因素,采取从下到上的方法,依托社区,小区为单位,根据各个社区的具体情况(自管小区、物管小区、单位小区、户籍人口、流动人口、管辖面积),同时考虑居民住宅、商业网点、驻区单位、社区共用设施(广场、绿化带、道路、公厕、车棚等)来分类,合理设置社区网格,各个网格之间要有机衔接,不留空白。
编码规则,一个管理单元网格在空间定义上应有一个唯一的编码,管理单元网格变更时,其原代码不应占用,新增管理单元网格按照原有编码规则进行扩展。
按理单元网格编码由14位数字组成,依次为:6位区级行政区划代码、3位乡镇代码、3位社区代码和2位管理单元网格顺序码。
区级行政区划代码应按照GB/T2260执行,乡镇代码和社区代码宜按各地管理要求进行编码。
管理单元网格顺序码在一个社区内按从左到右、从上到下的顺序进行编码。
部队、重点工程、大型企业、高校、大型商业区等特殊区域应独立划分管理单元网格,把原3位乡镇代码替换为特殊码。
数据要求:(1)一般规定。时间是描述管理单元网格的重要属性数据之一,它记录了管理单元网格划分与变更的历史过程。
管理单元网格数据应以房、户关联人的方式进行管理,户籍计量单位为户。
(2)空间要求。管理单元网格的几何特征应为面状,面与面之间应具有拓扑关系。管理单元网格数据采用的坐标系应与所在城市的根底坐标系一致。组成管理单元网格的多边形角点的定位中误差应不超过正负1m。
(3)时间。初始时间:第一次划分管理单元网格的时间。变更时间:原有的管理单元网格扩展再定义的时间。时间信息的记录应使用8位字符格式,以YYYY-MM-DD的方式表达。
(4)属性要求。管理单元网格属性数据包括管理单元网格编码、户籍数、管理区域等级、初始化时间、变更时间以及备注等。
网格管理模块的功能
支持对网格体系查看,对具体网格边界进行修改。
(1)【选择树】根据组织架构下专式选择,能选择到村社和网格级别;
(2)列表页
【列表页】显示序号、姓名、所在网格、类型、联系电话五个字段;
【网格范围】点击后弹出地图弹窗,显示当前区域范围;
【界面】显示出当前区域范围;
【编辑】点击后进入编辑状态;
【瞄点功能】拖动经纬度点位,可实现区域的改变;
【保存/关闭】点击关闭后关闭弹窗,且对修改内容不做存储,点击保存后,记录最新的区域点;
【数据处理】保存成功后同步更新数据库中的网格区域表,并记录出点位修改时间;
【运用】无论网格区域显示还是派单使用网格区域存在重叠时,以最近修改的记录为准。
3.常驻人口管理模块
常住人口管理,是利用平台建立的实有人口数据,通过身份证及护照号码关联人口的计生、社保、医疗等信息数据,涵盖“人”从出生、住房、工作、学习、流动、婚姻、养老到死亡的全生命周期。运用系统的软件分析辖区人口数量、构成及其变化等,用以研究人口的空间、时间分页和开展趋势,以及为人口方案开展、劳动力资源的分布,制订人口政策,解决辖区人口问题,为拟定社会管理方案提供决策咨询。常驻人口管理模块的管理流程包括:
3.1人口信息关联
根据公安的户籍信息,通过身份证及护照号码自动匹配业务数据。
3.2人口信息比对
通过网格管理员进行人口综合信息采集后,系统以身份证为唯一识别标记,通过数据交换平台进行人口综合信息比对,对于数据一致的,直接保存进入核心库,如果发现数据不一致或者数据错误,那么对该条数据进行标识。
3.3人口信息审核
有权限的人员比照对后的数据进行审核,如发现问题,可以把该数据退回给相应的社区网格员,由社区网格员确认后再次录入上报,这时,人口信息应以确认后再次上报数据为准。
3.4人口信息查询
实现人口信息的个案信息、变更轨迹、历史资料等的查询。支持针对社区计生、老龄等专项工作的目标人群定制查询,并可以保存查询条件为专项工作查询。支持单个或者多个角度的人口数据定制统计,并可以保存定制条件为专用蓌统计。
3.5人口数据分析
为政府领导和管理部门进行宏观决策提供充分、及时的信息支持和查询功能。
3.6以人找房
基于平台电子地图,查询当事人信息时,显示人口详细信息,同时还能在电子地图上准确地定位出当事人居住的房屋位置,点击列表中的人口信息。
4.特殊人群管理模块
该模块用于支持按特殊人群进行管理,包括特殊人群类型、区域、月份查询服务记录统计,数据的增删改查等。
5.数据分析可视化模块
该模块为慧减负板块的统计汇总信息可视化展示,包括,慧减负模块的统计数据值、减负情况及各镇街的报表上传情况。
慧减负UI界面设计说明:
(1)界面正上方显示慧减负板块的最新统计数据值,包括该市整体的报表填报及数据采集信息:报表累计填报数量、报表上报超时数量、报表填报回退数量、报表上报及时率、基层数据采集次数、基层数据采集条数。
(2)一采多用模块:显示该市当前年度的统计报表上传及数据采集情况,包括本年度基层数据采集次数及同比值、本年度数据收集累计耗时及同比值、本年度数据累计复用次数,并依据基础数据统计出对于基层减负的情况。
(3)近1月报表上传情况模块:显示最近1个月该市各个镇街的报表上传情况,根据该市各镇街的报表上传数量从大到小进行排列。
功能描述:
(1)界面风格:深色科技风,具体根据实际UI设计情况决定。
(2)当前页面被选中的菜单项,需高亮显示,具体颜色及风格根据实际UI设计情况决定。
(3)趋势图的纵坐标展示数据维度,最大边界值根据实际数据情况自适应。
(4)鼠标移入时,显示各柱体或各趋势点位的数据值。
(5)一采多用加入转动等特效。
(6)一采多用模块的数据统计信息需要有颜色、字体等对比。
6.系统登录模块
该模块用于支持用户登录。需求描述:1.用户输入系统地址后,进入系统登录页面;2.用户输入账号、密码点击登录即可进入系统首页;3.支持勾选记住用户密码。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护的范围由所附的权利要求书及其等效物界定。

Claims (7)

1.一种智能化报表生成系统,其特征在于,包括:
数据采集模块,用于根据数据采集任务采集各个单位报表系统中的报表数据;
数据导入导出模块,用于按预设报表采集格式要求编制excel表头模板导入报表系统,以及在数据采集任务完成后从报表系统中将采集的报表数据导入到基础信息表中;
数据处理模块,用于将已有的基础信息表根据业务领域进行分类,并根据业务规则建立关联关系映射表;
数据匹配模块,用于解析excel表头模板,获取excel表头信息,通过改进Aho-Corasick算法将解析出的excel表头与数据中台建立的映射表表头进行匹配,根据匹配的结果返回相应的excel数据;
任务生成模块,用于根据数据匹配返回数据中的缺失数据生成数据采集任务并下发至区域所辖单位;
数据存储模块,用于将用户的个人信息和采集的报表数据存储在数据库服务器中。
2.根据权利要求1所述的一种智能化报表生成系统,其特征在于,所述数据匹配模块包括关键词获取单元、解析单元和匹配查询单元;关键词获取单元用于根据预设条件构建匹配树来分析获取关键词;解析单元用于获取excel表头模板,通过POI工具包解析excel,获取excel表头;匹配查询单元用于通过改进Aho-Corasick算法将解析出的表头信息与数据中台建立的关联关系映射表表头进行匹配,根据匹配条件查询出关键词对应的业务数据。
3.根据权利要求2所述的一种智能化报表生成系统,其特征在于,所述根据预设条件构建匹配树具体包括:按以下条件建立匹配树:
条件一:存在一个根节点,不代表任何字符,匹配树中其余每个节点保存关键词中的一个字符,并以字符值代指该节点;
条件二:若存在一个关键词,字符A是关键词中的一个字符,字符B是字符A的后继字符,则称字符B是字符A的子节点,所有关键词的第一个字符都是根节点的子节点,其中相同的字符用同一个子节点表示;
条件三:如果从根节点到节点A经过的所有节点组成一条关键词,则把该条关键词的结束标志0也加入到节点A的子节点中,这个0节点称为叶子节点;
条件四:在节点A中记录子节点个数n,对节点A的任一子节点B,将其节点值对n取模,所有模相同的子节点相连组成一个链表;
条件五:所有的链表组成一个数组,节点A通过child指针指向该数组;
条件六:所有从根节点开始通过child指针到达任意结点的路径是唯一的,从根到任一叶子节点可以得到一条关键词;反之,每条关键词都在匹配树中存在一条唯一的从根节点到叶子节点的路径;
条件七:将从根节点到节点A经过的节点相连得到一个字符串,设长度为m,则获得m-1个以节点A结尾的真子串,如果存在最长的真子串S,假设真子串S是某个关键词的起始部份,则在匹配树中存在一条从根节点到达节点F的路径,代表该真子串;节点A通过next指针与节点F相连;节点F就是匹配到A failure后需要继续进行匹配的下一个节点。
4.根据权利要求2所述的一种智能化报表生成系统,其特征在于,所述匹配查询单元通过改进Aho-Corasick算法将解析出的表头信息与数据中台建立的关联关系映射表表头进行匹配过程具体包括:通过中文分词工具获取表头分词;获取数据中台中数据表所有列信息;通过改进Aho-Corasick算法建立Trie树;根据解析出的excel表头与数据中台建立的映射表表头进行匹配,根据匹配的结果返回相应的excel数据。
5.根据权利要求4所述的一种智能化报表生成系统,其特征在于,所述通过改进Aho-Corasick算法建立Trie树具体包括:根据数据中台数据表列信息建立起一棵Trie树;设置第一层的不匹配的转移节点;设置其余的不匹配转移节点;设置Trie树的各个节点的输出字符,即当到达预设状态时表明某个模式匹配成功,需要输出对应的字符串;初始化状态到根节点。
6.根据权利要求4所述的一种智能化报表生成系统,其特征在于,所述根据解析出的excel表头与数据中台建立的映射表表头进行匹配具体包括:逐个输入待搜索字符串;根据状态机的转移结果判断是否有模式匹配成功,若有则取出文本行与Trie树匹配,匹配成功的词加入tagList中,遍历tagList;根据匹配成功的词从关联关系映射表中获取表名,根据表名查询数据库,返回数据并填充到excel。
7.根据权利要求1所述的一种智能化报表生成系统,其特征在于,还包括登录模块,登录模块具体包括:获取单元,获取用户输入的用户名与密码;
匹配单元,查找数据库服务器中是否存在相同的用户名与密码匹配;当数据库服务器内存在相同的用户名与密码时,进入报表系统页面;当数据库服务器内不存在相同的用户名与密码时,提示用户重新输入。
CN202210281893.6A 2022-03-22 2022-03-22 一种智能化报表生成系统 Active CN114417802B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210281893.6A CN114417802B (zh) 2022-03-22 2022-03-22 一种智能化报表生成系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210281893.6A CN114417802B (zh) 2022-03-22 2022-03-22 一种智能化报表生成系统

Publications (2)

Publication Number Publication Date
CN114417802A true CN114417802A (zh) 2022-04-29
CN114417802B CN114417802B (zh) 2022-06-10

Family

ID=81263476

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210281893.6A Active CN114417802B (zh) 2022-03-22 2022-03-22 一种智能化报表生成系统

Country Status (1)

Country Link
CN (1) CN114417802B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115034186A (zh) * 2022-08-15 2022-09-09 北京永洪商智科技有限公司 一种基于数据处理的报表生成方法及系统
CN115329728A (zh) * 2022-08-11 2022-11-11 成都新津数字科技产业发展集团有限公司 工作数据低采集高复用协同办公报表通系统及方法
CN115423595A (zh) * 2022-11-02 2022-12-02 深圳高灯计算机科技有限公司 文件信息处理方法、装置、计算机设备和存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101719119A (zh) * 2009-11-18 2010-06-02 上海众恒信息产业有限公司 一种报表管理系统及方法
CN102855229A (zh) * 2011-06-30 2013-01-02 镇江雅迅软件有限责任公司 一种基于excel表格的自定义统计报表生成系统
CN103729337A (zh) * 2013-12-27 2014-04-16 金蝶软件(中国)有限公司 报表转换方法及装置
CN105320742A (zh) * 2015-09-24 2016-02-10 四川长虹电器股份有限公司 将传统财务报表的科目信息映射至xbrl分类标准格式的方法
CN107945048A (zh) * 2017-11-15 2018-04-20 广东电网有限责任公司电力科学研究院 一种基于计量自动化系统的数据补采系统
CN108009145A (zh) * 2017-12-18 2018-05-08 深圳市康必达控制技术有限公司 报表生成方法及装置
CN109918067A (zh) * 2019-01-23 2019-06-21 中国平安人寿保险股份有限公司 报表定制方法、装置、客户端及存储介质
CN112232047A (zh) * 2020-09-15 2021-01-15 福建省农村信用社联合社 一种多维数据采集和自动汇总方法、系统、设备和介质
CN112750025A (zh) * 2020-12-29 2021-05-04 山东浪潮通软信息科技有限公司 一种自动生成凭证的方法
CN113779941A (zh) * 2021-09-08 2021-12-10 无锡艾布斯智能科技发展有限公司 一种可配置的动态报表的生成装置、系统及方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101719119A (zh) * 2009-11-18 2010-06-02 上海众恒信息产业有限公司 一种报表管理系统及方法
CN102855229A (zh) * 2011-06-30 2013-01-02 镇江雅迅软件有限责任公司 一种基于excel表格的自定义统计报表生成系统
CN103729337A (zh) * 2013-12-27 2014-04-16 金蝶软件(中国)有限公司 报表转换方法及装置
CN105320742A (zh) * 2015-09-24 2016-02-10 四川长虹电器股份有限公司 将传统财务报表的科目信息映射至xbrl分类标准格式的方法
CN107945048A (zh) * 2017-11-15 2018-04-20 广东电网有限责任公司电力科学研究院 一种基于计量自动化系统的数据补采系统
CN108009145A (zh) * 2017-12-18 2018-05-08 深圳市康必达控制技术有限公司 报表生成方法及装置
CN109918067A (zh) * 2019-01-23 2019-06-21 中国平安人寿保险股份有限公司 报表定制方法、装置、客户端及存储介质
CN112232047A (zh) * 2020-09-15 2021-01-15 福建省农村信用社联合社 一种多维数据采集和自动汇总方法、系统、设备和介质
CN112750025A (zh) * 2020-12-29 2021-05-04 山东浪潮通软信息科技有限公司 一种自动生成凭证的方法
CN113779941A (zh) * 2021-09-08 2021-12-10 无锡艾布斯智能科技发展有限公司 一种可配置的动态报表的生成装置、系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
温星星: "金融数据报表平台的设计与实现", 《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》 *
温星星: "金融数据报表平台的设计与实现", 《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》, no. 2011, 15 September 2011 (2011-09-15), pages 138 - 403 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115329728A (zh) * 2022-08-11 2022-11-11 成都新津数字科技产业发展集团有限公司 工作数据低采集高复用协同办公报表通系统及方法
CN115329728B (zh) * 2022-08-11 2024-01-23 成都新津数字科技产业发展集团有限公司 工作数据低采集高复用协同办公报表系统及方法
CN115034186A (zh) * 2022-08-15 2022-09-09 北京永洪商智科技有限公司 一种基于数据处理的报表生成方法及系统
CN115423595A (zh) * 2022-11-02 2022-12-02 深圳高灯计算机科技有限公司 文件信息处理方法、装置、计算机设备和存储介质
CN115423595B (zh) * 2022-11-02 2023-03-28 深圳高灯计算机科技有限公司 文件信息处理方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN114417802B (zh) 2022-06-10

Similar Documents

Publication Publication Date Title
CN114417802B (zh) 一种智能化报表生成系统
CN110222373B (zh) 一种面向岩土工程全生命周期的工程勘察数据处理方法
CN109657074B (zh) 基于地址树的新闻知识图谱构建方法
CN108710625A (zh) 一种专题知识自动挖掘系统及方法
CN113434623B (zh) 一种基于多源异构空间规划数据的融合方法
CN109242170A (zh) 一种基于数据挖掘技术的城市道路管理系统及方法
CN113254630B (zh) 一种面向全球综合观测成果的领域知识图谱推荐方法
CN111612294A (zh) 一种基于时空大数据的城市体检系统
Christen et al. A probabilistic geocoding system based on a national address file
CN106982251A (zh) 基于移动设备的勘查项目野外工作数据上报方法及系统
CN113204329A (zh) 统一数据模型驱动业务应用的控制方法及其应用系统
CN114819589A (zh) 城市空间高质量利用测定方法、系统、计算机设备及终端
CN108416524A (zh) 基于一张图通用框架的产业规划精细化解读方法
Dong Exploration on web usage mining and its application
CN101295388A (zh) 一种信用评估方法及系统
Chen et al. Intelligent management information system of urban planning based on GIS
CN101576981A (zh) 场景式服务系统
CN117076590A (zh) 地址标准化方法、装置、计算机设备及可读存储介质
CN111784192A (zh) 一种基于动态演化的工业园区应急预案可执行化系统
CN112199566A (zh) 基于地产大数据的城市更新效果评估方法与系统
CN110019237A (zh) 一种基于地图分析罪犯行踪的系统及方法
CN113486115A (zh) 一种基于大数据的人才信息管理系统
CN113688870A (zh) 一种采用混合算法的基于用户用电行为的群租房识别方法
Simpson et al. Public access to conversion of data between geographies, with multiple look up tables derived from a postal directory
CN112950156A (zh) 一种基于教育云平台的人才遴选方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant