CN111079391B - 一种报表的生成方法及装置 - Google Patents
一种报表的生成方法及装置 Download PDFInfo
- Publication number
- CN111079391B CN111079391B CN201911407888.XA CN201911407888A CN111079391B CN 111079391 B CN111079391 B CN 111079391B CN 201911407888 A CN201911407888 A CN 201911407888A CN 111079391 B CN111079391 B CN 111079391B
- Authority
- CN
- China
- Prior art keywords
- target
- file
- sentence
- file type
- target sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 117
- 238000012545 processing Methods 0.000 claims abstract description 13
- 238000012546 transfer Methods 0.000 claims description 10
- 238000010276 construction Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 4
- 238000007405 data analysis Methods 0.000 abstract description 12
- 230000008569 process Effects 0.000 abstract description 8
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 229920001971 elastomer Polymers 0.000 description 2
- 239000000806 elastomer Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 235000019219 chocolate Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 235000013606 potato chips Nutrition 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种报表的生成方法及装置,其中,该方法包括:获取至少一种文件类型下的目标数据,并对于每一种文件类型,确定该文件类型下目标数据的取数方法,对该文件类型下目标数据进行取数处理,得到第一目标语句;确定该第一目标语句中属于预设目标种类下的词汇;最后,基于各个第一目标语句中属于预设目标种类下的词汇,构建报表;在该过程中,由于能够基于文件类型,确定所述文件类型下目标数据的取数方法,并所述预设目标种类及各个第一目标语句中属于预设目标种类下的词汇,从而构建报表,减少了人工操作,节省时间和资源,提高了生成数据分析报表的效率。
Description
技术领域
本申请涉及大数据领域,尤其是涉及一种报表的生成方法及装置。
背景技术
随着信息技术的高速发展,大数据时代逐渐来临,且其数据源具有多样性。为了充分体现数据的价值,可以将数据整合为数据分析报表,以便于后续的使用。
现有技术中,通常需要人工逐一地获取数据,并按照数据固有的属性,将获取到的数据整合成相应的数据分析报表,再按照报表的结构进行相应的调整,由此,需要消耗较多的时间与人工,生成数据分析报表的效率不佳。
发明内容
有鉴于此,本申请的目的在于提供一种报表的生成方法及装置,以提高生成数据分析报表的效率。
第一方面,本申请实施例提供了一种报表的生成方法,包括:
获取至少一种文件类型下的目标数据,并对于每一种文件类型,确定该文件类型下目标数据的取数方法;
基于该文件类型下目标数据的取数方法,对该文件类型下目标数据进行取数处理,得到第一目标语句;
基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇;
基于各个第一目标语句中属于预设目标种类下的词汇,构建报表;所述报表包括:所述预设目标种类及各个第一目标语句中属于预设目标种类下的词汇。
一种可选实施方式中,所述文件类型包括以下任意一种:
HIVE文件、Hbase文件、Greenplum文件、PostgreSQL文件,以及Elasticsearch文件、webmagic文件。
一种可选实施方式中,所述对于每一种文件类型,确定该文件类型下目标数据的取数方法,包括:
针对HIVE文件、Hbase文件、Greenplum文件、PostgreSQL文件中的目标数据,利用结构化查询SQL语句作为所述取数方法,得到所述第一目标语句;
和/或,
针对Elasticsearch文件、webmagic文件中的目标数据,利用超文本传输协议HTTP请求作为所述取数方法,得到所述第一目标语句。
一种可选实施方式中,所述预设目标种类包括以下至少一种:
时间、数量、物品名称、品牌、年龄、性别。
一种可选实施方式中,在所述基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇之后,还包括:
针对该第一目标语句中除属于预设目标种类下的词汇之外的词汇,进行删除处理。
一种可选实施方式中,在基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇之后,还包括:
基于该第一目标语句,将属于预设目标种类的词汇用变量进行替换,得到该第一目标语句对应的第二目标语句。
一种可选实施方式中,在基于该第一目标语句,将属于预设目标种类的词汇用变量进行替换,得到该第一目标语句对应的第二目标语句之后,还包括:
基于各个第二目标语句的顺序,对各第二目标语句进行编号;各个第二目标语句的顺序,与所述报表中属于预设目标种类的词汇顺序相对应;
基于各个第二目标语句的文件类型及取数方法,对各第二目标语句添加标识;所述标识为各个第二目标语句对应的取数方法。
第二方面,本申请实施例还提供一种报表的生成装置,该报表的生成装置包括:获取模块、处理模块、确定模块以及构建模块,其中:
所述获取模块,用于获取至少一种文件类型下的目标数据,并对于每一种文件类型,确定该文件类型下目标数据的取数方法;
所述处理模块,用于基于该文件类型下目标数据的取数方法,对该文件类型下目标数据进行取数处理,得到第一目标语句;
所述确定模块,用于基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇;
所述构建模块,用于基于各个第一目标语句中属于预设目标种类下的词汇,构建报表;所述报表包括:所述预设目标种类及各个第一目标语句中属于预设目标种类下的词汇。
一种可选实施方式中,所述文件类型包括以下任意一种:
HIVE文件、Hbase文件、Greenplum文件、PostgreSQL文件,以及Elasticsearch文件、webmagic文件。
一种可选实施方式中,所述获取模块,用于获取至少一种文件类型下的目标数据,并对于每一种文件类型,确定该文件类型下目标数据的取数方法时,具体用于:
针对HIVE文件、Hbase文件、Greenplum文件、PostgreSQL文件中的目标数据,利用结构化查询SQL语句作为所述取数方法,得到所述第一目标语句;
和/或,
针对Elasticsearch文件、webmagic文件中的目标数据,利用超文本传输协议HTTP请求作为所述取数方法,得到所述第一目标语句。
一种可选实施方式中,所述预设目标种类包括以下至少一种:
时间、数量、物品名称、品牌、年龄、性别。
一种可选实施方式中,在所述确定模块,用于基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇之后,还用于:
针对该第一目标语句中除属于预设目标种类下的词汇之外的词汇,进行删除处理。
一种可选实施方式中,在所述确定模块,用于基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇之后,还包括:替换模块,其中:
所述替换模块,用于基于该第一目标语句,将属于预设目标种类的词汇用变量进行替换,得到该第一目标语句对应的第二目标语句。
一种可选实施方式中,在替换模块,用于基于所述第一目标语句,将属于预设目标种类的可替换词汇用变量进行替换,得到第二目标语句之后,还用于:
基于各个第二目标语句的顺序,对各第二目标语句进行编号;各个第二目标语句的顺序,与所述报表中属于预设目标种类的词汇顺序相对应;
基于各个第二目标语句的文件类型及取数方法,对各第二目标语句添加标识;所述标识为各个第二目标语句对应的取数方法。
第三方面,本申请实施例还提供一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面、或第一方面中任一种可能的实施方式中的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面、或第一方面中任一种可能的实施方式中的步骤。
本申请实施例提供的一种报表的生成方法及装置,首先,获取至少一种文件类型下的目标数据,并对于每一种文件类型,确定该文件类型下目标数据的取数方法;之后,基于该文件类型下目标数据的取数方法,对该文件类型下目标数据进行取数处理,得到第一目标语句;并基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇;最后,基于各个第一目标语句中属于预设目标种类下的词汇,构建报表;所述报表包括:所述预设目标种类及各个第一目标语句中属于预设目标种类下的词汇。在该过程中,由于能够基于文件类型,确定所述文件类型下目标数据的取数方法,并所述预设目标种类及各个第一目标语句中属于预设目标种类下的词汇,从而构建报表,减少了人工操作,节省时间和资源,提高了生成数据分析报表的效率。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种报表的生成方法的流程图;
图2示出了本申请实施例所提供的另一种报表的生成方法的流程图;
图3示出了本申请实施例所提供的一种报表的生成装置名称的结构示意图;
图4示出了本申请实施例所提供的一种计算机设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
考虑到现有技术中,在生成数据分析报表的过程中,通常需要人工逐一地去获取数据,按照数据固有的属性,将获取到的数据整合成相应的数据分析报表,再按照报表的结构进行相应的调整,需要消耗较多的人工与实践,并且其生成数据分析报表的效率不佳。
本申请实施例提供的一种报表的生成方法及装置,首先,获取至少一种文件类型下的目标数据,并对于每一种文件类型,确定该文件类型下目标数据的取数方法;之后,基于该文件类型下目标数据的取数方法,对该文件类型下目标数据进行取数处理,得到第一目标语句;并基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇;最后,基于各个第一目标语句中属于预设目标种类下的词汇,构建报表;所述报表包括:所述预设目标种类及各个第一目标语句中属于预设目标种类下的词汇。在该过程中,由于能够基于文件类型,确定所述文件类型下目标数据的取数方法,并所述预设目标种类及各个第一目标语句中属于预设目标种类下的词汇,从而构建报表,减少了人工操作,节省时间和资源,提高了生成数据分析报表的效率。
针对以上方案所存在的缺陷,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本申请针对上述问题所提出的解决方案,都应该是发明人在本申请过程中对本申请做出的贡献。
下面将结合本申请中附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
本公开实施例所提供的报表的生成方法的执行主体一般为具有一定计算能力的计算机设备,该计算机设备例如包括:终端设备或服务器或其它处理设备,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该报表的生成方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
下面以执行主体为计算机设备为例对本公开实施例提供的报表的生成方法加以说明。
实施例一
参见图1所示,为本申请实施例一提供的一种报表的生成方法的流程图,所述方法包括步骤S101~S104,其中:
S101:获取至少一种文件类型下的目标数据,并对于每一种文件类型,确定该文件类型下目标数据的取数方法。
S102:基于该文件类型下目标数据的取数方法,对该文件类型下目标数据进行取数处理,得到第一目标语句。
S103:基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇。
S104:基于各个第一目标语句中属于预设目标种类下的词汇,构建报表;所述报表包括:所述预设目标种类及各个第一目标语句中属于预设目标种类下的词汇。
下面分别对上述S101~S103分别加以详细说明。
一:在上述S101中,获取至少一种文件类型下的目标数据,并对于每一种文件类型,确定该文件类型下目标数据的取数方法。
其中,所述文件类型包括以下任意一种:
HIVE文件、Hbase文件、Greenplum文件、PostgreSQL文件,以及Elasticsearch文件、webmagic文件。
示例性的,HIVE文件指的是Windows注册表HIVE文件,其文件存储格式包括以下几类:TEXTFILE、SEQUENCEFILE、RCFIL,其中,TEXTFILE为默认格式。
示例性的,HBase是一个分布式的、面向列的开源数据库,是一种个高可靠性、高性能、面向列、可伸缩的分布式存储系统。
示例性的,Greenplum文件的架构采用了大规模并行处理(massively parallelprocessing,MMP),属于用户访问一个中心数据库。
示例性的,是一种特性非常齐全的自由软件的对象-关系型数据库管理系统(ORDBMS),PostgreSQL支持大部分的结构化查询(Structured Query Language,SQL)语句标准并且提供了很多其他现代特性,如复杂查询、外键、触发器、视图、事务完整性、多版本并发控制等。
示例性的,Elasticsearch文件是一个基于Lucene的搜索服务器,提供了一个分布式多用户能力的全文搜索引擎,能够达到实时搜索,稳定,可靠,快速,安装使用方便得目的。
示例性的,webmagic文件是一个简单灵活的Java爬虫框架,可以快速开发出一个高效、易维护的爬虫,简化爬虫的开发流程。
所述对于每一种文件类型,确定该文件类型下目标数据的取数方法,包括:
针对HIVE文件、Hbase文件、Greenplum文件、PostgreSQL文件中的目标数据,利用结构化查询(Structured Query Language,SQL)语句作为所述取数方法,得到所述第一目标语句;
和/或,
针对Elasticsearch文件、webmagic文件中的目标数据,利用超文本传输协议HTTP请求作为所述取数方法,得到所述第一目标语句。
示例性的,结构化查询SQL语句是一种特殊目的的编程语言,是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统;同时也是数据库脚本文件的扩展名。
示例性的,超文本传输协议(Hyper Text Transfer Protocol,HTTP)请求是指从客户端到服务器端的请求消息。包括:消息首行中,对资源的请求方法、资源的标识符及使用的协议。
示例性的,假设目标数据存储在hive文件中,那么就可以基于结构化查询SQL语句,从hive文件中获取目标数据。
示例性的,假设目标数据存储在Elasticsearch文件中,那么就可以基于超文本传输协议HTTP请求,从Elasticsearch文件中获取目标数据。
二:在上述S102中,基于步骤S101中确定的所述文件类型下目标数据的取数方法,对所述文件类型下目标数据进行取数处理,得到第一目标语句。
示例性的,假设目标数据存储在hive文件中,那么就可以基于结构化查询SQL语句,从hive文件中,对目标数据进行取数处理,得到第一目标语句。
示例性的,假设目标数据存储在Hbase文件中,那么就可以基于结构化查询SQL语句,从Hbase文件中,对目标数据进行取数处理,得到第一目标语句。
示例性的,假设目标数据存储在Greenplum文件中,那么就可以基于结构化查询SQL语句,从Greenplum文件中,对目标数据进行取数处理,得到第一目标语句。
示例性的,假设目标数据存储在PostgreSQL文件中,那么就可以基于结构化查询SQL语句,从PostgreSQL文件中,对目标数据进行取数处理,得到第一目标语句。
示例性的,假设目标数据存储在Elasticsearch文件中,那么就可以基于超文本传输协议HTTP请求,从Elasticsearch文件中,对目标数据进行取数处理,得到第一目标语句。
示例性的,假设目标数据存储在webmagic文件中,那么就可以基于超文本传输协议HTTP请求,从webmagic文件中,对目标数据进行取数处理,得到第一目标语句。
三:在上述S103中,基于步骤S102中获取的所述第一目标语句,确定属于预设目标种类下的词汇。
参阅图2,图2为另一种报表的生成方法的流程图。
其中所述预设目标种类包括以下至少一种:
时间、数量、物品名称、品牌、年龄、性别。
示例性的,基于获取到的第一目标语句与预设目标种类,确定在第一目标语句中,对应预设目标种类的词汇。
示例性的,若预设目标种类为年龄,那么属于预设目标种类下的词汇就是表征年龄的对应词汇,例如:中年、20岁等。
示例性的,若预设目标种类为职业,那么属于预设目标种类下的词汇就是表征职业的对应词汇,例如:教师、会计、医生等。
示例性的,若预设目标种类为物品名称,那么属于预设目标种类下的词汇就是表征物品名称的对应词汇,例如:巧克力、牛奶、薯片等。
此外,在所述基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇之后,还包括:
针对该第一目标语句中除属于预设目标种类下的词汇之外的词汇,进行删除处理。
示例性的,在第一目标语句中,若包含一些词汇不属于预设目标种类,例如:地名、季节等词汇,则直接对该词汇进行删除处理。
此外,在基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇之后,还包括:
基于该第一目标语句,将属于预设目标种类的词汇用变量进行替换,得到该第一目标语句对应的第二目标语句。
示例性的,将表征年龄的词汇用变量A替换,表征职业的词汇用B来替换,依次类推,方便后续报表的构建。
在基于所述第一目标语句,将属于预设目标种类的可替换词汇用变量进行替换,得到第二目标语句之后,还包括:
基于各个第二目标语句的顺序,对各第二目标语句进行编号;各个第二目标语句的顺序,与所述报表中属于预设目标种类的词汇顺序相对应;
基于各个第二目标语句的文件类型及取数方法,对各第二目标语句添加标识;所述标识为各个第二目标语句对应的取数方法。
示例性的,从hive文件中获取的第二目标语句,该第二目标语句的标识为hive。
示例性的,从Hbase文件中获取的第二目标语句,该第二目标语句的标识为Hbase。
示例性的,从Greenplum文件中获取的第二目标语句,该第二目标语句的标识为Greenplum。
示例性的,从PostgreSQL文件中获取的第二目标语句,该第二目标语句的标识为PostgreSQL。
示例性的,从Elasticsearch文件中获取的第二目标语句,该第二目标语句的标识为Elasticsearch。
示例性的,从webmagic文件中获取的第二目标语句,该第二目标语句的标识为webmagic。
四:在上述S104中,基于步骤S103中所述预设目标种类及获取的所述属于预设目标种类下的词汇,构建报表;
其中,所述报表包括:所述预设目标种类及所述属于预设目标种类下的词汇。
示例性的,将获取的所述属于预设目标种类下的词汇对应其所属的预设目标种类,构建报表。
本申请实施例提供一种报表的生成方法,首先,获取至少一种文件类型下的目标数据,并对于每一种文件类型,确定该文件类型下目标数据的取数方法;之后,基于该文件类型下目标数据的取数方法,对该文件类型下目标数据进行取数处理,得到第一目标语句;并基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇;最后,基于各个第一目标语句中属于预设目标种类下的词汇,构建报表;所述报表包括:所述预设目标种类及各个第一目标语句中属于预设目标种类下的词汇。在该过程中,由于能够基于文件类型,确定所述文件类型下目标数据的取数方法,并所述预设目标种类及各个第一目标语句中属于预设目标种类下的词汇,从而构建报表,减少了人工操作,节省时间和资源,提高了生成数据分析报表的效率。
实施例二
参照图3所示,为本申请实施例二提供的一种报表的生成装置的结构示意图,所述装置包括:获取模块31、处理模块32、确定模块33以及构建模块34,其中:
获取模块31,用于获取至少一种文件类型下的目标数据,并对于每一种文件类型,确定该文件类型下目标数据的取数方法;
处理模块32,用于基于该文件类型下目标数据的取数方法,对该文件类型下目标数据进行取数处理,得到第一目标语句;
确定模块33,用于基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇;
构建模块34,用于基于各个第一目标语句中属于预设目标种类下的词汇,构建报表;所述报表包括:所述预设目标种类及各个第一目标语句中属于预设目标种类下的词汇。
基于上述研究,本申请实施例提供了一种报表的生成装置,首先,获取至少一种文件类型下的目标数据,并对于每一种文件类型,确定该文件类型下目标数据的取数方法;之后,基于该文件类型下目标数据的取数方法,对该文件类型下目标数据进行取数处理,得到第一目标语句;并基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇;最后,基于各个第一目标语句中属于预设目标种类下的词汇,构建报表;所述报表包括:所述预设目标种类及各个第一目标语句中属于预设目标种类下的词汇。在该过程中,由于能够基于文件类型,确定所述文件类型下目标数据的取数方法,并所述预设目标种类及各个第一目标语句中属于预设目标种类下的词汇,从而构建报表,减少了人工操作,节省时间和资源,提高了生成数据分析报表的效率。
一种可能的实施方式中,所述文件类型包括以下任意一种:
HIVE文件、Hbase文件、Greenplum文件、PostgreSQL文件,以及Elasticsearch文件、webmagic文件。
一种可能的实施方式中,所述获取模块31,用于获取至少一种文件类型下的目标数据,并对于每一种文件类型,确定该文件类型下目标数据的取数方法时,具体用于:
针对HIVE文件、Hbase文件、Greenplum文件、PostgreSQL文件中的目标数据,利用结构化查询SQL语句作为所述取数方法,得到所述第一目标语句;
和/或,
针对Elasticsearch文件、webmagic文件中的目标数据,利用超文本传输协议HTTP请求作为所述取数方法,得到所述第一目标语句。
一种可能的实施方式中,所述预设目标种类包括以下至少一种:
时间、数量、物品名称、品牌、年龄、性别。
一种可能的实施方式中,在所述确定模块33,用于基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇之后,还用于:
针对该第一目标语句中除属于预设目标种类下的词汇之外的词汇,进行删除处理。
一种可能的实施方式中,在所述确定模块33,用于基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇之后,还包括:替换模块35,其中:
所述替换模块35,用于基于该第一目标语句,将属于预设目标种类的词汇用变量进行替换,得到该第一目标语句对应的第二目标语句。
一种可能的实施方式中,在替换模块35,用于基于该第一目标语句,将属于预设目标种类的词汇用变量进行替换,得到该第一目标语句对应的第二目标语句之后,还用于:
基于各个第二目标语句的顺序,对各第二目标语句进行编号;各个第二目标语句的顺序,与所述报表中属于预设目标种类的词汇顺序相对应;
基于各个第二目标语句的文件类型及取数方法,对各第二目标语句添加标识;所述标识为各个第二目标语句对应的取数方法。
实施例三
本申请实施例还提供了一种计算机设备400,如图4所示,为本申请实施例提供的计算机设备400结构示意图,包括:
处理器41、存储器42、和总线43;存储器42用于存储执行指令,包括内存421和外部存储器422;这里的内存421也称内存储器,用于暂时存放处理器41中的运算数据,以及与硬盘等外部存储器422交换的数据,处理器41通过内存421与外部存储器422进行数据交换,当所述计算机设备400运行时,所述处理器41与所述存储器42之间通过总线43通信,使得所述处理器41在用户态执行以下指令:
获取至少一种文件类型下的目标数据,并对于每一种文件类型,确定该文件类型下目标数据的取数方法;
基于该文件类型下目标数据的取数方法,对该文件类型下目标数据进行取数处理,得到第一目标语句;
基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇;
基于各个第一目标语句中属于预设目标种类下的词汇,构建报表;所述报表包括:所述预设目标种类及各个第一目标语句中属于预设目标种类下的词汇。
一种可能的实施方式中,处理器41执行的指令中,所述文件类型包括以下任意一种:
HIVE文件、Hbase文件、Greenplum文件、PostgreSQL文件,以及Elasticsearch文件、webmagic文件。
一种可能的实施方式中,处理器41执行的指令中,所述对于每一种文件类型,确定该文件类型下目标数据的取数方法,包括:
针对HIVE文件、Hbase文件、Greenplum文件、PostgreSQL文件中的目标数据,利用结构化查询SQL语句作为所述取数方法,得到所述第一目标语句;
和/或,
针对Elasticsearch文件、webmagic文件中的目标数据,利用超文本传输协议HTTP请求作为所述取数方法,得到所述第一目标语句。
一种可能的实施方式中,处理器41执行的指令中,所述预设目标种类包括以下至少一种:
时间、数量、物品名称、品牌、年龄、性别。
一种可能的实施方式中,处理器41执行的指令中,在所述基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇之后,还包括:
针对该第一目标语句中除属于预设目标种类下的词汇之外的词汇,进行删除处理。
一种可能的实施方式中,处理器41执行的指令中,在基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇之后,还包括:
基于该第一目标语句,将属于预设目标种类的词汇用变量进行替换,得到该第一目标语句对应的第二目标语句。
一种可能的实施方式中,处理器41执行的指令中,在基于该第一目标语句,将属于预设目标种类的词汇用变量进行替换,得到该第一目标语句对应的第二目标语句之后,还包括:
基于各个第二目标语句的顺序,对各第二目标语句进行编号;各个第二目标语句的顺序,与所述报表中属于预设目标种类的词汇顺序相对应;
基于各个第二目标语句的文件类型及取数方法,对各第二目标语句添加标识;所述标识为各个第二目标语句对应的取数方法。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的报表的生成方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
Claims (7)
1.一种报表的生成方法,其特征在于,包括:
获取至少一种文件类型下的目标数据,并对于每一种文件类型,确定该文件类型下目标数据的取数方法;
基于该文件类型下目标数据的取数方法,对该文件类型下目标数据进行取数处理,得到第一目标语句;
基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇;
基于各个第一目标语句中属于预设目标种类下的词汇,构建报表;所述报表包括:所述预设目标种类及各个第一目标语句中属于预设目标种类下的词汇;
所述对于每一种文件类型,确定该文件类型下目标数据的取数方法,包括:
针对HIVE文件、Hbase文件、Greenplum文件、PostgreSQL文件中的目标数据,利用结构化查询SQL语句作为所述取数方法,得到所述第一目标语句;
和/或,
针对Elasticsearch文件、webmagic文件中的目标数据,利用超文本传输协议HTTP请求作为所述取数方法,得到所述第一目标语句;
在所述基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇之后,还包括:
基于该第一目标语句,将属于预设目标种类的词汇用变量进行替换,得到该第一目标语句对应的第二目标语句;
基于各个第二目标语句的顺序,对各第二目标语句进行编号;各个第二目标语句的顺序,与所述报表中属于预设目标种类的词汇顺序相对应;
基于各个第二目标语句的文件类型及取数方法,对各第二目标语句添加标识;所述标识为各个第二目标语句对应的取数方法。
2.根据权利要求1所述的方法,其特征在于,所述文件类型包括以下任意一种:
HIVE文件、Hbase文件、Greenplum文件、PostgreSQL文件,以及Elasticsearch文件、webmagic文件。
3.根据权利要求1所述的方法,其特征在于,所述预设目标种类包括以下至少一种:
时间、数量、物品名称、品牌、年龄、性别。
4.根据权利要求1所述的方法,其特征在于,在所述基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇之后,还包括:
针对该第一目标语句中除属于预设目标种类下的词汇之外的词汇,进行删除处理。
5.一种报表的生成装置,其特征在于,包括:
获取模块,用于获取至少一种文件类型下的目标数据,并对于每一种文件类型,确定该文件类型下目标数据的取数方法;
处理模块,用于基于该文件类型下目标数据的取数方法,对该文件类型下目标数据进行取数处理,得到第一目标语句;
确定模块,用于基于每个第一目标语句,确定该第一目标语句中属于预设目标种类下的词汇;
构建模块,用于基于各个第一目标语句中属于预设目标种类下的词汇,构建报表;所述报表包括:所述预设目标种类及各个第一目标语句中属于预设目标种类下的词汇;
所述获取模块,具体用于:
针对HIVE文件、Hbase文件、Greenplum文件、PostgreSQL文件中的目标数据,利用结构化查询SQL语句作为所述取数方法,得到所述第一目标语句;
和/或,
针对Elasticsearch文件、webmagic文件中的目标数据,利用超文本传输协议HTTP请求作为所述取数方法,得到所述第一目标语句;
标识模块,用于基于该第一目标语句,将属于预设目标种类的词汇用变量进行替换,得到该第一目标语句对应的第二目标语句;
基于各个第二目标语句的顺序,对各第二目标语句进行编号;各个第二目标语句的顺序,与所述报表中属于预设目标种类的词汇顺序相对应;
基于各个第二目标语句的文件类型及取数方法,对各第二目标语句添加标识;所述标识为各个第二目标语句对应的取数方法。
6.一种计算机设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至4任一所述的方法的步骤。
7.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至4任一所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911407888.XA CN111079391B (zh) | 2019-12-31 | 2019-12-31 | 一种报表的生成方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911407888.XA CN111079391B (zh) | 2019-12-31 | 2019-12-31 | 一种报表的生成方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111079391A CN111079391A (zh) | 2020-04-28 |
CN111079391B true CN111079391B (zh) | 2024-01-19 |
Family
ID=70320454
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911407888.XA Active CN111079391B (zh) | 2019-12-31 | 2019-12-31 | 一种报表的生成方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111079391B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103092890A (zh) * | 2011-11-08 | 2013-05-08 | 苏州中茵泰格科技有限公司 | 报表自动生成及发送的系统及方法 |
US8453126B1 (en) * | 2008-07-30 | 2013-05-28 | Dulles Research LLC | System and method for converting base SAS runtime macro language scripts to JAVA target language |
CN107908659A (zh) * | 2017-10-17 | 2018-04-13 | 深圳前海微众银行股份有限公司 | 数据报表配置方法、报表平台和计算机可读存储介质 |
CN108572963A (zh) * | 2017-03-09 | 2018-09-25 | 北京京东尚科信息技术有限公司 | 信息获取方法和装置 |
CN108694214A (zh) * | 2017-04-12 | 2018-10-23 | 北京京东尚科信息技术有限公司 | 数据报表的生成方法、生成装置、可读介质及电子设备 |
CN109190007A (zh) * | 2018-07-20 | 2019-01-11 | 阿里巴巴集团控股有限公司 | 数据分析方法及装置 |
CN109446262A (zh) * | 2018-10-31 | 2019-03-08 | 成都四方伟业软件股份有限公司 | 一种数据汇聚方法及装置 |
CN110069453A (zh) * | 2017-09-30 | 2019-07-30 | 北京国双科技有限公司 | 运维数据处理方法和装置 |
-
2019
- 2019-12-31 CN CN201911407888.XA patent/CN111079391B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8453126B1 (en) * | 2008-07-30 | 2013-05-28 | Dulles Research LLC | System and method for converting base SAS runtime macro language scripts to JAVA target language |
CN103092890A (zh) * | 2011-11-08 | 2013-05-08 | 苏州中茵泰格科技有限公司 | 报表自动生成及发送的系统及方法 |
CN108572963A (zh) * | 2017-03-09 | 2018-09-25 | 北京京东尚科信息技术有限公司 | 信息获取方法和装置 |
CN108694214A (zh) * | 2017-04-12 | 2018-10-23 | 北京京东尚科信息技术有限公司 | 数据报表的生成方法、生成装置、可读介质及电子设备 |
CN110069453A (zh) * | 2017-09-30 | 2019-07-30 | 北京国双科技有限公司 | 运维数据处理方法和装置 |
CN107908659A (zh) * | 2017-10-17 | 2018-04-13 | 深圳前海微众银行股份有限公司 | 数据报表配置方法、报表平台和计算机可读存储介质 |
CN109190007A (zh) * | 2018-07-20 | 2019-01-11 | 阿里巴巴集团控股有限公司 | 数据分析方法及装置 |
CN109446262A (zh) * | 2018-10-31 | 2019-03-08 | 成都四方伟业软件股份有限公司 | 一种数据汇聚方法及装置 |
Non-Patent Citations (1)
Title |
---|
基于SQL的报表生成系统;罗铁坚,陈霞;广西大学学报(自然科学版)(第01期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111079391A (zh) | 2020-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109739894B (zh) | 补充元数据描述的方法、装置、设备及存储介质 | |
CN110795455B (zh) | 依赖关系解析方法、电子装置、计算机设备及可读存储介质 | |
US9305176B2 (en) | Database generation from a spreadsheet | |
US20160171505A1 (en) | Extract, transform, and load (etl) processing | |
US20150161280A1 (en) | Method and system for centralized issue tracking | |
CN105431844A (zh) | 用于搜索系统的第三方搜索应用 | |
CN108415998B (zh) | 应用依赖关系更新方法、终端、设备及存储介质 | |
CN110781183B (zh) | Hive数据库中增量数据的处理方法、装置以及计算机设备 | |
CN112860727B (zh) | 基于大数据查询引擎的数据查询方法、装置、设备及介质 | |
US9706005B2 (en) | Providing automatable units for infrastructure support | |
CN112883030A (zh) | 数据收集方法、装置、计算机设备和存储介质 | |
CN110795697A (zh) | 逻辑表达式的获取方法、装置、存储介质以及电子装置 | |
CN111435406A (zh) | 一种纠正数据库语句拼写错误的方法和装置 | |
CN116450890A (zh) | 图数据处理方法、装置、系统、电子设备及存储介质 | |
CN114356968A (zh) | 查询语句生成方法、装置、计算机设备及存储介质 | |
CN113934786A (zh) | 一种构建统一etl的实施方法 | |
CN111079391B (zh) | 一种报表的生成方法及装置 | |
CN115357625A (zh) | 结构化数据比对方法、装置、电子设备及存储介质 | |
KR102308521B1 (ko) | 정보 업데이트 방법 및 장치 | |
CN112765200A (zh) | 一种基于Elasticsearch的数据查询方法及装置 | |
CN113448985A (zh) | 一种api接口生成方法、调用方法、装置及电子设备 | |
CN112579705A (zh) | 元数据采集方法、装置、计算机设备和存储介质 | |
CN111104369A (zh) | 一种检索数据库构建方法及装置 | |
CN111311329B (zh) | 标签数据获取方法、装置、设备及可读存储介质 | |
CN115242638B (zh) | 可行触达的筛选方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |