CN111222930A - 支持大屏幕展示的发票监控方法、装置及系统 - Google Patents

支持大屏幕展示的发票监控方法、装置及系统 Download PDF

Info

Publication number
CN111222930A
CN111222930A CN202010000727.5A CN202010000727A CN111222930A CN 111222930 A CN111222930 A CN 111222930A CN 202010000727 A CN202010000727 A CN 202010000727A CN 111222930 A CN111222930 A CN 111222930A
Authority
CN
China
Prior art keywords
data
invoice
large screen
preprocessed
invoicing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010000727.5A
Other languages
English (en)
Inventor
李凯
李泽然
魏海健
王晓亮
王凯
党璐一
胡聚平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ele Cloud Information Technology Co ltd
Original Assignee
Ele Cloud Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ele Cloud Information Technology Co ltd filed Critical Ele Cloud Information Technology Co ltd
Priority to CN202010000727.5A priority Critical patent/CN111222930A/zh
Publication of CN111222930A publication Critical patent/CN111222930A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/04Billing or invoicing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/546Message passing systems or structures, e.g. queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0203Market surveys; Market polls
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/54Indexing scheme relating to G06F9/54
    • G06F2209/548Queue

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开支持大屏幕展示的发票监控方法、装置及系统。该方法包括:提取电子发票数据,所述电子发票的票面信息包括商品名称、商品数量、销售额、纳税额、购买方和销售方;将电子发票数据中的销售方、商品和购货方的数据通过拉取的方式写入消息队列;从消息队列中取出销售方、商品和购货方的数据,进行预处理,得到预处理后的数据;根据预先设计的统计规则,在时间窗口内统计所述预处理后的数据,生成待大屏显示的展示数据;通过BI数据可视化工具将生成的待大屏显示的展示数据展示在大屏上。

Description

支持大屏幕展示的发票监控方法、装置及系统
技术领域
本发明涉及大数据技术领域,尤其涉及一种支持大屏幕展示的发票监控方法、装置及系统。
背景技术
随着时代的发展,大数据的重要性已经逐渐被人们意识到,各大公司纷纷开始进行数据收集、数据分析、数据展示、数据决策等数据运营业务。
在数据运营的过程中,如何让数据说话就显得格外重要。数据若“静止”或“停滞”在数据库,则难以发挥其应有的价值,对业务的辅助作用也是微乎其微。因此,企业对数据展示的重视性也就在不断提高。
如果因为展示的形式不佳而导致数据的可读性降低,影响观者的快速理解,数据展示也就失去了意义。
发明内容
针对现有技术的不足,本发明提供支持大屏幕展示的发票监控方法及系统,以解决目前发票数据收集及展示不及时等问题。
第一方面,本发明提供一种支持大屏幕展示的发票监控方法,包括以下步骤:
提取电子发票数据,所述电子发票的票面信息包括商品名称、商品数量、销售额、纳税额、购买方和销售方;
将电子发票数据中的销售方、商品和购货方的数据通过拉取的方式写入消息队列;
从消息队列中取出销售方、商品和购货方的数据,进行预处理,得到预处理后的数据;
根据预先设计的统计规则,在时间窗口内统计所述预处理后的数据,生成待大屏显示的展示数据;
通过BI数据可视化工具将生成的待大屏显示的展示数据展示在大屏上。
进一步地,所述的支持大屏幕展示的发票监控方法,
所述在时间窗口内统计所述预处理后的数据之后,还包括:
将根据所述预处理后的数据统计得到的归档数据,实时地写入数据存储系统。
进一步地,所述的支持大屏幕展示的发票监控方法,
根据预先设计的统计规则,在时间窗口内统计所述预处理后的数据,生成待大屏显示的展示数据,包括:
在所述时间窗口内,进行数据消费,包括完成所述统计所述预处理后的数据及生成待大屏显示的展示数据的步骤;
在所述时间窗口内,进行数据生产,包括完成将电子发票数据中的销售方、商品和购货方的数据通过拉取的方式写入消息队列的步骤,其中,所述销售方、商品和购货方的数据的容量,与所述时间窗口的长度相匹配。
进一步地,所述的支持大屏幕展示的发票监控方法,
所述预先设计的统计规则包括:
分别按照省份维度或时间维度进行统计,得出每个省份每天或每月的开票数量及开票金额;
分别按照公司维度和时间维度进行统计,得出每个公司每天或每月的开票数量及开票金额;
按照时间维度进行统计,得出每天或每月在全国范围内的开票数量及开票金额。
进一步地,所述的支持大屏幕展示的发票监控方法,
由flume将数据拉取到kafka消息队列;
在spark中统计所述预处理后的数据,并生成待大屏显示的展示数据;
在spark中将根据所述预处理后的数据统计得到的归档数据,实时地写入到由mysql管理的数据存储系统中。
第二方面,本发明提供一种支持大屏幕展示的发票监控装置,包括:
电子发票数据提取单元,用于:
提取电子发票数据,所述电子发票的票面信息包括商品名称、商品数量、销售额、纳税额、购买方和销售方;
数据写入消息队列单元,用于:
将电子发票数据中的销售方、商品和购货方的数据通过拉取的方式写入消息队列;
数据预处理单元,用于:
从消息队列中取出销售方、商品和购货方的数据,进行预处理,得到预处理后的数据;
展示数据生成单元,用于:
根据预先设计的统计规则,在时间窗口内统计所述预处理后的数据,生成待大屏显示的展示数据;
数据展示单元,用于:
通过BI数据可视化工具将生成的待大屏显示的展示数据展示在大屏上。
进一步地,所述的支持大屏幕展示的发票监控装置,还包括:
归档数据存储单元,用于:
所述在时间窗口内统计所述预处理后的数据之后,将根据所述预处理后的数据统计得到的归档数据,实时地写入数据存储系统。
进一步地,所述的支持大屏幕展示的发票监控装置,
所述展示数据生成单元,还用于:
在所述时间窗口内,进行数据消费,包括完成所述统计所述预处理后的数据及生成待大屏显示的展示数据的步骤;
在所述时间窗口内,进行数据生产,包括完成将电子发票数据中的销售方、商品和购货方的数据通过拉取的方式写入消息队列的步骤,其中,所述销售方、商品和购货方的数据的容量,与所述时间窗口的长度相匹配。
进一步地,所述的支持大屏幕展示的发票监控装置,所述预先设计的统计规则,包括:
分别按照省份维度或时间维度进行统计,得出每个省份每天或每月的开票数量及开票金额;
分别按照公司维度和时间维度进行统计,得出每个公司每天或每月的开票数量及开票金额;
按照时间维度进行统计,得出每天或每月在全国范围内的开票数量及开票金额。
第三方面,本发明提供一种支持大屏幕展示的发票监控系统,包括:
在第二方面中说明的发票监控装置;
数据存储系统;
大屏;
其中,所述发票监控装置通过BI数据可视化工具将生成的待大屏显示的展示数据展示在大屏上;
所述发票监控装置,将根据预处理后的数据统计得到的归档数据,实时地写入数据存储系统。
综上,本发明提供的支持大屏幕展示的发票监控方法、装置及系统,通过对电子发票数据进行统计分析,得出不同公司、不同地区间的产品销售情况等信息,展示出更多数据背后隐藏的信息,使得这些信息能够以更直观、更友好地方式被发现、被阅读,从而发挥数据的价值。
附图说明
通过参考下面的附图,可以更为完整地理解本发明的示例性实施方式:
图1为本发明优选实施方式的支持大屏幕展示的发票监控方法的流程示意图;
图2为本发明优选实施方式的支持大屏幕展示的发票监控装置的组成示意图;图3是本发明优选实施方式的支持大屏幕展示的发票监控系统的组成示意图;
图4是本发明优选实施方式的支持大屏幕展示的发票监控方法获取数据的流程示意图。
具体实施方式
现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。
除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。
术语说明:
大屏幕(big screen)指直观式彩电或背投式投影电视中的大屏幕。通常,屏幕的对角线尺寸大都在40英寸以上。
如图1所示,本发明实施例的支持大屏幕展示的发票监控方法,包括:
步骤S100:提取电子发票数据,所述电子发票的票面信息包括商品名称、商品数量、销售额、纳税额、购买方和/或销售方;
步骤S200:将电子发票数据中的销售方、商品和购货方的数据通过拉取的方式写入消息队列;
步骤S300:从消息队列中取出销售方、商品和购货方的数据,进行预处理,得到预处理后的数据;
步骤S400:根据预先设计的统计规则,在时间窗口内统计所述预处理后的数据,生成待大屏显示的展示数据;
步骤S500:通过BI数据可视化工具将生成的待大屏显示的展示数据展示在大屏上。
进一步地,所述的支持大屏幕展示的发票监控方法,
所述在时间窗口内统计所述预处理后的数据之后,还包括:
将根据所述预处理后的数据统计得到的归档数据,实时地写入数据存储系统。
进一步地,所述的支持大屏幕展示的发票监控方法,
根据预先设计的统计规则,在时间窗口内统计所述预处理后的数据,生成待大屏显示的展示数据,包括:
在所述时间窗口内,进行数据消费,包括完成所述统计所述预处理后的数据及生成待大屏显示的展示数据的步骤;
在所述时间窗口内,进行数据生产,包括完成将电子发票数据中的销售方、商品和购货方的数据通过拉取的方式写入消息队列的步骤,其中,所述销售方、商品和购货方的数据的容量,与所述时间窗口的长度相匹配。
进一步地,所述的支持大屏幕展示的发票监控方法,
所述预先设计的统计规则包括:
分别按照省份维度或时间维度进行统计,得出每个省份每天或每月的开票数量及开票金额;
分别按照公司维度和时间维度进行统计,得出每个公司每天或每月的开票数量及开票金额;
按照时间维度进行统计,得出每天或每月在全国范围内的开票数量及开票金额。
进一步地,所述的支持大屏幕展示的发票监控方法,
由flume将数据拉取到kafka消息队列;
在spark中统计所述预处理后的数据,并生成待大屏显示的展示数据;
在spark中将根据所述预处理后的数据统计得到的归档数据,实时地写入到由mysql管理的数据存储系统中。
该实施例的支持大屏幕展示的发票监控方法,通过对电子发票数据进行统计分析,得出不同公司、不同地区间的产品销售情况等信息,展示出更多数据背后隐藏的信息,使得这些信息能够以更直观、更友好地方式被发现、被阅读,从而发挥数据的价值。
如图2所示,本发明实施例的一种支持大屏幕展示的发票监控装置,包括:
电子发票数据提取单元10,用于:
提取电子发票数据,所述电子发票的票面信息包括商品名称、商品数量、销售额、纳税额、购买方和/或销售方;
数据写入消息队列单元20,用于:
将电子发票数据中的销售方、商品和购货方的数据通过拉取的方式写入消息队列;
数据预处理单元30,用于:
从消息队列中取出销售方、商品和购货方的数据,进行预处理,得到预处理后的数据;
展示数据生成单元40,用于:
根据预先设计的统计规则,在时间窗口内统计所述预处理后的数据,生成待大屏显示的展示数据;
数据展示单元50,用于:
通过BI数据可视化工具将生成的待大屏显示的展示数据展示在大屏上。
进一步地,所述的支持大屏幕展示的发票监控装置,还包括:
归档数据存储单元,用于:
所述在时间窗口内统计所述预处理后的数据之后,将根据所述预处理后的数据统计得到的归档数据,实时地写入数据存储系统。
进一步地,所述的支持大屏幕展示的发票监控装置,
所述展示数据生成单元,还用于:
在所述时间窗口内,进行数据消费,包括完成所述统计所述预处理后的数据及生成待大屏显示的展示数据的步骤;
在所述时间窗口内,进行数据生产,包括完成将电子发票数据中的销售方、商品和购货方的数据通过拉取的方式写入消息队列的步骤,其中,所述销售方、商品和购货方的数据的容量,与所述时间窗口的长度相匹配。
进一步地,所述的支持大屏幕展示的发票监控装置,所述预先设计的统计规则,包括:
分别按照省份维度或时间维度进行统计,得出每个省份每天或每月的开票数量及开票金额;
分别按照公司维度和时间维度进行统计,得出每个公司每天或每月的开票数量及开票金额;
按照时间维度进行统计,得出每天或每月在全国范围内的开票数量及开票金额。
该实施例的支持大屏幕展示的发票监控装置,通过对电子发票数据进行统计分析,得出不同公司、不同地区间的产品销售情况等信息,展示出更多数据背后隐藏的信息,使得这些信息能够以更直观、更友好地方式被发现、被阅读,从而发挥数据的价值。
如图3所示,本发明实施例的支持大屏幕展示的发票监控系统,包括:
在前述实施例中说明的发票监控装置1000,所述发票监控装置1000执行前述实施例的支持大屏幕展示的发票监控方法;
数据存储系统2000;
大屏3000;
其中,所述发票监控装置通过BI数据可视化工具将生成的待大屏显示的展示数据展示在大屏上;
所述发票监控装置,将根据预处理后的数据统计得到的归档数据,实时地写入数据存储系统。
本发明实施例的支持大屏幕展示的发票监控系统,开发了实时监控全国开票情况的可视化平台,用于掌控全网的实时开票情况。该可视化平台展示的开票信息可读性好、展示效果佳。
具体地,根据收集到的电子发票数据,确定产品销售情况。如,记载有该产品的发票数量越多,其销售量也就大。具体地,产品销售情况包括记载有产品信息的电子发票的数量、发票票面记载的开票金额或开票税额等。
前述实施例的支持大屏幕展示的发票监控方法及装置,借助数据可视化技术,大屏幕提供了更大的显示区域打破了传统数据展示时效性差、数据对比不明显的限制,解决了数据统计复杂繁琐、数据展示晦涩难懂的难题,可以给带给观者更加准确、震撼和清晰的视觉体验。
前述实施例的支持大屏幕展示的发票监控方法及装置,通过对数据采集单元和数据消费单元的压力测试,确定时间窗口的大小及时间窗口的移动速度,优化展示内容的实时性,使数据更快更准确地显示在大屏幕上,提高了监控装置的使用效果和效益。
前述实施例的支持大屏幕展示的发票监控装置,大屏展示监控到的不同公司、不同地区间的开票情况等信息,让更多背后隐藏的数据被发现、被阅读,发挥数据的价值。
前述实施例的支持大屏幕展示的发票监控方法,通过对不同企业、不同时间、不同地区的开票记录进行统计分析,得到企业、时间和地区与开票记录之间的关系数据。
具体地,建立在不同维度下的聚类或分类,得出年、月、日等时间维度下开票top10的企业,省、市、区等地区维度下开票top10企业以及全国开票以年月日为统计最小时间粒度的统计和,地区开票以每日为最小统计时间粒度等统计和展示指标。
在发票数据收集时,可以根据多种维度对发票数据进行归类。比如,分别按照省份维度或时间维度进行统计,得出每个省份每天或每月的开票数量及开票金额等等。比如,分别按照公司维度和时间维度进行统计,得出每个公司每天或每月的开票数量及开票金额等。比如,按照时间维度进行统计,得出每天或每月在全国范围内的开票数量。基于这些统计数据,得出地区开票排名前十(也即,开票最多的十个省份、直辖市或自治区),或月份开票排名前十的企业等多个指标。
具体地,本发明一个实施例的支持大屏幕展示的发票监控方法,包括以下步骤:
S1:从电子发票接口、服务器日志或票面信息中提取电子发票数据,所述票面信息包括商品名称、商品数量、销售额、纳税额、购买方和销售方(以下简称企业);
具体地,电子发票接口由内部开票平台提供。服务器日志为运行开票平台的服务器的日志;票面信息由内部开票平台提供。
S2:将企业、商品和购货方的数据通过拉取的方式写入消息队列;
具体地,企业、商品和购货方的数据以服务器日志的形式写入消息队列的。具体地,由flume将数据拉取到kafka消息队列。kafka消息队列可以基于先进先出的消费机制。消息队列内的总数据长度根据数据消费情况可以实时地调整。
Kafka可以与Flume/Flafka、Spark Streaming、Storm、HBase、Flink和Spark一起工作,对流媒体数据进行实时摄取、分析和处理。Kafka为Hadoop BigData lakes提供数据流。Kafka代理支持大量消息流,用于Hadoop或Spark的低延迟后续分析。此外,KafkaStreaming(子项目)也可以用于实时分析。Kafka用于流处理、网站活动跟踪、度量收集和监控、日志聚合、实时分析、CEP、将数据传输到Spark、将数据传输到Hadoop、CQRS、重放消息、错误恢复以及内存计算(微服务)的有保障的分布式提交日志。
S3:从消息队列中取出企业、商品和购货方的数据,并进行数据的预处理,包括去重、清除脏数据等;
具体地,实时流框架消费Kafka的消息队列,并且在实时流中进行数据的预处理,包括去重、清除脏数据等;
S4:分析及统计预处理后的数据,调整实时流时间窗口的大小和时间窗口的滑动距离,以最大化实时流的实时性;
具体地,通过实时流来分析统计预处理后的数据,并调整实时流时间窗口的长度和时间窗口的移动速度,保证实时性到达最大化;
具体地,时间窗口的单位或者量纲为秒(s);时间窗口的移动速度的单位或者量纲为秒(s)。具体地,滑动距离的数值不大于时间窗口的长度数值,以保证全部的数据都被存储、被处理及在大屏幕中展示。
S5:将得出的准确数据,实时地写入数据存储装置。
具体地,在spark中分析及统计预处理后的数据,并将得出的准确数据,实时地写入到由mysql管理的数据存储装置中。
Spark是一个准实时的计算框架。数据在到spark之前都是没有做好数据的计算的。在spark中进行计算并写入到mysql中。
S600:通过BI数据可视化工具将得出的准确数据实时地展示在大屏上。
具体地,BI可视化工具包括QlikView、Tableau、Power BI、帆软FineBI和GoogleData Studio。具体地,利用现有技术中公开的前端技术,通过BI数据可视化工具将得出的准确数据实时地展示在大屏上。
如图4所示,将获取的发票数据接入大数据平台进行清洗、转换及加载(Extraction-Transformation-Loading,简称ETL清洗,转换,加载)的步骤中,离线数据在Hive中建数据仓进行存储;实时数据存入Elasticsearch。具体地,离线数据和实时数据这两个部分分别按对外提供查询接口。也即前述步骤S100中的第三方的电子发票或服务器日志。
应该理解为,这里的离线数据和实时数据为前述步骤S3中的尚未经过分析及统计的原始数据。
具体地,ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。ElasticSearch用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。官方客户端在Java、.NET(C#)、PHP、Python、Apache Groovy、Ruby和许多其他语言中都是可用的。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr,也是基于Lucene。
综上,前述实施例的支持大屏幕展示的发票监控方法及装置,将信息中企业、商品和购货方的数据通过拉取的方式写入消息队列;实时流框架消费消息队列,并且在实时流中进行数据的预处理,包括去重、排除脏数据等;通过实时流分析统计预处理后的数据,调整实时流时间窗口的大小和时间窗口滑动的距离保证实时性到达最大化;将得出准确数据,实时写入数据存储装置。
前述实施例的支持大屏幕展示的发票监控方法通过汇集开票数据,经过清洗、统计、分析等过程,在保证实时性的前提下得出不同公司、地区间的开票情况等信息。通过简化数据展示的同时提高数据的可读性来让更多背后隐藏的数据被发现,被阅读,发挥数据的价值。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
以上已经通过参考少量实施方式描述了本发明。然而,本领域技术人员所公知的,正如附带的专利权利要求所限定的,除了本发明以上公开的其他的实施例等同地落在本发明的范围内。
通常地,在权利要求中使用的所有术语都根据他们在技术领域的通常含义被解释,除非在其中被另外明确地定义。所有的参考“一个//该[装置、组件等]”都被开放地解释为装置、组件等中的至少一个实例,除非另外明确地说明。这里公开的任何方法的步骤都没必要以公开的准确的顺序运行,除非明确地说明。

Claims (10)

1.一种支持大屏幕展示的发票监控方法,其特征在于,包括以下步骤:
提取电子发票数据,所述电子发票的票面信息包括商品名称、商品数量、销售额、纳税额、购买方和/或销售方;
将电子发票数据中的销售方、商品和购货方的数据通过拉取的方式写入消息队列;
从消息队列中取出销售方、商品和购货方的数据,进行预处理,得到预处理后的数据;
根据预先设计的统计规则,在时间窗口内统计所述预处理后的数据,生成待大屏显示的展示数据;
通过BI数据可视化工具将生成的待大屏显示的展示数据展示在大屏上。
2.根据权利要求1所述的支持大屏幕展示的发票监控方法,其特征在于,
所述在时间窗口内统计所述预处理后的数据之后,还包括:
将根据所述预处理后的数据统计得到的归档数据,实时地写入数据存储系统。
3.根据权利要求1所述的支持大屏幕展示的发票监控方法,其特征在于,
根据预先设计的统计规则,在时间窗口内统计所述预处理后的数据,生成待大屏显示的展示数据,包括:
在所述时间窗口内,进行数据消费,包括完成所述统计所述预处理后的数据及生成待大屏显示的展示数据的步骤;
在所述时间窗口内,进行数据生产,包括完成将电子发票数据中的销售方、商品和购货方的数据通过拉取的方式写入消息队列的步骤,其中,所述销售方、商品和购货方的数据的容量,与所述时间窗口的长度相匹配。
4.根据权利要求3所述的支持大屏幕展示的发票监控方法,其特征在于,
所述预先设计的统计规则包括:
分别按照省份维度或时间维度进行统计,得出每个省份每天或每月的开票数量及开票金额;
分别按照公司维度和时间维度进行统计,得出每个公司每天或每月的开票数量及开票金额;
按照时间维度进行统计,得出每天或每月在全国范围内的开票数量及开票金额。
5.根据权利要求2所述的支持大屏幕展示的发票监控方法,其特征在于,
由flume将数据拉取到kafka消息队列;
在spark中统计所述预处理后的数据,并生成待大屏显示的展示数据;
在spark中将根据所述预处理后的数据统计得到的归档数据,实时地写入到由mysql管理的数据存储系统中。
6.一种支持大屏幕展示的发票监控装置,其特征在于,包括:
电子发票数据提取单元,用于:
提取电子发票数据,所述电子发票的票面信息包括商品名称、商品数量、销售额、纳税额、购买方和/或销售方;
数据写入消息队列单元,用于:
将电子发票数据中的销售方、商品和购货方的数据通过拉取的方式写入消息队列;
数据预处理单元,用于:
从消息队列中取出销售方、商品和购货方的数据,进行预处理,得到预处理后的数据;
展示数据生成单元,用于:
根据预先设计的统计规则,在时间窗口内统计所述预处理后的数据,生成待大屏显示的展示数据;
数据展示单元,用于:
通过BI数据可视化工具将生成的待大屏显示的展示数据展示在大屏上。
7.根据权利要求6所述的支持大屏幕展示的发票监控装置,其特征在于,还包括:
归档数据存储单元,用于:
所述在时间窗口内统计所述预处理后的数据之后,将根据所述预处理后的数据统计得到的归档数据,实时地写入数据存储系统。
8.根据权利要求6所述的支持大屏幕展示的发票监控装置,其特征在于,
所述展示数据生成单元,还用于:
在所述时间窗口内,进行数据消费,包括完成所述统计所述预处理后的数据及生成待大屏显示的展示数据的步骤;
在所述时间窗口内,进行数据生产,包括完成将电子发票数据中的销售方、商品和购货方的数据通过拉取的方式写入消息队列的步骤,
其中,所述销售方、商品和购货方的数据的容量,与所述时间窗口的长度相匹配。
9.根据权利要求8所述的支持大屏幕展示的发票监控装置,其特征在于,
所述预先设计的统计规则,包括:
分别按照省份维度或时间维度进行统计,得出每个省份每天或每月的开票数量及开票金额;
分别按照公司维度和时间维度进行统计,得出每个公司每天或每月的开票数量及开票金额;
按照时间维度进行统计,得出每天或每月在全国范围内的开票数量及开票金额。
10.一种支持大屏幕展示的发票监控系统,其特征在于,包括:
如权利要求6至9中任一项所述的发票监控装置;
数据存储系统;
大屏;
其中,所述发票监控装置通过BI数据可视化工具将生成的待大屏显示的展示数据展示在大屏上;
所述发票监控装置,将根据预处理后的数据统计得到的归档数据,实时地写入数据存储系统。
CN202010000727.5A 2020-01-02 2020-01-02 支持大屏幕展示的发票监控方法、装置及系统 Pending CN111222930A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010000727.5A CN111222930A (zh) 2020-01-02 2020-01-02 支持大屏幕展示的发票监控方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010000727.5A CN111222930A (zh) 2020-01-02 2020-01-02 支持大屏幕展示的发票监控方法、装置及系统

Publications (1)

Publication Number Publication Date
CN111222930A true CN111222930A (zh) 2020-06-02

Family

ID=70829228

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010000727.5A Pending CN111222930A (zh) 2020-01-02 2020-01-02 支持大屏幕展示的发票监控方法、装置及系统

Country Status (1)

Country Link
CN (1) CN111222930A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112579691A (zh) * 2020-12-24 2021-03-30 安徽航天信息科技有限公司 一种支持大屏展示的数据处理方法及装置
CN113724024A (zh) * 2021-07-23 2021-11-30 航天信息股份有限公司 一种用于开票数据的大屏可视化实时展示系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2363167A1 (en) * 2001-01-19 2002-07-19 Cognos Incorporated Data warehouse model & methodology
CN104424595A (zh) * 2013-09-04 2015-03-18 航天信息股份有限公司 税务监控方法及其系统
CN106503760A (zh) * 2016-10-31 2017-03-15 青岛瑞宏科技有限公司 一种扫码开具电子发票方法
CN107391657A (zh) * 2017-07-18 2017-11-24 百望电子发票数据服务有限公司 一种生成电子发票版式文件的方法及系统
CN108280698A (zh) * 2018-01-19 2018-07-13 大象慧云信息技术有限公司 一种发票自定义分类管理方法及系统
CN108304454A (zh) * 2017-11-27 2018-07-20 大象慧云信息技术有限公司 基于大数据的发票数据实时聚合装置
CN108874524A (zh) * 2018-06-21 2018-11-23 山东浪潮商用系统有限公司 大数据分布式任务调度系统
CN109697640A (zh) * 2018-12-26 2019-04-30 大象慧云信息技术有限公司 一种增值税发票数据管理平台
CN109785100A (zh) * 2018-12-27 2019-05-21 大象慧云信息技术有限公司 一种用于对税务风险进行预警的方法及系统
CN109785023A (zh) * 2018-12-24 2019-05-21 大象慧云信息技术有限公司 一种电子发票交付方法及系统
CN110019453A (zh) * 2017-10-19 2019-07-16 航天信息股份有限公司 一种基于分布式系统基础架构平台对税务数据进行处理的方法及系统

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2363167A1 (en) * 2001-01-19 2002-07-19 Cognos Incorporated Data warehouse model & methodology
CN104424595A (zh) * 2013-09-04 2015-03-18 航天信息股份有限公司 税务监控方法及其系统
CN106503760A (zh) * 2016-10-31 2017-03-15 青岛瑞宏科技有限公司 一种扫码开具电子发票方法
CN107391657A (zh) * 2017-07-18 2017-11-24 百望电子发票数据服务有限公司 一种生成电子发票版式文件的方法及系统
CN110019453A (zh) * 2017-10-19 2019-07-16 航天信息股份有限公司 一种基于分布式系统基础架构平台对税务数据进行处理的方法及系统
CN108304454A (zh) * 2017-11-27 2018-07-20 大象慧云信息技术有限公司 基于大数据的发票数据实时聚合装置
CN108280698A (zh) * 2018-01-19 2018-07-13 大象慧云信息技术有限公司 一种发票自定义分类管理方法及系统
CN108874524A (zh) * 2018-06-21 2018-11-23 山东浪潮商用系统有限公司 大数据分布式任务调度系统
CN109785023A (zh) * 2018-12-24 2019-05-21 大象慧云信息技术有限公司 一种电子发票交付方法及系统
CN109697640A (zh) * 2018-12-26 2019-04-30 大象慧云信息技术有限公司 一种增值税发票数据管理平台
CN109785100A (zh) * 2018-12-27 2019-05-21 大象慧云信息技术有限公司 一种用于对税务风险进行预警的方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112579691A (zh) * 2020-12-24 2021-03-30 安徽航天信息科技有限公司 一种支持大屏展示的数据处理方法及装置
CN112579691B (zh) * 2020-12-24 2022-11-08 安徽航天信息科技有限公司 一种支持大屏展示的数据处理方法及装置
CN113724024A (zh) * 2021-07-23 2021-11-30 航天信息股份有限公司 一种用于开票数据的大屏可视化实时展示系统

Similar Documents

Publication Publication Date Title
US11095594B2 (en) Location resolution of social media posts
CN105677844B (zh) 一种移动广告大数据的定向推送及用户跨屏识别方法
CN108154401B (zh) 用户画像刻画方法、装置、介质和计算设备
Cui et al. Context preserving dynamic word cloud visualization
US8930581B2 (en) Implementation of a web-scale data fabric
WO2022127543A1 (zh) 广告信息处理方法、装置、设备和存储介质
US8849798B2 (en) Sampling analysis of search queries
CN108537544A (zh) 一种交易系统实时监控方法及其监控系统
CN104361111A (zh) 一种档案自动编研方法
CN103425755A (zh) 一种基于微博分析电视节目收视情况的方法
KR20150016972A (ko) 카테고리 비율들을 계산하기 위한 시스템들 및 방법들
CN111222930A (zh) 支持大屏幕展示的发票监控方法、装置及系统
US9792377B2 (en) Sentiment trent visualization relating to an event occuring in a particular geographic region
CN111062799A (zh) 家庭客户的管理方法、装置、电子设备及存储介质
CN112507006A (zh) 基于云端的电网企业运行数据整合系统
CN110543996A (zh) 一种职位薪资评估方法、装置、服务器和存储介质
CN110968676A (zh) 基于lda模型与lstm网络的文本数据语义时空模式探索方法
Anggrainy et al. Implementation of extract, transform, load on data warehouse and business intelligence using pentaho and tableau to analyse sales performance of offlist store
CN113485989A (zh) 一种监管数据的综合分析方法、系统、介质和设备
CN112418941A (zh) 一种基于实时流的资源人气计算方法、系统及存储介质
CN115563176A (zh) 一种电子商务数据处理系统及方法
CN110796505A (zh) 一种业务对象推荐方法以及装置
Sun et al. Design of a Media Resource Management System for Colleges Based on Cloud Service
CN112418260A (zh) 模型训练方法、信息提示方法、装置、设备及介质
Alyafi et al. Social data to enhance typical consumer energy profile estimation on a national level

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination