CN107577805A - 一种面向日志大数据分析的业务服务系统 - Google Patents
一种面向日志大数据分析的业务服务系统 Download PDFInfo
- Publication number
- CN107577805A CN107577805A CN201710881202.5A CN201710881202A CN107577805A CN 107577805 A CN107577805 A CN 107577805A CN 201710881202 A CN201710881202 A CN 201710881202A CN 107577805 A CN107577805 A CN 107577805A
- Authority
- CN
- China
- Prior art keywords
- data
- analysis
- module
- business
- daily record
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Debugging And Monitoring (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种面向日志大数据分析的业务服务系统,包括日志获取模块、数据预处理模块、数据管道模块、计算处理模块、存储查询模块、系统管理模块,对数据计算、数据存储的方式进行系统化封装,在日志数据分析领域,在各种需进行数据处理、分析、展示等场景应用的接入及数据管理上,形成在数据和业务上易于横向扩展、具有多种大数据计算模式适配的大数据服务系统。采用多模块设计方式,通过关键中间服务的统一管理,结合系统架构中分布式计算和存储组件,为用户通过数据快速处理与分析、业务应用易于扩展的系统平台。
Description
技术领域
本发明涉及日志数据分析的技术领域,尤其是指一种面向日志大数据分析的业务服务系统,结合大数据分析技术对指标类型日志数据进行流程化处理,最终提供通用化业务服务。
背景技术
随着信息行业的蓬勃发展,用户、联网设备带来了流量的井喷式增长,“大数据”一词在数据挖掘和商业智能等行业逐步升温。各领域针对实际的业务需求,设计合理的数据处理框架,包括计算框架、存储框架以及以二者为核心的架构解决方案。伴随着各种分布式云平台的逐步发展和完善,与分布式计算相结合的业务形成的功能产品更受青睐,其优势主要体现在更佳的时效性和更廉价的资源。
在基于分布式计算的大数据服务系统中,MapReduce计算模式在数据的并行处理上具有极大的优势,基于该数据计算模式实现的计算框架通常将数据处理拆分为map、shuffle、reduce三个阶段,并为用户提供面向数据的抽象化接口,由此可为用户应用开发提供友好的编程接口,促进模型原型的快速构建。在当前开源的计算引擎中,发展较成熟且为业界普遍认可的开源计算框架繁多,主要有:Hadoop、Storm、Spark、Flink等。而在分布式存储上,以HDFS、GFS等为代表的共享文件存储系统,提供了海量数据的一致性、容错性和读写上高吞吐量的保证。
当前工业界在大数据系统的构建上,主要基于通用的开源组件并加以适配和改造,自成一套数据转换和数据展示的方案。基于该方案形成的系统平台通常为用户提供配置工具,由用户控制数据处理的流程,最终数据经过逐步处理并落地。腾讯基于自研的分布式数据仓库TDW所构建的大数据平台,结合TRC、TDBank和Gaia等一系列组件,从而满足计算过程中实时处理、数据采集和分发、资源调度等功能。七牛云开发的大数据平台Pandora则基于Spark、MonogoDB和时序数据库等组件,为数据提供工作流的数据处理方式,在此之上用户可创建日志分析、性能监控等场景应用,一定程度上为操作用户提供直接面向数据进行分析和处理的手段。
目前,在面向日志分析的大数据服务系统的构建上,大多数做法或从数据处理的角度出发设计大数据分析功能,往往专注于数据流的构建,在场景设定和业务开发上缺乏一定的针对性。因此,在分析和挖掘的功能开发和由此引申的信息展示功能上,往往需要开发人员进行“平台级”的二次开发,将计算结果的数据“搬运”到具体场景上,在产品开发上缺乏一定的扩展性、通用性;或从业务的的角度出发,系统在数据上具有强业务相关的特点,平台系统往往为业务量身定做,耦合度较高,缺乏业务上的可移植性。
在针对日志数据进行大数据分析的领域,合理地对采集的日志数据进行管理和分析,最终形成相对固定的数据分析和可视化流程,为联网产品或应用提供基于日志的分析与挖掘平台,有利于提高基于大数据技术的运营管理能力和推动具体相关业务的营销。因此,本发明着重结合大数据处理的通用性需求和大部分基于产品或应用日志的功能业务开发需求,在数据处理、数据分析和场景应用上提供高效率、通用化和简便性的大数据业务服务系统。
发明内容
本发明的目的在于对数据计算、数据存储的方式进行系统化封装,在日志数据分析领域,在各种需进行数据处理、分析、展示等场景应用的接入及数据管理上,形成在数据和业务上易于横向扩展、具有多种大数据计算模式适配的面向日志大数据分析的业务服务系统;一方面,克服现有基于日志的大数据分析平台与商业智能结合普遍松散的缺点,提高业务开发的灵活度和部署的简便性;另一方面,在数据计算、分析、查询等模式应用上利用Spark、HDFS等开源软件的计算与存储优势,提供一个在基于日志数据的满足数据分析、模型构造、数据展示等场景的大数据服务系统。系统采用多模块设计方式,通过关键中间服务的统一管理,结合系统架构中分布式计算和存储组件,为用户通过数据快速处理与分析、业务应用易于扩展的系统平台。
为实现上述目的,本发明所提供的技术方案为:一种面向日志大数据分析的业务服务系统,包括:
日志获取模块,从相关应用的运营平台获取采集到的日志,该步骤得到的是原始日志,数据格式具有一定的规范性;
数据预处理模块,基于配置对原始日志数据提供预处理服务,本发明采用Agent(代理)程序根据用户选定的预处理方案,对数据进行清洗或转换操作。经过预处理后的日志具有一定的数值有效性;
数据管道模块,连接Agent程序和流式计算程序,通过提供高可用、高吞吐量的管道系统,提供数据缓冲功能和多样化的数据消费处理模型;
计算处理模块,提供数据的相关逻辑操作,通过对计算任务的管理和调度,为数据提供流式处理和批处理;
存储查询模块,在数据经过计算处理后,将根据业务需求持久化到指定存储,对于不同的存储介质对外提供对应数据响应能力的数据查询接口。
系统管理模块,作为系统服务对外的功能模块,通过可视化操作,为项目、业务以及对应的数据和任务提供管理能力,如数据接入、任务管理、信息展示和权限控制等。
所述日志获取模块的具体情况如下:
从应用的运营平台采集指标数据,数据类型可属于用户行为数据、应用状态数据或设备状态数据等,数据以日志规范的形式存储。其中,数据以行为基本单位,每一行需具有数据时间以及字段值,用逗号隔开。日志文件按照基于项目的配置要求,传输到本服务系统的指定原始日志消费区,最终由数据预处理模块进行处理。
数据被采集到本地或网络文件系统,由json格式的配置文件对目录结构进行规范。譬如:
对于项目project-A,其下可包括相关业务数据item-a,item-b,item-c,item-d,在业务下,详细的配置项将指定数据具体的格式与路径,数据的最小粒度统一按天规整切分,文件命名以日期格式yyyy-MM-dd进行保存。
所述数据预处理模块的具体情况如下:
当数据通过日志获取模块产生并进行分类归档后,形成基于业务分类的数据集。由Agent程序对获取到的日志进行预处理,系统中预处理的过程实际是将常见的预处理方式进行固化形成的预处理工具,经过预处理后的日志具有一定的数值有效性。
其中,在可视化操作上,系统为日志数据提供备选的数据预处理方案或自定义方式,用户通过在线方式进行业务数据的接入、处理和管理,后台解析请求,下发具体的清洗程序,由调度组件DSService进行统一调度和管理。
所述数据管道模块的具体情况如下:
日志经过预处理后,将通过网络传输到数据管道进行缓存,该模块实际上提供多数据队列的功能,并保证服务的高可用性,支持数据的实时消费和保证一定的吞吐量。在业务相关的逻辑处理前,数据将以分业务分队列的形式进行暂存,从而支持多队列分主题的数据消费模式,在应用场景上满足基于业务的多样化消费处理模型。
所述计算处理模块包括流式处理、批处理和任务管理与调度,具体情况如下:
流式处理主要对管道中的数据进行消费、处理和持久化,满足实时要求较高的应用;批处理主要针对统计分析业务或算法模型构建的数据量大、耗时较明显的应用;任务管理与调度负责整个计算处理模块中业务任务与底层基础计算组件的交互关系。
流式计算任务通过流模式(Streaming)应用实现,实时消费数据管道数据。经过流式处理的结果数据将按小时切分并落地到HDFS或数据库中,为用户查询或下一步的计算任务处理提供静态数据源。在大数据处理模式上,针对不同场景部署的功能应用,系统底层形成不同的处理模式。通过流式计算,可提供实时要求高的数据上报与分析应用;通过交互式分析,提供在线的统计分析功能;通过离线计算,对静态数据进行批处理;通过在线处理,提供数据分析的实时响应。基于缓存机制和预计算机制的设计,可快速读取流式处理或批处理的计算结果。
基于通用性的考量和业务解耦的实际需求,本系统的任务处理模式由自研调度组件DSService统一进行管理,并以RESTful接口的形式对外提供轻量级分析查询解析、调度等功能服务。
所述存储查询模块的具体情况如下:
由系统提供的存储组件保障,一方面,为经过计算处理后的数据提供存储功能,另一方面,数据经过存储后,针对具体的存储介质和指标查询,将由DSService对外提供查询接口进行数据查询,包括随机查询、批量查询或即系查询等。
数据查询的接口设计,由存储介质、数据格式及构建查询的转换逻辑共同决定,系统针对不同存储介质,提供源数据、指标聚合结果以及模型计算结果等具有场景意义的信息查询方式。
所述系统管理模块的具体情况如下:
通过提供管理类API并对外开放、针对该API封装的可视化操作,可进行数据和任务的管理,包括数据预览、日志预处理方案选定与执行、程序包的管理、计算任务的管理、数据的在线存查等功能,该模块属于直接面向用户的模块,前端抽象出实际业务操作,后台保证API的可靠性。
其中,系统提供了基于业务的开发模式,用户结合SDK构建业务程序包并上传到系统程序仓库,系统可基于对应的分布式计算任务、前端模板共同提供数据分析手段和信息展示功能。在信息展示上,通过前端定制具体的展示方案,即可对结果数据以报表、知识图谱、文本等方式进行展示。
本发明与现有技术相比,具有如下优点与有益效果:
1、本发明结合自定义的配置文件在数据的生成、导入、切分和管理上,对数据进行规范处理,一方面为用户在业务层面提供面向数据的管理,另一方面,数据总体分四个流程进行流动,分别为预处理、实时处理、业务计算、信息展示,借此可实现数据的有效复用和查询,克服了传统的数据分析平台存在数据链冗长、数据混乱、后期难以管理的问题。
2、在业务应用的开发和部署上,通过建立的应用部署流程以及统一调度服务,本发明从数据的产生、增长、处理、分析的流程设计出发,进行系统架构上设计;为方便开发和部署,本发明提供一种基于任务的开发和部署方式,克服了大数据分析系统在业务接入以及分析与挖掘功能开发上的薄弱性,提升了大数据应用任务管理的灵活度和应用部署上的简便性。
附图说明
图1为本发明的系统基本交互流程。
图2为本发明的数据DSService调度部分的原理框图。
图3为本发明的数据预处理模块的原理框图。
图4为本发明的数据管道模块的原理框图。
图5为本发明的计算处理模块原理框图。
图6为本发明的系统管理模块的原理框图。
具体实施方式
下面结合具体实施例对本发明作进一步说明。
本发明主要目的是充分发挥已有计算资源和存储资源,对海量日志数据提供计算、分析与挖掘、信息展示的大数据分析业务服务系统,信息以报表、知识图谱或文本等形式进行表达。如图1所示,分析服务系统提供前端操作界面作为服务的入口,用户可进行数据预处理、查看、管理以及业务上的应用开发和部署等。如图1所示,系统后台分三个流程进行处理:服务平台Web Server端作为系统界面的后台,主要通过API的形式提供系统管理功能,前端的请求将封装为具体的任务下发到通用服务DSService,由DSService负责任务的调度、监控和其它管理,并由DSService协调、完成具体计算任务在基础组件的计算和存储。如图2所示,为DSService任务调度部分的基本原理,内部通过维护等待队列和运行队列,保证计算任务的正常启动和停止,以及任务操作的原子性。
本发明系统包括日志获取模块、数据预处理模块、数据管道模块、计算处理模块、存储查询模块、系统管理模块,下面对各个模块的具体实现原理进行阐述。
所述日志获取模块的具体情况是:从应用的运营平台采集指标数据,数据类型可属于用户行为数据、应用状态数据或设备状态数据等,数据以日志规范的形式存储。其中,数据以行为基本单位,每一行需具有数据时间以及字段值,用逗号隔开。日志文件按照基于项目的配置要求,传输到本服务系统的指定原始日志消费区,最终由数据预处理模块进行处理。
日志数据根据项目、业务进行分类后,需配套提供配置文件进行说明,用户在前端进行预览、可视化操作以及Agent应用进行部署前,通过读取该配置文件,可准确地理解数据并加载数据,配置文件为json格式,譬如在项目目录/data/project-A下,存在配置文件conf.json,分别记录各个业务的数据信息,具体示例如下:
在各个业务下,数据统一按天进行切分,如:
/2017/08/10/2017-08-10.csv
/2017/08/11/2017-08-11.csv
/2017/08/12/2017-08-12.csv
/2017/08/13/2017-08-13.csv
如图3所示,所述的数据预处理模块的具体情况是:当数据通过日志获取模块产生并进行分类归档后,形成基于业务分类的数据集。原始数据一般存在数据不完整、失真甚至字段值不合法等情况,因此由Agent程序对获取到的日志进行预处理。系统中预处理的过程实际是将常见的预处理方式进行固化形成的预处理工具,经过预处理后的日志具有一定的数值有效性;
其中在可视化操作上,系统为日志数据提供备选的数据预处理方案或自定义方式,用户通过在线方式进行业务数据的接入、处理和管理,后台解析请求,由DSService进行统一调度和管理;
如图4所示,所述的数据管道模块的具体情况是:日志经过预处理后,将通过网络传输到数据管道进行缓存,该模块实际上提供多数据队列的功能,并保证服务的高可用性,支持数据的实时消费和保证一定的吞吐量。在业务相关的逻辑处理前,数据将以分业务分队列的形式进行暂存,从而支持多队列分主题的数据消费模式,在应用场景上满足基于业务的多样化消费处理模型。
特别的,每个Agent作为数据管道的数据的生产者,在处理前将自动新建一个具有唯一名称的主题,用于对业务数据进行分类管理,下一步的流式计算处理将基于对应主题信息,对管道数据进行消费;
如图5所示,所述的计算处理模块包括流式处理、批处理和任务管理与调度。流式处理主要对管道中的数据进行消费、处理和持久化,满足实时要求较高的应用;批处理主要针对统计分析业务或算法模型构建的数据量大、耗时较明显的应用;任务管理与调度负责整个计算处理模块中业务任务与底层基础计算组件的交互关系。
流式计算任务通过Streaming应用实现,实时消费数据管道数据。经过流式处理的结果数据将按小时切分并落地到HDFS或数据库中,为用户查询或下一步的计算任务处理提供静态数据源。在大数据处理模式上,针对不同场景部署的功能应用,系统底层形成不同的处理模式。通过流式计算,可提供实时要求高的数据上报与分析应用;通过交互式分析,提供在线的统计分析功能;通过离线计算,对静态数据进行批处理;通过在线处理,提供数据分析的实时响应。基于缓存机制和预计算机制的设计,可快速读取流式处理或批处理的计算结果。
基于通用性的考量和业务解耦的实际需求,本系统的任务处理模式由自研调度组件DSService统一进行管理,并以RESTful接口的形式对外提供轻量级分析查询解析、调度等功能服务。
所述的存储查询模块由系统提供的存储组件保障,一方面,为经过计算处理后的数据提供存储功能,另一方面,数据经过存储后,针对具体的存储介质和指标查询,将由DSService对外提供查询接口进行数据查询,包括随机查询、批量查询或即系查询等。
数据查询的接口设计,由存储介质、数据格式及构建查询的转换逻辑共同决定,系统针对不同存储介质,提供源数据、指标聚合结果以及模型计算结果等具有场景意义的信息查询方式。
如图6所示,所述的系统管理模块通过提供管理类API并对外开放、针对该API封装的可视化操作,可进行数据和任务的管理,包括数据预览、日志预处理方案选定与执行、程序包的管理、计算任务的管理、数据的在线存查等功能,该模块属于直接面向用户的模块,前端抽象出实际业务操作,后台保证API的可靠性。
系统的使用总体可包括以下步骤:
1)通过在操作界面对数据进行数据预览和简单的可视化操作,为数据预处理或构建算法模型的业务程序包提供参考;
2)构建业务程序包并上传到系统程序包托管仓库,业务程序包为适配系统的分布式计算任务,本发明通过SDK提供开发接口;
3)系统提供任务的启停服务,当任务计算完成并正常结束,数据结果将根据用户配置进行相应的持久化,并由存储模块和系统管理模块提供界面上的预览功能;
4)特定业务应用具有特定的信息展示方式,譬如对于推荐类的功能应用,展示方式将是为每个待推荐个体提供推荐列表,并提供列表中各个推荐个体的权重。而对于统计类的功能应用,展示方式可以是在一个维度按指标数据做聚合操作,在另一个维度按连续型指标属性(如时间、年龄等)或离散型指标属性(如性别、国家等)进行展示等。总体而言,分析或计算结果将经过一系列转换操作,结合查询API、前端模板最终以报表、知识图谱或文本的形式进行展示。
以上所述实施例只为本发明之较佳实施例,并非以此限制本发明的实施范围,故凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。
Claims (7)
1.一种面向日志大数据分析的业务服务系统,其特征在于,包括:
日志获取模块,从相关应用的运营平台获取采集到的日志,得到的是原始日志,数据格式具有规范性;
数据预处理模块,基于配置对原始日志数据提供预处理服务,采用Agent程序根据用户选定的预处理方案,对数据进行清洗或转换操作,经过预处理后的日志具有数值有效性;
数据管道模块,连接Agent程序和流式计算程序,通过提供高可用、高吞吐量的管道系统,提供数据缓冲功能和多样化的数据消费处理模型;
计算处理模块,提供数据的相关逻辑操作,通过对计算任务的管理和调度,为数据提供流式处理和批处理;
存储查询模块,在数据经过计算处理后,将根据业务需求持久化到指定存储,对于不同的存储介质对外提供对应数据响应能力的数据查询接口;
系统管理模块,为业务服务系统对外的功能模块,通过可视化操作,为项目、业务以及对应的数据和任务提供管理能力,包括数据接入、任务管理、信息展示和权限控制。
2.根据权利要求1所述的一种面向日志大数据分析的业务服务系统,其特征在于,所述日志获取模块的具体情况如下:
从应用的运营平台采集指标数据,数据类型为用户行为数据、应用状态数据或设备状态数据,数据以日志规范的形式存储;其中,数据以行为基本单位,每一行需具有数据时间以及字段值,用逗号隔开;日志文件按照基于项目的配置要求,传输到业务服务系统的指定原始日志消费区,最终由数据预处理模块进行处理;数据被采集到本地或网络文件系统,由json格式的配置文件对目录结构进行规范。
3.根据权利要求1所述的一种面向日志大数据分析的业务服务系统,其特征在于,所述数据预处理模块的具体情况如下:
当数据通过日志获取模块产生并进行分类归档后,形成基于业务分类的数据集,由Agent程序对获取到的日志进行预处理,系统中预处理的过程实际是将常见的预处理方式进行固化形成的预处理工具,经过预处理后的日志具有数值有效性;其中,在可视化操作上,系统为日志数据提供备选的数据预处理方案或自定义方式,用户通过在线方式进行业务数据的接入、处理和管理,后台解析请求,下发具体的清洗程序,由调度组件DSService进行统一调度和管理。
4.根据权利要求1所述的一种面向日志大数据分析的业务服务系统,其特征在于,所述数据管道模块的具体情况如下:
日志经过预处理后,将通过网络传输到数据管道进行缓存,该数据管道模块实际上提供多数据队列的功能,并保证服务的高可用性,支持数据的实时消费和保证吞吐量;在业务相关的逻辑处理前,数据将以分业务分队列的形式进行暂存,从而支持多队列分主题的数据消费模式,在应用场景上满足基于业务的多样化消费处理模型。
5.根据权利要求1所述的一种面向日志大数据分析的业务服务系统,其特征在于,所述计算处理模块包括流式处理、批处理和任务管理与调度,具体情况如下:
流式处理主要对管道中的数据进行消费、处理和持久化,满足实时要求高的应用;批处理主要针对统计分析业务或算法模型构建的数据量大、耗时明显的应用;任务管理与调度负责整个计算处理模块中业务任务与底层基础计算组件的交互关系;
流式计算任务通过流模式应用实现,实时消费数据管道数据;经过流式处理的结果数据将按小时切分并落地到HDFS或数据库中,为用户查询或下一步的计算任务处理提供静态数据源;在大数据处理模式上,针对不同场景部署的功能应用,系统底层形成不同的处理模式;通过流式计算,能够提供实时要求高的数据上报与分析应用;通过交互式分析,提供在线的统计分析功能;通过离线计算,对静态数据进行批处理;通过在线处理,提供数据分析的实时响应。基于缓存机制和预计算机制的设计,能够快速读取流式处理或批处理的计算结果;
基于通用性的考量和业务解耦的实际需求,系统的任务处理模式由自研调度组件DSService统一进行管理,并以RESTful接口的形式对外提供轻量级分析查询解析、调度的功能服务。
6.根据权利要求1所述的一种面向日志大数据分析的业务服务系统,其特征在于,所述存储查询模块的具体情况如下:
由系统提供的存储组件保障,一方面,为经过计算处理后的数据提供存储功能,另一方面,数据经过存储后,针对具体的存储介质和指标查询,将由DSService对外提供查询接口进行数据查询,包括随机查询、批量查询或即系查询;其中,数据查询的接口设计,由存储介质、数据格式及构建查询的转换逻辑共同决定,系统针对不同存储介质,提供源数据、指标聚合结果以及模型计算结果这些具有场景意义的信息查询方式。
7.根据权利要求1所述的一种面向日志大数据分析的业务服务系统,其特征在于,所述系统管理模块的具体情况如下:
通过提供管理类API并对外开放、针对该API封装的可视化操作,进行数据和任务的管理,包括数据预览、日志预处理方案选定与执行、程序包的管理、计算任务的管理、数据的在线存查功能,该系统管理模块属于直接面向用户的模块,前端抽象出实际业务操作,后台保证API的可靠性;
其中,系统提供了基于业务的开发模式,用户结合SDK构建业务程序包并上传到系统程序仓库,系统能够基于对应的分布式计算任务、前端模板共同提供数据分析手段和信息展示功能;在信息展示上,通过前端定制具体的展示方案,即可对结果数据以报表、知识图谱、文本方式进行展示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710881202.5A CN107577805B (zh) | 2017-09-26 | 2017-09-26 | 一种面向日志大数据分析的业务服务系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710881202.5A CN107577805B (zh) | 2017-09-26 | 2017-09-26 | 一种面向日志大数据分析的业务服务系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107577805A true CN107577805A (zh) | 2018-01-12 |
CN107577805B CN107577805B (zh) | 2020-08-18 |
Family
ID=61039775
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710881202.5A Active CN107577805B (zh) | 2017-09-26 | 2017-09-26 | 一种面向日志大数据分析的业务服务系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107577805B (zh) |
Cited By (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108228874A (zh) * | 2018-01-18 | 2018-06-29 | 北京邮电大学 | 基于人工智能技术的通用知识图谱可视化装置及方法 |
CN108427709A (zh) * | 2018-01-25 | 2018-08-21 | 朗新科技股份有限公司 | 一种多源海量数据处理系统及方法 |
CN108595473A (zh) * | 2018-03-09 | 2018-09-28 | 广州市优普计算机有限公司 | 一种基于云计算的大数据应用平台 |
CN108681589A (zh) * | 2018-05-15 | 2018-10-19 | 口碑(上海)信息技术有限公司 | 基于指标体系的结构化查询语言指令生成方法及装置 |
CN108804497A (zh) * | 2018-04-02 | 2018-11-13 | 北京国电通网络技术有限公司 | 一种基于日志的大数据分析方法 |
CN109189589A (zh) * | 2018-08-14 | 2019-01-11 | 北京博睿宏远数据科技股份有限公司 | 一种分布式大数据计算引擎及架构方法 |
CN109241291A (zh) * | 2018-07-18 | 2019-01-18 | 华南师范大学 | 基于深度强化学习的知识图谱最优路径查询系统及其方法 |
CN109255523A (zh) * | 2018-08-16 | 2019-01-22 | 北京奥技异科技发展有限公司 | 基于kks编码规则和大数据架构的分析指标计算平台 |
CN109359126A (zh) * | 2018-04-13 | 2019-02-19 | 国家计算机网络与信息安全管理中心 | 基于业务用户习惯的智能学习查询模型的构建方法及系统 |
CN109446180A (zh) * | 2018-10-18 | 2019-03-08 | 郑州云海信息技术有限公司 | 一种用于配置云数据平台的方法和装置 |
CN109828970A (zh) * | 2019-01-16 | 2019-05-31 | 北京奇艺世纪科技有限公司 | 一种信息处理方法、装置及电子设备 |
CN109977158A (zh) * | 2019-02-28 | 2019-07-05 | 武汉烽火众智智慧之星科技有限公司 | 公安大数据分析处理系统及方法 |
CN110245158A (zh) * | 2019-06-10 | 2019-09-17 | 上海理想信息产业(集团)有限公司 | 一种基于Flink流计算技术的多源异构数据实时处理系统及方法 |
CN110347575A (zh) * | 2018-04-04 | 2019-10-18 | 中移(杭州)信息技术有限公司 | 一种基于大数据组件的调试方法、装置、终端设备和介质 |
CN110362456A (zh) * | 2018-04-10 | 2019-10-22 | 挖财网络技术有限公司 | 一种获取服务端性能数据的方法及装置 |
CN110399352A (zh) * | 2019-06-18 | 2019-11-01 | 平安科技(深圳)有限公司 | 处理svn日志文件的方法、装置、设备及存储介质 |
CN110598199A (zh) * | 2018-06-12 | 2019-12-20 | 百度在线网络技术(北京)有限公司 | 数据流式处理方法、装置、计算机设备和存储介质 |
CN110635966A (zh) * | 2019-08-20 | 2019-12-31 | 华能四川水电有限公司 | 一种流量数据的可视化展示系统、方法、介质和电子设备 |
CN110690984A (zh) * | 2018-07-05 | 2020-01-14 | 上海宝信软件股份有限公司 | 基于Spark的大数据网络日志采集分析和预警的方法、系统 |
CN110825775A (zh) * | 2019-11-04 | 2020-02-21 | 北京理工大学 | 一种Gaia系统中支持流数据与批数据交互的数据交换系统 |
CN110852537A (zh) * | 2018-07-26 | 2020-02-28 | 北京京东金融科技控股有限公司 | 服务质量检测方法和装置 |
CN110891083A (zh) * | 2019-11-05 | 2020-03-17 | 北京理工大学 | 一种Gaia中支持多作业并行执行的代理方法 |
CN111078781A (zh) * | 2019-12-30 | 2020-04-28 | 电信科学技术第五研究所有限公司 | 一种多源流式大数据融合汇聚处理框架模型实现方法 |
CN111090676A (zh) * | 2019-12-23 | 2020-05-01 | 南京航空航天大学 | 面向流式数据的分布式自动处理方法及系统 |
CN111143314A (zh) * | 2019-12-26 | 2020-05-12 | 厦门服云信息科技有限公司 | 一种基于高速流式处理技术的日志解析方法及系统 |
CN111190876A (zh) * | 2019-12-31 | 2020-05-22 | 天津浪淘科技股份有限公司 | 日志管理系统及其运行方法 |
CN111241078A (zh) * | 2020-01-07 | 2020-06-05 | 网易(杭州)网络有限公司 | 数据分析系统、数据分析的方法及装置 |
CN111541645A (zh) * | 2020-03-24 | 2020-08-14 | 国家计算机网络与信息安全管理中心 | 一种VoIP服务知识库构建方法及系统 |
CN111581932A (zh) * | 2020-03-16 | 2020-08-25 | 北京掌行通信息技术有限公司 | 一种数据驱动的大数据分析方法、系统、装置、存储介质及终端 |
CN111860854A (zh) * | 2019-12-06 | 2020-10-30 | 北京嘀嘀无限科技发展有限公司 | 模型特征管理系统、模型特征管理方法及存储介质 |
CN111858278A (zh) * | 2020-07-08 | 2020-10-30 | 北京国联视讯信息技术股份有限公司 | 基于大数据处理的日志分析方法、系统及可读存储装置 |
CN111897859A (zh) * | 2020-09-30 | 2020-11-06 | 知学云(北京)科技有限公司 | 一种面向企业在线教育的大数据智能报表平台 |
CN111915382A (zh) * | 2019-05-08 | 2020-11-10 | 阿里巴巴集团控股有限公司 | 数据处理方法、系统及装置 |
CN112165470A (zh) * | 2020-09-18 | 2021-01-01 | 国网辽宁省电力有限公司电力科学研究院 | 一种基于日志大数据分析的智能终端接入安全预警系统 |
CN112989160A (zh) * | 2021-01-19 | 2021-06-18 | 苏州工业园区测绘地理信息有限公司 | 基于数据管道模型的网络爬虫方法及系统 |
CN113010399A (zh) * | 2021-04-16 | 2021-06-22 | 携程旅游网络技术(上海)有限公司 | 日志数据处理方法、系统、设备及介质 |
CN113032459A (zh) * | 2021-03-24 | 2021-06-25 | 陕西延长石油(集团)有限责任公司 | 面向油气管道内检测数据展示分析方法、系统、存储介质 |
CN113326237A (zh) * | 2021-06-16 | 2021-08-31 | 深圳市明源云科技有限公司 | 日志数据的加工方法、装置、终端设备以及存储介质 |
CN113515374A (zh) * | 2021-05-18 | 2021-10-19 | 中国工商银行股份有限公司 | 数据处理方法及装置、电子设备和计算机可读存储介质 |
CN113746665A (zh) * | 2021-07-29 | 2021-12-03 | 深圳市明源云科技有限公司 | 日志数据处理方法、装置、计算机程序产品及存储介质 |
CN114741412A (zh) * | 2021-01-07 | 2022-07-12 | 厦门美柚股份有限公司 | 用户行为自助分析系统 |
CN115018642A (zh) * | 2022-06-08 | 2022-09-06 | 国泰君安证券股份有限公司 | 针对多源实时行情数据实现高可用接收及处理的系统 |
CN115114339A (zh) * | 2022-08-26 | 2022-09-27 | 塬数科技(无锡)有限公司 | 基于物联网平台的数据管理方法及数据管理系统 |
CN115934680A (zh) * | 2022-12-23 | 2023-04-07 | 乐元素科技(北京)股份有限公司 | 一站式大数据分析处理系统 |
CN116431872A (zh) * | 2023-06-09 | 2023-07-14 | 智者四海(北京)技术有限公司 | 可观测系统及基于可观测系统的服务观测方法 |
WO2024082176A1 (zh) * | 2022-10-19 | 2024-04-25 | 华为技术有限公司 | 数据处理方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105389352A (zh) * | 2015-10-30 | 2016-03-09 | 北京奇艺世纪科技有限公司 | 日志处理方法和装置 |
JP2016051426A (ja) * | 2014-09-02 | 2016-04-11 | キヤノン株式会社 | 分析システム、分析システムの制御方法 |
CN105787064A (zh) * | 2016-03-01 | 2016-07-20 | 广州铭诚计算机科技有限公司 | 一种基于大数据的挖掘平台构建方法 |
CN106202192A (zh) * | 2016-06-28 | 2016-12-07 | 浪潮软件集团有限公司 | 一种基于工作流的大数据分析方法 |
US20170208077A1 (en) * | 2016-01-15 | 2017-07-20 | Kentik Technologies, Inc. | Network Monitoring, Detection, and Analysis System |
-
2017
- 2017-09-26 CN CN201710881202.5A patent/CN107577805B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016051426A (ja) * | 2014-09-02 | 2016-04-11 | キヤノン株式会社 | 分析システム、分析システムの制御方法 |
CN105389352A (zh) * | 2015-10-30 | 2016-03-09 | 北京奇艺世纪科技有限公司 | 日志处理方法和装置 |
US20170208077A1 (en) * | 2016-01-15 | 2017-07-20 | Kentik Technologies, Inc. | Network Monitoring, Detection, and Analysis System |
CN105787064A (zh) * | 2016-03-01 | 2016-07-20 | 广州铭诚计算机科技有限公司 | 一种基于大数据的挖掘平台构建方法 |
CN106202192A (zh) * | 2016-06-28 | 2016-12-07 | 浪潮软件集团有限公司 | 一种基于工作流的大数据分析方法 |
Cited By (69)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108228874A (zh) * | 2018-01-18 | 2018-06-29 | 北京邮电大学 | 基于人工智能技术的通用知识图谱可视化装置及方法 |
CN108427709A (zh) * | 2018-01-25 | 2018-08-21 | 朗新科技股份有限公司 | 一种多源海量数据处理系统及方法 |
CN108427709B (zh) * | 2018-01-25 | 2020-10-16 | 朗新科技集团股份有限公司 | 一种多源海量数据处理系统及方法 |
CN108595473A (zh) * | 2018-03-09 | 2018-09-28 | 广州市优普计算机有限公司 | 一种基于云计算的大数据应用平台 |
CN108804497A (zh) * | 2018-04-02 | 2018-11-13 | 北京国电通网络技术有限公司 | 一种基于日志的大数据分析方法 |
CN110347575A (zh) * | 2018-04-04 | 2019-10-18 | 中移(杭州)信息技术有限公司 | 一种基于大数据组件的调试方法、装置、终端设备和介质 |
CN110362456A (zh) * | 2018-04-10 | 2019-10-22 | 挖财网络技术有限公司 | 一种获取服务端性能数据的方法及装置 |
CN109359126B (zh) * | 2018-04-13 | 2021-06-04 | 国家计算机网络与信息安全管理中心 | 基于业务用户习惯的智能学习查询模型的构建方法及系统 |
CN109359126A (zh) * | 2018-04-13 | 2019-02-19 | 国家计算机网络与信息安全管理中心 | 基于业务用户习惯的智能学习查询模型的构建方法及系统 |
CN108681589A (zh) * | 2018-05-15 | 2018-10-19 | 口碑(上海)信息技术有限公司 | 基于指标体系的结构化查询语言指令生成方法及装置 |
CN110598199A (zh) * | 2018-06-12 | 2019-12-20 | 百度在线网络技术(北京)有限公司 | 数据流式处理方法、装置、计算机设备和存储介质 |
CN110598199B (zh) * | 2018-06-12 | 2023-07-25 | 百度在线网络技术(北京)有限公司 | 数据流式处理方法、装置、计算机设备和存储介质 |
CN110690984A (zh) * | 2018-07-05 | 2020-01-14 | 上海宝信软件股份有限公司 | 基于Spark的大数据网络日志采集分析和预警的方法、系统 |
CN109241291A (zh) * | 2018-07-18 | 2019-01-18 | 华南师范大学 | 基于深度强化学习的知识图谱最优路径查询系统及其方法 |
CN109241291B (zh) * | 2018-07-18 | 2022-02-15 | 华南师范大学 | 基于深度强化学习的知识图谱最优路径查询系统及其方法 |
CN110852537A (zh) * | 2018-07-26 | 2020-02-28 | 北京京东金融科技控股有限公司 | 服务质量检测方法和装置 |
CN109189589A (zh) * | 2018-08-14 | 2019-01-11 | 北京博睿宏远数据科技股份有限公司 | 一种分布式大数据计算引擎及架构方法 |
CN109189589B (zh) * | 2018-08-14 | 2020-08-07 | 北京博睿宏远数据科技股份有限公司 | 一种分布式大数据计算引擎及架构方法 |
CN109255523A (zh) * | 2018-08-16 | 2019-01-22 | 北京奥技异科技发展有限公司 | 基于kks编码规则和大数据架构的分析指标计算平台 |
CN109446180B (zh) * | 2018-10-18 | 2021-07-02 | 郑州云海信息技术有限公司 | 一种用于配置云数据平台的方法和装置 |
CN109446180A (zh) * | 2018-10-18 | 2019-03-08 | 郑州云海信息技术有限公司 | 一种用于配置云数据平台的方法和装置 |
CN109828970A (zh) * | 2019-01-16 | 2019-05-31 | 北京奇艺世纪科技有限公司 | 一种信息处理方法、装置及电子设备 |
CN109977158B (zh) * | 2019-02-28 | 2023-03-31 | 武汉烽火众智智慧之星科技有限公司 | 公安大数据分析处理系统及方法 |
CN109977158A (zh) * | 2019-02-28 | 2019-07-05 | 武汉烽火众智智慧之星科技有限公司 | 公安大数据分析处理系统及方法 |
CN111915382A (zh) * | 2019-05-08 | 2020-11-10 | 阿里巴巴集团控股有限公司 | 数据处理方法、系统及装置 |
CN110245158A (zh) * | 2019-06-10 | 2019-09-17 | 上海理想信息产业(集团)有限公司 | 一种基于Flink流计算技术的多源异构数据实时处理系统及方法 |
CN110399352B (zh) * | 2019-06-18 | 2023-05-30 | 平安科技(深圳)有限公司 | 处理svn日志文件的方法、装置、设备及存储介质 |
CN110399352A (zh) * | 2019-06-18 | 2019-11-01 | 平安科技(深圳)有限公司 | 处理svn日志文件的方法、装置、设备及存储介质 |
WO2020253082A1 (zh) * | 2019-06-18 | 2020-12-24 | 平安科技(深圳)有限公司 | 处理svn日志文件的方法、装置、设备及存储介质 |
CN110635966A (zh) * | 2019-08-20 | 2019-12-31 | 华能四川水电有限公司 | 一种流量数据的可视化展示系统、方法、介质和电子设备 |
CN110825775A (zh) * | 2019-11-04 | 2020-02-21 | 北京理工大学 | 一种Gaia系统中支持流数据与批数据交互的数据交换系统 |
CN110825775B (zh) * | 2019-11-04 | 2022-02-15 | 北京理工大学 | 一种Gaia系统中支持流数据与批数据交互的数据交换系统 |
CN110891083B (zh) * | 2019-11-05 | 2020-12-04 | 北京理工大学 | 一种Gaia中支持多作业并行执行的代理方法 |
CN110891083A (zh) * | 2019-11-05 | 2020-03-17 | 北京理工大学 | 一种Gaia中支持多作业并行执行的代理方法 |
CN111860854B (zh) * | 2019-12-06 | 2024-05-07 | 北京嘀嘀无限科技发展有限公司 | 模型特征管理系统、模型特征管理方法及存储介质 |
CN111860854A (zh) * | 2019-12-06 | 2020-10-30 | 北京嘀嘀无限科技发展有限公司 | 模型特征管理系统、模型特征管理方法及存储介质 |
CN111090676A (zh) * | 2019-12-23 | 2020-05-01 | 南京航空航天大学 | 面向流式数据的分布式自动处理方法及系统 |
CN111143314A (zh) * | 2019-12-26 | 2020-05-12 | 厦门服云信息科技有限公司 | 一种基于高速流式处理技术的日志解析方法及系统 |
CN111078781B (zh) * | 2019-12-30 | 2023-05-26 | 电信科学技术第五研究所有限公司 | 一种多源流式大数据融合汇聚处理框架模型实现方法 |
CN111078781A (zh) * | 2019-12-30 | 2020-04-28 | 电信科学技术第五研究所有限公司 | 一种多源流式大数据融合汇聚处理框架模型实现方法 |
CN111190876A (zh) * | 2019-12-31 | 2020-05-22 | 天津浪淘科技股份有限公司 | 日志管理系统及其运行方法 |
CN111241078B (zh) * | 2020-01-07 | 2024-06-21 | 网易(杭州)网络有限公司 | 数据分析系统、数据分析的方法及装置 |
CN111241078A (zh) * | 2020-01-07 | 2020-06-05 | 网易(杭州)网络有限公司 | 数据分析系统、数据分析的方法及装置 |
CN111581932A (zh) * | 2020-03-16 | 2020-08-25 | 北京掌行通信息技术有限公司 | 一种数据驱动的大数据分析方法、系统、装置、存储介质及终端 |
CN111581932B (zh) * | 2020-03-16 | 2024-09-10 | 北京掌行通信息技术有限公司 | 一种数据驱动的大数据分析方法、系统、装置、存储介质及终端 |
CN111541645A (zh) * | 2020-03-24 | 2020-08-14 | 国家计算机网络与信息安全管理中心 | 一种VoIP服务知识库构建方法及系统 |
CN111541645B (zh) * | 2020-03-24 | 2022-06-17 | 国家计算机网络与信息安全管理中心 | 一种VoIP服务知识库构建方法及系统 |
CN111858278A (zh) * | 2020-07-08 | 2020-10-30 | 北京国联视讯信息技术股份有限公司 | 基于大数据处理的日志分析方法、系统及可读存储装置 |
CN112165470A (zh) * | 2020-09-18 | 2021-01-01 | 国网辽宁省电力有限公司电力科学研究院 | 一种基于日志大数据分析的智能终端接入安全预警系统 |
CN112165470B (zh) * | 2020-09-18 | 2023-04-07 | 国网辽宁省电力有限公司电力科学研究院 | 一种基于日志大数据分析的智能终端接入安全预警系统 |
CN111897859A (zh) * | 2020-09-30 | 2020-11-06 | 知学云(北京)科技有限公司 | 一种面向企业在线教育的大数据智能报表平台 |
CN114741412B (zh) * | 2021-01-07 | 2024-04-16 | 厦门美柚股份有限公司 | 用户行为自助分析系统 |
CN114741412A (zh) * | 2021-01-07 | 2022-07-12 | 厦门美柚股份有限公司 | 用户行为自助分析系统 |
CN112989160A (zh) * | 2021-01-19 | 2021-06-18 | 苏州工业园区测绘地理信息有限公司 | 基于数据管道模型的网络爬虫方法及系统 |
CN113032459A (zh) * | 2021-03-24 | 2021-06-25 | 陕西延长石油(集团)有限责任公司 | 面向油气管道内检测数据展示分析方法、系统、存储介质 |
CN113010399A (zh) * | 2021-04-16 | 2021-06-22 | 携程旅游网络技术(上海)有限公司 | 日志数据处理方法、系统、设备及介质 |
CN113515374B (zh) * | 2021-05-18 | 2024-02-27 | 中国工商银行股份有限公司 | 数据处理方法及装置、电子设备和计算机可读存储介质 |
CN113515374A (zh) * | 2021-05-18 | 2021-10-19 | 中国工商银行股份有限公司 | 数据处理方法及装置、电子设备和计算机可读存储介质 |
CN113326237A (zh) * | 2021-06-16 | 2021-08-31 | 深圳市明源云科技有限公司 | 日志数据的加工方法、装置、终端设备以及存储介质 |
CN113746665B (zh) * | 2021-07-29 | 2022-04-15 | 深圳市明源云科技有限公司 | 日志数据处理方法、装置及存储介质 |
CN113746665A (zh) * | 2021-07-29 | 2021-12-03 | 深圳市明源云科技有限公司 | 日志数据处理方法、装置、计算机程序产品及存储介质 |
CN115018642A (zh) * | 2022-06-08 | 2022-09-06 | 国泰君安证券股份有限公司 | 针对多源实时行情数据实现高可用接收及处理的系统 |
CN115114339B (zh) * | 2022-08-26 | 2022-12-13 | 塬数科技(无锡)有限公司 | 基于物联网平台的数据管理方法及数据管理系统 |
CN115114339A (zh) * | 2022-08-26 | 2022-09-27 | 塬数科技(无锡)有限公司 | 基于物联网平台的数据管理方法及数据管理系统 |
WO2024082176A1 (zh) * | 2022-10-19 | 2024-04-25 | 华为技术有限公司 | 数据处理方法及装置 |
CN115934680B (zh) * | 2022-12-23 | 2023-06-23 | 乐元素科技(北京)股份有限公司 | 一站式大数据分析处理系统 |
CN115934680A (zh) * | 2022-12-23 | 2023-04-07 | 乐元素科技(北京)股份有限公司 | 一站式大数据分析处理系统 |
CN116431872B (zh) * | 2023-06-09 | 2023-09-01 | 智者四海(北京)技术有限公司 | 可观测系统及基于可观测系统的服务观测方法 |
CN116431872A (zh) * | 2023-06-09 | 2023-07-14 | 智者四海(北京)技术有限公司 | 可观测系统及基于可观测系统的服务观测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107577805B (zh) | 2020-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107577805A (zh) | 一种面向日志大数据分析的业务服务系统 | |
CN112685385B (zh) | 一种用于智慧城市建设的大数据平台 | |
Phaneendra et al. | Big Data-solutions for RDBMS problems-A survey | |
CN103023970B (zh) | 一种物联网海量数据存储方法及系统 | |
CN107679192A (zh) | 多集群协同数据处理方法、系统、存储介质及设备 | |
CN112181960B (zh) | 一种基于AIOps的智能运维框架系统 | |
CN107766402A (zh) | 一种楼盘字典云房源大数据平台 | |
CN105139281A (zh) | 一种电力营销大数据的处理方法及系统 | |
CN107315776A (zh) | 一种基于云计算的数据管理系统 | |
CN107103064B (zh) | 数据统计方法及装置 | |
CN108021809A (zh) | 一种数据处理方法及系统 | |
CN107247799A (zh) | 兼容多种大数据存储的数据处理方法、系统及其建模方法 | |
CN110019267A (zh) | 一种元数据更新方法、装置、系统、电子设备及存储介质 | |
CN106951552A (zh) | 一种基于Hadoop的用户行为数据处理方法 | |
US10924551B2 (en) | IRC-Infoid data standardization for use in a plurality of mobile applications | |
CN110716897A (zh) | 一种基于云计算的海洋档案数据库并行化构建方法和装置 | |
Caldarola et al. | Big data: A survey-the new paradigms, methodologies and tools | |
Agrahari et al. | A review paper on Big Data: technologies, tools and trends | |
CN112148578A (zh) | 基于机器学习的it故障缺陷预测方法 | |
CN105550351B (zh) | 旅客行程数据即席查询系统及方法 | |
CN109977125A (zh) | 一种基于网络安全的大数据安全分析平台系统 | |
CN104199889A (zh) | 基于CEP技术的RTLogic大数据处理系统及方法 | |
Ribeiro et al. | A data integration architecture for smart cities | |
CN112181972A (zh) | 基于大数据的数据治理方法、装置和计算机设备 | |
CN107357919A (zh) | 行为日志查询系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |