CN110837533A - 使用SpringBoot框架调度Kettle实现司法资源信息数据抽取转换的方法 - Google Patents

使用SpringBoot框架调度Kettle实现司法资源信息数据抽取转换的方法 Download PDF

Info

Publication number
CN110837533A
CN110837533A CN201911099134.2A CN201911099134A CN110837533A CN 110837533 A CN110837533 A CN 110837533A CN 201911099134 A CN201911099134 A CN 201911099134A CN 110837533 A CN110837533 A CN 110837533A
Authority
CN
China
Prior art keywords
task
scheduling
data extraction
judicial
framework
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201911099134.2A
Other languages
English (en)
Inventor
高昊飞
赵倩
吴蔚
李逊
郭百强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Aerospace Changfeng Co Ltd
Original Assignee
Beijing Aerospace Changfeng Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Aerospace Changfeng Co Ltd filed Critical Beijing Aerospace Changfeng Co Ltd
Priority to CN201911099134.2A priority Critical patent/CN110837533A/zh
Publication of CN110837533A publication Critical patent/CN110837533A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Technology Law (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了使用SpringBoot框架调度Kettle实现司法资源信息数据抽取转换的方法,该方法包括以下步骤:技术框架选型、定义项目的配置、初始化资源、设计数据抽取的具体过程、通过接口操作调度任务以及触发调度任务。

Description

使用SpringBoot框架调度Kettle实现司法资源信息数据抽取 转换的方法
技术领域
该发明直接应用的技术领域为基于司法行政资源的大数据应用。
背景技术
随着司法改革的不断深化和社会经济的不断发展,司法行政也面临着许多新情况、新问题。依托司法行政资源决策技术,推进信息化条件下业务流程再造,以信息化建设推进工作机制完善,推动实现了信息主导、精准服务、精准管控、智能研判的工作新模式,构建起以“智慧决策观”“智慧服务观”“智慧组织结构观”为重点的司法行政“智慧法务”新格局,对司法行政工作向标准化、规范化、精细化方向延伸具有重要推动作用。司法资源信息大数据并非数据的简单加法,而是应建立在数据“乘法融合”,其核心不在于数据量的多少,而是数据的智能化程度之高低。当前,司法资源信息大数据利用的智能化程度有待提高,由数据系统直接生成动态的立体化司法运行状况还未能实现,数据服务还无法满足于个人定制模式,数据检索项设置还比较简单,关键词检索还不够智能,在一定程度上影响了数据库的使用效能。
司法资源信息大数据的智能化要求实现大数据与互联网、人工智能等现代科技手段融合发展,共同运用到司法实践中,实现人工智能在司法领域的深度应用,打破部门信息壁垒,实现部门内部上下级之间数据的对流和交换,促成不同部门之间横向的数据开放与交流。大量的司法资源信息数据如何抽取到大数据平台呢?其中一个解决方案就是使用开源的ETL工具Kettle来进行抽取,但是Kettle的每次抽取都要手动去点击执行,使用并不友好和方便。所以,一个功能友好的、可配置的调度工具来调度kettle的司法资源信息大数据抽取任务十分必要。
发明内容
为实现上述目的,本发明提供如下技术方案:使用SpringBoot框架调度Kettle实现司法资源信息数据抽取转换的方法,该方法包括以下步骤:技术框架选型、定义项目的配置、初始化资源、设计数据抽取的具体过程、通过接口操作调度任务以及触发调度任务。
作为本发明的一种优选技术方案,所述技术框架选型采用目前Java EE最新的开发框架SpringBoot2.0搭建一个提供RESTful接口的Web项目,集成定时调度框架Quartz,和调用Kettle的依赖jar包。
作为本发明的一种优选技术方案,所述定义项目的配置包括:
定义统一的RESTful接口数据返回格式;
重写JobFactory的实现方式,使其可以放入到sping容器中进行管理;
使用hikari数据库连接池连接资源库和其他数据库,并初始化调度任务数据库和kettle的资源库;
配置quartz为数据库存储,配置其部署方式为集群部署;
配置kettle连接资源库的信息。
作为本发明的一种优选技术方案,所述初始化资源包括:
在工程启动的时候初始化Kettle的运行环境,并返回全局的KettleDatabaseRepository资源库对象,供后面操作;
创建2种Job的类,一种拿来实例化kettle的Trans任务,一种拿来实例化kettle的Job任务。
作为本发明的一种优选技术方案,所述设计数据抽取的具体过程包括:
创建调度数据抽取任务;
运行调度数据抽取任务;
暂停调度数据抽取任务;
恢复调度数据抽取任务;
删除调度数据抽取任务;
更新调度数据抽取任务;
查询调度数据抽取任务列表。
作为本发明的一种优选技术方案,所述触发调度任务为运行状态的调度数据抽取任务,在时间触发器的作用下,会触发任务,它根据悲观锁的方式选择一个调度节点执行调度任务,满足数据抽取的需求。
与现有技术相比,本发明提供了使用SpringBoot框架调度Kettle实现司法资源信息数据抽取转换的方法,具备以下有益效果:
本发明提供了一种界面友好的、功能强大的、易于操作的司法资源信息大数据抽取调度工具,为司法行政资源的大数据检索提供便捷。
附图说明
图1为本发明的结构示意图。
具体实施方式
参照图1,本发明提供一种技术方案:使用SpringBoot框架调度Kettle实现司法资源信息数据抽取转换的方法,该方法包括以下步骤:技术框架选型、定义项目的配置、初始化资源、设计数据抽取的具体过程、通过接口操作调度任务以及触发调度任务,具体地,在使用前,先安装3台Centos7服务器,配置好服务器对应的IP为静态地址,在服务器中安装JDK>=1.8版本的Java运行环境,其中一台服务器安装Mysq1数据库;在3台服务器上上传kettle8.1版本的执行文件,启动carte服务器,然后在安装Mysq1数据库的服务器作为master节点,使用启动一个kettle的spoon.sh创建一个资源库后连接资源库,并创建一个数据转换的集群任务;将工程项目配置好数据库连接信息和kettle连接信息后编译为一个可运行的jar包,传送到3台服务器上,并后台运行3个jar包;通过接口访问其中任意一台服务器的功能接口都行,对接一个前端,可以完成可视化操作接口,达到方便,友好的操作调度任务,集群部署方式能达到稳定,高效的功能。
本实施例中,所述技术框架选型采用目前Java EE最新的开发框架SpringBoot2.0搭建一个提供RESTful接口的Web项目,集成定时调度框架Quartz,和调用Kettle的依赖jar包。
本实施例中,所述定义项目的配置包括:
定义统一的RESTfu1接口数据返回格式;
重写JobFactory的实现方式,使其可以放入到sping容器中进行管理;
使用hikari数据库连接池连接资源库和其他数据库,并初始化调度任务数据库和kettle的资源库;
配置quartz为数据库存储,配置其部署方式为集群部署;
配置kettle连接资源库的信息。
本实施例中,所述初始化资源包括:
在工程启动的时候初始化Kettle的运行环境,并返回全局的KettleDatabaseRepository资源库对象,供后面操作;
创建2种Job的类,一种拿来实例化kettle的Trans任务,一种拿来实例化kettle的Job任务。
本实施例中,所述设计数据抽取的具体过程包括:
创建调度数据抽取任务;
运行调度数据抽取任务;
暂停调度数据抽取任务;
恢复调度数据抽取任务;
删除调度数据抽取任务;
更新调度数据抽取任务;
查询调度数据抽取任务列表。
本实施例中,所述触发调度任务为运行状态的调度数据抽取任务,在时间触发器的作用下,会触发任务,它根据悲观锁的方式选择一个调度节点执行调度任务,达到简洁,高效,健壮的功能,满足数据抽取的需求。
以上所述,仅为发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (6)

1.使用SpringBoot框架调度Kettle实现司法资源信息数据抽取转换的方法,其特征在于,该方法包括以下步骤:技术框架选型、定义项目的配置、初始化资源、设计数据抽取的具体过程、通过接口操作调度任务以及触发调度任务。
2.根据权利要求1所述的使用SpringBoot框架调度Kettle实现司法资源信息数据抽取转换的方法,其特征在于,所述技术框架选型采用目前Java EE最新的开发框架SpringBoot2.0搭建一个提供RESTful接口的Web项目,集成定时调度框架Quartz,和调用Kettle的依赖jar包。
3.根据权利要求1所述的使用SpringBoot框架调度Kettle实现司法资源信息数据抽取转换的方法,其特征在于,所述定义项目的配置包括:
定义统一的RESTful接口数据返回格式;
重写JobFactory的实现方式,使其可以放入到sping容器中进行管理;
使用hikari数据库连接池连接资源库和其他数据库,并初始化调度任务数据库和kettle的资源库;
配置quartz为数据库存储,配置其部署方式为集群部署;
配置kettle连接资源库的信息。
4.根据权利要求1所述的使用SpringBoot框架调度Kettle实现司法资源信息数据抽取转换的方法,其特征在于,所述初始化资源包括:
在工程启动的时候初始化Kettle的运行环境,并返回全局的KettleDatabaseRepository资源库对象,供后面操作;
创建2种Job的类,一种拿来实例化kettle的Trans任务,一种拿来实例化kettle的Job任务。
5.根据权利要求1所述的使用SpringBoot框架调度Kettle实现司法资源信息数据抽取转换的方法,其特征在于,所述设计数据抽取的具体过程包括:
创建调度数据抽取任务;
运行调度数据抽取任务;
暂停调度数据抽取任务;
恢复调度数据抽取任务;
删除调度数据抽取任务;
更新调度数据抽取任务;
查询调度数据抽取任务列表。
6.根据权利要求1所述的使用SpringBoot框架调度Kettle实现司法资源信息数据抽取转换的方法,其特征在于,所述触发调度任务为运行状态的调度数据抽取任务,在时间触发器的作用下,会触发任务,它根据悲观锁的方式选择一个调度节点执行调度任务,满足数据抽取的需求。
CN201911099134.2A 2019-11-11 2019-11-11 使用SpringBoot框架调度Kettle实现司法资源信息数据抽取转换的方法 Withdrawn CN110837533A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911099134.2A CN110837533A (zh) 2019-11-11 2019-11-11 使用SpringBoot框架调度Kettle实现司法资源信息数据抽取转换的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911099134.2A CN110837533A (zh) 2019-11-11 2019-11-11 使用SpringBoot框架调度Kettle实现司法资源信息数据抽取转换的方法

Publications (1)

Publication Number Publication Date
CN110837533A true CN110837533A (zh) 2020-02-25

Family

ID=69574791

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911099134.2A Withdrawn CN110837533A (zh) 2019-11-11 2019-11-11 使用SpringBoot框架调度Kettle实现司法资源信息数据抽取转换的方法

Country Status (1)

Country Link
CN (1) CN110837533A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111966394A (zh) * 2020-08-28 2020-11-20 珠海格力电器股份有限公司 基于etl的数据分析方法、装置、设备和存储介质
CN115687486A (zh) * 2022-11-14 2023-02-03 浪潮智慧科技有限公司 一种基于kettle的轻量级数据采集方法及设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111966394A (zh) * 2020-08-28 2020-11-20 珠海格力电器股份有限公司 基于etl的数据分析方法、装置、设备和存储介质
CN111966394B (zh) * 2020-08-28 2024-05-31 珠海格力电器股份有限公司 基于etl的数据分析方法、装置、设备和存储介质
CN115687486A (zh) * 2022-11-14 2023-02-03 浪潮智慧科技有限公司 一种基于kettle的轻量级数据采集方法及设备
CN115687486B (zh) * 2022-11-14 2023-06-13 浪潮智慧科技有限公司 一种基于kettle的轻量级数据采集方法及设备

Similar Documents

Publication Publication Date Title
CN108809972B (zh) 基于开源生态系统的物联网综合实验及应用开发平台
CN101699393B (zh) 一种面向网络的智能化软件界面动态生成方法
CN110908641B (zh) 基于可视化的流计算平台、方法、设备和存储介质
JPH09508742A (ja) 従来の非オブジェクト指向業務アプリケーションをアクセスするためのオブジェクト構造を生成するための方法論
CN1755720A (zh) 用于缓存或同步项目数据的方法和系统
CN110362363B (zh) 一种基于运行时模型实现对终端应用控制的方法
CN101287040A (zh) 基于发送方与接收方之间的交互历史和上下文的动作预测
US10089084B2 (en) System and method for reusing JavaScript code available in a SOA middleware environment from a process defined by a process execution language
CN102103497A (zh) 有限状态机执行装置和方法、在应用中的建立和使用方法
CN101667147A (zh) 一种多任务的可控自动快照方法
CN103942055A (zh) 面向融合网络混合服务流程编制语言的开发系统及方法
CN110837533A (zh) 使用SpringBoot框架调度Kettle实现司法资源信息数据抽取转换的方法
CN112286628B (zh) 一种统一纳管Kubernetes异构应用的系统及运行方法
CN113626128B (zh) 视听媒体微服务第三方模块接入方法、系统、电子设备
CN104536819A (zh) 基于web服务的任务调度方法
CN101202792B (zh) 基于发送方与接收方之间的关系处理消息的方法和装置
CN115934855A (zh) 一种全链路字段级血缘解析方法、系统、设备及存储介质
US9535678B2 (en) Providing distributed array containers for programming objects
CN110888736A (zh) 一种基于容器云平台的应用管理方法、系统及相关组件
CN110532058B (zh) 容器集群服务的管理方法、装置、设备及可读存储介质
CN103488697A (zh) 能自动收集和交换碎片化商业信息的系统及移动终端
CN107391274A (zh) 离线消息的处理方法及装置
CN112182075A (zh) 基于SpringBoot框架调度Kettle进行数据抽取转换的方法
US10268496B2 (en) System and method for supporting object notation variables in a process defined by a process execution language for execution in a SOA middleware environment
US10223143B2 (en) System and method for supporting javascript as an expression language in a process defined by a process execution language for execution in a SOA middleware environment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20200225

WW01 Invention patent application withdrawn after publication