CN115309722A - 一种一站式数据开发方法、系统 - Google Patents

一种一站式数据开发方法、系统 Download PDF

Info

Publication number
CN115309722A
CN115309722A CN202210961919.1A CN202210961919A CN115309722A CN 115309722 A CN115309722 A CN 115309722A CN 202210961919 A CN202210961919 A CN 202210961919A CN 115309722 A CN115309722 A CN 115309722A
Authority
CN
China
Prior art keywords
data
task
target
metadata
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210961919.1A
Other languages
English (en)
Inventor
王瀚
杨泽明
杨光
陆柏亨
李玮
鲍立飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hainan Digital Manufacturing Technology Co ltd
Original Assignee
Hainan Digital Manufacturing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hainan Digital Manufacturing Technology Co ltd filed Critical Hainan Digital Manufacturing Technology Co ltd
Priority to CN202210961919.1A priority Critical patent/CN115309722A/zh
Publication of CN115309722A publication Critical patent/CN115309722A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • G06F16/212Schema design and management with details for data modelling support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management
    • G06F11/3688Test management for test execution, e.g. scheduling of test suites
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24568Data stream processing; Continuous queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及数据开发的领域,尤其是涉及一种一站式数据开发方法、系统,其包括基于用户写入任务的操作获取对应的任务需求数据;将任务需求数据进行加工确定对应的目标任务数据;对目标任务数据进行逻辑判断是否正确;若是,依据多个目标任务数据获取对应的任务流数据;对任务流数据进行冒烟测试获取对应的目标发布包文件数据;基于冒烟测试通过的操作对发布包文件数据进行审核;基于用户的定时策略对发布包文件数据进行周期调度。本申请具有简化数据使用过程,提高开发效率的效果。

Description

一种一站式数据开发方法、系统
技术领域
本申请涉及数据开发的领域,尤其是涉及一种一站式数据开发方法、系统。
背景技术
随着云计算、物联网、第五代移动通信技术(5G)等信息技术和应用模式的快速发展,在发展过程中产生的数据正以指数级的速度增长,因此如何对海量数据进行采集、处理、加工和分析,快速发掘出其中潜在的价值成为多方共同努力的方向,其中一个方向就是构建大数据平台。
随着各类企业数字化转型的深入,企业对员工的数据素养要求逐步提高,用数据来辅助决策和营销已成为业务人员的日常工作。但是传统的数据数据使用方式需要业务人员讲需求反馈至IT人员进行开发,在此过程中,中间产生数据管道长,数据使用比较复杂,从而整个开发过程的效率较低,对此情况有待进一步改善。
发明内容
为了简化数据使用过程,提高开发效率,本申请提供一种一站式数据开发方法、系统。
第一方面,本申请提供的一种一站式数据开发方法,采用如下的技术方案:
一种一站式数据开发方法,包括如下步骤:
基于用户写入任务的操作获取对应的任务需求数据;
将任务需求数据进行加工确定对应的目标任务数据;
对目标任务数据进行逻辑判断是否正确;
若是,依据多个目标任务数据获取对应的任务流数据;
对任务流数据进行冒烟测试获取对应的目标发布包文件数据;
基于冒烟测试通过的操作对发布包文件数据进行审核;
基于用户的定时策略对发布包文件数据进行周期调度。
通过采用上述技术方案,在用户使用系统进行数据开发阶段,用户在设备端进行操作写入所需的功能需求,系统便可以获取用户对应的任务需求数据,随后系统任务需求数据进行加工后的目标任务数据,并且在判断目标任务数据逻辑正确之后,便可以确保进行后续的操作步骤,并且由于目标任务数据会有多个,系统为了便于数据的管理流转,将多个目标任务数据确定为一个单独的任务流数据,在经过冒烟测试后,可以确保任务流数据能够在后续顺利运行,并且将经过冒烟测试的发布包文件数据进行审核,在审核通过之后,系统便会将发布包文件数据进行发布,并且用户在系统上输入对应的定时策略,系统依据定时策略可以周期性调度发布包文件数据。
在本申请的方案中,用户只需要按照系统设定的逻辑方式写入对应的功能需求,系统便可以依据系统内部的数据库数据,生成对应功能的发布包文件数据,并可以进行发布;在上述过程中,相比于以往开发过程,对于用户而言,无需进行复杂的操作,可以方便整个功能需求开发,简化数据使用过程,从而实现提高开发效率。
可选的,在基于用户写入任务的操作获取对应的任务需求数据之前,还进行如下步骤:
获取数据底座中的元数据,其中,元数据包括库、表、字段等类型;
将元数据进行加工获取对应的目标元数据;
将目标元数据更新到对应的数据库中;
将目标元数据写入检索引擎。
通过采用上述技术方案,系统在投入供用户使用之前,通过获取元数据,在经过加工之后,便可以获取完成的目标元数据,在这里需要指出的是,元数据在经过加工之后,目标元数据对应一个功能需求或者对应部分功能需求的部分数据,并且系统会将目标元数据更新到自身对应的数据库中,数据库增加一种或者多种目标元数据,相当于系统能够开发的功能需求得以增加,并且通过系统的检索引擎,用户可以需求进行检索对应的元数据,如果用户需要的功能需求可以直接通过检索引擎搜索到,便可以直接进行功能需求开发,更加方便。
可选的,在将元数据进行加工获取对应的目标元数据过程中,进行如下步骤:
基于ETL流程对元数据进行排序处理、去重处理、转义处理的操作获取对应的中间元数据;
获取中间元数据的属性数据;
依据预先设置的预设属性数和属性数据确定缺失属性数据;
依据缺失属性数据对中间元数据进行属性补充操作获取对应的目标元数据。
通过采用上述技术方案,在获取元数据之后,为了将获取的元数据能够匹配到本方案中系统,需要将元数据进行属性补全,通过加工处理元数据能够符合系统的格式标准,便于后续直接调取使用。
可选的,在将目标元数据写入检索引擎过程中,进行如下步骤;
调取预先设置的定时任务数据;
依据定时任务数据将目标元数据写入检索引擎。
通过采用上述技术方案,通过将定时任务数据将目标元数据写入检索引擎,就是对检索引擎进行定期更新,并且能够逐步丰富检索引擎内的数据量。
可选的,在基于用户写入任务的操作获取对应的任务需求数据的过程中,进行如下步骤:
调取预设的脚本任务数据,其中脚本任务数据包括HiveSQL、SparkSQL、Python、Shell等多种类型;
基于用户编辑脚本任务数据的操作获取对应的任务需求数据。
通过采用上述技术方案,通过将脚本任务提前设置好,用户在使用系统的过程中,可以直接在任务脚本数据上进行编辑输入对应的任务,数据使用相对简单,从而可以提高整个开发过程的效率。
可选的,在获取对应的目标发布包文件数据过程中,进行如下步骤:
基于对任务流数据进行参数配置的操作获取对应的中间任务流数据,其中,参数包括频率、调度时间、告警策略;
将中间任务流数据存储至MongoDB数据库;
获取中间任务流数据对应的任务流测试数据,并将任务流测试数据存储至MongoDB数据库,其中,中间任务流数据为任务流测试数据;
基于任务流测试数据获取对应的目标发布包文件数据,并将目标发布包文件数据存储至MongoDB数据库。
通过采用上述技术方案,通过对任务流数据进行参数配置的操作,可以确保后续的目标发布包文件数据内的参数能够确保运行顺畅。
可选的,在对发布包文件数据进行周期调度的过程中,进行如下步骤:
基于检测到发布包文件数据运行异常,发送告警数据给到对应的管理人员;
基于管理人员的排查操作发送问题信息给用户,其中,问题信息为管理人员排查出那些部分有问题的相关信息;
基于用户的修复操作获取对应的新任务流数据,并将新任务流数据存储至MongoDB数据库;
选取新新任务流数据确定对应的待发布包文件数据,将待发布包文件数据确定为目标发布包文件数据。
通过采用上述技术方案,在监测到发布包文件数据出现运行异常时,说明发布包文件数据存在问题,经过管理人员的排查,可以及时将存在运行问题的发布包文件数据进行修复,从而确保发布包文件数据顺利发布。
第二方面,本申请提供的一种一站式数据开发系统,采用如下的技术方案:
一种一站式数据开发系统,包括:
任务需求获取模块,基于用户写入任务的操作用于获取对应的任务需求数据;
目标任务确定模块,将任务需求数据进行加工用于确定对应的目标任务数据;
判断模块,用于对目标任务数据进行逻辑判断是否正确;
任务流获取模块,若是,依据多个目标任务数据用于获取对应的任务流数据;
目标发布包获取模块,对任务流数据进行冒烟测试获用于取对应的目标发布包文件数据;
审核模块,基于冒烟测试通过的操作用于对发布包文件数据进行审核;
调度模块,基于用户的定时策略用于对发布包文件数据进行周期调度。
通过采用上述技术方案,在用户使用系统进行数据开发阶段,用户在设备端进行操作写入所需的功能需求,任务需求获取模块便可以获取用户对应的任务需求数据,随后目标任务确定模块确定任务需求数据进行加工后的目标任务数据,并且在判断模块判断目标任务数据逻辑正确之后,便可以确保进行后续的操作步骤,并且由于目标任务数据会有多个,系统为了便于数据的管理流转,任务流获取模块将多个目标任务数据确定为一个单独的任务流数据,在经过冒烟测试后,可以确保任务流数据能够在后续顺利运行,并且将经过冒烟测试的发布包文件数据进行审核,审核模块在审核通过之后,系统便会将发布包文件数据进行发布,并且用户在系统上输入对应的定时策略,调度模块依据定时策略可以周期性调度发布包文件数据。
在本申请的方案中,用户只需要按照系统设定的逻辑方式写入对应的功能需求,系统便可以依据系统内部的数据库数据,生成对应功能的发布包文件数据,并可以进行发布;在上述过程中,相比于以往开发过程,对于用户而言,无需进行复杂的操作,可以方便整个功能需求开发,简化数据使用过程,从而实现提高开发效率。
第三方面,本申请提供的计算机可读存储介质,存储有能够被处理器加载并执行如一种一站式数据开发系统中任一项所述方法的计算机程序。
第四方面,本申请提供的智能终端,包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行如一种一站式数据开发系统中任一种方法的计算机程序。
综上所述,本申请包括以下至少一种有益技术效果:
在本申请的方案中,用户只需要按照系统设定的逻辑方式写入对应的功能需求,系统便可以依据系统内部的数据库数据,生成对应功能的发布包文件数据,并可以进行发布;在上述过程中,相比于以往开发过程,对于用户而言,无需进行复杂的操作,可以方便整个功能需求开发,简化数据使用过程,从而实现提高开发效率。
并且通过系统的检索引擎,用户可以需求进行检索对应的元数据,如果用户需要的功能需求可以直接通过检索引擎搜索到,便可以直接进行功能需求开发,更加方便。
通过加工处理元数据能够符合系统的格式标准,便于后续直接调取使用。
附图说明
图1是本申请实施例的整体流程图;
图2是本申请实施例中系统使用之前的获取元数据的流程图;
图3是本申请实施例中对元数据进行加工的流程图;
图4是本申请实施例在获取对应的目标发布包文件数据过程中进行的流程图;
图5是本申请实施例在将发布包文件数据进行运行的流程图;
图6是本申请实施例的整体模块示意图。
附图标记说明:
1、任务需求获取模块;2、目标任务确定模块;3、判断模块;4、任务流获取模块;5、目标发布包获取模块;6、审核模块;7、调度模块。
具体实施方式
以下为对本申请作进一步详细说明。
第一方面,参照图1,本申请实施例公开一种一站式数据开发方法,包括如下步骤:
S1,基于用户写入任务的操作获取对应的任务需求数据。
S11,系统调取预设的脚本任务数据;
其中脚本任务数据包括HiveSQL、SparkSQL、Python、Shell等多种类型,并且根据不同的功能需求,需要在不同的脚本任务数据进行操作,在系统的使用过程中,通过脚本任务提前设置好,用户在使用系统的过程中,可以直接在任务脚本数据上进行编辑输入对应的任务,对于用户而言,系统能够提供较为便捷的输入方式。
S12,基于用户编辑脚本任务数据的操作获取对应的任务需求数据。
其中,用户在脚本任务数据内输入的字符串,系统便可以获取到用户所需要开发的功能需求,数据使用相对简单,从而可以提高整个开发过程的效率;
其中,用户在需要进行数据开发时,可以在系统的页面上进行编辑,并且系统页面会提示编辑格式的模版以供用户进行操作,所以在用户使用系统之前,参照图2和图3,还会进行如下步骤:
S01,获取数据底座中的元数据;
其中,元数据包括库、表、字段等类型,通过多种不同类型的元数据,系统可以用户的需求不同,用户对系统的熟悉程度不同,可以选择不同类型的元数据在模版上进行输入操作。
S02,将元数据进行加工获取对应的目标元数据;
其中,对元数据进行加工具体包括:
S021,基于ETL流程对元数据进行排序处理、去重处理、转义处理的操作获取对应的中间元数据;
并且通过上述步骤,可以将从数据底座中获取的元数据加工成符合本申请中系统使用格式的数据,便于将数据直接调取使用,无需进行其他操作。
S022,获取中间元数据的属性数据;
其中,属性数据包括主题域数据、使用说明数据、业务标签数据、部门数据、负责人数据、字段口径数据等数据中的一种或多种。
S023,依据预先设置的预设属性数据和属性数据确定缺失属性数据;
其中,将属性数据内的数据对全部的属性数据类型进行比对,若是属性数据并未包括该类型的属性数据,系统将确定该类属性数据为中间元数据的缺失属性数据,并且,缺失属性数据包括多种类型的属性数据;例如,中间元数据的属性数据中不包含业务标签数据,则将业务标签数据确定为中间元数据的缺失属性数据中的一种。
S024,依据缺失属性数据对中间元数据进行属性补充操作获取对应的目标元数据;
其中,将中间元数据的缺失属性数据进行补充完毕之后,便可以获取到属性数据完整的目标元数据,并且目标元数据符合系统标准格式规范。
S03,将目标元数据更新到对应的数据库中;
其中,将在数据库中更新目标元数据,可以增加数据库内的数据量,在后续用户使用系统的过程中,可以直接调取数据库中的元数据。
S04,将目标元数据写入检索引擎。
并且在此过程中,需要先调取预先设置的定时任务数据;然后系统依据定时任务数据将目标元数据写入检索引擎。
其中,在用户使用系统的检索引擎过程中,可以将查阅检索引擎中现有的一些检索记录,将目标元数据进行更新后,在检索引擎中可以将最新新增的功能需求对应的元数据进行展示,也就是将最新更新到检索引擎的目标元数据进行显示,并且在显示过程中,可以根据目标元数据的更新时间点进行优先级显示,例如,最新更新显示在最前列,以此进行类推。同时在将目标元数据更新到对应的数据库和检索引擎内之后,除了将最新更新显示在最前列,还可以在系统上展示数据资产,也就是指系统内已经存有的元数据以及对应的功能需求,以便于将系统进行更好的展示给用户;并且在系统形成有数据地图,用户可以根据数据地图找到系统内相应的元数据或者功能相关以及相近的元数据。
通过S01到S04的步骤,通过目标元数据写入数据库,检索引擎,就是对数据库和检索引擎进行定期更新,并且能够逐步丰富数据库和检索引擎内的数据量;并且需要指出的是,上述步骤不单单在系统投入使用之前运行,在系统提供给用户进行使用时,S01到S04的步骤也持续会在运行,从而在系统使用过程中,也可以逐步丰富系统的元数据。
S2,将任务需求数据进行加工确定对应的目标任务数据;
其中,通过将任务需求数据进行加工,其中加工过程也是与元数据的加工过程相同,需要将任务需求数据进行排序处理、去重处理、转义处理的等一系列操作,将部分无效任务需求数据进行过滤之后,系统便可以确定用户的目标任务数据。
S3,系统对目标任务数据进行逻辑判断是否正确;
S4,若是,说明目标任务数据的逻辑没有问题,依据多个目标任务数据获取对应的任务流数据;
其中,依据用户的功能需求不同,系统对应获取到的目标任务数据可能是一个或者多个,但是在判断目标任务数据的逻辑没有问题时,系统便可以依据全部的目标任务数据确定当前的目标流数据;并且若是出现目标任务数据逻辑错误时,系统会报错进行反馈,需要用户以及系统后台管理人员进行检查,待检查完毕之后再进行逻辑判断,直至逻辑判断没有出现错误时,才将目标任务数据整理为任务流数据。
S5,系统对任务流数据进行冒烟测试获取对应的目标发布包文件数据;
其中,对任务流数据还需要进行测试,多个任务之间需要配置对应的依赖关系,具体可以在任务流数据中配置任务调度频率、调度时间、告警策略等调度参数,并且在获取对应的目标发布包文件数据过程中,参照图4,进行如下步骤:
S51,基于对任务流数据进行参数配置的操作获取对应的中间任务流数据;
其中,参数包括频率、调度时间、告警策略,并且中间任务流数据作为一个过渡的任务流。
S52,将中间任务流数据存储至MongoDB数据库;
通过将中间任务流数据进行存储,后续可以系统可以查看对应的目标任务流的测试过程以及对应测试流程。
S53,获取中间任务流数据对应的任务流测试数据,并将任务流测试数据存储至MongoDB数据库;
其中,中间任务流数据为任务流测试数据,任务流测试数据为中间任务流数据以及中间任务流数据各任务下的版本。
S54,基于任务流测试数据获取对应的目标发布包文件数据,并将目标发布包文件数据存储至MongoDB数据库;
其中,在测试过程中,将目标发布包文件数据包括任务流数据、任务需求数据、表、配置等信息注册至测试态,同时生成一个提测工单,系统的测试人员在审核过程中,是通过提测工单进行审核的,系统根据每个任务关联的数据源信息,找到对应测试态的连接信息,完成自动切换。
S6,基于冒烟测试通过的操作对发布包文件数据进行审核;
其中,测试人员可以在测试环境使用新的数据源连接信息进行任务的运行和测试,测试通过后工单审批通过,发布包等待发布上线,测试不通过则驳回提测工单,可以选择再次提交发布包文件。
S7,基于用户的定时策略对发布包文件数据进行周期调度;
其中,进行周期调度就是根据各个工作流设置的定时策略周期运行任务,定期产生调度实例及调度日志,并且运行任务就是将发布包文件数据进行运行,而在运行过程中,参照图5,还进行如下步骤:
S71,基于检测到发布包文件数据运行异常,发送告警数据给到对应的管理人员;
S72,基于管理人员的排查操作发送问题信息给用户,其中,问题信息为管理人员排查出那些部分有问题的相关信息;
S73,基于用户的修复操作获取对应的新任务流数据,并将新任务流数据存储至MongoDB数据库;
S74,选取新任务流数据确定对应的待发布包文件数据,将待发布包文件数据确定为目标发布包文件数据。
通过S71到S74的操作步骤,在监测到发布包文件数据出现运行异常时,说明发布包文件数据存在问题,经过管理人员的排查,可以及时将存在运行问题的发布包文件数据进行修复,从而确保发布包文件数据顺利发布。
本申请实施例一种一站式数据开发方法的实施原理为:在用户使用系统进行数据开发阶段,用户在脚本任务数据内输入的字符串,系统便可以获取到用户所需要开发的功能需求,并获取用户的任务需求数据,随后系统进行排序处理、去重处理、转义处理的等一系列操作,将部分无效任务需求数据进行过滤之后,系统便可以确定用户的目标任务数据,并且在判断目标任务数据逻辑正确之后,便可以确保进行后续的操作步骤,若是并且若是出现目标任务数据逻辑错误时,系统会报错进行反馈,需要用户以及系统后台管理人员进行检查,待检查完毕之后再进行逻辑判断;由于目标任务数据会有多个,系统为了便于数据的管理流转,将多个目标任务数据确定为一个单独的任务流数据,并且需要对任务流数据还需要进行测试,多个任务之间还需要配置对应的依赖关系,具体可以在任务流数据中配置任务调度频率、调度时间、告警策略等调度参数。
随后进行冒烟测试,在测试时,将目标发布包文件数据包括任务流数据、任务需求数据、表、配置等信息注册至测试态,同时生成一个提测工单,系统的测试人员在审核过程中,是通过提测工单进行审核的。发布包文件数据在经过冒烟测试后,可以确保任务流数据能够在后续顺利运行,并且将经过冒烟测试的发布包文件数据进行审核,在审核通过之后,系统便会将发布包文件数据进行发布,并且用户在系统上输入对应的定时策略,系统依据定时策略可以周期性调度发布包文件数据;若是出现检测到发布包文件数据运行异常的情况,系统会发送告警数据给到对应的管理人员,管理人员可以进行排查操作,并且发送问题信息给用户,后续用户可以在系统进行修复操作,并且将修复之后获取的待发布包文件数据进行提测审核,待审核通过之后,便可以进行发布。
在本申请的方案中,用户只需要按照系统设定的逻辑方式写入对应的功能需求,系统便可以依据系统内部的数据库数据,生成对应功能的发布包文件数据,并可以进行发布;在上述过程中,相比于以往开发过程,对于用户而言,无需进行复杂的操作,可以方便整个功能需求开发,简化数据使用过程,从而实现提高开发效率。
第二方面,本申请实施例公开一种一站式数据开发系统,参照图6,包括:
任务需求获取模块1,基于用户写入任务的操作用于获取对应的任务需求数据;
目标任务确定模块2,将任务需求数据进行加工用于确定对应的目标任务数据;
判断模块3,用于对目标任务数据进行逻辑判断是否正确;
任务流获取模块4,若是,依据多个目标任务数据用于获取对应的任务流数据;
目标发布包获取模块5,对任务流数据进行冒烟测试获用于取对应的目标发布包文件数据;
审核模块6,基于冒烟测试通过的操作用于对发布包文件数据进行审核;
调度模块7,基于用户的定时策略用于对发布包文件数据进行周期调度。
本申请实施例一种一站式数据开发方法的实施原理为:在用户使用系统进行数据开发阶段,用户在设备端进行操作写入所需的功能需求,任务需求获取模块1便可以获取用户对应的任务需求数据,随后目标任务确定模块2确定任务需求数据进行加工后的目标任务数据,并且在判断模块3判断目标任务数据逻辑正确之后,便可以确保进行后续的操作步骤,并且由于目标任务数据会有多个,系统为了便于数据的管理流转,任务流获取模块4将多个目标任务数据确定为一个单独的任务流数据,在经过冒烟测试后,可以确保任务流数据能够在后续顺利运行,并且将经过冒烟测试的发布包文件数据进行审核,审核模块6在审核通过之后,系统便会将发布包文件数据进行发布,并且用户在系统上输入对应的定时策略,调度模块7依据定时策略可以周期性调度发布包文件数据。
在本申请的方案中,用户只需要按照系统设定的逻辑方式写入对应的功能需求,系统便可以依据系统内部的数据库数据,生成对应功能的发布包文件数据,并可以进行发布;在上述过程中,相比于以往开发过程,对于用户而言,无需进行复杂的操作,可以方便整个功能需求开发,简化数据使用过程,从而实现提高开发效率。
第三方面,本申请提供的计算机可读存储介质,存储有能够被处理器加载并执行如一种一站式数据开发系统中任一项所述方法的计算机程序。
第四方面,本申请提供的智能终端,包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行如一种一站式数据开发系统中任一种方法的计算机程序。
以上均为本申请的较佳实施例,并非依此限制本申请的保护范围,故:凡依本申请的结构、形状、原理所做的等效变化,均应涵盖于本申请的保护范围之内。

Claims (10)

1.一种一站式数据开发方法,其特征在于,包括如下步骤:
基于用户写入任务的操作获取对应的任务需求数据;
将任务需求数据进行加工确定对应的目标任务数据;
对目标任务数据进行逻辑判断是否正确;
若是,依据多个目标任务数据获取对应的任务流数据;
对任务流数据进行冒烟测试获取对应的目标发布包文件数据;
基于冒烟测试通过的操作对发布包文件数据进行审核;
基于用户的定时策略对发布包文件数据进行周期调度。
2.根据权利要求1所述的一种一站式数据开发方法,其特征在于,在基于用户写入任务的操作获取对应的任务需求数据之前,还进行如下步骤:
获取数据底座中的元数据,其中,元数据包括库、表、字段等类型;
将元数据进行加工获取对应的目标元数据;
将目标元数据更新到对应的数据库中;
将目标元数据写入检索引擎。
3.根据权利要求2所述的一种一站式数据开发方法,其特征在于,在将元数据进行加工获取对应的目标元数据过程中,进行如下步骤:
基于ETL流程对元数据进行排序处理、去重处理、转义处理的操作获取对应的中间元数据;
获取中间元数据的属性数据;
依据预先设置的预设属性数据和属性数据确定缺失属性数据;
依据缺失属性数据对中间元数据进行属性补充操作获取对应的目标元数据。
4.根据权利要求2所述的一种一站式数据开发方法,其特征在于,在将目标元数据写入检索引擎过程中,进行如下步骤;
调取预先设置的定时任务数据;
依据定时任务数据将目标元数据写入检索引擎。
5.根据权利要求1所述的一种一站式数据开发方法,其特征在于,在基于用户写入任务的操作获取对应的任务需求数据的过程中,进行如下步骤:
调取预设的脚本任务数据,其中脚本任务数据包括HiveSQL、SparkSQL、Python、Shell等多种类型;
基于用户编辑脚本任务数据的操作获取对应的任务需求数据。
6.根据权利要求1所述的一种一站式数据开发方法,其特征在于,在获取对应的目标发布包文件数据过程中,进行如下步骤:
基于对任务流数据进行参数配置的操作获取对应的中间任务流数据,其中,参数包括频率、调度时间、告警策略;
将中间任务流数据存储至MongoDB数据库;
获取中间任务流数据对应的任务流测试数据,并将任务流测试数据存储至MongoDB数据库,其中,中间任务流数据为任务流测试数据;
基于任务流测试数据获取对应的目标发布包文件数据,并将目标发布包文件数据存储至MongoDB数据库。
7.根据权利要求1所述的一种一站式数据开发方法,其特征在于,在对发布包文件数据进行周期调度的过程中,进行如下步骤:
基于检测到发布包文件数据运行异常,发送告警数据给到对应的管理人员;
基于管理人员的排查操作发送问题信息给用户,其中,问题信息为管理人员排查出那些部分有问题的相关信息;
基于用户的修复操作获取对应的新任务流数据,并将新任务流数据存储至MongoDB数据库;
选取新新任务流数据确定对应的待发布包文件数据,将待发布包文件数据确定为目标发布包文件数据。
8.一种一站式数据开发系统,其特征在于,包括:
任务需求获取模块(1),基于用户写入任务的操作用于获取对应的任务需求数据;
目标任务确定模块(2),将任务需求数据进行加工用于确定对应的目标任务数据;
判断模块(3),用于对目标任务数据进行逻辑判断是否正确;
任务流获取模块(4),若是,依据多个目标任务数据用于获取对应的任务流数据;
目标发布包获取模块(5),对任务流数据进行冒烟测试获用于取对应的目标发布包文件数据;
审核模块(6),基于冒烟测试通过的操作用于对发布包文件数据进行审核;
调度模块(7),基于用户的定时策略用于对发布包文件数据进行周期调度。
9.计算机可读存储介质,存储有能够被处理器加载并执行如权利要求1至7中任一项所述方法的计算机程序。
10.智能终端,包括存储器和处理器,所述存储器上存储有能够被处理器加载并执行如权利要求1至7中任一种方法的计算机程序。
CN202210961919.1A 2022-08-11 2022-08-11 一种一站式数据开发方法、系统 Pending CN115309722A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210961919.1A CN115309722A (zh) 2022-08-11 2022-08-11 一种一站式数据开发方法、系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210961919.1A CN115309722A (zh) 2022-08-11 2022-08-11 一种一站式数据开发方法、系统

Publications (1)

Publication Number Publication Date
CN115309722A true CN115309722A (zh) 2022-11-08

Family

ID=83859941

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210961919.1A Pending CN115309722A (zh) 2022-08-11 2022-08-11 一种一站式数据开发方法、系统

Country Status (1)

Country Link
CN (1) CN115309722A (zh)

Similar Documents

Publication Publication Date Title
CN107665171B (zh) 自动回归测试方法及装置
CN106951369B (zh) 一种联调测试的管理方法及装置
CN111553137B (zh) 报告生成方法、装置、存储介质及计算机设备
CN110716539B (zh) 一种故障诊断分析方法和装置
CN111881037A (zh) 测试用例的管理方法、装置和电子设备
CN111061733A (zh) 数据处理方法、装置、电子设备和计算机可读存储介质
CN115576834A (zh) 支撑故障还原的软件测试复用方法、系统、终端及介质
CN113220588A (zh) 一种数据处理的自动化测试方法、装置、设备及存储介质
US20110289086A1 (en) System, method and apparatus for data analysis
CN110865806A (zh) 代码处理方法、装置、服务器及存储介质
CN113157978B (zh) 数据的标签建立方法和装置
CN114116801A (zh) 数据清单核查方法及装置
CN111858236A (zh) 知识图谱监控方法、装置、计算机设备及存储介质
CN115309722A (zh) 一种一站式数据开发方法、系统
CN112053137B (zh) 流程预测方法、电子设备和服务器集群
CN113791980A (zh) 测试用例的转化分析方法、装置、设备及存储介质
CN113627816A (zh) 一种评估管理方法、装置、电子设备及存储介质
CN112559331A (zh) 测试方法和装置
CN111859985A (zh) Ai客服模型测试方法、装置、电子设备及存储介质
CN113674115B (zh) 一种基于数据治理技术的高校数据管理辅助系统及方法
CN114528452B (zh) 基于烟酒销售的数据标签实现方法及系统
US12072855B2 (en) Methods, systems, and computer readable media for utilizing machine learning for merging duplicate data records
CN112925856B (zh) 实体关系分析方法、装置、分析设备及计算机存储介质
US20220197765A1 (en) System for recommending tests for mobile communication devices maintenance release certification
CN115757151A (zh) 金融领域业务系统的测试方法、装置及服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination