CN109710653A - 一种测试数据源配置方法及装置 - Google Patents

一种测试数据源配置方法及装置 Download PDF

Info

Publication number
CN109710653A
CN109710653A CN201811648108.6A CN201811648108A CN109710653A CN 109710653 A CN109710653 A CN 109710653A CN 201811648108 A CN201811648108 A CN 201811648108A CN 109710653 A CN109710653 A CN 109710653A
Authority
CN
China
Prior art keywords
data
data source
target side
model
metadata
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811648108.6A
Other languages
English (en)
Inventor
贾彦江
赵宏宇
胡渊
陈海林
刘勇进
王晓
高华杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Space Data Ltd By Share Ltd
Original Assignee
Beijing Space Data Ltd By Share Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Space Data Ltd By Share Ltd filed Critical Beijing Space Data Ltd By Share Ltd
Priority to CN201811648108.6A priority Critical patent/CN109710653A/zh
Publication of CN109710653A publication Critical patent/CN109710653A/zh
Pending legal-status Critical Current

Links

Abstract

本申请提供了一种测试数据源配置方法,包括:可视化配置数据源,根据所述数据源对应的元数据映射关系,生成元数据表,根据所述元数据表,将目标端的数据进行组合;根据工业知识库中的目标参数,对工业模型进行初步的参数配置;根据所述组合后的目标端的数据,构建数据模型;将所述数据模型输入到所述工业模型中进行模型训练,根据所述模型训练的准确度和综合效率动态匹配元数据库中的数据源和数据格式。本申请基于工业预测数据源的可视化配置和可视化构建工具,通过对特定场景特定业务功能的数据源进行快速的构建和配置,实现模型的实际测试和功能预测。

Description

一种测试数据源配置方法及装置
技术领域
本申请涉及工业模型领域,具体而言,涉及一种测试数据源配置方法及装置。
背景技术
随着工业互联网的飞速发展,工业领域的知识库和模型库、机理模型、工艺流程等企业的数字化资产在成指数级增长。当前在企业中,主要靠各个孤立的信息化系统去管理这是数字化资产,但是没有统一的体系就统一管理,各个业务系统数据彼此分离,更为关键的是,这些复杂的的数据很难通过一种特定的方式进行组合,也无法形成特定企业模型直接使用的测试数据,更无法形成有效的企业知识和工业经验,为企业提供相应的数据化服务。
在这一领域中,现有技术没有根据工业模型训练的实际需要进行动态匹配合适的数据源和数据类型的技术,如果人工进行数据源和数据类型的修改,工业模型的训练效率往往很低,并且训练的准确性不能得到保障。
发明内容
有鉴于此,本申请的目的在于提供一种测试数据源配置方法及装置,用于解决现有技术中数据源无法进行自适应数据自匹配的问题。可以根据工业模型训练的实际需要和训练结果进行动态匹配更合适的数据源和数据类型,提高了工业模型训练的效率,并且提高了工业模型的算法准确度。
第一方面,本申请实施例提供了一种测试数据源配置方法,该方法包括:
可视化配置数据源,根据所述数据源对应的元数据映射关系,生成元数据表,根据所述元数据表,将目标端的数据进行组合;
根据工业知识库中的目标参数,对工业模型进行初步的参数配置;
根据所述组合后的目标端的数据,构建数据模型;
将所述数据模型输入到所述工业模型中进行模型训练,根据所述模型训练的准确度和综合效率动态匹配元数据库中的数据源和数据格式。
结合第一方面,本申请实施例提供了第一方面的第一种可能的实施方案,其中,所述可视化配置数据源,根据所述数据源对应的元数据映射关系,生成元数据表,根据所述元数据表,将目标端的数据进行组合,包括:当所述数据源为复杂异构数据源时,
将所述复杂异构数据源中的多种数据源根据各自的连接方式和读取方式进行整合,得到复杂异构数据源配置方案;
根据所述复杂异构数据源配置方案,配置所述复杂异构数据源;
根据所述复杂异构数据源中的多种数据源,生成数据源组合体;
将所述数据源组合体和辅助数据源特征结合,生成所述数据源组合体对应的元数据;
根据所述数据源组合体对应的元数据映射关系,生成组合体元数据表;
根据所述组合体元数据表,将目标端的数据进行组合。
结合第一方面,本申请实施例提供了第一方面的第二种可能的实施方案,其中,所述根据所述元数据表,将目标端的数据进行组合之后,包括:
将所述目标端的数据的数据特征参数组同步到工业元数据库中,更新所述工业元数据库中的数据特征参数组。
结合第一方面,本申请实施例提供了第一方面的第三种可能的实施方案,其中,所述将所述数据模型输入到所述工业模型中进行模型训练之后,还包括:当所述数据模型对应的元数据的数据源和数据格式无需进行动态匹配时,
当用户对所述数据源的数据进行修改时,数据源采集所述修改后的数据,并进行数据归档得到归档数据,然后将所述归档数据传送至目标端,目标端对归档数据进行解析,对目标端的数据进行相应的更新;
所述更新完成后,目标端向数据源的管理服务器发送执行结果,所述管理服务器收到执行结果后,确认同步成功后,对归档数据进行清除。
结合第一方面,本申请实施例提供了第一方面的第四种可能的实施方案,所述将所述数据模型输入到所述工业模型中进行模型训练,根据所述模型训练的准确度和综合效率动态匹配元数据库中的数据源和数据格式之后,包括:
将所述模型训练的训练数据加入所述工业知识库,更新工业知识库的训练经验数据。
第二方面,本申请实施例提供了一种测试数据源配置装置,其特征在于,包括:
元数据处理模块,用于可视化配置数据源,根据所述数据源对应的元数据映射关系,生成元数据表,根据所述元数据表,将目标端的数据进行组合;
工业模型初始化模块,用于根据工业知识库中的目标参数,对工业模型进行初步的参数配置;
数据模型模块,用于根据所述组合后的目标端的数据,构建数据模型;
训练模块,用于将所述数据模型输入到所述工业模型中进行模型训练,根据所述模型训练的准确度和综合效率动态匹配元数据库中的数据源和数据格式。
结合第二方面,本申请实施例提供了第二方面的第一种可能的实施方案,其中,所述元数据处理模块,包括:复杂异构数据处理模块,用于当所述数据源为复杂异构数据源时,将所述复杂异构数据源中的多种数据源根据各自的连接方式和读取方式进行整合,得到复杂异构数据源配置方案;
根据所述复杂异构数据源配置方案,配置所述复杂异构数据源;
根据所述复杂异构数据源中的多种数据源,生成数据源组合体;
将所述数据源组合体和辅助数据源特征结合,生成所述数据源组合体对应的元数据;
根据所述数据源组合体对应的元数据映射关系,生成组合体元数据表;
根据所述组合体元数据表,将目标端的数据进行组合。
结合第二方面,本申请实施例提供了第二方面的第二种可能的实施方案,其中,所述训练模块,还包括:数据同步模块,用于当所述数据模型对应的元数据的数据源和数据格式无需进行动态匹配时,当用户对所述数据源的数据进行修改时,数据源采集所述修改后的数据,并进行数据归档得到归档数据,然后将所述归档数据传送至目标端,目标端对归档数据进行解析,对目标端的数据进行相应的更新;
所述更新完成后,目标端向数据源的管理服务器发送执行结果,所述管理服务器收到执行结果后,确认同步成功后,对归档数据进行清除。
第三方面,本申请实施例提供了一种计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述第一方面至第一方面的第四种可能的实施方案中的任一项所述的方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行上述第一方面至第一方面的第四种可能的实施方案中任一项所述的方法的步骤。
本申请实施例提出的一种测试数据源配置方法及装置,通过可视化配置数据源,并根据该数据源对应的元数据的映射关系对目标端的数据进行组合,然后根据组合后的目标端的数据构建数据模型,并放入工业模型中进行训练,在训练的过程中,参考魔性训练的准确度和综合效率动态匹配数据源和数据格式,以完成工业模型训练。本申请实施例所提出的测试数据源配置方法根据工业模型训练的实际需要和训练结果进行动态匹配更合适的数据源和数据类型,提高了工业模型训练的效率,并且提高了工业模型的算法准确度。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种测试数据源配置方法的流程示意图;
图2为本申请实施例提供的又一种测试数据源配置方法的流程示意图;
图3为本申请实施例提供的又一种测试数据源配置方法的流程示意图;
图4为本申请实施例提供的一种测试数据源配置装置的结构示意图;
图5为本申请实施例提供的又一种测试数据源配置装置的结构示意图;
图6为本申请实施例提供的又一种测试数据源配置装置的结构示意图;
图7为本申请实施例提供的又一种测试数据源配置装置的结构示意图;
图8为本申请实施例提供的又一种测试数据源配置装置的结构示意图;
图9为本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供了一种测试数据源配置方法,如图1所示,包括以下步骤S100-S103:
S100,可视化配置数据源,根据上述数据源对应的元数据映射关系,生成元数据表,根据上述元数据表,将目标端的数据进行组合。
其中,元数据内包含数据源、连接属性、目标数据、数据特征等。
具体地,在工业模型管理后台通过拖拽的方式,配置数据源,根据元数据的映射关系,将该数据源对应的元数据进行映射,将映射结果整理后得到元数据表,在目标端需要将元数据对应的目标端的数据进行组合和配置的时候,可通过上述元数据表进行快速灵活的映射。
其中,在配置数据源时,如果数据源为某一信息系统、知识库或FTP 服务器等,那么就要配置相应的连接属性,如URL地址等,来建立源端到目标端的数据连接。
S101,根据工业知识库中的目标参数,对工业模型进行初步的参数配置。
具体地,工业知识库中存储了训练参数,在模型训练前会根据目标参数对工业模型进行初步的配置。
S102,根据上述组合后的目标端的数据,构建数据模型。
具体地,经过映射组合后得到的目标端的数据,根据工业模型的对数据的要求构建相应的数据模型。
S103,将上述数据模型输入到上述工业模型中进行模型训练,根据上述模型训练的准确度和综合效率动态匹配元数据库中的数据源和数据格式。
具体地,将上述构建好的数据模型放入工业模型中开始训练,训练过程中,在用户不了解该工业模型对应的数据模型的数据特征时,根据上述工业知识库配置的标准,不断得出的模型准确度和综合效率,并根据该准确度和综合效率自适应数据自匹配更适合数据源,以提高准确度和综合效率,直到模型训练结果达到目标要求的准确度和综合效率。
在一可选的实施例中,上述步骤S100:可视化配置数据源,根据上述数据源对应的元数据映射关系,生成元数据表,根据上述元数据表,将目标端的数据进行组合,包括:当上述数据源为复杂异构数据源时,将上述复杂异构数据源中的多种数据源根据各自的连接方式和读取方式进行整合,得到复杂异构数据源配置方案。
具体地,在上述数据源由多种不同数据特征的数据源组合而成的时候,需要先获取每一种数据源对应的处理方法,即连接方式和读取方式。并将所有的处理方法整合成一种针对该数据源的配置方案。
根据上述复杂异构数据源配置方案,配置上述复杂异构数据源。
具体地,根据上述配置方案对数据源进行相应的连接属性的配置。
根据上述复杂异构数据源中的多种数据源,生成数据源组合体。
具体地,将上述复杂异构数据源中的多种数据源通过元数据映射的方式映射成同种数据源,然后再合并成数据源组合体。
将上述数据源组合体和辅助数据源特征结合,生成所述数据源组合体对应的元数据。
具体地,将数据源组合体和辅助数据源特征进行结合后,生成数据源组合体的元数据。
根据所述数据源组合体对应的元数据映射关系,生成组合体元数据表。
具体地,针对上述数据源组合体的元数据进行映射,将结果整理成组合体元数据表。
根据所述组合体元数据表,将目标端的数据进行组合。
具体地,在目标端需要将上述数据源组合体对应的元数据对应的目标端的数据进行组合和配置的时候,可通过上述元数据表进行快速灵活的映射。
在一可选的实施例中,如图2所示,所述根据所述元数据表,将目标端的数据进行组合之后,包括步骤S104:
S104,将上述目标端的数据的数据特征参数组同步到工业元数据库中,更新上述工业元数据库中的数据特征参数组。
具体地,工业元数据库需要不断获取新的元数据的特征参数来更新和完善工业元数据库中的数据特征参数组,也可说成经验参数,并且用户可以通过系统在工业元数据库中对元数据进行增加、删除、修改、查询等业务操作,以此来扩充和完善工业元数据库,实现工业元数据的基本管理。
在一可选的实施例中,上述步骤S103将上述数据模型输入到上述工业模型中进行模型训练之后,还包括:当上述数据模型对应的元数据的数据源和数据格式无需进行动态匹配时,
当用户对上述数据源的数据进行修改时,数据源采集上述修改后的数据,并进行数据归档得到归档数据,然后将上述归档数据传送至目标端,目标端对归档数据进行解析,对目标端的数据进行相应的更新。
具体地,当用户了解该工业模型对应的数据模型的数据特征,用户选择自行调整数据源而非自适应数据自匹配数据源时,系统开启数据源的同步管理服务,包括数据自动采集服务、数据自动归档服务和数据自动传送服务,通过数据自动采集服务对修改后的数据源中的数据变化进行采集,然后通过数据自动归档服务,对采集到的数据变化进行归档数据缓存备份,然后将归档数据传送给目标端,目标端自动解析归档数据,对目标端的数据进行更新状态还原。
上述更新完成后,目标端向数据源的管理服务器发送执行结果,上述管理服务器收到执行结果后,确认同步成功后,对归档数据进行清除。
具体地,当目标端的数据的更新状态还原结束后,目标端生成执行结果,发送给数据源的管理服务器,该管理服务器对该执行结果进行信息确认,如果确认同步完成,则删除归档数据的缓存备份。
这是由于缓存备份数据累计多了会占用本地的存储空间,尤其是系统的存储,长时间的数据库积累会增加系统开销,影响系统性能,因此确认同步成功或超过暂存时间后就会自动清除;也可以通过设置,永久保留归档数据,但是系统不推荐这样做。
在一可选的实施例中,如图3所示,上述步骤S103将上述数据模型输入到上述工业模型中进行模型训练,根据上述模型训练的准确度和综合效率动态匹配元数据库中的数据源和数据格式之后,包括步骤S105:
S105,将上述模型训练的训练数据加入上述工业知识库,更新工业知识库的训练经验数据。
具体地,在工业模型训练完成后,将工业模型训练过程中的训练数据传送到工业知识库中该工业模型的知识库中,丰富优化该工业模型的知识库,在下次使用该工业模型进行训练之前,就可使用更新优化过的数据来进行配置该工业模型的训练参数,以及一些需要定义的数值的预设,例如:准确度用什么数据来表示以及达到多少数值合格,模型的综合效率用什么数据来表示以及达到多少数值合格等。
也可通过系统对工业知识库进行可视化的管理,包括知识库中数据的可视化处理等。
本申请实施例提供了一种测试数据源配置装置,如图4所示,包括:
元数据处理模块40,用于可视化配置数据源,根据上述数据源对应的元数据映射关系,生成元数据表,根据上述元数据表,将目标端的数据进行组合。
其中,元数据内包含数据源、连接属性、目标数据、数据特征等。
具体地,在工业模型管理后台通过拖拽的方式,配置数据源,根据元数据的映射关系,将该数据源对应的元数据进行映射,将映射结果整理后得到元数据表,在目标端需要将元数据对应的目标端的数据进行组合和配置的时候,可通过上述元数据表进行快速灵活的映射。
其中,在配置数据源时,如果数据源为某一信息系统、知识库或FTP 服务器等,那么就要配置相应的连接属性,如URL地址等,来建立源端到目标端的数据连接。
工业模型初始化模块41,用于根据工业知识库中的目标参数,对工业模型进行初步的参数配置。
具体地,工业知识库中存储了训练参数,在模型训练前会根据目标参数对工业模型进行初步的配置。
数据模型模块42,用于根据上述组合后的目标端的数据,构建数据模型。
具体地,经过映射组合后得到的目标端的数据,根据工业模型的对数据的要求构建相应的数据模型。
训练模块43,用于将上述数据模型输入到上述工业模型中进行模型训练,根据上述模型训练的准确度和综合效率动态匹配元数据库中的数据源和数据格式。
具体地,将上述构建好的数据模型放入工业模型中开始训练,训练过程中,在用户不了解该工业模型对应的数据模型的数据特征时,根据上述工业知识库配置的标准,不断得出的模型准确度和综合效率,并根据该准确度和综合效率自适应数据自匹配更适合数据源,以提高准确度和综合效率,直到模型训练结果达到目标要求的准确度和综合效率。
在一可选的实施例中,如图5所示,上述元数据处理模块40,包括:复杂异构数据处理模块401,用于当上述数据源为复杂异构数据源时,将上述复杂异构数据源中的多种数据源根据各自的连接方式和读取方式进行整合,得到复杂异构数据源配置方案;
根据上述复杂异构数据源配置方案,配置上述复杂异构数据源;
根据上述复杂异构数据源中的多种数据源,生成数据源组合体;
将上述数据源组合体和辅助数据源特征结合,生成上述数据源组合体对应的元数据;
根据上述数据源组合体对应的元数据映射关系,生成组合体元数据表;
根据上述组合体元数据表,将目标端的数据进行组合。
在一可选的实施例中,如图6所示,所述上述装置还包括:工业元数据库模块402,用于将上述目标端的数据的数据特征参数组同步到工业元数据库中,更新上述工业元数据库中的数据特征参数组。
具体地,工业元数据库需要不断获取新的元数据的特征参数来更新和完善工业元数据库中的数据特征参数组,也可说成经验参数,并且用户可以通过系统在工业元数据库中对元数据进行增加、删除、修改、查询等业务操作,以此来扩充和完善工业元数据库,实现工业元数据的基本管理。
在一可选的实施例中,如图7所示,上述训练模块43,包括:数据同步模块431,用于当上述数据模型对应的元数据的数据源和数据格式无需进行动态匹配时,当用户对上述数据源的数据进行修改时,数据源采集上述修改后的数据,并进行数据归档得到归档数据,然后将上述归档数据传送至目标端,目标端对归档数据进行解析,对目标端的数据进行相应的更新;
上述更新完成后,目标端向数据源的管理服务器发送执行结果,上述管理服务器收到执行结果后,确认同步成功后,对归档数据进行清除。
在一可选的实施例中,如图8所示,上述训练模块43,还包括:工业知识库模块432,用于将所述模型训练的训练数据加入所述工业知识库,更新工业知识库的训练经验数据。
具体地,在工业模型训练完成后,将工业模型训练过程中的训练数据传送到工业知识库中该工业模型的知识库中,丰富优化该工业模型的知识库,在下次使用该工业模型进行训练之前,就可使用更新优化过的数据来进行配置该工业模型的训练参数,以及一些需要定义的数值的预设,例如:准确度用什么数据来表示以及达到多少数值合格,模型的综合效率用什么数据来表示以及达到多少数值合格等。
也可通过系统对工业知识库进行可视化的管理,包括知识库中数据的可视化处理等。
对应于图1中的测试数据源配置方法,本申请实施例还提供了一种计算机设备500,如图9所示,该设备包括存储器501、处理器502及存储在该存储器501上并可在该处理器502上运行的计算机程序,其中,上述处理器502执行上述计算机程序时实现上述测试数据源配置方法。
具体地,上述存储器501和处理器502能够为通用的存储器和处理器,这里不做具体限定,当处理器502运行存储器501存储的计算机程序时,能够执行上述测试数据源配置方法,解决了现有技术数据源无法进行自适应数据自匹配的问题。
对应于图1中的测试数据源配置方法,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述测试数据源配置方法的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述测试数据源配置方法,解决了现有技术中数据源无法进行自适应数据自匹配的问题本申请实施例提出的一种测试数据源配置方法及装置,通过可视化配置数据源,并根据该数据源对应的元数据的映射关系对目标端的数据进行组合,然后根据组合后的目标端的数据构建数据模型,并放入工业模型中进行训练,在训练的过程中,参考魔性训练的准确度和综合效率动态匹配数据源和数据格式,以完成工业模型训练。本申请实施例所提出的测试数据源配置方法根据工业模型训练的实际需要和训练结果进行动态匹配更合适的数据源和数据类型,提高了工业模型训练的效率,并且提高了工业模型的算法准确度。
在本申请所提供的实施例中,应该理解到,所揭露方法和装置,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种测试数据源配置方法,其特征在于,包括:
可视化配置数据源,根据所述数据源对应的元数据映射关系,生成元数据表,根据所述元数据表,将目标端的数据进行组合;
根据工业知识库中的目标参数,对工业模型进行初步的参数配置;
根据所述组合后的目标端的数据,构建数据模型;
将所述数据模型输入到所述工业模型中进行模型训练,根据所述模型训练的准确度和综合效率动态匹配元数据库中的数据源和数据格式。
2.根据权利要求1所述的方法,其特征在于,所述可视化配置数据源,根据所述数据源对应的元数据映射关系,生成元数据表,根据所述元数据表,将目标端的数据进行组合,包括:当所述数据源为复杂异构数据源时,
将所述复杂异构数据源中的多种数据源根据各自的连接方式和读取方式进行组合,得到复杂异构数据源配置方案;
根据所述复杂异构数据源配置方案,配置所述复杂异构数据源;
根据所述复杂异构数据源中的多种数据源,生成数据源组合体;
将所述数据源组合体和辅助数据源特征进行结合,生成所述数据源组合体对应的元数据;
根据所述数据源组合体对应的元数据映射关系,生成组合体元数据表;
根据所述组合体元数据表,将目标端的数据进行组合。
3.根据权利要求1所述的方法,其特征在于,所述根据所述元数据表,将目标端的数据进行组合之后,包括:
将所述目标端的数据的数据特征参数组同步到工业元数据库中,更新所述工业元数据库中的数据特征参数组。
4.根据权利要求1所述的方法,其特征在于,所述将所述数据模型输入到所述工业模型中进行模型训练之后,还包括:当所述数据模型对应的元数据的数据源和数据格式无需进行动态匹配时,
当用户对所述数据源的数据进行修改时,数据源采集所述修改后的数据,并进行数据归档得到归档数据,然后将所述归档数据传送至目标端,目标端对归档数据进行解析,对目标端的数据进行相应的更新;
所述更新完成后,目标端向数据源的管理服务器发送执行结果,所述管理服务器收到执行结果后,确认同步成功后,对归档数据进行清除。
5.根据权利要求1所述的方法,其特征在于,所述将所述数据模型输入到所述工业模型中进行模型训练,根据所述模型训练的准确度和综合效率动态匹配元数据库中的数据源和数据格式之后,包括:
将所述模型训练的训练数据加入所述工业知识库,更新工业知识库的训练经验数据。
6.一种测试数据源配置装置,其特征在于,包括:
元数据处理模块,用于可视化配置数据源,根据所述数据源对应的元数据映射关系,生成元数据表,根据所述元数据表,将目标端的数据进行组合;
工业模型初始化模块,用于根据工业知识库中的目标参数,对工业模型进行初步的参数配置;
数据模型模块,用于根据所述组合后的目标端的数据,构建数据模型;
训练模块,用于将所述数据模型输入到所述工业模型中进行模型训练,根据所述模型训练的准确度和综合效率动态匹配元数据库中的数据源和数据格式。
7.根据权利要求6所述的装置,其特征在于,所述元数据处理模块,包括:复杂异构数据处理模块,用于当所述数据源为复杂异构数据源时,将所述复杂异构数据源中的多种数据源根据各自的连接方式和读取方式进行整合,得到复杂异构数据源配置方案;
根据所述复杂异构数据源配置方案,配置所述复杂异构数据源;
根据所述复杂异构数据源中的多种数据源,生成数据源组合体;
将所述数据源组合体和辅助数据源特征结合,生成所述数据源组合体对应的元数据;
根据所述数据源组合体对应的元数据映射关系,生成组合体元数据表;
根据所述组合体元数据表,将目标端的数据进行组合。
8.根据权利要求6所述的装置,其特征在于,所述训练模块,包括:数据同步模块,用于当所述数据模型对应的元数据的数据源和数据格式无需进行动态匹配时,当用户对所述数据源的数据进行修改时,数据源采集所述修改后的数据,并进行数据归档得到归档数据,然后将所述归档数据传送至目标端,目标端对归档数据进行解析,对目标端的数据进行相应的更新;
所述更新完成后,目标端向数据源的管理服务器发送执行结果,所述管理服务器收到执行结果后,确认同步成功后,对归档数据进行清除。
9.一种计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1-5中任一项所述的方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行上述权利要求1-5中任一项所述的方法的步骤。
CN201811648108.6A 2018-12-29 2018-12-29 一种测试数据源配置方法及装置 Pending CN109710653A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811648108.6A CN109710653A (zh) 2018-12-29 2018-12-29 一种测试数据源配置方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811648108.6A CN109710653A (zh) 2018-12-29 2018-12-29 一种测试数据源配置方法及装置

Publications (1)

Publication Number Publication Date
CN109710653A true CN109710653A (zh) 2019-05-03

Family

ID=66260361

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811648108.6A Pending CN109710653A (zh) 2018-12-29 2018-12-29 一种测试数据源配置方法及装置

Country Status (1)

Country Link
CN (1) CN109710653A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110471902A (zh) * 2019-07-18 2019-11-19 北京信远通科技有限公司 基于元数据模型进行合标的数据处理方法及装置
CN113923256A (zh) * 2020-06-22 2022-01-11 北京金山云网络技术有限公司 一种数据源管理方法、装置、服务器及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104166704A (zh) * 2014-08-05 2014-11-26 华为技术有限公司 一种屏蔽异构数据源的方法及装置
CN104200402A (zh) * 2014-09-11 2014-12-10 国家电网公司 一种电网多个数据源的源数据发布方法及系统
CN106547915A (zh) * 2016-11-29 2017-03-29 上海轻维软件有限公司 基于模型库的智能数据提取方法
CN107391175A (zh) * 2017-06-20 2017-11-24 福建天泉教育科技有限公司 控件数据配置方法及计算机可读存储介质
CN107844482A (zh) * 2016-09-17 2018-03-27 复旦大学 基于全局本体的多数据源模式匹配方法
WO2018170866A1 (zh) * 2017-03-24 2018-09-27 深圳中兴力维技术有限公司 数据采集方法和装置
CN108846567A (zh) * 2018-06-04 2018-11-20 广东京信软件科技有限公司 基于大数据多因素关联的企业上下规监管分析方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104166704A (zh) * 2014-08-05 2014-11-26 华为技术有限公司 一种屏蔽异构数据源的方法及装置
CN104200402A (zh) * 2014-09-11 2014-12-10 国家电网公司 一种电网多个数据源的源数据发布方法及系统
CN107844482A (zh) * 2016-09-17 2018-03-27 复旦大学 基于全局本体的多数据源模式匹配方法
CN106547915A (zh) * 2016-11-29 2017-03-29 上海轻维软件有限公司 基于模型库的智能数据提取方法
WO2018170866A1 (zh) * 2017-03-24 2018-09-27 深圳中兴力维技术有限公司 数据采集方法和装置
CN107391175A (zh) * 2017-06-20 2017-11-24 福建天泉教育科技有限公司 控件数据配置方法及计算机可读存储介质
CN108846567A (zh) * 2018-06-04 2018-11-20 广东京信软件科技有限公司 基于大数据多因素关联的企业上下规监管分析方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王元光: "模型驱动的数据可视化平台的设计与实现", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110471902A (zh) * 2019-07-18 2019-11-19 北京信远通科技有限公司 基于元数据模型进行合标的数据处理方法及装置
CN110471902B (zh) * 2019-07-18 2022-12-16 北京信远通科技有限公司 基于元数据模型进行合标的数据处理方法及装置
CN113923256A (zh) * 2020-06-22 2022-01-11 北京金山云网络技术有限公司 一种数据源管理方法、装置、服务器及系统
CN113923256B (zh) * 2020-06-22 2024-05-03 北京金山云网络技术有限公司 一种数据源管理方法、装置、服务器及系统

Similar Documents

Publication Publication Date Title
CN103678494B (zh) 客户端同步服务端数据的方法及装置
CN105373448A (zh) 数据库中故障数据的恢复方法和系统
CN105843895A (zh) 基于Ehcache的数据查询及同步方法,装置及系统
CN106445480B (zh) 命令行界面显示方法及装置
CN104881454A (zh) 参数的更新方法及系统
CN109710653A (zh) 一种测试数据源配置方法及装置
CN105491078A (zh) Soa系统中的数据处理方法及装置、soa系统
CN108363684A (zh) 表单创建方法、装置及服务器
CN106970993A (zh) 挖掘模型更新方法和装置
CN104317957A (zh) 一种报表处理的开放平台、系统及报表处理方法
CN106777368A (zh) 数据库查询语言适配方法及装置、分布式数据存储系统
CN110083504B (zh) 分布式任务的运行状态监控方法及装置
CN109191078A (zh) 一种流程业务建模方法、装置及设备
CN106201461A (zh) 一种界面的生成方法、系统及后台服务器
CN105227441A (zh) 云端服务器、联系人身份确定方法和系统
CN105511914A (zh) 应用更新方法、装置和系统
CN105302889B (zh) 数据存储结构的转换方法及装置
US20220224591A1 (en) Network management apparatus, method, and program
WO2017062984A1 (en) Continual learning in slowly-varying environments
CN112989364A (zh) 用于数据仿真的方法、设备和计算机程序产品
CN110362540A (zh) 一种数据存储、访客数获取方法及装置
CN107018038A (zh) 监控数据查询方法及服务器
CN104951550B (zh) 数据存储方法及装置
CN114417980A (zh) 一种业务模型的建立方法、装置、电子设备及存储介质
CN106528750A (zh) 数据提取方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190503