CN115544858A - 基于多源异构的数据挖掘建模方法及系统 - Google Patents

基于多源异构的数据挖掘建模方法及系统 Download PDF

Info

Publication number
CN115544858A
CN115544858A CN202211001299.3A CN202211001299A CN115544858A CN 115544858 A CN115544858 A CN 115544858A CN 202211001299 A CN202211001299 A CN 202211001299A CN 115544858 A CN115544858 A CN 115544858A
Authority
CN
China
Prior art keywords
algorithm
machine learning
components
learning model
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211001299.3A
Other languages
English (en)
Inventor
贾皓立
陈庆国
梁凯鹏
粟文
程吉辉
何一鸣
宋萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yinfeng Xinrong Technology Development Co ltd
Original Assignee
Beijing Yinfeng Xinrong Technology Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yinfeng Xinrong Technology Development Co ltd filed Critical Beijing Yinfeng Xinrong Technology Development Co ltd
Priority to CN202211001299.3A priority Critical patent/CN115544858A/zh
Publication of CN115544858A publication Critical patent/CN115544858A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • G06F16/275Synchronous replication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0483Interaction with page-structured environments, e.g. book metaphor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/0486Drag-and-drop
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Fuzzy Systems (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开涉及一种基于多源异构的数据挖掘建模方法及系统。本公开通过获取机器学习的相关算法,将所述机器学习的相关算法封装为多个算法组件,响应于用户对所述多个算法组件的第一操作,通过所述多个算法组件构建机器学习模型。由于将算法组件化,用户或者业务人员可以按需装配不同的组件,可以让机器学习模型的构建更加灵活,效率更加高效,也提高了算法的重用性。用户可以利用可视化的页面,使用拖拽的方式拖动组件,配置机器学习模型,使操作更加简单,用户只需要了解算法组件的基本功能,而不需要了解机器学习模型的技术细节,降低了用户的学习成本和构建机器学习模型的难度,从而降低了构建机器学习模型的开发门槛与成本。

Description

基于多源异构的数据挖掘建模方法及系统
技术领域
本公开涉及计算机技术领域,尤其涉及一种基于多源异构的数据挖掘建模方法及系统。
背景技术
随着计算机技术的发展,当我们对数据进行挖掘分析时,机器学习算法的使用越来越多,适用的场景也更广。其中,利用机器学习建模是一种常用的对数据进行挖掘分析的方法。
机器学习是一个入门门槛相对比较高的技术领域,大部分的工程技术人员和业务人员都聚焦在业务领域的特征提取、算法选择、参数调优和模型验证。
但是,机器学习建模过程复杂,不仅需要深入理解算法原理,而且需要对业务深入研究,导致传统的数据分析师无法快速胜任。并且在建模人员完成模型训练后,仍需要工程化团队协助完成模型的部署,导致建模整体成本高。
发明内容
为了解决上述技术问题,本公开提供了一种基于多源异构的数据挖掘建模方法及系统,以简化机器学习模型构建的操作,降低机器学习模型构建的成本。
第一方面,本公开实施例提供一种基于多源异构的数据挖掘建模方法,包括:
获取机器学习的相关算法;
将所述机器学习的相关算法封装为多个算法组件;
响应于用户对所述多个算法组件的第一操作,通过所述多个算法组件构建机器学习模型。
第二方面,本公开实施例提供一种基于多源异构的数据挖掘建模装置,包括:
第一获取模块,用于获取机器学习的相关算法;
封装模块,用于将所述机器学习的相关算法封装为多个算法组件;
构建模块,用于响应于用户对所述多个算法组件的第一操作,通过所述多个算法组件构建机器学习模型。
第三方面,本公开实施例提供一种电子设备,包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如第一方面所述的方法。
第四方面,本公开实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现第一方面所述的方法。
第五方面,本公开实施例提供了一种基于多源异构的数据挖掘建模系统,该系统包括至少一个计算装置和至少一个存储指令的存储装置,其中,所述指令在被所述至少一个计算装置运行时,促使所述至少一个计算装置执行如第一方面所述的方法。
第六方面,本公开实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机程序或指令,该计算机程序或指令被处理器执行时实现如上所述的基于多源异构的数据挖掘建模方法。
本公开实施例提供的基于多源异构的数据挖掘建模方法及系统,通过对所述机器学习的相关算法进行解耦处理,将处理后的算法封装为多个算法组件,所述多个算法组件包括如下至少一种:统计分析组件、分类组件、回归组件、聚类组件。将算法组件化操作,可以让机器学习模型的构建更加灵活,效率更加高效,也提高了算法的重复使用性。用户在构建机器学习模型时,只需要了解算法组件的基本功能,而不需要了解系统的技术细节,降低了用户的学习成本和构建机器学习模型的难度,从而降低了构建机器学习模型的开发门槛,简化了业务人员的操作,提高了工作效率,进而降低机器学习模型构建的成本。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例提供的基于多源异构的数据挖掘建模方法流程图;
图2为本公开实施例提供的一种应用场景的示意图;
图3为本公开实施例提供的一种用户界面的示意图;
图4为本公开实施例提供的一种用户界面的示意图;
图5为本公开另一实施例提供的基于多源异构的数据挖掘建模方法流程图;
图6为本公开实施例提供的基于多源异构的数据挖掘建模装置的结构示意图;
图7为本公开实施例提供的电子设备的结构示意图。
具体实施方式
为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。基于所描述的本发明的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
随着计算机技术的发展,当我们对数据进行挖掘分析时,机器学习算法的使用越来越多,适用的场景也更广。其中,利用机器学习建模是一种常用的对数据进行挖掘分析的方法。
机器学习是一个入门门槛相对比较高的技术领域,大部分的工程技术人员和业务人员都聚焦在业务领域的特征提取、算法选择、参数调优和模型验证。
但是,机器学习建模过程复杂,不仅需要深入理解算法原理,而且需要对业务深入研究,导致传统的数据分析师无法快速胜任。并且在建模人员完成模型训练后,仍需要工程化团队协助完成模型的部署,导致建模整体成本高。针对该问题,本公开实施例提供了一种基于多源异构的数据挖掘建模方法,下面结合具体的实施例对该方法进行介绍。
图1为本公开实施例提供的基于多源异构的数据挖掘建模方法流程图。该方法可以应用于图2所示的应用场景,该应用场景中包括服务器21和终端22,终端22具体可以是终端,例如,智能手机、掌上电脑、平板电脑、带显示屏的可穿戴设备、台式机、笔记本电脑、一体机、智能家居设备等。可以理解的是,本公开实施例提供的基于多源异构的数据挖掘建模方法还可以应用在其他场景中。
下面结合图2所示的应用场景,对图1所示的基于多源异构的数据挖掘建模方法进行介绍,该方法包括的具体步骤如下:
S101、获取机器学习的相关算法。
如图2所示的终端22从服务器21获取机器学习的相关算法,机器学习的相关算法可以是用户将写好的机器学习算法保存在服务器中的,也可以是通过浏览器查找到的机器学习算法。
S102、将所述机器学习的相关算法封装为多个算法组件。
可选的,终端可以依据算法各部分的功能不同,将复杂的算法拆分成多个算法,然后封装为多个算法组件,例如,将一个复杂算法的分类部分封装为分类组件、统计分析部分封装为统计分析组件等。如此,用户可以根据需要选择合适的算法组件,业务人员也可以按需装配不同的组件,可以让机器学习模型的构建更加灵活,效率更加高效,也提高了算法的重用性。
可选的,每一个功能类别的算法组件下包含若干个组件,其中,这若干个组件的划分依据是采用的方法不同,或者适用的条件不同等。例如分类组件中包含了多个不同的组件,依据采用的分类方法不同可以包含朴素贝叶斯、最近邻分类等。类似的,其他类别的组件也包含了多个组件,在此不做限定。
可选的,用户可以添加算法组件,增强了机器学习模型的可扩展性。算法组件提供了默认参数值,减少了用户配置的操作。
S103、响应于用户对所述多个算法组件的第一操作,通过所述多个算法组件构建机器学习模型。
具体的,用户打开浏览器,输入网址,终端响应于用户输入网址的操作,显示机器学习模型构建的页面,如图3所示,机器学习模型构建的页面有多个类别的算法组件,用户可以使用拖拽的方式拖动组件,配置机器学习模型,响应于用户对所述多个算法组件的拖拽的第一操作,终端将用户所拖拽的算法组件的底层算法代码载入到如图3所示的建模过程的区域,继而通过所述多个算法组件构建机器学习模型。在本步骤中,用户可以利用可视化的页面,使用拖拽的方式拖动组件,配置机器学习模型,使操作更加简单,用户只需要了解算法组件的基本功能,而不需要了解机器学习模型的技术细节,降低了构建机器学习模型的难度。
可选的,操作方式不限于可以是单击、双击,还可以是拖拽、滑动、触碰等等。
本公开实施例通过获取机器学习的相关算法,将所述机器学习的相关算法封装为多个算法组件,响应于用户对所述多个算法组件的第一操作,通过所述多个算法组件构建机器学习模型。由于将算法组件化,用户可以根据需要选择合适的算法组件,业务人员也可以按需装配不同的组件,可以让机器学习模型的构建更加灵活,效率更加高效,也提高了算法的重用性。用户可以利用可视化的页面,使用拖拽的方式拖动组件,配置机器学习模型,使操作更加简单,用户只需要了解算法组件的基本功能,而不需要了解机器学习模型的技术细节,降低了用户的学习成本和构建机器学习模型的难度,从而降低了构建机器学习模型的开发门槛。
在上述实施例的基础上,所述将所述机器学习的相关算法封装为多个算法组件,包括:对所述机器学习的相关算法进行解耦处理,将处理后的算法封装为多个算法组件。
具体的,解耦处理就是通过校正输出、输入之间的关系,减弱甚至消除这种相互关联,从而使系统变成多个单输入单输出系统的算法。在本步骤中,终端对获取到的机器学习的相关算法进行解耦处理,使其变为单输入单输出的算法,然后将处理后的算法封装为多个算法组件,将算法组件化,用户可以根据需要选择合适的算法组件,业务人员也可以按需装配不同的组件,可以让机器学习模型的构建更加灵活,效率更加高效,也提高了算法的重用性。
可选的,所述多个算法组件包括如下至少一种:统计分析组件、分类组件、回归组件、聚类组件。
终端可以依据算法各部分的功能不同,将复杂的算法拆分成多个算法,然后封装为多个算法组件。也可以依据算法的适用范围进行拆分。具体的,多个算法组件可以包括分类组件、统计分析组件、回归组件、聚类组件,也可以包括时序组件、数据处理组件等。
本公开实施例通过对所述机器学习的相关算法进行解耦处理,将处理后的算法封装为多个算法组件,所述多个算法组件包括如下至少一种:统计分析组件、分类组件、回归组件、聚类组件。将算法组件化操作,可以让机器学习模型的构建更加灵活,效率更加高效,也提高了算法的重复使用性。用户在构建机器学习模型时,只需要了解算法组件的基本功能,而不需要了解系统的技术细节,降低了用户的学习成本和构建机器学习模型的难度,从而降低了构建机器学习模型的开发门槛,简化了业务人员的操作,提高了工作效率,进而降低机器学习模型构建的成本。
图5为本公开另一实施例提供的基于多源异构的数据挖掘建模方法流程图,如图5所示,该方法包括如下几个步骤:
S501、获取机器学习的相关算法。
具体的,S501和S101的实现过程和原理一致,此处不再赘述。
S502、将所述机器学习的相关算法封装为多个算法组件。
具体的,S502和S102的实现过程和原理一致,此处不再赘述。
S503、响应于用户对目标数据源的第二操作,从目标数据源获取基础数据。
终端可以采用多种数据源进行数据的同步,可以将目标数据源数据同步到机器学习模型的数据中,可以配置不同的数据源进行操作,方便进行数据的后续操作。如图4所示,用户可以从A、B、C等多种数据源抽取数据,简单快捷。例如,用户的目标数据源为A数据源,用户只需对A数据源进行点击,终端响应于用户的A数据源点击的第二操作,从A数据源获取基础数据。
可选的,操作方式不限于可以是单击、双击,还可以是拖拽、滑动、触碰等等。
S504、将所述基础数据同步到机器学习模型的数据中,得到所述机器学习模型的原始数据。
在终端获取基础数据之后,会将基础数据同步到如图4所示的建模过程区域即机器学习模型的数据中,得到机器学习模型的原始数据。
可选的,可以使用数据同步组件进行数据同步,兼容多种数据源之间的同步。
S505、响应于用户对所述多个算法组件的第一操作,在所述机器学习模型的原始数据的基础上加载所述多个算法组件,对所述机器学习模型进行构建。
如图3所示,机器学习模型构建的页面有多个类别的算法组件,用户可以使用拖拽的方式拖动组件,配置机器学习模型,响应于用户对所述多个算法组件的拖拽的第一操作,终端将用户所拖拽的算法组件的底层算法代码载入到如图3所示的建模过程的区域,继而在原始数据的基础上通过所述多个算法组件构建机器学习模型。在本步骤中,用户可以利用可视化的页面,使用拖拽的方式拖动组件,配置机器学习模型,使操作更加简单,用户只需要了解算法组件的基本功能,而不需要了解机器学习模型的技术细节,降低了构建机器学习模型的难度。
S506、生成所述机器学习模型的评估报告。
在构建机器学习模型之后,终端会生成模型评估和模型预测的评估报告,可以对业务提供有力的数据支撑和图表展示。
本公开实施例通过获取机器学习的相关算法,将所述机器学习的相关算法封装为多个算法组件,响应于用户对目标数据源的第二操作,从目标数据源获取基础数据,将所述基础数据同步到机器学习模型的数据中,得到所述机器学习模型的原始数据。进一步,响应于用户对所述多个算法组件的第一操作,在所述机器学习模型的原始数据的基础上加载所述多个算法组件,对所述机器学习模型进行构建,生成所述机器学习模型的评估报告。由于将算法组件化,用户可以根据需要选择合适的算法组件,业务人员也可以按需装配不同的组件,可以让机器学习模型的构建更加灵活,效率更加高效,也提高了算法的重用性。并且可以采用多种数据源进行数据的同步,配置不同的数据源进行操作,可以将目标数据源数据同步到机器学习模型的数据中,方便进行数据的后续操作,生成了模型评估和模型预测的评估报告,可以对业务提供有力的数据支撑和图表展示,更加直观清晰。
图6为本公开实施例提供的基于多源异构的数据挖掘建模装置的结构示意图。该基于多源异构的数据挖掘建模装置可以是如上实施例所述的终端,或者该基于多源异构的数据挖掘建模装置可以该终端中的部件或组件。本公开实施例提供的基于多源异构的数据挖掘建模装置可以执行基于多源异构的数据挖掘建模方法实施例提供的处理流程,如图6所示,基于多源异构的数据挖掘建模装置60包括:第一获取模块61、封装模块62、构建模块63;其中,第一获取模块61用于获取机器学习的相关算法;封装模块62用于将所述机器学习的相关算法封装为多个算法组件;构建模块63用于响应于用户对所述多个算法组件的第一操作,通过所述多个算法组件构建机器学习模型。
可选的,所述封装模块62将所述机器学习的相关算法封装为多个算法组件时,具体用于:对所述机器学习的相关算法进行解耦处理,将处理后的算法封装为多个算法组件。
可选的,所述多个算法组件包括如下至少一种:统计分析组件、分类组件、回归组件、聚类组件。
可选的,基于多源异构的数据挖掘建模装置60还包括:第二获取模块64和/或同步模块65;其中,第二获取模块64用于响应于用户对目标数据源的第二操作,从目标数据源获取基础数据;同步模块65用于将所述基础数据同步到机器学习模型的数据中,得到所述机器学习模型的原始数据。相应地,所述构建模块63在响应于用户对所述多个算法组件的第一操作,通过所述多个算法组件构建机器学习模型时,具体用于:响应于用户对所述多个算法组件的第一操作,在所述机器学习模型的原始数据的基础上加载所述多个算法组件,对所述机器学习模型进行构建。
可选的,所述装置60还包括:生成模块66;生成模块66用于生成所述机器学习模型的评估报告。
图6所示实施例的基于多源异构的数据挖掘建模装置可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图7为本公开实施例提供的电子设备的结构示意图。该电子设备可以是如上实施例所述的终端。本公开实施例提供的电子设备可以执行基于多源异构的数据挖掘建模方法实施例提供的处理流程,如图7所示,电子设备70包括:存储器71、处理器72、计算机程序和通讯接口73;其中,计算机程序存储在存储器71中,并被配置为由处理器72执行如上所述的基于多源异构的数据挖掘建模方法。
另外,本公开实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现上述实施例所述的基于多源异构的数据挖掘建模方法。
本公开实施例提供了一种基于多源异构的数据挖掘建模系统,该系统包括至少一个计算装置和至少一个存储指令的存储装置,其中,所述指令在被所述至少一个计算装置运行时,促使所述至少一个计算装置执行如上所述的基于多源异构的数据挖掘建模方法。
此外,本公开实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机程序或指令,该计算机程序或指令被处理器执行时实现如上所述的基于多源异构的数据挖掘建模方法。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:
获取机器学习的相关算法;
将所述机器学习的相关算法封装为多个算法组件;
响应于用户对所述多个算法组件的第一操作,通过所述多个算法组件构建机器学习模型。
另外,该电子设备还可以执行如上所述的基于多源异构的数据挖掘建模方法中的其他步骤。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种基于多源异构的数据挖掘建模方法,其特征在于,包括:
获取机器学习的相关算法;
将所述机器学习的相关算法封装为多个算法组件;
响应于用户对所述多个算法组件的第一操作,通过所述多个算法组件构建机器学习模型。
2.根据权利要求1所述的方法,其特征在于,所述将所述机器学习的相关算法封装为多个算法组件,包括:
对所述机器学习的相关算法进行解耦处理,将处理后的算法封装为多个算法组件。
3.根据权利要求1所述的方法,其特征在于,所述多个算法组件包括如下至少一种:
统计分析组件、分类组件、回归组件、聚类组件。
4.根据权利要求1所述的方法,其特征在于,所述响应于用户对所述多个算法组件的第一操作,通过所述多个算法组件构建机器学习模型之前,所述方法还包括:
响应于用户对目标数据源的第二操作,从目标数据源获取基础数据;
将所述基础数据同步到机器学习模型的数据中,得到所述机器学习模型的原始数据;
相应地,响应于用户对所述多个算法组件的第一操作,通过所述多个算法组件构建机器学习模型,包括:
响应于用户对所述多个算法组件的第一操作,在所述机器学习模型的原始数据的基础上加载所述多个算法组件,对所述机器学习模型进行构建。
5.根据权利要求1-4任一所述的方法,其特征在于,所述通过所述多个算法组件构建机器学习模型之后,所述方法还包括:
生成所述机器学习模型的评估报告。
6.一种基于多源异构的数据挖掘建模装置,其特征在于,所述装置包括:
第一获取模块,用于获取机器学习的相关算法;
封装模块,用于将所述机器学习的相关算法封装为多个算法组件;
构建模块,用于响应于用户对所述多个算法组件的第一操作,通过所述多个算法组件构建机器学习模型。
7.根据权利要求6所述的装置,其特征在于,所述封装模块将所述机器学习的相关算法封装为多个算法组件时,具体用于:
对所述机器学习的相关算法进行解耦处理,将处理后的算法封装为多个算法组件。
8.一种电子设备,其特征在于,包括:
存储器;
处理器;以及
计算机程序;
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如权利要求1-5中任一所述的方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-5中任一项所述的方法。
10.一种基于多源异构的数据挖掘建模系统,其特征在于,该系统包括至少一个计算装置和至少一个存储指令的存储装置,其中,所述指令在被所述至少一个计算装置运行时,促使所述至少一个计算装置执行如权利要求1-5任一项所述的方法。
CN202211001299.3A 2022-08-19 2022-08-19 基于多源异构的数据挖掘建模方法及系统 Pending CN115544858A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211001299.3A CN115544858A (zh) 2022-08-19 2022-08-19 基于多源异构的数据挖掘建模方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211001299.3A CN115544858A (zh) 2022-08-19 2022-08-19 基于多源异构的数据挖掘建模方法及系统

Publications (1)

Publication Number Publication Date
CN115544858A true CN115544858A (zh) 2022-12-30

Family

ID=84726018

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211001299.3A Pending CN115544858A (zh) 2022-08-19 2022-08-19 基于多源异构的数据挖掘建模方法及系统

Country Status (1)

Country Link
CN (1) CN115544858A (zh)

Similar Documents

Publication Publication Date Title
CN108804450B (zh) 信息推送的方法和装置
JP6922538B2 (ja) Api学習
US10453165B1 (en) Computer vision machine learning model execution service
US20210103450A1 (en) Automated Container Image Assembly
CN108846753B (zh) 用于处理数据的方法和装置
WO2017181866A1 (en) Making graph pattern queries bounded in big graphs
US9712622B2 (en) Techniques to manage state information for a web service
US11775269B2 (en) Generating a synchronous digital circuit from a source code construct defining a function call
KR102049133B1 (ko) 파일 서술자를 자동으로 관리하는 기법
US20200142674A1 (en) Extracting web api endpoint data from source code
US11934287B2 (en) Method, electronic device and computer program product for processing data
US9778833B2 (en) Identifying and surfacing relevant report artifacts in documents
CN113807926A (zh) 推荐信息生成方法、装置、电子设备和计算机可读介质
US20230099484A1 (en) Application data exchange system
Casini et al. Enhancing decision-making by leveraging human intervention in large-scale sensor networks
CN115544858A (zh) 基于多源异构的数据挖掘建模方法及系统
CN110704099A (zh) 联盟链的构建方法、装置和电子设备
CN108804442B (zh) 序列号生成方法和装置
CN114116866A (zh) 一种数据获取方法、装置、终端设备及存储介质
US11468026B2 (en) Information processing apparatus, information processing method, and recording medium recording information processing program
US9235382B2 (en) Input filters and filter-driven input processing
US11863622B2 (en) Cross-device data distribution with modular architecture
CN113077353B (zh) 用于生成核保结论的方法、装置、电子设备和介质
US20230110520A1 (en) Ui service package generation and registration method and apparatus, and ui service loading method and apparatus
US10715615B1 (en) Dynamic content distribution system and associated methods

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination