CN108665071A - 一种交互式机器学习实验展示方法及系统 - Google Patents
一种交互式机器学习实验展示方法及系统 Download PDFInfo
- Publication number
- CN108665071A CN108665071A CN201710190169.1A CN201710190169A CN108665071A CN 108665071 A CN108665071 A CN 108665071A CN 201710190169 A CN201710190169 A CN 201710190169A CN 108665071 A CN108665071 A CN 108665071A
- Authority
- CN
- China
- Prior art keywords
- node
- data
- component
- line
- canvas area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- User Interface Of Digital Computer (AREA)
Abstract
本发明公开了一种交互式机器学习实验展示方法及系统,属于计算机图形学技术领域。该方法及系统可以提高机器学习实验创建、调试和监控的便捷性,降低了机器学习的门槛,提高了开发效率。所述交互式机器学习实验展示方法包括:在网页上创建画布;从所述组件列表区域中选择组件并置于画布区域中,在组件配置参数区域中对所述组件的参数进行配置,并读取数据,完成节点设置;对所述画布区域中的节点数据进行训练,获得初始模型;对所述初始模型进行评估,如果评估结果没有达到预设目标,则修改参数配置数据,重新训练后进行评估,直至评估结果满足预设目标,获得最终模型。
Description
技术领域
本发明涉及计算机图形学技术领域,特别地,涉及一种交互式机器学习实验展示方法及系统。
背景技术
机器学习是人工智能的核心。机器学习主要研究如何利用算法让计算机模拟人的学习方式,自动分析数据获得新的知识。机器学习可以用来发现已有数据中的规律,进而预测未来的事件和行为等。机器学习的实现方式明显优于传统的商业智能形式。传统的机器学习主要使用Statistical Product and Service Solutions(对应中文:统计产品与服务解决方案,简称:SPSS),STATISTICAL ANALYSIS SYSTEM(对应中文:统计分析系统,简称:SAS)等桌面软件,或R,Python等编程语言对数据进行离线处理和挖掘。然而,这种方式一方面对使用者的编程水平或软件的应用能力要求较高,另一方面往往只能离线处理少量数据。因此在大数据云计算时代,这种传统的机器学习在开发门槛、开发效率和部署重用等方面渐渐暴露出其弊端。
为了简化使用机器学习的过程,便于开发人员、业务分析师和数据科学家进行广泛、便捷地应用,同时,有效利用云计算超大规模数据的处理和存储能力,很多公司纷纷在自己的云计算平台上推出基于Web的在线机器学习服务。其中有代表性的主要有阿里巴巴机器学习平台(PAI平台)和微软Azure机器学习工作室等。
阿里和微软的机器学习平台是目前国内国外顶级水平。在他们的机器学习平台中均提供了基于Web的可视化操作界面。在这个界面中左侧是一些算法等组件,中间是实验画布,右侧是组件参数配置页。通过鼠标拖动节点到画布,然后拖动节点之间的端口可以完成机器学习实验流程图的创建,选择相应的组件可以在右侧配置组件的运行参数。配置完成后可以执行该实验。实验结束后,得到训练好的模型可保存并供其他机器学习实验使用;实验的处理流程也可以重复应用于新数据的分析和挖掘。现有的机器学习平台中的可视化操作界面在实时进度展现,实验流程控制和画布中流程图自动布局等方面尚有不足之处。
发明内容
本发明实施例提供一种交互式机器学习实验展示方法及系统,可以提高机器学习实验创建、调试和监控的便捷性,降低了机器学习的门槛,提高了开发效率。
为解决上述技术问题,本发明实施例采用下述技术方案:
第一方面,本发明实施例提供一种交互式机器学习实验展示方法,包括:
在网页上创建画布;所述画布包括组件列表区域、画布区域和组件配置参数区域;
从所述组件列表区域中选择组件并置于画布区域中,在组件配置参数区域中对所述组件的参数进行配置,并读取数据,完成节点设置;
对所述画布区域中的节点数据进行训练,获得初始模型;
对所述初始模型进行评估,如果评估结果没有达到预设目标,则修改参数配置数据,重新训练后进行评估,直至评估结果满足预设目标,获得最终模型。
结合第一方面,作为第一种可实现的方案,所述的方法还包括进行自动布局,具体包括:
将所述节点和节点之间的连线数据重新生成为图结构数据;
调用布局函数,将所述图结构数据输入布局函数中,生成节点布局后的新坐标;
清除画布区域中原有节点和连线;
采用所述新坐标重新生成节点和连线,并更新数据库中的节点和连线坐标。
结合第一方面,作为第二种可实现的方案,所述的方法还包括运行进度显示,具体包括:
所述节点开始运行时,计算连线路径的长度,设置连线的初始样式为虚线描边;
使用Websocket技术实时获取后端推送的进度数据,测算进度百分数和偏移量,所述偏移量等于所述连线路径的长度乘以所述进度百分数;
根据所述偏移量,按照连线方向,将实线从连线起点向终点移动,其中,所述实线的长度等于偏移量;
返回所述实时获取后端推送的进度数据步骤,直至完成运行。
结合第一方面,作为第三种可实现的方案,所述的方法还包括暂停或者恢复节点运行,具体包括:
接收指令,然后通过调度模块执行所述指令;所述指令包括暂停运行节点或者恢复运行节点。
结合第一方面,作为第四种可实现的方案,所述获得初始模型,具体包括:
从所述组件列表区域中选择训练组件至画布区域中,并进行参数配置,形成训练节点;
连接待处理节点的出端口和所述训练节点的入端口;
运行所述训练节点,完成训练,获得初始模型。
结合第一方面,作为第五种可实现的方案,所述对初始模型进行评估,具体包括:
从所述组件列表区域中选择模型评估组件至画布区域中,并进行参数配置,形成模型评估节点;
连接所述初始模型的出端口和所述模型评估节点的入端口;
运行所述模型评估节点。
结合第一方面,作为第六种可实现的方案,所述的方法还包括对节点进行数据预处理,具体包括:
从所述组件列表区域中选择数据预处理组件置于画布区域中,并进行参数配置,形成数据预处理节点;
连接待处理节点的出端口和所述数据预处理节点的入端口;
运行所述数据预处理节点,完成数据预处理。
结合第一方面,作为第七种可实现的方案,所述的方法还包括对节点进行特征提取,具体包括:
从所述组件列表区域中选择特征提取组件置于画布区域中,并进行参数配置,形成特征提取节点;
连接待处理节点的出端口和所述特征提取节点的入端口;
运行所述特征提取节点,完成特征提取。
第二方面,本实施例还提供一种交互式机器学习实验展示系统,包括:
创建模块:用于根据用户输入的创建信息,在网页上创建画布;所述画布包括组件列表区域、画布区域和组件配置参数区域;
节点设置模块:用于从所述组件列表区域中选择组件并置于画布区域中,在组件配置参数区域中对所述组件的参数进行配置,并读取数据,完成节点设置;
训练模块:用于对所述画布区域中的节点数据进行训练,获得初始模型;
模型评估模块:用于对所述初始模型进行评估,如果评估结果没有达到预设目标,则修改参数配置数据,重新训练后进行评估,直至评估结果满足预设目标,获得最终模型。
结合第二方面,作为第一种可实现的方案,所述的系统还包括布局模块,用于对所述节点以及节点之间的连线进行重新布局;具体包括,
第一生成子模块:用于将所述节点和节点之间的连线数据重新生成为图结构数据;
第二生成子模块:用于调用布局函数,将所述图结构数据输入布局函数中,生成节点布局后的新坐标;
第三生成子模块:用于清除画布区域中原有节点和连线,并采用所述新坐标重新生成节点和连线,并更新数据库中的节点和连线坐标数据。
结合第二方面,作为第二种可实现的方案,所述的系统还包括显示模块,用于显示运行进度;具体包括:
第一计算子模块:用于在所述节点开始运行时,计算连线路径的长度,设置连线的初始样式为虚线描边;
第二计算子模块:用于使用Websocket技术实时获取后端推送的进度数据,测算进度百分数和偏移量,所述偏移量等于所述连线路径的长度乘以所述进度百分数;其中,所述进度百分数为增变量;
显示子模块:用于根据所述偏移量,按照连线方向,将实线从连线起点向终点移动,其中,所述实线的长度等于偏移量。
结合第二方面,作为第三种可实现的方案,所述的系统还包括调度模块,用于接收指令,并执行所述指令;所述指令包括暂停运行节点或者恢复运行节点。
结合第二方面,作为第四种可实现的方案,所述的系统还包括预处理模块:用于对节点进行数据预处理,获得预处理后的节点;和/或,
特征提取模块:用于从所述节点中提取特征数据。
与现有技术相比,本发明交互式机器学习展示方法及系统,降低了机器学习的门槛,提高了开发效率。本发明在创建画布后,从组件列表区域中选择组件并置于画布区域中,在组件配置参数区域中对组件的参数进行配置,完成节点设置;对节点数据进行训练,对训练得到的初始模型进行评估,如果评估结果没有达到预设目标,则修改参数配置数据,直至评估结果满足预设目标,获得最终模型。本发明无需编写代码就可完成机器学习的创建和调试,大大降低了机器学习的门槛,提高了开发效率。同时,通过在画布中设置三个区域,用户可友好的交互式操作,增强了系统的友好性和易用性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例的方法流程框图;
图2是本发明实施例的系统结构框图;
图3是本发明实施例中显示运行日志示意图;
图4是本发明实施例中自动布局过程的信息流图。
具体实施方式
下面结合附图,对本发明实施例的技术方案进行详细的说明。
为使本领域技术人员更好地理解本发明的技术方案,下面结合附图和具体实施方式对本发明作进一步详细描述。下文中将详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
本发明实施例的交互式机器学习实验展示方法是一种在Web端通过可视化方式创建和调试机器学习实验流程的方法。如图1所示,交互式机器学习实验展示方法包括:
S10根据用户输入的创建信息,在网页上创建画布;所述画布包括组件列表区域、画布区域和组件配置参数区域。
其中,画布展示在Web中。作为一实例,整个画布从左到右依次分为组件列表区域、画布区域、组件配置参数区域三个区域。组件列表区域中展示各种组件,供用户选择使用。组件配置参数区域中展示各组件中的参数,供用户设定。画布区域用于布设节点,绘制流程图。
S20从所述组件列表区域中选择组件并置于画布区域中,在组件配置参数区域中对所述组件的参数进行配置,并读取数据,完成节点设置。
其中,用户从组件列表中选择组件,并拖至画布区域中,从而创建一个节点。通过点击该节点,组件配置参数区域会切换到所述组件对应的参数配置项。依次完成配置项选择。通过运行所述节点,完成各配置项的数据读取。
S30对所述画布区域中的节点数据进行训练,获得初始模型。
其中,将节点数据输入训练节点中,利用训练节点训练节点数据,获得初始模型。S30具体包括以下步骤:
S301从所述组件列表区域中选择训练组件至画布区域中,并进行参数配置,形成训练节点.
S302连接待处理节点的出端口和所述训练节点的入端口。
S303运行所述训练节点,完成训练,获得初始模型。
训练组件中包含分析组件。分析组件是一系列的判断或者计算,例如对于一个待预测数据,通过分析组件得到一个预测值。从组件列表中的机器学习、文本挖掘专题、时间序列专题等目录下选择一个或多个合适的训练组件拖到画布上,并进行参数配置,形成训练节点。连接待处理节点的出端口和训练节点的入端口。通过运行训练节点即可完成训练,获得初始模型。
S40对所述初始模型进行评估,如果评估结果没有达到预设目标,则修改参数配置数据,重新训练后进行评估,直至评估结果满足预设目标,获得最终模型。
其中,利用模型评估节点对S40得到的初始模型进行评估,如果评估效果没有达到预设目标,则返回S10,修改配置数据,直至评估结果满足预设目标。
作为一优选例,S40具体包括:
S401从所述组件列表区域中选择模型评估组件至画布区域中,并进行参数配置,形成模型评估节点;
S402连接所述初始模型的出端口和所述模型评估节点的入端口;
S403运行所述模型评估节点。
不同算法、不同特征、不同数据的模型训练的结果各不相同。模型训练完后,对训练结果进行评估。将初始模型的输出端口与模型评估节点的输入端口连接,并对模型评估节点中各参数进行配置,运行模型评估节点,获取评估结果。如果评估结果没有达到预设目标,则可调整节点的参数配置,反复优化。优化完成后可以保存模型供其余实验使用。
上述实施例的交互式机器学习展示方法,降低了机器学习的门槛,提高了开发效率。本发明采用交互式机器学习方法。用户从组件列表区域中选择组件,在组件配置参数区域中对组件的参数进行配置,在画布区域中完成节点设置和流程图的绘制。在此过程中,用户无需编写代码,就可完成机器学习的创建和调试,大大降低了机器学习的门槛,提高了开发效率。
上述实施例的交互式机器学习展示方法中,在画布区域创建的流程图比较凌乱,不规整,尤其当流程图比较复杂,含有多个节点和连线时,流程图就更显得杂乱。为解决这一问题,本优选例的方法中,还包括进行自动布局。如图4所示,进行自动布局具体包括以下步骤:
S501将所述节点和节点之间的连线数据重新生成为图结构数据;
S502调用布局函数,将所述图结构数据输入布局函数中,生成节点布局后的新坐标。
作为一实施例,利用Dagre内置的graphlib将节点和连线数据重新组织为用于布局的图结构数据。Graphlib用来构建图结构。Dagre根据图结构进行布局。
S503清除画布区域中原有节点和连线。
S504采用所述新坐标重新生成节点和连线,并更新数据库中的节点和连线坐标。通过将节点和连线的新坐标数据保存到后端数据库中,替换原有的流程图数据,使得下一次打开实验画布时能展示自动布局的结果。
上述实施例在画布区域中引入自动布局功能,帮助用户将复杂错乱的流程图进行重新布局,有效利用画布空间,有效展示流程图的层级结构和左右关系。为节点生成坐标使用开源JavaScript库Dagre,Dagre支持中等规模的有向图生成布局坐标。
通过本实施例的方法,流程图从原先的杂乱无章变为层级结构和左右关系清晰,有效的利用了画布空间。
在上述实施例中,流程图运行时,操作人员无法知晓运行进度。例如,微软的节点运行时跳转到空白页,运行结束才回到实验画布中,此时才可查看运行日志。用户体验较差,不直观。为此,本优选例还包括运行进度显示,具体包括:
S601所述节点开始运行时,计算连线路径的长度,设置连线的初始样式为虚线描边。计算连线路径的长度是计算流程图中连线的长度之和。
S602使用Websocket技术实时获取后端推送的进度数据,测算进度百分数和偏移量,所述偏移量等于所述连线路径的长度乘以所述进度百分数。其中,所述进度百分数为增变量。后端实时推送进度数据,使得运行进度也实时显示。
S603根据所述偏移量,按照连线方向,将实线从连线起点向终点移动。其中,所述实线的长度等于偏移量;
S604返回步骤602,直至完成运行。
本实施例采用实时推送方案,实时知晓运行进度,对前端压力小,效率高。后端每次返回前端的数据并不是增量的,有大量冗余数据。另外,本实施例中,画布通过WebSocket建立前后端连接。实时监控后端消息,一旦返回节点运行进度信息和状态信息,就更新该节点的连线进度条。本实施例中,虚线描边是先虚后实依次交叠。当监听到后端推送的进度消息后,根据进度百分比调整偏移量,从而实现进度依次增加的效果。
每次打开一个实验会开启一个WebSocket连接,并注册一个状态消息处理函数和日志消息处理函数。而关闭实验或者切换实验则关闭该连接。当需要在前端查看日志时,发送消息到后端请求消息。而后接到后端推送的消息时增量地显示在界面上,图3所示。
在画布区域中运行流程图,当需要中止或中止后重新运行节点时,上述方法还包括:暂停或者恢复节点运行。具体来说,该步骤包括:
接收指令,然后通过调度模块执行所述指令;所述指令包括暂停运行节点或者恢复运行节点。
其中,后端接收和执行指令。这样,当需要暂停运行节点或者暂停后恢复运行节点时,后端通过调度模块来执行暂停或者恢复运行指令。
在后端使用Spark完成节点运行的任务调度,并支持停止和恢复执行的功能。因此,比起其他现有方案,具有执行该节点,从此处执行,执行到此处,执行整个画布,停止执行,恢复执行等多种画布运行相关的操作方式。前端主要用于控制命令的发起、状态的切换和时间的启停。
上述实施例的方法中,节点读取的数据为原始数据,往往比较粗糙,初步加工以满足后续处理流程的需要,常用方法有加权采样、随机采样、过滤与映射、分层采样、JOIN、合并列UNION、缺失值填充、归一化、标准化等。例如缺失值填充用来将空值或者一个指定的值替换为最大值,最小值,均值或者一个自定义的值。通过数据预处理,对节点中的原始数据可能存在的缺失、重复问题进行处理。在画布区域中,利用数据预处理节点对S20中读取数据后的节点进行数据预处理,获得预处理后的节点。上述实施例的方法还包括对节点进行数据预处理,具体包括:
S701从所述组件列表区域中选择数据预处理组件置于画布区域中,并进行参数配置,形成数据预处理节点。其中,组件列表区域中可以设置多种数据预处理组件,用户可从中选择一个或多个数据预处理组件。
S702连接待处理节点的出端口和所述数据预处理节点的入端口。
S703运行所述数据预处理节点,完成数据预处理。
通过对读取数据后的节点进行数据预处理,减少原始数据中重复数据,补充缺失数据等处理,使得节点中的数据更加完善、准确,为后续特征提取和训练,提供了更加准确的数据,有利于提高最终建立的数据输出模型的精度。在完成数据预处理后,可以查看预处理后的数据分布。
当数据读取后或者预处理完成后,从节点中选择特征,输入机器学习的算法和模型中进行训练。在机器学习和模式识别中,特征是在观测现象中的一种独立、可测量的属性。选择信息量大的、有差别性的、独立的特征是模式识别、分类和回归问题的关键一步。最初的原始特征数据集可能太大,或者信息冗余,因此在机器学习的应用中,一个初始步骤就是选择特征的子集,或构建一套新的特征集,减少功能来促进算法的学习,提高泛化能力和可解释性。
为此,上述实施例的方法还包括对节点进行特征提取,具体包括:
S801从所述组件列表区域中选择特征提取组件置于画布区域中,并进行参数配置,形成特征提取节点。
S802连接待处理节点的出端口和所述特征提取节点的入端口。
S803运行所述特征提取节点,完成特征提取。
如图2所示,本发明实施例还提供一种交互式机器学习实验展示系统,包括:
创建模块:用于根据用户输入的创建信息,在网页上创建画布;所述画布包括组件列表区域、画布区域和组件配置参数区域;
节点设置模块:用于从所述组件列表区域中选择组件并置于画布区域中,在组件配置参数区域中对所述组件的参数进行配置,并读取数据,完成节点设置;
训练模块:用于对所述画布区域中的节点数据进行训练,获得初始模型;
模型评估模块:用于对所述初始模型进行评估,如果评估结果没有达到预设目标,则修改参数配置数据,重新训练后进行评估,直至评估结果满足预设目标,获得最终模型。
上述实施例的交互式机器学习展示系统,通过设置创建模块、节点设置模块、训练模块和模型评估模块,降低了机器学习的门槛,提高了开发效率。本发明采用交互式机器学习系统。用户从组件列表区域中选择组件,在组件配置参数区域中对组件的参数进行配置,在画布区域中完成节点设置和流程图的绘制。在此过程中,用户无需编写代码,就可完成机器学习的创建和调试,大大降低了机器学习的门槛,提高了开发效率。
作为一优选例,上述系统还包括布局模块,用于对所述节点以及节点之间的连线进行重新布局。布局模块具体包括:
第一生成子模块:用于将所述节点和节点之间的连线数据重新生成为图结构数据;
第二生成子模块:用于调用布局函数,将所述图结构数据输入布局函数中,生成节点布局后的新坐标;
第三生成子模块:用于清除画布区域中原有节点和连线,并采用所述新坐标重新生成节点和连线,并更新数据库中的节点和连线坐标数据。
上述实施例通过设置布局模块,帮助用户将复杂错乱的流程图进行重新布局,有效利用画布空间,有效展示流程图的层级结构和左右关系。
作为另一优选例,所述系统还包括显示模块,用于显示运行进度。显示模块具体包括:
第一计算子模块:用于在所述节点开始运行时,计算连线路径的长度,设置连线的初始样式为虚线描边;
第二计算子模块:用于使用Websocket技术实时获取后端推送的进度数据,测算进度百分数和偏移量,所述偏移量等于所述连线路径的长度乘以所述进度百分数;
显示子模块:用于根据所述偏移量,按照连线方向,将实线从连线起点向终点移动,其中,所述实线的长度等于偏移量。
本实施例设置显示模块,采用实时推送方案,实时知晓运行进度,对前端压力小,效率高。实时监控后端消息,一旦返回节点运行进度信息和状态信息,就更新该节点的连线进度条。本实施例中,虚线是先虚后实依次交叠。当监听到后端推送的进度消息后,根据进度百分比调整偏移量,从而实现进度依次增加的效果。
作为另一优选例,所述系统还包括调度模块,用于接收指令,并执行所述指令。所述指令包括暂停运行节点或者恢复运行节点。通过调度模块,用户可以随时向调度模块发送指令,使得整个流程运行暂停或者恢复运行,增加了用户对流程运行的可控性。
通过设置调度模块,除了在节点上有针对特定节点的流程控制:执行该节点、运行到此处和从此处执行外还在画布上提供了用于整体实验流程控制的运行,恢复执行和停止,以及运行时间展示。这样更加便于用户发现错误后重新组织实验流程或者调整实验参数,提高了对实验流程的控制能力和开发效率。
作为另一优选例,所述系统还包括预处理模块:用于对节点进行数据预处理,获得预处理后的节点;和/或,特征提取模块:用于从所述节点中提取特征数据。
预处理模块,对读取数据后的节点进行数据预处理,减少原始数据中重复数据,补充缺失数据等处理,使得节点中的数据更加完善、准确,为后续特征提取和训练,提供了更加准确的数据,有利于提高最终建立的数据输出模型的精度。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
Claims (13)
1.一种交互式机器学习实验展示方法,其特征在于,包括:
在网页上创建画布;所述画布包括组件列表区域、画布区域和组件配置参数区域;
从所述组件列表区域中选择组件并置于画布区域中,在组件配置参数区域中对所述组件的参数进行配置,并读取数据,完成节点设置;
对所述画布区域中的节点数据进行训练,获得初始模型;
对所述初始模型进行评估,如果评估结果没有达到预设目标,则修改参数配置数据,重新训练后进行评估,直至评估结果满足预设目标,获得最终模型。
2.按照权利要求1所述的方法,其特征在于,还包括进行自动布局,具体包括:
将所述节点和节点之间的连线数据重新生成为图结构数据;
调用布局函数,将所述图结构数据输入布局函数中,生成节点布局后的新坐标;
清除画布区域中原有节点和连线;
采用所述新坐标重新生成节点和连线,并更新数据库中的节点和连线坐标。
3.按照权利要求1所述的方法,其特征在于,还包括运行进度显示,具体包括:
所述节点开始运行时,计算连线路径的长度,设置连线的初始样式为虚线描边;
使用Websocket技术实时获取后端推送的进度数据,测算进度百分数和偏移量,所述偏移量等于所述连线路径的长度乘以所述进度百分数;
根据所述偏移量,按照连线方向,将实线从连线起点向终点移动,其中,所述实线的长度等于偏移量;
返回所述实时获取后端推送的进度数据步骤,直至完成运行。
4.按照权利要求1所述的方法,其特征在于,还包括暂停或者恢复节点运行,具体包括:
接收指令,然后通过调度模块执行所述指令;所述指令包括暂停运行节点或者恢复运行节点。
5.按照权利要求1所述的方法,其特征在于,所述获得初始模型,具体包括:
从所述组件列表区域中选择训练组件至画布区域中,并进行参数配置,形成训练节点;
连接待处理节点的出端口和所述训练节点的入端口;
运行所述训练节点,完成训练,获得初始模型。
6.按照权利要求1所述的方法,其特征在于,所述对初始模型进行评估,具体包括:
从所述组件列表区域中选择模型评估组件至画布区域中,并进行参数配置,形成模型评估节点;
连接所述初始模型的出端口和所述模型评估节点的入端口;
运行所述模型评估节点。
7.按照权利要求1所述的方法,其特征在于,还包括对节点进行数据预处理,具体包括:
从所述组件列表区域中选择数据预处理组件置于画布区域中,并进行参数配置,形成数据预处理节点;
连接待处理节点的出端口和所述数据预处理节点的入端口;
运行所述数据预处理节点,完成数据预处理。
8.按照权利要求1所述的方法,其特征在于,还包括对节点进行特征提取,具体包括:
从所述组件列表区域中选择特征提取组件置于画布区域中,并进行参数配置,形成特征提取节点;
连接待处理节点的出端口和所述特征提取节点的入端口;
运行所述特征提取节点,完成特征提取。
9.一种交互式机器学习实验展示系统,其特征在于,包括:
创建模块:用于根据用户输入的创建信息,在网页上创建画布;所述画布包括组件列表区域、画布区域和组件配置参数区域;
节点设置模块:用于从所述组件列表区域中选择组件并置于画布区域中,在组件配置参数区域中对所述组件的参数进行配置,并读取数据,完成节点设置;
训练模块:用于对所述画布区域中的节点数据进行训练,获得初始模型;
模型评估模块:用于对所述初始模型进行评估,如果评估结果没有达到预设目标,则修改参数配置数据,重新训练后进行评估,直至评估结果满足预设目标,获得最终模型。
10.按照权利要求9所述的系统,其特征在于,还包括布局模块,用于对所述节点以及节点之间的连线进行重新布局;具体包括,
第一生成子模块:用于将所述节点和节点之间的连线数据重新生成为图结构数据;
第二生成子模块:用于调用布局函数,将所述图结构数据输入布局函数中,生成节点布局后的新坐标;
第三生成子模块:用于清除画布区域中原有节点和连线,并采用所述新坐标重新生成节点和连线,并更新数据库中的节点和连线坐标数据。
11.按照权利要求9所述的系统,其特征在于,还包括显示模块,用于显示运行进度;具体包括:
第一计算子模块:用于在所述节点开始运行时,计算连线路径的长度,设置连线的初始样式为虚线描边;
第二计算子模块:用于使用Websocket技术实时获取后端推送的进度数据,测算进度百分数和偏移量,所述偏移量等于所述连线路径的长度乘以所述进度百分数;其中,所述进度百分数为增变量;
显示子模块:用于根据所述偏移量,按照连线方向,将实线从连线起点向终点移动,其中,所述实线的长度等于偏移量。
12.按照权利要求9所述的系统,其特征在于,还包括调度模块,用于接收指令,并执行所述指令;所述指令包括暂停运行节点或者恢复运行节点。
13.按照权利要求9所述的系统,其特征在于,还包括预处理模块:用于对节点进行数据预处理,获得预处理后的节点;和/或,
特征提取模块:用于从所述节点中提取特征数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710190169.1A CN108665071A (zh) | 2017-03-27 | 2017-03-27 | 一种交互式机器学习实验展示方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710190169.1A CN108665071A (zh) | 2017-03-27 | 2017-03-27 | 一种交互式机器学习实验展示方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108665071A true CN108665071A (zh) | 2018-10-16 |
Family
ID=63786366
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710190169.1A Pending CN108665071A (zh) | 2017-03-27 | 2017-03-27 | 一种交互式机器学习实验展示方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108665071A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110908573A (zh) * | 2019-12-03 | 2020-03-24 | 北京明略软件系统有限公司 | 算法模型训练方法、装置、设备及存储介质 |
CN111240662A (zh) * | 2020-01-16 | 2020-06-05 | 同方知网(北京)技术有限公司 | 一种基于任务可视化拖拽的spark机器学习系统及学习方法 |
CN112114797A (zh) * | 2020-09-03 | 2020-12-22 | 成都中科合迅科技有限公司 | 可配置的可视化开发方法与系统 |
WO2021038432A1 (en) * | 2019-08-30 | 2021-03-04 | International Business Machines Corporation | Automated artificial intelligence radial visualization |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101876900A (zh) * | 2009-11-24 | 2010-11-03 | 恒生电子股份有限公司 | 实现流程图自动调整布局的方法及装置 |
CN104123214A (zh) * | 2013-04-26 | 2014-10-29 | 阿里巴巴集团控股有限公司 | 基于运行时数据的任务执行进度度量和展示的方法及系统 |
CN106020811A (zh) * | 2016-05-13 | 2016-10-12 | 乐视控股(北京)有限公司 | 算法模型的开发方法和装置 |
-
2017
- 2017-03-27 CN CN201710190169.1A patent/CN108665071A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101876900A (zh) * | 2009-11-24 | 2010-11-03 | 恒生电子股份有限公司 | 实现流程图自动调整布局的方法及装置 |
CN104123214A (zh) * | 2013-04-26 | 2014-10-29 | 阿里巴巴集团控股有限公司 | 基于运行时数据的任务执行进度度量和展示的方法及系统 |
CN106020811A (zh) * | 2016-05-13 | 2016-10-12 | 乐视控股(北京)有限公司 | 算法模型的开发方法和装置 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021038432A1 (en) * | 2019-08-30 | 2021-03-04 | International Business Machines Corporation | Automated artificial intelligence radial visualization |
GB2602422A (en) * | 2019-08-30 | 2022-06-29 | Ibm | Automated artificial intelligence radial visualization |
CN110908573A (zh) * | 2019-12-03 | 2020-03-24 | 北京明略软件系统有限公司 | 算法模型训练方法、装置、设备及存储介质 |
CN110908573B (zh) * | 2019-12-03 | 2021-07-06 | 北京明略软件系统有限公司 | 算法模型训练方法、装置、设备及存储介质 |
CN111240662A (zh) * | 2020-01-16 | 2020-06-05 | 同方知网(北京)技术有限公司 | 一种基于任务可视化拖拽的spark机器学习系统及学习方法 |
CN111240662B (zh) * | 2020-01-16 | 2024-01-09 | 同方知网(北京)技术有限公司 | 一种基于任务可视化拖拽的spark机器学习系统及学习方法 |
CN112114797A (zh) * | 2020-09-03 | 2020-12-22 | 成都中科合迅科技有限公司 | 可配置的可视化开发方法与系统 |
CN112114797B (zh) * | 2020-09-03 | 2023-04-07 | 成都中科合迅科技有限公司 | 可配置的可视化开发方法与系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109496320B (zh) | 具有架构师模块的人工智能引擎 | |
Navarro-Prieto et al. | Are visual programming languages better? The role of imagery in program comprehension | |
CN108665071A (zh) | 一种交互式机器学习实验展示方法及系统 | |
Lomas et al. | Explaining robot actions | |
Mavin et al. | Determining socio-technical systems requirements: Experiences with generating and walking through scenarios | |
Atzmueller et al. | The mining and analysis continuum of explaining uncovered | |
US20140330542A1 (en) | Method and System to Unify and Display Simulation and Real-time Plant Data for Problem-Solving | |
Agarwal et al. | Expert system and it's requirement engineering process | |
Strassburger et al. | Future trends in distributed simulation and distributed virtual environments: results of a peer study | |
Pramudianto et al. | Iot link: An internet of things prototyping toolkit | |
CN108287648A (zh) | 软件的反馈管理方法、装置、电子设备和计算机存储介质 | |
Ugur et al. | A web‐based tool for teaching neural network concepts | |
Settouti et al. | A trace-based learner modelling framework for technology-enhanced learning systems | |
Decker et al. | The thousand faces of explainable AI along the machine learning life cycle: industrial reality and current state of research | |
Xie et al. | Chaos synchronization of financial chaotic system with external perturbation | |
Maier et al. | Learning analytics cockpit for MOOC platforms | |
Abdelgawad et al. | Model-based testing of a real-time adaptive motion planning system | |
Abad et al. | A visual narrative path from switching to resuming a requirements engineering task | |
Krüger et al. | Insite: a pipeline enabling in-transit visualization and analysis for neuronal network simulations | |
Zeigler | DEVS-based modeling and simulation framework for emergence in system of systems | |
CN113973060A (zh) | 一种物联网模拟方法、装置、系统及存储介质 | |
Aznar et al. | Agents for swarm robotics: Architecture and implementation | |
Sehaba | Sharing experiences between learners with different profiles: adaptation of interaction traces | |
Zorrilla et al. | A data mining service to assist instructors involved in virtual education | |
Ye et al. | SA-FGDEM: A Self-adaptive E-Learning Performance Prediction Model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181016 |
|
RJ01 | Rejection of invention patent application after publication |