CN111404721B - 基于web的模型训练过程数据可视化处理方法、装置、设备 - Google Patents

基于web的模型训练过程数据可视化处理方法、装置、设备 Download PDF

Info

Publication number
CN111404721B
CN111404721B CN202010090795.5A CN202010090795A CN111404721B CN 111404721 B CN111404721 B CN 111404721B CN 202010090795 A CN202010090795 A CN 202010090795A CN 111404721 B CN111404721 B CN 111404721B
Authority
CN
China
Prior art keywords
data
evaluation
failure
preset
feature quantity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010090795.5A
Other languages
English (en)
Other versions
CN111404721A (zh
Inventor
石晓龙
黄望
苏颖亮
饶鑫
刘双萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN202010090795.5A priority Critical patent/CN111404721B/zh
Publication of CN111404721A publication Critical patent/CN111404721A/zh
Application granted granted Critical
Publication of CN111404721B publication Critical patent/CN111404721B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • H04L43/045Processing captured monitoring data, e.g. for logfile generation for graphical visualisation of monitoring data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请属于数据处理领域,公开了一种基于web的模型训练过程数据可视化处理方法、装置、计算机设备和介质。所述方法包括从采集到的所述评估结果中提取所述预设模型特征的待评估数据;获取特征的对比评估数值,并计算待评估数据相对于对比评估数值的偏差数值;然后偏差数值对评估数据进行处理和分类操作,并与预设图像模板进行关联,生成评估结果页面以进行展示。解决了现有技术中得到的每个特征的评估数据杂乱无序不便于后期分析的技术问题。

Description

基于web的模型训练过程数据可视化处理方法、装置、设备
技术领域
本申请涉及数据处理领域,特别是涉及一种基于web的模型训练过程数据可视化处理方法、装置、计算机设备和存储介质。
背景技术
传统技术中,通过深度学习验证某一域名在特定条件下的访问量指标数据是否异常,需要对后台服务器训练出的数个模型进行评估,得出每一个模型的评估结果,然后根据评估结果从数个模型中遴选出合适的模型对指标数据进行验证得出结果。但是,一般每个模型里包括的特征奇多,每一特征的评估数据又杂乱无序,整个过程较为繁琐且操作门槛很高,耗费的时间较长,使用者要从这样一堆数据中厘清头绪,得到合适的模型十分吃力耗时。
发明内容
基于此,有必要针对上述技术问题,本申请提供一种基于web的模型训练过程数据可视化处理方法、装置、计算机设备及存储介质,以解决现有技术中无法对特征进行准确提取,导致的无法对模型进行准确分析的技术问题。
一种基于web的模型训练过程数据可视化处理方法,所述方法包括:
采集预设模型的评估结果,并从采集到的所述评估结果中提取所述预设模型特征的特征评估数据,作为待评估数据;
获取所述特征的预期评估数值,作为对比评估数值,并获取所述待评估数据相对于所述对比评估数值的偏差数值;
根据所述偏差数值将所述待评估数据标记为评估通过数据或评估失败数据,将所述评估通过数据作为目标成功数据,并计算所述目标成功数据的数量,作为目标特征数量;
对所述评估失败数据进行类型划分,得到失败特征类型,并计算与所述失败特征类型对应的所述评估失败数据的数量,作为失败特征数量;
将所述目标特征数量以及所述失败特征数量与预设图像模板进行关联,生成评估结果页面以进行展示。
一种基于web的模型训练过程数据可视化处理装置,所述装置包括:
数据采集模块,用于采集预设模型的评估结果,并从采集到的所述评估结果中提取所述预设模型特征的特征评估数据,作为待评估数据;
偏差计算模块,用于获取所述特征的预期评估数值,作为对比评估数值,并获取所述待评估数据相对于所述对比评估数值的偏差数值;
类型标记模块,用于根据所述偏差数值将所述待评估数据标记为评估通过数据或评估失败数据,将所述评估通过数据作为目标成功数据,并计算所述目标成功数据的数量,作为目标特征数量;
失败计数模块,用于对所述评估失败数据进行类型划分,得到失败特征类型,并计算与所述失败特征类型对应的所述评估失败数据的数量,作为失败特征数量;
渲染处理模块,用于将所述目标特征数量以及所述失败特征数量与预设图像模板进行关联,生成评估结果页面以进行展示。
一种计算机设备,包括存储器和处理器,以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于web的数据可视化处理方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于web的数据可视化处理方法的步骤。
上述基于web的模型训练过程数据可视化处理方法、装置、计算机设备和存储介质,通过获取评估数据与预期评估数值之间的偏差数值,然后对待评估数据进行处理和分类操作,并与预设图像模板进行关联,生成评估结果页面。解决了现有技术中得到的每个特征的评估数据杂乱无序不便于后期分析的技术问题。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为基于web的模型训练过程数据可视化处理方法的应用环境示意图;
图2为基于web的模型训练过程数据可视化处理方法的流程示意图;
图3为图2中步骤202的流程示意图;
图4为图2中步骤206的流程示意图;
图5为图2中步骤206的流程示意图;
图6为基于web的模型训练过程数据可视化处理装置的示意图;
图7为一个实施例中计算机设备的示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了使本申请的目的、技术方案及优点更加清楚明白,下面结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的基于web的模型训练过程数据可视化处理方法,可以应用于如图1所示的应用环境中。其中,该应用环境可以包括终端102、网络106以及服务端104,网络106用于在终端102和服务端104之间提供通信链路介质,网络106可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端102通过网络106与服务端104交互,以接收或发送消息等。终端102上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端102可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group AudioLayer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts GroupAudio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务端104可以是提供各种服务的服务器,例如对终端102上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的基于web的模型训练过程数据可视化处理方法一般由服务端/终端执行,相应地,基于web的模型训练过程数据可视化处理装置一般设置于服务端/终端设备中。
应该理解,图1中的终端、网络和服务端的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
其中,终端102通过网络与服务端104进行通信。服务端104从终端102上获取预设模型的评估数据,并得出评估数据与对比评估数据的偏差数值,通过偏差数值将评估数据划分为评估通过数据和评估失败数据,再确定评估失败数据的失败类型,然后将每一个评估失败数据的数量、每一个评估通过数据的数量进行关联生成评估结果页面以进行展示。其中,终端102和服务端104之间通过网络进行连接,该网络可以是有线网络或者无线网络,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务端104可以用独立的服务器或者是多个组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种基于web的模型训练过程数据可视化处理方法,以该方法应用于图1中的服务端为例进行说明,包括以下步骤:
步骤202,采集预设模型的评估结果,并从采集到的所述评估结果中提取所述预设模型特征的特征评估数据,作为待评估数据。
在模型训练过程中,若要了解训练的情况,看看模型能否在训练集上表现良好,需要对模型进行评估测试。具体地,服务端,比如后台服务器在共享服务器上获取web服务器上传的验证集,根据验证集得到训练出的指标评估模型的评估结果,后台服务器会实时将训练出的结果存储在数据库中,并向web服务器发送通知或者变更数据库中的状态告诉web服务器已经生成了预设模型的评估结果。
其中,后台服务器评估模型得到的评估结果是一个模型中多个维度数据的评估数据,得到的每一个维度特征的评估数据是有多个正整数组成的无顺序数据列表,一般无法从该无顺序数字列表中直观得出评估结果的优劣。比如,在域名访问指标异常的模型训练过程中,对该指标异常评估模型进行评估时,得到模型的偏度特征的评估数据,该偏度特征的评估数据可以是一串无顺序的数值组成的列表。
步骤204,获取特征的预期评估数值,作为对比评估数值,并获取待评估数据相对于对比评估数值的偏差数值。
预期评估数值是该模型中某一特征的应该有的一个数值范围或者一个确切数值,但具体是数值范围还是具体数值需要根据具体情况而定。本实施例可以将该特征的预期评估数值设为一个具体数值。
偏差数值中的偏差数值可以是通过将待评估数据与对比评估数值进行对比得到的,
对比评估数值是根据特征的预期评估数值得到的,比如可以是对偏态特征的预期评估数值:[偏态值:-1~+1],则可以认为该特征得出的结果是符合正态分布。
当然,该预设评估数值还可以是根据历史评估结果数据得到失败类型分布图,当得到的数值为多少时待评估数据的类型等等,此处不做限定。
步骤206,根据偏差数值将待评估数据标记为评估通过数据或评估失败数据,将评估通过数据作为目标成功数据,并计算目标成功数据的数量,作为目标特征数量。
若得到的特征的待评估数据是一个4或者9,且预期评估数值可以是5,若待评估数据与预期评估偏差数值的偏差数值不超过预设值2,则可以认定该特征的评估结果是准确的,并将该待评估数据标记为通过数据写入通过列表中;若偏差数值的偏差数值大于2,则认定该待评估数据出现偏差,可以根据偏差数值将该评估数据标记为失败数据,并将失败数据写入失败列表中。目标特征数量表示一个特征中符合预期评估数值的评估数据的数量。在一个实施例中,可以每标记一个通过数据便记录一个通过数据,并将后续标记的通过数据的数量进行累加;也可以在对一个特征的所有评估数据进行标记完成后,计算通过数据的数量。
步骤208,对评估失败数据进行类型划分,得到失败特征类型,并计算与失败特征类型对应的评估失败数据的数量,作为失败特征数量。
同一特征的评估失败数据的失败类型会有一种至多种,比如在对模型的偏态特征进行评估时,正常情况下得到的评估结果是偏态数据,即符合预设评估数值的数据;但在非正常情况下对偏态特征的评估得到的结果可能会是峰度、方差或者权值特征的数据,这种情况下web服务器需要按照失败类型对评估失败数据进行在此分类,并获取每一失败类型下对应的评估数据的数量,作为失败特征数量。即,确认对该偏度特征的评估结果的错误类型到底是峰度失败类型还是方差失败类型。其中,模型的特征还可以是:峰度,偏度,方差,绝对能量值,一阶差分绝对和,近似熵等等,本实施例以偏态作为特征进行说明。
步骤210,将目标特征数量以及失败特征数量与预设图像模板进行关联,生成评估结果页面以进行展示。
得到同一模型的每一特征的目标特征数量以及失败特征数量后,需要将得到的这些数据与预设图像模板进行关联。预设图像模板可以是对目标特征数量与失败特征数量进行映射的坐标图像。比如纵轴(Y)、横轴(X)上分别标记有预设模型的特征名,当验证点落在(X,Y),其中,X=Y点上时,表示评估数据为正确的;当验证点落在(X,Y)其中,X不等于Y上时,表示评估数据为评估失败数据,至于评估失败数据为何种失败类型,需要看Y所对应的特征名。
验证点用于映射目标特征数量或者失败特征数量。当验证点(X,Y,其中,X=Y)上都是目标特征数量,而验证点(X,Y,其中,X不等于Y)上不存在失败特征数量的数值或者失败特征数量的少于预设值时,则表示对该预设模型的训练结果比较准确。
上述基于web的模型训练过程数据可视化处理方法中,通过获取评估数据与预期评估数值之间的偏差数值,然后根据偏差数值对评估数据进行处理和分类操作,并与预设图像模板进行关联,生成评估结果页面。解决了现有技术中得到的每个特征的评估数据杂乱无序不便于后期分析的技术问题。
进一步地,在一个实施例中,步骤210,包括:
对目标特征数量、失败特征数量以及预设图像模板进行渲染,并根据预设色彩标注条件在预设图像模板上对目标特征数量、失败特征数量进行颜色标注,得到评估结果页面。
每一个验证点都是一个变量,在对得到的目标特征数量、失败特征数量以及预设图像模板进行渲染时,只需要将目标特征数量或者失败特征数量加到与该预设图像模板上的对应的变量上,然后在按照预设色彩标注条件对加好的目标特征数量或者失败特征数量进行颜色标注即可。
进一步地,根据目标特征两束以及失败特征数量的数值的大小按颜色从深到浅的顺序对目标特征数量、失败特征数量进行颜色标注。
预设色彩标注条件可以是按照蓝色的色彩纯度按数值的从大到小顺序对数值进行标注。具体可以表现为,对数值25标注的蓝色的纯度大于对数值10的蓝色的纯度。
可选地,还可以是预选两种不同的颜色,对不同特征的目标特征数量按照数值从大到小的顺序颜色纯度从大到小的顺序进行标注;对不同特征的失败特征数量按照数值从大到小的顺序颜色纯度从大到小的顺序进行标注。
以上的颜色标注不仅仅局限于以上提到的方式,还可以是其他颜色标注,比如说不同特征不同的颜色标注,不同特征不同失败类型的评估失败数量的颜色标注等等,此处不做限定。
本实施例通过对数值进行颜色标注,可以更直观表示对预设模型的特征的评估结果,方便后期从众多的模型中根据不同特征评估结果选出合适的模型使用。
在一个实施例中,如图3所示,步骤202,包括:
步骤302,接收评估查看请求,并从评估查看请求中获取预设模型的位置索引。
评估结果查看请求可以是用户通过页面向web服务器发送的一个查看请求,该请求中包括待查看评估结果在预设数据库中的存储地址;预设数据库中的评估结果与指标评估模型关联,每一个评估结果又有唯一标识,该唯一标识根据模型生成时间、创建人以及模型名生成,不至于使得多个模型混淆。
步骤304,根据位置索引从后台服务器上获取预设模型的评估结果。获取到的模型评估结果会被存储到web服务器上的数据库中。
步骤306,从评估结果中获取预设模型的所有特征,并获取与特征对应的特征评估数据,作为待评估数据。在对指标异常评估模型进行评估时,根据不同的验证集或者不同验证集中的验证数据得到的特征的评估数据中的数值数量也不相同,为了保证评估的准确性,在通常的操作中,一般会将验证集中验证指标的数量设在一个范围内,范围太大会导致评估效率降低,但是范围太小又起不到参考的效果。每一个指标异常评估模型都包括若干特征(维度),要获取每一个与特征对应的评估数据。其中,该特征可以是偏度、方差、加权平均数、峰度等指标曲线的特征。
在一个实施例中,如图4所示,步骤206,包括:
步骤402,根据偏差数值将待评估数据标记为评估通过数据或评估失败数据。
步骤404,若偏差数值小于等于预设偏差值,则将待评估数据标记为评估通过数据。
步骤406,若偏差数值大于预设偏差值,则将待评估数据标记为评估失败数据。
在一个实施例中,通过对验证集进行标注,得到验证集中指标曲线的特征的数值,作为预期评估数值,并将得到的待评估数据与对应的预期评估数值一一对比,得出待评估数据与预期评估数值之间的偏差数值。例如,对指标异常评估模型的峰度特征的某一待评估数据的数值是20,而预期评估数值是18,则该待评估数据与预设评估数值之间的偏差数值为2,;按照此种方式,对每一个评估数据都获取与之对应的预期评估数值,并计算该待评估数据与该预期评估数值之间的偏差数值。
具体地,偏差数值大于预设偏差值,为评估数据不合格,偏差数值小于等于预设偏差值,代表评估数据合格,若预设偏差值为2,则可以得出,该评估数据合格,则将该评估数据标记为评估通过数据,对评估数据的标记可以是0,其中,0表示该评估数据为评估通过数据。
可选地,同一特征下的不同评估失败数据的偏差数值还对应着不同失败类型,比如当偏差为7、5、2、4时,偏态特征的评估数据的失败类型为权值,偏差数值为3.21时,偏态特征的评估数据就的失败类型为方差等等,不一而足。
其中,获取偏度数值不一定是计算待评估数据与对比评估数值的大小,还可以对比得到的数据的数量的多寡、维度等。
当然,失败类型也可以是直接通过待评估数据得出的,比如通过验证集对偏态特征进行验证时,得出的失败数据的变量名称就是方差或者权值等,然后可以直接从评估数据中获取这些变量名称并计算每一个变量名称的数量,也可以实现以上获取评估失败数量的目的,本实施例不做限定。
本实施例中通过评估失败数据的偏差数值将评估失败数据按照失败类型划分为若干类,然后再计算每一类中评估数据的数量,可以很清楚地得出预设模型的数据预测的具体情况。
在一个实施例中,如图5所示,步骤206,:
步骤502,从评估失败数据中获取偏差类型,其中,偏差类型为待评估数据的类别属性。
待评估数据中还可以直接携带待评估数据的评估类别,比如得到的结果是权值数值、方差数值等等。可以通过从中获取评估类别作为偏差类型对评估失败数据进行分类。
步骤504,确定偏差类型在预设失败类型上的偏差分布。
预设失败类型是失败类型的失败数据分布,通过将新得出的偏差类型与预设失败类型进行对比,得到偏差类型在预设失败类型上的偏态分布直接得出该评估失败数据的失败类型,实现批量的的数据运算,提高运算效率。
具体地,偏差类型的表现形式可以是(X,Y),其中,X为预期的评估结果的类型,Y表示实际的评估结果的类型。若是对偏态特征进行预测,得出的结果可以是(偏态,方差)、(偏态,权值)或者(偏态,加权平均数)等等,其中,偏差类型可以通过字符串、数字、符号进行表示,比如用二进制0000表示偏态特征(X)、0001表示方差特征(Y)。
具体地,预设失败类型可以是二维坐标,X轴表示预期评估结果的类型,Y轴表示实际评估结果的类型。若X轴从原点0至Xi的每个单位依次分别表示偏态、方差、权值、峰度等,Y轴从原点0至Xi的每个单位依次分别也是表示偏态、方差、权值、峰度等,若偏差类型为(0000,0001),则可以认为该偏差类型落在(偏态,方差)坐标点上。
步骤506,若偏差分布为偏态数据偏方差,则确定失败类型为方差失败类型。
若偏差类型落在(偏态,方差)坐标点上,可以认为得到的偏差分布为评估失败数据是偏态数据偏方差,则可以确定该评估失败数据的失败类型为方差失败类型。通过该方式不仅可以直接得出评估失败数据的失败类型,还可以直接从数据上得到该评估失败数据是从哪种特征偏向该失败类型的结果。
进一步地,偏差类型不仅可以作为对评估失败数据失败类型的判断依据,还可以用来区分评估通过数据和评估失败数据。比如当偏差类型为(0000,0000),即X=Y时,则可以确定该待评估数据为评估通过数据。本实施例中,通过根据历史失败类型生成预设失败类型,然后作为偏差类型的参考依据,可以实现批量的数据运算,提高对失败数据的分类效率。
应该理解的是,虽然图2-图5的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-图5中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图6所示,提供了一种基于web的模型训练过程数据可视化处理装置,该基于web的模型训练过程数据可视化处理装置与上述实施例中基于web的模型训练过程数据可视化处理方法一一对应。该基于web的模型训练过程数据可视化处理装置包括:
数据采集模块602,用于采集预设模型的评估结果,并从采集到的评估结果中提取预设模型特征的特征评估数据,作为待评估数据。
偏差计算模块604,用于获取特征的预期评估数值,作为对比评估数值,并获取待评估数据相对于对比评估数值的偏差数值。
类型标记模块606,用于根据偏差数值将待评估数据标记为评估通过数据或评估失败数据,将评估通过数据作为目标成功数据,并计算目标成功数据的数量,作为目标特征数量。
失败计数模块608,用于对评估失败数据进行类型划分,得到失败特征类型,并计算与失败特征类型对应的评估失败数据的数量,作为失败特征数量。
渲染处理模块610,用于将目标特征数量以及失败特征数量与预设图像模板进行关联,生成评估结果页面以进行展示。
进一步地,渲染处理模块610,包括:
数据渲染子模块,用于对目标特征数量、失败特征数量以及预设图像模板进行渲染,并根据预设色彩标注条件在预设图像模板上对目标特征数量、失败特征数量进行颜色标注,得到评估结果页面。
进一步地,数据渲染子模块,包括:
颜色标注单元,用于根据目标特征数量以及失败特征数量的数值的大小按颜色从深到浅的顺序对目标特征数量、失败特征数量进行颜色标注。
进一步地,数据采集模块602,包括:
请求处理子模块,用于接收评估查看请求,并从评估查看请求中获取预设模型的位置索引。
结果采集子模块,用于根据位置索引从后台服务器上获取预设模型的所述评估结果。
评估获取子模块,用于从评估结果中获取预设模型的所有特征,并获取与特征对应的特征评估数据,作为待评估数据。
进一步地,偏差计算模块604,包括:
通过标记子模块,用于若偏差数值小于等于预设偏差值,则将待评估数据标记为评估通过数据。
失败标记子模块,用于若偏差数值大于所述预设偏差值,则将待评估数据标记为评估失败数据。
进一步地,失败计数模块608,包括:
类型获取子模块,用于从评估失败数据中获取偏差类型,其中,偏差类型为待评估数据的类别属性。
类型对比子模块,用于确定偏差类型在预设失败类型上的偏差分布。
型确认子模块,用于若偏差分布为偏态数据偏方差,则确定失败类型为方差失败类型。
上述基于web的模型训练过程数据可视化处理装置,通过获取评估数据与预期评估数值之间的偏差数值,然后对评估数据进行处理和分类操作,并与预设图像模板进行关联,生成评估结果页面。解决了现有技术中得到的每个特征的评估数据杂乱无序不便于后期分析的技术问题。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储用户订单数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于web的模型训练过程数据可视化处理方法。
其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中基于web的模型训练过程数据可视化处理方法的步骤,例如图2所示的步骤202至步骤210,或者,处理器执行计算机程序时实现上述实施例中基于web的模型训练过程数据可视化处理装置的各模块/单元的功能,例如图6所示模块602至模块610的功能。为避免重复,此处不再赘述。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中基于web的模型训练过程数据可视化处理方法的步骤,例如图2所示的步骤202至步骤210,或者,处理器执行计算机程序时实现上述实施例中基于web的模型训练过程数据可视化处理装置的各模块/单元的功能,例如图6所示模块602至模块610的功能。为避免重复,此处不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形、改进或者对部分技术特征进行等同替换,而这些修改或者替换,并不使相同技术方案的本质脱离本发明个实施例技术方案地精神和范畴,都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种基于web的模型训练过程数据可视化处理方法,其特征在于,包括:
采集预设模型的评估结果,并从采集到的所述评估结果中提取所述预设模型特征的特征评估数据,作为待评估数据;
获取所述特征的预期评估数值,作为对比评估数值,并获取所述待评估数据相对于所述对比评估数值的偏差数值;
根据所述偏差数值将所述待评估数据标记为评估通过数据或评估失败数据,将所述评估通过数据作为目标成功数据,并计算所述目标成功数据的数量,作为目标特征数量;
对所述评估失败数据进行类型划分,得到失败特征类型,并获取与所述失败特征类型对应的所述评估失败数据的数量,作为失败特征数量;
将所述目标特征数量以及所述失败特征数量与预设图像模板进行关联,生成评估结果页面以进行展示。
2.根据权利要求1所述的方法,其特征在于,所述将所述目标特征数量以及所述失败特征数量与预设图像模板进行关联,生成评估结果页面以进行展示,包括:
对所述目标特征数量、所述失败特征数量以及所述预设图像模板进行渲染,并根据预设色彩标注条件在所述预设图像模板上对所述目标特征数量、所述失败特征数量进行颜色标注,得到所述评估结果页面。
3.根据权利要求2所述的方法,其特征在于,所述根据预设色彩标注条件在所述预设图像模板上对所述目标特征数量、所述失败特征数量进行颜色标注,包括:
根据所述目标特征数量以及所述失败特征数量的数值的大小按颜色从深到浅的顺序对所述目标特征数量、所述失败特征数量进行颜色标注。
4.根据权利要求1所述的方法,其特征在于,所述采集预设模型的评估结果,并从采集到的所述评估结果中提取所述预设模型特征的特征评估数据,作为待评估数据,包括:
接收评估查看请求,并从所述评估查看请求中获取所述预设模型的位置索引;
根据所述位置索引从后台服务器上获取所述预设模型的所述评估结果;
从所述评估结果中获取所述预设模型的所有特征,并获取与所述特征对应的特征评估数据,作为所述待评估数据。
5.根据权利要求1所述的方法,其特征在于,所述根据所述偏差数值将所述待评估数据标记为评估通过数据或评估失败数据,包括:
若所述偏差数值小于等于预设偏差值,则将所述待评估数据标记为评估通过数据;
若所述偏差数值大于所述预设偏差值,则将所述待评估数据标记为评估失败数据。
6.根据权利要求1所述的方法,其特征在于,所述对所述评估失败数据进行类型划分,得到失败特征类型,包括:
从所述评估失败数据中获取偏差类型,其中,所述偏差类型为所述待评估数据的类别属性;
确定所述偏差类型在预设失败类型上的偏差分布;
若所述偏差分布为偏态数据偏方差,则确定所述失败类型为方差失败类型。
7.一种基于web的模型训练过程数据可视化处理装置,其特征在于,包括:
数据采集模块,用于采集预设模型的评估结果,并从采集到的所述评估结果中提取所述预设模型特征的特征评估数据,作为待评估数据;
偏差计算模块,用于获取所述特征的预期评估数值,作为对比评估数值,并获取所述待评估数据相对于所述对比评估数值的偏差数值;
类型标记模块,用于根据所述偏差数值将所述待评估数据标记为评估通过数据或评估失败数据,将所述评估通过数据作为目标成功数据,并计算所述目标成功数据的数量,作为目标特征数量;
失败计数模块,用于对所述评估失败数据进行类型划分,得到失败特征类型,并计算与所述失败特征类型对应的所述评估失败数据的数量,作为失败特征数量;
渲染处理模块,用于将所述目标特征数量以及所述失败特征数量与预设图像模板进行关联,生成评估结果页面以进行展示。
8.根据权利要求7所述的装置,其特征在于,渲染处理模块,包括:
数据渲染子模块,用于对所述目标特征数量、所述失败特征数量以及所述预设图像模板进行渲染,并根据预设色彩标注条件在所述预设图像模板上对所述目标特征数量、所述失败特征数量进行颜色标注,得到所述评估结果页面。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202010090795.5A 2020-02-13 2020-02-13 基于web的模型训练过程数据可视化处理方法、装置、设备 Active CN111404721B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010090795.5A CN111404721B (zh) 2020-02-13 2020-02-13 基于web的模型训练过程数据可视化处理方法、装置、设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010090795.5A CN111404721B (zh) 2020-02-13 2020-02-13 基于web的模型训练过程数据可视化处理方法、装置、设备

Publications (2)

Publication Number Publication Date
CN111404721A CN111404721A (zh) 2020-07-10
CN111404721B true CN111404721B (zh) 2023-07-25

Family

ID=71413856

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010090795.5A Active CN111404721B (zh) 2020-02-13 2020-02-13 基于web的模型训练过程数据可视化处理方法、装置、设备

Country Status (1)

Country Link
CN (1) CN111404721B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110135694A (zh) * 2019-04-12 2019-08-16 深圳壹账通智能科技有限公司 产品风险评估方法、装置、计算机设备和存储介质
CN110175507A (zh) * 2019-04-09 2019-08-27 文远知行有限公司 模型评估方法、装置、计算机设备和存储介质
CN110349038A (zh) * 2019-06-13 2019-10-18 中国平安人寿保险股份有限公司 风险评估模型训练方法和风险评估方法
CN110493190A (zh) * 2019-07-15 2019-11-22 平安科技(深圳)有限公司 数据信息的处理方法、装置、计算机设备和存储介质
WO2020015089A1 (zh) * 2018-07-18 2020-01-23 平安科技(深圳)有限公司 身份信息风险评定方法、装置、计算机设备和存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020015089A1 (zh) * 2018-07-18 2020-01-23 平安科技(深圳)有限公司 身份信息风险评定方法、装置、计算机设备和存储介质
CN110175507A (zh) * 2019-04-09 2019-08-27 文远知行有限公司 模型评估方法、装置、计算机设备和存储介质
CN110135694A (zh) * 2019-04-12 2019-08-16 深圳壹账通智能科技有限公司 产品风险评估方法、装置、计算机设备和存储介质
CN110349038A (zh) * 2019-06-13 2019-10-18 中国平安人寿保险股份有限公司 风险评估模型训练方法和风险评估方法
CN110493190A (zh) * 2019-07-15 2019-11-22 平安科技(深圳)有限公司 数据信息的处理方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN111404721A (zh) 2020-07-10

Similar Documents

Publication Publication Date Title
CN106327546B (zh) 人脸检测算法的测试方法和装置
CN109886719B (zh) 基于网格的数据挖掘处理方法、装置和计算机设备
CN105989144A (zh) 通知消息管理方法、装置、系统及终端设备
CN109580004A (zh) 一种温度检测方法及装置
WO2022105119A1 (zh) 意图识别模型的训练语料生成方法及其相关设备
KR20210090576A (ko) 품질을 관리하는 방법, 장치, 기기, 저장매체 및 프로그램
CN109542764B (zh) 网页自动化测试方法、装置、计算机设备和存储介质
CN108665513B (zh) 基于用户行为数据的绘图方法和装置
CN105678127A (zh) 一种身份信息的验证方法和装置
CN114241499A (zh) 表格图片识别方法、装置、设备和可读存储介质
CN113806568B (zh) 多媒体资源推荐方法、装置、电子设备及存储介质
CN111985467B (zh) 聊天记录截图处理方法、装置、计算机设备和存储介质
CN108875901B (zh) 神经网络训练方法以及通用物体检测方法、装置和系统
CN111404721B (zh) 基于web的模型训练过程数据可视化处理方法、装置、设备
CN111552696A (zh) 基于大数据的数据处理方法、装置、计算机设备和介质
CN112395450B (zh) 图片文字检测方法、装置、计算机设备及存储介质
CN114925153A (zh) 基于业务的地理信息数据质量检测方法、装置和设备
CN111078984B (zh) 网络模型发布方法、装置、计算机设备和存储介质
CN109885710B (zh) 基于差分演化算法的用户画像刻画方法及服务器
CN116804993B (zh) 一种具备时序数据特征的可视化表达方法
CN116232760B (zh) 一种诈骗网址识别预警方法、装置、设备及存储介质
CN116737437A (zh) 数据分析方法、装置、计算机设备及存储介质
CN115250200B (zh) 服务授权认证方法及其相关设备
CN113806372B (zh) 新数据信息构建方法、装置、计算机设备及存储介质
CN116977611A (zh) 图片识别方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant