CN115309958A - 基于智能语义理解的可视化建模方法 - Google Patents

基于智能语义理解的可视化建模方法 Download PDF

Info

Publication number
CN115309958A
CN115309958A CN202210862195.5A CN202210862195A CN115309958A CN 115309958 A CN115309958 A CN 115309958A CN 202210862195 A CN202210862195 A CN 202210862195A CN 115309958 A CN115309958 A CN 115309958A
Authority
CN
China
Prior art keywords
model
test
data set
source data
algorithm models
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210862195.5A
Other languages
English (en)
Inventor
姚苗
詹永川
沈杰
谭亚军
李硕
赵磊
杨李伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Business Big Data Technology Co Ltd
Original Assignee
Chengdu Business Big Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Business Big Data Technology Co Ltd filed Critical Chengdu Business Big Data Technology Co Ltd
Priority to CN202210862195.5A priority Critical patent/CN115309958A/zh
Publication of CN115309958A publication Critical patent/CN115309958A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/904Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及基于智能语义理解的可视化建模方法,包括步骤:用户输入建模任务目标,进行分词处理,得到分词结果;用户输入源数据集,获取源数据集的特征;基于分词结果确定测试模型范围;从源数据集中选择m条测试数据对测试模型范围进行测试,得到模型测试结果;从预置算法模型中选择n个预置算法模型作为备选方案,并确定对应的n组算法模型超参;将n个预置算法模型及其对应的n组算法模型超参,和源数据集的特征进行神经网络学习;学习后根据模型评估指标对n个预置算法模型进行排序后并推荐。本发明提供以智能推荐的形式,针对用户给出的建模任务目标,推荐算法模型的形式,提供给用户可以直接解决其任务目标的多种模型方案。

Description

基于智能语义理解的可视化建模方法
技术领域
本发明涉及智能推荐、人工可视化建模技术领域,特别涉及一种基于智能语义理解的可视化建模方法。
背景技术
随着云时代的到来,大数据也吸引了越来越多的关注,大数据通常用来形容一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。为了探求企业海量数据更深层次的价值,机器学习模型被应用于各个行业,各种智能系统。
目前,机器学习对用户仍有很高理论及编程技术门槛,越来越多的可视化建模平台都视图降低机器学习算法、模型使用的门槛。如拖拉拽式的可视化建模方法,虽然降低了用户的编程技术门槛,但是依然对用户有很强的理论要求,其原因在于:①可视化建模平台,以算法和模型功能的最小粒度,将算法、模型封装成一个个可以被直接使用的组件,无形之中要求用户必须掌握机器学习理论知识,了解数据的处理流程,包括对不同类型的数据需要进行不同的数据预处理、数据清洗;要求用户清楚特征处理工程知识,还要求用户明白各种神经网络的优劣势;②建立机器学习模型是服务于特定的应用场景,实现特定目标,组件式的可视化建模方法看似降低了用户的使用门槛,却因为在拖拉拽后,数据处理流、组件执行流的环环相扣,导致通过可视化建立的模型调试周期变长;③神经网络的种类及变体数量非常多,且神经网络的组合不同、网络参数不同,都会对最优模型的生成有直接影响,即使有可视化的建模方法,也需要大量实验,才能验证是否满足建模的目标。
发明内容
本发明的目的在于提供以智能推荐的形式,针对用户给出的建模任务目标,推荐算法模型的形式,提供给用户可以直接解决其任务目标的多种模型方案,使得用户可以针对设定的任务目标进行建模,进而对大数据进行分析梳理,最终得到任务结果,比如基于大数据的智能语义分析处理获得客户对商品的兴趣,从而店家可以根据兴趣推荐商品销售,故提供一种基于智能语义理解的可视化建模方法。
为了实现上述发明目的,本发明实施例提供了以下技术方案:
基于智能语义理解的可视化建模方法,包括以下步骤:
步骤S1,用户输入建模任务目标,对建模任务目标进行分词处理,得到分词结果;用户输入源数据集,并获取源数据集的特征;
步骤S2,基于分词结果确定测试模型范围;从源数据集中选择m条测试数据对测试模型范围进行测试,得到模型测试结果,所述模型测试结果中包括N个预置算法模型;
步骤S3,从N个预置算法模型中选择n个预置算法模型作为备选方案,并确定对应的n组算法模型超参,1<n≤N;
步骤S4,将n个预置算法模型及其对应的n组算法模型超参,和源数据集的特征进行神经网络学习;学习后根据模型评估指标对n个预置算法模型进行排序后并推荐。
更进一步地,所述基于分词结果确定测试模型范围的步骤,包括:基于分词结果,对算法模型库中的模型标签进行相似度计算,从而确定测试模型范围;所述算法模型库包括模型ID、模型标签、模型名称、模型描述字段,所述模型标签包括分类、聚类、预测、回归。
更进一步地,所述从源数据集中选择m条测试数据对测试模型范围进行测试,得到模型测试结果的步骤,包括:
基于源数据集的特征,从模型超参库中获取测试模型范围中各模型ID所对应的超参列表;
从源数据集中选择m条测试数据对测试模型范围进行测试,1<m<0.1M,M为源数据集的总条数,得到模型测试结果;根据模型F1值的大小对模型测试结果中得到的各预置算法模型进行排序,可视化推荐前N个预置算法模型,N>1。
更进一步地,所述确定对应的n组算法模型超参的步骤,包括:根据测试模型范围的模型ID在模型超参库中筛选出对应的n组算法模型超参,每个备选方案的算法模型超参设置有预置初始值,用户通过可视化界面方式,对预置初始值进行修改重置。
更进一步地,所述学习后根据模型评估指标对n个预置算法模型进行排序后并推荐的步骤,包括:利用可视化图标的展现形式,将n个预置算法模型依据不同的评估指标进行排序,所述评估指标包括准确率、召回率、F1值;用户从n个预置算法模型选择一个最优方案,或使用推荐的第1个方案作为本次建模任务目标的最终解决方案。
更进一步地,所述用户输入源数据集,并获取源数据集的特征的步骤,包括:根据输入的源数据集,计算统计每个特征的值分布、值缺失率,根据设定阈值x来确定特征选择结果,0.5<x<1。
更进一步地,所述将n个预置算法模型及其对应的n组算法模型超参,和源数据集的特征进行神经网络学习的步骤,包括:
将本次建模任务目标的n个预置算法模型及其对应的n组算法模型超参,和源数据集的特征,进行批量迭代学习,利用BP算法进行神经网络权重优化;
神经网络权重优化的损失函数为:
Figure DEST_PATH_IMAGE001
其中,M表示源数据集的总条数,i表示第i条测试数据,j表示第j条测试数据,xi表示第i条测试数据中的任一特征;
Figure DEST_PATH_IMAGE002
表示第i条测试数据和第j条测试数据在余弦空间的特征分度;n表示预置算法模型的数量,k表示第k个预置算法模型;
Figure DEST_PATH_IMAGE003
表示第k个预置算法模型的权重;
Figure DEST_PATH_IMAGE004
表示第i条测试数据中特征的权重偏置;
Figure DEST_PATH_IMAGE005
表示第i条测试数据的权重;
Figure DEST_PATH_IMAGE006
表示第i条测试数据中的总特征,
Figure DEST_PATH_IMAGE007
表示第j条测试数据中的总特征;
Figure DEST_PATH_IMAGE008
表示第k个预置算法模型的算法模型超参。
与现有技术相比,本发明的有益效果:
(1)本发明首先利用智能语义理解,以建模任务目标为导向,保障模型质量。其次对结构化数据中的数据,可以通过将建模任务目标字段值与其他特征值进行关联度分析,过滤关联性弱的特征,也可以通过计算特征字段值的缺失率,来过滤特征字段缺失较高的特征,从而起到特征自动选择,此过程无需人工干预,减轻了用户的工作量,也进一步提供了模型的质量。最后因为使用预置算法模型具有良好的数据流规范和标准,所以降低了建模任务流出错的可能性,提高了建模效率。
(2)本发明在得到最优模型的过程中,用户只需要通过可视化界面,提交建模任务的目标,进行源数据集输入、算法模型的参数配置、模型结果存储位置的设置,就能够完成建模。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明流程图。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性,或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
实施例1:
本发明通过下述技术方案实现,如图1所示,基于智能语义理解的可视化建模方法,包括以下步骤:
步骤S1,用户输入建模任务目标,对建模任务目标进行分词处理,得到分词结果;用户输入源数据集,并获取源数据集的特征。
用户根据自身业务需求,输入建模任务目标,比如用户需要预测客户对商品的兴趣程度以便于进行推荐时,用户可输入建模任务目标“任务1-预测客户对商品的兴趣”;再比如用户需要预测客户的违约风险以便于考虑是否合作时,用户可输入建模任务目标“任务2-预测客户违约风险”。
利用分词算法对输入的建模任务目标进行分词,得到分词结果。比如任务1进行分词后得到分词结果“预测、用户、对、商品、喜爱”,任务2进行分词后得到分词结果“预测、客户、违约、风险”。
接着用户输入源数据集,源数据集即为与建模任务目标相关的大数据,支持两种源数据集选择方式,一为本地上传,二为连接数据库。源数据集包括结构化的表格数据、文本数据、图像数据等多模态数据类型。
根据输入的源数据集,计算统计每个特征的值分布、值缺失率等指标,根据设定阈值x来确定特征选择结果,0.5<x<1。
步骤S2,基于分词结果确定测试模型范围;从源数据集中选择m条测试数据对测试模型范围进行测试,得到模型测试结果,所述模型测试结果中包括N个预置算法模型。
基于分词结果,对算法模型库中的模型标签进行相似度计算,从而确定测试模型范围;所述算法模型库包括模型ID、模型标签、模型名称、模型描述字段,所述模型标签包括但不限于分类、聚类、预测、回归。
基于源数据集的特征,从模型超参库中获取测试模型范围中各模型ID所对应的超参列表。从源数据集中选择m条测试数据对测试模型范围进行测试,1<m<0.1M,M为源数据集的总条数,得到模型测试结果。根据模型F1值的大小对模型测试结果中得到的各预置算法模型进行排序,可视化推荐前N个预置算法模型,N>1。
步骤S3,从N个预置算法模型中选择n个预置算法模型作为备选方案,并确定对应的n组算法模型超参,1<n≤N。
用户从推荐的N个预置算法模型中选择n个预置算法模型作为本次建模任务目标的备选方案,其中1<n≤N。根据测试模型范围的模型ID在模型超参库中筛选出对应的n组算法模型超参,每个备选方案的算法模型超参设置有预置初始值,用户通过可视化界面方式,对预置初始值进行修改重置。
步骤S4,将n个预置算法模型及其对应的n组算法模型超参,和源数据集的特征进行神经网络学习;学习后根据模型评估指标对n个预置算法模型进行排序后并推荐。
将本次建模任务目标的n个预置算法模型及其对应的n组算法模型超参,和源数据集的特征,进行批量迭代学习,利用BP算法进行神经网络权重优化。
神经网络权重优化的损失函数为:
Figure 447964DEST_PATH_IMAGE001
其中,M表示源数据集的总条数,i表示第i条测试数据,j表示第j条测试数据,xi表示第i条测试数据中的任一特征;
Figure 230018DEST_PATH_IMAGE002
表示第i条测试数据和第j条测试数据在余弦空间的特征分度;n表示预置算法模型的数量,k表示第k个预置算法模型;
Figure 478597DEST_PATH_IMAGE003
表示第k个预置算法模型的权重;
Figure 795178DEST_PATH_IMAGE004
表示第i条测试数据中特征的权重偏置;
Figure 671867DEST_PATH_IMAGE005
表示第i条测试数据的权重;
Figure 697592DEST_PATH_IMAGE006
表示第i条测试数据中的总特征,
Figure 292521DEST_PATH_IMAGE007
表示第j条测试数据中的总特征;
Figure 819317DEST_PATH_IMAGE008
表示第k个预置算法模型的算法模型超参。
利用可视化图标的展现形式,将n个预置算法模型依据不同的评估指标进行排序,所述评估指标包括准确率、召回率、F1值;用户从n个预置算法模型选择一个最优方案,或使用推荐的第1个方案作为本次建模任务目标的最终解决方案。
传统的AI可视化建模核心流程为:建立任务→选择数据集→选择特征工程组件→选择模型组件→选择评估指标组件→提交训练→得到模型结果。而这个流程中,特征工程包含数据拆分组件、行组件、列组件、SQL组件、数据清洗组件等,搭建模型包含逻辑回归组件、决策树组件、CNN组件、RNN组件等。看似降低了AI可视化建模的门槛,零代码搭建模型,但事实上对用户在特征工程、数据预处理以及神经网络理论上仍有较高要求。且一旦任务流程中某个组件执行失败,则搭建的模型就无法正常运行使用,模型效率极低。
本发明的AI可视化建模核心流程为:输入建模任务目标→选择数据集→模型选择(自动选择特征、预置超参列表)→提交训练→得到模型结果→选择最优模型。首先利用智能语义理解,以建模任务目标为导向,保障模型质量。其次对结构化数据中的数据,可以通过将建模任务目标字段值与其他特征值进行关联度分析,过滤关联性弱的特征,也可以通过计算特征字段值的缺失率,来过滤特征字段缺失较高的特征,从而起到特征自动选择,此过程无需人工干预,减轻了用户的工作量,也进一步提供了模型的质量。最后因为使用预置算法模型具有良好的数据流规范和标准,所以降低了建模任务流出错的可能性,提高了建模效率。
本发明不仅仅实现了零代码的AI可视化建模,更实现了以建模任务目标为初心,提供给用户可以直接解决其任务目标的多种模型方案,促进AI模型更好的落地与应用。
实施例2:
本实施例在实施例1的技术方案上做出举例说明。用户的需求是根据商品销售数据,预测客户对商品的兴趣,进行商品推荐。
第一步:输入建模任务目标“预测客户对商品的兴趣”。
第二步:对建模任务目标进行分词,得到分词结果“预测、客户、对、商品、喜爱”。
第三步:输入源数据集,即客户商品订单表,该表包括以下19个字段:产品名称、制造商、发货日期、国家/地区、地区、城市、子类别、客户名称、省/自治区、类别、细分、订单ID、订单日期、邮寄方式、利润、折扣、数量、销售额。
第四步:(1)根据输入的源数据集,统计每个特征的值分布、值缺失率等指标,设定阈值x,0.5<x<1,若缺失率大于设定阈值x,则丢弃该特征;若特征值分布越均匀则该特征对建模任务目标的影响越弱,则丢弃该特征,从而进行自动特征选择。
(2)根据建模任务目标的分词结果和算法模型库中的模型标签进行映射,得到该任务目标可选择模型标签为“预测”的模型作为测试模型范围。基于源数据集的特征,从模型超参库中获取测试模型范围中各模型ID所对应的超参列表,可参见表1。所述算法模型库包括模型ID、模型标签、模型名称、模型描述字段,所述模型标签包括分类、聚类、预测、回归。
Figure DEST_PATH_IMAGE009
表1
(3)从源数据集中选择m条测试模型测试数据对测试模型范围进行测试,1<m<0.1M,M为源数据集的总条数,得到模型测试结果。根据模型F1值的大小对模型测试结果中得到的各预置算法模型进行排序,可视化推荐前N个预置算法模型,N>1。可参见表2的示例数据,训练结果F1值排序为前3(N=3)的预置算法模型为RCNN(F1值等于92%)、GRU(F1值等于89%)、LSTM(F1值等于85%),则将这三个预置算法模型推荐给用户,供用户选择。
Figure DEST_PATH_IMAGE010
表2
第五步:用户从3个(N=3)预置算法模型中选择2个(n=2)预置算法模型RCNN、GRU,作为本次建模任务目标的备选方案,1<n≤N。
第六步:根据用户选择的2个备选方案的模型ID在模型超参库中筛选出对应的2组算法模型超参,每个备选方案的算法模型超参都有预置初始值,用户可通过可视化界面方式,对预置初始值进行修改重置。
第七步:将本次建模任务目标选择的2个备选方案和对应的2组算法模型超参,以及源数据集的特征,批量进行迭代学习,利用BP算法,进行神经网络权重优化。
第八步:利用可视化图表的展现形式,将2个备选方案依据不同的评估指标,比如:准确率、召回率、F1值等进行展示。本例中,预置RCNN模型准确率为94%,召回率为88%,F1值为91%,预置GRU模型准确率为91%,召回率为90%,F1值为90.5%。用户可根据建模任务目标,从2个备选方案中选择1个最优方案,比如用户若需要高准确率,则可选择RCNN模型,若需要高召回率,则可选择GRU模型。也可以使用系统推荐的1个最优解决方案,其中推荐规则为评估指标的加权平均和的排名方式进行推荐,即推荐RCNN模型,从而用户可以得到最终的解决方案。
上述是对任务目标“预测客户对商品的兴趣”的建模方法,在对企业大数 据的处理领域中,还可以实现对互联网支付、股权众筹、互联网基金销售、互 联网保险、互联网信托和互联网消费金融等6类互联网金融行业的监测大数据 进行任务目标建模,从而根据客户的需求获得可直接利用的模型。比如针对小 额贷款、私募基金、地方交易场所、股权众筹等四类金融业态的风险预警能力, 试点覆盖区域性股权市场、互联网支付等两类业态的风险预警。本方案基于智 能语义理解,将监测大数据作为源数据集,以建模任务目标为导向方式,基本 形成对金融企业经营风险、互联网传销风险、互联网合同诈骗风险以及空壳公司企业识别等4类金融风险的监测防控和识别能力,用户只需要通过可视化界 面,提交建模任务的目标,进行源数据集输入、算法模型的参数配置、模型结 果存储位置的设置,就能够完成建模。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (6)

1.基于智能语义理解的可视化建模方法,其特征在于:包括以下步骤:
步骤S1,用户输入建模任务目标,对建模任务目标进行分词处理,得到分词结果;用户输入源数据集,并获取源数据集的特征;
步骤S2,基于分词结果确定测试模型范围;从源数据集中选择m条测试数据对测试模型范围进行测试,得到模型测试结果,所述模型测试结果中包括N个预置算法模型;
步骤S3,从N个预置算法模型中选择n个预置算法模型作为备选方案,并确定对应的n组算法模型超参,1<n≤N;
步骤S4,将n个预置算法模型及其对应的n组算法模型超参,和源数据集的特征进行神经网络学习;学习后根据模型评估指标对n个预置算法模型进行排序后并推荐。
2.根据权利要求1所述的基于智能语义理解的可视化建模方法,其特征在于:所述基于分词结果确定测试模型范围的步骤,包括:基于分词结果,对算法模型库中的模型标签进行相似度计算,从而确定测试模型范围;所述算法模型库包括模型ID、模型标签、模型名称、模型描述字段,所述模型标签包括分类、聚类、预测、回归。
3.根据权利要求1所述的基于智能语义理解的可视化建模方法,其特征在于:所述从源数据集中选择m条测试数据对测试模型范围进行测试,得到模型测试结果的步骤,包括:
基于源数据集的特征,从模型超参库中获取测试模型范围中各模型ID所对应的超参列表;
从源数据集中选择m条测试数据对测试模型范围进行测试,1<m<0.1M,M为源数据集的总条数,得到模型测试结果;根据模型F1值的大小对模型测试结果中得到的各预置算法模型进行排序,可视化推荐前N个预置算法模型,N>1。
4.根据权利要求1所述的基于智能语义理解的可视化建模方法,其特征在于:所述确定对应的n组算法模型超参的步骤,包括:根据测试模型范围的模型ID在模型超参库中筛选出对应的n组算法模型超参,每个备选方案的算法模型超参设置有预置初始值,用户通过可视化界面方式,对预置初始值进行修改重置。
5.根据权利要求1所述的基于智能语义理解的可视化建模方法,其特征在于:所述学习后根据模型评估指标对n个预置算法模型进行排序后并推荐的步骤,包括:利用可视化图标的展现形式,将n个预置算法模型依据不同的评估指标进行排序,所述评估指标包括准确率、召回率、F1值;用户从n个预置算法模型选择一个最优方案,或使用推荐的第1个方案作为本次建模任务目标的最终解决方案。
6.根据权利要求1所述的基于智能语义理解的可视化建模方法,其特征在于:所述用户输入源数据集,并获取源数据集的特征的步骤,包括:根据输入的源数据集,计算统计每个特征的值分布、值缺失率,根据设定阈值x来确定特征选择结果,0.5<x<1。
CN202210862195.5A 2022-07-21 2022-07-21 基于智能语义理解的可视化建模方法 Pending CN115309958A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210862195.5A CN115309958A (zh) 2022-07-21 2022-07-21 基于智能语义理解的可视化建模方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210862195.5A CN115309958A (zh) 2022-07-21 2022-07-21 基于智能语义理解的可视化建模方法

Publications (1)

Publication Number Publication Date
CN115309958A true CN115309958A (zh) 2022-11-08

Family

ID=83857380

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210862195.5A Pending CN115309958A (zh) 2022-07-21 2022-07-21 基于智能语义理解的可视化建模方法

Country Status (1)

Country Link
CN (1) CN115309958A (zh)

Similar Documents

Publication Publication Date Title
Kellner et al. An a posteriori decision support methodology for solving the multi-criteria supplier selection problem
Karami et al. Supplier selection and evaluation in the garment supply chain: An integrated DEA–PCA–VIKOR approach
US20170220943A1 (en) Systems and methods for automated data analysis and customer relationship management
CN109377260A (zh) 面向服装行业的用户行为分析系统
Ghadge et al. Impact of financial risk on supply chains: a manufacturer-supplier relational perspective
CN103678457A (zh) 基于初始数据可视化确定替代性数据可视化的方法和系统
WO2016139666A1 (en) Predictive strategic outcomes by combining human crowdsourcing
CN102272758A (zh) 因果驱动和市场响应弹性或提升因素的自动规范、估计和发现
CN114219169A (zh) 颖幡供应链销售和库存预测算法模型和应用系统
Baizyldayeva et al. Multi-criteria decision support systems. Comparative analysis
BenMark et al. How retailers can drive profitable growth through dynamic pricing
CN111192161A (zh) 电力市场交易对象推荐方法、装置
Ayadi et al. Analytic hierarchy process-based approach for selecting a Pareto-optimal solution of a multi-objective, multi-site supply-chain planning problem
US20210090105A1 (en) Technology opportunity mapping
Sakalli Optimization of Production‐Distribution Problem in Supply Chain Management under Stochastic and Fuzzy Uncertainties
Sharma et al. Best seller rank (bsr) to sales: An empirical look at amazon. com
Farzamnia et al. Group decision-making process for supplier selection using MULTIMOORA technique under fuzzy environment
Zietsman et al. A generic decision support framework for inventory procurement planning in distribution centres
Ganhewa et al. Sales Optimization Solution for Fashion Retail
CN115309958A (zh) 基于智能语义理解的可视化建模方法
Astuti et al. Classification and Clustering of Internet Quota Sales Data Using C4. 5 Algorithm and K-Means
Firmansyah et al. Sales and Stock Purchase Prediction System Using Trend Moment Method and FIS Tsukamoto
Ramadhaniati PRODUCT CLUSTERING USING K-MEANS METHOD IN CV. JAYA ABADI
Huovila Use of machine learning in supply chain management: case study with DataRobot
Shil et al. A survey on existing vendor selection techniques

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination