CN110674838A - 基于组合特征筛选的模型构建方法、装置、计算机设备 - Google Patents

基于组合特征筛选的模型构建方法、装置、计算机设备 Download PDF

Info

Publication number
CN110674838A
CN110674838A CN201910752919.9A CN201910752919A CN110674838A CN 110674838 A CN110674838 A CN 110674838A CN 201910752919 A CN201910752919 A CN 201910752919A CN 110674838 A CN110674838 A CN 110674838A
Authority
CN
China
Prior art keywords
month
feature
model
information
combination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910752919.9A
Other languages
English (en)
Other versions
CN110674838B (zh
Inventor
陈远波
张海洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN201910752919.9A priority Critical patent/CN110674838B/zh
Publication of CN110674838A publication Critical patent/CN110674838A/zh
Application granted granted Critical
Publication of CN110674838B publication Critical patent/CN110674838B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2113Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了基于组合特征筛选的模型构建方法、装置、计算机设备。方法包括:若接收到用户所输入的数据信息表,根据多组预设的组合特征对数据信息表中每一月份的数据信息进行二值化以得到多个单月二维矩阵,根据预设的矩阵计算模型对所有单月二维矩阵进行计算以得到每一组合特征对应的特征计算信息,根据预设的筛选规则及特征计算信息对所有组合特征进行筛选以得到满足筛选规则的优势组合特征,根据优势组合特征及预设的模型配置信息构建得到深度学习模型。本发明基于模型构建技术,能够根据筛选得到的优势组合特征构建深度学习模型,所构建得到的模型可用于人工智能领域,可大幅提升所构建得到的模型的可靠性,使模型的输出结果更加客观、准确。

Description

基于组合特征筛选的模型构建方法、装置、计算机设备
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于组合特征筛选的模型构建方法、装置、计算机设备及存储介质。
背景技术
在基于神经网络构建分析模型、预测模型的过程中,需使用多个特征作为模型的输入节点,然而不同的特征在模型中的重要性存在较大区别,也即是不同的特征对模型的输出结果具有不同的影响。传统的模型构建过程中均是将所有特征作为模型的输入节点,或是通过人工选择的方式对特征进行组合及筛选后将得到的部分组合特征作为模型的输入节点,然而通过人工选择的方式所选择得到的组合特征构建的模型无法获取客观、准确的输出结果,导致所构建模型的可靠性无法满足用户的使用需求。因而,现有的技术方法存在所构建模型的可靠性不高的问题。
发明内容
本发明实施例提供了一种基于组合特征筛选的模型构建方法、装置、计算机设备及存储介质,旨在解决现有技术方法中存在所构建模型的可靠性不高的问题。
第一方面,本发明实施例提供了一种基于组合特征筛选的模型构建方法,其包括:
若接收到用户所输入的数据信息表,根据多组预设的组合特征对所述数据信息表中每一月份的数据信息进行二值化以得到多个单月二维矩阵,其中,所述数据信息表中包含多个连续月份的数据信息;
根据预设的矩阵计算模型对所有所述单月二维矩阵进行计算以得到每一所述组合特征对应的特征计算信息,其中,所述特征计算信息包括逐月饱和度、逐月重要度、饱和度变异系数及重要度变异系数;
根据预设的筛选规则及所述特征计算信息对所有所述组合特征进行筛选以得到满足所述筛选规则的优势组合特征,其中,所述筛选规则包括保留规则及剔除规则;
根据所述优势组合特征及预设的模型配置信息构建得到深度学习模型,其中,所述模型配置信息包括节点比值信息及输出节点信息。
第二方面,本发明实施例提供了一种基于组合特征筛选的模型构建装置,其包括:
数据信息二值化单元,用于若接收到用户所输入的数据信息表,根据多组预设的组合特征对所述数据信息表中每一月份的数据信息进行二值化以得到多个单月二维矩阵,其中,所述数据信息表中包含多个连续月份的数据信息;
特征计算信息获取单元,用于根据预设的矩阵计算模型对所有所述单月二维矩阵进行计算以得到每一所述组合特征对应的特征计算信息,其中,所述特征计算信息包括逐月饱和度、逐月重要度、饱和度变异系数及重要度变异系数;
组合特征筛选单元,用于根据预设的筛选规则及所述特征计算信息对所有所述组合特征进行筛选以得到满足所述筛选规则的优势组合特征,其中,所述筛选规则包括保留规则及剔除规则;
模型构建单元,用于根据所述优势组合特征及预设的模型配置信息构建得到深度学习模型,其中,所述模型配置信息包括节点比值信息及输出节点信息。
第三方面,本发明实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的基于组合特征筛选的模型构建方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的基于组合特征筛选的模型构建方法。
本发明实施例提供了一种基于组合特征筛选的模型构建方法、装置、计算机设备及存储介质。根据组合特征从数据信息表中获取到多个单月二维矩阵,计算得到每一组合特征的特征计算信息,根据筛选规则及特征计算信息对组合特征进行筛选得到优势组合特征,根据优势组合特征及模型配置信息构建得到深度学习模型。通过上述方法,所获取到的优势组合特征的重要性高于其他组合特征,基于筛选得到的优势组合特征构建深度学习模型,所构建得到的模型可用于智能分析、智能预测等人工智能领域,可大幅提升所构建得到的模型的可靠性,使模型的输出结果更加客观、准确,在实际应用过程中取得了良好的技术效果。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于组合特征筛选的模型构建方法的流程示意图;
图2为本发明实施例提供的基于组合特征筛选的模型构建方法的子流程示意图;
图3为本发明实施例提供的基于组合特征筛选的模型构建方法的另一子流程示意图;
图4为本发明实施例提供的基于组合特征筛选的模型构建方法的另一子流程示意图;
图5为本发明实施例提供的基于组合特征筛选的模型构建方法的另一子流程示意图;
图6为本发明实施例提供的基于组合特征筛选的模型构建方法的另一流程示意图;
图7为本发明实施例提供的基于组合特征筛选的模型构建装置的示意性框图;
图8为本发明实施例提供的基于组合特征筛选的模型构建装置的子单元示意性框图;
图9为本发明实施例提供的基于组合特征筛选的模型构建装置的另一子单元示意性框图;
图10为本发明实施例提供的基于组合特征筛选的模型构建装置的另一子单元示意性框图;
图11为本发明实施例提供的基于组合特征筛选的模型构建装置的另一子单元示意性框图;
图12为本发明实施例提供的基于组合特征筛选的模型构建装置的另一示意性框图;
图13为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1,图1是本发明实施例提供的基于组合特征筛选的模型构建方法的流程示意图。该基于组合特征筛选的模型构建方法应用于用户终端中,该方法通过安装于用户终端中的应用软件进行执行,用户终端即是用于执行基于组合特征筛选的模型构建方法以对构建得到深度学习模型的终端设备,例如台式电脑、笔记本电脑、平板电脑或手机等。
如图1所示,该方法包括步骤S110~S140。
S110、若接收到用户所输入的数据信息表,根据多组预设的组合特征对所述数据信息表中每一月份的数据信息进行二值化以得到多个单月二维矩阵。
若接收到用户所输入的数据信息表,根据多组预设的组合特征对所述数据信息表中每一月份的数据信息进行二值化以得到多个单月二维矩阵。组合特征可由用户预先配置,每一组组合特征均是有多个特征进行组合所得到的,组合特征还可根据特征组合规则从数据信息表中进行获取。数据信息表中包含多条数据,数据信息表中还包含多个项目及一个响应条件,每一项目即对应一个特征。数据表中的每一条数据中还包含每一项目对应的项目值,也即是该条数据所包含的数据信息;其中,所述数据信息表中包含多个连续月份的数据信息,可通过月份信息对数据信息表进行拆分以得到每一月份对应的数据信息。数据信息表中还包括每一条数据对应的响应信息,响应信息即是用于对每一条数据是否响应该响应条件进行记录的信息。
例如,数据信息表中所包含数据信息如表1所示。
Figure BDA0002167804480000051
表1
根据多组预设的组合特征即可对数据信息表进行二值化以得到对应的二值化数值,二值化即是用“0”或“1”对数据信息进行表示的信息,通过将数据信息表进行二值化即可得到多个单月二维矩阵。计算机无法对数据信息表中的文字信息进行计算,但可对二值化数值进行计算,因此可根据二值化数值对数据信息表中的信息进行量化计算。针对一个月份的数据信息进行二值化即可得到一个单月二维矩阵,数据信息表中包含多个月份的数据信息,因此可对应得到多个单月二维矩阵。
在一实施例中,如图2所示,步骤S110包括子步骤S111、S112、S113和S114。
S111、根据月份信息从所述数据信息表中拆分得到每一月份的数据信息。
根据月份信息从所述数据信息表中拆分得到每一月份的数据信息。具体的,数据信息表中包含月份信息,根据月份信息即可从数据信息表中获取得到每一个月的数据信息,并获取每一条数据对应的响应信息,将单个月份的数据信息与每一条数据的响应信息进行组合即可得到该月份对应的数据信息,也即是拆分得到的每一月份的数据信息中均包含多个项目及每一条数据对应的响应信息,每一月份的数据信息中所包含的多个项目均相同,每一项目即对应组合特征中的一个特征。
例如,对表1中的数据信息表进行拆分所得到的一个月份的数据信息如表2所示。
Figure BDA0002167804480000061
表2
S112、获取每一月份的数据信息中与所有所述组合特征对应的单月特征数据。
获取每一月份的数据信息中与所有所述组合特征对应的单月特征数据。每一组合特征中均包含多个项目,根据一个组合特征所包含的项目即可获取得到一个月份的数据信息与该组合特征对应的一份单月特征数据,根据N个组合特征即可从M个月份的数据信息中获取得到对应的N×M份单月特征数据。若从数据信息表中获取得到18个月份的数据信息,根据10个组合特征分别从18个月份的数据信息中获取得到与所有组合特征对应的180份单月特征数据。
例如,某一组合特征中包括购买本公司产品及VIP,则根据表2中的数据信息获取与该组合特征对应的单月特征数据如表3所示。
表3
S113、根据所有所述组合特征对每一所述单月特征数据进行二值化以得每一所述单月特征数据对应的一维数组。
根据所有所述组合特征对每一所述单月特征数据进行二值化以得每一所述单月特征数据对应的一维数组。根据一个组合特征对一个单月特征数据进行二值化即可得到一组包含多个二值化数值的一维数组。
具体的,某一个组合特征为某一组合特征中包括购买本公司产品及VIP,若某一客户在“购买本公司产品”的项目值为“是”且“VIP”的项目值为“是”,则将该客户对应的二值化数值记“1”;否则将该客户对应的二值化数值记为“0”。
例如,根据上述组合特征对表3中的单月特征数据进行二值化得到对应的一个一维数组如表4所示。
组合特征1
客户A 0
客户B 0
客户C 1
客户D 0
表4
S114、根据月份信息对所述一维数组进行组合以得到每一月份对应的单月二维矩阵。
根据月份信息对所述一维数组进行组合以得到每一月份对应的单月二维矩阵。将一个月份所包含的所有一维数组及响应信息对应转换得到的响应信息数组进行组合即可得到与该月份对应的一个单月二维矩阵。在获取单月二维矩阵时,还需对响应条件进行二值化。
例如,对“潜在客户”这一响应条件进行二值化时,若“潜在客户”的响应信息为“是”则将该响应信息对应的二值化数值记为“1”;若“潜在客户”的响应信息为“否”则将该响应信息对应的二值化数值记“0”。
例如,根据多个组合特征中二值化规则获取得到某一月份对应的单月二维矩阵如表5所示。
Figure BDA0002167804480000071
表5
S120、根据预设的矩阵计算模型对所有所述单月二维矩阵进行计算以得到每一所述组合特征对应的特征计算信息,其中,所述特征计算信息包括逐月饱和度、逐月重要度、饱和度变异系数及重要度变异系数。
根据预设的矩阵计算模型对所有所述单月二维矩阵进行计算以得到每一所述组合特征对应的特征计算信息。具体的,矩阵计算模型即是用于对所得到的单月二维矩阵进行计算的模型,矩阵计算模型中包括饱和度计算公式计算、重要度计算公式、饱和度变异系数计算公式及重要度变异系数计算公式。根据饱和度计算公式对所有单月二维矩阵进行计算即可得到每一组合特征对应的逐月饱和度,根据重要度计算公式对所有单月二维矩阵进行计算即可得到每一组合特征对应的逐月重要度,根据饱和度变异系数计算公式对每一组合特征的逐月饱和度进行计算即可得到每一组合特征的饱和度变异系数,根据重要度变异系数计算公式对每一组合特征的逐月重要度进行计算即可得到每一组合特征的重要度变异系数,也即是得到每一组合特征的特征计算信息。
在一实施例中,如图3所示,步骤S120包括子步骤S121、S122、S123和S124。
S121、根据所述矩阵计算模型中的饱和度计算公式计算所有单月二维矩阵中每一组合特征对应的饱和度以得到每一所述组合特征的逐月饱和度。
根据所述矩阵计算模型中的饱和度计算公式Tni=fni/(fni+gni)计算所有单月二维矩阵中每一组合特征对应的饱和度以得到每一所述组合特征的逐月饱和度,其中,Tni为组合特征i在第n月份的饱和度,fni为组合特征i在第n个单月二维矩阵中二值化数值为“1”的数量,gni为组合特征i在第n个单月二维矩阵中二值化数值为“0”的数量。根据饱和度计算公式对所有单月二维矩阵进行计算即可得到每一组合特征在所有月份的饱和度,获取一个组合特征在所有月份的饱和度即可得到该组合特征的逐月饱和度,根据上述方法即可获取每一组合特征的逐月饱和度。
若组合特征1在月份1的单月二维矩阵中二值化数值为“1”的数量是“22”,在该单月二维矩阵中二值化数值为“0”的数量是“78”,则对应计算得到组合特征1在月份1的饱和度T=22/(22+78)=0.22。
例如,通过上述方法计算得到某一组合特征的逐月饱和度如表6所示。
月份 月份1 月份2 月份3 月份4 月份5
组合特征1 0.22 0.16 0.29 0.41 0.19
表6
S122、根据所述矩阵计算模型中的重要度计算公式计算所有单月二维矩阵中每一组合特征对应的重要度以得到每一所述组合特征的逐月重要度。
根据所述矩阵计算模型中的重要度计算公式计算所有单月二维矩阵中每一组合特征对应的重要度以得到每一所述组合特征的逐月重要度。具体的,重要度计算公式为:Uni=(sni1/(sni1+rni1)-sni0/(sni0+rni0))×ln((sni1×(sni0+rni0))/(sni0×(sni1+rni1)))+(rni1/(sni1+rni1)-rni0/(sni0+rni0))×ln((rni1×(sni0+rni0))/(rni0×(sni1+rni1))),其中,Uni为组合特征i在第n月份的重要度,sni1为组合特征i在第n个单月二维矩阵中二维数值为“1”且响应信息二值化数值为“1”的数量,rni1为组合特征i在第n个单月二维矩阵中二维数值为“1”且响应信息二值化数值为“0”的数量,sni0为组合特征i在第n个单月二维矩阵中二维数值为“0”且响应信息二值化数值为“1”的数量,rni0为组合特征i在第n个单月二维矩阵中二维数值为“0”且响应信息二值化数值为“0”的数量。
根据重要度计算公式对所有单月二维矩阵进行计算即可得到每一组合特征在所有月份的重要度,获取一个组合特征在所有月份的重要度即可得到该组合特征的逐月重要度,根据上述方法即可获取每一组合特征的逐月重要度。
S123、根据所述矩阵计算模型中的饱和度变异系数计算公式
Figure BDA0002167804480000091
计算得到每一所述组合特征的饱和度变异系数。
根据所述矩阵计算模型中的饱和度变异系数计算公式即可计算得到每一所述组合特征的饱和度变异系数,其中,Bi为组合特征i的饱和度变异系数,FTi为组合特征i在所有月份中饱和度的标准差,
Figure BDA0002167804480000093
为组合特征i在所有月份中的饱和度平均值。具体的,饱和度变异系数即可用于对该组合特征的饱和度在所有月份中的波动程度进行量化。
例如,对表6中组合特征1的逐月饱和度进行计算,得到组合特征1的饱和度在所有月份中的标准差FT1=0.0996,计算得到组合特征1的饱和度平均值
Figure BDA0002167804480000094
组合特征1的饱和度变异系数
Figure BDA0002167804480000095
S124、根据所述矩阵计算模型中的重要度变异系数计算公式
Figure BDA0002167804480000096
计算得到每一所述组合特征的重要度变异系数。
根据所述矩阵计算模型中的重要度变异系数计算公式
Figure BDA0002167804480000097
即可计算得到每一所述组合特征的重要度变异系数,其中,Zi为组合特征i的重要度变异系数,FUi为组合特征i在所有月份中重要度的标准差,
Figure BDA0002167804480000101
为组合特征i在所有月份中的重要度平均值。重要度变异系数即可用于对该组合特征的重要度在所有月份中的波动程度进行量化,具体的计算过程与饱和度变异系数类似,在此不作赘述。
S130、根据预设的筛选规则及所述特征计算信息对所有所述组合特征进行筛选以得到满足所述筛选规则的优势组合特征,其中,所述筛选规则包括保留规则及剔除规则。
根据预设的筛选规则及所述特征计算信息对所有所述组合特征进行筛选以得到满足所述筛选规则的优势组合特征。具体的,筛选规则即是用于对所有组合特征进行筛选以获取得到优势组合特征的规则信息,通过筛选规则结合所得到的特征计算信息即可从所有组合特征中筛选得到满足要求的优势组合特征,使用优势组合特征作为分析模型、预测模型等模型的输入节点,可大幅提高模型输入结果的准确率。具体的,筛选规则中包括保留规则及剔除规则。
在一实施例中,如图4所示,步骤S130包括子步骤S131、S132和S133。
S131、对每一所述组合特征的特征计算信息是否满足所述保留规则进行判断,以获取满足所述保留规则的第一组合特征及不满足所述保留规则的第二组合特征。
对每一所述组合特征的特征计算信息是否满足所述保留规则进行判断,以获取满足所述保留规则的第一组合特征及不满足所述保留规则的第二组合特征。具体的保留规则中可包含一条或多条规则,若某一组合特征满足保留规则中的任一条规则,则判断得到该组合特征满足保留规则,将该组合特征作为第一组合特征;若某一组合特征不满足保留规则中的任一条规则,则判断得到该组合特征不满足保留规则,将该组合特征作为第二组合特征。
具体的,保留规则中所包含的规则可以是:重要度平均值的绝对值大于阈值α且饱和度变异系数小于阈值γ,重要度平均值的绝对值大于α且饱和度平均值大于阈值β。
例如,保留规则中仅包含一条规则为:重要度平均值的绝对值大于阈值α=0.35且饱和度变异系数小于阈值γ=0.40,则将满足该条保留规则的组合特征作为第一组合特征;将不满足该条保留规则的组合特征作为第二组合特征。
S132、对每一所述第二组合特征的特征计算信息是否满足所述剔除规则进行判断,将满足所述剔除规则的组合特征进行剔除以得到第三组合特征。
对每一所述第二组合特征的特征计算信息是否满足所述剔除规则进行判断,将满足所述剔除规则的组合特征进行剔除以得到第三组合特征。具体的剔除规则中可包含一条或多条规则,若某一组合特征满足剔除规则中的任一条规则,则判断得到该组合特征满足剔除规则,将该组合特征从第二组合特征中剔除;若某一组合特征不满足剔除规则中每一条规则,则判断得到该组合特征不满足剔除规则,不对该组合特征进行剔除处理。
具体的,剔除规则中所包含的规则可以是:饱和度间隔月份差值大于阈值η,重要度间隔月份差值大于阈值λ,逐月重要度中同时包含正值及负值,逐月重要度中最大值与逐月重要度中最小值的差大于阈值σ,(饱和度平均值-逐月饱和度后三位的均值)/饱和度平均值的计算结果大于阈值ν,饱和度平均值或重要度平均值均为“0”。
S133、获取所述第一组合特征及所述第三组合特征作为所得到的优势组合特征。
获取所述第一组合特征及所述第三组合特征作为所得到的优势组合特征。将所得到的第一组合特征及第三组合特征作为满足筛选规则的组合特征,也即是最终所得到的优势组合特征。
S140、根据所述优势组合特征及预设的模型配置信息构建得到深度学习模型,其中,所述模型配置信息包括节点比值信息及输出节点信息。
根据所述优势组合特征及预设的模型配置信息构建得到深度学习模型。优势组合特征对于模型中输出结果的影响大于其他组合特征,也即是优势组合特征的重要性高于其他组合特征,因而基于优势组合特征所构建得到的深度学习模型中不同样本之间的输出结果差异更加明显,从而能够使模型的输出结果更加客观、准确,因此大幅提升了所构建得到的模型的可靠性。具体的,可根据所得到的多个优势组合特征构建得到深度学习模型的输入节点,每一个优势组合特征对应一个输入节点。模型配置信息中包括节点比值信息及输出节点信息,节点比值信息即是所生成深度学习模型中的中间层节点与输入节点数量的比值信息,所有中间层节点也即组成了深度学习模型中的全连接隐层;输出节点信息中包含至少一个输出节点及用于对每一输出节点对应的输出值进行描述的描述信息,也即是输出节点可以为一个或多个,输出节点的具体数值即是输出节点值,也即是输入深度学习模型中样本与该输出节点的匹配度。
例如,模型配置信息中的输出节点信息包含两个输出节点,第一个输出节点的描述信息为“潜在客户”,第二个输出节点的描述信息为“非潜在客户”,则对应生成的深度学习模型中包含两个输出节点。
根据优势组合特征及模型配置信息最终构建得到的深度学习模型由输入节点、全连接隐层、输出节点及模型公式组构成。其中,全连接隐层即是用于对输入节点与输出节点进行联系的中间层,模型配置信息中全连接隐层可以为一层或多层。以模型配置信息中仅包含一层全连接隐层为例,全连接隐层中包含若干个中间层节点,每一个中间层节点均与所有输入节点和所有输出节点进行关联,中间层节点即可用于反映深度学习模型中每一优势组合特征与每一输出节点之间的关系。模型公式组即是用于在输入节点、全连接隐层及输出节点之间建立关联关系,模型公式组中包含用于在输入节点与全连接隐层之间建立关联关系的第一公式组、在全连接隐层与输出节点之间建立关联关系的第二公式组。
在一实施例中,如图5所示,步骤S140包括子步骤S141、S142和S143。
S141、根据所述优势组合特征构建所述深度学习模型的输入节点。
根据所述优势组合特征构建所述深度学习模型的输入节点。具体的,每一个优势组合特征对应生成一个输入节点,因此可根据所得到的多个优势组合特征对应生成相同数量的输入节点,每一个输入节点均对应一个输入节点值,输入节点值为“0”或“1”;“1”表示当前输入该输入节点的样本满足该输入节点对应的优势组合特征,“0”则表示当前输入该输入节点的样本不满足该输入节点对应的优势组合特征。
例如,以客户作为样本,某一客户的信息如表7所示。
Figure BDA0002167804480000121
表7
组合特征1为所得到的一个优势组合特征,则根据组合特征1对客户E进行判断得到,客户E不满足组合特征1,将该客户作为一个样本输入所构建的深度学习模型,则组合特征1对应的输入节点的输入节点值即为“0”。
S142、根据所述优势组合特征及所述节点比值信息构建所述深度学习模型的全连接隐层。
根据所述优势组合特征及所述节点比值信息构建所述深度学习模型的全连接隐层。中间层节点的数量可根据节点比值信息及优势组合特征的数量计算得到,根据所计算得到的中间层节点的数量即可生成包含多个中间层节点的全连接隐层,其中,节点比值信息可设置的数值范围为[0.4,0.8]。
例如,节点节点比值信息为0.6,优势组合特征的数量为28,则对应计算得到中间层节点的数量为28×0.6=16.8,所得结果取整为16,则生成包含16个中间层节点的全连接隐层。
S143、根据所述输入节点、所述全连接隐层及所述输出节点信息构建模型公式组以构建得到深度学习模型。
根据所述输入节点、所述全连接隐层及所述输出节点信息构建所述深度学习模型中的模型公式组,以构建得到深度学习模型。具体的,模型公式组中包含第一公式组及第二公式组,第一公式组及第二公式组中均包含多个公式,第一公式组中的公式用于表示输入节点与全连接隐层中每一中间层节点之间的关联关系,第二公式组中的公式用于表示全连接隐层中每一中间层节点与输出节点之间的关联关系。
在一实施例中,步骤S143包括子步骤S1431和S1432。
S1431、根据所述全连接隐层所包含的所有中间层节点及所述输入节点,以输入节点值作为输入值、中间层节点的节点值作为输出值构建输入节点至中间层节点的第一公式组。
其中,第一公式组包含所有输入节点至相应中间层节点的公式,每一输入节点与所有中间层节点之间公式的格式均相同,仅公式中的参数值存在差异,公式中的参数值均由随机生成的随机数进行配置,公式中的参数值可为正数或负数。输入节点即是深度学习模型中用于对某样本的信息进行输入的节点,输入节点的具体数值即为输入节点值,中间层节点的节点值即是全连接隐层中该中间层节点对应的计算值。
例如,某一输入节点的输入节点值为x1,某一中间层节点的节点值为y1,则该输入节点至该中间层节点的公式为y1=v×x1+w;其中,v和w为该公式中的参数值,v和w可为正数或负数。
S1432、根据所述全连接隐层所包含的所有中间层节点及所述输出节点信息,以中间层节点的节点值作为输入值、输出节点信息中每一输出节点的输出节点值作为输出值构建中间层节点至输出节点的第二公式组。
其中,输出节点信息中包含一个或多个输出节点,第二公式组包含所有中间层节点至相应输出节点的公式,每一中间层节点与输出节点之间公式的格式均相同,仅公式中的参数值存在差异,公式中的参数值均由随机生成的随机数进行配置,公式中的参数值可为正数或负数。输出节点即是深度学习模型中用于进行输出信息的节点,中间层节点的节点值即是全连接隐层中该中间层节点对应的计算值。
例如,某一中间层节点的节点值为y1,某一输出节点的输出节点值为z1,则该中间层节点至该输出节点的公式为z1=p×y1+t;其中,p和t为该公式中的参数值。
在一实施例中,如图6所示,步骤S140之后还包括步骤S150。
S150、根据预设的模型训练参数及预设的训练信息库对所述深度学习模型进行训练以得到训练后的深度学习模型。
根据预设的模型训练参数及预设的训练信息库对所述深度学习模型进行训练以得到训练后的深度学习模型。具体的,每一组模型训练参数中均包括学习率、训练次数以及训练终止条件,学习率即是对深度学习模型的模型公式组中公式的参数值进行调整的幅度,训练次数即是对深度学习模型进行训练的最大次数,训练终止条件即是对深度学习模型的训练进行终止的条件信息,若达到训练终止条件或达到预设的训练次数,则终止对深度学习模型的训练。训练信息库中包含多条训练数据,每一条训练数据中均包含与数据信息表中每一项目对应的项目值,每一条训练数据还包括与该训练数据对应的预设响应信息。
在一实施例中,步骤S150包括子步骤S151和S152。
S151、获取预设的一组训练参数及所述训练信息库中所包含的训练数据对所述深度学习模型进行训练以得到该组训练参数的模型准确率。
获取预设的一组训练参数及所述训练信息库中所包含的训练数据对所述深度学习模型进行训练以得到该组训练参数的模型准确率。具体的,将训练信息库中的一条训练数据输入深度学习模型,获取深度学习模型所输出的每一输出节点的输出节点值,也即是每一输出节点与该条训练数据的匹配度,获取匹配度最高的输出节点作为该条训练数据的输出结果。根据上述方法即可获取训练信息库中的一条训练数据的输出结果,统计输出结果与预设响应信息相匹配的训练数据在所有训练数据中的占比作为所有训练数据的匹配概率。
例如,训练信息库中所包含的训练数据有1000条,1000条训练数据的输出结果中与预设响应信息相匹配的训练数据为683条,则本次训练中所有训练数量的匹配概率为68.3%。
根据第一次训练所得到的匹配概率及该组训练参数对深度学习模型中所包含公式的参数值进行调整,即完成对该深度学习模型的一次训练,反复执行上述过程,直到达到训练终止条件或达到预设的训练次数,则终止对深度学习模型的训练,得到最后一次训练过程中所有训练参数的匹配概率作为该组训练参数的模型准确率。通过上述方法将所预设的多组训练参数依次输入深度学习模型进行训练,得到所有训练参数的模型准确率。
S152、根据所得到的多组训练参数的模型准确率选择最优的一组训练参数对深度学习模型中所包含公式的参数值进行设置以得到训练后的深度学习模型。
根据所得到的多组训练参数的模型准确率选择最优的一组训练参数对深度学习模型中所包含公式的参数值进行设置,即可得到训练后的深度学习模型。具体的,选择模型准确率最高的一组训练参数,将该组训练参数对深度学习模型进行训练时最后一次训练过程中,所得到的模型公式组中每一公式的参数值作为训练后的深度学习模型中相应公式的参数值,即可最终得到训练后的深度学习模型。
在本发明实施例所提供的基于组合特征筛选的模型构建方法中,根据组合特征从数据信息表中获取到多个单月二维矩阵,计算得到每一组合特征的特征计算信息,根据筛选规则及特征计算信息对组合特征进行筛选得到优势组合特征,根据优势组合特征及模型配置信息构建得到深度学习模型。通过上述方法,所获取到的优势组合特征的重要性高于其他组合特征,基于筛选得到的优势组合特征构建深度学习模型,所构建得到的模型可用于智能分析、智能预测等人工智能领域,可大幅提升所构建得到的模型的可靠性,使模型的输出结果更加客观、准确,在实际应用过程中取得了良好的技术效果。
本发明实施例还提供一种基于组合特征筛选的模型构建装置,该基于组合特征筛选的模型构建装置用于执行前述基于组合特征筛选的模型构建方法的任一实施例。具体地,请参阅图7,图7是本发明实施例提供的基于组合特征筛选的模型构建装置的示意性框图。该基于组合特征筛选的模型构建装置可以配置于台式电脑、笔记本电脑、平板电脑或手机等用户终端中。
如图7所示,基于组合特征筛选的模型构建装置100包括数据信息二值化单元110、特征计算信息获取单元120、组合特征筛选单元130和模型构建单元140。
数据信息二值化单元110,用于若接收到用户所输入的数据信息表,根据多组预设的组合特征对所述数据信息表中每一月份的数据信息进行二值化以得到多个单月二维矩阵。
若接收到用户所输入的数据信息表,根据多组预设的组合特征对所述数据信息表中每一月份的数据信息进行二值化以得到多个单月二维矩阵。组合特征可由用户预先配置,每一组组合特征均是有多个特征进行组合所得到的,组合特征还可根据特征组合规则从数据信息表中进行获取。其中,所述数据信息表中包含多个连续月份的数据信息,数据信息表中还包含多个项目及一个响应条件,每一项目即对应一个特征。数据表中的每一条数据中还包含每一项目对应的项目值,也即是该条数据所包含的数据信息;数据信息表中还包含月份信息,可通过月份信息对数据信息表进行拆分以得到每一月份对应的数据信息。数据信息表中还包括每一条数据对应的响应信息,响应信息即是用于对每一条数据是否响应该响应条件进行记录的信息。
根据多组预设的组合特征即可对数据信息表进行二值化以得到对应的二值化数值,二值化即是用“0”或“1”对数据信息进行表示的信息,通过将数据信息表进行二值化即可得到多个单月二维矩阵。计算机无法对数据信息表中的文字信息进行计算,但可对二值化数值进行计算,因此可根据二值化数值对数据信息表中的信息进行量化计算。针对一个月份的数据信息进行二值化即可得到一个单月二维矩阵,数据信息表中包含多个月份的数据信息,因此可对应得到多个单月二维矩阵。
其他发明实施例中,如图8所示,所述数据信息二值化单元110包括子单元:数据信息表拆分单元111、单月特征数据获取单元112、单月特征数据二值化单元113和数组组合单元114。
数据信息表拆分单元111,用于根据月份信息从所述数据信息表中拆分得到每一月份的数据信息。
根据月份信息从所述数据信息表中拆分得到每一月份的数据信息。具体的,数据信息表中包含月份信息,根据月份信息即可从数据信息表中获取得到每一个月的数据信息,并获取每一条数据对应的响应信息,将单个月份的数据信息与每一条数据的响应信息进行组合即可得到该月份对应的数据信息,也即是拆分得到的每一月份的数据信息中均包含多个项目及每一条数据对应的响应信息,每一月份的数据信息中所包含的多个项目均相同,每一项目即对应组合特征中的一个特征。
单月特征数据获取单元112,用于获取每一月份的数据信息中与所有所述组合特征对应的单月特征数据。
获取每一月份的数据信息中与所有所述组合特征对应的单月特征数据。每一组合特征中均包含多个项目,根据一个组合特征所包含的项目即可获取得到一个月份的数据信息与该组合特征对应的一份单月特征数据,根据N个组合特征即可从M个月份的数据信息中获取得到对应的N×M份单月特征数据。
单月特征数据二值化单元113,用于根据所有所述组合特征对每一所述单月特征数据进行二值化以得每一所述单月特征数据对应的一维数组。
根据所有所述组合特征对每一所述单月特征数据进行二值化以得每一所述单月特征数据对应的一维数组。根据一个组合特征对一个单月特征数据进行二值化即可得到一组包含多个二值化数值的一维数组。
数组组合单元114,用于根据月份信息对所述一维数组进行组合以得到每一月份对应的单月二维矩阵。
根据月份信息对所述一维数组进行组合以得到每一月份对应的单月二维矩阵。将一个月份所包含的所有一维数组及响应信息对应转换得到的响应信息数组进行组合即可得到与该月份对应的一个单月二维矩阵。在获取单月二维矩阵时,还需对响应条件进行二值化。
特征计算信息获取单元120,用于根据预设的矩阵计算模型对所有所述单月二维矩阵进行计算以得到每一所述组合特征对应的特征计算信息,其中,所述特征计算信息包括逐月饱和度、逐月重要度、饱和度变异系数及重要度变异系数。
根据预设的矩阵计算模型对所有所述单月二维矩阵进行计算以得到每一所述组合特征对应的特征计算信息。具体的,矩阵计算模型即是用于对所得到的单月二维矩阵进行计算的模型,矩阵计算模型中包括饱和度计算公式计算、重要度计算公式、饱和度变异系数计算公式及重要度变异系数计算公式。根据饱和度计算公式对所有单月二维矩阵进行计算即可得到每一组合特征对应的逐月饱和度,根据重要度计算公式对所有单月二维矩阵进行计算即可得到每一组合特征对应的逐月重要度,根据饱和度变异系数计算公式对每一组合特征的逐月饱和度进行计算即可得到每一组合特征的饱和度变异系数,根据重要度变异系数计算公式对每一组合特征的逐月重要度进行计算即可得到每一组合特征的重要度变异系数,也即是得到每一组合特征的特征计算信息。
其他发明实施例中,如图9所示,所述特征计算信息获取单元120包括子单元:逐月饱和度计算单元121、逐月重要度计算单元122、饱和度变异系数计算单元123和重要度变异系数计算单元124。
逐月饱和度计算单元121,用于根据所述矩阵计算模型中的饱和度计算公式计算所有单月二维矩阵中每一组合特征对应的饱和度以得到每一所述组合特征的逐月饱和度。
根据所述矩阵计算模型中的饱和度计算公式Tni=fni/(fni+gni)计算所有单月二维矩阵中每一组合特征对应的饱和度以得到每一所述组合特征的逐月饱和度,其中,Tni为组合特征i在第n月份的饱和度,fni为组合特征i在第n个单月二维矩阵中二值化数值为“1”的数量,gni为组合特征i在第n个单月二维矩阵中二值化数值为“0”的数量。根据饱和度计算公式对所有单月二维矩阵进行计算即可得到每一组合特征在所有月份的饱和度,获取一个组合特征在所有月份的饱和度即可得到该组合特征的逐月饱和度,根据上述方法即可获取每一组合特征的逐月饱和度。
逐月重要度计算单元122,用于根据所述矩阵计算模型中的重要度计算公式计算所有单月二维矩阵中每一组合特征对应的重要度以得到每一所述组合特征的逐月重要度。
根据所述矩阵计算模型中的重要度计算公式计算所有单月二维矩阵中每一组合特征对应的重要度以得到每一所述组合特征的逐月重要度。具体的,重要度计算公式为:Uni=(sni1/(sni1+rni1)-sni0/(sni0+rni0))×ln((sni1×(sni0+rni0))/(sni0×(sni1+rni1)))+(rni1/(sni1+rni1)-rni0/(sni0+rni0))×ln((rni1×(sni0+rni0))/(rni0×(sni1+rni1))),其中,Uni为组合特征i在第n月份的重要度,sni1为组合特征i在第n个单月二维矩阵中二维数值为“1”且响应信息二值化数值为“1”的数量,rni1为组合特征i在第n个单月二维矩阵中二维数值为“1”且响应信息二值化数值为“0”的数量,sni0为组合特征i在第n个单月二维矩阵中二维数值为“0”且响应信息二值化数值为“1”的数量,rni0为组合特征i在第n个单月二维矩阵中二维数值为“0”且响应信息二值化数值为“0”的数量。
根据重要度计算公式对所有单月二维矩阵进行计算即可得到每一组合特征在所有月份的重要度,获取一个组合特征在所有月份的重要度即可得到该组合特征的逐月重要度,根据上述方法即可获取每一组合特征的逐月重要度。
饱和度变异系数计算单元123,用于根据所述矩阵计算模型中的饱和度变异系数计算公式计算得到每一所述组合特征的饱和度变异系数。
根据所述矩阵计算模型中的饱和度变异系数计算公式
Figure BDA0002167804480000192
即可计算得到每一所述组合特征的饱和度变异系数,其中,Bi为组合特征i的饱和度变异系数,FTi为组合特征i在所有月份中饱和度的标准差,
Figure BDA0002167804480000193
为组合特征i在所有月份中的饱和度平均值。具体的,饱和度变异系数即可用于对该组合特征的饱和度在所有月份中的波动程度进行量化。
重要度变异系数计算单元124,用于根据所述矩阵计算模型中的重要度变异系数计算公式
Figure BDA0002167804480000194
计算得到每一所述组合特征的重要度变异系数。
根据所述矩阵计算模型中的重要度变异系数计算公式
Figure BDA0002167804480000195
即可计算得到每一所述组合特征的重要度变异系数,其中,Zi为组合特征i的重要度变异系数,FUi为组合特征i在所有月份中重要度的标准差,
Figure BDA0002167804480000196
为组合特征i在所有月份中的重要度平均值。重要度变异系数即可用于对该组合特征的重要度在所有月份中的波动程度进行量化,具体的计算过程与饱和度变异系数类似,在此不作赘述。
组合特征筛选单元130,用于根据预设的筛选规则及所述特征计算信息对所有所述组合特征进行筛选以得到满足所述筛选规则的优势组合特征,其中,所述筛选规则包括保留规则及剔除规则。
根据预设的筛选规则及所述特征计算信息对所有所述组合特征进行筛选以得到满足所述筛选规则的优势组合特征。具体的,筛选规则即是用于对所有组合特征进行筛选以获取得到优势组合特征的规则信息,通过筛选规则结合所得到的特征计算信息即可从所有组合特征中筛选得到满足要求的优势组合特征,使用优势组合特征作为分析模型、预测模型等模型的输入节点,可大幅提高模型输入结果的准确率。具体的,筛选规则中包括保留规则及剔除规则。
其他发明实施例中,如图10所示,所述组合特征筛选单元130包括子单元:第一组合特征筛选单元131、第二组合特征筛选单元132和优势组合特征获取单元133。
第一组合特征筛选单元131,用于对每一所述组合特征的特征计算信息是否满足所述保留规则进行判断,以获取满足所述保留规则的第一组合特征及不满足所述保留规则的第二组合特征。
对每一所述组合特征的特征计算信息是否满足所述保留规则进行判断,以获取满足所述保留规则的第一组合特征及不满足所述保留规则的第二组合特征。具体的保留规则中可包含一条或多条规则,若某一组合特征满足保留规则中的任一条规则,则判断得到该组合特征满足保留规则,将该组合特征作为第一组合特征;若某一组合特征不满足保留规则中的任一条规则,则判断得到该组合特征不满足保留规则,将该组合特征作为第二组合特征。
第二组合特征筛选单元132,用于对每一所述第二组合特征的特征计算信息是否满足所述剔除规则进行判断,将满足所述剔除规则的组合特征进行剔除以得到第三组合特征。
对每一所述第二组合特征的特征计算信息是否满足所述剔除规则进行判断,将满足所述剔除规则的组合特征进行剔除以得到第三组合特征。具体的剔除规则中可包含一条或多条规则,若某一组合特征满足剔除规则中的任一条规则,则判断得到该组合特征满足剔除规则,将该组合特征从第二组合特征中剔除;若某一组合特征不满足剔除规则中每一条规则,则判断得到该组合特征不满足剔除规则,不对该组合特征进行剔除处理。
优势组合特征获取单元133,用于获取所述第一组合特征及所述第三组合特征作为所得到的优势组合特征。
获取所述第一组合特征及所述第三组合特征作为所得到的优势组合特征。将所得到的第一组合特征及第三组合特征作为满足筛选规则的组合特征,也即是最终所得到的优势组合特征。
模型构建单元140,用于根据所述优势组合特征及预设的模型配置信息构建得到深度学习模型,其中,所述模型配置信息包括节点比值信息及输出节点信息。
根据所述优势组合特征及预设的模型配置信息构建得到深度学习模型。优势组合特征对于模型中输出结果的影响大于其他组合特征,也即是优势组合特征的重要性高于其他组合特征,因而基于优势组合特征所构建得到的深度学习模型中不同样本之间的输出结果差异更加明显,从而能够使模型的输出结果更加客观、准确,因此大幅提升了所构建得到的模型的可靠性。具体的,可根据所得到的多个优势组合特征构建得到深度学习模型的输入节点,每一个优势组合特征对应一个输入节点。模型配置信息中包括节点比值信息及输出节点信息,节点比值信息即是所生成深度学习模型中的中间层节点与输入节点数量的比值信息,所有中间层节点也即组成了深度学习模型中的全连接隐层;输出节点信息中包含至少一个输出节点及用于对每一输出节点对应的输出值进行描述的描述信息,也即是输出节点可以为一个或多个,输出节点的具体数值即是输出节点值,也即是输入深度学习模型中样本与该输出节点的匹配度。
根据优势组合特征及模型配置信息最终构建得到的深度学习模型由输入节点、全连接隐层、输出节点及模型公式组构成。其中,全连接隐层即是用于对输入节点与输出节点进行联系的中间层,模型配置信息中全连接隐层可以为一层或多层。以模型配置信息中仅包含一层全连接隐层为例,全连接隐层中包含若干个中间层节点,每一个中间层节点均与所有输入节点和所有输出节点进行关联,中间层节点即可用于反映深度学习模型中每一优势组合特征与每一输出节点之间的关系。模型公式组即是用于在输入节点、全连接隐层及输出节点之间建立关联关系,模型公式组中包含用于在输入节点与全连接隐层之间建立关联关系的第一公式组、在全连接隐层与输出节点之间建立关联关系的第二公式组。
其他发明实施例中,如图11所示,所述模型构建单元140包括子单元:输入节点构建单元141、全连接隐层构建单元142和模型公式组构建单元143。
输入节点构建单元141,用于根据所述优势组合特征构建所述深度学习模型的输入节点。
根据所述优势组合特征构建所述深度学习模型的输入节点。具体的,每一个优势组合特征对应生成一个输入节点,因此可根据所得到的多个优势组合特征对应生成相同数量的输入节点,每一个输入节点均对应一个输入节点值,输入节点值为“0”或“1”;“1”表示当前输入该输入节点的样本满足该输入节点对应的优势组合特征,“0”则表示当前输入该输入节点的样本不满足该输入节点对应的优势组合特征。
全连接隐层构建单元142,用于根据所述优势组合特征及所述节点比值信息构建所述深度学习模型的全连接隐层。
根据所述优势组合特征及所述节点比值信息构建所述深度学习模型的全连接隐层。中间层节点的数量可根据节点比值信息及优势组合特征的数量计算得到,根据所计算得到的中间层节点的数量即可生成包含多个中间层节点的全连接隐层,其中,节点比值信息可设置的数值范围为[0.4,0.8]。
模型公式组构建单元143,用于根据所述输入节点、所述全连接隐层及所述输出节点信息构建模型公式组以构建得到深度学习模型。
根据所述输入节点、所述全连接隐层及所述输出节点信息构建所述深度学习模型中的模型公式组,以构建得到深度学习模型。具体的,模型公式组中包含第一公式组及第二公式组,第一公式组及第二公式组中均包含多个公式,第一公式组中的公式用于表示输入节点与全连接隐层中每一中间层节点之间的关联关系,第二公式组中的公式用于表示全连接隐层中每一中间层节点与输出节点之间的关联关系。
其他发明实施例中,所述模型公式组构建单元143包括子单元:第一公式组构建单元1431和第二公式组构建单元1432。
第一公式组构建单元1431,用于根据所述全连接隐层所包含的所有中间层节点及所述输入节点,以输入节点值作为输入值、中间层节点的节点值作为输出值构建输入节点至中间层节点的第一公式组。
其中,第一公式组包含所有输入节点至相应中间层节点的公式,每一输入节点与所有中间层节点之间公式的格式均相同,仅公式中的参数值存在差异,公式中的参数值均由随机生成的随机数进行配置,公式中的参数值可为正数或负数。输入节点即是深度学习模型中用于对某样本的信息进行输入的节点,输入节点的具体数值即为输入节点值,中间层节点的节点值即是全连接隐层中该中间层节点对应的计算值。
第二公式组构建单元1432,用于根据所述全连接隐层所包含的所有中间层节点及所述输出节点信息,以中间层节点的节点值作为输入值、输出节点信息中每一输出节点的输出节点值作为输出值构建中间层节点至输出节点的第二公式组。
其中,输出节点信息中包含一个或多个输出节点,第二公式组包含所有中间层节点至相应输出节点的公式,每一中间层节点与输出节点之间公式的格式均相同,仅公式中的参数值存在差异,公式中的参数值均由随机生成的随机数进行配置,公式中的参数值可为正数或负数。输出节点即是深度学习模型中用于进行输出信息的节点,中间层节点的节点值即是全连接隐层中该中间层节点对应的计算值。
其他发明实施例中,如图12所示,所述基于组合特征筛选的模型构建装置100还包括子单元:模型训练单元150。
模型训练单元150,用于根据预设的模型训练参数及预设的训练信息库对所述深度学习模型进行训练以得到训练后的深度学习模型。
根据预设的模型训练参数及预设的训练信息库对所述深度学习模型进行训练以得到训练后的深度学习模型。具体的,每一组模型训练参数中均包括学习率、训练次数以及训练终止条件,学习率即是对深度学习模型的模型公式组中公式的参数值进行调整的幅度,训练次数即是对深度学习模型进行训练的最大次数,训练终止条件即是对深度学习模型的训练进行终止的条件信息,若达到训练终止条件或达到预设的训练次数,则终止对深度学习模型的训练。训练信息库中包含多条训练数据,每一条训练数据中均包含与数据信息表中每一项目对应的项目值,每一条训练数据还包括与该训练数据对应的预设响应信息。
其他发明实施例中,所述模型训练单元150包括子单元:模型准确率获取单元151和模型参数值设置单元152。
模型准确率获取单元151,用于获取预设的一组训练参数及所述训练信息库中所包含的训练数据对所述深度学习模型进行训练以得到该组训练参数的模型准确率。
获取预设的一组训练参数及所述训练信息库中所包含的训练数据对所述深度学习模型进行训练以得到该组训练参数的模型准确率。具体的,将训练信息库中的一条训练数据输入深度学习模型,获取深度学习模型所输出的每一输出节点的输出节点值,也即是每一输出节点与该条训练数据的匹配度,获取匹配度最高的输出节点作为该条训练数据的输出结果。根据上述方法即可获取训练信息库中的一条训练数据的输出结果,统计输出结果与预设响应信息相匹配的训练数据在所有训练数据中的占比作为所有训练数据的匹配概率。
根据第一次训练所得到的匹配概率及该组训练参数对深度学习模型中所包含公式的参数值进行调整,即完成对该深度学习模型的一次训练,反复执行上述过程,直到达到训练终止条件或达到预设的训练次数,则终止对深度学习模型的训练,得到最后一次训练过程中所有训练参数的匹配概率作为该组训练参数的模型准确率。通过上述方法将所预设的多组训练参数依次输入深度学习模型进行训练,得到所有训练参数的模型准确率。
模型参数值设置单元152,用于根据所得到的多组训练参数的模型准确率选择最优的一组训练参数对深度学习模型中所包含公式的参数值进行设置以得到训练后的深度学习模型。
根据所得到的多组训练参数的模型准确率选择最优的一组训练参数对深度学习模型中所包含公式的参数值进行设置,即可得到训练后的深度学习模型。具体的,选择模型准确率最高的一组训练参数,将该组训练参数对深度学习模型进行训练时最后一次训练过程中,所得到的模型公式组中每一公式的参数值作为训练后的深度学习模型中相应公式的参数值,即可最终得到训练后的深度学习模型。
在本发明实施例所提供的基于组合特征筛选的模型构建装置应用上述基于组合特征筛选的模型构建方法,根据组合特征从数据信息表中获取到多个单月二维矩阵,计算得到每一组合特征的特征计算信息,根据筛选规则及特征计算信息对组合特征进行筛选得到优势组合特征,根据优势组合特征及模型配置信息构建得到深度学习模型。通过上述方法,所获取到的优势组合特征的重要性高于其他组合特征,基于筛选得到的优势组合特征构建深度学习模型,所构建得到的模型可用于智能分析、智能预测等人工智能领域,可大幅提升所构建得到的模型的可靠性,使模型的输出结果更加客观、准确,在实际应用过程中取得了良好的技术效果。
上述基于组合特征筛选的模型构建装置可以实现为计算机程序的形式,该计算机程序可以在如图13所示的计算机设备上运行。
请参阅图13,图13是本发明实施例提供的计算机设备的示意性框图。
参阅图13,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行基于组合特征筛选的模型构建方法。
该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行基于组合特征筛选的模型构建方法。
该网络接口505用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图13中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下功能:若接收到用户所输入的数据信息表,根据多组预设的组合特征对所述数据信息表中每一月份的数据信息进行二值化以得到多个单月二维矩阵,其中,所述数据信息表中包含多个连续月份的数据信息;根据预设的矩阵计算模型对所有所述单月二维矩阵进行计算以得到每一所述组合特征对应的特征计算信息,其中,所述特征计算信息包括逐月饱和度、逐月重要度、饱和度变异系数及重要度变异系数;根据预设的筛选规则及所述特征计算信息对所有所述组合特征进行筛选以得到满足所述筛选规则的优势组合特征,其中,所述筛选规则包括保留规则及剔除规则;根据所述优势组合特征及预设的模型配置信息构建得到深度学习模型,其中,所述模型配置信息包括节点比值信息及输出节点信息。
在一实施例中,处理器502在执行若接收到用户所输入的数据信息表,根据多组预设的组合特征对所述数据信息表中每一月份的数据信息进行二值化以得到多个单月二维矩阵的步骤时,执行如下操作:根据月份信息从所述数据信息表中拆分得到每一月份的数据信息;获取每一月份的数据信息中与所有所述组合特征对应的单月特征数据;根据所有所述组合特征对每一所述单月特征数据进行二值化以得每一所述单月特征数据对应的一维数组;根据月份信息对所述一维数组进行组合以得到每一月份对应的单月二维矩阵。
在一实施例中,处理器502在执行根据预设的矩阵计算模型对所有所述单月二维矩阵进行计算以得到每一所述组合特征对应的特征计算信息的步骤时,执行如下操作:根据所述矩阵计算模型中的饱和度计算公式计算所有单月二维矩阵中每一组合特征对应的饱和度以得到每一所述组合特征的逐月饱和度;根据所述矩阵计算模型中的重要度计算公式计算所有单月二维矩阵中每一组合特征对应的重要度以得到每一所述组合特征的逐月重要度;根据所述矩阵计算模型中的饱和度变异系数计算公式
Figure BDA0002167804480000251
计算得到每一所述组合特征的饱和度变异系数,其中,Bi为组合特征i的饱和度变异系数,FTi为组合特征i在所有月份中饱和度的标准差,
Figure BDA0002167804480000252
为组合特征i在所有月份中的饱和度平均值;根据所述矩阵计算模型中的重要度变异系数计算公式
Figure BDA0002167804480000253
计算得到每一所述组合特征的重要度变异系数,其中,Zi为组合特征i的重要度变异系数,FUi为组合特征i在所有月份中重要度的标准差,
Figure BDA0002167804480000254
为组合特征i在所有月份中的重要度平均值。
在一实施例中,处理器502在执行根据预设的筛选规则及所述特征计算信息对所有所述组合特征进行筛选以得到满足所述筛选规则的优势组合特征的步骤时,执行如下操作:对每一所述组合特征的特征计算信息是否满足所述保留规则进行判断,以获取满足所述保留规则的第一组合特征及不满足所述保留规则的第二组合特征;对每一所述第二组合特征的特征计算信息是否满足所述剔除规则进行判断,将满足所述剔除规则的组合特征进行剔除以得到第三组合特征;获取所述第一组合特征及所述第三组合特征作为所得到的优势组合特征。
在一实施例中,处理器502在执行根据所述优势组合特征及预设的模型配置信息构建得到深度学习模型的步骤时,执行如下操作:根据所述优势组合特征构建所述深度学习模型的输入节点;根据所述优势组合特征及所述节点比值信息构建所述深度学习模型的全连接隐层;根据所述输入节点、所述全连接隐层及所述输出节点信息构建模型公式组以构建得到深度学习模型。
在一实施例中,处理器502在执行根据所述优势组合特征及预设的模型配置信息构建得到深度学习模型的步骤之后,还执行如下操作:根据预设的模型训练参数及预设的训练信息库对所述深度学习模型进行训练以得到训练后的深度学习模型。
本领域技术人员可以理解,图13中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图13所示实施例一致,在此不再赘述。
应当理解,在本发明实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现以下步骤:若接收到用户所输入的数据信息表,根据多组预设的组合特征对所述数据信息表中每一月份的数据信息进行二值化以得到多个单月二维矩阵,其中,所述数据信息表中包含多个连续月份的数据信息;根据预设的矩阵计算模型对所有所述单月二维矩阵进行计算以得到每一所述组合特征对应的特征计算信息,其中,所述特征计算信息包括逐月饱和度、逐月重要度、饱和度变异系数及重要度变异系数;根据预设的筛选规则及所述特征计算信息对所有所述组合特征进行筛选以得到满足所述筛选规则的优势组合特征,其中,所述筛选规则包括保留规则及剔除规则;根据所述优势组合特征及预设的模型配置信息构建得到深度学习模型,其中,所述模型配置信息包括节点比值信息及输出节点信息。
在一实施例中,所述若接收到用户所输入的数据信息表,根据多组预设的组合特征对所述数据信息表中每一月份的数据信息进行二值化以得到多个单月二维矩阵的步骤,包括:根据月份信息从所述数据信息表中拆分得到每一月份的数据信息;获取每一月份的数据信息中与所有所述组合特征对应的单月特征数据;根据所有所述组合特征对每一所述单月特征数据进行二值化以得每一所述单月特征数据对应的一维数组;根据月份信息对所述一维数组进行组合以得到每一月份对应的单月二维矩阵。
在一实施例中,所述根据预设的矩阵计算模型对所有所述单月二维矩阵进行计算以得到每一所述组合特征对应的特征计算信息的步骤,包括:根据所述矩阵计算模型中的饱和度计算公式计算所有单月二维矩阵中每一组合特征对应的饱和度以得到每一所述组合特征的逐月饱和度;根据所述矩阵计算模型中的重要度计算公式计算所有单月二维矩阵中每一组合特征对应的重要度以得到每一所述组合特征的逐月重要度;根据所述矩阵计算模型中的饱和度变异系数计算公式
Figure BDA0002167804480000271
计算得到每一所述组合特征的饱和度变异系数,其中,Bi为组合特征i的饱和度变异系数,FTi为组合特征i在所有月份中饱和度的标准差,
Figure BDA0002167804480000272
为组合特征i在所有月份中的饱和度平均值;根据所述矩阵计算模型中的重要度变异系数计算公式
Figure BDA0002167804480000273
计算得到每一所述组合特征的重要度变异系数,其中,Zi为组合特征i的重要度变异系数,FUi为组合特征i在所有月份中重要度的标准差,
Figure BDA0002167804480000274
为组合特征i在所有月份中的重要度平均值。
在一实施例中,所述根据预设的筛选规则及所述特征计算信息对所有所述组合特征进行筛选以得到满足所述筛选规则的优势组合特征的步骤,包括:对每一所述组合特征的特征计算信息是否满足所述保留规则进行判断,以获取满足所述保留规则的第一组合特征及不满足所述保留规则的第二组合特征;对每一所述第二组合特征的特征计算信息是否满足所述剔除规则进行判断,将满足所述剔除规则的组合特征进行剔除以得到第三组合特征;获取所述第一组合特征及所述第三组合特征作为所得到的优势组合特征。
在一实施例中,所述根据所述优势组合特征及预设的模型配置信息构建得到深度学习模型的步骤,包括:根据所述优势组合特征构建所述深度学习模型的输入节点;根据所述优势组合特征及所述节点比值信息构建所述深度学习模型的全连接隐层;根据所述输入节点、所述全连接隐层及所述输出节点信息构建模型公式组以构建得到深度学习模型。
在一实施例中,所述根据所述优势组合特征及预设的模型配置信息构建得到深度学习模型的步骤之后,还包括:根据预设的模型训练参数及预设的训练信息库对所述深度学习模型进行训练以得到训练后的深度学习模型。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的计算机可读存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种基于组合特征筛选的模型构建方法,其特征在于,包括:
若接收到用户所输入的数据信息表,根据多组预设的组合特征对所述数据信息表中每一月份的数据信息进行二值化以得到多个单月二维矩阵,其中,所述数据信息表中包含多个连续月份的数据信息;
根据预设的矩阵计算模型对所有所述单月二维矩阵进行计算以得到每一所述组合特征对应的特征计算信息,其中,所述特征计算信息包括逐月饱和度、逐月重要度、饱和度变异系数及重要度变异系数;
根据预设的筛选规则及所述特征计算信息对所有所述组合特征进行筛选以得到满足所述筛选规则的优势组合特征,其中,所述筛选规则包括保留规则及剔除规则;
根据所述优势组合特征及预设的模型配置信息构建得到深度学习模型,其中,所述模型配置信息包括节点比值信息及输出节点信息。
2.根据权利要求1所述的基于组合特征筛选的模型构建方法,其特征在于,所述根据多组预设的组合特征对所述数据信息表中每一月份的数据信息进行二值化以得到多个单月二维矩阵,包括:
根据月份信息从所述数据信息表中拆分得到每一月份的数据信息;
获取每一月份的数据信息中与所有所述组合特征对应的单月特征数据;
根据所有所述组合特征对每一所述单月特征数据进行二值化以得每一所述单月特征数据对应的一维数组;
根据月份信息对所述一维数组进行组合以得到每一月份对应的单月二维矩阵。
3.根据权利要求1所述的基于组合特征筛选的模型构建方法,其特征在于,所述根据预设的矩阵计算模型对所有所述单月二维矩阵进行计算以得到每一所述组合特征对应的特征计算信息,包括:
根据所述矩阵计算模型中的饱和度计算公式计算所有单月二维矩阵中每一组合特征对应的饱和度以得到每一所述组合特征的逐月饱和度;
根据所述矩阵计算模型中的重要度计算公式计算所有单月二维矩阵中每一组合特征对应的重要度以得到每一所述组合特征的逐月重要度;
根据所述矩阵计算模型中的饱和度变异系数计算公式
Figure FDA0002167804470000021
计算得到每一所述组合特征的饱和度变异系数,其中,Bi为组合特征i的饱和度变异系数,FTi为组合特征i在所有月份中饱和度的标准差,
Figure FDA0002167804470000022
为组合特征i在所有月份中的饱和度平均值;
根据所述矩阵计算模型中的重要度变异系数计算公式
Figure FDA0002167804470000023
计算得到每一所述组合特征的重要度变异系数,其中,Zi为组合特征i的重要度变异系数,FUi为组合特征i在所有月份中重要度的标准差,
Figure FDA0002167804470000024
为组合特征i在所有月份中的重要度平均值。
4.根据权利要求1所述的基于组合特征筛选的模型构建方法,其特征在于,所述根据预设的筛选规则及所述特征计算信息对所有所述组合特征进行筛选以得到满足所述筛选规则的优势组合特征,包括:
对每一所述组合特征的特征计算信息是否满足所述保留规则进行判断,以获取满足所述保留规则的第一组合特征及不满足所述保留规则的第二组合特征;
对每一所述第二组合特征的特征计算信息是否满足所述剔除规则进行判断,将满足所述剔除规则的组合特征进行剔除以得到第三组合特征;
获取所述第一组合特征及所述第三组合特征作为所得到的优势组合特征。
5.根据权利要求1所述的基于组合特征筛选的模型构建方法,其特征在于,所述根据所述优势组合特征及预设的模型配置信息构建得到深度学习模型,包括:
根据所述优势组合特征构建所述深度学习模型的输入节点;
根据所述优势组合特征及所述节点比值信息构建所述深度学习模型的全连接隐层;
根据所述输入节点、所述全连接隐层及所述输出节点信息构建模型公式组以构建得到深度学习模型。
6.根据权利要求1所述的基于组合特征筛选的模型构建方法,其特征在于,所述根据所述优势组合特征及预设的模型配置信息构建得到深度学习模型之后,还包括:
根据预设的模型训练参数及预设的训练信息库对所述深度学习模型进行训练以得到训练后的深度学习模型。
7.一种基于组合特征筛选的模型构建装置,其特征在于,包括:
数据信息二值化单元,用于若接收到用户所输入的数据信息表,根据多组预设的组合特征对所述数据信息表中每一月份的数据信息进行二值化以得到多个单月二维矩阵,其中,所述数据信息表中包含多个连续月份的数据信息;
特征计算信息获取单元,用于根据预设的矩阵计算模型对所有所述单月二维矩阵进行计算以得到每一所述组合特征对应的特征计算信息,其中,所述特征计算信息包括逐月饱和度、逐月重要度、饱和度变异系数及重要度变异系数;
组合特征筛选单元,用于根据预设的筛选规则及所述特征计算信息对所有所述组合特征进行筛选以得到满足所述筛选规则的优势组合特征,其中,所述筛选规则包括保留规则及剔除规则;
模型构建单元,用于根据所述优势组合特征及预设的模型配置信息构建得到深度学习模型,其中,所述模型配置信息包括节点比值信息及输出节点信息。
8.根据权利要求7所述的基于组合特征筛选的模型构建装置,其特征在于,所述数据信息二值化单元,包括:
数据信息表拆分单元,用于根据月份信息从所述数据信息表中拆分得到每一月份的数据信息;
单月特征数据获取单元,用于获取每一月份的数据信息中与所有所述组合特征对应的单月特征数据;
单月特征数据二值化单元,用于根据所有所述组合特征对每一所述单月特征数据进行二值化以得每一所述单月特征数据对应的一维数组;
数组组合单元,用于根据月份信息对所述一维数组进行组合以得到每一月份对应的单月二维矩阵。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述的基于组合特征筛选的模型构建方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至6任一项所述的基于组合特征筛选的模型构建方法。
CN201910752919.9A 2019-08-15 2019-08-15 基于组合特征筛选的模型构建方法、装置、计算机设备 Active CN110674838B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910752919.9A CN110674838B (zh) 2019-08-15 2019-08-15 基于组合特征筛选的模型构建方法、装置、计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910752919.9A CN110674838B (zh) 2019-08-15 2019-08-15 基于组合特征筛选的模型构建方法、装置、计算机设备

Publications (2)

Publication Number Publication Date
CN110674838A true CN110674838A (zh) 2020-01-10
CN110674838B CN110674838B (zh) 2024-05-14

Family

ID=69075347

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910752919.9A Active CN110674838B (zh) 2019-08-15 2019-08-15 基于组合特征筛选的模型构建方法、装置、计算机设备

Country Status (1)

Country Link
CN (1) CN110674838B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110689023A (zh) * 2019-08-15 2020-01-14 平安科技(深圳)有限公司 可靠组合特征提取方法、装置、计算机设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180150746A1 (en) * 2016-02-05 2018-05-31 Huawei Technologies Co., Ltd. Feature Set Determining Method and Apparatus
CN109345198A (zh) * 2018-09-17 2019-02-15 平安科技(深圳)有限公司 简历筛选方法、装置、计算机设备及存储介质
CN109344990A (zh) * 2018-08-02 2019-02-15 中国电力科学研究院有限公司 一种基于dfs和svm特征选择的短期负荷预测方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180150746A1 (en) * 2016-02-05 2018-05-31 Huawei Technologies Co., Ltd. Feature Set Determining Method and Apparatus
CN109344990A (zh) * 2018-08-02 2019-02-15 中国电力科学研究院有限公司 一种基于dfs和svm特征选择的短期负荷预测方法及系统
CN109345198A (zh) * 2018-09-17 2019-02-15 平安科技(深圳)有限公司 简历筛选方法、装置、计算机设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘芳;: "基于大数据特征选择的深度学习算法", 赤峰学院学报(自然科学版), no. 05, pages 52 - 54 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110689023A (zh) * 2019-08-15 2020-01-14 平安科技(深圳)有限公司 可靠组合特征提取方法、装置、计算机设备及存储介质
CN110689023B (zh) * 2019-08-15 2024-01-16 平安科技(深圳)有限公司 可靠组合特征提取方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN110674838B (zh) 2024-05-14

Similar Documents

Publication Publication Date Title
CN111461180B (zh) 样本分类方法、装置、计算机设备及存储介质
CN109961086B (zh) 基于聚类和sse的异常点比例优化方法及装置
Maruotti Mixed hidden markov models for longitudinal data: An overview
Birks Overview of numerical methods in palaeolimnology
CN112348079B (zh) 数据降维处理方法、装置、计算机设备及存储介质
WO2019169704A1 (zh) 一种数据分类方法、装置、设备及计算机可读存储介质
WO2011133551A2 (en) Reducing the dissimilarity between a first multivariate data set and a second multivariate data set
CN111222556A (zh) 一种基于决策树算法识别用电类别的方法及系统
Yvette Zhang A density‐ratio model of crop yield distributions
US11216512B2 (en) Accessible machine learning backends
WO2021098265A1 (zh) 缺失信息预测方法、装置、计算机设备及存储介质
CN108197795B (zh) 恶意团体账户识别方法、装置、终端及存储介质
CN112541635A (zh) 业务数据统计预测方法、装置、计算机设备及存储介质
CN112163637A (zh) 基于非平衡数据的图像分类模型训练方法、装置
CN113590603A (zh) 基于数据源智能选择的数据处理方法、装置、设备及介质
CN112416590A (zh) 服务器系统资源调整方法、装置、计算机设备及存储介质
CN114780606B (zh) 一种大数据挖掘方法及系统
CN110674104B (zh) 特征组合筛选方法、装置、计算机设备及存储介质
CN110633304B (zh) 组合特征筛选方法、装置、计算机设备及存储介质
CN110674838B (zh) 基于组合特征筛选的模型构建方法、装置、计算机设备
CN112085509A (zh) 通知信息发送方法、装置、计算机设备及存储介质
CN110826008A (zh) 指标相关性分析方法、装置、计算机设备及存储介质
CN112330411B (zh) 团体产品推荐方法、装置、计算机设备及存储介质
CN113688206A (zh) 基于文本识别的趋势分析方法、装置、设备及介质
CN110689023B (zh) 可靠组合特征提取方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant