CN111815030B - 一种基于少量问卷调查数据的多目标特征预测方法 - Google Patents
一种基于少量问卷调查数据的多目标特征预测方法 Download PDFInfo
- Publication number
- CN111815030B CN111815030B CN202010530453.0A CN202010530453A CN111815030B CN 111815030 B CN111815030 B CN 111815030B CN 202010530453 A CN202010530453 A CN 202010530453A CN 111815030 B CN111815030 B CN 111815030B
- Authority
- CN
- China
- Prior art keywords
- task
- model
- data
- hidden layer
- representing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000006243 chemical reaction Methods 0.000 claims abstract description 6
- 239000011159 matrix material Substances 0.000 claims description 25
- 230000006870 function Effects 0.000 claims description 23
- 241001334134 Rugopharynx epsilon Species 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 2
- 230000004931 aggregating effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000003930 cognitive ability Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Software Systems (AREA)
- Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Strategic Management (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Operations Research (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Human Resources & Organizations (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Probability & Statistics with Applications (AREA)
- Computing Systems (AREA)
- Quality & Reliability (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
Abstract
一种基于少量问卷调查数据的多目标特征预测方法,包括如下步骤:S1:整理问卷调查数据;S2:使用k‑means方法对步骤S1中缺失数据进行插补;S3:通过独热编码和编码标签将步骤S2中补充后的非数值型特征转换为数值型特征;S4:将步骤S3中转换得到的数值型特征与任意一个想要预测的目标特征进行关联,称为一个任务;建立基于随机配置径向基网络的多任务监督学习模型,并对多个任务进行预测;S5:根据步骤S4建立模型的输出结果,得到最终的预测结果;本发明通过利用多个目标特征之间的关联性,挖掘存在于模型参数或数据特征中的共有信息,以解决问卷调查数据不足的问题。
Description
技术领域
本发明涉及问卷数据分析领域,特别是涉及一种基于少量问卷调查数据的多目标特征预测方法。
背景技术
目前,线下的问卷调查在实际生活中的运用越来越少,问卷调查的逐渐由线下转为线上,主要包括以下几点原因:其一,问卷的回收率低,尤其是问卷调查中还存在恶意丢弃问卷的现象,非但浪费了问卷,而且一定程度上还导致了环境的污染;其二,问卷内容转化为数据的成本高,包括两部分,一部分是问卷的印制成本高,另一部分是问卷分发的人力成本和时间成本高;其三,问卷调查收集的数据量少。上述线下问卷调查的前两个弊端都会直接导致第三个弊端,而问卷的数据量少会直接导致问卷调查结果不准确,失去或偏离了问卷调查的意义。因此急需一种方法能够基于少量的问卷调查数据对多个目标特征进行准确的预测,其中目标特征指的是问卷想要获取的指标,比如居民收入区间的分布和比例、居民消费倾向等等。
发明内容
本发明的目的是解决现有技术的不足,提供一种基于少量问卷调查数据的多目标特征预测方法,原理简单,预测准确。
一种基于少量问卷调查数据的多目标特征预测方法,包括如下步骤:
S1:整理问卷调查数据;
S2:使用k-means方法对步骤S1中缺失数据进行插补;
S3:通过独热编码和编码标签将步骤S2中补充后的非数值型特征转换为数值型特征;
S4:将步骤S3中转换得到的数值型特征与任意一个想要预测的目标特征进行关联,称为一个任务;建立基于随机配置径向基网络的多任务监督学习模型,并对多个任务进行预测;
S5:根据步骤S4建立模型的输出结果,得到最终的预测结果。
进一步的,所述步骤S4中,基于随机配置径向基网络的多任务监督学习模型的建立包括如下步骤:
步骤S41:整理任务的输入数据和输出数据,使其满足模型的要求;设定已经具有L-1个隐藏层节点的通用模型,L=1,2,3,…,L为初始的设定值,该通用模型作为初始的通用模型;
步骤S42:将通用模型转换为应用模型,并根据实际输出数据与应用模型的输出数据做差,得到残差矩阵;
步骤S43:根据残差矩阵计算均方根误差,并与预先设定的误差进行比较;若满足误差要求,则模型建立完成,结束步骤;若不满足要求,则进入步骤S44;
步骤S44:通过配置满足设定要求的随机参数,增加一个新的隐藏层节点;
步骤S45:根据步骤S44的参数得到新的通用模型,返回步骤S42。
进一步的,所述步骤S41中,
首先由步骤S3转换得到的数值型特征与任意一个想要预测的目标特征进行关联,得到M个任务,其中要求每个任务的样本数量相同,N1=N2=…=NM=N,N表示样本数量,N1、N2…NM分别对应各个任务;若任务的样本数量不同,则对该任务内的样本进行随机采样,使其满足样本数量相等的要求;
随后对各个任务中的样本对应的输入变量进行合并,将每个任务中第i个样本进行汇总,得到M个任务的第i个样本的输入数据为其中表示第m个任务第i个样本的输入数据的转置矩阵;第i个样本对应的输出数据为/>其中i=1,…,N,R1×Md表示矩阵的维度,1×Md代表输入数据是一行、M*d列;
引入径向基函数kσ(t,t′)作为模型的基函数;
给定目标函数f:RMd→RM,设定构建了具有L-1个隐藏层节点的多任务监督学习,得到初始的通用模型如式(2)所示,
其中表示在L-1个隐藏层节点的多任务监督学习中第j个隐藏层节点的第m个任务的最优外权参数向量,m∈(1,2,...M),j的取值范围和隐藏层节点的数量有关;/>表示第j个隐藏层节点的最优径向基函数中心;/>表示第j个隐藏层节点的最优线性变换内权参数;/>表示第j个隐藏层节点的最优尺度参数。
进一步的,所述步骤S42中,先对数据集进行整理,包括输入数据集X=[X1,…,XM]∈RN×Md,Xm表示第m个任务中的样本形成的矩阵,Xm∈RN×d,m∈(1,2,...M);输出数据集Y=[y1,…,yM]∈RN×M,ym表示第m个任务中的样本实际输出的数据形成的列向量;修改原始通用模型(2)式中的输入数据形式,得到原始应用模型,如式(3)所示:
其中Kj为矩阵;/> kj为列向量,/>表示第m个任务在第j个隐藏层节点径向基函数上的映射;
所述残差矩阵EL-1:表示为:
EL-1:=Y-fL-1:=[e1,L-1,…,eM,L-1]
其中em,L-1,m∈(1,2,...M),表示具有L-1个隐藏层节点时第m个任务的残差。
进一步的,所述步骤S43中,通过残差矩阵计算得到的均方根误差与预先设定的误差标准进行比较,如果没有满足要求,如式(4)所示:
则进入下一步骤。
进一步的,所述步骤S44中,对新增的隐藏层节点配置参数wL,σL,xL,其中wL表示权重,从U[-Φ,Φ],Φ>0中随机配置获得;σL表示尺度参数,从U[0,Ω],Ω>0中随机配置获得;xL表示径向基函数的中心,xL为X中选取的一个样本数据,引入适应多任务环境的变量ξm,L对随机配置的参数wL,σL,xL进行约束,ξm,L的计算如式(5)所示:
其中r∈(0,1);μL为非负实值序列,满足limL→+∞μL=0和μL≤(1-r);如果求得的ξm,L满足则认为参数wL,σL,xL是满足条件的,否则对随机参数wL,σL,xL重新进行配置;
在获得满足变量ξm,L条件的参数的情况下,再根据式(6)求得/>
其中j表示第j个隐藏层节点,j的取值范围和隐藏层节点的数量有关。
进一步的,所述步骤S45中,将以及/>代入式(2),得到新的通用模型,如式(7)所示:
进一步的,所述步骤S1的整理问卷数据过程中,能够基于问卷调查中出现的高频问题,聚合出有效特征,并根据有效特征得到步骤S4中所述的任务。
本发明的有益效果为:
本发明通过利用多个目标特征之间的关联性,挖掘存在于模型参数和数据特征中的共有信息,以解决问卷调查数据不足的问题;
本发明通过逐步增加隐藏层节点的数量,对残差进行优化,实现收敛,逐步提高模型的准确性,同时本发明提出的方法具有良好的泛化能力;
本发明通过整理高频问题,聚合有效特征,提高模型的预测效果。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
实施例一:
一种基于少量问卷调查数据的多目标特征预测方法,包括如下步骤:
S1:整理问卷调查数据;
S2:使用k-means方法对步骤S1中缺失数据进行插补;
S3:通过独热编码(One-hot Encoder)和编码标签(Label Encoder)将步骤S2中补充后的非数值型特征转换为数值型特征;
S4:将步骤S3中转换得到的数值型特征与任意一个想要预测的目标特征进行关联,称为一个任务;建立基于随机配置径向基网络的多任务监督学习(MTSL-SCRBN)模型,并对多个任务进行预测;
S5:步骤S4建立的模型的输出结果,即为最终的预测结果。
所述步骤S3中非数值型特征包括:
a:根据受调查者的年龄、性别等基本信息聚合身体状况特征;
b:根据受调查者的出生、工作地域信息等聚合地区发展特征;
c:根据受调查者的情绪稳定性、随和性和尽责性等聚合非认知能力特征;
d:根据受调查者的购物情况、购物偏好等聚合消费特征;
e:根据受调查者的受教育情况、亲属的受教育情况等聚合受调查者教育资源特征等。
所述步骤S4中,基于随机配置径向基网络的多任务监督学习(MTSL-SCRBN)模型的建立包括如下步骤:
步骤S41:整理任务的输入数据和输出数据,使其满足模型的要求;设定已经具有L-1个隐藏层节点的通用模型,L=1,2,3,…,L为初始的设定值,该通用模型作为初始的通用模型;
步骤S42:将通用模型转换为应用模型,并根据实际输出数据与应用模型的输出数据做差,得到残差矩阵;
步骤S43:根据残差矩阵计算均方根误差,并与预先设定的误差进行比较;若满足误差要求,则模型建立完成,结束步骤;若不满足要求,则进入步骤S44;
步骤S44:通过配置满足设定要求的随机参数,增加一个新的隐藏层节点;
步骤S45:根据步骤S44的参数得到新的通用模型,返回步骤S42。
所述步骤S41中,首先由步骤S3转换得到的数值型特征与任意一个想要预测的目标特征进行关联,得到M个任务,其中要求每个任务的样本数量相同,即,N1=N2=…=NM=N,N表示样本数量,N1,N2,…,NM分别对应各个任务;若任务的样本数量不同,则对该任务内的样本进行随机采样,使其满足样本数量相等的要求。
随后对各个任务中的样本对应的输入变量进行合并,将每个任务中第i个样本进行汇总,得到M个任务的第i个样本的输入数据为其中表示第m个任务第i个样本的输入数据的转置矩阵;第i个样本对应的输出数据为/>其中i=1,…,N,R1×Md表示矩阵的维度,1×Md代表输入数据是一行,M*d列;一个任务中的一个样本对应的输入数据维度为R1×d。
为了构建表达能力更好的模型,引入径向基函数kσ(t,t′)作为模型的基函数,径向基函数的运算规则如式(1)所示:
其中t表示输入,t′表示径向基函数的中心,σ表示径向基函数的尺度参数。
给定目标函数f:RMd→RM,其中RMd→RM表示输入数据为1行,M*d列,输出数据为1行,M列;假设已经构建了具有L-1个隐藏层节点的多任务监督学习(MTSL-SCRBN),得到原始通用模型如式(2)所示,
所述隐藏层节点越高,模型的误差就越小,但是运算量随之增大。在上式中表示在L-1个隐藏层节点的多任务监督学习中第j个隐藏层节点的第m个任务的最优外权参数向量,m∈(1,2,...M),j的取值范围和隐藏层节点的数量有关;/>表示第j个隐藏层节点的最优径向基函数中心;/>表示第j个隐藏层节点的最优线性变换内权参数;/>表示第j个隐藏层节点的最优尺度参数。
所述步骤S42中,把整理好的数据集放入原始通用模型中,包括输入数据集X=[X1,…,XM]∈RN×Md,Xm表示第m个任务中的样本形成的矩阵,Xm∈RN×d,m∈(1,2,...M);输出数据集Y=[y1,…,yM]∈RN×M,ym表示第m个任务中的样本实际输出的数据形成的列向量。修改原始通用模型(2)式中的输入数据形式,得到原始应用模型,如式(3)所示:
其中Kj为矩阵;/> kj为列向量,/>表示第m个任务在第j个隐藏层节点径向基函数上的映射。
所述步骤S43中,令EL-1:=Y-fL-1:=[e1,L-1,…,eM,L-1],EL-1:表示具有L-1个隐藏层节点时的残差矩阵;em,L-1,m∈(1,2,...M),表示具有L-1个隐藏层节点时第m个任务的残差。根据残差矩阵计算均方根误差并与预先设定的误差标准ε进行比较。
所述步骤S44中,如果通过‖EL-1‖F计算的均方根误差没有满足预先设定的误差标准ε,其中‖EL-1‖F表示具有L-1个隐藏层节点时的均方根误差EL-1的范数,即式(4)所示,
其中表示em,L-1的2-范数的平方值,em,L-1表示具有L-1个隐藏层节点时第m个任务均方根误差
则需要在多任务监督学习(MTSL-SCRBN)中增加一个新的隐藏层节点,得到具有L个隐藏层节点的多任务监督学习,并对新的隐藏层节点配置参数wL,σL,xL。其中wL表示权重,从U[-Φ,Φ],Φ>0,中随机配置获得,U[-Φ,Φ]表示wL服从[-Φ,Φ]上的均匀分布;σL表示尺度参数,从U[0,Ω],Ω>0,中随机配置获得,U[0,Ω]表示σL服从[0,Ω]上的均匀分布;xL表示径向基函数的中心,xL为X中选取的一个样本数据。引入适应多任务环境的变量ξm,L对随机配置的参数wL,σL,xL进行约束,ξm,L的计算如式(5)所示:
其中r∈(0,1);μL为非负实值序列,满足limL→+∞μL=0和μL≤(1-r)。如果求得的ξm,L满足则认为参数wL,σL,xL是满足条件的,否则对随机参数wL,σL,xL重新进行配置。
在获得满足变量ξm,L条件的参数的情况下,再根据式(6)求得/>其中j表示第j个隐藏层节点,j的取值范围和隐藏层节点的数量有关,
所述步骤S45中,将以及/>代入式(2),得到新的通用模型,如式(7)所示:
计算新模型的残差矩阵EL:=Y-fL:=[e1,L,…,eM,L],以及均方根误差,
显然随着隐藏层节点的增加,模型的均方根误差会减小。
将新模型的均方根误差与预先设定的误差标准ε进行比较,若满足要求,则模型建立完成;若仍不满足要求,则重复上述过程,继续添加隐藏层节点,直到满足误差标准。
为了进一步提高模型的预测效果,能够基于问卷调查中出现的高频问题,聚合出有效特征,并根据有效特征得到步骤S4中所述的任务。
需要说明的是,本发明不仅仅能够运用于线下的问卷调查,还能够运用于线上的问卷调查,或者其他需要通过较少的特征数据量准确推断出与目标特征关联性的场景。
以上描述仅是本发明的一个具体实例,不构成对本发明的任何限制。显然对于本领域的专业人员来说,在了解了本发明内容和原理后,都可能在不背离本发明原理、结构的情况下,进行形式和细节上的各种修改和改变,但是这些基于本发明思想的修正和改变仍在本发明的权利要求保护范围之内。
Claims (7)
1.一种基于少量问卷调查数据的多目标特征预测方法,其特征在于,包括如下步骤:
S1:整理问卷调查数据;
S2:使用k-means方法对步骤S1中缺失数据进行插补;
S3:通过独热编码和编码标签将步骤S2中补充后的非数值型特征转换为数值型特征;
S4:将步骤S3中转换得到的数值型特征与任意一个想要预测的目标特征进行关联,称为一个任务;建立基于随机配置径向基网络的多任务监督学习模型,并对多个任务进行预测;
S5:根据步骤S4建立模型的输出结果,得到最终的预测结果;
所述步骤S4中,基于随机配置径向基网络的多任务监督学习模型的建立包括如下步骤:
步骤S41:整理任务的输入数据和输出数据,使其满足模型的要求;设定已经具有L-1个隐藏层节点的多任务监督学习模型的通用模型,L=1,2,3,…,L为初始的设定值,该通用模型作为初始的通用模型;引入径向基函数作为模型的基函数;
步骤S42:将通用模型转换为应用模型,并根据实际输出数据与应用模型的输出数据做差,得到残差矩阵;
步骤S43:根据残差矩阵计算均方根误差,并与预先设定的误差进行比较;若满足误差要求,则模型建立完成,结束步骤;若不满足要求,则进入步骤S44;
步骤S44:通过随机配置径向基网络配置满足设定要求的随机参数,增加一个新的隐藏层节点;
步骤S45:根据步骤S44的参数得到新的通用模型,返回步骤S42。
2.根据权利要求1所述的一种基于少量问卷调查数据的多目标特征预测方法,其特征在于,所述步骤S41中,
首先由步骤S3转换得到的数值型特征与任意一个想要预测的目标特征进行关联,得到M个任务,其中要求每个任务的样本数量相同,N1=N2=…=NM=N,N表示样本数量,N1、N2…NM分别对应各个任务;若任务的样本数量不同,则对该任务内的样本进行随机采样,使其满足样本数量相等的要求;随后对各个任务中的样本对应的输入变量进行合并,将每个任务中第i个样本进行汇总,得到M个任务的第i个样本的输入数据为其中/>m=1,…,M,表示第m个任务第i个样本的输入数据的转置矩阵;第i个样本对应的输出数据为/>其中i=1,…,N,R1×Md表示矩阵的维度,1×Md代表输入数据是一行、M*d列;
引入径向基函数kσ(t,t′)作为模型的基函数;
给定目标函数f:RMd→RM,设定构建了具有L-1个隐藏层节点的多任务监督学习,得到初始的通用模型如式(2)所示,
其中 表示在L-1个隐藏层节点的多任务监督学习中第j个隐藏层节点的第m个任务的最优外权参数向量,m∈(1,2,...M),j的取值范围和隐藏层节点的数量有关;/>表示第j个隐藏层节点的最优径向基函数中心;/>表示第j个隐藏层节点的最优线性变换内权参数;/>表示第j个隐藏层节点的最优尺度参数。
3.根据权利要求2所述的一种基于少量问卷调查数据的多目标特征预测方法,其特征在于,所述步骤S42中,先对数据集进行整理,包括输入数据集X=[X1,…,XM]∈RN×Md,Xm表示第m个任务中的样本形成的矩阵,Xm∈RN×d,m∈(1,2,...M);输出数据集Y=[y1,…,yM]∈RN ×M,ym表示第m个任务中的样本实际输出的数据形成的列向量;修改原始通用模型(2)式中的输入数据形式,得到原始应用模型,如式(3)所示:
其中Kj为矩阵;/> kj为列向量,/>表示第m个任务在第j个隐藏层节点径向基函数上的映射;
所述残差矩阵EL-1:表示为:
EL-1:=Y-fL-1:=[e1,L-1,…,eM,L-1]
其中em,L-1,m∈(1,2,...M),表示具有L-1个隐藏层节点时第m个任务的残差。
4.根据权利要求3所述的一种基于少量问卷调查数据的多目标特征预测方法,其特征在于,所述步骤S43中,通过残差矩阵计算得到的均方根误差与预先设定的误差标准ε进行比较,如果没有满足要求,如式(4)所示:
则进入下一步骤。
5.根据权利要求4所述的一种基于少量问卷调查数据的多目标特征预测方法,其特征在于,所述步骤S44中,对新增的隐藏层节点配置参数wL,σL,xL,其中wL表示权重,从U[-Φ,Φ],Φ>0,中随机配置获得;σL表示尺度参数,从U[0,Ω],Ω>0,中随机配置获得;xL表示径向基函数的中心,xL为X中选取的一个样本数据,引入适应多任务环境的变量ξm,L对随机配置的参数wL,σL,xL进行约束,ξm,L的计算如式(5)所示:
其中r∈(0,1);μL为非负实值序列,满足limL→+∞μL=0和μL≤(1-r);如果求得的ξm,L满足则认为参数wL,σL,xL是满足条件的,否则对随机参数wL,σL,xL重新进行配置;
在获得满足变量ξm,L条件的参数的情况下,再根据式(6)求得/>
其中j表示第j个隐藏层节点,j的取值范围和隐藏层节点的数量有关。
6.根据权利要求5所述的一种基于少量问卷调查数据的多目标特征预测方法,其特征在于,所述步骤S45中,将以及/>代入式(2),得到新的通用模型,如式(7)所示:
7.根据权利要求1所述的一种基于少量问卷调查数据的多目标特征预测方法,其特征在于,所述步骤S1的整理问卷数据过程中,能够基于问卷调查中出现的高频问题,聚合出有效特征,并根据有效特征得到步骤S4中所述的任务。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010530453.0A CN111815030B (zh) | 2020-06-11 | 2020-06-11 | 一种基于少量问卷调查数据的多目标特征预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010530453.0A CN111815030B (zh) | 2020-06-11 | 2020-06-11 | 一种基于少量问卷调查数据的多目标特征预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111815030A CN111815030A (zh) | 2020-10-23 |
CN111815030B true CN111815030B (zh) | 2024-02-06 |
Family
ID=72845857
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010530453.0A Active CN111815030B (zh) | 2020-06-11 | 2020-06-11 | 一种基于少量问卷调查数据的多目标特征预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111815030B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197701A (zh) * | 2018-02-05 | 2018-06-22 | 哈工大机器人(合肥)国际创新研究院 | 一种基于rnn的多任务学习方法 |
CN108846384A (zh) * | 2018-07-09 | 2018-11-20 | 北京邮电大学 | 融合视频感知的多任务协同识别方法及系统 |
CN109885671A (zh) * | 2019-02-28 | 2019-06-14 | 重庆邮电大学 | 基于多任务学习的问答方法 |
CN110222827A (zh) * | 2019-06-11 | 2019-09-10 | 苏州思必驰信息科技有限公司 | 基于文本的抑郁判定网络模型的训练方法 |
CN110580695A (zh) * | 2019-08-07 | 2019-12-17 | 深圳先进技术研究院 | 一种多模态三维医学影像融合方法、系统及电子设备 |
-
2020
- 2020-06-11 CN CN202010530453.0A patent/CN111815030B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197701A (zh) * | 2018-02-05 | 2018-06-22 | 哈工大机器人(合肥)国际创新研究院 | 一种基于rnn的多任务学习方法 |
CN108846384A (zh) * | 2018-07-09 | 2018-11-20 | 北京邮电大学 | 融合视频感知的多任务协同识别方法及系统 |
CN109885671A (zh) * | 2019-02-28 | 2019-06-14 | 重庆邮电大学 | 基于多任务学习的问答方法 |
CN110222827A (zh) * | 2019-06-11 | 2019-09-10 | 苏州思必驰信息科技有限公司 | 基于文本的抑郁判定网络模型的训练方法 |
CN110580695A (zh) * | 2019-08-07 | 2019-12-17 | 深圳先进技术研究院 | 一种多模态三维医学影像融合方法、系统及电子设备 |
Non-Patent Citations (8)
Title |
---|
Dianhui Wang.etc.Stochastic Configuration Networks Ensemble for Large-Scale Data Analytics.Computer Science.2017,第1-20页. * |
Dianhui Wang.etc.Stochastic_Configuration_Networks_Fundamentals_and_Algorithms.IEEE TRANSACTIONS ON CYBERNETICS.2017,第3466-3479页. * |
竹泽石.基于随机配置网络的分布回归研究.中国优秀硕士学位论文全文数据库.2019,I140-97. * |
翁昊.随机多尺度核学习及应用.中国优秀硕士学位论文全文数据库.2018,H123-120. * |
郑敬华 ; 许成喜 ; 汪松鹤 ; .网络空间用户心理健康风险研究.网络安全技术与应用.2017,(第11期),第14-16页. * |
郑敬华 ; 郭世泽 ; 高梁 ; 赵楠 ; .基于多任务学习的大五人格预测.中国科学院大学学报.2018,(第04期),第550-560页. * |
郑敬华 ; 郭世泽 ; 高梁 ; 钟晓峰 ; .社交网络用户认知域特征预测研究综述.计算机科学.2018,(第03期),第18-24页. * |
黄鹤谦.基于随机配置网络的多分类集成算法研究.中国优秀硕士学位论文全文数据库.2019,H123-147. * |
Also Published As
Publication number | Publication date |
---|---|
CN111815030A (zh) | 2020-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107886161A (zh) | 一种提高复杂信息系统效能的全局敏感性分析方法 | |
Xu* et al. | A polychromatic sets approach to the conceptual design of machine tools | |
CN110083125B (zh) | 一种基于深度学习的机床热误差建模方法 | |
Pal et al. | Rapid tooling route selection for metal casting using QFD–ANP methodology | |
Ming-Te et al. | Using data mining technique to perform the performance assessment of lean service | |
CN108416439A (zh) | 基于变量加权深度学习的炼油过程产品预测方法和系统 | |
US20200050982A1 (en) | Method and System for Predictive Modeling for Dynamically Scheduling Resource Allocation | |
CN112308298A (zh) | 一种面向半导体生产线的多场景性能指标预测方法及系统 | |
CN114819395A (zh) | 一种基于长短期记忆神经网络和支持向量回归组合模型的行业中长期负荷预测方法 | |
CN114239397A (zh) | 基于动态特征提取与局部加权深度学习的软测量建模方法 | |
CN113627977A (zh) | 一种基于异构图的房屋价值预测方法 | |
CN111815030B (zh) | 一种基于少量问卷调查数据的多目标特征预测方法 | |
CN110222877A (zh) | 一种基于自定义神经网络的负荷预测系统及负荷预测方法 | |
CN113722951B (zh) | 基于神经网络的散射体三维有限元网格优化方法 | |
CN115759469A (zh) | 一种针对峰值负荷及其出现时间的预测方法及其装置 | |
CN114612914A (zh) | 一种多标签不平衡数据分类的机器学习方法及系统 | |
Xie et al. | New dynamic group DEMATEL decision-making method based on hesitant fuzzy linguistic term sets | |
Yang et al. | Sequential big data-based macroeconomic forecast for industrial value added | |
Dalimunthe et al. | Study of C45 Algorithm In Predicting New Employee Acception | |
Gomes et al. | Optimisation of Multiple Response Processes Using Different Modeling Techniques | |
CN103279461B (zh) | 面向领域的Web服务文档质量评价方法 | |
Kim et al. | Stepwise benchmarking based on production function: Selecting path towards closest target | |
CN113283174B (zh) | 基于算法集成与自控制的储层产能预测方法、系统及终端 | |
Zhu | A new discounting approach to conflict information fusion using multi-criteria of reliability in dempster-shafer evidence theory | |
Li et al. | Improved genetic algorithm-GM (1, 1) for power load forecasting problem |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |