CN111222566B - 用户属性识别方法、装置及存储介质 - Google Patents
用户属性识别方法、装置及存储介质 Download PDFInfo
- Publication number
- CN111222566B CN111222566B CN202010004475.3A CN202010004475A CN111222566B CN 111222566 B CN111222566 B CN 111222566B CN 202010004475 A CN202010004475 A CN 202010004475A CN 111222566 B CN111222566 B CN 111222566B
- Authority
- CN
- China
- Prior art keywords
- user
- attribute
- identified
- feature
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/285—Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及智能决策,提出一种用户属性识别方法,包括:接收用户通过客户端发出的用户属性识别请求;获取所述待识别用户的预设类型数据;根据所述第一预设类型数据生成所述待识别用户的多个目标特征因子组合对应的特征向量;分别将所述多个目标特征因子组合对应的特征向量输入与所述多个目标特征因子对应的所述识别模型中,基于模型输出结果得到所述待识别用户的属性识别结果;及,将所述待识别用户的属性识别结果反馈至所述客户端。本发明还提出一种电子装置及存储介质。利用本发明,根据待识别用户的预设类型数据,可准确识别出待识别用户的属性数据。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种用户属性识别方法、电子装置及计算机可读存储介质。
背景技术
目前,为了提高产品定价的客观性和产品推荐的精准性,通常需要采用用户分类算法为不同用户进行分类。现有技术中,传统的用户分类算法通常是基于用户属性及固定的规则/利用现有的机器学习算法进行用户分类,这些属性包括用户性别、用户年龄、用户职业、用户学历和地理位置等。
近年来,随着互联网的快速发展,人们的生活行为越来越离不开网络平台。用户在各个网络平台上发布和共享大量数据,留下了大量的网络痕迹,这些数据能够有效刻画用户属性,然而,并不是所有的用户属性均能直接或者经过简单计算间接获取,例如,用户性格特征,
在性格心理学上,一些研究和实验表明拥有相同的性格的人行为习惯上比较规律,这些现象说明他们行为习惯与心理活动显著相关。传统的性格测试方法主要以调查问卷为主,但是这种调查问卷方法比较耗时耗力,并且与测试者的知识和文化背景有关。所以研究如何自动识别评估人的性格特征的方法显得十分必要。
发明内容
本发明提供一种用户属性识别方法、电子装置及计算机可读存储介质,其主要目的在于提高用户属性识别的准确性。
为实现上述目的,本发明提供一种用户属性识别方法,该方法包括:
接收步骤:接收用户通过客户端发出的用户属性识别请求,所述用户属性识别请求中包括待识别用户的身份标识;
获取步骤:基于所述待识别用户的身份标识从预设服务器获取所述待识别用户的第一预设类型数据;
处理步骤:从预设存储路径中获取预先确定的多个目标特征因子组合及与每一个目标特征因子组合相对应的预先训练好的识别模型,根据所述第一预设类型数据生成所述待识别用户的每一个目标特征因子组合对应的特征向量;
识别步骤:分别将每一个目标特征因子组合对应的特征向量输入与所述目标特征因子组合对应的所述识别模型中,基于模型输出结果得到所述待识别用户的属性识别结果;及
反馈步骤:将所述待识别用户的属性识别结果作为待识别用户的属性数据反馈至所述客户端;
所述属性识别结果中包括待识别用户的属性及属性等级,每一个预先训练好的识别模型对应一种属性特征,所述将所述待识别用户的属性识别结果作为待识别用户的属性数据反馈至所述客户端,包括:
根据多个所述识别模型的识别结果分别确定所述待识别用户的不同属性特征的属性等级;
基于所述待识别用户的不同属性特征的属性等级生成所述待识别用户的综合属性识别结果;及
将所述综合属性识别结果作为所述待识别用户的属性数据反馈至所述客户端。
此外,为实现上述目的,本发明还提供一种电子装置,该装置包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的用户属性识别程序程序,该程序被所述处理器执行时实现如上所述的用户属性识别方法的任意步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有用户属性识别程序,该程序被处理器执行时实现如上所述的用户属性识别方法的任意步骤。
相较于现有技术,本发明提出的用户属性识别方法、电子装置及计算机可读存储介质,通过挖掘预设类型数据与用户属性的关系,利用这种关系训练随机森林模型得到用户属性识别模型,实现对用户属性的自动、准确、客观识别;在实际应用过程中,利用每一种属性特征的识别模型对应的目标特征因子组合对应的数据对待识别用户进行属性识别,减少计算量的同时,提高用户属性识别的效率及准确性。通过采用交叉验证的方法训练并验证模型,可以在一定程度上解决模型过拟合的问题,为准确识别用户属性奠定基础;不同用户属性特征采用不同的识别模型,且不同识别模型对应不同的特征因子组合,通过分析筛选出模型准确率最高的特征因子组合,进一步提高用户属性识别的准确性;利用不同属性特征对应的识别模型分析得到待识别用户不同属性特征的属性等级后,综合用户在不同不同属性特征的属性等级信息,得到待识别用户的综合属性特征数据,使得对待识别用户的属性识别结果更全面、更准确。
附图说明
图1为本发明电子装置较佳实施例的示意图;
图2为图1中用户属性识别程序的程序模块示意图;
图3为本发明用户属性识别方法较佳实施例的流程图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种用户属性识别方法,该方法应用于一种电子装置1。参照图1所示,为本发明电子装置1较佳实施例的示意图。
在本实施例中,电子装置1可以是服务器、智能手机、平板电脑、便携计算机、桌上型计算机等具有数据处理功能的终端设备,所述服务器可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器。
该电子装置1包括存储器11、处理器12,通信总线13,以及网络接口14。
其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是所述电子装置1的内部存储单元,例如该电子装置1的硬盘。存储器11在另一些实施例中也可以是所述电子装置1的外部存储设备,例如该电子装置1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器11还可以既包括该电子装置1的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于该电子装置1的应用软件及各类数据,例如用户属性识别程序10等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如用户属性识别程序10等。
通信总线13用于实现这些组件之间的连接通信。
网络接口14可选的可以包括标准的有线接口、无线接口(如WI-FI接口),通常用于在该电子装置1与其他电子设备(例如,客户端)之间建立通信连接。
图1仅示出了具有组件11-14的电子装置1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
可选地,该电子装置1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。
可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-Emitting Diode,OLED)触摸器等。其中,显示器也可以称为显示屏或显示单元,用于显示在电子装置1中处理的信息以及用于显示可视化的用户界面。
在图1所示的装置实施例中,存储器11中存储有用户属性识别程序10。处理器12执行存储器11中存储的用户属性识别程序10时实现如下步骤:
接收步骤:接收用户通过客户端发出的用户属性识别请求,所述用户属性识别请求中包括待识别用户的身份标识;
本实施例以对某金融机构的保险客户进行出险性格这一属性进行识别为例,以电子装置1为执行主体对本方案进行说明,但不仅限于对保险客户进行出险性格识别。
在本实施例中,上述用户属性为用户的性格,是与基于大五人格与16PF等经典性格理论与危险驾驶、出险高度相关的研究/实验文献归纳出的12维性格类别,包括:焦虑型、尽责型、利他型、冲动型、敌对型、乐群型、独立型、激进型、自律型、条理型、顺从型、聪慧型。
在本实施例中,电子装置1接收用户通过客户端发送的携带待识别用户的身份标识的用户属性识别请求。上述待识别用户的身份标识可以是身份证、手机号、姓名等。
获取步骤:基于所述待识别用户的身份标识从预设服务器获取所述待识别用户的第一预设类型数据;
所述基于所述待识别用户的身份标识从预设服务器获取所述待识别用户的第一预设类型数据,包括:
从所述用户属性识别请求中获取所述待识别用户的身份标识,确定与所述身份标识对应的预设类型的账号信息;
根据所述预设类型的账号信息从所述预设服务器中获取所述待识别用户在预设时间内的全量信息;及
从所述全量信息中筛选出所述待识别用户的第一预设类型数据。
其中,以手机号为例,获取与所述手机号绑定的所有账号信息,例如,购物类APP的账号信息、理财类APP的账号信息、运动健身类APP的账号信息等,根据账号信息拉取该用户的所有信息并从中筛选出预先确定的与性格属性识别相关的行为爱好数据。
处理步骤:从预设存储路径中获取预先确定的多个目标特征因子组合及与每一个目标特征因子组合相对应的预先训练好的识别模型,根据所述第一预设类型数据生成所述待识别用户的每一个目标特征因子组合对应的特征向量;
在本实施例中,为了提高属性识别的准确性,每一种属性特征对应一个识别模型,为了进一步提高准确性,每一种属性特征对应的识别模型的特征因子不完全相同。例如,焦虑型性格对应焦虑型分类模型,对应的目标特征因子组合包括:A1、A2、Ai、…;尽责型性格对应的对应尽责型分类模型,对应的目标特征因子组合包括:D1、D2、Di、…;…以此类推。
当得到待识别用户的行为爱好数据后,基于上述映射数据及特征工程确定每一种属性特征的识别模型对应的特征向量,即生成每一种性格属性对应的特征向量。例如,在确定焦虑型性格对应特征向量时,首先根据映射数据确定焦虑型性格对应的目标特征因子组合包括:A1、A2、Ai、…,从待识别用户的行为爱好数据中筛选出该目标特征因子组合对应的特征数据,并基于筛选出的特征数据生成特征向量,最后将特征向量输入与焦虑型性格对应的识别模型中进行识别。
需要说明的是,在生成每一种性格属性对应的特征向量前,需要对待识别用户的行为爱好数据进行空值填充等预处理,以确定各特征因子对应的特征值,空值填空为本领域人员习知手段,这里不作赘述。在生成每一种性格对应的特征向量过程中,各特征向量对应的特征因子顺序是预先确定的,直接基于各特征因子对应的指标值及特征因子顺序生成性格特征向量。
识别步骤:分别将每一个目标特征因子组合对应的特征向量输入与所述目标特征因子组合对应的所述识别模型中,基于模型输出结果得到所述待识别用户的属性识别结果;
分别将12种性格对应的特征向量输入对应的识别模型中,得到12种性格的识别结果,每一个识别模型三分类的结果包括:“0”、“1”、“2”,分别表示对应性格的等级:“低”、“中”、“高”。例如,激进型性格对应的模型输出结果为:“0”,表示待识别用户为低激进型;自律型性格对应的模型输出结果为:“1”,表示待识别用户为中自律型;聪慧型性格对应的模型输出结果为:“2”,表示待识别用户为高聪慧型。
反馈步骤:将所述待识别用户的属性识别结果作为待识别用户的属性数据反馈至所述客户端。
将上述各识别模型的识别结果作为待识别用户的属性数据反馈至客户端。
在其他实施例中,所述将所述待识别用户的属性识别结果作为待识别用户的属性数据反馈至所述客户端,包括:
根据多个所述识别模型的识别结果分别确定所述待识别用户的不同用户属性特征的属性等级;
基于所述待识别用户的不同用户属性特征的属性等级生成所述待识别用户的综合属性识别结果;及
将所述综合属性识别结果作为所述待识别用户的属性数据反馈至所述客户端。
12个识别模型对应12个识别结果,将每一个识别模型的识别结果作为待识别用户的用户属性数据(综合性格特征)的一个分量,每个分量上的值为“0”、“1”、“2”中的某一个。整合12个识别结果生成当前待识别用户的综合性格特征,即综合用户属性数据。
在其他实施例中,所述预先训练好的识别模型的训练步骤包括:
获取指定用户群中每个用户在预设时间内的第一预设类型数据和第二预设类型数据,根据所述第一预设类型数据确定所述每个用户对应的预设特征因子的特征值,根据所述第二预设类型数据确定所述每个用户对应的属性特征及属性等级;及
基于所述每个用户对应的预设特征因子的特征值及所述属性特征生成每一种属性特征对应的样本数据,分别利用所述每一种属性特征对应的样本数据及交叉验证的方式训练随机森林模型,确定不同属性特征对应的识别模型。
上述指定用户群为某金融机构已有的车险用户。
上述第一预设类型数据为用户在手机APP上留下的数据,例如,行为爱好数据:运动健身兴趣爱好相关信息、问诊咨询兴趣爱好相关信息等。基于用户的行为爱好数据确定各预设特征因子的特征值,并生成特征向量。
可以理解的是,随着时间的推移,用户的行为爱好数据会发生较大的变化,为了使获取的数据更符合用户当前的实际情况,在时间维度上对用户的数据进行筛选,仅保留用户在预设时间内(例如,近3个月)的行为爱好数据。
上述第二预设类型数据为通过某种方式获取的上述指定用户群中每一个用户的不同性格对应的分数,例如,通过设计性格问卷,每个维度对应5道题,涵盖12个性格维度,共60题,按调研样本答题情况进行性格维度打分。
根据每一个用户的不同性格类别对应的分数确定该用户对应的不同性格类别及其等级。其中,每种性格类别对应的等级包括:高、中、低。性格类别的等级根据某一种性格类别的所有用户的评分及先验知识确定,例如,基于所有用户的评分进行降序排列,等比例切分为高、中、低三类,或者预先设置每一种等级对应的分值区间,根据一种性格类别的评分确定对应的分值区间并最终确定对应的等级。
在每一种属性特征对应的样本数据中,自变量X为各预设类型因子对应的特征值生成的特征向量,因变量Y为某一种性格类别对应的等级标签(例如,“2”、“1”、“0”分别对应:高、中、低。
不同的性格类别对应的样本数据中,自变量X相同,但因变量Y可能不同。以用户A为例,焦虑型性格类别对应的样本数据包括:用户A的行为爱好数据对应的特征向量及用户A焦虑型性格类别的等级(例如,高),而自律型性格类别对应的样本数据包括:用户A的行为爱好数据对应的特征向量及用户A自律型性格类别的等级(例如,低)。
本实施例中,通过对随机森林模型进行训练得到的识别模型为三分类模型,三分类包括:高、中、低。
在训练过程中,将第一预设比例(例如,90%)的样本数据归为训练集,将第二预设比例(例如,10%)的样本数据归为测试集,并根据预设验证指标(例如,FI,accuracy)判断模型训练结果,当预设验证指标满足预设条件(例如,F1超过第一预设阈值,accuracy超过第二预设阈值)时,确定最终的识别模型。
利用上述步骤,确定每一种性格类别对应的识别模型,即,每一种属性特征对应的识别模型。
在其他实施例中,所述所述基于所述每个用户对应的预设特征因子的特征值及所述属性特征生成每一种属性特征对应的样本数据,包括:
根据所述每个用户对应的预设特征因子的特征值及所述属性特征生成每一种属性特征对应的初始样本数据;
对所述每一种属性特征对应的初始样本数据进行数据预处理,得到每一种属性特征对应的目标样本数据。
可以理解的是,初始样本数据中可能存在多种问题,例如,存在空值、数据离散等。因此,需要对初始样本数据进行数据预处理。
在本实施例中,所述数据预处理包括:空值填充、数据转换、数据过滤等。例如:
空值填充:当某一个特征因子数据为空时,取默认值对这个数据为空的特征因子进行赋值,还可以是取其他用户在的该特征因子上的均值;
数据转换:将离散数据转换连续型数值。例如,使用one-hot编码,对离散型特征使用one-hot编码,会让特征之间的距离计算更加合理。离散特征进行one-hot编码后,编码后的特征,其实每一维度的特征都可以看做是连续的特征。就可以跟对连续型特征的归一化方法一样,对每一维特征进行归一化。比如归一化到[-1,1]或归一化到均值为0,方差为1。例如,将某一个特征因子的“高、中、低”转换为“3、2、1”;
数据过滤:1)获取每一个特征因子的全量数据并进行排序,从全量数据中剔除掉前10%和后10%的数据;2)饱和度过滤;分析各特征因子的饱和度,将饱和度低于预设阈值的特征因子进行过滤;3)方差过滤:分别计算每一个特征因子对应的全量数据的方差,从全量数据中剔除掉方差小于预设阈值的数据。
进一步地,所述对所述每一种属性特征对应的初始样本数据进行数据预处理,得到每一种属性特征对应的目标样本数据,还包括:
计算每一种属性特征对应的目标样本数据中不同属性等级的样本比例,根据不同属性等级的样本比例判断目标样本数据是否分布不平衡,若是,则采用过采样的方法生成数据来更新所述目标样本数据。
以顺从型性格为例,其等级为高/低的样本比例低于15%,则判断其分布不平衡。对于存在分布不平衡的样本数据,通过为其添加高斯噪声来平衡样本数据。高斯噪声是符合高斯正态分布的误差。通过加入合适的高斯噪声会让样本数据具有更好的训练效果,防止模型过拟合,提高模型的泛化能力。
通过在确认样本数据过程中通过对原始数据进行预处理,使得最终得到的样本数据更完整、更精准,提高模型训练的准确性。
在其他实施例中,所述基于所述每个用户对应的预设特征因子的特征值及所述属性特征生成每一种属性特征对应的样本数据,分别利用所述每一种属性特征对应的样本数据及交叉验证的方式训练随机森林模型,确定不同属性特征对应的识别模型,还包括:
对所述预设特征因子进行分类组合,得到不同的因子组合,确定所述不同的因子组合对应的样本数据;
分别利用所述不同的因子组合对应的样本数据训练随机森林模型,得到一种属性特征对应的多个初始识别模型,以准确率最佳的初始识别模型作为所述属性特征对应的识别模型,并以所述准确率最佳的初始识别模型对应的因子组合作为所述属性特征对应的目标特征因子组合;及
确定所述属性特征、识别模型及目标特征因子组合的映射数据,并将其保存至所述预设存储路径中。
在本实施例中,对特征因子进行分类组合时需要根据业务逻辑进行,例如,根据业务逻辑将所有预设特征因子划分为几大类,然后从几大类的特征因子中分别选择一个或多个进行组合,得到多个因子组合。分别利用多个因子组合对应的样本数据训练随机森林模型,并基于模型训练结果确定每一种属性特征对应的识别模型及目标特征因子组合,确定属性特征、识别模型及目标特征因子组合的映射数据,并将模型文件及映射数据保存至预设存储路径中。
上述实施例提出的电子装置1,通过挖掘预设类型数据与用户属性的关系,利用这种关系训练随机森林模型得到用户属性识别模型,实现对用户属性的自动、准确、客观识别;在实际应用过程中,利用每一种属性特征的识别模型对应的目标特征因子组合对应的数据对待识别用户进行属性识别,减少计算量的同时,提高用户属性识别的效率及准确性。通过采用交叉验证的方法训练并验证模型,可以在一定程度上解决模型过拟合的问题,为准确识别用户属性奠定基础;不同用户属性特征采用不同的识别模型,且不同识别模型对应不同的特征因子组合,通过分析筛选出模型准确率最高的特征因子组合,进一步提高用户属性识别的准确性;利用不同属性特征对应的识别模型分析得到待识别用户不同属性特征的属性等级后,综合用户在不同不同属性特征的属性等级信息,得到待识别用户的综合属性特征数据,使得对待识别用户的属性识别结果更全面、更准确。
可选地,在其他的实施例中,用户属性识别程序10还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器11中,并由一个或多个处理器(本实施例为处理器12)所执行,以完成本发明,本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段。例如,参照图2所示,为图1中用户属性识别程序10的程序模块示意图,该实施例中,用户属性识别程序10可以被分割为接收模块110、获取模块120、处理模块130、识别模块140及反馈模块150,所述模块110-150所实现的功能或操作步骤均与上文类似,此处不再详述,示例性地,例如其中:
接收模块110,用于接收用户通过客户端发出的用户属性识别请求,所述用户属性识别请求中包括待识别用户的身份标识;
获取模块120,用于基于所述待识别用户的身份标识从预设服务器获取所述待识别用户的第一预设类型数据;
处理模块130,用于从预设存储路径中获取预先确定的多个目标特征因子组合与多个预先训练好的识别模型之间的映射数据,根据所述第一预设类型数据生成所述待识别用户的多个目标特征因子组合分别对应的多个特征向量;
识别模块140,用于分别将所述多个目标特征因子组合对应的多个特征向量输入与所述多个目标特征因子组合对应的所述识别模型中,基于模型输出结果得到所述待识别用户的属性识别结果;及
反馈模块150,用于将所述待识别用户的属性识别结果作为待识别用户的属性数据反馈至所述客户端。
此外,本发明还提供一种用户属性识别方法。参照图3所示,为本发明用户属性识别方法较佳实施例的流程图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。
在本实施例中,所述用户属性识别方法包括:步骤S1-S5。
步骤S1,接收用户通过客户端发出的用户属性识别请求,所述用户属性识别请求中包括待识别用户的身份标识。
在本实施例中,上述用户属性为用户的性格,是与基于大五人格与16PF等经典性格理论与危险驾驶、出险高度相关的研究/实验文献归纳出的12维性格类别,包括:焦虑型、尽责型、利他型、冲动型、敌对型、乐群型、独立型、激进型、自律型、条理型、顺从型、聪慧型。
在本实施例中,电子装置1接收用户通过客户端发送的携带待识别用户的身份标识的用户属性识别请求。上述待识别用户的身份标识可以是身份证、手机号、姓名等。
步骤S2,基于所述待识别用户的身份标识从预设服务器获取所述待识别用户的第一预设类型数据。
所述基于所述待识别用户的身份标识从预设服务器获取所述待识别用户的第一预设类型数据,包括:
从所述用户属性识别请求中获取所述待识别用户的身份标识,确定与所述身份标识对应的预设类型的账号信息;
根据所述预设类型的账号信息从所述预设服务器中获取所述待识别用户在预设时间内的全量信息;及
从所述全量信息中筛选出所述待识别用户的第一预设类型数据。
其中,以手机号为例,获取与所述手机号绑定的所有账号信息,例如,购物类APP的账号信息、理财类APP的账号信息、运动健身类APP的账号信息等,根据账号信息拉取该用户的所有信息并从中筛选出预先确定的与性格属性识别相关的行为爱好数据。
步骤S3,从预设存储路径中获取预先确定的多个目标特征因子组合及多个预先训练好的识别模型的映射数据,根据所述第一预设类型数据生成所述待识别用户的多个目标特征因子组合对应的特征向量。
在本实施例中,为了提高属性识别的准确性,每一种属性特征对应一个识别模型,为了进一步提高准确性,每一种属性特征对应的识别模型的特征因子不完全相同。例如,焦虑型性格对应焦虑型分类模型,对应的目标特征因子组合包括:A1、A2、Ai、…;尽责型性格对应的对应尽责型分类模型,对应的目标特征因子组合包括:D1、D2、Di、…;…以此类推。
当得到待识别用户的行为爱好数据后,基于上述映射数据及特征工程确定每一种属性特征的识别模型对应的特征向量,即生成每一种性格属性对应的特征向量。例如,在确定焦虑型性格对应特征向量时,首先根据映射数据确定焦虑型性格对应的目标特征因子组合包括:A1、A2、Ai、…,从待识别用户的行为爱好数据中筛选出该目标特征因子组合对应的特征数据,并基于筛选出的特征数据生成特征向量,最后将特征向量输入与焦虑型性格对应的识别模型中进行识别。
需要说明的是,在生成每一种性格属性对应的特征向量前,需要对待识别用户的行为爱好数据进行空值填充等预处理,以确定各特征因子对应的特征值,空值填空为本领域人员习知手段,这里不作赘述。在生成每一种性格对应的特征向量过程中,各特征向量对应的特征因子顺序是预先确定的,直接基于各特征因子对应的指标值及特征因子顺序生成性格特征向量。
步骤S4,分别将所述多个目标特征因子组合对应的特征向量输入与所述多个目标特征因子对应的所述识别模型中,基于模型输出结果得到所述待识别用户的属性识别结果。
分别将12种性格对应的特征向量输入对应的识别模型中,得到12种性格的识别结果,每一个识别模型三分类的结果包括:“0”、“1”、“2”,分别表示对应性格的等级:“低”、“中”、“高”。例如,激进型性格对应的模型输出结果为:“0”,表示待识别用户为低激进型;自律型性格对应的模型输出结果为:“1”,表示待识别用户为中自律型;聪慧型性格对应的模型输出结果为:“2”,表示待识别用户为高聪慧型。
步骤S5,将所述待识别用户的属性识别结果作为待识别用户的属性数据反馈至所述客户端。
将上述各识别模型的识别结果作为待识别用户的属性数据反馈至客户端。
在其他实施例中,所述将所述待识别用户的属性识别结果作为待识别用户的属性数据反馈至所述客户端,包括:
根据多个所述识别模型的识别结果分别确定所述待识别用户的不同用户属性特征的属性等级;
基于所述待识别用户的不同用户属性特征的属性等级生成所述待识别用户的综合属性识别结果;及
将所述综合属性识别结果作为所述待识别用户的属性数据反馈至所述客户端。
12个识别模型对应12个识别结果,将每一个识别模型的识别结果作为待识别用户的用户属性数据(综合性格特征)的一个分量,每个分量上的值为“0”、“1”、“2”中的某一个。整合12个识别结果生成当前待识别用户的综合性格特征,即综合用户属性数据。
在其他实施例中,所述预先训练好的识别模型的训练步骤包括:
获取指定用户群中每个用户在预设时间内的第一预设类型数据和第二预设类型数据,根据所述第一预设类型数据确定所述每个用户对应的预设特征因子的特征值,根据所述第二预设类型数据确定所述每个用户对应的属性特征及属性等级;及
基于所述每个用户对应的预设特征因子的特征值及所述属性特征生成每一种属性特征对应的样本数据,分别利用所述每一种属性特征对应的样本数据及交叉验证的方式训练随机森林模型,确定不同属性特征对应的识别模型。
上述指定用户群为某金融机构已有的车险用户。
上述第一预设类型数据为用户在手机APP上留下的数据,例如,行为爱好数据:运动健身兴趣爱好相关信息、问诊咨询兴趣爱好相关信息等。基于用户的行为爱好数据确定各预设特征因子的特征值,并生成特征向量。
可以理解的是,随着时间的推移,用户的行为爱好数据会发生较大的变化,为了使获取的数据更符合用户当前的实际情况,在时间维度上对用户的数据进行筛选,仅保留用户在预设时间内(例如,近3个月)的行为爱好数据。
上述第二预设类型数据为通过某种方式获取的上述指定用户群中每一个用户的不同性格对应的分数,例如,通过设计性格问卷,每个维度对应5道题,涵盖12个性格维度,共60题,按调研样本答题情况进行性格维度打分。
根据每一个用户的不同性格类别对应的分数确定该用户对应的不同性格类别及其等级。其中,每种性格类别对应的等级包括:高、中、低。性格类别的等级根据某一种性格类别的所有用户的评分及先验知识确定,例如,基于所有用户的评分进行降序排列,等比例切分为高、中、低三类,或者预先设置每一种等级对应的分值区间,根据一种性格类别的评分确定对应的分值区间并最终确定对应的等级。
在每一种属性特征对应的样本数据中,自变量X为各预设类型因子对应的特征值生成的特征向量,因变量Y为某一种性格类别对应的等级标签(例如,“2”、“1”、“0”分别对应:高、中、低。
不同的性格类别对应的样本数据中,自变量X相同,但因变量Y可能不同。以用户A为例,焦虑型性格类别对应的样本数据包括:用户A的行为爱好数据对应的特征向量及用户A焦虑型性格类别的等级(例如,高),而自律型性格类别对应的样本数据包括:用户A的行为爱好数据对应的特征向量及用户A自律型性格类别的等级(例如,低)。
本实施例中,通过对随机森林模型进行训练得到的识别模型为三分类模型,三分类包括:高、中、低。
在训练过程中,将第一预设比例(例如,90%)的样本数据归为训练集,将第二预设比例(例如,10%)的样本数据归为测试集,并根据预设验证指标(例如,FI,accuracy)判断模型训练结果,当预设验证指标满足预设条件(例如,F1超过第一预设阈值,accuracy超过第二预设阈值)时,确定最终的识别模型。
利用上述步骤,确定每一种性格类别对应的识别模型,即,每一种属性特征对应的识别模型。
在其他实施例中,所述所述基于所述每个用户对应的预设特征因子的特征值及所述属性特征生成每一种属性特征对应的样本数据,包括:
根据所述每个用户对应的预设特征因子的特征值及所述属性特征生成每一种属性特征对应的初始样本数据;
对所述每一种属性特征对应的初始样本数据进行数据预处理,得到每一种属性特征对应的目标样本数据。
可以理解的是,初始样本数据中可能存在多种问题,例如,存在空值、数据离散等。因此,需要对初始样本数据进行数据预处理。
在本实施例中,所述数据预处理包括:空值填充、数据转换、数据过滤等。例如:
空值填充:当某一个特征因子数据为空时,取默认值对这个数据为空的特征因子进行赋值,还可以是取其他用户在的该特征因子上的均值;
数据转换:将离散数据转换连续型数值。例如,使用one-hot编码,对离散型特征使用one-hot编码,会让特征之间的距离计算更加合理。离散特征进行one-hot编码后,编码后的特征,其实每一维度的特征都可以看做是连续的特征。就可以跟对连续型特征的归一化方法一样,对每一维特征进行归一化。比如归一化到[-1,1]或归一化到均值为0,方差为1。例如,将某一个特征因子的“高、中、低”转换为“3、2、1”;
数据过滤:1)获取每一个特征因子的全量数据并进行排序,从全量数据中剔除掉前10%和后10%的数据;2)饱和度过滤;分析各特征因子的饱和度,将饱和度低于预设阈值的特征因子进行过滤;3)方差过滤:分别计算每一个特征因子对应的全量数据的方差,从全量数据中剔除掉方差小于预设阈值的数据。
进一步地,所述对所述每一种属性特征对应的初始样本数据进行数据预处理,得到每一种属性特征对应的目标样本数据,还包括:
计算每一种属性特征对应的目标样本数据中不同属性等级的样本比例,根据不同属性等级的样本比例判断目标样本数据是否分布不平衡,若是,则采用过采样的方法生成数据来更新所述目标样本数据。
以顺从型性格为例,其等级为高/低的样本比例低于15%,则判断其分布不平衡。对于存在分布不平衡的样本数据,通过为其添加高斯噪声来平衡样本数据。高斯噪声是符合高斯正态分布的误差。通过加入合适的高斯噪声会让样本数据具有更好的训练效果,防止模型过拟合,提高模型的泛化能力。
通过在确认样本数据过程中通过对原始数据进行预处理,使得最终得到的样本数据更完整、更精准,提高模型训练的准确性。
在其他实施例中,所述基于所述每个用户对应的预设特征因子的特征值及所述属性特征生成每一种属性特征对应的样本数据,分别利用所述每一种属性特征对应的样本数据及交叉验证的方式训练随机森林模型,确定不同属性特征对应的识别模型,还包括:
对所述预设特征因子进行分类组合,得到不同的因子组合,确定所述不同的因子组合对应的样本数据;
分别利用所述不同的因子组合对应的样本数据训练随机森林模型,得到一种属性特征对应的多个初始识别模型,以准确率最佳的初始识别模型作为所述属性特征对应的识别模型,并以所述准确率最佳的初始识别模型对应的因子组合作为所述属性特征对应的目标特征因子组合;及
确定所述属性特征、识别模型及目标特征因子组合的映射数据,并将其保存至所述预设存储路径中。
在本实施例中,对特征因子进行分类组合时需要根据业务逻辑进行,例如,根据业务逻辑将所有预设特征因子划分为几大类,然后从几大类的特征因子中分别选择一个或多个进行组合,得到多个因子组合。分别利用多个因子组合对应的样本数据训练随机森林模型,并基于模型训练结果确定每一种属性特征对应的识别模型及目标特征因子组合,确定属性特征、识别模型及目标特征因子组合的映射数据,并将模型文件及映射数据保存至预设存储路径中。
上述实施例提出的用户属性识别方法,通过挖掘预设类型数据与用户属性的关系,利用这种关系训练随机森林模型得到用户属性识别模型,实现对用户属性的自动、准确、客观识别;在实际应用过程中,利用每一种属性特征的识别模型对应的目标特征因子组合对应的数据对待识别用户进行属性识别,减少计算量的同时,提高用户属性识别的效率及准确性。通过采用交叉验证的方法训练并验证模型,可以在一定程度上解决模型过拟合的问题,为准确识别用户属性奠定基础;不同用户属性特征采用不同的识别模型,且不同识别模型对应不同的特征因子组合,通过分析筛选出模型准确率最高的特征因子组合,进一步提高用户属性识别的准确性;利用不同属性特征对应的识别模型分析得到待识别用户不同属性特征的属性等级后,综合用户在不同不同属性特征的属性等级信息,得到待识别用户的综合属性特征数据,使得对待识别用户的属性识别结果更全面、更准确。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有用户属性识别程序10,该程序被处理器执行时实现如下操作:
接收步骤:接收用户通过客户端发出的用户属性识别请求,所述用户属性识别请求中包括待识别用户的身份标识;
获取步骤:基于所述待识别用户的身份标识从预设服务器获取所述待识别用户的第一预设类型数据;
处理步骤:从预设存储路径中获取预先确定的多个目标特征因子组合及多个预先训练好的识别模型的映射数据,根据所述第一预设类型数据生成所述待识别用户的多个目标特征因子组合对应的特征向量;
识别步骤:分别将所述多个目标特征因子组合对应的特征向量输入与所述多个目标特征因子对应的所述识别模型中,基于模型输出结果得到所述待识别用户的属性识别结果;及
反馈步骤:将所述待识别用户的属性识别结果作为待识别用户的属性数据反馈至所述客户端。
本发明计算机可读存储介质具体实施方式与上述用户属性识别方法和电子装置1的具体实施方式基本相同,在此不作累述。
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (8)
1.一种用户属性识别方法,应用于电子装置,其特征在于,该方法包括:
接收步骤:接收用户通过客户端发出的用户属性识别请求,所述用户属性识别请求中包括待识别用户的身份标识;
获取步骤:基于所述待识别用户的身份标识从预设服务器获取所述待识别用户的第一预设类型数据;
处理步骤:从预设存储路径中获取预先确定的多个目标特征因子组合及与每一个目标特征因子组合相对应的预先训练好的识别模型,根据所述第一预设类型数据生成所述待识别用户的每一个目标特征因子组合对应的特征向量;
识别步骤:分别将每一个目标特征因子组合对应的特征向量输入与所述目标特征因子组合对应的所述识别模型中,基于模型输出结果得到所述待识别用户的属性识别结果;及
反馈步骤:将所述待识别用户的属性识别结果作为待识别用户的属性数据反馈至所述客户端;
所述属性识别结果中包括待识别用户的属性及属性等级,每一个预先训练好的识别模型对应一种属性特征,所述将所述待识别用户的属性识别结果作为待识别用户的属性数据反馈至所述客户端,包括:
根据多个所述识别模型的识别结果分别确定所述待识别用户的不同属性特征的属性等级;
基于所述待识别用户的不同属性特征的属性等级生成所述待识别用户的综合属性识别结果;及
将所述综合属性识别结果作为所述待识别用户的属性数据反馈至所述客户端。
2.如权利要求1所述的用户属性识别方法,其特征在于,所述预先训练好的识别模型的训练步骤包括:
获取指定用户群中每个用户在预设时间内的第一预设类型数据和第二预设类型数据,根据所述第一预设类型数据确定所述每个用户对应的预设特征因子的特征值,根据所述第二预设类型数据确定所述每个用户对应的属性特征及属性等级;及
基于所述每个用户对应的预设特征因子的特征值及所述属性特征生成每一种属性特征对应的样本数据,分别利用所述每一种属性特征对应的样本数据及交叉验证的方式训练随机森林模型,确定不同属性特征对应的识别模型。
3.如权利要求1所述的用户属性识别方法,其特征在于,所述基于所述待识别用户的身份标识从预设服务器获取所述待识别用户的第一预设类型数据,包括:
从所述用户属性识别请求中获取所述待识别用户的身份标识,确定与所述身份标识对应的预设类型的账号信息;
根据所述预设类型的账号信息从所述预设服务器中获取所述待识别用户在预设时间内的全量信息;及
从所述全量信息中筛选出所述待识别用户的第一预设类型数据。
4.如权利要求2所述的用户属性识别方法,其特征在于,所述基于所述每个用户对应的预设特征因子的特征值及所述属性特征生成每一种属性特征对应的样本数据,包括:
根据所述每个用户对应的预设特征因子的特征值及所述属性特征生成每一种属性特征对应的初始样本数据;
对所述每一种属性特征对应的初始样本数据进行数据预处理,得到每一种属性特征对应的目标样本数据。
5.如权利要求4所述的用户属性识别方法,其特征在于,所述数据预处理包括:空值填充、数据转换、数据过滤。
6.如权利要求4所述的用户属性识别方法,其特征在于,所述基于所述每个用户对应的预设特征因子的特征值及所述属性特征生成每一种属性特征对应的样本数据,分别利用所述每一种属性特征对应的样本数据及交叉验证的方式训练随机森林模型,确定不同属性特征对应的识别模型,还包括:
对所述预设特征因子进行分类组合,得到不同的因子组合,确定所述不同的因子组合对应的样本数据;
分别利用所述不同的因子组合对应的样本数据训练随机森林模型,得到一种属性特征对应的多个初始识别模型,以准确率最佳的初始识别模型作为所述属性特征对应的识别模型,并以所述准确率最佳的初始识别模型对应的因子组合作为所述属性特征对应的目标特征因子组合;及
确定所述属性特征、识别模型及目标特征因子组合的映射数据,并将其保存至所述预设存储路径中。
7.一种电子装置,其特征在于,该装置包括:存储器、处理器,所述存储器上存储有可在所述处理器上运行的用户属性识别程序,该程序被所述处理器执行时实现如下步骤:
接收步骤:接收用户通过客户端发出的用户属性识别请求,所述用户属性识别请求中包括待识别用户的身份标识;
获取步骤:基于所述待识别用户的身份标识从预设服务器获取所述待识别用户的第一预设类型数据;
处理步骤:从预设存储路径中获取预先确定的多个目标特征因子组合及与每一个目标特征因子组合相对应的预先训练好的识别模型,根据所述第一预设类型数据生成所述待识别用户的每一个目标特征因子组合对应的特征向量;
识别步骤:分别将每一目标特征因子组合对应的特征向量输入与所述目标特征因子组合对应的所述识别模型中,基于模型输出结果得到所述待识别用户的属性识别结果;及
反馈步骤:将所述待识别用户的属性识别结果作为待识别用户的属性数据反馈至所述客户端;
所述属性识别结果中包括待识别用户的属性及属性等级,每一个预先训练好的识别模型对应一种属性特征,所述将所述待识别用户的属性识别结果作为待识别用户的属性数据反馈至所述客户端,包括:
根据多个所述识别模型的识别结果分别确定所述待识别用户的不同属性特征的属性等级;
基于所述待识别用户的不同属性特征的属性等级生成所述待识别用户的综合属性识别结果;及
将所述综合属性识别结果作为所述待识别用户的属性数据反馈至所述客户端。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有用户属性识别程序,该程序被处理器执行时实现如权利要求1至6中任一项所述的用户属性识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010004475.3A CN111222566B (zh) | 2020-01-02 | 2020-01-02 | 用户属性识别方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010004475.3A CN111222566B (zh) | 2020-01-02 | 2020-01-02 | 用户属性识别方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111222566A CN111222566A (zh) | 2020-06-02 |
CN111222566B true CN111222566B (zh) | 2020-09-01 |
Family
ID=70807863
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010004475.3A Active CN111222566B (zh) | 2020-01-02 | 2020-01-02 | 用户属性识别方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111222566B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112130815B (zh) * | 2020-08-18 | 2024-10-01 | 成都市维思凡科技有限公司 | 一种自动识别用户特性并为其提供辅助的方法、系统及存储介质 |
CN115292081B (zh) * | 2022-08-10 | 2023-10-20 | 朴道征信有限公司 | 信息发送方法、装置、电子设备和介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102646132A (zh) * | 2012-03-26 | 2012-08-22 | 中国联合网络通信集团有限公司 | 宽带用户属性识别方法和装置 |
CN104679969A (zh) * | 2013-11-29 | 2015-06-03 | 腾讯科技(深圳)有限公司 | 防止用户流失的方法及装置 |
CN104991899A (zh) * | 2015-06-02 | 2015-10-21 | 广州酷狗计算机科技有限公司 | 用户属性的识别方法及装置 |
CN105094305A (zh) * | 2014-05-22 | 2015-11-25 | 华为技术有限公司 | 识别用户行为的方法、用户设备及行为识别服务器 |
CN108416485A (zh) * | 2017-07-25 | 2018-08-17 | 平安科技(深圳)有限公司 | 用户身份识别方法、电子装置及计算机可读存储介质 |
CN110121088A (zh) * | 2019-04-17 | 2019-08-13 | 北京奇艺世纪科技有限公司 | 一种用户属性信息确定方法、装置及电子设备 |
CN110276621A (zh) * | 2019-05-21 | 2019-09-24 | 平安银行股份有限公司 | 数据卡反欺诈识别方法、电子装置及可读存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120198365A1 (en) * | 2011-01-31 | 2012-08-02 | Sap Ag | User interface style guide compliance |
CN110555451A (zh) * | 2018-05-31 | 2019-12-10 | 北京京东尚科信息技术有限公司 | 信息识别方法和装置 |
CN109784140A (zh) * | 2018-11-19 | 2019-05-21 | 深圳市华尊科技股份有限公司 | 驾驶员属性识别方法及相关产品 |
-
2020
- 2020-01-02 CN CN202010004475.3A patent/CN111222566B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102646132A (zh) * | 2012-03-26 | 2012-08-22 | 中国联合网络通信集团有限公司 | 宽带用户属性识别方法和装置 |
CN104679969A (zh) * | 2013-11-29 | 2015-06-03 | 腾讯科技(深圳)有限公司 | 防止用户流失的方法及装置 |
CN105094305A (zh) * | 2014-05-22 | 2015-11-25 | 华为技术有限公司 | 识别用户行为的方法、用户设备及行为识别服务器 |
CN104991899A (zh) * | 2015-06-02 | 2015-10-21 | 广州酷狗计算机科技有限公司 | 用户属性的识别方法及装置 |
CN108416485A (zh) * | 2017-07-25 | 2018-08-17 | 平安科技(深圳)有限公司 | 用户身份识别方法、电子装置及计算机可读存储介质 |
CN110121088A (zh) * | 2019-04-17 | 2019-08-13 | 北京奇艺世纪科技有限公司 | 一种用户属性信息确定方法、装置及电子设备 |
CN110276621A (zh) * | 2019-05-21 | 2019-09-24 | 平安银行股份有限公司 | 数据卡反欺诈识别方法、电子装置及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111222566A (zh) | 2020-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109325165B (zh) | 网络舆情分析方法、装置及存储介质 | |
CN112632385A (zh) | 课程推荐方法、装置、计算机设备及介质 | |
CN109582875B (zh) | 一种在线医疗教育资源的个性化推荐方法及系统 | |
CN111861768B (zh) | 基于人工智能的业务处理方法、装置、计算机设备及介质 | |
EP2866421A1 (en) | Method and apparatus for identifying a same user in multiple social networks | |
CN112328909B (zh) | 信息推荐方法、装置、计算机设备及介质 | |
CN111552870A (zh) | 对象推荐方法、电子装置及存储介质 | |
WO2011133551A2 (en) | Reducing the dissimilarity between a first multivariate data set and a second multivariate data set | |
CN107818491A (zh) | 电子装置、基于用户上网数据的产品推荐方法及存储介质 | |
CN111222566B (zh) | 用户属性识别方法、装置及存储介质 | |
CN112348417A (zh) | 一种基于主成分分析算法的营销价值评估方法及装置 | |
CN110209928A (zh) | 一种信息推荐方法、装置及存储介质 | |
CN111475628B (zh) | 会话数据处理方法、装置、计算机设备和存储介质 | |
CN111831708A (zh) | 基于缺失数据的样本分析方法、装置、电子设备及介质 | |
CN115391669A (zh) | 一种智能推荐方法、装置、电子设备 | |
CN112487284A (zh) | 银行客户画像生成方法、设备、存储介质及装置 | |
CN106708729A (zh) | 代码缺陷的预测方法及装置 | |
CN111582932A (zh) | 场景间信息推送方法、装置、计算机设备及存储介质 | |
CN115577172A (zh) | 物品推荐方法、装置、设备及介质 | |
CN117743985B (zh) | 基于移动互联网的在线培训课程推荐方法及系统 | |
CN113934937A (zh) | 一种内容智能推荐方法、装置、终端和存储介质 | |
JP2021018466A (ja) | ルール抽出装置、情報処理装置、ルール抽出方法及びルール抽出プログラム | |
CN113327132A (zh) | 多媒体推荐方法、装置、设备及存储介质 | |
CN110362681B (zh) | 问答系统重复问题识别方法、装置及存储介质 | |
CN111062449A (zh) | 预测模型的训练方法、兴趣度预测方法、装置和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |