CN113158022A - 业务推荐方法、装置、服务器及存储介质 - Google Patents

业务推荐方法、装置、服务器及存储介质 Download PDF

Info

Publication number
CN113158022A
CN113158022A CN202110129181.8A CN202110129181A CN113158022A CN 113158022 A CN113158022 A CN 113158022A CN 202110129181 A CN202110129181 A CN 202110129181A CN 113158022 A CN113158022 A CN 113158022A
Authority
CN
China
Prior art keywords
feature
dimension
service
data
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110129181.8A
Other languages
English (en)
Other versions
CN113158022B (zh
Inventor
吴曙楠
王方舟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202110129181.8A priority Critical patent/CN113158022B/zh
Publication of CN113158022A publication Critical patent/CN113158022A/zh
Application granted granted Critical
Publication of CN113158022B publication Critical patent/CN113158022B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开关于一种业务推荐方法、装置、服务器及存储介质,该方法包括:获取业务对象的业务特征维度对应的特征数据;对所述特征数据进行降维处理,并根据降维后的特征数据,在所述业务特征维度中确定关键特征维度;其中,所述关键特征维度对应的特征数据与所述降维后的特征数据之间的数据差异小于预设的差异阈值;基于所述关键特征维度的特征数据,对所述业务对象进行排序,得到排序后业务对象;对所述排序后业务对象执行推荐策略。采用本公开可以提高业务对象的推荐准确度。

Description

业务推荐方法、装置、服务器及存储介质
技术领域
本公开涉及数据挖掘领域,尤其涉及一种业务推荐方法、装置、服务器及存储介质。
背景技术
相关技术中的短视频创作平台往往会将该平台中的优质内容生产者作为目标对象,并 将该目标对象的相关信息推荐至该平台中的其他内容生产者,以供其他内容生产者进行学 习,促进他们的进步和成长。
在评价业务平台中的对象是否为生成优质业务内容的目标对象时,往往受很多因素或 是特征维度的影响,而现有技术往往只是基于人为经验去选择某些特征维度,并用这些特 征维度对对业务平台中的对象的优质水平进行评价,缺乏科学性,无法准确地在业务平台 中的找出目标对象并进行推荐。
因此,相关技术中存在业务对象的推荐准确度不高的问题。
发明内容
本公开提供一种业务推荐方法、装置、服务器及存储介质,以至少解决相关技术中业 务对象的推荐准确度不高的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种业务推荐方法,包括:
获取业务对象的业务特征维度对应的特征数据;
对所述特征数据进行降维处理,并根据降维后的特征数据,在所述业务特征维度中确 定关键特征维度;其中,所述关键特征维度对应的特征数据与所述降维后的特征数据之间 的数据差异小于预设的差异阈值;
基于所述关键特征维度的特征数据,对所述业务对象进行排序,得到排序后业务对象;
对所述排序后业务对象执行推荐策略。
在一种可能实现方式中,所述对所述特征数据进行降维处理,并根据降维特征数据, 在所述业务特征维度中确定关键特征维度,包括:
对所述特征数据进行降维处理,并根据所述降维后的特征数据和所述特征数据之间的 数据差异,确定所述业务特征维度对应的特征维度权重;
按照所述特征维度权重对所述业务特征维度进行加权,得到所述关键特征维度。
在一种可能实现方式中,所述对所述特征数据进行降维处理,并根据所述降维后的特 征数据和所述特征数据之间的数据差异,确定所述业务特征维度对应的特征维度权重,包 括:
对所述特征数据进行主成分分析,得到主成分分析结果;所述主成分分析结果包括在 新空间坐标下的主成分在所述业务特征维度下的方差占比,以及,所述主成分在所述业务 特征维度下的特征方向;
根据所述主成分在所述业务特征维度下的方差占比和所述主成分在所述业务特征维 度下的特征方向,确定所述业务特征维度对应的特征维度权重。
在一种可能实现方式中,所述根据所述主成分在所述业务特征维度下的方差占比和所 述主成分在所述业务特征维度下的特征方向,确定所述业务特征维度对应的特征维度权 重,包括:
将所述主成分在所述业务特征维度下的方差占比和所述主成分在所述业务特征维度 下的特征方向进行点乘,得到所述业务特征维度对应的特征维度权重。
在一种可能实现方式中,所述获取业务对象的业务特征维度对应的特征数据,包括:
获取原始业务对象数据,所述原始对象业务数据包括业务对象的各个业务特征维度对 应的原始特征数据;
对所述原始特征数据进行标准化处理,得到所述特征数据。
在一种可能实现方式中,所述获取原始对象业务数据,包括:
响应于对象特征选取操作,确定针对所述业务对象所选取的多个候选业务特征维度;
去除所述多个候选业务特征维度中的线性相关特征维度,得到目标业务特征维度;其 中,所述线性相关特征维度的特征数据与任意一个所述候选业务特征维度的特征数据呈线 性相关关系;
获取所述目标业务特征维度的原始特征数据,所述原始特征数据为所述原始对象业务 数据。
在一种可能实现方式中,所述基于所述关键特征维度的特征数据,对所述业务对象进 行排序,得到排序后业务对象,包括:
融合所述关键特征维度的特征数据,得到所述业务对象对应的融合特征数据;
基于所述业务对象对应的融合特征数据,对所述业务对象进行排序,得到所述排序后 业务对象。
在一种可能实现方式中,在所述基于各个所述业务对象对应的融合特征数据,对所述 业务对象进行排序,得到排序后业务对象的步骤之后,还包括:
在所述排序后业务对象中,确定第一对象和第二对象;其中,所述第一对象的融合特 征数据与所述第二对象的融合特征数据相同;
确定第一特征数据与第二特征数据之间的数据差异,所述第一特征数据为所述第一对 象的业务特征维度对应的特征数据,所述第二特征数据为所述第二对象的业务特征维度对 应的特征数据;
若所述数据差异大于预设差异阈值时,则返回所述响应于对象特征选取操作,确定针 对所述业务对象所选取的多个候选业务特征维度的步骤。
在一种可能实现方式中,所述对所述排序后业务对象执行推荐策略,包括:
获取所述排序后业务对象对应的对象描述信息;
按照所述排序后业务对象的排序顺序,对所述对象描述信息进行排序,得到排序后的 对象描述信息;
发送所述排序后的对象描述信息。
根据本公开实施例的第二方面,提供一种业务推荐装置,包括:
获取单元,被配置为执行获取业务对象的业务特征维度对应的特征数据;
确定单元,被配置为执行对所述特征数据进行降维处理,并根据降维后的特征数据, 在所述业务特征维度中确定关键特征维度;其中,所述关键特征维度对应的特征数据与所 述降维后的特征数据之间的数据差异小于预设的差异阈值;
排序单元,被配置为执行基于所述关键特征维度的特征数据,对所述业务对象进行排 序,得到排序后业务对象;
推荐单元,被配置为执行对所述排序后业务对象执行推荐策略。
在一种可能实现方式中,所述确定单元,具体被配置为执行对所述特征数据进行降维 处理,并根据所述降维后的特征数据和所述特征数据之间的数据差异,确定所述业务特征 维度对应的特征维度权重;按照所述特征维度权重对所述业务特征维度进行加权,得到所 述关键特征维度。
在一种可能实现方式中,所述确定单元,具体被配置为执行对所述特征数据进行主成 分分析,得到主成分分析结果;所述主成分分析结果包括在新空间坐标下的主成分在所述 业务特征维度下的方差占比,以及,所述主成分在所述业务特征维度下的特征方向;根据 所述主成分在所述业务特征维度下的方差占比和所述主成分在所述业务特征维度下的特 征方向,确定所述业务特征维度对应的特征维度权重。
在一种可能实现方式中,所述确定单元,具体被配置为执行将所述主成分在所述业务 特征维度下的方差占比和所述主成分在所述业务特征维度下的特征方向进行点乘,得到所 述业务特征维度对应的特征维度权重。
在一种可能实现方式中,所述获取单元,具体被配置为执行获取原始业务对象数据, 所述原始对象业务数据包括业务对象的各个业务特征维度对应的原始特征数据;对所述原 始特征数据进行标准化处理,得到所述特征数据。
在一种可能实现方式中,所述获取单元,具体被配置为执行响应于对象特征选取操作, 确定针对所述业务对象所选取的多个候选业务特征维度;去除所述多个候选业务特征维度 中的线性相关特征维度,得到目标业务特征维度;其中,所述线性相关特征维度的特征数 据与任意一个所述候选业务特征维度的特征数据呈线性相关关系;获取所述目标业务特征 维度的原始特征数据,所述原始特征数据为所述原始对象业务数据。
在一种可能实现方式中,所述排序单元,具体被配置为执行融合所述关键特征维度的 特征数据,得到所述业务对象对应的融合特征数据;基于所述业务对象对应的融合特征数 据,对所述业务对象进行排序,得到所述排序后业务对象。
在一种可能实现方式中,所述业务推荐装置,还包括:对象确定单元,被配置为执行 在所述排序后业务对象中,确定第一对象和第二对象;其中,所述第一对象的融合特征数 据与所述第二对象的融合特征数据相同;确定第一特征数据与第二特征数据之间的数据差 异,所述第一特征数据为所述第一对象的业务特征维度对应的特征数据,所述第二特征数 据为所述第二对象的业务特征维度对应的特征数据;若所述数据差异大于预设差异阈值 时,则返回所述响应于对象特征选取操作,确定针对所述业务对象所选取的多个候选业务 特征维度的步骤。
在一种可能实现方式中,所述推荐单元,具体被配置为执行获取所述排序后业务对象 对应的对象描述信息;按照所述排序后业务对象的排序顺序,对所述对象描述信息进行排 序,得到排序后的对象描述信息;发送所述排序后的对象描述信息。
根据本公开实施例的第三方面,提供一种电子设备,包括存储器和处理器,所述存储 器存储有计算机程序,所述处理器执行所述计算机程序时实现如第一方面或第一方面的任 一种可能实现方式所述的一种业务推荐方法。
根据本公开实施例的第四方面,提供一种存储介质,其上存储有计算机程序,所述计 算机程序被处理器执行时实现如第一方面或第一方面的任一种可能实现方式所述的一种 业务推荐方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,所述程序产品包括计算机 程序,所述计算机程序存储在可读存储介质中,设备的至少一个处理器从所述可读存储介 质读取并执行所述计算机程序,使得设备执行第一方面的任一项实施例中所述的一种业务 推荐方法。
本公开的实施例提供的技术方案至少带来以下有益效果:获取业务对象的业务特征维 度对应的特征数据,对特征数据进行降维处理,并根据降维后的特征数据,在业务特征维 度中确定关键特征维度;其中,关键特征维度对应的特征数据与降维后的特征数据之间的 数据差异小于预设的差异阈值;基于关键特征维度的特征数据,对业务对象进行排序,得 到排序后业务对象;对所述排序后业务对象执行推荐策略;如此,可以在业务对象的多个 业务特征维度中,准确且有效地确定出可以用于排序各个业务对象的关键特征维度,并基 于关键特征维度的特征数据,对各个业务对象进行准确地排序,实现了基于关键特征维度 在各个业务对象中挖掘出能够输出优质业务内容的目标对象并进行推荐,提高了业务对象 的推荐准确度。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限 制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例, 并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种业务推荐方法的应用环境图。
图2是根据一示例性实施例示出的一种业务推荐方法的流程图。
图3是根据一示例性实施例示出的另一种业务推荐方法的流程图。
图4是根据一示例性实施例示出的一种业务推荐流程图。
图5是根据一示例性实施例示出的一种业务推荐装置的框图。
图6是根据一示例性实施例示出的一种服务器的内部结构图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实 施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二” 等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的 数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或 描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相 一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方 面相一致的装置和方法的例子。
本公开所提供的业务推荐方法,可以应用于如图1所示的应用环境中。其中,服务器 110获取业务对象的业务特征维度对应的特征数据,对特征数据进行降维处理,并根据降 维后的特征数据,在业务特征维度中确定关键特征维度,基于关键特征维度的特征数据, 对业务对象进行排序,得到排序后业务对象,对所述排序后业务对象执行推荐策略。对所 述排序后业务对象执行推荐策略例如推荐排序后业务对象、或向所述排序后业务对象推荐 信息;其中,关键特征维度对应的特征数据与降维后的特征数据之间的数据差异小于预设 的差异阈值。其中,服务器110可以用独立的服务器或者是多个服务器组成的服务器集群 来实现。
图2是根据一示例性实施例示出的一种业务推荐方法的流程图,如图2所示,该业务 推荐方法用于图1的服务器110中,包括以下步骤。
在步骤S210中,获取业务对象的业务特征维度对应的特征数据。
其中,业务对象可以是指在业务平台中的对象。例如,某个作品平台的作品生产者、 某个直播平台的主播、某个购物平台的卖家或者买家、媒体作品(如,专辑、视频、歌曲、电影等)、人物(如,歌手、演员、编剧、学生、老师等)。当然,业务对象也可以被命 名为业务实体。
其中,业务特征维度可以是指用于描述该业务对象的相关属性信息的特征维度。例如, 当业务对象为某个作品平台的作品生产者时,业务特征维度可以是生产作品数、作品被点 赞次数、作品被播放次数等等,即与该作品生产者相关的属性均可以作为业务特征维度。
其中,业务特征维度对应的特征数据可以是业务对象在该业务特征维度下对应的具体 的特征值。例如,A主播的生产作品数为100个、作品被点赞词数为10000次。
具体实现中,服务器获取业务对象的业务特征维度对应的特征数据。
例如,当多个业务对象为某个作品平台的N(N为正整数)个作品生产者时,服务器可以获取各个作品生产者的生产作品数、作品被点赞次数、作品被播放次数、生产者性别、生产者出生日期、生产者年龄和生产者生日等具体的数值,如作者小明生产的生产作品数为10个、作品被点赞次数为20次、作品被播放次数为30次、生产者性别为女、生产者 出生日期为2001年10月1日、生产者年龄为20岁和生产者生日10月1日。
在步骤S220中,对特征数据进行降维处理,并根据降维后的特征数据,在业务特征维度中确定关键特征维度。
其中,关键特征维度对应的特征数据与降维后的特征数据之间的数据差异小于预设的 差异阈值。
其中,关键特征维度对应的维度重要程度满足预设条件。换句话说,关键特征维度也 可以是指维度重要程度大于预设阈值的业务特征维度。
接上例,在某作品平台的各个作品生产者中确定优质作品生产者的过程中,生产者 性别、生产者出生日期、生产者年龄这些业务特征维度的重要程度,显然是低于生产作品 数、作品被点赞次数、作品被播放次数这些业务特征维度的重要程度。也就是说,生产作品数、作品被点赞次数、作品被播放次数为区分作品生产者是否为优质作品生产者的关键特征维度。而生产者性别、生产者出生日期、生产者年龄为区分作品生产者是否为优质作品生产者的冗余特征维度。
一个实现方式中,服务器对特征数据进行降维处理,并根据降维后的特征数据,服务 器计算各个业务特征维度对应的特征数据与降维后的特征数据之间的数据差异。服务器将 数据差异小于预设的差异阈值的业务特征维度,作为关键特征维度。
在一个实施例中,服务器对业务对象的业务特征维度对应的特征数据进行主成分分析 (Principal Components Analysis,PCA),进而确定业务特征维度对应的特征权重。其 中,该业务特征维度对应的特征权重可以用于表征该业务特征维度对应的特征数据与降维 后的特征数据之间的数据差异。
服务器在基于业务特征维度对应的特征权重对业务特征维度进行加权,得到加权后的 业务特征维度,得到业务对象的关键特征维度。
仍接上例,服务器可以确定出生产作品数、作品被点赞次数、作品被播放次数对应的 特征权重均为1,而生产者性别、生产者出生日期、生产者年龄对应的特征权重均为0;如此,服务器在基于上述业务特征维度对应的特征权重对业务特征维度进行加权后,可以有效地减少服务器在区分作品生产者是否为优质作品生产者时对生产者性别、生产者出生日期、生产者年龄对应的特征数据的数据处理量,以实现去除多个业务特征维度中的冗余特征维度对应的特征数据。
在步骤S230中,基于关键特征维度的特征数据,对业务对象进行排序,得到排序后业务对象。
一个实施例中,服务器在确定业务对象的关键特征维度之后,服务器可以基于业务对 象的关键特征维度,对业务对象进行排序,得到排序后业务对象。例如,当关键特征维度 为上述的加权后的业务特征维度时,服务器可以对每个业务对象的各个加权后的业务特征 维度对应的特征值进行相加,得到每个业务对象的综合特征值。服务器对每个业务对象的 综合特征值进行归一化处理,得到每个业务对象的归一化后综合特征值。其中,归一化后 综合特征值也可以命名为综合水平得分。服务器基于各个业务对象的综合水平得分,对各 个业务对象进行排序,得到排序后业务对象。
举例来说,已知作品生产者A的生产作品数为10个、作品被点赞次数500次、作品被播放次数700次,且生产作品数对应的特征权重为0.6,作品被点赞次数对应的特征权 重为0.7,作品被播放次数对应的特征权重为0.8。由此可知,作品生产者A的关键特征 维度对应的特征值(加权后的业务特征维度对应的特征值)为加权后的生产作品数6、加 权后的作品被点赞次数350和加权后的作品被播放次数560;然后,对各个加权后的业务 特征维度对应的特征值进行相加,得到该作品生产者A的综合特征值为916;对作品生产 者A的综合特征值进行归一化,得到作品生产者A的综合水平得分。同理,服务器基于上 述方法确定出作品生产者平台中各个作品生产者对应的综合水平得分,并基于各个作品生 产者对应的综合水平得分,对各个作品生产者进行排序,得到排序后作品生产者。
在步骤S240中,对所述排序后业务对象执行推荐策略。一个实施例中,推荐排序后业务对象,另一个实施例中,向排序后业务对象推荐信息。
具体实现中,服务器在得到排序后业务对象后,服务器可以将排序后业务对象的待推 荐信息,按照该排序后业务对象的排序顺序推荐排序后业务对象,或向排序后业务对象推 荐信息。
实际应用中,待推荐信息可以是业务对象的对象描述信息。待推荐信息也可以是需要 推荐至各个业务对象对应的用户账户的信息。
再接上例,服务器在基于各个作品生产者对应的综合水平得分,对各个作品生产者进 行排序,得到排序后作品生产者后,服务器可以在排序后作品生产者中确定综合水平得分 排名top25%的作品生产者,作为目标生产者,将新生产激励策略作为待推荐信息推荐至 各个目标生产者;又例如,服务器可以将目标生产者的生产者信息发送至请求发送上述信 息的用户终端。
上述业务推荐方法获取业务对象的业务特征维度对应的特征数据;通过对特征数据进 行降维处理,并根据降维后的特征数据,在业务特征维度中确定关键特征维度;其中,关 键特征维度对应的特征数据与降维后的特征数据之间的数据差异小于预设的差异阈值;基 于关键特征维度的特征数据,对业务对象进行排序,得到排序后业务对象;推荐排序后业 务对象;如此,可以在业务对象的多个业务特征维度中,准确且有效地确定出可以用于排 序各个业务对象的关键特征维度,并基于关键特征维度的特征数据,对各个业务对象进行 准确地排序,实现了基于关键特征维度在各个业务对象中挖掘出能够输出优质业务内容的 目标对象并进行推荐,提高了业务对象的推荐准确度。
在一示例性实施例中,对特征数据进行降维处理,并根据降维特征数据,在业务特征 维度中确定关键特征维度,包括:对特征数据进行降维处理,并根据降维后的特征数据和 特征数据之间的数据差异,确定业务特征维度对应的特征维度权重;按照特征维度权重对 业务特征维度进行加权,得到关键特征维度。
在可能的实现中,服务器对特征数据进行降维处理,并根据降维特征数据,在业务特 征维度中确定关键特征维度的过程中,服务器可以对特征数据进行降维处理,并根据降维 后的特征数据和特征数据之间的数据差异,确定业务特征维度对应的特征维度权重;按照 特征维度权重对业务特征维度进行加权,得到关键特征维度。
一个实施例中,服务器可以对特征数据进行降维处理,得到该业务特征维度对应的降 维后的特征数据。
服务器计算出该业务特征维度对应的降维后的特征数据与该业务特征维度对应的特 征数据之间的数据差异。
服务器确定与该数据差异对应的特征维度权重。
其中,数据差异与特征维度权重成负相关关系;即业务特征维度对应的降维后的特征 数据与该业务特征维度对应的特征数据之间的数据差异越小,则说明该业务特征维度的特 征数据中的冗余数据越少,则赋予该业务特征维度更高的特征维度权重。
本实施例的技术方案,通过对特征数据进行降维处理,并根据降维后的特征数据和特 征数据之间的数据差异,确定业务特征维度对应的特征维度权重;按照特征维度权重对业 务特征维度进行加权,进而实现较为合理地从业务特征维度中确定出重要程度高的关键特 征维度,去除多个业务特征维度中的冗余特征维度。
在一示例性实施例中,对特征数据进行降维处理,并根据降维后的特征数据和特征数 据之间的数据差异,确定业务特征维度对应的特征维度权重,包括:对特征数据进行主成 分分析,得到主成分分析结果;主成分分析结果包括在新空间坐标下的主成分在业务特征 维度下的方差占比、以及主成分在业务特征维度下的特征方向;根据主成分在业务特征维 度下的方差占比和主成分在业务特征维度下的特征方向,确定业务特征维度对应的特征维 度权重。
其中,根据主成分在业务特征维度下的方差占比和主成分在业务特征维度下的特征方 向,确定业务特征维度对应的特征维度权重,包括:将主成分在业务特征维度下的方差占 比和主成分在业务特征维度下的特征方向进行点乘,得到业务特征维度对应的特征维度权 重。
一个实施例中,服务器采用特征数据进行PCA训练。例如,采用sklearn(一种机器学习工具)进行PCA训练。服务器根据业务特征维度的数量设置进行PCA训练的目标维度 的数量。即当业务特征维度的数量为N时,服务器可以设置目标维度n_components=N并 进行PCA训练得到PCA训练结果即主成分分析结果。
其中,PCA训练结果在新空间坐标下的主成分在各个业务特征维度下的方差占比(pca.explained_variance_ratio)和主成分在各个业务特征维度下的特征方向(pca.components)。服务器将主成分在各个业务特征维度下的方差占比对应的矩阵和主成分在各个业务特征维度下的特征方向对应的矩阵进行点乘,得到各个主成分对应的点乘结果。服务器将各个主成分对应的点乘结果,确定各个业务特征维度对应的特征维度权重,进而实现采用该特征维度权重来表征对应的业务特征维度的重要程度。
举例来说,如表一所示,表一提供了一种业务特征维度的特征数据。
表一
样本\特征 业务特征维度a 业务特征维度b 业务特征维度c
业务对象A -1.34 -0.75 1.09
业务对象B 1.05 -0.65 -1.32
业务对象C 0.28 1.41 0.23
服务器对特征数据进行主成分分析,得到主成分分析结果;主成分分析结果包括在新 空间坐标下的主成分在业务特征维度下的方差占比 pca.explained_variance_ratio[0.647 0.352 0],以及,主成分在业务特征维度下的特征 方向。其中,主成分在业务特征维度下的特征方向如表二所示。
表二
业务特征维度a 业务特征维度b 业务特征维度c
业务对象A -0.712 -0.090 0.695
业务对象B 0.111 0.964 0.239
业务对象C 0.692 -0.248 0.677
服务器将主成分在各个业务特征维度下的方差占比对应的矩阵和主成分在各个业务 特征维度下的特征方向对应的矩阵进行点乘,得到点乘结果。其中,点乘结果如表三所示。
表三
Figure BDA0002924494880000111
Figure BDA0002924494880000121
服务器基于业务特征维度对应的点乘结果,得到业务特征维度对应的特征维度权重。 其中,业务特征维度a对应的特征维度权重为0.534,业务特征维度b对应的特征维度权重为0.281,业务特征维度c对应的特征维度权重为0.421。
本实施例的技术方案,通过主成分分析法对特征数据进行快速地降维处理,并基于降 维后的特征数据和特征数据之间的数据差异,确定业务特征维度对应的特征维度权重,便 于后续在业务特征维度中确定关键特征维度。
在一示例性实施例中,获取业务对象的业务特征维度对应的特征数据,包括:获取原 始业务对象数据,原始对象业务数据包括业务对象的各个业务特征维度对应的原始特征数 据;对原始特征数据进行标准化处理,得到特征数据。
其中,原始特征数据可以是指记录有业务对象的业务特征维度对应的原始特征值。
一个例子中,服务器获取原始对象业务数据;对原始对象业务数据进行标准化处理, 得到标准化后的业务数据。实际应用中,标准化处理可以采用min-max标准化、log函数转换、atan函数转换、z-score标准化中的其中一种数据标准化方法。服务器将标准化 后的业务数据,作为上述的特征数据。例如,服务器可以对每个业务对象在业务特征维度 对应的原始特征值进行标准化处理,得到各个业务对象在业务特征维度对应的标准化后的 特征值。服务器将业务特征维度对应的标准化后的特征值,确定为业务特征维度对应的特 征数据。
本实施例的技术方案,通过获取包括业务对象的各个业务特征维度对应的原始特征数 据的原始业务对象数据,并对原始特征数据进行标准化处理,得到特征数据,如此,可以 减少后续对特征数据进行主成分分析时的数据处理量,提高服务器确定出关键对象特征的 效率。
在一示例性实施例中,获取原始对象业务数据,包括:响应于对象特征选取操作,确 定针对业务对象所选取的多个候选业务特征维度;去除多个候选业务特征维度中的线性相 关特征维度,得到目标业务特征维度;获取目标业务特征维度的原始特征数据,原始特征 数据为原始对象业务数据。其中,线性相关特征维度的特征数据与任意一个候选业务特征 维度的特征数据呈线性相关关系。
一个实施例中,对象特征选取操作可以是指用户利用设备在多个初始业务特征维度中 选取候选业务特征维度的操作。例如,用户在确定作品生产者是否为优质生产者时,用户 利用设备在生产作品数、作品被点赞次数、作品被播放次数、生产者性别、生产者出生日 期、生产者年龄这些初始业务特征维度中,选择作品被点赞次数、作品被播放次数、生产者性别作为候选业务特征维度。
例如,服务器响应于用户针对各个业务对象的对象特征选取操作,确定针对业务对象 从多个初始业务特征维度中选取的多个候选业务特征维度;服务器去除多个候选业务特征 维度中的线性相关特征维度,得到业务对象的目标业务特征维度;其中,线性相关特征维 度为与各个候选业务特征维度中的任意一个候选业务特征维度呈线性相关关系的特征。发 明人认为,线性相关度高的业务特征维度之间会相互影响,线性相关度高的多个业务特征 维度属于冗余特征维度。因此本实施例中服务器可以通过皮尔逊相关系数先计算各个业务 特征维度之间的线性相关度,将线性相关度高于预设线性相关度阈值的各个业务特征维度 剔除至一个业务特征维度,进而实现去除多个候选业务特征维度中的线性相关特征维度, 得到业务对象的各个目标业务特征维度。例如,已知有候选业务特征维度1、2、3、4、5; 其中,由于候选业务特征维度4和候选业务特征维度5之间的线性相关度高于预设线性相 关度阈值;则服务器确定候选业务特征维度4和候选业务特征维度5线性相关;服务器则 在候选业务特征维度1、2、3、4、5中,剔除候选业务特征维度4和候选业务特征维度5 中的其中一个候选业务特征维度,得到目标业务特征维度。实际应用中,线性相关度阈值 可以设置为0.5。服务器可以将每个目标业务特征维度的原始特征数据,作为上述的原始 特征数据。
本实施例的技术方案,通过响应于对象特征选取操作,确定针对业务对象所选取的多 个候选业务特征维度;去除多个候选业务特征维度中的线性相关特征维度,得到目标业务 特征维度;获取目标业务特征维度的原始特征数据,原始特征数据为原始对象业务数据, 从而实现初步地去除多个候选业务特征维度中的冗余特征维度,进而有效地减少了服务器 的数据处理量,提高业务对象的推荐效率。
在一示例性实施例中,基于关键特征维度的特征数据,对业务对象进行排序,得到排 序后业务对象,包括:融合关键特征维度的特征数据,得到业务对象对应的融合特征数据; 基于业务对象对应的融合特征数据,对业务对象进行排序,得到排序后业务对象。
具体实现中,服务器可以对每个业务对象的关键特征维度的特征数据进行融合,得到 各个业务对象对应的融合特征数据;服务器基于各个业务对象对应的融合特征数据,对各 个业务对象进行排序,得到排序后业务对象。
具体来说,服务器可以对业务对象的多个关键特征维度的特征值进行求和,进而得到 该业务对象对应的总体特征值。服务器将每个业务对象对应的总体特征值进行归一化,得 到每个业务对象对应的归一化后特征值,作为各个业务对象的融合特征数据即各个业务对 象对应的综合水平得分。服务器再基于各个业务对象对应的综合水平得分,对各个业务对 象进行排序,得到排序后业务对象。
本实施例的技术方案,通过融合关键特征维度的特征数据,得到业务对象对应的融合 特征数据,并基于业务对象对应的融合特征数据,对业务对象进行排序,得到排序后业务 对象,使得可以综合考虑到业务对象的多个关键特征维度的特征数据,对业务对象进行准 确地排序,实现了基于关键特征维度在各个业务对象中挖掘出能够输出优质业务内容的目 标对象并进行推荐,提高了业务对象的推荐准确度。
在一示例性实施例中,在基于各个业务对象对应的融合特征数据,对业务对象进行排 序,得到排序后业务对象的步骤之后,还包括:在排序后业务对象中,确定第一对象和第 二对象,其中,第一对象的融合特征数据与第二对象的融合特征数据相同;确定第一特征 数据与第二特征数据之间的数据差异,第一特征数据为第一对象的业务特征维度对应的特 征数据,第二特征数据为第二对象的业务特征维度对应的特征数据;若数据差异大于预设 差异阈值时,则返回响应于对象特征选取操作,确定针对业务对象所选取的多个候选业务 特征维度的步骤。
其中,第一对象的融合对象特征对应的特征值与第二对象的融合对象特征对应的特征 值相等或相同。实际应用中,第一对象和第二对象可以称之为相同综合水平的对象或者相 同综合水平的实体。
第一对象和第二对象的数量可以是一个也可以是多个。
第一特征数据为第一对象的业务特征维度对应的特征数据。
第二特征数据为第二对象的业务特征维度对应的特征数据。
具体实现中,当服务器在基于各个业务对象对应的融合特征数据,对业务对象进行排 序,得到排序后业务对象之后,服务器可以对对象排序结果进行置信度检验。具体来说, 服务器可以在各个业务对象中确定相同综合水平的对象。服务器将相同综合水平的对象随 机分为2部分,得到第一对象df1和第二对象df2。
服务器确定第一特征数据与第二特征数据之间的数据差异,第一特征数据为第一对象 的业务特征维度对应的特征数据,第二特征数据为第二对象的业务特征维度对应的特征数 据。实际应用中,当第一对象或第二对象的业务特征维度对应的特征数据具有多个时,服 务器可以对多个第一对象或第二对象的业务特征维度对应的特征数据进行融合,得到第一 对象的第一特征数据或第二对象的第二特征数据。
例如,第一对象df1的业务特征维度a对应的特征数据为a1,业务特征维度b对应的特征数据为b1;则服务器对第一对象df1的特征数据a1和特征数据b1求和取平均, 得到score1=(a1+b1)/2;第二对象df2的业务特征维度a对应的特征数据为a2,业务 特征维度b对应的特征数据为b2;则服务器对第一对象df2的特征数据a2和特征数据b2 求和取平均,得到score2=(a2+b2)/2。使得实际水平得分score1用于表征第一特征数 据,实际水平得分score2用于表征第二特征数据。
服务器获取第一特征数据与第二特征数据之间的数据差异,并判断该数据差异是否大 于预设差异阈值,当第一特征数据与第二特征数据之间的差异小于或等于预设差异阈值 时,确定排序后业务对象这一个对象排序结果通过了置信度检验,说明服务器可以基于上 述的关键特征维度的特征数据准确地对业务对象进行排序。当第一特征数据与第二特征数 据之间的差异大于预设差异阈值时,则说明对象排序结果未能通过置信度检验,说明服务 器无法很好地基于上述的关键特征维度的特征数据对业务对象进行排序,服务器则舍弃该 对象排序结果,并返回响应于对象特征选取操作,确定针对业务对象所选取的多个候选业 务特征维度的步骤,供用户重新在初始业务特征维度中选取候选业务特征维度。
例如,服务器可以计算出差异率abs(score1-score2),其中,abs()为差异率计算函数。该差异率用于表征第一特征数据与第二特征数据之间的数据差异。服务器可以通过该差异率abs(score1-score2),判断第一特征数据与第二特征数据之间的数据差异是否大于预设差异阈值。实际应用中,排序后业务对象的稳定率可以表示为 1-abs(score1-score2)。若第一特征数据与第二特征数据之间的数据差异大于预设差异阈 值,则说明该排序后业务对象这一个对象排序结果未能通过置信度检验,服务器则舍弃该 对象排序结果,并返回响应于对象特征选取操作,确定针对业务对象所选取的多个候选业 务特征维度的步骤。
若第一特征数据与第二特征数据之间的数据差异小于或等于预设差异阈值时,说明该 排序后业务对象这一个对象排序结果通过了置信度检验。
本实施例的技术方案,通过在排序后业务对象中,确定第一对象和第二对象;其中, 第一对象的融合特征数据与第二对象的融合特征数据相同,然后,确定第一特征数据与第 二特征数据之间的数据差异,第一特征数据为第一对象的业务特征维度对应的特征数据, 第二特征数据为第二对象的业务特征维度对应的特征数据;若数据差异大于预设差异阈值 时,则返回响应于对象特征选取操作,确定针对业务对象所选取的多个候选业务特征维度 的步骤,如此,实现了对排序后业务对象这一对象排序结果的置信度进行校验,保障了排 序后业务对象的准确度,从而提高了业务对象的推荐准确度。
在一示例性实施例中,对所述排序后业务对象执行推荐策略,包括:获取排序后业务 对象对应的对象描述信息;按照排序后业务对象的排序顺序,对对象描述信息进行排序, 得到排序后的对象描述信息;发送排序后的对象描述信息,或向排序后对象推荐信息。
其中,对象描述信息可以是指用于描述该业务对象的信息。实际应用中,对象描述信 息可以是该业务对象的介绍文本、头像、名称等信息。
具体实现中,服务器可以分别获取排序后业务对象对应的对象描述信息。服务器按照 排序后业务对象的排序顺序,对各个排序后业务对象对应的对象描述信息进行排序,得到 排序后的对象描述信息;服务器推荐排序后的对象描述信息。
例如,服务器在推荐主播时,服务器可以获取各个排序后主播对应的主播头像;按照 各个排序后主播的排序顺序,对各个主播头像进行排序,得到排序后的主播头像即头像排 行榜单;服务器推送该头像排行榜单。
本实施例的技术方案,通过获取排序后业务对象对应的对象描述信息;并按照排序后 业务对象的排序顺序,对对象描述信息进行排序,得到排序后的对象描述信息,最后发送 排序后的对象描述信息,使得接收到排序后的对象描述信息的用户可以知晓到各个排序后 业务对象的排序顺序,确定出排序后业务对象中的目标业务对象。
图3是根据一示例性实施例示出的另一种业务推荐方法的流程图,如图3所示,该方 法用于图1中的服务器110中,包括以下步骤。在步骤S310中,获取业务对象的业务特 征维度对应的特征数据。在步骤S320中,对所述特征数据进行主成分分析,得到主成分 分析结果;所述主成分分析结果包括在新空间坐标下的主成分在所述业务特征维度下的方 差占比,以及,所述主成分在所述业务特征维度下的特征方向。在步骤S330中,将所述 主成分在所述业务特征维度下的方差占比和所述主成分在所述业务特征维度下的特征方 向进行点乘,得到所述业务特征维度对应的特征维度权重。在步骤S340中,按照所述特 征维度权重对所述业务特征维度进行加权,得到所述关键特征维度;其中,所述关键特征 维度对应的特征数据与所述降维后的特征数据之间的数据差异小于预设的差异阈值。在步 骤S350中,基于所述关键特征维度的特征数据,对所述业务对象进行排序,得到排序后 业务对象。在步骤S360中,推荐所述排序后业务对象,或向所述排序后业务对象推荐信 息。需要说明的是,上述步骤的具体限定可以参见上文对一种业务推荐方法的具体限定, 在此不再赘述。
应该理解的是,虽然图2和图3的流程图中的各个步骤按照箭头的指示依次显示,但 是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步 骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2和图3 中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
为了便于本领域技术人员的理解,图4提供了一种业务推荐流程图。其中,包括:
确定候选业务特征维度:用户在需要对业务对象进行排序时,用户可以利用设备在多 个初始业务特征维度中初步选取候选业务特征维度,即利用设备向服务器发送对象特征选 取操作;服务器响应于对象特征选取操作,确定针对业务对象所选取的多个候选业务特征 维度,以用于对各个业务对象的排序顺序进行综合评价。
特征过滤;服务器确定多个候选业务特征维度后,服务器则去除多个候选业务特征维 度中的线性相关特征维度,得到筛选出来的业务特征维度。
特征PCA训练;服务器对筛选出来的业务特征维度进行PCA训练,确定出关键特征维 度。其中,服务器业务特征维度的特征数据进行PCA训练,得到主成分在各个业务特征维度下的方差占比和主成分在各个业务特征维度下的特征方向;服务器对主成分在各个业务特征维度下的方差占比和主成分在各个业务特征维度下的特征方向进行点乘,得到各个主成分对应的点乘结果。服务器将各个主成分对应的点乘结果,确定各个业务特征维度对应的特征维度权重;服务器按照特征维度权重对业务特征维度进行加权,得到关键特征维度。
综合水平评估;服务器基于该关键特征维度的特征数据,对业务对象进行排序,得到 排序后业务对象,以实现对各个业务对象的排序顺序进行综合评价。
置信度评估;服务器对各个业务对象进行置信度评估。其中,服务器在排序后业务对 象中,确定第一对象和第二对象;其中,第一对象的融合特征数据与第二对象的融合特征 数据相同;确定第一特征数据与第二特征数据之间的数据差异,第一特征数据为第一对象 的业务特征维度对应的特征数据,第二特征数据为第二对象的业务特征维度对应的特征数 据;若数据差异大于预设差异阈值,则判定置信度评估不通过,返回响应于对象特征选取 操作,确定针对业务对象所选取的多个候选业务特征维度的步骤,以重新确定候选业务特 征维度。若数据差异小于或等于预设差异阈值则判定置信度评估通过,服务器可以基于上 述的关键特征维度的特征数据准确地对业务对象进行排序。
业务推荐;服务器推荐排序后业务对象;其中,服务器获取排序后业务对象对应的对 象描述信息;按照排序后业务对象的排序顺序,对对象描述信息进行排序,得到排序后的 对象描述信息;发送排序后的对象描述信息。服务器还可以向排序后业务对象推荐信息。
需要说明的是,上述步骤的具体限定可以参见上文对一种业务推荐方法的具体限定, 在此不再赘述。
图5是根据一示例性实施例示出的一种业务推荐装置框图。参照图5,该装置包括:
获取单元510,被配置为执行获取业务对象的业务特征维度对应的特征数据;
确定单元520,被配置为执行对所述特征数据进行降维处理,并根据降维后的特征数 据,在所述业务特征维度中确定关键特征维度;其中,所述关键特征维度对应的特征数据 与所述降维后的特征数据之间的数据差异小于预设的差异阈值;
排序单元530,被配置为执行基于所述关键特征维度的特征数据,对所述业务对象进 行排序,得到排序后业务对象;
推荐单元540,被配置为执行对所述排序后业务对象执行推荐策略,例如推荐所述排 序后业务对象,或向所述排序后业务对象推荐信息。
在一示例性实施例中,所述确定单元520,具体被配置为执行对所述特征数据进行降 维处理,并根据所述降维后的特征数据和所述特征数据之间的数据差异,确定所述业务特 征维度对应的特征维度权重;按照所述特征维度权重对所述业务特征维度进行加权,得到 所述关键特征维度。
在一示例性实施例中,所述确定单元520,具体被配置为执行对所述特征数据进行主 成分分析,得到主成分分析结果;所述主成分分析结果包括在新空间坐标下的主成分在所 述业务特征维度下的方差占比,以及,所述主成分在所述业务特征维度下的特征方向;根 据所述主成分在所述业务特征维度下的方差占比和所述主成分在所述业务特征维度下的 特征方向,确定所述业务特征维度对应的特征维度权重。
在一示例性实施例中,所述确定单元520,具体被配置为执行将所述主成分在所述业 务特征维度下的方差占比和所述主成分在所述业务特征维度下的特征方向进行点乘,得到 所述业务特征维度对应的特征维度权重。
在一示例性实施例中,所述获取单元510,具体被配置为执行获取原始业务对象数据, 所述原始对象业务数据包括业务对象的各个业务特征维度对应的原始特征数据;对所述原 始特征数据进行标准化处理,得到所述特征数据。
在一示例性实施例中,所述获取单元510,具体被配置为执行响应于对象特征选取操 作,确定针对所述业务对象所选取的多个候选业务特征维度;去除所述多个候选业务特征 维度中的线性相关特征维度,得到目标业务特征维度;其中,所述线性相关特征维度的特 征数据与任意一个所述候选业务特征维度的特征数据呈线性相关关系;获取所述目标业务 特征维度的原始特征数据,所述原始特征数据为所述原始对象业务数据。
在一示例性实施例中,所述排序单元530,具体被配置为执行融合所述关键特征维度 的特征数据,得到所述业务对象对应的融合特征数据;基于所述业务对象对应的融合特征 数据,对所述业务对象进行排序,得到所述排序后业务对象。
在一示例性实施例中,所述业务推荐装置,还包括:对象确定单元,被配置为执行在 所述排序后业务对象中,确定第一对象和第二对象;其中,所述第一对象的融合特征数据 与所述第二对象的融合特征数据相同;确定第一特征数据与第二特征数据之间的数据差 异,所述第一特征数据为所述第一对象的业务特征维度对应的特征数据,所述第二特征数 据为所述第二对象的业务特征维度对应的特征数据;若所述数据差异大于预设差异阈值 时,则返回所述响应于对象特征选取操作,确定针对所述业务对象所选取的多个候选业务 特征维度的步骤。
在一示例性实施例中,所述推荐单元540,具体被配置为执行获取所述排序后业务对 象对应的对象描述信息;按照所述排序后业务对象的排序顺序,对所述对象描述信息进行 排序,得到排序后的对象描述信息;发送所述排序后的对象描述信息。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实 施例中进行了详细描述,此处将不做详细阐述说明。
图6是根据一示例性实施例示出的一种用于执行业务推荐方法的设备600的框图。例 如,设备600可以为一服务器。参照图6,设备600包括处理组件620,其进一步包括一 个或多个处理器,以及由存储器622所代表的存储器资源,用于存储可由处理组件620 的执行的指令,例如应用程序。存储器622中存储的应用程序可以包括一个或一个以上的 每一个对应于一组指令的模块。此外,处理组件620被配置为执行指令,以执行上述业务 推荐方法。
设备600还可以包括一个电源组件624被配置为执行设备600的电源管理,一个有线 或无线网络接口626被配置为将设备600连接到网络,和一个输入输出(I/O)接口628。设备600可以操作基于存储在存储器622的操作系统,例如Window6 6erverTM,Mac O6 XTM,UnixTM,LinuxTM,FreeB6DTM或类似。
在示例性实施例中,还提供了一种包括指令的存储介质,例如包括指令的存储器622, 上述指令可由设备600的处理器执行以完成上述方法。存储介质可以是ROM、随机存取存 储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供一种计算机程序产品,包括计算机程序,所述计算机程序 存储在计算机可读存储介质中,所述计算机程序可由设备600的处理器执行以完成上述方 法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实 施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者 适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或 惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权 利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可 以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种业务推荐方法,其特征在于,所述方法包括:
获取业务对象的业务特征维度对应的特征数据;
对所述特征数据进行降维处理,并根据降维后的特征数据,在所述业务特征维度中确定关键特征维度;其中,所述关键特征维度对应的特征数据与所述降维后的特征数据之间的数据差异小于预设的差异阈值;
基于所述关键特征维度的特征数据,对所述业务对象进行排序,得到排序后业务对象;
对所述排序后业务对象执行推荐策略。
2.根据权利要求1所述的业务推荐方法,其特征在于,所述对所述特征数据进行降维处理,并根据降维特征数据,在所述业务特征维度中确定关键特征维度,包括:
对所述特征数据进行降维处理,并根据所述降维后的特征数据和所述特征数据之间的数据差异,确定所述业务特征维度对应的特征维度权重;
按照所述特征维度权重对所述业务特征维度进行加权,得到所述关键特征维度。
3.根据权利要求2所述的业务推荐方法,其特征在于,所述对所述特征数据进行降维处理,并根据所述降维后的特征数据和所述特征数据之间的数据差异,确定所述业务特征维度对应的特征维度权重,包括:
对所述特征数据进行主成分分析,得到主成分分析结果;所述主成分分析结果包括在新空间坐标下的主成分在所述业务特征维度下的方差占比,以及,所述主成分在所述业务特征维度下的特征方向;
根据所述主成分在所述业务特征维度下的方差占比和所述主成分在所述业务特征维度下的特征方向,确定所述业务特征维度对应的特征维度权重。
4.根据权利要求3所述的业务推荐方法,其特征在于,所述根据所述主成分在所述业务特征维度下的方差占比和所述主成分在所述业务特征维度下的特征方向,确定所述业务特征维度对应的特征维度权重,包括:
将所述主成分在所述业务特征维度下的方差占比和所述主成分在所述业务特征维度下的特征方向进行点乘,得到所述业务特征维度对应的特征维度权重。
5.根据权利要求1所述的业务推荐方法,其特征在于,所述获取业务对象的业务特征维度对应的特征数据,包括:
获取原始业务对象数据,所述原始对象业务数据包括业务对象的各个业务特征维度对应的原始特征数据;
对所述原始特征数据进行标准化处理,得到所述特征数据。
6.根据权利要求5所述的业务推荐方法,其特征在于,所述获取原始对象业务数据,包括:
响应于对象特征选取操作,确定针对所述业务对象所选取的多个候选业务特征维度;
去除所述多个候选业务特征维度中的线性相关特征维度,得到目标业务特征维度;其中,所述线性相关特征维度的特征数据与任意一个所述候选业务特征维度的特征数据呈线性相关关系;
获取所述目标业务特征维度的原始特征数据,所述原始特征数据为所述原始对象业务数据。
7.一种业务推荐装置,其特征在于,包括:
获取单元,被配置为执行获取业务对象的业务特征维度对应的特征数据;
确定单元,被配置为执行对所述特征数据进行降维处理,并根据降维后的特征数据,在所述业务特征维度中确定关键特征维度;其中,所述关键特征维度对应的特征数据与所述降维后的特征数据之间的数据差异小于预设的差异阈值;
排序单元,被配置为执行基于所述关键特征维度的特征数据,对所述业务对象进行排序,得到排序后业务对象;
推荐单元,被配置为执行对所述排序后业务对象执行推荐策略。
8.一种服务器,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至6中任一项所述的业务推荐方法。
9.一种计算机可读存储介质,当所述计算机可读存储介质中的指令由服务器的处理器执行时,使得所述服务器能够执行如权利要求1至6中任一项所述的业务推荐方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的业务推荐方法。
CN202110129181.8A 2021-01-29 2021-01-29 业务推荐方法、装置、服务器及存储介质 Active CN113158022B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110129181.8A CN113158022B (zh) 2021-01-29 2021-01-29 业务推荐方法、装置、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110129181.8A CN113158022B (zh) 2021-01-29 2021-01-29 业务推荐方法、装置、服务器及存储介质

Publications (2)

Publication Number Publication Date
CN113158022A true CN113158022A (zh) 2021-07-23
CN113158022B CN113158022B (zh) 2024-03-12

Family

ID=76879032

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110129181.8A Active CN113158022B (zh) 2021-01-29 2021-01-29 业务推荐方法、装置、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN113158022B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116049648A (zh) * 2022-11-17 2023-05-02 北京东方通科技股份有限公司 一种基于数据安全的多方投影方法及多方数据分析方法
CN116257791A (zh) * 2023-05-10 2023-06-13 北京云真信科技有限公司 设备集合确定方法、电子设备和计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106952052A (zh) * 2017-04-06 2017-07-14 东北林业大学 基于混合权重核主成分分析企业供应商评价方法
US20180357548A1 (en) * 2015-04-30 2018-12-13 Google Inc. Recommending Media Containing Song Lyrics
CN110334720A (zh) * 2018-03-30 2019-10-15 百度在线网络技术(北京)有限公司 业务数据的特征提取方法、装置、服务器和存储介质
CN110472659A (zh) * 2019-07-05 2019-11-19 中国平安人寿保险股份有限公司 数据处理方法、装置、计算机可读存储介质和计算机设备
CN111523575A (zh) * 2020-04-13 2020-08-11 中南大学 基于短视频多模态特征的短视频推荐模型

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180357548A1 (en) * 2015-04-30 2018-12-13 Google Inc. Recommending Media Containing Song Lyrics
CN106952052A (zh) * 2017-04-06 2017-07-14 东北林业大学 基于混合权重核主成分分析企业供应商评价方法
CN110334720A (zh) * 2018-03-30 2019-10-15 百度在线网络技术(北京)有限公司 业务数据的特征提取方法、装置、服务器和存储介质
CN110472659A (zh) * 2019-07-05 2019-11-19 中国平安人寿保险股份有限公司 数据处理方法、装置、计算机可读存储介质和计算机设备
CN111523575A (zh) * 2020-04-13 2020-08-11 中南大学 基于短视频多模态特征的短视频推荐模型

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116049648A (zh) * 2022-11-17 2023-05-02 北京东方通科技股份有限公司 一种基于数据安全的多方投影方法及多方数据分析方法
CN116049648B (zh) * 2022-11-17 2023-08-04 北京东方通科技股份有限公司 一种基于数据安全的多方投影方法及多方数据分析方法
CN116257791A (zh) * 2023-05-10 2023-06-13 北京云真信科技有限公司 设备集合确定方法、电子设备和计算机可读存储介质
CN116257791B (zh) * 2023-05-10 2023-08-11 北京云真信科技有限公司 设备集合确定方法、电子设备和计算机可读存储介质

Also Published As

Publication number Publication date
CN113158022B (zh) 2024-03-12

Similar Documents

Publication Publication Date Title
CN108280670B (zh) 种子人群扩散方法、装置以及信息投放系统
CN110222233B (zh) 视频推荐方法、装置、服务器及存储介质
CN107590232B (zh) 一种基于网络学习环境的资源推荐系统及方法
WO2021180249A1 (zh) 职业推荐方法、装置、设备和介质
CN103119582A (zh) 降低第一多变量数据组和第二多变量数据组之间的不相似度
CN110008397A (zh) 一种推荐模型训练方法及装置
CN113158022B (zh) 业务推荐方法、装置、服务器及存储介质
CN111291895A (zh) 组合特征评估模型的样本生成和训练方法及装置
CN113283795B (zh) 基于二分类模型的数据处理方法及装置、介质、设备
CN112199559B (zh) 数据特征的筛选方法、装置及计算机设备
CN115146161A (zh) 一种基于内容推荐的个性化学习资源推荐方法及系统
CN112765484A (zh) 短视频推送方法、装置、电子设备及存储介质
CN111581435A (zh) 一种视频封面图像生成方法、装置、电子设备及存储介质
CN112819024A (zh) 模型处理方法、用户数据处理方法及装置、计算机设备
CN113656699B (zh) 用户特征向量确定方法、相关设备及介质
Irawan et al. Qur’an tilawatil examination system
CN113065790A (zh) 一种评估专利价值方法及系统
CN110633410A (zh) 信息处理方法及装置、存储介质、电子装置
CN112464106A (zh) 对象推荐方法及装置
CN112148994A (zh) 信息推送效果评估方法、装置、电子设备及存储介质
US20180114093A1 (en) Data analysis system, method for controlling data analysis system, and recording medium
CN112434140B (zh) 一种答复信息处理方法及系统
CN113590673A (zh) 基于区块链深度学习的数据热度统计方法
JP6509391B1 (ja) 計算機システム
CN113011503A (zh) 一种电子设备的数据取证方法、存储介质及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant