CN111563761A - 人群拓展方法、装置、设备及存储介质 - Google Patents

人群拓展方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111563761A
CN111563761A CN202010063804.1A CN202010063804A CN111563761A CN 111563761 A CN111563761 A CN 111563761A CN 202010063804 A CN202010063804 A CN 202010063804A CN 111563761 A CN111563761 A CN 111563761A
Authority
CN
China
Prior art keywords
expansion
feedback information
crowd
analysis result
packet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010063804.1A
Other languages
English (en)
Inventor
刘畅
郑文琛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN202010063804.1A priority Critical patent/CN111563761A/zh
Publication of CN111563761A publication Critical patent/CN111563761A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Abstract

本发明公开了一种人群拓展方法、装置、设备及存储介质,该方法包括:接收种子包,并基于所述种子包进行人群拓展,生成拓展包;对所述拓展包进行可解释性分析,输出分析结果;根据所述分析结果确定反馈信息,并根据所述反馈信息生成符合预期的二次拓展包。由此对拓展包进行可解释性分析和反馈,实现了人群拓展的二次调整,增强了人群拓展的有效性和合理性。

Description

人群拓展方法、装置、设备及存储介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种人群拓展方法、装置、设备及存储介质。
背景技术
随着计算机技术的发展,越来越多的技术(大数据、分布式、区块链Blockchain、人工智能等)应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,但由于金融行业的安全性、实时性要求,也对技术提出了更高的要求。
在传统的人群拓展广告方案中,由于种子包中人群数量远小于大盘人群,会导致拓展包中的人群不是最优人群。而传统的拓展方法不能对拓展包内的人群进行评估和修正,只有在广告投放之后才能根据广告投放效果来反推人群拓展效果。因此,传统方法不能保证拓展包人群的有效性和合理性。
发明内容
本发明提供一种人群拓展方法、装置、设备及存储介质,旨在实现人群拓展的二次调整,增强人群拓展的有效性和合理性。
为实现上述目的,本发明提供一种人群拓展方法,所述方法包括
接收种子包,并基于所述种子包进行人群拓展,生成拓展包;
对所述拓展包进行可解释性分析,输出分析结果;
根据所述分析结果确定反馈信息,并根据所述反馈信息生成符合预期的二次拓展包。
优选地,所述对所述拓展包进行可解释性分析,输出分析结果的步骤包括:
将所述拓展包输入预先训练的可解释性模型,通过所述可解释性模型对所述拓展包进行分析并输出分析结果,所述分析结果包括显著特征;
所述根据所述分析结果确定反馈信息的步骤包括:
判断所述分析结果中的所述显著特征是显著正特征还是显著负特征;
若所述显著特征是显著正特征,则将所述显著正特征输入正特征结果模板,生成正特征反馈信息;
若所述显著特征是显著负特征,则将所述显著负特征输入负特征结果模板,生成负特征反馈信息。
优选地,所述对所述拓展包进行可解释性分析,输出分析结果的步骤包括:
根据所述拓展包中的各个标签进行可视化分析,获得分析结果,所述分析结果包括拓展分布图和/或拓展分布结果;
所述根据所述分析结果确定反馈信息的步骤包括:
根据所述拓展分布图和/或拓展分布结果,从分析结果-反馈信息映射表中确定对应的反馈信息。
优选地,所述根据所述分析结果确定反馈信息,并根据所述反馈信息生成符合预期的二次拓展包的步骤包括:
将所述分析结果与预期结果进行对比,判断所述分析结果是否符合预期;
若所述分析结果不符合预期,则根据所述对比结果确定反馈信息;
基于所述反馈信息进行二次拓展,直到生成符合预期的二次拓展包。
优选地,所述基于所述反馈信息进行二次拓展,直到生成符合预期的二次拓展包的步骤包括:
判断所述反馈信息的等级,所述等级包括警告级和严重级;
若所述反馈信息的等级是警告级,则根据所述反馈信息调整人群拓展条件后,进行二次拓展,直到生成符合预期的二次拓展包;
若所述反馈信息的等级是严重级,则重新进行人群拓展,直到生成符合预期的二次拓展包。
优选地,所述接收种子包,并基于所述种子包进行人群拓展,生成拓展包的步骤包括:
接收种子包,对所述种子包进行不同维度的分析,筛选出共同特征;
根据数据库中候选人群的个人标签与所述共同特征的相似度,从所述数据库中筛选出预设数量的目标候选人群,所述预设数量由拓展倍数决定;
将所述目标候选人群及其个人标签保存为所述拓展包。
优选地,所述根据所述分析结果确定反馈信息,并根据所述反馈信息生成符合预期的二次拓展包的步骤之后还包括:
获取所述二次拓展包中的人群,向所述人群推荐信息,并记录信息推荐效果。
此外,为实现上述目的,本发明还提供一种人群拓展装置,所述人群拓展装置包括:
第一拓展模块,用于接收种子包,并基于所述种子包进行人群拓展,生成拓展包;
可解释性分析模块,用于对所述拓展包进行可解释性分析,输出分析结果;
反馈模块,用于根据所述分析结果确定反馈信息,并根据所述反馈信息生成符合预期的二次拓展包。
此外,为实现上述目的,本发明还提供一种人群拓展设备,所述人群拓展设备包括处理器,存储器以及存储在所述存储器中的人群拓展程序,所述人群拓展程序被所述处理器运行时,实现如上所述的人群拓展方法的步骤。
此外,为实现上述目的,本发明还一种计算机存储介质,所述计算机存储介质上存储有人群拓展程序,所述人群拓展程序被处理器运行时实现如上所述人群拓展方法的步骤。
相比现有技术,本发明提供一种人群拓展方法、装置、设备及存储介质,接收种子包,并基于所述种子包进行人群拓展,生成拓展包;对所述拓展包进行可解释性分析,输出分析结果;根据所述分析结果确定反馈信息,并根据所述反馈信息生成符合预期的二次拓展包。由此对拓展包进行可解释性分析和反馈,实现了人群拓展的二次调整,增强了人群拓展的有效性和合理性。
附图说明
图1是本发明各实施例涉及的人群拓展设备的硬件结构示意图;
图2是本发明人群拓展方法第一实施例的流程示意图;
图3是本发明人群拓展方法一实施例的场景示意图;
图4是本发明人群拓展方法一实施例的又一场景示意图;
图5是本发明人群拓展方法第二实施例的流程示意图
图6是本发明人群拓展装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例主要涉及的人群拓展设备是指能够实现网络连接的网络连接设备,所述人群拓展设备可以是服务器、云平台等。另外本发明实施例涉及的移动终端可以为手机、平板电脑等移动网络设备。
参照图1,图1是本发明各实施例涉及的人群拓展设备的硬件结构示意图。本发明实施例中,人群拓展设备可以包括处理器1001(例如中央处理器Central ProcessingUnit、CPU),通信总线1002,输入端口1003,输出端口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信;输入端口1003用于数据输入;输出端口1004用于数据输出,存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器,存储器1005可选的还可以是独立于前述处理器1001的存储装置。本领域技术人员可以理解,图1中示出的硬件结构并不构成对本发明的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
继续参照图1,图1中作为一种可读存储介质的存储器1005可以包括操作系统、网络通信模块、应用程序模块以及人群拓展程序。在图1中,网络通信模块主要用于连接服务器,与服务器进行数据通信;而处理器1001可以调用存储器1005中存储的人群拓展程序,并执行本发明实施例提供的人群拓展方法。
本发明实施例提供了一种人群拓展方法。当广告主进行人群拓展时,会对种子人群进行解析,选出该人群较为显著的特征,根据其特征在数据库中的用户体系根据Look-alike相似人群扩展方法进行拓展,找到与其高度相似的人群,扩大目标受众数量。主要特征包括人口学、兴趣类、行为类、设备类等,丰富、灵活的标签组合体系可以帮广告主找到种子人群的相似人群,进而向相似人群投放广告,以提高广告投放效果。
参照图2,图2是本发明人群拓展方法第一实施例的流程示意图。
本实施例中,所述人群拓展方法应用于人群拓展设备,所述方法包括:
步骤S101,接收种子包,并基于所述种子包进行人群拓展,生成拓展包;
一般地,人群拓展的方法包括用户画像标签、分类或预测模型、基于社交网络挖掘相似用户等。
本实施例基于用户画像标签进行人群拓展,具体地,所述接收种子包,并基于所述种子包进行人群拓展,生成拓展包的步骤包括:
步骤S101a,接收种子包,对所述种子包进行不同维度的分析,筛选出共同特征;
所述种子包可以根据需要选取,一般地,所述种子包中的人群是信息推荐的核心人群,或者是根据经验总结的感兴趣人群。
进一步地,所述种子包中的人群具有各自的种子标签。例如对于证券类种子包,则其种子标签包括性别、年龄、地区、职业、收入水平、抗风险能力等。
获取种子包后,则根据所述种子标签进行不同维度的分析,根据所述种子标签筛选出共同特征。
步骤S101b,根据数据库中候选人群的个人标签与所述共同特征的相似度,从所述数据库中筛选出预设数量的目标候选人群,所述预设数量由拓展倍数决定;
获得所述共同特征后,则将所述共同特征与数据库中候选人群的个人标签进行对比,确定所述候选人群中每个个人标签与所述共同特征的相似度,然后将相似度大于或等于相似度阈值的个人标签对应的个人信息标记为候选个人信息。
进一步地,设置拓展倍数,根据所述拓展倍数确定所需要的候选人群数量。并根据所述相似度,将所述候选人群中的每个人进行正向排序,即相似度越高,排名越靠前,选择排在前面的候选人群,直到所述候选人群的数量等于预设数量,并将所述预设数量的候选人群标记为目标候选人群。
步骤S101c,将所述目标候选人群及其个人标签保存为所述拓展包。
将所述目标候选人群及其对应的个人标签保存为拓展包。
在其它实施例中,还可以通过其它方式生成所述拓展包。例如,获取种子包,将所述种子包中的样本作为正样本;再收集一批负样本,所述负样本为非种子用户,将所述正样本和所述负样本作为机器学习建模的训练数据,训练拓展模型;利用所述拓展模型对数据库中的大量人群进行分类,获得目标人群。
步骤S102,对所述拓展包进行可解释性分析,输出分析结果;
本实施例可以通过可解释性模型和可视化分析对所述拓展包进行可解释性分析。在机器学习领域,可解释性指模型做决策时,能展示过程中哪些变量起了显著作用。
具体地,将所述拓展包输入预先训练的可解释性模型,通过所述可解释性模型对所述拓展包进行分析并输出分析结果,所述分析结果包括显著特征。
预先生成训练拓展包,所述训练拓展包包括训练人群及其对应的训练标签。根据所述训练拓展包进行模型训练,生成可解释性模型,所述可解释性模型包括树模型、线性模型、特征模型,例如随机森林模型、回归树模型、逻辑回归模型等。所述可解释性模型输出的结果是显著特征,其中所述显著特征包括显著正特征和显著负特征。可以理解地,所述可解释性模型输出的结果可以是高阶组合分布特征。例如,对于个人标签包括地区、性别、年龄的拓展包,所述可解释性模型可以输出人群地区分布,性别比例,年龄段分布的组合分布特征。
具体地,根据所述拓展包中的各个标签进行可视化分析,获得分析结果,所述分析结果包括拓展分布图和/或拓展分布结果。
根据所述标签进行可视化分析,生产拓展分布图及拓展分布结果。所述拓展分布图包括饼状图、柱状图、折线图等、桑基图、地域分布图等。所述拓展分布结果包括占比、目标群体指数(target group index,TGI)等。
具体地,参考图3,图3是本发明人群拓展方法一实施例的场景示意图。图3中,对所述拓展包中人群的性别进行可视化分析,获得了拓展分布图--性别分布图,并且还获得了拓展分布结果—性别分布结果。从图3可以直观地获知所述拓展包中男、女的标签占比分别是88.05%和11.95%。所述大盘值占比是指数据库中男女的占比,分别为61.13%和38.87%,男、女的TGI分布分别为144和31.由此,根据所述性别分布图和所述性别分布结果可以直观地对比差异。
进一步地,参考图4,图4是本发明人群拓展方法一实施例的又一场景示意图。图4是对某个拓展包进行可视化分析获得的地域分布图和地域分布结果。该拓展包中的人群分布在在福建省、甘肃省、广东省、广西壮族自治区、贵州省、海南省,对应的标签占比分布为0.8%、0.14%、5.81%、70.92%、0.24%、0.21%,对应的大盘值分别为2.94%、1.24%、12.24%、2.48%、2.11%、0.75%;对应的TGI分别为27、11、47、2860、11、28。从所述地域分布图和所述地域分布结果中可以清楚获知,该拓展包中的人群大部分集中在广西壮族自治区。
步骤S103,根据所述分析结果确定反馈信息,并根据所述反馈信息生成符合预期的二次拓展包。
具体地,将所述分析结果与预期结果进行对比,判断所述分析结果是否符合预期;所述预期结果可以预先设置。一般地,可以根据种子包中人群特征设置所述预期结果。例如,若种子包中男女占比分别是80%和20%,则将所述预期结果中的男女比例设置为9:1,并设置一定的拨动区间。
若所述分析结果不符合预期,则根据所述对比结果确定反馈信息;若所述分析结果不在预期结果范围内,则判断所述分析结果不符合预期。
本实施例中,若所述分析结果是拓展分布图和/或拓展分布结果,则需要预先设置分析结果-反馈信息映射表,以供根据所述分析结果-反馈信息映射表选择与所述分析结果对应的反馈信息。若所述分析结果是拓展分布图和/或拓展分布结果,则根据所述拓展分布图和/或拓展分布结果,从分析结果-反馈信息映射表中确定对应的反馈信息。所述反馈信息包括分析结果符合程度,异常情况,以及处置建议等。所述分析结果符合程度根据所述分析结果与所述预期结果的相似度确定,所述异常情况包括异常标签以及对应的值,处置建议包括上传反馈,更新拓展包,重做拓展包等。
本实施例中,若所述分析结果包括显著特征,所述根据所述分析结果确定反馈信息的步骤包括:判断所述分析结果中的所述显著特征是显著正特征还是显著负特征;若所述显著特征是显著正特征,则将所述显著正特征输入正特征结果模板,生成正特征反馈信息;若所述显著特征是显著负特征,则将所述显著负特征输入负特征结果模板,生成负特征反馈信息。例如,所述正特征结果模板可以为:当前分析结果为(显著正特征),故可以根据该特征继续拓展;再例如,所述负特征结果模板可以为:当前分析结果为(显著负特征),故可以剔除该特征后再拓展。
基于所述反馈信息进行二次拓展,直到生成符合预期的二次拓展包。具体地,判断所述反馈信息的等级,所述等级包括警告级和严重级;若所述反馈信息的等级是警告级,则根据所述反馈信息调整人群拓展条件后,进行二次拓展,直到生成符合预期的二次拓展包;所述等级根据所述反馈信息中的处置建议设置,若所述处置建议为更新拓展包,则所述等级为警告级;若所述处置建议为重做拓展包,则所述等级为严重级。若所述反馈信息的等级是严重级,则重新进行人群拓展,直到生成符合预期的二次拓展包,可以重新分析所述种子包,甚至更换一份种子包后再进行二次拓展。
继续参照图3,图3中男女占比无明显异常,故对应的性别分布结果可能是符合预期结果的,因此对应的拓展包是合格的,不需要调整。继续参照图4,在图4中,该拓展包中的人群大部分集中在广西壮族自治区。若该拓展包应用于证券广告,可以理解地,证券广告可以面向全国、甚至全世界,因此拓展包中的人群主要集中在广西省是明显不合理的,不符合预期分布结果,因此其对应的等级可能是警告级,并且警高广西壮族自治区占比过高。其原因可能是种子包中的人群集中在广西壮族自治区,因而生成拓展包的过程,将广西壮族自治区也标记成了共同特征。因此可以去除广西壮族自治区这个特征后,继续对该拓展包进行更新直到获得符合要求的拓展包。
本实施例通过上述方案,接收种子包,并基于所述种子包进行人群拓展,生成拓展包;对所述拓展包进行可解释性分析,输出分析结果;根据所述分析结果确定反馈信息,并根据所述反馈信息生成符合预期的二次拓展包。由此对拓展包进行可解释性分析和反馈,实现了人群拓展的二次调整,增强了人群拓展的有效性和合理性。
如图5所示,本发明第二实施例提出一种人群拓展方法,基于上述图2所示的第一实施例,所述根据所述分析结果确定反馈信息,并根据所述反馈信息生成符合预期的二次拓展包的步骤之后还包括:
步骤S104:获取所述二次拓展包中的人群,向所述人群推荐信息,并记录信息推荐效果。
在现有人群拓展信息推荐方案中,由于种子人群远小于大盘人群,由于机器学习学到的是相关性而不是因果性,在严重偏差时拓展包中人群的质量是不受控的,而传统方式不能对拓展包内的用户进行有效评估和修正,只有在执行信息推荐之后才知道效果如何,最终ROI(=收益/信息推荐费)不可控。例如,某券商广西分公司提供的开户种子人群,都是广西省的,在人群拓展时,机器学习模型会认为广西省是这个人群的显著特征,因而拓展包也会局限在广西省人群中,然而券商需要给全国对证券开户感兴趣的用户。因而需要对拓展包进行修正,将修正后的二次拓展包中的人群作为信息推荐对象。并在投放广告后继续监控所述二次拓展包中人群的点击、下载、安装、激活等行为,并根据这些行为确定信息推荐效果。
本实施例中,所述信息推荐包括广告投放、发送信息、广播等。
本实施例通过上述方案,接收种子包,并基于所述种子包进行人群拓展,生成拓展包;对所述拓展包进行可解释性分析,输出分析结果;根据所述分析结果确定反馈信息,并根据所述反馈信息生成符合预期的二次拓展包,获取所述二次拓展包中的人群,向所述人群进行广告投放,并记录广告投放效果。由此对拓展包进行可解释性分析和反馈,实现了人群拓展的二次调整,增强了人群拓展的有效性和合理性。并且使得信息推荐成本可控,提升了信息推荐的精准性,降低了信息推荐成本。
此外,本实施例还提供一种人群拓展装置。参照图6,图6为本发明人群拓展装置第一实施例的功能模块示意图。
本实施例中,所述人群拓展装置为虚拟装置,存储于图1所示的人群拓展设备的存储器1005中,以实现人群拓展程序的所有功能:用于接收种子包,并基于所述种子包进行人群拓展,生成拓展包;用于对所述拓展包进行可解释性分析,输出分析结果;用于根据所述分析结果确定反馈信息,并根据所述反馈信息生成符合预期的二次拓展包。
具体地,所述人群拓展装置包括:
第一拓展模块10,用于接收种子包,并基于所述种子包进行人群拓展,生成拓展包;
可解释性分析模块20,用于对所述拓展包进行可解释性分析,输出分析结果;
反馈模块30,用于根据所述分析结果确定反馈信息,并根据所述反馈信息生成符合预期的二次拓展包。
进一步地,所述可解释性分析模块包括:
可解释性模型单元,用于将所述拓展包输入预先训练的可解释性模型,通过所述可解释性模型对所述拓展包进行分析并输出分析结果,所述分析结果包括显著特征;
所述反馈模块还包括:
判断单元,用于判断所述分析结果中的所述显著特征是显著正特征还是显著负特征;
第一生成单元,用于若所述显著特征是显著正特征,则将所述显著正特征输入正特征结果模板,生成正特征反馈信息;
第一生成单元,用于若所述显著特征是显著负特征,则将所述显著负特征输入负特征结果模板,生成负特征反馈信息。
进一步地,所述可解释性分析模块包括:
可视化分析单元,用于根据所述拓展包中的各个标签进行可视化分析,获得分析结果,所述分析结果包括拓展分布图和/或拓展分布结果;
所述反馈模块还包括:
确定单元,用于根据所述拓展分布图和/或拓展分布结果,从分析结果-反馈信息映射表中确定对应的反馈信息。
进一步地,所述反馈模块包括:
对比单元,用与将所述分析结果与预期结果进行对比,判断所述分析结果是否符合预期;
确定单元,用于若所述分析结果不符合预期,则根据所述对比结果确定反馈信息;
生成单元,用于基于所述反馈信息进行二次拓展,直到生成符合预期的二次拓展包。
进一步地,所述生成单元包括:
判断子单元,用于判断所述反馈信息的等级,所述等级包括警告级和严重级;
第一生成子单元,用于若所述反馈信息的等级是警告级,则根据所述反馈信息调整人群拓展条件后,进行二次拓展,直到生成符合预期的二次拓展包;
第二生成子单元,用于若所述反馈信息的等级是严重级,则重新进行人群拓展,直到生成符合预期的二次拓展包。
进一步地,所述第一拓展模块包括:
接收单元,用于接收种子包,对所述种子包进行不同维度的分析,筛选出共同特征;
筛选单元,用于根据数据库中候选人群的个人标签与所述共同特征的相似度,从所述数据库中筛选出预设数量的目标候选人群,所述预设数量由拓展倍数决定;
保存单元,用于将所述目标候选人群及其个人标签保存为所述拓展包。
进一步地,所述反馈模块包括:
投放单元,用于获取所述二次拓展包中的人群,向所述人群推荐信息,并记录信息推荐效果。
此外,本发明实施例还提供一种计算机存储介质,所述计算机存储介质上存储有人群拓展程序,所述人群拓展程序被处理器运行时实现如上所述人群拓展方法的步骤,此处不再赘述。
相比现有技术,本发明提出的一种人群拓展方法、装置、设备及存储介质,该方法包括:接收种子包,并基于所述种子包进行人群拓展,生成拓展包;对所述拓展包进行可解释性分析,输出分析结果;根据所述分析结果确定反馈信息,并根据所述反馈信息生成符合预期的二次拓展包。由此对拓展包进行可解释性分析和反馈,实现了人群拓展的二次调整,增强了人群拓展的有效性和合理性。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备执行本发明各个实施例所述的方法。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种人群拓展方法,其特征在于,所述方法包括
接收种子包,并基于所述种子包进行人群拓展,生成拓展包;
对所述拓展包进行可解释性分析,输出分析结果;
根据所述分析结果确定反馈信息,并根据所述反馈信息生成符合预期的二次拓展包。
2.根据权利要求1所述的方法,其特征在于,所述对所述拓展包进行可解释性分析,输出分析结果的步骤包括:
将所述拓展包输入预先训练的可解释性模型,通过所述可解释性模型对所述拓展包进行分析并输出分析结果,所述分析结果包括显著特征;
所述根据所述分析结果确定反馈信息的步骤包括:
判断所述分析结果中的所述显著特征是显著正特征还是显著负特征;
若所述显著特征是显著正特征,则将所述显著正特征输入正特征结果模板,生成正特征反馈信息;
若所述显著特征是显著负特征,则将所述显著负特征输入负特征结果模板,生成负特征反馈信息。
3.根据权利要求1所述的方法,其特征在于,所述对所述拓展包进行可解释性分析,输出分析结果的步骤包括:
根据所述拓展包中的各个标签进行可视化分析,获得分析结果,所述分析结果包括拓展分布图和/或拓展分布结果;
所述根据所述分析结果确定反馈信息的步骤包括:
根据所述拓展分布图和/或拓展分布结果,从分析结果-反馈信息映射表中确定对应的反馈信息。
4.根据权利要求1所述的方法,其特征在于,所述根据所述分析结果确定反馈信息,并根据所述反馈信息生成符合预期的二次拓展包的步骤包括:
将所述分析结果与预期结果进行对比,判断所述分析结果是否符合预期;
若所述分析结果不符合预期,则根据所述对比结果确定反馈信息;
基于所述反馈信息进行二次拓展,直到生成符合预期的二次拓展包。
5.根据权利要求4所述的方法,其特征在于,所述基于所述反馈信息进行二次拓展,直到生成符合预期的二次拓展包的步骤包括:
判断所述反馈信息的等级,所述等级包括警告级和严重级;
若所述反馈信息的等级是警告级,则根据所述反馈信息调整人群拓展条件后,进行二次拓展,直到生成符合预期的二次拓展包;
若所述反馈信息的等级是严重级,则重新进行人群拓展,直到生成符合预期的二次拓展包。
6.根据权利要求1所述的方法,其特征在于,所述接收种子包,并基于所述种子包进行人群拓展,生成拓展包的步骤包括:
接收种子包,对所述种子包进行不同维度的分析,筛选出共同特征;
根据数据库中候选人群的个人标签与所述共同特征的相似度,从所述数据库中筛选出预设数量的目标候选人群,所述预设数量由拓展倍数决定;
将所述目标候选人群及其个人标签保存为所述拓展包。
7.根据权利要求1所述的方法,其特征在于,所述根据所述分析结果确定反馈信息,并根据所述反馈信息生成符合预期的二次拓展包的步骤之后还包括:
获取所述二次拓展包中的人群,向所述人群推荐信息,并记录信息推荐效果。
8.一种人群拓展装置,其特征在于,所述人群拓展装置包括:
第一拓展模块,用于接收种子包,并基于所述种子包进行人群拓展,生成拓展包;
可解释性分析模块,用于对所述拓展包进行可解释性分析,输出分析结果;
反馈模块,用于根据所述分析结果确定反馈信息,并根据所述反馈信息生成符合预期的二次拓展包。
9.一种人群拓展设备,其特征在于,所述人群拓展设备包括处理器,存储器以及存储在所述存储器中的人群拓展程序,所述人群拓展程序被所述处理器运行时,实现如权利要求1-7中任一项所述的人群拓展方法的步骤。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有人群拓展程序,所述人群拓展程序被处理器运行时实现如权利要求1-7中任一项所述人群拓展方法的步骤。
CN202010063804.1A 2020-01-19 2020-01-19 人群拓展方法、装置、设备及存储介质 Pending CN111563761A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010063804.1A CN111563761A (zh) 2020-01-19 2020-01-19 人群拓展方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010063804.1A CN111563761A (zh) 2020-01-19 2020-01-19 人群拓展方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN111563761A true CN111563761A (zh) 2020-08-21

Family

ID=72071426

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010063804.1A Pending CN111563761A (zh) 2020-01-19 2020-01-19 人群拓展方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111563761A (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105427129A (zh) * 2015-11-12 2016-03-23 腾讯科技(深圳)有限公司 一种信息的投放方法及系统
CN107944931A (zh) * 2017-12-18 2018-04-20 平安科技(深圳)有限公司 种子用户拓展方法、电子设备及计算机可读存储介质
CN108038739A (zh) * 2017-12-27 2018-05-15 北京奇虎科技有限公司 一种根据统计数据关联度确定扩展用户的方法和系统
CN108182600A (zh) * 2017-12-27 2018-06-19 北京奇虎科技有限公司 一种根据加权计算来确定扩展用户的方法和系统
CN108280670A (zh) * 2017-01-06 2018-07-13 腾讯科技(深圳)有限公司 种子人群扩散方法、装置以及信息投放系统
CN109002810A (zh) * 2018-08-01 2018-12-14 西南交通大学 模型评价方法、雷达信号识别方法及对应装置
US20190080253A1 (en) * 2017-09-12 2019-03-14 Sas Institute Inc. Analytic system for graphical interpretability of and improvement of machine learning models
CN109991500A (zh) * 2019-04-29 2019-07-09 中国水电工程顾问集团有限公司 一种风电故障预警预测的方法
CN110135893A (zh) * 2019-04-16 2019-08-16 深圳壹账通智能科技有限公司 潜在用户的确定方法、装置、计算机设备及存储介质
CN110162703A (zh) * 2019-05-13 2019-08-23 腾讯科技(深圳)有限公司 内容推荐方法、训练方法、装置、设备及存储介质
CN110619585A (zh) * 2019-08-16 2019-12-27 广州越秀金融科技有限公司 推荐数据的方法、装置、存储介质和处理器

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105427129A (zh) * 2015-11-12 2016-03-23 腾讯科技(深圳)有限公司 一种信息的投放方法及系统
CN108280670A (zh) * 2017-01-06 2018-07-13 腾讯科技(深圳)有限公司 种子人群扩散方法、装置以及信息投放系统
US20190080253A1 (en) * 2017-09-12 2019-03-14 Sas Institute Inc. Analytic system for graphical interpretability of and improvement of machine learning models
CN107944931A (zh) * 2017-12-18 2018-04-20 平安科技(深圳)有限公司 种子用户拓展方法、电子设备及计算机可读存储介质
CN108038739A (zh) * 2017-12-27 2018-05-15 北京奇虎科技有限公司 一种根据统计数据关联度确定扩展用户的方法和系统
CN108182600A (zh) * 2017-12-27 2018-06-19 北京奇虎科技有限公司 一种根据加权计算来确定扩展用户的方法和系统
CN109002810A (zh) * 2018-08-01 2018-12-14 西南交通大学 模型评价方法、雷达信号识别方法及对应装置
CN110135893A (zh) * 2019-04-16 2019-08-16 深圳壹账通智能科技有限公司 潜在用户的确定方法、装置、计算机设备及存储介质
CN109991500A (zh) * 2019-04-29 2019-07-09 中国水电工程顾问集团有限公司 一种风电故障预警预测的方法
CN110162703A (zh) * 2019-05-13 2019-08-23 腾讯科技(深圳)有限公司 内容推荐方法、训练方法、装置、设备及存储介质
CN110619585A (zh) * 2019-08-16 2019-12-27 广州越秀金融科技有限公司 推荐数据的方法、装置、存储介质和处理器

Similar Documents

Publication Publication Date Title
WO2020135535A1 (zh) 一种推荐模型训练方法及相关装置
CN105095219B (zh) 微博推荐方法和终端
CN111382361B (zh) 信息推送方法、装置、存储介质和计算机设备
CN111444428A (zh) 基于人工智能的信息推荐方法、装置、电子设备及存储介质
US20150081696A1 (en) Systems and Methods for Actively Composing Content for Use in Continuous Social Communication
US20110082824A1 (en) Method for selecting an optimal classification protocol for classifying one or more targets
US11188579B2 (en) Personalized dynamic content via content tagging and transfer learning
CN110728541A (zh) 信息流媒体广告创意推荐方法及装置
CN101271558A (zh) 基于上下文信息的多策略商品推荐系统
Niu et al. FUIR: Fusing user and item information to deal with data sparsity by using side information in recommendation systems
CN109819015B (zh) 基于用户画像的信息推送方法、装置、设备及存储介质
CN111768244A (zh) 一种广告投放的推荐方法及装置
CN111611488B (zh) 基于人工智能的信息推荐方法、装置、电子设备
US20100100443A1 (en) User classification apparatus, advertisement distribution apparatus, user classification method, advertisement distribution method, and program used thereby
US20210035183A1 (en) Method and system for a recommendation engine utilizing progressive labeling and user content enrichment
CN109376237A (zh) 客户稳定性的预测方法、装置、计算机设备和存储介质
CN114330752A (zh) 排序模型训练方法和排序方法
CN113111198B (zh) 基于协同过滤算法的演示文稿推荐方法及相关设备
CN113051468B (zh) 一种基于知识图谱和强化学习的电影推荐方法及系统
CN113869931A (zh) 广告投放策略确定方法、装置、计算机设备和存储介质
CN111563761A (zh) 人群拓展方法、装置、设备及存储介质
CN108810577B (zh) 一种用户画像的构建方法、装置及电子设备
CN116049530A (zh) 推广信息的召回方法、装置、计算机设备和存储介质
CN115618271A (zh) 对象类别识别方法、装置、设备及存储介质
CN107944975A (zh) 创意产品大数据分析方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination