CN112561636A - 一种推荐方法、装置、终端设备及介质 - Google Patents
一种推荐方法、装置、终端设备及介质 Download PDFInfo
- Publication number
- CN112561636A CN112561636A CN202011466252.5A CN202011466252A CN112561636A CN 112561636 A CN112561636 A CN 112561636A CN 202011466252 A CN202011466252 A CN 202011466252A CN 112561636 A CN112561636 A CN 112561636A
- Authority
- CN
- China
- Prior art keywords
- target
- determining
- users
- user
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000004590 computer program Methods 0.000 claims description 21
- 238000010801 machine learning Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0203—Market surveys; Market polls
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/21—Server components or server architectures
- H04N21/218—Source of audio or video content, e.g. local disk arrays
- H04N21/2187—Live feed
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Development Economics (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Databases & Information Systems (AREA)
- Signal Processing (AREA)
- Game Theory and Decision Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Multimedia (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请适用于机器学习技术领域,提供了一种推荐方法、装置、终端设备及介质,所述方法包括:确定在预设时间内进入目标场所的总体用户以及进入目标子场所的样本用户,所述目标场所包括多个子场所,所述目标子场所为所述多个子场所中的任意一个;按照预设的多个标签值,分别对所述总体用户和所述样本用户进行数量统计,得到数量统计结果;根据所述数量统计结果,确定每个标签值对应的所述总体用户和所述样本用户的特征差距值;根据所述多个标签值对应的多个特征差距值,确定所述目标子场所的目标用户的群体特征;根据所述群体特征,确定所述目标子场所的潜在用户并向所述潜在用户推荐所述目标子场所。通过上述方法,能够提高推荐的准确性。
Description
技术领域
本申请属于机器学习技术领域,尤其涉及一种推荐方法、装置、终端设备及介质。
背景技术
不同的店铺,所针对的目标人群不同;不同的网络主播,所针对的粉丝群体不同;不同的电视节目,所针对的目标观众不同。如果能够准确地向对应的目标用户进行推荐,则可以为商家带来更好的利润。
目前的推荐模型中,通常采用对商品进行人为标定属性的方式,将商品与客户特征进行匹配。但是人为标定属性的方式,对商户的主观判断能力要求较高,且判断结果不一定符合市场表现。
发明内容
本申请实施例提供了一种推荐方法、装置、终端设备及介质,可以提高推荐的准确性。
第一方面,本申请实施例提供了一种推荐方法,包括:
确定在预设时间内进入目标场所的总体用户以及进入目标子场所的样本用户,所述目标场所包括多个子场所,所述目标子场所为所述多个子场所中的任意一个;
按照预设的多个标签值,分别对所述总体用户和所述样本用户进行数量统计,得到数量统计结果;
根据所述数量统计结果,确定每个标签值对应的所述总体用户和所述样本用户的特征差距值;
根据所述多个标签值对应的多个特征差距值,确定所述目标子场所的目标用户的群体特征;
根据所述群体特征,确定所述目标子场所的潜在用户并向所述潜在用户推荐所述目标子场所。
第二方面,本申请实施例提供了一种推荐装置,包括:
用户确定块,用于确定在预设时间内进入目标场所的总体用户以及进入目标子场所的样本用户,所述目标场所包括多个子场所,所述目标子场所为所述多个子场所中的任意一个;
统计模块,用于按照预设的多个标签值,分别对所述总体用户和所述样本用户进行数量统计,得到数量统计结果;
特征差距值确定模块,用于根据所述数量统计结果,确定每个标签值对应的所述总体用户和所述样本用户的特征差距值;
群体特征确定模块,用于根据所述多个标签值对应的多个特征差距值,确定所述目标子场所的目标用户的群体特征;
推荐模块,用于根据所述群体特征,确定所述目标子场所的潜在用户并向所述潜在用户推荐所述目标子场所。
第三方面,本申请实施例提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的方法。
第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中任一项所述的方法。
本申请实施例与现有技术相比存在的有益效果是:在本申请实施例中,通过确定目标子场所的目标用户的群体特征,然后基于群体特征来向目标子场所的潜在用户推荐该目标子场所。在确定群体特征时,本申请实施例中通过统计目标子场所的样本用户与其所在的目标场所的总体用户之间的特征差距来确定目标子场所的目标用户的群体特征的。通过统计预设时间段内的总体用户和样本用户在多个预设的标签值下的数量,从而确定每个标签值对应的样本用户与总体用户之间的差距;按照样本用户与总体用户之间的差距,从多个标签值中确定目标用户的群体特征。由于本申请中采用了数量统计表方法来衡量差距,计算方式简单,可以提高计算效率;本申请实施例中基于由统计分布差异提取的群体特征得到组合特征排序的优先级,进而推荐相似个体,极大提高了推荐的准确率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例一提供的一种推荐方法的流程示意图;
图2是本申请实施例一提供的一种统计结果的示意图;
图3是本申请实施例一提供的一种总体和样本的占比分布示意图;
图4是本申请实施例一提供的一种确定的群体特征的示意图;
图5是本申请实施例二提供的一种推荐装置的结构示意图;
图6是本申请实施例三提供的一种终端设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
特征工程是机器学习和深度学习重要的组成部分,是把原始数据转变为模型训练数据的过程,它的目的是获取更好的训练数据特征,使模型具有更优的泛化性能。在面向群体的应用场景时,如何识别和提取有效的群体特征决定了机器学习和深度学习模型的上限,具有极其重要的意义。
当前提取特征的方法主要面向个体的应用场景,本申请从统计学中总体和样本的关系着手,结合频率分布直方图,解决了识别和提取群体特征难的痛点,提供了一种面向群体应用场景的全新的解决思路和可行性方案。
传统的推荐模型着重从个体和个体之间建立关联,本申请基于由统计分布差异提取的群体特征得到组合特征排序的优先级,进而推荐相似个体,极大提高了计算效率和推荐的准确率,具有重要的实践价值。
以下以具体实施例对本申请中的方法进行说明。
图1是本申请实施例一提供的一种推荐方法的流程示意图,如图1所示,所述方法包括:
S101,确定在预设时间内进入目标场所的总体用户以及进入目标子场所的样本用户;
具体地,本实施例中的执行主体为终端设备。
上述目标场所可以为商场、平台或者电视台等,一个目标场所中包括多个子场所,上述目标子场所为多个子场所中的一个。例如,若目标场所为一个商场,则目标子场所可以为一个店铺;若目标场所为一个视频平台,则目标子场所可以为视频平台内的一个电视节目;若目标场所为一个直播平台,则目标子场所可以为一个直播博主号。
具体地,在进行统计时,可以在目标场所的入口和目标子场所门口分别安装摄像头,采集人脸照片,通过AI的方法判断用户的性别,年龄。也可以采用抽样的方式,分别估计目标场所的和目标子场所的用户画像,例如商场有所有会员的注册信息,店铺有自己的会员的注册信息,可以用商场和店铺会员的信息分别替代商场和店铺的用户信息。
另外,可以直接获取平台内的用户的平台注册信息、登录信息作为总体用户;获取该平台内的某一账号的观众信息作为样本用户。S102,按照预设的多个标签值,分别对所述总体用户和所述样本用户进行数量统计,得到数量统计结果;
具体地,可以根据不同的属性标签为用户设置标签值,在每个属性标签下,用户具有对应的标签值,比如对于性别这一属性标签,用户的标签值可以为男或女;对于年龄段这一属性标签,用户的标签值可以为20s、30s、40s、50s、50s+,其中20s代表20-29岁这一年龄段,同理30s、40s、50s对应的年龄段分别为30-39岁、40-49岁、50-59岁;50s+表示年龄大于60岁的年龄段;对于学历这一属性标签,用户的标签值可以为高中、本科、研究生、其他。
具体地,统计总体用户的数量以及样本用户的数量;统计总体用户中每个标签值对应的第一用户数量,以及样本用户中每个标签对应的第二用户数量,得到数量统计结果。例如,对于“男”这一标签值,统计总体用户中的男性数量,将总体用户中的男性数量记为一个第一用户数量;统计样本用户中的男性数量,并将样本用户中的男性数量记为一个第二用户数量。在进行数量统计之后,每个标签值对应一个第一用户数量和一个第二用户数量。
S103,根据所述数量统计结果,确定每个标签值对应的所述总体用户和所述样本用户的特征差距值;
具体地,针对每个标签值,分别计算该标签值对应的第一用户数量与总体用户数量的第一比值;计算该标签值对应的第二用户数量与样本用户数量的第二比值。在此步骤计算之后,每个标签值对应一个第一比值和一个第二比值。计算每个标签值对应的第二比值减去第一比值得到的占比差,将该占比差作为总体用户和样本用户在这一标签值上的特征差距值。这样本方法中的多个标签值可以对应多个特征差距值。
示例性地,总体用户的数量为A,样本用户的数量为B;在“男”这一标签值下,统计出的总体用户中的男性数量为X,样本用户中男性数量为Y,则“男”这一标签值对应的第一比值为:X/A,第二比值为Y/B,那么“男”对应的占比差为Y/B-X/A。这一差值可以用于反映样本用户与总体用户在男性方面的特征差距。比如,Y/B-X/A的值比较大,则说明,该目标子场所的男性用户的比例大于该目标场所中的男性用户的比例,则可以说明,男性用户更喜欢这个目标子场所。
S104,根据所述多个标签值对应的多个特征差距值,确定所述目标子场所的目标用户的群体特征;
上述群体特征包括的属性标签与用户的属性标签相同,比如,用户的属性标签为性别、年龄段、学历,则群体特征也包括性别、年龄段、学历这些属性标签。确定目标用户的群体特征,即确定目标用户在每个属性标签上所对应的标签值。
具体地,可以将多个标签值对应的多个特征差距值降序排列;然后根据降序排列结果确定预设数量的目标特征差距值;确定目标特征差距值对应的第一标签值;针对每个属性标签,确定属性标签对应的特征差距值最大的第二标签值;根据第一标签值和第二标签值,确定目标子场所的目标用户的群体特征。从第一标签值和第二标签值中确定群体特征的多个目标标签值,多个目标标签值对应的多个属性标签不同;根据目标标签值,确定目标用户的群体特征。将每个属性标签对应的多个标签值所对应的多个特征差距值作为一个属性组;确定每个标签值对应的特征差距值在对应的属性组中的组内排名;根据群体特征中的每个目标标签值的组内排名,确定群体特征的优先级。
示例性地,将多个特征差距值降序排列,然后将排列在前5位的特征差距值记为目标特征差距值,将这5个目标特征差距值对应的标签值记为第一标签值;每个属性标签对应的多个标签值,每个标签值对应一个特征差距值,则每个属性标签可以对应多个特征差距值,将每个属性标签对应的多个特征差距值进行降序排列,得到每个标签值的组内排名,提取每个属性标签对应的组内排名为第一位的特征差距值,将该特征差距值对应的标签值作为第二标签值,第二标签值的个数与属性标签的个数相同。例如用户包括3个属性标签,则对应有3个第二标签值。由于用户包括3个属性标签,则目标用户的群体特征也包括3个属性标签,从5个第一标签值和3个第二标签值中选取目标用户的3个属性标签对应的3个目标标签值,这3个目标标签值为最终确定的群体特征。一般地,第一标签值和第二标签值中可能存在重复的标签值,因此这5个第一标签值和3个第二标签值对应的标签值的个数少于8个,但至少包括5个,因此可以确定出多个群体特征。对于确定的多个群体特征,可以确定每个群体特征对应的3个目标标签值的组内排名,然后利用这3个组内排名相加得到的和,确定群体特征的优先级。即目标标签值的组内排名的和越小,则群体特征的优先级越高。
在另一种可能的实现方式中,可以设置一个占比差阈值,当标签值对应的占比差大于该占比差阈值,则说明目标子场所的用户中这一标签值的用户比较多,即在进行推荐时,可以面向该标签值对应的群体推荐该目标场所,这样推荐成功的概率比较大。确定所有占比差大于预设的占比差阈值的标签值,并且确定每个占比差大于预设的占比差阈值的标签值的组内排名。然后从占比差大于预设的占比差阈值的标签值中选取群体特征在每个属性标签上的目标标签值,再基于目标标签值的组内排名,确定群体特征的优先级。
另外,也可以计算每个群体特征对应的目标标签值对应的占比差的和,利用占比差的和确定群体特征的优先级。例如,占比差的和越大,对应的群体特征的优先级越高。
S105,根据所述群体特征,确定所述目标子场所的潜在用户并向所述潜在用户推荐所述目标子场所。
具体地,本申请中统计的样本用户是该目标子场所的用户,得到的群体特征可以反映出目标用户的属性标签,比如群体特征为“女”,“本科”,“20s”则说明年龄段在20s的本科女生更喜欢进入该目标子场所。则该目标子场所的潜在用户是年龄段在20s的本科女生,因此,可以面向年龄段在20s的本科女生进行相应地推广。
具体地,每个群体特征对应有优先级,则根据群体特征确定的潜在用户同样具有对应的优先级,在进行推荐时,可以优先面向优先级高的潜在用户推荐该目标子场所。具体地,若对线下店铺进行推荐,设置有主题的广告牌,该广告牌的目标群体为潜在用户;也可以考虑将具有相近群体特征的潜在用户的店铺安排在商场的空间相邻的位置,做好用户分群导流。对于线上的商城和店铺,可以针对用户浏览页面做个性化推荐。
为了更好地对本实施例中的方法进行说明,下面采用一具体实例进行描述。在该实例中,目标场所可以为一个商场,目标子场所可以为商场中的一个店铺。
假设已知用户的属性标签为性别、年龄段、学历,对应的标签值分别为:男、女;20s、30s、40s、50s、50s+;高中、本科、研究生、其他。统计得到的某个时间段进入商场的用户为1000人,进入店铺的用户为100人,总体和样本分别为进入商场和店铺的用户。对于每一个标签,我们分别统计标签值对应的总体和样本的频数,再计算对应频数的百分比,比较总体和样本不同标签值占比的差异。本申请确定群体标签的设计逻辑如下:(1)、先遍历用户的标签(性别、年龄段、学历),逐次统计各标签值总体和样本的频数。(2)、分别计算各标签值占同类标签的百分比。(3)、计算样本和总体百分比的占比差,占比差=样本_占比-总体_占比,占比差小于0时,忽略不计。(4)、按占比差降序排列,得到所有标签对应标签值的整体排名。(5)、对占比差按各标签分组排序,得到组内排名。
统计结果可以如图2所示,参照图2,对于男、女;20s、30s、40s、50s、50s+;高中、本科、研究生、其他这些预设的标签值,总体用户中,多个标签值对应用户数量分别为:501,499,219,192,194,205,190,254,239,265,242,其对应的总体占比分别为:50.1%,49.9%,21.9%,19.2%,19.4%,20.5%,19.0%,25.4%,23.9%,26.5%,24.2%;样本用户中,多个标签值对应的用户数量分别为:24,76,30,33,16,12,9,10,34,47,9,对应的样本占比分别为:24.0%,76.0%,30.0%,33.0%,16.0%,12.0%,9.0%,10.0%,34.0%,47.0%,9.0%。基于该统计结果可以绘制出如图3所示的总体和样本在各个属性标签上的占比分布图。参照图3,可以看出样本用户中女性占比更大;样本用户中年龄段在20s和30s的用户占比比较大;样本用户中学历为研究生和本科的用户占比比较大。
对所有的占比差进行整体排名,占比差的整体排名排列在前5位的标签值分别为:女、研究生、30s、本科、20s,这几个标签值对应的组内排名分别为:1、1、1、2、2。
按整体排名和组内排名可得到组合标签,即可获取该商铺的群体特征和对应的优先级。图4可以为确定的多个群体特征,参照图4,该店铺的用户画像的多个群体特征分别为:女性、30s、研究生;女性、20s、研究生;女性、30s、本科;女性、20s、本科。这些群体特征对应的标签值的组内排名的和分别为:3、4、4、5,则女性、30s、研究生这一群体特征对应的优先级最高。
依据提取的群体特征及对应的优先级,可以快速匹配推荐相似的个体。以给店铺推荐潜在用户为例,先推荐群体特征的优先级最高的用户,即从进入商场的全部用户中搜索满足性别为女性,年龄段为30s,学历为研究生的用户。然后推荐群体特征优先级次高的用户,即在全部用户中搜索满足性别为女性,年龄段为20s,学历为研究生的用户。依此类推,得到该商铺潜在的用户和优先级序列。
本申请立足总体和样本的统计分布特征,从样本和总体的占比差提取群体特征,而不是基于样本的频数分布确定群体特征。假设某时间段进入商场的男性为400人,女性为600人;同期进入店铺的男性为45人,女性为55人。若以样本频数为依据,则进入店铺的群体特征为女性。而如果基于样本和总体占比差考虑,男性样本的占比为45%,男性总体的占比为40%,男性的占比差为5%,即进入店铺的群体特征为男性。由于进入店铺消费的是进入商场的用户,如果进入商场的是男性消费者,那么他成为该店铺潜在用户的概率比女性更高,因此给店铺推荐进入商场的男性用户是合理的。
本申请从总体和样本的统计分布考虑,通过计算样本和总体的占比差来确定和提取群体特征,能够更快速和准确推荐相似个体,具有重要的实践价值。
图5是本申请实施例二提供的一种推荐装置的结构示意图,如图5所示,所述装置包括:
用户确定模块51,用于确定在预设时间内进入目标场所的总体用户以及进入目标子场所的样本用户,所述目标场所包括多个子场所,所述目标子场所为所述多个子场所中的任意一个;
统计模块52,用于按照预设的多个标签值,分别对所述总体用户和所述样本用户进行数量统计,得到数量统计结果;
特征差距值确定模块53,用于根据所述数量统计结果,确定每个标签值对应的所述总体用户和所述样本用户的特征差距值;
群体特征确定模块54,用于根据所述多个标签值对应的多个特征差距值,确定所述目标子场所的目标用户的群体特征;
推荐模块55,用于根据所述群体特征,确定所述目标子场所的潜在用户并向所述潜在用户推荐所述目标子场所。
上述统计模块52包括:
总数量统计子模块,用于统计总体用户数量以及样本用户数量;
频数统计子模块,用于统计所述总体用户中每个标签值对应的第一用户数量,以及所述样本用户中每个标签对应的第二用户数量,得到数量统计结果。
上述特征差距值确定模块53包括:
比值计算子模块,用于针对每个标签值,分别计算所述标签值对应的所述第一用户数量与所述总体用户数量的第一比值,以及对应的所述第二用户数量与所述样本用户数量的第二比值;
占比差计算子模块,用于计算所述每个标签值对应的所述第二比值与所述第一比值之间的占比差,将所述占比差作为所述总体用户和所述样本用户的特征差距值。
上述群体特征确定模块54包括:
排序子模块,用于将多个标签值对应的多个特征差距值降序排列;
目标特征差距值确定子模块,用于根据降序排列结果确定预设数量的目标特征差距值;
第一标签值确定子模块,用于确定所述目标特征差距值对应的第一标签值;
第二标签值确定子模块,用于针对所述每个属性标签,确定所述属性标签对应的特征差距值最大的第二标签值;
群体特征确定子模块,用于根据所述第一标签值和所述第二标签值,确定所述目标子场所的目标用户的群体特征。
上述群体特征确定子模块,包括:
目标标签值确定单元,用于从所述第一标签值和所述第二标签值中确定所述群体特征的多个目标标签值,所述多个目标标签值对应的多个属性标签不同;
群体特征确定单元,用于根据所述目标标签值,确定所述目标用户的群体特征。
上述群体特征确定子模块还包括:
属性组确定单元,用于将每个属性标签对应的多个标签值所对应的多个特征差距值作为一个属性组;
组内排名确定单元,用于确定每个标签值对应的特征差距值在对应的属性组中的组内排名;
群体特征优先级确定单元,用于根据所述群体特征中的每个目标标签值的组内排名,确定所述群体特征的优先级。
上述推荐模块55包括::
潜在用户优先级确定子模块,用于根据所述群体特征的优先级,确定所述潜在用户的优先级;
推荐子模块,用于按照所述潜在用户的优先级,向所述潜在用户推荐所述目标子场所。
图6为本申请实施例三提供的一种终端设备的结构示意图。如图6所示,该实施例的终端设备6包括:至少一个处理器60(图6中仅示出一个)处理器、存储器61以及存储在所述存储器61中并可在所述至少一个处理器60上运行的计算机程序62,所述处理器60执行所述计算机程序62时实现上述任意各个方法实施例中的步骤。
所述终端设备6可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。该终端设备可包括,但不仅限于,处理器60、存储器61。本领域技术人员可以理解,图6仅仅是终端设备6的举例,并不构成对终端设备6的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括输入输出设备、网络接入设备等。
所称处理器60可以是中央处理单元(CentralProcessingUnit,CPU),该处理器60还可以是其他通用处理器、数字信号处理器(DigitalSignalProcessor,DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)、现成可编程门阵列(Field-ProgrammableGateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器61在一些实施例中可以是所述终端设备6的内部存储单元,例如终端设备6的硬盘或内存。所述存储器61在另一些实施例中也可以是所述终端设备6的外部存储设备,例如所述终端设备6上配备的插接式硬盘,智能存储卡(SmartMediaCard,SMC),安全数字(SecureDigital,SD)卡,闪存卡(FlashCard)等。进一步地,所述存储器61还可以既包括所述终端设备6的内部存储单元也包括外部存储设备。所述存储器61用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器61还可以用于暂时地存储已经输出或者将要输出的数据。
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设执行时实现可实现上述各个方法实施例中的步骤。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/网络设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/网络设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (10)
1.一种推荐方法,其特征在于,包括:
确定在预设时间内进入目标场所的总体用户以及进入目标子场所的样本用户,所述目标场所包括多个子场所,所述目标子场所为所述多个子场所中的任意一个;
按照预设的多个标签值,分别对所述总体用户和所述样本用户进行数量统计,得到数量统计结果;
根据所述数量统计结果,确定每个标签值对应的所述总体用户和所述样本用户的特征差距值;
根据所述多个标签值对应的多个特征差距值,确定所述目标子场所的目标用户的群体特征;
根据所述群体特征,确定所述目标子场所的潜在用户并向所述潜在用户推荐所述目标子场所。
2.如权利要求1所述的方法,其特征在于,所述按照预设的多个标签值,分别对所述总体用户和所述样本用户进行数量统计,得到数量统计结果,包括:
统计总体用户数量以及样本用户数量;
统计所述总体用户中每个标签值对应的第一用户数量,以及所述样本用户中每个标签对应的第二用户数量,得到数量统计结果。
3.如权利要求2所述的方法,其特征在于,所述根据所述数量统计结果,确定每个标签值对应的所述总体用户和所述样本用户的特征差距值,包括:
针对每个标签值,分别计算所述标签值对应的所述第一用户数量与所述总体用户数量的第一比值,以及对应的所述第二用户数量与所述样本用户数量的第二比值;
计算所述每个标签值对应的所述第二比值与所述第一比值之间的占比差,将所述占比差作为所述总体用户和所述样本用户的特征差距值。
4.如权利要求1-3任一项所述的方法,其特征在于,所述每个标签值对应一个属性标签,所述总体用户和所述样本用户均包括多个属性标签,每个属性标签具有对应的多个所述标签值,所述根据所述多个标签值对应的多个特征差距值,确定所述目标子场所的目标用户的群体特征,包括:
将多个标签值对应的多个特征差距值降序排列;
根据降序排列结果确定预设数量的目标特征差距值;
确定所述目标特征差距值对应的第一标签值;
针对所述每个属性标签,确定所述属性标签对应的特征差距值最大的第二标签值;
根据所述第一标签值和所述第二标签值,确定所述目标子场所的目标用户的群体特征。
5.如权利要求4所述的方法,其特征在于,每个群体特征对应多个标签值,所述根据所述第一标签值和所述第二标签值,确定所述目标子场所的目标用户的群体特征,包括:
从所述第一标签值和所述第二标签值中确定所述群体特征的多个目标标签值,所述多个目标标签值对应的多个属性标签不同;
根据所述目标标签值,确定所述目标用户的群体特征。
6.如权利要求5所述的方法,其特征在于,所述确定的群体特征包括多个,所述根据所述第一标签值和所述第二标签值,确定所述目标子场所的目标用户的群体特征,还包括:
将每个属性标签对应的多个标签值所对应的多个特征差距值作为一个属性组;
确定每个标签值对应的特征差距值在对应的属性组中的组内排名;
根据所述群体特征中的每个目标标签值的组内排名,确定所述群体特征的优先级。
7.如权利要求6所述的方法,其特征在于,所述根据所述群体特征,确定所述目标子场所的潜在用户并向所述潜在用户推荐所述目标子场所,包括:
根据所述群体特征的优先级,确定所述潜在用户的优先级;
按照所述潜在用户的优先级,向所述潜在用户推荐所述目标子场所。
8.一种推荐装置,其特征在于,包括:
用户确定模块,用于确定在预设时间内进入目标场所的总体用户以及进入目标子场所的样本用户,所述目标场所包括多个子场所,所述目标子场所为所述多个子场所中的任意一个;
统计模块,用于按照预设的多个标签值,分别对所述总体用户和所述样本用户进行数量统计,得到数量统计结果;
特征差距值确定模块,用于根据所述数量统计结果,确定每个标签值对应的所述总体用户和所述样本用户的特征差距值;
群体特征确定模块,用于根据所述多个标签值对应的多个特征差距值,确定所述目标子场所的目标用户的群体特征;
推荐模块,用于根据所述群体特征,确定所述目标子场所的潜在用户并向所述潜在用户推荐所述目标子场所。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011466252.5A CN112561636A (zh) | 2020-12-14 | 2020-12-14 | 一种推荐方法、装置、终端设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011466252.5A CN112561636A (zh) | 2020-12-14 | 2020-12-14 | 一种推荐方法、装置、终端设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112561636A true CN112561636A (zh) | 2021-03-26 |
Family
ID=75064437
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011466252.5A Pending CN112561636A (zh) | 2020-12-14 | 2020-12-14 | 一种推荐方法、装置、终端设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112561636A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113468424A (zh) * | 2021-06-30 | 2021-10-01 | 北京达佳互联信息技术有限公司 | 异常属性标签的监控方法、装置、电子设备及存储介质 |
CN117408531A (zh) * | 2023-10-26 | 2024-01-16 | 北京赛博数智科技有限公司 | 一种大数据智能匹配的客户信息管理方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108537568A (zh) * | 2018-03-07 | 2018-09-14 | 阿里巴巴集团控股有限公司 | 一种信息推荐方法和装置 |
CN109145146A (zh) * | 2018-09-07 | 2019-01-04 | 北京奇艺世纪科技有限公司 | 一种数据对象推荐方法、装置及电子设备 |
CN110704677A (zh) * | 2019-08-23 | 2020-01-17 | 优地网络有限公司 | 一种节目推荐方法、装置、可读存储介质及终端设备 |
CN111415184A (zh) * | 2019-01-08 | 2020-07-14 | 百度在线网络技术(北京)有限公司 | 内容推荐方法、装置、电子设备及可读存储介质 |
-
2020
- 2020-12-14 CN CN202011466252.5A patent/CN112561636A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108537568A (zh) * | 2018-03-07 | 2018-09-14 | 阿里巴巴集团控股有限公司 | 一种信息推荐方法和装置 |
CN109145146A (zh) * | 2018-09-07 | 2019-01-04 | 北京奇艺世纪科技有限公司 | 一种数据对象推荐方法、装置及电子设备 |
CN111415184A (zh) * | 2019-01-08 | 2020-07-14 | 百度在线网络技术(北京)有限公司 | 内容推荐方法、装置、电子设备及可读存储介质 |
CN110704677A (zh) * | 2019-08-23 | 2020-01-17 | 优地网络有限公司 | 一种节目推荐方法、装置、可读存储介质及终端设备 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113468424A (zh) * | 2021-06-30 | 2021-10-01 | 北京达佳互联信息技术有限公司 | 异常属性标签的监控方法、装置、电子设备及存储介质 |
CN113468424B (zh) * | 2021-06-30 | 2023-10-31 | 北京达佳互联信息技术有限公司 | 异常属性标签的监控方法、装置、电子设备及存储介质 |
CN117408531A (zh) * | 2023-10-26 | 2024-01-16 | 北京赛博数智科技有限公司 | 一种大数据智能匹配的客户信息管理方法及系统 |
CN117408531B (zh) * | 2023-10-26 | 2024-05-07 | 北京赛博数智科技有限公司 | 一种大数据智能匹配的客户信息管理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11252245B2 (en) | Information pushing method and device | |
CN109325179B (zh) | 一种内容推广的方法及装置 | |
CN111125574B (zh) | 用于生成信息的方法和装置 | |
CN109064265A (zh) | 基于网络平台的购车推荐方法及系统 | |
CN112380859A (zh) | 舆情信息的推荐方法、装置、电子设备及计算机存储介质 | |
CN113034241B (zh) | 一种产品信息推荐方法及计算机设备 | |
CN111159563A (zh) | 用户兴趣点信息的确定方法、装置、设备及存储介质 | |
WO2021129531A1 (zh) | 一种资源分配方法、装置、设备、存储介质及计算机程序 | |
CN112561636A (zh) | 一种推荐方法、装置、终端设备及介质 | |
CN111104590A (zh) | 信息推荐方法、装置、介质及电子设备 | |
CN112927050A (zh) | 待推荐金融产品确定方法、装置、电子设备及存储介质 | |
CN111815375A (zh) | 广告投放中的用户画像方法及装置 | |
CN111626767A (zh) | 资源数据的发放方法、装置及设备 | |
CN111414410A (zh) | 数据处理方法、装置、设备和存储介质 | |
CN112346951B (zh) | 业务的测试方法及装置 | |
CN113886711B (zh) | 内容推荐方法、装置、服务器及存储介质 | |
CN113609409B (zh) | 一种推荐浏览信息的方法及其系统、电子设备、存储介质 | |
CN113011911B (zh) | 基于人工智能的数据预测方法、装置、介质及电子设备 | |
CN114066533A (zh) | 产品推荐方法、装置、电子设备及存储介质 | |
CN113627983A (zh) | 一种基于视频创意的网络广告推广方法及系统 | |
CN113327132A (zh) | 多媒体推荐方法、装置、设备及存储介质 | |
CN112966756A (zh) | 一种可视化的准入规则的生成方法、装置、机器可读介质及设备 | |
CN110990692A (zh) | 基于画像分析的数据处理方法及装置 | |
CN113282807B (zh) | 基于二部图的关键词扩展方法、装置、设备及介质 | |
CN113961803A (zh) | 拍品推荐方法及装置以及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |