CN106355449B - 用户选取方法和装置 - Google Patents
用户选取方法和装置 Download PDFInfo
- Publication number
- CN106355449B CN106355449B CN201610797458.3A CN201610797458A CN106355449B CN 106355449 B CN106355449 B CN 106355449B CN 201610797458 A CN201610797458 A CN 201610797458A CN 106355449 B CN106355449 B CN 106355449B
- Authority
- CN
- China
- Prior art keywords
- information
- user
- category
- users
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
- G06Q30/0256—User search
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2113—Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/40—Software arrangements specially adapted for pattern recognition, e.g. user interfaces or toolboxes therefor
- G06F18/41—Interactive pattern learning with a human teacher
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Economics (AREA)
- Databases & Information Systems (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Game Theory and Decision Science (AREA)
- Probability & Statistics with Applications (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种用户选取方法,该用户选取方法包括:获取每个种子用户的特征标签向量;根据所有种子用户的特征标签向量计算预设的第一数量的信息类别中,每个类别的信息对应的聚类中心;获取所述每个类别的信息对应的特征权值向量;获取潜在用户群中的每个潜在用户的特征标签向量;根据所述潜在用户的特征标签向量、特征权值向量以及聚类中心,计算潜在用户和每个类别的聚类中心的第一距离;从所述第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户。上述方法可使得所选取出的目标用户的精准度更高。此外,还对应提供了一种用户选取装置。
Description
技术领域
本发明涉及信息处理技术领域,特别是涉及一种用户选取方法和装置。
背景技术
随着大数据应用的发展,即时通信和社交应用平台中存储了大量的用户信息,比如用户的喜好、年龄、职业和需求等等,而这些用户信息对于是否可进行信息的推送,比如商品广告等信息的推送,有着重要的参考价值。
传统的技术方案中,通常都是对所获取的海量用户进行简单的筛选,比如筛选出浏览过与服务商准备推送的信息相同或相似的用户,作为目标用户,并向其投放相关服务商的推送信息。而现实中,由于每个用户都是一个独立的存在,具有多样化的特性,仅通过这种简单的筛选所确定的用于投放信息的目标用户不够精准。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高目标用户选取的精准度的用户选取方法和装置。
一种用户选取方法,所述方法包括:
获取每个种子用户的特征标签向量;
根据所有种子用户的特征标签向量计算预设的第一数量的信息类别中,每个类别的信息对应的聚类中心;
获取所述每个类别的信息对应的特征权值向量;
获取潜在用户群中的每个潜在用户的特征标签向量;
根据所述潜在用户的特征标签向量、特征权值向量以及聚类中心,计算潜在用户和每个类别的聚类中心的第一距离;
从所述第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户。
一种用户选取装置,所述装置包括:
特征标签向量获取模块,用于获取每个种子用户的特征标签向量;
聚类中心计算模块,用于根据所有种子用户的特征标签向量计算预设的第一数量的信息类别中,每个类别的信息对应的聚类中心;
特征权值向量获取模块,用于获取所述每个类别的信息对应的特征权值向量;
所述特征标签向量获取模块还用于获取潜在用户群中的每个潜在用户的特征标签向量;
第一距离计算模块,用于根据所述潜在用户的特征标签向量、特征权值向量以及聚类中心,计算潜在用户和每个类别的聚类中心的第一距离;
目标用户选取模块,用于从所述第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户。
上述用户选取方法和装置,根据所获取的每个种子用户的特征向量以及预设的第一数量的信息类别,计算出每个类别的信息对应的聚类中心,然后根据潜在用户的特征标签向量、特征权值向量以及所计算出的聚类中心,计算潜在用户和每个类别的聚类中心的第一距离;再从所计算出的所有潜在用户的第一距离中选取距离最短的第二数量的潜在用户,作为可向该目标用户发送相应的推送信息的目标用户。由于该第一距离可反映出对应潜在用户与相应类别信息的匹配程度,且距离越小,则说明越适合向该用户发送相应类别的信息,从而使得所选取出的目标用户更加精准。
附图说明
图1为一个实施例中用户选取方法的应用环境图;
图2为一个实施例中用于实现用户选取方法的服务器的内部结构图;
图3为一个实施例中用户选取方法的流程示意图;
图4为一个实施例中聚类的示意图;
图5为一个实施例中根据所有种子用户的特征标签向量计算预设的第一数量的信息类别中,每个类别的信息对应的聚类中心的步骤的流程示意图;
图6为一个实施例中获取每个类别的信息对应的特征权值向量的步骤的流程示意图;
图7为一个实施例中根据反馈信息更新每个类别的信息对应的聚类中心和特征权值向量的步骤的流程示意图;
图8为一个实施例中根据反馈信息更新每个类别的信息对应的聚类中心和特征权值向量的步骤的流程示意图;
图9为一个实施例中用户选取装置的结构框图;
图10为另一个实施例中用户选取装置的结构框图;
图11为又一个实施例中用户选取装置的结构框图;
图12为一个实施例中聚类中心计算模块的结构框图;
图13为一个实施例中特征权值向量获取模块的结构框图;
图14为再一个实施例中用户选取装置的结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例所提供的用户选取方法可应用于如图1所示的应用场景中。参考图1所示,客户终端110可通过预先设置的网络与服务器120进行交互。客户终端110为需要向用户发送推送信息的服务商的终端,包括但不限于具有通信功能的智能手机、平板电脑、掌上电脑等设备。服务器120为存储有大量的用户信息的社交、即时通信或购物等平台的服务器,该大量的用户即构成一个潜在用户群。服务器120中的每个潜在用户均具有多个特征信息,根据该多个特征信息可构成特征标签向量,通过该特征标签向量可反映用户的特征。客户终端110可向服务器120发送用于选取合适的用户的选取请求,以便于向所选取的用户发送相关的推送信息。服务器120可根据该请求来获取每个种子用户的特征标签向量,种子用户一般为购买过或收藏过服务商的相关产品的用户;根据所有种子用户的特征标签向量计算预设的第一数量的信息类别中,每个类别的信息对应的聚类中心。其中,第一数量与该服务商准备推荐的信息所包含的种类数量相匹配,每种类别的信息均对应具有一个聚类中心。服务器120中还设有与特征标签向量对应的特征权值向量,根据潜在用户的特征标签向量、特征权值向量以及聚类中心,计算潜在用户和每个类别的聚类中心的第一距离;然后从第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户,从而实现了对用户的选取。
在一个实施例中,图1中的服务器120的内部结构如图2所示,该服务器包括通过系统总线连接的处理器、存储介质、内存和网络接口。其中,该服务器的存储介质存储有操作系统、数据库和一种用户选取装置。数据库用于存储数据,如存储每个潜在用户的特征标签向量、每个类别的信息的聚类中心以及特征权值向量等。该操作系统用于实现一种用户选取方法。该服务器的处理器用于提供计算和控制能力,支撑整个接入服务器的运行。该服务器的内存为存储介质中的用户选取系统的运行提供环境。该服务器的网络接口用于与外部的终端或服务器通过网络连接通信,比如接收终端110发送的选取请求或向所选取的用户对应的终端发送推送信息等。
在一个实施例中,如图3所示,提供了一种用户选取方法,该方法可应用于如图1所示的服务器中,具体包括以下步骤:
步骤302,获取每个种子用户的特征标签向量。
本实施例中,服务器可预先接收服务商的客户终端所发送的用户选取请求,该用户选取请求中包含服务商所需推送信息的具体分类、以及一定数量的种子用户的特征信息,并根据服务商所提供的种子用户的特征信息构建对应的特征标签向量。其中,该推送信息可为任意信息,对推送信息所分的类别的数量即为第一数量。以推送信息为服装信息为例,当该具体分类被分为男士服装、女士服装和儿童服装三类时,则相应的第一数量即为3。以推送信息为体育用品为例,当该具体分类被分为篮球、足球、排球和网球四类时,则相应的第一数量即为4。
种子用户为服务器所提供的样本用户,种子用户一般为购买过或收藏过服务商的相关产品的用户,种子用户的数量可为10000、50000等任意数量,所有数量的种子用户则构成一个种子用户群。特征信息可包括用户的年龄、性别、职业、收入、学历、所在城市以及购物习惯等其中的一种或多种。服务器可按照预设量化规则对每个种子用户的特征信息进行相应的量化,根据预设的所需类型的特征标签构建对应种子用户的特征标签向量。特征标签向量是具有一定长度的维度,其每个维度上的参数均对应表征种子用户的一种特征信息,即该特征标签向量由所选取种子用户的多个特征信息构成。
设所选取的特征信息的种类为n,对于第i个种子用户的特征标签向量,其表示方式可为(yi1,yi2,...yin),其中,参数yim用于表征第i个种子用户的第m个特征信息,举例来说,所选取的特征信息的种类分别包括年龄、性别、职业、收入、学历、所在城市这6种,则n为6。依次按照该种类顺序构建相应的特征标签向量,则yi1至yi6分别表征第i个种子用户的年龄、性别、职业、收入、学历、所在城市这些具体的特征信息。
步骤304,根据所有种子用户的特征标签向量计算预设的第一数量的信息类别中,每个类别的信息对应的聚类中心。
本实施例中,服务器可根据所分类的具体的信息类别,将每个种子用户也进行相应的分类,使得对种子用户的分类与信息类别的分类相对应,从而可形成第一数量的聚类,每个聚类分别与信息的种类一一对应。特征标签向量反映在空间坐标系中则为一个具体的点,被划分为相同类别的种子用户的特征标签向量则处于同一聚类中,服务器可根据由所有种子用户的特征标签向量所形成的第一数量的聚类,计算出每个聚类的中心点,将该中心点作为该类别的信息的聚类中心。其中,每个聚类分别与信息的种类一一对应。具体的,可根据预设的聚类算法计算出每个类别的信息对应的聚类中心,该聚类算法可为K-means、K-medoids或Clara等任意一种聚类算法。
所计算出的聚类中心是用于表征某一类别的信息对应的种子用户所共有的特征信息,聚类中心的形式与特征标签向量相同,具有与特征标签向量相同长度的维度,其每个维度上的参数均对应表征种子用户所共有的一种特征信息。反映在空间坐标系中则为一个具体的点。对于第k类的信息的n维聚类中心,其表示方式可为(xk1,xk2,...xkn),其中,参数xkm用于表征第k类的信息对应的种子用户所共有的第m个特征信息。
如图4所示,为一个实施例中对特征标签向量进行聚类的示意图。图中的每一个点表示对应一个种子用户的特征标签向量,处于同一圆圈中的点构成了一个聚类,通过该圆圈中的所有点,可计算出对应的中心点,该中心点即为相应类别信息的聚类中心。
举例来说,推送信息为服装信息,该信息分类被分为男士服装信息、女士服装信息和儿童服装信息三类时,服务器可按照预设的聚类算法将形成的如图4中上方、左下方、右下方的聚类分别与男士服装信息、女士服装信息和儿童服装信息对应。所计算出的三个聚类中心分别为与男士服装信息、女士服装信息和儿童服装信息对应的聚类中心。
步骤306,获取每个类别的信息对应的特征权值向量。
本实施例中,服务器还根据所需推送信息的具体分类设置了对应第一数量的特征权值向量,每个特征权值向量与相应的类别的信息一一对应。其中,不同类别的信息的聚类中心对应的特征权值向量可相同或者不同。同样的,特征权值向量的维数与特征标签向量的维数相同。特征权值向量的每个参数为特征标签向量中对应特征标签向量的参数的权值。其表示方式可为(wk1,wk2,...wkn),其中,wki用于反映对应于第k类信息的特征标签向量第i个参数yi所占的权重。特征标签向量中不同参数对应的权值可相同或不同,对于与待推送的类型的信息关联度较大的特征信息,可对应设置较大的权值。举例来说,当信息类别为男士服装信息、女士服装信息和儿童服装信息三类,且特征向量标签中表示年龄、性别和职业等参数,可分别将与男士服装信息、女士服装信息对应的特征权值向量中反映性别的参数设置一个相对较大的权值,而将与儿童服装信息对应的特征权值向量中反映性别的参数设置一个相对较小的权值。
步骤306,获取潜在用户群中的每个潜在用户的特征标签向量。
本实施例中,服务器中存储有大量的用户,该用户即为可被适用于推送信息的潜在用户,服务器中所存储的用户即构成相应的潜在用户群。同样的,潜在用户也同样具有包括年龄、性别、职业、收入、学历、所在城市以及购物习惯等其中的一种或多种的特征信息。服务器可按照种子用户的特征标签向量的构建方式,构建潜在用户的特征标签向量,潜在用户的特征标签向量与种子用户的特征标签向量以及聚类中心的形式均相同,且三者中的参数所表示的含义也相同。
在一个实施例中,上述的步骤302~304、306以及308之间的执行顺序可不做限定,即对于聚类中心的计算、特征权值向量以及潜在用户的特征标签向量的获取的顺序不做限定。
步骤310,根据潜在用户的特征标签向量、特征权值向量以及聚类中心,计算潜在用户和每个类别的聚类中心的第一距离。
本实施例中,服务器可对潜在用户群中的潜在用户,计算其与每个聚类中心的距离。可将某一具体的潜在用户的特征标签向量中的每个参数,其与一个类别信息的聚类中心中的对应参数相减,得到差值,然后将该差值进行平方运算,将该平方值与该类别信息所对应的特征权值向量中对应的参数相乘,得到相应的乘积。再对每个参数的乘积进行求和,所得到的数值即为相应类别的聚类中心的第一距离。
具体的,可通过公式来计算第一距离。其中,dkj表示第j个潜在用户与第k类信息对应的聚类中心的第一距离,n表示特征标签向量、特征权值向量以及聚类中心的维度,wkj表示第k类信息对应的n维特征权值向量中的第j个参数,zij表示第i可潜在用户的n维特征标签向量中第j个参数,ykj表示第k类信息的n维聚类中心的第j个参数。通过上述的计算公式,分别可计算出每个潜在用户和每个类别的聚类中心的第一距离。
步骤312,从第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户。
本实施例中,第一距离的大小可反映出是否适合向该潜在用户发送对应类别信息的匹配程度。即若所计算出的距离越小,则说明该潜在用户与对应类别信息的聚类中心越接近,则与对应类别信息的匹配程度越高,从而也就越适合向该用户发送相应类别的信息。
继续以信息分类为男士服装信息、女士服装信息和儿童服装信息三类为例来说明,则可分别计算出每个用户的特征标签向量分别与男士服装信息的聚类中心的第一距离、与女士服装信息的聚类中心的第一距离、与儿童服装信息的聚类中心的第一距离。针对一个具体的潜在用户,若这三个第一距离中,与女士服装信息的聚类中心的第一距离的数值最小,则判断该用户在此三类的信息中,最适合向其推送女士服装信息。针对处于潜在用户群中的所有潜在用户,可对每一类的第一距离进行大小排名,从其中选取预设数量的在对应类型中的第一距离最小的潜在用户,作为用于推送与该类型相匹配的推送信息。
在一个实施例中,第二数量可为预先设置的数量,即预先设置了要获取的目标用户的数量。服务器可对所计算出所有第一距离进行排名,根据该排名选取出对应数量的最小的第一距离,将其对应的用户作为目标用户,从而可向该目标用户发送相应的推送信息。
在另一个实施例中,服务器中还可不设置第二数量,转而设置距离阈值,将小于距离阈值的第一距离对应的潜在用户设置为目标用户。统计所设置的目标用户的数量,该数量即作为第二数量。
本实施例所提供的用户选取方法,通过根据所获取的每个种子用户的特征向量以及预设的第一数量的信息类别,计算出每个类别的信息对应的聚类中心,然后根据潜在用户的特征标签向量、特征权值向量以及所计算出的聚类中心,计算潜在用户和每个类别的聚类中心的第一距离;再从所计算出的所有潜在用户的第一距离中选取距离最短的第二数量的潜在用户,作为可向该目标用户发送相应的推送信息的目标用户。由于该方法预先信息进行了分类,且计算出的第一距离可反映出对应潜在用户与相应类别信息的匹配程度,距离越小,则说明越适合向该用户发送相应类别的信息,从而使得所选取出的目标用户更加精准。
在一个实施例中,根据所有种子用户的特征标签向量计算预设的第一数量的信息类别中,每个类别的信息对应的聚类中心的步骤,包括:当种子用户的信息中包含类别标识时,根据类别标识确定对应种子用户的特征标签向量所归属的类别,形成第一数量的类别的聚类;计算每个聚类的中心点,将该中心点作为对应类别的信息的聚类中心。
本实施例中,服务器在接收到用户选取请求后,可检测种子用户的信息中是否包含类别标识,该类别标识用于标识对应种子用户所收藏或购买服务商的相关产品或者该产品的所属类别。
当种子用户的信息中包含类别标识时,可根据该类别标识获知对应种子用户所收藏或购买的服务商的相关产品或者该产品的所属类别,从而可确定与该产品或者产品的所属类别相匹配的推送信息的类别。然后将该种子用户的特征标签向量划分到所确定的类别的信息的聚类之中。服务器可对每个种子用户的特征标签向量的进行类别的划分,从而形成了第一数量的类别的聚类。
在形成了第一数量的类别的聚类之后,可根据每个聚类中所包含的特征标签向量,计算出相应的中心点,该中心点即为对应类别的信息的聚类中心。具体的,可对每个聚类中的特征标签向量进行算术平均,将所得到的平均值作为相应的聚类中心。
由于种子用户的信息中包含了类别标识,因而根据该类别标识可准确对相应的种子用户进行聚类,从而可提高所计算出的聚类中心的准确度。且由于第一距离与聚类中心相关,因而还可提高后续对第一距离的计算的准确度,进而提高了对目标用户选取的精准度。
在一个实施例中,如图5所示,根据所有种子用户的特征标签向量计算预设的第一数量的信息类别中,每个类别的信息对应的聚类中心的步骤,包括:
步骤502,当种子用户的信息中不包含类别标识时,从种子用户群中选取第一数量的特征标签向量,将所选取出的每个特征标签向量分别作为其中一个类别的信息的初始聚类中心,使得每个类别的信息均具有一个初始聚类中心。
当种子用户的信息中不包含类别标识时,服务器可从种子用户群中选取出与信息类别的数量等同的种子用户的特征标签向量,并分别将所选取的每个特征标签向量作为对应一种类别的信息的初始聚类中心,使得每个类别的信息均具有一个初始聚类中心。其中,服务器可采取预设的随机函数来选取第一数量的特征标签向量,并随机地将每个选取出的特征标签向量作为对应的一个初始聚类中心。
步骤504,计算种子用户群的每个特征标签向量与每个类别的信息的上一次聚类中心的第二距离,根据第二距离确定对应的特征标签向量所归属的类别,形成第一数量的类别的聚类。
在每个类别的信息均具有了聚类中心之后,则分别计算剩下的种子用户的特征标签向量与每个初始聚类中心的第二距离,根据第二距离确定与种子用户最近的一个初始聚类中心,然后将该种子用户的特征标签向量划分到该初始聚类中心所对应类别之中。服务器可对每个种子用户的特征标签向量的进行类别的划分,从而形成了第一数量的类别的聚类。
其中,第一次的聚类中心即为初始聚类中心,对于后续需再次执行步骤504的时候,每个类别的上一次的聚类中心即为在步骤506中所计算出的对应聚类的中心点。
步骤506,计算每个聚类的中心点。
本实施例中,在形成了第一数量的类别的聚类之后,可根据每个聚类中所包含的特征标签向量,计算出相应的中心点,该中心点即为对应类别的信息的聚类中心。具体的,可对每个聚类中的特征标签向量进行算术平均,将所得到的平均值作为相应的聚类中心。
步骤508,判断聚类的中心点是否已收敛。若是,则执行步骤510,否则,继续执行步骤504~508,直至判断结果为是。
具体的,判断所计算出的新的中心点与前一次的中心点之间的差值是否小于预设距离值。若是,则判断所计算出的中心点收敛,否则,判断不收敛。
本实施例中,服务器中对应预设有一个距离值,该预设距离值用于作为判断对应中心点是否收敛的标准。当其中的一个或多个聚类的中心点不收敛时,可继续执行步骤504,将每个类别的信息,进行重新聚类。该每个聚类的中心点即为对应类别的信息的上一次的聚类中心。若所计算出的新的中心点与前一次的差值处于小于该预设距离值,则说明所计算出的新的中心点收敛,可将其作为该类别的信息最终的聚类中心。
步骤510,将该中心点作为对应类别的信息的聚类中心。
当在判断出所有聚类的中心点已均经收敛时,则可将该中心点作为对应类别的信息最终的聚类中心。
本实施例中,通过判断所形成的聚类中心是否收敛,若否,则循对每个类别的信息进行聚类,根据所形成的新的聚类重新计算中心点,直至每个类别的中心点均收敛,则可将该中心点作为对应类别的信息最终的聚类中心,从而也可提高所计算出的聚类中心的准确度,进而提高了对目标用户选取的精准度。
在一个实施例中,如图6所示,获取每个类别的信息对应的特征权值向量的步骤,包括:
步骤602,将种子用户群中的特征标签向量作为正样本特征标签向量。
本实施例中,可将种子用户群中的所有种子用户或选取出部分种子用户的特征标签向量,将其作为正样本特征标签向量,作为正样本,形成正样本向量集。
步骤604,从潜在用户群中获取与种子用户数量相同的特征标签向量,作为负样本特征标签向量。
其中,可采用预设的随机函数选取中与正样本特征标签向量数量等同的负样本特征标签向量,作为负样本,形成负样本向量集。
在一个实施例中,步骤602和步骤604的执行顺序可不做限定。
步骤606,根据正样本特征标签向量和负样本特征标签向量,按照预设分类模型进行训练学习,生成特征权值向量。
本实施例中,该预设分类模型可为任意的二分类模型,具体的,可为逻辑回归分类模型。服务器可基于正样本向量集和负样本向量集进行二分类模型训练,进而可获得各聚类下的特征权值向量。即该特征权值向量是训练二分类模型之后得到的,是二分类模型训练之后获得的参数。
本实施例中,通过上述的预设模型可提高所获取的特征权值向量的准确度,从而也相应提高了对第一距离的计算的准确度,同样提高了对目标用户选取的精准度。
在一个实施例中,根据潜在用户的特征标签向量、特征权值向量以及聚类中心,计算潜在用户和每个类别的聚类中心的第一距离的步骤,包括:根据分类模型对潜在用户群中的特征标签向量进行筛选;计算筛选出的每个潜在用户和每个类别的聚类中心的第一距离。
本实施例中,分类模型与上述步骤606中的分类模型相同,可为任意的二分类模型。服务器可将潜在用户群中的潜在用户的特征标签向量输入到该分类模型中,并计算输出结果。若输出结果为1,则表示对应的潜在用户与推送信息具有一定的匹配度,为可投放推送信息的用户。若输出结果为0,则表示对应的潜在用户与推送信息不相符,可将其剔除,不作为投放推送信息的用户。其中,计算结果为1的潜在用户即为筛选出的潜在用户。服务器可仅对所筛选出的每个潜在用户的特征标签向量、特征权值向量以及聚类中心,计算对应潜在用户和每个类别的聚类中心的第一距离。
本实施例中,服务器可对所存储的海量的潜在用户在求取第一距离之前,进行筛选,以将剔除一部分与推送信息不匹配的潜在用户,使得无需再对该部分潜在用户进行第一距离的计算,从而可减少计算量,降低了对资源的占用,提高了对目标用户的选取效率。
在一个实施例中,从第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户的步骤,包括:对第一距离进行总的排名;从总的排名中选取排名靠前的对应数量的潜在用户,作为用于推送信息的目标用户。
本实施例中,所述总的排名为不考虑分类而进行的混合排名,通过进行总的排名,可使得所选取的目标用户为所有潜在用户中,与准备推送的信息的某一个或多个种类的匹配度均是最高的,从而提高了目标用户选取的精准度。
在一个实施例中,从第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户的步骤,包括:分别对每个类别对应的第一距离进行单独排名;从每个类别的排名中选取排名靠前的对应数量的潜在用户,作为目标用户。
本实施例中,服务器还可直接提取每个类别下的潜在用户对应的第一距离,针对每个类别进行单独排名,分别从每个类别的排名中选取排名靠前的对应数量的潜在用户,作为目标用户。
进一步的,服务器还可在计算出对应潜在用户和每个类别的聚类中心的第一距离后,可在该每个类别的聚类中心的第一距离中选取出最小第一距离,作为第三距离。并将该潜在用户设置一个与该最小第一距离对应的类别信息的类别标识。通过该类别标识,可获知对应潜在用户与那种类别的信息最匹配。
服务器可分别针对具有同一类别标识的所有潜在用户的第三距离进行排名,并从每种类别标识对应的潜在用户中选取出距离最小的对应数量的潜在用户,将其作为用于推送信息的目标用户。
其中,该对应数量既可根据不同类别的信息的需求进行配置。还可以根据针对每个类别信息对应设置一个距离阈值,并选取出对应类别中,小于该距离阈值的第三距离对应的潜在用户,将所选取出的潜在用户作为目标用户。所选取出的目标用户的数量即为第二数量。
本实施例中,通过针对每个类别对应的第一距离进行单独排名,并从每个类别的排名中选取排名靠前的对应数量的潜在用户,作为目标用户,使得所选取的目标用户的数量可按照待推送的信息的类型进行合理的配置。
在一个实施例中,在从第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户的步骤之后,还包括:向目标用户的终端发送与对应类别相匹配的推送信息。
本实施例中,服务器在选取出目标用户后,可对该目标用户设置相应的类别标识,并从准备推荐的信息中,选取与该类别标识相匹配的类别的信息,作为推送信息发送给目标用户。其中,服务器可采用短信或邮件等一种或多种推送方式向目标用户的终端发送与对应类别相匹配的推送信息。由于所选取的目标用户的精准度高,从而向目标用户发送对应的推送信息后,被目标用户所接受的概率也相对较高。
在一个实施例中,在从第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户的步骤之后,还包括:将目标用户的信息发送给客户终端,以使客户终端推送信息至目标用户的终端。
本实施例中,服务器可将所选取出的目标用户的信息发送给服务商的客户终端,目标用户的信息包括目标用户的联系电话、邮箱以及与服务器对应的应用的使用账号(比如即时通讯账号)等其中的一种或多种,还包括对应的类别标识,使得客户终端在接收到该目标用户的信息后,可根据该类别标识获知与对应目标用户相匹配的推荐信息,进而可自己将相匹配的推荐信息发送给目标用户。同样的,客户终端也可采用短信或邮件等一种或多种推送方式向目标用户的终端发送与对应类别相匹配的推送信息,由于所选取的目标用户的精准度高,从而向目标用户发送对应的推送信息后,被目标用户所接受的概率也相对较高。
在一个实施例中,在向目标用户的终端发送与对应类别相匹配的推送信息的步骤之后,还包括:获取目标用户的反馈信息;根据反馈信息更新每个类别的信息对应的聚类中心和特征权值向量。
本实施例中,目标用户的反馈信息包括对应目标用户对所推荐的信息是否感兴趣的信息。目标用户的终端在接收到服务商的推荐信息后,可向服务器发送对该推荐信息感兴趣或者不感兴趣的反馈信息,服务器可接收目标用户的终端所发送的反馈信息,根据该反馈信息可获知目标用户对该推荐信息是否感兴趣。
进一步的,服务器可检测所获取的目标用户的反馈信息的数量是否达到预设数量,当反馈信息的数量达到预设数量时,则执行根据反馈信息更新每个类别的信息对应的聚类中心和特征权值向量。
对于有反馈信息的目标用户,可获取对该目标用户所划分的聚类。若该反馈信息表示目标用户对推荐信息感兴趣,则将该目标用户归类到对应类别的种子用户群中,根据归类后的种子用户群中对应用户的特征标签向量来更新对应的种子中心。若该反馈信息表示目标用户对推荐信息不感兴趣,则可将该目标用户的特征标签向量划分到负样本向量集中,并根据新形成的种子用户群中的特征标签向量所构成的正样本向量集,按照预设分类模型进行训练学习,生成新的特征权值向量。从而实现了对聚类中心和特征权值向量的更新,使获得的聚类中心和特征权值向量更加准确,从而在后续再次选取目标用户时,可使得所选取的目标用户更加精准。
在一个实施例中,如图7所示,根据反馈信息更新每个类别的信息对应的聚类中心和特征权值向量的步骤,包括:
步骤702,根据反馈信息确定目标用户是否为种子用户。
本实施例中,当该反馈信息表示目标用户对推荐信息感兴趣时,则可将该目标用户作为种子用户,将其归入到种子用户群中;当反馈信息表示目标用户对推荐信息不感兴趣时,则不将该目标用户归入到种子用户群中。
步骤704,当目标用户为种子用户时,将目标用户的特征标签向量加入到对应类别的聚类中。
对于划分为种子用户的目标用户,可根据该目标用户的类别标识获取到对应的信息的类别,并将该目标用户的特征标签向量加入到对应类别的聚类中,该聚类为由服务商所提供的种子用户的特征标签向量所形成的聚类。
步骤706,更新聚类的中心点,将更新后的中心点作为对应类别信息的聚类中心。
具体的,可按照上述的步骤510的计算方法,计算出相应的中心点,将该中心点作为对应类别的信息的聚类中心。通过更新聚类中心,可使得所确定的聚类中心的准确度更高,从而使得根据该聚类中心所选取的目标用户更加精准。
在一个实施例中,如图8所示,根据反馈信息更新每个类别的信息对应的聚类中心和特征权值向量的步骤,包括:
步骤802,根据反馈信息对目标用户划分所属样本向量集。
本实施例中,服务器可分别筛选出反馈信息表示对推荐信息感兴趣以及不感兴趣的目标用户,将所筛选出的感兴趣的目标用户的特征标签向量作为正样本,增加到正样本向量集中,将所筛选出的不感兴趣的目标用户的特征标签向量作为负样本,增加到负样本向量集中。
检测正样本向量集和负样本向量集中的样本数量是否相同,若不相同,可对正样本向量集或负样本向量集中的样本进行增加或删减,以使得正样本数量与负样本数量相同。
具体的,当负样本向量集的样本数量大于正样本向量集中的样本数量时,可对从负样本向量集中删减出超过数量的样本,其中,可优先删减之前的潜在用户群中获取的负样本特征标签向量。当负样本向量集的样本数量小于正样本向量集中的样本数量时,则可从潜在用户群中继续选取一定数量的潜在用户的特征标签向量,作为负样本,增加到负样本向量集中,以保持正样本数量与负样本数量相同。
步骤804,根据划分后的样本向量集,按照预设分类模型进行训练学习,更新特征权值向量。
分类模型与上述步骤606中的分类模型相同,可为任意的二分类模型。服务器可基于新的正样本向量集和负样本向量集进行二分类模型训练,重新计算各聚类下的特征权值向量,将重新计算出的特征权值向量作为对应类别的信息的特征权值向量。
本实施例中,通过根据反馈信息重新对相应的目标用户进行正负样本向量集的划分,并根据划分后的样本向量集来重新计算特征权值向量,使得所计算出的特征权值向量更能反映出对应特征标签所占的比重,从而使得根据该特征权值向量所选取的目标用户更加精准。
在一个实施例中,如图9所示,提供了一种用户选取装置,该装置包括:
特征标签向量获取模块902,用于获取每个种子用户的特征标签向量。
聚类中心计算模块904,用于根据所有种子用户的特征标签向量计算预设的第一数量的信息类别中,每个类别的信息对应的聚类中心。
特征权值向量获取模块906,用于获取特征权值向量。
特征标签向量获取模块902还用于获取潜在用户群中的每个潜在用户的特征标签向量。
第一距离计算模块908,用于根据潜在用户的特征标签向量、特征权值向量以及聚类中心,计算潜在用户和每个类别的聚类中心的第一距离。
目标用户选取模块910,用于从第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户。
在一个实施例中,第一距离计算模块908还用于根据分类模型对潜在用户群中的特征标签向量进行筛选;计算筛选出的每个潜在用户和每个类别的聚类中心的第一距离。
在一个实施例中,目标用户选取模块910还用于分别对每个类别对应的第一距离进行单独排名;从每个类别的排名中选取排名靠前的对应数量的潜在用户,作为目标用户。
在一个实施例中,如图10所示,提供了另一种用户选取装置,该装置还包括:
信息推送模块912,用于向目标用户的终端发送与对应类别相匹配的推送信息。
在一个实施例中,如图11所示,提供了又一种用户选取装置,该装置还包括:
反馈信息获取模块914,用于获取目标用户的反馈信息。
聚类中心计算模块904还用于根据反馈信息更新每个类别的信息对应的聚类中心。
特征权值向量获取模块906还用于根据反馈信息更新每个类别的信息对应的特征权值向量。
在一个实施例中,如图12所示,聚类中心计算模块904还包括:
种子用户确定单元1202,用于根据反馈信息确定目标用户是否为种子用户;
聚类更新单元1204,用于当目标用户为种子用户时,将目标用户的特征标签向量加入到对应类别的聚类中;
聚类中心更新单元1206,用于更新聚类的中心点,将更新后的中心点作为对应类别信息的聚类中心。
在一个实施例中,如图13所示,特征权值向量获取模块906还包括:
样本向量集划分单元1302,用于根据反馈信息对目标用户划分所属样本向量集;
特征权值向量更新单元1304,用于根据划分后的样本向量集,按照预设模型进行训练学习,更新特征权值向量。
在一个实施例中,如图14所示,提供了再一种用户选取装置,该装置还包括:
目标用户推送模块916,用于将目标用户的信息发送给客户终端,以使客户终端推送信息至目标用户的终端。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (18)
1.一种用户选取方法,其特征在于,所述方法包括:
接收服务商的客户终端发送的用户选取请求,所述用户选取请求中包含服务商所需推送信息的具体分类、以及一定数量的种子用户的特征信息,并根据所述服务商提供的种子用户的特征信息构建对应的特征标签向量,所述种子用户为购买过或收藏过服务商的相关产品的用户;
根据所有种子用户的特征标签向量计算预设的第一数量的信息类别中,每个类别的信息对应的聚类中心;所述第一数量与所述服务商准备推荐的信息所包含的种类数量相匹配,所述第一数量为对所述推送信息所分的类别的数量;所述聚类中心用于表征每个类别的信息对应的种子用户所共有的特征信息;
获取所述每个类别的信息对应的特征权值向量;
获取潜在用户群中的每个潜在用户的特征标签向量;
根据所述潜在用户的特征标签向量、特征权值向量以及聚类中心,计算潜在用户和每个类别的聚类中心的第一距离;
从所述第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户。
2.根据权利要求1所述的方法,其特征在于,所述根据所述每个潜在用户的特征标签向量、特征权值向量以及聚类中心,计算潜在用户和每个类别的聚类中心的第一距离的步骤,包括:
根据分类模型对所述潜在用户群中的特征标签向量进行筛选;
计算筛选出的每个潜在用户和每个类别的聚类中心的第一距离。
3.根据权利要求1所述的方法,其特征在于,所述从所述第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户的步骤,包括:
分别对每个类别对应的第一距离进行单独排名;
从每个类别的排名中选取排名靠前的对应数量的潜在用户,作为所述目标用户。
4.根据权利要求1所述的方法,其特征在于,在所述从所述第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户的步骤之后,还包括:
向所述目标用户的终端发送与对应类别相匹配的推送信息。
5.根据权利要求4所述的方法,其特征在于,在所述向所述目标用户发送与对应类别相匹配的推送信息的步骤之后,还包括:
获取所述目标用户的反馈信息;
根据所述反馈信息更新每个类别的信息对应的聚类中心和特征权值向量。
6.根据权利要求5所述的方法,其特征在于,所述根据所述反馈信息更新每个类别的信息对应的聚类中心和特征权值向量的步骤,包括:
根据所述反馈信息确定所述目标用户是否为种子用户;
当所述目标用户为种子用户时,将所述目标用户的特征标签向量加入到对应类别的聚类中;
更新所述聚类的中心点,将更新后的中心点作为对应类别信息的聚类中心。
7.根据权利要求5所述的方法,其特征在于,所述根据所述反馈信息更新每个类别的信息对应的聚类中心和特征权值向量的步骤,包括:
根据所述反馈信息对所述目标用户划分所属样本向量集;
根据划分后的样本向量集,按照预设模型进行训练学习,更新特征权值向量。
8.根据权利要求1所述的方法,其特征在于,在所述从所述第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户的步骤之后,还包括:
将所述目标用户的信息发送给客户终端,以使所述客户终端推送信息至所述目标用户的终端。
9.一种用户选取装置,其特征在于,所述装置包括:
特征权值向量获取模块,用于接收服务商的客户终端发送的用户选取请求,所述用户选取请求中包含服务商所需推送信息的具体分类、以及一定数量的种子用户的特征信息,并根据所述服务商提供的种子用户的特征信息构建对应的特征标签向量,所述种子用户为购买过或收藏过服务商的相关产品的用户;
聚类中心计算模块,用于根据所有种子用户的特征标签向量计算预设的第一数量的信息类别中,每个类别的信息对应的聚类中心;所述第一数量与所述服务商准备推荐的信息所包含的种类数量相匹配,所述第一数量为对所述推送信息所分的类别的数量;所述聚类中心用于表征每个类别的信息对应的种子用户所共有的特征信息;
特征权值向量获取模块,用于获取所述每个类别的信息对应的特征权值向量;
所述特征标签向量获取模块还用于获取潜在用户群中的每个潜在用户的特征标签向量;
第一距离计算模块,用于根据所述潜在用户的特征标签向量、特征权值向量以及聚类中心,计算潜在用户和每个类别的聚类中心的第一距离;
目标用户选取模块,用于从所述第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户。
10.根据权利要求9所述的装置,其特征在于,
所述第一距离计算模块还用于根据分类模型对所述潜在用户群中的特征标签向量进行筛选;计算筛选出的每个潜在用户和每个类别的聚类中心的第一距离。
11.根据权利要求9所 述的装置,其特征在于,
所述目标用户选取模块还用于分别对每个类别对应的第一距离进行单独排名;从每个类别的排名中选取排名靠前的对应数量的潜在用户,作为所述目标用户。
12.根据权利要求9所述的装置,其特征在于,所述装置还包括:
信息推送模块,用于向所述目标用户的终端发送与对应类别相匹配的推送信息。
13.根据权利要求12所述的装置,其特征在于,所述装置还包括:
反馈信息获取模块,用于获取所述目标用户的反馈信息;
所述聚类中心计算模块还用于根据所述反馈信息更新每个类别的信息对应的聚类中心;
所述特征权值向量获取模块还用于根据所述反馈信息更新每个类别的信息对应的特征权值向量。
14.根据权利要求13所述的装置,其特征在于,所述聚类中心计算模块还包括:
种子用户确定单元,用于根据所述反馈信息确定所述目标用户是否为种子用户;
聚类更新单元,用于当所述目标用户为种子用户时,将所述目标用户的特征标签向量加入到对应类别的聚类中;
聚类中心更新单元,用于更新所述聚类的中心点,将更新后的中心点作为对应类别信息的聚类中心。
15.根据权利要求13所述的装置,其特征在于,所述特征权值向量获取模块还包括:
样本向量集划分单元,用于根据所述反馈信息对所述目标用户划分所属样本向量集;
特征权值向量更新单元,用于根据划分后的样本向量集,按照预设模型进行训练学习,更新特征权值向量。
16.根据权利要求9所述的装置,其特征在于,所述装置还包括:
目标用户推送模块,用于将所述目标用户的信息发送给客户终端,以使所述客户终端推送信息至所述目标用户的终端。
17.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。
18.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610797458.3A CN106355449B (zh) | 2016-08-31 | 2016-08-31 | 用户选取方法和装置 |
PCT/CN2017/099790 WO2018041168A1 (zh) | 2016-08-31 | 2017-08-31 | 信息推送方法、存储介质和服务器 |
US16/208,226 US11574139B2 (en) | 2016-08-31 | 2018-12-03 | Information pushing method, storage medium and server |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610797458.3A CN106355449B (zh) | 2016-08-31 | 2016-08-31 | 用户选取方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106355449A CN106355449A (zh) | 2017-01-25 |
CN106355449B true CN106355449B (zh) | 2021-09-07 |
Family
ID=57859421
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610797458.3A Active CN106355449B (zh) | 2016-08-31 | 2016-08-31 | 用户选取方法和装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11574139B2 (zh) |
CN (1) | CN106355449B (zh) |
WO (1) | WO2018041168A1 (zh) |
Families Citing this family (88)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106355449B (zh) | 2016-08-31 | 2021-09-07 | 腾讯科技(深圳)有限公司 | 用户选取方法和装置 |
CN108306811B (zh) * | 2017-02-06 | 2021-03-26 | 腾讯科技(深圳)有限公司 | 一种消息处理方法及装置 |
CN106886918A (zh) * | 2017-02-06 | 2017-06-23 | 中国联合网络通信集团有限公司 | 一种目标用户的确定方法、装置及系统 |
CN108427690B (zh) * | 2017-02-15 | 2022-09-13 | 腾讯科技(深圳)有限公司 | 信息投放方法及装置 |
CN106997629B (zh) * | 2017-02-17 | 2019-06-11 | 北京格灵深瞳信息技术有限公司 | 门禁控制方法、装置及系统 |
CN107247786A (zh) * | 2017-06-15 | 2017-10-13 | 北京小度信息科技有限公司 | 用于确定相似用户的方法、装置和服务器 |
CN107688984A (zh) * | 2017-07-27 | 2018-02-13 | 上海壹账通金融科技有限公司 | 产品信息推送方法、装置、存储介质和计算机设备 |
CN109819282B (zh) * | 2017-11-22 | 2021-04-23 | 腾讯科技(深圳)有限公司 | 一种视频用户类别识别方法、装置和介质 |
CN108108451A (zh) * | 2017-12-27 | 2018-06-01 | 合肥美的智能科技有限公司 | 群体的群体用户画像获取方法和装置 |
CN109977979B (zh) * | 2017-12-28 | 2021-12-07 | 中国移动通信集团广东有限公司 | 定位种子用户的方法、装置、电子设备和存储介质 |
CN108230029A (zh) * | 2017-12-29 | 2018-06-29 | 西南大学 | 客户交易行为分析方法 |
CN108737491B (zh) * | 2018-03-23 | 2020-09-01 | 腾讯科技(深圳)有限公司 | 信息推送方法和装置以及存储介质、电子装置 |
CN108763246B (zh) * | 2018-03-29 | 2022-04-22 | 科大讯飞股份有限公司 | 人员分组方法及装置、存储介质、电子设备 |
CN108777701B (zh) * | 2018-04-24 | 2022-01-25 | 微梦创科网络科技(中国)有限公司 | 一种确定信息受众的方法及装置 |
CN108694606B (zh) * | 2018-05-11 | 2022-07-26 | 南京邮电大学 | 一种基于关联规则的客户画像及服务推送方法 |
CN110267086B (zh) * | 2018-05-16 | 2022-02-25 | 腾讯数码(天津)有限公司 | 主播标签建立方法和装置、直播网络界面引擎接口和介质 |
WO2019218334A1 (en) * | 2018-05-18 | 2019-11-21 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for user analysis |
CN110675179A (zh) * | 2018-07-03 | 2020-01-10 | 百度在线网络技术(北京)有限公司 | 营销信息处理方法、装置、电子设备及可读存储介质 |
CN108932658B (zh) * | 2018-07-13 | 2021-07-06 | 京东数字科技控股有限公司 | 数据处理方法、装置和计算机可读存储介质 |
CN109118288B (zh) * | 2018-08-22 | 2023-06-20 | 中国平安人寿保险股份有限公司 | 基于大数据分析的目标用户获取方法及装置 |
CN109241427B (zh) * | 2018-09-04 | 2023-08-18 | 中国平安人寿保险股份有限公司 | 信息推送方法、装置、计算机设备和存储介质 |
CN109639561B (zh) * | 2018-10-25 | 2022-03-04 | 北京达佳互联信息技术有限公司 | 基于信息反馈的分享方法、装置、电子设备及存储介质 |
CN109784367A (zh) * | 2018-12-11 | 2019-05-21 | 东软集团股份有限公司 | 用户画像方法、装置、计算机可读存储介质及电子设备 |
CN109636482B (zh) * | 2018-12-21 | 2021-07-27 | 南京星云数字技术有限公司 | 基于相似度模型的数据处理方法及系统 |
CN109816043B (zh) * | 2019-02-02 | 2021-01-01 | 拉扎斯网络科技(上海)有限公司 | 用户识别模型的确定方法、装置、电子设备及存储介质 |
CN109903086B (zh) * | 2019-02-14 | 2020-12-18 | 北京奇艺世纪科技有限公司 | 一种相似人群扩展方法、装置及电子设备 |
CN110111192A (zh) * | 2019-02-19 | 2019-08-09 | 西北大学 | 多过滤器结合nsd指标的信贷客户特征选择方法和系统 |
CN110059221B (zh) * | 2019-03-11 | 2023-10-20 | 咪咕视讯科技有限公司 | 视频推荐方法、电子设备及计算机可读存储介质 |
CN109949160A (zh) * | 2019-03-27 | 2019-06-28 | 上海优扬新媒信息技术有限公司 | 一种区块链的分片方法及装置 |
CN110147821B (zh) * | 2019-04-15 | 2024-09-17 | 中国平安人寿保险股份有限公司 | 目标用户群体确定方法、装置、计算机设备及存储介质 |
CN110275986B (zh) * | 2019-04-23 | 2022-02-11 | 深圳市傲天科技股份有限公司 | 基于协同过滤的视频推荐方法、服务器及计算机存储介质 |
CN110097111A (zh) * | 2019-04-26 | 2019-08-06 | 深圳前海微众银行股份有限公司 | 一种确定目标用户的方法及装置 |
CN110069663B (zh) * | 2019-04-29 | 2021-06-04 | 厦门美图之家科技有限公司 | 视频推荐方法及装置 |
CN111861065A (zh) * | 2019-04-30 | 2020-10-30 | 北京嘀嘀无限科技发展有限公司 | 一种用户数据管理方法、装置、电子设备及存储介质 |
CN110245070B (zh) * | 2019-05-07 | 2024-05-31 | 平安科技(深圳)有限公司 | 测试用户筛选方法、装置、计算机设备及存储介质 |
CN110197402B (zh) * | 2019-06-05 | 2022-07-15 | 中国联合网络通信集团有限公司 | 基于用户群的用户标签分析方法、装置、设备和存储介质 |
CN110399430A (zh) * | 2019-06-14 | 2019-11-01 | 平安科技(深圳)有限公司 | 用户特征确定方法、装置、设备及计算机可读存储介质 |
CN110309878B (zh) * | 2019-06-28 | 2022-02-22 | 深圳市商汤科技有限公司 | 一种信息处理方法及装置、存储介质 |
CN110321834A (zh) * | 2019-06-28 | 2019-10-11 | 深圳市商汤科技有限公司 | 一种身份确定方法及装置、存储介质 |
CN110413852A (zh) * | 2019-07-19 | 2019-11-05 | 深圳市元征科技股份有限公司 | 一种信息推送方法、装置、设备及介质 |
CN110569428B (zh) * | 2019-08-08 | 2023-10-20 | 创新先进技术有限公司 | 一种推荐模型的构建方法、装置及设备 |
CN110517114A (zh) * | 2019-08-21 | 2019-11-29 | 广州云徙科技有限公司 | 一种基于社区发现算法的信息推送方法及系统 |
CN110740166B (zh) * | 2019-09-19 | 2022-06-17 | 平安科技(深圳)有限公司 | 基于距离的信息发送方法、装置、计算机设备和存储介质 |
CN110751219A (zh) * | 2019-10-23 | 2020-02-04 | 郑州阿帕斯科技有限公司 | 一种内容发送方法和装置 |
CN111046902B (zh) * | 2019-10-30 | 2024-02-02 | 平安科技(深圳)有限公司 | 基于聚类算法的分类方法、装置、计算机设备及存储介质 |
WO2021081914A1 (zh) * | 2019-10-31 | 2021-05-06 | 深圳市欢太科技有限公司 | 推送对象确定方法、装置、终端设备及存储介质 |
CN111010595B (zh) * | 2019-12-25 | 2021-08-24 | 广州欢聊网络科技有限公司 | 一种新节目推荐的方法及装置 |
CN111353825B (zh) * | 2020-03-10 | 2024-01-12 | 北京爱笔科技有限公司 | 一种消息传输方法及装置 |
CN111382283B (zh) * | 2020-03-12 | 2023-01-03 | 腾讯科技(深圳)有限公司 | 资源类别标签标注方法、装置、计算机设备和存储介质 |
CN111460293B (zh) * | 2020-03-30 | 2023-02-28 | 招商局金融科技有限公司 | 信息推送方法、装置及计算机可读存储介质 |
CN111464641B (zh) * | 2020-03-31 | 2022-11-01 | 深圳前海微众银行股份有限公司 | 消息推送优化方法、设备及可读存储介质 |
CN113743968A (zh) * | 2020-05-29 | 2021-12-03 | 北京沃东天骏信息技术有限公司 | 信息投放方法、装置及设备 |
CN113821703B (zh) * | 2020-06-18 | 2023-12-08 | 广州汽车集团股份有限公司 | 一种车联网用户画像生成方法及其系统 |
CN111698332A (zh) * | 2020-06-23 | 2020-09-22 | 深圳壹账通智能科技有限公司 | 业务对象的分配方法、装置、设备及存储介质 |
CN111813910B (zh) * | 2020-06-24 | 2024-05-31 | 平安科技(深圳)有限公司 | 客服问题的更新方法、系统、终端设备及计算机存储介质 |
CN112749331B (zh) * | 2020-06-28 | 2023-09-19 | 腾讯科技(深圳)有限公司 | 一种数据推荐方法、装置以及计算机可读存储介质 |
CN111738774A (zh) * | 2020-06-30 | 2020-10-02 | 中国平安财产保险股份有限公司 | 识别潜在目标用户的方法、装置、计算机设备和存储介质 |
CN113919856A (zh) * | 2020-07-09 | 2022-01-11 | 上海钧正网络科技有限公司 | 目标用户选择方法、系统、设备及存储介质 |
CN111882398A (zh) * | 2020-07-31 | 2020-11-03 | 深圳市华云中盛科技股份有限公司 | 智慧城市服务推荐方法、装置、计算机设备及存储介质 |
CN111973996B (zh) * | 2020-08-20 | 2024-03-12 | 腾讯科技(上海)有限公司 | 一种游戏资源投放方法和装置 |
CN112001760B (zh) * | 2020-08-28 | 2021-10-12 | 贝壳找房(北京)科技有限公司 | 潜在用户挖掘方法、装置、电子设备和存储介质 |
CN112381598B (zh) * | 2020-10-26 | 2023-12-05 | 泰康保险集团股份有限公司 | 产品服务信息推送方法及装置 |
CN113807905A (zh) * | 2020-11-05 | 2021-12-17 | 北京沃东天骏信息技术有限公司 | 物品的推荐方法及装置、计算机存储介质、电子设备 |
CN112270492A (zh) * | 2020-11-12 | 2021-01-26 | 北京百家科技集团有限公司 | 一种资源分配方法、装置、计算机设备和存储介质 |
CN112270008A (zh) * | 2020-11-16 | 2021-01-26 | 加和(北京)信息科技有限公司 | 一种精准计算群体特征的方法及系统 |
CN112561571A (zh) * | 2020-12-07 | 2021-03-26 | 深圳市思为软件技术有限公司 | 购房意向评估方法及相关设备 |
CN112434136B (zh) * | 2020-12-08 | 2024-04-23 | 深圳市欢太科技有限公司 | 性别分类方法、装置、电子设备以及计算机存储介质 |
CN112613917B (zh) * | 2020-12-30 | 2024-09-06 | 平安壹钱包电子商务有限公司 | 基于用户画像的信息推送方法、装置、设备及存储介质 |
CN113781085A (zh) * | 2021-01-20 | 2021-12-10 | 北京沃东天骏信息技术有限公司 | 信息生成方法、装置、电子设备和计算机可读介质 |
CN112835958A (zh) * | 2021-02-04 | 2021-05-25 | 中国工商银行股份有限公司 | 目标客户确定方法及装置 |
CN113793191B (zh) * | 2021-02-09 | 2024-05-24 | 京东科技控股股份有限公司 | 商品的匹配方法、装置及电子设备 |
CN113034229A (zh) * | 2021-03-19 | 2021-06-25 | 深圳装速配科技有限公司 | 一种数字化家居供应链电商品类管理推荐系统及方法 |
CN112989198B (zh) * | 2021-03-30 | 2022-06-07 | 北京三快在线科技有限公司 | 推送内容的确定方法、装置、设备及计算机可读存储介质 |
CN113033685A (zh) * | 2021-04-01 | 2021-06-25 | 安徽理工大学 | 一种航空旅客付费选座意愿画像及分析的方法 |
CN112967100B (zh) * | 2021-04-02 | 2024-03-15 | 杭州网易云音乐科技有限公司 | 相似人群扩展方法、装置、计算设备以及介质 |
CN113139381B (zh) * | 2021-04-29 | 2023-11-28 | 平安国际智慧城市科技股份有限公司 | 不均衡样本分类方法、装置、电子设备及存储介质 |
CN113255694B (zh) * | 2021-05-21 | 2022-11-11 | 北京百度网讯科技有限公司 | 训练图像特征提取模型和提取图像特征的方法、装置 |
CN113409081A (zh) * | 2021-06-16 | 2021-09-17 | 建信金融科技有限责任公司 | 一种信息处理方法和装置 |
CN113657971B (zh) * | 2021-08-31 | 2023-12-01 | 卓尔智联(武汉)研究院有限公司 | 物品推荐方法、装置及电子设备 |
CN113935429B (zh) * | 2021-10-27 | 2024-07-26 | 北京搜房科技发展有限公司 | 用户画像的构建方法及装置、存储介质及电子设备 |
CN114090401B (zh) * | 2021-11-01 | 2024-09-10 | 支付宝(杭州)信息技术有限公司 | 处理用户行为序列的方法及装置 |
CN114140162A (zh) * | 2021-12-03 | 2022-03-04 | 深圳乐信软件技术有限公司 | 广告投放方法、装置、电子设备及计算机可读存储介质 |
CN113902132B (zh) * | 2021-12-09 | 2022-05-24 | 北京达佳互联信息技术有限公司 | 负反馈行为预测模型训练方法、消息推送方法及设备 |
CN114422585A (zh) * | 2021-12-27 | 2022-04-29 | 航天信息股份有限公司 | 一种企业服务平台消息推送方法及系统 |
CN114596126A (zh) * | 2022-04-26 | 2022-06-07 | 土巴兔集团股份有限公司 | 一种广告推荐方法及装置 |
CN115130123A (zh) * | 2022-06-24 | 2022-09-30 | 苏州浪潮智能科技有限公司 | 基于多方隐私协作的k均值聚类的联邦学习方法、系统 |
CN115379269A (zh) * | 2022-08-17 | 2022-11-22 | 咪咕文化科技有限公司 | 虚拟形象直播互动方法、计算设备及存储介质 |
CN116401460B (zh) * | 2023-04-23 | 2024-04-05 | 中航信移动科技有限公司 | 一种提高信息推送准确性的方法、存储介质及电子设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101082972A (zh) * | 2007-05-30 | 2007-12-05 | 华为技术有限公司 | 预测用户对商品的兴趣的方法、装置和广告发布方法 |
CN101520878A (zh) * | 2009-04-03 | 2009-09-02 | 华为技术有限公司 | 向用户进行广告推送的方法、装置和系统 |
CN101535944A (zh) * | 2005-08-15 | 2009-09-16 | 谷歌公司 | 基于集的相似性的可扩展用户聚类 |
CN104111946A (zh) * | 2013-04-19 | 2014-10-22 | 腾讯科技(深圳)有限公司 | 基于用户兴趣的聚类方法和装置 |
CN105447730A (zh) * | 2015-12-25 | 2016-03-30 | 腾讯科技(深圳)有限公司 | 目标用户定向方法及装置 |
CN105681089A (zh) * | 2016-01-26 | 2016-06-15 | 上海晶赞科技发展有限公司 | 网络用户行为聚类方法、装置及终端 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6317722B1 (en) * | 1998-09-18 | 2001-11-13 | Amazon.Com, Inc. | Use of electronic shopping carts to generate personal recommendations |
US7043475B2 (en) * | 2002-12-19 | 2006-05-09 | Xerox Corporation | Systems and methods for clustering user sessions using multi-modal information including proximal cue information |
US8095521B2 (en) * | 2007-03-30 | 2012-01-10 | Amazon Technologies, Inc. | Recommendation system with cluster-based filtering of recommendations |
US7966225B2 (en) * | 2007-03-30 | 2011-06-21 | Amazon Technologies, Inc. | Method, system, and medium for cluster-based categorization and presentation of item recommendations |
CN103077220B (zh) * | 2012-12-29 | 2016-06-29 | 中国科学院深圳先进技术研究院 | 一种基于用户群关联度的个性化推荐方法及系统 |
US10509816B2 (en) * | 2014-05-16 | 2019-12-17 | Facebook, Inc. | Runtime expansion of targeting criteria based on user characteristics |
CN103996088A (zh) * | 2014-06-10 | 2014-08-20 | 苏州工业职业技术学院 | 基于多维特征组合逻辑回归的广告点击率预测方法 |
CN104063801B (zh) * | 2014-06-23 | 2016-05-25 | 有米科技股份有限公司 | 一种基于聚类的移动广告推荐方法 |
CN104408642B (zh) * | 2014-10-29 | 2017-09-12 | 云南大学 | 一种基于用户体验质量的广告制作方法 |
CN105868243A (zh) * | 2015-12-14 | 2016-08-17 | 乐视网信息技术(北京)股份有限公司 | 信息处理方法及装置 |
CN105787061B (zh) * | 2016-02-29 | 2019-09-20 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 信息推送方法 |
CN106355449B (zh) * | 2016-08-31 | 2021-09-07 | 腾讯科技(深圳)有限公司 | 用户选取方法和装置 |
-
2016
- 2016-08-31 CN CN201610797458.3A patent/CN106355449B/zh active Active
-
2017
- 2017-08-31 WO PCT/CN2017/099790 patent/WO2018041168A1/zh active Application Filing
-
2018
- 2018-12-03 US US16/208,226 patent/US11574139B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101535944A (zh) * | 2005-08-15 | 2009-09-16 | 谷歌公司 | 基于集的相似性的可扩展用户聚类 |
CN101082972A (zh) * | 2007-05-30 | 2007-12-05 | 华为技术有限公司 | 预测用户对商品的兴趣的方法、装置和广告发布方法 |
CN101520878A (zh) * | 2009-04-03 | 2009-09-02 | 华为技术有限公司 | 向用户进行广告推送的方法、装置和系统 |
CN104111946A (zh) * | 2013-04-19 | 2014-10-22 | 腾讯科技(深圳)有限公司 | 基于用户兴趣的聚类方法和装置 |
CN105447730A (zh) * | 2015-12-25 | 2016-03-30 | 腾讯科技(深圳)有限公司 | 目标用户定向方法及装置 |
CN105681089A (zh) * | 2016-01-26 | 2016-06-15 | 上海晶赞科技发展有限公司 | 网络用户行为聚类方法、装置及终端 |
Also Published As
Publication number | Publication date |
---|---|
CN106355449A (zh) | 2017-01-25 |
US20190102652A1 (en) | 2019-04-04 |
WO2018041168A1 (zh) | 2018-03-08 |
US11574139B2 (en) | 2023-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106355449B (zh) | 用户选取方法和装置 | |
CN109919316B (zh) | 获取网络表示学习向量的方法、装置和设备及存储介质 | |
CN111008332B (zh) | 内容项推荐方法、装置、服务器以及存储介质 | |
CN105427129B (zh) | 一种信息的投放方法及系统 | |
CN108960945A (zh) | 商品推荐方法和装置 | |
US10162868B1 (en) | Data mining system for assessing pairwise item similarity | |
CN110008397B (zh) | 一种推荐模型训练方法及装置 | |
CN103414930A (zh) | 识别感应用户的遥控系统及其方法 | |
KR20130062442A (ko) | 협업 필터링 추천 방식을 이용한 추천 방법 및 추천 시스템 | |
CN109903103A (zh) | 一种推荐物品的方法和装置 | |
CN110532429B (zh) | 一种基于聚类和关联规则的线上用户群体分类方法及装置 | |
CN110909222A (zh) | 基于聚类的用户画像建立方法、装置、介质及电子设备 | |
CN109241202B (zh) | 一种基于聚类的陌生人社交用户匹配方法和系统 | |
CN107203558A (zh) | 对象推荐方法和装置、推荐信息处理方法和装置 | |
CN112685635A (zh) | 基于分类标签的项目推荐方法、装置、服务器和存储介质 | |
CN109146606B (zh) | 一种品牌推荐方法、电子设备、存储介质及系统 | |
CN112783468A (zh) | 目标对象的排序方法和排序装置 | |
CN105096161B (zh) | 一种进行信息展示的方法和装置 | |
CN111831892A (zh) | 信息推荐方法、信息推荐装置、服务器及存储介质 | |
CN113704617A (zh) | 物品推荐方法、系统、电子设备及存储介质 | |
CN109656433A (zh) | 类目信息处理方法、装置、计算机设备和存储介质 | |
CN111177564A (zh) | 一种产品推荐方法及装置 | |
CN110413852A (zh) | 一种信息推送方法、装置、设备及介质 | |
CN115795156A (zh) | 物料召回和神经网络训练方法、装置、设备及存储介质 | |
CN110874432A (zh) | 排序方法、信息推荐方法、系统及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |