CN111222923A - 一种判断潜在客户的方法及装置、电子设备和存储介质 - Google Patents
一种判断潜在客户的方法及装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN111222923A CN111222923A CN202010034294.5A CN202010034294A CN111222923A CN 111222923 A CN111222923 A CN 111222923A CN 202010034294 A CN202010034294 A CN 202010034294A CN 111222923 A CN111222923 A CN 111222923A
- Authority
- CN
- China
- Prior art keywords
- feature
- machine learning
- learning model
- identifier
- interest
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000010801 machine learning Methods 0.000 claims abstract description 67
- 238000012549 training Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 238000007477 logistic regression Methods 0.000 description 4
- 238000012795 verification Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000011478 gradient descent method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
Abstract
本申请提供一种判断潜在客户的方法及装置、电子设备和计算机可读存储介质,该方法包括:获取设备标识集,所述设备标识集包括多个待分类人员的设备标识;从特征匹配库中查找每一设备标识对应的特征信息,并依据所述特征信息生成特征参数;将每一设备标识对应的所述特征参数输入至已训练的机器学习模型,通过所述机器学习模型计算所述特征参数,获得与每一设备标识对应的人员类别信息;其中,所述人员类别信息包括潜在客户和非潜在客户。在本申请实施例中,由于已训练的机器学习模型学习了到店客户的特征参数的内在规律,因此可以准确地基于待分类人员对应的特征参数判断出潜在客户。
Description
技术领域
本申请涉及计算机技术领域,特别涉及一种判断潜在客户的方法及装置、电子设备和计算机可读存储介质。
背景技术
互联网时代的消费情境相比以往更为丰富,用户可通过公众号、购物平台应用(比如:美团、淘宝、饿了么等)、社交网站等渠道向商家购买商品或服务。如今,许多线下商家也开始通过各类线上渠道向用户推送促销信息,从而提高店铺的客流量。
一般,商家会大面积地向渠道上所有人推送促销信息。然而,这种方式难以确定真正有意愿到店的潜在客户,商家很难预测到店的客户量,也就无法灵活调整促销策略。
发明内容
本申请实施例的目的在于提供一种判断潜在客户的方法,用以判断到店几率高的潜在客户,从而提高促销精确性和有效性。
本申请实施例提供一种判断潜在客户的方法,所述方法包括:
获取设备标识集,所述设备标识集包括多个待分类人员的设备标识;
从特征匹配库中查找每一设备标识对应的特征信息,并依据所述特征信息生成特征参数;
将每一设备标识对应的所述特征参数输入至已训练的机器学习模型,通过所述机器学习模型计算所述特征参数,获得与每一设备标识对应的人员类别信息;其中,所述人员类别信息包括潜在客户和非潜在客户。
在一实施例中,所述机器学习模型通过以下方式训练得到:
获取多个正样本标识和多个负样本标识;其中,所述正样本标识为历史到店人员的设备标识,所述负样本标识为未到店人员的设备标识;
从所述特征匹配库中查找每一设备标识对应的特征信息,并依据所述特征信息生成所述特征参数;
为所述正样本标识对应的特征参数添加正样本标签,为所述负样本标识对应的特征参数添加负样本标签;其中,所述正样本标签表征潜在客户,所述负样本标签表征非潜在客户;
将多个所述特征参数输入至所述机器学习模型,通过所述机器学习模型对每一特征参数计算出的人员类别信息与该特征参数的正样本标签或负样本标签之间的差异,对所述机器学习模型的模型参数进行训练;
重复所述训练过程,直至所述模型参数满足所述机器学习模型的分类精度要求。
在一实施例中,所述方法还包括:
重新获取多个所述正样本标识和多个所述负样本标识;
从所述特征匹配库中查找每一设备标识对应的特征信息,并依据所述特征信息生成所述特征参数;
为所述正样本标识对应的特征参数添加正样本标签,为所述负样本标识对应的特征参数添加负样本标签;
将多个所述特征参数输入至所述机器学习模型,通过所述机器学习模型对每一特征参数计算人员类别信息,并判断所述人员类别信息与该特征参数的正样本标签或负样本标签之间的差异是否满足所述分类精度要求;
如果不满足所述分类精度要求,训练所述模型参数,直至所述模型参数满足所述分类精度要求。
在一实施例中,所述特征参数包括动态系数、距职系数、距住系数、兴趣度系数和天气系数中一种或多种的组合;
所述查找每一设备标识对应的特征信息,并依据所述特征信息生成所述特征参数,包括:
从所述特征匹配库中查找每一设备标识对应的兴趣点访问日志;其中,所述兴趣点访问日志包括多条兴趣点访问记录,每一兴趣点访问记录包括时间戳、兴趣点和兴趣点类别;
筛选出时间戳位于指定时间段内的兴趣点访问记录,从所述兴趣点访问记录统计每一设备标识对应的所述兴趣点的数量和所述兴趣点类别的数量;
基于所述兴趣点的数量和所述兴趣点类别的数量,计算所述设备标识对应的动态系数。
在一实施例中,所述查找每一设备标识对应的特征信息,并依据所述特征信息生成所述特征参数,还包括:
从所述特征匹配库查找每一设备标识对应的工作地坐标和居住地坐标;
基于预设目的地的坐标和每一设备标识对应的工作地坐标,计算该设备标识对应的距职系数;
基于所述目的地的坐标和每一设备标识对应的居住地坐标,计算该设备标识对应的距住系数。
在一实施例中,所述查找每一设备标识对应的特征信息,并依据所述特征信息生成所述特征参数,还包括:
确定预设目的地所属的兴趣点类别,并检查每一设备标识的所述兴趣点访问记录中属于该兴趣点类别的兴趣点的数量,将该数量作为该设备标识对应的兴趣度系数。
在一实施例中,所述依据所述特征信息生成特征参数,包括:
依照预定义的数据格式对所述特征参数进行标准化处理。
本申请实施例还提供了一种判断潜在客户的装置,包括:
获取模块,用于获取设备标识集,所述设备标识集包括多个待分类人员的设备标识;
生成模块,用于从特征匹配库中查找每一设备标识对应的特征信息,并依据所述特征信息生成特征参数;
判断模块,用于将每一设备标识对应的所述特征参数输入至已训练的机器学习模型,通过所述机器学习模型计算所述特征参数,获得与每一设备标识对应的人员类别信息;其中,所述人员类别信息包括潜在客户和非潜在客户。
进一步的,本申请实施例还提供了一种电子设备,所述电子设备包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行上述判断潜在客户的方法。
进一步的,本申请实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序可由处理器执行以完成上述判断潜在客户的方法。
在本申请实施例的技术方案中,获取设备标识后,从特征匹配库中查找每一设备标识对应的特征信息,并依据特征信息生成特征参数,然后通过已训练的机器学习模型计算特征参数,从而获得与每一设备标识对应的人员类别信息;由于已训练的机器学习模型学习了到店客户的特征参数的内在规律,因此可以准确地基于待分类人员对应的特征参数判断出潜在客户。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍。
图1为本申请一示例性实施例示出判断潜在客户的方法的应用场景示意图;
图2为本申请一示例性实施例的电子设备的结构示意图;
图3为本申请实施例示出的一种判断潜在客户的方法的流程示意图;
图4为本申请实施例示出的一种机器学习模型的训练示意图;
图5为本申请实施例示出的一种判断潜在客户的装置的框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
图1为本申请一示例性实施例示出判断潜在客户的方法的应用场景示意图。如图1所示,该应用场景包括服务端30和客户端20,服务端30可以是服务器、服务器集群或者云计算中心,服务端30可依据客户端20发送的人员判断指令提供相应的潜在客户判断服务。客户端20可以是计算机、平板电脑、智能手机等智能设备。
如图2所示,本实施例提供一种电子设备1,包括:至少一个处理器11和存储器12,图2中以一个处理器11为例。处理器11、存储器12和显示载体13通过总线10连接,存储器12存储有可被处理器11执行的指令,指令被处理器11执行,以使电子设备1可执行下述的实施例中方法的全部或部分流程。在一实施例中,电子设备1可以是上述服务端30。
存储器12可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read Only Memory,简称EPROM),可编程只读存储器(Programmable Red-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。
本申请还提供了一种计算机可读存储介质,存储介质存储有计算机程序,计算机程序可由处理器11执行以完成本申请提供的判断潜在客户的方法。
图3是本申请实施例提供的判断潜在客户的方法的流程示意图,如图3所示,该方法可以包括以下步骤301-步骤303。
步骤301:获取设备标识集,所述设备标识集包括多个待分类人员的设备标识。
在一实施例中,服务端可以接收客户端发送的人员判断指令,从该人员判断指令中获取设备标识集。设备标识集中的设备标识(device ID)是注册指定的平台应用或社交网站的用户的设备标识,可以包括IMEI(International Mobile Equipment Identity,国际移动设备识别码)和MEID/ESN(Mobile Equipment Identifier/Electronic SerialNumber,移动设备识别码/电子序列号)。比如:如果商家想通过美团APP(Application,手机软件)向美团的注册用户推送促销信息,可以将待推送的多个注册用户的设备标识交由本方案中执行判断潜在客户的服务端。
步骤302:从特征匹配库中查找每一设备标识对应的特征信息,并依据所述特征信息生成特征参数。
这里的特征匹配库可以是一个或多个数据源,基于具体的实现策略,特征匹配库中可以包括单一或复杂的特征信息。
在一实施例中,上述特征参数可以包括动态系数、距职系数、距住系数、兴趣度系数和天气系数中一种或多种的组合。如果要引入更全面的特征信息以判断一个人是否为潜在客户,还可以从此人的其它特征信息(比如:收入信息、受教育水平)中提取特征参数。
在一实施例中,服务端可以从特征匹配库中查找每一设备标识对应的兴趣点(POI,Point of Interest)访问日志。其中,兴趣点访问日志包括多条兴趣点访问记录,每一兴趣点访问记录包括时间戳、兴趣点和兴趣点类别。兴趣点类别通常包括多级类别,大类别包括多个小类别。如下表1所示,为包含多条兴趣点访问记录的兴趣点访问日志。
表1
本实施例中的兴趣点类别指的是最小级的类别,在表1中为POI小类。
为更准确地依据人员短期活动规律判断其是否为潜在客户,可以筛选出时间戳位于指定时间段内的兴趣点访问记录。比如:商家在七月预备推送促销信息,则可以筛选出时间戳位于六月的兴趣点访问记录,以判断潜在客户。
服务端可以从上述兴趣点访问记录统计每一设备标识对应的兴趣点的数量和兴趣点类别的数量,然后基于该兴趣点的数量和兴趣点类别的数量,计算该设备标识对应的动态系数。在一实施例中,可以通过如下公式(1)来计算动态系数:
其中,F为动态系数,A为兴趣点的数量,B为兴趣点类别的数量。
动态系数可以表示一个人的活动意愿,动态系数越高,说明活动意愿越强,反之,说明活动意愿越弱。
在一实施例中,服务端可以从特征匹配库中查找每一设备标识对应的工作地坐标和居住地坐标。
服务端可以基于预设目的地的坐标和每一设备标识对应的工作地坐标,计算该设备标识对应的距职系数,该距职系数表示工作地与目的地的距离。这里,预设目的地为商家的线下店铺。
服务端可以基于上述目的地的坐标和每一设备标识对应的居住地坐标,计算该设备标识对应的距住系数,该距住系数标识居住地与目的地的距离。
在一实施例中,服务端可以确定预设目的地所述的兴趣点类别,并检查每一设备标识的所述兴趣点访问记录中属于该兴趣点类别的兴趣点数量,将该数量作为该设备标识对应的兴趣度系数。兴趣点系数可表征人员对与目的地的同类地点访问兴趣。
比如:目的地为“学院路的麦颂KTV”,兴趣度类别为“KTV”,可以检查每一设备标识的兴趣度访问记录中属于“KTV”的兴趣点数量,从而确定该设备标识对应的兴趣点系数。
在一实施例中,服务端可以基于预设目的地的坐标,从提供天气预报服务的第三方平台(比如:墨迹天气)获取对应的天气系数。天气系数用以评估目的地的天气状况。
在一实施例中,为避免以多个特征数据库的特征信息生成的特征参数的数据格式不同,以及,为便于后续计算,可以依照预定义的数据格式对上述特征参数进行标准化处理。示例性的,如果特征参数为上述五种系数的组合,可以保存为“设备标识(动态系数、距职系数、距住系数、兴趣度系数和天气系数)”。
在生成对应于每一设备标识的特征参数之后,可以将利用已训练的机器学习模型对上述特征参数进行计算。
在此之前,还需要训练机器学习模型。可以通过如下方式训练机器学习模型:
获取多个正样本标识和多个负样本标识。其中,正样本标识为历史到店人员的设备标识,负样本标识为未到店人员的设备标识。商家可以根据客户到店消费的记录中获取正样本标识。
服务端可以从上述特征匹配库中查找每一设备标识对应的特征信息,并依据特征信息生成特征参数,进而为正样本标识对应的特征参数添加正样本标签,为负样本标识对应的特征参数添加负样本标签。其中,正样本标签表征潜在客户,负样本标签表征非潜在客户。
服务端将多个上述特征参数输入至机器学习模型,通过机器学习模型对每一特征参数计算出的人员类别信息与该特征参数的正样本标签或负样本标签之间的差异,对机器学习模型的模型参数进行训练。
重复训练过程,直至模型参数满足机器学习模型的分类精度要求。
在一实施例中,机器学习模型可以是逻辑回归模型,此时机器学习模型通过逻辑回归算法计算特征参数,而模型参数为逻辑回归算法的参数。
在这种情况下,正样本标签可以是1,负样本标签可以是0。机器学习模型对特征参数计算出的人员类别信息实际上是一个介于0和1之间的数字。在针对每一条特征参数进行计算后,确定计算结果与样本标签的差异。依据预先构建的损失函数评估该差异,以梯度下降法多次迭代,从而获得能使损失函数的值趋于最小时的模型参数。在这种情况下,模型参数满足机器学习模型的分类精度要求。
在一实施例中,为避免机器学习模型过拟合,在训练机器学习模型后,可以通过新的样本验证上述机器学习模型。
服务端可以重新获取多个正样本标识和多个负样本标识。重新获取的正样本标识和负样本标识与训练阶段所用到的设备标识不同。
服务端从上述特征匹配库中查找每一设备标识对应的特征信息,并依据特征信息生成特征参数,进而为正样本标识对应的特征参数添加正样本标签,为负样本标识对应的特征参数添加负样本标签。
服务端将多个上述特征参数输入至机器学习模型,通过机器学习模型对每一特征参数计算出的人员类别信息,并判断该人员类别信息与该特征参数的正样本标签或负样本标签之间的差异是否满足分类精度要求。
一方面,如果机器学习模型对新的特征参数的计算结果满足分类精度要求,说明机器学习模型没有过拟合,可以利用该机器学习模型判断潜在客户。
另一方面,如果机器学习模型对新的特征参数的计算结果不满足分类精度要求,可以继续训练模型参数,直至模型参数满足分类精度要求。
服务端可以依据上述损失函数评估计算结果和样本标签的差异,根据梯度下降法多次迭代,从而获得能使损失函数的值趋于最小时的模型参数。
参见图4,为本申请实施例示出的一种机器学习模型的训练示意图。如图4所示,服务端首先获取正样本标识和负样本标识,并针对上述正样本标识和上述负样本标识分别进行特征提取,从特征匹配库中获取每一设备标识对应的特征信息。
服务端对上述特征信息进行特征转化,从而生成对应于每一设备标识的特征参数。在一实施例中,上述特征参数包括动态系数、距职系数、距住系数、兴趣度系数和天气系数。
服务端可以对上述特征参数进行标准化处理,使所有特征参数转化为标准存储格式,并为正样本标识对应的特征参数添加正样本标签,为负样本标识对应的特征参数添加负样本标签。
基于已添加样本标签的特征参数,生成模型训练集和模型验证集。其中,模型训练集和模型验证集中均包括多个添加正样本标签的特征参数和多个添加负样本标签的特征参数。
服务端通过模型训练集中的特征参数对机器学习模型进行训练,然后通过模型验证集中的特征参数对已训练的机器学习模型进行验证,从而获得可以判断潜在客户的机器学习模型。
步骤303:将每一设备标识对应的所述特征参数输入至已训练的机器学习模型,通过所述机器学习模型计算所述特征参数,获得与每一设备标识对应的人员类别信息;其中,所述人员类别信息包括潜在客户和非潜在客户。
服务端将待判断的设备标识对应的特征参数输入至上述机器学习模型,通过机器学习模型计算特征参数,从而获得与每一设备标识对应的人员类别信息。
在一实施例中,上述机器学习模型可以是逻辑回归模型,机器学习模型计算出的人员类别信息为介于0到1之间的数字。如果该数字小于判定边界0.5,说明特征参数对应的人员为非潜在客户;如果该数字大于判定边界0.5,说明特征参数对应的人员为潜在客户。
在本申请实施例的技术方案中,通过机器学习模型学习历史到店人员的特征参数中的内在规律,根据待分类人员的设备标识获取对应的特征信息后生成特征参数,从而可以针对待分类人员对应的特征参数判断出潜在客户,在此基础上对潜在客户推送促销信息,有助于提高促销的精确性和有效性。
图5是本发明一实施例的一种判断潜在客户的装置的框图。如图5所示,该装置可以包括:获取模块510、生成模块520和判断模块530。
获取模块510,用于获取设备标识集,所述设备标识集包括多个待分类人员的设备标识。
生成模块520,用于从特征匹配库中查找每一设备标识对应的特征信息,并依据所述特征信息生成特征参数。
判断模块530,用于将每一设备标识对应的所述特征参数输入至已训练的机器学习模型,通过所述机器学习模型计算所述特征参数,获得与每一设备标识对应的人员类别信息;其中,所述人员类别信息包括潜在客户和非潜在客户。
在一实施例中,上述装置还可以包括训练模块(图中未示出),用于:
获取多个正样本标识和多个负样本标识;其中,所述正样本标识为历史到店人员的设备标识,所述负样本标识为未到店人员的设备标识;
从所述特征匹配库中查找每一设备标识对应的特征信息,并依据所述特征信息生成所述特征参数;
为所述正样本标识对应的特征参数添加正样本标签,为所述负样本标识对应的特征参数添加负样本标签;其中,所述正样本标签表征潜在客户,所述负样本标签表征非潜在客户;
将多个所述特征参数输入至所述机器学习模型,通过所述机器学习模型对每一特征参数计算出的人员类别信息与该特征参数的正样本标签或负样本标签之间的差异,对所述机器学习模型的模型参数进行训练;
重复所述训练过程,直至所述模型参数满足所述机器学习模型的分类精度要求。
在一实施例中,上述训练模块(图中未示出),进一步用于:
重新获取多个所述正样本标识和多个所述负样本标识;
从所述特征匹配库中查找每一设备标识对应的特征信息,并依据所述特征信息生成所述特征参数;
为所述正样本标识对应的特征参数添加正样本标签,为所述负样本标识对应的特征参数添加负样本标签;
将多个所述特征参数输入至所述机器学习模型,通过所述机器学习模型对每一特征参数计算人员类别信息,并判断所述人员类别信息与该特征参数的正样本标签或负样本标签之间的差异是否满足所述分类精度要求;
如果不满足所述分类精度要求,训练所述模型参数,直至所述模型参数满足所述分类精度要求。
在一实施例中,上述特征参数包括动态系数、距职系数、距住系数、兴趣度系数和天气系数中一种或多种的组合;
上述生成模块520,进一步用于:
从所述特征匹配库中查找每一设备标识对应的兴趣点访问日志;其中,所述兴趣点访问日志包括多条兴趣点访问记录,每一兴趣点访问记录包括时间戳、兴趣点和兴趣点类别;
筛选出时间戳位于指定时间段内的兴趣点访问记录,从所述兴趣点访问记录统计每一设备标识对应的所述兴趣点的数量和所述兴趣点类别的数量;
基于所述兴趣点的数量和所述兴趣点类别的数量,计算所述设备标识对应的动态系数。
上述生成模块520,进一步用于:
从所述特征匹配库查找每一设备标识对应的工作地坐标和居住地坐标;
基于预设目的地的坐标和每一设备标识对应的工作地坐标,计算该设备标识对应的距职系数;
基于所述目的地的坐标和每一设备标识对应的居住地坐标,计算该设备标识对应的距住系数。
上述生成模块520,进一步用于:
确定预设目的地所属的兴趣点类别,并检查每一设备标识的所述兴趣点访问记录中属于该兴趣点类别的兴趣点的数量,将该数量作为该设备标识对应的兴趣度系数。
上述生成模块520,进一步用于:
依照预定义的数据格式对所述特征参数进行标准化处理。
上述装置中各个模块的功能和作用的实现过程具体详见上述判断潜在客户的方法中对应步骤的实现过程,在此不再赘述。
在本申请所提供的几个实施例中,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
Claims (10)
1.一种判断潜在客户的方法,其特征在于,包括:
获取设备标识集,所述设备标识集包括多个待分类人员的设备标识;
从特征匹配库中查找每一设备标识对应的特征信息,并依据所述特征信息生成特征参数;
将每一设备标识对应的所述特征参数输入至已训练的机器学习模型,通过所述机器学习模型计算所述特征参数,获得与每一设备标识对应的人员类别信息;其中,所述人员类别信息包括潜在客户和非潜在客户。
2.根据权利要求1所述的方法,其特征在于,所述机器学习模型通过以下方式训练得到:
获取多个正样本标识和多个负样本标识;其中,所述正样本标识为历史到店人员的设备标识,所述负样本标识为未到店人员的设备标识;
从所述特征匹配库中查找每一设备标识对应的特征信息,并依据所述特征信息生成所述特征参数;
为所述正样本标识对应的特征参数添加正样本标签,为所述负样本标识对应的特征参数添加负样本标签;其中,所述正样本标签表征潜在客户,所述负样本标签表征非潜在客户;
将多个所述特征参数输入至所述机器学习模型,通过所述机器学习模型对每一特征参数计算出的人员类别信息与该特征参数的正样本标签或负样本标签之间的差异,对所述机器学习模型的模型参数进行训练;
重复训练过程,直至所述模型参数满足所述机器学习模型的分类精度要求。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
重新获取多个所述正样本标识和多个所述负样本标识;
从所述特征匹配库中查找每一设备标识对应的特征信息,并依据所述特征信息生成所述特征参数;
为所述正样本标识对应的特征参数添加正样本标签,为所述负样本标识对应的特征参数添加负样本标签;
将多个所述特征参数输入至所述机器学习模型,通过所述机器学习模型对每一特征参数计算人员类别信息,并判断所述人员类别信息与该特征参数的正样本标签或负样本标签之间的差异是否满足所述分类精度要求;
如果不满足所述分类精度要求,训练所述模型参数,直至所述模型参数满足所述分类精度要求。
4.根据权利要求1-3任一所述的方法,其特征在于,所述特征参数包括动态系数、距职系数、距住系数、兴趣度系数和天气系数中一种或多种的组合;
所述查找每一设备标识对应的特征信息,并依据所述特征信息生成所述特征参数,包括:
从所述特征匹配库中查找每一设备标识对应的兴趣点访问日志;其中,所述兴趣点访问日志包括多条兴趣点访问记录,每一兴趣点访问记录包括时间戳、兴趣点和兴趣点类别;
筛选出时间戳位于指定时间段内的兴趣点访问记录,从所述兴趣点访问记录统计每一设备标识对应的所述兴趣点的数量和所述兴趣点类别的数量;
基于所述兴趣点的数量和所述兴趣点类别的数量,计算所述设备标识对应的动态系数。
5.根据权利要求4所述的方法,其特征在于,所述查找每一设备标识对应的特征信息,并依据所述特征信息生成所述特征参数,还包括:
从所述特征匹配库查找每一设备标识对应的工作地坐标和居住地坐标;
基于预设目的地的坐标和每一设备标识对应的工作地坐标,计算该设备标识对应的距职系数;
基于所述目的地的坐标和每一设备标识对应的居住地坐标,计算该设备标识对应的距住系数。
6.根据权利要求4所述的方法,其特征在于,所述查找每一设备标识对应的特征信息,并依据所述特征信息生成所述特征参数,还包括:
确定预设目的地所属的兴趣点类别,并检查每一设备标识的所述兴趣点访问记录中属于该兴趣点类别的兴趣点的数量,将该数量作为该设备标识对应的兴趣度系数。
7.根据权利要求1-3任一所述的方法,其特征在于,所述依据所述特征信息生成特征参数,包括:
依照预定义的数据格式对所述特征参数进行标准化处理。
8.一种判断潜在客户的装置,其特征在于,包括:
获取模块,用于获取设备标识集,所述设备标识集包括多个待分类人员的设备标识;
生成模块,用于从特征匹配库中查找每一设备标识对应的特征信息,并依据所述特征信息生成特征参数;
判断模块,用于将每一设备标识对应的所述特征参数输入至已训练的机器学习模型,通过所述机器学习模型计算所述特征参数,获得与每一设备标识对应的人员类别信息;其中,所述人员类别信息包括潜在客户和非潜在客户。
9.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行权利要求1-7任意一项所述的判断潜在客户的方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序可由处理器执行以完成权利要求1-7任意一项所述的判断潜在客户的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010034294.5A CN111222923B (zh) | 2020-01-13 | 2020-01-13 | 一种判断潜在客户的方法及装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010034294.5A CN111222923B (zh) | 2020-01-13 | 2020-01-13 | 一种判断潜在客户的方法及装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111222923A true CN111222923A (zh) | 2020-06-02 |
CN111222923B CN111222923B (zh) | 2023-12-15 |
Family
ID=70808391
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010034294.5A Active CN111222923B (zh) | 2020-01-13 | 2020-01-13 | 一种判断潜在客户的方法及装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111222923B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112291713A (zh) * | 2020-12-25 | 2021-01-29 | 浙江口碑网络技术有限公司 | 一种目标潜在用户数据的获得方法 |
CN112835958A (zh) * | 2021-02-04 | 2021-05-25 | 中国工商银行股份有限公司 | 目标客户确定方法及装置 |
Citations (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090222313A1 (en) * | 2006-02-22 | 2009-09-03 | Kannan Pallipuram V | Apparatus and method for predicting customer behavior |
US20120259919A1 (en) * | 2011-04-07 | 2012-10-11 | Rong Yan | Using Polling Results as Discrete Metrics for Content Quality Prediction Model |
CN105208113A (zh) * | 2015-08-31 | 2015-12-30 | 北京百度网讯科技有限公司 | 信息推送的方法和装置 |
CN105681908A (zh) * | 2012-09-17 | 2016-06-15 | 中国传媒大学 | 基于个体收视行为的广播电视系统及其个性节目推荐方法 |
US20160253688A1 (en) * | 2015-02-24 | 2016-09-01 | Aaron David NIELSEN | System and method of analyzing social media to predict the churn propensity of an individual or community of customers |
US20160267498A1 (en) * | 2015-03-10 | 2016-09-15 | Wipro Limited | Systems and methods for identifying new users using trend analysis |
CN106127525A (zh) * | 2016-06-27 | 2016-11-16 | 浙江大学 | 一种基于分类算法的电视购物商品推荐方法 |
US20170053208A1 (en) * | 2015-08-17 | 2017-02-23 | Adobe Systems Incorporated | Behavioral Prediction for Targeted End Users |
GB201701126D0 (en) * | 2017-01-23 | 2017-03-08 | Adbrain Ltd | Data processing system and method of associating internet devices based upon device usage |
US20170270416A1 (en) * | 2016-03-16 | 2017-09-21 | 24/7 Customer, Inc. | Method and apparatus for building prediction models from customer web logs |
CN107220852A (zh) * | 2017-05-26 | 2017-09-29 | 北京小度信息科技有限公司 | 用于确定目标推荐用户的方法、装置和服务器 |
CN107464141A (zh) * | 2017-08-07 | 2017-12-12 | 北京京东尚科信息技术有限公司 | 用于信息推广的方法、装置、电子设备及计算机可读介质 |
CN107481052A (zh) * | 2017-08-14 | 2017-12-15 | 福建米客互联网科技有限公司 | 一种广告信息推送方法及终端 |
US9947024B1 (en) * | 2012-10-04 | 2018-04-17 | Groupon, Inc. | Method, apparatus, and computer program product for classifying user search data |
CN107944913A (zh) * | 2017-11-21 | 2018-04-20 | 重庆邮电大学 | 基于大数据用户行为分析的高潜在用户购买意向预测方法 |
CN108205766A (zh) * | 2016-12-19 | 2018-06-26 | 阿里巴巴集团控股有限公司 | 信息推送方法、装置及系统 |
CN109325806A (zh) * | 2018-09-20 | 2019-02-12 | 北京小度信息科技有限公司 | 一种用户信息的处理方法及装置 |
CN109784654A (zh) * | 2018-12-17 | 2019-05-21 | 平安国际融资租赁有限公司 | 任务生成方法、装置、计算机设备和存储介质 |
CN110008973A (zh) * | 2018-11-23 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 一种模型训练方法、基于模型确定目标用户的方法及装置 |
US20190236645A1 (en) * | 2018-02-01 | 2019-08-01 | Aingines, Inc. | System and a method for identifying prospects with a buying intent and connecting them with relevant businesses |
CN110087104A (zh) * | 2019-04-29 | 2019-08-02 | 秒针信息技术有限公司 | 信息推送的装置、方法、电子设备和计算机可读存储介质 |
CN110197386A (zh) * | 2018-04-12 | 2019-09-03 | 腾讯科技(深圳)有限公司 | 媒体资源推送方法和装置、存储介质及电子装置 |
JP2019191714A (ja) * | 2018-04-19 | 2019-10-31 | Kddi株式会社 | Urlのアクセス履歴を用いて予測対象行動に至るであろう潜在対象ユーザを推定するプログラム、装置及び方法 |
CN110490632A (zh) * | 2019-07-01 | 2019-11-22 | 广州阿凡提电子科技有限公司 | 一种潜在客户识别方法、电子设备及存储介质 |
CN110555717A (zh) * | 2019-07-29 | 2019-12-10 | 华南理工大学 | 基于用户行为特征挖掘用户潜在购买商品和品类的方法 |
-
2020
- 2020-01-13 CN CN202010034294.5A patent/CN111222923B/zh active Active
Patent Citations (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090222313A1 (en) * | 2006-02-22 | 2009-09-03 | Kannan Pallipuram V | Apparatus and method for predicting customer behavior |
US20120259919A1 (en) * | 2011-04-07 | 2012-10-11 | Rong Yan | Using Polling Results as Discrete Metrics for Content Quality Prediction Model |
CN105681908A (zh) * | 2012-09-17 | 2016-06-15 | 中国传媒大学 | 基于个体收视行为的广播电视系统及其个性节目推荐方法 |
US9947024B1 (en) * | 2012-10-04 | 2018-04-17 | Groupon, Inc. | Method, apparatus, and computer program product for classifying user search data |
US20160253688A1 (en) * | 2015-02-24 | 2016-09-01 | Aaron David NIELSEN | System and method of analyzing social media to predict the churn propensity of an individual or community of customers |
US20160267498A1 (en) * | 2015-03-10 | 2016-09-15 | Wipro Limited | Systems and methods for identifying new users using trend analysis |
US20170053208A1 (en) * | 2015-08-17 | 2017-02-23 | Adobe Systems Incorporated | Behavioral Prediction for Targeted End Users |
CN105208113A (zh) * | 2015-08-31 | 2015-12-30 | 北京百度网讯科技有限公司 | 信息推送的方法和装置 |
US20170270416A1 (en) * | 2016-03-16 | 2017-09-21 | 24/7 Customer, Inc. | Method and apparatus for building prediction models from customer web logs |
CN106127525A (zh) * | 2016-06-27 | 2016-11-16 | 浙江大学 | 一种基于分类算法的电视购物商品推荐方法 |
CN108205766A (zh) * | 2016-12-19 | 2018-06-26 | 阿里巴巴集团控股有限公司 | 信息推送方法、装置及系统 |
GB201701126D0 (en) * | 2017-01-23 | 2017-03-08 | Adbrain Ltd | Data processing system and method of associating internet devices based upon device usage |
CN107220852A (zh) * | 2017-05-26 | 2017-09-29 | 北京小度信息科技有限公司 | 用于确定目标推荐用户的方法、装置和服务器 |
CN107464141A (zh) * | 2017-08-07 | 2017-12-12 | 北京京东尚科信息技术有限公司 | 用于信息推广的方法、装置、电子设备及计算机可读介质 |
CN107481052A (zh) * | 2017-08-14 | 2017-12-15 | 福建米客互联网科技有限公司 | 一种广告信息推送方法及终端 |
CN107944913A (zh) * | 2017-11-21 | 2018-04-20 | 重庆邮电大学 | 基于大数据用户行为分析的高潜在用户购买意向预测方法 |
US20190236645A1 (en) * | 2018-02-01 | 2019-08-01 | Aingines, Inc. | System and a method for identifying prospects with a buying intent and connecting them with relevant businesses |
CN110197386A (zh) * | 2018-04-12 | 2019-09-03 | 腾讯科技(深圳)有限公司 | 媒体资源推送方法和装置、存储介质及电子装置 |
JP2019191714A (ja) * | 2018-04-19 | 2019-10-31 | Kddi株式会社 | Urlのアクセス履歴を用いて予測対象行動に至るであろう潜在対象ユーザを推定するプログラム、装置及び方法 |
CN109325806A (zh) * | 2018-09-20 | 2019-02-12 | 北京小度信息科技有限公司 | 一种用户信息的处理方法及装置 |
CN110008973A (zh) * | 2018-11-23 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 一种模型训练方法、基于模型确定目标用户的方法及装置 |
CN109784654A (zh) * | 2018-12-17 | 2019-05-21 | 平安国际融资租赁有限公司 | 任务生成方法、装置、计算机设备和存储介质 |
CN110087104A (zh) * | 2019-04-29 | 2019-08-02 | 秒针信息技术有限公司 | 信息推送的装置、方法、电子设备和计算机可读存储介质 |
CN110490632A (zh) * | 2019-07-01 | 2019-11-22 | 广州阿凡提电子科技有限公司 | 一种潜在客户识别方法、电子设备及存储介质 |
CN110555717A (zh) * | 2019-07-29 | 2019-12-10 | 华南理工大学 | 基于用户行为特征挖掘用户潜在购买商品和品类的方法 |
Non-Patent Citations (3)
Title |
---|
孙海真;谢颖华;: "基于情景和浏览内容的层次性用户兴趣建模", 计算机系统应用, no. 01 * |
李琰;刘嘉勇;: "基于作者主题模型和辐射模型的用户位置预测模型", 计算机应用, no. 04 * |
黎雪微;应时;周寅;: "基于用户兴趣迁移的网络图书推荐模型研究", 图书馆学研究, no. 22 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112291713A (zh) * | 2020-12-25 | 2021-01-29 | 浙江口碑网络技术有限公司 | 一种目标潜在用户数据的获得方法 |
CN112291713B (zh) * | 2020-12-25 | 2021-04-09 | 浙江口碑网络技术有限公司 | 一种目标潜在用户数据的获得方法 |
CN112835958A (zh) * | 2021-02-04 | 2021-05-25 | 中国工商银行股份有限公司 | 目标客户确定方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111222923B (zh) | 2023-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115002200B (zh) | 基于用户画像的消息推送方法、装置、设备及存储介质 | |
CN112613917A (zh) | 基于用户画像的信息推送方法、装置、设备及存储介质 | |
CN109711424B (zh) | 一种基于决策树的行为规则获取方法、装置及设备 | |
CN107180064A (zh) | 一种物流信息处理方法、装置及物流信息系统 | |
CN109360089A (zh) | 贷款风险预测方法及装置 | |
CN114663198A (zh) | 基于用户画像的产品推荐方法、装置、设备及存储介质 | |
CN110555451A (zh) | 信息识别方法和装置 | |
CN114691932A (zh) | 用于生成合成数据的系统、方法和计算机程序产品 | |
US10706371B2 (en) | Data processing techniques | |
CN113360768A (zh) | 基于用户画像的产品推荐方法、装置、设备及存储介质 | |
US20180300376A1 (en) | Method and system for evaluating user persona data | |
CN113420018A (zh) | 用户行为数据分析方法、装置、设备及存储介质 | |
CN111222923B (zh) | 一种判断潜在客户的方法及装置、电子设备和存储介质 | |
CN115081025A (zh) | 基于数字中台的敏感数据管理方法、装置及电子设备 | |
CN112632409A (zh) | 同一用户识别方法、装置、计算机设备和存储介质 | |
CN114612194A (zh) | 产品推荐方法、装置、电子设备及存储介质 | |
CN109144999B (zh) | 一种数据定位方法、装置及存储介质、程序产品 | |
CN115712684B (zh) | 一种物联网中物品动态信息的存储方法及系统 | |
CN112052310A (zh) | 基于大数据的信息获取方法、装置、设备及存储介质 | |
CN106600053A (zh) | 一种基于时空轨迹和社会网络的用户属性预测系统 | |
CN111382343B (zh) | 一种标签体系生成方法及装置 | |
CN115018576A (zh) | 金融数据处理方法、装置、设备及存储介质 | |
CN109885647B (zh) | 用户履历验证方法、装置、电子设备及存储介质 | |
CN109919811B (zh) | 基于大数据的保险代理人培养方案生成方法及相关设备 | |
CN112084408A (zh) | 名单数据筛选方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |