CN109447687A - 基于大数据分析的用户挖掘方法及装置 - Google Patents

基于大数据分析的用户挖掘方法及装置 Download PDF

Info

Publication number
CN109447687A
CN109447687A CN201811128150.5A CN201811128150A CN109447687A CN 109447687 A CN109447687 A CN 109447687A CN 201811128150 A CN201811128150 A CN 201811128150A CN 109447687 A CN109447687 A CN 109447687A
Authority
CN
China
Prior art keywords
user
usage mining
historical
use data
template
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811128150.5A
Other languages
English (en)
Inventor
林凌军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN201811128150.5A priority Critical patent/CN109447687A/zh
Publication of CN109447687A publication Critical patent/CN109447687A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于人工智能和大数据技术领域,涉及了一种基于大数据分析的用户挖掘方法及装置,所述基于大数据分析的用户挖掘方法包括:获取请求方为进行用户挖掘所配置的用户挖掘模板;根据所述用户挖掘模板从用户数据库中获取相应的用户数据;根据获取到的用户数据引导用户挖掘模型进行模型训练;根据完成模型训练的用户挖掘模型进行用户挖掘,得到目标用户。采用本发明所提供的基于大数据分析的用户挖掘方法解决了现有技术中用户挖掘成本较高的问题。

Description

基于大数据分析的用户挖掘方法及装置
技术领域
本发明涉及人工智能和大数据技术领域,尤其涉及一种基于大数据分析的用户挖掘方法及装置。
背景技术
针对销售领域来说,如何快速有效地获取大量的购买产品的潜在用户,已成为销售人员的迫切需求。
相关技术中,销售人员如果需要获取潜在用户,将面向广大用户进行大量的产品推广活动,例如广告投放,即销售人员在各类型网站中购买广告位进行广告投放、或者在各个广告商户所拥有的广告位投放广告、又或者通过报纸、电视、广告等传统媒体投放广告,以向广大用户推广产品。
上述潜在用户的挖掘过程中,由于只能等待被投放广告的用户主动沟通,缺乏主动性,造成用户挖掘效率低下,最终导致用户挖掘成本居高不下。
发明内容
为了解决上述技术问题,本发明的一个目的在于提供一种基于大数据分析的用户挖掘方法及装置。
其中,本发明所采用的技术方案为:
第一方面,一种基于大数据分析的用户挖掘方法,包括:获取请求方为进行用户挖掘所配置的用户挖掘模板;根据所述用户挖掘模板从历史用户数据库中获取相应的历史用户数据;根据获取到的历史用户数据引导用户挖掘模型进行模型训练;根据完成模型训练的用户挖掘模型进行用户挖掘,得到目标用户。
第二方面,一种基于大数据分析的用户挖掘装置,包括:模板获取模块,用于获取请求方为进行用户挖掘所配置的用户挖掘模板;数据获取模块,用于根据所述用户挖掘模板从历史用户数据库中获取相应的历史用户数据;模型训练模块,用于根据获取到的历史用户数据引导用户挖掘模型进行模型训练;用户挖掘模块,用于根据完成模型训练的用户挖掘模型进行用户挖掘,得到目标用户。
在一示例性实施例中,所述模板获取模块包括:操作检测单元,用于检测所述请求方为进行用户挖掘而触发的配置操作;标签获取单元,用于如果检测到所述配置操作,根据所述配置操作的指示获取至少一个目标用户标签,所述目标用户标签用于描述所述目标用户的用户特征;模板生成单元,用于根据获取到的目标用户标签生成所述用户挖掘模板。
在一示例性实施例中,所述数据获取模块包括:标签提取单元,用于从所述用户挖掘模板中提取得到至少一个目标用户标签;第一关联单元,用于联动所述历史用户数据库,获取得到至少一个目标用户标签关联的历史用户标识;集合形成单元,用于由至少一个目标用户标签所关联历史用户标识的交集形成历史用户集合;第二关联单元,用于根据所述历史用户集合中的历史用户标识在所述历史用户数据库中关联查找历史用户数据,得到所述用户挖掘模板相应的历史用户数据。
在一示例性实施例中,所述装置还包括数据库形成模块,所述数据库形成模块包括:标签配置单元,用于预先配置若干用户标签,所述用户标签用于描述用户的用户特征;第一数据获取单元,用于针对若干所述用户标签,获取符合所述用户标签所描述用户特征的历史用户数据;标识获取单元,用于确定所述历史用户数据对应的历史用户标识;关联存储单元,用于将所述历史用户标识、历史用户数据与用户标签关联存储至所述历史用户数据库。
在一示例性实施例中,所述模型训练模块包括:第一向量提取单元,用于从获取到的历史用户数据中提取得到历史用户特征向量;参数更新单元,用于根据所述历史用户特征向量对所述用户挖掘模型的参数进行迭代更新;迭代单元,用于直至更新的参数使得所述用户挖掘模型收敛,或者,迭代次数达到迭代阈值,停止所述迭代。
在一示例性实施例中,所述用户挖掘模块包括:第二数据获取单元,用于根据所述用户挖掘模板中的目标用户标签获取待挖掘用户的用户数据;第二向量提取单元,用于从所述待挖掘用户的用户数据中提取得到待挖掘用户特征向量;相似度计算单元,用于通过所述用户挖掘模型的前向传播计算所述待挖掘用户特征向量的相似度;用户挖掘单元,用于如果所述相似度超过相似度阈值,则将所述待挖掘用户作为所述目标用户。
第三方面,一种基于大数据分析的用户挖掘装置,包括处理器及存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如上所述的基于大数据分析的用户挖掘方法。
第四方面,一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的基于大数据分析的用户挖掘方法。
在上述技术方案中,结合已购买产品的历史用户,主动预测可能购买产品的目标用户,以此提高用户挖掘的效率,避免用户挖掘的高成本。
具体而言,获取请求方为进行用户挖掘所配置的用户挖掘模板,以根据此用户挖掘模板从历史用户数据库中获取相应的历史用户数据,进而根据获取到的历史用户数据引导用户挖掘模型进行模型训练,并最终基于完成模型训练的用户挖掘模型进行用户挖掘,得到目标用户,由此,避免依赖于用户的主动沟通,有效地解决了现有技术中存在的用户挖掘成本较高的问题。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并于说明书一起用于解释本发明的原理。
图1是根据本发明所涉及的实施环境的示意图。
图2是根据一示例性实施例示出的一种服务器的硬件结构框图。
图3是根据一示例性实施例示出的一种基于大数据分析的用户挖掘方法的流程图。
图4是图3对应实施例中步骤310在一个实施例的流程图。
图5是图3对应实施例中步骤330在一个实施例的流程图。
图6是根据一示例性实施例示出的另一种基于大数据分析的用户挖掘方法的流程图。
图7是图3对应实施例中步骤350在一个实施例的流程图。
图8是图3对应实施例中步骤370在一个实施例的流程图。
图9是根据一示例性实施例示出的一种基于大数据分析的用户挖掘装置的框图。
图10是根据一示例性实施例示出的一种基于大数据分析的用户挖掘装置的硬件结构框图。
通过上述附图,已示出本发明明确的实施例,后文中将有更详细的描述,这些附图和文字描述并不是为了通过任何方式限制本发明构思的范围,而是通过参考特定实施例为本领域技术人员说明本发明的概念。
具体实施方式
这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1为一种基于大数据分析的用户挖掘方法所涉及的实施环境的示意图。该实施环境包括用户设备110、服务端130和部署了历史用户数据库的服务端150。
其中,用户设备110可以是台式电脑、笔记本电脑、平板电脑、智能手机或者其他可建立网络连接的电子设备,在此不进行限定。
用户设备110与服务端130通过无线或者有线建立了网络连接,以基于此网络连接实现用户设备110与服务端130之间的数据传输。例如,待传输的数据包括用户挖掘模板等。
服务端130预先建立与服务端150之间的网络连接,并通过此网络连接实现与服务端150中部署的历史用户数据库的联动。
无论是服务端130还是服务端150,可以是一台服务器,也可以是由多台服务器构成的服务器集群,还可以是由多台服务器构成的云计算中心。此服务器可以是为用户提供后台服务的电子设备,例如,后台服务包括数据存储。
通过用户设备110与服务端130的交互,用户设备110将为请求方向服务端130发起用户挖掘请求,对于服务端130而言,通过用户挖掘请求联动服务端150中部署的历史用户数据库,进行历史用户数据的获取,以基于历史用户数据来预测目标用户,进而向用户设备110返回目标用户。
当然,根据实际营运的需要,服务端130和服务端150也可以整合在同一服务器集群,以使用户挖掘由该同一服务器集群完成。
图2是根据一示例性实施例示出的一种服务器的硬件结构框图。该服务器适用于图1所示出实施环境中的服务端130、服务端150。
需要说明的是,该服务器只是一个适配于本发明的示例,不能认为是提供了对本发明的使用范围的任何限制。该服务器也不能解释为需要依赖于或者必须具有图2中示出的示例性的服务器200中的一个或者多个组件。
该服务器200的硬件结构可因配置或者性能的不同而产生较大的差异,如图2所示,服务器200包括:电源210、接口230、至少一存储器250、以及至少一中央处理器(CPU,Central Processing Units)270。
其中,电源210用于为服务器200上的各硬件设备提供工作电压。
接口230包括至少一有线或无线网络接口231、至少一串并转换接口233、至少一输入输出接口235以及至少一USB接口237等,用于与外部设备通信。
存储器250作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源包括操作系统251、应用程序253及数据255等,存储方式可以是短暂存储或者永久存储。其中,操作系统251用于管理与控制服务器200上的各硬件设备以及应用程序253,以实现中央处理器270对海量数据255的计算与处理,其可以是WindowsServerTM、Mac OS XTM、UnixTM、LinuxTM、FreeBSDTM等。应用程序253是基于操作系统251之上完成至少一项特定工作的计算机程序,其可以包括至少一模块(图2中未示出),每个模块都可以分别包含有对服务器200的一系列计算机可读指令。数据255可以是存储于磁盘中的照片、图片等。
中央处理器270可以包括一个或多个以上的处理器,并设置为通过总线与存储器250通信,用于运算与处理存储器250中的海量数据255。
如上面所详细描述的,适用本发明的服务器200将通过中央处理器270读取存储器250中存储的一系列计算机可读指令的形式来完成基于大数据分析的用户挖掘方法。
此外,通过硬件电路或者硬件电路结合软件也能同样实现本发明,因此,实现本发明并不限于任何特定硬件电路、软件以及两者的组合。
请参阅图3,在一示例性实施例中,一种基于大数据分析的用户挖掘方法适用于图1所示实施环境的服务端130,该服务端130的结构可以如图2所示。
该种基于大数据分析的用户挖掘方法可以由服务端130执行,可以包括以下步骤:
步骤310,获取请求方为进行用户挖掘所配置的用户挖掘模板。
首先,用户挖掘模板,是用于指导服务端如何挖掘目标用户的,即此用户挖掘模板告知了服务端请求方实际需要挖掘哪一类的目标用户。
也可以理解为,用户挖掘模板实质上反映了请求方的个性化挖掘需求,例如,请求方是销售玩具类产品的销售人员,则此销售人员期望挖掘的目标用户是可能购买此玩具类产品的客户,又或者,请求方是招聘销售人员的业务主管,则此业务主管期望挖掘的目标用户是销售业绩好的销售人员。
进一步地,用户挖掘模板,包括至少一个目标用户标签,以通过目标用户标签对目标用户的用户特征加以描述,进而有利于服务端准确地进行目标用户的挖掘。
举例来说,假设用户挖掘模板中的目标用户标签包括用于描述目标用户年龄的年龄标签、用于描述目标用户性别的性别标签等,则表示请求方希望挖掘的目标用户的用户特征将符合年龄标签所描述的年龄、性别标签所描述的性别。
也就是说,用户挖掘模板,指示了请求方实际需要挖掘的目标用户所具备的用户特征。
步骤330,根据用户挖掘模板从历史用户数据库中获取相应的历史用户数据。
历史用户数据库,是根据海量历史用户的历史用户数据而预先构建的。
可以理解,针对不同类型的请求方,历史用户及其历史用户数据有所区别,由此构建的历史用户数据库也各不相同。
举例来说,对于请求方是销售产品的销售人员而言,历史用户则是已购买此产品的客户,历史用户数据可以是反映已购买此产品的客户的年龄、性别、职业、家庭成员、财富值、购买行为等等用户特征的数据,由此构建的历史用户数据库则是用于挖掘可能购买此产品的客户。
又或者,对于请求方是招聘销售人员的业务主管来说,历史用户则是销售业绩好的销售人员,历史用户数据可以是反映销售业绩好的销售人员的销售行为、销售业绩、年龄,性别等等用户特征的数据,由此构建的历史用户数据库则用于挖掘可能会具有良好销售业绩的销售人员。
进一步地,历史用户数据库,实质上建立了历史用户数据与用户标签之间的关联关系,即不同用户标签,相关联的历史用户数据也不同。
换而言之,历史用户数据库,是由若干不同历史用户群体的历史用户数据构建的,每一个历史用户群体所具有的相同用户特征是由用户标签加以描述的。
由上可知,在获得用户挖掘模板之后,便可根据用户挖掘模板中的目标用户标签得到存在关联关系的历史用户数据。
步骤350,根据获取到的历史用户数据引导用户挖掘模型进行模型训练。
用户挖掘模型,实质上是以数学结构的形式对请求方所期望挖掘的目标用户的用户特征进行准确地描述。
那么,对于用户挖掘模型而言,如果请求方所期望挖掘的目标用户的用户特征不同,则用户挖掘模型也有所区别。
为此,用户挖掘模型,需要根据请求方所期望挖掘的目标用户的用户特征进行模型训练,以此准确地描述请求方所期望挖掘的目标用户的用户特征,进而有利于提高后续目标用户挖掘的准确性。
如前所述,历史用户数据,即是按照请求方所期望挖掘的目标用户的用户特征由历史用户数据库中获取到的,也就是说,此历史用户数据即是反映了请求方所期望挖掘的目标用户的用户特征。
因此,用户挖掘模型的模型训练是基于获取到的历史用户数据实现的。
步骤370,根据完成模型训练的用户挖掘模型进行用户挖掘,得到目标用户。
在用户挖掘模型完成模型训练之后,即准确地描述了请求方期望挖掘的目标用户的用户特征。
那么,针对不同的待挖掘用户,便可通过此用户挖掘模型预测待挖掘用户的用户特征与请求方期望挖掘的目标用户的用户特征之间的相似度,从而判断待挖掘用户是否可作为目标用户。通过如上所述的过程,实现了基于历史用户的目标用户主动挖掘,避免依赖于用户的主动沟通,能够有效地提高用户挖掘的效率,进而有效地降低用户挖掘的高成本。
此外,基于不同用户挖掘模板训练得到的用户挖掘模型,所描述的目标用户的用户特征不同,那么,进行用户挖掘时,所得到的目标用户也有所区别,以此满足了请求方个性化的用户挖掘需求。
请参阅图4,在一示例性实施例中,步骤310可以包括以下步骤:
步骤311,检测请求方为进行用户挖掘而触发的配置操作。
步骤313,如果检测到配置操作,根据配置操作的指示获取至少一个目标用户标签。
其中,目标用户标签用于描述目标用户的用户特征。
步骤315,根据获取到的目标用户标签生成用户挖掘模板。
服务端为了获知请求方实际需要挖掘的目标用户,将为请求方提供用于配置用户挖掘模板的配置入口,如果请求发希望进行用户挖掘模板的配置,便可借助此配置入口触发相关的操作,以便于通知服务端请求方实际需要挖掘的目标用户。
举例来说,在服务端所配置的屏幕中,向请求方展示用户标签列表,此用户标签列表罗列了若干用户标签,请求方便可选择此用户标签列表中罗列的用户标签,由此形成包含至少一个目标用户标签的用户挖掘模板。
假设请求方实际需要挖掘的目标用户是30岁~40岁、女性、可能购买产品的客户,便可通过选择操作从用户标签列表中选取用于描述用户的年龄为30岁~40岁的年龄标签、用于描述用户性别为女性的性别标签、以及用于描述用户针对该产品进行了购买、浏览、搜索等等行为的行为标签,进而形成包含年龄标签、性别标签、行为标签的用户挖掘模板。
其中,用户标签列表视为配置入口,选择操作即视为此配置入口触发的相关操作。可以理解,选择操作指示了请求方选择的至少一个用户标签,即目标用户标签,并以此来描述请求方实际需要挖掘的目标用户的用户特征。
值得一提的是,基于服务端所配置的输入组件(例如鼠标、键盘、触控屏幕等)不同,配置操作的具体方式也可以有所区别。例如,对于鼠标所实施的配置操作,具体方式可以是单击、双击、移动、拖拽等操作,或者,通过键盘所实施的配置操作,具体方式还可以是快捷键操作等,又或者,针对触控屏幕所实施的配置操作,则具体方式也可以是点击、滑动等手势操作。
在上述实施例的作用下,实现了用户挖掘模板的配置,为引导用户挖掘模型的模型训练时使用的历史用户数据提供了采集依据,充分地保障了用户挖掘的针对性。
此外,请求方可以根据实际需求的变化而实时调整用户挖掘模板,以便于更加贴合请求方个性化的用户挖掘需求,且具有可复用性、可操作性等优势。
请参阅图5,在一示例性实施例中,步骤330可以包括以下步骤:
步骤331,从用户挖掘模板中提取得到至少一个目标用户标签。
如前所述,用户挖掘模块板是由请求方触发的配置操作所指示的目标用户标签生成的,为此,在获取到用户挖掘模板之后,便可从中提取得到目标用户标签。
进一步地,根据请求方实际需要挖掘的目标用户的用户特征,提取得到的目标用户标签可以是一个,也可以是多个。
步骤333,联动历史用户数据库,获取得到至少一个目标用户标签关联的历史用户标识。
联动,是指部署了历史用户数据库的服务端预先通过无线或者有线网络与执行用户挖掘的服务端之间建立了网络连接,进而方便于执行用户挖掘的服务端通过此网络连接与历史用户数据库交互。
随着执行用户挖掘的服务端与历史用户数据库之间的交互,使得执行用户挖掘的服务端便可由历史用户数据库中获得相应数据。
如前所述,历史用户数据库,是由若干不同历史用户群体的历史用户数据构建的,每一个历史用户群体所具有的相同用户特征是由用户标签加以描述的。
由此,历史用户数据库中的数据包括但不限于:用户标签、历史用户标识、历史用户数据等。其中,历史用户标识用于标识历史用户数据的所属历史用户,用户标签则用于描述历史用户数据所属历史用户的用户特征。
也就是说,历史用户数据库,构建了用户标签、历史用户标识、历史用户数据三者之间的关联关系,那么,基于此关联关系,即可根据目标用户标签获得具有关联关系的历史用户标识、历史用户数据。
步骤335,由至少一个目标用户标签所关联历史用户标识的交集形成历史用户集合。
如果用户挖掘模板中存在多个目标用户标签,说明请求方实际需要挖掘的目标用户的用户特征是多个,也可以理解为,请求方实际需要挖掘的目标用户同时具备多个用户特征。
那么,在进行历史用户数据获取之前,首先需要确定同时具备目标用户多个用户特征的历史用户,以便于基于此历史用户获取相应的历史用户数据。
历史用户集合,包含了若干个历史用户标识,此若干个历史用户标识即是用于标识同时具备目标用户多个用户特征的若干个历史用户。也就是说,历史用户集合,实质上指示了同时具备目标用户多个用户特征的历史用户。
举例来说,用户挖掘模板包含目标用户标签A和目标用户标签B,目标用户标签A用于描述目标用户的用户特征M,而目标用户标签B用于描述目标用户的用户特征N。
历史用户数据库中,假设与目标用户标签A关联的历史用户标识包括集合1:{A1、A2、A3、B1、B2},与目标用户标签B关联的历史用户标识包括集合2:{A1、A3、A4、B2、B3}。也就是说,集合1中历史用户标识所标识的历史用户具备目标用户标签A所描述的用户特征M,而集合2中历史用户标识所标识的历史用户具备目标用户标签B所描述的用户特征N。
由此,集合1和集合2的交集为{A1、A3、B2},即历史用户集合,那么,历史用户标识A1、A3、B2所标识的历史用户同时具备目标用户的用户特征M、N。
步骤337,根据历史用户集合中的历史用户标识在历史用户数据库中关联查找历史用户数据,得到用户挖掘模板相应的历史用户数据。
用户挖掘模板相应的历史用户数据,是指用户挖掘模板指示的用户特征与历史用户数据所属历史用户具备的用户特征相一致。
仍以上述例子进行说明,用户挖掘模板实质上指示了请求方实际需要挖掘的目标用户所具备的用户特征为M、N。
对于历史用户数据库而言,基于历史用户标识与历史用户数据之间的关联关系,便可获得历史用户集合中历史用户标识A1、A3、B2所关联的历史用户数据,即同时具备用户特征M、N的历史用户的历史用户数据,由此形成用户挖掘模板相应的历史用户数据。
通过上述过程,实现了历史用户数据的采集,为引导用户挖掘模型的模型训练提供了充足的数据依据,进而有利于充分保障用户挖掘的准确性。
请参阅图6,在一示例性实施例中,步骤330之前,如上所述的方法还可以包括以下步骤:
步骤410,预先配置若干用户标签。
其中,用户标签用于描述用户的用户特征。
例如,用于描述用户年龄的年龄标签、用于描述用户性别的性别标签、用于描述用户婚姻状况的婚姻标签、用于描述用户家庭地位的家庭成员标签、用于描述用户职业的职业标签、用于描述用户财富水平的财富标签、用于描述用户针对某产品的购买、浏览、搜索等行为的行为标签等等。
用户标签的配置,受控于触发进行的标签配置操作。
具体而言,服务端提供配置用户标签的入口,如果服务端在此入口检测到标签配置操作,即可根据此标签配置操作的指示完成用户标签的配置。
例如,在服务端所配置的屏幕中,显示一输入对话框,通过在输入对话框的文本输入操作,服务端便可根据此文本输入操作完成相应用户标签的配置。其中,输入对话框即视为入口,文本输入操作即视为此入口触发的标签配置操作。
当然,基于服务端所配置的输入组件(例如鼠标、键盘、触控屏幕等)的区别,标签配置操作的具体方式也将有所区别,此标签配置操作的具体方式可以是单击、双击、移动、拖拽等操作,还可以是点击、滑动等手势操作,本实施例并未对此加以限定。
步骤430,针对若干用户标签,获取符合用户标签所描述用户特征的历史用户数据。
以行为标签为例,则获取到的历史用户数据,是能够反映历史用户针对某产品的购买、浏览、搜索等行为。此历史用户数据可以包括针对某产品的购买时间、购买网址、浏览时间、浏览网址、搜索时间、搜索关键词、搜索网址等等。
以财富标签为例,则获取到的历史用户数据,能够反映历史用户的财富水平。此历史用户数据可以包括历史用户是否购买过保险、基金、理财产品、是否拥有信用卡、所拥有信用卡的额度、是否存在贷款、银行信用等级等等。
步骤450,确定历史用户数据对应的历史用户标识。
历史用户标识,用于标识历史用户数据所属历史用户。应当理解,历史用户数据所属历史用户不同,则历史用户标识有所区别。
步骤470,将历史用户标识、历史用户数据与用户标签关联存储至历史用户数据库。
在上述实施例的作用下,实现了历史用户数据库的构建,为引导用户挖掘模型的模型训练提供了数据来源,进而充分保障了模型训练得以实现,有利于保证用户挖掘的准确性。
请参阅图7,在一示例性实施例中,步骤350可以包括以下步骤:
步骤351,从获取到的历史用户数据中提取得到历史用户特征向量。
历史用户特征向量,是对历史用户数据进行特征数字化,进而在数字上准确地描述历史用户数据。
历史用户特征向量的提取,可以采用word2vector、One-Hot、n-gram等编码方式实现。
步骤353,根据历史用户特征向量对用户挖掘模型的参数进行迭代更新。
可以理解,模型训练,是基于海量的历史用户特征向量,由此保证完成模型训练的用户挖掘模型进行用户挖掘时的准确性。
首先,随机初始化用户挖掘模型的参数,根据当前一个历史用户特征向量计算随机初始化的参数所构建的损失函数的损失值。
如果损失函数的损失值未达到最小,则更新用户挖掘模型的参数,并根据后一个历史用户特征向量计算更新的参数所构建的损失函数的损失值。
如此迭代循环,直至损失函数的损失值达到最小,即视为用户挖掘模型收敛,则跳转执行步骤355。
否则,迭代更新用户挖掘模型的参数,并根据其余历史用户特征向量迭代计算所更新参数构建的损失函数的损失值。
步骤355,直至更新的参数使得用户挖掘模型收敛,或者,迭代次数达到迭代阈值,停止迭代。
值得一提的是,如果在用户挖掘模型收敛之前,迭代次数已经达到迭代阈值,也将停止迭代,即认为用户挖掘模型已完成模型训练,以此保证模型训练的效率。
在上述过程中,实现了用户挖掘模型的模型训练,有利于保证后续用户挖掘的准确性。
请参阅图8,在一示例性实施例中,步骤370可以包括以下步骤:
步骤371,根据用户挖掘模板中的目标用户标签获取待挖掘用户的用户数据。
对于不同类型的请求方来说,待挖掘用户,区别于历史用户,是指未曾购买过产品的客户,或者,未曾进行过销售业绩评估的销售人员。
仍以前述例子进行说明,假设待挖掘用户的用户数据中,所反映的用户特征包括M、N、L、O。
由于用户挖掘模板所指示的目标用户的用户特征为M、N,因此,获取到的待挖掘用户的用户数据仅反映用户特征M、N,而反映用户特征L、O的用户数据将被忽略,即不会应用于后续的用户挖掘。
值得一提的是,无论是待挖掘用户的用户数据,还是前述存储于历史用户数据库中的历史用户数据,均被视为大数据,随着用户各种用户行为(例如注册、登录、购买、浏览、搜索、转账等等)的发生而预先收集,以供进行后续的大数据分析,例如,本发明各实施例所涉及的用户挖掘。
步骤373,从待挖掘用户的用户数据中提取得到待挖掘用户特征向量。
同理于历史用户特征向量,待挖掘用户特征向量是对待挖掘用户的用户数据进行特征数字化,进而在数字上准确地描述待挖掘用户的用户数据。
待挖掘用户特征向量的提取,可以采用word2vector、One-Hot、n-gram等编码方式实现。
步骤375,通过用户挖掘模型的前向传播计算待挖掘用户特征向量的相似度。
用户挖掘模型,是通过机器学习历史用户特征向量,进而实现对请求方所期望挖掘的目标用户的用户特征的准确描述。
机器学习,可以采用逻辑回归、支持向量机、随机森林、神经网络等机器学习模型,也可以理解为,被应用于用户挖掘的机器学习模型即为用户挖掘模型。
应当理解,对于机器学习模型而言,包括前向传播和反向传播。其中,反向传播,用于实现模型训练,相对的,前向传播,则用于实现模型预测。
为此,在获得待挖掘用户特征向量之后,便可将此待挖掘用户特征向量输入至用户挖掘模型,进而通过用户挖掘模型的前向传播,预测得到用户挖掘模型的输出结果,即待挖掘用户特征向量的相似度。
在一实施例的具体实现中,用户挖掘模型为神经网络模型,待挖掘用户特征向量的相似度,实质是经由神经网络模型前向传播计算得到的待挖掘用户特征向量的条件概率。此条件概率越大,则待挖掘用户特征向量与神经网络模型所学习的历史用户特征向量之间的相似度越高。
步骤377,如果相似度超过相似度阈值,则将待挖掘用户作为目标用户。
基于用户挖掘模板,用户挖掘模型所学习的历史用户特征向量对应于请求方所期望挖掘的目标用户的用户特征,如果待挖掘用户特征向量与用户挖掘模型所学习的历史用户特征向量相似度很高,说明了待挖掘用户的用户特征与目标用户的用户特征非常相似,由此,即可认为待挖掘用户是请求方所期望挖掘的目标用户。
通过上述实施例的配合,即可从海量的待挖掘用户中挖掘得到目标用户,进而反馈请求方,以满足请求方的用户挖掘需求。
下述为本发明装置实施例,可以用于执行本发明所涉及的基于大数据分析的用户挖掘方法。对于本发明装置实施例中未披露的细节,请参照本发明所涉及的基于大数据分析的用户挖掘方法的方法实施例。
请参阅图9,在一示例性实施例中,一种基于大数据分析的用户挖掘装置900包括但不限于:模板获取模块910、数据获取模块930、模型训练模块950和用户挖掘模块970。
其中,模板获取模块910用于获取请求方为进行用户挖掘所配置的用户挖掘模板。
数据获取模块930用于根据用户挖掘模板从历史用户数据库中获取相应的历史用户数据。
模型训练模块950用于根据获取到的历史用户数据引导用户挖掘模型进行模型训练。
用户挖掘模块970用于根据完成模型训练的用户挖掘模型进行用户挖掘,得到目标用户。
需要说明的是,上述实施例所提供的基于大数据分析的用户挖掘装置在进行用户挖掘处理时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即基于大数据分析的用户挖掘装置的内部结构将划分为不同的功能模块,以完成以上描述的全部或者部分功能。
另外,上述实施例所提供的基于大数据分析的用户挖掘装置与基于大数据分析的用户挖掘方法的实施例属于同一构思,其中各个模块执行操作的具体方式已经在方法实施例中进行了详细描述,此处不再赘述。
请参阅图10,在一示例性实施例中,一种基于大数据分析的用户挖掘装置1000,包括至少一处理器1001、至少一存储器1002、以及至少一通信总线1003。
其中,至少一存储器1002上存储有计算机可读指令,至少一处理器1001通过至少一通信总线1003从至少一存储器1002中读取计算机可读指令。
该计算机可读指令被至少一处理器1001执行时实现上述各实施例中的基于大数据分析的用户挖掘方法。
在一示例性实施例中,一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各实施例中的基于大数据分析的用户挖掘方法。
上述内容,仅为本发明的较佳示例性实施例,并非用于限制本发明的实施方案,本领域普通技术人员根据本发明的主要构思和精神,可以十分方便地进行相应的变通或修改,故本发明的保护范围应以权利要求书所要求的保护范围为准。

Claims (10)

1.一种基于大数据分析的用户挖掘方法,其特征在于,包括:
获取请求方为进行用户挖掘所配置的用户挖掘模板;
根据所述用户挖掘模板从历史用户数据库中获取相应的历史用户数据;
根据获取到的历史用户数据引导用户挖掘模型进行模型训练;
根据完成模型训练的用户挖掘模型进行用户挖掘,得到目标用户。
2.如权利要求1所述的方法,其特征在于,所述获取请求方为进行用户挖掘所配置的用户挖掘模板,包括:
检测所述请求方为进行用户挖掘而触发的配置操作;
如果检测到所述配置操作,根据所述配置操作的指示获取至少一个目标用户标签,所述目标用户标签用于描述所述目标用户的用户特征;
根据获取到的目标用户标签生成所述用户挖掘模板。
3.如权利要求1所述的方法,其特征在于,所述根据所述用户挖掘模板从历史用户数据库中获取相应的历史用户数据,包括:
从所述用户挖掘模板中提取得到至少一个目标用户标签;
联动所述历史用户数据库,获取得到至少一个目标用户标签关联的历史用户标识;
由至少一个目标用户标签所关联历史用户标识的交集形成历史用户集合;
根据所述历史用户集合中的历史用户标识在所述历史用户数据库中关联查找历史用户数据,得到所述用户挖掘模板相应的历史用户数据。
4.如权利要求1或3所述的方法,其特征在于,所述根据所述用户挖掘模板从历史用户数据库中获取相应的历史用户数据之前,所述方法还包括:
预先配置若干用户标签,所述用户标签用于描述用户的用户特征;
针对若干所述用户标签,获取符合所述用户标签所描述用户特征的历史用户数据;
确定所述历史用户数据对应的历史用户标识;
将所述历史用户标识、历史用户数据与用户标签关联存储至所述历史用户数据库。
5.如权利要求1所述的方法,其特征在于,所述根据获取到的历史用户数据引导用户挖掘模型进行模型训练,包括:
从获取到的历史用户数据中提取得到历史用户特征向量;
根据所述历史用户特征向量对所述用户挖掘模型的参数进行迭代更新;
直至更新的参数使得所述用户挖掘模型收敛,或者,迭代次数达到迭代阈值,停止所述迭代。
6.如权利要求1所述的方法,其特征在于,所述根据完成模型训练的用户挖掘模型进行用户挖掘,得到目标用户,包括:
根据所述用户挖掘模板中的目标用户标签获取待挖掘用户的用户数据;
从所述待挖掘用户的用户数据中提取得到待挖掘用户特征向量;
通过所述用户挖掘模型的前向传播计算所述待挖掘用户特征向量的相似度;
如果所述相似度超过相似度阈值,则将所述待挖掘用户作为所述目标用户。
7.一种基于大数据分析的用户挖掘装置,其特征在于,包括:
模板获取模块,用于获取请求方为进行用户挖掘所配置的用户挖掘模板;
数据获取模块,用于根据所述用户挖掘模板从历史用户数据库中获取相应的历史用户数据;
模型训练模块,用于根据获取到的历史用户数据引导用户挖掘模型进行模型训练;
用户挖掘模块,用于根据完成模型训练的用户挖掘模型进行用户挖掘,得到目标用户。
8.如权利要求7所述的装置,其特征在于,所述数据获取模块包括:
标签提取单元,用于从所述用户挖掘模板中提取得到至少一个目标用户标签;
第一关联单元,用于联动所述用户数据库,获取得到至少一个目标用户标签关联的历史用户标识;
集合形成单元,用于由至少一个目标用户标签所关联历史用户标识的交集形成历史用户集合;
第二关联单元,用于根据所述历史用户集合中的历史用户标识在所述历史用户数据库中关联查找历史用户数据,得到所述用户挖掘模板相应的历史用户数据。
9.一种基于大数据分析的用户挖掘装置,其特征在于,包括:
处理器;及
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如权利要求1至6中任一项所述的基于大数据分析的用户挖掘方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的基于大数据分析的用户挖掘方法。
CN201811128150.5A 2018-09-27 2018-09-27 基于大数据分析的用户挖掘方法及装置 Pending CN109447687A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811128150.5A CN109447687A (zh) 2018-09-27 2018-09-27 基于大数据分析的用户挖掘方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811128150.5A CN109447687A (zh) 2018-09-27 2018-09-27 基于大数据分析的用户挖掘方法及装置

Publications (1)

Publication Number Publication Date
CN109447687A true CN109447687A (zh) 2019-03-08

Family

ID=65544286

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811128150.5A Pending CN109447687A (zh) 2018-09-27 2018-09-27 基于大数据分析的用户挖掘方法及装置

Country Status (1)

Country Link
CN (1) CN109447687A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110070123A (zh) * 2019-04-16 2019-07-30 北京新意互动数字技术有限公司 一种目标用户识别装置及服务器
CN110609935A (zh) * 2019-08-29 2019-12-24 湖南草花互动网络科技有限公司 用户身份标签生成方法、装置、计算机设备和存储介质
CN112508693A (zh) * 2021-02-05 2021-03-16 北京淇瑀信息科技有限公司 基于用户标签的资源分配渠道分配方法、装置和电子设备
WO2023103584A1 (zh) * 2021-12-08 2023-06-15 腾讯科技(深圳)有限公司 对象处理方法、装置、计算机设备和存储介质
CN116485560A (zh) * 2023-06-21 2023-07-25 杭州大鱼网络科技有限公司 一种基于反馈机制的目标用户筛选方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104123395A (zh) * 2014-08-13 2014-10-29 北京赛科世纪数码科技有限公司 一种基于大数据的决策方法和系统
CN107657500A (zh) * 2016-12-03 2018-02-02 平安证券股份有限公司 股票推荐方法及服务器
CN108319646A (zh) * 2017-12-26 2018-07-24 金瓜子科技发展(北京)有限公司 基于用户历史行为的车源搜索方法及装置
CN108364192A (zh) * 2018-01-16 2018-08-03 阿里巴巴集团控股有限公司 一种用户挖掘方法、装置以及电子设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104123395A (zh) * 2014-08-13 2014-10-29 北京赛科世纪数码科技有限公司 一种基于大数据的决策方法和系统
CN107657500A (zh) * 2016-12-03 2018-02-02 平安证券股份有限公司 股票推荐方法及服务器
CN108319646A (zh) * 2017-12-26 2018-07-24 金瓜子科技发展(北京)有限公司 基于用户历史行为的车源搜索方法及装置
CN108364192A (zh) * 2018-01-16 2018-08-03 阿里巴巴集团控股有限公司 一种用户挖掘方法、装置以及电子设备

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110070123A (zh) * 2019-04-16 2019-07-30 北京新意互动数字技术有限公司 一种目标用户识别装置及服务器
CN110609935A (zh) * 2019-08-29 2019-12-24 湖南草花互动网络科技有限公司 用户身份标签生成方法、装置、计算机设备和存储介质
CN112508693A (zh) * 2021-02-05 2021-03-16 北京淇瑀信息科技有限公司 基于用户标签的资源分配渠道分配方法、装置和电子设备
CN112508693B (zh) * 2021-02-05 2021-06-11 北京淇瑀信息科技有限公司 基于用户标签的资源分配渠道分配方法、装置和电子设备
WO2023103584A1 (zh) * 2021-12-08 2023-06-15 腾讯科技(深圳)有限公司 对象处理方法、装置、计算机设备和存储介质
CN116485560A (zh) * 2023-06-21 2023-07-25 杭州大鱼网络科技有限公司 一种基于反馈机制的目标用户筛选方法及系统

Similar Documents

Publication Publication Date Title
EP3989131A1 (en) Method and system for realizing machine learning modeling process
CN109447687A (zh) 基于大数据分析的用户挖掘方法及装置
US20180253649A1 (en) Method and system for finding a solution to a provided problem by selecting a winner in evolutionary optimization of a genetic algorithm
KR102472572B1 (ko) 사용자 의도 프로파일링 방법 및 이를 위한 장치
US20190147231A1 (en) Predictive analysis of target behaviors utilizing rnn-based user embeddings
US20180197087A1 (en) Systems and methods for retraining a classification model
WO2017080170A1 (zh) 群体用户画像方法及系统
US20190244110A1 (en) Enhancing Evolutionary Optimization in Uncertain Environments By Allocating Evaluations Via Multi-Armed Bandit Algorithms
WO2017190610A1 (zh) 目标用户定向方法、装置和计算机存储介质
CN108228873A (zh) 对象推荐、发布内容推送方法、装置、存储介质和设备
CN103814351A (zh) 基于协同姿势的输入语言
CN109255644A (zh) 用于提供优化分发和物流的营销管理数据的方法及设备
CN103597509A (zh) 利用用户交互分组聚合转化路径
Govindarajan et al. Intelligent collaborative patent mining using excessive topic generation
US20220398600A1 (en) Intelligent merchant onboarding
CN112348592A (zh) 广告推荐方法、装置、电子设备及介质
CN112380104A (zh) 用户属性识别方法、装置、电子设备及存储介质
CN113297287B (zh) 用户策略自动部署方法、装置及电子设备
WO2022169770A1 (en) Systems and methods for managing, distributing and deploying a recursive decisioning system based on continuously updating machine learning models
US10776411B2 (en) Systematic browsing of automated conversation exchange program knowledge bases
WO2020211616A1 (zh) 用于处理用户交互信息的方法和装置
CN113569578B (zh) 一种用户意图识别方法、装置和计算机设备
CN113312457B (zh) 用于问题解决的方法、计算系统和计算机可读介质
Shrivastava Learning Salesforce Einstein
CN111191142B (zh) 一种电子资源推荐方法、装置和可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination