CN113988195A - 一种私域流量线索挖掘方法、装置、车辆、可读介质 - Google Patents
一种私域流量线索挖掘方法、装置、车辆、可读介质 Download PDFInfo
- Publication number
- CN113988195A CN113988195A CN202111279659.1A CN202111279659A CN113988195A CN 113988195 A CN113988195 A CN 113988195A CN 202111279659 A CN202111279659 A CN 202111279659A CN 113988195 A CN113988195 A CN 113988195A
- Authority
- CN
- China
- Prior art keywords
- private domain
- mining
- clue
- traffic
- private
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例提供了一种私域流量线索挖掘方法、装置、车辆、可读介质;所述方法包括:针对获取的初始私域流量,提取特征信息,所述特征包括时序特征和固有属性特征;输入所述特征信息至预设的挖掘模型;接收所述挖掘模型输出的与所述特征信息匹配的行为预测结果;依据所述预测行为结果确定第一私域流量线索。本发明实施例通过针对私域流量进行线索挖掘,在挖掘过程中通过时序特征体现出用户的意向度变化趋势,有助于更加准确地挖掘私域流量的线索。
Description
技术领域
本发明涉及数据挖掘技术领域,特别是涉及一种私域流量线索挖掘方法、一种私域流量线索挖掘装置、一种车辆以及一种可读介质。
背景技术
私域流量是指品牌或个人自主拥有的、无需付费的、可反复利用的、能随时触达用户的流量,是随时能与之交流并获得反馈信息的用户。在当前优质流量不断减少的背景下,私域流量毅然成为品牌或个人中重要的流量资源。然而目前却缺少针对私域流量的线索挖掘方法,并没有对私域流量进行充分的利用。
再进一步而言,目前的线索挖掘方法只是样本之间的相似度为标准进行挖掘,并不能有效的针对私域流量的挖掘。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种私域流量线索挖掘方法和相应的一种私域流量线索挖掘装置、一种车辆和一种可读介质。
本发明实施例公开了一种私域流量线索挖掘方法,包括:
针对获取的初始私域流量,提取特征信息,所述特征包括时序特征和固有属性特征;
输入所述特征信息至预设的挖掘模型;
接收所述挖掘模型输出的与所述特征信息匹配的行为预测结果;
依据所述预测行为结果确定第一私域流量线索。
可选地,所述方法还包括:
获取筛选条件,所述筛选条件包括至少一个所述时序特征是否满足预设值;
采用所述筛选条件筛选所述第一私域流量线索,得到第二私域流量线索。
可选地,所述采用所述筛选条件筛选所述第一私域流量线索,得到第二私域流量线索的步骤包括:
当所述第一私域流量线索中记载的时序特征符合所述筛选条件时,确定所述第一私域流量线索为第二私域流量线索。
可选地,所述初始私域流量中包括关键字,所述针对获取的初始私域流量,提取特征信息的步骤包括:
基于所述私域流量的原始数据,查找与所述关键字相关的数据作为固有属性特征;
基于所述私域流量的原始数据,提取预设周期内针对预设操作事件的统计数据作为时序特征。
可选地,所述预测行为结果包括挖掘对象及与其对应的行为概率;所述依据所述预测行为结果确定第一私域流量线索的步骤包括:
确定所述行为概率大于概率阈值的对象为目标对象;
以所述目标对象为第一私域流量线索。
可选地,所述预设的挖掘模型通过如下方式训练得到:
获取所述私域流量的历史数据,分类树模型;
标注所述历史数据的类型,得到训练样本;
基于梯度下降树算法,采用所述训练样本训练所述分类树模型,得到挖掘模型。
可选地,所述预测行为结果对应挖掘对象行为,所述筛选条件通过如下方式获得:
采用相关性分析计算所述特征信息与所述挖掘对象行为的相关性,
确定所述相关性大于预设相关性阈值的特征信息为强相关特征;
选取至少一个强相关特征生成筛选条件,所述至少一个强相关特征包括至少一个所述相关性大于预设相关性阈值的时序特征。
本发明实施例还公开了一种私域流量线索挖掘装置,包括:
提取模块,用于针对获取的初始私域流量,提取特征信息,所述特征包括时序特征和固有属性特征;
输入模块,用于输入所述特征信息至预设的挖掘模型;
接收模块,用于接收所述挖掘模型输出的与所述特征信息匹配的行为预测结果;
确定模块,用于依据所述预测行为结果确定第一私域流量线索。
本发明实施例还公开了一种车辆包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于执行如上所述的私域流量线索挖掘方法。
本发明实施例还公开了一种可读存储介质,当所述存储介质中的指令由车辆的处理器执行时,使得车辆能够执行如上所述的私域流量线索挖掘方法。
本发明实施例包括以下优点:
本发明实施例通过针对获取的初始私域流量,提取特征信息,所述特征包括时序特征和固有属性特征;输入所述特征信息至预设的挖掘模型;接收所述挖掘模型输出的与所述特征信息匹配的行为预测结果;依据所述预测行为结果确定第一私域流量线索。通过针对私域流量进行线索挖掘,充分利用私域流量的价值,对挖掘出高价值的线索,以及在挖掘过程中,在采用固有属性特征的基础上融合时序特征进行挖掘,体现出用户的意向度变化趋势,有助于更加准确地挖掘私域流量的线索。
附图说明
图1是本发明的一种私域流量线索挖掘方法实施例一的步骤流程图;
图2是本发明的一种私域流量线索挖掘方法实施例二的步骤流程图;
图3是本发明的一种私域流量线索挖掘方法实施例三的步骤流程图;
图4是本发明的一种私域流量线索挖掘方法示例的执行过程示意图;
图5是本发明的一种私域流量线索挖掘装置实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
目前,针对线索挖掘一般有以下两种方法,第一种是基于数量比重、相关度均值、情感得分、文本相似度和主题相似度,通过经验为这五个特征赋予不同的权重,分别计算各个指标的分数与对应的权重结合得到出一个综合的分数来进行线索挖掘方法;其中,数量比重是指待挖掘文本数据的组合词中与特征词库相关的组合词占所有组合词的数量比重;相关度均值是指文本数据的组合词与特征词相关的组合词的相关度均值;情感得分是指所述待挖掘文本数据的情感得分;文本相似度是指待挖掘文本数据与案例之间的文本相似度;主题相似度是指待挖掘文本数据与案例之间的主题相似度。
第二种方法则是通过设置三层门限,挖掘出有效线索,拓展线索来源。该方法首先对数据的内容进行情感分析,并判断分析得出的负向得分是否大于设置的第一置信度门限,若是则进行实体识别,否则丢弃数据;其次,对数据的内容进行命名实体识别,并判断识别结果中是否包含有效实体,若是则进行相似度计算,否则丢弃数据;对文本数据的标题和参考文本的标题进行语义相似度计算,并判断相似度是否大于设置的第二置信度门限,若是则确定为有效线索,否则丢弃数据。
而这两种方式是针对公域流量进行挖掘,而私域流量属于某一对象所特有的流量与能从公域流量获取的流量并不相同;在公域流量的挖掘中无需考虑线索的意向度变化的挖掘方式。不能适用于私域流量的挖掘。
参照图1,示出了本发明的一种私域流量线索挖掘方法实施例一的步骤流程图,具体可以包括如下步骤:
步骤101,针对获取的初始私域流量,提取特征信息,所述特征包括时序特征和固有属性特征;
需要说明的是,私域流量是个人或企业等对象可以完全支配的流量,说我们的社交软件中的通讯朋友、自搭建的社群或是自搭建的资源交互平台的粉丝等。可以通过度这些流量终端去获取初始私域流量,针对获取的初始流量,提取出特征信息,这些特征信息包括时序特征和固有属性特征。
在机器学习中,特征信息是被观测对象的一个独立可观测的属性、特点或行为信息,特征信息可以作为机器学习算法的输入,对模型的效果起到了重要作用。好的特征信息能够较好地区分样本,配合高效的机器学习算法,实现更好的模型效果。因此,固有属性特征指未能反映样本属性、特点、行为随时间变化的特征,例如:年龄、性别、学历、近一个月APP(Application,应用程序)活跃天数等。时序特征是指能够反映样本属性、特点、行为随时间变化的特征,例如:近一月APP活跃的环比变化天数。
步骤102,输入所述特征信息至预设的挖掘模型;
将提取出来的特征信息作为输入信号,输入到预设的挖掘模型中,所述挖掘模型经过历史数据作为样本训练得到,可以对用户的行为进行预测;对输入的特征信息进行处理,输出用户的行为预测结果。
步骤103,接收所述挖掘模型输出的与所述特征信息匹配的行为预测结果;
接收挖掘模型输出的与特征信息匹配的行为预测结果,所述预测结果至少包括一种用户行为,或针对特征行为的概率。
步骤104,依据所述预测行为结果确定第一私域流量线索。
依据预测行为结果进行处理,剔除部分干扰信息,剩下的即为第一私域流量线索;即第一私域流量线索为基于用户行为预测的数据线索。
本发明实施例通过针对获取的初始私域流量,提取特征信息,所述特征包括时序特征和固有属性特征;输入所述特征信息至预设的挖掘模型;接收所述挖掘模型输出的与所述特征信息匹配的行为预测结果;依据所述预测行为结果确定第一私域流量线索。通过针对私域流量进行线索挖掘,充分利用私域流量的价值,对挖掘出高价值的线索,以及在挖掘过程中,在采用固有属性特征的基础上融合时序特征进行挖掘,体现出用户的意向度变化趋势,有助于更加准确地挖掘私域流量的线索。
参照图2,示出了本发明的一种私域流量线索挖掘方法实施例二的步骤流程图,具体可以包括如下步骤:
步骤201,针对获取的初始私域流量,提取特征信息,所述特征包括时序特征和固有属性特征;
可以从专属某一对象的私域流量池中,获取初始私域流量,针对获取到的初始私域流量数据进行线索挖掘;针对初始私域流量,提取出特征信息,包括时序特征和固有属性特征。
步骤202,输入所述特征信息至预设的挖掘模型;
将特征信息输入至预设的挖掘模型,其中常用的机器学习算法与神经网络模型皆可用于处理私域流量线索挖掘的任务,因此,在此对挖掘模型的具体类型并不具体做限定。挖掘模型可以对用户行为进行预测,输出行为预测结果。需要说明的是,挖掘模型可以是自身所拥有的也可以是设置在云端,通过数据传输网络与挖掘模型所在的云端连接,并进行数据传输。
步骤203,接收所述挖掘模型输出的与所述特征信息匹配的行为预测结果;
当模型输出与输入模型特征信息相匹配的行为预测结果时,接收所述行为预测结果。
步骤204,依据所述预测行为结果确定第一私域流量线索;
依据行为预测结果确定用户的行为以确定第一私域流量线索。
步骤205,获取筛选条件,所述筛选条件包括至少一个所述时序特征是否满足预设值;
得到第一私域流量线索时,由于第一私域流量线索是以用户行为作为基础进行挖掘,而在用户行为会可能在不同的时期发生变化,因此通过获取筛选条件,对第一私域流量线索进行进一步的筛选,其中所述筛选条件包括至少一个所述时序特征是否满足预设值,如近7天线上浏览眼镜商家的数量大于2。
步骤206,采用所述筛选条件筛选所述第一私域流量线索,得到第二私域流量线索。
通过筛选条件筛选第一私域流量线索,所述筛选条件可以是单个也可以是多个,本发明实施例对此不作限定,筛选出第一私域流量线索中的第二私域流量线索。
本发明实施例通过针对私域流量的数据,在固有属性特征的基础上提取其时序特征作为模型的特征信息输入。通过神经网络模型,可以对私域流量中的用户行为进行预测确定初步的第一私域流量挖掘线索,再辅以筛选条件,进一步细分用户,增强预测的准确性,提高私域流量线索挖掘的效率。
参照图3,示出了本发明的一种私域流量线索挖掘方法实施例三的步骤流程图,所述方法具体可以包括如下步骤:
步骤301,针对获取的初始私域流量,提取特征信息,所述特征包括时序特征和固有属性特征;
可以从私域流量平台来获取初始私域流量,如在某公司面向客户进行信息交流的应用程序中,获取初始私域流量。针对这些初始私域流量进行识别提取,提取出时序特征和固有属性特征。其中,时序特征表征私域流量用户行为随时间的分布。时序特征能够直接反应出用户的行为变化,在用户当下行为特征信息相近的情况下,仅通过固有属性特征难以直接地区别出用户,因此结合时序特征,可以有效区分用户,便于后续模型针对用户行为进行预测。
需要说明的是,提取时序特征和固有属性特征可以同步进行也可以异步进行;本发明实施例对此不作限定。为了挖掘的效率而言,优选的是采用同步识别提取方式,令提取两种特征的时间获得重叠以减少识别提取的时间,提高挖掘的效率。
在本发明的一优选实施例中,所述初始私域流量中包括关键字,所述针对获取的初始私域流量,提取特征信息的步骤包括:
子步骤3011基于所述私域流量的原始数据,查找与所述关键字相关的数据作为固有属性特征;
基于私域流量的原始数据,采用查询的方式,查找出与关键字相关的原始数据作为固有属性特征,固有属性特征并不会随着时间的变化而改变的特征,如关键字为性别,查找得到的固有属性特征为性别男;关键字为学历,查找得到的固有属性特征为本科等,并不随时间变化的值。此外,对于查询的方式可以采用二叉查找树查询方式,也可以采用SQL(Structured Query Language,结构化查询语言)查询方式等,本领域技术人员还可以采用其他的查询方式进行查询以获得固有属性特征,本发明实施例对此不作具体限定。
子步骤3012基于所述私域流量的原始数据,提取预设周期内针对预设操作事件的统计数据作为时序特征。
对于时序特征可以采用行为序列模型识别:从私域流量的原始数据中提取预设周期内,用户对某些操作的统计数据作为时序特征;所述预设周期本领域技术人员可于根据需求进行设置,如、一天、一周、两周、一个月等,对此不作限定。其中时序特征可以只包括用户针对单项操作的统计数据,可以包括用户针对多项操作的统计数据。在时序特征包括用户针对多项操作的统计数据时,一项操作对应一个统计数据;如用户近7天内APP活跃环比变化天数为2天、近14天内点击APP推送内容环比次数为3次。
步骤302,输入所述特征信息至预设的挖掘模型;
将提取出来的特征信息全部数据至预设的挖掘模型中,挖掘模型是通过对历史的私域流量数据进行标注,并通过机器学习算法,对私域流量线索挖掘进行建模得到。
在本发明的一优选实施例中,所述预设的挖掘模型通过如下方式训练得到:
获取所述私域流量的历史数据,分类树模型;
标注所述历史数据的类型,得到训练样本;
基于梯度下降树算法,采用所述训练样本训练所述分类树模型,得到挖掘模型。
首先可以从云端或者终端自身的存储空间中获取基础的分类树模型,从私域流量池中的回去私域流量的历史数据。然后依据历史数据的类型对历史数据进行正负样本的标注,即当该历史数据符合某项行为时为正样本,不符合时为负样本,整理历史数据得到多个正负样本作为训练样本。得到训练样本之后,使用GBDT(Gradient Boosting DecisionTree,梯度下降树)算法,输入正负样本训练分类树模型,得到挖掘模型。
步骤303,接收所述挖掘模型输出的与所述特征信息匹配的行为预测结果;所述预测行为结果包括挖掘对象及与其对应的行为概率;
挖掘模型会根据输入特征信息,输出与之匹配的行为预测结果;终端接收所述行为预测结果,其中预测行为结果包括挖掘对象及与其对应的行为概率,具体而言,预测结果为用户A的购车概率为90%,则挖掘对象为用户A,用户A对应的购车行为概率为90%。需要说明的是,预测结果为多个时,可以按照用户的信息进行排序也可以根据行为概率的大小进行排序,本发明实施例对此不作具体限定。
步骤304,确定所述行为概率大于概率阈值的对象为目标对象;
在挖掘模型输出的行为预测结果为多个时,由于行为概率较小的用户行为说明用户发送该行为的可能性较低,并不能作为私域流量线索,因此,将行为概率大于概率阈值的对象确定为目标对象,如用户A的购车概率为90%,用户B的购车概率为50%,用户C的购车概率为80%,概率阈值为60%,则用户A、C的购车概率高于概率阈值,将用户A、C确定为目标对象。需要说明的是,概率阈值可以由本领域技术人员根据需求进行设置,本发明实施例对此不作具体限定。
步骤305,以所述目标对象为第一私域流量线索;
在确定目标对象为后,将目标对象确定为第一私域流量线索,通过所述第一私域流量线索则可以看出用户A与用户C有购车的意向。
步骤306,获取筛选条件,所述筛选条件包括至少一个所述时序特征是否满足预设值;
在得到第一私域流量线索后为了可以更加准确的挖掘出细致的线索,可以获取筛选条件,所述筛选条件由特征对象和值组成,即当特征对象满足值的要求时,才对第一私域流量线索做出进一步的筛选。例如,当用户最近一个月有在APP活跃过,这个用户才有可能购买车,最近一个月操作APP是特征对象,活跃天数“>0”是值,购买车是做出的预测筛选。根据需要预测的群体,可以对特征对象和值进行调整。例如,筛选的群体是想要配眼睛的用户,可以将设置筛选条件为:近7天线上浏览眼镜商家数量大于2的。所述筛选条件包括至少一个所述时序特征是否满足预设值。此外,筛选条件可以为多个,可以是固有属性特征结合时序特征作为特征对象、多个时序特征结合作为特征对象。
在本发明的一优选实施例中,所述预测行为结果对应挖掘对象行为,所述筛选条件通过如下方式获得:
采用相关性分析计算所述特征信息与所述挖掘对象行为的相关性,
确定所述相关性大于预设相关性阈值的特征信息为强相关特征;
选取至少一个强相关特征生成筛选条件,所述至少一个强相关特征包括至少一个所述相关性大于预设相关性阈值的时序特征。
预测行为结果对应挖掘对象行为,当存在与预测行为强相关的筛选条件时,使用筛选条件将对预测结果的准确性有较大的提升。筛选条件的选择可根据相关性进行选择。
通过相关性分析方法计算,分析特征信息中的特征与挖掘对象行为的相关性,如图表相关分析、协方差及协方差矩阵、相关性系数、一元回归及多元回归以及信息熵及互信息等方式对相关性进行计算。相关性越大则说明该特征与挖掘对象行为的关联越大,因此,确定所述相关性大于预设相关性阈值的特征信息为强相关特征;相关性阈值的大小可以根据群体以及特征的差别选择不同的相关性阈值。然后在强相关特征中选取至少一个时序特征对应的强相关特征结合其对应的值生成筛选条件。
步骤307,当所述第一私域流量线索中记载的时序特征符合所述筛选条件时,确定所述第一私域流量线索为第二私域流量线索。
当第一私域流量线索中记载的时序特征符合所述筛选条件时,即时序特征中的特征对象与筛选条件中的特征对象一致,且时序特征中的特征对象对应的值符合预设值的要求。如筛选条件为近一个月APP活跃天数大于2,则第一私域流量线索中记载的时序特征近一个月APP活跃天数为5,大于2则是满足筛选条件。若符合第一私域流量线索中记载的时序特征近一个月APP活跃天数为1,并不大于2,则不符合预设筛选条件。当符合时确定该第一私域流量线索为第二私域流量线索,否则舍弃该第一私域流量线索。
本发明实施例通过对私域流量的原始数据,提取出固有属性特征以及时序特征作为挖掘模型的输入信息。同时,对私域流量的历史数据进行标注,并通过机器学习算法,对私域流量线索挖掘进行建模得到挖掘。通过固有属性特征以及时序特征输入至挖掘模型,挖掘模型输出预测行为结果,可以对私域流量中的用户行为进行预测得到第一私域流量线索,实现对私域流量的线索挖掘,再辅以基于规则的专家系统,进一步细分用户,增强预测的准确性,提高私域流量线索挖掘的效率。
为了使本领域技术人员能够更好地理解本发明实施例,下面通过一个示例对本申请实施例的工作流程加以说明:可以参照图5,示出了本发明的一种私域流量线索挖掘方法示例的执行过程示意图。以私域流量线索挖掘中的购车用户挖掘为例进行说明:
首先,通过私域流量平台的用户原始数据提取出用户特征:年龄、性别、学历、近一个月APP活跃天数、近一月APP活跃的环比变化天数。其中,“近一月APP活跃的环比变化天数”为时序特征。“年龄”、“性别”、“学历”、“近一个月APP活跃天数”为固定属性特征(常规特征),并且,根据用户的购车行为标定正负样本,购车用户为正样本,非购车用户为负样本。其次,使用做完以上处理的样本、通过机器学习算法,对模型进行训练,得到一个可以对用户购车行为进行预测的挖掘模型。最后,设定筛选条件(专家规则),如:近一个月APP活跃天数大于2,且近一月APP活跃的环比变化天数不小于0(即近一个月的活跃天数不小于上一个月的活跃天数)。完成上述设置后,将提取出来的固定属性特征(常规特征)和时序特征输入到模型中,模型输出的行为预测结果结合筛选条件(专家规则)的筛选,得到购车用户的线索以完成挖掘。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图5,示出了本发明的一种私域流量线索挖掘装置实施例的结构框图,具体可以包括如下模块:
提取模块501,用于针对获取的初始私域流量,提取特征信息,所述特征包括时序特征和固有属性特征;
输入模块502,用于输入所述特征信息至预设的挖掘模型;
接收模块503,用于接收所述挖掘模型输出的与所述特征信息匹配的行为预测结果;
确定模块504,用于依据所述预测行为结果确定第一私域流量线索。
在本发明的一优选实施例中,所述装置还包括:
获取模块,用于获取筛选条件,所述筛选条件包括至少一个所述时序特征是否满足预设值;
筛选模块,用于采用所述筛选条件筛选所述第一私域流量线索,得到第二私域流量线索。
在本发明的一优选实施例中,所述筛选模块包括;
第一确定子模块,用于当所述第一私域流量线索中记载的时序特征符合所述筛选条件时,确定所述第一私域流量线索为第二私域流量线索。
在本发明的一优选实施例中,所述初始私域流量中包括关键字,所述提取模块501包括:
第一提取子模块,用于基于所述私域流量的原始数据,查找与所述关键字相关的数据作为固有属性特征;
第二提取子模块,用于基于所述私域流量的原始数据,提取预设周期内针对预设操作事件的统计数据作为时序特征。
在本发明的一优选实施例中,所述预测行为结果包括挖掘对象及与其对应的行为概率;所述确定模块504包括:
第二确定子模块,用于确定所述行为概率大于概率阈值的对象为目标对象;
第一私域流量线索确认模块,用于以所述目标对象为第一私域流量线索。
在本发明的一优选实施例中,所述预设的挖掘模型通过如下方式训练得到:
获取所述私域流量的历史数据,分类树模型;
标注所述历史数据的类型,得到训练样本;
基于梯度下降树算法,采用所述训练样本训练所述分类树模型,得到挖掘模型。
在本发明的一优选实施例中,所述预测行为结果对应挖掘对象行为,所述筛选条件通过如下方式获得:
采用相关性分析计算所述特征信息与所述挖掘对象行为的相关性,
确定所述相关性大于预设相关性阈值的特征信息为强相关特征;
选取至少一个强相关特征生成筛选条件,所述至少一个强相关特征包括至少一个所述相关性大于预设相关性阈值的时序特征。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请实施例还提供了一种车辆,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于执行上述私域流量线索挖掘方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本申请实施例还提供了一种可读存储介质,当所述存储介质中的指令由车辆的处理器执行时,使得车辆能够执行上述私域流量线索挖掘方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种私域流量线索挖掘方法、一种私域流量线索挖掘装置、一种车辆、一种可读介质,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种私域流量线索挖掘方法,其特征在于,包括:
针对获取的初始私域流量,提取特征信息,所述特征包括时序特征和固有属性特征;
输入所述特征信息至预设的挖掘模型;
接收所述挖掘模型输出的与所述特征信息匹配的行为预测结果;
依据所述预测行为结果确定第一私域流量线索。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取筛选条件,所述筛选条件包括至少一个所述时序特征是否满足预设值;
采用所述筛选条件筛选所述第一私域流量线索,得到第二私域流量线索。
3.根据权利要求2所述的方法,其特征在于,所述采用所述筛选条件筛选所述第一私域流量线索,得到第二私域流量线索的步骤包括:
当所述第一私域流量线索中记载的时序特征符合所述筛选条件时,确定所述第一私域流量线索为第二私域流量线索。
4.根据权利要求1所述的方法,其特征在于,所述初始私域流量中包括关键字,所述针对获取的初始私域流量,提取特征信息的步骤包括:
基于所述私域流量的原始数据,查找与所述关键字相关的数据作为固有属性特征;
基于所述私域流量的原始数据,提取预设周期内针对预设操作事件的统计数据作为时序特征。
5.根据权利要求1所述的方法,其特征在于,所述预测行为结果包括挖掘对象及与其对应的行为概率;所述依据所述预测行为结果确定第一私域流量线索的步骤包括:
确定所述行为概率大于概率阈值的对象为目标对象;
以所述目标对象为第一私域流量线索。
6.根据权利要求1所述的方法,其特征在于,所述预设的挖掘模型通过如下方式训练得到:
获取所述私域流量的历史数据,分类树模型;
标注所述历史数据的类型,得到训练样本;
基于梯度下降树算法,采用所述训练样本训练所述分类树模型,得到挖掘模型。
7.根据权利要求2所述的方法,其特征在于,所述预测行为结果对应挖掘对象行为,所述筛选条件通过如下方式获得:
采用相关性分析计算所述特征信息与所述挖掘对象行为的相关性,
确定所述相关性大于预设相关性阈值的特征信息为强相关特征;
选取至少一个强相关特征生成筛选条件,所述至少一个强相关特征包括至少一个所述相关性大于预设相关性阈值的时序特征。
8.一种私域流量线索挖掘装置,其特征在于,包括:
提取模块,用于针对获取的初始私域流量,提取特征信息,所述特征包括时序特征和固有属性特征;
输入模块,用于输入所述特征信息至预设的挖掘模型;
接收模块,用于接收所述挖掘模型输出的与所述特征信息匹配的行为预测结果;
确定模块,用于依据所述预测行为结果确定第一私域流量线索。
9.一种车辆,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于执行如方法权利要求1-7任一所述的私域流量线索挖掘方法。
10.一种可读存储介质,其特征在于,当所述存储介质中的指令由车辆的处理器执行时,使得车辆能够执行如方法权利要求1-7任一所述的私域流量线索挖掘方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111279659.1A CN113988195A (zh) | 2021-10-28 | 2021-10-28 | 一种私域流量线索挖掘方法、装置、车辆、可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111279659.1A CN113988195A (zh) | 2021-10-28 | 2021-10-28 | 一种私域流量线索挖掘方法、装置、车辆、可读介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113988195A true CN113988195A (zh) | 2022-01-28 |
Family
ID=79745100
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111279659.1A Pending CN113988195A (zh) | 2021-10-28 | 2021-10-28 | 一种私域流量线索挖掘方法、装置、车辆、可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113988195A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115309737A (zh) * | 2022-10-11 | 2022-11-08 | 深圳市明源云客电子商务有限公司 | 访客意向分析方法、系统、终端设备及可读存储介质 |
CN117094383A (zh) * | 2023-10-19 | 2023-11-21 | 成都数之联科技股份有限公司 | 一种语言模型的联合训练方法、系统、设备及存储介质 |
-
2021
- 2021-10-28 CN CN202111279659.1A patent/CN113988195A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115309737A (zh) * | 2022-10-11 | 2022-11-08 | 深圳市明源云客电子商务有限公司 | 访客意向分析方法、系统、终端设备及可读存储介质 |
CN117094383A (zh) * | 2023-10-19 | 2023-11-21 | 成都数之联科技股份有限公司 | 一种语言模型的联合训练方法、系统、设备及存储介质 |
CN117094383B (zh) * | 2023-10-19 | 2024-02-02 | 成都数之联科技股份有限公司 | 一种语言模型的联合训练方法、系统、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109918673B (zh) | 语义仲裁方法、装置、电子设备和计算机可读存储介质 | |
US20230222366A1 (en) | Systems and methods for semantic analysis based on knowledge graph | |
CN108255934B (zh) | 一种语音控制方法及装置 | |
CN107657048B (zh) | 用户识别方法及装置 | |
CN108280114B (zh) | 一种基于深度学习的用户文献阅读兴趣分析方法 | |
CN112800170A (zh) | 问题的匹配方法及装置、问题的回复方法及装置 | |
CN112235327A (zh) | 异常日志检测方法、装置、设备和计算机可读存储介质 | |
CN111126396A (zh) | 图像识别方法、装置、计算机设备以及存储介质 | |
CN113988195A (zh) | 一种私域流量线索挖掘方法、装置、车辆、可读介质 | |
CN110309504B (zh) | 基于分词的文本处理方法、装置、设备及存储介质 | |
CN113379457A (zh) | 面向金融领域的智能营销方法 | |
CN112347223A (zh) | 文档检索方法、设备及计算机可读存储介质 | |
CN110990563A (zh) | 一种基于人工智能的传统文化素材库构建方法及系统 | |
CN114911929A (zh) | 分类模型训练方法、文本挖掘方法、设备及存储介质 | |
CN117520503A (zh) | 基于llm模型的金融客服对话生成方法、装置、设备及介质 | |
CN110362828B (zh) | 网络资讯风险识别方法及系统 | |
CN116127066A (zh) | 文本聚类方法、文本聚类装置、电子设备及存储介质 | |
US20210286810A1 (en) | Method And Apparatus For Generating Context Category Dataset | |
CN114036289A (zh) | 一种意图识别方法、装置、设备及介质 | |
CN114610576A (zh) | 一种日志生成监控方法和装置 | |
CN114969253A (zh) | 市场主体与政策的匹配方法、装置、计算设备及介质 | |
CN114764437A (zh) | 用户意图识别方法、装置以及电子设备 | |
CN113064986B (zh) | 模型的生成方法、系统、计算机设备和存储介质 | |
CN110737750B (zh) | 分析文本受众的数据处理方法、装置与电子设备 | |
CN116341990B (zh) | 一种基础设施工程的知识管理评价方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |