CN106713106A - 数据分析方法、装置和邮件发送方法、装置 - Google Patents

数据分析方法、装置和邮件发送方法、装置 Download PDF

Info

Publication number
CN106713106A
CN106713106A CN201510771725.5A CN201510771725A CN106713106A CN 106713106 A CN106713106 A CN 106713106A CN 201510771725 A CN201510771725 A CN 201510771725A CN 106713106 A CN106713106 A CN 106713106A
Authority
CN
China
Prior art keywords
user
advertising slogan
mail
preference
speech information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510771725.5A
Other languages
English (en)
Inventor
李雪怡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201510771725.5A priority Critical patent/CN106713106A/zh
Publication of CN106713106A publication Critical patent/CN106713106A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/07User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
    • H04L51/08Annexed information, e.g. attachments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/56Unified messaging, e.g. interactions between e-mail, instant messaging or converged IP messaging [CPM]

Abstract

本申请公开了一种数据分析方法、装置和邮件发送方法、装置。其中,该用户访问数据的分析方法包括:获取用户通过邮件里的网页链接访问网站的访问日志;对访问日志进行解析,得到用户唯一标识及用户访问的网页链接中携带的广告语的词性信息,其中,广告语的词性信息,为根据用户访问邮件的邮件标题的词性信息确定的,网页链接为邮件推广的网页链接;根据广告语的词性信息,确定该唯一标识对应的用户对广告语的偏好。本申请解决了由于无法获知用户的偏好导致发送的推广邮件打开率低的技术问题。

Description

数据分析方法、装置和邮件发送方法、装置
技术领域
本申请涉及领域,具体而言,涉及一种数据分析方法、装置和邮件发送方法、装置。
背景技术
目前很多企业客户通过电子邮件营销(Email Direct Marketing,简称为EDM)方式向目标用户传递有价值的信息。电子邮件营销的关键之一是首先提高发送邮件的打开率,进而提升网站到达率。通过EDM系统向用户发送推广邮件,当用户点击邮件内容的网页链接即可进入推广网站的网页。然而,由于无法获知用户的偏好,使得在多数情况下向用户发送的推广邮件中所包含的内容并不是用户所关注的信息,因此,无法有效提高邮件打开率。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种数据分析方法、装置和邮件发送方法、装置,以至少解决由于无法获知用户的偏好导致发送的推广邮件打开率低的技术问题。
根据本申请实施例的一个方面,提供了一种数据分析方法,包括:获取用户通过邮件里的网页链接访问网站的访问日志;对所述访问日志进行解析,得到用户唯一标识及用户访问的网页链接中携带的广告语的词性信息,其中,所述广告语的词性信息,为根据用户访问所述邮件的邮件标题的词性信息确定的,所述网页链接为邮件推广的网页链接;根据所述广告语的词性信息,确定该唯一标识对应的用户对所述广告语的偏好。
进一步地,根据所述广告语的词性信息,确定该唯一标识对应的用户对所述广告语的偏好包括:按照所述词性信息的类别对所述唯一标识对应的用户通过邮件里的网页链接访问网站的次数进行统计,得到每一类别的词性信息对应的访问次数;由统计得到的访问次数确定所述唯一标识对应的用户对邮件标题里包含的广告语的偏好,其中,访问次数越高表示用户对相应类别的广告语的偏好越强。
进一步地,在所述邮件标题里包含的广告语具有多种词性的情况下,所述邮件里的网页链接中携带的广告语的词性信息包括所述多种词性及其权重,其中,根据所述广告语的词性信息,确定该唯一标识对应的用户对所述广告语的偏好包括:按照所述词性信息的类别对所述唯一标识对应的用户访问的所述网页链接中携带的广告语的词性信息的权重进行计算,得到每一类别的词性信息对应的权重总值;由所述权重总值确定所述唯一标识对应的用户对邮件标题里包含的广告语的偏好,其中,权重总值越大表示用户对相应类别的广告语的偏好越强。
进一步地,在根据所述广告语的词性信息,确定该唯一标识对应的用户对所述广告语的偏好之后,所述方法还包括:根据确定出的用户对邮件标题里包含的广告语的偏好,计算词性信息的群体热度和群体区分度,其中,所述群体热度表示具有同一预设属性的用户群体对邮件标题里包含的广告语的偏好情况,所述群体区分度表示对每一类别的词性信息具有偏好的用户群体的用户数量。
根据本申请实施例的另一方面,还提供了一种邮件发送方法,包括:确定用户的唯一标识和邮件标题里包含的广告语之间的关联关系;根据所述关联关系,得到所述用户对邮件标题里包含的广告语的偏好;根据所述用户对邮件标题里包含的广告语的偏好,将所述广告语添加到邮件标题里,并将所述广告语的词性信息添加到网页链接中。
根据本申请实施例的另一方面,还提供了一种数据分析装置,包括:获取单元,用于获取用户通过邮件里的网页链接访问网站的访问日志;解析单元,用于对所述访问日志进行解析,得到用户唯一标识及用户访问的网页链接中携带的广告语的词性信息,其中,所述广告语的词性信息,为根据用户访问所述邮件的邮件标题的词性信息确定的,所述网页链接为邮件推广的网页链接;确定单元,用于根据所述广告语的词性信息,确定该唯一标识对应的用户对所述广告语的偏好。
进一步地,所述第二确定单元包括:统计模块,用于按照所述词性信息的类别对所述唯一标识对应的用户通过邮件里的网页链接访问网站的次数进行统计,得到每一类别的词性信息对应的访问次数;第一确定模块,用于由统计得到的访问次数确定所述唯一标识对应的用户对邮件标题里包含的广告语的偏好,其中,访问次数越高表示用户对相应类别的广告语的偏好越强。
进一步地,在所述邮件标题里包含的广告语具有多种词性的情况下,所述邮件里的网页链接中携带的广告语的词性信息包括所述多种词性及其权重,其中,所述第二确定单元包括:计算模块,用于按照所述词性信息的类别对所述唯一标识对应的用户访问的网页链接中携带的广告语的词性信息的权重进行计算,得到每一类别的词性信息对应的权重总值;第二确定模块,用于由所述权重总值确定所述唯一标识对应的用户对邮件标题里包含的广告语的偏好,其中,权重总值越大表示用户对相应类别的广告语的偏好越强。
进一步地,所述装置还包括:计算单元,用于在根据所述广告语的词性信息,确定该唯一标识对应的用户对所述广告语的偏好之后,根据确定出的用户对邮件标题里包含的广告语的偏好,计算词性信息的群体热度和群体区分度,其中,所述群体热度表示具有同一预设属性的用户群体对邮件标题里包含的广告语的偏好情况,所述群体区分度表示对每一类别的词性信息具有偏好的用户群体的用户数量。
根据本申请实施例的另一方面,还提供了一种邮件发送装置,包括:关系确定单元,用于确定用户的唯一标识和邮件标题里包含的广告语之间的关联关系;偏好获取单元,用于根据所述关联关系,得到所述用户对邮件标题里包含的广告语的偏好;添加单元,用于根据所述用户对邮件标题里包含的广告语的偏好,将所述广告语添加到邮件标题里,并将所述广告语的词性信息添加到网页链接中。
根据本申请实施例,获取用户通过邮件里的网页链接访问网站的访问日志,对访问日志进行解析,得到用户唯一标识及用户访问的网页链接中携带的广告语的词性信息,根据广告语的词性信息,确定该唯一标识对应的用户对广告语的偏好,从而获知用户的偏好,以便于采用针对性的广告语向用户发送邮件,提高邮件的打开率,解决了由于无法获知用户的偏好导致发送的推广邮件打开率低的技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本发明实施例的数据分析方法的流程图;
图2是根据本发明实施例的邮件发送方法的流程图;
图3是根据本发明实施例的数据分析装置的示意图;
图4是根据本发明实施例的邮件发送装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请实施例,提供了一种数据分析方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本申请实施例的数据分析方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取用户通过邮件里的网页链接访问网站的访问日志。
用户访问网站的行为记录在访问日志中,其中,访问日志还记录有用户的访问来源,例如,用户通过用于推广的邮件中链接访问的网站,用户通过其他网站里携带的友情链接访问的网站等。本申请实施例中,获取用户通过邮件里的网页链接访问网站的访问日志,该日志可以存储在邮件发送服务器中。
需要说明的是,本申请中向用户发送的邮件中包含有广告语,并将该广告语的词性信息嵌入到网页链接中,将广告语和嵌入该广告语的词性信息的网页链接添加到同一邮件中发送给用户。其中,词性信息为按照预设规则(如常用广告语词性规则)预先定义并划分的,如品牌词、口碑/问询词、价格词、活动词、通用词等对应的常用广告语。当然,同一广告语还可以具有多种词性,并确定每种词性的权重比例,这样,嵌入到网页链接中的词性信息则包括多种词性及其相应的权重。
网页链接可以是以统一资源定位符(Uniform Resource Locator简称为URL),优选地,在网页链接为URL的情况下,广告语的词性信息可以以参数的方式嵌入到URL的尾部。优选地,广告语可以是添加到邮件的标题中内容。
步骤S104,对访问日志进行解析,得到用户唯一标识及用户访问的网页链接中携带的广告语的词性信息,其中,广告语的词性信息,为根据用户访问邮件的邮件标题的词性信息确定的,网页链接为邮件推广的网页链接。
访问日志中记录有用户点击的网页链接,因此,在获取到访问日志之后,对该访问日志进行解析,以获取到用户的唯一标识以及该用户访问的网页链接中携带的广告语的词性信息。具体地,由于在将广告语的词性信息以参数的方式嵌入到网页链接中,因此,可以从该网页链接的相应的字段中解析得到词性信息。本申请中对访问日志的解析可以是对每一条访问日志进行解析,得到用于表示用户的唯一标识及其访问的网页链接中携带的广告语的词性信息。
步骤S106,根据广告语的词性信息,确定该唯一标识对应的用户对广告语的偏好。
由于广告语是用于吸引用户点击网页链接的重要因素,用户在查看邮件过程中,会受到邮件标题所包含的广告语的影响,如果其对某一类词性的广告语具有偏好,则会比较关注具有这类广告语的邮件,本申请实施例中,通过从历史访问日志中解析得到用户点击过的网页链接中的词性信息,并将其与用户的唯一标识相关联,因此可以统计出用户偏好于哪一类词性的广告语,进而确定出用户对邮件标题里包含的广告语的偏好,以便于采用针对性的广告语向用户发送邮件,提高邮件的打开率。
根据本申请实施例,获取用户通过邮件里的网页链接访问网站的访问日志,对访问日志进行解析,得到用户唯一标识及用户访问的网页链接中携带的广告语的词性信息,根据广告语的词性信息,确定该唯一标识对应的用户对广告语的偏好,从而获知用户的偏好,以便于采用针对性的广告语向用户发送邮件,提高邮件的打开率,解决了由于无法获知用户的偏好导致发送的推广邮件打开率低的技术问题。
本申请实施例中的广告语优先放置在邮件的标题,其中广告语的词性分类,可以先从邮件发送服务器中导出之前发送过的一段时间内的邮件标题,然后人工按照广告语的词性规则,对邮件标题里包含的广告语的词性进行定义,形成广告语的词性种类及其相关的广告语,如果广告语包含有多种词性,则按照规则定义该广告语的各词性权重比例,最终形成广告语的词性对照表。在发送邮件时,将广告语对应的词性信息嵌入到网页链接中即可。
优选地,用户的唯一标识可以是由用户在第一次通过邮件里的网页链接进行网站时生成的,具体地,网站本地上部署有检测代码,当用户通过邮件链接进入网站时,生成第三方cookie以及该用户唯一标识。
优选地,根据广告语的词性信息,确定该唯一标识对应的用户对广告语的偏好包括:按照词性信息的类别对唯一标识对应的用户通过邮件里的网页链接访问网站的次数进行统计,得到每一类别的词性信息对应的访问次数;由统计得到的访问次数确定唯一标识对应的用户对邮件标题里包含的广告语的偏好,其中,访问次数越高表示用户对相应类别的广告语的偏好越强。
本实施例中,当每一个广告语对应一种词性时,用户对邮件标题里包含的广告语的偏好可以是根据用户对每一种类的广告语的邮件中网页链接的访问次数来确定。具体地,按照解析出的词性信息的类别进行统计,统计出用户对每一种类词性的广告语所在邮件中网页链接的访问次数。例如,记录的用户X的访问日志中,由词性A的广告语访问网站的次数为10,词性B的广告语访问网站的次数为1,词性C的广告语访问网站的次数为2。由此得出,该用户X对词性A的广告语具有较强的偏好,对词性B的广告语的偏好较弱。
根据本申请实施例,将每一个广告语定义一种词性,这样,可以通过用户对每一类别的词性信息对应的访问次数来确定用户的偏好,确定方式简单易操作。
可选地,在邮件标题里包含的广告语具有多种词性的情况下,邮件里的网页链接中携带的广告语的词性信息包括多种词性及其权重,其中,根据广告语的词性信息,确定该唯一标识对应的用户对广告语的偏好包括:按照词性信息的类别对唯一标识对应的用户访问的网页链接中携带的广告语的词性信息的权重进行计算,得到每一类别的词性信息对应的权重总值;由权重总值确定唯一标识对应的用户对邮件标题里包含的广告语的偏好,其中,权重总值越大表示用户对相应类别的广告语的偏好越强。
本实施例中,如果预先定义的一个广告语对应有多种词性时,则按照规则确定每种词性的权重,例如,广告语a对应有三种词性,分别为词性A、词性B、词性C,其中,每一种词性的权重依次为0.7、0.2、0.1,即广告语a的词性A的权重为0.7,词性B的权重为0.2,词性C的权重为0.1。
这种情况下,需要计算用户打开过的邮件中广告语的各种词性的权重总值,例如,用户Y有4条访问日志,其中,四条广告语的词性及其权重分别为:【词性A(0.7)、词性B(0.1)、词性C(0.2)】、【词性A(0.6)、词性B(0.2)、词性C(0.2)】、【词性A(0.3)、词性B(0.4)、词性C(0.3)】、【词性A(0.8)、词性B(0.1)、词性C(0.1)】,计算各种词性的权重总值:词性A(2.4)、词性B(0.8)、词性C(0.8)。由此得出,该用户对词性A的广告语的偏好较强。
由于并非每一条广告语的词性都能够清晰的界定,通过对同一广告语定义多种词性及其相应的权重,这样能够保证最终确定出的用户的偏好的准确性。
本申请实施例中,在确定出用户的偏好之后,将用于表示用户的对每一种词性的广告语的偏好的参数与该用户对应的唯一标识关联在一起,保存在用户标签服务器中,作为该用户的标签。
优选地,在根据所述广告语的词性信息,确定该唯一标识对应的用户对所述广告语的偏好之后,方法还包括:根据确定出的用户对邮件标题里包含的广告语的偏好,计算词性信息的群体热度和群体区分度,其中,群体热度表示具有同一预设属性的用户群体对邮件标题里包含的广告语的偏好情况,群体区分度表示对每一类别的词性信息具有偏好的用户群体的用户数量。
其中,预设属性可以是例如性别、年龄、所在区域等用于表示用户人群的属性。群体热度可是指某一个属性下用户群体对邮件标题里包含的广告语的偏好情况,例如,同一性别人群对邮件标题里包含的广告语的偏好情况,或者同一年龄段的人群对邮件标题里包含的广告语的偏好情况等。其中,用户群体的属性可以在用户访问网站时,记录在访问日志中,这样,就可以从访问日志中解析出来。群体区分度则是以广告语的词性种类为维度,统计对每一类广告语具有偏好的人群进行统计,从而统计出用户偏好较强,且偏好较强的用户群较大的词性种类;还可以以广告词的词性来对用户群进行划分,确定出哪些用户偏好这类词性的广告语。
具体地,可以利用聚类等机器学习算法,对用第三方cookie监测并输出的用户的偏好信息进行分类,计算不同广告语词性的群体热度以及群体区分度。
综上,本申请实施例,通过预先对邮件标题里包含的广告语进行词性分类,存储在邮件发送服务器中,以参数方式将词性信息嵌入在网页链接中(如URL尾部),当用户打开并进入网站时,生成该用户的第三方cookie,之后每一次的邮件打开行为,都会记录在邮件发送服务器中。通过解析用户访问日志中的URL,分析出该用户感兴趣的词性分布,以便后续EDM邮件标题自动推送该类词性广告语。
根据本申请实施例,提供了一种邮件发送方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
如图2所示,该邮件发送方法,包括:
步骤S202,确定用户的唯一标识和邮件标题里包含的广告语之间的关联关系。
其中,邮件标题里包含的广告语可以是根据本申请实施例中确定过的用户对广告语的偏好确定的,用户对邮件标题里包含的广告语的偏好是根据本申请实施例提供的上述用户访问数据的分析方法确定的。用户对邮件标题里包含的广告语的偏好与该用户对应的唯一标识关联在一起,保存在用户标签服务器中,因此,可以利用用户的唯一标识在用户标签服务器中匹配得到用户对邮件标题里包含的广告语的偏好,进而确定用户的唯一标识与广告语之间的关联关系。
步骤S204,根据关联关系,得到用户对邮件标题里包含的广告语的偏好。
步骤S206,根据用户对邮件标题里包含的广告语的偏好,将广告语添加到邮件标题里,并将广告语的词性信息添加到网页链接中。在添加完广告语和网页链接之后,将邮件发送给用户。
本申请实施例中,根据用户的偏好将用户偏好的词性的广告语以及携带有该广告语的词性信息的网页链接添加到邮件中发送给该用户,将用户特征与广告语的词性相关联,从而提高邮件的打开率,进而提高转化率。
本发明实施例还提供了一种数据分析装置,该装置可以用于执行本发明实施例的用户访问数据的分析方法,如图3所示,该装置包括:获取单元301、解析单元303和确定单元305。
获取单元301用于获取用户通过邮件里的网页链接访问网站的访问日志。
用户访问网站的行为记录在访问日志中,其中,访问日志还记录有用户的访问来源,例如,用户通过用于推广的邮件中链接访问的网站,用户通过其他网站里携带的友情链接访问的网站等。本申请实施例中,获取用户通过邮件里的网页链接访问网站的访问日志,该日志可以存储在邮件发送服务器中。
需要说明的是,本申请中向用户发送的邮件中包含有广告语,并将该广告语的词性信息嵌入到网页链接中,将广告语和嵌入该广告语的词性信息的网页链接添加到同一邮件中发送给用户。其中,词性信息为按照预设规则(如常用广告语词性规则)预先定义并划分的,如品牌词、口碑/问询词、价格词、活动词、通用词等对应的常用广告语。当然,同一广告语还可以具有多种词性,并确定每种词性的权重比例,这样,嵌入到网页链接中的词性信息则包括多种词性及其相应的权重。
网页链接可以是以统一资源定位符(Uniform Resource Locator简称为URL),优选地,在网页链接为URL的情况下,广告语的词性信息可以以参数的方式嵌入到URL的尾部。优选地,广告语可以是添加到邮件的标题中内容。
解析单元303用于对访问日志进行解析,得到用户唯一标识及用户访问的网页链接中携带的广告语的词性信息,其中,广告语的词性信息,为根据用户访问邮件的邮件标题的词性信息确定的,网页链接为邮件推广的网页链接。
访问日志中记录有用户点击的网页链接,因此,在获取到访问日志之后,对该访问日志进行解析,以获取到用户的唯一标识以及该用户访问的网页链接中携带的广告语的词性信息。具体地,由于在将广告语的词性信息以参数的方式嵌入到网页链接中,因此,可以从该网页链接的相应的字段中解析得到词性信息。本申请中对访问日志的解析可以是对每一条访问日志进行解析,得到用于表示用户的唯一标识及其访问的网页链接中携带的广告语的词性信息。
确定单元305用于根据广告语的词性信息,确定该唯一标识对应的用户对广告语的偏好。
由于广告语是用于吸引用户点击网页链接的重要因素,用户在查看邮件过程中,会受到邮件标题所包含的广告语的影响,如果其对某一类词性的广告语具有偏好,则会比较关注具有这类广告语的邮件,本申请实施例中,通过从历史访问日志中解析得到用户点击过的网页链接中的词性信息,并将其与用户的唯一标识相关联,因此可以统计出用户偏好于哪一类词性的广告语,进而确定出用户对邮件标题里包含的广告语的偏好,以便于采用针对性的广告语向用户发送邮件,提高邮件的打开率。
根据本申请实施例,获取用户通过邮件里的网页链接访问网站的访问日志,对访问日志进行解析,得到用户唯一标识及用户访问的网页链接中携带的广告语的词性信息,根据广告语的词性信息,确定该唯一标识对应的用户对广告语的偏好,从而获知用户的偏好,以便于采用针对性的广告语向用户发送邮件,提高邮件的打开率,解决了由于无法获知用户的偏好导致发送的推广邮件打开率低的技术问题。
本申请实施例中的广告语优先放置在邮件的标题,其中广告语的词性分类,可以先从邮件发送服务器中导出之前发送过的一段时间内的邮件标题,然后人工按照广告语的词性规则,对邮件标题里包含的广告语的词性进行定义,形成广告语的词性种类及其相关的广告语,如果广告语包含有多种词性,则按照规则定义该广告语的各词性权重比例,最终形成广告语的词性对照表。在发送邮件时,将广告语对应的词性信息嵌入到网页链接中即可。
优选地,用户的唯一标识可以是由用户在第一次通过邮件里的网页链接进行网站时生成的,具体地,网站本地上部署有检测代码,当用户通过邮件链接进入网站时,生成第三方cookie以及该用户唯一标识。
优选地,确定单元包括:统计模块,用于按照词性信息的类别对唯一标识对应的用户通过邮件里的网页链接访问网站的次数进行统计,得到每一类别的词性信息对应的访问次数;第一确定模块,用于由统计得到的访问次数确定唯一标识对应的用户对邮件标题里包含的广告语的偏好,其中,访问次数越高表示用户对相应类别的广告语的偏好越强。
本实施例中,当每一个广告语对应一种词性时,用户对邮件标题里包含的广告语的偏好可以是根据用户对每一种类的广告语的邮件中网页链接的访问次数来确定。具体地,按照解析出的词性信息的类别进行统计,统计出用户对每一种类词性的广告语所在邮件中网页链接的访问次数。例如,记录的用户X的访问日志中,由词性A的广告语访问网站的次数为10,词性B的广告语访问网站的次数为1,词性C的广告语访问网站的次数为2。由此得出,该用户X对词性A的广告语具有较强的偏好,对词性B的广告语的偏好较弱。
根据本申请实施例,将每一个广告语定义一种词性,这样,可以通过用户对每一类别的词性信息对应的访问次数来确定用户的偏好,确定方式简单易操作。
可选地,在邮件标题里包含的广告语具有多种词性的情况下,邮件里的网页链接中携带的广告语的词性信息包括多种词性及其权重,其中,确定单元包括:计算模块,用于按照词性信息的类别对唯一标识对应的用户访问的网页链接中携带的广告语的词性信息的权重进行计算,得到每一类别的词性信息对应的权重总值;第二确定模块,用于由权重总值确定唯一标识对应的用户对邮件标题里包含的广告语的偏好,其中,权重总值越大表示用户对相应类别的广告语的偏好越强。
本实施例中,如果预先定义的一个广告语对应有多种词性时,则按照规则确定每种词性的权重,例如,广告语a对应有三种词性,分别为词性A、词性B、词性C,其中,每一种词性的权重依次为0.7、0.2、0.1,即广告语a的词性A的权重为0.7,词性B的权重为0.2,词性C的权重为0.1。
这种情况下,需要计算用户打开过的邮件中广告语的各种词性的权重总值,例如,用户Y有4条访问日志,其中,四条广告语的词性及其权重分别为:【词性A(0.7)、词性B(0.1)、词性C(0.2)】、【词性A(0.6)、词性B(0.2)、词性C(0.2)】、【词性A(0.3)、词性B(0.4)、词性C(0.3)】、【词性A(0.8)、词性B(0.1)、词性C(0.1)】,计算各种词性的权重总值:词性A(2.4)、词性B(0.8)、词性C(0.8)。由此得出,该用户对词性A的广告语的偏好较强。
由于并非每一条广告语的词性都能够清晰的界定,通过对同一广告语定义多种词性及其相应的权重,这样能够保证最终确定出的用户的偏好的准确性。
本申请实施例中,在确定出用户的偏好之后,将用于表示用户的对每一种词性的广告语的偏好的参数与该用户对应的唯一标识关联在一起,保存在用户标签服务器中,作为该用户的标签。
优选地,装置还包括:计算单元,用于在根据所述广告语的词性信息,确定该唯一标识对应的用户对所述广告语的偏好之后,根据确定出的用户对邮件标题里包含的广告语的偏好,计算词性信息的群体热度和群体区分度,其中,群体热度表示具有同一预设属性的用户群体对邮件标题里包含的广告语的偏好情况,群体区分度表示对每一类别的词性信息具有偏好的用户群体的用户数量。
其中,预设属性可以是例如性别、年龄、所在区域等用于表示用户人群的属性。群体热度可是指某一个属性下用户群体对邮件标题里包含的广告语的偏好情况,例如,同一性别人群对邮件标题里包含的广告语的偏好情况,或者同一年龄段的人群对邮件标题里包含的广告语的偏好情况等。其中,用户群体的属性可以在用户访问网站时,记录在访问日志中,这样,就可以从访问日志中解析出来。群体区分度则是以广告语的词性种类为维度,统计对每一类广告语的词性信息具有偏好的人群进行统计,从而统计出用户偏好较强,且偏好较强的用户群较大的词性种类;还可以以广告词的词性来对用户群进行划分,确定出哪些用户偏好这类词性的广告语。
具体地,可以利用聚类等机器学习算法,对用第三方cookie监测并输出的用户的偏好信息进行分类,计算不同广告语词性的群体热度以及群体区分度。
综上,本申请实施例,通过预先对邮件标题里包含的广告语进行词性分类,存储在邮件发送服务器中,以参数方式将词性信息嵌入在网页链接中(如URL尾部),当用户打开并进入网站时,生成该用户的第三方cookie,之后每一次的邮件打开行为,都会记录在邮件发送服务器中。通过解析用户访问日志中的URL,分析出该用户感兴趣的词性分布,以便后续EDM邮件标题自动推送该类词性广告语。
所述用户访问数据的分析装置包括处理器和存储器,上述获取单元301、解析单元303和确定单元305等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数确定用户对邮件标题里包含的广告语的偏好。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本申请还提供了一种计算机程序产品的实施例,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:获取用户通过邮件里的网页链接访问网站的访问日志;对访问日志进行解析,得到用户唯一标识及用户访问的网页链接中携带的广告语的词性信息,其中,广告语的词性信息,为根据用户访问邮件的邮件标题的词性信息确定的,网页链接为邮件推广的网页链接;根据广告语的词性信息,确定该唯一标识对应的用户对广告语的偏好。
本发明实施例还提供了一种邮件发送装置,该装置可以用于执行本发明实施例的邮件发送方法,如图4所示,该装置包括:关系确定单元401、偏好获取单元403和添加单元405。
关系确定单元401用于确定用户的唯一标识和邮件标题里包含的广告语之间的关联关系。
其中,邮件标题里包含的广告语可以是根据本申请实施例中确定过的用户对广告语的偏好确定的,用户对邮件标题里包含的广告语的偏好是根据本申请实施例提供的上述用户访问数据的分析方法确定的。用户对邮件标题里包含的广告语的偏好与该用户对应的唯一标识关联在一起,保存在用户标签服务器中,因此,可以利用用户的唯一标识在用户标签服务器中匹配得到用户对邮件标题里包含的广告语的偏好,进而确定用户的唯一标识与广告语之间的关联关系。
偏好获取单元403用于根据关联关系,得到用户对邮件标题里包含的广告语的偏好。
添加单元405用于根据用户对邮件标题里包含的广告语的偏好,将广告语添加到邮件标题里,并将广告语的词性信息添加到网页链接中。
本申请实施例中,根据用户的偏好将用户偏好的词性的广告语以及携带有该广告语的词性信息的网页链接添加到邮件中发送给该用户,将用户特征与广告语的词性相关联,从而提高邮件的打开率,进而提高转化率。
所述邮件发送装置包括处理器和存储器,上述关系确定单元401、偏好获取单元403和添加单元405等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数向用户发送邮件。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本申请还提供了一种计算机程序产品的实施例,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:确定用户的唯一标识和邮件标题里包含的广告语之间的关联关系,根据所述关联关系,得到所述用户对邮件标题里包含的广告语的偏好,根据所述用户对邮件标题里包含的广告语的偏好,将所述广告语添加到邮件标题里,并将所述广告语的词性信息添加到网页链接中。在添加完广告语和网页链接之后,将邮件发送给用户。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (10)

1.一种数据分析方法,其特征在于,包括:
获取用户通过邮件里的网页链接访问网站的访问日志;
对所述访问日志进行解析,得到用户唯一标识及用户访问的网页链接中携带的广告语的词性信息,其中,所述广告语的词性信息,为根据用户访问所述邮件的邮件标题的词性信息确定的,所述网页链接为邮件推广的网页链接;
根据所述广告语的词性信息,确定该唯一标识对应的用户对所述广告语的偏好。
2.根据权利要求1所述的方法,其特征在于,根据所述广告语的词性信息,确定该唯一标识对应的用户对所述广告语的偏好包括:
按照所述词性信息的类别对所述唯一标识对应的用户通过邮件里的网页链接访问网站的次数进行统计,得到每一类别的词性信息对应的访问次数;
由统计得到的访问次数确定所述唯一标识对应的用户对邮件标题里包含的广告语的偏好,其中,访问次数越高表示用户对相应类别的广告语的偏好越强。
3.根据权利要求1所述的方法,其特征在于,在所述邮件标题里包含的广告语具有多种词性的情况下,所述邮件里的网页链接中携带的广告语的词性信息包括所述多种词性及其权重,其中,根据所述广告语的词性信息,确定该唯一标识对应的用户对所述广告语的偏好包括:
按照所述词性信息的类别对所述唯一标识对应的用户访问的所述网页链接中携带的广告语的词性信息的权重进行计算,得到每一类别的广告语的词性信息对应的权重总值;
由所述权重总值确定所述唯一标识对应的用户对邮件标题里包含的广告语的偏好,其中,权重总值越大表示用户对相应类别的广告语的偏好越强。
4.根据权利要求1所述的方法,其特征在于,在根据所述广告语的词性信息,确定该唯一标识对应的用户对所述广告语的偏好之后,所述方法还包括:
根据确定出的用户对邮件标题里包含的广告语的偏好,计算词性信息的群体热度和群体区分度,其中,所述群体热度表示具有同一预设属性的用户群体对邮件标题里包含的广告语的偏好情况,所述群体区分度表示对每一类别的词性信息具有偏好的用户群体的用户数量。
5.一种邮件发送方法,其特征在于,包括:
确定用户的唯一标识和邮件标题里包含的广告语之间的关联关系;
根据所述关联关系,得到所述用户对邮件标题里包含的广告语的偏好;
根据所述用户对邮件标题里包含的广告语的偏好,将所述广告语添加到邮件标题里,并将所述广告语的词性信息添加到网页链接中。
6.一种数据分析装置,其特征在于,包括:
获取单元,用于获取用户通过邮件里的网页链接访问网站的访问日志;
解析单元,用于对所述访问日志进行解析,得到用户唯一标识及用户访问的网页链接中携带的广告语的词性信息,其中,所述广告语的词性信息,为根据用户访问所述邮件的邮件标题的词性信息确定的,所述网页链接为邮件推广的网页链接;
确定单元,用于根据所述广告语的词性信息,确定该唯一标识对应的用户对所述广告语的偏好。
7.根据权利要求6所述的装置,其特征在于,所述确定单元包括:
统计模块,用于按照所述词性信息的类别对所述唯一标识对应的用户通过邮件里的网页链接访问网站的次数进行统计,得到每一类别的词性信息对应的访问次数;
第一确定模块,用于由统计得到的访问次数确定所述唯一标识对应的用户对邮件标题里包含的广告语的偏好,其中,访问次数越高表示用户对相应类别的广告语的偏好越强。
8.根据权利要求6所述的装置,其特征在于,在所述邮件标题里包含的广告语具有多种词性的情况下,所述邮件里的网页链接中携带的广告语的词性信息包括所述多种词性及其权重,其中,所述确定单元包括:
计算模块,用于按照所述词性信息的类别对所述唯一标识对应的用户访问的网页链接中携带的广告语的词性信息的权重进行计算,得到每一类别的词性信息对应的权重总值;
第二确定模块,用于由所述权重总值确定所述唯一标识对应的用户对邮件标题里包含的广告语的偏好,其中,权重总值越大表示用户对相应类别的广告语的偏好越强。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括:
计算单元,用于在根据所述广告语的词性信息,确定该唯一标识对应的用户对所述广告语的偏好之后,根据确定出的用户对邮件标题里包含的广告语的偏好,计算词性信息的群体热度和群体区分度,其中,所述群体热度表示具有同一预设属性的用户群体对邮件标题里包含的广告语的偏好情况,所述群体区分度表示对每一类别的词性信息具有偏好的用户群体的用户数量。
10.一种邮件发送装置,其特征在于,包括:
关系确定单元,用于确定用户的唯一标识和邮件标题里包含的广告语之间的关联关系;
偏好获取单元,用于根据所述关联关系,得到所述用户对邮件标题里包含的广告语的偏好;
添加单元,用于根据所述用户对邮件标题里包含的广告语的偏好,将所述广告语添加到邮件标题里,并将所述广告语的词性信息添加到网页链接中。
CN201510771725.5A 2015-11-12 2015-11-12 数据分析方法、装置和邮件发送方法、装置 Pending CN106713106A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510771725.5A CN106713106A (zh) 2015-11-12 2015-11-12 数据分析方法、装置和邮件发送方法、装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510771725.5A CN106713106A (zh) 2015-11-12 2015-11-12 数据分析方法、装置和邮件发送方法、装置

Publications (1)

Publication Number Publication Date
CN106713106A true CN106713106A (zh) 2017-05-24

Family

ID=58930074

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510771725.5A Pending CN106713106A (zh) 2015-11-12 2015-11-12 数据分析方法、装置和邮件发送方法、装置

Country Status (1)

Country Link
CN (1) CN106713106A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090037355A1 (en) * 2004-12-29 2009-02-05 Scott Brave Method and Apparatus for Context-Based Content Recommendation
CN103377219A (zh) * 2012-04-24 2013-10-30 苏州引角信息科技有限公司 用户信息数据库的建构方法及其系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090037355A1 (en) * 2004-12-29 2009-02-05 Scott Brave Method and Apparatus for Context-Based Content Recommendation
CN103377219A (zh) * 2012-04-24 2013-10-30 苏州引角信息科技有限公司 用户信息数据库的建构方法及其系统

Similar Documents

Publication Publication Date Title
US11847612B2 (en) Social media profiling for one or more authors using one or more social media platforms
CN105335509B (zh) 一种推荐活动信息的方法、装置及服务器
US10325289B2 (en) User similarity groups for on-line marketing
JP5797806B2 (ja) ニュース記事のランク付けを向上させるためのシステムおよび方法
CN106997549A (zh) 一种广告信息的推送方法及系统
CN102866990B (zh) 一种主题对话方法和装置
CN106033415B (zh) 文本内容推荐方法及装置
EP1738524B1 (en) Method and system for generating a population representative of a set of users of a communication network
CN105069654A (zh) 一种基于用户识别的网站实时/非实时营销投放方法及系统
CN108805694B (zh) 信贷咨询服务方法、装置、设备及计算机可读存储介质
US20110218859A1 (en) Method, Apparatus and System for Increasing Website Data Transfer Speed
CN104835066A (zh) 一种投放渠道的选择方法及系统
CN106682686A (zh) 一种基于手机上网行为的用户性别预测方法
US10311120B2 (en) Method and apparatus for identifying webpage type
CN105678317B (zh) 一种信息处理方法及服务器
AU2008315748A1 (en) Method and computer system for automatically answering natural language questions
Sahni et al. Native advertising, sponsorship disclosure and consumer deception: Evidence from mobile search-ad experiments
CN103778225A (zh) 广告营销类语言信息的处理方法、识别装置及系统
US20150348059A1 (en) System and method for determining the shopping phase of a shopper
CN106570013A (zh) 页面访问数据的处理方法和装置
CN111447575B (zh) 短信息推送方法、装置、设备及存储介质
CN107291755A (zh) 一种终端推送方法及装置
CN103379161B (zh) 媒体信息展示方法、系统和装置
CN111461827A (zh) 产品评价信息的推送方法和装置
CN108595580B (zh) 新闻推荐方法、装置、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100083 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing

Applicant after: Beijing Guoshuang Technology Co.,Ltd.

Address before: 100086 Cuigong Hotel, 76 Zhichun Road, Shuangyushu District, Haidian District, Beijing

Applicant before: Beijing Guoshuang Technology Co.,Ltd.

CB02 Change of applicant information
RJ01 Rejection of invention patent application after publication

Application publication date: 20170524

RJ01 Rejection of invention patent application after publication