CN111918323B - 数据的校准方法、装置、设备以及存储介质 - Google Patents

数据的校准方法、装置、设备以及存储介质 Download PDF

Info

Publication number
CN111918323B
CN111918323B CN201910883535.0A CN201910883535A CN111918323B CN 111918323 B CN111918323 B CN 111918323B CN 201910883535 A CN201910883535 A CN 201910883535A CN 111918323 B CN111918323 B CN 111918323B
Authority
CN
China
Prior art keywords
data
behavior
view
operator
sdk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910883535.0A
Other languages
English (en)
Other versions
CN111918323A (zh
Inventor
范小赟
王贺
秦峰
潘思宇
钱宇
张姝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yunhai Taojin Data Technology Co ltd
Original Assignee
Beijing Yunhai Taojin Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yunhai Taojin Data Technology Co ltd filed Critical Beijing Yunhai Taojin Data Technology Co ltd
Priority to CN201910883535.0A priority Critical patent/CN111918323B/zh
Publication of CN111918323A publication Critical patent/CN111918323A/zh
Application granted granted Critical
Publication of CN111918323B publication Critical patent/CN111918323B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/08Testing, supervising or monitoring using real traffic

Abstract

本发明提供一种数据的校准方法、装置、设备以及存储介质,该方法通过获取运营商数据和SDK数据,其中,运营商数据为运营商采集的用户数据,SDK数据为SDK监测到的多个终端设备的用户数据,根据运营商数据和SDK数据,得到与运营商数据对应的第一行为视图和与SDK数据对应的第二行为视图,第一行为视图用于表示全部运营商用户在每个维度的行为,第二行为视图用于表示多个终端设备用户在每个维度的行为,并根据第一行为视图与第二行为视图,对第一行为视图进行校准,解决了现有技术中对运营商数据进行简单的放大或者仅采集SDK监测的少量数据,而导致的用户行为视图不可靠的问题。

Description

数据的校准方法、装置、设备以及存储介质
技术领域
本发明涉及数据处理技术领域,尤其涉及一种数据的校准方法、装置、设备以及存储介质。
背景技术
随着各数据处理技术的不断发展,对于运营商数据的分析处理,为各领域的技术发展以及研究方向提供了强大的数据支撑。
目前,运营商数据主要为第三代移动通信技术(the 3th Generation mobilecommunication technology,3G)或者第四代移动通信技术(the 4th Generation mobilecommunication technology,4G)数据,即用户使用手机流量上网的数据,通过分析汇总运营商数据,能够从多维度进行用户行为的统计,并将多维度的统计结果进行汇总,得到用户行为视图,即获取用户画像。
然而,由于技术的限制,用户通过手机使用无线宽带wi-fi上网的数据不能与用户主体关联,所以无法用于用户画像,并且,一般无法同时获取多家运营商的全量用户数据,因此,现有技术无法进行用户全方位画像,进而,使用户行为视图的数据不可靠。
发明内容
本发明提供一种数据的校准方法、装置、设备以及存储介质,解决了由于运营商数据不全面,导致的用户行为视图的数据不可靠的问题。
第一方面,本发明提供一种数据的校准方法,包括:
获取运营商数据和软件开发工具包SDK数据;其中,所述运营商数据为运营商采集的用户数据,所述SDK数据为SDK监测到的多个终端设备的用户数据;
根据所述运营商数据和所述SDK数据,得到与所述运营商数据对应的第一行为视图和与所述SDK数据对应的第二行为视图,所述第一行为视图用于表示全部运营商用户在每个维度的行为,所述第二行为视图用于表示多个终端设备用户在每个维度的行为;
根据所述第一行为视图与所述第二行为视图,对所述第一行为视图进行校准。
在一种具体的实现方式中,所述根据所述第一行为视图与所述第二行为视图,对所述第一行为视图进行校准,包括:
将所述第一行为视图与所述第二行为视图的每个维度的行为进行对比,根据所述第二行为视图的每个行为在所述维度中所占的比例,对所述第一行为视图进行加权计算,得到校准后的第一行为视图。
在一种具体的实现方式中,所述运营商数据和所述SDK数据均包括多个操作数据,所述根据所述运营商数据和所述SDK数据,得到与所述运营商数据对应的第一行为视图和与所述用户操作数据对应的第二行为视图,包括:
根据所述运营商数据和所述SDK数据,以及第一对应关系,得到与所述运营商数据对应的第一行为数据和与所述SDK数据对应的第二行为数据,所述第一对应关系用于表示操作数据与用户行为之间的对应关系;
对所述第一行为数据进行多维度统计,得到所述第一行为视图;对所述第二行为数据进行多维度统计,得到所述第二行为视图;
其中,所述第一行为数据包括多个用户的行为数据。
进一步地,所述方法还包括:
根据所述第一行为数据中每个用户的行为数据和行为权重,计算得到所述用户的至少一个行为的得分,所述行为权重为预设值或者根据深度学习算法确定的;
根据所述至少一个行为的得分,为所述用户设置标签;其中,所述标签包括购买意向标签、兴趣标签、资产标签、消费能力标签中的至少一种。
可选的,所述方法还包括:
根据所述SDK数据以及预设置的数据处理机制,生成操作数据与用户行为的对应关系;
根据所述操作数据与用户行为的对应关系更新所述第一对应关系。
第二方面,本发明提供一种数据的校准装置,包括:
数据采集模块,用于获取运营商数据和软件开发工具包SDK数据;其中,所述运营商数据为运营商采集的用户的数据,所述SDK数据为SDK监测到的多个终端设备的用户数据;
数据校准模块,用于根据所述运营商数据和所述SDK数据,得到与所述运营商数据对应的第一行为视图和与所述SDK数据对应的第二行为视图,所述第一行为视图用于表示全部运营商用户在每个维度的行为,所述第二行为视图用于表示多个终端设备用户在每个维度的行为;
所述数据校准模块还用于根据所述第一行为视图与所述第二行为视图,对所述第一行为视图进行校准。
在一种具体的实现方式中,所述数据校准模块具体用于:
将所述第一行为视图与所述第二行为视图的每个维度的行为进行对比,根据所述第二行为视图的每个行为在所述维度中所占的比例,对所述第一行为视图进行加权计算,得到校准后的第一行为视图。
在一种具体的实现方式中,所述数据校准模块具体用于:
根据所述运营商数据和所述SDK数据,以及第一对应关系,得到与所述运营商数据对应的第一行为数据和与所述SDK数据对应的第二行为数据,所述第一对应关系用于表示操作数据与用户行为之间的对应关系;
对所述第一行为数据进行多维度统计,得到所述第一行为视图;对所述第二行为数据进行多维度统计,得到所述第二行为视图;
其中,所述第一行为数据包括多个用户的行为数据。
进一步地,所述装置还包括:行为洞察模块;
所述行为洞察模块用于
根据所述第一行为数据中每个用户的行为数据和行为权重,计算得到所述用户的至少一个行为的得分,所述行为权重为预设值或者根据深度学习算法确定的;
根据所述至少一个行为的得分,为所述用户设置标签;其中,所述标签包括购买意向标签、兴趣标签、资产标签、消费能力标签中的至少一种。
可选的,所述装置还包括:更新模块;
所述更新模块用于:
根据所述SDK监测到的多个终端设备的SDK数据以及预设置的数据处理机制,生成操作数据与用户行为的对应关系;
根据所述操作数据与用户行为的对应关系更新所述第一对应关系。
第三方面,本发明提供一种服务器,包括:存储器及处理器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,使得所述处理器执行如第一方面任一项所述的数据的校准方法。
第四方面,本发明提供一种存储介质,包括:可读存储介质和计算机程序,所述计算机程序用于实现第一方面任一项所述的数据的校准方法。
本发明实施例提供的一种数据的校准方法、装置、设备以及存储介质,通过获取运营商数据和SDK数据,根据运营商数据和SDK数据,得到与运营商数据对应的第一行为视图和与SDK数据对应的第二行为视图,第一行为视图用于表示全部运营商用户在每个维度的行为,第二行为视图用于表示多个终端设备用户在每个维度的行为,并根据第一行为视图与第二行为视图,对第一行为视图进行校准,解决了现有技术中对运营商数据进行简单的放大或者仅采集SDK监测的少量数据,而导致的用户行为视图不可靠、用户画像不准确的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种数据校准系统的结构示意图;
图2为本发明实施例提供的一种数据的校准方法实施例一的流程示意图;
图3为本发明实施例提供的一种数据的校准方法实施例二的流程示意图;
图4为本发明实施例提供的一种数据的校准方法实施例三的流程示意图;
图5为本发明实施例提供的一种数据的校准装置实施例一的结构示意图;
图6为本发明实施例提供的一种数据的校准装置实施例二的结构示意图;
图7为本发明实施例提供的一种数据的校准装置实施例三的结构示意图
图8为本发明一实施例提供的服务器的硬件结构示意图一。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本文中使用的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明的说明书中通篇提到的“一实施例”或“另一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各处出现的“在一实施例中”或“本实施例中”未必一定指相同的实施例。需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
本发明的执行主体是一种数据校准系统,该数据校准系统安装于一种服务器,也可以是云端服务器。
图1为本发明实施例提供的一种数据校准系统的结构示意图,如图1所示,该数据校准系统包括数据采集模块、数据校准模块和行为洞察模块。
其中,数据采集模块设置有运营商数据接口和软件开发工具包(SoftwareDevelopment Kit,SDK)数据接口,通过运营商数据接口可采集运营商数据,该运营商数据为运营商采集的用户数据,通过SDK数据接口可获取多个终端设备中特定行业或者特定应用程序(Application,APP)的用户数据。
数据校准模块包括以下三种子模块:用户行为解析、多维度统计和数据对比较准。用户行为解析是将原始的上网日志数据解析匹配成用户具体的行为数据。多维度统计是将用户的行为数据按照预设的维度进行归纳统计,形成两个用户行为视图,一个为基于运营商数据的第一行为视图,另一个为基于SDK的第二行为视图。数据对比校准是将两个用户行为视图按照行业、手机系统类型、网络制式、运营商分布、城市等维度进行对比,并按照第二行为视图所计算的比例对运营商数据进行加权调整。
行为洞察模块包括以下三种子模块:行为权重配置、行为得分计算、用户标签归类。行为权重配置是指对用户行为进行权重分配,为后续用户行为得分做准备。行为得分计算是指结合用户各种行为次数和行为权重,并通过一定的算法计算出用户行为得分。用户标签归类是指根据用户行为得分将用户进行归类并打上标签。
本发明提供一种数据的校准方法,应用于上述设备中以实现数据的校准,提供可靠的数据服务,下面通过几个具体的实施例进行说明。
图2为本发明实施例提供的一种数据的校准方法实施例一的流程示意图,如图2所示,该数据的校准方法包括:
S101:获取运营商数据和SDK数据。
应理解,在数据校准系统中设置有运营商数据接口和SDK数据接口,使数据校准系统能够通过运营商数据接口从运营商数据库中获取运营商数据,一般来说,该运营商数据为运营商采集的用户数据,并通过SDK数据接口获取SDK数据,SDK数据为通过SDK监测多个终端设备中的用户数据。SDK是预先安装在多个用户的终端设备中的,通过SDK能够监测并获取每个终端设备中的用户数据。
可选的,终端设备包括手机、电脑、平板、智能可穿戴设备、智能家居产品等。
S102:根据运营商数据和SDK数据,得到与运营商数据对应的第一行为视图和与用户数据对应的第二行为视图。
其中,第一行为视图用于表示全部运营商用户在每个维度的行为,第二行为视图用于表示多个终端设备用户在每个维度的行为。一般来说,第一行为视图的统计维度与第二行为视图的统计维度存在对应关系,这里所说的维度至少包括行业、手机系统类型、网络制式、运营商分布、城市等
可选的,运营商数据和SDK数据均包括上网日志数据。
S103:根据第一行为视图与第二行为视图,对第一行为视图进行校准。
在本步骤中,可将第一行为视图中每个维度的行为与第二行为视图中对应维度的行为进行对比,根据第二行为视图中该维度的不同行为之间的关系,对第一行为视图进行校准,对第一行为视图的校准包括对第一行为视图中缺失数据的扩展。
在本方案中,运营商可以是一至多个,终端设备所加入的运营商可以是相同的也可以是不同的,因此,本方案获取的运营商数据对应的用户可以覆盖全部终端设备的用户,或者不能覆盖全部终端设备的用户,针对上述情况,本步骤包括不同的实现方式。
方式一:运营商数据对应的用户不能覆盖全部终端设备的用户,即存在至少一个终端设备的用户在运营商数据中不存在对应数据时,或者运营商数据对应的用户能够覆盖全部终端设备的用户时,均可通过以下方案对第一行为视图进行校准:将第一行为视图与第二行为视图的每个维度的行为进行对比,根据第二行为视图的每个行为在该维度中所占的比例,对第一行为视图进行加权计算,得到校准后的第一行为视图。
以房地产行业为例,某运营商数据中统计的使用运营商网络(例如3G或者4G网络)上网看房的人数为30万;利用SDK监测到的多个终端设备的用户数据中看房人数为2万人,其中用运营商网络看房的人数为1.5万,用wi-fi看房的人数为5000。根据SDK监测的多个终端设备的用户数据,看房客户中,使用运营商网络看房的人数和使用wi-fi看房的人数比例为3:1,据此对第一行为视图进行加权计算,某运营商用户中看房的总人数为30万(使用运营商网络)+10万(使用wi-fi)=40万人。
进一步地,若上述示例中运营商数量为多个,则第一行为视图的数量也为多个,根据第二行为视图的每个行为在每个维度中所占的比例,对每个第一视图进行加权计算,得到校准后的第一行为视图。
可选的,可以根据SDK监测的多个终端设备的用户数据中某运营商用户所占比例对运营商数据进行加权放大,从而得到整个市场的用户数量。
方式二:运营商数据对应的用户能够覆盖全部终端设备的用户时,可通过以下方案对第一行为视图进行校准:将第二行为视图中与第一行为视图不重叠部分占重叠部分的比例作为权值,对第一行为视图进行加权计算,得到校准后的第一行为视图。
仍以房地产行业为例,第一行为视图中统计的使用运营商网络(例如3G或者4G网络)上网看房的人数为30万;第二行为视图中看房人数为2万人,其中用运营商网络看房的人数为1.5万,用wi-fi看房的人数为5000。第二行为视图中用运营商网络看房的人数包含于第一行为视图中使用运营商网络看房的人数,即第二行为视图中用运营商网络看房的人数为在该维度下第二行为视图与第一行为视图重叠的部分,而使用wi-fi看房的人数为与第二行为视图不重叠的部分,因此,第二行为视图中使用运营商网络看房的人数和使用wi-fi看房的人数比例为3:1,据此对第一行为视图进行加权计算,运营商用户中看房的总人数为30万(使用运营商网络)+10万(使用wi-fi)=40万人。
本发明实施例提供的一种数据的校准方法,通过获取运营商数据和SDK监测到的多个终端设备的用户数据,根据运营商数据和SDK数据,得到与运营商数据对应的第一行为视图和与SDK数据对应的第二行为视图,第一行为视图用于表示全部运营商用户在每个维度的行为,第二行为视图用于表示多个终端设备用户在每个维度的行为,并根据第一行为视图与第二行为视图,对第一行为视图进行校准,解决了现有技术中对运营商数据进行简单的放大获取仅采集SDK监测的少量数据,而导致的用户行为视图不可靠、用户画像不准确的问题。
在图2所示实施例的基础上,图3为本发明实施例提供的一种数据的校准方法实施例二的流程示意图,如图3所示,上述步骤S102根据运营商数据和SDK数据,得到与运营商数据对应的第一行为视图和与SDK数据对应的第二行为视图,具体包括:
S1021:根据运营商数据和SDK数据,以及第一对应关系,得到与运营商数据对应的第一行为数据和与SDK数据对应的第二行为数据。
应理解,运营商数据和SDK数据均包括多个操作数据,该操作数据可以是从上网日志数据中获取的,例如用户浏览网页的网址、浏览时间、打开咨询弹窗、拨打页面网络电话、通过链接跳转至聊天工具、通过链接跳转至广告页面等。
其中,第一对应关系用于表示操作数据与用户行为之间的对应关系,可选的,第一对应关系可以是预先设置的,或者可以是在数据校准的过程中获取的,并在数据校准的过程中不断更新第一对应关系。
作为一种示例,根据SDK监测到的多个终端设备的用户数据以及预设置的数据处理机制,生成操作数据与用户行为的对应关系,并根据操作数据与用户行为的对应关系更新第一对应关系。其中,数据校准系统可一次生成一个操作数据与用户行为的对应关系,并逐个将其添加至第一对应关系;也可以生成多个操作数据与用户行为的对应关系,将多个操作数据与用户行为的对应关系一次添加至第一对应关系。
本步骤主要实现了将运营商数据和SDK数据中的操作数据,对应到用户的行为,得到第一行为数据和第二行为数据。即通过用户的操作识别用户的行为,例如操作数据是某视频网站的网址,通过第一对应关系,得到该用户行为为看电影。
S1022:对第一行为数据进行多维度统计,得到第一行为视图,并对第二行为数据进行多维度统计,得到第二行为视图。
将第一行为数据根据多个不同维度进行统计,得到第一行为视图,类似的,将第二行为数据根据多个不同维度进行统计,得到第二行为视图,第一行为视图和第二行为视图均包括多个用户的行为数据。
本实施例中,根据运营商数据和SDK数据,以及第一对应关系,得到与运营商数据对应的第一行为数据和与SDK数据对应的第二行为数据,第一对应关系用于表示操作数据与用户行为之间的对应关系,并对第一行为数据进行多维度统计,得到第一行为视图;对第二行为数据进行多维度统计,得到第二行为视图,实现了将采集的原始操作数据对应到用户的行为,并通过多个维度的统计,展现出运营商侧和终端设备侧的全方位的用户行为视图,为各领域提供优质的数据服务。
在上述实施例的基础上,图4为本发明实施例提供的一种数据的校准方法实施例三的流程示意图,如图4所示,该方法还包括:
S201:根据第一行为数据中每个用户的行为数据和行为权重,计算得到用户的至少一个行为的得分。
其中,行为权重为预设值或者根据深度学习算法确定的。
基于步骤S1021中得到的第一行为数据,根据第一行为数据中每个用户的行为数据和行为权重,对用户的至少一个行为进行打分。
例如,在判断用户是否有购房意向时,浏览房屋信息的权重为1,咨询房产中介的权重为5,结合第一行为数据中每个用户的浏览房屋信息的次数和咨询房产中介的此处,根据行为权重,通过计算得出用户行为得分。
S202:根据至少一个行为的得分,为用户设置标签。
其中,标签包括购买意向标签、兴趣标签、资产标签、消费能力标签等等中的至少一种。
在本步骤中,可根据一个行为的得分,为用户设置标签,或者可根据两个以上的行为的得分,通过综合判断得到综合得分,为用户设置标签。示例性的,可根据至少一个行为的得分和预设置的每个得分或者每个得分区与标签之间的对应关系,得到该用户的标签,或者,通过至少一个行为的得分或者综合得分与预设阈值的比较结果,确定该用户的标签。
仍以判断用户是否有购房意向为例,根据用户行为得分将用户购房意向得分高的用户为购买意向高的用户,得分低的为购买意向低的用户。
本实施例中,根据第一行为数据中每个用户的行为数据和行为权重,计算得到用户的至少一个行为的得分,并根据至少一个行为的得分,为用户设置标签,实现了从多种维度对用户进行识别和归类,增加了数据价值,为数据服务提供可靠的数据支撑。
图5为本发明实施例提供的一种数据的校准装置实施例一的结构示意图,如图5所示,该数据的校准装置100包括:
数据采集模块101,用于获取运营商数据和SDK数据;其中,所述运营商数据为运营商采集的用户的数据,所述SDK数据为SDK监测到的多个终端设备的用户数据;
数据校准模块102,用于根据所述运营商数据和所述SDK数据,得到与所述运营商数据对应的第一行为视图和与所述SDK数据对应的第二行为视图,所述第一行为视图用于表示全部运营商用户在每个维度的行为,所述第二行为视图用于表示多个终端设备用户在每个维度的行为;
所述数据校准模块102还用于根据所述第一行为视图与所述第二行为视图,对所述第一行为视图进行校准。
本发明实施例提供的一种数据的校准装置100包括数据采集模块101和数据校准模块102,通过获取运营商数据和SDK监测到的多个终端设备的用户数据,根据运营商数据和SDK数据,得到与运营商数据对应的第一行为视图和与SDK数据对应的第二行为视图,第一行为视图用于表示全部运营商用户在每个维度的行为,第二行为视图用于表示多个终端设备用户在每个维度的行为,并根据第一行为视图与第二行为视图,对第一行为视图进行校准,解决了现有技术中对运营商数据进行简单的放大或者仅采集SDK监测的少量数据,而导致的用户行为视图不可靠、用户画像不准确的问题。
在一种可能的设计中,数据校准模块102具体用于:
将所述第一行为视图与所述第二行为视图的每个维度的行为进行对比,根据所述第二行为视图的每个行为在所述维度中所占的比例,对所述第一行为视图进行加权计算,得到校准后的第一行为视图。
在一种可能的设计中,数据校准模块102具体用于:
根据所述运营商数据和所述SDK数据,以及第一对应关系,得到与所述运营商数据对应的第一行为数据和与所述SDK数据对应的第二行为数据,所述第一对应关系用于表示操作数据与用户行为之间的对应关系;
对所述第一行为数据进行多维度统计,得到所述第一行为视图;对所述第二行为数据进行多维度统计,得到所述第二行为视图;
其中,所述第一行为数据包括多个用户的行为数据。
在图5所示实施例的基础上,图6为本发明实施例提供的一种数据的校准装置实施例二的结构示意图,如图6所示,该数据的校准装置100还包括:
行为洞察模块103;
所述行为洞察模块103用于
根据所述第一行为数据中每个用户的行为数据和行为权重,计算得到所述用户的至少一个行为的得分,所述行为权重为预设值或者根据深度学习算法确定的;
根据所述至少一个行为的得分,为所述用户设置标签;其中,所述标签包括购买意向标签、兴趣标签、资产标签、消费能力标签中的至少一种。
在图5和图6所示实施例的基础上,图7为本发明实施例提供的一种数据的校准装置实施例三的结构示意图,如图7所示,该数据的校准装置100还包括:
更新模块104;
所述更新模块104用于:
根据所述SDK监测到的多个终端设备的用户数据以及预设置的数据处理机制,生成操作数据与用户行为的对应关系;
根据所述操作数据与用户行为的对应关系更新所述第一对应关系。
本实施例提供的数据的校准装置,可以执行上述方法实施例的技术方案,其实现原理和技术效果类似,本实施例此处不再赘述。
图8为本发明一实施例提供的服务器的硬件结构示意图一。如图8所示,本实施例提供的服务器10可以包括:存储器11、处理器12;可选的还可以包括总线13。其中,总线13用于实现各元件之间的连接。
所述存储器11存储计算机执行指令;
所述处理器12执行所述存储器11存储的计算机执行指令,使得所述处理器执行前述第一设备侧实施例提供的数据的校准方法。
其中,存储器和处理器之间直接或间接地电性连接,以实现数据的校准或交互。例如,这些元件相互之间可以通过一条或者多条通信总线或信号线实现电性连接,如可以通过总线连接。存储器中存储有实现数据访问控制方法的计算机执行指令,包括至少一个可以软件或固件的形式存储于存储器中的软件功能模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理。
存储器可以是,但不限于,随机存取存储器(Random Access Memory,简称:RAM),只读存储器(Read Only Memory,简称:ROM),可编程只读存储器(Programmable Read-OnlyMemory,简称:PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,简称:EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,简称:EEPROM)等。其中,存储器用于存储程序,处理器在接收到执行指令后,执行程序。进一步地,上述存储器内的软件程序以及模块还可包括操作系统,其可包括各种用于管理系统任务(例如内存管理、存储设备控制、电源管理等)的软件组件和/或驱动,并可与各种硬件或软件组件相互通信,从而提供其他软件组件的运行环境。
处理器可以是一种集成电路芯片,具有信号的处理能力。上述的处理器202可以是通用处理器,包括中央处理器(Central Processing Unit,简称:CPU)、网络处理器(Network Processor,简称:NP)等。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机执行指令,计算机执行指令被处理器执行时可以实现上述任一方法实施例提供的数据的校准方法。
本实施例中的计算机可读存储介质可以是计算机能够存取的任何可用介质,或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备,可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如SSD)等。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种数据的校准方法,其特征在于,包括:
获取运营商数据和软件开发工具包SDK数据;其中,所述运营商数据为运营商采集的用户数据,所述SDK数据为SDK监测到的多个终端设备的用户数据;
根据所述运营商数据和所述SDK数据,得到与所述运营商数据对应的第一行为视图和与所述SDK数据对应的第二行为视图,所述第一行为视图用于表示全部运营商用户在每个维度的行为,所述第二行为视图用于表示多个终端设备用户在每个维度的行为;
根据所述第一行为视图与所述第二行为视图,对所述第一行为视图进行校准;
所述根据所述第一行为视图与所述第二行为视图,对所述第一行为视图进行校准,包括:
将所述第一行为视图与所述第二行为视图的每个维度的行为进行对比,根据所述第二行为视图的每个行为在所述维度中所占的比例,对所述第一行为视图进行加权计算,得到校准后的第一行为视图。
2.根据权利要求1所述的方法,其特征在于,所述运营商数据和所述SDK数据均包括多个操作数据,所述根据所述运营商数据和所述SDK数据,得到与所述运营商数据对应的第一行为视图和与所述SDK数据对应的第二行为视图,包括:
根据所述运营商数据和所述SDK数据,以及第一对应关系,得到与所述运营商数据对应的第一行为数据和与所述SDK数据对应的第二行为数据,所述第一对应关系用于表示操作数据与用户行为之间的对应关系;
对所述第一行为数据进行多维度统计,得到所述第一行为视图;对所述第二行为数据进行多维度统计,得到所述第二行为视图;
其中,所述第一行为数据包括多个用户的行为数据。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
根据所述第一行为数据中每个用户的行为数据和行为权重,计算得到所述用户的至少一个行为的得分,所述行为权重为预设值或者根据深度学习算法确定的;
根据所述至少一个行为的得分,为所述用户设置标签;其中,所述标签包括购买意向标签、兴趣标签、资产标签、消费能力标签中的至少一种。
4.根据权利要求2或3所述的方法,其特征在于,所述方法还包括:
根据所述SDK数据以及预设置的数据处理机制,生成操作数据与用户行为的对应关系;
根据所述操作数据与用户行为的对应关系更新所述第一对应关系。
5.一种数据的校准装置,其特征在于,包括:
数据采集模块,用于获取运营商数据和软件开发工具包SDK数据;其中,所述运营商数据为运营商采集的用户的数据,所述SDK数据为SDK监测到的多个终端设备的用户数据;
数据校准模块,用于根据所述运营商数据和所述SDK数据,得到与所述运营商数据对应的第一行为视图和与所述SDK数据对应的第二行为视图,所述第一行为视图用于表示全部运营商用户在每个维度的行为,所述第二行为视图用于表示多个终端设备用户在每个维度的行为;
所述数据校准模块还用于根据所述第一行为视图与所述第二行为视图,对所述第一行为视图进行校准;
所述数据校准模块具体用于:
将所述第一行为视图与所述第二行为视图的每个维度的行为进行对比,根据所述第二行为视图的每个行为在所述维度中所占的比例,对所述第一行为视图进行加权计算,得到校准后的第一行为视图。
6.根据权利要求5所述的装置,其特征在于,所述数据校准模块具体用于:
根据所述运营商数据和所述SDK数据,以及第一对应关系,得到与所述运营商数据对应的第一行为数据和与所述SDK数据对应的第二行为数据,所述第一对应关系用于表示操作数据与用户行为之间的对应关系;
对所述第一行为数据进行多维度统计,得到所述第一行为视图;对所述第二行为数据进行多维度统计,得到所述第二行为视图;
其中,所述第一行为数据包括多个用户的行为数据。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:行为洞察模块;
所述行为洞察模块用于:
根据所述第一行为数据中每个用户的行为数据和行为权重,计算得到所述用户的至少一个行为的得分,所述行为权重为预设值或者根据深度学习算法确定的;
根据所述至少一个行为的得分,为所述用户设置标签;其中,所述标签包括购买意向标签、兴趣标签、资产标签、消费能力标签中的至少一种。
8.根据权利要求6或7所述的装置,其特征在于,所述装置还包括:更新模块;
所述更新模块用于:
根据所述SDK数据以及预设置的数据处理机制,生成操作数据与用户行为的对应关系;
根据所述操作数据与用户行为的对应关系更新所述第一对应关系。
9.一种服务器,其特征在于,包括:存储器及处理器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,使得所述处理器执行如权利要求1至4任一项所述的数据的校准方法。
10.一种存储介质,其特征在于,包括:可读存储介质和计算机程序,所述计算机程序用于实现权利要求1至4任一项所述的数据的校准方法。
CN201910883535.0A 2019-09-18 2019-09-18 数据的校准方法、装置、设备以及存储介质 Active CN111918323B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910883535.0A CN111918323B (zh) 2019-09-18 2019-09-18 数据的校准方法、装置、设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910883535.0A CN111918323B (zh) 2019-09-18 2019-09-18 数据的校准方法、装置、设备以及存储介质

Publications (2)

Publication Number Publication Date
CN111918323A CN111918323A (zh) 2020-11-10
CN111918323B true CN111918323B (zh) 2021-10-22

Family

ID=73242646

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910883535.0A Active CN111918323B (zh) 2019-09-18 2019-09-18 数据的校准方法、装置、设备以及存储介质

Country Status (1)

Country Link
CN (1) CN111918323B (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105828430A (zh) * 2015-01-08 2016-08-03 阿里巴巴集团控股有限公司 一种信息采集和处理方法、客户端及服务器
CN106503015A (zh) * 2015-09-07 2017-03-15 国家计算机网络与信息安全管理中心 一种构建用户画像的方法
CN105959173A (zh) * 2016-04-05 2016-09-21 王攀 一种基于dpi的固定宽带互联网流量中提取手机号码的方法v1.0
CN207677997U (zh) * 2017-12-15 2018-07-31 珠海华发实业股份有限公司 基于WiFi定位技术和电信运营商数据的分析系统
CN110087230B (zh) * 2019-04-26 2020-09-15 同盾控股有限公司 数据处理方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN111918323A (zh) 2020-11-10

Similar Documents

Publication Publication Date Title
CN110245213B (zh) 调查问卷生成方法、装置、设备和存储介质
CN106940705B (zh) 一种用于构建用户画像的方法与设备
US10497013B2 (en) Purchasing behavior analysis apparatus and non-transitory computer readable medium
US11036615B2 (en) Automatically performing and evaluating pilot testing of software
KR101708444B1 (ko) 키워드 및 자산 가격 관련성 평가 방법 및 그 장치
CN112148987B (zh) 基于目标对象活跃度的消息推送方法及相关设备
JP6713238B2 (ja) 電子装置、小売店舗評価モデルを構築する方法、システム及び記憶媒体
Trappey et al. Consumer driven product technology function deployment using social media and patent mining
CN104954410A (zh) 消息推送方法、装置及服务器
CN111522724B (zh) 异常账号的确定方法、装置、服务器及存储介质
CN111369258A (zh) 实体对象类型的预测方法、装置及设备
CN111738785A (zh) 选品方法、系统及存储介质
CN112394908A (zh) 埋点页面自动生成的方法、装置、计算机设备及存储介质
CN113127723A (zh) 用户画像处理方法、装置、服务器及存储介质
KR20190081032A (ko) 부동산 분양 정보 제공 시스템
CN113918949A (zh) 基于多模态融合的诈骗app的识别方法
JP6680663B2 (ja) 情報処理装置、情報処理方法、予測モデルの生成装置、予測モデルの生成方法、およびプログラム
CN110189171B (zh) 特征数据的生成方法、装置及设备
CN111918323B (zh) 数据的校准方法、装置、设备以及存储介质
CN115809889A (zh) 基于营销效果的智能客群筛选方法、系统、介质及设备
CN113051911B (zh) 提取敏感词的方法、装置、设备、介质及程序产品
US11373210B2 (en) Content interest from interaction information
CN114265777A (zh) 应用程序的测试方法、装置、电子设备及存储介质
CN113297290A (zh) 实时用户策略配置方法、装置及电子设备
KR20160000487A (ko) 설문 조사 검증 시스템 및 설문 조사 검증 시스템의 동작 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Fan Xiaobin

Inventor after: Wang He

Inventor after: Qin Feng

Inventor after: Pan Siyu

Inventor after: Qian Yu

Inventor after: Zhang Shu

Inventor before: Fan Xiaobin

Inventor before: Wang He

Inventor before: Qin Feng

Inventor before: Zhang Shu

Inventor before: Pan Siyu

GR01 Patent grant
GR01 Patent grant