CN108876434B - 用户画像构建方法、装置、计算设备及可读存储介质 - Google Patents
用户画像构建方法、装置、计算设备及可读存储介质 Download PDFInfo
- Publication number
- CN108876434B CN108876434B CN201810509950.5A CN201810509950A CN108876434B CN 108876434 B CN108876434 B CN 108876434B CN 201810509950 A CN201810509950 A CN 201810509950A CN 108876434 B CN108876434 B CN 108876434B
- Authority
- CN
- China
- Prior art keywords
- user
- connection
- association degree
- ids
- edge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Processing Or Creating Images (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种用户画像构建方法、装置、计算设备及计算机可读存储介质,其中,该方法包括:获取多个弱账户体系的用户数据源,在用户数据源的每条用户数据中提取一个或多个用户身份标识ID,确定用户ID之间的连接关系,根据用户ID之间的连接关系,构建出用户画像,通过用户画像标识用户的每一次行为,进而根据该用户画像对用户精准地推送其感兴趣的内容。由此解决了现有技术中在用户享用弱账户体系提供的服务时,弱账户体系对应的服务商不能完整地将数据源匹配到特定的用户的技术问题。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种用户画像构建方法、装置、计算设备及可读存储介质。
背景技术
随着互联网技术的发展与运用,服务商为了提供更优质的服务,通常会根据用户的需求或爱好推送用户感兴趣的内容。如,用户登录微博账号,服务商通过该微博账号获取用户在不同设备上的使用数据,根据获取到的使用数据建立用户的兴趣模型,根据建立的兴趣模型为用户推送感兴趣的内容,以提升用户体验。
然而,随着用户对隐私保护的重视,用户通常只会在使用频率高或强制要求用户认证注册的APP或网站上注册认证账户;如,用户在使用支付宝、微信、以及QQ等高频率的APP时,只有通过登录认证账户才能享受支付宝、微信、以及QQ服务商提供的服务;由于每一用户在对应的APP上通常只有一个的认证账户,因此该认证账户可以标识用户的每一次行为。用户在使用频率低或没有强制要求用户认证注册的APP或网站时,通常会通过QQ、微信、微博、支付宝、以及手机等多种方式进行快捷登录,服务商根据不同的登录方式生成不同的账号ID;由于每一用户在对应的APP中可能拥有多个账号ID,因此该账号ID不能标识用户的每一次行为。在此,将没有强制要求用户认证注册的APP或网站称之为弱账户体系。
在用户享用弱账户体系提供的服务时,弱账户体系对应的服务商记录的数据源中包括用户的cookie、pc/m端浏览行为标识ID、手机设备号imei、APP端浏览行为标识ID、以及账号ID等用于用户身份标识的用户ID。由于上述用于用户身份标识的用户ID均不能标识用户的每一次行为,导致弱账户体系对应的服务商不能完整地将数据源匹配到特定的用户,因此也无法对该特定用户精准地推送其感兴趣的内容。
发明内容
本发明提供一种用户画像构建方法、装置、计算设备及可读存储介质,用以解决现有技术中在用户享用弱账户体系提供的服务时,弱账户体系对应的服务商不能完整地将数据源匹配到特定的用户的技术问题。
依据本发明的一个方面,提供一种用户画像构建方法,所述方法包括:
获取多个弱账户体系的用户数据源;
在用户数据源的每条用户数据中提取一个或多个用户身份标识ID;
确定用户ID之间的连接关系;
根据用户ID之间的连接关系,构建出用户画像。
依据本发明实施例的第二个方面,提供了一种用户画像构建装置,所述装置包括:
身份标识模块,用于获取多个弱账户体系的用户数据源;
身份标识模块,用于在用户数据源的每条用户数据中提取一个或多个用户身份标识ID;
连接关系模块,用于确定用户ID之间的连接关系;
画像构建模块,用于根据用户ID之间的连接关系,构建出用户画像。
依据本发明实施例的第三个方面,提供了一种计算设备,计算设备包括:存储器、处理器及通信总线;通信总线用于实现处理器和存储器之间的连接通信;
处理器用于执行存储器中存储的用户画像构建程序,该程序被处理器执行时实现本发明实施例提供的用户画像构建方法的步骤。
依据本发明实施例的第四个方面,提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现本发明实施例提供的用户画像构建方法的步骤。
根据本发明实施例的一种用户画像构建方法、装置、计算设备及计算机可读存储介质,通过在多个弱账户体系中获取用户数据,在获取的每一条数据中提取一个或多个用户身份标识ID,根据ID之间的连接关系,构建用户画像。将弱账户体系中的数据源匹配到用户画像,通过用户画像标识用户的每一次行为,进而根据该用户画像对用户精准地推送其感兴趣的内容。由此解决了现有技术中在用户享用弱账户体系提供的服务时,弱账户体系对应的服务商不能完整地将数据源匹配到特定的用户的技术问题。
上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明实施例的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明实施例的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本发明第一实施例提供的一种用户画像构建方法的流程图;
图2为本发明第二实施例提供的一种用户画像构建方法的流程图;
图3为本发明第三实施例提供的一种用户画像构建方法的流程图;
图4为本发明第四实施例提供的一种用户画像构建方法的流程图;
图5为本发明第五实施例提供的一种用户画像构建方法的流程图;
图6为本发明第六实施例提供的一种用户画像构建方法的流程图;
图7为本发明第七实施例提供的一种用户画像构建方法的流程图;
图8为本发明第八实施例提供的一种用户画像构建方法的流程图;
图9为本发明第九实施例提供的一种用户画像构建方法的流程图;
图10为本发明第十实施例提供的一种用户画像构建方法的流程图;
图11为本发明第十一实施例和第十二实施例提供的一种用户画像构建装置的功能模块示意图;
图12为本发明第十三实施例和第十四实施例提供的一种用户画像构建装置的功能模块示意图;
图13为本发明第十五实施例提供的一种用户画像构建装置的功能模块示意图;
图14为本发明第十六实施例和第二十实施例提供的一种用户画像构建装置的功能模块示意图;
图15为本发明第十七实施例至和第十九实施例提供的一种用户画像构建装置的功能模块示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
请参阅图1,为本发明第一实施提供的一种用户画像构建方法的流程图。本实施例中,所述用户画像构建方法包括如下步骤:
步骤S101,获取多个弱账户体系的用户数据源。
可以清楚的是,APP或网站在为用户提供服务时,通常会记录用户的日志信息,本实施例中将用户的日志信息作为用户数据源。
在用户没有认证注册或没有认证登录的情况下享用APP或网站提供的服务时,APP或网站记录用户的日志中没有明确用于辨别用户身份的认证账户信息;在本实施例中,将没有强制要求用户认证注册的APP或网站称之为弱账户体系。
具体的,同一个服务商会根据业务布局开发多个APP或网站为用户提供服务,本实施例中,在同一服务商开发的APP或网站中选择多个弱账户体系下的用户日志信息作为用户数据源。通过将多个弱账户体系下的日志信息作为数据源,有利于用户数据的全面性;以及根据多个弱账户体系下不同的APP或网站的日志信息对用户进行数据交叉验证,保证用户画像的准确定。
步骤S102,在用户数据源的每条用户数据中提取一个或多个用户身份标识ID。
具体实施时,由于用户数据源为用户的日志信息,数据源中每一条用户数据中均包括一个或多个用户身份标识的ID。为了便于描述,将用户身份标识ID称之为用户ID。如,数据中包括用户的cookie、pc/m端浏览行为标识ID、手机设备号imei、APP端浏览行为标识ID、以及账号ID等用户身份标识的用户ID。其中,该用户身份标识的用户ID的性质可以为设备硬件ID或字符标识。
步骤S103,确定用户ID之间的连接关系。
在获取到用户身份标识的ID后,确定每一用户身份标识的ID之间的连接关系。如,两个ID同时出现在一条数据中,则判定该ID之间存在连接关系。
步骤S104,根据用户ID之间的连接关系,构建出用户画像。
根据获取到的ID之间的连接关系,将ID之间存在连接关系的ID连接,以构建出用户画像。通过用户画像,将多个弱账户体系中的数据源建立联系,将得到的用户画像作为一个特定用户。
本实施例中,通过在多个弱账户体系中获取用户数据,在获取的每一条数据中提取一个或多个用户身份标识ID,根据ID之间的连接关系,构建用户画像,将得到的用户画像作为一个特定的用户,并将弱账户体系对应的数据源匹配到该用户画像,由此解决了现有技术中在用户享用弱账户体系提供的服务时,弱账户体系对应的服务商不能完整地将数据源匹配到特定的用户的技术问题。
请参阅图2,为本发明第二实施提供的一种用户画像构建方法的流程图。本实施例中,所述用户画像构建方法包括如下步骤:
步骤S201,获取多个弱账户体系的用户数据源。
步骤S202,在用户数据源的每条用户数据中提取一个或多个用户身份标识ID。
步骤S203,以出现在同一条用户数据中的各用户ID之间具有连接关系为原则,确定用户ID之间的连接关系。
具体实施时,数据源中每一条数据中可能包括多个用户ID,可以清楚的是,每一条数据中的用户ID之间存在连接关系。进一步地,根据每一条数据中用户ID的连接关系为原则,确定数据源中ID之间的连接关系。如,数据中包括用户的手机编码及ip地址,则可以判定该手机编码和ip地址存在直接连接关系,在另一条数据中包括手机编码和用户账号ID,则判定该默认账号ID与ip地址存在间接连接关系。其中,该账号ID为服务商根据用户不同的登录方式生成的ID。
步骤S204,根据用户ID之间的连接关系,构建出用户画像。
其中,步骤S201、步骤S202、以及至步骤S204均在第一实施例中进行了详细说明,在此不作赘述。
本实施例中,通过获取数据源中每一条数据中包括的多个用户ID,以及多个用户ID之间连接关系,构建数据源用户ID之间的连接关系。进而通过数据源中用户ID之间的连接关系,构建用户画像。将得到的用户画像作为一个特定的用户,并将弱账户体系对应的数据源匹配到该用户画像,由此解决了现有技术中在用户享用弱账户体系提供的服务时,弱账户体系对应的服务商不能完整地将数据源匹配到特定的用户的技术问题。
请参阅图3,为本发明第三实施提供的一种用户画像构建方法的流程图,本实施例中,所述用户画像构建方法包括如下步骤:
步骤S301,获取多个弱账户体系的用户数据源。
步骤S302,在用户数据源的每条用户数据中提取一个或多个用户身份标识ID。
步骤S203,确定用户ID之间的连接关系。
步骤S304,根据用户ID之间的连接关系,构造连通图。
具体实施时,根据在每一条数据中获取的用户ID之间的连接关系,构建连通图,连通图中包括用户ID之间的直接联系关系或间接联系关系。如,数据中包括用户的手机编码及ip地址,则可以判定该手机编码和ip地址存在直接连接关系,在另一条数据中包括手机编码和用户账号ID,则判定该默认账号ID与ip地址存在间接连接关系;将存在连接关系的用户ID连接,连接后得到连通图。
步骤S305,根据连通图,得到用户画像。
在得到连通图后,服务商可以根据连通图的特征对连通图中的用户ID进行筛选,根据筛选后的连通图得到用户画像。可以,用户数据源数据量大,得到的连通图复杂,可以将连通图中不重要的用户ID进行删除;如,一台手机也可以通过刷机改变手机设备号imei,苹果手机的设备号IDfa过一段时间就会自动新生成,则苹果手机设备号imei可以根据连通图的复杂性程度判定为不稳定用户ID。在具体实施时,可以根据具体需要选择性的删除连通图中不稳定的用户ID,通过删除后的连通图得到用户画像。
其中,步骤S301至步骤S303已在第一实施例或第二是实施例中进行了详细说明,在此不作赘述。
本实施例中,通过在每一条数据中获取的用户ID之间的连接关系,构建连通图;在得到连通图后,可根据连通图的特征对连通图中的用户ID进行筛选,通过筛选后的连通图得到用户画像,减少构建用户画像的运算量。进一步地,将得到的用户画像作为一个特定的用户,并将弱账户体系对应的数据源匹配到该用户画像,由此解决了现有技术中在用户享用弱账户体系提供的服务时,弱账户体系对应的服务商不能完整地将数据源匹配到特定的用户的技术问题。
请参阅图4,为本发明第四实施提供的一种用户画像构建方法的流程图,本实施例中,所述用户画像构建方法包括如下步骤:
步骤S401,获取多个弱账户体系的用户数据源。
步骤S402,在用户数据源的每条用户数据中提取一个或多个用户身份标识ID。
步骤S403,确定用户ID之间的连接关系。
步骤S404,根据用户ID之间的连接关系,构造连通图。
步骤S405,检测连通图中是否只有没有连接关系的用户ID或者只有一个连接关系的用户ID。
在检测到连接图中只有没有连接关系的用户ID或者只有一个连接关系的用户ID时,执行步骤S406;在检测到连接图中不是只有没有连接关系的用户ID或者只有一个连接关系的用户ID时,执行步骤S407。
具体实施时,由于用户数据源是通过多个弱账户体系中获取的,数据源可能对应有T级别的日志信息和亿级别的用户ID量,对算法运行时间的高要求,一般的算法达不到这个性能。检测到连接图中只有没有连接关系的用户ID或者只有一个连接关系的用户ID时,直接将连通图作为得到的用户画像。检测到连接图中不是只有没有连接关系的用户ID或者只有一个连接关系的用户ID时,在去除连通图中的伪连接后,得到用户画像。
步骤S406,直接将连通图作为得到的用户画像。
具体实施时,可能因为用户数据源的数据不完整或用户第一次使用弱账户体系记录数据量少,造成得到的连通图中只有一个用户ID或只有一个连接关系的用户ID。该情况下,直接将该连通图作为用户画像,将得到的用户画像作为特定用户,也可将特定用户默认为新用户,并将该弱账户体系对应的数据源匹配到该用户画像。
步骤S407,在去除连通图中的伪连接后,得到用户画像。
具体实施时,连通图中的用户ID并不全是特定用户对应的用户ID;如,用户借了他朋友的手机登录了APP或网站,该情况下因为这个用户和他的朋友的APP或网站账号在同一个设备上登录,这两个登录账号会有一个连接关系,这种连接关系为伪连接。该用户和他的朋友的账号虽然有连接关系,但是最终会属于两个特定账户,两个人的身份,因此要将连通图中的伪连接去除,通过去除伪连接后的连通图,得到用户画像。
其中,步骤S401至步骤S404已在第三实施例中进行了详细说明,在此不作赘述。
本实施例中,在检测到连接图中只有没有连接关系的用户ID或者只有一个连接关系的用户ID时,直接将连通图作为得到的用户画像,提升用户画像的构建效率。通过将连通图中的伪连接去除,通过去除伪连接后的连通图,得到用户画像,以保证用户画像的准确定。进一步地,将得到的用户画像作为一个特定的用户,并将弱账户体系对应的数据源匹配到该用户画像,由此解决了现有技术中在用户享用弱账户体系提供的服务时,弱账户体系对应的服务商不能完整地将数据源匹配到特定的用户的技术问题。
请参阅图5,为本发明第五实施提供的一种用户画像构建方法的流程图,本实施例中,所述用户画像构建方法包括如下步骤:
步骤S501,获取多个弱账户体系的用户数据源。
步骤S502,在用户数据源的每条用户数据中提取一个或多个用户身份标识ID。
步骤S503,确定用户ID之间的连接关系。
步骤S504,根据用户ID之间的连接关系,构造连通图。
步骤S505,检测连通图中是否只有没有连接关系的用户ID或者只有一个连接关系的用户ID。
在检测到连接图中是只有没有连接关系的用户ID或者只有一个连接关系的用户ID时,执行步骤S506;在检测到连接图中不是只有没有连接关系的用户ID或者只有一个连接关系的用户ID时,执行步骤S507。
步骤S506,直接将连通图作为得到的用户画像。
步骤S507,确定连通图中具有连接关系的两两用户ID之间的关联度。
具体实施时,由于连通图中ID之间的连接关系复杂,需要去除一些连接关系弱的连接。通过计算具有连接关系的两两ID之间的关联度,根据关联度对具有连接关系的两两ID之间的连接关系强弱进行判断。
步骤S508,判断关联度是否满足预设值。
具体实施时,根据用户数据源及连通图的复杂程度设定预设值。如在用户数据源量大时选择关联度中值、平均值作为预设值。根据连通图中ID的数量大小设置预设值,以通过预设值来减少连通图中用户ID的数量。
步骤S509,在连通图中断开这两个用户ID之间的连接。
在判断关联度不满足预设值,断开两个用户ID之间的连接。
其中,步骤S501至步骤S506已在第四实施例中进行了详细说明,在此不作赘述。
本实施例中,通过确定连通图中具有连接关系的两两用户ID之间的关联度,对两个用户ID之间的连接强弱进行判断,在两个用户ID之间关联度小于预设值时,断开两个用户ID之间的连接,以保证用户画像的准确性,以及提升了用户画像构建的效率。进一步地,将得到的用户画像作为一个特定的用户,并将弱账户体系对应的数据源匹配到该用户画像,由此解决了现有技术中在用户享用弱账户体系提供的服务时,弱账户体系对应的服务商不能完整地将数据源匹配到特定的用户的技术问题。
请参阅图6,为本发明第五实施提供的一种用户画像构建方法的流程图,本实施例中,所述用户画像构建方法包括如下步骤:
步骤S601,获取多个弱账户体系的用户数据源。
步骤S602,在用户数据源的每条用户数据中提取一个或多个用户身份标识ID。
步骤S603,确定用户ID之间的连接关系。
步骤S604,根据用户ID之间的连接关系,构造连通图。
步骤S605,检测连通图中是否只有没有连接关系的用户ID或者只有一个连接关系的用户ID。
在检测到连接图中是只有没有连接关系的用户ID或者只有一个连接关系的用户ID时,执行步骤S606;在检测到连接图中不是只有没有连接关系的用户ID或者只有一个连接关系的用户ID时,执行步骤S607。
步骤S606,直接将连通图作为得到的用户画像。
步骤S607,获取两两用户ID之间的连接天数。
具体实施时,用户数据源随着用户使用APP或网站的次数增加而增加,连通图中的两两ID之间的关联度也不是长期稳定的,随着时间推移关联度也会改变。因此,本实施例中,通过获取两两用户ID之间的连接天数作为计算关联度的条件。
步骤S608,确定连接天数中每天对应的连接权重。
本发明实施例中,连接的各天对应的连接权重可以相同,但更优选地,过去一段时间的连接的权重小于当前时间的连接的权重。比如用户ID:A和B,20180501第一次连接,它们的权重是1;20180502第二次连接时,本次连接的权重是1,但针对20180501第一次连接的权重要做衰减,例如衰减至0.8。即在连接天数中,第i天的连接权重小于第i+1天的连接权重。通过该设置可以更精准的体现用户当前的兴趣爱好。
具体实施时,令:连接权重N(t)=N0e-λt。其中,N(t)是衰减后的权重,N0是当前时间对应的原始权重,λ为根据具体的业务需求设置的衰减参数,t为当前时间与衰减时间对应的天数差值。
步骤S609,将确定的各连接权重求和,得到两两用户ID之间的直接边关联度。
本发明实施例中,直接边关联度是当前连接边的权重和经过衰减后的连接边的权重的累加,即:其中,当前天数对应的直接边关联度为eij,衰减后天数对应的直接边关联度为例如,用户ID:A和B,20180501第一次连接,它们的权重是1,20180502第二次连接时,它们的权重就是1*0.8+1=1.8,这里的20180501就是过去连接的一天,20180502就是当前连接的一天,当前如果又有连接时会对过去连接的权重进行衰减,这里的0.8就是衰减系数。
步骤S610,根据直接边关联度,得到两两用户ID之间的关联度。
步骤S611,判断关联度是否满足预设值。
步骤S612,在连通图中断开这两个用户ID之间的连接。
其中,步骤S601至步骤S606、以及步骤S611至步骤S612已在第五实施例中进行了详细说明,在此不作赘述。
本实施例中,通过获取两两用户ID之间的连接天数,确定连接天数中每天对应的连接权重,进而通过两两用户ID的直接边关联度和权重得到两两用户ID之间的直接边关联度。将关联度与连接天数建立联系,使得得到的用户画像更加准确。进一步地,将得到的用户画像作为一个特定的用户,并将弱账户体系对应的数据源匹配到该用户画像,由此解决了现有技术中在用户享用弱账户体系提供的服务时,弱账户体系对应的服务商不能完整地将数据源匹配到特定的用户的技术问题。
请参阅图7,为本发明第七实施提供的一种用户画像构建方法的流程图,本实施例中,所述用户画像构建方法包括如下步骤:
步骤S701,获取多个弱账户体系的用户数据源。
步骤S702,在用户数据源的每条用户数据中提取一个或多个用户身份标识ID。
步骤S703,确定用户ID之间的连接关系。
步骤S704,根据用户ID之间的连接关系,构造连通图。
步骤S705,检测连通图中是否只有没有连接关系的用户ID或者只有一个连接关系的用户ID。
在检测到连接图中是只有没有连接关系的用户ID或者只有一个连接关系的用户ID时,执行步骤S706;在检测到连接图中不是只有没有连接关系的用户ID或者只有一个连接关系的用户ID时,执行步骤S707。
步骤S706,直接将连通图作为得到的用户画像。
步骤S707,获取两两用户ID之间的连接天数。
步骤S708,确定连接天数中每天对应的连接权重。
可选的,在连接天数中,第i天的连接权重小于第i+1天的连接权重。
步骤S709,将确定的各连接权重求和,得到两两用户ID之间的直接边关联度。
步骤S710,确定出两两用户ID之间除具有直接连接关系外还包括通过其他用户ID进行连接的间接连接关系。
步骤S711,求取间接连接关系的连接链路上具有连接关系的两两用户ID之间的直接边关联度。
步骤S712,根据求取的连接链路上两两用户ID之间的直接边关联度,得到间接边关联度。
具体实施时,两两用户ID之间除了通过直接,还通过间接连接;如,用户IDi直接连接用户IDj,用户IDi还可以通过用户IDk或用户IDl间接与用户IDj连接。在计算关联度时,除了计算两两用户ID之间的直接边关联度,还包括计算两两用户ID之间的间接关联度。
步骤S713,根据直接边关联度和间接边关联度,得到两两用户ID之间的关联度。
根据获取到的两两ID之间的直接关联度和间接边关联度,得到两两用户ID之间的关联度。
步骤S714,判断关联度是否满足预设值。
步骤S715,在连通图中断开这两个用户ID之间的连接。
其中,步骤S701至步骤709、以及步骤S714至步骤S715已在第六实施例中进行了详细说明,在此不作赘述。
本实施例中,通过获取两两ID之间的直接边关联度和间接边关联度,进而通过直接边关联度和间接边关联度得到两两用户ID之间的关联度,通过对该关联度与预设值进行判断,以使得到的用户画像更加准备。进一步地,将得到的用户画像作为一个特定的用户,并将弱账户体系对应的数据源匹配到该用户画像,由此解决了现有技术中在用户享用弱账户体系提供的服务时,弱账户体系对应的服务商不能完整地将数据源匹配到特定的用户的技术问题。
请参阅图8,为本发明第八实施提供的一种用户画像构建方法的流程图,本实施例中,所述用户画像构建方法包括如下步骤:
步骤S801,获取多个弱账户体系的用户数据源。
步骤S802,在用户数据源的每条用户数据中提取一个或多个用户身份标识ID。
步骤S803,确定用户ID之间的连接关系。
步骤S804,根据用户ID之间的连接关系,构造连通图。
步骤S805,检测连通图中是否只有没有连接关系的用户ID或者只有一个连接关系的用户ID。
在检测到连接图中是只有没有连接关系的用户ID或者只有一个连接关系的用户ID时,执行步骤S806;在检测到连接图中不是只有没有连接关系的用户ID或者只有一个连接关系的用户ID时,执行步骤S807。
步骤S806,直接将连通图作为得到的用户画像。
步骤S807,获取两两用户ID之间的连接天数。
步骤S808,确定连接天数中每天对应的连接权重。
可选的,在连接天数中,第i天的连接权重小于第i+1天的连接权重。
步骤S809,将确定的各连接权重求和,得到两两用户ID之间的直接边关联度;
步骤S810,确定出两两用户ID之间除具有直接连接关系外还包括通过其他用户ID进行连接的间接连接关系。
步骤S811,求取间接连接关系的连接链路上具有连接关系的两两用户ID之间的直接边关联度。
步骤S812,确定连接链路的条数。
具体实施时,由于两两用户ID之间除了直接连接关系,还存在间接连接关系。其中两两用户ID之间可以通过一个用户ID间接连接也可以通过两个或多个用户ID间接连接,因此间接连接关系存在有多个方式的连接链路。由于在用户数据源量大的情况下间接边连接链路数量较大,本实施例中选择通过一个用户ID间接连接的链路,并确定该链路条数。如,用户IDi直接连接用户IDj,用户IDi还可以通过用户IDk或用户IDl间接与用户IDj连接;在选择链路时,选择IDi通过用户IDk或用户IDl间接与用户IDj连接的链路。
步骤S813,在每条连接链路中选取最小的直接边关联度。
具体实施时,IDi通过用户IDk间接与用户IDj连接的链路的最小的直接边关联度为min(eik,ekj),其中eik为用户IDi与用户IDk的直接边关联度,其中ekj为用户IDk与用户IDj的直接边关联度;通过用户IDl间接与用户IDj连接的链路的最小的直接边关联度为min(eil,elj),其中eil为用户IDi与用户IDl的直接边关联度,其中elj为用户IDl与用户IDj的直接边关联度。
步骤S814,将选取的各连接链路的最小的直接边关联度求和,得到间接边关联度。
步骤S815,根据直接边关联度和间接边关联度,得到两两用户ID之间的关联度。
步骤S816,判断关联度是否满足预设值。
步骤S817,在连通图中断开这两个用户ID之间的连接。
其中,步骤S801至步骤S811、以及步骤S816步骤S817已在第七实施例中进行了详细说明,在此不作赘述。
本实施例中,通过确定连接链路的条数,在每条连接链路中选取最小的直接边关联度,将选取的各连接链路的最小的直接边关联度求和,得到间接边关联度,进一步地保证用户画像的准确性。进一步地,将得到的用户画像作为一个特定的用户,并将弱账户体系对应的数据源匹配到该用户画像,由此解决了现有技术中在用户享用弱账户体系提供的服务时,弱账户体系对应的服务商不能完整地将数据源匹配到特定的用户的技术问题。
请参阅图9,为本发明第九实施提供的一种用户画像构建方法的流程图,本实施例中,所述用户画像构建方法包括如下步骤:
步骤S901,获取多个弱账户体系的用户数据源。
步骤S902,在用户数据源的每条用户数据中提取一个或多个用户身份标识ID。
步骤S903,确定用户ID之间的连接关系。
步骤S904,根据用户ID之间的连接关系,构造连通图。
步骤S905,检测连通图中是否只有没有连接关系的用户ID或者只有一个连接关系的用户ID。
在检测到连接图中是只有没有连接关系的用户ID或者只有一个连接关系的用户ID时,执行步骤S906;在检测到连接图中不是只有没有连接关系的用户ID或者只有一个连接关系的用户ID时,执行步骤S907。
步骤S906,直接将连通图作为得到的用户画像。
步骤S907,获取两两用户ID之间的连接天数;
步骤S908,确定连接天数中每天对应的连接权重。
可选的,在连接天数中,第i天的连接权重小于第i+1天的连接权重。
步骤S909,将确定的各连接权重求和,得到两两用户ID之间的直接边关联度;
步骤S910,确定出两两用户ID之间除具有直接连接关系外还包括通过其他用户ID进行连接的间接连接关系。
步骤S911,求取间接连接关系的连接链路上具有连接关系的两两用户ID之间的直接边关联度。
步骤S912,确定连接链路的条数。
步骤S913,在每条连接链路中选取最小的直接边关联度。
步骤S914,确定每条连接链路的权重。
具体实施时,根据每一条链路的稳定,设置不同的权重。如,两两用户ID之间通过一个稳定性弱的用户ID(如,苹果手机的设备号IDfa过一段时间就会自动新生成,以此该用户ID的稳定性弱)连接,或两两用户ID之间通过出现次数较多的用户ID连接,则对应链路的稳定性也不同。因此,可根据用户ID的稳定性强弱或用户ID在用户数据源中出现的次数对每一条链路设置权重。
步骤S915,利用各连接链路的权重,对各连接链路的最小的直接边关联度进行加权处理。
具体实施时,可通过如下公式表示:wk min(eik,ekj),其中wk为用户IDi还可以通过用户IDk间接与用户IDj连接的链路权重;wl min(eil,elj),其中wl为用户IDi还可以通过用户IDl间接与用户IDj连接的链路权重。
步骤S916,将加权后的各直接边关联度求和,得到间接边关联度。
步骤S917,根据直接边关联度和间接边关联度,得到两两用户ID之间的关联度。
步骤S918,判断关联度是否满足预设值。
步骤S919,在连通图中断开这两个用户ID之间的连接。
其中,步骤S901至步骤S913、以及步骤S918步骤S919已在第八实施例中进行了详细说明,在此不作赘述。
本实施例中,通过确定每条连接链路的权重,利用各连接链路的权重,对各连接链路的最小的直接边关联度进行加权处理,将加权后的各直接边关联度求和,得到间接边关联度,进一步地保证用户画像的准确性。进一步地,将得到的用户画像作为一个特定的用户,并将弱账户体系对应的数据源匹配到该用户画像,由此解决了现有技术中在用户享用弱账户体系提供的服务时,弱账户体系对应的服务商不能完整地将数据源匹配到特定的用户的技术问题。
请参阅图10,为本发明第十实施提供的一种用户画像构建方法的流程图,本实施例中,所述用户画像构建方法包括如下步骤:
步骤S1001,获取多个弱账户体系的用户数据源。
步骤S1002,在用户数据源的每条用户数据中提取一个或多个用户身份标识ID。
步骤S1003,确定用户ID之间的连接关系。
步骤S1004,根据用户ID之间的连接关系,构造连通图。
步骤S1005,检测连通图中是否只有没有连接关系的用户ID或者只有一个连接关系的用户ID。
在检测到连接图中是只有没有连接关系的用户ID或者只有一个连接关系的用户ID时,执行步骤S1006;在检测到连接图中不是只有没有连接关系的用户ID或者只有一个连接关系的用户ID时,执行步骤S1007。
步骤S1006,直接将连通图作为得到的用户画像。
步骤S1007,获取两两用户ID之间的连接天数;
步骤S1008,确定连接天数中每天对应的连接权重。
可选的,在连接天数中,第i天的连接权重小于第i+1天的连接权重。
步骤S1009,将确定的各连接权重求和,得到两两用户ID之间的直接边关联度;
步骤S1010,确定出两两用户ID之间除具有直接连接关系外还包括通过其他用户ID进行连接的间接连接关系。
步骤S1011,求取间接连接关系的连接链路上具有连接关系的两两用户ID之间的直接边关联度。
步骤S1012,确定连接链路的条数。
步骤S1013,在每条连接链路中选取最小的直接边关联度。
步骤S1014,将选取的各连接链路的最小的直接边关联度求和,得到间接边关联度。
步骤S1015,利用设定的直接边关联度的权重和间接边关联度的权重,对直接边关联度和间接边关联度进行加权处理。
具体实施时,根据实际运用场景,为直接边关联度和间接边关联度设置权重,以对直接边和间接边权重进行加权处理,使得得到的两两ID的关联度更加贴合实际运用。本实施例中,设置直接关联度的权重为1,间接关联度的权重为μ,则加权处理后的间接关联度为
步骤S1016,将加权后的直接边关联度和间接边关联度进行求和,得到两两用户ID之间的关联度。
步骤S1017,判断关联度是否满足预设值。
步骤S1018,在连通图中断开这两个用户ID之间的连接。
其中,步骤S1001至步骤S1014、以及步骤S10017至步骤S1018已在第七实施例中进行了详细说明,在此不作赘述。
本实施例中,通过利用设定的直接边关联度的权重和间接边关联度的权重,对直接边关联度和间接边关联度进行加权处理,将加权后的直接边关联度和间接边关联度进行求和,得到两两用户ID之间的关联度,进一步地保证用户画像的准确性。将得到的用户画像作为一个特定的用户,并将弱账户体系对应的数据源匹配到该用户画像,由此解决了现有技术中在用户享用弱账户体系提供的服务时,弱账户体系对应的服务商不能完整地将数据源匹配到特定的用户的技术问题。
请参阅图11,为本发明第十一实施例提供的一种用户画像构建装置100的功能模块示意图。应用于计算机设备,该用户画像构建装置100包括数据源模块110、身份标识模块120、连接关系模块130、以及画像构建模块140。该装置主要用来实现本发明实施例提供的用户画像构建方法,该方法主要用来解决现有技术中在用户享用弱账户体系提供的服务时,弱账户体系对应的服务商不能完整地将数据源匹配到特定的用户的技术问题。
其中,该计算机设备包括但不限于移动电话、手机、智能手机、平板电脑、个人电脑、个人数字助理、媒体播放器、服务器和其他电子设备。
数据源模块110,用于获取多个弱账户体系的用户数据源。
可以清楚的是,APP或网站在为用户提供服务时,通常会记录用户的日志信息,本实施例中将用户的日志信息作为用户数据源。
在用户没有认证注册或没有认证登录的情况下享用APP或网站提供的服务时,APP或网站记录用户的日志中没有明确用于辨别用户身份的认证账户信息;在本实施例中,将没有强制要求用户认证注册的APP或网站称之为弱账户体系。
具体的,同一个服务商会根据业务布局开发多个APP或网站为用户提供服务,本实施例中,在同一服务商开发的APP或网站中选择多个弱账户体系下的用户日志信息作为用户数据源。通过将多个弱账户体系下的日志信息作为数据源,有利于用户数据的全面性;以及根据多个弱账户体系下不同的APP或网站的日志信息对用户进行数据交叉验证,保证用户画像的准确定。
身份标识模块120,用于在用户数据源的每条用户数据中提取一个或多个用户身份标识ID。
具体实施时,由于用户数据源为用户的日志信息,数据源中每一条用户数据中均包括一个或多个用户身份标识的ID。为了便于描述,将用户身份标识ID称之为用户ID。如,数据中包括用户的cookie、pc/m端浏览行为标识ID、手机设备号imei、APP端浏览行为标识ID、以及账号ID等用户身份标识的用户ID。其中,该用户身份标识的用户ID的性质可以为设备硬件ID或字符标识。
连接关系模块130,用于确定用户ID之间的连接关系。
在获取到用户身份标识的ID后,确定每一用户身份标识的ID之间的连接关系。如,两个ID同时出现在一条数据中,则判定该ID之间存在连接关系。
画像构建模块140,用于根据用户ID之间的连接关系,构建出用户画像。
根据获取到的ID之间的连接关系,将ID之间存在连接关系的ID连接,以构建出用户画像。通过用户画像,将多个弱账户体系中的数据源建立联系,将得到的用户画像作为一个特定用户。
本实施例中,通过在多个弱账户体系中获取用户数据,在获取的每一条数据中提取一个或多个用户身份标识ID,根据ID之间的连接关系,构建用户画像,将得到的用户画像作为一个特定的用户,并将弱账户体系对应的数据源匹配到该用户画像,由此解决了现有技术中在用户享用弱账户体系提供的服务时,弱账户体系对应的服务商不能完整地将数据源匹配到特定的用户的技术问题。
请参阅图11,为本发明第十二实施例提供的用户画像构建装置100的功能模块示意图。应用于计算机设备,该计算机设备包括但不限于移动电话、手机、智能手机、平板电脑、个人电脑、个人数字助理、媒体播放器、服务器和其他电子设备。该用户画像构建装置100包括数据源模块110、身份标识模块120、连接关系模块130、以及画像构建模块140。在第十一实施例的基础上,连接关系模块130,具体用于以出现在同一条用户数据中的各用户ID之间具有连接关系为原则,确定用户ID之间的连接关系。
具体实施时,数据源中每一条数据中可能包括多个用户ID,可以清楚的是,每一条数据中的用户ID之间存在连接关系。进一步地,根据每一条数据中用户ID的连接关系为原则,确定数据源中ID之间的连接关系。如,数据中包括用户的手机编码及ip地址,则可以判定该手机编码和ip地址存在直接连接关系,在另一条数据中包括手机编码和用户账号ID,则判定该默认账号ID与ip地址存在间接连接关系。其中,该账号ID为服务商根据用户不同的登录方式生成的ID。
本实施例中,通过获取数据源中每一条数据中包括的多个用户ID,以及多个用户ID之间连接关系,构建数据源用户ID之间的连接关系。进而通过数据源中用户ID之间的连接关系,构建用户画像。将得到的用户画像作为一个特定的用户,并将弱账户体系对应的数据源匹配到该用户画像,由此解决了现有技术中在用户享用弱账户体系提供的服务时,弱账户体系对应的服务商不能完整地将数据源匹配到特定的用户的技术问题。
请参阅图12,为本发明第十三实施例提供的用户画像构建装置100的功能模块示意图。应用于计算机设备,该计算机设备包括但不限于移动电话、手机、智能手机、平板电脑、个人电脑、个人数字助理、媒体播放器、服务器和其他电子设备。该用户画像构建装置100包括数据源模块110、身份标识模块120、连接关系模块130、以及画像构建模块140。在第十一实施例的基础上,画像构建模块140包括:
连通图构建子模块141,用于根据用户ID之间的连接关系,构造连通图。
具体实施时,根据在每一条数据中获取的用户ID之间的连接关系,构建连通图,连通图中包括用户ID之间的直接联系关系或间接联系关系。如,数据中包括用户的手机编码及ip地址,则可以判定该手机编码和ip地址存在直接连接关系,在另一条数据中包括手机编码和用户账号ID,则判定该默认账号ID与ip地址存在间接连接关系;将存在连接关系的用户ID连接,连接后得到连通图。
用户画像子模块142,用于根据连通图,得到用户画像。
在得到连通图后,服务商可以根据连通图的特征对连通图中的用户ID进行筛选,根据筛选后的连通图得到用户画像。可以,用户数据源数据量大,得到的连通图复杂,可以将连通图中不重要的用户ID进行删除;如,一台手机也可以通过刷机改变手机设备号imei,苹果手机的设备号IDfa过一段时间就会自动新生成,则苹果手机设备号imei可以根据连通图的复杂性程度判定为不稳定用户ID。在具体实施时,可以根据具体需要选择性的删除连通图中不稳定的用户ID,通过删除后的连通图得到用户画像。
本实施例中,通过在每一条数据中获取的用户ID之间的连接关系,构建连通图;在得到连通图后,可根据连通图的特征对连通图中的用户ID进行筛选,通过筛选后的连通图得到用户画像,减少构建用户画像的运算量。进一步地,将得到的用户画像作为一个特定的用户,并将弱账户体系对应的数据源匹配到该用户画像,由此解决了现有技术中在用户享用弱账户体系提供的服务时,弱账户体系对应的服务商不能完整地将数据源匹配到特定的用户的技术问题。
请参阅图12,为本发明第十四实施例提供的用户画像构建装置100的功能模块示意图。应用于计算机设备,该计算机设备包括但不限于移动电话、手机、智能手机、平板电脑、个人电脑、个人数字助理、媒体播放器、服务器和其他电子设备。该用户画像构建装置100包括数据源模块110、身份标识模块120、连接关系模块130、以及画像构建模块140,画像构建模块140包括连通图构建子模块141和用户画像子模块142。在第十三实施例的基础上,用户画像子模块142具体用于检测连通图中是否只有没有连接关系的用户ID或者只有一个连接关系的用户ID,若是,则直接将连通图作为得到的用户画像;否则,在去除连通图中的伪连接后,得到用户画像。
由于用户数据源是通过多个弱账户体系中获取的,数据源可能对应有T级别的日志信息和亿级别的用户ID量,对算法运行时间的高要求,一般的算法达不到这个性能。检测到连接图中只有没有连接关系的用户ID或者只有一个连接关系的用户ID时,直接将连通图作为得到的用户画像。检测到连接图中不是只有没有连接关系的用户ID或者只有一个连接关系的用户ID时,在去除连通图中的伪连接后,得到用户画像。
可能因为用户数据源的数据不完整或用户第一次使用弱账户体系记录数据量少,造成得到的连通图中只有一个用户ID或只有一个连接关系的用户ID。该情况下,直接将该连通图作为用户画像,将得到的用户画像作为特定用户,也可将特定用户默认为新用户,并将该弱账户体系对应的数据源匹配到该用户画像。
具体实施时,连通图中的用户ID并不全是特定用户对应的用户ID;如,用户借了他朋友的手机登录了APP或网站,该情况下因为这个用户和他的朋友的APP或网站账号在同一个设备上登录,这两个登录账号会有一个连接关系,这种连接关系为伪连接。该用户和他的朋友的账号虽然有连接关系,但是最终会属于两个特定账户,两个人的身份,因此要将连通图中的伪连接去除,通过去除伪连接后的连通图,得到用户画像。
本实施例中,在检测到连接图中只有没有连接关系的用户ID或者只有一个连接关系的用户ID时,直接将连通图作为得到的用户画像,提升用户画像的构建效率。通过将连通图中的伪连接去除,通过去除伪连接后的连通图,得到用户画像,以保证用户画像的准确定。进一步地,将得到的用户画像作为一个特定的用户,并将弱账户体系对应的数据源匹配到该用户画像,由此解决了现有技术中在用户享用弱账户体系提供的服务时,弱账户体系对应的服务商不能完整地将数据源匹配到特定的用户的技术问题。
请参阅图13,为本发明第十五实施例提供的用户画像构建装置100的功能模块示意图。应用于计算机设备,该计算机设备包括但不限于移动电话、手机、智能手机、平板电脑、个人电脑、个人数字助理、媒体播放器、服务器和其他电子设备。该用户画像构建装置100包括数据源模块110、身份标识模块120、连接关系模块130、以及画像构建模块140,画像构建模块140包括连通图构建子模块141和用户画像子模块142。在第十四实施例的基础上,用户画像子模块142包括:
关联度单元1421,用于确定连通图中具有连接关系的两两用户ID之间的关联度,并判断关联度是否满足预设值。
由于连通图中ID之间的连接关系复杂,需要去除一些连接关系弱的连接。通过计算具有连接关系的两两ID之间的关联度,根据关联度对具有连接关系的两两ID之间的连接关系强弱进行判断。
具体实施时,根据用户数据源及连通图的复杂程度设定预设值。如在用户数据源量大时选择关联度中值、平均值作为预设值。根据连通图中ID的数量大小设置预设值,以通过预设值来减少连通图中用户ID的数量。
连接单元1422,用于在判断结果为是时,在连通图中断开这两个用户ID之间的连接。
在判断关联度不满足预设值,断开两个用户ID之间的连接。
本实施例中,通过确定连通图中具有连接关系的两两用户ID之间的关联度,对两个用户ID之间的连接强弱进行判断,在两个用户ID之间关联度小于预设值时,断开两个用户ID之间的连接,以保证用户画像的准确性,以及提升了用户画像构建的效率。进一步地,将得到的用户画像作为一个特定的用户,并将弱账户体系对应的数据源匹配到该用户画像,由此解决了现有技术中在用户享用弱账户体系提供的服务时,弱账户体系对应的服务商不能完整地将数据源匹配到特定的用户的技术问题。
请参阅图14,为本发明第十六实施例提供的用户画像构建装置100的功能模块示意图。应用于计算机设备,该计算机设备包括但不限于移动电话、手机、智能手机、平板电脑、个人电脑、个人数字助理、媒体播放器、服务器和其他电子设备。该用户画像构建装置100包括数据源模块110、身份标识模块120、连接关系模块130、以及画像构建模块140,画像构建模块140包括连通图构建子模块141和用户画像子模块142,用户画像子模块142包括关联度单元1421和连接单元1422。在第十五实施例的基础上,关联度单元1421包括:
连接天数子单元14211,用于获取两两用户ID之间的连接天数。
具体实施时,用户数据源随着用户使用APP或网站的次数增加而增加,连通图中的两两ID之间的关联度也不是长期稳定的,随着时间推移关联度也会改变。因此,本实施例中,通过获取两两用户ID之间的连接天数作为计算关联度的条件。
连接权重子单元14212,用于确定连接天数中每天对应的连接权重。
本发明实施例中,连接的各天对应的连接权重可以相同,但更优选地,过去一段时间的连接的权重小于当前时间的连接的权重。即,在连接天数中,第i天的连接权重小于第i+1天的连接权重。通过该设置可以更精准的体现用户当前的兴趣爱好。
具体实施时,令:连接权重N(t)=N0e-λt。其中,N(t)是衰减后的权重,N0是当前时间对应的原始权重,λ为根据具体的业务需求设置的衰减参数,t为当前时间与衰减时间对应的天数差值。
直接边关联度子单元14213,用于将确定的各连接权重求和,得到两两用户ID之间的直接边关联度。
关联度子单元14214,用于根据直接边关联度,得到两两用户ID之间的关联度。
本实施例中,通过获取两两用户ID之间的连接天数,确定连接天数中每天对应的连接权重,进而通过两两用户ID的直接边关联度和权重得到两两用户ID之间的直接边关联度。将关联度与连接天数建立联系,使得得到的用户画像更加准确。进一步地,将得到的用户画像作为一个特定的用户,并将弱账户体系对应的数据源匹配到该用户画像,由此解决了现有技术中在用户享用弱账户体系提供的服务时,弱账户体系对应的服务商不能完整地将数据源匹配到特定的用户的技术问题。
请参阅图15,为本发明第十七实施例提供的用户画像构建装置100的功能模块示意图。应用于计算机设备,该计算机设备包括但不限于移动电话、手机、智能手机、平板电脑、个人电脑、个人数字助理、媒体播放器、服务器和其他电子设备。该用户画像构建装置100包括数据源模块110、身份标识模块120、连接关系模块130、以及画像构建模块140,画像构建模块140包括连通图构建子模块141和用户画像子模块142,用户画像子模块142包括关联度单元1421和连接单元1422,关联度单元1421包括连接天数子单元14211、连接权重子单元14212、直接边关联度子单元14213、以及关联度子单元14214。在第十六实施例的基础上,关联度单元1421还包括:
间接连接子单元14215,用于确定出两两用户ID之间除具有直接连接关系外还包括通过其他用户ID进行连接的间接连接关系。
连接关系子单元14216连接关系子单元14216,用于求取间接连接关系的连接链路上具有连接关系的两两用户ID之间的直接边关联度。
根据获取到的两两ID之间的直接关联度和间接边关联度,得到两两用户ID之间的关联度。
间接边关联度子单元14217,用于根据求取的连接链路上两两用户ID之间的直接边关联度,得到间接边关联度。
关联度子单元14214,还用于根据直接边关联度和间接边关联度,得到两两用户ID之间的关联度。
具体实施时,两两用户ID之间除了通过直接,还通过间接连接;如,用户IDi直接连接用户IDj,用户IDi还可以通过用户IDk或用户IDl间接与用户IDj连接。在计算关联度时,除了计算两两用户ID之间的直接边关联度,还包括计算两两用户ID之间的间接关联度。
根据获取到的两两ID之间的直接关联度和间接边关联度,得到两两用户ID之间的关联度。
本实施例中,通过获取两两ID之间的直接边关联度和间接边关联度,进而通过直接边关联度和间接边关联度得到两两用户ID之间的关联度,通过对该关联度与预设值进行判断,以使得到的用户画像更加准备。进一步地,将得到的用户画像作为一个特定的用户,并将弱账户体系对应的数据源匹配到该用户画像,由此解决了现有技术中在用户享用弱账户体系提供的服务时,弱账户体系对应的服务商不能完整地将数据源匹配到特定的用户的技术问题。
请参阅图15,为本发明第十八实施例提供的用户画像构建装置100的功能模块示意图。应用于计算机设备,该计算机设备包括但不限于移动电话、手机、智能手机、平板电脑、个人电脑、个人数字助理、媒体播放器、服务器和其他电子设备。该用户画像构建装置100包括数据源模块110、身份标识模块120、连接关系模块130、以及画像构建模块140,画像构建模块140包括连通图构建子模块141和用户画像子模块142,用户画像子模块142包括关联度单元1421和连接单元1422,关联度单元1421包括连接天数子单元14211、连接权重子单元14212、直接边关联度子单元14213、间接连接子单元14215、连接关系子单元14216连接关系子单元14216、间接边关联度子单元14217、以及关联度子单元14214。在第十七实施例的基础上,关间接边关联度子单元14217具体用于确定连接链路的条数,在每条连接链路中选取最小的直接边关联度,将选取的各连接链路的最小的直接边关联度求和,得到间接边关联度。
具体实施时,由于两两用户ID之间除了直接连接关系,还存在间接连接关系。其中两两用户ID之间可以通过一个用户ID间接连接也可以通过两个或多个用户ID间接连接,因此间接连接关系存在有多个方式的连接链路。由于在用户数据源量大的情况下间接边连接链路数量较大,本实施例中选择通过一个用户ID间接连接的链路,并确定该链路条数。如,用户IDi直接连接用户IDj,用户IDi还可以通过用户IDk或用户IDl间接与用户IDj连接;在选择链路时,选择IDi通过用户IDk或用户IDl间接与用户IDj连接的链路。
具体实施时,IDi通过用户IDk间接与用户IDj连接的链路的最小的直接边关联度为min(eik,ekj),其中eik为用户IDi与用户IDk的直接边关联度,其中ekj为用户IDk与用户IDj的直接边关联度;通过用户IDl间接与用户IDj连接的链路的最小的直接边关联度为min(eil,elj),其中eil为用户IDi与用户IDl的直接边关联度,其中elj为用户IDl与用户IDj的直接边关联度。具体实施时,可通过如下公式获得
本实施例中,通过确定连接链路的条数,在每条连接链路中选取最小的直接边关联度,将选取的各连接链路的最小的直接边关联度求和,得到间接边关联度,进一步地保证用户画像的准确性。进一步地,将得到的用户画像作为一个特定的用户,并将弱账户体系对应的数据源匹配到该用户画像,由此解决了现有技术中在用户享用弱账户体系提供的服务时,弱账户体系对应的服务商不能完整地将数据源匹配到特定的用户的技术问题。
请参阅图15,为本发明第十九实施例提供的用户画像构建装置100的功能模块示意图。应用于计算机设备,该计算机设备包括但不限于移动电话、手机、智能手机、平板电脑、个人电脑、个人数字助理、媒体播放器、服务器和其他电子设备。该用户画像构建装置100包括数据源模块110、身份标识模块120、连接关系模块130、以及画像构建模块140,画像构建模块140包括连通图构建子模块141和用户画像子模块142,用户画像子模块142包括关联度单元1421和连接单元1422,关联度单元1421包括连接天数子单元14211、连接权重子单元14212、直接边关联度子单元14213、间接连接子单元14215、连接关系子单元14216连接关系子单元14216、间接边关联度子单元14217、以及关联度子单元14214。在第十八实施例的基础上,关间接边关联度子单元14217具体用于确定连接链路的条数,在每条连接链路中选取最小的直接边关联度,确定每条连接链路的权重,利用各连接链路的权重,对各连接链路的最小的直接边关联度进行加权处理,将加权后的各直接边关联度求和,得到间接边关联度。
具体实施时,根据每一条链路的稳定,设置不同的权重。如,两两用户ID之间通过一个稳定性弱的用户ID(如,苹果手机的设备号IDfa过一段时间就会自动新生成,以此该用户ID的稳定性弱)连接,或两两用户ID之间通过出现次数较多的用户ID连接,则对应链路的稳定性也不同。因此,可根据用户ID的稳定性强弱或用户ID在用户数据源中出现的次数对每一条链路设置权重。
具体实施时,可通过如下公式表示:wk min(eik,ekj),其中wk为用户IDi还可以通过用户IDk间接与用户IDj连接的链路权重;wl min(eil,elj),其中wl为用户IDi还可以通过用户IDl间接与用户IDj连接的链路权重。具体实施时,可通过如下公式获得:
本实施例中,通过确定每条连接链路的权重,利用各连接链路的权重,对各连接链路的最小的直接边关联度进行加权处理,将加权后的各直接边关联度求和,得到间接边关联度,进一步地保证用户画像的准确性。进一步地,将得到的用户画像作为一个特定的用户,并将弱账户体系对应的数据源匹配到该用户画像,由此解决了现有技术中在用户享用弱账户体系提供的服务时,弱账户体系对应的服务商不能完整地将数据源匹配到特定的用户的技术问题。
请参阅图14,为本发明第二十实施例提供的用户画像构建装置100的功能模块示意图。应用于计算机设备,该计算机设备包括但不限于移动电话、手机、智能手机、平板电脑、个人电脑、个人数字助理、媒体播放器、服务器和其他电子设备。该用户画像构建装置100包括数据源模块110、身份标识模块120、连接关系模块130、以及画像构建模块140,画像构建模块140包括连通图构建子模块141和用户画像子模块142,用户画像子模块142包括关联度单元1421和连接单元1422,关联度单元1421包括连接天数子单元14211、连接权重子单元14212、直接边关联度子单元14213、间接连接子单元14215、连接关系子单元14216连接关系子单元14216、间接边关联度子单元14217、以及关联度子单元14214。在第十七实施例的基础上,关联度子单元14214具体用于利用设定的直接边关联度的权重和间接边关联度的权重,对直接边关联度和间接边关联度进行加权处理,将加权后的直接边关联度和间接边关联度进行求和,得到两两用户ID之间的关联度。
具体实施时,根据实际运用场景,为直接边关联度和间接边关联度设置权重,以对直接边和间接边权重进行加权处理,使得得到的两两ID的关联度更加贴合实际运用。本实施例中,设置直接关联度的权重为1,间接关联度的权重为μ,则加权处理后的间接关联度为具体实施时,可通过如下公式获得:
本实施例中,通过利用设定的直接边关联度的权重和间接边关联度的权重,对直接边关联度和间接边关联度进行加权处理,将加权后的直接边关联度和间接边关联度进行求和,得到两两用户ID之间的关联度,进一步地保证用户画像的准确性。将得到的用户画像作为一个特定的用户,并将弱账户体系对应的数据源匹配到该用户画像,由此解决了现有技术中在用户享用弱账户体系提供的服务时,弱账户体系对应的服务商不能完整地将数据源匹配到特定的用户的技术问题。
本发明实施例还提供了一种计算设备,计算设备包括:存储器、处理器及通信总线;通信总线用于实现处理器和存储器之间的连接通信;
处理器用于执行存储器中存储的用户画像构建程序,以实现本发明如下步骤:
步骤S101,获取多个弱账户体系的用户数据源;
步骤S102,在用户数据源的每条用户数据中提取一个或多个用户身份标识ID;
步骤S103,确定用户ID之间的连接关系;
步骤S104,根据用户ID之间的连接关系,构建出用户画像。
可选的,执行的步骤可替换为步骤S201至步骤S204、步骤S301至步骤S305、步骤S401至步骤S407、步骤S501至步骤S509、步骤S601至步骤S612、步骤S701至步骤S715、步骤S801至步骤S817、步骤S901至步骤S919、以及步骤S1001至步骤S1018。
由于在第一实施例至第十实施例中已经对用户画像构建方法实施过程进行了详细说明,本实施例在此不再重复赘述。
本实施例中计算机设备包括但不限于移动电话、手机、智能手机、平板电脑、个人电脑、个人数字助理、媒体播放器、服务器和其他电子设备。
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现本发明实施例提供的如下步骤:
步骤S101,获取多个弱账户体系的用户数据源;
步骤S102,在用户数据源的每条用户数据中提取一个或多个用户身份标识ID;
步骤S103,确定用户ID之间的连接关系;
步骤S104,根据用户ID之间的连接关系,构建出用户画像。
可选的,执行的步骤可替换为步骤S201至步骤S204、步骤S301至步骤S305、步骤S401至步骤S407、步骤S501至步骤S509、步骤S601至步骤S612、步骤S701至步骤S715、步骤S801至步骤S817、步骤S901至步骤S919、以及步骤S1001至步骤S1018。
由于在第一实施例至第十实施例中已经对用户画像构建方法实施过程进行了详细说明,本实施例在此不再重复赘述。
本实施例计算机可读存储介质包括但不限于为:ROM、RAM、磁盘或光盘等。
综上所述,本发明实施例公开了一种用户画像构建方法、装置、计算设备及计算机可读存储介质,通过在多个弱账户体系中获取用户数据,在获取的每一条数据中提取一个或多个用户身份标识ID,根据ID之间的连接关系,构建用户画像。将弱账户体系中的数据源匹配到用户画像,通过用户画像标识用户的每一次行为,进而根据该用户画像对用户精准地推送其感兴趣的内容。由此解决了现有技术中在用户享用弱账户体系提供的服务时,弱账户体系对应的服务商不能完整地将数据源匹配到特定的用户的技术问题,并取得了积极的技术效果。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
总之,以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (18)
1.一种用户画像构建方法,其特征在于,所述方法包括:
获取多个弱账户体系的用户数据源;
在所述用户数据源的每条用户数据中提取一个或多个用户ID;
确定所述用户ID之间的连接关系;
根据所述用户ID之间的连接关系,构建出用户画像,包括:
根据所述用户ID之间的连接关系,构造连通图;
检测所述连通图中是否只有没有连接关系的用户ID或者只有一个连接关系的用户ID,若否,在去除所述连通图中的伪连接后,得到用户画像;所述去除所述连通图中的伪连接,包括:获取两两用户ID之间的连接天数;确定所述连接天数中每天对应的连接权重;将确定的各连接权重求和,得到所述两两用户ID之间的直接边关联度;根据所述直接边关联度,得到所述两两用户ID之间的关联度,并判断所述关联度是否满足预设值;当判断结果为是时,在所述连通图中断开关联度满足预设值的所述两两用户ID之间的连接。
2.如权利要求1所述的方法,其特征在于,所述确定所述用户ID之间的连接关系,包括:
以出现在同一条用户数据中的各用户ID之间具有连接关系为原则,确定所述用户ID之间的连接关系。
3.如权利要求1所述的方法,其特征在于,所述根据所述连通图,得到所述用户画像,还包括:
在所述连通图中只有没有连接关系的用户ID或者只有一个连接关系的用户ID的情况下,则直接将所述连通图作为得到的用户画像。
4.如权利要求1所述的方法,其特征在于,在所述连接天数中,第i天的连接权重小于第i+1天的连接权重。
5.如权利要求1所述的方法,其特征在于,所述得到所述两两用户ID之间的直接边关联度之后,还包括:
确定出所述两两用户ID之间除具有直接连接关系外还包括通过其他用户ID进行连接的间接连接关系;
求取间接连接关系的连接链路上具有连接关系的两两用户ID之间的直接边关联度;
根据求取的连接链路上两两用户ID之间的直接边关联度,得到间接边关联度;
根据所述直接边关联度和间接边关联度,得到两两用户ID之间的关联度。
6.如权利要求5所述的方法,其特征在于,所述根据求取的连接链路上两两用户ID之间的直接边关联度,得到间接边关联度,包括:
确定连接链路的条数;
在每条连接链路中选取最小的直接边关联度;
将选取的各连接链路的最小的直接边关联度求和,得到间接边关联度。
7.如权利要求6所述的方法,其特征在于,将选取的各连接链路的最小的直接边关联度求和,包括:
确定每条连接链路的权重;
利用各连接链路的权重,对各连接链路的最小的直接边关联度进行加权处理;
将加权后的各直接边关联度求和,得到间接边关联度。
8.如权利要求5所述的方法,其特征在于,所述根据所述直接边关联度和间接边关联度,得到两两用户ID之间的关联度,包括:
利用设定的直接边关联度的权重和间接边关联度的权重,对所述直接边关联度和间接边关联度进行加权处理;
将加权后的直接边关联度和间接边关联度进行求和,得到两两用户ID之间的关联度。
9.一种用户画像构建装置,其特征在于,所述装置包括:
数据源模块,用于获取多个弱账户体系的用户数据源;
身份标识模块,用于在所述用户数据源的每条用户数据中提取一个或多个用户ID;
连接关系模块,用于确定所述用户ID之间的连接关系;
画像构建模块,用于根据所述用户ID之间的连接关系,构建出用户画像;
所述画像构建模块包括:连通图构建子模块,用于根据所述用户ID之间的连接关系,构造连通图;用户画像子模块,用于检测所述连通图中是否只有没有连接关系的用户ID或者只有一个连接关系的用户ID,若否,在去除所述连通图中的伪连接后,得到用户画像;
所述用户画像子模块包括:关联度单元,用于确定所述连通图中具有连接关系的两两用户ID之间的关联度,并判断所述关联度是否满足预设值;连接单元,用于在判断结果为是时,在所述连通图中断开关联度满足预设值的所述两两用户ID之间的连接;
所述关联度单元包括:连接天数子单元,用于获取所述两两用户ID之间的连接天数;连接权重子单元,用于确定所述连接天数中每天对应的连接权重;直接边关联度子单元,用于将确定的各连接权重求和,得到所述两两用户ID之间的直接边关联度;关联度子单元,用于根据所述直接边关联度,得到所述两两用户ID之间的关联度。
10.如权利要求9所述的装置,其特征在于,所述连接关系模块具体用于以出现在同一条用户数据中的各用户ID之间具有连接关系为原则,确定所述用户ID之间的连接关系。
11.如权利要求9所述的装置,其特征在于,所述根据所述连通图,所述用户画像子模块具体用于在所述连通图中是只有没有连接关系的用户ID或者只有一个连接关系的用户ID的情况下,则直接将所述连通图作为得到的用户画像。
12.如权利要求9所述的装置,其特征在于,在所述连接天数中,第i天的连接权重小于第i+1天的连接权重。
13.如权利要求9所述的装置,其特征在于,所述关联度单元还包括:
间接连接子单元,用于确定出所述两两用户ID之间除具有直接连接关系外还包括通过其他用户ID进行连接的间接连接关系;
连接关系子单元,用于求取间接连接关系的连接链路上具有连接关系的两两用户ID之间的直接边关联度;
间接边关联度子单元,用于根据求取的连接链路上两两用户ID之间的直接边关联度,得到间接边关联度;
关联度子单元,还用于根据所述直接边关联度和间接边关联度,得到两两用户ID之间的关联度。
14.如权利要求13所述的装置,其特征在于,所述间接边关联度子单元具体用于确定连接链路的条数,在每条连接链路中选取最小的直接边关联度,将选取的各连接链路的最小的直接边关联度求和,得到间接边关联度。
15.如权利要求14所述的装置,其特征在于,将选取的各连接链路的最小的直接边关联度求和,包括确定每条连接链路的权重,利用各连接链路的权重,对各连接链路的最小的直接边关联度进行加权处理,将加权后的各直接边关联度求和,得到间接边关联度。
16.如权利要求13所述的装置,其特征在于,所述关联度子单元具体用于利用设定的直接边关联度的权重和间接边关联度的权重,对所述直接边关联度和间接边关联度进行加权处理,将加权后的直接边关联度和间接边关联度进行求和,得到两两用户ID之间的关联度。
17.一种计算设备,其特征在于,所述计算设备包括:存储器、处理器及通信总线;所述通信总线用于实现处理器和存储器之间的连接通信;
所述处理器用于执行存储器中存储的用户画像构建程序,以实现如权利要求1至8中任一项所述的用户画像构建方法的步骤。
18.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现如权利要求1至8中任一项所述的用户画像构建方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810509950.5A CN108876434B (zh) | 2018-05-24 | 2018-05-24 | 用户画像构建方法、装置、计算设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810509950.5A CN108876434B (zh) | 2018-05-24 | 2018-05-24 | 用户画像构建方法、装置、计算设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108876434A CN108876434A (zh) | 2018-11-23 |
CN108876434B true CN108876434B (zh) | 2022-08-16 |
Family
ID=64333219
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810509950.5A Active CN108876434B (zh) | 2018-05-24 | 2018-05-24 | 用户画像构建方法、装置、计算设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108876434B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109582829B (zh) * | 2018-12-03 | 2021-05-18 | 联想(北京)有限公司 | 一种处理方法、装置、设备及可读存储介质 |
CN111292152A (zh) * | 2018-12-07 | 2020-06-16 | 上海云思智慧信息技术有限公司 | 一种虚拟人物画像构建方法及系统、存储介质及终端 |
CN110505285B (zh) * | 2019-07-31 | 2022-03-22 | 万翼科技有限公司 | 园区会话方法及相关装置 |
CN112954666A (zh) * | 2019-11-26 | 2021-06-11 | 中兴通讯股份有限公司 | 一种用户画像方法、装置、设备和存储介质 |
CN111400549B (zh) * | 2020-06-05 | 2021-02-02 | 北京搜狐新动力信息技术有限公司 | 一种用户画像的处理方法及系统 |
CN111931107B (zh) * | 2020-07-31 | 2024-03-22 | 博泰车联网科技(上海)股份有限公司 | 数字公民体系构建方法、系统及存储介质 |
CN112231590B (zh) * | 2020-10-15 | 2023-06-27 | 中国联合网络通信集团有限公司 | 内容推荐方法、系统、计算机设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130055076A1 (en) * | 2010-02-09 | 2013-02-28 | Exb Asset Management Gmbh | Online Analysis and Display of Correlated Information |
US20160021084A1 (en) * | 2009-03-25 | 2016-01-21 | The 41St Parameter, Inc. | Systems and methods of sharing information through a tag-based consortium |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2810264C (en) * | 2011-03-18 | 2020-06-09 | The Nielsen Company (Us), Llc | Methods and apparatus to determine media impressions |
CN105827676B (zh) * | 2015-01-04 | 2019-06-14 | 中国移动通信集团上海有限公司 | 一种用户画像信息获取系统、方法及装置 |
CN106504099A (zh) * | 2015-09-07 | 2017-03-15 | 国家计算机网络与信息安全管理中心 | 一种构建用户画像的系统 |
CN106534164B (zh) * | 2016-12-05 | 2019-09-03 | 公安部第三研究所 | 基于网络空间用户标识的有效虚拟身份刻画方法 |
CN106960391A (zh) * | 2017-02-23 | 2017-07-18 | 武汉智寻天下科技有限公司 | 一种用户信息聚合方法、系统和装置 |
CN107862553B (zh) * | 2017-11-15 | 2020-03-17 | 平安科技(深圳)有限公司 | 广告实时推荐方法、装置、终端设备及存储介质 |
CN108038714B (zh) * | 2017-11-29 | 2020-12-11 | 贝壳找房(北京)科技有限公司 | 广告推广处理方法及装置 |
-
2018
- 2018-05-24 CN CN201810509950.5A patent/CN108876434B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160021084A1 (en) * | 2009-03-25 | 2016-01-21 | The 41St Parameter, Inc. | Systems and methods of sharing information through a tag-based consortium |
US20130055076A1 (en) * | 2010-02-09 | 2013-02-28 | Exb Asset Management Gmbh | Online Analysis and Display of Correlated Information |
Also Published As
Publication number | Publication date |
---|---|
CN108876434A (zh) | 2018-11-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108876434B (zh) | 用户画像构建方法、装置、计算设备及可读存储介质 | |
CN109816039B (zh) | 一种跨模态信息检索方法、装置和存储介质 | |
US20160105386A1 (en) | System for handling abbreviation related text | |
CN105630977B (zh) | 应用程序推荐方法、装置及系统 | |
WO2015058709A1 (en) | Secured payment method and relevant device and system | |
CN112000819A (zh) | 多媒体资源推荐方法、装置、电子设备及存储介质 | |
CN106534268B (zh) | 一种数据共享方法及装置 | |
CN105224545A (zh) | 一种位置推荐方法及装置 | |
CN111723083B (zh) | 用户身份识别方法、装置、电子设备及存储介质 | |
CN109272378A (zh) | 一种风险群组的发现方法和装置 | |
CN112765364A (zh) | 群聊会话排序方法、装置、存储介质和电子设备 | |
CN114398973B (zh) | 一种媒体内容标签识别方法、装置、设备及存储介质 | |
CN114969512A (zh) | 对象推荐方法、装置、电子设备 | |
CN114153959A (zh) | 键值匹配方法、装置、可读介质及电子设备 | |
US20130151553A1 (en) | Method and apparatus for processing a composite context event | |
CN110599278A (zh) | 聚合设备标识符的方法、装置和计算机存储介质 | |
CN110020166B (zh) | 一种数据分析方法及相关设备 | |
CN110362603B (zh) | 一种特征冗余性分析方法、特征选择方法和相关装置 | |
CN115481424A (zh) | 检测模型的跨域自适应方法、数据处理方法 | |
CN112559872A (zh) | 设备间用户识别方法、系统、计算机设备及存储介质 | |
CN113297504A (zh) | 一种社交账户推荐方法、装置、电子设备和存储介质 | |
CN114401242B (zh) | 用户推荐方法、装置、设备及计算机可读存储介质 | |
CN110913353A (zh) | 短信的分类方法及装置 | |
CN114741502A (zh) | 资源确定的方法和装置、电子设备和存储介质 | |
CN110417841B (zh) | 地址归一化处理方法、装置和系统、数据处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |