WO2019080404A1 - 跨社交平台用户匹配方法、数据处理装置及可读存储介质 - Google Patents

跨社交平台用户匹配方法、数据处理装置及可读存储介质

Info

Publication number
WO2019080404A1
WO2019080404A1 PCT/CN2018/075205 CN2018075205W WO2019080404A1 WO 2019080404 A1 WO2019080404 A1 WO 2019080404A1 CN 2018075205 W CN2018075205 W CN 2018075205W WO 2019080404 A1 WO2019080404 A1 WO 2019080404A1
Authority
WO
WIPO (PCT)
Prior art keywords
user
information
social platform
users
spatial distance
Prior art date
Application number
PCT/CN2018/075205
Other languages
English (en)
French (fr)
Inventor
王健宗
吴天博
黄章成
肖京
Original Assignee
平安科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 平安科技(深圳)有限公司 filed Critical 平安科技(深圳)有限公司
Publication of WO2019080404A1 publication Critical patent/WO2019080404A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Definitions

  • the present application relates to the field of computer network technologies, and in particular, to a cross-social platform user matching method, a data processing device, and a computer readable storage medium.
  • the social network user matching technology is a method for identifying the same person's account on each social platform, and can effectively integrate the information of multiple sources of the user together, so that the user can further provide personalized service.
  • the existing social network user matching technology utilizes the semantic information (user name, geographical location, personal data, etc.) of the user in the online social network or the online community, and uses the machine learning algorithm to calculate the similarity between the users.
  • the results of the connection between the two social platforms are combined to get the final matching result, but this will result in different total results if the connection order of the two social platforms is different.
  • Another aspect of the existing social network user matching technology is to use the topology of the social network to model the network as a weightless graph, by mining the structural features of the nodes (node degrees, common neighbors, etc.), thereby realizing cross-platform identification Users, but this way to model the social network as a powerless graph, ignoring the intimacy between users, and the intimacy of different users in real life is different.
  • the main purpose of the present application is to provide a cross-social platform user matching method, a data processing device, and a computer readable storage medium, which are aimed at improving the technical problem of accuracy and recognition rate of user matching across social platforms.
  • the present application provides a cross-social platform user matching method, including the steps of:
  • the application also provides a data processing device, including:
  • a data acquisition module acquiring information of the first user on the first social platform, and acquiring information of the second user on the second social platform;
  • mapping module by using a ULinK framework algorithm model, defining spatial mappings of matching offline users and unmatched offline users on the first social platform and the second social platform, to calculate information representing the first user and a spatial distance of the total difference between the information of the second user;
  • the spatial distance calculation module solves the projection matrix of the ULinK framework algorithm according to the spatial distance representing the total difference between the information of the first user and the information of the second user, and establishes a original space and a user hidden space. Contacting to obtain a spatial distance between the first user and the second user in the hidden space of the user;
  • the user matching module determines, according to the spatial distance between the first user and the second user in the hidden space, whether the first user and the second user are matched offline users.
  • the present application also provides a data processing apparatus including a memory, a processor, and a computer program stored on the memory and operable on the processor, the processor executing the program to implement a cross-social platform user matching method as described above A step of.
  • the present application also provides a computer readable storage medium having stored thereon a computer program, wherein the program, when executed by the processor, implements the steps of the cross-social platform user matching method as described above.
  • the information of the first user on the first social platform is acquired, and the information of the second user on the second social platform is acquired; and then the first social platform and the second social are defined by the ULinK framework algorithm model.
  • Defining a spatial distance between the information of the first user and the information of the second user solving a projection matrix of the ULinK framework algorithm model, establishing a raw space and a user hidden space association, to obtain the The user hides a spatial distance between the first user and the second user in a space; and determines the number according to a spatial distance between the first user and the second user in the hidden space Whether a user and the second user are matched offline users; considering the relationship between the two platforms in the restriction item, calculating the projection by establishing a spatial projection model Way to avoid multiple platforms connection order is not the same result in the most total result can not be confirmed problem; while
  • FIG. 1 is a flowchart of a method for matching a cross-social platform user in a first embodiment of the present application
  • FIG. 4 is a cross-social platform user matching example of the present application.
  • FIG. 5 is a schematic structural diagram of hardware modules of a data processing apparatus according to an embodiment of the present application.
  • FIG. 6 is a schematic structural diagram of functional modules of a data processing apparatus according to an embodiment of the present application.
  • FIG. 1 is a flowchart of a method for a cross-social platform user matching method 100 according to a first embodiment of the present application, where the cross-social platform user matching method 100 includes the following steps:
  • Step S10 Acquire information of the first user on the first social platform, and acquire information of the second user on the second social platform.
  • the first user on the first social platform and the second user on the second social platform may be the same user or different users; in the step 10, the first The offline relationship between the user and the second user is unknown.
  • the result of the cross-social platform user matching method 100 in the embodiment that needs to be confirmed is the offline matching relationship between the first user and the second user. Whether the first user and the second user are matched offline users.
  • the social platform may be various social softwares or social networking websites in the Internet, and is not specifically limited herein.
  • the information of the first user includes, but is not limited to, a user's name, nickname, gender, age, hobbies, work experience, personal signature, tag, place of origin, resident address, email address, telephone number, social account number, etc.;
  • the user's information also includes, but is not limited to, the user's name, nickname, gender, age, hobbies, work experience, personal signature, tag, place of origin, resident address, email address, phone number, social account number, and the like.
  • Step S20 defining a spatial mapping of the matched offline user and the unmatched offline user on the first social platform and the second social platform by using a ULinK framework algorithm model, to calculate information representing the first user and The spatial distance of the total difference between the information of the second user.
  • Step S30 solving a projection matrix of the ULinK framework algorithm model according to the spatial distance of the total difference between the information representing the first user and the information of the second user, and establishing a hidden space relationship between the original space and the user And obtaining a spatial distance between the first user and the second user in the hidden space of the user.
  • the definition of the potential user hidden space is to assume that there is such a space, the information of the same user will be closer to each other in the space, and the information of different users will be far apart.
  • the ULinK framework algorithm model defined in steps 20 and 30 is used to establish such a relationship, and the original space and the user hidden space are linked to complete the user matching work.
  • a spatial mapping of the same user and different usages on different social platforms is defined by the ULinK framework algorithm; that is, matching offline users and unmatched offline users on the first social platform and the second social platform are defined Space mapping, the total difference between the information 1 - N of the first user and the information 1 - N ' of the second user represents a spatial distance between the users; according to the information representing the first user Calculating a spatial distance of the total difference between 1 ⁇ N and the information 1 ⁇ N' of the second user, solving a projection matrix of the ULinK framework algorithm model, establishing a hidden space relationship between the original space and the user, to obtain the hidden by the user The spatial distance between the first user and the second user in the space; in the user hidden space, the distance of the spatial distance represents whether the user is the same offline user.
  • Step S40 Determine, according to the spatial distance between the first user and the second user in the hidden space, whether the first user and the second user are matched offline users.
  • the distance of the spatial distance represents whether the user is the same offline user; that is, in the step S40, the first user and the user in the hidden space may be set. Determining whether the first user and the second user are matched offline users by using a minimum threshold of a spatial distance between the second users, or directly directly searching all the first users in the hidden space The first user and the second user with the shortest spatial distance between all the second users are confirmed as matching offline users.
  • the information of the first user on the first social platform is acquired, and the information of the second user on the second social platform is acquired; and then the first social platform and the second are defined by a ULinK framework algorithm model.
  • the projection dimensions of the first user's information 1 to N and the second user's information 1 to N' are the same.
  • the objective function of the ULinK framework algorithm model includes:
  • is a projection matrix
  • the ⁇ is a relaxation variable
  • the C is a penalty coefficient
  • the D function is a distance function
  • the B is a coefficient
  • the u For the user's information
  • the e is the total number of the social platforms
  • the l, k, ⁇ (l) are index values.
  • the above objective function solves the optimization problem in the objective function by using the efficient CCCP optimization algorithm.
  • the connection order of multiple social platforms is avoided, resulting in the most unrecognized confirmation.
  • the method may further include:
  • step S21 the information of the first user on the first social platform and the information of the second user on the second social platform corresponding to each moment are updated in real time through the ULink-On framework algorithm model.
  • the objective function of the ULink-On framework algorithm model may include:
  • the defined ULink-On framework algorithm model solves the problem of real-time data, establishes potential user hidden space in real time, and gradually improves the performance of the algorithm framework as the amount of data increases, and finally completes the better matching result.
  • step S40 determining the space according to a spatial distance between the first user and the second user in the hidden space. Whether a user and the second user are matched offline users, including:
  • Step S401 determining whether a spatial distance between the first user and the second user in the hidden space of the user is less than a preset threshold
  • Step S402 when the spatial distance between the first user and the second user in the user hidden space is less than a preset threshold, confirm that the first user and the second user are offline. user.
  • determining whether the first user and the second user are matched by setting a minimum threshold of a spatial distance between the first user and the second user in the hidden space Offline users can effectively improve the accuracy of user matching across social platforms.
  • step S40 determining, according to the spatial distance between the first user and the second user in the hidden space, Whether the first user and the second user are matching offline users, including:
  • Step S411 Acquire a first user and a second user that have the shortest spatial distance between all the first users and all the second users in the hidden space;
  • Step S412 the first user and the second user whose space distance is the shortest are confirmed as matching offline users.
  • the first user and the second user who minimize the spatial distance between all the first users and all the second users in the hidden space are directly confirmed as matching offline users, and Effectively improve the recognition rate of user matching across social platforms.
  • the cross-social platform user matching method in the above embodiment can accurately mine the registered users of the same user on different social platforms from hundreds of millions of users in the social platform, and can effectively integrate the information of multiple sources of the user together. Therefore, the user can further provide personalized service, and the cross-social platform user matching method can be applied to the field of financial products, public security monitoring, and the like.
  • FIG. 4 is a cross-social platform user matching example of the present application, where the first social platform is a Renren network and the second social platform is a Weibo.
  • the first social platform is a Renren network
  • the second social platform is a Weibo.
  • is a projection matrix
  • the ⁇ is a relaxation variable
  • the C is a penalty coefficient
  • the D function is a distance function
  • the B is a coefficient
  • the u For the information of the user, the e is the total number of the social platforms, and the l, k, ⁇ (l) are index values;
  • FIG. 5 is a schematic structural diagram of hardware modules of the data processing apparatus 200 according to an embodiment of the present application.
  • the data processing apparatus 200 includes a memory 201, a processor 202, and a computer program stored on the memory and operable on the processor 202.
  • the processor 202 implements the program to implement the following steps:
  • Step S10 Acquire information of the first user on the first social platform, and acquire information of the second user on the second social platform.
  • Step S20 defining a spatial mapping of the matched offline user and the unmatched offline user on the first social platform and the second social platform by using a ULinK framework algorithm model, to calculate information representing the first user and a spatial distance of the total difference between the information of the second user;
  • Step S30 solving a projection matrix of the ULinK framework algorithm model according to the spatial distance of the total difference between the information representing the first user and the information of the second user, and establishing a hidden space relationship between the original space and the user Obtaining a spatial distance between the first user and the second user in the hidden space of the user;
  • Step S40 Determine, according to the spatial distance between the first user and the second user in the hidden space, whether the first user and the second user are matched offline users.
  • the data processing apparatus obtains information of the first user on the first social platform, and acquires information of the second user on the second social platform; and then defines the first by using a ULinK framework algorithm model. Spatial mapping of matching offline users and unmatched offline users on a social platform and a second social platform to calculate a total difference between information representing the first user and information of the second user a spatial distance; and further, according to the spatial distance representing the total difference between the information of the first user and the information of the second user, the projection matrix of the ULinK framework algorithm model is solved, and the original space and the user are hidden.
  • the inter-projection model calculates the way of projection, avoiding the problem that the connection order of multiple platforms is different, which leads to the failure to confirm the most total results. At the same time, the accuracy and recognition rate of user matching across social platforms are improved.
  • the data processing device 200 may be an electronic product having a data processing function such as a server, a computer, a portable computer device, a mobile phone, or a tablet computer.
  • the projection dimensions of the first user's information 1 to N and the second user's information 1 to N' are the same.
  • the objective function of the ULinK framework algorithm model includes:
  • is a projection matrix
  • the ⁇ is a relaxation variable
  • the C is a penalty coefficient
  • the D function is a distance function
  • the B is a coefficient
  • the u For the user's information
  • the e is the total number of the social platforms
  • the l, k, ⁇ (l) are index values.
  • the above objective function solves the optimization problem in the objective function by using the efficient CCCP optimization algorithm.
  • the connection order of multiple social platforms is avoided, resulting in the most unrecognized confirmation.
  • the method may further include:
  • step S21 the information of the first user on the first social platform and the information of the second user on the second social platform corresponding to each moment are updated in real time through the ULink-On framework algorithm model.
  • the objective function of the ULink-On framework optimization algorithm model may include:
  • the defined ULink-On framework algorithm model solves the problem of real-time data, and establishes potential user hidden space in real time. As the amount of data increases, the performance of the algorithm framework is gradually improved, and a better matching result is finally achieved.
  • step S40 determining the first user and the second according to a spatial distance between the first user and the second user in the hidden space. Whether the user is a matching offline user, including:
  • Step S401 determining whether a spatial distance between the first user and the second user in the hidden space of the user is less than a preset threshold
  • Step S402 when the spatial distance between the first user and the second user in the user hidden space is less than a preset threshold, confirm that the first user and the second user are offline. user.
  • determining whether the first user and the second user are matched by setting a minimum threshold of a spatial distance between the first user and the second user in the hidden space Offline users can effectively improve the accuracy of user matching across social platforms.
  • step S40 determining, by the spatial distance between the first user and the second user in the hidden space, the first user and the first Whether the second user is a matching offline user, including:
  • Step S411 Acquire a first user and a second user that have the shortest spatial distance between all the first users and all the second users in the hidden space;
  • Step S412 the first user and the second user whose space distance is the shortest are confirmed as matching offline users.
  • the first user and the second user who minimize the spatial distance between all the first users and all the second users in the hidden space are directly confirmed as matching offline users, and Effectively improve the recognition rate of user matching across social platforms.
  • FIG. 6 is a schematic structural diagram of a function module of the data processing apparatus 200 according to an embodiment of the present application.
  • the data processing device 200 includes:
  • the data obtaining module 210 acquires information of the first user on the first social platform, and acquires information of the second user on the second social platform;
  • the mapping module 211 defines a spatial mapping of the matched offline user and the unmatched offline user on the first social platform and the second social platform by using a ULinK framework algorithm model to calculate information representing the first user. a spatial distance from the total difference between the information of the second user;
  • the spatial distance calculation module 212 solves the projection matrix of the ULinK framework algorithm according to the spatial distance between the information representing the first user and the information of the second user, and establishes the original space and the user hides Spatially contacting to obtain a spatial distance between the first user and the second user in the hidden space of the user;
  • the user matching module 213 determines, according to the spatial distance between the first user and the second user in the hidden space, whether the first user and the second user are matched offline users.
  • the data processing device 200 may be an electronic product having a data processing function such as a server, a computer, a portable computer device, a mobile phone, or a tablet computer.
  • the projection dimensions of the first user's information 1 to N and the second user's information 1 to N' are the same.
  • the objective function of the ULinK framework algorithm model includes:
  • is a projection matrix
  • the ⁇ is a relaxation variable
  • the C is a penalty coefficient
  • the D function is a distance function
  • the B is a coefficient
  • the u For the user's information
  • the e is the total number of the social platforms
  • the l, k, ⁇ (l) are index values.
  • the data processing apparatus 200 may further include:
  • the data optimization module 214 updates the information of the first user on the first social platform and the information of the second user on the second social platform corresponding to each moment in real time by defining a ULink-On framework algorithm model.
  • the objective functions of the ULink-On framework optimization algorithm model include:
  • the defined ULink-On framework algorithm model solves the problem of real-time data, establishes potential user hidden space in real time, and gradually improves the performance of the algorithm framework as the amount of data increases, and finally achieves better matching results.
  • the user matching module 213 is configured to:
  • the user matching module 213 is configured to:
  • the present application also provides a computer readable storage medium having stored thereon a computer program that, when executed by a processor, can implement the steps of the cross-social platform user matching method as described in one embodiment above.
  • the technical solution of the present application which is essential or contributes to the prior art, may be embodied in the form of a software product stored in a storage medium (such as ROM/RAM as described above). , a disk, an optical disk, including a number of instructions for causing a terminal device (which may be a mobile phone, a computer, a server, an air conditioner, or a network device, etc.) to perform the methods described in the various embodiments of the present application.
  • a terminal device which may be a mobile phone, a computer, a server, an air conditioner, or a network device, etc.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种跨社交平台用户匹配方法,包括步骤:获取第一社交平台上的第一用户的信息,以及获取第二社交平台上的第二用户的信息;通过ULinK框架算法模型定义匹配的和不匹配的线下用户的空间映射,以计算所述第一用户的信息与所述第二用户的信息之间总差异性;求解所述ULinK框架算法模型的投影矩阵,建立原始空间和用户隐藏空间联系,根据所述隐藏空间中的所述第一用户与所述第二用户之间的空间距离判断所述第一用户与所述第二用户是否为匹配的线下用户。本申请还提供一种数据处理装置及计算机可读存储介质。

Description

跨社交平台用户匹配方法、数据处理装置及可读存储介质 技术领域
本申请涉及计算机网络技术领域,尤其涉及一种跨社交平台用户匹配方法、数据处理装置及计算机可读存储介质。
背景技术
随着互联网的发展,用户通常同时在多个社交网站拥有账号,比如微博、朋友圈、脸书(Facebook)以及推特(Twitter)等各类社交平台。社交网络用户匹配技术是一种识别同一个人在各个社交平台的账号的方法,可以有效地将用户多个来源的信息整合到一起,从而可以为用户进一步的提供个性化的服务。
通常现有的社交网络用户匹配技术是利用在线社交网络或者在线社区中用户的语义信息(用户名、地理位置、分人资料等),使用机器学习算法来计算用户之间的相似度,通过两两社交平台的连接结果整合得到最后的匹配结果,但是这样就会产生如果两两社交平台的连接顺序不同,导致最总结果不同。现有的社交网络用户匹配技术中还有一种是使用社交网络的拓扑结构,将网络建模成无权图,通过挖掘节点的结构特征(节点度、共同邻居等),从而实现跨平台识别同一用户,但此种方式把社交网络建模成无权图,忽略了用户间的亲密程度,而现实生活中不同用户的亲密程度是有差异的。
申请内容
本申请的主要目的在于提供一种跨社交平台用户匹配方法、数据处理装置及计算机可读存储介质,旨在改进跨社交平台用户匹配的准确度和识别率的技术问题。
为实现上述目的,本申请提供的一种一种跨社交平台用户匹配方法,包括步骤:
获取第一社交平台上的第一用户的信息,以及获取第二社交平台上的第二用户的信息;
通过ULinK框架算法模型定义所述第一社交平台和第二社交平台上的匹配的线下用户和不匹配的线下用户的空间映射,以计算得到代表所述第一用户的信息与所述第二用户的信息之间总差异性的空间距离;
根据所述代表所述第一用户的信息与所述第二用户的信息之间总差异性的空间距离,求解所述ULinK框架算法模型的投影矩阵,建立原始空间和用户隐藏空间联系,以获取所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离;
根据所述隐藏空间中的所述第一用户与所述第二用户之间的空间距离判断所述第一用户与所述第二用户是否为匹配的线下用户。
本申请还提供一种数据处理装置,包括:
数据获取模块,获取第一社交平台上的第一用户的信息,以及获取第二社交平台上的第二用户的信息;
映射模块,通过ULinK框架算法模型定义所述第一社交平台和第二社交平台上的匹配的线下用户和不匹配的线下用户的空间映射,以计算得到代表所述第一用户的信息与所述第二用户的信息之间总差异性的空间距离;
空间距离计算模块,根据所述代表所述第一用户的信息与所述第二用户的信息之间总差异性的空间距离,求解所述ULinK框架算法的投影矩阵,建立原始空间和用户隐藏空间联系,以获取所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离;
用户匹配模块,根据所述隐藏空间中的所述第一用户与所述第二用户之间的空间距离判断所述第一用户与所述第二用户是否为匹配的线下用户。
本申请还提供一种数据处理装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述的跨社交平台用户匹配方法的步骤。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如上述的跨社交平台用户匹配方法的步骤。
在本申请中,通过获取第一社交平台上的第一用户的信息,以及获取第二社交平台上的第二用户的信息;然后通过ULinK框架算法模型定义所述第一社交平台和第二社交平台上的匹配的线下用户和不匹配的线下用户的空间映射,以计算得到代表所述第一用户的信息与所述第二用户的信息之间总差异性的空间距离; 再根据所述代表所述第一用户的信息与所述第二用户的信息之间总差异性的空间距离,求解所述ULinK框架算法模型的投影矩阵,建立原始空间和用户隐藏空间联系,以获取所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离;并根据所述隐藏空间中的所述第一用户与所述第二用户之间的空间距离判断所述第一用户与所述第二用户是否为匹配的线下用户;将两两平台之间的关系考虑在限制项中,通过建立空间投影模型,计算投影的方式,避免了多个平台连接顺序不一样导致最总结果无法确认的问题;同时改进了跨社交平台用户匹配的准确度和识别率。
附图说明
图1为本申请第一实施方式中的跨社交平台用户匹配方法的方法流程图;
图2为图1中社交平台用户的现实关系匹配方法的步骤S40的一实施例中的子流程图;
图3为图1中社交平台用户的现实关系匹配方法的步骤S40的另一实施例中的子流程图;
图4为本申请一跨社交平台用户匹配示例。
图5为本申请一实施方式中的数据处理装置的硬件模块结构示意图;
图6为本申请一实施方式中的数据处理装置的功能模块结构示意图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
请参照图1,图1为本申请第一实施方式中的跨社交平台用户匹配方法100的方法流程图,其中,所述跨社交平台用户匹配方法100包括如下步骤:
步骤S10,获取第一社交平台上的第一用户的信息,以及获取第二社交平台上的第二用户的信息。
其中,所述第一社交平台上的所述第一用户和所述第二社交平台上的所述第二用户可以是同一用户,也可以是不同用户;在该步骤10中,所述第一用户与第二用户的线下关系是未知的,本实施例中的跨社交平台用户匹配方法100最终需 要确认的结果就是所述第一用户与所述第二用户的线下匹配关系,即所述第一用户与所述第二用户是否为匹配的线下用户。
所述社交平台可以是,互联网中的各类社交软件或者社交网站等,在此不做具体限制。
所述第一用户的信息包括但不限于是,用户的姓名、昵称、性别、年龄、爱好、工作经历、个性签名、标签、籍贯、常住地址、邮箱、电话、社交账号等;所述第二用户的信息同样包括但不限于是,用户的姓名、昵称、性别、年龄、爱好、工作经历、个性签名、标签、籍贯、常住地址、邮箱、电话、社交账号等。
步骤S20,通过ULinK框架算法模型定义所述第一社交平台和第二社交平台上的匹配的线下用户和不匹配的线下用户的空间映射,以计算得到代表所述第一用户的信息与所述第二用户的信息之间总差异性的空间距离。
步骤S30,根据所述代表所述第一用户的信息与所述第二用户的信息之间总差异性的空间距离,求解所述ULinK框架算法模型的投影矩阵,建立原始空间和用户隐藏空间联系,以获取所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离。
在本实施例中,所述定义潜在的用户隐藏空间,就是假设存在这样一个空间,同一个用户的信息将相距较近在这个空间中,而不同的用户的间信息将会相距较远,所述步骤20和步骤30所定义的ULinK框架算法模型就是用于建立起这样的一种关系,将原始空间和用户隐藏空间联系起来,进而完成用户匹配的工作。
例如,通过ULinK框架算法定义出不同社交平台上的相同用户和不同使用的空间映射;即定义出所述第一社交平台和第二社交平台上的匹配的线下用户和不匹配的线下用户的空间映射,所述第一用户的信息1~N与所述第二用户的信息1~N'之间总差异性代表用户之间的空间距离;根据所述代表所述第一用户的信息1~N与所述第二用户的信息1~N'之间总差异性的空间距离,求解所述ULinK框架算法模型的投影矩阵,建立原始空间和用户隐藏空间联系,以获取所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离;在所述用户隐藏空间中,空间距离的远近即代表了用户是否为同一线下用户。
步骤S40,根据所述隐藏空间中的所述第一用户与所述第二用户之间的空间距离判断所述第一用户与所述第二用户是否为匹配的线下用户。
在所述用户隐藏空间中,空间距离的远近即代表了用户是否为同一线下用 户;也就是说,所述步骤S40中,可以通过设定所述隐藏空间中的所述第一用户与所述第二用户之间的空间距离的最小阈值来确定所述第一用户与所述第二用户是否为匹配的线下用户,或者可以直接将所述隐藏空间中的所有所述第一用户与所有所述第二用户之间的空间距离最短的第一用户和第二用户确认为匹配的线下用户。
在本实施例中,通过获取第一社交平台上的第一用户的信息,以及获取第二社交平台上的第二用户的信息;然后通过ULinK框架算法模型定义所述第一社交平台和第二社交平台上的匹配的线下用户和不匹配的线下用户的空间映射,以计算得到代表所述第一用户的信息与所述第二用户的信息之间总差异性的空间距离;再根据所述代表所述第一用户的信息与所述第二用户的信息之间总差异性的空间距离,求解所述ULinK框架算法模型的投影矩阵,建立原始空间和用户隐藏空间联系,以获取所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离;并根据所述隐藏空间中的所述第一用户与所述第二用户之间的空间距离判断所述第一用户与所述第二用户是否为匹配的线下用户;将两两平台之间的关系考虑在限制项中,通过建立空间投影模型,计算投影的方式,避免了多个平台连接顺序不一样导致最总结果无法确认的问题;同时改进了跨社交平台用户匹配的准确度和识别率。
可选地,在一实施例中,所述第一用户的信息包括1,2,3...N;所述第二社交平台上的第二用户的信息1',2',3'...N';其中,N≠N'或者N=N';其中,在通计算代表所述第一用户的信息1~N与所述第二用户的信息1~N'之间总差异性的空间距离时,所述第一用户的信息1~N和第二用户的信息1~N'的投影维度为相同的。
可选地,在一实施例中,所述ULinK框架算法模型的目标函数包括:
Figure PCTCN2018075205-appb-000001
约束条件为:
Figure PCTCN2018075205-appb-000002
其中,i,j∈{1,2,…,e},i≠j;l∈{1,2,…,n i},k,ρ(l)∈{1,2,…,n j},ρ(l)≠k;ξ≥0;所述ω为投影矩阵,所述ε为松弛变量,所述C为惩罚系数,所述D函数为距离函数,所述B为系数,所述u为用户的信息,所述e为所述社交平台的总数量,所 述l,k,ρ(l)为索引值。
上述目标函数使用高效的CCCP优化算法解决了目标函数中的优化问题,通过将两两社交平台之间的关系考虑在限制项中,避免了多个社交平台连接顺序不一样导致最总结过无法确认的问题。
进一步的,在本实施例中,所述步骤S20之后,还可以包括:
步骤S21,通过ULink-On框架算法模型实时更新每一时刻对应的所述第一社交平台上的第一用户的信息以及第二社交平台上的第二用户的信息。
其中,
所述ULink-On框架算法模型的目标函数可以包括:
Figure PCTCN2018075205-appb-000003
约束条件为:
Figure PCTCN2018075205-appb-000004
所定义的ULink-On框架算法模型解决了数据实时的问题,实时的建立潜在的用户隐藏空间,随着数据量的增多,逐步改进算法框架的性能,最终完成较好的匹配结果。
请一并参考图2,可选地,在一实施例中,在所述步骤S40,根据所述隐藏空间中的所述第一用户与所述第二用户之间的空间距离判断所述第一用户与所述第二用户是否为匹配的线下用户,包括:
步骤S401,判断所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离是否小于预设阈值;
步骤S402,在所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离小于预设阈值时,确认所述第一用户与所述第二用户为匹配的线下用户。
在本实施例中,通过设定所述隐藏空间中的所述第一用户与所述第二用户之间的空间距离的最小阈值来确定所述第一用户与所述第二用户是否为匹配的线下用户,可以有效改进跨社交平台用户匹配的准确度。
请一并参考图3,可选地,在另一实施例中,在所述步骤S40,根据所述隐藏空间中的所述第一用户与所述第二用户之间的空间距离判断所述第一用户与所述第二用户是否为匹配的线下用户,包括:
步骤S411,获取所述隐藏空间中的所有所述第一用户与所有所述第二用户之 间的空间距离最短的第一用户和第二用户;
步骤S412,将所述空间距离最短的第一用户和第二用户确认为匹配的线下用户。
在本实施例中,直接将所述隐藏空间中的所有所述第一用户与所有所述第二用户之间的空间距离最短的第一用户和第二用户确认为匹配的线下用户,可以有效改进跨社交平台用户匹配的识别率。
上述实施例中的跨社交平台用户匹配方法可以从社交平台里上亿的海量用户中准确的挖掘出同一用户在不同社交平台上的注册用户,可以有效地将用户多个来源的信息整合到一起,从而可以为用户进一步的提供个性化的服务,该跨社交平台用户匹配方法可以应用于金融产品领域、公共安全监控领域等。
请一并结合图4,为本申请一跨社交平台用户匹配示例,其中,所述第一社交平台为人人网,第二社交平台为微博。在人人网和新浪微博分别有四个用户u 1,v 1;u 2,v 2;u 3,v 3;u 4,v 4
通过分别获取用户u 1的信息1,2,3...N;用户u 2的信息1 2,2 2,3 2...N 2;用户u 3的信息1 3,2 3,3 3...N 3;用户u 4的信息1 4,2 4,3 4...N 4;用户v 1的信息1’,2’,3’...N’;用户v 2的信息1 2’,2 2’,3 2’...N 2’;用户v 3的信息1 3’,2 3’,3 3’...N 3’;用户v 4的信息1 4’,2 4’,3 4’...N 4’;使用所述ULinK框架算法模型的目标函数:
Figure PCTCN2018075205-appb-000005
约束条件为:
Figure PCTCN2018075205-appb-000006
其中,i,j∈{1,2,…,e},i≠j;l∈{1,2,…,n i},k,ρ(l)∈{1,2,…,n j},ρ(l)≠k;ξ≥0;所述ω为投影矩阵,所述ε为松弛变量,所述C为惩罚系数,所述D函数为距离函数,所述B为系数,所述u为用户的信息,所述e为所述社交平台的总数量,所述l,k,ρ(l)为索引值;
定义所述第一社交平台和第二社交平台上的匹配的线下用户和不匹配的线下用户的空间映射,以计算得到代表所述第一用户的信息与所述第二用户的信息之间总差异性的空间距离。
根据所述代表所述第一用户的信息与所述第二用户的信息之间总差异性的空间距离,求解所述ULinK框架算法模型的投影矩阵,建立原始空间和用户隐藏 空间联系,以获取所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离,来判断在人人网和新浪微博上的两两用户之间的线下匹配关系。
可以看出,在建立的用户隐藏空间中,同一用户间比较靠近,不同用户会差别比较大。
请一并结合图5,为本申请一实施方式中的数据处理装置200的硬件模块结构示意图。
所述数据处理装置200包括存储器201、处理器202及存储在存储器上并可在处理器202上运行的计算机程序,所述处理器202执行所述程序时实现如下的步骤:
步骤S10,获取第一社交平台上的第一用户的信息,以及获取第二社交平台上的第二用户的信息;
步骤S20,通过ULinK框架算法模型定义所述第一社交平台和第二社交平台上的匹配的线下用户和不匹配的线下用户的空间映射,以计算得到代表所述第一用户的信息与所述第二用户的信息之间总差异性的空间距离;
步骤S30,根据所述代表所述第一用户的信息与所述第二用户的信息之间总差异性的空间距离,求解所述ULinK框架算法模型的投影矩阵,建立原始空间和用户隐藏空间联系,以获取所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离;
步骤S40,根据所述隐藏空间中的所述第一用户与所述第二用户之间的空间距离判断所述第一用户与所述第二用户是否为匹配的线下用户。
在本实施方式中,所述数据处理装置,通过获取第一社交平台上的第一用户的信息,以及获取第二社交平台上的第二用户的信息;然后通过ULinK框架算法模型定义所述第一社交平台和第二社交平台上的匹配的线下用户和不匹配的线下用户的空间映射,以计算得到代表所述第一用户的信息与所述第二用户的信息之间总差异性的空间距离;再根据所述代表所述第一用户的信息与所述第二用户的信息之间总差异性的空间距离,求解所述ULinK框架算法模型的投影矩阵,建立原始空间和用户隐藏空间联系,以获取所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离;并根据所述隐藏空间中的所述第一用户与所述第二用户之间的空间距离判断所述第一用户与所述第二用户是否为匹配的线下用户;将两两平台之间的关系考虑在限制项中,通过建立空间投影模型,计算投影 的方式,避免了多个平台连接顺序不一样导致最总结果无法确认的问题;同时改进了跨社交平台用户匹配的准确度和识别率。
其中,该数据处理装置200可以是服务器,计算机、便携式计算机设备、手机、平板电脑等具备数据处理功能的电子产品。
可选地,在一实施例中,所述第一用户的信息包括1,2,3...N;所述第二社交平台上的第二用户的信息1',2',3'...N';其中,N≠N'或者N=N';其中,在通计算代表所述第一用户的信息1~N与所述第二用户的信息1~N'之间总差异性的空间距离时,所述第一用户的信息1~N和第二用户的信息1~N'的投影维度为相同的。
可选地,在一实施例中,所述ULinK框架算法模型的目标函数包括:
Figure PCTCN2018075205-appb-000007
约束条件为:
Figure PCTCN2018075205-appb-000008
其中,i,j∈{1,2,…,e},i≠j;l∈{1,2,…,n i},k,ρ(l)∈{1,2,…,n j},ρ(l)≠k;ξ≥0;所述ω为投影矩阵,所述ε为松弛变量,所述C为惩罚系数,所述D函数为距离函数,所述B为系数,所述u为用户的信息,所述e为所述社交平台的总数量,所述l,k,ρ(l)为索引值。
上述目标函数使用高效的CCCP优化算法解决了目标函数中的优化问题,通过将两两社交平台之间的关系考虑在限制项中,避免了多个社交平台连接顺序不一样导致最总结过无法确认的问题。
进一步的,在本实施例中,所述步骤S20之后,还可以包括:
步骤S21,通过ULink-On框架算法模型实时更新每一时刻对应的所述第一社交平台上的第一用户的信息以及第二社交平台上的第二用户的信息。
所述ULink-On框架优化算法模型的目标函数可以包括:
Figure PCTCN2018075205-appb-000009
约束条件为:
Figure PCTCN2018075205-appb-000010
所定义的ULink-On框架算法模型解决了数据实时的问题,实时的建立潜在的用户隐藏空间,随着数据量的增多,逐步改进算法框架的性能,最终完成较好 的匹配结果。
可选地,在一实施例中,在所述步骤S40,根据所述隐藏空间中的所述第一用户与所述第二用户之间的空间距离判断所述第一用户与所述第二用户是否为匹配的线下用户,包括:
步骤S401,判断所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离是否小于预设阈值;
步骤S402,在所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离小于预设阈值时,确认所述第一用户与所述第二用户为匹配的线下用户。
在本实施例中,通过设定所述隐藏空间中的所述第一用户与所述第二用户之间的空间距离的最小阈值来确定所述第一用户与所述第二用户是否为匹配的线下用户,可以有效改进跨社交平台用户匹配的准确度。
可选地,在另一实施例中,在所述步骤S40,根据所述隐藏空间中的所述第一用户与所述第二用户之间的空间距离判断所述第一用户与所述第二用户是否为匹配的线下用户,包括:
步骤S411,获取所述隐藏空间中的所有所述第一用户与所有所述第二用户之间的空间距离最短的第一用户和第二用户;
步骤S412,将所述空间距离最短的第一用户和第二用户确认为匹配的线下用户。
在本实施例中,直接将所述隐藏空间中的所有所述第一用户与所有所述第二用户之间的空间距离最短的第一用户和第二用户确认为匹配的线下用户,可以有效改进跨社交平台用户匹配的识别率。
请一并结合图6,为本申请一实施方式中的数据处理装置200的功能模块结构示意图。
所述数据处理装置200包括:
数据获取模块210,获取第一社交平台上的第一用户的信息,以及获取第二社交平台上的第二用户的信息;
映射模块211,通过ULinK框架算法模型定义所述第一社交平台和第二社交平台上的匹配的线下用户和不匹配的线下用户的空间映射,以计算得到代表所述第一用户的信息与所述第二用户的信息之间总差异性的空间距离;
空间距离计算模块212,根据所述代表所述第一用户的信息与所述第二用户 的信息之间总差异性的空间距离,求解所述ULinK框架算法的投影矩阵,建立原始空间和用户隐藏空间联系,以获取所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离;
用户匹配模块213,根据所述隐藏空间中的所述第一用户与所述第二用户之间的空间距离判断所述第一用户与所述第二用户是否为匹配的线下用户。
其中,该数据处理装置200可以是服务器,计算机、便携式计算机设备、手机、平板电脑等具备数据处理功能的电子产品。
可选地,在一实施例中,所述第一用户的信息包括1,2,3...N;所述第二社交平台上的第二用户的信息1',2',3'...N';其中,N≠N'或者N=N';其中,在通计算代表所述第一用户的信息1~N与所述第二用户的信息1~N'之间总差异性的空间距离时,所述第一用户的信息1~N和第二用户的信息1~N'的投影维度为相同的。
可选地,在一实施例中,所述ULinK框架算法模型的目标函数包括:
Figure PCTCN2018075205-appb-000011
约束条件为:
Figure PCTCN2018075205-appb-000012
其中,i,j∈{1,2,…,e},i≠j;l∈{1,2,…,n i},k,ρ(l)∈{1,2,…,n j},ρ(l)≠k;ξ≥0;所述ω为投影矩阵,所述ε为松弛变量,所述C为惩罚系数,所述D函数为距离函数,所述B为系数,所述u为用户的信息,所述e为所述社交平台的总数量,所述l,k,ρ(l)为索引值。
进一步的,在本实施例中,所述数据处理装置200,还可以包括:
数据优化模块214,通过定义ULink-On框架算法模型实时更新每一时刻对应的所述第一社交平台上的第一用户的信息以及第二社交平台上的第二用户的信息。
所述ULink-On框架优化算法模型的目标函数包括:
Figure PCTCN2018075205-appb-000013
约束条件为:
Figure PCTCN2018075205-appb-000014
所定义的ULink-On框架算法模型解决了数据实时的问题,实时的建立潜在 的用户隐藏空间,随着数据量的增多,逐步改进算法框架的性能,最终完成较好的匹配结果。
可选地,在一实施例中,所述用户匹配模块213,用于:
判断所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离是否小于预设阈值;以及在所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离小于预设阈值时,确认所述第一用户与所述第二用户为匹配的线下用户。
可选地,在另一实施例中,所述用户匹配模块213,用于:
获取所述隐藏空间中的所有所述第一用户与所有所述第二用户之间的空间距离最短的第一用户和第二用户;以及将所述空间距离最短的第一用户和第二用户确认为匹配的线下用户。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时可以实现如上人一实施例中所述的跨社交平台用户匹配方法的步骤。
可以理解的是,在本说明书的描述中,参考术语“一实施例”、“另一实施例”、“其他实施例”、或“第一实施例~第N实施例”等的描述意指结合该实施例或示例描述的特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机 软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
可以理解的是,以上仅为本申请的可选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (32)

  1. 一种跨社交平台用户匹配方法,其中,包括步骤:
    获取第一社交平台上的第一用户的信息,以及获取第二社交平台上的第二用户的信息;
    通过ULinK框架算法模型定义所述第一社交平台和第二社交平台上的匹配的线下用户和不匹配的线下用户的空间映射,以计算得到代表所述第一用户的信息与所述第二用户的信息之间总差异性的空间距离;
    根据所述代表所述第一用户的信息与所述第二用户的信息之间总差异性的空间距离,求解所述ULinK框架算法模型的投影矩阵,建立原始空间和用户隐藏空间联系,以获取所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离;
    根据所述隐藏空间中的所述第一用户与所述第二用户之间的空间距离判断所述第一用户与所述第二用户是否为匹配的线下用户。
  2. 如权利要求1所述的跨社交平台用户匹配方法,其中,所述第一用户的信息包括1,2,3...N;所述第二社交平台上的第二用户的信息1',2',3'...N';其中,N≠N'或者N=N';
    其中,在通计算代表所述第一用户的信息1~N与所述第二用户的信息1~N'之间总差异性的空间距离时,所述第一用户的信息1~N和第二用户的信息1~N'的投影维度为相同的。
  3. 如权利要求2所述的跨社交平台用户匹配方法,其中,所述ULinK框架算法模型的目标函数包括:
    Figure PCTCN2018075205-appb-100001
    约束条件为:
    Figure PCTCN2018075205-appb-100002
    其中,i,j∈{1,2,…,e},i≠j;l∈{1,2,…,n i},k,ρ(l)∈{1,2,…,n j},ρ(l)≠k;ξ≥0;所述ω为投影矩阵,所述ε为松弛变量,所述C为惩罚系数,所述D函数为距离函数,所述B为系数,所述u为用户的信息,所述e为所述社交平台的总数量,所述l,k,ρ(l)为索引值。
  4. 如权利要求3所述的跨社交平台用户匹配方法,其中,所述根据所述隐藏 空间中的所述第一用户与所述第二用户之间的空间距离判断所述第一用户与所述第二用户是否为匹配的线下用户的步骤,包括:
    判断所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离是否小于预设阈值;
    在所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离小于预设阈值时,确认所述第一用户与所述第二用户为匹配的线下用户。
  5. 如权利要求3所述的跨社交平台用户匹配方法,其中,所述根据所述隐藏空间中的所述第一用户与所述第二用户之间的空间距离判断所述第一用户与所述第二用户是否为匹配的线下用户的步骤,包括:
    获取所述隐藏空间中的所有所述第一用户与所有所述第二用户之间的空间距离最短的第一用户和第二用户;
    将所述空间距离最短的第一用户和第二用户确认为匹配的线下用户。
  6. 如权利要求3所述的跨社交平台用户匹配方法,其中,所述通过ULinK框架算法模型定义所述第一社交平台和第二社交平台上的匹配的线下用户和不匹配的线下用户的空间映射,以计算得到代表所述第一用户的信息1~N与所述第二用户的信息1~N'之间总差异性的空间距离的步骤之后,还包括:
    通过ULink-On框架算法模型实时更新每一时刻对应的所述第一社交平台上的第一用户的信息以及第二社交平台上的第二用户的信息。
  7. 如权利要求6所述的跨社交平台用户匹配方法,其中,
    所述ULink-On框架优化算法模型的目标函数包括:
    Figure PCTCN2018075205-appb-100003
    约束条件为:
    Figure PCTCN2018075205-appb-100004
  8. 如权利要求2所述的跨社交平台用户匹配方法,其中,所述通过ULinK框架算法模型定义所述第一社交平台和第二社交平台上的匹配的线下用户和不匹配的线下用户的空间映射,以计算得到代表所述第一用户的信息1~N与所述第二用户的信息1~N'之间总差异性的空间距离的步骤之后,还包括:
    通过ULink-On框架算法模型实时更新每一时刻对应的所述第一社交平台上的第一用户的信息以及第二社交平台上的第二用户的信息。
  9. 如权利要求8所述的跨社交平台用户匹配方法,其中,
    所述ULink-On框架优化算法模型的目标函数包括:
    Figure PCTCN2018075205-appb-100005
    约束条件为:
    Figure PCTCN2018075205-appb-100006
  10. 如权利要求1所述的跨社交平台用户匹配方法,其中,所述根据所述隐藏空间中的所述第一用户与所述第二用户之间的空间距离判断所述第一用户与所述第二用户是否为匹配的线下用户的步骤,包括:
    判断所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离是否小于预设阈值;
    在所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离小于预设阈值时,确认所述第一用户与所述第二用户为匹配的线下用户。
  11. 如权利要求10所述的跨社交平台用户匹配方法,其中,所述ULinK框架算法模型的目标函数包括:
    Figure PCTCN2018075205-appb-100007
    约束条件为:
    Figure PCTCN2018075205-appb-100008
    其中,i,j∈{1,2,…,e},i≠j;l∈{1,2,…,n i},k,ρ(l)∈{1,2,…,n j},ρ(l)≠k;ξ≥0;所述ω为投影矩阵,所述ε为松弛变量,所述C为惩罚系数,所述D函数为距离函数,所述B为系数,所述u为用户的信息,所述e为所述社交平台的总数量,所述l,k,ρ(l)为索引值。
  12. 如权利要求1所述的跨社交平台用户匹配方法,其中,所述根据所述隐藏空间中的所述第一用户与所述第二用户之间的空间距离判断所述第一用户与所述第二用户是否为匹配的线下用户的步骤,包括:
    获取所述隐藏空间中的所有所述第一用户与所有所述第二用户之间的空间距离最短的第一用户和第二用户;
    将所述空间距离最短的第一用户和第二用户确认为匹配的线下用户。
  13. 如权利要求12所述的跨社交平台用户匹配方法,其中,所述ULinK框架算法模型的目标函数包括:
    Figure PCTCN2018075205-appb-100009
    约束条件为:
    Figure PCTCN2018075205-appb-100010
    其中,i,j∈{1,2,…,e},i≠j;l∈{1,2,…,n i},k,ρ(l)∈{1,2,…,n j},ρ(l)≠k;ξ≥0;所述ω为投影矩阵,所述ε为松弛变量,所述C为惩罚系数,所述D函数为距离函数,所述B为系数,所述u为用户的信息,所述e为所述社交平台的总数量,所述l,k,ρ(l)为索引值。
  14. 如权利要求1所述的跨社交平台用户匹配方法,其中,所述ULinK框架算法模型的目标函数包括:
    Figure PCTCN2018075205-appb-100011
    约束条件为:
    Figure PCTCN2018075205-appb-100012
    其中,i,j∈{1,2,…,e},i≠j;l∈{1,2,…,n i},k,ρ(l)∈{1,2,…,n j},ρ(l)≠k;ξ≥0;所述ω为投影矩阵,所述ε为松弛变量,所述C为惩罚系数,所述D函数为距离函数,所述B为系数,所述u为用户的信息,所述e为所述社交平台的总数量,所述l,k,ρ(l)为索引值。
  15. 一种数据处理装置,其中,包括:
    数据获取模块,获取第一社交平台上的第一用户的信息,以及获取第二社交平台上的第二用户的信息;
    映射模块,通过ULinK框架算法模型定义所述第一社交平台和第二社交平台上的匹配的线下用户和不匹配的线下用户的空间映射,以计算得到代表所述第一用户的信息与所述第二用户的信息之间总差异性的空间距离;
    空间距离计算模块,根据所述代表所述第一用户的信息与所述第二用户的信息之间总差异性的空间距离,求解所述ULinK框架算法的投影矩阵,建立原始空间和用户隐藏空间联系,以获取所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离;
    用户匹配模块,根据所述隐藏空间中的所述第一用户与所述第二用户之间的空间距离判断所述第一用户与所述第二用户是否为匹配的线下用户。
  16. 一种数据处理装置,包括存储器、处理器及存储在存储器上并可在处理 器上运行的计算机程序,其中,所述处理器执行所述程序时实现以下步骤:
    获取第一社交平台上的第一用户的信息,以及获取第二社交平台上的第二用户的信息;
    通过ULinK框架算法模型定义所述第一社交平台和第二社交平台上的匹配的线下用户和不匹配的线下用户的空间映射,以计算得到代表所述第一用户的信息与所述第二用户的信息之间总差异性的空间距离;
    根据所述代表所述第一用户的信息与所述第二用户的信息之间总差异性的空间距离,求解所述ULinK框架算法模型的投影矩阵,建立原始空间和用户隐藏空间联系,以获取所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离;
    根据所述隐藏空间中的所述第一用户与所述第二用户之间的空间距离判断所述第一用户与所述第二用户是否为匹配的线下用户。
  17. 如权利要求16所述的数据处理装置,其中,所述第一用户的信息包括1,2,3...N;所述第二社交平台上的第二用户的信息1',2',3'...N';其中,N≠N'或者N=N';
    其中,在通计算代表所述第一用户的信息1~N与所述第二用户的信息1~N'之间总差异性的空间距离时,所述第一用户的信息1~N和第二用户的信息1~N'的投影维度为相同的。
  18. 如权利要求17所述的数据处理装置,其中,
    所述ULinK框架算法模型的目标函数包括:
    Figure PCTCN2018075205-appb-100013
    约束条件为:
    Figure PCTCN2018075205-appb-100014
    其中,i,j∈{1,2,…,e},i≠j;l∈{1,2,…,n i},k,ρ(l)∈{1,2,…,n j},ρ(l)≠k;ξ≥0;所述ω为投影矩阵,所述ε为松弛变量,所述C为惩罚系数,所述D函数为距离函数,所述B为系数,所述u为用户的信息,所述e为所述社交平台的总数量,所述l,k,ρ(l)为索引值。
  19. 如权利要求18所述的数据处理装置,其中,所述处理器执行所述程序时还实现以下步骤:
    判断所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离是否小于预设阈值;
    在所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离小于预设阈值时,确认所述第一用户与所述第二用户为匹配的线下用户;
    或者,
    获取所述隐藏空间中的所有所述第一用户与所有所述第二用户之间的空间距离最短的第一用户和第二用户;
    将所述空间距离最短的第一用户和第二用户确认为匹配的线下用户。
  20. 如权利要求19所述的数据处理装置,其中,所述处理器执行所述程序时还实现以下步骤:
    通过ULink-On框架算法模型实时更新每一时刻对应的所述第一社交平台上的第一用户的信息以及第二社交平台上的第二用户的信息。
  21. 如权利要求20所述的数据处理装置,其中,所述ULink-On框架优化算法模型的目标函数包括:
    Figure PCTCN2018075205-appb-100015
    约束条件为:
    Figure PCTCN2018075205-appb-100016
  22. 如权利要求16所述的数据处理装置,其中,所述处理器执行所述程序时还实现以下步骤:
    判断所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离是否小于预设阈值;
    在所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离小于预设阈值时,确认所述第一用户与所述第二用户为匹配的线下用户;
    或者,
    获取所述隐藏空间中的所有所述第一用户与所有所述第二用户之间的空间距离最短的第一用户和第二用户;
    将所述空间距离最短的第一用户和第二用户确认为匹配的线下用户。
  23. 如权利要求22所述的数据处理装置,其中,所述ULinK框架算法模型的目标函数包括:
    Figure PCTCN2018075205-appb-100017
    约束条件为:
    Figure PCTCN2018075205-appb-100018
    其中,i,j∈{1,2,…,e},i≠j;l∈{1,2,…,n i},k,ρ(l)∈{1,2,…,n j},ρ(l)≠k;ξ≥0;所述ω为投影矩阵,所述ε为松弛变量,所述C为惩罚系数,所述D函数为距离函数,所述B为系数,所述u为用户的信息,所述e为所述社交平台的总数量,所述l,k,ρ(l)为索引值。
  24. 如权利要求16所述的数据处理装置,其中,所述ULinK框架算法模型的目标函数包括:
    Figure PCTCN2018075205-appb-100019
    约束条件为:
    Figure PCTCN2018075205-appb-100020
    其中,i,j∈{1,2,…,e},i≠j;l∈{1,2,…,n i},k,ρ(l)∈{1,2,…,n j},ρ(l)≠k;ξ≥0;所述ω为投影矩阵,所述ε为松弛变量,所述C为惩罚系数,所述D函数为距离函数,所述B为系数,所述u为用户的信息,所述e为所述社交平台的总数量,所述l,k,ρ(l)为索引值。
  25. 一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现以下步骤:
    获取第一社交平台上的第一用户的信息,以及获取第二社交平台上的第二用户的信息;
    通过ULinK框架算法模型定义所述第一社交平台和第二社交平台上的匹配的线下用户和不匹配的线下用户的空间映射,以计算得到代表所述第一用户的信息与所述第二用户的信息之间总差异性的空间距离;
    根据所述代表所述第一用户的信息与所述第二用户的信息之间总差异性的空间距离,求解所述ULinK框架算法模型的投影矩阵,建立原始空间和用户隐藏空间联系,以获取所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离;
    根据所述隐藏空间中的所述第一用户与所述第二用户之间的空间距离判断所述第一用户与所述第二用户是否为匹配的线下用户。
  26. 如权利要求25所述的计算机可读存储介质,其中,所述第一用户的信息包括1,2,3...N;所述第二社交平台上的第二用户的信息1',2',3'...N';其中,N≠N'或者N=N';
    其中,在通计算代表所述第一用户的信息1~N与所述第二用户的信息1~N'之间总差异性的空间距离时,所述第一用户的信息1~N和第二用户的信息1~N'的投影维度为相同的。
  27. 如权利要求26所述的计算机可读存储介质,其中,所述ULinK框架算法模型的目标函数包括:
    Figure PCTCN2018075205-appb-100021
    约束条件为:
    Figure PCTCN2018075205-appb-100022
    其中,i,j∈{1,2,…,e},i≠j;l∈{1,2,…,n i},k,ρ(l)∈{1,2,…,n j},ρ(l)≠k;ξ≥0;所述ω为投影矩阵,所述ε为松弛变量,所述C为惩罚系数,所述D函数为距离函数,所述B为系数,所述u为用户的信息,所述e为所述社交平台的总数量,所述l,k,ρ(l)为索引值。
  28. 如权利要求27所述的计算机可读存储介质,其中,该程序被处理器执行时还实现以下步骤:
    判断所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离是否小于预设阈值;
    在所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离小于预设阈值时,确认所述第一用户与所述第二用户为匹配的线下用户;
    或者,
    获取所述隐藏空间中的所有所述第一用户与所有所述第二用户之间的空间距离最短的第一用户和第二用户;
    将所述空间距离最短的第一用户和第二用户确认为匹配的线下用户。
  29. 如权利要求28所述的计算机可读存储介质,其中,所述ULink-On框架优化算法模型的目标函数包括:
    Figure PCTCN2018075205-appb-100023
    约束条件为:
    Figure PCTCN2018075205-appb-100024
  30. 如权利要求25所述的计算机可读存储介质,其中,该程序被处理器执行时还实现以下步骤:
    判断所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离是否小于预设阈值;
    在所述用户隐藏空间中的所述第一用户与所述第二用户之间的空间距离小于预设阈值时,确认所述第一用户与所述第二用户为匹配的线下用户;
    或者,
    获取所述隐藏空间中的所有所述第一用户与所有所述第二用户之间的空间距离最短的第一用户和第二用户;
    将所述空间距离最短的第一用户和第二用户确认为匹配的线下用户。
  31. 如权利要求30所述的计算机可读存储介质,其中,所述ULinK框架算法模型的目标函数包括:
    Figure PCTCN2018075205-appb-100025
    约束条件为:
    Figure PCTCN2018075205-appb-100026
    其中,i,j∈{1,2,…,e},i≠j;l∈{1,2,…,n i},k,ρ(l)∈{1,2,…,n j},ρ(l)≠k;ξ≥0;所述ω为投影矩阵,所述ε为松弛变量,所述C为惩罚系数,所述D函数为距离函数,所述B为系数,所述u为用户的信息,所述e为所述社交平台的总数量,所述l,k,ρ(l)为索引值。
  32. 如权利要求25所述的计算机可读存储介质,其中,所述ULinK框架算法模型的目标函数包括:
    Figure PCTCN2018075205-appb-100027
    约束条件为:
    Figure PCTCN2018075205-appb-100028
    其中,i,j∈{1,2,…,e},i≠j;l∈{1,2,…,n i},k,ρ(l)∈{1,2,…,n j},ρ(l)≠k;ξ≥0;所述ω为投影矩阵,所述ε为松弛变量,所述C为惩罚系数,所述D函数为距离函数,所述B为系数,所述u为用户的信息,所述e为所述社交平台的总数量,所述l,k,ρ(l)为索引值。
PCT/CN2018/075205 2017-10-25 2018-02-05 跨社交平台用户匹配方法、数据处理装置及可读存储介质 WO2019080404A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201711008295.7A CN107832783A (zh) 2017-10-25 2017-10-25 跨社交平台用户匹配方法、数据处理装置及可读存储介质
CN201711008295.7 2017-10-25

Publications (1)

Publication Number Publication Date
WO2019080404A1 true WO2019080404A1 (zh) 2019-05-02

Family

ID=61649257

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2018/075205 WO2019080404A1 (zh) 2017-10-25 2018-02-05 跨社交平台用户匹配方法、数据处理装置及可读存储介质

Country Status (2)

Country Link
CN (1) CN107832783A (zh)
WO (1) WO2019080404A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111192154A (zh) * 2019-12-25 2020-05-22 西安交通大学 一种基于风格迁移的社交网络用户节点匹配方法
CN112085114A (zh) * 2020-09-14 2020-12-15 杭州中奥科技有限公司 线上线下身份匹配方法、装置、设备及存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111767438A (zh) * 2020-06-16 2020-10-13 上海同犀智能科技有限公司 一种基于Hash结合积分的身份识别方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140288999A1 (en) * 2013-03-12 2014-09-25 Correlor Technologies Ltd Social character recognition (scr) system
CN104574192A (zh) * 2013-10-25 2015-04-29 华为技术有限公司 在多个社交网络中识别同一用户的方法及装置
CN104778388A (zh) * 2015-05-04 2015-07-15 苏州大学 一种两个不同平台下同一用户识别方法及系统
CN106096653A (zh) * 2016-06-12 2016-11-09 中国科学院自动化研究所 基于跨平台用户社交多媒体行为的人口属性推断方法
CN107247786A (zh) * 2017-06-15 2017-10-13 北京小度信息科技有限公司 用于确定相似用户的方法、装置和服务器

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104317784A (zh) * 2014-09-30 2015-01-28 苏州大学 一种跨平台用户识别方法和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140288999A1 (en) * 2013-03-12 2014-09-25 Correlor Technologies Ltd Social character recognition (scr) system
CN104574192A (zh) * 2013-10-25 2015-04-29 华为技术有限公司 在多个社交网络中识别同一用户的方法及装置
CN104778388A (zh) * 2015-05-04 2015-07-15 苏州大学 一种两个不同平台下同一用户识别方法及系统
CN106096653A (zh) * 2016-06-12 2016-11-09 中国科学院自动化研究所 基于跨平台用户社交多媒体行为的人口属性推断方法
CN107247786A (zh) * 2017-06-15 2017-10-13 北京小度信息科技有限公司 用于确定相似用户的方法、装置和服务器

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111192154A (zh) * 2019-12-25 2020-05-22 西安交通大学 一种基于风格迁移的社交网络用户节点匹配方法
CN111192154B (zh) * 2019-12-25 2023-05-02 西安交通大学 一种基于风格迁移的社交网络用户节点匹配方法
CN112085114A (zh) * 2020-09-14 2020-12-15 杭州中奥科技有限公司 线上线下身份匹配方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN107832783A (zh) 2018-03-23

Similar Documents

Publication Publication Date Title
US8214301B2 (en) Social network mapping
US20200210466A1 (en) Hybrid entity matching to drive program execution
JP4906846B2 (ja) ソーシャルネットワークにおける利用者の相性の得点化
US10255282B2 (en) Determining key concepts in documents based on a universal concept graph
US10701010B2 (en) Claiming conversations between users and non-users of a social networking system
US10311288B1 (en) Determining identity of a person in a digital image
US9218568B2 (en) Disambiguating data using contextual and historical information
US20160132832A1 (en) Generating company profiles based on member data
US10728225B1 (en) People-based user synchronization within an online system
EP3163471A1 (en) Data information transaction method and system
US11501331B2 (en) System for providing proof and attestation services for claim verification
US20180255010A1 (en) High confidence digital content treatment
CN107085616B (zh) Lbsn中一种基于多维属性挖掘的虚假评论可疑地点检测方法
US10333964B1 (en) Fake account identification
WO2019080404A1 (zh) 跨社交平台用户匹配方法、数据处理装置及可读存储介质
US11323404B2 (en) System and method for displaying message or user lists
CA3059152A1 (en) Multi-layer user authentication with live interaction
US10074143B2 (en) Surfacing an entity's physical locations via social graph
WO2019080403A1 (zh) 社交平台用户的现实关系匹配方法、装置及可读存储介质
US11601509B1 (en) Systems and methods for identifying entities between networks
CN116776150A (zh) 接口异常访问识别方法、装置、计算机设备及存储介质
CN111694884B (zh) 基于大数据的智慧政务请求处理方法
US20240232208A9 (en) System and method for generating searchable social graph
CN115270169B (zh) 一种基因数据的解压方法及系统
US11874823B1 (en) Agnostic image digitizer to detect fraud

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18869907

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 25/09/2020)

122 Ep: pct application non-entry in european phase

Ref document number: 18869907

Country of ref document: EP

Kind code of ref document: A1