CN116915831A - 样本数据生成、模型训练以及确定设备关联关系的方法 - Google Patents

样本数据生成、模型训练以及确定设备关联关系的方法 Download PDF

Info

Publication number
CN116915831A
CN116915831A CN202310913648.7A CN202310913648A CN116915831A CN 116915831 A CN116915831 A CN 116915831A CN 202310913648 A CN202310913648 A CN 202310913648A CN 116915831 A CN116915831 A CN 116915831A
Authority
CN
China
Prior art keywords
similarity
data
devices
pair
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310913648.7A
Other languages
English (en)
Inventor
金博夫
周俊
章越
惠盼
焦健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu China Co Ltd
Original Assignee
Baidu China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu China Co Ltd filed Critical Baidu China Co Ltd
Priority to CN202310913648.7A priority Critical patent/CN116915831A/zh
Publication of CN116915831A publication Critical patent/CN116915831A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/1396Protocols specially adapted for monitoring users' activity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/14Session management
    • H04L67/146Markers for unambiguous identification of a particular session, e.g. session cookie or URL-encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/2866Architectures; Arrangements
    • H04L67/30Profiles
    • H04L67/306User profiles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种样本数据生成方法,涉及人工智能技术领域,尤其涉及机器学习、深度学习、数据挖掘和数据处理技术领域。具体实现方案为:获取与M个设备各自关联的网络使用数据、运动数据以及环境数据,网络使用数据包括对象标识,M为大于1的整数;根据对象标识对M个设备进行配对,得到N个设备对,N为大于1的整数;针对每个设备对,分别根据网络使用数据、运动数据以及环境数据,确定设备对中两个设备之间的网络使用相似度、运动相似度和环境相似度,并根据网络使用相似度、运动相似度和环境相似度,确定设备对的特征;以及将设备对作为样本,设备对的特征作为样本的特征,得到样本数据。

Description

样本数据生成、模型训练以及确定设备关联关系的方法
技术领域
本公开涉及人工智能技术领域,尤其涉及机器学习、深度学习、数据挖掘和数据处理技术领域。更具体地,本公开提供了一种样本数据生成方法、机器学习模型的训练方法、确定设备关联关系的方法、数据库生成方法、信息推荐方法、装置、电子设备和存储介质。
背景技术
随着电子设备的大量普及应用,电子设备能够支持的应用越来越多,功能越来越强大,电子设备向着多样化、个性化的方向发展,成为用户生活中不可缺少的电子用品。
发明内容
本公开提供了一种样本数据生成方法、机器学习模型的训练方法、确定设备关联关系的方法、数据库生成方法、信息推荐方法、装置、设备以及存储介质。
根据第一方面,提供了一种样本数据生成方法,该方法包括:获取与M个设备各自关联的网络使用数据、运动数据以及环境数据,其中,网络使用数据包括对象标识,M为大于1的整数;根据对象标识对M个设备进行配对,得到N个设备对,N为大于1的整数;针对每个设备对,分别根据网络使用数据、运动数据以及环境数据,确定设备对中两个设备之间的网络使用相似度、运动相似度和环境相似度,并根据网络使用相似度、运动相似度和环境相似度,确定设备对的特征;以及将设备对作为样本,设备对的特征作为样本的特征,得到样本数据。
根据第二方面,提供了一种机器学习模型的训练方法,该方法包括:获取样本数据,其中,样本数据包括样本和样本的特征;将样本的特征输入机器学习模型,得到样本的输出结果;根据样本的输出结果,确定机器学习模型的损失;以及根据损失,调整机器学习模型的参数;其中,样本数据是根据上述样本数据生成方法生成的。
根据第三方面,提供了一种确定设备关联关系的方法,该方法包括:获取与第一设备关联的网络使用数据、运动数据以及环境数据,并获取与第二设备关联的网络使用数据、运动数据以及环境数据;根据与第一设备关联的网络使用数据、运动数据以及环境数据以及与第二设备关联的网络使用数据、运动数据以及环境数据,确定第一设备和第二设备之间的网络使用相似度、运动相似度和环境相似度;根据网络使用相似度、运动相似度和环境相似度,确定第一设备和第二设备的关联特征;将关联特征输入机器学习模型,得到第一设备和第二设备属于同一对象的概率;以及响应于概率大于阈值,确定第一设备和第二设备彼此关联;其中,机器学习模型是根据机器学习模型的训练方法进行训练得到的。
根据第四方面,提供了一种数据库生成方法,该方法包括:获取与多个设备各自关联的网络使用数据、运动数据以及环境数据;对多个设备进行两两配对,得到至少一个设备对;针对每个设备对,分别根据网络使用数据、运动数据以及环境数据,确定该设备对中两个设备之间的网络使用相似度、运动相似度和环境相似度,并根据网络使用相似度、运动相似度和环境相似度,确定设备对的特征;将设备对的特征输入机器学习模型,得到设备对中的两个设备属于同一对象的概率;以及响应于概率大于阈值,将设备对中两个设备各自的属性信息添加到数据库中,其中,两个设备各自的属性信息包含彼此的设备标识;其中,机器学习模型是根据机器学习模型的训练方法进行训练得到的。
根据第五方面,提供了一种信息推荐方法,该方法包括:接收用于查询目标设备的关联设备的请求,其中,请求包括目标设备的目标标识;以及根据目标标识从数据库中确定目标设备的属性信息;根据属性信息,确定与目标设备关联的关联设备的标识;根据关联设备的标识,确定关联设备的属性信息;以及根据关联设备的属性信息,输出针对目标设备的推荐信息。其中,数据库是根据上述数据库生成方法生成的。
根据第六方面,提供了一种样本数据生成装置,该装置包括:第一获取模块,用于获取与M个设备各自关联的网络使用数据、运动数据以及环境数据,其中,网络使用数据包括对象标识,M为大于1的整数;第一配对模块,用于根据对象标识对M个设备进行配对,得到N个设备对,N为大于1的整数;第一特征确定模块,用于针对每个设备对,分别根据网络使用数据、运动数据以及环境数据,确定设备对中两个设备之间的网络使用相似度、运动相似度和环境相似度,并根据网络使用相似度、运动相似度和环境相似度,确定设备对的特征;以及样本数据生成模块,用于将设备对作为样本,设备对的特征作为样本的特征,得到样本数据。
根据第七方面,提供了一种机器学习模型的训练装置,该装置包括:第二获取模块,用于获取样本数据,其中,样本数据包括样本和样本的特征;样本处理模块,用于将样本的特征输入机器学习模型,得到样本的输出结果;损失确定模块,用于根据样本的输出结果,确定机器学习模型的损失;以及调整模块,用于根据损失,调整机器学习模型的参数;其中,样本数据是根据上述样本数据生成装置生成的。
根据第八方面,提供了一种确定设备关联关系的装置,该装置包括:第三获取模块,用于获取与第一设备关联的网络使用数据、运动数据以及环境数据,并获取与第二设备关联的网络使用数据、运动数据以及环境数据;相似度确定模块,用于根据与第一设备关联的网络使用数据、运动数据以及环境数据以及与第二设备关联的网络使用数据、运动数据以及环境数据,确定第一设备和第二设备之间的网络使用相似度、运动相似度和环境相似度;第二特征确定模块,用于根据网络使用相似度、运动相似度和环境相似度,确定第一设备和第二设备的关联特征;第一概率确定模块,用于将关联特征输入机器学习模型,得到第一设备和第二设备属于同一对象的概率;以及关联关系确定模块,用于响应于概率大于阈值,确定第一设备和第二设备彼此关联;其中,机器学习模型是根据上述机器学习模型的训练装置进行训练得到的。
根据第九方面,提供了一种数据库生成装置,该装置包括:第四获取模块,用于获取与多个设备各自关联的网络使用数据、运动数据以及环境数据;第二配对模块,用于对多个设备进行两两配对,得到至少一个设备对;第三特征确定模块,用于针对每个设备对,分别根据网络使用数据、运动数据以及环境数据,确定该设备对中两个设备之间的网络使用相似度、运动相似度和环境相似度,并根据网络使用相似度、运动相似度和环境相似度,确定设备对的特征;第二概率确定模块,用于将设备对的特征输入机器学习模型,得到设备对中的两个设备属于同一对象的概率;以及数据库生成模块,用于响应于概率大于阈值,将设备对中两个设备各自的属性信息添加到数据库中,其中,两个设备各自的属性信息包含彼此的设备标识;其中,机器学习模型是根据上述机器学习模型的训练装置进行训练得到的。
根据第十方面,提供了一种信息推荐装置,该装置包括:接收模块,用于接收用于查询目标设备的关联设备的请求,其中,请求包括目标设备的目标标识;以及第一属性信息确定模块,用于根据目标标识从数据库中确定目标设备的属性信息;关联设备确定模块,用于根据属性信息,确定与目标设备关联的关联设备的标识;第二属性信息确定模块,用于根据关联设备的标识,确定关联设备的属性信息;以及推荐信息输出模块,用于根据关联设备的属性信息,输出针对目标设备的推荐信息。其中,数据库是根据上述数据库生成装置生成的。
根据第十一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行根据本公开提供的方法。
根据第十二方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行根据本公开提供的方法。
根据第十三方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序存储于可读存储介质和电子设备其中至少之一上,所述计算机程序在被处理器执行时实现根据本公开提供的方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开的一个实施例的可以应用样本数据生成方法、机器学习模型的训练方法、确定设备关联关系的方法、数据库生成方法、信息推荐方法中的至少之一的示例性系统架构示意图;
图2是根据本公开的一个实施例的样本数据生成方法的流程图;
图3A是根据本公开的一个实施例的确定设备对中两个设备之间的网络使用相似度的方法的示意图;
图3B是根据本公开的一个实施例的确定设备对中两个设备之间的运动相似度的方法的示意图;
图3C是根据本公开的一个实施例的确定设备对中两个设备之间的环境相似度的方法的示意图;
图4是根据本公开的一个实施例的机器学习模型的训练方法的流程图;
图5是根据本公开的一个实施例的确定设备关联关系的方法的流程图;
图6是根据本公开的一个实施例的数据库生成方法的流程图;
图7是根据本公开的一个实施例的设备信息入库的方法的流程图;
图8是根据本公开的一个实施例的信息推荐方法的流程图;
图9是根据本公开的一个实施例的样本数据生成装置的框图;
图10是根据本公开的一个实施例的机器学习模型的训练装置的框图;
图11是根据本公开的一个实施例的确定设备关联关系的装置的框图;
图12是根据本公开的一个实施例的数据库生成装置的框图;
图13是根据本公开的一个实施例的信息推荐装置的框图;
图14是根据本公开的一个实施例的样本数据生成方法、机器学习模型的训练方法、确定设备关联关系的方法、数据库生成方法、信息推荐方法中的至少之一的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
用户使用电子设备(例如手机、平板等)进行网络活动成为越来越普遍的现象,用户的网络活动数据作为一种信息资产,可以反映出个体在某段时间内的活动情况和趋势。随着大数据和人工智能在各个领域的广泛应用,对用户的网络活动数据的处理也更加多元化,可以用来实现用户画像,定制化推广,预测用户的某个趋势等。
用户可以拥有多个电子设备,用户增加新的电子设备或者更换旧电子设备是一件非常平常的事情。但是新的电子设备会带来用户冷启动问题。因此,在检测到新的电子设备之后,需要将新的电子设备与用户以及与用户历史时段内使用过的设备快速关联上,以便将用户画像迁移到新设备,避免冷启动问题。
相关技术中可以根据用户在新设备上登录的应用程序的登录ID,将新设备关联到历史时段内使用相同ID登录过的设备,这样能够将用户的新设备与历史时段内使用过的设备相关联。然而用户在新设备的应用程序上可能还没有进行登录,或者用户在新设备的应用程序上注册了新的登录ID,或者多个用户共享同一登录ID等,上述几种情况下根据应用程序的登录ID进行设备关联的方式都不可靠,易造成设备关联错误。
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
在本公开的技术方案中,在获取或采集用户个人信息之前,均获取了用户的授权或同意。
图1是根据本公开一个实施例的可以应用样本数据生成方法、机器学习模型的训练方法、确定设备关联关系的方法、数据库生成方法、信息推荐方法中的至少之一的示例性系统架构示意图。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线和/或无线通信链路等等。
用户可以使用终端设备101、102、103通过网络104与服务器105进行交互,以接收或发送消息等。终端设备101、102、103可以是各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机等等。
本公开实施例所提供的样本数据生成方法、确定设备关联关系的方法、数据库生成方法、信息推荐方法中的至少之一一般可以由终端设备101、102、103执行。相应地,本公开实施例所提供的样本数据生成方法、确定设备关联关系的方法、数据库生成方法、信息推荐方法中的至少之一一般可以设置于终端设备101、102、103中。
本公开实施例所提供的机器学习模型的训练方法一般可以由服务器105执行。相应地,本公开实施例所提供的机器学习模型的训练装置一般可以设置于服务器105中。
图2是根据本公开的一个实施例的样本数据生成方法的流程图。
如图2所示,该样本数据生成方法200包括操作S210~操作S240。
在操作S210,获取与M个设备各自关联的网络使用数据、运动数据以及环境数据。
例如,可以从多个应用程序后台的目志系统中获取网络使用数据,网络使用数据例如包括流量数据,每一条网络使用数据可以包括登录ID、设备ID、IP地址、地理位置、以及操作记录等。其中,设备ID可以包括设备的硬件信息,如MAC信息、设备型号、设备序列号等。此外,网络使用数据还包括用户使用的应用程序的标识(应用程序ID),还包括用户浏览网络产生的Cookie信息等。
应用程序ID和Cookie信息可以关联到设备ID,设备ID可以关联到各个应用程序的登录ID,登录ID又可以与电话号码、邮箱等账号信息关联。电话号码、邮箱等账号信息可以唯一标识一个自然人,因此,可以通过多层级的关联,将应用程序ID、Cookie信息、设备ID、各个应用程序的登录ID、电话号码、邮箱等账号信息均关联到一个自然人。该自然人可以用一个对象标识(对象ID)表示,从而可以形成该对象ID的全量账号信息表。
将设备ID从全量账号信息表中抽取出来,得到设备ID-全量账号信息表的关联关系,作为与设备ID表示的设备相关联的网络使用数据。
运动数据可以包括电子设备的运动传感器采集的数据。例如设备的IMU(InertialMeasurement Unit,惯性测量单元)装置采集的加速度信息、角速度信息等。这些信息能够表征设备在空间中的运动姿态、震动强度等。运动数据还可以包括电子设备的定位传感器采集的数据,例如,GPS传感器采集的地理位置信息、轨迹信息等,这些信息能够表征设备在空间中位置变化。设备的运动姿态、震动强度、位置变化信息可以表征用户的运动模式、行为习惯等。
环境数据可以包括电子设备的环境传感器采集的数据。例如设备的光线传感器采集的光线亮度信息、温度传感器采集的温度信息、湿度传感器采集的湿度信息等。光线亮度信息、温度信息以及湿度信息可以表征用户所处的环境。
在操作S220,根据对象标识对M个设备进行配对,得到N个设备对。
M个设备各自具有设备ID-全量账号信息表的关联关系。其中,全量账号信息表中包括对象标识,该对象标识能够唯一表示一个自然人。因此,对象标识一致的设备属于同一用户,对象标识不一致的设备属于不同用户。
因此,可以按照对象标识对M个设备进行两两配对。例如可以将对象标识一致的两个设备组成第一设备对,作为正样本。该正样本表示已知的属于同一用户的两个设备。对应的,将对象标识不一致的两个设备组成第二设备对。该负样本表示已知的属于不同用户的两个设备。
需要说明的是,针对具体的应用场景,还可以设置对应的配对条件。例如,在换设备场景下,正样本的配对条件可以包括对象ID一致、IP地址的重合度高于阈值(例如80%)、以及两个设备发布时间具有一定时间差。这样能够更符合换设备场景。在得到正样本之后,可以将正样本中的设备拆分开,分别将拆分开的两个设备各自与其他设备进行配对,得到负样本。
还需要说明的是,为提高配对效率,该M个设备的标识可以均来自同一个IP桶。例如,全量账号信息表中包括IP地址,可以按照IP地址表征的区域范围,将属于同一区域范围(该区域范围可以是城市级别的)的全量账号信息表划分在一个集合(IP桶)中。针对每个集合,对该集合内的M个设备标识进行配对。
在操作S230,针对每个设备对,分别根据网络使用数据、运动数据以及环境数据,确定设备对中两个设备之间的网络使用相似度、运动相似度和环境相似度,并根据网络使用相似度、运动相似度和环境相似度,确定设备对的特征。
例如,每个设备的网络使用数据包括设备ID-全量账号信息表,全量账号信息表中包括IP地址、地理位置、使用的应用程序ID、操作记录等。针对设备对,可以分别计算该设备对中两个设备的IP地址相似度、地理位置相似度、应用程序使用相似度、操作记录相似度等,这些相似度作为不同的维度,拼接成两个设备的网络使用相似度。
例如,每个设备的运动数据包括加速度、角速度、运动轨迹等。针对设备对,可以分别计算该设备对中两个设备的加速度相似度、角速度相似度以及运动轨迹相似度,这些相似度作为不同的维度,拼接成两个设备的运动相似度。
例如,每个设备的环境数据包括光线亮度、温度、湿度等。针对设备对,可以分别计算该设备对中两个设备的光线亮度相似度、温度相似度、湿度相似度,这些相似度可以作为不同的维度,拼接成两个设备的环境相似度。
由此,可以得到每个设备对的网络使用相似度、运动相似度和环境相似度。针对每个设备对,网络使用相似度、运动相似度和环境相似度还可以拼接成该设备对的特征(特征向量)。
在操作S240,将设备对作为样本,设备对的特征作为样本的特征,得到样本数据。
例如,对象标识一致的两个设备(第一设备对)作为正样本,第一设备对的特征作为对应正样本的特征。对象标识不一致的两个设备(第二设备对)作为负样本,第二设备对的特征作为对应负样本的特征。
由此,正样本及对应特征、负样本及对应特征构成样本数据。
需要说明的是,样本的标签可以表征样本中两个设备实际上是否属于同一个用户。正样本是对象标识一致的两个设备,正样本中的两个设备属于同一用户,因此,正样本的标签可以表示两个设备属于同一用户,可以用1表示。负样本是对象标识不一致的两个设备,负样本中的两个设备属于不同的用户,因此,负样本的标签可以表示两个设备属于不同的用户,可以用0表示。
相比于相关技术中仅根据应用程序的登录标识将设备进行关联,本公开的实施例通过获取设备不同模态的数据,包括网络使用数据、运动数据和环境数据,并基于设备间的网络使用相似度、运动相似度和环境相似度构造设备对的特征,基于设备对的特征生成样本数据。本实施例的样本数据能够更加准确的表征两个设备之间的相似度,进而提高利用模型进行设备关联的效果,提高设备关联的准确性。
图3A是根据本公开的一个实施例的确定设备对中两个设备之间的网络使用相似度的方法的示意图。
如图3A所示,网络使用数据310包括IP地址、坐标、标签以及使用的APP的标识。网络使用数据310可以包括设备A的网络使用数据和设备B的网络使用数据。设备A和设备B组成的设备对,网络使用数据310还包括两个设备的数据传输情况。
根据预设时段内设备对中两个设备各自的IP地址序列,计算两个设备的IP地址相似度。
例如,可以获取设备A和设备B在预设时间段内(例如一周)各自的IP地址序列(IP地址序列A和IP地址序列B)。IP地址序列中的IP地址可以根据使用频次分配权重。例如,针对设备A的IP地址序列A,计算IP地址序列A中每个IP地址出现的频次,作为该IP地址的权重,得到加权后的IP地址序列A。针对设备B的IP地址序列B,采用类似的方式得到加权后的IP地址序列B。可以计算加权后的IP地址序列A和加权后的IP地址序列B之间的相似度,作为设备A和设备B之间的IP地址相似度。
需要说明的是,与IP地址相似度类似,本实施例还可以根据AP(Access Point,无线接入点)地址序列计算AP地址相似度,AP地址即用户使用WIFI接入网络的地址。
还需要说明的是,可以分时段统计不同时段的IP地址相似度。例如按照工作日/周末、白天/晚上等分别统计,得到不同时段的IP地址相似度。不同时段的IP地址相似度可以拼接在一起作为整体的IP地址相似度。
根据预设时段内设备对中两个设备各自的地理位置序列,计算两个设备的地理位置相似度。
例如,地理位置包括坐标,可以获取设备A和设备B在预设时间段(例如一周)内各自的地理位置序列(坐标序列A和坐标序列B)。计算坐标序列A和坐标序列B之间的相似度,得到坐标相似度,作为设备A和设备B之间的地理位置相似度。
根据预设时段内设备对中两个设备各自的网络活动的标签序列,计算两个设备的网络活动相似度。
例如,网络活动可以包括浏览历史、搜索记录和访问的网站关注情况等,这些网络活动具有对应的标签。可以获取设备A和设备B在预设时间段内(例如一周)各自的标签序列(标签序列A和标签序列B)。计算标签序列A和标签序列B之间的相似度,得到标签相似度,作为设备A和设备B之间的网络活动相似度。
根据预设时段内设备对中两个设备各自的应用程序标识序列,计算两个设备的应用程序使用相似度。
例如,可以获取设备A和设备B在预设时间段内(例如一周)各自的应用程序标识序列(APP序列A和APP序列B)。应用程序标识序列中的应用程序标识可以根据应用程序使用时长分配权重。例如,针对设备A的APP序列A,计算APP序列A中每个APP的使用时长占序列中所有APP使用时长的比例,作为该APP的权重,得到加权后的APP序列A。针对设备B的APP序列B,采用类似的方式得到加权后的APP序列B。可以计算加权后的APP序列A和加权后的APP序列B之间的相似度,作为应用程序使用相似度。
根据本公开的实施例,以上IP地址相似度、地理位置相似度、网络活动相似度、以及应用程序使用相似度中各个相似度的计算方法可以包括余弦相似度、Jaccard相似度中的至少之一,利多种相似度计算方法可以提供更全面、准确和鲁棒性更高的相似度度量,进而增强模型的性能和可靠性。
根据预设时段内设备对中两个设备之间的数据传输情况,确定两个设备的数据同步相似度。
例如,可以确定设备A和设备B在预设时间段内(例如一周)是否存在数据传输和同步行为,如文件传输、云存储使用等。如果存在,则两个设备的数据同步相似度可以设置为1,否则设置为0。
接下来,将IP地址相似度、地理位置相似度、网络活动相似度、应用程序使用相似度以及数据同步相似度进行拼接,得到网络使用相似度311。
本实施例通过统计IP地址、地理位置、网络活动标签、使用的应用程序以及是否进行数据传输等多个方面的相似度,能够更加全面、准确的表征网络使用相似度。
图3B是根据本公开的一个实施例的确定设备对中两个设备之间的运动相似度的方法的示意图。
如图3B所示,运动数据320可以包括速度、姿态以及轨迹。速度可以包括加速度,姿态可以包括角速度。运动数据320可以包括设备A的运动数据和设备B的运动数据。
根据预设时段内设备对中两个设备各自的速度序列,计算两个设备的速度相似度。
例如,速度包括IMU装置采集的加速度,可以获取设备A和设备B在预设时间段(例如一周)内各自的加速度序列(加速度序列A和加速度序列B)。加速度序列A和加速度序列B的采样频率一致。计算加速度序列A和加速度序列B之间的相似度,得到加速度相似度,作为设备A和设备B的速度相似度。
另一种计算设备A和设备B的速度相似度的方法,可以计算加速度序列A中各个加速度的时域统计特征,例如平均值、方差、最大值和最小值,将平均值、方差、最大值和最小值组成时域特征序列A。类似地,可以得到时域特征序列B,计算时域特征序列A和时域特征序列B之间的相似度,作为设备A和设备B之间的速度相似度。
另一种计算设备A和设备B的速度相似度的方法,可以计算加速度序列A中各个加速度的频域统计特征,例如提取频率特征、能量分布特征,组成频域特征序列A。类似地,可以得到频域特征序列B,计算频域特征序列A和频域特征序列B之间的相似度,作为设备A和设备B之间的速度相似度。
还可以将加速度的时域特征的相似度和频域特征的相似度进行拼接,得到整体的速度相似度。
根据预设时段内设备对中两个设备各自的姿态序列,计算两个设备的姿态相似度。
例如,姿态包括IMU装置采集的角速度,可以获取设备A和设备B在预设时间段(例如一周)内各自的角速度序列(角速度序列A和角速度序列B)。角速度序列A和角速度序列B的采样频率一致。计算角速度序列A和角速度序列B之间的相似度,得到角速度相似度,作为设备A和设备B之间的姿态相似度。
与速度相似度的计算方式类似,也可以通过统计角速度序列A和角速度序列B各自时域统计特征和/或频域统计特征来计算设备A和设备B之间的姿态相似度。这里不再赘述。
根据预设时段内设备对中两个设备各自的轨迹,计算两个设备的轨迹相似度。
例如,轨迹可以是从GPS数据中确定的。轨迹包括多个轨迹点,每个轨迹点包括经度、纬度和时间戳信息。获取设备A和设备B在预设时间段(例如一周)内各自的轨迹(轨迹A和轨迹B),轨迹A和轨迹B的轨迹点采样频率一致。根据时间戳将轨迹A和轨迹B对齐,计算轨迹A的总距离、平均距离、位置变化的速度、位置变化的角度,组成轨迹A的特征序列。其中,位置变化的速度可以是总距离或平均距离与时间段的比值,位置变化的角度可以是起点位置与终点位置之间的角度。类似地,可以得到轨迹B的特征序列。计算轨迹A的特征序列和轨迹B的特征序列之间的相似度,得到设备A和设备B之间的轨迹相似度。
接下来,将速度相似度、姿态相似度以及轨迹相似度进行拼接,得到运动相似度321。
本实施例通过统计加速度、角速度、轨迹等多个方面的相似度,能够更加全面、准确的表征设备对中两个设备之间的运动相似度。
图3C是根据本公开的一个实施例的确定设备对中两个设备之间的环境相似度的方法的示意图。
如图3C所示,环境数据330包括光线亮度、温度以及湿度。环境数据330包括设备A的环境数据和设备B的环境数据。
根据预设时段内设备对中两个设备各自的光线亮度序列,计算两个设备的光线亮度相似度。
例如,光线亮度可以是通过光线亮度传感器采集的。可以获取设备A和设备B在预设时间段(例如一周)内各自的光线亮度序列(光线亮度列A和光线亮度列B)。光线亮度列A和光线亮度列B的采样频率一致。计算光线亮度列A和光线亮度列B的相似度,得到光线亮度相似度。
另一种计算设备A和设备B的光线亮度相似度的方法,可以计算光线亮度序列A中各个光线亮度的统计特征,例如平均值、方差、最大值和最小值,将平均值、方差、最大值和最小值组成光线亮度特征序列A。类似地,可以得到光线亮度特征序列B,计算光线亮度特征序列A和光线亮度特征序列B之间的相似度,作为设备A和设备B之间的光线亮度相似度。
根据预设时段内设备对中两个设备各自的温度序列,计算两个设备的温度相似度。
例如,温度可以是通过温度传感器采集的。可以获取设备A和设备B在预设时间段(例如一周)内各自的温度序列(温度序列A和温度序列B)。温度序列A和温度序列B的采样频率一致。计算温度序列A和温度序列B的相似度,得到温度相似度。
另一种计算设备A和设备B之间的温度相似度的方法,可以计算温度序列A中各个温度的统计特征,例如平均值、方差、最大值和最小值,将平均值、方差、最大值和最小值组成温度特征序列A。类似地,可以得到温度特征序列B,计算温度特征序列A和温度特征序列B之间的相似度,作为设备A和设备B之间的温度相似度。
根据预设时段内设备对中两个设备各自的湿度序列,计算两个设备的湿度相似度。
例如,湿度可以是通过湿度传感器采集的。可以获取设备A和设备B在预设时间段(例如一周)内各自的湿度序列(湿度序列A和湿度序列B)。湿度序列A和湿度序列B的采样频率一致。计算湿度序列A和湿度序列B之间的相似度,得到湿度相似度。
另一种计算设备A和设备B之间的湿度相似度的方法,可以计算湿度序列A中各个湿度的统计特征,例如平均值、方差、最大值和最小值,将平均值、方差、最大值和最小值组成湿度特征序列A。类似地,可以得到湿度特征序列B,计算湿度特征序列A和湿度特征序列B之间的相似度,作为设备A和设备B之间的湿度相似度。
接下来,将光线亮度相似度、温度相似度以及湿度相似度进行拼接,得到环境相似度331。
本实施例通过统计光线亮度、温度以及湿度等多个方面的相似度,能够更加全面、准确的表征设备对中两个设备之间的环境相似度。
根据本公开的实施例,针对每个设备对,可以将该设备对中两个设备之间的网络使用相似度311、运动相似度321和环境相似度331拼接在一起,得到设备对的特征向量。
图4是根据本公开的一个实施例的机器学习模型的训练方法的流程图。
如图4所示,该机器学习模型的训练方法400包括操作S410~S440。
在操作S410,获取样本数据。
样本数据可以是根据上述样本数据生成方法得到的。样本包括设备对,样本的特征表示设备对中两个设备之间的关联关系。样本可以包括正样本和负样本。正样本包括对象标识一致的两个设备,该两个设备属于同一用户。负样本包括对象标识不一致的两个设备,该两个设备属于不同的用户。
需要说明的是,负样本的选取,需要具有多样性。例如负样本需要包含各维度特征完全不相似且属于不同用户的设备对、各维度特征有相似性但属于不同用户的设备对、以及各维度特征均相似但属于不同用户的设备对。上述三部分负样本的比例还可以根据实际情况调整,从而更好的模拟真实情况,避免过拟合的情况发生。
在操作S420,将样本的特征输入机器学习模型,得到样本的输出结果。
例如,将正样本的特征输入机器学习模型,机器学习模型计算正样本中两个设备属于同一用户的概率。将负样本的特征输入机器学习模型,机器学习模型计算负样本中两个设备属于同一用户的概率。
在操作S430,根据样本的输出结果,确定机器学习模型的损失。
例如,正样本的标签为1,根据正样本的标签和模型输出的两个设备属于同一用户的概率之间的距离,可以确定正样本损失。负样本的标签为0,根据负样本的标签和模型输出的两个设备属于同一用户的概率之间的距离,确定负样本的损失。
正样本的损失和负样本的损失之和可以作为模型的整体损失。
在操作S440,根据损失,调整机器学习模型的参数。
例如,根据模型的整体损失计算模型中的各个参数的梯度,根据梯度调整参数,得到更新的模型。针对下一个样本(正样本或负样本),使用更新的模型重复上述操作S420~440,直至达到预设条件(例如损失收敛),得到经训练的机器学习模型。
本实施例经训练的机器学习模型具备预测设备问关联关系的能力。利用经训练的机器学习模型,针对未知关联关系的新的设备对,可以基于设备对的特征,预测该设备对中两个设备属于同一用户的概率,进而将属于同一用户的设备相关联,能够提高设备关联的效率和准确性。
本实施例的机器学习模型可以是机器学习模型或者深度学习模型。机器学习模型可以选取随机森林模型、LGBM(Light Gradient Boosting Machine,是一个基于梯度提升决策树的机器学习算法)模型、XGBoost(eXtreme Gradient Boosting,极度梯度提升树的机器学习算法)模型等。深度学习模型可以选取卷积神经网络模型等。
需要说明的是,由于样本数量众多,可以首先选取随机森林模型进行对样本进行初筛,将输出概率值大于阈值(例如20%)的样本保留下来进行后面的精筛,将不大于阈值的样本过滤掉。这样做是为了减少样本量,随机森林模型运行速度快,能够快速从上亿的样本中过滤掉不符合条件的样本。针对保留下来的样本,再根据深度神经网络、LightGBM或XGBoost模型对数据进行模型训练。
还需要说明的是,为了提高模型的性能和泛化能力,可以使用网格搜索、随机搜索方法对模型的超参数学习率、最大深度、权重等进行优化。网格搜索通过穷举搜索,指定超参数的候选值,对所有可能的参数组合进行尝试并评估模型性能。对于每个参数组合,验证评估模型,并选择在性能指标上表现最好的参数组合。随机搜索不是穷举尝试所有可能的参数组合,而是从指定的参数空间中随机选择一组参数进行模型训练和评估。通过随机搜索,可以更高效地探索参数空间。
还需要说明的是,为了提高模型的性能和泛化能力,还可以结合交叉验证来评估模型性能,以避免过拟合。例如使用k折交叉验证,将训练数据划分为k个大小相等的子集,然后进行k次训练和验证。每次训练时,使用k-1个折作为训练集,剩余的1个折作为验证集。最终,将k次验证结果的平均值作为模型的性能评估指标。过迭代尝试不同的参数组合,并根据评估指标(准确率、精确率等)来选择最佳的参数组合,提高模型的性能和泛化能力。
还需要说明的是,可以对多模型结果集成,加权融合得到最终的模型。例如使用加权平均方法,对于每个模型的预测结果,为其分配一个权重,根据其表现和可靠性来确定。权重根据模型在验证集上的评估指标(准确率等)进行确定。然后,将每个模型的预测结果乘以其相应的权重,并将加权后的结果进行求和,得到最终的集成预测结果。模型集成可以提高模型的鲁棒性和泛化能力,减少过拟合的风险,并在处理复杂问题时提供更准确的预测结果。
图5是根据本公开的一个实施例的确定设备关联关系的方法的流程图。
如图5所示,该确定设备关联关系的方法500包括操作S510~S550。
在操作S510,获取与第一设备关联的网络使用数据、运动数据以及环境数据,并获取与第二设备关联的网络使用数据、运动数据以及环境数据。
第一设备和第二设备可以是未知二者之间关联关系的两个设备。可以使用上述经训练的机器学习模型确定二者的关系,即确定二者是否属于同一用户。
例如,获取第一设备和第二设备各自的网络使用数据、运动数据和环境数据以及第二设备和第二设备之间的数据传输情况。网络使用数据包括IP地址、地理位置、网络活动数据、应用程序使用数据。运动数据包括加速度数据、角速度数据和运动轨迹数据。环境数据包括光线亮度数据、温度数据和湿度数据。
在操作S520,根据与第一设备关联的网络使用数据、运动数据以及环境数据以及与第二设备关联的网络使用数据、运动数据以及环境数据,确定第一设备和第二设备之间的网络使用相似度、运动相似度和环境相似度。
例如,根据第一设备的网络使用数据和第二设备的网络使用数据,计算网络使用相似度,网络使用相似度可以包括多个维度的相似度,例如IP地址相似度、地理位置相似度、网络活动标签相似度、用用程序使用相似度以及数据同步相似度。
根据第一设备的运动数据和第二设备的运动数据,计算运动相似度。运动相似度可以包括加速度相似度、角速度相似度和轨迹相似度等多个维度的相似度。
根据第一设备的环境数据和第二设备的环境数据,计算环境相似度。环境相似度可以包括光线亮度相似度、温度相似度和湿度相似度等多个维度的相似度。
在操作S530,根据网络使用相似度、运动相似度和环境相似度,确定第一设备和第二设备的关联特征。
例如,将第一设备和第二设备的网络使用相似度、运动相似度和环境相似度进行拼接的,得到第一设备和第二设备的关联特征。
在操作S540,将关联特征输入机器学习模型,得到第一设备和第二设备属于同一对象的概率。
在操作S550,响应于概率大于阈值,确定第一设备和第二设备彼此关联。
例如,将第一设备和第二设备的关联特征输入经训练的机器学习模型,得打第一设备和第二设备属于同一对象的概率。在该概率大于阈值(例如80%)的情况下,可以确定第一设备和第二设备属于同一对象,即第一设备和第二设备彼此关联。
本实施例利用经训练的机器学习模型基于设备对的关联特征,计算设备对中两个设备属于同一用户的概率,将概率大于阈值的两个设备相关联,能够提高设备关联准确性。
图6是根据本公开的一个实施例的数据库生成方法的流程图。
如图6所示,该数据库生成方法600包括操作S610~S650。
在操作S610,获取与多个设备各自关联的网络使用数据、运动数据以及环境数据。
在操作S620,对多个设备进行两两配对,得到至少一个设备对。
在操作S630,针对每个设备对,分别根据网络使用数据、运动数据以及环境数据,确定该设备对中两个设备之间的网络使用相似度、运动相似度和环境相似度,并根据网络使用相似度、运动相似度和环境相似度,确定设备对的特征。
在操作S640,将设备对的特征输入机器学习模型,得到设备对中的两个设备属于同一对象的概率。
在操作S650,响应于概率大于阈值,将设备对中两个设备各自的属性信息添加到数据库中,其中,两个设备各自的属性信息包含彼此的设备标识。
根据本公开的实施例,多个设备可以是未知彼此之间关联关系的设备集合中的设备。可以获取每个设备的网络使用数据、运动数据和环境数据。可以通过两两配对的方式,得到至少一个设备对。
针对每个设备对,根据设备对中两个设备的网络使用数据计算两个设备的网络使用相似度根据两个设备的运动数据计算两个设备的运动相似度。根据两个设备的环境数据计算两个设备的环境相似度。然后将网络使用相似度、运动相似度和环境相似度拼接在一起,得到设备对的特征。
将设备对的特征输入经训练的机器学习模型,得到设备对中两个设备属于同一用户的概率,如果该概率大于阈值(例如80%),确定该两个设备彼此关联,进而可以将该两个设备的属性信息相关联的保存在数据库中。
例如,设备的属性信息可以包括设备ID、与设备ID关联的全量账号信息表、设备的产品线、最近活跃时间戳等。这些属性信息组成设备的属性集合。
例如,设备A和设备B彼此关联,可以将设备A的设备标识添加到设备B的属性集合中,并将设备B的设备标识添加到设备A的属性集合中。这样,设备A和设备B便相关联地存储在了数据库中。
根据本公开的实施例,对于大量的未知关联关系的设备集合,利用经训练的机器学习模型确定出集合中彼此关联的设备对,针对设备未登录应用程序的情况、用户注册新登录ID的情况以及多个用户共享登录ID的情况,也可以对设备进行正确的关联。
此外,本实施例将彼此关联的设备对的信息相关联的保存在数据库中,能够在某个业务系统检测到新设备之后,通过查询数据库,便可以得到与该新设备关联的设备,进而将关联设备的用户画像迁移到该新设备上,能够快速、准确的进行内容推荐、身份认证等。
下面对将彼此关联的设备对的属性信息进行入库的方法进行详细说明。
图7是根据本公开的一个实施例的设备信息入库的方法的流程图。
如图7所示,该数设备信息入库的方法包括操作S751~S753。
在操作S751,生成设备关联关系表。
在操作S752,将设备关联关系表进行结构化数据存储格式的转换。
在操作S753,将经格式转换的设备关联关系表添加到数据库中。
例如,设备A和设备B为模型预测的相关联的设备对,将设备B的设备标识添加到设备A的属性集合中,得到“设备A标识-属性集合”形式的设备记录。类似地,将设备A的设备标识添加到设备B的属性集合中,得到“设备B标识-属性集合”形式的设备记录。设备关联关系表包括多个设备的设备记录,每条设备记录包括设备自身的设备标识以及该设备的关联设备的设备标识。
例如,针对每条设备记录,可以根据哈希,移位等操作基于设备标识(或者设备类型和设备标识)生成该设备的关键字Key,并将设备的属性集合生成属性值Value,该条设备记录转换为Key-Value格式。类似的,将每条设备记录转换为Key-Value格式。接下来,便可以将Key-Value格式的设备记录添加到数据库中。
本实施例通过生成设备关联关系表,将设备关联关系表转换为Key-Value格式,然后存储到数据库中,便于设备信息的查询。
图8是根据本公开的一个实施例的信息推荐方法的流程图。
如图8所示,该数信息推荐方法包括操作S810~S850。
在操作S810,接收用于查询目标设备的关联设备的请求。
在操作S820,根据目标标识从数据库中确定目标设备的属性信息。
在操作S830,根据属性信息,确定与目标设备关联的关联设备的标识。
在操作S840,根据关联设备的标识,确定关联设备的属性信息。
在操作S850,根据关联设备的属性信息,输出针对目标设备的推荐信息。
例如,查询请求包括待查询的目标设备的设备标识(目标标识)。根据目标设备的设备标识(或者设备标识和设备类型)生成关键字Key。使用关键字Key从数据库中查询对应的关键字。在查询到关键字之后,可以从该关键字的设备记录中查找到该目标设备的关联设备的设备ID,进而可以基于该关联设备的设备ID查询到该关联设备的属性信息。
例如,目标设备A是某业务系统新检测到的设备,根据该设备的目标标识生成关键字,使用关键字从数据库中查询到对应的关键字,从而得到该设备A的设备记录。从设备A的设备记录中可以确定关联设备的设备标识。例如,关联设备为设备B,进而可以查询得到设备B的属性信息。设备B的属性信息可以包括应用程序使用记录、网络浏览记录、检索记录等操作信息生成的Cookie。因此,利用设备B的属性信息可以为设备A提供更准确的内容推荐信息。
本实施例通过数据库查询目标设备的关联设备,进而可以根据关联设备的属性信息为目标设备提供更准确的内容推荐信息,提高用户体验。
图9是根据本公开的一个实施例的样本数据生成装置的框图。
如图9所示,该样本数据生成装置900包括第一获取模块901、第一配对模块902、第一特征确定模块903以及样本数据生成模块904。
第一获取模块901用于获取与M个设备各自关联的网络使用数据、运动数据以及环境数据,其中,网络使用数据包括对象标识,M为大于1的整数。
第一配对模块902用于根据对象标识对M个设备进行配对,得到N个设备对,N为大于1的整数。
第一特征确定模块903用于针对每个设备对,分别根据网络使用数据、运动数据以及环境数据,确定设备对中两个设备之间的网络使用相似度、运动相似度和环境相似度,并根据网络使用相似度、运动相似度和环境相似度,确定设备对的特征。
样本数据生成模块904用于将设备对作为样本,设备对的特征作为样本的特征,得到样本数据。
根据本公开的实施例,样本包括正样本和负样本。
第一配对模块902用于将对象标识一致的两个设备确定为第一设备对;以及将对象标识不一致的两个设备确定为第二设备对。
样本数据生成模块904用于将第一设备对作为正样本,第一设备对的特征作为正样本的特征,并将第二设备对作为负样本,将第二设备对的特征作为负样本的特征,得到样本数据。
网络使用数据包括IP地址数据、地理位置数据、网络活动数据、应用程序使用数据以及设备对中两个设备之间的数据传输情况中的至少之一。
第一特征确定模块903包括IP地址相似度确定单元、地理位置相似度确定单元、网络活动相似度确定单元、应用程序使用相似度确定单元以及数据同步相似度确定单元中的至少之一。
IP地址相似度确定单元用于根据预设时段内设备对中两个设备各自的IP地址序列,计算两个设备的IP地址相似度。
地理位置相似度确定单元用于根据预设时段内设备对中两个设备各自的地理位置序列,计算两个设备的地理位置相似度。
网络活动相似度确定单元用于根据预设时段内设备对中两个设备各自的网络活动的标签序列,计算两个设备的网络活动相似度。
应用程序使用相似度确定单元用于根据预设时段内设备对中两个设备各自的应用程序标识序列,计算两个设备的应用程序使用相似度。
数据同步相似度确定单元用于根据预设时段内设备对中两个设备之间的数据传输情况,确定两个设备的数据同步相似度。
运动数据包括速度数据、姿态数据以及轨迹数据中的至少之一。第一特征确定模块903包括速度相似度确定单元、姿态相似度确定单元以及轨迹相似度确定单元中的至少之一。
速度相似度确定单元用于根据预设时段内设备对中两个设备各自的速度序列,计算两个设备的速度相似度。
姿态相似度确定单元用于根据预设时段内设备对中两个设备各自的姿态序列,计算两个设备的姿态相似度。
轨迹相似度确定单元用于根据预设时段内设备对中两个设备各自的轨迹,计算两个设备的轨迹相似度。
环境数据包括光线亮度数据、温度数据以及湿度数据中的至少之一。第一特征确定模块903包括光线亮度相似度确定单元、温度相似度确定单元以及湿度相似度确定单元中的至少之一。
光线亮度相似度确定单元用于根据预设时段内设备对中两个设备各自的光线亮度序列,计算两个设备的光线亮度相似度。
温度相似度确定单元用于根据预设时段内设备对中两个设备各自的温度序列,计算两个设备的温度相似度。
湿度相似度确定单元用于根据预设时段内设备对中两个设备各自的湿度序列,计算两个设备的湿度相似度。
图10是根据本公开的一个实施例的机器学习模型的训练装置的框图。
如图10所示,该机器学习模型的训练装置1000包括第二获取模块1001、样本处理模块1002、损失确定模块1003以及调整模块1004。
第二获取模块1001用于获取样本数据,其中,样本数据包括样本和样本的特征。
样本处理模块1002用于将样本的特征输入机器学习模型,得到样本的输出结果。
损失确定模块1003用于根据样本的输出结果,确定机器学习模型的损失。
调整模块1004用于根据损失,调整机器学习模型的参数。
其中,样本数据是根据上述样本数据生成装置生成的。
样本数据包括正样本和负样本。损失确定模块1003用于根据正样本的输出结果,确定正样本的损失;以及根据负样本的输出结果,确定负样本的损失。
调整模块1004用于根据正样本的损失和负样本的损失,调整机器学习模型的参数。
图11是根据本公开的一个实施例的确定设备关联关系的装置的框图。
如图11所示,该确定设备关联关系的装置1100包括第三获取模块1101、相似度确定模块1102、第二特征确定模块1103、第一概率确定模块1104、关联关系确定模块1105。
第三获取模块1101用于获取与第一设备关联的网络使用数据、运动数据以及环境数据,并获取与第二设备关联的网络使用数据、运动数据以及环境数据。
相似度确定模块1102用于根据与第一设备关联的网络使用数据、运动数据以及环境数据以及与第二设备关联的网络使用数据、运动数据以及环境数据,确定第一设备和第二设备之间的网络使用相似度、运动相似度和环境相似度。
第二特征确定模块1103用于根据网络使用相似度、运动相似度和环境相似度,确定第一设备和第二设备的关联特征。
第一概率确定模块1104用于将关联特征输入机器学习模型,得到第一设备和第二设备属于同一对象的概率。
关联关系确定模块1105用于响应于概率大于阈值,确定第一设备和第二设备彼此关联。
其中,机器学习模型是根据上述机器学习模型的训练装置进行训练得到的。
图12是根据本公开的一个实施例的数据库生成装置的框图。
如图12所示,该数据库生成装置1200包括第四获取模块1201、第二配对模块1202、第三特征确定模块1203、第二概率确定模块1204以及数据库生成模块1205。
第四获取模块1201用于获取与多个设备各自关联的网络使用数据、运动数据以及环境数据。
第二配对模块1 202用于对多个设备进行两两配对,得到至少一个设备对。
第三特征确定模块1203用于针对每个设备对,分别根据网络使用数据、运动数据以及环境数据,确定该设备对中两个设备之间的网络使用相似度、运动相似度和环境相似度,并根据网络使用相似度、运动相似度和环境相似度,确定设备对的特征。
第二概率确定模块1204用于将设备对的特征输入机器学习模型,得到设备对中的两个设备属于同一对象的概率。
数据库生成模块1205用于响应于概率大于阈值,将设备对中两个设备各自的属性信息添加到数据库中,其中,两个设备各自的属性信息包含彼此的设备标识。
其中,机器学习模型是根据上述机器学习模型的训练装置进行训练得到的。
图13是根据本公开的一个实施例的信息推荐装置的框图。
如图13所示,该信息推荐装置1300包括接收模块1301、第一属性信息确定模块1302、关联设备确定模块1303、第二属性信息确定模块1304以及推荐信息输出模块1305。
接收模块1301用于接收用于查询目标设备的关联设备的请求,其中,请求包括目标设备的目标标识。
第一属性信息确定模块1302用于根据目标标识从数据库中确定目标设备的属性信息。
关联设备确定模块1303用于根据属性信息,确定与目标设备关联的关联设备的标识。
第二属性信息确定模块1304用于根据关联设备的标识,确定关联设备的属性信息。
推荐信息输出模块1305用于根据关联设备的属性信息,输出针对目标设备的推荐信息。
其中,数据库是根据上述数据库生成装置生成的。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图14示出了可以用来实施本公开的实施例的示例电子设备1400的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图14所示,设备1400包括计算单元1401,其可以根据存储在只读存储器(ROM)1402中的计算机程序或者从存储单元1408加载到随机访问存储器(RAM)1403中的计算机程序,来执行各种适当的动作和处理。在RAM 1403中,还可存储设备1400操作所需的各种程序和数据。计算单元1401、ROM 1402以及RAM 1403通过总线1404彼此相连。输入/输出(I/O)接口1405也连接至总线1404。
设备1400中的多个部件连接至I/O接口1405,包括:输入单元1406,例如键盘、鼠标等;输出单元1407,例如各种类型的显示器、扬声器等;存储单元1408,例如磁盘、光盘等;以及通信单元1409,例如网卡、调制解调器、无线通信收发机等。通信单元1409允许设备1400通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元1401可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1401的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1401执行上文所描述的各个方法和处理,例如样本数据生成方法、机器学习模型的训练方法、确定设备关联关系的方法、数据库生成方法、信息推荐方法中的至少之一。例如,在一些实施例中,样本数据生成方法、机器学习模型的训练方法、确定设备关联关系的方法、数据库生成方法、信息推荐方法中的至少之一可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1408。在一些实施例中,计算机程序的部分或者全部可以经由ROM 1402和/或通信单元1409而被载入和/或安装到设备1400上。当计算机程序加载到RAM 1403并由计算单元1401执行时,可以执行上文描述的样本数据生成方法、机器学习模型的训练方法、确定设备关联关系的方法、数据库生成方法、信息推荐方法中的至少之一的一个或多个步骤。备选地,在其他实施例中,计算单元1401可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行样本数据生成方法、机器学习模型的训练方法、确定设备关联关系的方法、数据库生成方法、信息推荐方法中的至少之一。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (23)

1.一种样本数据生成方法,包括:
获取与M个设备各自关联的网络使用数据、运动数据以及环境数据,其中,所述网络使用数据包括对象标识,M为大于1的整数;
根据所述对象标识对所述M个设备进行配对,得到N个设备对,N为大于1的整数;
针对每个设备对,分别根据所述网络使用数据、运动数据以及环境数据,确定所述设备对中两个设备之间的网络使用相似度、运动相似度和环境相似度,并根据所述网络使用相似度、运动相似度和环境相似度,确定所述设备对的特征;以及
将所述设备对作为样本,设备对的特征作为所述样本的特征,得到样本数据。
2.根据权利要求1所述的方法,其中,所述样本包括正样本和负样本;
所述根据所述对象标识对所述M个设备进行配对,得到N个设备对包括:
将所述对象标识一致的两个设备确定为第一设备对;以及
将所述对象标识不一致的两个设备确定为第二设备对;
所述将所述设备对作为样本,设备对的特征作为所述样本的特征,得到样本数据包括:
将所述第一设备对作为正样本,第一设备对的特征作为所述正样本的特征,并将所述第二设备对作为负样本,将所述第二设备对的特征作为所述负样本的特征,得到所述样本数据。
3.根据权利要求1或2所述的方法,其中,所述网络使用数据包括IP地址数据、地理位置数据、网络活动数据、应用程序使用数据以及设备对中两个设备之间的数据传输情况中的至少之一;所述确定所述设备对中两个设备之间的网络使用相似度、运动相似度和环境相似度包括以下操作中的至少之一:针对每个设备对,
根据预设时段内所述设备对中两个设备各自的IP地址序列,计算所述两个设备的IP地址相似度;
根据所述预设时段内所述设备对中两个设备各自的地理位置序列,计算所述两个设备的地理位置相似度;
根据所述预设时段内所述设备对中两个设备各自的网络活动的标签序列,计算所述两个设备的网络活动相似度;
根据所述预设时段内所述设备对中两个设备各自的应用程序标识序列,计算所述两个设备的应用程序使用相似度;
根据所述预设时段内所述设备对中两个设备之间的数据传输情况,确定所述两个设备的数据同步相似度。
4.根据权利要求1至3中任一项所述的方法,其中,所述运动数据包括速度数据、姿态数据以及轨迹数据中的至少之一;所述确定所述设备对中两个设备之间的网络使用相似度、运动相似度和环境相似度包括以下操作中的至少之一:针对每个设备对,
根据预设时段内所述设备对中两个设备各自的速度序列,计算所述两个设备的速度相似度;
根据所述预设时段内所述设备对中两个设备各自的姿态序列,计算所述两个设备的姿态相似度;
根据所述预设时段内所述设备对中两个设备各自的轨迹,计算所述两个设备的轨迹相似度。
5.根据权利要求1至4中任一项所述的方法,其中,所述环境数据包括光线亮度数据、温度数据以及湿度数据中的至少之一;所述确定所述设备对中两个设备之间的网络使用相似度、运动相似度和环境相似度包括以下操作中的至少之一:针对每个设备对,
根据预设时段内所述设备对中两个设备各自的光线亮度序列,计算所述两个设备的光线亮度相似度;
根据所述预设时段内所述设备对中两个设备各自的温度序列,计算所述两个设备的温度相似度;
根据所述预设时段内所述设备对中两个设备各自的湿度序列,计算所述两个设备的湿度相似度。
6.一种机器学习模型的训练方法,包括:
获取样本数据,其中,所述样本数据包括样本和所述样本的特征;
将所述样本的特征输入机器学习模型,得到所述样本的输出结果;
根据所述样本的输出结果,确定所述机器学习模型的损失;以及
根据所述损失,调整所述机器学习模型的参数;
其中,所述样本数据是根据权利要求1至5中任一项所述的方法生成的。
7.根据权利要求6所述的方法,其中,所述样本数据包括正样本和负样本;
所述根据所述样本的输出结果,确定所述机器学习模型的损失包括:
根据所述正样本的输出结果,确定所述正样本的损失;以及
根据所述负样本的输出结果,确定所述负样本的损失;
所述根据所述损失,调整所述机器学习模型的参数包括:
根据所述正样本的损失和所述负样本的损失,调整所述机器学习模型的参数。
8.一种确定设备关联关系的方法,包括:
获取与第一设备关联的网络使用数据、运动数据以及环境数据,并获取与第二设备关联的网络使用数据、运动数据以及环境数据;
根据所述与第一设备关联的网络使用数据、运动数据以及环境数据以及所述与第二设备关联的网络使用数据、运动数据以及环境数据,确定第一设备和第二设备之间的网络使用相似度、运动相似度和环境相似度;
根据所述网络使用相似度、运动相似度和环境相似度,确定所述第一设备和第二设备的关联特征;
将所述关联特征输入机器学习模型,得到所述第一设备和所述第二设备属于同一对象的概率;以及
响应于所述概率大于阈值,确定所述第一设备和所述第二设备彼此关联;
其中,所述机器学习模型是根据权利要求6或7所述的方法进行训练得到的。
9.一种数据库生成方法,包括:
获取与多个设备各自关联的网络使用数据、运动数据以及环境数据;
对所述多个设备进行两两配对,得到至少一个设备对;
针对每个设备对,分别根据所述网络使用数据、运动数据以及环境数据,确定该设备对中两个设备之间的网络使用相似度、运动相似度和环境相似度,并根据所述网络使用相似度、运动相似度和环境相似度,确定所述设备对的特征;
将所述设备对的特征输入机器学习模型,得到所述设备对中的两个设备属于同一对象的概率;以及
响应于所述概率大于阈值,将所述设备对中两个设备各自的属性信息添加到数据库中,其中,所述两个设备各自的属性信息包含彼此的设备标识;
其中,所述机器学习模型是根据权利要求6或7所述的方法进行训练得到的。
10.一种信息推荐方法,包括:
接收用于查询目标设备的关联设备的请求,其中,所述请求包括所述目标设备的目标标识;以及
根据所述目标标识从数据库中确定所述目标设备的属性信息;
根据所述属性信息,确定与所述目标设备关联的关联设备的标识;
根据所述关联设备的标识,确定所述关联设备的属性信息;以及
根据所述关联设备的属性信息,输出针对所述目标设备的推荐信息。
其中,所述数据库是根据权利要求9所述的方法生成的。
11.一种样本数据生成装置,包括:
第一获取模块,用于获取与M个设备各自关联的网络使用数据、运动数据以及环境数据,其中,所述网络使用数据包括对象标识,M为大于1的整数;
第一配对模块,用于根据所述对象标识对所述M个设备进行配对,得到N个设备对,N为大于1的整数;
第一特征确定模块,用于针对每个设备对,分别根据所述网络使用数据、运动数据以及环境数据,确定所述设备对中两个设备之间的网络使用相似度、运动相似度和环境相似度,并根据所述网络使用相似度、运动相似度和环境相似度,确定所述设备对的特征;以及
样本数据生成模块,用于将所述设备对作为样本,设备对的特征作为所述样本的特征,得到样本数据。
12.根据权利要求11所述的装置,其中,所述样本包括正样本和负样本;
所述第一配对模块,用于将所述对象标识一致的两个设备确定为第一设备对;以及将所述对象标识不一致的两个设备确定为第二设备对;
所述样本数据生成模块,用于将所述第一设备对作为正样本,第一设备对的特征作为所述正样本的特征,并将所述第二设备对作为负样本,将所述第二设备对的特征作为所述负样本的特征,得到所述样本数据。
13.根据权利要求11或12所述的装置,其中,所述网络使用数据包括IP地址数据、地理位置数据、网络活动数据、应用程序使用数据以及设备对中两个设备之间的数据传输情况中的至少之一;所述第一特征确定模块包括以下单元中的至少之一:
IP地址相似度确定单元,用于根据预设时段内所述设备对中两个设备各自的IP地址序列,计算所述两个设备的IP地址相似度;
地理位置相似度确定单元,用于根据所述预设时段内所述设备对中两个设备各自的地理位置序列,计算所述两个设备的地理位置相似度;
网络活动相似度确定单元,用于根据所述预设时段内所述设备对中两个设备各自的网络活动的标签序列,计算所述两个设备的网络活动相似度;
应用程序使用相似度确定单元,用于根据所述预设时段内所述设备对中两个设备各自的应用程序标识序列,计算所述两个设备的应用程序使用相似度;
数据同步相似度确定单元,用于根据所述预设时段内所述设备对中两个设备之间的数据传输情况,确定所述两个设备的数据同步相似度。
14.根据权利要求11至13中任一项所述的装置,其中,所述运动数据包括速度数据、姿态数据以及轨迹数据中的至少之一;所述第一特征确定模块包括以下单元中的至少之一:
速度相似度确定单元,用于根据预设时段内所述设备对中两个设备各自的速度序列,计算所述两个设备的速度相似度;
姿态相似度确定单元,用于根据所述预设时段内所述设备对中两个设备各自的姿态序列,计算所述两个设备的姿态相似度;
轨迹相似度确定单元,用于根据所述预设时段内所述设备对中两个设备各自的轨迹,计算所述两个设备的轨迹相似度。
15.根据权利要求11至14中任一项所述的装置,其中,所述环境数据包括光线亮度数据、温度数据以及湿度数据中的至少之一;所述第一特征确定模块包括以下单元中的至少之一:
光线亮度相似度确定单元,用于根据预设时段内所述设备对中两个设备各自的光线亮度序列,计算所述两个设备的光线亮度相似度;
温度相似度确定单元,用于根据所述预设时段内所述设备对中两个设备各自的温度序列,计算所述两个设备的温度相似度;
湿度相似度确定单元,用于根据所述预设时段内所述设备对中两个设备各自的湿度序列,计算所述两个设备的湿度相似度。
16.一种机器学习模型的训练装置,包括:
第二获取模块,用于获取样本数据,其中,所述样本数据包括样本和所述样本的特征;
样本处理模块,用于将所述样本的特征输入机器学习模型,得到所述样本的输出结果;
损失确定模块,用于根据所述样本的输出结果,确定所述机器学习模型的损失;以及
调整模块,用于根据所述损失,调整所述机器学习模型的参数;
其中,所述样本数据是根据权利要求11至15中任一项所述的装置生成的。
17.根据权利要求16所述的装置,其中,所述样本数据包括正样本和负样本;
所述损失确定模块,用于根据所述正样本的输出结果,确定所述正样本的损失;以及根据所述负样本的输出结果,确定所述负样本的损失;
所述调整模块,用于根据所述正样本的损失和所述负样本的损失,调整所述机器学习模型的参数。
18.一种确定设备关联关系的装置,包括:
第三获取模块,用于获取与第一设备关联的网络使用数据、运动数据以及环境数据,并获取与第二设备关联的网络使用数据、运动数据以及环境数据;
相似度确定模块,用于根据所述与第一设备关联的网络使用数据、运动数据以及环境数据以及所述与第二设备关联的网络使用数据、运动数据以及环境数据,确定第一设备和第二设备之间的网络使用相似度、运动相似度和环境相似度;
第二特征确定模块,用于根据所述网络使用相似度、运动相似度和环境相似度,确定所述第一设备和第二设备的关联特征;
第一概率确定模块,用于将所述关联特征输入机器学习模型,得到所述第一设备和所述第二设备属于同一对象的概率;以及
关联关系确定模块,用于响应于所述概率大于阈值,确定所述第一设备和所述第二设备彼此关联;
其中,所述机器学习模型是根据权利要求16或17所述的装置进行训练得到的。
19.一种数据库生成装置,包括:
第四获取模块,用于获取与多个设备各自关联的网络使用数据、运动数据以及环境数据;
第二配对模块,用于对所述多个设备进行两两配对,得到至少一个设备对;
第三特征确定模块,用于针对每个设备对,分别根据所述网络使用数据、运动数据以及环境数据,确定该设备对中两个设备之间的网络使用相似度、运动相似度和环境相似度,并根据所述网络使用相似度、运动相似度和环境相似度,确定所述设备对的特征;
第二概率确定模块,用于将所述设备对的特征输入机器学习模型,得到所述设备对中的两个设备属于同一对象的概率;以及
数据库生成模块,用于响应于所述概率大于阈值,将所述设备对中两个设备各自的属性信息添加到数据库中,其中,所述两个设备各自的属性信息包含彼此的设备标识;
其中,所述机器学习模型是根据权利要求16或17所述的装置进行训练得到的。
20.一种信息推荐装置,包括:
接收模块,用于接收用于查询目标设备的关联设备的请求,其中,所述请求包括所述目标设备的目标标识;以及
第一属性信息确定模块,用于根据所述目标标识从数据库中确定所述目标设备的属性信息;
关联设备确定模块,用于根据所述属性信息,确定与所述目标设备关联的关联设备的标识;
第二属性信息确定模块,用于根据所述关联设备的标识,确定所述关联设备的属性信息;以及
推荐信息输出模块,用于根据所述关联设备的属性信息,输出针对所述目标设备的推荐信息。
其中,所述数据库是根据权利要求19所述的装置生成的。
21.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至10中任一项所述的方法。
22.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1至10中任一项所述的方法。
23.一种计算机程序产品,包括计算机程序,所述计算机程序存储于可读存储介质和电子设备其中至少之一上,所述计算机程序在被处理器执行时实现根据权利要求1至10中任一项所述的方法。
CN202310913648.7A 2023-07-24 2023-07-24 样本数据生成、模型训练以及确定设备关联关系的方法 Pending CN116915831A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310913648.7A CN116915831A (zh) 2023-07-24 2023-07-24 样本数据生成、模型训练以及确定设备关联关系的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310913648.7A CN116915831A (zh) 2023-07-24 2023-07-24 样本数据生成、模型训练以及确定设备关联关系的方法

Publications (1)

Publication Number Publication Date
CN116915831A true CN116915831A (zh) 2023-10-20

Family

ID=88356318

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310913648.7A Pending CN116915831A (zh) 2023-07-24 2023-07-24 样本数据生成、模型训练以及确定设备关联关系的方法

Country Status (1)

Country Link
CN (1) CN116915831A (zh)

Similar Documents

Publication Publication Date Title
US20240104156A1 (en) Systems and Methods for Selecting Content Based on Linked Devices
CN108875007B (zh) 兴趣点的确定方法和装置、存储介质、电子装置
US11113745B1 (en) Neural contextual bandit based computational recommendation method and apparatus
Xiao et al. Inferring social ties between users with human location history
US9071939B2 (en) Methods and apparatuses for context determination
WO2019061656A1 (zh) 电子装置、基于lbs数据的服务场所推荐方法及存储介质
CN114422267B (zh) 流量检测方法、装置、设备及介质
CN114357105B (zh) 地理预训练模型的预训练方法及模型微调方法
Zhang et al. Beyond the limits of predictability in human mobility prediction: context-transition predictability
CN110263824A (zh) 模型的训练方法、装置、计算设备及计算机可读存储介质
CN107689991B (zh) 信息推送方法和装置、服务器
WO2018227773A1 (zh) 地点推荐方法、装置、计算机设备和存储介质
CN110704754A (zh) 一种由用户终端执行的推送模型优化方法和装置
US20220417226A1 (en) Automatic privacy-aware machine learning method and apparatus
US11601509B1 (en) Systems and methods for identifying entities between networks
CN116915831A (zh) 样本数据生成、模型训练以及确定设备关联关系的方法
CN115935265A (zh) 训练风险识别模型的方法、风险识别方法及对应装置
CN111278105B (zh) 无线网络定位方法和相关装置
Duan et al. Trajectory-matching prediction for friend recommendation in anonymous social networks
KR102570399B1 (ko) 장소 추천 방법 및 장치
CN117522614B (zh) 一种数据的处理方法、装置、电子设备及存储介质
CN112214387A (zh) 基于知识图谱的用户操作行为预测方法及装置
EP3107317A1 (en) User activity random indexing predictor for mobile context awareness
CN117077110A (zh) 数据处理方法、装置、电子设备及存储介质
CN117390276A (zh) 内容推荐方法、装置、设备、计算机可读存储介质及产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination