CN111930995A - 数据处理方法及装置 - Google Patents
数据处理方法及装置 Download PDFInfo
- Publication number
- CN111930995A CN111930995A CN202010831980.5A CN202010831980A CN111930995A CN 111930995 A CN111930995 A CN 111930995A CN 202010831980 A CN202010831980 A CN 202010831980A CN 111930995 A CN111930995 A CN 111930995A
- Authority
- CN
- China
- Prior art keywords
- user
- data
- application device
- target
- application
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 22
- 238000000034 method Methods 0.000 claims abstract description 61
- 238000004891 communication Methods 0.000 claims abstract description 33
- 238000013523 data management Methods 0.000 claims abstract description 25
- 238000004140 cleaning Methods 0.000 claims abstract description 10
- 238000012545 processing Methods 0.000 claims description 16
- 230000000875 corresponding effect Effects 0.000 abstract description 112
- 230000002596 correlated effect Effects 0.000 abstract description 6
- 230000006399 behavior Effects 0.000 description 47
- 230000008569 process Effects 0.000 description 23
- 230000003993 interaction Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- YSCNMFDFYJUPEF-OWOJBTEDSA-N 4,4'-diisothiocyano-trans-stilbene-2,2'-disulfonic acid Chemical compound OS(=O)(=O)C1=CC(N=C=S)=CC=C1\C=C\C1=CC=C(N=C=S)C=C1S(O)(=O)=O YSCNMFDFYJUPEF-OWOJBTEDSA-N 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000013475 authorization Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000004080 punching Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/735—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Stored Programmes (AREA)
Abstract
本发明提供一种数据处理方法及装置,该方法包括:获取目标用户的用户信息,并确定各个设置有目标应用软件的应用设备;采集每个应用设备中的数据信息,对各个数据信息中的各个数据进行数据清洗,将清洗后的各个数据信息存储至数据管理引擎中;运行数据打通模块并基于数据打通模块中设定的数据打通条件,在各个应用设备中将与目标用户存在数据关联关系的各个应用设备确定为目标应用设备;基于目标用户的用户信息,提取各个目标应用设备对应的属于目标用户的各个数据,将各个已提取的数据关联。应用该方法,可以将各个设备之间的数据进行关联,消除同一用户在不同设备上的数据孤岛,以便于通过大数据分析用户的喜好,为用户推荐满足其喜好的内容。
Description
技术领域
本发明涉及数据处理技术领域,特别是涉及一种数据处理方法及装置。
背景技术
随着大数据时代的到来,在用户通过设备应用各个应用软件时,运营商会根据用户在应用软件上的历史操作内容为用户推送相关的内容。例如,用户应用视频软件观看音乐类综艺,可以根据用户的观看记录为用户推荐相关的音乐视频内容。
在现有技术中,通过为用户所使用的设备分配指定的ID,将该ID与用户在应用该设备时所产生的日志数据进行关联,从而获知用户的应用喜好。但是,随着用户生活水平的提高,用户在应用各个应用软件时,并不局限在同一个设备上,用户可以通过多个设备,如:手机、电脑、平板等使用同一个应用软件,但是各个设备中的产生数据将形成数据孤岛,即数据在不同设备中相互独立存储,独立维护,彼此间相互孤立。若仅根据单个设备中的数据对用户喜好进行分析,为用户推荐相关的内容,则会导致推荐的内容不能满足用户的需求,影响用户的使用体验。
发明内容
有鉴于此,本发明提供一种数据处理方法及装置其中,通过该方法,可以将各个设备之间的数据进行关联,消除同一用户在不同设备上的数据孤岛,以便于通过大数据分析用户的喜好,为用户推荐满足其喜好的内容。
本发明还提供了一种数据处理装置,用以保证上述方法在实际中的实现及应用。
一种数据处理方法,包括:
获取目标用户的用户信息,并确定各个设置有目标应用软件的应用设备;
采集每个所述应用设备中的所述目标应用软件对应的数据信息,并对各个所述数据信息中的各个数据进行数据清洗,将清洗后的各个所述数据信息存储至预先设置的数据管理引擎中;
运行预先设置的数据打通模块,并基于所述数据打通模块中预先设定的数据打通条件,在各个所述应用设备中将与所述目标用户存在数据关联关系的各个应用设备确定为目标应用设备;
基于所述目标用户的用户信息,提取所述数据管理引擎中各个所述目标应用设备对应的属于所述目标用户的各个数据,并将各个已提取的数据进行关联。
上述的方法,可选的,所述采集所述目标应用软件对应的数据信息,包括:
调用预先设置的软件开发工具,检验各个所述应用设备是否开通所述目标应用软件对应的数据权限设置;
若各个所述应用设备已开通所述目标应用软件对应的数据权限设置,则通过所述软件开发工具采集每个所述应用设备中的所述目标应用软件对应的数据信息。
上述的方法,可选的,所述基于所述数据打通模块中预先设定的数据打通条件,在各个所述应用设备中,将与所述目标用户存在数据关联关系的各个应用设备确定为目标应用设备,包括:
获取每个所述应用设备中记录的所述目标应用软件对应的至少一个用户标识码,所述用户标识码为其对应的用户在注册所述目标应用软件时,所述目标应用软件为该用户分配的唯一标识码;
基于所述目标用户的用户信息,判断各个所述应用设备记录的各个用户标识码中,是否存在所述目标用户对应的用户标识码;
若任一应用设备记录的各个用户标识码中,存在所述目标用户对应的用户标识码,则确定该应用设备与所述目标用户存在数据关联关系,并将所述应用设备设置为目标应用设备。
上述的方法,可选的,所述基于所述数据打通模块中预先设定的数据打通条件,在各个所述应用设备中,将与所述目标用户存在数据关联关系的各个应用设备确定为目标应用设备,包括:
获取每个所述应用设备中记录的所述目标应用软件对应的至少一个用户标识码;
基于所述目标用户的用户信息,判断各个所述应用设备记录的各个用户标识码中,是否存在所述目标用户对应的用户标识码;
若任意的应用设备记录的各个用户标识码中,存在所述目标用户对应的用户标识码,则将存在所述目标用户对应的用户标识码的应用设备确定为第一应用设备;
获取各个所述第一应用设备的设备信息,并确定所述数据打通设备中预先设置的各个逻辑规则;
基于各个所述设备信息及各个所述逻辑规则,判断所述目标用户是否为各个所述第一应用设备中应用所述目标应用软件的真实用户;
若所述目标用户为任意的第一应用设备中应用所述目标应用软件的真实用户,则确定所述第一应用设备与所述目标用户存在数据关联关系,将所述第一应用设备设定为目标应用设备。
上述的方法,可选的,还包括:
当任意的第一应用设备与所述目标用户存在数据关联关系时,将与所述目标用户存在数据关联关系的各个第一应用设备确定为第二应用设备;
获取各个所述第二应用设备中所述目标用户对应的用户行为数据,并分别计算各个所述用户行为数据之间的相似度;
当至少两个用户行为数据之间的相似度大于预设阈值时,确定所述至少两个用户行为数据对应的各个第二应用设备为第三应用设备;
确定各个所述第三应用设备的当前位置,并基于每个所述第三应用设备的当前位置确定各个所述第三应用设备之间的相对位置;
若存在至少两个第三应用设备之间的相对位置在预设范围内,则将所述相对位置在预设范围内的各个第三应用设备设定为目标应用设备。
上述的方法,可选的,所述获取各个所述第二应用设备中所述目标用户对应的用户行为数据,包括:
获取每个所述第二应用设备中在预设时间段内所述目标用户对应的历史操作内容;
将各个所述历史操作内容输入预先设置的识别模型,触发所述识别模型对各个所述历史操作内容进行数据结构化;
当所述识别模型输出每个所述历史操作模型对应的历史操作文件时,获取每个所述历史操作文件中所述目标用户对应的用户行为数据。
一种数据处理装置,包括:
获取单元,用于获取目标用户的用户信息,并确定各个设置有目标应用软件的应用设备;
采集单元,用于采集每个所述应用设备中的所述目标应用软件对应的数据信息,并对各个所述数据信息中的各个数据进行数据清洗,将清洗后的各个所述数据信息存储至预先设置的数据管理引擎中;
确定单元,用于运行预先设置的数据打通模块,并基于所述数据打通模块中预先设定的数据打通条件,在各个所述应用设备中将与所述目标用户存在数据关联关系的各个应用设备确定为目标应用设备;
关联单元,用于基于所述目标用户的用户信息,提取所述数据管理引擎中各个所述目标应用设备对应的属于所述目标用户的各个数据,并将各个已提取的数据进行关联。
上述的装置,可选的,所述采集单元,包括:
检验子单元,用于调用预先设置的软件开发工具,检验各个所述应用设备是否开通所述目标应用软件对应的数据权限设置;
采集子单元,用于若各个所述应用设备已开通所述目标应用软件对应的数据权限设置,则通过所述软件开发工具采集每个所述应用设备中的所述目标应用软件对应的数据信息。
上述的装置,可选的,所述确定单元,包括:
第一确定子单元,用于获取每个所述应用设备中记录的所述目标应用软件对应的至少一个用户标识码,所述用户标识码为其对应的用户在注册所述目标应用软件时,所述目标应用软件为该用户分配的唯一标识码;基于所述目标用户的用户信息,判断各个所述应用设备记录的各个用户标识码中,是否存在所述目标用户对应的用户标识码;若任一应用设备记录的各个用户标识码中,存在所述目标用户对应的用户标识码,则确定该应用设备与所述目标用户存在数据关联关系,并将所述应用设备设置为目标应用设备。
上述的装置,可选的,所述确定单元,包括:
第二确定子单元,用于获取每个所述应用设备中记录的所述目标应用软件对应的至少一个用户标识码;基于所述目标用户的用户信息,判断各个所述应用设备记录的各个用户标识码中,是否存在所述目标用户对应的用户标识码;若任意的应用设备记录的各个用户标识码中,存在所述目标用户对应的用户标识码,则将存在所述目标用户对应的用户标识码的应用设备确定为第一应用设备;获取各个所述第一应用设备的设备信息,并确定所述数据打通设备中预先设置的各个逻辑规则;基于各个所述设备信息及各个所述逻辑规则,判断所述目标用户是否为各个所述第一应用设备中应用所述目标应用软件的真实用户;若所述目标用户为任意的第一应用设备中应用所述目标应用软件的真实用户,则确定所述第一应用设备与所述目标用户存在数据关联关系,将所述第一应用设备设定为目标应用设备。
一种存储介质,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行上述的数据处理方法。
一种电子设备,包括存储器,以及一个或者一个以上的指令,其中一个或者一个以上指令存储于存储器中,且经配置以由一个或者一个以上处理器执行上述的数据处理方法。
与现有技术相比,本发明包括以下优点:
本发明提供一种数据处理方法,包括:获取目标用户的用户信息,并确定各个设置有目标应用软件的应用设备;采集每个所述应用设备中的所述目标应用软件对应的数据信息,并对各个所述数据信息中的各个数据进行数据清洗,将清洗后的各个所述数据信息存储至预先设置的数据管理引擎中;运行预先设置的数据打通模块,并基于所述数据打通模块中预先设定的数据打通条件,在各个所述应用设备中将与所述目标用户存在数据关联关系的各个应用设备确定为目标应用设备;基于所述目标用户的用户信息,提取所述数据管理引擎中各个所述目标应用设备对应的属于所述目标用户的各个数据,并将各个已提取的数据进行关联。应用本发明提供的方法,可以将各个设备之间的数据进行关联,消除同一用户在不同设备上的数据孤岛,以便于通过大数据分析用户的喜好,为用户推荐满足其喜好的内容。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种数据处理方法的方法流程图;
图2为本发明实施例提供的一种数据处理方法的另一方法流程图;
图3为本发明实施例提供的一种数据处理方法的再一方法流程图;
图4为本发明实施例提供的一种数据处理装置的装置结构图;
图5为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本发明可用于众多通用或专用的计算装置环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器装置、包括以上任何装置或设备的分布式计算环境等等。
本发明实施例提供了一种数据处理方法,该方法可以应用在大数据处理平台,该平台包括自研的数据收集服务器LogServer、大数据计算引擎Hadoop和数据管理引擎Hive,所述方法的方法流程图如图1所示,具体包括:
S101:获取目标用户的用户信息,并确定各个设置有目标应用软件的应用设备;
在本发明实施例中,目标用户在使用目标应用软件的过程中,可能会存在通过多个设备使用同一个应用软件的情况,例如,用户通常会通过手机使用视频软件观看视频,但偶尔会通过电脑或电视使用该视频软件观看视频。为了能够根据用户观看视频的喜好为用户推荐其所喜好的视频内容,需要将用户在各个应用设备中使用同一个应用软件所产生的数据关联。其中,在需要关联用户在多个应用设备中的数据时,先获取该目标用户的用户信息,该用户信息中包含用户名称、用户在该目标应用软件上注册的账号、用户的唯一标识码等信息。
需要说明的是,确定各个设置有目标应用软件的应用设备的方式可以是根据用户当前所在位置确定一定范围内的设置有该目标应用软件的应用设备,或者接收各个应用设备上传的信息,确定该目标用户是否使用过该应用设备。对于每个应用设备来说,该应用设备会实时将其内部设置的所有应用软件及每个应用软件的相关信息上报至对应的服务器中,而服务器则根据应用设备上报的信息进行数采集。其中,采集数据的服务器为自研的LogServer收集服务器。
S102:采集每个所述应用设备中的所述目标应用软件对应的数据信息,并对各个所述数据信息中的各个数据进行数据清洗,将清洗后的各个所述数据存储至预先设置的数据管理引擎中;
在本发明实施例中,在确定各个应用设备后,需采集每个应用设备中的数据信息中,该数据信息中包含其对应的应用设备中设置的目标应用软件所产生的所有数据。在采集数据信息的过程中,可能会存在数据缺失或者是数据不完整的情况,需要对数据信息中的各个数据进行清洗,将缺失或者不完整的数据补全。将清洗后的数据信息保存至数据管理引擎中。
S103:运行预先设置的数据打通模块,并基于所述数据打通模块中预先设定的数据打通条件,在各个所述应用设备中将与所述目标用户存在数据关联关系的各个应用设备确定为目标应用设备;
在本发明实施例中,该数据打通模块中设置至少一个数据打通条件,每个数据打通条件均应用对应的数据打通技术实现将各个应用设备中该目标用户对应的数据关联。其中,数据打通技术可以是ID mapping技术,具体是将多个数据源通过一种关联关系进行对接的技术。在本发明中通过数据打通条件中的数据打通技术确定各个应用设备中与目标用户存在数据关联关系的应用设备,以通过与目标用户存在数据关联关系的各个应用设备实现数据关联。
S104:基于所述目标用户的用户信息,提取所述数据管理引擎中各个所述目标应用设备对应的属于所述目标用户的各个数据,并将各个已提取的数据进行关联。
在本发明实施例中,由于每个应用设备所设置的目标应用软件可能曾经存在多个用户使用,因此,先获取每个目标应用设备中的已清洗数据信息,并通过目标用户的用户信息提取每个已清洗数据信息中属于该目标用户的各个数据,并在提取各个目标应用设备中属于该目标用户的各个数据后,可以通过数据打通技术将各个数据关联起来,从而实现该目标用户数据的连续性。
本发明实施例提供的数据处理方法中,在需要关联目标应用软件对应的与目标用户相关的各个数据时,获取该目标用户的用户信息,并先从各个设置有目标应用软件的应用设备中采集数据信息,对数据信息中的各个数据清洗后保存至数据管理引擎中。通过数据打通模块的数据打通条件,在各个应用设备中确定与该目标用户存在数据关联关系的目标应用设备,并基于目标用户的用户信息提取目标应用设备对应的属于该目标用户的各个数据,并关联各个已提取的数据。
可选的,本发明的数据处理过程中,可以同时对多个用户及多个应用设备同时进行数据处理,通过数据打通模块确定多个用户与多个设备之间的对应关系,以根据各个用户和设备之间的关系,确定每个用户在不同设备上所产生的的各个数据,并将属于同一个用户的各个数据关联,解决同一个用户的数据在各个设备上的数据孤岛问题。
基于上述实施例提供的方法,以视频软件为例,视频软件运营商为了迎合用户观看视频内容的喜好,需要结合用户历史观看视频的相关数据进行分析,为用户推荐符合用户喜好的视频内容。但是用户可能不仅仅使用一台设备应用该视频软件观看视频,因此,若用户存在使用多个设备应用该视频软件观看视频时,需要将各个设备中用户应用该视频软件是所产生的数据进行关联,具体实现过程为:
获取用户的用户信息,具体包括用户姓名、在视频软件上注册的账户等信息,并同时确定各个设备有该视频软件的各个设备,采集各个设备中的该视频软件对应的数据信息,并对各个数据信息中的数据进行清洗,以保证各个数据的完整性。在将数据清洗后,将各个数据信息存储至数据管理引擎中。通过数据打通模块中的数据打通条件,确定与该用户存在数据关联关系的各个设备,即用户使用过该视频软件的各个设备。在确定各个设备后,根据该用户的用户信息,从数据管理引擎中属于该用户的数据,并对各个数据进行关联。在将各个数据关联后,将获得该用户使用该视频软件的相关的历史数据,通过对历史数据的分析可以及时为用户推荐其所感兴趣的相关视频、广告等内容。
应用本发明实施例提供的方法,可以将各个设备之间的数据进行关联,消除同一用户在不同设备上的数据孤岛,以便于通过大数据分析用户的喜好,为用户推荐满足其喜好的内容。
本发明实施例提供的方法中,基于上述S102的内容,在确定与目标用户存在数据关联关系的应用设备之前,需要先采集目标应用软件的数据信息,以获得该目标应用软件对应的各个数据,具体的,采集所述目标应用软件对应的数据信息,可以包括:
调用预先设置的软件开发工具,检验各个所述应用设备是否开通所述目标应用软件对应的数据权限设置;
若各个所述应用设备已开通所述目标应用软件对应的数据权限设置,则通过所述软件开发工具采集每个所述应用设备中的所述目标应用软件对应的数据信息。
本发明实施例提供的数据处理方法中,在每个应用设备启用该目标应用软件时,需要向使用该目标应用软件的用户发送数据权限的相关消息,即在应用设备的显示界面上提示用户是否授予采集用户在使用过程中所产生的数据的相关信息。在需要获取各个应用设备的数据信息时,先通过软件开发工具检验应用设备是否开通数据权限设置,即原先在应用设备启用该目标应用软件的用户是否对采集数据信息的相关权限进行授权。若已经授权,则该应用应用设备会开通该目标应用软件对应的数据权限设置,此时可以再次通过软件开发工具进行数据信息的采集。
可以理解的是,数据权限是由用户进行授权的,用户可以选择是否允许其他的第三方设备或软件采其在目标应用软件上产生的相关数据信息。若授权则可以采集数据信息,若未授权则无法采集数据信息。
应用本发明实施例提供的方法,可以保证数据信息已被用户授权采集,保证所采集数据的合理和合法性。
本发明实施例提供的方法中,基于上述S103的内容,在数据打通模块中设置有数据打通条件,通过数据打通条件确定与目标用户存在数据关联关系的各个目标应用设备的过程如图2所示,具体可以包括:
S201:获取每个所述应用设备中记录的所述目标应用软件对应的至少一个用户标识码,所述用户标识码为其对应的用户在注册所述目标应用软件时,所述目标应用软件为该用户分配的唯一标识码;
在本发明实施例中,在用户通过应用设备登录目标应用软件时,该目标应用软件将记录当前登录的用户,并确定该用户对应的用户标识码,将用户标识码保存在用户当前所使用的应用设备中。对于同一个应用设备,可能存在多个历史用户登录过该目标应用软件的情况,因此需要获得每个应用设备中记录的所有登录过该目标应用软件的用户对应的用户标识码。
可以理解的是,用户在使用目标应用软件时,可以通过第三方账号注册并绑定目标应用软件,或通过用户手机号等个人信息注册并绑定目标应用软件,此时目标应用软件在用户进行注册时,将为用户分配一个用户的唯一标识码,当用户更换其他设备登陆该目标应用软件时,可以通过用户的账户确定该用户的唯一标识码,并对其进行记录,可以将已记录的唯一标识码与应用设备的设备did进行绑定。
S202:基于所述目标用户的用户信息,判断各个所述应用设备记录的各个用户标识码中,是否存在所述目标用户对应的用户标识码;
在本发明实施例中,该用户信息中包含该目标用户的唯一标识码,通过将唯一标识码与每个用户标识码进行比对,即可获知各个应用所记录的各个用户标识码中是否存在与该唯一标识码一致的用户标识码。
S203:若任一应用设备记录的各个用户标识码中,存在所述目标用户对应的用户标识码,则确定该应用设备与所述目标用户存在数据关联关系,并将所述应用设备设置为目标应用设备。
在本发明实施例中,若存在任意一个应用设备所记录的各个用户标识码中,与该目标用户的唯一标识码一致,则该应用设备为目标应用设备。
本发明实施例提供的数据处理方法中,在需要确定与用户存在数据关联关系的各个应用设备的过程中,通过每个应用设备中用户登录该目标应用软件时所记录的用户标识码,判断是否存在该目标用户的用户标识码。在各个应用设备中,若任意的应用设备记录有该目标用户的用户标识码,则记录有该目标用户的用户标识码的应用设备为目标应用设备,各个目标应用设备中存有该目标用户使用该目标应用软件的相关数据。
需要说明的是,该目标用户的用户标识码为uuid,每个应用设备都有单独对应的设备did,设备did包含应用过该目标应用软件的用户账户、手机号、uuid、设备的Mac/IMEI等信息。当用户通过某个设备登录应用软件时,将用户的uuid与设备did进行绑定。
应用本发明实施提供的方法,在用户通过应用设备登录目标应用软件时,将会记录用户的用户标识码,通过各个应用设备中所记录的用户标识码,确定用户与各个应用设备之间的关系,从而确定与用户存在数据关联关系的各个应用设备。
在上述步骤S201至S203的过程中,主要是基于用户标识码与各个应用设备之间的关联性确定与目标用户存在数据关联关系的各个应用设备,但是在用户使用用户账户登录目标应用设备的过程中,可能不是该用户账户本人对该账户进行操作,或者是用户所使用的应用设备数量过多的情况。若非本人操作的账户或者是过多的应用设备中存在某些与目标用户相关的数据为非必要数据,则为了保证需要关联的数据的可靠性以及真实性,在另一个实施例中,基于该数据打通模块中预先设定的数据打通条件,在各个应用设备中将与目标用户存在数据关联关系的各个应用设备确定为目标应用设备的具体过程如图3所示,具体可以包括:
S301:获取每个所述应用设备中记录的所述目标应用软件对应的至少一个用户标识码;
在本发明实施例中,步骤S301与上述实施例中的S201一致,此处将不复赘述。
S302:基于所述目标用户的用户信息,判断各个所述应用设备记录的各个用户标识码中,是否存在所述目标用户对应的用户标识码;
在本发明实施例中,步骤S302与上述实施例中的S202一致,此处将不复赘述。
S303:若任意的应用设备记录的各个用户标识码中,存在所述目标用户对应的用户标识码,则将存在所述目标用户对应的用户标识码的应用设备确定为第一应用设备;
在本发明实施例中,在确定各个存在该目标用户的用户标识码的应用设备后,将各个存在该目标用户的用户标识码的应用设备确定为第一应用设备。
S304:获取各个所述第一应用设备的设备信息,并确定所述数据打通设备中预先设置的各个逻辑规则;
在本发明实施例中,设备信息中包含其对应的应用设备的设备号、应用设备的网络IP、应用设备当前所属的路由器的路由器信息、应用设备中当前所安装的各个应用软件的APP列表、GPS信息、应用设备入网时的IMEI号以及用于可以标识或描述设备或用户行为的数据等信息。各个逻辑规则分别为网络IP规则、路由器规则、用户网络交互行为规则等。
其中,该网络IP规则是一个用户使用多台设备时,确定在预设时间段内一个用户标识码在同一个网络IP内对应多个设备did对应的应用设备的情况。路由器规则是每个路由器在入网时厂商为每个路由器分配一个MAC地址,在公共场所可能出现网络IP对应大批设备的did的情况,我们根据一个访问网络IP对应的不同路由器的MAC地址,将其划分为多个逻辑区域,确定每个逻辑区域内的各个设备。该用户网络交互行为规则是当没有网络IP或者路由器信息时或者用户没有登录应用软件的情况下,我们基于应用设备中的APP列表进行相似度的判断,或根据用户的网络交互行为等信息,结合用户位置信息,进行相似度判断分析。
S305:基于各个所述设备信息及各个所述逻辑规则,判断所述目标用户是否为各个所述第一应用设备中应用所述目标应用软件的真实用户;
在本发明实施例中,在基于上述S301至S303中确定各个用户标识码与各个第一应用设备的对应关系后,基于每个第一应用设备的设备信息及逻辑规则,判断该目标用户是不是应用该第一应用设备登录目标应用软件的真实用户,即判断在基于用户标识码与应用设备的设备did对应关系基础上,用户标识码与应用设备的设备did是否符合各个逻辑规则。
S306:若所述目标用户为任意的第一应用设备中应用所述目标应用软件的真实用户,则确定所述第一应用设备与所述目标用户存在数据关联关系,将所述第一应用设备设定为目标应用设备。
在本发明实施例中,在基于用户标识码与应用设备的设备did对应关系基础上,用户标识码与任一第一应用设备的设备did若符合任意一个逻辑规则,该目标用户则为该第一应用设备中应用该目标应用软件的真实用户,该第一应用设备则为目标应用设备。
具体的,对于网络IP规则,若目标用户使用多台应用设备时,在预设时间段内出现一个用户标识码对应多个did的情况,我们认为其不同的设备为同一真实用户操作。对于路由器规则,根据应用设备访问网络IP对应的不同路由器的MAC地址,将其划分为多个逻辑区域,在同一逻辑区域内,当出现同一个用户操作多个设备且该用户的用户标识码对应多个did的情况,则将该用户认定为真实用户。对于用户网络交互行为规则,当没有网络IP或者路由器信息时或者用户没有登录的情况下,基于各个应用设备APP列表进行相似度的判断,根据用户的网络交互行为等信息,结合用户位置信息,进行相似度判断分析,在相似度高于一定百分比阈值的情况下,认定同一真实的用户使用不同的设备。其中,网络交互行为指的是用户对应用设备的操作行为,例如用户对应用设备的基本功能的设置、应用各个APP操作习惯等。
本发明实施例提供的数据处理方法中,在需要确定与用户存在数据关联关系的各个应用设备的过程中,通过每个应用设备中用户登录该目标应用软件时所记录的用户标识码,判断是否存在该目标用户的用户标识码。在各个应用设备中,若任意的应用设备记录有该目标用户的用户标识码,则将记录有该目标用户的用户标识码的应用设备确定为第一应用设备。获取各个第一应用设备的设备信息,并确定预先设置的各个逻辑规则,基于每个第一应用设备设备的设备信息及各个逻辑规则,判断该目标用户与各个第一应用设备之间的真假关系,即判断目标用户是否为各个第一应用设备中应用所述目标应用软件的真实用户。若为真实用户,则对应的第一应用设备与目标用户存在真实的数据关联关系,需要将各个第一应用设备中确定该目标用户为真实应用该目标应用软件的真实用户的第一应用设备确定为目标应用设备。基于各个目标应用设备与目标用户之间的对应关系,可以在数据管理引擎中提取各个目标应用设备的数据信息,并从各个数据信息中提取该目标用户对应的各个数据进行数据关联。
可选的,在各个第一应用设备中,若存在任意一个第一应用设备与目标用户之间的数据关联关系并非真实的数据关联关系,则不会将该第一应用设备确定为目标应用设备,也无需提取与该第一应用设备相关的任何数据进行数据关联。
应用本发明实施例提供的方法,在基于用户标识码确定目标用户与各个应用设备之间的关系的基础上,在结合设备信息及各个逻辑规则,筛选出与目标用户存在真实的数据关联关系的应用设备,提高数据关联的真实性和可靠性。
在上述实施例S301至S306中,确定各个目标应用设备的过程是在原先步骤S201至S203的基础上再结合设备信息及各个逻辑规则确定真实可靠的各个目标应用设备。除此之外,在确定各个目标应用设备的过程中,可以在无需结合上述的S201至S203的过程,直接通过用户标识码确定目标用户与各个应用设备之间的关系的条件下,基于各个应用设备的设备信息及各个逻辑规则中的用户网络交互行为规则,将各个应用设备进行分组。基于每个应用设备的设备信息中的APP列表、用户行为数据、用户位置信息等,将相似的信息对应应用设备归属为同一个应用设备一组,通过目标用户在历史记录中APP列表信息、网络交互行为信息、用户位置信息等信息与每个应用设备中的设备信息比对,确定与该目标用户对应的应用设备组,则该应用设备组中的各个应用设备则为目标应用设备。
本发明实施例提供的方法中,在上述实施例S301至S306的过程中,先确定用户标识码与各个设备did的关系后,再结合设备信息及逻辑规则确定出各个目标应用设备。除此之外,在上述S301至S306的基础上,确定与目标用户存在数据关联关系的各个目标应用设备的过程,具体还可以包括:
当任意的第一应用设备与所述目标用户存在数据关联关系时,将与所述目标用户存在数据关联关系的各个第一应用设备确定为第二应用设备;
获取各个所述第二应用设备中所述目标用户对应的用户行为数据,并分别计算各个所述用户行为数据之间的相似度;
当至少两个用户行为数据之间的相似度大于预设阈值时,确定所述至少两个用户行为数据对应的各个第二应用设备为第三应用设备;
确定各个所述第三应用设备的当前位置,并基于每个所述第三应用设备的当前位置确定各个所述第三应用设备之间的相对位置;
若存在至少两个第三应用设备之间的相对位置在预设范围内,则将所述相对位置在预设范围内的各个第三应用设备设定为目标应用设备。
本发明实施例提供的数据处理方法中,为了提高数据关联的准确度,在确定各个与目标用户存在数据关联关系的第一应用设备后,将第一应用设备确定为第二应用设备,并获取各个第二应用设备中该目标用户对应的用户行为数据,该用户行为数据指的是用户在应用目标应用软件时对某些内容的偏好数据,例如在视频软件中对观看某个视频的偏好,或在音乐软件中对某个类型音乐的偏好等相关数据。在获取到各个第二应用设备中该目标用户对应的用户行为数据后,对各个用户行为数据分别进行相似度计算,具体计算过程可以是各个用户行为数据之间两两进行计算,若存在有至少两个用户行为数据之间的相似度大于预设的阈值时,将几个相似的用户行为数据对应的第二应用设备确定为第三应用设备,并根据各个第三应用设备当前位置,确定各个第三应用设备之间的相对距离,若有两个第三应用设备之间的相对距离在预设范围内,则可以将两个第三应用设备设定为目标应用设备,并将数据管理引擎中与两个应用设备对应的数据信息中与该目标用户对应的各个数据关联。
基于上述实施例提供的方案,本发明实施例提供的数据处理方法中,通过运行数据打通模块,并应用数据打通模块中的各个数据打通条件,确定与该目标用户存在数据关联关系的各个目标应用设备的具体过程为:
获取每个应用设备中记录的目标应用软件对应的至少一个用户标识码,该用户标识码是其对应的用户通过应用设备登录该目标软件时,基于该用户的对应的账户将其对应的用户标识码设备的did进行绑定。在各个应用设备的各个用户标识码中,若有一个应用设备的任意一个用户标识码为该目标用户的用户标识码,则将该应用设备确定为第一应用设备。在存在多个第一应用设备时,获取每个第一应用设备的设备信息,同时确定数据打通模块中当前设置的各个逻辑规则,以根据各个设备信息及各个逻辑规则,判断该目标用户是否为真实应用各个第一应用设备中的目标应用软件的真实用户,若该目标用户为任意一个第一应用设备对应的真实用户,则将该第一应用设备确定为第二应用设备。在存在多个第二应用设备时,计算各个第二应用设备对应的用户行为数据之间的相似度并确定各个第二应用设备之间的相对位置。当至少两个第二应用设备之间的用户行为相似度超出阈值,且相对位置在预设范围内,则相似度超出阈值且相对位置在预设范围内各个第二应用设备为目标应用设备。
应用本发明实施例提供的方法,可以进一步提高各个应用设备与用户之间的关联性,以保证在关联数据时,确定各个数据为该目标用户的真实数据。
进一步地,本发明实施例中,在需要进一步确定目标应用设备的过程中,需要获取各个第二应用设备中对应的用户行为数据,具体可以包括:
获取每个所述第二应用设备中在预设时间段内所述目标用户对应的历史操作内容;
将各个所述历史操作内容输入预先设置的识别模型,触发所述识别模型对各个所述历史操作内容进行数据结构化;
当所述识别模型输出每个所述历史操作模型对应的历史操作文件时,获取每个所述历史操作文件中所述目标用户对应的用户行为数据。
本发明实施例提供的数据处理方法中,为了提高与目标用户相关数据的连通率和联通的准确率,基于目标用户的操作内容构建识别模型,该模型主要通过将内容的进行结构化,在得到多个用户行为数据情况下,我们将一定时间段内的各个用户行为数据构建为一个历史操作文件,则用户在近期内的历史操作内容将形成至少一个历史操作而文件,可以从历史操作文件中获取该目标用户的用户行为数据。然后可以再结合各个第二应用设备之间的相对位置,将用户行为数据超过阈值且相对位置在预设范围内的两个第二应用设备确定为目标应用设备。
应用本发明实施例提供的方法,通过识别模型将内容转换成用户行为数据的方式,可以获得真实的用户行为数据。
可选的,在确定各个目标应用设备的过程中,除了可以在基于每个应用设备中的各个用户标识码确定与目标用户存在数据关联关系的各个第一应用设备后,可直接获取各个第一应用设备中的该目标用户的用户行为数据及各个第一应用设备的当前位置,并再对各个第一应用设备的用户行为数据进行相似度计算以及相对位置计算后,将用户行为数据相似度超出阈值且相对位置在预设范围内的至少两个第一应用设备确定为目标应用设备。
上述各个实施例的具体实施过程及其衍生方式,均在本发明的保护范围之内。
与图1所述的方法相对应,本发明实施例还提供了一种数据处理装置,用于对图1中方法的具体实现,本发明实施例提供的数据处理装置可以应用计算机终端或各种移动设备中,其结构示意图如图4所示,具体包括:
获取单元401,用于获取目标用户的用户信息,并确定各个设置有目标应用软件的应用设备;
采集单元402,用于采集每个所述应用设备中的所述目标应用软件对应的数据信息,并对各个所述数据信息中的各个数据进行数据清洗,将清洗后的各个所述数据信息存储至预先设置的数据管理引擎中;
确定单元403,用于运行预先设置的数据打通模块,并基于所述数据打通模块中预先设定的数据打通条件,在各个所述应用设备中将与所述目标用户存在数据关联关系的各个应用设备确定为目标应用设备;
关联单元404,用于基于所述目标用户的用户信息,提取所述数据管理引擎中各个所述目标应用设备对应的属于所述目标用户的各个数据,并将各个已提取的数据进行关联。
本发明实施例提供的数据处理装置中,在需要关联与目标用户相关联的各个数据时,获取该目标用户的用户信息,并先从各个设置有目标应用软件的应用设备中采集数据信息,对数据信息中的各个数据清洗后保存至数据管理引擎中。通过数据打通模块的数据打通条件,在各个应用设备中确定与该目标用户存在数据关联关系的目标应用设备,并基于目标用户的用户信息提取目标应用设备对应的属于该目标用户的各个数据,并关联各个已提取的数据。
应用本发明提供的装置,可以将各个设备之间的数据进行关联,消除同一用户在不同设备上的数据孤岛,以便于通过大数据分析用户的喜好,为用户推荐满足其喜好的内容。
本发明实施例提供的装置中,所述采集单元402,包括:
检验子单元,用于调用预先设置的软件开发工具,检验各个所述应用设备是否开通所述目标应用软件对应的数据权限设置;
采集子单元,用于若各个所述应用设备已开通所述目标应用软件对应的数据权限设置,则通过所述软件开发工具采集每个所述应用设备中的所述目标应用软件对应的数据信息。
本发明实施例提供的装置中,所述确定单元403,包括:
第一确定子单元,用于获取每个所述应用设备中记录的所述目标应用软件对应的至少一个用户标识码,所述用户标识码为其对应的用户在注册所述目标应用软件时,所述目标应用软件为该用户分配的唯一标识码;基于所述目标用户的用户信息,判断各个所述应用设备记录的各个用户标识码中,是否存在所述目标用户对应的用户标识码;若任一应用设备记录的各个用户标识码中,存在所述目标用户对应的用户标识码,则确定该应用设备与所述目标用户存在数据关联关系,并将所述应用设备设置为目标应用设备。
本发明实施例提供的装置中,所述确定单元403,包括:
第二确定子单元,用于获取每个所述应用设备中记录的所述目标应用软件对应的至少一个用户标识码;基于所述目标用户的用户信息,判断各个所述应用设备记录的各个用户标识码中,是否存在所述目标用户对应的用户标识码;若任意的应用设备记录的各个用户标识码中,存在所述目标用户对应的用户标识码,则将存在所述目标用户对应的用户标识码的应用设备确定为第一应用设备;获取各个所述第一应用设备的设备信息,并确定所述数据打通设备中预先设置的各个逻辑规则;基于各个所述设备信息及各个所述逻辑规则,判断所述目标用户是否为各个所述第一应用设备中应用所述目标应用软件的真实用户;若所述目标用户为任意的第一应用设备中应用所述目标应用软件的真实用户,则确定所述第一应用设备与所述目标用户存在数据关联关系,将所述第一应用设备设定为目标应用设备。
本发明实施例提供的装置中,还包括:
第三确定子单元,用于当任意的第一应用设备与所述目标用户存在数据关联关系时,将与所述目标用户存在数据关联关系的各个第一应用设备确定为第二应用设备;获取各个所述第二应用设备中所述目标用户对应的用户行为数据,并分别计算各个所述用户行为数据之间的相似度;当至少两个用户行为数据之间的相似度大于预设阈值时,确定所述至少两个用户行为数据对应的各个第二应用设备为第三应用设备;确定各个所述第三应用设备的当前位置,并基于每个所述第三应用设备的当前位置确定各个所述第三应用设备之间的相对位置;若存在至少两个第三应用设备之间的相对位置在预设范围内,则将所述相对位置在预设范围内的各个第三应用设备设定为目标应用设备。
本发明实施例提供的装置中,所述第三确定子单元中所述获取各个所述第二应用设备中所述目标用户对应的用户行为数据,包括:
获取每个所述第二应用设备中在预设时间段内所述目标用户对应的历史操作内容;将各个所述历史操作内容输入预先设置的识别模型,触发所述识别模型对各个所述历史操作内容进行数据结构化;当所述识别模型输出每个所述历史操作模型对应的历史操作文件时,获取每个所述历史操作文件中所述目标用户对应的用户行为数据。
以上本发明实施例公开的数据处理装置中各个单元及子单元的具体工作过程,可参见本发明上述实施例公开的数据处理方法中的对应内容,这里不再进行赘述。
本发明实施例还提供了一种存储介质,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行上述数据处理方法。
本发明实施例还提供了一种电子设备,其结构示意图如图5所示,具体包括存储器501,以及一个或者一个以上的指令502,其中一个或者一个以上指令502存储于存储器501中,且经配置以由一个或者一个以上处理器503执行所述一个或者一个以上指令502进行以下操作:
获取目标用户的用户信息,并确定各个设置有目标应用软件的应用设备;
采集每个所述应用设备中的所述目标应用软件对应的数据信息,并对各个所述数据信息中的各个数据进行数据清洗,将清洗后的各个所述数据信息存储至预先设置的数据管理引擎中;
运行预先设置的数据打通模块,并基于所述数据打通模块中预先设定的数据打通条件,在各个所述应用设备中将与所述目标用户存在数据关联关系的各个应用设备确定为目标应用设备;
基于所述目标用户的用户信息,提取所述数据管理引擎中各个所述目标应用设备对应的属于所述目标用户的各个数据,并将各个已提取的数据进行关联。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现。
为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种数据处理方法,其特征在于,包括:
获取目标用户的用户信息,并确定各个设置有目标应用软件的应用设备;
采集每个所述应用设备中的所述目标应用软件对应的数据信息,并对各个所述数据信息中的各个数据进行数据清洗,将清洗后的各个所述数据信息存储至预先设置的数据管理引擎中;
运行预先设置的数据打通模块,并基于所述数据打通模块中预先设定的数据打通条件,在各个所述应用设备中将与所述目标用户存在数据关联关系的各个应用设备确定为目标应用设备;
基于所述目标用户的用户信息,提取所述数据管理引擎中各个所述目标应用设备对应的属于所述目标用户的各个数据,并将各个已提取的数据进行关联。
2.根据权利要求1所述的方法,其特征在于,所述采集所述目标应用软件对应的数据信息,包括:
调用预先设置的软件开发工具,检验各个所述应用设备是否开通所述目标应用软件对应的数据权限设置;
若各个所述应用设备已开通所述目标应用软件对应的数据权限设置,则通过所述软件开发工具采集每个所述应用设备中的所述目标应用软件对应的数据信息。
3.根据权利要求1所述的方法,其特征在于,所述基于所述数据打通模块中预先设定的数据打通条件,在各个所述应用设备中,将与所述目标用户存在数据关联关系的各个应用设备确定为目标应用设备,包括:
获取每个所述应用设备中记录的所述目标应用软件对应的至少一个用户标识码,所述用户标识码为其对应的用户在注册所述目标应用软件时,所述目标应用软件为该用户分配的唯一标识码;
基于所述目标用户的用户信息,判断各个所述应用设备记录的各个用户标识码中,是否存在所述目标用户对应的用户标识码;
若任一应用设备记录的各个用户标识码中,存在所述目标用户对应的用户标识码,则确定该应用设备与所述目标用户存在数据关联关系,并将所述应用设备设置为目标应用设备。
4.根据权利要求1所述的方法,其特征在于,所述基于所述数据打通模块中预先设定的数据打通条件,在各个所述应用设备中,将与所述目标用户存在数据关联关系的各个应用设备确定为目标应用设备,包括:
获取每个所述应用设备中记录的所述目标应用软件对应的至少一个用户标识码;
基于所述目标用户的用户信息,判断各个所述应用设备记录的各个用户标识码中,是否存在所述目标用户对应的用户标识码;
若任意的应用设备记录的各个用户标识码中,存在所述目标用户对应的用户标识码,则将存在所述目标用户对应的用户标识码的应用设备确定为第一应用设备;
获取各个所述第一应用设备的设备信息,并确定所述数据打通设备中预先设置的各个逻辑规则;
基于各个所述设备信息及各个所述逻辑规则,判断所述目标用户是否为各个所述第一应用设备中应用所述目标应用软件的真实用户;
若所述目标用户为任意的第一应用设备中应用所述目标应用软件的真实用户,则确定所述第一应用设备与所述目标用户存在数据关联关系,将所述第一应用设备设定为目标应用设备。
5.根据权利要求4所述的方法,其特征在于,还包括:
当任意的第一应用设备与所述目标用户存在数据关联关系时,将与所述目标用户存在数据关联关系的各个第一应用设备确定为第二应用设备;
获取各个所述第二应用设备中所述目标用户对应的用户行为数据,并分别计算各个所述用户行为数据之间的相似度;
当至少两个用户行为数据之间的相似度大于预设阈值时,确定所述至少两个用户行为数据对应的各个第二应用设备为第三应用设备;
确定各个所述第三应用设备的当前位置,并基于每个所述第三应用设备的当前位置确定各个所述第三应用设备之间的相对位置;
若存在至少两个第三应用设备之间的相对位置在预设范围内,则将所述相对位置在预设范围内的各个第三应用设备设定为目标应用设备。
6.根据权利要求5所述的方法,其特征在于,所述获取各个所述第二应用设备中所述目标用户对应的用户行为数据,包括:
获取每个所述第二应用设备中在预设时间段内所述目标用户对应的历史操作内容;
将各个所述历史操作内容输入预先设置的识别模型,触发所述识别模型对各个所述历史操作内容进行数据结构化;
当所述识别模型输出每个所述历史操作模型对应的历史操作文件时,获取每个所述历史操作文件中所述目标用户对应的用户行为数据。
7.一种数据处理装置,其特征在于,包括:
获取单元,用于获取目标用户的用户信息,并确定各个设置有目标应用软件的应用设备;
采集单元,用于采集每个所述应用设备中的所述目标应用软件对应的数据信息,并对各个所述数据信息中的各个数据进行数据清洗,将清洗后的各个所述数据信息存储至预先设置的数据管理引擎中;
确定单元,用于运行预先设置的数据打通模块,并基于所述数据打通模块中预先设定的数据打通条件,在各个所述应用设备中将与所述目标用户存在数据关联关系的各个应用设备确定为目标应用设备;
关联单元,用于基于所述目标用户的用户信息,提取所述数据管理引擎中各个所述目标应用设备对应的属于所述目标用户的各个数据,并将各个已提取的数据进行关联。
8.根据权利要求7所述的装置,其特征在于,所述采集单元,包括:
检验子单元,用于调用预先设置的软件开发工具,检验各个所述应用设备是否开通所述目标应用软件对应的数据权限设置;
采集子单元,用于若各个所述应用设备已开通所述目标应用软件对应的数据权限设置,则通过所述软件开发工具采集每个所述应用设备中的所述目标应用软件对应的数据信息。
9.根据权利要求7所述的装置,其特征在于,所述确定单元,包括:
第一确定子单元,用于获取每个所述应用设备中记录的所述目标应用软件对应的至少一个用户标识码,所述用户标识码为其对应的用户在注册所述目标应用软件时,所述目标应用软件为该用户分配的唯一标识码;基于所述目标用户的用户信息,判断各个所述应用设备记录的各个用户标识码中,是否存在所述目标用户对应的用户标识码;若任一应用设备记录的各个用户标识码中,存在所述目标用户对应的用户标识码,则确定该应用设备与所述目标用户存在数据关联关系,并将所述应用设备设置为目标应用设备。
10.根据权利要求7所述的装置,其特征在于,所述确定单元,包括:
第二确定子单元,用于获取每个所述应用设备中记录的所述目标应用软件对应的至少一个用户标识码;基于所述目标用户的用户信息,判断各个所述应用设备记录的各个用户标识码中,是否存在所述目标用户对应的用户标识码;若任意的应用设备记录的各个用户标识码中,存在所述目标用户对应的用户标识码,则将存在所述目标用户对应的用户标识码的应用设备确定为第一应用设备;获取各个所述第一应用设备的设备信息,并确定所述数据打通设备中预先设置的各个逻辑规则;基于各个所述设备信息及各个所述逻辑规则,判断所述目标用户是否为各个所述第一应用设备中应用所述目标应用软件的真实用户;若所述目标用户为任意的第一应用设备中应用所述目标应用软件的真实用户,则确定所述第一应用设备与所述目标用户存在数据关联关系,将所述第一应用设备设定为目标应用设备。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010831980.5A CN111930995B (zh) | 2020-08-18 | 2020-08-18 | 数据处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010831980.5A CN111930995B (zh) | 2020-08-18 | 2020-08-18 | 数据处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111930995A true CN111930995A (zh) | 2020-11-13 |
CN111930995B CN111930995B (zh) | 2023-12-22 |
Family
ID=73305360
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010831980.5A Active CN111930995B (zh) | 2020-08-18 | 2020-08-18 | 数据处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111930995B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140122697A1 (en) * | 2012-11-01 | 2014-05-01 | Google Inc. | Providing content to linked devices associated with a user |
CN103873698A (zh) * | 2014-03-31 | 2014-06-18 | 宇龙计算机通信科技(深圳)有限公司 | 终端关联装置和终端关联方法 |
CN105871585A (zh) * | 2015-12-03 | 2016-08-17 | 乐视网信息技术(北京)股份有限公司 | 终端关联方法及装置 |
CN106202117A (zh) * | 2015-05-07 | 2016-12-07 | 深圳市腾讯计算机系统有限公司 | 数据处理方法、装置和服务器 |
CN106790523A (zh) * | 2016-12-20 | 2017-05-31 | 维沃移动通信有限公司 | 一种消息推送方法及服务器 |
CN108390788A (zh) * | 2018-03-05 | 2018-08-10 | 北京奇艺世纪科技有限公司 | 用户识别方法、装置及电子设备 |
CN110046196A (zh) * | 2019-04-16 | 2019-07-23 | 北京品友互动信息技术股份公司 | 标识关联方法及装置、电子设备 |
CN110248217A (zh) * | 2019-07-08 | 2019-09-17 | 中国联合网络通信集团有限公司 | 一种用户数据同步方法及装置 |
CN110555451A (zh) * | 2018-05-31 | 2019-12-10 | 北京京东尚科信息技术有限公司 | 信息识别方法和装置 |
CN110891097A (zh) * | 2019-12-04 | 2020-03-17 | 秒针信息技术有限公司 | 一种跨设备用户识别方法及装置 |
CN111241502A (zh) * | 2020-01-14 | 2020-06-05 | 恩亿科(北京)数据科技有限公司 | 跨设备的用户识别方法及装置、电子设备、存储介质 |
WO2020257991A1 (zh) * | 2019-06-24 | 2020-12-30 | 深圳市欢太科技有限公司 | 用户识别方法及相关产品 |
-
2020
- 2020-08-18 CN CN202010831980.5A patent/CN111930995B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140122697A1 (en) * | 2012-11-01 | 2014-05-01 | Google Inc. | Providing content to linked devices associated with a user |
CN103873698A (zh) * | 2014-03-31 | 2014-06-18 | 宇龙计算机通信科技(深圳)有限公司 | 终端关联装置和终端关联方法 |
CN106202117A (zh) * | 2015-05-07 | 2016-12-07 | 深圳市腾讯计算机系统有限公司 | 数据处理方法、装置和服务器 |
CN105871585A (zh) * | 2015-12-03 | 2016-08-17 | 乐视网信息技术(北京)股份有限公司 | 终端关联方法及装置 |
CN106790523A (zh) * | 2016-12-20 | 2017-05-31 | 维沃移动通信有限公司 | 一种消息推送方法及服务器 |
CN108390788A (zh) * | 2018-03-05 | 2018-08-10 | 北京奇艺世纪科技有限公司 | 用户识别方法、装置及电子设备 |
CN110555451A (zh) * | 2018-05-31 | 2019-12-10 | 北京京东尚科信息技术有限公司 | 信息识别方法和装置 |
CN110046196A (zh) * | 2019-04-16 | 2019-07-23 | 北京品友互动信息技术股份公司 | 标识关联方法及装置、电子设备 |
WO2020257991A1 (zh) * | 2019-06-24 | 2020-12-30 | 深圳市欢太科技有限公司 | 用户识别方法及相关产品 |
CN110248217A (zh) * | 2019-07-08 | 2019-09-17 | 中国联合网络通信集团有限公司 | 一种用户数据同步方法及装置 |
CN110891097A (zh) * | 2019-12-04 | 2020-03-17 | 秒针信息技术有限公司 | 一种跨设备用户识别方法及装置 |
CN111241502A (zh) * | 2020-01-14 | 2020-06-05 | 恩亿科(北京)数据科技有限公司 | 跨设备的用户识别方法及装置、电子设备、存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111930995B (zh) | 2023-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7144117B2 (ja) | モデルトレーニングシステムおよび方法および記憶媒体 | |
CN109687991B (zh) | 用户行为识别方法、装置、设备及存储介质 | |
EP2748781B1 (en) | Multi-factor identity fingerprinting with user behavior | |
EP3211825B1 (en) | Trusted terminal verification method and apparatus | |
CN113489713B (zh) | 网络攻击的检测方法、装置、设备及存储介质 | |
CN104836781A (zh) | 区分访问用户身份的方法及装置 | |
CN105122230A (zh) | 跟踪作为服务 | |
CN109657107B (zh) | 一种基于第三方应用的终端匹配方法和装置 | |
CN111625809B (zh) | 数据授权方法及装置、电子设备、存储介质 | |
CN110691085B (zh) | 登录方法、装置、密码管理系统及计算机可读介质 | |
CN112613067A (zh) | 用户行为数据采集方法、装置、计算机设备及存储介质 | |
CN112017007A (zh) | 用户行为数据的处理方法及装置、计算机设备、存储介质 | |
EP2320622A1 (en) | Report form normalization processing method, apparatus and system | |
CN112437034B (zh) | 虚假终端检测方法和装置、存储介质及电子装置 | |
CN105184559A (zh) | 一种支付系统及方法 | |
CN116383786B (zh) | 一种基于物联网的大数据信息监管系统及方法 | |
CN108777749A (zh) | 一种诈骗电话识别方法及装置 | |
CN111930995B (zh) | 数据处理方法及装置 | |
CN112817816B (zh) | 埋点处理方法、装置、计算机设备和存储介质 | |
WO2005122017A1 (en) | Method for determining validity of command and system thereof | |
US20070245029A1 (en) | Method for Determining Validity of Command and System Thereof | |
CN112364219A (zh) | 内容发布方法、装置、电子设备及存储介质 | |
CN111324796A (zh) | 基于区块链和sdn边缘计算网络系统的域名爬取方法及装置 | |
CN112100657A (zh) | 一种基于区块链的数据处理方法 | |
CN111339317A (zh) | 用户注册识别方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |