CN108764369B - 基于数据融合的人物识别方法、装置和计算机存储介质 - Google Patents
基于数据融合的人物识别方法、装置和计算机存储介质 Download PDFInfo
- Publication number
- CN108764369B CN108764369B CN201810583719.0A CN201810583719A CN108764369B CN 108764369 B CN108764369 B CN 108764369B CN 201810583719 A CN201810583719 A CN 201810583719A CN 108764369 B CN108764369 B CN 108764369B
- Authority
- CN
- China
- Prior art keywords
- data
- same user
- association
- time point
- acquisition time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/251—Fusion techniques of input or preprocessed data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于数据融合的人物识别方法,包括:获取多个用户的各类ID数据及对应的数据采集时间点和地点,将同一地点采集的ID数据按采集时间点从先到后排序,并按不同地点分别保存所述排序;获取预设的参数值,并根据所述参数值得到各个所述排序中同一个用户的ID关联对;根据所述ID关联对计算各类ID数据正确关联同一个用户的正确率;根据所述正确率确定人物识别参数值。本发明还公开了一种基于数据融合的人物识别装置和计算机存储介质,实现通过自学习模型训练得到人物识别参数值,并在获得同一地点的多个ID数据时,利用该人物识别参数值基于数据融合以确定所述多个ID数据是否属于同一个用户。
Description
技术领域
本发明涉及大数据处理领域,尤其涉及一种基于数据融合的人物识别方法、装置和计算机存储介质。
背景技术
信息融合是利用计算机技术将来自多个传感器或多源的观测信息进行分析、综合处理,从而得出决策和估计任务所需的信息的处理过程。另一种说法是信息融合就是数据融合,但其内涵更广泛、更确切、更合理,也更具有概括性,不仅包括数据,而且包括了信号和知识,由于习惯上的原因,很多文献仍使用数据融合。信息融合的基本原理是:充分利用传感器资源,通过对各种传感器及人工观测信息的合理支配与使用,将各种传感器在空间和时间上的互补与冗余信息依据某种优化准则或算法组合来产生对观测对象的一致性解释和描述。其目标是基于各传感器检测信息分解人工观测信息,通过对信息的优化组合来导出更多的有效信息。
现如今,信息融合技术还尚未应用在公安系统上,若公安系统有此应用,则可快速确定同一地点的多个身份信息是否属于同一个人。此外,还可以根据嫌疑犯在某个地点的某个信息快速提取其在该地点的其他多维电子虚拟身份信息,例如,已知某嫌疑犯的手机MAC地址且该手机MAC地址在A地点获取,则根据这两个信息可快速获取该嫌疑犯在A地点的其他身份信息。
发明内容
本发明的主要目的在于提供一种基于数据融合的人物识别方法、装置和计算机存储介质,旨在通过自学习模型训练得到参数以解决利用同一地点的多维身份数据融合实现人物识别的技术问题。
为实现上述目的,本发明提供一种基于数据融合的人物识别方法,所述基于数据融合的人物识别方法包括步骤:
获取多个用户的各类ID数据及对应的数据采集时间点和地点,将同一地点采集的ID数据按采集时间点从先到后排序,并按不同地点分别保存所述排序;
获取预设的参数值,并根据所述参数值得到各个所述排序中同一个用户的ID关联对;
根据所述ID关联对计算各类ID数据正确关联同一个用户的正确率;
根据所述正确率确定人物识别参数值,所述人物识别参数值用于在获得同一地点的多个ID数据时,基于数据融合以确定所述多个ID数据是否属于同一个用户。
优选地,所述ID包括身份证ID、人脸ID、手机IMSI或其他用户身份标识ID,各类ID数据分别由不同设备采集。
优选地,所述获取预设的参数值,并根据所述参数值得到各个所述排序中同一个用户的ID关联对的步骤包括:
在同一地点的所述排序中,获取第一采集时间点以及对应的ID数据,并依次判断与第一采集时间点对应的ID不同类的各ID数据的采集时间点是否在第一采集时间点的时间差范围内,其中,所述第一采集时间点的时间差范围由第一采集时间点和预设的参数值确定;
若存在与第一采集时间点对应的ID不同类的ID数据的采集时间点在第一采集时间点的时间差范围内,则将这些ID数据与第一采集时间点对应的ID数据关联以形成ID关联对;
依次类推,获取第N采集时间点以及对应的ID数据,并依次判断与第N采集时间点对应的ID不同类的各ID数据的采集时间点是否在第N采集时间点的时间差范围内,其中,所述第N采集时间点的时间差范围由第N采集时间点和预设的参数值确定,其中,所述第N采集时间点晚于第N-1采集时间点,N≥2;
若存在与第N采集时间点对应的ID不同类的ID数据的采集时间点在第N采集时间点的时间差范围内,则将这些ID数据与第N采集时间点对应的ID数据关联以形成ID关联对。
优选地,所述根据所述ID关联对计算各类ID数据正确关联同一个用户的正确率的步骤包括:
根据所述ID关联对分别判断任一类ID数据与不同类的ID数据这两个ID数据是否属于同一个用户;
在任一类ID数据与不同类的ID数据都属于同一个用户时,判定各类ID数据关联同一个用户;
将得到的各类ID数据关联同一个用户对应的结果与预存的各类ID数据关联同一个用户对应的结果比较,以得到各类ID数据正确关联同一个用户的次数;
根据所述次数与获取的用户数得到各类ID数据正确关联同一个用户的正确率。
优选地,所述根据所述ID关联对分别判断任一类ID数据与不同类的ID数据这两个ID数据是否属于同一个用户的步骤包括:
对所述ID关联对按照预设计数规则进行计数操作以得到任一类ID数据与不同类的ID数据这两个ID数据关联的次数以及各ID数据在所述ID关联对中出现的次数;
在任一类ID数据与不同类的ID数据这两个ID数据关联的次数大于或等于第一预设阈值,且任一类ID数据与不同类的ID数据这两个ID数据关联的次数与其中任一ID数据在所述ID关联对中出现的次数的比值大于第二预设阈值时,判定这两个ID数据属于同一个用户。
优选地,所述预设计数规则包括:
在所述ID关联对的ID数据的数量为2时,将这两个ID数据关联的次数记为1;
在所述ID关联对的ID数据的数量为大于2时,将其中每两个ID数据关联的次数记为1;
在相同两类ID数据的计数中,且有一个相同的ID数据时,选取其中计数最大的。
优选地,所述根据所述正确率确定人物识别参数值的步骤包括:
在所述正确率小于预设值时,更新所述参数值并返回执行所述获取预设的参数值,并根据所述参数值得到各个所述排序中同一个用户的ID关联对的步骤;
在所述正确率大于或等于预设值时,保存所述参数值,并将所述参数值作为所述人物识别参数值。
优选地,所述在所述正确率小于预设值时,更新所述参数值的步骤包括:
若存在两类ID数据没有对应的ID关联对,则增大所述参数值,降低所述第一预设阈值和第二预设阈值;
若每两类ID数据有对应的ID关联对,但存在错误的各类ID数据关联同一个用户,则减少所述参数值,所述第一预设阈值和第二预设阈值保持不变;
若存在两类ID数据没有对应的ID关联对和错误的各类ID数据关联同一个用户,则比较两者的错误次数,并按错误次数最多的进行处理。
此外,为实现上述目的,本发明还提供一种基于数据融合的人物识别装置,所述基于数据融合的人物识别装置包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如以上所述的基于数据融合的人物识别方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机存储介质,所述计算机存储介质上存储有基于数据融合的人物识别程序,所述基于数据融合的人物识别程序被所述处理器执行时实现如以上所述的基于数据融合的人物识别方法的步骤。
本发明提出的基于数据融合的人物识别方法、装置和计算机存储介质,通过获取多个用户的各类ID数据及对应的数据采集时间点和地点,将同一地点采集的ID数据按采集时间点从先到后排序,并按不同地点分别保存该排序,再获取预设的参数值,并根据该参数值得到各个排序中同一个用户的ID关联对,然后根据ID关联对计算各类ID数据正确关联同一个用户的正确率,最后根据该正确率确定人物识别参数值。实现通过自学习模型训练得到人物识别参数值,并在获得同一地点的多个ID数据时,利用该人物识别参数值基于数据融合以确定所述多个ID数据是否属于同一个用户。
附图说明
图1为本发明实施例方案涉及的硬件运行环境的终端结构示意图;
图2为本发明基于数据融合的人物识别方法第一实施例的流程示意图;
图3为图2中获取预设的参数值,并根据所述参数值得到各个所述排序中同一个用户的ID关联对的步骤的细化流程示意图;
图4为本发明基于数据融合的人物识别方法第二实施例的流程示意图;
图5为本发明基于数据融合的人物识别方法第三实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例的主要解决方案是:
获取多个用户的各类ID数据及对应的数据采集时间点和地点,将同一地点采集的ID数据按采集时间点从先到后排序,并按不同地点分别保存所述排序;
获取预设的参数值,并根据所述参数值得到各个所述排序中同一个用户的ID关联对;
根据所述ID关联对计算各类ID数据正确关联同一个用户的正确率;
根据所述正确率确定人物识别参数值,所述人物识别参数值用于在获得同一地点的多个ID数据时,基于数据融合以确定所述多个ID数据是否属于同一个用户。
由于现有技术中,没有将多维数据进行融合以确定用户身份的相关应用。
本发明提供一种解决方案,通过获取多个用户的各类ID数据及对应的数据采集时间点和地点,将同一地点采集的ID数据按采集时间点从先到后排序,并按不同地点分别保存该排序,再获取预设的参数值,并根据该参数值得到各个排序中同一个用户的ID关联对,然后根据ID关联对计算各类ID数据正确关联同一个用户的正确率,最后根据该正确率确定人物识别参数值。实现通过自学习模型训练得到人物识别参数值,并在获得同一地点的多个ID数据时,利用该人物识别参数值基于数据融合以确定所述多个ID数据是否属于同一个用户。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的终端结构示意图。
本发明实施例终端是PC或服务器。
如图1所示,该终端可以包括:处理器1001,例如CPU,网络接口1004、用户接口1003、存储器1005和通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于数据融合的人物识别程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的基于数据融合的人物识别程序,并执行以下操作:
获取多个用户的各类ID数据及对应的数据采集时间点和地点,将同一地点采集的ID数据按采集时间点从先到后排序,并按不同地点分别保存所述排序;
获取预设的参数值,并根据所述参数值得到各个所述排序中同一个用户的ID关联对;
根据所述ID关联对计算各类ID数据正确关联同一个用户的正确率;
根据所述正确率确定人物识别参数值,所述人物识别参数值用于在获得同一地点的多个ID数据时,基于数据融合以确定所述多个ID数据是否属于同一个用户。
进一步地,处理器1001可以调用存储器1005中存储的基于数据融合的人物识别程序,还执行以下操作:
所述ID包括身份证ID、人脸ID、手机IMSI或其他用户身份标识ID,各类ID数据分别由不同设备采集。
进一步地,处理器1001可以调用存储器1005中存储的基于数据融合的人物识别程序,还执行以下操作:
在同一地点的所述排序中,获取第一采集时间点以及对应的ID数据,并依次判断与第一采集时间点对应的ID不同类的各ID数据的采集时间点是否在第一采集时间点的时间差范围内,其中,所述第一采集时间点的时间差范围由第一采集时间点和预设的参数值确定;
若存在与第一采集时间点对应的ID不同类的ID数据的采集时间点在第一采集时间点的时间差范围内,则将这些ID数据与第一采集时间点对应的ID数据关联以形成ID关联对;
依次类推,获取第N采集时间点以及对应的ID数据,并依次判断与第N采集时间点对应的ID不同类的各ID数据的采集时间点是否在第N采集时间点的时间差范围内,其中,所述第N采集时间点的时间差范围由第N采集时间点和预设的参数值确定,其中,所述第N采集时间点晚于第N-1采集时间点,N≥2;
若存在与第N采集时间点对应的ID不同类的ID数据的采集时间点在第N采集时间点的时间差范围内,则将这些ID数据与第N采集时间点对应的ID数据关联以形成ID关联对。
进一步地,处理器1001可以调用存储器1005中存储的基于数据融合的人物识别程序,还执行以下操作:
根据所述ID关联对分别判断任一类ID数据与不同类的ID数据这两个ID数据是否属于同一个用户;
在任一类ID数据与不同类的ID数据都属于同一个用户时,判定各类ID数据关联同一个用户;
将得到的各类ID数据关联同一个用户对应的结果与预存的各类ID数据关联同一个用户对应的结果比较,以得到各类ID数据正确关联同一个用户的次数;
根据所述次数与获取的用户数得到各类ID数据正确关联同一个用户的正确率。
进一步地,处理器1001可以调用存储器1005中存储的基于数据融合的人物识别程序,还执行以下操作:
对所述ID关联对按照预设计数规则进行计数操作以得到任一类ID数据与不同类的ID数据这两个ID数据关联的次数以及各ID数据在所述ID关联对中出现的次数;
在任一类ID数据与不同类的ID数据这两个ID数据关联的次数大于或等于第一预设阈值,且任一类ID数据与不同类的ID数据这两个ID数据关联的次数与其中任一ID数据在所述ID关联对中出现的次数的比值大于第二预设阈值时,判定这两个ID数据属于同一个用户。
进一步地,处理器1001可以调用存储器1005中存储的基于数据融合的人物识别程序,还执行以下操作:
在所述ID关联对的ID数据的数量为2时,将这两个ID数据关联的次数记为1;
在所述ID关联对的ID数据的数量为大于2时,将其中每两个ID数据关联的次数记为1;
在相同两类ID数据的计数中,且有一个相同的ID数据时,选取其中计数最大的。
进一步地,处理器1001可以调用存储器1005中存储的基于数据融合的人物识别程序,还执行以下操作:
在所述正确率小于预设值时,更新所述参数值并返回执行所述获取预设的参数值,并根据所述参数值得到各个所述排序中同一个用户的ID关联对的步骤;
在所述正确率大于或等于预设值时,保存所述参数值,并将所述参数值作为所述人物识别参数值。
进一步地,处理器1001可以调用存储器1005中存储的基于数据融合的人物识别程序,还执行以下操作:
若存在两类ID数据没有对应的ID关联对,则增大所述参数值,降低所述第一预设阈值和第二预设阈值;
若每两类ID数据有对应的ID关联对,但存在错误的各类ID数据关联同一个用户,则减少所述参数值,所述第一预设阈值和第二预设阈值保持不变;
若存在两类ID数据没有对应的ID关联对和错误的各类ID数据关联同一个用户,则比较两者的错误次数,并按错误次数最多的进行处理。
参照图2,图2为本发明基于数据融合的人物识别方法第一实施例的流程示意图;
本实施例提出一种基于数据融合的人物识别方法,该基于数据融合的人物识别方法包括步骤:
步骤S10,获取多个用户的各类ID数据及对应的数据采集时间点和地点,将同一地点采集的ID数据按采集时间点从先到后排序,并按不同地点分别保存所述排序;
本实施例中,首先获取多个用户的各类ID数据及对应的数据采集时间点和地点,其中,所述ID包括身份证ID、人脸ID、手机IMSI或其他用户身份标识ID,各类ID数据分别由不同设备采集。在得到多组包含ID数据、时间和地点的数据集合后,将该数据集合中同一地点采集的ID数据按采集时间点的先后顺序依次从先到后排序,最后,按不同地点分别保存各个地点对应的按采集时间点的先后顺序排好序的数据。可以理解为,若有10个不同的采集地点,则有10组数据集合对应的数组,每个数组里,数据采集时间点最早的ID数据排在首位,数据采集时间点最晚的ID数据排在末位。
步骤S20,获取预设的参数值,并根据所述参数值得到各个所述排序中同一个用户的ID关联对;
进一步地,参照图3,图3为图2中步骤S20的进一步细化流程示意图;
步骤S21,在同一地点的所述排序中,获取第一采集时间点以及对应的ID数据,并依次判断与第一采集时间点对应的ID不同类的各ID数据的采集时间点是否在第一采集时间点的时间差范围内,其中,所述第一采集时间点的时间差范围由第一采集时间点和预设的参数值确定;
步骤S22,若存在与第一采集时间点对应的ID不同类的ID数据的采集时间点在第一采集时间点的时间差范围内,则将这些ID数据与第一采集时间点对应的ID数据关联以形成ID关联对;
步骤S23,依次类推,获取第N采集时间点以及对应的ID数据,并依次判断与第N采集时间点对应的ID不同类的各ID数据的采集时间点是否在第N采集时间点的时间差范围内,其中,所述第N采集时间点的时间差范围由第N采集时间点和预设的参数值确定,其中,所述第N采集时间点晚于第N-1采集时间点,N≥2;
步骤S24,若存在与第N采集时间点对应的ID不同类的ID数据的采集时间点在第N采集时间点的时间差范围内,则将这些ID数据与第N采集时间点对应的ID数据关联以形成ID关联对。
本实施例中,以3个不同采集地点对应的按数据采集时间点先后顺序排序的各ID数据为例进行说明,假设这3个不同采集地点分别为A、B和C,用t1、t2...tn通用的来表示各个地点的数据采集时间点,其中,t1为最早的数据采集时间点,tn为最晚的数据采集时间点。用gap来表示预设的参数值,选取A地点对应的数据集合,为了便于理解,可将A地点对应的数据集合当成A数组,若A数组里首位ID数据为a,依次为b,末位ID数据为z,则依次判断b~z中与a不同类的ID数据的采集时间点是否在t1~t1+gap内,若存在与a不同类的ID数据的采集时间点在t1~t1+gap内,则将这些ID数据与a关联以形成ID关联对,具体的,若只有c与a关联,则ID关联对记为(a,c),若有e、f、g与a关联,则ID关联对记为(a,e,f,g)。在对a判断完毕得到对应的ID关联对之后,对b进行判断,具体为依次判断a~z中与b不同类的ID数据的采集时间点是否在t2~t2+gap或t2-gap~t2内,若存在与b不同类的ID数据的采集时间点在t2~t2+gap或t2-gap~t2内,则将这些ID数据与b关联以形成ID关联对。依次类推,A数组里的其他ID数据也用这种方法进行判断,直至到末位ID数据z。可以理解的是,首位ID数据和末位ID数据对应的数据采集时间点的时间差范围只有1个,分别为t1~t1+gap和tn-gap~tn,其他位于A数组里中间位置的ID数据对应的数据采集时间点的时间差范围有2个,例如b对应的数据采集时间点的时间差范围为t2~t2+gap或t2-gap~t2。此处ID关联对表示关联的这些ID数据有可能为同一个用户的,同时也是用于后续判断两个不同类的ID数据是否为同一个用户的基础数据。同理,对B和C对应的数据集合进行相同方式的处理,以得到ID关联对。
步骤S30,根据所述ID关联对计算各类ID数据正确关联同一个用户的正确率;
假设有5类ID数据,本实施例中,通过步骤S20得到的所有ID关联对分别计算任一类ID数据与其他4类ID数据是否关联同一个用户,若存在任一类ID数据与其他4类ID数据都关联同一个用户,则认为这5类ID数据关联同一个人,此时,将得到的这5类ID数据关联同一个人的结果与预设的真实结果比对,即可得到本实施例中各类ID数据正确关联同一个用户的正确率。具体计算过程参照本发明中第二实施例,在此暂不做详细描述。
步骤S40,根据所述正确率确定人物识别参数值,所述人物识别参数值用于在获得同一地点的多个ID数据时,基于数据融合以确定所述多个ID数据是否属于同一个用户。
由于本发明是利用自学习模型训练的方式根据预设的参数值确定自学习模型的正确率,在各类ID数据正确关联同一个用户的正确率达到预设标准时,本次自学习模型训练完成,故可通过调整参数值使正确率达到预设标准,从而将正确率达到预设标准时对应的参数值作为人物识别参数值,用于在获得同一地点的多个ID数据时,基于数据融合以确定所述多个ID数据是否属于同一个用户。具体实施方式参照本发明中第三实施例,在此暂不做详细描述。
本实施例提出的基于数据融合的人物识别方法,获取多个用户的各类ID数据及对应的数据采集时间点和地点,将同一地点采集的ID数据按采集时间点从先到后排序,并按不同地点分别保存该排序,再获取预设的参数值,并根据该参数值得到各个排序中同一个用户的ID关联对,然后根据ID关联对计算各类ID数据正确关联同一个用户的正确率,最后根据该正确率确定人物识别参数值。实现通过自学习模型训练得到人物识别参数值,并在获得同一地点的多个ID数据时,利用该人物识别参数值基于数据融合以确定所述多个ID数据是否属于同一个用户。
进一步地,参照图4,基于第一实施例提出本发明基于数据融合的人物识别方法第二实施例,在本实施例中,所述步骤S30包括:
步骤S31,对所述ID关联对按照预设计数规则进行计数操作以得到任一类ID数据与不同类的ID数据这两个ID数据关联的次数以及各ID数据在所述ID关联对中出现的次数;
本实施例中,以5类ID数据为例进行说明,假如5类ID分别为s(深圳通卡号)、m(手机MAC地址)、i(身份证)、f(人脸)和im(手机IMSI),以s1s2...sn表示不同的s类ID数据,依次类推,其他类ID数据也用此法表示。此处所述的预设计数规则为:在ID关联对的ID数据的数量为2时,将这两个ID数据关联的次数记为1;在ID关联对的ID数据的数量为大于2时,将其中每两个ID数据关联的次数记为1;在相同两类ID数据的计数中,且有一个相同的ID数据时,选取其中计数最大的。该预设计数规则举例说明如下:若ID关联对为(s1,m1),则s1和m1关联的次数count(s1,m1)记为1,若ID关联对为(s2,i2,f2),则count(s2,i2)、count(s2,f2)和count(i2,f2)各记为1,其他以此类推。此外,若存在类似count(s1,i1)和count(s1,i2)这样的计数对,选取两者中计数最大的。按照上述方法对得到的所有ID关联对进行计算,可得到每两个不同类ID数据的总计数。
步骤S32,在任一类ID数据与不同类的ID数据这两个ID数据关联的次数大于或等于第一预设阈值,且任一类ID数据与不同类的ID数据这两个ID数据关联的次数与其中任一ID数据在所述ID关联对中出现的次数的比值大于第二预设阈值时,判定这两个ID数据属于同一个用户;
以s1和m1为例进行说明,可根据步骤S31得到的结果,判断s1和m1是否属于同一个用户。具体的,判定s1和m1属于同一个用户,需要满足以下条件:count(s1,m1)≥n1、count(s1,m1)/count(s1)>n2、count(s1,m1)/count(m1)>n3。此处n1表示第一预设阈值,n2或n3表示第二预设阈值。需要说明的是,通过对所有ID关联对统计并计数,可得出任一ID数据在ID关联对中出现的次数。
步骤S33,在任一类ID数据与不同类的ID数据都属于同一个用户时,判定各类ID数据关联同一个用户;
类似的,采用步骤S32的方法,判断s1和f1,s1和i1,s1和im1是否属于同一个用户,当s1和f1,s1和i1,s1和im1都属于同一个用户时,判定s1、m1、f1、i1和im1关联同一个用户,可以理解为,根据预设的参数值通过自学习模型训练的方式得出各类ID数据关联同一个用户的结果。需要说明的是,该结果有可能出现各类ID数据没有全部关联上的情况,比如,得到s1、m1、f1和im1关联同一个用户,i类ID数据没有跟其他4类ID数据关联上。
步骤S34,将得到的各类ID数据关联同一个用户对应的结果与预存的各类ID数据关联同一个用户对应的结果比较,以得到各类ID数据正确关联同一个用户的次数;
步骤S35,根据所述次数与获取的用户数得到各类ID数据正确关联同一个用户的正确率。
选取各类ID数据关联同一个用户对应的结果,将该结果与预存的各类ID数据关联同一个用户对应的结果比较,此处预存的结果对应用户真实数据,以此作为标准,判断出通过自学习模型训练的方式得到的结果中正确的结果有多少个,再获取此次自学习模型训练采样的用户数,也就是采集了多少个用户的数据,最后求这两个值的比值,即可得到各类ID数据正确关联同一个用户的正确率。
本实施例公开的技术方案中,讲述了如何根据ID关联对计算各类ID数据正确关联同一个用户的正确率,该方法对数据做了科学精密的处理,以使得到的正确率误差极小,同时也为后续根据正确率确定人物识别参数提供了保障。
进一步地,参照图5,基于第一至第二实施例任一实施例提出本发明基于数据融合的人物识别方法第三实施例,在本实施例中,所述步骤S40包括:
步骤S41,判断所述正确率是否小于预设值;
步骤S42,在所述正确率小于预设值时,若存在两类ID数据没有对应的ID关联对,则增大所述参数值,降低所述第一预设阈值和第二预设阈值;
步骤S43,若每两类ID数据有对应的ID关联对,但存在错误的各类ID数据关联同一个用户,则减少所述参数值,所述第一预设阈值和第二预设阈值保持不变;
步骤S44,若存在两类ID数据没有对应的ID关联对和错误的各类ID数据关联同一个用户,则比较两者的错误次数,并按错误次数最多的进行处理;
步骤S45,保存更新后的所述参数值、第一预设阈值和第二预设阈值并返回执行所述获取预设的参数值,并根据所述参数值得到各个所述排序中同一个用户的ID关联对的步骤;
步骤S46,在所述正确率大于或等于预设值时,保存所述参数值,并将所述参数值作为所述人物识别参数值。
本实施例中,在得到各类ID数据正确关联同一个用户的正确率时,将该正确率与预设值比较,此处预设值可为百分数,例如80%,也可为表示概率大小的其他度量数值,在此不做具体限定。在正确率大于或等于预设值时,保存参数值,并将该参数值作为人物识别参数值,此时,可理解为预设的参数值可以作为人物识别参数值。在正确率小于预设值时,根据自学习模型训练得到的结果对预设的参数值,第一预设阈值和第二预设阈值做出不同的更新。具体为,若存在两类ID数据没有对应的ID关联对,以5类ID数据为例,可以理解为得到的结果中存在5类ID数据没有全部关联上的情况,此时,增大参数值,降低第一预设阈值和第二预设阈值;若每两类ID数据有对应的ID关联对,但存在错误的各类ID数据关联同一个用户,可以理解为,得到的结果中各类ID数据都关联同一个用户,但是与真实数据比较,存在错误关联的情况,此时,减少参数值,所述第一预设阈值和第二预设阈值保持不变;另外,若存在两类ID数据没有对应的ID关联对和错误的各类ID数据关联同一个用户,即得到的结果中前面两种情况都有,此时,比较两种情况对应的错误次数,并按错误次数最多的来选择处理方式。
本实施例公开的技术方案中,先通过正确率和预设值比较,再进一步在正确率小于预设值时,根据自学习模型训练得到的不同结果对预设的参数值、第一预设阈值和第二预设阈值做不同的更新,以快速完成自学习模型训练,从而使正确率大于等于预设值,得到准确的人物识别参数。
此外,本发明实施例还提出一种基于数据融合的人物识别装置,所述基于数据融合的人物识别装置包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上实施例所述的基于数据融合的人物识别方法的步骤。
此外,本发明实施例还提出一种计算机存储介质,所述计算机存储介质上存储有基于数据融合的人物识别程序,所述基于数据融合的人物识别程序被所述处理器执行时实现如上实施例所述的基于数据融合的人物识别方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,云端服务器,空调器,或者网络设备等)执行本发明各个实施例的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (8)
1.一种基于数据融合的人物识别方法,其特征在于,所述基于数据融合的人物识别方法包括步骤:
获取多个用户的各类ID数据及对应的数据采集时间点和地点,将同一地点采集的ID数据按采集时间点从先到后排序,并按不同地点分别保存所述排序;
获取预设的参数值,并根据所述参数值得到各个所述排序中同一个用户的ID关联对;
根据所述ID关联对计算各类ID数据正确关联同一个用户的正确率;
根据所述正确率确定人物识别参数值,所述人物识别参数值用于在获得同一地点的多个ID数据时,基于数据融合以确定所述多个ID数据是否属于同一个用户;
所述根据所述ID关联对计算各类ID数据正确关联同一个用户的正确率的步骤还包括:
对所述ID关联对按照预设计数规则进行计数操作以得到任一类ID数据与不同类的ID数据这两个ID数据关联的次数以及各ID数据在所述ID关联对中出现的次数;
在任一类ID数据与不同类的ID数据这两个ID数据关联的次数大于或等于第一预设阈值,且任一类ID数据与不同类的ID数据这两个ID数据关联的次数与其中任一ID数据在所述ID关联对中出现的次数的比值大于第二预设阈值时,判定这两个ID数据属于同一个用户;
所述根据所述正确率确定人物识别参数值的步骤包括:
在所述正确率小于预设值时,更新所述参数值并返回执行所述获取预设的参数值,并根据所述参数值得到各个所述排序中同一个用户的ID关联对的步骤;
所述在所述正确率小于预设值时,更新所述参数值的步骤包括:
若存在两类ID数据没有对应的ID关联对,则增大所述参数值,降低所述第一预设阈值和所述第二预设阈值;
若每两类ID数据有对应的ID关联对,但存在错误的各类ID数据关联同一个用户,则减小所述参数值,所述第一预设阈值和所述第二预设阈值保持不变;
若存在两类ID数据没有对应的ID关联对和错误的各类ID数据关联同一个用户,则比较两者的错误次数,并按错误次数最多的进行处理。
2.如权利要求1所述的基于数据融合的人物识别方法,其特征在于,所述ID包括身份证ID、人脸ID、手机IMSI,各类ID数据分别由不同设备采集。
3.如权利要求1所述的基于数据融合的人物识别方法,其特征在于,所述获取预设的参数值,并根据所述参数值得到各个所述排序中同一个用户的ID关联对的步骤包括:
在同一地点的所述排序中,获取第一采集时间点以及对应的ID数据,并依次判断与第一采集时间点对应的ID不同类的各ID数据的采集时间点是否在第一采集时间点的时间差范围内,其中,所述第一采集时间点的时间差范围由第一采集时间点和预设的参数值确定;
若存在与第一采集时间点对应的ID不同类的ID数据的采集时间点在第一采集时间点的时间差范围内,则将这些ID数据与第一采集时间点对应的ID数据关联以形成ID关联对;
依次类推,获取第N采集时间点以及对应的ID数据,并依次判断与第N采集时间点对应的ID不同类的各ID数据的采集时间点是否在第N采集时间点的时间差范围内,其中,所述第N采集时间点的时间差范围由第N采集时间点和预设的参数值确定,其中,所述第N采集时间点晚于第N-1采集时间点,N≥2;
若存在与第N采集时间点对应的ID不同类的ID数据的采集时间点在第N采集时间点的时间差范围内,则将这些ID数据与第N采集时间点对应的ID数据关联以形成ID关联对。
4.如权利要求1所述的基于数据融合的人物识别方法,其特征在于,所述根据所述ID关联对计算各类ID数据正确关联同一个用户的正确率的步骤包括:
根据所述ID关联对分别判断任一类ID数据与不同类的ID数据这两个ID数据是否属于同一个用户;
在任一类ID数据与不同类的ID数据都属于同一个用户时,判定各类ID数据关联同一个用户;
将得到的各类ID数据关联同一个用户对应的结果与预存的各类ID数据关联同一个用户对应的结果比较,以得到各类ID数据正确关联同一个用户的次数;
根据所述次数与获取的用户数得到各类ID数据正确关联同一个用户的正确率。
5.如权利要求1所述的基于数据融合的人物识别方法,其特征在于,所述预设计数规则包括:
在所述ID关联对的ID数据的数量为2时,将这两个ID数据关联的次数记为1;
在所述ID关联对的ID数据的数量为大于2时,将其中每两个ID数据关联的次数记为1;
在相同两类ID数据的计数中,且有一个相同的ID数据时,选取其中计数最大的。
6.如权利要求1-5任一项所述的基于数据融合的人物识别方法,其特征在于,所述根据所述正确率确定人物识别参数值的步骤包括:
在所述正确率大于或等于预设值时,保存所述参数值,并将所述参数值作为所述人物识别参数值。
7.一种基于数据融合的人物识别装置,其特征在于,所述基于数据融合的人物识别装置包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1-6 中任一项所述的基于数据融合的人物识别方法的步骤。
8.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有基于数据融合的人物识别程序,所述基于数据融合的人物识别程序被处理器执行时实现如权利要求1-6 中任一项所述的基于数据融合的人物识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810583719.0A CN108764369B (zh) | 2018-06-07 | 2018-06-07 | 基于数据融合的人物识别方法、装置和计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810583719.0A CN108764369B (zh) | 2018-06-07 | 2018-06-07 | 基于数据融合的人物识别方法、装置和计算机存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108764369A CN108764369A (zh) | 2018-11-06 |
CN108764369B true CN108764369B (zh) | 2021-10-22 |
Family
ID=63999452
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810583719.0A Active CN108764369B (zh) | 2018-06-07 | 2018-06-07 | 基于数据融合的人物识别方法、装置和计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108764369B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110674125B (zh) * | 2019-09-24 | 2022-05-17 | 北京明略软件系统有限公司 | 一种待融合数据的过滤方法、过滤装置及可读存储介质 |
CN110874369A (zh) * | 2019-10-25 | 2020-03-10 | 广州纳斯威尔信息技术有限公司 | 一种多维数据融合侦查系统及其方法 |
CN111640477A (zh) * | 2020-05-29 | 2020-09-08 | 京东方科技集团股份有限公司 | 身份信息的统一方法、装置以及电子设备 |
CN112085323A (zh) * | 2020-07-30 | 2020-12-15 | 北京明略软件系统有限公司 | 基于活跃度指标的关联可信度评估方法和装置 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105160514A (zh) * | 2015-07-10 | 2015-12-16 | 辽宁成远爆破工程有限公司 | 治安综合管理系统和治安综合管理的方法 |
CN105303167A (zh) * | 2008-01-23 | 2016-02-03 | 加州大学评议会 | 用于行为监测及校正的系统和方法 |
CN105631043A (zh) * | 2016-01-26 | 2016-06-01 | 公安部第一研究所 | 一种视频处理方法及装置 |
CN106548164A (zh) * | 2016-11-28 | 2017-03-29 | 中通服公众信息产业股份有限公司 | 人脸图像与移动设备的关联性识别方法 |
CN106610997A (zh) * | 2015-10-23 | 2017-05-03 | 杭州海康威视数字技术股份有限公司 | 人物信息处理方法、装置及系统 |
CN106709482A (zh) * | 2017-03-17 | 2017-05-24 | 中国人民解放军国防科学技术大学 | 基于自编码器的人物亲缘关系识别方法 |
CN106874347A (zh) * | 2016-12-26 | 2017-06-20 | 深圳市深网视界科技有限公司 | 一种匹配人体特征与mac地址的方法及系统 |
CN106899827A (zh) * | 2015-12-17 | 2017-06-27 | 杭州海康威视数字技术股份有限公司 | 图像数据采集、查询、视频监控方法、设备及系统 |
CN107404408A (zh) * | 2017-08-30 | 2017-11-28 | 北京邮电大学 | 一种虚拟身份关联识别方法及装置 |
CN107480624A (zh) * | 2017-08-08 | 2017-12-15 | 深圳云天励飞技术有限公司 | 常住人口获取方法、装置及系统、计算机装置和存储介质 |
CN107590439A (zh) * | 2017-08-18 | 2018-01-16 | 湖南文理学院 | 基于监控视频的目标人物识别追踪方法和装置 |
CN107766940A (zh) * | 2017-11-20 | 2018-03-06 | 北京百度网讯科技有限公司 | 用于生成模型的方法和装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8184154B2 (en) * | 2006-02-27 | 2012-05-22 | Texas Instruments Incorporated | Video surveillance correlating detected moving objects and RF signals |
AU2010259032B2 (en) * | 2009-06-08 | 2014-03-20 | Research Now Limited | Systems for applying quantitative marketing research principles to qualitative internet data |
-
2018
- 2018-06-07 CN CN201810583719.0A patent/CN108764369B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105303167A (zh) * | 2008-01-23 | 2016-02-03 | 加州大学评议会 | 用于行为监测及校正的系统和方法 |
CN105160514A (zh) * | 2015-07-10 | 2015-12-16 | 辽宁成远爆破工程有限公司 | 治安综合管理系统和治安综合管理的方法 |
CN106610997A (zh) * | 2015-10-23 | 2017-05-03 | 杭州海康威视数字技术股份有限公司 | 人物信息处理方法、装置及系统 |
CN106899827A (zh) * | 2015-12-17 | 2017-06-27 | 杭州海康威视数字技术股份有限公司 | 图像数据采集、查询、视频监控方法、设备及系统 |
CN105631043A (zh) * | 2016-01-26 | 2016-06-01 | 公安部第一研究所 | 一种视频处理方法及装置 |
CN106548164A (zh) * | 2016-11-28 | 2017-03-29 | 中通服公众信息产业股份有限公司 | 人脸图像与移动设备的关联性识别方法 |
CN106874347A (zh) * | 2016-12-26 | 2017-06-20 | 深圳市深网视界科技有限公司 | 一种匹配人体特征与mac地址的方法及系统 |
CN106709482A (zh) * | 2017-03-17 | 2017-05-24 | 中国人民解放军国防科学技术大学 | 基于自编码器的人物亲缘关系识别方法 |
CN107480624A (zh) * | 2017-08-08 | 2017-12-15 | 深圳云天励飞技术有限公司 | 常住人口获取方法、装置及系统、计算机装置和存储介质 |
CN107590439A (zh) * | 2017-08-18 | 2018-01-16 | 湖南文理学院 | 基于监控视频的目标人物识别追踪方法和装置 |
CN107404408A (zh) * | 2017-08-30 | 2017-11-28 | 北京邮电大学 | 一种虚拟身份关联识别方法及装置 |
CN107766940A (zh) * | 2017-11-20 | 2018-03-06 | 北京百度网讯科技有限公司 | 用于生成模型的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN108764369A (zh) | 2018-11-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108764369B (zh) | 基于数据融合的人物识别方法、装置和计算机存储介质 | |
CN109684047B (zh) | 事件处理方法、装置、设备和计算机存储介质 | |
CN108200054B (zh) | 一种基于dns解析的恶意域名检测方法及装置 | |
CN107566358B (zh) | 一种风险预警提示方法、装置、介质及设备 | |
CN110443274B (zh) | 异常检测方法、装置、计算机设备及存储介质 | |
CN109936561B (zh) | 用户请求的检测方法、装置、计算机设备及存储介质 | |
CN107305611B (zh) | 恶意账号对应的模型建立方法和装置、恶意账号识别的方法和装置 | |
CN106650350B (zh) | 一种身份认证方法及系统 | |
CN108491720B (zh) | 一种应用识别方法、系统以及相关设备 | |
CN110336838B (zh) | 账号异常检测方法、装置、终端及存储介质 | |
CN109684302B (zh) | 数据预测方法、装置、设备及计算机可读存储介质 | |
US20140279803A1 (en) | Disambiguating data using contextual and historical information | |
US9866454B2 (en) | Generating anonymous data from web data | |
CN105894028B (zh) | 用户识别方法和装置 | |
CN109658120B (zh) | 一种业务数据处理方法以及装置 | |
CN111177568A (zh) | 基于多源数据的对象推送方法、电子装置及存储介质 | |
CN110741387A (zh) | 人脸识别方法、装置、存储介质及电子设备 | |
CN111553241A (zh) | 掌纹的误匹配点剔除方法、装置、设备及存储介质 | |
CN116756616A (zh) | 数据处理方法、装置、计算机可读介质及电子设备 | |
CN116707859A (zh) | 特征规则提取方法和装置、网络入侵检测方法和装置 | |
CN113254250B (zh) | 数据库服务器异常成因检测方法、装置、设备和存储介质 | |
CN110909258A (zh) | 一种信息推荐方法、装置、设备及存储介质 | |
CN117435999A (zh) | 一种风险评估方法、装置、设备以及介质 | |
CN114238768A (zh) | 资讯信息的推送方法、装置、计算机设备和存储介质 | |
CN109255016A (zh) | 基于深度学习的应答方法、装置及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |