CN110969209A - 一种陌生人识别方法、装置、电子设备及存储介质 - Google Patents
一种陌生人识别方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN110969209A CN110969209A CN201911212711.4A CN201911212711A CN110969209A CN 110969209 A CN110969209 A CN 110969209A CN 201911212711 A CN201911212711 A CN 201911212711A CN 110969209 A CN110969209 A CN 110969209A
- Authority
- CN
- China
- Prior art keywords
- area
- time
- time period
- person
- identified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 230000006399 behavior Effects 0.000 claims description 56
- 238000012549 training Methods 0.000 claims description 27
- 238000007477 logistic regression Methods 0.000 claims description 19
- 239000011159 matrix material Substances 0.000 claims description 14
- 238000012216 screening Methods 0.000 claims description 5
- 238000002372 labelling Methods 0.000 claims description 3
- 230000003542 behavioural effect Effects 0.000 claims 1
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 claims 1
- 230000008569 process Effects 0.000 description 13
- 238000012360 testing method Methods 0.000 description 6
- 230000009471 action Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 235000013311 vegetables Nutrition 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012847 principal component analysis method Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Image Analysis (AREA)
Abstract
本申请提供一种陌生人识别方法、装置、电子设备及存储介质。方法包括:获取第一历史时间段内待识别人员在待测区域中的行为特征;行为特征包括进入待测区域的时间段、在待测区域的轨迹、出待测区域的时间段、进出待测区域的第一次数和在待测区域平均停留时长;利用识别模型对行为特征进行识别,获得待识别人员对应的初始识别结果;获取待识别人员在第三历史时间段内进入所述待测区域的第二时间以及进入待测区域的第二次数,根据第二时间和第二次数对初始识别结果进行调整,获得目标识别结果。本申请实施例不需要安保人员人工对每个进入待测区域的人员进行辨识盘问,降低了安保人员的工作压力,节省了进入待测区域的人员的时间。
Description
技术领域
本申请涉及大数据处理技术领域,具体而言,涉及一种陌生人识别方法、装置、电子设备及存储介质。
背景技术
社区安全是社会安全的基石,长期以来,我国安全形势严峻的重要原因之一是社区安全基础差。所以构建安全祥和的社区是社会安全的重要基础。
现有技术中,为了保证社区的安全,每个社区都配备有门卫等安保人员,安保人员大致会记住在该社区居住的人员。当有他们认为不是该社区的人员进入该社区时,会对该人员进行询问。一方面,给安保人员的工作带来了很大的压力,另一方面,如果只是走亲访友的人员在进入社区时被询问,也会浪费来访者的时间。
发明内容
本申请实施例的目的在于提供一种陌生人识别方法、装置、电子设备及存储介质,用以在保证社区安全的前提下,降低安保人员的工作压力并节省来访者的时间。
第一方面,本申请实施例提供陌生人识别方法,包括:获取第一历史时间段内待识别人员在待测区域中的行为特征;其中,所述行为特征包括进入所述待测区域的时间段、在所述待测区域的轨迹、出待测区域的时间段、进出待测区域的第一次数和在所述待测区域平均停留时长;利用识别模型对所述行为特征进行识别,获得所述待识别人员对应的初始识别结果;其中,所述识别模型为根据逻辑回归模型构建获得,并利用所述待测区域中,第二历史时间段内出现的人员的行为特征进行训练获得;获取所述待识别人员在第三历史时间段内进入所述待测区域的第二时间,以及进入所述待测区域的第二次数,根据所述第二时间和所述第二次数对所述初始识别结果进行调整,获得目标识别结果。
本申请实施例通过先利用识别模型对行为特征进行初步识别,获得初始识别结果,然后对初始识别结果进行调整获得目标识别结果,不需要安保人员人工对每个进入待测区域的人员进行辨识盘问,降低了安保人员的工作压力,节省了进入待测区域的人员的时间,并且本申请的方法能够提高对陌生人识别的准确性。
进一步地,在利用识别模型对所述行为特征进行识别之前,所述方法还包括:获取样本数据,所述样本数据包括多个陌生人样本和多个非陌生人样本;利用所述样本数据对逻辑回归模型进行训练,获得所述识别模型。
进一步地,所述获取样本数据包括:获取第四历史时间段内,所述待测区域中的人员的数据;根据历史标注信息,对所述待测区域中的人员进行划分,获得属于陌生人类型的人员和属于非陌生人类型的人员;分别对每一人员的数据进行特征提取,获得初始特征;对所述初始特征进行筛选,获得目标特征;根据人员的类型和对应的目标特征获得所述样本数据。
本申请实施例通过对初始特征进行筛选,获得影响因子较大的目标特征,提高了对识别模型训练的效率。
进一步地,所述对所述初始特征进行筛选,获得目标特征,包括:根据所述初始特征构建数据矩阵;计算所述数据矩阵对应的协方差矩阵的特征值和特征向量;选择特征值最大的K个特征作为所述目标特征;其中,K为正整数。
本申请实施例通过主成分分析方法对初始特征进行筛选,获得影响因子较大的目标特征,提高了对识别模型训练的效率。
进一步地,所述根据所述第二时间和所述第二次数对所述初始识别结果进行调整,包括:获取目标规则,所述目标规则包括标准时间范围和标准频次范围;判断所述第二时间落入所述标准时间范围的个数,以及所述第二次数是否落入所述标准频次范围;根据所述判断结果对所述初始识别结果进行调整。
本申请实施例通过利用目标规则对初始识别结果进行调整,从而提高了识别的准确性。
进一步地,在获取目标规则之前所述方法还包括:获取第六历史时间段内所述待测区域中出现陌生人的时间和次数;按照预设时间段对所述第六历史时间段进行分割,获得多个子历史时间段,以及每一子历史时间段对应的时间和次数;利用ARIMA模型分别对多个子历史时间段对应的时间和次数进行分析,获得所述目标规则。
本申请实施例通过ARIMA模型获得所述目标规则,可以根据当前时间来对标准时间范围和标准次数进行调整,提高识别的准确度。
第二方面,本申请实施例提供一种陌生人识别装置,包括:
特征获取模块,用于获取第一历史时间段内待识别人员在待测区域中的行为特征;其中,所述行为特征包括进入所述待测区域的时间段、在所述待测区域的轨迹、出待测区域的时间段、进出待测区域的第一次数和在所述待测区域平均停留时长;
第一识别模块,用于利用识别模型对所述行为特征进行识别,获得所述待识别人员对应的初始识别结果;其中,所述识别模型为根据逻辑回归模型构建获得,并利用所述待测区域中,第二历史时间段内出现的人员的行为特征进行训练获得;
第二识别模块,用于获取所述待识别人员在第三历史时间段内进入所述待测区域的第二时间,以及进入所述待测区域的第二次数,根据所述第二时间和所述第二次数对所述初始识别结果进行调整,获得目标识别结果。
进一步地,所述装置还包括模型训练模块,用于:
获取样本数据,所述样本数据包括多个陌生人样本和多个非陌生人样本;
利用所述样本数据对逻辑回归模型进行训练,获得所述识别模型。
第三方面,本申请实施例提供一种电子设备,包括:处理器、存储器和总线,其中,
所述处理器和所述存储器通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行第一方面的方法。
第四方面,本申请实施例提供一种非暂态计算机可读存储介质,包括:
所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行第一方面的方法。
本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种识别模型训练方法流程示意图;
图2为本申请实施例提供一种陌生人识别方法流程示意图;
图3为本申请实施例提供的装置结构示意图;
图4为本申请实施例提供的电子设备实体结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
在本申请提出之前,为了保证社区的安全,需要有安保人员来保证,即若安保人员发现社区中有不属于该社区的人员进入时,会对该人员进行询问,以排除其可能实施犯罪行为的可能。随着科技的发展,人工智能领域的兴起,不再需要安保人员熟记每个居住在社区的人员,而是可以通过在社区中设置多个图像采集装置,通过图像采集装置采集进入图像采集装置可采集的范围内的人的外貌特征,例如:人脸特征、行走特征、身高、体型等信息,并通过识别装置对人的外貌进行识别,来判断该人员是否为社区居住人员,当不是该社区居住人员时,向安保人员发出警报,此时安保人员对该人员进行询问。但是,如果是某个社区居民的亲朋好友来拜访,每次都需要被安保人员询问,一方面会增加安保人员的工作压力,另一方面,也会浪费来访者的时间。
为解决上述技术问题,本申请实施例提供一种陌生人识别方法,在介绍具体的识别过程之前,需要做预先做准备工作,例如构建识别模型、构建各种识别规则等。
应当说明的是,执行本申请实施例的方法的主体为识别装置,该识别装置可以是计算机、服务器、智能移动终端、智能穿戴设备等。
图1为本申请实施例提供的一种识别模型训练方法流程示意图,如图1所示,该方法包括:
步骤101:获取历史数据;识别装置获取第四历史时间段内的待测区域中的人员的数据;其中,第四历史时间段可以是近两年内,也可以是近一年内,还可以根据实际情况进行设定。待测区域可以是某个城市、城市下的一个行政区、一个小区等,或者是按照经纬度进行划分的一块区域。人员的数据是指,在第四历史时间段内,由待测区域中的图像采集装置采集到的人员的视频或图像数据,也可以是公安数据,即户口数据,人员的备案信息(包括曾经的犯罪记录等),还可以是基站数据等。应当说明的是,对于图像采集装置采集到的视频或图像数据,可以通过行人识别技术识别出具体是哪个人。
步骤102:对数据进行划分;在获取到数据之后,可以获得在第四历史时间段内,所有出现在待测区域中的人员。在对每个人的数据进行划分时,可以查询公安数据,将有犯罪记录的人员作为陌生人,剩下的作为非陌生人。应当说明的是,本申请中所称的陌生人是指有较大犯罪嫌疑的陌生人,犯罪可以是入室盗窃等。非陌生人是指待测区域中的常住人口、服务该待测区域的外卖人员、快递人员等。
步骤103:特征提取;分别对属于陌生人的数据和属于非陌生人的数据进行特征提取,获得初始特征;其中,初始特征中可以包括:出单元门的时间段、出社区的时间段、进小区的时间段、进单元门的时间段、在社区中的活动轨迹、出门买菜的时间段等特征。应当说明的是,一般来说,社区中的每个常住居民都有各自的生活习惯,因此,可以从第四历史时间段中各个人员的数据可以统计得到其行为特征。出单元门的时间段可以通过设置在单元门口的图像采集装置获得,统计每个出单元门口的人员的时间,从而可以获知人员出单元门对应的时间段。例如:对于周一-周五上班的人来说,其可能在周一-周五每天早上7:20-7:30出单元门,晚上8:00-8:30进单元门。对于没有工作的家庭主妇来说,其可能在每天早上9:30-10:00出单元门去买菜,10:30-11:00买菜回来进单元门。可以理解的是,判断是否去买菜可以通过图像识别获得,即判断进单元门的人员手中是否拎着东西,以及对拎着的东西进行识别。出社区的时间段、进小区的时间段以及在社区中的活动轨迹等,均可以通过统计的方式获得。而对于快递员来说,其每天进出社区的时间及次数都是固定的,因此,也较容易统计获得。陌生人,尤其是具有犯罪嫌疑的陌生人,一般进出社区的时间会在晚上、在社会活动的轨迹会在社区的边缘、或者人少的地方。判断社区哪块人多,哪块人少,也可以预先对社区进行标注,将经常有人活动的区域标注为人多区域,将人很少去的区域标注为人少区域。
步骤104:模型训练;将陌生人的行为特征作为正样本,将非陌生人的行为特征作为负样本。应当说明的是,若正样本数量较少时,可以总结根据有犯罪嫌疑的人的行为特征,人工构建多条正样本。利用正样本和负样本对逻辑回归模型进行训练,不断优化逻辑回归模型中的参数,以获得识别模型。其中,逻辑回归(Logistic Regression,LR)模型可以被认为就是一个被Sigmoid函数所归一化后的线性回归模型。在参数拟合过程中使用交叉熵损失函数。并通过5折交叉验证反复训练,避免造成过拟合现象。
本申请实施例通过构建识别模型,并利用识别模型对行为特征进行分析,获得初始识别模型,不需要人工查看每个进入待测区域的人,降低了安保人员的工作压力。
在上述实施例的基础上,在对每个样本的初始特征之后,为了提高训练效率,可以对初始特征进行筛选,选择影响因子大的特征,将影响因子晓得特征剔除处理。因此,可以采用主成分分析法获得目标特征。其中,主成分分析的思想是将n维特征映射到k维上(k<n),这k维是全新的正交特征。这k为特征称为主成分,是重新构造出来的k维特征,而不是简单地从n维特征中去除其余n-k维特征。
根据所有的人员对应的初始特征构建数据矩阵,每一行向量表示一个样例,每一纵向量表示一个初始特征,分别求每一初始特征对应的平均值,然后对于所有的样例,都减去对应的均值,获得新的数据矩阵。求取新的数据特征的协方差矩阵,进而计算获得协方差矩阵对应的特征值和特征向量。将特征值按照从大到小的顺序进行排序,选择其中最大的k个,然后将这k个特征值对应的特征向量分别作为列向量组成特征向量矩阵。将样本投影到选取的特征向量上,获得目标特征。可以理解的是,k为正整数,且k的最大值小于初始特征的数量。
本申请实施例通过利用主成分分析方法对初选特征进行降维,获得影响影子较大的目标特征,从而能够准确、快速地对模型进行训练。
在上述实施例的基础上,本申请实施例提供一种陌生人识别方法,如图2所示,该方法包括:
步骤201:获取第一历史时间段内待识别人员在待测区域中的行为特征;其中,所述行为特征包括进入所述待测区域的时间段、在所述待测区域的轨迹、出待测区域的时间段、进出待测区域的第一次数和在所述待测区域平均停留时长。
在具体的实施过程中,若需要识别某个人是否是陌生人时,这个人被称为待识别人员。第一历史时间段可以是距当前时间之前的半年、一年等。待测区域可以是某个城市、城市下的一个行政区、一个小区等,或者是按照经纬度进行划分的一块区域。进入待测区域的时间段是指该待识别人员习惯性在哪个时间段进入待测区域,可以预先对一天24小时进行划分,每两个小时划分为一个时间段。若在第一历史时间段内,该待识别人员每天会在17:30左右进入待测区域,那么进入待测区域的时间段为16:00-18:00。在所述待测区域的轨迹是指待识别人员习惯性在待测区域活动所形成的轨迹。可以理解的是,可以通过待测区域的图像采集装置来确定待识别人员的轨迹。出待测区域的时间段与进入待测区域的时间段的确定方式类似,此处不再赘述。进出待测区域的第一次数是指在第一历史时间段内,待识别人员一共进出待测区域的次数。在待测区域平均停留时长是指统计待识别人员在第一历史时间段内每次进入待测区域的时长,然后求取平均时长。
因此,若要识别某个人是否是陌生人时,可以通过识别装置获取待识别人员在第一历史时间段内的行为特征,基于行为特征进行识别。应当说明的是,行为特征还可以包括其他特征,例如:在室内的停留时长、在室外的停留时长等。
步骤202:利用识别模型对所述行为特征进行识别,获得所述待识别人员对应的初始识别结果;其中,所述识别模型为根据逻辑回归模型构建获得,并利用所述待测区域中,第二历史时间段内出现的人员的行为特征进行训练获得。
在具体的实施过程中,将步骤201中获取到的行为特征作为输入,输入到识别模型中,识别模型对行为特征进行分析,获得待识别人员为陌生人的概率。其中,是陌生人的概率就是初始识别结果。应当说明的是,识别模型可以是通过上述实施例对逻辑回归模型训练获得,也可以利用神经网络模型训练获得。
步骤203:获取所述待识别人员在第三历史时间段内进入所述待测区域的第二时间,以及进入所述待测区域的第二次数,根据所述第二时间和所述第二次数对所述初始识别结果进行调整,获得目标识别结果。
在具体的实施过程中,因为要判断待识别人员是否为具有较大犯罪嫌疑的陌生人,因此,需要利用要排查的犯罪行为所具备的特征对待识别人员进行再次核查。因此,在获得待识别人员的初始识别结果后,利用预设规则对初始识别结果进行调整。第三历史时间段可以是距离当前时刻一个月或两个月等,具体时间可以根据实际情况确定。
本申请以一个月为例,一般情况下,如果一个人要在待测区域实施犯罪行为,其在实施之前的一段时间内会对待测区域的环境进行熟悉,所以,要获取待识别人员在第三历史时间段内进入待测区域的第二时间,以及第二次数。进入待测区域的第二时间是指待识别人员在最近一个月内每次进入待测区域的时间点,进入待测区域的第二次数是指待识别人员在最近一个月内一共进入待测区域的次数。然后根据第二时间和第二次数对初始识别结果进行调整,以获得目标识别结果。
本申请实施例通过先利用识别模型对行为特征进行初步识别,获得初始识别结果,然后对初始识别结果进行调整获得目标识别结果,不需要安保人员人工对每个进入待测区域的人员进行辨识盘问,降低了安保人员的工作压力,节省了进入待测区域的人员的时间,并且本申请的方法能够提高对陌生人识别的准确性。
在上述实施例的基础上,所述根据所述第二时间和所述第二次数对所述初始识别结果进行调整,包括:
获取目标规则,所述目标规则包括标准时间范围和标准频次范围;
判断所述第二时间落入所述标准时间范围的个数,以及所述第二次数是否落入所述标准频次范围;
根据所述判断结果对所述初始识别结果进行调整。
在具体的实施过程中,目标规则是指由需要判断陌生人的犯罪行为所对应的普遍特征构成的。例如:对于入室盗窃行为来说,入室盗窃犯在实施盗窃行为之前的一段时间,都会在目标小区进行环境熟悉,并且其出入小区的时间会与正常居民不同。假设入室盗窃的人在实施盗窃行为一般会在午夜或下午1-3点钟,而踩点时间会比实施盗窃行为的时间提交1-2小时。并且这类人进入待测区域的次数也跟正常居民有差别。
假设入室盗窃人员对应的目标规则为在一个月内,进入待测区域的标准时间范围为午夜1-3点,以及下午1-3点两个时间段;进入待测区域的标准频次范围为10到15次。若待识别人员对应的初始识别结果为陌生人的概率为75%。并且待识别人员进入待测区域的第二时间由6次在午夜1-3点内,还有6次在下午1-3点内,有1次在下午4点,共进入待测区域13次,那么说明待识别人员极有可能是陌生人,提高是陌生人的可能性,即目标识别结果为陌生人的可能性达到95%。应当说明的是,根据第二时间落入标准时间范围以及第二次数落入标准频次范围的个数来确定如何调整初始识别结果。
例如:落入标准时间范围以及第二次数落入标准频次范围的个数占总个数的50%,那么则不对初始识别结果进行调整,如果大于50%,则可以根据公式P=m+(1-m)n,计算获得目标识别结果。如果入标准时间范围以及第二次数落入标准频次范围的个数占总个数的百分比小于50%,那么可以根据公式P=m-(1-m)n,计算获得目标识别结果。其中,P为目标识别结果,m为初始识别结果,n为落入标准时间范围以及第二次数落入标准频次范围的个数占总个数的百分比。
应当说明的是,不同的犯罪行为,以及不同的区域其对应的目标规则可能不同,因此,可以根据实际情况确定目标规则。
本申请实施例通过目标规则对初始识别结果进行进一步确认,从而能够获得更加准确的识别结果。
在上述实施例的基础上,在获取目标规则之前所述方法还包括:
获取第六历史时间段内所述待测区域中出现陌生人的时间和次数;
按照预设时间段对所述第六历史时间段进行分割,获得多个子历史时间段,以及每一子历史时间段对应的时间和次数;
利用ARIMA模型分别对多个子历史时间段对应的时间和次数进行分析,获得所述目标规则。
在具体的实施过程中,陌生人可能在待测区域实施的行为有多种,例如入室盗窃,拐卖儿童等,并且,不同季节、不同地区其行为特征也不同,因此,可以预先统计不同行为所对应的特征,根据这些特征生成对应的规则。
第六历史时间段可以是最近一年、一个月、一天等,具体根据实际情况设定。待测区域中出现的陌生人可以通过上述识别模型确定,也可以通过公安数据确定。应当说明的是,此处的陌生人不是特指某一个人,而是第六历史时间段内,出现在待测区域中所有的陌生人。
下面以第六历史时间段为一年为例:预设时间段可以为一个月,此时,可以将第六历史时间段划分为12个子历史时间,并且,可以获得每个子历史事件段分别对应的陌生人出现的时间和次数。
自回归积分滑动平均模型(Autoregressive Integrated Moving AverageModel,简记ARIMA)。其中,ARIMA(p,d,q)称为差分自回归移动平均模型,AR是自回归,I为单整阶数,MA为移动平均,p为自回归项;q为移动平均项数,d为时间序列成为平稳时所做的差分次数。所谓ARIMA模型,是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。ARIMA模型根据原序列是否平稳以及回归中所含部分的不同,包括移动平均过程(MA)、自回归过程(AR)、自回归移动平均过程(ARMA)以及ARIMA过程。
时间和次数分别对应一个ARIMA模型,ARIMA模型的构建可以包括如下步骤:
步骤1:分别对获得的序列数据(每一子历史时间段对应的时间和次数)进行绘图,观测是否序列图或利用ADF单位根来判断是否为平稳序列。
步骤2:序列平稳化。对非平稳序列,可以通过差分运算使其平稳,其中差分次数d,然后对差分d次后的平稳序列进行白噪声检验,若平稳序列为非白噪声序列,则可进入步骤3。
步骤3:模型的识别与定阶。根据样本的自相关图和偏自相关图选择适当的自相关阶数p和移动平均阶数q,然后对模型进行拟合;如果偏自相关系数呈指数形式衰减到零,那么则存在移动平均(MA)过程。如果自相关系数呈指数形式衰减到零,那么存在自回归(AR)过程。如果上述两种情况都存在,则说明该序列为求和自回归移动平均(ARIMA)过程。
步骤4:模型的参数估计。利用最小二乘法估计序列的回归系数。最小二乘法能充分利用序列观察值的信息,从而能提高序列的预测精度。
步骤5:模型的检验。通过对模型进行残差白噪声检验和参数性检验,来判断所建模型是否可取,如果残差序列不是白噪声序列,则返回步骤3,重新建立模型,直到通过参数检验和模型的残差白噪声检验即可。
步骤6:模型的预测。利用参数检验和白噪声检验的ARIMA对序列进行短期预测。
在构建完成ARIMA模型之后,可以将子历史时间段对应的时间和次数分别输入到对应的ARIMA模型中,利用ARIMA模型获得对应的标准时间范围和标准频次范围。
本申请实施例通过利用ARIMA模型计算获得标准时间范围和标准频次范围,可以让目标规则在不用时期对应不同的标准时间范围和标准频次范围,提高识别精度。
图3为本申请实施例提供的装置结构示意图,该装置可以是电子设备上的模块、程序段或代码。应理解,该装置与上述图2方法实施例对应,能够执行图2方法实施例涉及的各个步骤,该装置具体的功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。该装置包括:特征获取模块301、第一识别模块302和第二识别模块303,其中:
特征获取模块301用于获取第一历史时间段内待识别人员在待测区域中的行为特征;其中,所述行为特征包括进入所述待测区域的时间段、在所述待测区域的轨迹、出待测区域的时间段、进出待测区域的第一次数和在所述待测区域平均停留时长;第一识别模块302用于利用识别模型对所述行为特征进行识别,获得所述待识别人员对应的初始识别结果;其中,所述识别模型为根据逻辑回归模型构建获得,并利用所述待测区域中,第二历史时间段内出现的人员的行为特征进行训练获得;第二识别模块303用于获取所述待识别人员在第三历史时间段内进入所述待测区域的第二时间,以及进入所述待测区域的第二次数,根据所述第二时间和所述第二次数对所述初始识别结果进行调整,获得目标识别结果。
在上述实施例的基础上,所述装置还包括模型训练模块,用于:
获取样本数据,所述样本数据包括多个陌生人样本和多个非陌生人样本;
利用所述样本数据对逻辑回归模型进行训练,获得所述识别模型。
在上述实施例的基础上,特征获取模块301具体用于:
获取第四历史时间段内,所述待测区域中的人员的数据;
根据历史标注信息,对所述待测区域中的人员进行划分,获得属于陌生人类型的人员和属于非陌生人类型的人员;
分别对每一人员的数据进行特征提取,获得初始特征;
对所述初始特征进行筛选,获得目标特征;
根据人员的类型和对应的目标特征获得所述样本数据。
在上述实施例的基础上,特征获取模块301具体用于:
根据所述初始特征构建数据矩阵;
计算所述数据矩阵对应的协方差矩阵的特征值和特征向量;
选择特征值最大的K个特征作为所述目标特征;其中,K为正整数。
在上述实施例的基础上,第二识别模块303具体用于:
获取目标规则,所述目标规则包括标准时间范围和标准频次范围;
判断所述第二时间落入所述标准时间范围的个数,以及所述第二次数是否落入所述标准频次范围;
根据所述判断结果对所述初始识别结果进行调整。
在上述实施例的基础上,该装置还包括规则生成模块,用于:
获取第六历史时间段内所述待测区域中出现陌生人的时间和次数;
按照预设时间段对所述第六历史时间段进行分割,获得多个子历史时间段,以及每一子历史时间段对应的时间和次数;
利用ARIMA模型分别对多个子历史时间段对应的时间和次数进行分析,获得所述目标规则。
综上所述,本申请实施例通过识别模型对待识别用户的行为特征进行初始识别,获得初始识别结果,然后再对初始识别结果进行调整,获得目标识别结果,无需人工对每个人进行盘问,一方面降低了安保人员的工作压力,另一方便节省了人员进入待测区域的时间。
图4为本申请实施例提供的电子设备实体结构示意图,如图4所示,所述电子设备,包括:处理器(processor)401、存储器(memory)402和总线403;其中,
所述处理器401和存储器402通过所述总线403完成相互间的通信;
所述处理器401用于调用所述存储器402中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:获取第一历史时间段内待识别人员在待测区域中的行为特征;其中,所述行为特征包括进入所述待测区域的时间段、在所述待测区域的轨迹、出待测区域的时间段、进出待测区域的第一次数和在所述待测区域平均停留时长;利用识别模型对所述行为特征进行识别,获得所述待识别人员对应的初始识别结果;其中,所述识别模型为根据逻辑回归模型构建获得,并利用所述待测区域中,第二历史时间段内出现的人员的行为特征进行训练获得;获取所述待识别人员在第三历史时间段内进入所述待测区域的第二时间,以及进入所述待测区域的第二次数,根据所述第二时间和所述第二次数对所述初始识别结果进行调整,获得目标识别结果。
处理器401可以是一种集成电路芯片,具有信号处理能力。上述处理器401可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。其可以实现或者执行本申请实施例中公开的各种方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器402可以包括但不限于随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
本实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:获取第一历史时间段内待识别人员在待测区域中的行为特征;其中,所述行为特征包括进入所述待测区域的时间段、在所述待测区域的轨迹、出待测区域的时间段、进出待测区域的第一次数和在所述待测区域平均停留时长;利用识别模型对所述行为特征进行识别,获得所述待识别人员对应的初始识别结果;其中,所述识别模型为根据逻辑回归模型构建获得,并利用所述待测区域中,第二历史时间段内出现的人员的行为特征进行训练获得;获取所述待识别人员在第三历史时间段内进入所述待测区域的第二时间,以及进入所述待测区域的第二次数,根据所述第二时间和所述第二次数对所述初始识别结果进行调整,获得目标识别结果。
本实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:获取第一历史时间段内待识别人员在待测区域中的行为特征;其中,所述行为特征包括进入所述待测区域的时间段、在所述待测区域的轨迹、出待测区域的时间段、进出待测区域的第一次数和在所述待测区域平均停留时长;利用识别模型对所述行为特征进行识别,获得所述待识别人员对应的初始识别结果;其中,所述识别模型为根据逻辑回归模型构建获得,并利用所述待测区域中,第二历史时间段内出现的人员的行为特征进行训练获得;获取所述待识别人员在第三历史时间段内进入所述待测区域的第二时间,以及进入所述待测区域的第二次数,根据所述第二时间和所述第二次数对所述初始识别结果进行调整,获得目标识别结果。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种陌生人识别方法,其特征在于,包括:
获取第一历史时间段内待识别人员在待测区域中的行为特征;其中,所述行为特征包括进入所述待测区域的时间段、在所述待测区域的轨迹、出待测区域的时间段、进出待测区域的第一次数和在所述待测区域平均停留时长;
利用识别模型对所述行为特征进行识别,获得所述待识别人员对应的初始识别结果;其中,所述识别模型为根据逻辑回归模型构建获得,并利用所述待测区域中,第二历史时间段内出现的人员的行为特征进行训练获得;
获取所述待识别人员在第三历史时间段内进入所述待测区域的第二时间,以及进入所述待测区域的第二次数,根据所述第二时间和所述第二次数对所述初始识别结果进行调整,获得目标识别结果。
2.根据权利要求1所述的方法,其特征在于,在利用识别模型对所述行为特征进行识别之前,所述方法还包括:
获取样本数据,所述样本数据包括多个陌生人样本和多个非陌生人样本;
利用所述样本数据对逻辑回归模型进行训练,获得所述识别模型。
3.根据权利要求2所述的方法,其特征在于,所述获取样本数据包括:
获取第四历史时间段内,所述待测区域中的人员的数据;
根据历史标注信息,对所述待测区域中的人员进行划分,获得属于陌生人类型的人员和属于非陌生人类型的人员;
分别对每一人员的数据进行特征提取,获得初始特征;
对所述初始特征进行筛选,获得目标特征;
根据人员的类型和对应的目标特征获得所述样本数据。
4.根据权利要求3所述的方法,其特征在于,所述对所述初始特征进行筛选,获得目标特征,包括:
根据所述初始特征构建数据矩阵;
计算所述数据矩阵对应的协方差矩阵的特征值和特征向量;
选择特征值最大的K个特征作为所述目标特征;其中,K为正整数。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述根据所述第二时间和所述第二次数对所述初始识别结果进行调整,包括:
获取目标规则,所述目标规则包括标准时间范围和标准频次范围;
判断所述第二时间落入所述标准时间范围的个数,以及所述第二次数是否落入所述标准频次范围;
根据判断结果对所述初始识别结果进行调整。
6.根据权利要求5所述的方法,其特征在于,在获取目标规则之前所述方法还包括:
获取第六历史时间段内所述待测区域中出现陌生人的时间和次数;
按照预设时间段对所述第六历史时间段进行分割,获得多个子历史时间段,以及每一子历史时间段对应的时间和次数;
利用ARIMA模型分别对多个子历史时间段对应的时间和次数进行分析,获得所述目标规则。
7.一种陌生人识别装置,其特征在于,包括:
特征获取模块,用于获取第一历史时间段内待识别人员在待测区域中的行为特征;其中,所述行为特征包括进入所述待测区域的时间段、在所述待测区域的轨迹、出待测区域的时间段、进出待测区域的第一次数和在所述待测区域平均停留时长;
第一识别模块,用于利用识别模型对所述行为特征进行识别,获得所述待识别人员对应的初始识别结果;其中,所述识别模型为根据逻辑回归模型构建获得,并利用所述待测区域中,第二历史时间段内出现的人员的行为特征进行训练获得;
第二识别模块,用于获取所述待识别人员在第三历史时间段内进入所述待测区域的第二时间,以及进入所述待测区域的第二次数,根据所述第二时间和所述第二次数对所述初始识别结果进行调整,获得目标识别结果。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括模型训练模块,用于:
获取样本数据,所述样本数据包括多个陌生人样本和多个非陌生人样本;
利用所述样本数据对逻辑回归模型进行训练,获得所述识别模型。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,其中,
所述处理器和所述存储器通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1-6任一项所述的方法。
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令被计算机运行时,使所述计算机执行如权利要求1-6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911212711.4A CN110969209B (zh) | 2019-11-29 | 2019-11-29 | 一种陌生人识别方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911212711.4A CN110969209B (zh) | 2019-11-29 | 2019-11-29 | 一种陌生人识别方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110969209A true CN110969209A (zh) | 2020-04-07 |
CN110969209B CN110969209B (zh) | 2023-05-02 |
Family
ID=70032532
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911212711.4A Active CN110969209B (zh) | 2019-11-29 | 2019-11-29 | 一种陌生人识别方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110969209B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113556697A (zh) * | 2021-07-21 | 2021-10-26 | 智慧足迹数据科技有限公司 | 基于手机信令的快递员识别方法及相关装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108052925A (zh) * | 2017-12-28 | 2018-05-18 | 江西高创保安服务技术有限公司 | 一种小区人员档案智能管理方法 |
JP2019125238A (ja) * | 2018-01-18 | 2019-07-25 | グローリー株式会社 | 滞在時間検出システム、滞在時間検出装置、及び滞在時間検出方法 |
CN110363080A (zh) * | 2019-06-05 | 2019-10-22 | 平安科技(深圳)有限公司 | 基于人脸识别的黄牛识别方法、装置、终端及存储介质 |
-
2019
- 2019-11-29 CN CN201911212711.4A patent/CN110969209B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108052925A (zh) * | 2017-12-28 | 2018-05-18 | 江西高创保安服务技术有限公司 | 一种小区人员档案智能管理方法 |
JP2019125238A (ja) * | 2018-01-18 | 2019-07-25 | グローリー株式会社 | 滞在時間検出システム、滞在時間検出装置、及び滞在時間検出方法 |
CN110363080A (zh) * | 2019-06-05 | 2019-10-22 | 平安科技(深圳)有限公司 | 基于人脸识别的黄牛识别方法、装置、终端及存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113556697A (zh) * | 2021-07-21 | 2021-10-26 | 智慧足迹数据科技有限公司 | 基于手机信令的快递员识别方法及相关装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110969209B (zh) | 2023-05-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112382407A (zh) | 一种风险管控方法、装置、电子设备和存储介质 | |
CN116821809B (zh) | 基于人工智能的生命体征数据采集系统 | |
CN114898261A (zh) | 一种基于视频和生理数据融合的睡眠质量评估方法及系统 | |
CN110210694A (zh) | 空间管理方法、装置、存储介质和计算机设备 | |
CN111382723A (zh) | 求救识别的方法、装置及系统 | |
CN115691034A (zh) | 一种智能家居异常情况告警方法、系统及存储介质 | |
CN110969209B (zh) | 一种陌生人识别方法、装置、电子设备及存储介质 | |
CN110909706A (zh) | 一种昼伏夜出人员判定方法、装置、电子设备及存储介质 | |
CN113837138B (zh) | 一种着装监控方法、系统、介质及电子终端 | |
CN111160263B (zh) | 一种获取人脸识别阈值的方法及系统 | |
CN116186513A (zh) | 一种基于一维卷积神经网络的振动信号识别方法 | |
CN115116119A (zh) | 一种基于数字图像处理技术的人脸识别系统 | |
CN113468948A (zh) | 基于视图数据的治安防控方法、模块、设备及存储介质 | |
CN114420307A (zh) | 基于人工智能的公共卫生事件登记方法、装置及电子设备 | |
CN110472680B (zh) | 目标分类方法、装置和计算机可读存储介质 | |
CN109308565B (zh) | 人群绩效等级识别方法、装置、存储介质及计算机设备 | |
CN113743293A (zh) | 跌倒行为检测方法、装置、电子设备及存储介质 | |
CN112507972A (zh) | 基于区块链的绩效考核系统 | |
Perner | Concepts for novelty detection and handling based on a case-based reasoning process scheme | |
CN110399399B (zh) | 用户分析的方法、装置、电子设备和存储介质 | |
JP2020035022A (ja) | 評価更新装置、方法、及びプログラム | |
JP2020035021A (ja) | 評価装置、方法、及びプログラム | |
CN116401290B (zh) | 基于金属携带量数据的人员安检方法 | |
WO2022088331A1 (zh) | 数据聚类方法及其装置、电子设备、存储介质和程序 | |
CN115001941B (zh) | 一种通信网管故障的确定方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |