CN112906725A - 统计人流特征的方法、装置及服务器 - Google Patents
统计人流特征的方法、装置及服务器 Download PDFInfo
- Publication number
- CN112906725A CN112906725A CN201911146379.6A CN201911146379A CN112906725A CN 112906725 A CN112906725 A CN 112906725A CN 201911146379 A CN201911146379 A CN 201911146379A CN 112906725 A CN112906725 A CN 112906725A
- Authority
- CN
- China
- Prior art keywords
- classification result
- sub
- region
- data
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 112
- 238000004364 calculation method Methods 0.000 claims abstract description 63
- 238000004891 communication Methods 0.000 claims description 9
- 238000012512 characterization method Methods 0.000 claims description 3
- 238000000638 solvent extraction Methods 0.000 claims 2
- 230000009286 beneficial effect Effects 0.000 abstract description 9
- 230000008569 process Effects 0.000 description 20
- 238000012545 processing Methods 0.000 description 14
- 238000004422 calculation algorithm Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000000903 blocking effect Effects 0.000 description 5
- 238000007619 statistical method Methods 0.000 description 5
- 238000013480 data collection Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000007115 recruitment Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000012098 association analyses Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
- G06V20/53—Recognition of crowd images, e.g. recognition of crowd congestion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Library & Information Science (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种统计人流特征的方法、装置及服务器,获取指定区域内每个子区域的人脸图像的特征数据;对每个子区域对应的特征数据进行分类统计,得到每个子区域对应的一级分类结果;如果子区域中,存在一级分类结果中的类别数量满足第一预设数量阈值的目标子区域,将目标子区域的一级分类结果统计至指定区域当前的二级分类结果中,得到统计后的二级分类结果;根据统计后的二级分类结果,确定指定区域的人流特征。这种多层级统计的方式,有助于降低统计数据的运算量,提高了计算效率,从而可以实时地进行统计人流特征。
Description
技术领域
本发明涉及人流统计技术领域,尤其是涉及一种统计人流特征的方法、装置及服务器。
背景技术
随着社会的发展,商城、车站等各种公共基础设施的人口流量急速增长,如何从大数据量的用户行为中归纳规律,对智慧社区建设具有重要意义。人流统计技术是指利用人工手段或摄像头、传感器等设备进行数据采集,通过一系列的分析技术,统计某个时间段或某个区域的人流量的方法。传统的人流统计的方法主要包括人工检测、红外感应设备、Wi-Fi(无线上网)探针、人脸识别等技术,对每天的人流量进行统计。在基于人脸识别的人流量统计方式中,每次进行统计时,都需要把历史所有的人脸数据进行统计处理,人脸数据不断增长时,该方式的计算效率较低,统计的实时性较差。
发明内容
本发明的目的在于提供一种统计人流特征的方法、装置及服务器,以降低统计数据的运算量,提高计算效率,从而可以实时地统计人流特征。
第一方面,本发明实施例提供了一种统计人流特征的方法,该方法包括:获取指定区域内每个子区域的人脸图像的特征数据;对每个子区域对应的特征数据进行分类统计,得到每个子区域对应的一级分类结果;其中,一级分类结果中,同一个人的人脸图像的特征数据属于同一类别;如果子区域中,存在一级分类结果中的类别数量满足第一预设数量阈值的目标子区域,将目标子区域的一级分类结果统计至指定区域当前的二级分类结果中,得到统计后的二级分类结果;根据统计后的二级分类结果,确定指定区域的人流特征。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,将目标子区域的一级分类结果统计至指定区域当前的二级分类结果中的步骤,包括:针对目标子区域的一级分类结果中的每个特征数据,将当前特征数据与指定区域的二级分类结果进行相似度匹配;如果二级分类结果中存在相似度满足预设相似度阈值的目标特征数据,将当前特征数据归入目标特征数据所属的类别中;如果二级分类结果中不存在相似度满足预设相似度阈值的目标特征数据,新建类别,将当前特征数据归入新建的类别中。
结合第一方面的第一种可能的实施方式,本发明实施例提供了第一方面的第二种可能的实施方式,其中,将当前特征数据与指定区域的二级分类结果进行相似度匹配的步骤,包括:按照预设的并行度,将指定区域的二级分类结果进行分块处理,得到多个分块数据;将当前特征数据分别与每个分块数据进行相似度匹配。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,得到每个子区域的一级分类结果的步骤之后,该方法还包括:针对每个子区域,计算当前子区域的一级分类结果中,各个特征数据的均值特征;将均值特征确定为当前子区域的区域特征;清空当前子区域对应的一级分类结果。
结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中,根据统计后的二级分类结果,确定指定区域的人流特征的步骤,至少包括下述之一:根据统计后的二级分类结果,计算指定区域的总人流量;根据统计后的二级分类结果,统计指定区域中的指定人流特征属性对应的人流量;根据统计后的二级分类结果,确定指定区域中的热点区域;其中,热点区域为人流量高于第二预设数量阈值的区域;计算二级分类结果中,各个特征数据的均值特征和/或中值特征,得到计算结果;将计算结果确定为指定区域的区域特征。
结合第一方面的任一种可能的实施方式,本发明实施例提供了第一方面的第五种可能的实施方式,其中,该方法应用于运行有Cassandra数据库的服务器;Cassandra数据库与PostgreSQL引擎通信连接;Cassandra数据库用于存储人脸图像、一级分类结果和二级分类结果;获取指定区域内每个子区域的人脸图像的特征数据的步骤之前,该方法还包括:通过PostgreSQL引擎获取统计算子;在运行有Cassandra数据库的服务器上运行统计算子,通过统计算子执行统计人流特征的方法。
第二方面,本发明实施例提供了一种统计人流特征的装置,该装置包括:特征数据获取模块,用于获取指定区域内每个子区域的人脸图像的特征数据;特征数据分类模块,用于对每个子区域对应的特征数据进行分类统计,得到每个子区域对应的一级分类结果;其中,一级分类结果中,同一个人的人脸图像的特征数据属于同一类别;类别数量判断模块,用于如果子区域中,存在一级分类结果中的类别数量满足第一预设数量阈值的目标子区域,将目标子区域的一级分类结果统计至指定区域当前的二级分类结果中,得到统计后的二级分类结果;人流特征确定模块,用于根据统计后的二级分类结果,确定指定区域的人流特征。
结合第二方面,本发明实施例提供了第二方面的第一种可能的实施方式,其中,特征数据分类模块还用于:针对目标子区域的一级分类结果中的每个特征数据,将当前特征数据与指定区域的二级分类结果进行相似度匹配;如果二级分类结果中存在相似度满足预设相似度阈值的目标特征数据,将当前特征数据归入目标特征数据所属的类别中;如果二级分类结果中不存在相似度满足预设相似度阈值的目标特征数据,新建类别,将当前特征数据归入新建的类别中。
结合第二方面的第一种可能的实施方式,本发明实施例提供了第二方面的第二种可能的实施方式,其中,特征数据分类模块还用于:按照预设的并行度,将指定区域的二级分类结果进行分块处理,得到多个分块数据;将当前特征数据分别与每个分块数据进行相似度匹配。
结合第二方面,本发明实施例提供了第二方面的第三种可能的实施方式,其中,该装置还包括:均值特征计算模块,用于针对每个子区域,计算当前子区域的一类分类结果中,各个特征数据的均值特征;将均值特征确定为当前子区域的区域特征;分类结果清空模块,用于清空当前子区域对应的一类分类结果。
第三方面,本发明实施例提供了一种服务器,包括处理器和存储器,存储器存储有能够被处理器执行的机器可执行指令,处理器执行机器可执行指令以实现上述统计人流特征的方法。
第四方面,本发明实施例提供了一种机器可读存储介质,机器可读存储介质存储有机器可执行指令,机器可执行指令在被处理器调用和执行时,机器可执行指令促使处理器实现上述统计人流特征的方法。
本发明实施例带来了以下有益效果:
本发明提供的一种统计人流特征的方法、装置及服务器,首先获取指定区域内每个子区域的人脸图像的特征数据;然后对每个子区域对应的特征数据进行分类统计,得到每个子区域对应的一级分类结果;如果子区域中,存在一级分类结果中的类别数量满足第一预设数量阈值的目标子区域,将目标子区域的一级分类结果统计至指定区域当前的二级分类结果中,得到统计后的二级分类结果;最后根据统计后的二级分类结果,确定指定区域的人流特征。该方式中,当指定区域范围较大时,可以划分为多个子区域,先统计各个子区域,基于各个子区域的统计结果,再统计整个指定区域;相对于现有的基于区域内所有数据进行统计的方式,这种多层级统计的方式,有助于降低统计数据的运算量,提高了计算效率,从而可以实时地进行统计人流特征。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种统计人流特征的方法流程图;
图2为本发明实施例提供的一种统计人流特征的方法应用场景示意图;
图3为本发明实施例提供的另一种统计人流特征的方法流程图;
图4为本发明实施例提供的一种并行计算的结构示意图;
图5为本发明实施例提供的另一种统计人流特征的方法流程图;
图6为本发明实施例提供的另一种统计人流特征的方法流程图;
图7为本发明实施例提供的另一种统计人流特征的方法应用场景示意图;
图8为本发明实施例提供的一种小档档案计算过程算法时序图;
图9为本发明实施例提供的一种中档档案计算过程算法时序图;
图10为本发明实施例提供的一种大档档案计算过程算法时序图;
图11为本发明实施例提供的一种统计人流特征的装置结构示意图;
图12为本发明实施例提供的一种服务器的结构示意图。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
相关技术中,人流统计的方法主要包括人工检测、红外感应设备、Wi-Fi探针等技术。其中,人工检测的方法,需要额外的人员成本,并且要求工作人员的注意力必须高度集中,这种方法效率低下,难以长时间、自动化实施;红外、Wi-Fi探针等设备的技术,需要顾客或行人携带相应设备,并保持设备在活跃状态,对硬件条件要求过于苛刻,且无法获得行人的年龄、性别、等外貌特征,不利于进一步挖掘数据,同时该技术手段具有泄露用户隐私的风险。随着计算机视觉技术的发展,从摄像头等监控设备中,依托于人脸识别技术推动了人流统计的发展。相关技术中,基于人脸识别的人流量统计方式,通过计算机视觉识别人脸,对人脸进行技术统计,一定程度上解决了上述方法的不足,但是,每次进行统计时,都需要把所有的人脸数据进行统计处理,人脸数据不断增长时,该方式的计算效率较低,统计的实时性较差,无法应用于大规模的实时人流统计。
基于上述问题,本发明实施例提供了一种统计人流特征的方法、装置及服务器,可以应用于各类场景下的人流特征统计,尤其是可以用于实时的人流特征统计。首先,本发明实施例提供了一种统计人流特征的方法,如图1所示,该方法包括以下步骤:
步骤S102,获取指定区域内每个子区域的人脸图像的特征数据;
上述指定区域可以设置有多个摄像头,用于采集进入该指定区域的人群的人脸图像,该指定区域具体可以是商场或者商业街等人流量较为密集的区域。该指定区域可以预先划分为多个子区域,每个子区域可以是地理区域中的某一个小范围的地理区域,例如可以是商场的出入口、某个柜台区域或者某个店面区域等,每个子区域内通常均设置有至少一个摄像头。上述人脸图像的特征数据可以是采用神经网络等人工智能工具从人脸图像中提取到的特征数据,该特征数据中可以包含有性别、年龄、身高等属性信息。
步骤S104,对每个子区域对应的特征数据进行分类统计,得到每个子区域对应的一级分类结果;其中,该一级分类结果中,同一个人的人脸图像的特征数据属于同一类别;
上述分类统计可以是指,将步骤S102得到的人脸图像的特征数据,进行聚类,该聚类算法可以是k-means等算法,将每个人分为一个类别。可以理解为,获取一个子区域内包含的所有摄像头在预设时间段内(如一天内)采集的人脸图像的特征数据,然后将该人脸图像的特征数据进行实时聚类,可以过滤重复的人脸图像的特征数据,每个人会分为一个类别,最后统计为该子区域对应的一级分类结果。由于人的行为轨迹是不固定的,同一个人可能会在同一个子区域重复出现,也有可能在不同时间出现在其他子区域,因此,所有一级分类结果中,每个子区域对应的一级分类结果之间可能会有重复的人脸图像特征数据,而一个子区域对应的一级分类结果中,同一个人的人脸图像的特征数据属于同一类别,通常不存在重复的人脸图像特征数据。
步骤S106,如果子区域中,存在一级分类结果中的类别数量满足第一预设数量阈值的目标子区域,将目标子区域的一级分类结果统计至指定区域当前的二级分类结果中,得到统计后的二级分类结果;
上述一级分类结果中的类别数量可以是所在子区域统计到的人群的人数,当所在子区域对应的一级分类结果中的类别数量满足第一预设数量阈值时,将该子区域作为目标子区域,然后将该目标子区域的一级分类结果统计至指定区域当前的二级分类结果中,得到统计后的二级分类结果,该统计后的二级分类结果可以是所有目标子区域的人脸图像的特征数据。上述第一预设数量阈值可以是预先设置的一个数值,比如可以是500。
上述二级分类结果通常是指定区域中所有子区域的汇总的分类结果,由于各个子区域之间对应的一级分类结果可能会有重复的人脸图像的特征数据,所以上述将目标子区域的一级分类结果统计至指定区域当前的二级分类结果的过程中,包括过滤重复的人脸图像的特征数据的过程,具体可以通过聚类、循环更新、分类器等方法进行统计。另外,目标子区域的一级分类结果统计至二级分类结果后,可以将一级分类结果清空,以便分类统计后续计算的人脸图像特征数据。
步骤S108,根据统计后的二级分类结果,确定指定区域的人流特征。
上述统计后的二级分类结果包括所有目标子区域的一级分类结果,统计后的二级分类结果中的每个类别的特征数据中还可以包含有指示特征数据来自哪个子区域的区域标识。上述指定区域的人流特征可以包括指定区域的总人流量、人流属性特征信息等,比如,该指定区域内各个年龄段的人群分布、不同性别的人群分布、还可以有各个子区域的各个特征的人群分布等。基于这些特征的人群分布,进而可以统计指定区域的多种特征,比如,商场的运行数据,包括人流量、进店率、进店人流属性、热点区域等,最终帮助商业地产等解决招商、店面布局、精准营销、品牌管理等精细化运营问题,达到商场智能化运行目的。
本发明实施例提供的一种统计人流特征的方法,首先获取指定区域内每个子区域的人脸图像的特征数据;然后对每个子区域对应的特征数据进行分类统计,得到每个子区域对应的一级分类结果;如果子区域中,存在一级分类结果中的类别数量满足第一预设数量阈值的目标子区域,将目标子区域的一级分类结果统计至指定区域当前的二级分类结果中,得到统计后的二级分类结果;最后根据统计后的二级分类结果,确定指定区域的人流特征。该方式中,当指定区域范围较大时,可以划分为多个子区域,先统计各个子区域,基于各个子区域的统计结果,再统计整个指定区域;相对于现有的基于区域内所有数据进行统计的方式,这种多层级统计的方式,有助于降低统计数据的运算量,提高了计算效率,从而可以实时地进行统计人流特征。
为了便于理解,本实施例提出一种可以实现本实施例提供的统计人流特征的方法的应用场景,但本实施例提供的统计人流特征的方法不限定于该应用场景。如图2所示,该场景包括分布式日志系统Kafka、Cassandra数据库、业务系统数据库、Hive数据仓库、SQL(结构化查询语言,Structured Query Language)调度器、对象-关系型数据库管理系统PostgreSQL、以及基于该PostgreSQL的人脸分类统计算子和指标计算统计算子。
其中,该PostgreSQL包括FDW(外部数据封装器,Foreign-Data Wrapper)、函数Functions及CPU(中央处理器,central processing unit)。上述CPU提供数据的运算及处理,函数Functions包括可以执行各种数据处理功能的函数,如上述人脸分类统计算子和指标计算统计算子函数。上述Kafka可以用于构建实时数据管道,获取到人脸图像的特征数据后,首先可以通过Kafka记录人脸图像的特征数据,并实时处理大量人脸图像的特征数据,将特征数据作为视频结构化日志,写入消息队列,以满足各种需求场景。上述Cassandra数据库为一套开源分布式NoSQL数据库系统,其中存储着由上述Kafka输出的视频结构化日志形式的人脸图像的特征数据,以满足实时检索以及后续人流统计的需求。
上述PostgreSQL是一种特性齐全的自由软件的对象-关系型数据库管理系统,通过SQL调度器调用PostgreSQL中的PDW、Functions及CPU,PostgreSQL可以将Cassandra数据库、业务系统数据库和Hive数据仓库等多源异构数据进行融合计算,利用FDW将Cassandra数据库等作为外部数据源以外部表的形式参与计算,解决多源异构数据融合计算的问题,可以通过in-database compute计算模式将统计算子直接作用在外部表,外部数据不用落地到PostgreSQL系统本地,减少了数据迁移的IO消耗及计算过程中的数据拷贝过程,对计算性能有很大的提升。其中,上述业务系统数据库存储的是人流特征统计得到的信息,上述Hive数据仓库主要用于后期的数据处理。上述人脸分类统计算子及指标计算统计算子可以通过PostgreSQL直接在Cassandra数据库中运行,无需将Cassandra数据库中存储的数据拷贝至运行PostgreSQL的服务器上。
基于上述应用场景,本发明实施例还提供了另一种统计人流特征的方法,该方法在上述实施例方法的基础上实现;该方法重点描述将目标子区域的一级分类结果统计至指定区域当前的二级分类结果中(通过步骤S306-S310实现)的具体实现过程,如图3所示,该方法包括如下步骤:
步骤S302,获取指定区域内每个子区域的人脸图像的特征数据;
在实际实现时,可以首先由指定区域内每个子区域的摄像头采集人流视频信息,形成非结构化的视频流数据,为了解决标准化数据采集的问题,可以通过SDK(软件开发工具包,Software Development Kit)、ONVIF(开放型网络视频接口论坛,Open NetworkVideo Interface Forum)、RSTP(快速生成树协议,Rapid Spanning Tree Protocol)、FTP(文件传输协议,FileTransfer Protocol)等方式支持各种IPC(进程间通信,Inter-Process Communication)、NVR(网络视频录像机,Network Video Recorder)、DVR(硬盘录像机,Digital Video Recorder)的接入,并对视频流进行抽帧,将视频数据转换成图片数据;然后根据预设的评分标准,计算上述图片数据的评分,选择质量评分达到预设值的图片,并对该图片进行压缩,得到上述人脸图像;将该人脸图像传输到云端处理器,该云端处理器可以利用深度网络等方法提取人脸图像的特征数据,然后将该人脸图像的特征数据作为视频结构化日志,写入消息队列;最后,由于视频结构化日志是后续计算的基础,具有数量大、数据列动态扩展的特点,因此,可以将该视频结构化日志输出存储在Cassandra数据库,以满足实时检索的需求,支撑后续人脸分类的统计。其中,数据列动态扩展可以是指每一个数据列记录一种属性,数据列的动态扩展,实质就是从图片中提取的属性的扩展。
步骤S304,对每个子区域对应的特征数据进行分类统计,得到每个子区域对应的一级分类结果;其中,该一级分类结果中,同一个人的人脸图像的特征数据属于同一类别;
步骤S306,如果子区域中,存在一级分类结果中的类别数量满足第一预设数量阈值的目标子区域,针对目标子区域的一级分类结果中的每个特征数据,将当前特征数据与指定区域的二级分类结果进行相似度匹配;
上述一级分类结果中的每个特征数据对应一个人,该特征数据中可以包含这个人的年龄、性别、身高、体重等特征。由于指定区域的二级分类结果由各个子区域的一级分类结果统计得到,因而在初始状态下,指定区域的二级分类结果为空,没有特征数据。又由于一个子区域中的一级分类结果中不存在重复的人脸图像的特征数据,因此该情况下,第一个目标子区域中的特征数据与二级分类结果的相似度匹配均较低,即二级分类结果中不存在与目标子区域中的人脸图像的特征数据相同的特征数据。
举例说明上述步骤S306的实现过程,所有目标子区域的一级分类结果按照预设的顺序,可以是采集按照采集的时间顺序,逐一确定当前人脸图像的特征数据,每个当前人脸图像的特征数据中包括年龄、性别、身高、体重等特征子数据,然后将每个特征子数据与二级分类结果中各个人脸图像的特征数据中的相应的特征子数据进行相似度匹配,完成当前人脸图像的特征数据的匹配,然后再从一级分类结果中重新确定新的当前人脸图像的特征数据,直到所有目标子区域的一级分类结果中的特征数据匹配完成。
上述特征数据或特征子数据相似度匹配的过程,可以采用各种距离公式计算相互匹配的两个数据之间的距离,如欧式距离公式、余弦距离公式等;根据预设的距离阈值,确定两个数据之间是否匹配;比如,如果距离小于或等于预设的距离阈值,则可以确定两个数据相互匹配,如果距离大于预设的距离阈值,则可以确定两个数据不匹配。
另一种实施方式中,参见图4所示,为了使相似度匹配过程更加简单高效,可以按照预设的并行度,将指定区域的二级分类结果进行分块处理,得到多个分块数据;将所有目标子区域的特征数据同时与每个分块数据进行相似度匹配,并行的进行相似度匹配,可以减少计算时间。举例说明,比如,指定区域的二级分类结果有100个类别,将该100个类别进行分块处理,得到5个分块数据,每块有20个类别,所有目标子区域的一级分类结果有10个类别,将这10个类别同时与每个分块数据中的20个类别的所有特征数据进行相似度匹配,直到这10个类别的特征数据与每块20个类别的特征数据匹配完成。
步骤S308,如果二级分类结果中存在相似度满足预设相似度阈值的目标特征数据,将当前特征数据归入目标特征数据所属的类别中;
在开始进行相似度匹配之前,该指定区域的二级分类结果可能是空的,没有特征数据。而且一个子区域中的一级分类结果中不存在重复的人脸图像的特征数据,第一个目标子区域的人脸图像的特征数据与二级分类结果中的特征数据将进行相似度匹配,其结果均不满足预设相似度阈值。因此,在第一个目标子区域的人脸图像的特征数据与二级分类结果中的特征数据相似度匹配完成之后,第二个目标子区域与二级分类结果进行匹配时,才可能会存在相似度满足预设相似度阈值的目标特征数据,即二级分类结果中存在与目标子区域的人脸图像的特征数据相同的特征数据,这两个特征数据属于同一类别。
由于不同目标子区域的一级分类结果可能会存在相同的类别,因此若进行相似度匹配的特征数据,相似度满足预设相似度阈值,即匹配到该特征数据所属的类别,说明该特征数据所属类别已经存在,然后将拥有相同特征类别的特征数据归为一类,具体可以标识上相同的类别标识,该过程相当于过滤掉了一级分类结果中重复的类别。
步骤S310,如果二级分类结果中不存在相似度满足预设相似度阈值的目标特征数据,新建类别,将当前特征数据归入新建的类别中;得到统计后的二级分类结果;
上述二级分类结果中不存在相似度满足预设相似度阈值的目标特征数据,即二级分类结果中不存在与目标子区域中的人脸图像的特征数据相同的特征数据,没有匹配到该特征数据所属的类别,这种情况下需要建立新的类别,将目标子区域中不满足预设相似度阈值的特征数据统计到新建的类别中。例如,设置一个新的类别标识,为目标子区域中不满足预设相似度阈值的特征数据添加该新的类别标识。
步骤S312,根据统计后的二级分类结果,确定指定区域的人流特征。
本发明实施例提供的一种统计人流特征的方法,首先获取指定区域内每个子区域的人脸图像的特征数据;然后对每个子区域对应的特征数据进行分类统计,得到每个子区域对应的一级分类结果;如果子区域中,存在一级分类结果中的类别数量满足第一预设数量阈值的目标子区域,针对目标子区域的一级分类结果中的每个特征数据,当前特征数据与指定区域的二级分类结果进行相似度匹配;判断二级分类结果中是否存在相似度满足预设相似度阈值的目标特征数据,存在则将当前特征数据归入目标特征数据所属的类别中,不存在则将当前特征数据归入新建的类别中;得到统计后的二级分类结果;最后根据统计后的二级分类结果,确定指定区域的人流特征。该方式中,当指定区域范围较大时,可以划分为多个子区域,先统计各个子区域,基于各个子区域的统计结果,再统计整个指定区域;相对于现有的基于区域内所有数据进行统计的方式,这种多层级统计的方式,有助于降低统计数据的运算量,提高了计算效率,从而可以实时地进行统计人流特征。
本发明实施例还提供另一种统计人流特征的方法,该方法在上述实施例方法的基础上实现;该方法重点描述得到每个子区域的一级分类结果的步骤之后的具体步骤(通过步骤S506以及步骤S514实现),以及根据统计后的二级分类结果,确定指定区域的人流特征的具体过程(通过步骤S516实现)。如图5所示,该方法包括以下步骤:
步骤S502,获取指定区域内每个子区域的人脸图像的特征数据;
步骤S504,对每个子区域对应的特征数据进行分类统计,得到每个子区域对应的一级分类结果;其中,该一级分类结果中,同一个人的人脸图像的特征数据属于同一类别;
步骤S506,针对每个子区域,计算当前子区域的一级分类结果中,各个特征数据的均值特征;将该均值特征确定为当前子区域的区域特征;
上述均值特征可以是每个子区域的一级分类结果中,各个特征数据的平均值,上述均值特征的个数与特征数据的种类相对应,最后得到多个均值特征。举例说明,当前子区域的一级分类结果中,有100个类别,每个类别的特征数据包括人脸图像的年龄、性别、身高、体重四种特征数据,分别计算100个类别的4种特征数据的平均值,将4种特征数据的平均值组成一个特征向量,将该特征向量确定为当前子区域的区域特征。
步骤S508,如果子区域中,存在一级分类结果中的类别数量满足第一预设数量阈值的目标子区域,针对目标子区域的一级分类结果中的每个特征数据,将当前特征数据与指定区域的二级分类结果进行相似度匹配;
步骤S510,如果二级分类结果中存在相似度满足预设相似度阈值的目标特征数据,将当前特征数据归入目标特征数据所属的类别中;
步骤S512,如果二级分类结果中不存在相似度满足预设相似度阈值的目标特征数据,新建类别,将当前特征数据归入新建的类别中;得到统计后的二级分类结果;
步骤S514,清空当前子区域对应的一级分类结果;
由于视频采集具有时序性,一级分类结果采集的是预设时间段内(如一小时、半天或者一天)的人脸图像的特征数据,因此完成指定区域的二级分类结果统计后,需要清空当前子区域对应的一级分类结果,以便后续计算每个子区域的人脸图像的特征数据,并对每个子区域对应的特征数据进行新一轮的分类统计,得到新的每个子区域对应的一级分类结果。
步骤S516,根据统计后的二级分类结果,确定指定区域的人流特征。
根据统计后的二级分类结果,确定指定区域的人流特征,可以得到以下多种可能的结果:
一、根据统计后的二级分类结果,计算指定区域的总人流量;当指定区域中每个子区域的一级分类结果的类别数量均达到了第一预设数量阈值,则上述统计后的二级分类结果包括了指定区域的所有人脸图像的特征数据。在上述情况下,指定区域的总人流量可以是上述统计后的二级分类结果的类别数量,通过计算该类别的数量即可得到预设时间段内指定区域的总人流量。
二、根据统计后的二级分类结果,统计指定区域中的指定人流特征属性对应的人流量;其中统计后的二级分类结果的特征数据,可能包括多种特征;上述指定人流特征属性具体可以为指定性别、指定年龄段、指定体貌特征等,比如,可以计算指定区域中性别是男性的特征数据所属的类别数量,通过计算该类别数量即可得到预设时间段内指定区域男性的人流数量,同样的方式,也可以得到指定年龄段在18-25岁人流数量,或者年龄在18-25岁,男性的人流数量。
三、根据统计后的二级分类结果,确定指定区域中的热点区域;其中,热点区域为人流量高于第二预设数量阈值的区域,比如,该第二预设数量阈值可以是800。由于每个特征数据中可以携带有区域标识,因此可以根据统计后二级分类结果的特征数据中携带的区域标识,统计不同区域标识的类别数量,该类别数量相当于人流量,当该类别数量高于第二预设数量阈值时,该区域即为热点区域;另外,还可以根据该热点区域内的特征数据,确定该热点区域中的人流特征属性。
四、计算二级分类结果中,各个特征数据的均值特征和/或中值特征,得到计算结果;将计算结果确定为指定区域的区域特征。由于统计后的二级分类结果所包含的特征数据是多个目标子区域中一级分类结果的特征数据,相比每个子区域的一级分类结果的特征数据会多,因此需要计算各个特征数据的均值特征和中值特征,用多种特征表示指定区域的区域特征会更加准确,同时更加丰富的表示该区域特征的特点。当然,也可以采用均值特征或中值特征之一表示指定区域的区域特征。
本发明提供的另一种统计人流特征的方法,首先获取指定区域内每个子区域的人脸图像的特征数据;然后对每个子区域对应的特征数据进行分类统计,得到每个子区域对应的一级分类结果;针对每个子区域,计算当前子区域的一级分类结果中,各个特征数据的均值特征;将该均值特征确定为当前子区域的区域特征;如果子区域中,存在一级分类结果中的类别数量满足第一预设数量阈值的目标子区域,将目标子区域的一级分类结果统计至指定区域当前的二级分类结果中,得到统计后的二级分类结果;清空当前子区域对应的一级分类结果;最后根据统计后的二级分类结果,确定指定区域的人流特征。该方式中,当指定区域范围较大时,可以划分为多个子区域,先统计各个子区域,基于各个子区域的统计结果,再统计整个指定区域;相对于现有的基于区域内所有数据进行统计的方式,这种多层级统计的方式,有助于降低统计数据的运算量,提高了计算效率,从而可以实时地进行统计人流特征。
本发明实施例还提供了另一种统计人流特征的方法,该方法应用于运行有Cassandra数据库的服务器;该Cassandra数据库与PostgreSQL引擎通信连接;该Cassandra数据库用于存储人脸图像、一级分类结果和二级分类结果;该方法在上述实施例方法的基础上实现;该方法重点描述获取指定区域内每个子区域的人脸图像的特征数据的步骤之前的具体步骤(通过步骤S602-步骤S604实现),如图6所示,该方法包括以下步骤:
步骤S602,通过PostgreSQL引擎获取统计算子;
参见图1所示,上述统计算子可以是人脸分类统计算子、指标计算统计算子,上述PostgreSQL引擎可以包含查询引擎、执行引擎、存储引擎等;具体可以通过PostgreSQL引擎的外部调用的作用,获取上述统计算子。
步骤S604,在运行有Cassandra数据库的服务器上运行统计算子,通过统计算子执行下述统计人流特征的方法步骤;
上述PostgreSQL引擎可以将上述统计算子调用至Cassandra数据库的服务器上,在该服务器中利用人脸分类统计算子,进行特征数据的分类、人流特征等计算统计,利用指标计算统计算子,进行运行指标数据计算、轨迹计算、时空聚合计算和关联分析计算,可以得到指定区域的总客流量、进店率、顾客属性、热点区域等,最终帮助商业地产解决招商、店面布局、精准营销、品牌管理精细化运营的问题,达到商场智能化运营的目的。
步骤S606,获取指定区域内每个子区域的人脸图像的特征数据;
步骤S608,对每个子区域对应的特征数据进行分类统计,得到每个子区域对应的一级分类结果;其中,该一级分类结果中,同一个人的人脸图像的特征数据属于同一类别;
步骤S610,针对每个子区域,计算当前子区域的一类分类结果中,各个特征数据的均值特征;将该均值特征确定为当前子区域的区域特征;
步骤S612,如果子区域中,存在一级分类结果中的类别数量满足第一预设数量阈值的目标子区域,针对目标子区域的一级分类结果中的每个特征数据,将当前特征数据与指定区域的二级分类结果进行相似度匹配;
步骤S614,如果二级分类结果中存在相似度满足预设相似度阈值的目标特征数据,将当前特征数据归入目标特征数据所属的类别中;
步骤S616,如果二级分类结果中不存在相似度满足预设相似度阈值的目标特征数据,新建类别,将当前特征数据归入新建的类别中;得到统计后的二级分类结果;
步骤S618,清空当前子区域对应的一类分类结果;
步骤S620,根据统计后的二级分类结果,确定指定区域的人流特征。
上述方法还包括,当需要统计的目标区域较大时,上述指定区域也可以作为目标区域的子区域;该目标区域可以包含多个指定区域,基于每个指定区域的二级分类结果,按照上述方式,统计得到目标区域对应的三级分类结果。
具体地,对每个指定区域对应的特征数据进行分类统计,得到每个指定区域对应的二级分类结果;如果指定区域中,存在二级分类结果中的类别数量满足第二预设数量阈值的目标指定区域,将目标指定区域的二级分类结果统计至目标区域当前的三级分类结果中,得到统计后的三级分类结果;根据统计后的三级分类结果,确定目标区域的人流特征。具体的实现过程与将一级分类结果的目标子区域的人脸图像的特征数据统计至二级分类结果的方法一致,因此可以参考上述实施例,在此不再赘述。
本发明提供的另一种统计人流特征的方法,首先通过PostgreSQL引擎获取统计算子;在运行有Cassandra数据库的服务器上运行该统计算子,通过统计算子执行统计人流特征的方法;然后获取指定区域内每个子区域的人脸图像的特征数据;对每个子区域对应的特征数据进行分类统计,得到每个子区域对应的一级分类结果;如果子区域中,存在一级分类结果中的类别数量满足第一预设数量阈值的目标子区域,将目标子区域的一级分类结果统计至指定区域当前的二级分类结果中,得到统计后的二级分类结果;最后根据统计后的二级分类结果,确定指定区域的人流特征。该方式中,通过PostgreSQL引擎将统计算子直接运行在Cassandra数据库,避免了计算过程中的数据传输;同时多层级统计的方式,有助于降低统计数据的运算量,提高了计算效率,从而可以实时地进行统计人流特征。
本发明实施例还提供了一种具体的统计人流特征的方法的实施方式,本实施例所述的人脸归档,包括小档归档、中档归档和大档归档,对应上述实施例所述的一级分类统计、二级分类统计和三级分类统计;小档档案、中档档案和大档档案,对应上述实施例所述的一级分类结果、二级分类结果和三级分类结果;人脸特征档案对应上述实施例所述的指定区域的区域特征。
为了便于理解,该实施例提供一种具体的应用场景,如图7所示的另一种统计人流特征的方法应用场景示意图,通过视频结构化处理模块的摄像头采集人流视频信息,形成非结构化的视频流数据,对视频流进行抽帧,提取抓拍信息,包括人脸特征和性别、年龄等属性信息,将上述人脸图像的特征数据作为视频结构化日志,写入消息队列;由于视频结构化日志是后续计算的基础,具有数量大、数据列动态扩展的特点,因此,可以将视频结构化日志输出存储在Cassandra数据库,以满足实时检索的需求,支撑后续人脸归档的统计;然后利用人脸归档计算模块,对每个抓拍人脸图像的人脸特征进行聚类,形成人脸档案用于计算客流;最后数据加工模块根据人脸归档计算模块产生的基础数据,实施并行计算,生成运营数据指标。
首先,参见图8所示的一种小档档案计算过程算法时序图,利用图8中的多个分摄像头并行获取指定区域每个子区域的人脸图像的特征数据,图8中的分摄像头并行可以理解为:将指定区域预先划分为多个子区域,每个子区域设置有至少一个摄像头,用于采集进入该子区域的人群的人脸图像的特征数据;还可以将该人脸图像的特征数据进行标识,包括抓拍ID、抓拍时间戳及跟踪ID等信息。将上述信息存储在人脸抓拍库,其中,抓拍ID可以是人脸图像的特征数据采集的摄像头位置信息,人脸特征可以是上述每个子区域的人脸图像的特征数据,抓拍时间戳可以是人脸图像的特征数据采集的当前时刻,跟踪ID可以是人脸图像的特征数据的类别标识,即一个人对应一个类别标识,即一个跟踪ID。一个子区域的一级分类结果相当于一个小档档案,利用小档归档算子,将每个小档档案的人脸图像的特征数据进行聚类,每个人分为一类,过滤重复的人脸图像的特征数据,每个人会分为一类别,然后统计为该子区域对应的小档档案。最后取所有小档档案中的各个人脸图像的特征数据的均值代表小档档案特征,也可以称为L1人脸档案特征,然后将小档档案中的特征数据、该L1人脸档案特征、抓拍ID列表等放入人脸小档库。若小档档案中的类别数量满足预设的阈值时,将小档档案的特征数据传输到中档档案计算步骤。
参见图9所示为一种中档档案计算过程算法时序图,如果人脸小档库的小档档案中存在满足第一预设数量阈值的目标小档档案,即目标子区域的一级分类结果,将该目标小档档案的特征数据统计至指定区域当前的中档档案中,得到统计后的中档档案。上述目标小档档案相当于图中所示的小档信息(T),因为数据采集具有时序性,所以图中的中档信息(T-1)相当于上一段时间统计的中档档案,需要把目标小档档案与原来的中档档案进行合并统计,相当于持续更新的过程。由于各个目标小档档案之间可能会有大量重复的人,统计至中档档案的过程,利用中档归档算子,将目标小档档案中的特征数据与所有的中档档案中的特征数据进行相似度匹配,满足预设阈值,说明这上述两个特征数据拥有一个特征类别,则将拥有一个特征类别的特征数据归为一类,即归入中档档案中该特征数据所属的类别,否则重新建立新的类别。然后,取中档档案中的所有特征数据的均值和中值作为中档档案特征,也可以称为L2人脸档案特征,当然也可以是均值或者中值其中的一个作为L2人脸档案特征。
新增的L2档案特征(即新增类别中的特征数据)和归入该新增的L2档案特征的抓拍ID列表,原中档档案中已有类别的特征数据L2和对应的抓拍ID列表(即L2-ID列表)、以及归入该中档档案中已有类别的小档档案的特征数据和对应的抓拍ID列表(即L1-ID列表),最终通过中档特征算子得到中档档案,也可以称为L2特征档案,即统计后的二级分类结果,放入人脸中档库,并清空人脸小档库。当人脸中档库的类别数量满足预设阈值,传输到大档档案计算步骤。
参见图10所示为一种大档档案计算过程算法时序图,如果中档档案中存在满足第一预设数量阈值的目标中档档案,即热点区域的二级分类结果,将该目标中档档案的特征数据统计至指定区域当前的大档档案中,得到统计后的大档档案。上述目标中档档案相当于图中所示的中档信息(T),因为数据采集具有时序性,所以图中的大档信息(T-1)相当于上一段时间统计的大档档案,需要把目标中档档案与原来的大档档案进行合并统计,相当于持续更新的过程。对所有大档档案进行哈希(hash,一种散列函数)分块,增加算法的并行度,目标中档档案的特征数据,利用大档MR(MapReduce,映射归约)算子,并行与每个分块的大档档案的特征数据进行相似度匹配,若当前目标中档档案的特征数据与分块的大档档案的特征数据的相似度值满足预设阈值,说明上述两个特征数据拥有一个特征类别,则将拥有一个特征类别的特征数据归为一类,即归入大档档案中该特征数据所属的类别,否则重新建立新的人脸类别,计算每个分块大档档案的所有特征数据的均值和中值作为大档档案的特征值,当然也可以是均值或者中值其中的一个作为大档档案的特征值。
新增的L3档案特征(即新增类别中的特征数据)和归入该新增的L3档案特征的抓拍ID列表,原大档档案中已有类别的特征数据L3和对应的抓拍ID列表(即L3-ID列表)、以及归入该大档档案中已有类别的中档档案的特征数据和对应的抓拍ID列表(即L2-ID列表),最终通过大档特征算子得到大档档案,也可以称为L3特征档案,即统计后的三级分类结果,放入人脸大档库,并清空人脸中档库。最后,基于上述L3特征档案,进行运营指标数据计算、轨迹计算、时空聚合计算和关联分析计算,将计算结果以业务表的形式输出到业务端。
其中,上述小档归档算子、中档归档算子、大档MR算子、中档特征算子、大档特征算子,可以从PostgreSQL引擎获取,再在运行有Cassandra数据库的服务器上运行;该归档算子、特征算子具体可以为前述实施例中的统计算子,通过统计算子执行上述小档档案、中档档案、大档档案计算过程。
另外,本发明不仅限于上述实施例所述的二级或三级分类,需要根据实际情况增加或减少分级的层数,层数在此不做限制。
上述具体的统计人流特征的方法实施例,该方式可以通过FDW(Foreign-DataWrapper)解决多源异构数据融合计算的问题,并且可以利用in-database compute的计算模式,减少计算过程中的数据拷贝过程,对计算性能有很大的提升。同时提出一种分层次人脸聚类的方法,该方法中,当指定区域范围较大时,可以划分为多个子区域,先统计各个子区域,基于各个子区域的统计结果,再统计整个指定区域;相对于现有的基于区域内所有数据进行统计的方式,这种多层级统计的方式,有助于降低统计数据的运算量,提高了计算效率,从而可以实时地进行统计人流特征。
对应于上述统计人流特征的方法实施例,本发明实施例还提供了一种统计人流特征的装置,如图11所示,该装置包括:
特征数据获取模块111,用于获取指定区域内每个子区域的人脸图像的特征数据;
特征数据分类模块112,用于对每个子区域对应的特征数据进行分类统计,得到每个子区域对应的一级分类结果;其中,一级分类结果中,同一个人的人脸图像的特征数据属于同一类别;
类别数量判断模块113,用于如果子区域中,存在一级分类结果中的类别数量满足第一预设数量阈值的目标子区域,将目标子区域的一级分类结果统计至指定区域当前的二级分类结果中,得到统计后的二级分类结果;
人流特征确定模块114,用于根据统计后的二级分类结果,确定指定区域的人流特征。
进一步地,上述特征数据分类模块还用于:针对目标子区域的一级分类结果中的每个特征数据,将当前特征数据与指定区域的二级分类结果进行相似度匹配;如果二级分类结果中存在相似度满足预设相似度阈值的目标特征数据,将当前特征数据归入目标特征数据所属的类别中;如果二级分类结果中不存在相似度满足预设相似度阈值的目标特征数据,新建类别,将当前特征数据归入新建的类别中。
进一步地,上述特征数据分类模块还用于,按照预设的并行度,将指定区域的二级分类结果进行分块处理,得到多个分块数据;将当前特征数据分别与每个分块数据进行相似度匹配。
进一步地,上述装置还包括:均值特征计算模块,用于针对每个子区域,计算当前子区域的一类分类结果中,各个特征数据的均值特征;将均值特征确定为当前子区域的区域特征;分类结果清空模块,用于清空当前子区域对应的一类分类结果。
进一步地,上述人流特征确定模块还用于至少下述之一:根据统计后的二级分类结果,计算指定区域的总人流量;根据统计后的二级分类结果,统计指定区域中的指定人流特征属性对应的人流量;根据统计后的二级分类结果,确定指定区域中的热点区域;其中,热点区域为人流量高于第二预设数量阈值的区域;计算二级分类结果中,各个特征数据的均值特征和/或中值特征,得到计算结果;将计算结果确定为指定区域的区域特征。
进一步地,上述装置设置于运行有Cassandra数据库的服务器;该Cassandra数据库与PostgreSQL引擎通信连接;该Cassandra数据库用于存储人脸图像、一级分类结果和二级分类结果;
进一步地,上述装置还包括:统计算子获取模块,用于通过PostgreSQL引擎获取统计算子;统计算子执行模块,用于在运行有Cassandra数据库的服务器上运行统计算子,通过统计算子执行统计人流特征的方法。
本发明实施例提供的一种统计人流特征的装置,首先获取指定区域内每个子区域的人脸图像的特征数据;然后对每个子区域对应的特征数据进行分类统计,得到每个子区域对应的一级分类结果;如果子区域中,存在一级分类结果中的类别数量满足第一预设数量阈值的目标子区域,将目标子区域的一级分类结果统计至指定区域当前的二级分类结果中,得到统计后的二级分类结果;最后根据统计后的二级分类结果,确定指定区域的人流特征。该方式中,当指定区域范围较大时,可以划分为多个子区域,先统计各个子区域,基于各个子区域的统计结果,再统计整个指定区域;相对于现有的基于区域内所有数据进行统计的方式,这种多层级统计的方式,有助于降低统计数据的运算量,提高了计算效率,从而可以实时地进行统计人流特征。
本发明实施例所提供的统计人流特征的装置,其实现原理及产生的技术效果和前述统计人流特征的方法实施例相同,为简要描述,统计人流特征的装置实施例部分未提及之处,可参考前述流量调度方法实施例中相应内容。
本发明实施例还提供一种服务器,参见图12所示,包括处理器和存储器,存储器存储有能够被处理器执行的机器可执行指令,处理器执行机器可执行指令以实现上述统计人流特征的方法。
进一步地,图12所示的服务器还包括总线132和通信接口133,处理器130、通信接口133和存储器131通过总线132连接。
其中,存储器131可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口133(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。总线132可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图12中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
处理器130可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器130中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器130可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DigitalSignal Processing,简称DSP)、专用集成电路(Application Specific IntegratedCircuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器131,处理器130读取存储器131中的信息,结合其硬件完成前述实施例的方法的步骤。
本发明实施例还提供了一种机器可读存储介质,该机器可读存储介质存储有机器可执行指令,该机器可执行指令在被处理器调用和执行时,该机器可执行指令促使处理器实现上述统计人流特征的方法,具体实现可参见方法实施例,在此不再赘述。
本发明实施例所提供的统计人流特征的方法和装置及服务器的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (12)
1.一种统计人流特征的方法,其特征在于,所述方法包括:
获取指定区域内每个子区域的人脸图像的特征数据;
对每个所述子区域对应的特征数据进行分类统计,得到每个所述子区域对应的一级分类结果;其中,所述一级分类结果中,同一个人的人脸图像的特征数据属于同一类别;
如果所述子区域中,存在一级分类结果中的类别数量满足第一预设数量阈值的目标子区域,将所述目标子区域的一级分类结果统计至所述指定区域当前的二级分类结果中,得到统计后的二级分类结果;
根据所述统计后的二级分类结果,确定所述指定区域的人流特征。
2.根据权利要求1所述的方法,其特征在于,将所述目标子区域的一级分类结果统计至所述指定区域当前的二级分类结果中的步骤,包括:
针对所述目标子区域的一级分类结果中的每个特征数据,将当前特征数据与所述指定区域的二级分类结果进行相似度匹配;
如果所述二级分类结果中存在相似度满足预设相似度阈值的目标特征数据,将所述当前特征数据归入所述目标特征数据所属的类别中;
如果所述二级分类结果中不存在相似度满足预设相似度阈值的目标特征数据,新建类别,将所述当前特征数据归入新建的所述类别中。
3.根据权利要求2所述的方法,其特征在于,将当前特征数据与所述指定区域的二级分类结果进行相似度匹配的步骤,包括:
按照预设的并行度,将所述指定区域的二级分类结果进行分块处理,得到多个分块数据;
将当前特征数据分别与每个所述分块数据进行相似度匹配。
4.根据权利要求1所述的方法,其特征在于,得到每个所述子区域的一级分类结果的步骤之后,所述方法还包括:
针对每个所述子区域,计算当前子区域的一级分类结果中,各个特征数据的均值特征;将所述均值特征确定为所述当前子区域的区域特征;
清空所述当前子区域对应的一级分类结果。
5.根据权利要求1所述的方法,其特征在于,根据所述统计后的二级分类结果,确定所述指定区域的人流特征的步骤,至少包括下述之一:
根据所述统计后的二级分类结果,计算所述指定区域的总人流量;
根据所述统计后的二级分类结果,统计所述指定区域中的指定人流特征属性对应的人流量;
根据所述统计后的二级分类结果,确定所述指定区域中的热点区域;其中,所述热点区域为人流量高于第二预设数量阈值的区域;
计算所述二级分类结果中,各个特征数据的均值特征和/或中值特征,得到计算结果;将所述计算结果确定为所述指定区域的区域特征。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述方法应用于运行有Cassandra数据库的服务器;所述Cassandra数据库与PostgreSQL引擎通信连接;所述Cassandra数据库用于存储人脸图像、所述一级分类结果和所述二级分类结果;
所述获取指定区域内每个子区域的人脸图像的特征数据的步骤之前,所述方法还包括:
通过所述PostgreSQL引擎获取统计算子;
在所述运行有Cassandra数据库的服务器上运行所述统计算子,通过所述统计算子执行所述统计人流特征的方法。
7.一种统计人流特征的装置,其特征在于,所述装置包括:
特征数据获取模块,用于获取指定区域内每个子区域的人脸图像的特征数据;
特征数据分类模块,用于对每个所述子区域对应的特征数据进行分类统计,得到每个所述子区域对应的一级分类结果;其中,所述一级分类结果中,同一个人的人脸图像的特征数据属于同一类别;
类别数量判断模块,用于如果所述子区域中,存在一级分类结果中的类别数量满足第一预设数量阈值的目标子区域,将所述目标子区域的一级分类结果统计至所述指定区域当前的二级分类结果中,得到统计后的二级分类结果;
人流特征确定模块,用于根据所述统计后的二级分类结果,确定所述指定区域的人流特征。
8.根据权利要求7所述的装置,其特征在于,所述特征数据分类模块还用于:
针对所述目标子区域的一级分类结果中的每个特征数据,将当前特征数据与所述指定区域的二级分类结果进行相似度匹配;
如果所述二级分类结果中存在相似度满足预设相似度阈值的目标特征数据,将所述当前特征数据归入所述目标特征数据所属的类别中;
如果所述二级分类结果中不存在相似度满足预设相似度阈值的目标特征数据,新建类别,将所述当前特征数据归入新建的所述类别中。
9.根据权利要求8所述的装置,其特征在于,所述特征数据分类模块还用于:
按照预设的并行度,将所述指定区域的二级分类结果进行分块处理,得到多个分块数据;
将当前特征数据分别与每个所述分块数据进行相似度匹配。
10.根据权利要求7所述的装置,其特征在于,所述装置还包括:
均值特征计算模块,用于针对每个所述子区域,计算当前子区域的一类分类结果中,各个特征数据的均值特征;将所述均值特征确定为所述当前子区域的区域特征;
分类结果清空模块,用于清空所述当前子区域对应的一类分类结果。
11.一种服务器,其特征在于,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的机器可执行指令,所述处理器执行所述机器可执行指令以实现权利要求1-6任一项所述的统计人流特征的方法。
12.一种机器可读存储介质,其特征在于,所述机器可读存储介质存储有机器可执行指令,所述机器可执行指令在被处理器调用和执行时,所述机器可执行指令促使所述处理器实现权利要求1-6任一项所述的统计人流特征的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911146379.6A CN112906725A (zh) | 2019-11-19 | 2019-11-19 | 统计人流特征的方法、装置及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911146379.6A CN112906725A (zh) | 2019-11-19 | 2019-11-19 | 统计人流特征的方法、装置及服务器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112906725A true CN112906725A (zh) | 2021-06-04 |
Family
ID=76103565
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911146379.6A Pending CN112906725A (zh) | 2019-11-19 | 2019-11-19 | 统计人流特征的方法、装置及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112906725A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113822367A (zh) * | 2021-09-29 | 2021-12-21 | 重庆紫光华山智安科技有限公司 | 一种基于人脸的区域行为分析方法、系统及介质 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013175792A1 (ja) * | 2012-05-23 | 2013-11-28 | パナソニック株式会社 | 人物属性推定システム、及び学習用データ生成装置 |
CN104092988A (zh) * | 2014-07-10 | 2014-10-08 | 深圳市中控生物识别技术有限公司 | 一种公共场合客流管理方法、装置及系统 |
CN104123776A (zh) * | 2014-07-31 | 2014-10-29 | 上海汇纳信息科技股份有限公司 | 一种基于图像的对象统计方法及系统 |
US20150332087A1 (en) * | 2014-05-15 | 2015-11-19 | Fuji Xerox Co., Ltd. | Systems and Methods for Identifying a User's Demographic Characteristics Based on the User's Social Media Photographs |
CN106127812A (zh) * | 2016-06-28 | 2016-11-16 | 中山大学 | 一种基于视频监控的客运站非出入口区域的客流统计方法 |
CN106570465A (zh) * | 2016-10-31 | 2017-04-19 | 深圳云天励飞技术有限公司 | 一种基于图像识别的人流量统计方法及装置 |
CN108280387A (zh) * | 2017-01-05 | 2018-07-13 | 厦门雅迅网络股份有限公司 | 车辆客流量统计方法及系统 |
CN108985218A (zh) * | 2018-07-10 | 2018-12-11 | 上海小蚁科技有限公司 | 人流量统计方法及装置、存储介质、计算设备 |
WO2019051795A1 (zh) * | 2017-09-15 | 2019-03-21 | 广东欧珀移动通信有限公司 | 图像处理方法、装置、终端、服务器和计算机可读存储介质 |
CN109711370A (zh) * | 2018-12-29 | 2019-05-03 | 北京博睿视科技有限责任公司 | 一种基于wifi探测和人脸聚类的数据融合算法 |
CN110059657A (zh) * | 2019-04-25 | 2019-07-26 | 北京旷视科技有限公司 | 档案处理方法、装置、电子设备及计算机可读存储介质 |
CN110263703A (zh) * | 2019-06-18 | 2019-09-20 | 腾讯科技(深圳)有限公司 | 人员流量统计方法、装置和计算机设备 |
CN110378314A (zh) * | 2019-05-31 | 2019-10-25 | 北京金山云网络技术有限公司 | 一种人脸区域图像归档方法、装置、电子设备及存储介质 |
CN110458053A (zh) * | 2019-07-26 | 2019-11-15 | 中国安全生产科学研究院 | 一种有效监控区域划分方法及视频客流计数方法 |
-
2019
- 2019-11-19 CN CN201911146379.6A patent/CN112906725A/zh active Pending
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013175792A1 (ja) * | 2012-05-23 | 2013-11-28 | パナソニック株式会社 | 人物属性推定システム、及び学習用データ生成装置 |
US20150332087A1 (en) * | 2014-05-15 | 2015-11-19 | Fuji Xerox Co., Ltd. | Systems and Methods for Identifying a User's Demographic Characteristics Based on the User's Social Media Photographs |
CN104092988A (zh) * | 2014-07-10 | 2014-10-08 | 深圳市中控生物识别技术有限公司 | 一种公共场合客流管理方法、装置及系统 |
CN104123776A (zh) * | 2014-07-31 | 2014-10-29 | 上海汇纳信息科技股份有限公司 | 一种基于图像的对象统计方法及系统 |
CN106127812A (zh) * | 2016-06-28 | 2016-11-16 | 中山大学 | 一种基于视频监控的客运站非出入口区域的客流统计方法 |
CN106570465A (zh) * | 2016-10-31 | 2017-04-19 | 深圳云天励飞技术有限公司 | 一种基于图像识别的人流量统计方法及装置 |
CN108280387A (zh) * | 2017-01-05 | 2018-07-13 | 厦门雅迅网络股份有限公司 | 车辆客流量统计方法及系统 |
WO2019051795A1 (zh) * | 2017-09-15 | 2019-03-21 | 广东欧珀移动通信有限公司 | 图像处理方法、装置、终端、服务器和计算机可读存储介质 |
CN108985218A (zh) * | 2018-07-10 | 2018-12-11 | 上海小蚁科技有限公司 | 人流量统计方法及装置、存储介质、计算设备 |
CN109711370A (zh) * | 2018-12-29 | 2019-05-03 | 北京博睿视科技有限责任公司 | 一种基于wifi探测和人脸聚类的数据融合算法 |
CN110059657A (zh) * | 2019-04-25 | 2019-07-26 | 北京旷视科技有限公司 | 档案处理方法、装置、电子设备及计算机可读存储介质 |
CN110378314A (zh) * | 2019-05-31 | 2019-10-25 | 北京金山云网络技术有限公司 | 一种人脸区域图像归档方法、装置、电子设备及存储介质 |
CN110263703A (zh) * | 2019-06-18 | 2019-09-20 | 腾讯科技(深圳)有限公司 | 人员流量统计方法、装置和计算机设备 |
CN110458053A (zh) * | 2019-07-26 | 2019-11-15 | 中国安全生产科学研究院 | 一种有效监控区域划分方法及视频客流计数方法 |
Non-Patent Citations (3)
Title |
---|
WAN ZHANG 等: "Unsupervized Image Clustering With SIFT-Based Soft-Matching Affinity Propagation", 《IEEE SIGNAL PROCESSING LETTERS》, vol. 24, no. 4, 31 December 2017 (2017-12-31), pages 461 - 464 * |
张强: "基于深度学习的地铁进站客流检测算法研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》, vol. 2019, no. 7, 15 July 2019 (2019-07-15), pages 033 - 127 * |
陈东伟 等: "基于智能视频的客流人数统计系统设计与实现", 《信息技术》, no. 5, 31 December 2016 (2016-12-31), pages 9 - 11 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113822367A (zh) * | 2021-09-29 | 2021-12-21 | 重庆紫光华山智安科技有限公司 | 一种基于人脸的区域行为分析方法、系统及介质 |
CN113822367B (zh) * | 2021-09-29 | 2024-02-09 | 重庆紫光华山智安科技有限公司 | 一种基于人脸的区域行为分析方法、系统及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110428091B (zh) | 基于数据分析的风险识别方法及相关设备 | |
CN110738127A (zh) | 基于无监督深度学习神经网络算法的安全帽识别方法 | |
CN107169106B (zh) | 视频检索方法、装置、存储介质及处理器 | |
US20210357624A1 (en) | Information processing method and device, and storage medium | |
CN109740573B (zh) | 视频分析方法、装置、设备及服务器 | |
CN107480624B (zh) | 常住人口获取方法、装置及系统、计算机装置和存储介质 | |
TWI740537B (zh) | 一種資訊處理方法及裝置、儲存介質 | |
CN110717358B (zh) | 访客人数统计方法、装置、电子设备及存储介质 | |
CN108197544B (zh) | 人脸分析、过滤方法、装置、嵌入式设备、介质和集成电路 | |
WO2021135138A1 (zh) | 一种目标运动轨迹构建方法、设备以及计算机存储介质 | |
CN113378616A (zh) | 视频分析方法、视频分析的管理方法及相关设备 | |
CN111126324B (zh) | 一种多源异构数据融合的方法、装置、计算机设备及介质 | |
CN112364176A (zh) | 一种人员行动轨迹的构建方法、设备及系统 | |
CN111522974A (zh) | 一种实时归档的方法及装置 | |
CN116244609A (zh) | 一种客流量统计方法、装置、计算机设备及存储介质 | |
CN114519879A (zh) | 人体数据归档方法、装置、设备及存储介质 | |
CN112906725A (zh) | 统计人流特征的方法、装置及服务器 | |
CN112925899A (zh) | 排序模型建立方法、案件线索推荐方法、装置及介质 | |
CN105930430B (zh) | 一种基于非累积属性的实时欺诈检测方法及装置 | |
CN113822367B (zh) | 一种基于人脸的区域行为分析方法、系统及介质 | |
Niloy et al. | A novel disaster image data-set and characteristics analysis using attention model | |
CN115439928A (zh) | 一种操作行为识别方法及装置 | |
CN113343060B (zh) | 对象检测方法及装置、电子设备和存储介质 | |
CN113963438A (zh) | 行为识别方法及装置、设备和存储介质 | |
CN113761263A (zh) | 相似度确定方法、装置及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |