CN108229292A - 目标识别方法、装置、存储介质和电子设备 - Google Patents

目标识别方法、装置、存储介质和电子设备 Download PDF

Info

Publication number
CN108229292A
CN108229292A CN201710633604.3A CN201710633604A CN108229292A CN 108229292 A CN108229292 A CN 108229292A CN 201710633604 A CN201710633604 A CN 201710633604A CN 108229292 A CN108229292 A CN 108229292A
Authority
CN
China
Prior art keywords
image
determined
target
information
predicted path
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710633604.3A
Other languages
English (en)
Inventor
沈岩涛
肖桐
李鸿升
伊帅
王晓刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sensetime Technology Development Co Ltd
Original Assignee
Beijing Sensetime Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sensetime Technology Development Co Ltd filed Critical Beijing Sensetime Technology Development Co Ltd
Priority to CN201710633604.3A priority Critical patent/CN108229292A/zh
Publication of CN108229292A publication Critical patent/CN108229292A/zh
Priority to SG11201911625YA priority patent/SG11201911625YA/en
Priority to PCT/CN2018/097374 priority patent/WO2019020103A1/zh
Priority to JP2019557616A priority patent/JP6893564B2/ja
Priority to KR1020197031657A priority patent/KR102339323B1/ko
Priority to US16/565,069 priority patent/US11200682B2/en
Priority to US17/452,776 priority patent/US20220051417A1/en
Priority to US17/453,487 priority patent/US20220058812A1/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • G06V20/47Detecting features for summarising video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks
    • G06F18/295Markov models or related models, e.g. semi-Markov models; Markov random fields; Networks embedding Markov models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/143Segmentation; Edge detection involving probabilistic approaches, e.g. Markov random field [MRF] modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/48Matching video sequences
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • G06V20/54Surveillance or monitoring of activities, e.g. for recognising suspicious objects of traffic, e.g. cars on the road, trains or boats
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Neurology (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Image Analysis (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明实施例提供一种目标识别方法、装置、存储介质和电子设备。其中,所述目标识别方法包括:获取第一图像及第二图像,所述第一图像及所述第二图像中均包含待确定目标;基于所述第一图像及所述第二图像,生成预测路径,所述预测路径的两端分别对应所述第一图像及所述第二图像;对所述预测路径进行有效性判断,基于判断结果,确定所述第一图像及所述第二图像中的待确定目标是否相同。通过本发明实施例,能够对不同图像中的待确定目标是否为同一个待确定目标进行较为精准的检测和识别。

Description

目标识别方法、装置、存储介质和电子设备
技术领域
本发明实施例涉及人工智能技术领域,尤其涉及一种目标识别方法、装置、存储介质和电子设备。
背景技术
交通工具再识别,如车辆再识别,是计算机视觉和公共安全领域的重要内容,其在交通工具检测与跟踪、行进路线估计以及异常行为检测等诸多方面都有重要应用价值。
大多数交通工具再识别的技术都是基于交通工具的外观信息进行判断,不同于行人再识别,单纯利用交通工具外观信息进行交通工具再识别的难点在于许多交通工具如车辆的外观(如颜色、型号、造型等)十分相似。尤其是在同品牌同款的不同交通工具之间,差异将会更加微小。而依赖交通工具标识信息如车辆的车牌信息以及交通工具内装饰物如车内装饰物这些独特细节信息进行检测和识别,则会因为监控镜头角度不佳、光照条件不佳、镜头模糊等因素使检测和识别的鲁棒性变差,导致检测和识别结果不准确。
发明内容
本发明实施例提供了一种目标识别的技术方案。
根据本发明实施例的第一方面,提供了一种目标识别方法。所述方法包括:获取第一图像及第二图像,所述第一图像及所述第二图像中均包含待确定目标;基于所述第一图像及所述第二图像,生成预测路径,所述预测路径的两端分别对应所述第一图像及所述第二图像;对所述预测路径进行有效性判断,基于判断结果,确定所述第一图像及所述第二图像中的待确定目标是否相同。
可选地,所述待确定目标为交通工具。
可选地,所述基于所述第一图像及所述第二图像,生成预测路径之前,所述方法还包括:根据所述第一图像的时间信息、空间信息、图像特征信息,以及,所述第二图像的时间信息、空间信息、图像特征信息,确定所述第一图像及所述第二图像中分别包含的待确定目标的初步相同概率值;相应地,所述基于所述第一图像及所述第二图像,生成预测路径,包括:当所述初步相同概率值大于预设值时,基于所述第一图像及所述第二图像,生成所述预测路径。
可选地,根据所述第一图像的时间信息、空间信息、图像特征信息,以及,所述第二图像的时间信息、空间信息、图像特征信息,确定所述第一图像及所述第二图像中分别包含的待确定目标的初步相同概率值,包括:将所述第一图像和所述第二图像,以及,所述第一图像和所述第二图像之间的时间信息的差异和空间信息的差异输入孪生卷积神经网络Siamese-CNN,获得所述第一图像和第二图像中的待确定目标的初步相同概率值。
可选地,所述基于所述第一图像及所述第二图像,生成预测路径,包括:根据所述第一图像的特征信息、所述第一图像的时间信息、所述第一图像的空间信息、所述第二图像的特征信息、所述第二图像的时间信息、和所述第二图像的空间信息,通过概率模型生成所述待确定目标的预测路径。
可选地,所述通过概率模型生成所述待确定目标的预测路径,包括:通过链状马尔可夫随机场模型MRF从获取的图像集中确定出包含有所述待确定目标的信息、且与所述第一图像和所述第二图像均具有时空序列关系的所有图像;根据确定出的所有图像对应的时间信息和空间信息,生成所述待确定目标的预测路径。
可选地,所述根据确定出的所有图像对应的时间信息和空间信息,生成所述待确定目标的预测路径,包括:根据确定出的所有图像对应的时间信息和空间信息,生成以所述第一图像为首节点且以所述第二图像为尾节点的一条预测路径,其中,所述预测路径除包括所述首节点和所述尾节点外,还包括至少一个中间节点。
可选地,所述通过链状马尔可夫随机场模型MRF从获取的图像集中确定出包含有所述待确定目标的信息、且与所述第一图像和所述第二图像均具有时空序列关系的所有图像,包括:以所述第一图像的空间信息对应的位置为起始位置,以所述第二图像的空间信息对应的位置为终止位置,获取从所述起始位置至所述终止位置之间的所有摄像设备的位置信息;根据所有摄像设备的位置信息所指示的位置之间的关系,以所述起始位置对应的摄像设备为起点,以所述终止位置对应的摄像设备为终点,生成至少一个设备路径,其中,每个设备路径除包括所述起点的摄像设备和所述终点的摄像设备外,还包括至少一个其它摄像设备的信息;针对每一个设备路径,以所述第一图像的时间信息对应的时间为起始时间,以所述第二图像的时间信息对应的时间为终止时间,从当前路径上的每个其它摄像设备拍摄的图像中,确定出与当前摄像设备相邻的前一摄像设备拍摄的包含所述待确定目标的信息的图像具有设定时间序列关系、且包含所述待确定目标的信息的图像。
可选地,所述根据确定出的所有图像对应的时间信息和空间信息,生成以所述第一图像为首节点且以所述第二图像为尾节点的一条预测路径,包括:针对每一个设备路径,根据确定出的所述图像的时间序列关系生成相连的具有时空序列关系的多个中间节点;根据所述首节点、所述尾节点、和所述中间节点,生成与当前设备路径对应的具有时空序列关系的图像路径;从每一个设备路径对应的图像路径中,确定出以所述第一图像为首节点且以所述第二图像为尾节点的最大概率图像路径作为所述待确定目标的预测路径。
可选地,所述从每一个设备路径对应的图像路径中,确定出以所述第一图像为首节点且以所述第二图像为尾节点的最大概率图像路径作为所述待确定目标的预测路径,包括:针对每一个设备路径对应的图像路径,获取所述图像路径中每两个相邻节点的图像之间具有同一个待确定目标的信息的概率;根据所述图像路径中每两个相邻节点的图像之间具有同一个待确定目标的信息的概率计算所述图像路径作为所述待确定目标的预测路径的概率;根据每一个图像路径作为所述待确定目标的预测路径的概率确定最大概率图像路径作为所述待确定目标的预测路径。
可选地,对所述预测路径进行有效性判断,基于判断结果,确定所述第一图像及所述第二图像中的待确定目标是否相同,包括:通过神经网络,对所述预测路径进行有效性判断,基于判断结果,确定所述第一图像和第二图像中的待确定目标是否为同一个待确定目标。
可选地,通过神经网络,对所述预测路径进行有效性判断,基于判断结果,确定所述第一图像和第二图像中的待确定目标是否为同一个待确定目标,包括:根据所述预测路径中的相邻的图像的时间信息,获取相邻的图像的时间差异;根据相邻的图像的空间信息,获取相邻的图像的空间差异;根据相邻的图像中的待确定目标的特征信息,获取相邻的图像中的待确定目标的特征差异;将获得的所述预测路径中相邻的图像的时间差异、空间差异和特征差异输入长短时记忆网络LSTM,获得所述预测路径的待确定目标的识别概率;根据所述预测路径的待确定目标的识别概率,确定所述第一图像和第二图像中的待确定目标是否为同一个待确定目标。
可选地,根据相邻的图像中的待确定目标的特征信息,获取相邻的图像中的待确定目标的特征差异,包括:通过Siamese-CNN分别获取相邻的图像中的待确定目标的特征信息;根据分别获取的所述特征信息,获取相邻的图像中的待确定目标的特征差异。
根据本发明实施例的第二方面,提供了一种目标识别装置。所述装置包括:获取模块,用于获取第一图像及第二图像,所述第一图像及所述第二图像中均包含待确定目标;生成模块,用于基于所述第一图像及所述第二图像,生成预测路径,所述预测路径的两端分别对应所述第一图像及所述第二图像;第一确定模块,用于对所述预测路径进行有效性判断,基于判断结果,确定所述第一图像及所述第二图像中的待确定目标是否相同。
可选地,所述待确定目标为交通工具。
可选地,所述装置还包括:第二确定模块,用于根据所述第一图像的时间信息、空间信息、图像特征信息,以及,所述第二图像的时间信息、空间信息、图像特征信息,确定所述第一图像及所述第二图像中分别包含的待确定目标的初步相同概率值;相应地,所述生成模块,包括:第一生成子模块,用于当所述初步相同概率值大于预设值时,基于所述第一图像及所述第二图像,生成所述预测路径。
可选地,所述第二确定模块,包括:第一确定子模块,用于将所述第一图像和所述第二图像,以及,所述第一图像和所述第二图像之间的时间信息的差异和空间信息的差异输入孪生卷积神经网络Siamese-CNN,获得所述第一图像和第二图像中的待确定目标的初步相同概率值。
可选地,所述生成模块,包括:第二生成子模块,用于根据所述第一图像的特征信息、所述第一图像的时间信息、所述第一图像的空间信息、所述第二图像的特征信息、所述第二图像的时间信息、和所述第二图像的空间信息,通过概率模型生成所述待确定目标的预测路径。
可选地,所述第二生成子模块,包括:第一确定单元,用于通过链状马尔可夫随机场模型MRF从获取的图像集中确定出包含有所述待确定目标的信息、且与所述第一图像和所述第二图像均具有时空序列关系的所有图像;第一生成单元,用于根据确定出的所有图像对应的时间信息和空间信息,生成所述待确定目标的预测路径。
可选地,所述第一生成单元,包括:第二生成单元,用于根据确定出的所有图像对应的时间信息和空间信息,生成以所述第一图像为首节点且以所述第二图像为尾节点的一条预测路径,其中,所述预测路径除包括所述首节点和所述尾节点外,还包括至少一个中间节点。
可选地,所述第一确定单元,具体用于:以所述第一图像的空间信息对应的位置为起始位置,以所述第二图像的空间信息对应的位置为终止位置,获取从所述起始位置至所述终止位置之间的所有摄像设备的位置信息;根据所有摄像设备的位置信息所指示的位置之间的关系,以所述起始位置对应的摄像设备为起点,以所述终止位置对应的摄像设备为终点,生成至少一个设备路径,其中,每个设备路径除包括所述起点的摄像设备和所述终点的摄像设备外,还包括至少一个其它摄像设备的信息;针对每一个设备路径,以所述第一图像的时间信息对应的时间为起始时间,以所述第二图像的时间信息对应的时间为终止时间,从当前路径上的每个其它摄像设备拍摄的图像中,确定出与当前摄像设备相邻的前一摄像设备拍摄的包含所述待确定目标的信息的图像具有设定时间序列关系、且包含所述待确定目标的信息的图像。
可选地,所述第二生成单元,具体用于:针对每一个设备路径,根据确定出的所述图像的时间序列关系生成相连的具有时空序列关系的多个中间节点;根据所述首节点、所述尾节点、和所述中间节点,生成与当前设备路径对应的具有时空序列关系的图像路径;从每一个设备路径对应的图像路径中,确定出以所述第一图像为首节点且以所述第二图像为尾节点的最大概率图像路径作为所述待确定目标的预测路径。
可选地,所述第二生成单元,还用于:针对每一个设备路径对应的图像路径,获取所述图像路径中每两个相邻节点的图像之间具有同一个待确定目标的信息的概率;根据所述图像路径中每两个相邻节点的图像之间具有同一个待确定目标的信息的概率计算所述图像路径作为所述待确定目标的预测路径的概率;根据每一个图像路径作为所述待确定目标的预测路径的概率确定最大概率图像路径作为所述待确定目标的预测路径。
可选地,所述第一确定模块,包括:第二确定子模块,用于通过神经网络,对所述预测路径进行有效性判断,基于判断结果,确定所述第一图像和第二图像中的待确定目标是否为同一个待确定目标。
可选地,所述第二确定子模块,包括:第一获取单元,用于根据所述预测路径中的相邻的图像的时间信息,获取相邻的图像的时间差异;根据相邻的图像的空间信息,获取相邻的图像的空间差异;根据相邻的图像中的待确定目标的特征信息,获取相邻的图像中的待确定目标的特征差异;第二获取单元,用于将获得的所述预测路径中相邻的图像的时间差异、空间差异和特征差异输入长短时记忆网络LSTM,获得所述预测路径的待确定目标的识别概率;第二确定单元,用于根据所述预测路径的待确定目标的识别概率,确定所述第一图像和第二图像中的待确定目标是否为同一个待确定目标。
可选地,所述第一获取单元,具体用于:通过Siamese-CNN分别获取相邻的图像中的待确定目标的特征信息;根据分别获取的所述特征信息,获取相邻的图像中的待确定目标的特征差异。
根据本发明实施例的第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序指令,其中,所述程序指令被处理器执行时实现本发明实施例的第一方面所述的目标识别方法的步骤。
根据本发明实施例的第四方面,提供了一种电子设备,包括:处理器、存储器、通信元件和通信总线,所述处理器、所述存储器和所述通信元件通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如本发明实施例的第一方面所述的目标识别方法的步骤。
根据本发明实施例提供的技术方案,基于第一图像和第二图像所包含的信息,生成待确定目标可能通过的预测路径;并通过对该预测路径的有效性判断,以确定第一图像及第二图像中的待确定目标是否相同。其中,有效性判断是对当前预测路径是否会为同一个待确定目标的行进路线的可能性判断,其可能性越高则第一图像和第二图像中的待确定目标为同一个待确定目标的可能性也越高。由此,可以对不同图像中的待确定目标是否为同一个待确定目标进行较为精准的检测和识别。
附图说明
图1是根据本发明实施例一的一种目标识别方法的步骤流程图;
图2是根据本发明实施例二的一种目标识别方法的步骤流程图;
图3是根据本发明实施例三的一种目标识别方法的步骤流程图;
图4是根据本发明实施例四的一种目标识别装置的结构框图;
图5是根据本发明实施例五的一种目标识别装置的结构框图;
图6是根据本发明实施例六的一种目标识别装置的结构框图;
图7是根据本发明实施例七的一种电子设备的结构示意图。
具体实施方式
下面结合附图(若干附图中相同的标号表示相同的元素)和实施例,对本发明实施例的具体实施方式作进一步详细说明。以下实施例用于说明本发明,但不用来限制本发明的范围。
本领域技术人员可以理解,本发明实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
实施例一
图1是根据本发明实施例一的一种目标识别方法的步骤流程图。如图1所示,本实施例的目标识别方法包括以下步骤:
在步骤S102中,获取第一图像及第二图像。
在具体的实施方式中,从图像包含的内容来讲,所述第一图像和所述第二图像中均包含待确定目标。从图像的类别来讲,所述第一图像和所述第二图像均可为拍摄的静态图像,或者为视频帧序列中的视频图像等。具体地,所述待确定目标可包括行人、无人机以及交通工具等。可以理解的是,本实施例不限于此,任何可移动的物体均被包括在待确定目标的范围内。
在步骤S104中,基于所述第一图像及所述第二图像,生成预测路径。
其中,所述预测路径的两端分别对应所述第一图像及所述第二图像。在本发明实施例中,可基于所述第一图像和所述第二图像中包含的待确定目标的特征信息以及所述第一图像和所述第二图像中包含的时空信息来对待确定目标的行进路线进行预测,以路线预测结果来加强待确定目标识别的可信度。具体地,以所述第一图像和所述第二图像所包含的信息为基础,需要进一步找出图像中的待确定目标的可能的行进路线,其中,该行进路线上拍摄的待确定目标的图像均应与所述第一图像和所述第二图像在时空上相关。
在步骤S106中,对所述预测路径进行有效性判断,基于判断结果,确定所述第一图像及所述第二图像中的待确定目标是否相同。
其中,有效性判断是对一条预测路径是否会为同一个待确定目标的行进路线的可能性判断,其可能性越高则第一图像和第二图像中的待确定目标为同一个待确定目标的可能性也越高,也即是所述第一图像中的待确定目标与所述第二图像中的待确定目标相同的可能性也越高。在具体的实施方式中,所述有效性判断的结果具体可以是有效概率,也可以直接是“是否有效”。
根据本实施例提供的目标识别方法,基于第一图像和第二图像所包含的信息,生成待确定目标可能通过的预测路径;并通过对该预测路径的有效性判断,以确定第一图像及第二图像中的待确定目标是否相同。其中,有效性判断是对当前预测路径是否会为同一个待确定目标的行进路线的可能性判断,其可能性越高则第一图像和第二图像中的待确定目标为同一个待确定目标的可能性也越高。由此,可以对不同图像中的待确定目标是否为同一个待确定目标进行较为精准的检测和识别。
本实施例的目标识别方法可以由任意适当的具有图像或数据处理能力的设备执行,包括但不限于:摄像头、终端、移动终端、PC机、服务器、车载设备、娱乐设备、广告设备、个人数码助理(PDA)、平板电脑、笔记本电脑、掌上游戏机、智能眼镜、智能手表、可穿戴设备、虚拟显示设备或显示增强设备(如Google Glass、Oculus Rift、Hololens、Gear VR)等。
实施例二
参照图2,示出了根据本发明实施例二的一种目标识别方法的步骤流程图。
在本实施例中,以待确定目标为交通工具为例,对本发明实施例的目标识别方法进行说明,但本领域技术人员应当明了,在实际应用中,其它的待确定目标可参照本实施例实现相应的目标识别操作。
本实施例的目标识别方法包括以下步骤:
在步骤S202中,获取第一图像及第二图像。
在具体的实施方式中,所述第一图像和所述第二图像中均包含待确定目标,且所述待确定目标为交通工具。
在步骤S204中,根据所述第一图像的特征信息、所述第一图像的时间信息、所述第一图像的空间信息、所述第二图像的特征信息、所述第二图像的时间信息、和所述第二图像的空间信息,通过概率模型生成所述待确定目标的预测路径。
相比较于行人的行进路线,交通工具的行进路线更加稳定、更加有规律,判断和识别的准确率更高,因此,可以联合利用交通工具的特征信息(可以表征交通工具的外观)和图像的时空信息来对交通工具的行进路线进行预测,以路线预测结果来加强交通工具识别的可信度。
其中,图像的时间信息用于指示拍摄图像的时间,可以认为是待确定目标如交通工具经过拍摄设备的时间;图像的空间信息用于指示拍摄图像的位置,可以认为是拍摄设备所在的位置,也可以认为是待确定目标如交通工具被拍摄时所处的位置;图像的特征信息用于指示图像中的待确定目标的特征,如交通工具的特征,根据该特征可以确定交通工具的外观等信息。可以理解的是,本实施例涉及的图像所包含的信息可包括但不限于:图像的时间信息、图像的空间信息、和图像的特征信息。在具体的实施方式中,所述概率模型可为MRF(Markov Random Field,马尔可夫随机场模型)。
随机场可以看成是一组对应于同一个样本空间的随机变量的集合。一般来说,当这些随机变量之间有依赖关系时,该随机场可以被认为具有实际意义。随机场包含两个要素,即位置(site)和相空间(phase space),当给每一个位置中按照某种分布随机赋予相空间的一个值之后,其全体就叫做随机场。
MRF是加了Markov性质限制的随机场。Markov性质是指一个随机变量序列按时间先后关系依次排开的时候,第N+1时刻的分布特性,与N时刻以前的随机变量的取值无关。一个MRF对应一个无向图,这个无向图上的每一个节点对应一个随机变量,节点之间的边表示节点对应的随机变量之间有概率依赖关系。因此,MRF的结构本质上反应了先验知识,即,哪些变量之间有依赖关系需要考虑,而哪些可以忽略。
本实施例中,可以通过MRF生成第一图像和第二图像中的待确定目标的至少一条预测路径,然后,从中确定出最优路径作为所述待确定目标的预测路径。具体地,可以根据第一图像的特征信息、第一图像的时间信息、第一图像的空间信息、第二图像的特征信息、第二图像的时间信息、和第二图像的空间信息,通过MRF生成所述待确定目标的预测路径。可选地,可以通过链状MRF从获取的图像集中确定出包含有所述待确定目标的信息、且与第一图像和第二图像均具有时空序列关系的所有图像;根据确定出的所有图像对应的时间信息和空间信息,生成所述待确定目标的预测路径。
其中,时空数据是指同时具有时间和空间维度的数据,其包括时间和空间二个维度的信息。地理学中,由于连续的时空数据都是经过离散化抽样提取并存储的,因而能够将时空数据看作是空间上有相关关系的时间序列集合,即时空序列。该集合中的数据可以被认为是具有时空序列关系的数据。具体地,与第一图像和第二图像均具有时空序列关系的所有图像的含义为该所有图像中包含的时空数据分别与第一图像中包含的时空数据和第二图像中包含的时空数据在时间和空间上相关。
通常情况下,可以以第一图像为路径首节点图像,以第二图像为路径尾节点图像,根据链状MRF确定出的所有图像对应的时间信息和空间信息,生成以第一图像为首节点且以第二图像为尾节点的一条预测路径,其中,该预测路径除包括所述首节点和所述尾节点外,还包括至少一个中间节点。
其中,在通过链状MRF从获取的图像集中确定出包含有所述待确定目标的信息、且与所述第一图像和所述第二图像均具有时空序列关系的所有图像时,可以以第一图像的空间信息对应的位置为起始位置,以第二图像的空间信息对应的位置为终止位置,获取从所述起始位置至所述终止位置之间的所有摄像设备的位置信息;根据所有摄像设备的位置信息所指示的位置之间的关系,以所述起始位置对应的摄像设备为起点,以所述终止位置对应的摄像设备为终点,生成至少一个设备路径,其中,每个设备路径除包括所述起点的摄像设备和所述终点的摄像设备外,还包括至少一个其它摄像设备的信息;针对每一个设备路径,以第一图像的时间信息对应的时间为起始时间,以第二图像的时间信息对应的时间为终止时间,从当前路径上的每个其它摄像设备拍摄的图像中,确定出与当前摄像设备相邻的前一摄像设备拍摄的包含所述待确定目标的信息的图像具有设定时间序列关系、且包含所述待确定目标的信息的图像。
进而,在根据确定出的所有图像对应的时间信息和空间信息,生成以第一图像为首节点且以第二图像为尾节点的一条预测路径时,可以针对每一个设备路径,根据确定出的图像的时间序列关系生成相连的具有时空序列关系的多个中间节点;根据所述首节点、所述尾节点、和所述中间节点,生成与当前设备路径对应的具有时空序列关系的图像路径;从每一个设备路径对应的图像路径中,确定出以第一图像为首节点且以第二图像为尾节点的最大概率图像路径作为所述待确定目标的预测路径。
其中,在从每一个设备路径对应的图像路径中,确定出以第一图像为首节点且以第二图像为尾节点的最大概率图像路径作为所述待确定目标的预测路径时,可以针对每一个设备路径对应的图像路径,获取所述图像路径中每两个相邻节点的图像之间具有同一个待确定目标的信息的概率;根据所述图像路径中每两个相邻节点的图像之间具有同一个待确定目标的信息的概率计算所述图像路径作为所述待确定目标的预测路径的概率;根据每一个图像路径作为所述待确定目标的预测路径的概率确定最大概率图像路径作为所述待确定目标的预测路径。
以本实施例中的待确定目标为交通工具为例,假定交通工具在路网中的行进路线为一个链状MRF,链上的每一个节点为一个摄像机,节点的变量空间为该摄像机所拍摄的图像、图像的拍摄时间和地点所组成的三元组。任给一对需要识别是否为同一辆交通工具的图像,以及它们之间的可能的监控摄像机(可能的监控摄像机为先验信息,可以通过任意适当方式得到,如通过在数据训练集上进行统计得到),把相邻摄像机之间每一对图像以及它们之间的时空差异输入到Siamese-CNN(Siamese Convolutional Neural Network,孪生卷积神经网络)中,计算出每一对路网中相邻监控摄像机所拍的图像中的交通工具所属为同一辆交通工具的概率。其中,Siamese-CNN可以视作为MRF中相邻节点的势能函数,可以通过Max-Sum(最大子序列和)算法,最小化(优化)势能函数的乘积数值,以得到一条可能性最高的预测路径,该预测路径包括该交通工具所经过的摄像机的地理位置、被拍摄的时间以及被拍摄的图像的相关信息。
例如,设定p表示第一图像的信息(包括特征信息、时间信息和空间信息),q表示第二图像的信息(包括特征信息、时间信息和空间信息),通过链状MRF从多条可能的预测路径中确定最优路径的一种方式可以采用最大化下述公式(1)的方式实现:
其中,P表示预测路径(即交通工具有可能经过的预测路径);X表示摄像机;N表示一条预测路径上的摄像机的数量,从X1到XN,x1表示X1拍摄到的所述交通工具的图像的信息,以此类推,xN表示XN拍摄到的所述交通工具的图像的信息,表示势能函数(即Siamese-CNN的输出,为0~1之间的概率值),表示xi和xi+1之间的势能函数对,xi和xi+1被认为包含有同一辆交通工具的信息。如果xi和xi+1确实包含有同一辆交通工具的信息,则将有一个较大值,否则,会有一个较小值。
在最大化上述公式(1)时,可以使用公式(2)中所述的时间约束,使公式(2)满足公式(3),即:
其中,t表示时间,分别表示xi对应的图像的信息的最优选择和xi+1对应的图像的信息的最优选择;X表示摄像机;N表示一条预测路径上的摄像机的数量,从X1到XN,x1表示X1拍摄到的所述交通工具的图像的信息,以此类推,xN表示XN拍摄到的所述交通工具的图像的信息。
上述公式(1)、(2)和(3)中,图像的信息均包括图像的时间信息、空间信息和特征信息。
基于上述公式(1)、(2)和(3),可以将上述公式(1)最优化为下述公式(4),以获得最优路径,也即,交通工具可能通过的最大概率路径。
通过上述过程,可以确定出所述交通工具最有可能经过的一条预测路径。
例如,以第一图像为预测路径首节点A,以第二图像为预测路径尾节点D,根据摄像设备之间的位置关系,车辆可能的行驶路线包括:路线1:A->B->C->D;路线2:A->E->D;路线3:A->F->G->H->D。经过上述公式(4)的计算,确定路线1的概率为85%,路线2的概率为95%,而路线3的概率为70%,则可将路线2确定为交通工具的预测路径。
需要说明的是,上述过程以链状MRF为例,但在实际应用中,本领域技术人员也可以使用其它适当方式实现所述待确定目标的预测路径的生成。例如,根据深度神经网络检测第一图像和第二图像的背景信息,以生成所述待确定目标的预测路径。
在步骤S206中,通过神经网络,对所述预测路径进行有效性判断,基于判断结果,确定所述第一图像和第二图像中的待确定目标是否为同一个待确定目标。
其中,所述神经网络可以是任意适当的可实现特征提取或目标对象识别的神经网络,包括但不限于卷积神经网络、增强学习神经网络、对抗神经网络中的生成网络等等。神经网络中具体结构的设置可以由本领域技术人员根据实际需求适当设定,如卷积层的层数、卷积核的大小、通道数等等,本发明实施例对此不作限制。
在具体的实施方式中,所述神经网络可为LSTM(Long Short-Term Memory,长短时记忆网络)。LSTM是一种时间递归神经网络,是一种RNN(循环神经网络)的变种,较为擅长于处理序列信息。本发明实施例中,交通工具的预测路径也可以认为是一个序列信息,采用LSTM对其进行处理,以确定预测路径的有效性。
有效性判断是对一条预测路径是否会为同一个待确定目标的行进路线的可能性判断,其可能性越高则第一图像和第二图像中的待确定目标为同一个待确定目标的可能性也越高。
本实施例中,可以根据所述预测路径中的相邻的图像的时间信息,获取相邻的图像的时间差异;根据相邻的图像的空间信息,获取相邻的图像的空间差异;根据相邻的图像中的待确定目标的特征信息,获取相邻的图像中的待确定目标的特征差异;将获得的所述预测路径中相邻的图像的时间差异、空间差异和特征差异输入LSTM,获得所述预测路径的待确定目标的识别概率;根据所述预测路径的待确定目标的识别概率,确定所述第一图像和第二图像中的待确定目标是否为同一个待确定目标。其中,对待确定目标是否为同一个待确定目标的判断标准的具体设定可以由本领域技术人员根据实际需要适当设置,本发明实施例对此不作限制。
其中,相邻图像的时间差异可以通过两者的时间信息相减得到;相邻图像的空间差异可以通过计算两者之间的距离得到;而相邻图像的特征差异可以通过两者的特征向量相减得到。在一种可行方式中,在获得相邻图像的特征差异时,可以利用Siamese-CNN,通过Siamese-CNN分别获取相邻的图像中的待确定目标的特征信息;根据分别获取的特征信息,获取相邻的图像中的待确定目标的特征差异。其中,本步骤中的Siamese-CNN可以与步骤S204中的Siamese-CNN相同也可以不同。
本实施例中,在通过MRF得到任意两张交通工具图像之间的行进路线后,需要对该行进路线是否有效进行判断,即进行有效性判断。其中,有效指该行进路线是一条同样的交通工具会走过的路线,反之则为无效路线。本实施例中,采用的判断方式是使用LSTM来进行判断,该LSTM的输入为路线上相邻节点之间的时间差(即时间差异)、距离差(即空间差异),还有它们的外观差异(即特征差异),如前所述,其中的外观差异可用两张图像输入到Siamese-CNN后输出的特征向量直接进行相减得到。该LSTM的输出为一个概率值,通过该概率值可以对预测路径是否有效进行判断,进而判断两张图像中的交通工具是否确实为同一辆交通工具。
可见,通过本实施例,基于第一图像和第二图像所包含的时空信息和特征信息,生成图像中待确定目标可能通过的预测路径;并通过对该预测路径的有效性判断,以确定第一图像及第二图像中的待确定目标是否相同。其中,有效性判断是对当前预测路径是否会为同一个待确定目标的行进路线的可能性判断,其可能性越高则第一图像和第二图像中的待确定目标为同一个待确定目标的可能性也越高。由此,可以对不同图像中的待确定目标是否为同一个待确定目标进行较为精准的检测和识别。
本实施例的目标识别方法可以由任意适当的具有图像或数据处理能力的设备执行,包括但不限于:摄像头、终端、移动终端、PC机、服务器、车载设备、娱乐设备、广告设备、个人数码助理(PDA)、平板电脑、笔记本电脑、掌上游戏机、智能眼镜、智能手表、可穿戴设备、虚拟显示设备或显示增强设备(如Google Glass、Oculus Rift、Hololens、Gear VR)等。
实施例三
参照图3,示出了根据本发明实施例三的一种目标识别方法的步骤流程图。
在本实施例中,以待确定目标为交通工具为例,对本发明实施例的目标识别方法进行说明,但本领域技术人员应当明了,在实际应用中,其它的待确定目标可参照本实施例实现相应的目标识别操作。
本实施例的目标识别方法包括以下步骤:
在步骤S302中,根据所述第一图像的时间信息、空间信息、图像特征信息,以及,所述第二图像的时间信息、空间信息、图像特征信息,确定所述第一图像及所述第二图像中分别包含的待确定目标的初步相同概率值。
其中,第一图像和第二图像均包含有待确定目标的信息。
本发明实施例中,第一图像和第二图像具有时空序列关系,且均包含有相应的待确定目标的信息,在综合考虑图像的时间信息、空间信息、图像特征信息的基础上,本领域技术人员可以采用任意适当的方法初步确定这两张图像中的待确定目标的初步相同概率值。
在一种可行方案中,可以使用Siamese-CNN获得所述第一图像及所述第二图像中分别包含的待确定目标的初步相同概率值。
Siamese-CNN是一种至少具有两个分支的CNN,可以同时接收多个输入,输出该多个输入的相似度(可以表现为概率的形式)。以双分支为例,可以通过双分支同时向Siamese-CNN输入两张图像,Siamese-CNN将输出这两张图像之间的相似度,或者,输出两张图像是否相似的判断结果。本实施例中的Siamese-CNN包括三个分支,其中两个分支用于接收输入的图像,一个分支用于接收输入的两个图像之间的时间信息的差异(时间差异)和空间信息的差异(空间差异)。通过对输入的图像进行检测输出图像中目标对象(本实施例中为交通工具)在特征方面的相似度(如外观相似度),以及,对输入的时间信息的差异和空间信息的差异进行检测输出图像中目标对象在时空方面的相似度。根据这两方面的相似度,可以进一步确定图像中的目标对象,如本实施例中的交通工具的初步相同概率值。
可见,在本实施例中,可以将第一图像和第二图像,以及,第一图像和第二图像之间的时间信息的差异和空间信息的差异输入Siamese-CNN,获得所述第一图像和第二图像中的待确定目标的初步相同概率值。在获得初步相同概率值之后,根据所述初步相同概率值初步确定所述第一图像和第二图像中具有相同的待确定目标。具体地,将所述初步相同概率值与预设值进行比较,当所述初步相同概率值小于或等于预设值时,确定所述第一图像和第二图像中不具有相同的待确定目标,当所述初步相同概率值大于预设值时,初步确定所述第一图像和第二图像中具有相同的待确定目标。其中,所述预设值可以由本领域技术人员根据实际情况适当设置,本发明实施例对此不作限制。
Siamese-CNN可以对具有时空信息的两张图像中的目标对象如交通工具的相似程度进行有效判断,但不限于Siamese-CNN,其它具有类似功能或者可以实现相同目的的方式或神经网络也同样适用于本发明实施例的方案。
在步骤S304中,当所述初步相同概率值大于预设值时,基于所述第一图像及所述第二图像,生成所述预测路径。
相比较于行人的行进路线,待确定目标如交通工具的行进路线更加有规律性,因此,可以联合利用交通工具的特征信息(可以表征交通工具的外观)和时空信息来对交通工具的路线进行估计,以路线估计结果来加强交通工具再识别的可信度。
如前所述,第一图像和第二图像为具有时空序列关系的图像,以此为基础,需要进一步找出图像中的交通工具的可能的行进路线,其中,该行进路线上拍摄的交通工具的图像均应与第一图像和第二图像具有时空序列关系。
在具体的实施方式中,根据第一图像的信息和第二图像的信息,使用MRF生成所述待确定目标的预测路径。具体的实现过程与上述实施二中的步骤S204类似,在此不再赘述。
在步骤S306中,对所述预测路径进行有效性判断,基于判断结果,对所述第一图像和所述第二图像中的待确定目标是否为同一个待确定目标进行再识别。
其中,有效性判断是对一条预测路径是否会为同一个待确定目标的行进路线的可能性判断,其可能性越高则第一图像和第二图像中的待确定目标为同一个待确定目标的可能性也越高。
例如,在某些情况下,有可能初步确定的结果本身就是错误的,也即,第一图像中的交通工具和第二图像中的交通工具可能并不为同一辆交通工具,但却被误识别为同一辆交通工具。若二者不为同一辆交通工具,则二者在可能的合理时间范围内具有相同的行驶路线的概率很低,因此,根据第一图像的信息和第二图像的信息确定有的预测路径的有效性也较低,由此可以实现对第一图像和第二图像中的交通工具是否为同一辆交通工具的再判断和识别。
在具体的实施方式中,通过LSTM,对所述预测路径进行有效性判断,根据判断结果对所述第一图像和第二图像中的待确定目标是否为同一个待确定目标进行再识别。具体的实现过程与上述实施二中的步骤S206类似,在此不再赘述。
根据本实施例提供的目标识别方法,在初步确定所述第一图像及所述第二图像中分别包含的待确定目标相同的基础上,确定该待确定目标可能通过的预测路径;进而,通过对该预测路径的有效性判断,确定初步确定的结果是否准确,以实现对第一图像和第二图像中的待确定目标是否为同一个待确定目标的再识别。其中,有效性判断是对当前预测路径是否会为同一个待确定目标的行进路线的可能性判断,其可能性越高则第一图像和第二图像中的待确定目标为同一个待确定目标的可能性也越高。由此,可以对不同图像中的待确定目标是否为同一个待确定目标进行较为精准的再检测和识别。
本实施例的目标识别方法可以由任意适当的具有图像或数据处理能力的设备执行,包括但不限于:摄像头、终端、移动终端、PC机、服务器、车载设备、娱乐设备、广告设备、个人数码助理(PDA)、平板电脑、笔记本电脑、掌上游戏机、智能眼镜、智能手表、可穿戴设备、虚拟显示设备或显示增强设备(如Google Glass、Oculus Rift、Hololens、Gear VR)等。
实施例四
基于相同的技术构思,图4是示出根据本发明实施例四的目标识别装置的结构示意图。可用以执行如实施例一所述的目标识别方法流程。
参照图4,该目标识别装置包括获取模块401、生成模块402和第一确定模块403。
获取模块401,用于获取第一图像及第二图像,所述第一图像及所述第二图像中均包含待确定目标;
生成模块402,用于基于所述第一图像及所述第二图像,生成预测路径,所述预测路径的两端分别对应所述第一图像及所述第二图像;
第一确定模块403,用于对所述预测路径进行有效性判断,基于判断结果,确定所述第一图像及所述第二图像中的待确定目标是否相同。
通过本实施例提供的目标识别装置,基于第一图像和第二图像所包含的信息,生成待确定目标可能通过的预测路径;并通过对该预测路径的有效性判断,以确定第一图像及第二图像中的待确定目标是否相同。其中,有效性判断是对当前预测路径是否会为同一个待确定目标的行进路线的可能性判断,其可能性越高则第一图像和第二图像中的待确定目标为同一个待确定目标的可能性也越高。由此,可以对不同图像中的待确定目标是否为同一个待确定目标进行较为精准的检测和识别。
实施例五
基于相同的技术构思,图5是示出根据本发明实施例五的目标识别装置的结构示意图。可用以执行如实施例二所述的目标识别方法流程。
参照图5,该目标识别装置包括获取模块501、生成模块502和第一确定模块503。其中,获取模块501,用于获取第一图像及第二图像,所述第一图像及所述第二图像中均包含待确定目标;生成模块502,用于基于所述第一图像及所述第二图像,生成预测路径,所述预测路径的两端分别对应所述第一图像及所述第二图像;第一确定模块503,用于对所述预测路径进行有效性判断,基于判断结果,确定所述第一图像及所述第二图像中的待确定目标是否相同。
可选地,所述生成模块502,包括:第二生成子模块5021,用于根据所述第一图像的特征信息、所述第一图像的时间信息、所述第一图像的空间信息、所述第二图像的特征信息、所述第二图像的时间信息、和所述第二图像的空间信息,通过概率模型生成所述待确定目标的预测路径。
可选地,所述第二生成子模块5021,包括:第一确定单元5022,用于通过链状马尔可夫随机场模型MRF从获取的图像集中确定出包含有所述待确定目标的信息、且与所述第一图像和所述第二图像均具有时空序列关系的所有图像;第一生成单元5023,用于根据确定出的所有图像对应的时间信息和空间信息,生成所述待确定目标的预测路径。
可选地,所述第一生成单元5023,包括:第二生成单元5024,用于根据确定出的所有图像对应的时间信息和空间信息,生成以所述第一图像为首节点且以所述第二图像为尾节点的一条预测路径,其中,所述预测路径除包括所述首节点和所述尾节点外,还包括至少一个中间节点。
可选地,所述第一确定单元5022,具体用于:以所述第一图像的空间信息对应的位置为起始位置,以所述第二图像的空间信息对应的位置为终止位置,获取从所述起始位置至所述终止位置之间的所有摄像设备的位置信息;根据所有摄像设备的位置信息所指示的位置之间的关系,以所述起始位置对应的摄像设备为起点,以所述终止位置对应的摄像设备为终点,生成至少一个设备路径,其中,每个设备路径除包括所述起点的摄像设备和所述终点的摄像设备外,还包括至少一个其它摄像设备的信息;针对每一个设备路径,以所述第一图像的时间信息对应的时间为起始时间,以所述第二图像的时间信息对应的时间为终止时间,从当前路径上的每个其它摄像设备拍摄的图像中,确定出与当前摄像设备相邻的前一摄像设备拍摄的包含所述待确定目标的信息的图像具有设定时间序列关系、且包含所述待确定目标的信息的图像。
可选地,所述第二生成单元5024,具体用于:针对每一个设备路径,根据确定出的所述图像的时间序列关系生成相连的具有时空序列关系的多个中间节点;根据所述首节点、所述尾节点、和所述中间节点,生成与当前设备路径对应的具有时空序列关系的图像路径;从每一个设备路径对应的图像路径中,确定出以所述第一图像为首节点且以所述第二图像为尾节点的最大概率图像路径作为所述待确定目标的预测路径。
可选地,所述第二生成单元5024,还用于:针对每一个设备路径对应的图像路径,获取所述图像路径中每两个相邻节点的图像之间具有同一个待确定目标的信息的概率;根据所述图像路径中每两个相邻节点的图像之间具有同一个待确定目标的信息的概率计算所述图像路径作为所述待确定目标的预测路径的概率;根据每一个图像路径作为所述待确定目标的预测路径的概率确定最大概率图像路径作为所述待确定目标的预测路径。
可选地,所述第一确定模块503,包括:第二确定子模块5031,用于通过神经网络,对所述预测路径进行有效性判断,基于判断结果,确定所述第一图像和第二图像中的待确定目标是否为同一个待确定目标。
可选地,所述第二确定子模块5031,包括:第一获取单元5032,用于根据所述预测路径中的相邻的图像的时间信息,获取相邻的图像的时间差异;根据相邻的图像的空间信息,获取相邻的图像的空间差异;根据相邻的图像中的待确定目标的特征信息,获取相邻的图像中的待确定目标的特征差异;第二获取单元5033,用于将获得的所述预测路径中相邻的图像的时间差异、空间差异和特征差异输入长短时记忆网络LSTM,获得所述预测路径的待确定目标的识别概率;第二确定单元5034,用于根据所述预测路径的待确定目标的识别概率,确定所述第一图像和第二图像中的待确定目标是否为同一个待确定目标。
可选地,所述第一获取单元5032,具体用于:通过Siamese-CNN分别获取相邻的图像中的待确定目标的特征信息;根据分别获取的所述特征信息,获取相邻的图像中的待确定目标的特征差异。
需要说明的是,对于本发明实施例提供的目标识别装置还涉及的具体细节已在本发明实施例提供的目标识别方法中作了详细的说明,在此不在赘述。
实施例六
基于相同的技术构思,图6是示出根据本发明实施例六的目标识别装置的结构示意图。可用以执行如实施例三所述的目标识别方法流程。
参照图6,该目标识别装置包括获取模块601、生成模块603和第一确定模块604。其中,获取模块601,用于获取第一图像及第二图像,所述第一图像及所述第二图像中均包含待确定目标;生成模块603,用于基于所述第一图像及所述第二图像,生成预测路径,所述预测路径的两端分别对应所述第一图像及所述第二图像;第一确定模块604,用于对所述预测路径进行有效性判断,基于判断结果,确定所述第一图像及所述第二图像中的待确定目标是否相同。
可选地,所述待确定目标为交通工具。
可选地,所述装置还包括:第二确定模块602,用于根据所述第一图像的时间信息、空间信息、图像特征信息,以及,所述第二图像的时间信息、空间信息、图像特征信息,确定所述第一图像及所述第二图像中分别包含的待确定目标的初步相同概率值;相应地,所述生成模块603,包括:第一生成子模块6031,用于当所述初步相同概率值大于预设值时,基于所述第一图像及所述第二图像,生成所述预测路径。
可选地,所述第二确定模块602,包括:第一确定子模块6021,用于将所述第一图像和所述第二图像,以及,所述第一图像和所述第二图像之间的时间信息的差异和空间信息的差异输入孪生卷积神经网络Siamese-CNN,获得所述第一图像和第二图像中的待确定目标的初步相同概率值。
需要说明的是,对于本发明实施例提供的目标识别装置还涉及的具体细节已在本发明实施例提供的目标识别方法中作了详细的说明,在此不在赘述。
实施例七
本发明实施例七提供了一种电子设备,例如可以是移动终端、个人计算机(PC)、平板电脑、服务器等。下面参考图7,其示出了适于用来实现本发明实施例的终端设备或服务器的电子设备700的结构示意图:如图7所示,电子设备700包括一个或多个处理器、通信元件等,所述一个或多个处理器例如:一个或多个中央处理单元(CPU)701,和/或一个或多个图像处理器(GPU)713等,处理器可以根据存储在只读存储器(ROM)702中的可执行指令或者从存储部分708加载到随机访问存储器(RAM)703中的可执行指令而执行各种适当的动作和处理。通信元件包括通信组件712和/或通信接口709。其中,通信组件712可包括但不限于网卡,所述网卡可包括但不限于IB(Infiniband)网卡,通信接口709包括诸如LAN卡、调制解调器等的网络接口卡的通信接口,通信接口709经由诸如因特网的网络执行通信处理。
处理器可与只读存储器702和/或随机访问存储器703中通信以执行可执行指令,通过通信总线704与通信组件712相连、并经通信组件712与其他目标设备通信,从而完成本发明实施例提供的任一项目标识别方法对应的操作,例如,获取第一图像及第二图像,所述第一图像及所述第二图像中均包含待确定目标;基于所述第一图像及所述第二图像,生成预测路径,所述预测路径的两端分别对应所述第一图像及所述第二图像;对所述预测路径进行有效性判断,基于判断结果,确定所述第一图像及所述第二图像中的待确定目标是否相同。
此外,在RAM 703中,还可存储有装置操作所需的各种程序和数据。CPU701或GPU713、ROM702以及RAM703通过通信总线704彼此相连。在有RAM703的情况下,ROM702为可选模块。RAM703存储可执行指令,或在运行时向ROM702中写入可执行指令,可执行指令使处理器执行上述通信方法对应的操作。输入/输出(I/O)接口705也连接至通信总线704。通信组件712可以集成设置,也可以设置为具有多个子模块(例如多个IB网卡),并在通信总线链接上。
以下部件连接至I/O接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信接口709。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
需要说明的,如图7所示的架构仅为一种可选实现方式,在具体实践过程中,可根据实际需要对上述图7的部件数量和类型进行选择、删减、增加或替换;在不同功能部件设置上,也可采用分离设置或集成设置等实现方式,例如GPU和CPU可分离设置或者可将GPU集成在CPU上,通信元件可分离设置,也可集成设置在CPU或GPU上,等等。这些可替换的实施方式均落入本发明的保护范围。
特别地,根据本发明实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,计算机程序包含用于执行流程图所示的方法的程序代码,程序代码可包括对应执行本发明实施例提供的方法步骤对应的指令,例如,获取第一图像及第二图像,所述第一图像及所述第二图像中均包含待确定目标;基于所述第一图像及所述第二图像,生成预测路径,所述预测路径的两端分别对应所述第一图像及所述第二图像;对所述预测路径进行有效性判断,基于判断结果,确定所述第一图像及所述第二图像中的待确定目标是否相同。在这样的实施例中,该计算机程序可以通过通信元件从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被处理器执行时,执行本发明实施例的方法中限定的上述功能。
需要指出,根据实施的需要,可将本发明实施例中描述的各个部件/步骤拆分为更多部件/步骤,也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤,以实现本发明实施例的目的。
上述根据本发明实施例的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的处理方法。此外,当通用计算机访问用于实现在此示出的处理的代码时,代码的执行将通用计算机转换为用于执行在此示出的处理的专用计算机。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明实施例的范围。
以上实施方式仅用于说明本发明实施例,而并非对本发明实施例的限制,有关技术领域的普通技术人员,在不脱离本发明实施例的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明实施例的范畴,本发明实施例的专利保护范围应由权利要求限定。

Claims (10)

1.一种目标识别方法,包括:
获取第一图像及第二图像,所述第一图像及所述第二图像中均包含待确定目标;
基于所述第一图像及所述第二图像,生成预测路径,所述预测路径的两端分别对应所述第一图像及所述第二图像;
对所述预测路径进行有效性判断,基于判断结果,确定所述第一图像及所述第二图像中的待确定目标是否相同。
2.根据权利要求1所述的方法,其中,所述待确定目标为交通工具。
3.根据权利要求1所述的方法,其中,所述基于所述第一图像及所述第二图像,生成预测路径之前,所述方法还包括:
根据所述第一图像的时间信息、空间信息、图像特征信息,以及,所述第二图像的时间信息、空间信息、图像特征信息,确定所述第一图像及所述第二图像中分别包含的待确定目标的初步相同概率值;
相应地,所述基于所述第一图像及所述第二图像,生成预测路径,包括:
当所述初步相同概率值大于预设值时,基于所述第一图像及所述第二图像,生成所述预测路径。
4.根据权利要求3所述的方法,其中,根据所述第一图像的时间信息、空间信息、图像特征信息,以及,所述第二图像的时间信息、空间信息、图像特征信息,确定所述第一图像及所述第二图像中分别包含的待确定目标的初步相同概率值,包括:
将所述第一图像和所述第二图像,以及,所述第一图像和所述第二图像之间的时间信息的差异和空间信息的差异输入孪生卷积神经网络Siamese-CNN,获得所述第一图像和第二图像中的待确定目标的初步相同概率值。
5.根据权利要求1-4任一项所述的方法,其中,所述基于所述第一图像及所述第二图像,生成预测路径,包括:
根据所述第一图像的特征信息、所述第一图像的时间信息、所述第一图像的空间信息、所述第二图像的特征信息、所述第二图像的时间信息、和所述第二图像的空间信息,通过概率模型生成所述待确定目标的预测路径。
6.根据权利要求5所述的方法,其中,所述通过概率模型生成所述待确定目标的预测路径,包括:
通过链状马尔可夫随机场模型MRF从获取的图像集中确定出包含有所述待确定目标的信息、且与所述第一图像和所述第二图像均具有时空序列关系的所有图像;
根据确定出的所有图像对应的时间信息和空间信息,生成所述待确定目标的预测路径。
7.根据权利要求6所述的方法,其中,所述根据确定出的所有图像对应的时间信息和空间信息,生成所述待确定目标的预测路径,包括:
根据确定出的所有图像对应的时间信息和空间信息,生成以所述第一图像为首节点且以所述第二图像为尾节点的一条预测路径,其中,所述预测路径除包括所述首节点和所述尾节点外,还包括至少一个中间节点。
8.一种目标识别装置,包括:
获取模块,用于获取第一图像及第二图像,所述第一图像及所述第二图像中均包含待确定目标;
生成模块,用于基于所述第一图像及所述第二图像,生成预测路径,所述预测路径的两端分别对应所述第一图像及所述第二图像;
第一确定模块,用于对所述预测路径进行有效性判断,基于判断结果,确定所述第一图像及所述第二图像中的待确定目标是否相同。
9.一种计算机可读存储介质,其上存储有计算机程序指令,其中,所述程序指令被处理器执行时实现权利要求1~7中任意一项权利要求所述的目标识别方法的步骤。
10.一种电子设备,包括:处理器、存储器、通信元件和通信总线,所述处理器、所述存储器和所述通信元件通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1~7中任意一项权利要求所述的目标识别方法的步骤。
CN201710633604.3A 2017-07-28 2017-07-28 目标识别方法、装置、存储介质和电子设备 Pending CN108229292A (zh)

Priority Applications (8)

Application Number Priority Date Filing Date Title
CN201710633604.3A CN108229292A (zh) 2017-07-28 2017-07-28 目标识别方法、装置、存储介质和电子设备
SG11201911625YA SG11201911625YA (en) 2017-07-28 2018-07-27 Target recognition method and apparatus, storage medium, and electronic device
PCT/CN2018/097374 WO2019020103A1 (zh) 2017-07-28 2018-07-27 目标识别方法、装置、存储介质和电子设备
JP2019557616A JP6893564B2 (ja) 2017-07-28 2018-07-27 ターゲット識別方法、装置、記憶媒体および電子機器
KR1020197031657A KR102339323B1 (ko) 2017-07-28 2018-07-27 타겟 인식 방법, 장치, 저장 매체 및 전자 기기
US16/565,069 US11200682B2 (en) 2017-07-28 2019-09-09 Target recognition method and apparatus, storage medium, and electronic device
US17/452,776 US20220051417A1 (en) 2017-07-28 2021-10-29 Target recognition method and appartus, storage medium, and electronic device
US17/453,487 US20220058812A1 (en) 2017-07-28 2021-11-03 Target recognition method and appartus, storage medium, and electronic device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710633604.3A CN108229292A (zh) 2017-07-28 2017-07-28 目标识别方法、装置、存储介质和电子设备

Publications (1)

Publication Number Publication Date
CN108229292A true CN108229292A (zh) 2018-06-29

Family

ID=62654256

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710633604.3A Pending CN108229292A (zh) 2017-07-28 2017-07-28 目标识别方法、装置、存储介质和电子设备

Country Status (6)

Country Link
US (3) US11200682B2 (zh)
JP (1) JP6893564B2 (zh)
KR (1) KR102339323B1 (zh)
CN (1) CN108229292A (zh)
SG (1) SG11201911625YA (zh)
WO (1) WO2019020103A1 (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019020103A1 (zh) * 2017-07-28 2019-01-31 北京市商汤科技开发有限公司 目标识别方法、装置、存储介质和电子设备
CN109508787A (zh) * 2018-10-16 2019-03-22 深圳大学 用于超声位移估计的神经网络模型训练方法及系统
CN109726684A (zh) * 2018-12-29 2019-05-07 百度在线网络技术(北京)有限公司 一种地标元素获取方法和地标元素获取系统
CN109740479A (zh) * 2018-12-25 2019-05-10 苏州科达科技股份有限公司 一种车辆重识别方法、装置、设备及可读存储介质
CN110490906A (zh) * 2019-08-20 2019-11-22 南京邮电大学 一种基于孪生卷积网络和长短期记忆网络的实时视觉目标跟踪方法
CN110991413A (zh) * 2019-12-20 2020-04-10 西南交通大学 一种基于ReID的跑步检测方法
CN111160067A (zh) * 2018-11-07 2020-05-15 北京奇虎科技有限公司 危险识别方法、装置、电子设备及计算机可读存储介质
CN111491131A (zh) * 2019-01-29 2020-08-04 斯特拉德视觉公司 集成由每个对象检测器检测的对象检测信息的方法及装置
CN113627260A (zh) * 2021-07-12 2021-11-09 科大讯飞股份有限公司 识别手写汉字的笔顺的方法、系统和计算设备
CN113673412A (zh) * 2021-08-17 2021-11-19 驭势(上海)汽车科技有限公司 关键目标物的识别方法、装置、计算机设备及存储介质
CN113688776A (zh) * 2021-09-06 2021-11-23 北京航空航天大学 一种用于跨视场目标重识别的时空约束模型构建方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108921811B (zh) * 2018-04-03 2020-06-30 阿里巴巴集团控股有限公司 检测物品损伤的方法和装置、物品损伤检测器
WO2021003379A1 (en) * 2019-07-03 2021-01-07 Waymo Llc Agent trajectory prediction using anchor trajectories
CN110443828A (zh) * 2019-07-31 2019-11-12 腾讯科技(深圳)有限公司 对象跟踪方法和装置、存储介质及电子装置
CN110728330A (zh) * 2019-10-23 2020-01-24 腾讯科技(深圳)有限公司 基于人工智能的对象识别方法、装置、设备及存储介质
CN112766301B (zh) * 2020-12-11 2024-04-12 南京富岛信息工程有限公司 一种采油机示功图相似性判断方法
CN114338974A (zh) * 2021-12-02 2022-04-12 深圳市领航卫士安全技术有限公司 多通道的活动路径确定方法、装置、设备及存储介质
CN114783003B (zh) * 2022-06-23 2022-09-20 之江实验室 一种基于局部特征注意力的行人重识别方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150154457A1 (en) * 2012-06-28 2015-06-04 International Business Machines Corporation Object retrieval in video data using complementary detectors
CN106778517A (zh) * 2016-11-25 2017-05-31 河南高速公路驻信段改扩建工程有限公司 一种监控视频序列图像车辆再识别的方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001208844A (ja) * 2000-01-25 2001-08-03 Sumitomo Electric Ind Ltd 光学式車両感知装置および光学式車両感知方法
US7623674B2 (en) * 2003-11-05 2009-11-24 Cognex Technology And Investment Corporation Method and system for enhanced portal security through stereoscopy
JP4447309B2 (ja) * 2003-12-25 2010-04-07 財団法人生産技術研究奨励会 交差点交通量計測装置および交差点交通量計測方法
JP5941987B2 (ja) * 2012-08-08 2016-06-29 株式会社日立製作所 交通量予測装置および方法
US9436895B1 (en) * 2015-04-03 2016-09-06 Mitsubishi Electric Research Laboratories, Inc. Method for determining similarity of objects represented in images
JP6439571B2 (ja) * 2015-04-28 2018-12-19 オムロン株式会社 交通情報収集装置、交通情報収集方法、および交通情報収集プログラム
CN105095362B (zh) * 2015-06-25 2019-02-22 深圳码隆科技有限公司 一种基于目标对象的图像显示方法和装置
JP6433877B2 (ja) * 2015-10-27 2018-12-05 日本電信電話株式会社 目的地予測装置、目的地予測方法、及び目的地予測プログラム
JP6521835B2 (ja) * 2015-10-27 2019-05-29 日本電信電話株式会社 移動経路予測装置、移動経路予測方法、及び移動経路予測プログラム
WO2017122086A1 (en) * 2016-01-11 2017-07-20 Mobileye Vision Technologies Ltd. Systems and methods for augmenting upright object detection
CN106326837B (zh) * 2016-08-09 2019-09-17 北京旷视科技有限公司 对象追踪方法和装置
CN106650660A (zh) * 2016-12-19 2017-05-10 深圳市华尊科技股份有限公司 一种车型识别方法及终端
CN108229292A (zh) * 2017-07-28 2018-06-29 北京市商汤科技开发有限公司 目标识别方法、装置、存储介质和电子设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150154457A1 (en) * 2012-06-28 2015-06-04 International Business Machines Corporation Object retrieval in video data using complementary detectors
CN106778517A (zh) * 2016-11-25 2017-05-31 河南高速公路驻信段改扩建工程有限公司 一种监控视频序列图像车辆再识别的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
OMAR JAVED, KHURRAM SHAFIQUE, ZEESHAN RASHEED, MUBARAK SHAH: "Modeling inter-camera space–time and appearance relationships for tracking across non-overlapping views", 《COMPUTER VISION AND IMAGE UNDERSTANDING》 *
XINCHEN LIU, WU LIU, TAO MEI, HUADONG MA: "A Deep Learning-Based Approach to Progressive Vehicle Re-identification for Urban Surveillance", 《IN EUROPEAN CONFERENCE ON COMPUTER VISION》 *
YICHAO YAN, BINGBING NI, ZHICHAO SONG, CHAO MA, YAN YAN, XIAOKAN: "Person Re-Identification via Recurrent Feature Aggregation", 《IN EUROPEAN CONFERENCE ON COMPUTER VISION》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11200682B2 (en) 2017-07-28 2021-12-14 Beijing Sensetime Technology Development Co., Ltd. Target recognition method and apparatus, storage medium, and electronic device
WO2019020103A1 (zh) * 2017-07-28 2019-01-31 北京市商汤科技开发有限公司 目标识别方法、装置、存储介质和电子设备
CN109508787A (zh) * 2018-10-16 2019-03-22 深圳大学 用于超声位移估计的神经网络模型训练方法及系统
CN111160067A (zh) * 2018-11-07 2020-05-15 北京奇虎科技有限公司 危险识别方法、装置、电子设备及计算机可读存储介质
CN109740479A (zh) * 2018-12-25 2019-05-10 苏州科达科技股份有限公司 一种车辆重识别方法、装置、设备及可读存储介质
CN109726684B (zh) * 2018-12-29 2021-02-19 百度在线网络技术(北京)有限公司 一种地标元素获取方法和地标元素获取系统
CN109726684A (zh) * 2018-12-29 2019-05-07 百度在线网络技术(北京)有限公司 一种地标元素获取方法和地标元素获取系统
CN111491131A (zh) * 2019-01-29 2020-08-04 斯特拉德视觉公司 集成由每个对象检测器检测的对象检测信息的方法及装置
CN110490906A (zh) * 2019-08-20 2019-11-22 南京邮电大学 一种基于孪生卷积网络和长短期记忆网络的实时视觉目标跟踪方法
CN110991413B (zh) * 2019-12-20 2020-12-15 西南交通大学 一种基于ReID的跑步检测方法
CN110991413A (zh) * 2019-12-20 2020-04-10 西南交通大学 一种基于ReID的跑步检测方法
CN113627260A (zh) * 2021-07-12 2021-11-09 科大讯飞股份有限公司 识别手写汉字的笔顺的方法、系统和计算设备
CN113673412A (zh) * 2021-08-17 2021-11-19 驭势(上海)汽车科技有限公司 关键目标物的识别方法、装置、计算机设备及存储介质
CN113673412B (zh) * 2021-08-17 2023-09-26 驭势(上海)汽车科技有限公司 关键目标物的识别方法、装置、计算机设备及存储介质
CN113688776A (zh) * 2021-09-06 2021-11-23 北京航空航天大学 一种用于跨视场目标重识别的时空约束模型构建方法
CN113688776B (zh) * 2021-09-06 2023-10-20 北京航空航天大学 一种用于跨视场目标重识别的时空约束模型构建方法

Also Published As

Publication number Publication date
JP6893564B2 (ja) 2021-06-23
US20220051417A1 (en) 2022-02-17
US20200005090A1 (en) 2020-01-02
WO2019020103A1 (zh) 2019-01-31
JP2020519989A (ja) 2020-07-02
US11200682B2 (en) 2021-12-14
SG11201911625YA (en) 2020-01-30
US20220058812A1 (en) 2022-02-24
KR20190128724A (ko) 2019-11-18
KR102339323B1 (ko) 2021-12-14

Similar Documents

Publication Publication Date Title
CN108229292A (zh) 目标识别方法、装置、存储介质和电子设备
JP7335274B2 (ja) ジオロケーションの予測のためのシステムおよび方法
CN108416326B (zh) 人脸识别方法和装置
CN110245579B (zh) 人流密度预测方法及装置、计算机设备及可读介质
CN110379020B (zh) 一种基于生成对抗网络的激光点云上色方法和装置
CN113159283B (zh) 一种基于联邦迁移学习的模型训练方法及计算节点
CN108197326A (zh) 一种车辆检索方法及装置、电子设备、存储介质
CN111310518B (zh) 图片特征提取方法、目标重识别方法、装置及电子设备
WO2020134102A1 (zh) 物品识别方法、装置、售货系统和存储介质
CN115115872A (zh) 图像识别方法、装置、设备及存储介质
Sun et al. Vehicle counting in crowded scenes with multi-channel and multi-task convolutional neural networks
CN112215831B (zh) 一种用于人脸图像质量的评价方法和系统
CN109002784A (zh) 街景识别模型的训练方法和系统、街景识别方法和系统
CN115546705B (zh) 目标识别方法、终端设备及存储介质
CN113361710A (zh) 学生模型训练方法、图片处理方法、装置及电子设备
Kadim et al. Deep-learning based single object tracker for night surveillance.
CN115617882A (zh) 基于gan的带有结构约束的时序图数据生成方法及系统
CN114170484B (zh) 图片属性预测方法、装置、电子设备和存储介质
CN111709382A (zh) 人体轨迹处理方法、装置、计算机存储介质以及电子设备
CN115114329A (zh) 数据流异常检测的方法、装置、电子设备和存储介质
CN116861262A (zh) 一种感知模型训练方法、装置及电子设备和存储介质
CN116543283A (zh) 一种考虑模态不确定性的多模态目标检测方法
CN116978093A (zh) 基于空间数据增强和对称互注意力的跨模态行人重识别方法
CN115687764A (zh) 车辆轨迹评估模型的训练方法、车辆轨迹评估方法和装置
CN113344121B (zh) 训练招牌分类模型和招牌分类的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180629