CN108960046A - 一种训练数据采样方法及其装置、计算机服务器 - Google Patents

一种训练数据采样方法及其装置、计算机服务器 Download PDF

Info

Publication number
CN108960046A
CN108960046A CN201810498800.9A CN201810498800A CN108960046A CN 108960046 A CN108960046 A CN 108960046A CN 201810498800 A CN201810498800 A CN 201810498800A CN 108960046 A CN108960046 A CN 108960046A
Authority
CN
China
Prior art keywords
frame image
image
video
testing result
sampling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810498800.9A
Other languages
English (en)
Inventor
黄泽昊
王乃岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Tusimple Technology Co Ltd
Original Assignee
Beijing Tusimple Future Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Tusimple Future Technology Co Ltd filed Critical Beijing Tusimple Future Technology Co Ltd
Priority to CN201810498800.9A priority Critical patent/CN108960046A/zh
Publication of CN108960046A publication Critical patent/CN108960046A/zh
Priority to US16/421,320 priority patent/US11068719B2/en
Priority to US17/378,054 priority patent/US11631249B2/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06V10/7747Organisation of the process, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种训练数据采样方法及其装置、计算机服务器,从视频中采样得到目标检测模型处理不理想的图像作为待标注图像,以便后续根据待标注图像对目标检测模型进行重新训练时能够有效的提升目标检测模型的性能。方法包括:将视频输入到目标检测模型中,得到每一帧图像的检测结果;将所述视频的所有帧图像的检测结果输入到目标跟踪模型,得到每一帧图像的跟踪结果;针对所述视频的每一帧图像执行以下步骤:匹配一帧图像的检测结果与跟踪结果;若匹配不一致,则确定所述一帧图像为所述目标检测模型处理不理想且需要标注的样本图像。

Description

一种训练数据采样方法及其装置、计算机服务器
技术领域
本发明涉及深度学习领域,特别涉及一种训练数据采样方法、一种训练数据采样装置和一种计算机服务器。
背景技术
近几年来,深度神经网络在诸多领域中取得了巨大的成功,如计算机视觉、自然语言处理等。然而,为了将深度神经网络应用到实际应用当中,深度神经网络必须满足以下三个条件:1)符合实际应用速度需求;2)在大量的实际场景数据上进行训练;3)能够根据实际需求快速迭代更新。
当神经网络在实际投入使用时,研发人员发现神经网络对视频处理不理想时,需要从该视频中采样一些图像作为待标注图像,并对待标注图像进行标注后将标注的图像添加到训练集中,基于该训练集对神经网络进行重新训练,以提高神经网络的性能。
目前,从视频中采样一些图像作为待标注图像,主要方式如下:采用简单的时序间隔采样方法对视频进行采样,以得到待标注图像。但是该种采样方式采样得到的图像有可能是神经网络已经处理的比较好的图像,基于这些图像再对神经网络进行重新训练并不能有效的提升该神经网络的性能。因此,如何能够采样到能够有效提升神经网络的图像,则成为本领域技术人员亟待解决的技术问题。
发明内容
鉴于上述技术问题,本发明提供一种训练数据采样方法及装置、计算机服务器,从视频中采样得到目标检测模型处理不理想的图像作为待标注图像,以便后续根据待标注图像对目标检测模型进行重新训练时能够有效的提升目标检测模型的性能。
本发明实施例,第一方面,提供一种训练数据采样方法,该方法包括:
将视频输入到目标检测模型中,得到每一帧图像的检测结果;
将所述视频的所有帧图像的检测结果输入到目标跟踪模型,得到每一帧图像的跟踪结果;
针对所述视频的每一帧图像执行以下步骤:匹配一帧图像的检测结果与跟踪结果;若匹配不一致,则确定所述一帧图像为所述目标检测模型处理不理想且需要标注的样本图像。
本发明实施例,第二方面,提供一种训练数据采样装置,包括:
目标检测单元,用于将视频输入到目标检测模型中,得到每一帧图像的检测结果;
目标跟踪单元,用于将所述视频的所有帧图像的检测结果输入到目标跟踪模型,得到每一帧图像的跟踪结果;
确定单元,用于针对所述视频的每一帧图像执行以下步骤:匹配一帧图像的检测结果与跟踪结果;若匹配不一致,则确定所述一帧图像为所述目标检测模型处理不理想且需要标注的样本图像。
本发明实施例,第三方面,提供一种计算机服务器,包括存储器,以及与所述存储器通信连接的一个或多个处理器;
所述存储器中存储有可被所述一个或多个处理器执行的指令,所述指令被所述一个或多个处理器执行,以使所述一个或多个处理器实现前述第一方面提供的训练数据采样方法。
本发明实施例中,针对视频的每一帧图像,将该一帧图像的检测结果和跟踪结果进行匹配,在匹配不一致时确定该一帧图像为目标检测模型处理不理想且需要标注的样本图像,从而使得确定出的样本图像均为目标检测模型处理不理想的图像;而一帧图像的跟踪结果一般是根据前一帧图像的检测结果得到,若一帧图像的检测结果与跟踪结果不相同则可能说明该目标检测模型发生漏检、误检等问题,往往是目标检测模型处理不理想的图像更能够反应目标检测模型的缺陷,因此将目标检测模型处理不理想的图像进行标注后再对目标检测模型进行重新训练,能够更好地提升目标检测模型的性能。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
图1为本发明实施例中训练数据采样方法的流程图之一;
图2为本发明实施例中训练数据采样方法的流程图之二;
图3为本发明实施例中训练数据采样装置的结构示意图之一;
图4为本发明实施例中训练数据采样装置的结构示意图之二;
图5为本发明实施例中计算机服务器的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
实施例一
参见图1,为本发明实施例中训练数据采样方法的流程图,该流程包括以下步骤:
步骤101、将视频输入到目标检测模型中,得到每一帧图像的检测结果。
步骤102、将所述视频的所有帧图像的检测结果输入到目标跟踪模型,得到每一帧图像的跟踪结果。
步骤103、针对所述视频的每一帧图像执行以下步骤:匹配一帧图像的检测结果与跟踪结果;若匹配不一致,则确定所述一帧图像为所述目标检测模型处理不理想且需要标注的样本图像。
优选地,所述步骤103中匹配一帧图像的检测结果与跟踪结果,具体可通过但不仅限于以下方式实现:采用二分图匹配算法匹配一帧图像的检测结果与跟踪结果。二分图匹配算法例如可以为匈牙利匹配算法。
当然,本领域技术人员还可以针对一帧图像,采用遍历方式一一匹配每一个检测目标和跟踪目标,例如,某一帧图像的检测结果包括A1、A2这两个检测目标,该一帧图像的跟踪结果包括B1、B2这两个跟踪目标,则分别匹配A1与B1、A1与B1、A2与B1、A2与B2这四组;若检测目标与跟踪目标一一对应匹配,则确定该一帧图像不是目标检测模型处理不理想且需要标注的样本图像,否则确定该一帧图像为目标检测模型处理不理想且需要标注的样本图像。
优选地,步骤103中确定出的样本图像中可能会存在相邻多帧图像,而该相邻多帧图像基本是一样的,为避免冗余,降低标注工作量,本发明实施例中,在前述所有实施例中,前述步骤103匹配完所述视频中的所有帧图像之后,还包括步骤104,如图2所示:
步骤104、通过时序非极大值抑制算法对步骤103确定出的样本图像进行采样。
例如,假设所述视频的图像帧按照时序依次用t1、t2、t3、…、tn表示,步骤103得到10张样本图像,该10张样本图像分别为t1、t2、t6、t7、t8、t20、t21、t22、t50、t100,设置的非极大值为3,则将连续3帧以内的样本图像采样成1帧,则10张样本图像采样后为:t1、t7、t21、t50和t100。
当然,本领域技术人员,针对步骤104也可以采用其他的方式对样本图像进行采用,例如采用简单的间隔采样算法。
实施例二
基于前述实施例一提供的训练数据采样方法的相同构思,本发明实施例二还提供一种训练数据采集装置,该装置的结构如图3所示,包括:
目标检测单元1,用于将视频输入到目标检测模型中,得到每一帧图像的检测结果;
目标跟踪单元2,用于将所述视频的所有帧图像的检测结果输入到目标跟踪模型,得到每一帧图像的跟踪结果;
确定单元3,用于针对所述视频的每一帧图像执行以下步骤:匹配一帧图像的检测结果与跟踪结果;若匹配不一致,则确定所述一帧图像为所述目标检测模型处理不理想且需要标注的样本图像。
优选地,所述确定单元3匹配一帧图像的检测结果与跟踪结果,具体包括:采用二分图匹配算法匹配一帧图像的检测结果与跟踪结果。
优选地,所述二分图匹配算法为匈牙利匹配算法。
优选地,在前述实施例中,所述装置还可进一步包括采样单元4,如图4所示,其中:
所述确定单元3进一步用于:在匹配完所述视频中的所有帧图像之后触发所述采样单元4;
采样单元4,用于通过时序非极大值抑制算法对所述确定单元确定出的样本图像进行采样。
实施例三
本发明实施例三还提供一种计算机服务器,如图5所示,该计算机服务器包括存储器,以及与所述存储器通信连接的一个或多个处理器;
所述存储器中存储有可被所述一个或多个处理器执行的指令,所述指令被所述一个或多个处理器执行,以使所述一个或多个处理器实现前述实施例一中任意一种训练数据1方法。
本发明实施例三中,该计算机服务器可以为PC机、笔记本、平板电脑、FPGA(Field-Programmable Gate Array,即现场可编程门阵列)、工业电脑或者智能手机等硬件设备。
以上结合具体实施例描述了本发明的基本原理,但是,需要指出的是,对本领域普通技术人员而言,能够理解本发明的方法和装置的全部或者任何步骤或者部件可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中,以硬件固件、软件或者他们的组合加以实现,这是本领域普通技术人员在阅读了本发明的说明的情况下运用它们的基本编程技能就能实现的。
本领域普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的上述实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括上述实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (9)

1.一种训练数据采样方法,其特征在于,包括:
将视频输入到目标检测模型中,得到每一帧图像的检测结果;
将所述视频的所有帧图像的检测结果输入到目标跟踪模型,得到每一帧图像的跟踪结果;
针对所述视频的每一帧图像执行以下步骤:匹配一帧图像的检测结果与跟踪结果;若匹配不一致,则确定所述一帧图像为所述目标检测模型处理不理想且需要标注的样本图像。
2.根据权利要求1所述的方法,其特征在于,匹配一帧图像的检测结果与跟踪结果,具体包括:
采用二分图匹配算法匹配一帧图像的检测结果与跟踪结果。
3.根据权利要求2所述的方法,其特征在于,所述二分图匹配算法为匈牙利匹配算法。
4.根据权利要求1~3任一项所述的方法,其特征在于,在匹配完所述视频中的所有帧图像之后,所述方法还包括:
通过时序非极大值抑制算法对确定出的样本图像进行采样。
5.一种训练数据采样装置,其特征在于,包括:
目标检测单元,用于将视频输入到目标检测模型中,得到每一帧图像的检测结果;
目标跟踪单元,用于将所述视频的所有帧图像的检测结果输入到目标跟踪模型,得到每一帧图像的跟踪结果;
确定单元,用于针对所述视频的每一帧图像执行以下步骤:匹配一帧图像的检测结果与跟踪结果;若匹配不一致,则确定所述一帧图像为所述目标检测模型处理不理想且需要标注的样本图像。
6.根据权利要求5所述的装置,其特征在于,所述确定单元匹配一帧图像的检测结果与跟踪结果,具体包括:
采用二分图匹配算法匹配一帧图像的检测结果与跟踪结果。
7.根据权利要求6所述的装置,其特征在于,所述二分图匹配算法为匈牙利匹配算法。
8.根据权利要求5~7任一项所述的装置,其特征在于,所述装置还包括采样单元;
所述确定单元进一步用于:在匹配完所述视频中的所有帧图像之后触发所述采样单元;
采样单元,用于通过时序非极大值抑制算法对所述确定单元确定出的样本图像进行采样。
9.一种计算机服务器,其特征在于,包括存储器,以及与所述存储器通信连接的一个或多个处理器;
所述存储器中存储有可被所述一个或多个处理器执行的指令,所述指令被所述一个或多个处理器执行,以使所述一个或多个处理器实现如权利要求1~4中任一项所述的训练数据采样方法。
CN201810498800.9A 2018-05-23 2018-05-23 一种训练数据采样方法及其装置、计算机服务器 Pending CN108960046A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201810498800.9A CN108960046A (zh) 2018-05-23 2018-05-23 一种训练数据采样方法及其装置、计算机服务器
US16/421,320 US11068719B2 (en) 2018-05-23 2019-05-23 Method and apparatus for sampling training data and computer server
US17/378,054 US11631249B2 (en) 2018-05-23 2021-07-16 Method and apparatus for sampling training data and computer server

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810498800.9A CN108960046A (zh) 2018-05-23 2018-05-23 一种训练数据采样方法及其装置、计算机服务器

Publications (1)

Publication Number Publication Date
CN108960046A true CN108960046A (zh) 2018-12-07

Family

ID=64499379

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810498800.9A Pending CN108960046A (zh) 2018-05-23 2018-05-23 一种训练数据采样方法及其装置、计算机服务器

Country Status (2)

Country Link
US (2) US11068719B2 (zh)
CN (1) CN108960046A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111369585A (zh) * 2020-02-28 2020-07-03 上海顺久电子科技有限公司 一种图像处理方法及设备
CN113741884A (zh) * 2020-05-29 2021-12-03 阿里巴巴集团控股有限公司 数据处理方法、装置及设备

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3140567A1 (en) * 2019-05-17 2020-11-26 Schlumberger Canada Limited System and method for managing wellsite event detection
CN111444833B (zh) * 2020-03-25 2023-09-15 中国农业科学院农业信息研究所 果实测产方法、装置、计算机设备及存储介质
US11689693B2 (en) * 2020-04-30 2023-06-27 Boe Technology Group Co., Ltd. Video frame interpolation method and device, computer readable storage medium
CN111862156B (zh) * 2020-07-17 2021-02-26 中南民族大学 一种基于图匹配的多目标跟踪方法和系统
CN112528932B (zh) * 2020-12-22 2023-12-08 阿波罗智联(北京)科技有限公司 用于优化位置信息的方法、装置、路侧设备和云控平台

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110293136A1 (en) * 2010-06-01 2011-12-01 Porikli Fatih M System and Method for Adapting Generic Classifiers for Object Detection in Particular Scenes Using Incremental Training
CN103324937A (zh) * 2012-03-21 2013-09-25 日电(中国)有限公司 标注目标的方法和装置
US20150220853A1 (en) * 2012-03-23 2015-08-06 Nuance Communications, Inc. Techniques for evaluation, building and/or retraining of a classification model
CN104866472A (zh) * 2015-06-15 2015-08-26 百度在线网络技术(北京)有限公司 分词训练集的生成方法和装置
CN106707293A (zh) * 2016-12-01 2017-05-24 百度在线网络技术(北京)有限公司 用于车辆的障碍物识别方法和装置
CN107491790A (zh) * 2017-08-25 2017-12-19 北京图森未来科技有限公司 一种神经网络训练方法及装置
CN107679455A (zh) * 2017-08-29 2018-02-09 平安科技(深圳)有限公司 目标跟踪装置、方法及计算机可读存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8331619B2 (en) * 2008-03-14 2012-12-11 Sony Computer Entertainment Inc. Image processing apparatus and image processing method
US20160300573A1 (en) * 2015-04-08 2016-10-13 Google Inc. Mapping input to form fields
JP6390671B2 (ja) * 2016-07-29 2018-09-19 オムロン株式会社 画像処理装置および画像処理方法
JP6697986B2 (ja) * 2016-09-07 2020-05-27 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置および画像領域分割方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110293136A1 (en) * 2010-06-01 2011-12-01 Porikli Fatih M System and Method for Adapting Generic Classifiers for Object Detection in Particular Scenes Using Incremental Training
CN103324937A (zh) * 2012-03-21 2013-09-25 日电(中国)有限公司 标注目标的方法和装置
US20150220853A1 (en) * 2012-03-23 2015-08-06 Nuance Communications, Inc. Techniques for evaluation, building and/or retraining of a classification model
CN104866472A (zh) * 2015-06-15 2015-08-26 百度在线网络技术(北京)有限公司 分词训练集的生成方法和装置
CN106707293A (zh) * 2016-12-01 2017-05-24 百度在线网络技术(北京)有限公司 用于车辆的障碍物识别方法和装置
CN107491790A (zh) * 2017-08-25 2017-12-19 北京图森未来科技有限公司 一种神经网络训练方法及装置
CN107679455A (zh) * 2017-08-29 2018-02-09 平安科技(深圳)有限公司 目标跟踪装置、方法及计算机可读存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111369585A (zh) * 2020-02-28 2020-07-03 上海顺久电子科技有限公司 一种图像处理方法及设备
CN111369585B (zh) * 2020-02-28 2023-09-29 上海顺久电子科技有限公司 一种图像处理方法及设备
CN113741884A (zh) * 2020-05-29 2021-12-03 阿里巴巴集团控股有限公司 数据处理方法、装置及设备

Also Published As

Publication number Publication date
US20190384982A1 (en) 2019-12-19
US20210342594A1 (en) 2021-11-04
US11631249B2 (en) 2023-04-18
US11068719B2 (en) 2021-07-20

Similar Documents

Publication Publication Date Title
CN108960046A (zh) 一种训练数据采样方法及其装置、计算机服务器
US20180088663A1 (en) Method and system for gesture-based interactions
US11967089B2 (en) Object tracking method, tracking processing method, corresponding apparatus, and electronic device
CN106845440B (zh) 一种增强现实图像处理方法及系统
CN110378966B (zh) 车路协同相机外参标定方法、装置、设备及存储介质
CN108769517A (zh) 一种基于增强现实进行远程辅助的方法与设备
WO2017168262A1 (en) Video stream augmenting
CN107831902B (zh) 一种运动控制方法及其设备、存储介质、终端
US10990170B2 (en) Eye tracking method, electronic device, and non-transitory computer readable storage medium
EP3218873A1 (en) Systems and methods for tracking an object
WO2020244075A1 (zh) 手语识别方法、装置、计算机设备及存储介质
CN110245679A (zh) 图像聚类方法、装置、电子设备及计算机可读存储介质
US20230143452A1 (en) Method and apparatus for generating image, electronic device and storage medium
CN111797733A (zh) 一种基于图像的行为识别方法、装置、设备和存储介质
CN111739016A (zh) 目标检测模型训练方法、装置、电子设备及存储介质
US20190279048A1 (en) Methods and systems of real time movement classification using a motion capture suit
CN115661336A (zh) 一种三维重建方法及相关装置
CN111881740A (zh) 人脸识别方法、装置、电子设备及介质
CN112241001B (zh) 雷达人体动作识别方法、装置、电子设备和存储介质
CN113822097B (zh) 单视角人体姿态识别方法、装置、电子设备和存储介质
CN109816791B (zh) 用于生成信息的方法和装置
CN112270205A (zh) 一种案件侦查方法及装置
US20230139994A1 (en) Method for recognizing dynamic gesture, device, and storage medium
CN113255539B (zh) 多任务融合的人脸定位方法、装置、设备及存储介质
CN111199179B (zh) 目标对象的跟踪方法、终端设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200324

Address after: 101300, No. two, 1 road, Shunyi Park, Zhongguancun science and Technology Park, Beijing, Shunyi District

Applicant after: BEIJING TUSENZHITU TECHNOLOGY Co.,Ltd.

Address before: 101300, No. two, 1 road, Shunyi Park, Zhongguancun science and Technology Park, Beijing, Shunyi District

Applicant before: TuSimple

TA01 Transfer of patent application right