CN115578790A - 动作识别的方法、动作识别模型的优化部署方法 - Google Patents

动作识别的方法、动作识别模型的优化部署方法 Download PDF

Info

Publication number
CN115578790A
CN115578790A CN202211249463.2A CN202211249463A CN115578790A CN 115578790 A CN115578790 A CN 115578790A CN 202211249463 A CN202211249463 A CN 202211249463A CN 115578790 A CN115578790 A CN 115578790A
Authority
CN
China
Prior art keywords
action
video
determining
target object
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211249463.2A
Other languages
English (en)
Inventor
孙熠
孙凯
杨晓刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Alibaba China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd filed Critical Alibaba China Co Ltd
Priority to CN202211249463.2A priority Critical patent/CN115578790A/zh
Publication of CN115578790A publication Critical patent/CN115578790A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7837Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content
    • G06F16/784Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content the detected or recognised objects being people
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting

Abstract

本申请提供了一种动作识别的方法、动作识别模型的优化部署方法,包括以下步骤:确定视频中的动作特征;动作特征是通过对视频中目标对象的操作动作进行特征提取确定的;利用动作特征,在预先构建的动作特征数据库中进行检索,确定与动作特征匹配的动作类型;动作特征数据库中存储有针对多个类别的目标对象的动作特征与动作类型的对应关系,每一个类别的目标对象的动作特征至少为一个,依据本申请实施例,降低人工识别的成本,随着识别过程的优化,可以提高识别质量和效率。

Description

动作识别的方法、动作识别模型的优化部署方法
技术领域
本申请涉及图像识别技术领域,尤其涉及一种动作识别的方法、动作识别模型的优化部署方法。
背景技术
在一些质检场景下,质检员需要对目标对象进行指定的操作动作以确定目标对象的质量,从而用于减少存在问题的目标对象的流通。对于质检员的操作动作是否标准、是否完整等,往往需要人工进行核验,一方面提高了成本;另一方面对于核验的质量和效率也会存在一定问题。
发明内容
本申请实施例提供一种动作识别的方法、服装质检处理方法、动作识别模型的优化部署方法、装置、电子设备及存储介质,以实现动作识别的自动化,以及动作识别过程的优化。一方面降低人工识别的成本,另一方面随着识别过程的优化,可以提高识别质量和效率。
第一方面,本申请实施例提供了一种动作识别的方法,包括以下步骤:
确定视频中的动作特征;动作特征是通过对视频中目标对象的操作动作进行特征提取确定的;
利用动作特征,在预先构建的动作特征数据库中进行检索,确定与动作特征匹配的动作类型;动作特征数据库中存储有针对多个类别的目标对象的动作特征与动作类型的对应关系,每一个类别的目标对象的动作特征至少为一个。
第二方面,本申请实施例提供了一种服装质检处理方法,包括以下步骤:
确定动作特征;动作特征是通过对视频中出现的服装质检动作进行特征提取确定的;
利用动作特征,在预先构建的质检动作特征数据库中进行检索,得到检索结果;检索结果中包含与动作特征匹配的质检动作;质检动作特征数据库中存储有针对多个服装类别的动作特征与质检动作的对应关系,每一个服装类别的质检动作特征至少为一个;
利用检索结果,对视频中出现的服装质检动作进行检验。
第三方面,本申请实施例提供了一种动作识别模型的优化部署方法,包括以下步骤:
对视频样本进行解析,确定视频样本中的内容;内容包括视频样本的采集环境、视频样本中目标对象的类别以及对目标对象的操作动作中的至少一种;
确定视频样本中的内容与已有内容的差异;
利用差异对动作识别模型进行优化部署;动作识别模型用于确定视频中的动作特征,并利用动作特征,在预先构建的动作特征数据库中进行检索,确定与动作特征匹配的动作类型。
第四方面,本申请实施例提供了一种动作识别的装置,该装置可以包括:
动作特征确定模块,用于确定视频中的动作特征;动作特征是通过对视频中目标对象的操作动作进行特征提取确定的;
动作类型确定模块,用于利用动作特征,在预先构建的动作特征数据库中进行检索,确定与动作特征匹配的动作类型;动作特征数据库中存储有针对多个类别的目标对象的动作特征与动作类型的对应关系,每一个类别的目标对象的动作特征至少为一个。
第五方面,本申请实施例提供了一种动作识别模型的优化部署装置,该装置可以包括:
解析模块,用于对视频样本进行解析,确定视频样本中的内容;内容包括视频样本的采集环境、视频样本中目标对象的类别以及对目标对象的操作动作中的至少一种;
差异确定模块,用于确定视频样本中的内容与已有内容的差异;
优化部署模块,用于利用差异对动作识别模型进行优化;动作识别模型用于确定视频中的动作特征,并利用动作特征,在预先构建的动作特征数据库中进行检索,确定与动作特征匹配的动作类型。
第六方面,本申请实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,处理器在执行计算机程序时实现上述任一项的方法。
第七方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述任一项的方法。
与现有技术相比,本申请具有如下优点:
依据本申请实施例,在面对获取到的不同类别的目标对象的操作动作时,可以用通用的动作特征确定方式确定动作特征。进而利用动作特征检索的方式在已构建的动作特征数据库中进行检索,以确定出视频中的动作作为动作识别结果。相比于每个类别的目标对象需要单独训练对应的特征识别模型,当前实施例中使用通用的特征确定方式来应对所有操作动作,从而节省模型的训练复杂程度以及部署难度。除此之外,预先构建的动作特征数据库已存储有动作特征,以及动作特征与目标对象的类别、动作类型之间的关联关系。基于此,利用特征检索算法即可实现准确的动作类型确定。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,可依照说明书的内容予以实施,并且为了让本申请的上述和其他目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本申请的一些实施方式,而不应将其视为是对本申请范围的限制。
图1为本申请提供的动作识别的方法的场景示意图;
图2为本申请一实施例的动作识别的方法的示意图之一;
图3是本申请另一实施例的动作识别的方法的流程图;
图4为本申请一实施例的动作识别的方法的示意图之二;
图5为本申请一实施例的服装质检处理方法的流程图;
图6为本申请一实施例的动作识别模型的优化部署方法的流程图;
图7为本申请一实施例的动作识别模型的优化部署方法的示意图之一;
图8为本申请一实施例的动作识别模型的优化部署方法的示意图之二;
图9是本申请一实施例的动作识别的装置的结构框图;
图10是本申请一实施例的服装质检处理装置的结构框图;
图11是本申请一实施例的动作识别模型的优化部署装置的结构框图;以及
图12为用来实现本申请实施例的电子设备的框图。
具体实施方式
在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本申请的构思或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的,而非限制性的。
为便于理解本申请实施例的技术方案,以下对本申请实施例的相关技术进行说明。以下相关技术作为可选方案与本申请实施例的技术方案可以进行任意结合,其均属于本申请实施例的保护范围。
首先对本申请所涉及的名词进行解释。
动作特征:将输入数据通过一定的计算方法得到一个固定长度的向量,该向量可以表征图片或视频片段中的动作,并可以用于度量各动作之间的相关性或者相似程度。
特征提取:对输入数据实行某种计算过程,得到该数据特征向量的过程。
动作特征数据库:指对图片或视频片段中的动作进行数据特征提取后,通过特征压缩、特征聚类等方法,构建由特征组成的数据库。
图1为示例性的用于实现本申请实施例的方法的一个应用场景的示意图。对获取到的视频图像进行识别,以确定视频图像中的动作。视频图像可以是通过摄像头等图像采集装置所采集的视频图像,也可以是通过手机等智能设备拍摄的视频图像等。以执行主体为动作识别终端为示例,动作识别终端可以通过通信网络获取到视频图像,从而对视频图像中的动作进行识别。确定视频图像中的动作的目的可以是判断视频图像中的动作是否为对目标对象的标准操作动作。示例性地,目标对象可以是成衣,例如,可以是出厂前的西服、衬衫、冲锋衣等。对目标对象的标准操作动作可以是成衣在出厂前的质检动作,例如,可以是翻袖口的动作、翻领口的动作、拉拉链的动作等。对于不同类型的成衣,质检动作可能会存在差异。例如,对于西服的质检动作需要包含翻袖口的动作、翻领口的动作等,而对于无袖的开衫上衣,无需翻袖口的动作,但包含拉拉链的动作等。
视频图像可以包括多个动作的片段。以一个动作片段为例说明。以操作动作为质检动作为例,对动作片段中的动作进行动作特征提取,以确定出动作特征。动作特征可以利用向量表示。利用特征向量检索算法,在预先构建的动作特征数据库中进行匹配检索,从而可以确定出视频图像中的动作。其中,动作特征数据库可以是离线数据库,动作特征数据库中可以存储有不同类型的成衣的质检动作以及动作特征的对应关系,从而构成多个子集。例如,对于西装类成衣的质检,可以包括第一质检动作、第二质检动作和第三质检动作。对于冲锋衣类成衣,可以包括第一质检动作、第三质检动作、第四质检动作和第五质检动作。对应的,在进行特征向量检索时,可以首先确定视频中目标对象的类别,从而仅对对应类别的动作特征进行检索。
当前实施例中,通过通用的特征提取模型即可为所有动作提取具有足够表达力的特征。在得到特征后,可以利用特征数据库对每个类别的目标对象以及其对应的质检标准动作建立数据库子集的特点,将动作检索的结果限制在当前类别的质检过程所包含的质检动作中,从而保证了特征提取模型结合检索算法的识别精度。
如图2所示为一种动作识别的方法的流程图。以对成衣的质检动作进行识别为示例进行简要说明。在进行识别前,需要针对不同类型的成衣预先训练出对应的动作识别模型。例如,图2中包括在不同环境采集的图像,如工厂甲、工厂乙等。在工厂甲或工厂乙等不同环境,或者可以是工厂甲的第一质检工位,第二质检工位等位置,可以采集到第一类别服装动作视频和第二类别服装动作视频,在工厂戊中,可以采集到第三类别服装动作视频等。服装动作视频可以是对服装进行质检的视频。不同的服装类别可以是男士上装、男士下装、女士上装等。对于不同类别的服装,质检动作可能会存在差异。例如,第一类别服装动作视频中包括动作一、动作二、动作三(对应第一质检动作、第二质检动作和第三质检动作)。第二类别服装动作视频中包括动作一、动作二、动作四(对应第一质检动作、第二质检动作和第四质检动作)。通过对不同环境下,每个类别服装动作视频中的动作进行数据采集、数据标注和模型训练,可以训练出针对不同类别服装所对应的模型。例如,第一类别服装和第二类别服装是相似类型,例如男士T恤和女士T恤,或者男士长袖衬衫和男士短袖衬衫等。对于相似类型的成衣,质检动作通常也是相同或近似的。例如,对于男士T恤和女士T恤的质检动作可以是通过翻领口的动作检查成衣的吊牌。基于此,可以共同使用一个动作识别模型。例如图2中的模型0。另外,对于其他类型的成衣,可以对应使用图2中所示的模型1、模型2、……、模型N等。以模型0为示例,其模型的输入为服装动作视频,输出为动作识别结果,即质检动作的类型。例如,在识别正确的情况下,动作识别结果为翻领口。
以模型0的训练过程为例,可以预先采集包含对于男士T恤和女士T恤的质检动作的视频。通过对视频进行标注得到模型0的训练样本,从而利用训练样本对模型0进行训练,最终得到训练好的模型0。示例性地,标注结果可以是翻领口。在上述过程中,服装动作视频的采集大约需要5天时间,对视频进行标注大约需要15天时间,模型训练大约需要5天时间。即,对于模型0的训练周期大约为25天左右。
本申请实施例提供了一种动作识别的方法,如图3所示为本申请一实施例的动作识别的方法的流程图,可以包括:
步骤S301:确定视频中的动作特征;动作特征是通过对视频中目标对象的操作动作进行特征提取确定的。
当前实施例可以是在线部署的应用场景,即当前实施例的执行是在实际业务场景中,对实际业务场景中的数据进行处理并得到符合实际业务场景需求的结果。举例而言,实际业务场景可以是对成衣出厂前的质检场景。对于成衣生产厂商而言,在成衣生产完成后,需要对成衣进行质检。例如,通过翻领口的动作检查成衣的吊牌,通过翻口袋的动作检测口袋是否有遗留物品或者口袋是否已封口,通过拉拉链的动作检测拉链是否可以顺利拉起等。
视频可以是在成衣生产工厂的生产车间所拍摄的视频,或者,还可以是在质检流水线上的质检工位所采集的视频等。视频中的内容可以包括质检员对视频中的目标对象的操作动作。目标对象可以是西服、连衣裙、冲锋衣等成衣。后文中,以对目标对象的操作动作是对成衣的质检动作为示例进行阐述和说明,质检动作可以是如前述的翻领口的动作、翻口袋的动作、拉拉链的动作等。
利用预先训练好的通用的动作特征提取模型可以确定质检动作的动作特征。动作特征可以以向量形式表示。在一段视频中包括多个质检动作的情况下,可以利用动作识别技术将视频中的多个动作切分成视频片段,从而确定每个视频片段中的质检动作的动作特征。
步骤S302:利用动作特征,在预先构建的动作特征数据库中进行检索,确定与动作特征匹配的动作类型;动作特征数据库中存储有针对多个类别的目标对象的动作特征与动作类型的对应关系,每一个类别的目标对象的动作特征至少为一个。
动作特征数据库是预先构建的离线数据库。动作特征数据库中可以包括多个类别的目标对象的动作特征,每个动作特征均可以与动作类型之间存在对应关系。例如,对于成衣而言,粗粒度的分类类别可以是男士上装、男士下装、女士上装、女士下装等。细粒度的分类类别还可以是男士T恤、男士衬衫、男士西裤、女士T恤、女士长裙、儿童外套等,具体类别不再赘述举例。不同类别的成衣所对应的质检动作可能会存在差异。以粗粒度分类进行示例性说明,例如,对于男士上装的质检动作可以是通过翻领口的动作检查成衣的吊牌。对于男士下装的质检动作可以是通过翻口袋的动作检测口袋是否有遗留物品或者口袋是否已封口,通过拉拉链的动作检测拉链是否可以顺利拉起。翻领口、翻口袋、拉拉链等可以对应不同的动作类型。基于此,在动作特征数据库中保存有针对不同目标对象的动作特征与动作类型之间的关联关系。
利用确定出的动作特征可以在预先构建的动作特征数据库中进行检索,从而确定出与动作特征匹配的动作类型。基于此,可以对当前类别的成衣的质检动作进行管理,确定出是否按照质检标准进行对应的质检过程。结合图4所示,根据当前实施例,在面对获取到的不同类别的成衣的质检动作时,可以用通用的动作特征数据模型进行动作特征的确定。进而利用动作特征检索的方式在已构建的动作特征数据库中进行检索,以确定出视频中的动作类型作为动作识别结果。相比于每个类别的成衣需要单独训练对应的特征识别模型,当前实施例中使用通用的特征确定方式来应对所有动作,从而节省模型的训练复杂程度以及部署难度。除此之外,预先构建的动作特征数据库已存储有目标对象的动作特征,以及动作特征与动作类型之间的关联关系。基于此,利用特征检索算法即可实现准确的动作类型确定。在一个实例中,动作特征数据模型和动作特征检索算法可以是端到端模型,从而提高模型的整合度。
本申请的上述方案可以应用于数字化工厂、数字化车间,提升智能制造的能力。例如,通过在服装工厂、服装车间的质检工位或质检工位所在区域设置图像采集设备,以采集服装质检动作。通过对服装质检动作进行特征提取,可以实现质检动作的数字化。在确定出与动作特征匹配的动作类型后,可以对质检工位进行的服装质检动作进行检验。例如,可以检测是否漏检某个服装质检动作,或者服装质检动作未到位等,实现服装质检动作检验的自动化、智能化。上述部署可以减少检验人员的安排,辅助保障服装的质检效率和质检质量,以降低出厂服装的瑕疵情况,提高服装工厂的利润。
在一种可能的实现方式中,确定视频中的动作特征,可以包括:
步骤S3011:对视频进行切分,得到多个候选视频片段。
以目标对象为成衣为示例,由于视频中可能包含对成衣进行质检的多个操作动作,因此可以首先对视频进行切分处理,得到多个候选视频片段。示例性地,可以根据经验值以0.5秒、1秒或者2秒等间隔,将视频切分成多个候选视频片段。
步骤3012:对出现操作动作的候选视频片段进行识别,确定存在同一操作动作的目标视频片段。
可以对候选视频片段进行初筛。例如,可以将有人物出现的视频片段进行保留,将没有人物出现的视频片段删除。上述过程可以利用图像识别技术实现,例如,在固定位置拍摄没有人物的图像或视频。在有人物出现的情况下,在视频图像中的某个区域会出现像素级别的显著变化,基于此可以进行图像识别。
对于保留下来的视频片段,可以利用预先训练好的动作特征提取模型确定视频片段中的动作特征。例如,第一视频片段提取出的特征为第一特征向量,第二视频片段提取出的特征为第二特征向量。利用第一特征向量在预先构建的动作特征数据库中进行检索,以在动作特征数据库中确定与第一特征向量匹配度最高的已有特征向量。同理,利用第二特征向量在预先构建的动作特征数据库中进行检索,以确定与第二特征向量匹配度最高的已有特征向量。若与第一特征向量匹配的已有特征向量和与第二特征向量匹配的已有特征向量相同,则可以确定第一特征向量和第二特征向量对应同一个质检动作。即,可以确定出第一视频片段和第二视频片段存在同一质检动作。
或者,还可以利用确定出的与第一特征向量匹配度最高的已有特征向量来比对。例如,与第一特征向量匹配度最高的已有特征向量是翻领口的动作特征。可以基于翻领口的动作特征验证第二视频片段提取出的第二特征向量,若验证通过,可以直接将第二视频片段与第一视频片段合并。进而再继续验证第三视频片段,直至确定出存在同一操作动作的多个目标视频片段。
对于两个操作动作中的连接动作的视频片段,虽然会被采集到,但是会在特征向量的匹配过程中因无法匹配而被过滤。
步骤S3013:确定目标视频片段中的动作特征。
根据第一视频片段和第二视频片段的采集时序,可以将第一视频片段和第二视频片段进行组合,合并成目标视频。将合成的目标视频中完整动作的特征作为确定出的动作特征。
通过上述过程,即便视频中有多个质检动作,也可以将多个质检动作进行拆解,得到每个质检动作对应的视频片段。从而在后续动作识别过程中,可以将操作动作进行逐一识别。
在一种可能的实现方式中,动作特征的确定方式,可以包括:
步骤S401:确定视频中的目标对象的类别。
可以利用预先训练的分类模型对视频中的目标对象进行识别,以确定视频中的目标对象的类别。图像分类模型可以利用标注后的图像样本或标注后的视频样本进行训练。标注的内容可以是对图像样本或视频样本中的目标对象的类别,例如男士T恤、儿童外套等。将视频输入预先训练的分类模型,可以得到目标对象类别的预测结果。
步骤S402:根据目标对象的类别,确定与目标对象的类别对应的动作特征确定模型。
动作特征确定模型可以是预先训练的。例如,目标对象的类别为男士T恤,而男士T恤的质检动作为翻领口。基于此,可以利用标注后的翻领口的视频作为训练样本,对男士T恤所对应的动作特征确定模型进行训练,得到与男士T恤对应的动作特征确定模型。在确定出视频中的目标对象的类别为男士T恤的情况下,即可选用男士T恤所对应的动作特征确定模型。
步骤S403:利用目标对象的类别对应的动作特征确定模型,对视频中目标对象的操作动作进行特征提取,以确定视频中的动作特征。
在确定出视频中的目标对象的类别为男士T恤的情况下,利用男士T恤所对应的动作特征确定模型对视频中目标对象的质检动作进行特征提取,以确定出对应的动作特征。通过选择不同类别的目标对象所对应的动作特征确定模型,可以更进一步的提高特征提取的精度。
采用与目标对象的类别对应的动作特征确定模型的方式,可以提升不同类别目标对象的操作动作的特征的提取精度。而采用前述的通用特征提取模型,可以应对提取不同类别目标对象操作动作的特征,从而可以提高模型部署过程中的效率。
在一种可能的实现方式中,步骤S302可以包括:
步骤S3021:确定视频中的目标对象的类别。
可以利用预先训练的分类模型对视频中的目标对象进行识别,以确定视频中的目标对象的类别。图像分类模型可以利用标注后的图像样本或标注后的视频样本进行训练。标注的内容可以是对图像样本或视频样本中的目标对象的类别,例如男士T恤、儿童外套等。将视频输入预先训练的分类模型,可以得到目标对象类别的预测结果。
步骤S3022:根据目标对象的类别,在动作特征数据库中确定与目标对象的类别匹配的动作特征的集合。
如前已述及,男士T恤、儿童外套等可以作为目标对象的类别识别结果。对应的,已知预先构建的动作特征数据库中存储有针对多个类别的目标对象的动作特征,以及动作特征与动作类型的对应关系。基于此,可以根据类别识别结果在动作特征数据库中确定与目标对象的类别匹配的动作特征的集合。例如,在模板对象为男士T恤的情况下,可以在动作特征数据库中筛选出男士T恤的相关动作特征,作为动作特征的集合。从而方便在后续检索时,仅在动作特征的集合中执行检索动作即可。
步骤S3023:根据动作特征的相似程度,在动作特征的集合中进行检索,以确定与动作特征匹配的动作类型。
动作特征的相似程度可以利用特征向量匹配原理进行,例如,可以是向量检索算法。通过筛选出与目标对象的类别匹配的动作特征的集合,一来可以降低特征向量匹配的数据量。二来每个类别以及其对应的操作动作建立单独的动作特征集合的特点,将动作检索的结果限制在当前类别的操作过程所包含的动作中,从而保证了特征模型结合向量检索算法的识别精度。
在一种可能的实现方式中,还包括利用动作类型对视频中目标对象的操作动作进行检验的过程;
检验的过程,可以包括以下步骤:
步骤S303:获取目标对象的标准动作类型序列;标准动作类型序列包括至少一个动作类型。
对于每一类目标对象,都可以对应有一套标准动作类型序列。以目标对象为男士上装为例,标准动作类型序列可以是通过翻领口的动作检查成衣的吊牌。以目标对象为男士下装为例,标准动作类型序列可以是通过翻口袋的动作检测口袋是否有遗留物品或者口袋是否已封口,通过拉拉链的动作检测拉链是否可以顺利拉起。
步骤S304:将确定出的与动作特征匹配的动作类型和标准动作类型序列中的动作类型进行比对,以进行校验。
利用动作特征,可以在预先构建的动作特征数据库中进行检索,从而确定与动作特征匹配的动作类型。例如,对于男士上装的动作类型确定结果,如果是翻领口的动作类型,则表示对于男上装的操作动作是合规的。基于此,校验结果可以是通过。又例如,对于男士下装的动作类型确定结果,如果仅包含翻口袋的动作类型,则可以确定校验结果为漏检、校验结果可以是不通过。再例如,对于男士下装的动作类型确定结果,如果包含翻口袋的动作类型和翻领口的动作类型,则可以确定校验结果为漏检或错检。即漏检了拉拉链的动作类型或者将拉拉链的动作类型错检为翻领口的动作类型。校验结果可以是不通过。
通过上述过程,可以对视频中目标对象的操作动作进行校验。在成衣质检场景下,可以减少检验人员的安排,辅助保障服装的质检效率和质检质量。
本申请实施例提供了一种服装质检处理方法,如图5所示为本申请一实施例的服装质检处理方法的流程图,可以包括:
步骤S501:确定动作特征;动作特征是通过对视频中出现的服装质检动作进行特征提取确定的。
视频可以是在成衣生产工厂的生产车间所拍摄的视频,或者,还可以是在质检流水线上的质检工位所采集的视频等。视频中的内容可以包括质检员对服装的质检动作。服装可以包括西服、连衣裙、冲锋衣等成衣。质检动作可以是如前述的翻领口的动作、翻口袋的动作、拉拉链的动作等。
步骤S502:利用动作特征,在预先构建的质检动作特征数据库中进行检索,得到检索结果;检索结果中包含与动作特征匹配的质检动作;质检动作特征数据库中存储有针对多个服装类别的动作特征与质检动作的对应关系,每一个服装类别的质检动作特征至少为一个。
动作特征数据库是预先构建的离线数据库。动作特征数据库中可以包括多个服装类别的动作特征,每个动作特征均可以与动作类型之间存在对应关系。例如,服装类别为男士上装,动作特征数据库中可以包括翻领口的动作特征,以及翻领口的动作特征与翻领口的动作质检的对应关系。服装类别为男士下装,动作特征数据库中可以翻口袋的动作特征,以及翻口袋的动作特征与翻口袋的动作质检的对应关系。
步骤S503:利用检索结果,对视频中出现的服装质检动作进行检验。
对于每一服装类别,都可以对应有一套标准动作类型序列。以目标对象为男士下装为例,标准动作类型序列可以是通过翻口袋的动作检测口袋是否有遗留物品或者口袋是否已封口,通过拉拉链的动作检测拉链是否可以顺利拉起。如果检索结果符合该标准动作类型序列,则可以确定视频中出现的服装质检动作检验通过。反之,如果检索结果未能符合该标准动作类型序列,则可以确定视频中出现的服装质检动作检验不通过。
本申请实施例提供了一种动作识别模型的优化部署方法,如图6所示为本申请一实施例的动作识别模型的优化部署方法的流程图,可以包括:
步骤S601:对视频样本进行解析,确定视频样本中的内容;内容包括视频样本的采集环境、视频样本中目标对象的类别以及对目标对象的操作动作中的至少一种。
当前实施例可以是离线训练场景。视频样本可以是预先采集到的对目标对象的操作动作的样本。仍以目标对象为成衣为示例,视频样本可以是采集到的对成衣进行质检操作的样本,即质检操作的动作可以对应操作动作。可以利用图像识别技术对视频样本进行解析,从而确定视频样本中的内容。其中,内容可以包括采集环境、目标对象的类别以及对目标对象的操作动作中的至少一种。采集环境可以包括服装工厂的差异、质检流水线上工位的差异或者是质检人员的差异等。目标对象的类别即为成衣的类别,粗粒度的分类类别可以是男士上装、男士下装、女士上装、女士下装等。细粒度的分类类别还可以是男士T恤、男士衬衫、男士西裤、女士T恤、女士长裙、女士短裙等。不同类别的成衣可以有对应的质检动作。以粗粒度分类进行示例性说明,例如,对于男上装的质检动作可以是通过翻领口的动作检查成衣的吊牌。对于男士下装的质检动作可以是通过翻口袋的动作检测口袋是否有遗留物品或者口袋是否已封口,通过拉拉链的动作检测拉链是否可以顺利拉起。
通过图像识别技术,可以对视频的采集环境以及视频中出现的成衣的类别进行确定。通过动作特征的匹配,可以对视频中出现的操作动作进行识别。基于此,可以实现对于视频样本中内容的确定。
步骤S602:确定视频样本中的内容与已有内容的差异。
已有内容可以是预先已经累积的内容数据。例如,已有内容可以是在现有工厂、现有质检流水线上对现有质检人员的质检动作所采集的视频图像。其中,采集的视频图像可以包括已经累积的对n个类别的成衣的质检动作,n为正整数。所谓差异,可以是在新的工厂、新的质检流水线、新的质检人员,或者可以是新架设的图像采集设备所采集到的视频图像中出现的质检动作等。或者,也可以是在现有工厂、现有质检流水线上的已有质检人员(或新的质检人员)对新的类别的成衣的质检动作。再者,还可以是在现有工厂、现有质检流水线上的已有质检人员(或新的质检人员)对现有类别成衣的新的质检动作等。通过图像识别技术,可以确定出视频样本中的内容与已有内容的差异。
步骤S603:利用差异对动作识别模型进行优化部署。
在出现差异的情况下,可以基于差异对动作识别模型进行优化部署。如前已述,动作识别过程可以是先确定动作特征,进而利用动作特征在预先构建的动作特征数据库中进行特征匹配,从而基于特征匹配的结果确定动作类型。因此,对于动作识别模型进行优化部署可以是从动作特征提取的维度进行,或者可以从动作特征数据库的维度进行。
从动作特征提取的维度进行优化部署可以是更新训练样本,从而优化特征提取模型的参数。从动作特征数据库的维度进行优化部署可以是更新动作特征数据库中的动作特征,以及建立该特征与新的动作类型的对应关系,从而在特征匹配时可以匹配到准确的动作类型。
通过上述过程,在视频样本中的内容与已有内容相比发生变化的情况下,可以仅根据变化部分对动作识别模型进行优化部署,从而可以节省离线部署的周期。针对全部内容更新导致的适配流程过长的缺陷,当前实施例中提出利用差异进行优化部署,可以将部署所需时间缩短50%~80%。
在一种可能的实现方式中,在差异满足第一指定条件的情况下,步骤S603可以包括:
步骤S6031:确定差异操作动作;差异操作动作为与已有操作动作的变化幅度超过对应阈值的动作。
第一指定条件可以是预先设置的条件。第一指定条件可以是差异比较小的情况。例如,在如原有工厂、原有质检工位下对已有服装类别的新增加的质检动作等。新增加的质检动作的数量上限可以是预先确定的。
可以利用特征提取,以及将提取出的特征与动作特征数据库中的特征进行匹配的方式,确定出新增加的质检动作,即差异操作动作。例如,在匹配过程中,出现动作特征的向量与已有动作特征的向量之间的差异超过对应阈值,则可以认为对目标对象的操作动作为差异操作动作。
步骤S6032:确定差异操作动作的特征,将差异操作动作的特征与差异操作动作进行关联后,存储至动作特征数据库;动作特征数据库为动作识别模型依据动作特征进行动作识别时进行检索的数据库。
在确定出差异操作动作后,可以将确定出的差异操作动作的动作特征进行存储。例如,差异操作动作是新增加的对男士T恤的翻袖口的动作。在确定出翻袖口所对应动作的动作特征后,可以将翻袖口的动作特征与男士T恤、翻袖口的动作进行关联后存储至动作特征数据库。从而实现对于动作特征数据库的更新优化。
动作识别模型可以包括动作特征提取模型和匹配模型。动作特征提取模型用于操作动作的特征确定,匹配模型用于在动作特征数据库中进行匹配,以依据动作特征确定动作类型。基于此,将差异操作动作的特征与差异操作动作以及目标对象的类型(男士T恤)之间进行关联后,存储至动作特征数据库。
结合图7所示,从差异操作动作的特征的确定,再到将差异操作动作的动作特征与差异操作动作以及目标对象的类型之间关联后存储至动作特征数据库,实现动作特征数据库的优化,整个过程仅需要5天时间左右。相比于通用技术需要重新训练动作识别模型,无疑大幅优化了部署效率。
在一种可能的实现方式中,第一指定条件的确定方式,可以包括:
在对目标对象的操作动作为新的操作动作的情况下,确定满足第一指定条件。
第一指定条件可以是视频样本的采集环境,以及视频样本中目标对象的类别均未改变,仅改变了操作动作的情况。例如,在原有工厂,原有质检工位对原有类别的服装新增加了部分质检动作。可以利用图像识别技术,确定是否满足第一指定条件。
在一种可能的实现方式中,在差异满足第二指定条件的情况下,利用差异对动作识别模型进行优化部署,包括:
S6033:确定差异操作动作;差异操作动作为与已有操作动作的变化幅度超过对应阈值的动作。
第二指定条件可以是预先设置的条件。第二指定条件可以是差异比较大的情况。例如,在新的质检工位采集到的视频图像,调整或新增图像采集设备的位置,或者采集到的对于新出现类别的服装的质检动作等,都可以认为是差异较大的情况。
S6034:对差异操作动作进行标注,作为动作识别模型的更新训练样本。
在差异较大的情况下,为了提高差异操作动作的识别精度,可以对差异操作动作进行标注。例如,可以对采集到的各个差异操作动作进行标注,示例性地,标注第一差异操作动作为翻口袋、标注第二差异操作动作为翻领口等。将标注后的差异操作动作作为新的训练样本,以对动作识别模型中的参数进行微调。具体而言,可以对动作识别模型中的动作特征提取模型中的参数进行微调。
S6035:利用更新训练样本对动作识别模型进行优化。
优化过程可以包括,利用标注后的差异操作动作视频作为动作识别模型中的动作特征提取模型的输入数据。动作特征提取模型根据输入数据可以得到特征确定结果的预测值,该预测值可以以概率的形式表示。例如,第一动作的概率为a%,第二动作的概率为b%。利用已标注的识别结果与识别结果的预测值之间的误差,对动作特征提取模型中的参数进行调整。利用上述误差,对动作特征提取模型中的所有参数进行调整。上述误差会在动作特征提取模型中的每一层进行反向传播,动作特征提取模型中每一层的参数都会根据上述误差进行调整,直到动作特征提取模型的输出结果收敛或达到预期的效果才结束优化过程。
结合图8所示,从差异操作动作的特征的确定,再到差异操作动作的标注(对应图8中的“标注”)和模型参数的优化(对应图8中的“模型优化”),由于差异动作相对于全套质检动作而言数量较少,因此整个过程仅需要12天时间左右。相比于通用技术需要重新训练动作识别模型无疑大幅优化了部署效率。
在一种可能的实现方式中,第二指定条件的确定方式,包括:
在视频样本的采集环境为新的采集环境,或者
在视频中目标对象的类别为新出现的类别的情况下,确定满足第二指定条件。
例如,对于新增加质检工位,可以确定为新的采集环境。另外,如果对于现有工厂或者现有质检工位而言,在新增了图像采集设备,或者调整了原有图像采集设备的位置,同样也可以确定为新的采集环境。对于新的采集环境而言,由于背景的改变,即便还是已有的质检动作,也可以认为存在较大差异。
如果存在新出现的类别,例如,出现了之前没有的成衣类型。那么,对于新的成衣类型,其操作动作(质检动作)也会是新的。基于此,可以认为是存在较大差异而满足第二指定条件。
与本申请实施例提供的方法的应用场景以及方法相对应地,本申请实施例还提供一种动作识别的装置。如图9所示为本申请一实施例的动作识别的装置的结构框图,该动作识别的装置可以包括:
动作特征确定模块901,用于确定视频中的动作特征;动作特征是通过对视频中目标对象的操作动作进行特征提取确定的;
动作类型确定模块902,用于利用动作特征,在预先构建的动作特征数据库中进行检索,确定与动作特征匹配的动作类型;动作特征数据库中存储有针对多个类别的目标对象的动作特征与动作类型的对应关系,每一个类别的目标对象的动作特征至少为一个。
在一种可能的实现方式中,动作特征确定模块901,可以包括:
视频切分子模块,用于对视频进行切分,得到多个候选视频片段;
目标视频片段确定子模块,用于对出现操作动作的候选视频片段进行识别,确定存在同一操作动作的目标视频片段;
动作特征确定执行子模块,用于确定目标视频片段中的动作特征。
在一种可能的实现方式中,动作特征确定模块901,可以包括:
类别确定子模块,用于确定视频中的目标对象的类别;
模型确定子模块,用于根据目标对象的类别,确定与目标对象的类别对应的动作特征确定模型;
模型执行子模块,用于利用目标对象的类别对应的动作特征确定模型,对视频中目标对象的操作动作进行特征提取,以确定视频中的动作特征。
在一种可能的实现方式中,动作类型确定模块902,可以包括:
类别确定子模块,用于确定视频中的目标对象的类别;
动作特征集合确定子模块,用于根据目标对象的类别,在动作特征数据库中确定与目标对象的类别匹配的动作特征的集合;
动作类型确定执行子模块,用于根据动作特征的相似程度,在动作特征的集合中进行检索,以确定与动作特征匹配的动作类型。
在一种可能的实现方式中,还可以包括检验模块,检验模块具体可以包括:
标准动作类型序列获取子模块,用于获取目标对象的标准动作类型序列;标准动作类型序列包括至少一个动作类型;
校验执行子模块,用于将确定出的与动作特征匹配的动作类型和标准动作类型序列中的动作类型进行比对,以进行校验。
与本申请实施例提供的方法的应用场景以及方法相对应地,本申请实施例还提供一种服装质检处理装置。如图10所示为本申请一实施例的一种服装质检处理装置的结构框图,可以包括:
动作特征确定模块1001,用于确定动作特征;动作特征是通过对视频中出现的服装质检动作进行特征提取确定的;
检索结果确定模块1002,用于利用动作特征,在预先构建的质检动作特征数据库中进行检索,得到检索结果;检索结果中包含与动作特征匹配的质检动作;质检动作特征数据库中存储有针对多个服装类别的动作特征与质检动作的对应关系,每一个服装类别的质检动作特征至少为一个;
检验模块1003,用于利用检索结果,对视频中出现的服装质检动作进行检验。
与本申请实施例提供的方法的应用场景以及方法相对应地,本申请实施例还提供一种种动作识别模型的优化部署装置。如图11所示为本申请一实施例的一种动作识别模型的优化部署装置的结构框图,可以包括:
解析模块1101,用于对视频样本进行解析,确定视频样本中的内容;内容包括视频样本的采集环境、视频样本中目标对象的类别以及对目标对象的操作动作中的至少一种;
差异确定模块1102,用于确定视频样本中的内容与已有内容的差异;
优化部署模块1103,用于利用差异对动作识别模型进行优化部署;动作识别模型用于确定视频中的动作特征,并利用动作特征,在预先构建的动作特征数据库中进行检索,确定与动作特征匹配的动作类型。
在一种可能的实现方式中,在差异满足第一指定条件的情况下,优化部署模块1103,可以包括:
差异操作动作确定子模块,用于确定差异操作动作;差异操作动作为与已有操作动作的变化幅度超过对应阈值的动作;
特征存储子模块,用于确定差异操作动作的特征,将差异操作动作的特征与差异操作动作进行关联后,存储至动作特征数据库,以对动作识别模型进行优化部署;动作特征数据库中预存储有针对多个类别的目标对象的动作特征与动作类型的对应关系,每一个类别的目标对象的动作特征至少为一个。
在一种可能的实现方式中,第一指定条件的确定方式,包括:
在对目标对象的操作动作为新的操作动作的情况下,确定满足第一指定条件。
在一种可能的实现方式中,在差异满足第二指定条件的情况下,优化部署模块1103,可以包括:
差异操作动作确定子模块,确定差异操作动作;差异操作动作为与已有操作动作的变化幅度超过对应阈值的动作;
标注子模块,用于对差异操作动作进行标注,作为动作识别模型的更新训练样本;
模型优化子模块,用于利用更新训练样本对动作识别模型的参数进行更新,以对动作识别模型进行优化部署。
在一种可能的实现方式中,第二指定条件的确定方式,包括:
在视频样本的采集环境为新的采集环境,或者
在视频中目标对象的类别为新出现的类别的情况下,确定满足第二指定条件。
本申请实施例各装置中的各模块的功能可以参见上述方法中的对应描述,并具备相应的有益效果,在此不再赘述。
图12为用来实现本申请实施例的电子设备的框图。如图12所示,该电子设备包括:存储器1210和处理器1220,存储器1210内存储有可在处理器1220上运行的计算机程序。处理器1220执行该计算机程序时实现上述实施例中的方法。存储器1210和处理器1220的数量可以为一个或多个。
该电子设备还包括:
通信接口1230,用于与外界设备进行通信,进行数据交互传输。
如果存储器1210、处理器1220和通信接口1230独立实现,则存储器1210、处理器1220和通信接口1230可以通过总线相互连接并完成相互间的通信。该总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(PeripheralComponent Interconnect,PCI)总线或扩展工业标准体系结构(Extended IndustryStandard Architecture,EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图12中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器1210、处理器1220及通信接口1230集成在一块芯片上,则存储器1210、处理器1220及通信接口1230可以通过内部接口完成相互间的通信。
本申请实施例提供了一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现本申请实施例中提供的方法。
本申请实施例还提供了一种芯片,该芯片包括处理器,用于从存储器中调用并运行存储器中存储的指令,使得安装有芯片的通信设备执行本申请实施例提供的方法。
本申请实施例还提供了一种芯片,包括:输入接口、输出接口、处理器和存储器,输入接口、输出接口、处理器以及存储器之间通过内部连接通路相连,处理器用于执行存储器中的代码,当代码被执行时,处理器用于执行申请实施例提供的方法。
应理解的是,上述处理器可以是中央处理器(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(FieldProgrammable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者是任何常规的处理器等。值得说明的是,处理器可以是支持进阶精简指令集机器(Advanced RISC Machines,ARM)架构的处理器。
进一步地,可选的,上述存储器可以包括只读存储器和随机访问存储器。该存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以包括只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以包括随机访问存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM均可用。例如,静态随机访问存储器(Static RAM,SRAM)、动态随机访问存储器(Dynamic Random Access Memory,DRAM)、同步动态随机访问存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机访问存储器(Double Data RateSDRAM,DDR SDRAM)、增强型同步动态随机访问存储器(Enhanced SDRAM,ESDRAM)、同步链接动态随机访问存储器(Sync link DRAM,SLDRAM)和直接内存总线随机访问存储器(DirectRambus RAM,DR RAM)。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生依照本申请的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包括于本申请的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中描述的或在此以其他方式描述的任何过程或方法可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分。并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能。
在流程图中描述的或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。
应理解的是,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。上述实施例方法的全部或部分步骤是可以通过程序来指令相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。上述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。该存储介质可以是只读存储器,磁盘或光盘等。
以上所述,仅为本申请的示例性实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请记载的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (15)

1.一种动作识别的方法,其特征在于,包括:
确定视频中的动作特征;所述动作特征是通过对所述视频中目标对象的操作动作进行特征提取确定的;
利用所述动作特征,在预先构建的动作特征数据库中进行检索,确定与所述动作特征匹配的动作类型;所述动作特征数据库中存储有针对多个类别的目标对象的动作特征与动作类型的对应关系,每一个类别的所述目标对象的动作特征至少为一个。
2.根据权利要求1所述的方法,其特征在于,所述确定视频中的动作特征,包括:
对所述视频进行切分,得到多个候选视频片段;
对出现操作动作的候选视频片段进行识别,确定存在同一操作动作的目标视频片段;
确定所述目标视频片段中的动作特征。
3.根据权利要求1或2所述的方法,其特征在于,所述动作特征的确定方式,包括:
确定所述视频中的所述目标对象的类别;
根据所述目标对象的类别,确定与所述目标对象的类别对应的动作特征确定模型;
利用所述目标对象的类别对应的动作特征确定模型,对所述视频中目标对象的操作动作进行特征提取,以确定所述视频中的动作特征。
4.根据权利要求1所述的方法,其特征在于,所述利用所述动作特征,在预先构建的动作特征数据库中进行检索,确定与所述动作特征匹配的动作类型,包括:
确定所述视频中的目标对象的类别;
根据所述目标对象的类别,在所述动作特征数据库中确定与所述目标对象的类别匹配的动作特征的集合;
根据动作特征的相似程度,在所述动作特征的集合中进行检索,以确定与所述动作特征匹配的动作类型。
5.根据权利要求1所述的方法,其特征在于,还包括利用所述动作类型对所述视频中目标对象的操作动作进行检验的过程;
所述检验的过程,包括:
获取所述目标对象的标准动作类型序列;所述标准动作类型序列包括至少一个动作类型;
将确定出的所述与所述动作特征匹配的动作类型和所述标准动作类型序列中的动作类型进行比对,以进行校验。
6.一种服装质检处理方法,其特征在于,包括:
确定动作特征;所述动作特征是通过对视频中出现的服装质检动作进行特征提取确定的;
利用所述动作特征,在预先构建的质检动作特征数据库中进行检索,得到检索结果;所述检索结果中包含与所述动作特征匹配的质检动作;所述质检动作特征数据库中存储有针对多个服装类别的动作特征与质检动作的对应关系,每一个服装类别的质检动作特征至少为一个;
利用所述检索结果,对所述视频中出现的服装质检动作进行检验。
7.一种动作识别模型的优化部署方法,其特征在于,包括:
对视频样本进行解析,确定所述视频样本中的内容;所述内容包括所述视频样本的采集环境、所述视频样本中目标对象的类别以及对所述目标对象的操作动作中的至少一种;
确定所述视频样本中的内容与已有内容的差异;
利用所述差异对动作识别模型进行优化部署;所述动作识别模型用于确定视频中的动作特征,并利用所述动作特征,在预先构建的动作特征数据库中进行检索,确定与所述动作特征匹配的动作类型。
8.根据权利要求7所述的方法,其特征在于,在所述差异满足第一指定条件的情况下,所述利用所述差异对动作识别模型进行优化部署,包括:
确定差异操作动作;所述差异操作动作为与已有操作动作的变化幅度超过对应阈值的动作;
确定所述差异操作动作的特征,将所述差异操作动作的特征与所述差异操作动作进行关联后,存储至所述动作特征数据库,以对所述动作识别模型进行优化部署;所述动作特征数据库中预存储有针对多个类别的目标对象的动作特征与动作类型的对应关系,每一个类别的所述目标对象的动作特征至少为一个。
9.根据权利要求8所述的方法,其特征在于,所述第一指定条件的确定方式,包括:
在对所述目标对象的操作动作为新的操作动作的情况下,确定满足所述第一指定条件。
10.根据权利要求7所述的方法,其特征在于,在所述差异满足第二指定条件的情况下,所述利用所述差异对动作识别模型进行优化部署,包括:
确定差异操作动作;所述差异操作动作为与已有操作动作的变化幅度超过对应阈值的动作;
对所述差异操作动作进行标注,作为所述动作识别模型的更新训练样本;
利用所述更新训练样本对所述动作识别模型的参数进行更新,以对所述动作识别模型进行优化部署。
11.根据权利要求10所述的方法,其特征在于,所述第二指定条件的确定方式,包括:
在所述视频样本的采集环境为新的采集环境,或者
在所述视频中目标对象的类别为新出现的类别的情况下,确定满足所述第二指定条件。
12.一种动作识别的装置,其特征在于,包括:
动作特征确定模块,用于确定视频中的动作特征;所述动作特征是通过对所述视频中目标对象的操作动作进行特征提取确定的;
动作类型确定模块,用于利用所述动作特征,在预先构建的动作特征数据库中进行检索,确定与所述动作特征匹配的动作类型;所述动作特征数据库中存储有针对多个类别的目标对象的动作特征与动作类型的对应关系,每一个类别的所述目标对象的动作特征至少为一个。
13.一种动作识别模型的优化部署装置,其特征在于,包括:
解析模块,用于对视频样本进行解析,确定所述视频样本中的内容;所述内容包括所述视频样本的采集环境、所述视频样本中目标对象的类别以及对所述目标对象的操作动作中的至少一种;
差异确定模块,用于确定所述视频样本中的内容与已有内容的差异;
优化部署模块,用于利用所述差异对动作识别模型进行优化部署;所述动作识别模型用于确定视频中的动作特征,并利用所述动作特征,在预先构建的动作特征数据库中进行检索,确定与所述动作特征匹配的动作类型。
14.一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器在执行所述计算机程序时实现权利要求1-11中任一项所述的方法。
15.一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-11中任一项所述的方法。
CN202211249463.2A 2022-10-12 2022-10-12 动作识别的方法、动作识别模型的优化部署方法 Pending CN115578790A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211249463.2A CN115578790A (zh) 2022-10-12 2022-10-12 动作识别的方法、动作识别模型的优化部署方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211249463.2A CN115578790A (zh) 2022-10-12 2022-10-12 动作识别的方法、动作识别模型的优化部署方法

Publications (1)

Publication Number Publication Date
CN115578790A true CN115578790A (zh) 2023-01-06

Family

ID=84584736

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211249463.2A Pending CN115578790A (zh) 2022-10-12 2022-10-12 动作识别的方法、动作识别模型的优化部署方法

Country Status (1)

Country Link
CN (1) CN115578790A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115880782A (zh) * 2023-02-16 2023-03-31 广州佰锐网络科技有限公司 基于ai的签字动作识别定位方法、识别训练方法及系统
CN116501176A (zh) * 2023-06-27 2023-07-28 世优(北京)科技有限公司 基于人工智能的用户动作识别方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115880782A (zh) * 2023-02-16 2023-03-31 广州佰锐网络科技有限公司 基于ai的签字动作识别定位方法、识别训练方法及系统
CN115880782B (zh) * 2023-02-16 2023-08-08 广州佰锐网络科技有限公司 基于ai的签字动作识别定位方法、识别训练方法及系统
CN116501176A (zh) * 2023-06-27 2023-07-28 世优(北京)科技有限公司 基于人工智能的用户动作识别方法及系统
CN116501176B (zh) * 2023-06-27 2023-09-12 世优(北京)科技有限公司 基于人工智能的用户动作识别方法及系统

Similar Documents

Publication Publication Date Title
CN115578790A (zh) 动作识别的方法、动作识别模型的优化部署方法
Li et al. Self-correction for human parsing
CN107330451B (zh) 基于深度卷积神经网络的服装属性检索方法
CN106126579B (zh) 物体识别方法和装置、数据处理装置和终端设备
Moryossef et al. Evaluating the immediate applicability of pose estimation for sign language recognition
CN110647906A (zh) 基于Faster R-CNN方法的服饰目标检测方法
Lee et al. A global-local embedding module for fashion landmark detection
EP3678047B1 (en) Method and device for recognizing identity of human target
CN112633297B (zh) 目标对象的识别方法、装置、存储介质以及电子装置
CN108629319B (zh) 图像检测方法及系统
CN108960124A (zh) 用于行人再识别的图像处理方法及装置
CN112330383A (zh) 用于基于可视元素的物品推荐的设备及方法
CN111508006A (zh) 一种基于深度学习的运动目标同步检测、识别与跟踪方法
CN109829484B (zh) 一种服饰分类方法、设备及计算机可读存储介质
CN113557546B (zh) 图像中关联对象的检测方法、装置、设备和存储介质
Lorenzo-Navarro et al. Evaluation of LBP and HOG descriptors for clothing attribute description
CN113780145A (zh) 精子形态检测方法、装置、计算机设备和存储介质
CN113034492A (zh) 一种印刷质量缺陷检测方法、存储介质
JP2020095757A (ja) 情報処理装置、情報処理方法及びプログラム
CN115546824B (zh) 禁忌图片识别方法、设备及存储介质
KR102318931B1 (ko) 폐의류를 활용한 의류 리사이클링 방법
CN114299619A (zh) 在线行为识别方法、装置、电子设备及存储介质
CN113749412A (zh) 智能衣柜中的衣物存放方法、装置、智能设备及存储介质
CN113749413A (zh) 智能衣柜系统
Nyström Evaluation of Multiple Object Tracking in Surveillance Video

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination