CN112925949A - 视频帧数据采样方法、装置、计算机设备和存储介质 - Google Patents

视频帧数据采样方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN112925949A
CN112925949A CN202110203578.7A CN202110203578A CN112925949A CN 112925949 A CN112925949 A CN 112925949A CN 202110203578 A CN202110203578 A CN 202110203578A CN 112925949 A CN112925949 A CN 112925949A
Authority
CN
China
Prior art keywords
video frame
target
frame data
sampling
field information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110203578.7A
Other languages
English (en)
Inventor
纪晓龙
季兴
许壮
李赐兴
朱晓龙
汤善敏
张正生
刘永升
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Super Parameter Technology Shenzhen Co ltd
Original Assignee
Super Parameter Technology Shenzhen Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Super Parameter Technology Shenzhen Co ltd filed Critical Super Parameter Technology Shenzhen Co ltd
Priority to CN202110203578.7A priority Critical patent/CN112925949A/zh
Publication of CN112925949A publication Critical patent/CN112925949A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及一种视频帧数据采样方法、装置、计算机设备和存储介质。所述方法包括:获取与待采样的视频帧数据集合对应的目标采样条件;根据所述目标采样条件解析所述视频帧数据集合中的视频帧数据,获得所述视频帧数据对应的第一目标字段信息;根据所述目标采样条件计算所述视频帧数据对应的第二目标字段信息;将所述第一目标字段信息、第二目标字段信息及所述视频帧数据对应的标识信息对应存储至数据库中;基于所述数据库及所述目标采样条件对所述视频帧数据集合进行采样,得到目标视频帧数据。采用本方法能够提高采样效率。

Description

视频帧数据采样方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种视频帧数据采样方法、装置、计算机设备和存储介质。
背景技术
随着近年来大数据平台,算力的不断发展,监督学习领域训练数据的量级从G级到T级等不断增涨。与此同时对数据采样的需求变得越来越大。
在监督学习中,经常需要进行多次采样,传统技术中,每一次数据采样都需要从头遍历所有的原始数据,进行计算,根据计算结果作为采样的依据,这种方式采样耗时长,导致采样效率低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高采样效率的视频帧数据采样方法、装置、计算机设备和存储介质。
一种视频帧数据采样方法,所述方法包括:
获取与待采样的视频帧数据集合对应的目标采样条件;
根据所述目标采样条件解析所述视频帧数据集合中的视频帧数据,获得所述视频帧数据对应的第一目标字段信息;
根据所述目标采样条件计算所述视频帧数据对应的第二目标字段信息;
将所述第一目标字段信息、第二目标字段信息及所述视频帧数据对应的标识信息对应存储至数据库中;
基于所述数据库及所述目标采样条件对所述视频帧数据集合进行采样,得到目标视频帧数据。
在其中一个实施例中,所述视频帧数据为视频帧对应的文本数据或者图像数据;所述文本数据为描述所述视频帧内容的文本;所述图像数据为包括所述视频帧内容的图像。
在其中一个实施例中,当所述视频帧数据为视频帧对应的文本数据;所述根据所述目标采样条件解析所述视频帧数据集合中的视频帧数据,获得所述视频帧数据对应的第一目标字段信息包括:
根据所述目标采样条件确定目标字段;
将所述目标字段与所述文本数据中的文本内容进行匹配,将与所述目标字段匹配成功的文本内容确定为第一目标字段信息。
在其中一个实施例中,所述根据所述目标采样条件计算所述视频帧数据对应的第二目标字段信息包括:
将所述目标字段中与所述文本数据中的文本内容不匹配的字段确定为待计算字段;
根据所述视频帧数据计算所述待计算字段对应的字段值,将计算得到的字段值作为第二目标字段信息。
在其中一个实施例中,在所述基于所述数据库及所述目标采样条件对所述视频帧数据集合进行采样,得到目标视频帧数据之前,所述方法还包括:
获取预设丢弃概率;
所述基于所述数据库及所述目标采样条件对所述视频帧数据集合进行采样,得到目标视频帧数据,包括:
从所述数据库中查找与所述目标采样条件匹配的字段信息,获取候选字段信息;
以预设丢弃概率丢弃所述候选字段信息,获取目标采样字段信息;
将所述目标采样字段信息对应的标识信息确定为目标标识信息;
从所述视频帧数据集合中获取所述目标标识信息对应的视频帧数据,得到所述目标视频帧数据。
在其中一个实施例中,所述方法还包括:获取待统计的字段;基于所述数据库对所述待统计的字段进行统计分析,得到对应的统计分析结果。
在其中一个实施例中,所述目标视频帧数据存在对应的训练标签;所述方法还包括:
获取与目标游戏对应的初始机器学习模型;
基于所述目标视频帧数据及对应的训练标签对所述初始机器学习模型进行有监督训练,直至满足收敛条件时,得到目标机器学习模型;
所述目标机器学习模型用于控制所述目标游戏中的智能体执行预设的动作。-
一种视频帧数据采样装置,所述装置包括:
数据获取模块,用于获取与待采样的视频帧数据集合对应的目标采样条件;
第一字段信息获取模块,用于根据所述目标采样条件解析所述视频帧数据集合中的视频帧数据,获得所述视频帧数据对应的第一目标字段信息;
第二字段信息获取模块,用于根据所述目标采样条件计算所述视频帧数据对应的第二目标字段信息;
存储模块,用于将所述第一目标字段信息、第二目标字段信息及所述视频帧数据对应的标识信息对应存储至数据库中;
采样模块,用于基于所述数据库及所述目标采样条件对所述视频帧数据集合进行采样,得到目标视频帧数据。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取与待采样的视频帧数据集合对应的目标采样条件;
根据所述目标采样条件解析所述视频帧数据集合中的视频帧数据,获得所述视频帧数据对应的第一目标字段信息;
根据所述目标采样条件计算所述视频帧数据对应的第二目标字段信息;
将所述第一目标字段信息、第二目标字段信息及所述视频帧数据对应的标识信息对应存储至数据库中;
基于所述数据库及所述目标采样条件对所述视频帧数据集合进行采样,得到目标视频帧数据。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取与待采样的视频帧数据集合对应的目标采样条件;
根据所述目标采样条件解析所述视频帧数据集合中的视频帧数据,获得所述视频帧数据对应的第一目标字段信息;
根据所述目标采样条件计算所述视频帧数据对应的第二目标字段信息;
将所述第一目标字段信息、第二目标字段信息及所述视频帧数据对应的标识信息对应存储至数据库中;
基于所述数据库及所述目标采样条件对所述视频帧数据集合进行采样,得到目标视频帧数据。
上述视频帧数据采样方法、装置、计算机设备和存储介质,通过获取与待采样的视频帧数据集合对应的目标采样条件,根据所述目标采样条件解析所述视频帧数据集合中的视频帧数据,获得所述视频帧数据对应的第一目标字段信息,根据所述目标采样条件计算所述视频帧数据对应的第二目标字段信息,将所述第一目标字段信息、第二目标字段信息及所述视频帧数据对应的标识信息对应存储至数据库中,基于所述数据库及所述目标采样条件对所述视频帧数据集合进行采样,得到目标视频帧数据,由于将视频帧数据解析得到的第一目标字段信息以及计算得到的第二目标字段信息存储至数据库中,采样时可以直接基于数据库进行采样,不需要每一个都进行解析和计算,节省了解析和计算的时间,从而提高了采样效率。
附图说明
图1为一个实施例中视频帧数据采样方法的应用环境图;
图2为一个实施例中视频帧数据采样方法的流程示意图;
图3为另一个实施例中视频帧数据采样方法的流程示意图;
图4为一个实施例中视频帧数据采样装置的结构框图;
图5为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的视频帧数据采样方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。终端获取与待采样的视频帧数据集合对应的目标采样条件,根据目标采样条件解析视频帧数据集合中的视频帧数据,获得视频帧数据对应的第一目标字段信息,根据目标采样条件计算视频帧数据对应的第二目标字段信息,将第一目标字段信息、第二目标字段信息及视频帧数据对应的标识信息对应存储至服务器104的数据库中,最后终端基于数据库及目标采样条件对视频帧数据集合进行采样,得到目标视频帧数据。
其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种视频帧数据采样方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:
步骤202,获取与待采样的视频帧数据集合对应的目标采样条件。
其中,目标采样条件指的是预先设置的从视频帧数据集合中获取视频帧数据的条件。例如,在游戏领域,目标采样条件可以是游戏视频帧中队友个数大于3。可以理解,通常情况下,在不同的采样场景中,同一个视频帧数据集合可以对应不同的采样条件。视频帧数据集合中的视频帧数据可以是视频帧对应的文本数据或者图像数据,视频帧数据为视频帧对应的文本数据或者图像数据;文本数据为描述视频帧内容的文本;图像数据为包括视频帧内容的图像。
具体地,终端可以设置采样条件设置界面,在接收到用户通过采样条件设备界面输入的采样字段及采样字段对应的字段值后,终端即获取到目标采样条件。例如,用户可通过采样设置界面设置采样字段为“队友人数”,对应的字段值为“3”,则终端获取到目标采样条件为队友个数大于3。
步骤204,根据目标采样条件解析视频帧数据集合中的视频帧数据,获得视频帧数据对应的第一目标字段信息。
具体地,终端根据目标采样条件对视频帧数据集合中的视频帧数据进行解析,得到视频帧数据的基础字段信息,将基础字段信息与目标采样条件中的采样字段进行匹配,以获取到与目标采样条件中的采样字段对应的字段信息,得到视频帧数据对应的第一目标字段信息。例如,终端可以解析游戏视频帧数据中,每帧自己的位置,队友的位置,敌方的位置,自己的血量,队友血量,敌方血量等基础字段信息来作为第一目标字段信息。
步骤206,根据目标采样条件计算视频帧数据对应的第二目标字段信息。
具体地,目标采样条件中通常会存在一部分无法根据视频帧数据直接得到的字段信息,需要通过对基础字段信息进行计算得到中间结果,那么终端可以根据目标采样条件中的采样字段确定需要计算得到哪些中间结果,然后对视频帧数据集合中的视频帧数据进行中间结果的计算,从而得到第二目标字段信息。例如,在游戏中,计算队友人数,敌方人数,敌方总经济,己方总经济等作为中间结果。
步骤208,将第一目标字段信息、第二目标字段信息及视频帧数据对应的标识信息对应存储至数据库中。
其中,标识信息指的是可以对视频帧数据集合中的视频帧数据进行标识的数据,例如,标识信息可以是视频帧数据的存储路径或者视频帧数据的名称等等。
具体地,终端在对视频帧数据集合中的视频帧数据解析得到基础字段信息作为第一目标字段信息,并计算得到中间结果作为第二目标字段信息后,由于第一目标字段信息、第二目标字段信息均为结构化数据,那么终端可以将该视频帧数据的第一目标字段信息、第二目标字段信息与该视频帧数据的标识信息对应存储至数据库中,基于该数据库,终端可以对视频帧数据集合中的视频帧数据进行采样。
可以理解,在一些实施例中,终端在将第一目标字段信息、第二目标字段信息存储至数据库时,需要将第一目标字段信息、第二目标字段信息转换为与数据库匹配的数据格式。
步骤210,基于数据库及目标采样条件对视频帧数据集合进行采样,得到目标视频帧数据。
具体地,在进行采样时,终端可以根据目标采样条件中的采样字段及采样字段对应的字段值从数据库中查找匹配的标识信息,根据查找到的标识信息从视频帧数据集合中获取对应的视频帧数据。
在一个实施例中,终端可以进行随机采样,在进行随机采样时,终端可以从数据库中查找到的符合目标采样条件的标识信息中随机选择一个作为目标标识信息,然后从视频帧数据集合获取目标标识信息对应的视频帧数据,从而得到目标视频帧数据。
上述视频帧数据采样方法中,通过获取与待采样的视频帧数据集合对应的目标采样条件,根据目标采样条件解析视频帧数据集合中的视频帧数据,获得视频帧数据对应的第一目标字段信息,根据目标采样条件计算视频帧数据对应的第二目标字段信息,将第一目标字段信息、第二目标字段信息及视频帧数据对应的标识信息对应存储至数据库中,基于数据库及目标采样条件对视频帧数据集合进行采样,得到目标视频帧数据,由于将视频帧数据解析得到的第一目标字段信息以及计算得到的第二目标字段信息存储至数据库中,采样时可以直接基于数据库进行采样,不需要每一个都进行解析和计算,节省了解析和计算的时间,从而提高了采样效率。
在一个实施例中,当视频帧数据为视频帧对应的文本数据;根据目标采样条件解析视频帧数据集合中的视频帧数据,获得视频帧数据对应的第一目标字段信息包括:根据目标采样条件确定目标字段;将目标字段与文本数据中的文本内容进行匹配,将与目标字段匹配成功的文本内容确定为第一目标字段信息。
具体地,终端将目标采样条件中的采样字段确定为目标字段,将目标字段与文本数据中的文本内容进行匹配,将文本内容中与目标字段匹配的内容确定为第一目标字段信息。
可以理解的是,目标采样条件中通常包括多个采样字段,那么终端可以确定多个目标字段,终端分别将每一个目标字段与文本数据的文本内容进行匹配,当所有目标字段匹配完后,即完成对视频帧数据的解析。
在一个实施例中,根据目标采样条件计算视频帧数据对应的第二目标字段信息包括:将目标字段中与文本数据中的文本内容不匹配的字段确定为待计算字段;根据视频帧数据计算待计算字段对应的字段值,将计算得到的字段值作为第二目标字段信息。
可以理解,目标字段中可能有一部分字段与文本数据的文本内容并不匹配,需要根据视频帧数据进行计算,那么终端可以将这部分字段确定为待计算字段,对于待计算字段,终端可以根据视频帧数据的基础字段信息进行计算,得到待计算字段对应的字段值,在计算得到待计算字段对应的字段值后,终端将计算得到的字段值作为第二目标字段信息。
举个例子,目标字段中包括队友的位置和队友人数,其中,队友的位置可以根据解析视频帧数据得到的基础字段确定,那么终端可以将目标字段与文本数据的文本内容进行匹配得到队友的位置,而队友人数无法根据与文本数据的文本内容匹配得到,那么终端可以基于队友的位置进行计算得到队友人数。
在一个实施例中,如图3所示,提供了一种视频帧数据采样方法,包括以下步骤:
步骤302,获取与待采样的视频帧数据集合对应的目标采样条件。
如在游戏领域根据队友个数是否大于3以及设置30%概率丢弃采样,敌方总经济是否大于2000以及设置10%的概率丢弃采样;在人脸识别领域中,根据人脸尺寸是否大于100*100来采样,人脸的偏移角度来采样等。
步骤304,根据目标采样条件解析视频帧数据集合中的视频帧数据,获得视频帧数据对应的第一目标字段信息。
具体地,终端解析视频帧数据集合中的视频帧数据,得到视频帧数据的基础字段信息作为第一目标字段信息。例如游戏领域中的自己的坐标,队友的坐标,敌人坐标;人脸识别领域中图像的尺寸等。
步骤306,根据目标采样条件计算视频帧数据对应的第二目标字段信息。
具体地,终端基于目标采样条件及视频帧数据的基础字段信息计算中间结果,作为第二目标字段信息。如在游戏领域中计算队友的个数,敌方的个数,队友总经济,敌方总经济;在人脸识别领域中计算人脸的位置,人脸的大小等。
步骤308,将第一目标字段信息、第二目标字段信息及视频帧数据对应的标识信息对应存储至数据库中。
步骤310,获取预设丢弃概率。
其中,丢弃概率可以是目标采样条件中携带的,也可以是在目标采样条件之外设置的。
步骤312,从数据库中查找与目标采样条件匹配的字段信息,获取候选字段信息。
具体地,终端从数据库中查找与目标采样条件中的采样字段匹配的字段信息,以获取候选字段信息。例如在游戏领域根据队友个数是否大于3进行采样,则可以从数据库中查找大于3的队友个数字段信息,得到候选字段信息。
步骤314,以预设丢弃概率丢弃候选字段信息,获取目标采样字段信息。
如上面的例子中,假设查找到大于3的队友个数字段信息的数量为100,假设预设丢弃概率为30,则最终获取到目标采样字段信息的数量为70。
步骤316,将目标采样字段信息对应的标识信息确定为目标标识信息。
步骤318,从视频帧数据集合中获取目标标识信息对应的视频帧数据,得到目标视频帧数据。
本实施例中,在进行采样时,可以基于SQL语言的基础上添加概率采样,得到一种DSL语言(domain-specific language,领域特定语言)称为PSL语言(probability-samplelanguage,概率采样语言),由于可以进行概率采样,相对于标准的SQL语言,更加灵活。
在一个实施例中,上述方法还包括:获取待统计的字段;基于数据库对待统计的字段进行统计分析,得到对应的统计分析结果。
具体地,终端在获取到待统计的字段,基于数据库的结构化数据,可以对数据库相应字段进行操作,以实现对待统计的字段进行统计分析,得到对应的统计分析结果,以便更好地认识样本。
如游戏领域中可以统计队有个数的分布,敌方总经济的分布;人脸识别领域中,可以统计人脸尺寸的分布;也可以实现map,reduce操作,对数据记性复杂的统计。
在一个实施例中,目标视频帧数据存在对应的训练标签;方法还包括:获取与目标游戏对应的初始机器学习模型;基于目标视频帧数据及对应的训练标签对初始机器学习模型进行有监督训练,直至满足收敛条件时,得到目标机器学习模型;目标机器学习模型用于控制目标游戏中的智能体执行预设的动作。
其中,收敛条件可以是训练次数达到预设次数、训练时长达到预设时长或者损失函数达到最小值等等。智能体为目标游戏中的游戏角色,例如游戏中的人物。
具体地,从视频帧数据集合中采集到的目标视频帧数据可以作为训练样本对机器学习模型进行训练,终端在获取到与目标游戏对应的初始机器学习模型后,可以将视频帧数据作为初始机器学习模型的输入,将目标视频帧数据对应的训练标签作为期望的输出对初始机器学习模型进行有监督训练,直至满足收敛条件时,得到目标机器学习模型。其中,可以使用随机梯度下降算法、Adagrad((Adaptive Gradient,自适应梯度)算法、Adadelta(AdaGrad算法的改进)、RMSprop(AdaGrad算法的改进)、Adam(Adaptive MomentEstimation,自适应矩估计)算法等来调整图像分割网络的网络参数。
应该理解的是,虽然图2-3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-3中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图4所示,提供了一种视频帧数据采样装置400,该装置包括:
数据获取模块402,用于获取与待采样的视频帧数据集合对应的目标采样条件;
第一字段信息获取模块404,用于根据目标采样条件解析视频帧数据集合中的视频帧数据,获得视频帧数据对应的第一目标字段信息;
第二字段信息获取模块406,用于根据目标采样条件计算视频帧数据对应的第二目标字段信息;
存储模块408,用于将第一目标字段信息、第二目标字段信息及视频帧数据对应的标识信息对应存储至数据库中;
采样模块410,用于基于数据库及目标采样条件对视频帧数据集合进行采样,得到目标视频帧数据。
上述视频帧数据采样装置,通过获取与待采样的视频帧数据集合对应的目标采样条件,根据目标采样条件解析视频帧数据集合中的视频帧数据,获得视频帧数据对应的第一目标字段信息,根据目标采样条件计算视频帧数据对应的第二目标字段信息,将第一目标字段信息、第二目标字段信息及视频帧数据对应的标识信息对应存储至数据库中,基于数据库及目标采样条件对视频帧数据集合进行采样,得到目标视频帧数据,由于将视频帧数据解析得到的第一目标字段信息以及计算得到的第二目标字段信息存储至数据库中,采样时可以直接基于数据库进行采样,不需要每一个都进行解析和计算,节省了解析和计算的时间,从而提高了采样效率。
在一个实施例中,视频帧数据为视频帧对应的文本数据或者图像数据;文本数据为描述视频帧内容的文本;图像数据为包括视频帧内容的图像。
在一个实施例中,当视频帧数据为视频帧对应的文本数据;第一字段信息获取模块还用于根据目标采样条件确定目标字段;将目标字段与文本数据中的文本内容进行匹配,将与目标字段匹配成功的文本内容确定为第一目标字段信息。
在一个实施例中,第二字段信息获取模块还用于将目标字段中与文本数据中的文本内容不匹配的字段确定为待计算字段;根据视频帧数据计算待计算字段对应的字段值,将计算得到的字段值作为第二目标字段信息。
在一个实施例中,上述装置还包括丢弃概率获取模块,用于获取预设丢弃概率;采样模块还用于从数据库中查找与目标采样条件匹配的字段信息,获取候选字段信息;以预设丢弃概率丢弃候选字段信息,获取目标采样字段信息;将目标采样字段信息对应的标识信息确定为目标标识信息;从视频帧数据集合中获取目标标识信息对应的视频帧数据,得到目标视频帧数据。
在一个实施例中,上述装置还包括统计模块,用于获取待统计的字段;基于数据库对待统计的字段进行统计分析,得到对应的统计分析结果。
在一个实施例中,目标视频帧数据存在对应的训练标签;上述装置还包括训练模块,用于获取与目标游戏对应的初始机器学习模型;基于目标视频帧数据及对应的训练标签对初始机器学习模型进行有监督训练,直至满足收敛条件时,得到目标机器学习模型;目标机器学习模型用于控制目标游戏中的智能体执行预设的动作。-
关于视频帧数据采样装置的具体限定可以参见上文中对于视频帧数据采样方法的限定,在此不再赘述。上述视频帧数据采样装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种视频帧数据采样方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:获取与待采样的视频帧数据集合对应的目标采样条件;根据目标采样条件解析视频帧数据集合中的视频帧数据,获得视频帧数据对应的第一目标字段信息;根据目标采样条件计算视频帧数据对应的第二目标字段信息;将第一目标字段信息、第二目标字段信息及视频帧数据对应的标识信息对应存储至数据库中;基于数据库及目标采样条件对视频帧数据集合进行采样,得到目标视频帧数据。
在一个实施例中,视频帧数据为视频帧对应的文本数据或者图像数据;文本数据为描述视频帧内容的文本;图像数据为包括视频帧内容的图像。
在一个实施例中,当视频帧数据为视频帧对应的文本数据;根据目标采样条件解析视频帧数据集合中的视频帧数据,获得视频帧数据对应的第一目标字段信息包括:根据目标采样条件确定目标字段;将目标字段与文本数据中的文本内容进行匹配,将与目标字段匹配成功的文本内容确定为第一目标字段信息。
在一个实施例中,根据目标采样条件计算视频帧数据对应的第二目标字段信息包括:将目标字段中与文本数据中的文本内容不匹配的字段确定为待计算字段;根据视频帧数据计算待计算字段对应的字段值,将计算得到的字段值作为第二目标字段信息。
在一个实施例中,在基于数据库及目标采样条件对视频帧数据集合进行采样,得到目标视频帧数据之前,处理器执行计算机程序时还实现以下步骤:获取预设丢弃概率;基于数据库及目标采样条件对视频帧数据集合进行采样,得到目标视频帧数据,包括:从数据库中查找与目标采样条件匹配的字段信息,获取候选字段信息;以预设丢弃概率丢弃候选字段信息,获取目标采样字段信息;将目标采样字段信息对应的标识信息确定为目标标识信息;从视频帧数据集合中获取目标标识信息对应的视频帧数据,得到目标视频帧数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取待统计的字段;基于数据库对待统计的字段进行统计分析,得到对应的统计分析结果。
在一个实施例中,目标视频帧数据存在对应的训练标签;处理器执行计算机程序时还实现以下步骤:获取与目标游戏对应的初始机器学习模型;基于目标视频帧数据及对应的训练标签对初始机器学习模型进行有监督训练,直至满足收敛条件时,得到目标机器学习模型;目标机器学习模型用于控制目标游戏中的智能体执行预设的动作。-
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取与待采样的视频帧数据集合对应的目标采样条件;根据目标采样条件解析视频帧数据集合中的视频帧数据,获得视频帧数据对应的第一目标字段信息;根据目标采样条件计算视频帧数据对应的第二目标字段信息;将第一目标字段信息、第二目标字段信息及视频帧数据对应的标识信息对应存储至数据库中;基于数据库及目标采样条件对视频帧数据集合进行采样,得到目标视频帧数据。
在一个实施例中,视频帧数据为视频帧对应的文本数据或者图像数据;文本数据为描述视频帧内容的文本;图像数据为包括视频帧内容的图像。
在一个实施例中,当视频帧数据为视频帧对应的文本数据;根据目标采样条件解析视频帧数据集合中的视频帧数据,获得视频帧数据对应的第一目标字段信息包括:根据目标采样条件确定目标字段;将目标字段与文本数据中的文本内容进行匹配,将与目标字段匹配成功的文本内容确定为第一目标字段信息。
在一个实施例中,根据目标采样条件计算视频帧数据对应的第二目标字段信息包括:将目标字段中与文本数据中的文本内容不匹配的字段确定为待计算字段;根据视频帧数据计算待计算字段对应的字段值,将计算得到的字段值作为第二目标字段信息。
在一个实施例中,在基于数据库及目标采样条件对视频帧数据集合进行采样,得到目标视频帧数据之前,计算机程序被处理器执行时还实现以下步骤:获取预设丢弃概率;基于数据库及目标采样条件对视频帧数据集合进行采样,得到目标视频帧数据,包括:从数据库中查找与目标采样条件匹配的字段信息,获取候选字段信息;以预设丢弃概率丢弃候选字段信息,获取目标采样字段信息;将目标采样字段信息对应的标识信息确定为目标标识信息;从视频帧数据集合中获取目标标识信息对应的视频帧数据,得到目标视频帧数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取待统计的字段;基于数据库对待统计的字段进行统计分析,得到对应的统计分析结果。
在一个实施例中,目标视频帧数据存在对应的训练标签;计算机程序被处理器执行时还实现以下步骤:获取与目标游戏对应的初始机器学习模型;基于目标视频帧数据及对应的训练标签对初始机器学习模型进行有监督训练,直至满足收敛条件时,得到目标机器学习模型;目标机器学习模型用于控制目标游戏中的智能体执行预设的动作。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种视频帧数据采样方法,其特征在于,所述方法包括:
获取与待采样的视频帧数据集合对应的目标采样条件;
根据所述目标采样条件解析所述视频帧数据集合中的视频帧数据,获得所述视频帧数据对应的第一目标字段信息;
根据所述目标采样条件计算所述视频帧数据对应的第二目标字段信息;
将所述第一目标字段信息、第二目标字段信息及所述视频帧数据对应的标识信息对应存储至数据库中;
基于所述数据库及所述目标采样条件对所述视频帧数据集合进行采样,得到目标视频帧数据。
2.根据权利要求1所述的方法,其特征在于,所述视频帧数据为视频帧对应的文本数据或者图像数据;所述文本数据为描述所述视频帧内容的文本;所述图像数据为包括所述视频帧内容的图像。
3.根据权利要求2所述的方法,其特征在于,当所述视频帧数据为视频帧对应的文本数据;所述根据所述目标采样条件解析所述视频帧数据集合中的视频帧数据,获得所述视频帧数据对应的第一目标字段信息包括:
根据所述目标采样条件确定目标字段;
将所述目标字段与所述文本数据中的文本内容进行匹配,将与所述目标字段匹配成功的文本内容确定为第一目标字段信息。
4.根据权利要求3所述的方法,其特征在于,所述根据所述目标采样条件计算所述视频帧数据对应的第二目标字段信息包括:
将所述目标字段中与所述文本数据中的文本内容不匹配的字段确定为待计算字段;
根据所述视频帧数据计算所述待计算字段对应的字段值,将计算得到的字段值作为第二目标字段信息。
5.根据权利要求1所述的方法,其特征在于,在所述基于所述数据库及所述目标采样条件对所述视频帧数据集合进行采样,得到目标视频帧数据之前,所述方法还包括:
获取预设丢弃概率;
所述基于所述数据库及所述目标采样条件对所述视频帧数据集合进行采样,得到目标视频帧数据,包括:
从所述数据库中查找与所述目标采样条件匹配的字段信息,获取候选字段信息;
以预设丢弃概率丢弃所述候选字段信息,获取目标采样字段信息;
将所述目标采样字段信息对应的标识信息确定为目标标识信息;
从所述视频帧数据集合中获取所述目标标识信息对应的视频帧数据,得到所述目标视频帧数据。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取待统计的字段;
基于所述数据库对所述待统计的字段进行统计分析,得到对应的统计分析结果。
7.根据权利要求1至6任意一项所述的方法,其特征在于,所述目标视频帧数据存在对应的训练标签;所述方法还包括:
获取与目标游戏对应的初始机器学习模型;
基于所述目标视频帧数据及对应的训练标签对所述初始机器学习模型进行有监督训练,直至满足收敛条件时,得到目标机器学习模型;
所述目标机器学习模型用于控制所述目标游戏中的智能体执行预设的动作。
8.一种视频帧数据采样装置,其特征在于,所述装置包括:
数据获取模块,用于获取与待采样的视频帧数据集合对应的目标采样条件;
第一字段信息获取模块,用于根据所述目标采样条件解析所述视频帧数据集合中的视频帧数据,获得所述视频帧数据对应的第一目标字段信息;
第二字段信息获取模块,用于根据所述目标采样条件计算所述视频帧数据对应的第二目标字段信息;
存储模块,用于将所述第一目标字段信息、第二目标字段信息及所述视频帧数据对应的标识信息对应存储至数据库中;
采样模块,用于基于所述数据库及所述目标采样条件对所述视频帧数据集合进行采样,得到目标视频帧数据。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202110203578.7A 2021-02-24 2021-02-24 视频帧数据采样方法、装置、计算机设备和存储介质 Pending CN112925949A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110203578.7A CN112925949A (zh) 2021-02-24 2021-02-24 视频帧数据采样方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110203578.7A CN112925949A (zh) 2021-02-24 2021-02-24 视频帧数据采样方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN112925949A true CN112925949A (zh) 2021-06-08

Family

ID=76170481

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110203578.7A Pending CN112925949A (zh) 2021-02-24 2021-02-24 视频帧数据采样方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN112925949A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111651635A (zh) * 2020-05-28 2020-09-11 拾音智能科技有限公司 一种基于自然语言描述的视频检索方法
CN111651466A (zh) * 2020-05-09 2020-09-11 杭州数梦工场科技有限公司 数据采样方法及装置
US20200382793A1 (en) * 2018-06-20 2020-12-03 Tencent Technology (Shenzhen) Company Limited Method and apparatus for video encoding and decoding
CN112256653A (zh) * 2020-11-06 2021-01-22 网易(杭州)网络有限公司 一种数据采样方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200382793A1 (en) * 2018-06-20 2020-12-03 Tencent Technology (Shenzhen) Company Limited Method and apparatus for video encoding and decoding
CN111651466A (zh) * 2020-05-09 2020-09-11 杭州数梦工场科技有限公司 数据采样方法及装置
CN111651635A (zh) * 2020-05-28 2020-09-11 拾音智能科技有限公司 一种基于自然语言描述的视频检索方法
CN112256653A (zh) * 2020-11-06 2021-01-22 网易(杭州)网络有限公司 一种数据采样方法和装置

Similar Documents

Publication Publication Date Title
CN110033018B (zh) 图形相似度判断方法、装置及计算机可读存储介质
US9613296B1 (en) Selecting a set of exemplar images for use in an automated image object recognition system
CN111414946B (zh) 基于人工智能的医疗影像的噪声数据识别方法和相关装置
CN110075524B (zh) 异常行为检测方法和装置
CN110738211A (zh) 一种对象检测的方法、相关装置以及设备
CN110263916B (zh) 数据处理方法和装置、存储介质及电子装置
WO2018196718A1 (zh) 图像消歧方法、装置、存储介质和电子设备
CN107679449A (zh) 嘴唇动作捕捉方法、装置及存储介质
CN107633205A (zh) 嘴唇动作分析方法、装置及存储介质
CN111783997B (zh) 一种数据处理方法、装置及设备
CN112463106A (zh) 基于智能屏幕的语音交互方法、装置、设备及存储介质
WO2017088434A1 (zh) 人脸模型矩阵训练方法、装置及存储介质
CN111553838A (zh) 模型参数的更新方法、装置、设备及存储介质
CN111340213B (zh) 神经网络的训练方法、电子设备、存储介质
CN113190646A (zh) 一种用户名样本的标注方法、装置、电子设备及存储介质
CN111046203A (zh) 图像检索方法、装置、存储介质及电子设备
CN111429414B (zh) 基于人工智能的病灶影像样本确定方法和相关装置
CN115131693A (zh) 文本内容识别方法、装置、计算机设备和存储介质
CN112925949A (zh) 视频帧数据采样方法、装置、计算机设备和存储介质
CN113641767B (zh) 实体关系抽取方法、装置、设备及存储介质
CN112995757B (zh) 视频剪裁方法及装置
US20210019553A1 (en) Information processing apparatus, control method, and program
CN111522722A (zh) 一种数据分析方法、电子设备及存储介质
CN113743448B (zh) 模型训练数据获取方法、模型训练方法和装置
CN115641542B (zh) 一种数据的处理方法、装置以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination