CN112929701A

CN112929701A - 一种视频编码方法、装置、设备及介质

Info

Publication number: CN112929701A
Application number: CN202110157129.3A
Authority: CN
Inventors: 冯亮
Original assignee: Zhejiang Dahua Technology Co Ltd
Current assignee: Zhejiang Dahua Technology Co Ltd
Priority date: 2021-02-04
Filing date: 2021-02-04
Publication date: 2021-06-08
Anticipated expiration: 2041-02-04
Also published as: CN112929701B

Abstract

本发明公开了一种视频编码方法、装置、设备及介质，用以准确的确定I帧间隔。本发明实施例可以基于第一视频帧中包含的目标物体的移动速度和占比的乘积，确定第一视频帧的敏感值，进而可以根据预设的每个敏感值和I帧间隔的对应关系，确定第一视频帧的敏感值对应的第一目标I帧间隔，并基于该第一目标I帧间隔，确定编码I帧间隔，以可以根据该编码I帧间隔对第一视频帧进行编码。相比现有采用固定的I帧间隔进行编码而言，本发明实施例可以基于视频帧中目标物体的移动速度和占比等的变化而自适应的调整编码I帧间隔，从而可以准确的确定编码I帧间隔，进而可以兼顾画面质量和码率大小，在保证画面质量的前提下，节省带宽及储存空间，降低码率。

Description

一种视频编码方法、装置、设备及介质

技术领域

本发明涉及视频编码技术领域，尤其涉及一种视频编码方法、装置、设备及介质。

背景技术

码流(Data Rate)是指视频文件在单位时间内使用的数据流量，也叫码率，是视频编码中画面质量控制中最重要的部分。同样分辨率下，视频文件的码流越大，压缩比就越小，画面质量就越好。然而视频文件的码流越大，占用的带宽和储存空间就会越大，为了可以兼顾画面质量和码率大小，在保证画面质量的前提下，节省带宽及储存空间，降低码率已经成为视频编码的重点。

现有技术中，可以使用智能(Smart)264编码技术等来降低码率，Smart264等编码技术简单来说就是增大画面组(Group Of Pictures，GOP)，也就是增大I帧间隔的技术，可以将I帧的数量有效的减少，使I帧所占的数据的信息量较少，从而达到降低码率的目的。

图1为现有技术提供的一种编码帧序列图，在使用Smart264等编码技术时，可以预先设定一部分虚拟I帧，虚拟I帧实质为直接参考I帧的P帧，其他普通P帧可以参考临近的I帧或虚拟I帧，从而可以在保证画面质量的同时，可以增大I帧间隔，将I帧的数量有效的减少，从而达到降低码率的目的。

现有技术在进行视频编码时，通常采用的是固定不变的I帧间隔，然而例如在视频帧中的物体的运动状态发生改变等场景下，如果一直采用固定不变的I帧间隔对视频帧进行编码，可能会使得该I帧间隔并不适用于当前场景，从而可能导致码率偏低而影响画面质量，或者导致码率偏高而占用较多的带宽和储存空间等情况。因此亟需一种可以准确的确定I帧间隔，以可以兼顾画面质量和码率大小，在保证画面质量的前提下，节省带宽及储存空间，降低码率的方案。

发明内容

本发明提供了一种视频编码方法、装置、设备及介质，用以准确的确定I帧间隔。

第一方面，本发明提供了一种视频编码方法，所述方法包括：

将接收到的第一视频帧输入预先训练完成的目标检测模型，基于所述目标检测模型，确定所述第一视频帧中包含的目标物体的第一位置信息；基于所述第一位置信息，确定所述目标物体的移动速度及所述目标物体在所述第一视频帧中的占比；

基于所述移动速度和所述占比的乘积，确定所述第一视频帧的敏感值；

根据预设的每个敏感值和I帧间隔的对应关系，确定所述第一视频帧的敏感值对应的第一目标I帧间隔；基于所述第一目标I帧间隔，确定编码I帧间隔，并根据所述编码I帧间隔对所述第一视频帧进行编码。

进一步地，所述基于所述第一位置信息，确定所述目标物体的移动速度包括：

根据所述第一位置信息及获取的所述第一视频帧前一相邻第二视频帧中所述目标物体的第二位置信息，确定所述目标物体在所述第一视频帧中的偏移量；

根据所述偏移量和所述第一视频帧的尺寸，确定所述目标物体在所述第一视频帧中的相对偏移度；根据所述相对偏移度、所述第一视频帧和第二视频帧之间的间隔时长，确定所述目标物体的相对移动速度。

进一步地，所述确定所述目标物体在所述第一视频帧中的偏移量包括：

确定所述目标物体在所述第一视频帧横向上的第一偏移量及在所述第一视频帧纵向上的第二偏移量，并确定所述第一偏移量和所述第二偏移量中的最大偏移量，将所述最大偏移量，确定为所述目标物体在所述第一视频帧中的偏移量。

进一步地，所述根据所述偏移量和所述第一视频帧的尺寸，确定所述目标物体在所述第一视频帧中的相对偏移度包括：

若所述最大偏移量为所述第一偏移量，则根据所述第一偏移量与所述第一视频帧的横向尺寸的比值，确定所述相对偏移度；

若所述最大偏移量为所述第二偏移量，则根据所述第二偏移量与所述第一视频帧的纵向尺寸的比值，确定所述相对偏移度。

进一步地，所述基于所述移动速度和所述占比的乘积，确定所述第一视频帧的敏感值包括：

若所述第一视频帧中包括至少一个目标物体，确定所述至少一个目标物体的移动速度和占比的乘积，将乘积中的最大值确定为所述第一视频帧的敏感值。

进一步地，所述基于所述第一目标I帧间隔，确定编码I帧间隔包括：

若所述第一目标I帧间隔小于当前保存的I帧间隔，将所述第一目标I帧间隔，确定为所述编码I帧间隔。

若所述第一目标I帧间隔不小于当前保存的I帧间隔，确定所述第一视频帧之后设定数量的第三视频帧的敏感值对应的第二目标I帧间隔；判断所述第一目标I帧间隔及每个所述第二目标I帧间隔是否均不小于所述当前I帧间隔，若是，则确定所述第一目标I帧间隔及每个所述第二目标I帧间隔中的最小I帧间隔；将所述最小I帧间隔，确定为所述编码I帧间隔。

进一步地，训练所述目标检测模型的过程包括：

获取样本集中任一包含有目标物体的样本图像，所述样本图像对应有样本类别标签、以及所述样本类别标签对应的目标物体在所述样本图像中的样本位置信息；其中所述样本类别标签用于标识所述样本图像中包含的目标物体的类别；

通过原始目标检测模型，确定所述样本图像中包含的目标物体的识别类别标签以及对应的识别位置信息；

根据所述样本类别标签和所述识别类别标签，以及所述样本位置信息和所述识别位置信息，对原始目标检测模型进行训练，得到训练完成的目标检测模型。

第二方面，本发明提供了一种视频编码装置，所述装置包括：

第一确定模块，用于将接收到的第一视频帧输入预先训练完成的目标检测模型，基于所述目标检测模型，确定所述第一视频帧中包含的目标物体的第一位置信息；基于所述第一位置信息，确定所述目标物体的移动速度及所述目标物体在所述第一视频帧中的占比；

第二确定模块，用于基于所述移动速度和所述占比的乘积，确定所述第一视频帧的敏感值；

编码模块，用于根据预设的每个敏感值和I帧间隔的对应关系，确定所述第一视频帧的敏感值对应的第一目标I帧间隔；基于所述第一目标I帧间隔，确定编码I帧间隔，并根据所述编码I帧间隔对所述第一视频帧进行编码。

进一步地，所述第二确定模块，具体用于根据所述第一位置信息及获取的所述第一视频帧前一相邻第二视频帧中所述目标物体的第二位置信息，确定所述目标物体在所述第一视频帧中的偏移量；

进一步地，所述第二确定模块，具体用于确定所述目标物体在所述第一视频帧横向上的第一偏移量及在所述第一视频帧纵向上的第二偏移量，并确定所述第一偏移量和所述第二偏移量中的最大偏移量，将所述最大偏移量，确定为所述目标物体在所述第一视频帧中的偏移量。

进一步地，所述第二确定模块，具体用于若所述最大偏移量为所述第一偏移量，则根据所述第一偏移量与所述第一视频帧的横向尺寸的比值，确定所述相对偏移度；

进一步地，所述第二确定模块，具体用于若所述第一视频帧中包括至少一个目标物体，确定所述至少一个目标物体的移动速度和占比的乘积，将乘积中的最大值确定为所述第一视频帧的敏感值。

进一步地，所述编码模块，具体用于若所述第一目标I帧间隔小于当前保存的I帧间隔，将所述第一目标I帧间隔，确定为所述编码I帧间隔。

进一步地，所述编码模块，具体用于若所述第一目标I帧间隔不小于当前保存的I帧间隔，确定所述第一视频帧之后设定数量的第三视频帧的敏感值对应的第二目标I帧间隔；判断所述第一目标I帧间隔及每个所述第二目标I帧间隔是否均不小于所述当前I帧间隔，若是，则确定所述第一目标I帧间隔及每个所述第二目标I帧间隔中的最小I帧间隔；将所述最小I帧间隔，确定为所述编码I帧间隔。

进一步地，训练所述目标检测模型的过程包括：

第三方面，本发明提供了一种电子设备，所述电子设备至少包括处理器和存储器，所述处理器用于执行存储器中存储的计算机程序时实现如上述任一所述视频编码方法的步骤。

第四方面，本发明提供了一种计算机可读存储介质，其存储有计算机程序，所述计算机程序被处理器执行时实现如上述任一所述视频编码方法的步骤。

由于本发明实施例可以基于第一视频帧中包含的目标物体的移动速度和占比的乘积，确定第一视频帧的敏感值，进而可以根据预设的每个敏感值和I帧间隔的对应关系，确定第一视频帧的敏感值对应的第一目标I帧间隔，并基于该第一目标I帧间隔，确定编码I帧间隔，以可以根据该编码I帧间隔对第一视频帧进行编码。由于本发明实施例可以在当第一视频帧中包含的目标物体的移动速度和占比发生变化时，第一视频帧的敏感值、第一视频帧的敏感值对应的第一目标I帧间隔及编码I帧间隔均可以自适应的进行调整，相比现有采用固定的I帧间隔进行编码而言，本发明实施例可以基于视频帧中目标物体的移动速度和占比等的变化而自适应的调整编码I帧间隔，从而可以准确的确定编码I帧间隔，进而可以兼顾画面质量和码率大小，在保证画面质量的前提下，节省带宽及储存空间，降低码率。

附图说明

图1为现有技术提供的一种编码帧序列图；

图2为本发明实施例提供的第一种视频编码过程示意图；

图3为本发明实施例提供的确定第一视频帧中包含的目标物体的第一位置信息示意图；

图4为本发明实施例提供的第二种视频解码过程示意图；

图5为本发明实施例提供的第三种视频编码过程示意图；

图6为本发明实施例提供的第四种视频编码过程示意图；

图7为本发明实施例提供的一种视频编码装置示意图；

图8为本发明实施例提供的一种电子设备结构示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步地详细描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

本发明中说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别类似或同类的对象或实体，而不必然意味着限定特定的顺序或先后次序，除非另外注明。应该理解这样使用的用语在适当情况下可以互换。

术语“包括”和“具有”以及他们的任何变形，意图在于覆盖但不排他的包含，例如，包含了一系列组件的产品或设备不必限于清楚地列出的所有组件，而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。

术语“模块”是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合，能够执行与该元件相关的功能。

为了准确的确定I帧间隔，本发明实施例提供了一种视频编码方法、装置、设备及介质。

实施例1：

图2为本发明实施例提供的第一种视频编码过程示意图，该过程包括以下步骤：

S201：将接收到的第一视频帧输入预先训练完成的目标检测模型，基于所述目标检测模型，确定所述第一视频帧中包含的目标物体的第一位置信息；基于所述第一位置信息，确定所述目标物体的移动速度及所述目标物体在所述第一视频帧中的占比。

本发明实施例提供的视频编码方法应用于电子设备，该电子设备例如可以是PC、移动终端等设备，也可以是服务器等。在一种可能的实施方式中，该电子设备可以是进行视频监控的图像采集的设备，或者存储了监控视频的终端或者服务器等。

在一种可能的实施方式中，电子设备可以接收待编码的第一视频帧，并将接收到的第一视频帧输入预先训练完成的目标检测模型中。为了准确确定I帧间隔，在一种可能的实施方式中，目标检测模型可以确定设定类别的目标物体的第一位置信息，该设定类别的目标物体例如可以包括人、机动车、非机动车、动物等，可以根据需求灵活设置，本发明实施例对此不做具体限定。另外，目标物体的第一位置信息可以包括目标物体所在目标框的左上角、左下角、右上角、右下角等像素点在第一视频帧中的位置坐标。图3为本发明实施例提供的确定第一视频帧中包含的目标物体的第一位置信息示意图，如图3所示，第一视频帧中包含的目标物体可以包括人、机动车、非机动车(自行车)。以目标物体为图3中的自行车为例，该目标物体的目标框的左上角像素点在第一视频帧中的位置坐标用(left，top)表示，其中left表示左上角像素点的横坐标，top表示左上角像素点的纵坐标。该目标物体的目标框的右下角像素点在第一视频帧中的位置坐标用(right，bottom)表示，其中right表示右下角像素点的横坐标，bottom表示右下角像素点的纵坐标。

为了准确确定I帧间隔，可以基于目标物体的第一位置信息，确定目标物体的移动速度以及目标物体在第一视频帧中的占比。其中，在一种可能的实施方式中，在基于目标物体的第一位置信息，确定目标物体的移动速度时，可以获取第一视频帧前一相邻第二视频帧中该目标物体的第二位置信息。在获取第二视频帧中该目标物体的第二位置信息时，也可以将该第二视频帧输入预先训练完成的目标检测模型，基于该目标检测模型，确定第二视频帧中包含的目标物体的第二位置信息。然后根据该第一位置信息和第二位置信息，确定该目标物体的偏移量，并根据该偏移量、第一视频帧和第二视频帧之间的间隔时长，确定该目标物体的移动速度。

其中，在根据第一位置信息和第二位置信息，确定目标物体的偏移量时，可以是根据目标物体的第一位置信息中该目标物体的目标框的左上角、左下角、右上角、右下角等像素点的位置坐标，与第二位置信息中该目标物体的目标框的左上角、左下角、右上角、右下角等像素点的位置坐标来确定目标物体的偏移量。在一种可能的实施方式中，还可以根据第一位置信息中目标物体所在目标框的左上角和右下角等像素点的位置坐标，确定第一位置信息中目标物体所在目标框的第一中心点位置坐标，同样的，也可以根据第二位置信息中目标物体所在目标框的左上角和右下角等像素点的位置坐标，确定第二位置信息中目标物体所在目标框的第二中心点位置坐标，然后根据第一中心点位置坐标和第二中心点位置坐标，确定目标物体的偏移量。

为方便理解，下面用公式形式对确定目标物体的偏移量的过程进行说明。仍以上述实施例为例，目标物体所在的目标框的左上角像素点在第一视频帧中的位置坐标用(left，top)表示，其中left表示左上角像素点的横坐标，top表示左上角像素点的纵坐标。目标物体的目标框的右下角像素点在第一视频帧中的位置坐标用(right，bottom)表示，其中right表示右下角像素点的横坐标，bottom表示右下角像素点的纵坐标。第一视频帧中目标物体的第一中心点位置坐标用(X′_i，Y′_i)表示，其中X′_i为第一中心点的横坐标，Y′_i为第一中心点的纵坐标，则

第二视频帧中目标物体的第二中心点位置坐标(X′_i+1，Y′_i+1)表示，其中确定第二中心点位置坐标的过程与确定第一中心点位置坐标过程相同，在此不再赘述。根据第一中心点位置坐标和第二中心点位置坐标，确定目标物体的偏移量时，偏移量可以是：

另外，还可以确定第一视频帧和第二视频帧之间的间隔时长，在确定目标物体的移动速度时，可以根据偏移量与该间隔时长的比值，确定目标物体的移动速度。

在一种可能的实施方式中，还可以基于第一位置信息，确定目标物体在第一视频帧中的占比。在基于第一位置信息，确定目标物体在第一视频帧中的占比时，可以先根据第一位置信息，确定目标物体的第一面积；并根据第一视频帧的尺寸，确定第一视频帧的第二面积；然后根据第一面积和第二面积的比值，确定目标物体在第一视频帧中的占比。示例性的，仍以上述实施例为例，在根据第一位置信息，确定目标物体的第一面积时，第一面积可以为|left-right|×|bottom-top|。第一视频帧的横向尺寸用Width表示，第一视频帧的纵向尺寸用Height表示，则第一视频帧的第二面积为Width×Height，目标物体在第一视频帧中的占比

S202：基于所述移动速度和所述占比的乘积，确定所述第一视频帧的敏感值。

为了确定第一视频帧的敏感值，在一种可能的实施方式中，可以先基于目标物体的移动速度和占比的乘积，确定第一视频帧的敏感值。其中在基于目标物体的移动速度和目标物体在第一视频帧中的占比的乘积，确定第一视频帧的敏感值时，如果第一视频帧中包括至少一个目标物体，可以分别确定每个目标物体的移动速度和每个目标物体在第一视频帧中的占比，并分别确定每个目标物体的移动速度和占比的乘积。在一种可能的实施方式中，可以将任一目标物体的移动速度和占比的乘积，确定为第一视频帧的敏感值。也可以将每个目标物体的移动速度和占比的乘积的平均值或方差，确定为第一视频帧的敏感值。另外，还可以将每个目标物体的移动速度和占比的乘积中的最小值等，确定为第一视频帧的敏感值。

为了准确确定I帧间隔，在上述各实施例的基础上，在本发明实施例中，所述基于所述移动速度和所述占比的乘积，确定所述第一视频帧的敏感值包括：

在一种可能的实施方式中，为了准确确定I帧间隔，如果第一视频帧中包括至少一个目标物体，还可以将每个目标物体的移动速度和占比的乘积中的最大值，确定为第一视频帧的敏感值。

为方便理解，目标物体的移动速度用V表示，目标物体在第一视频帧中的占比用R表示，该目标物体的移动速度和占比的乘积用D表示，则D＝V×R。第一视频帧的敏感值为每个目标物体的移动速度和占比的乘积中的最大值。

S203：根据预设的每个敏感值和I帧间隔的对应关系，确定所述第一视频帧的敏感值对应的第一目标I帧间隔；基于所述第一目标I帧间隔，确定编码I帧间隔，并根据所述编码I帧间隔对所述第一视频帧进行编码。

为了准确确定用于编码的I帧间隔，可以预设每个敏感值和I帧间隔的对应关系，其中每个敏感值对应的I帧间隔的具体数值可以根据需求灵活设置，本发明实施例对此不做具体限定。确定了第一视频帧的敏感值后，可以根据预设的每个敏感值和I帧间隔的对应关系，确定该第一视频帧的敏感值对应的第一目标I帧间隔。

在一种可能的实施方式中，第一视频帧中目标物体的移动速度越高，占比越高，则移动速度和占比的乘积越大，第一视频帧的敏感值越大，该第一视频帧对画面质量的诉求就会越高，相应的，该第一视频帧对应的编码I帧间隔可以较小。也就是说，敏感值越大，敏感值对应的I帧间隔可以越小。

相反的，如果第一视频帧中目标物体的移动速度越小，占比越小，则移动速度和占比的乘积越小，第一视频帧的敏感值越小，该第一视频帧对画面质量的诉求就会越低，相应的，该第一视频帧对应的编码I帧间隔可以较大。也就是说，敏感值越小，敏感值对应的I帧间隔可以越大。

表1为本发明实施例提供的一种敏感值和I帧间隔的对应关系示意表，如表1所示，敏感值越小，敏感值对应的I帧间隔越大；敏感值越大，敏感值对应的I帧间隔越小。以编码帧率为30为例，当第一视频帧的敏感值在[0，0.2)区间时，第一视频帧的敏感值对应的第一目标I帧间隔可以为15*FPS，即450。当第一视频帧的敏感值在[0.2，0.4)区间时，第一视频帧的敏感值对应的第一目标I帧间隔可以为12*FPS，即360。当第一视频帧的敏感值在[0.4，0.6)区间时，第一视频帧的敏感值对应的第一目标I帧间隔可以为10*FPS，即300。当第一视频帧的敏感值在[0.6，0.8)区间时，第一视频帧的敏感值对应的第一目标I帧间隔可以为6*FPS，即180。当第一视频帧的敏感值在[0.8，1)区间时，第一视频帧的敏感值对应的第一目标I帧间隔可以为2*FPS，即60。当第一视频帧的敏感值≥1时，第一视频帧的敏感值对应的第一目标I帧间隔可以为FPS，即30。

表1

敏感值

[0，0.2)

[0.2，0.4)

[0.4，0.6)

[0.6，0.8)

[0.8，1)

≥1

I帧间隔

15*FPS

12*FPS

10*FPS

6*FPS

2*FPS

FPS

其中FPS为编码帧率。

在一种可能的实施方式中，确定了第一视频帧的敏感值对应的第一目标I帧间隔后，可以基于该第一目标I帧间隔，确定用于编码的编码I帧间隔。在一种可能的实施方式中，在基于第一目标I帧间隔，确定编码I帧间隔时，可以是将第一目标I帧间隔，确定为编码I帧间隔；也可以是将第一目标I帧间隔与设定系数的乘积，确定为编码I帧间隔等，可以根据需求灵活设置。

确定了编码I帧间隔后，可以根据该编码I帧间隔对第一视频帧进行编码。在一种可能的实施方式中，可以用该编码I帧间隔，对当前保存的I帧间隔进行更新，从而根据该编码I帧间隔，进行编码。具体的，根据编码I帧间隔对第一视频帧进行编码可以采用现有技术，在此不再赘述。

实施例2：

为了准确确定目标物体的移动速度，在上述实施例的基础上，在本发明实施例中，所述基于所述第一位置信息，确定所述目标物体的移动速度包括：

在一种可能的实施方式中，为了确定目标物体的移动速度，可以先根据第一位置信息及获取的第一视频帧前一相邻第二视频帧中目标物体的第二位置信息，确定目标物体在第一视频帧中的偏移量，其中，确定目标物体在第一视频帧中的偏移量的过程可以与上述实施例相同，在此不再赘述。

在一种可能的实施方式中，为了准确确定目标物体的移动速度，可以根据目标物体的偏移量和第一视频帧的尺寸，确定目标物体在第一视频帧中的相对偏移度。该相对偏移度可用于表示目标物体在第一视频帧中的偏移程度。在一种可能的实施方式中，根据偏移量和第一视频帧的尺寸，确定目标物体在第一视频帧中的相对偏移度时，可以是根据偏移量与第一视频帧的横向尺寸，确定目标物体在第一视频帧中的相对偏移度；也可以是根据偏移量与第一视频帧的纵向尺寸等，确定目标物体在第一视频帧中的相对偏移度，可以根据需求灵活设置。

在一种可能的实施方式中，可以将相对偏移度作为目标物体在第一视频帧中的偏移距离，将第一视频帧和第二视频帧之间的间隔时长作为目标物体的偏移时间，根据相对偏移度和该间隔时长的比值，确定目标物体的相对移动速度。

在一种可能的实施方式中，第一视频帧和第二视频帧之间的间隔时长可以根据包括第一视频帧和第二视频帧在内的视频的帧率来确定，其中帧率为单位时间内包含的视频帧的数量，帧率的倒数可以表示第一视频帧和第二视频帧之间的间隔时长。为方便理解，帧率用F表示，相对偏移度用ΔL表示，则目标物体的相对移动速度V＝ΔL×F。

实施例3：

为了准确确定目标物体在所述第一视频帧中的偏移量，在上述实施例的基础上，在本发明实施例中，所述确定所述目标物体在所述第一视频帧中的偏移量包括：

在一种可能的实施方式中，在确定目标物体在第一视频帧中的偏移量时，可以确定目标物体在第一视频帧横向上的第一偏移量，以上述实施例为例，目标物体在第一视频帧横向上的第一偏移量可以用|X′_i+1-X′_i|表示。同时，还可以确定目标物体在第一视频帧纵向上的第二偏移量，以上述实施例为例，目标物体在第一视频帧纵向上的第二偏移量可以用|Y′_i+1-Y′_i|表示。在一种可能的实施方式中，可以确定第一偏移量和第二偏移量中的最大偏移量，并将该最大偏移量，确定为目标物体在第一视频帧中的偏移量。

为方便理解，第一偏移量和第二偏移量中的最大偏移量可以用Max{|X′_i+1-X′_i|,|Y′_i+1-Y′_i|}表示，如果根据偏移量和第一视频帧的横向尺寸，确定目标物体在第一视频帧中的相对偏移度，则相对偏移度

另外，如果根据偏移量和第一视频帧的纵向尺寸，确定目标物体在第一视频帧中的相对偏移度，则相对偏移度

在一种可能的实施方式中，为了准确的确定目标物体在所述第一视频帧中的相对偏移度，在上述各实施例的基础上，在本发明实施例中，所述根据所述偏移量和所述第一视频帧的尺寸，确定所述目标物体在所述第一视频帧中的相对偏移度包括：

在一种可能的实施方式中，如果第一偏移量不小于第二偏移量，第一偏移量和第二偏移量中的最大偏移量与第一偏移量相同，即最大偏移量为第一偏移量时，为了准确确定目标物体在第一视频帧中的相对偏移度，可以根据第一偏移量与第一视频帧的横向尺寸的比值，确定目标物体的相对偏移度。为方便理解，下面用公式形式对确定目标物体的相对偏移度的过程进行说明：若Max{|X′_i+1-X′_i|,|Y′_i+1-Y′_i|}＝|X′_i+1-X′_i|，第一视频帧的横向尺寸用Width表示，则相对偏移度

在一种可能的实施方式中，如果第一偏移量小于第二偏移量，第一偏移量和第二偏移量中的最大偏移量与第二偏移量相同，即最大偏移量为第二偏移量时，为了准确确定目标物体在第一视频帧中的相对偏移度，可以根据第二偏移量与第一视频帧的纵向尺寸的比值，确定目标物体的相对偏移度。为方便理解，下面用公式形式对确定目标物体的相对偏移度的过程进行说明。若Max{|X′_i+1-X′_i|,|Y′_i+1-Y′_i|}＝|Y′_i+1-Y′_i|，第一视频帧的纵向尺寸用Height表示，则相对偏移度

为方便理解，下面通过一个具体实施例对本发明实施例提供的视频解码过程进行说明，图4为本发明实施例提供的第二种视频解码过程示意图，如图4所示，该视频解码过程包括：

将包括第一视频帧在内的视频帧队列中的每个视频帧，依次输入预先训练完成的目标检测模型，以将第一视频帧输入目标检测模型为例，可以基于该目标检测模型，确定第一视频帧中包含的目标物体的第一位置信息。确定第一视频帧中包含的目标物体的第一位置信息后，可以基于该第一位置信息，确定目标物体的移动速度及目标物体在第一视频帧中的占比。在一种可能的实施方式中，若第一视频帧中包括至少一个目标物体，可以确定每个目标物体的移动速度及占比的乘积，并将乘积中的最大值确定为第一视频帧的敏感值。然后根据预设的每个敏感值和I帧间隔的对应关系，确定第一视频帧的敏感值对应的第一目标I帧间隔；并基于该第一目标I帧间隔，确定编码I帧间隔，电子设备中的编码器可以根据该编码I帧间隔对第一视频帧进行编码，形成对应的码流。

为方便理解，下面通过一个具体实施例对本发明实施例提供的视频编码过程进行说明。图5为本发明实施例提供的第三种视频编码过程示意图，如图5所示，该过程包括以下步骤：

S501：将接收到的第一视频帧输入预先训练完成的目标检测模型，基于该目标检测模型，确定第一视频帧中包含的目标物体的第一位置信息；基于该第一位置信息，确定该目标物体的移动速度及该目标物体在第一视频帧中的占比。

S502：若第一视频帧中包括至少一个目标物体，针对至少一个目标物体，确定该目标物体的移动速度和占比的乘积。将每个乘积中的最大值确定为第一视频帧的敏感值。

S503：根据预设的每个敏感值和I帧间隔的对应关系，确定第一视频帧的敏感值对应的第一目标I帧间隔；基于该第一目标I帧间隔，确定编码I帧间隔，并根据该编码I帧间隔对第一视频帧进行编码。

实施例4：

为了准确确定编码I帧间隔，在上述各实施例的基础上，在本发明实施例中，所述基于所述第一目标I帧间隔，确定编码I帧间隔包括：

在一种可能的实施方式中，若第一目标I帧间隔小于当前保存的I帧间隔，可以认为第一视频帧中包含的目标物体发生了较剧烈运动等，第一视频帧对画面质量的诉求较高，为了提高画面质量，可以随即将第一目标I帧间隔确定为编码I帧间隔，即根据第一目标I帧间隔对第一视频帧进行编码。

另外，为了准确确定编码I帧间隔，在上述各实施例的基础上，在本发明实施例中，所述基于所述第一目标I帧间隔，确定编码I帧间隔包括：

鉴于通常情况下，I帧间隔越大，越有利于降低编码码率，但可能会影响画面质量，在一种可能的实施方式中，若第一目标I帧间隔不小于当前保存的I帧间隔，可以认为该第一视频帧对画面质量的诉求较低，为了确保画面质量，避免画面质量不高，降低用户体验，同时，为了避免反复调整I帧间隔，可以进一步确定第一视频帧之后设定数量的第三视频帧的敏感值对应的第二目标I帧间隔。其中确定第三视频帧的敏感值对应的第二目标I帧间隔的过程与确定第一视频帧的敏感值对应的第一目标I帧间隔的过程相同，在此不再赘述。

确定了设定数量的第三视频帧的敏感值对应的第二目标I帧间隔之后，可以判断第一目标I帧间隔及每个第二目标I帧间隔是否均不小于当前I帧间隔，若是，则认为可以基于第一目标I帧间隔及每个第二目标I帧间隔，对当前I帧间隔进行调整。在一种可能的实施方式中，在基于第一目标I帧间隔及每个第二目标I帧间隔，对当前I帧间隔进行调整时，可以先确定第一目标I帧间隔及每个第二目标I帧间隔中的最小I帧间隔，然后将该最小I帧间隔，确定为编码I帧间隔。

由于本发明实施例可以基于第一视频帧中目标物体的移动速度和占比等对第一视频帧中目标物体的运动状态等场景进行准确判断，在当第一视频帧对画面质量的诉求较高时，可以采用较小的编码I帧间隔，提高画面质量；在当第一视频帧对画面质量的诉求较低时，可以采用较大的I帧间隔，适当降低画面质量，降低码率，从而实现可以根据视频帧中目标物体的移动速度和占比等自适应的调整编码I帧间隔，以可以提高确定的编码I帧间隔的准确性，进而可以兼顾画面质量和码率大小，在保证画面质量的前提下，节省带宽及储存空间，降低码率。

为方便理解，下面通过一个具体实施例对本发明实施例提供的视频编码过程进行说明。图6为本发明实施例提供的第四种视频编码过程示意图，如图6所示，该过程包括以下步骤：

S601：将接收到的第一视频帧输入预先训练完成的目标检测模型，基于该目标检测模型，确定第一视频帧中包含的目标物体的第一位置信息；基于第一位置信息，确定目标物体的移动速度及目标物体在第一视频帧中的占比。

S602：若第一视频帧中包括至少一个目标物体，确定该至少一个目标物体的移动速度和占比的乘积，将乘积中的最大值确定为第一视频帧的敏感值。

S603：根据预设的每个敏感值和I帧间隔的对应关系，确定第一视频帧的敏感值对应的第一目标I帧间隔；并判断第一目标I帧间隔是否小于当前保存的I帧间隔，若是，则进行S604；若否，则进行S605。

S604：将第一目标I帧间隔，确定为编码I帧间隔，并进行S607。

S605：确定第一视频帧之后设定数量的第三视频帧的敏感值对应的第二目标I帧间隔；判断第一目标I帧间隔及每个第二目标I帧间隔是否均不小于当前I帧间隔，若是，则进行S606；若否，则进行S608。

S606：确定第一目标I帧间隔及每个第二目标I帧间隔中的最小I帧间隔；将该最小I帧间隔，确定为编码I帧间隔。

S607：根据编码I帧间隔对第一视频帧进行编码。

S608：不对当前I帧间隔进行调整，根据当前I帧间隔对第一视频帧进行编码。

实施例5：

为了准确确定I帧间隔，在上述各实施例的基础上，在本发明实施例中，训练所述目标检测模型的过程包括：

在本发明实施例中，可以通过预先训练完成的目标检测模型，确定第一图像中是否存在目标物体，以及在确定第一图像中存在目标物体时，可以输出第一图像中的目标物体所在的位置信息。

为了准确确定I帧间隔，在对目标检测模型进行训练时，在本发明实施例中，样本集中包含多个样本图像，每个包含有目标物体的样本图像都对应有该目标物体对应的样本类别标签，该样本类别标签用于标识该样本图像中包含的目标物体的类别，具体的，目标物体的类别可以根据需求灵活设置，示例性的，目标物体的类别可以包括人、机动车、非机动车、动物等。例如当目标物体包含人时，该样本图像对应有包含人的样本类别标签，当目标物体包含机动车时，该样本图像对应有包含机动车的样本类别标签，当目标物体包含非机动车时，该样本图像对应有包含非机动车的样本类别标签等。

值得说明的是，本发明实施例中的目标检测模型可以确定设定类别的目标物体的位置信息，基于该设定类别的目标物体的位置信息，确定第一视频帧中包含的目标物体的移动速度及目标物体在第一视频帧中的占比时，相比相关方案没有考虑目标物体的类别及移动速度，只基于运动物体在图像中的占比，确定I帧间隔而言，本发明实施例可以避免将树叶摆动、水面的波光粼粼等用户不关心的运动场景也考虑到目标物体中，从而避免这些用户不关心的运动场景影响确定的I帧间隔的准确性，本发明实施例可以提高确定的I帧间隔的准确性。

为了可以获取目标物体的位置信息，样本图像还对应有每个样本类别标签对应的目标物体在该样本图像中的样本位置信息。样本位置信息可以包括该目标物体的目标框的左上角像素点、右下角像素点等在样本图像中的坐标位置。

在对原始目标检测模型进行训练时，可以获取样本集中任一包含有目标物体的样本图像，该样本图像对应有样本类别标签、以及该样本类别标签对应的目标物体在该样本图像中的样本位置信息。将该获取到的任一样本图像输入原始目标检测模型，通过原始目标检测模型，获取该样本图像对应的目标物体的识别类别标签，以及对应的识别位置信息。

具体实施中，确定了输入的样本图像的识别类别标签和对应的识别位置信息后，因为预先保存了该样本图像的样本类别标签、以及该样本类别标签对应的目标物体在样本图像中的样本位置信息，因此可以根据样本类别标签与识别类别标签是否一致，以及样本位置信息与识别位置信息是否一致，确定该目标检测模型的识别结果是否准确。具体实施中，若不一致，说明该目标检测模型的识别结果不准确，则需要对该目标检测模型的参数进行调整，从而对目标检测模型进行训练。

具体实施中，对目标检测模型中的参数进行调整时，可以采用梯度下降算法，对目标检测模型的参数的梯度进行反向传播，从而对目标检测模型进行训练。

在一种可能的实施方式中，可以对样本集中的每个样本图像都进行上述操作，当满足预设的收敛条件时，确定该目标检测模型训练完成。

其中，满足预设的收敛条件可以为样本集中的样本图像通过该原始目标检测模型，被正确识别的样本图像的个数大于设定数量，或对目标检测模型进行训练的迭代次数达到设置的最大迭代次数等。具体实施中可以灵活进行设置，在此不做具体限定。

在一种可能的实施方式中，在进行原始目标检测模型训练时，可以把样本集中的样本图像分为训练样本图像和测试样本图像，先基于训练样本图像对原始目标检测模型进行训练，再基于测试样本图像对上述已训练的目标检测模型的可靠程度进行验证。

实施例6：

在上述各实施例的基础上，本发明实施例提供的一种视频编码装置，图7为本发明实施例提供的一种视频编码装置示意图，如图7所示，所述装置包括：

第一确定模块71，用于将接收到的第一视频帧输入预先训练完成的目标检测模型，基于所述目标检测模型，确定所述第一视频帧中包含的目标物体的第一位置信息；基于所述第一位置信息，确定所述目标物体的移动速度及所述目标物体在所述第一视频帧中的占比；

第二确定模块72，用于基于所述移动速度和所述占比的乘积，确定所述第一视频帧的敏感值；

编码模块73，用于根据预设的每个敏感值和I帧间隔的对应关系，确定所述第一视频帧的敏感值对应的第一目标I帧间隔；基于所述第一目标I帧间隔，确定编码I帧间隔，并根据所述编码I帧间隔对所述第一视频帧进行编码。

在一种可能的实施方式中，所述第二确定模块72，具体用于根据所述第一位置信息及获取的所述第一视频帧前一相邻第二视频帧中所述目标物体的第二位置信息，确定所述目标物体在所述第一视频帧中的偏移量；

在一种可能的实施方式中，所述第二确定模块72，具体用于确定所述目标物体在所述第一视频帧横向上的第一偏移量及在所述第一视频帧纵向上的第二偏移量，并确定所述第一偏移量和所述第二偏移量中的最大偏移量，将所述最大偏移量，确定为所述目标物体在所述第一视频帧中的偏移量。

在一种可能的实施方式中，所述第二确定模块72，具体用于若所述最大偏移量为所述第一偏移量，则根据所述第一偏移量与所述第一视频帧的横向尺寸的比值，确定所述相对偏移度；

在一种可能的实施方式中，所述第二确定模块72，具体用于若所述第一视频帧中包括至少一个目标物体，确定所述至少一个目标物体的移动速度和占比的乘积，将乘积中的最大值确定为所述第一视频帧的敏感值。

在一种可能的实施方式中，所述编码模块73，具体用于若所述第一目标I帧间隔小于当前保存的I帧间隔，将所述第一目标I帧间隔，确定为所述编码I帧间隔。

在一种可能的实施方式中，所述编码模块73，具体用于若所述第一目标I帧间隔不小于当前保存的I帧间隔，确定所述第一视频帧之后设定数量的第三视频帧的敏感值对应的第二目标I帧间隔；判断所述第一目标I帧间隔及每个所述第二目标I帧间隔是否均不小于所述当前I帧间隔，若是，则确定所述第一目标I帧间隔及每个所述第二目标I帧间隔中的最小I帧间隔；将所述最小I帧间隔，确定为所述编码I帧间隔。

在一种可能的实施方式中，训练所述目标检测模型的过程包括：

实施例7：

在上述各实施例的基础上，本发明实施例还提供了一种电子设备，图8为本发明实施例提供的一种电子设备结构示意图，如图8所示，该电子设备包括：处理器81、通信接口82、存储器83和通信总线84，其中，处理器81，通信接口82，存储器83通过通信总线84完成相互间的通信；

所述存储器83中存储有计算机程序，当所述程序被所述处理器81执行时，使得所述处理器81执行如下步骤：

在一种可能的实施方式中，所述处理器81，具体用于根据所述第一位置信息及获取的所述第一视频帧前一相邻第二视频帧中所述目标物体的第二位置信息，确定所述目标物体在所述第一视频帧中的偏移量；

在一种可能的实施方式中，所述处理器81，具体用于确定所述目标物体在所述第一视频帧横向上的第一偏移量及在所述第一视频帧纵向上的第二偏移量，并确定所述第一偏移量和所述第二偏移量中的最大偏移量，将所述最大偏移量，确定为所述目标物体在所述第一视频帧中的偏移量。

在一种可能的实施方式中，所述处理器81，具体用于若所述最大偏移量为所述第一偏移量，则根据所述第一偏移量与所述第一视频帧的横向尺寸的比值，确定所述相对偏移度；

在一种可能的实施方式中，所述处理器81，具体用于若所述第一视频帧中包括至少一个目标物体，确定所述至少一个目标物体的移动速度和占比的乘积，将乘积中的最大值确定为所述第一视频帧的敏感值。

在一种可能的实施方式中，所述处理器81，具体用于若所述第一目标I帧间隔小于当前保存的I帧间隔，将所述第一目标I帧间隔，确定为所述编码I帧间隔。

在一种可能的实施方式中，所述处理器81，具体用于若所述第一目标I帧间隔不小于当前保存的I帧间隔，确定所述第一视频帧之后设定数量的第三视频帧的敏感值对应的第二目标I帧间隔；判断所述第一目标I帧间隔及每个所述第二目标I帧间隔是否均不小于所述当前I帧间隔，若是，则确定所述第一目标I帧间隔及每个所述第二目标I帧间隔中的最小I帧间隔；将所述最小I帧间隔，确定为所述编码I帧间隔。

由于上述电子设备解决问题的原理与视频编码方法相似，因此上述电子设备的实施可以参见方法的实施，重复之处不再赘述。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口82用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。可选地，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述处理器可以是通用处理器，包括中央处理器、网络处理器(NetworkProcessor，NP)等；还可以是数字指令处理器(Digital Signal Processing，DSP)、专用集成电路、现场可编程门陈列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。

实施例8：

在上述各实施例的基础上，本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有可由电子设备执行的计算机程序，当所述程序在所述电子设备上运行时，使得所述电子设备执行时实现如下步骤：

在一种可能的实施方式中，所述基于所述第一位置信息，确定所述目标物体的移动速度包括：

在一种可能的实施方式中，所述确定所述目标物体在所述第一视频帧中的偏移量包括：

在一种可能的实施方式中，所述根据所述偏移量和所述第一视频帧的尺寸，确定所述目标物体在所述第一视频帧中的相对偏移度包括：

在一种可能的实施方式中，所述基于所述移动速度和所述占比的乘积，确定所述第一视频帧的敏感值包括：

在一种可能的实施方式中，所述基于所述第一目标I帧间隔，确定编码I帧间隔包括：

上述计算机可读存储介质可以是电子设备中的处理器能够存取的任何可用介质或数据存储设备，包括但不限于磁性存储器如软盘、硬盘、磁带、磁光盘(MO)等、光学存储器如CD、DVD、BD、HVD等、以及半导体存储器如ROM、EPROM、EEPROM、非易失性存储器(NANDFLASH)、固态硬盘(SSD)等。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

1.一种视频编码方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述第一位置信息，确定所述目标物体的移动速度包括：

3.根据权利要求2所述的方法，其特征在于，所述确定所述目标物体在所述第一视频帧中的偏移量包括：

4.根据权利要求3所述的方法，其特征在于，所述根据所述偏移量和所述第一视频帧的尺寸，确定所述目标物体在所述第一视频帧中的相对偏移度包括：

5.根据权利要求1所述的方法，其特征在于，所述基于所述移动速度和所述占比的乘积，确定所述第一视频帧的敏感值包括：

6.根据权利要求1所述的方法，其特征在于，所述基于所述第一目标I帧间隔，确定编码I帧间隔包括：

7.根据权利要求1所述的方法，其特征在于，所述基于所述第一目标I帧间隔，确定编码I帧间隔包括：

8.根据权利要求1所述的方法，其特征在于，训练所述目标检测模型的过程包括：

9.一种视频编码装置，其特征在于，所述装置包括：

10.一种电子设备，其特征在于，所述电子设备至少包括处理器和存储器，所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-8中任一所述视频编码方法的步骤。

11.一种计算机可读存储介质，其特征在于，其存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1-8中任一所述视频编码方法的步骤。