WO2021147966A1

WO2021147966A1 - 图像识别方法及装置

Info

Publication number: WO2021147966A1
Application number: PCT/CN2021/073150
Authority: WO
Inventors: 施雪梅; 许强强; 杨浩
Original assignee: 北京达佳互联信息技术有限公司
Priority date: 2020-01-21
Filing date: 2021-01-21
Publication date: 2021-07-29
Also published as: CN113225613A; CN113225613B; US20220279241A1

Abstract

本公开涉及一种图像识别方法及装置。所述方法包括：获取多个待识别图像；拼接多个所述待识别图像，得到目标图像；将所述目标图像输入图像识别模型，得到所述目标图像的多个第一关键点；根据所述目标图像的多个第一关键点，确定每个所述待识别图像各自的第二关键点。

Description

图像识别方法及装置

本公开要求于2020年01月21日提交、申请号为202010070867.X的中国专利申请的优先权，其全部内容通过引用结合在本公开中。

技术领域

本公开涉及视频技术领域，特别是涉及一种图像识别方法及装置。

背景技术

目前，随着视频技术的发展，越来越多的用户通过手机或者台式电脑等终端进行视频通讯，视频通讯能够广泛应用于视频通话、视频会议、视频直播等应用场景中。通常，在上述的应用场景中，用户能够通过本地端进行拍摄，播放本地端拍摄到的视频，本地端还能够播放另一端拍摄到的视频，由此，用户通过本地端看到双方实时的视频。

通常，在上述的应用场景中，用户能够对视频图像进行特效处理。例如，在视频直播中，用户在双方的视频图像中贴上动画贴纸。

发明内容

本公开提供一种图像识别方法及装置。本公开的技术方案如下：

根据本公开实施例的一方面，提供一种图像识别方法，包括：

获取多个待识别图像；

拼接多个所述待识别图像，得到目标图像；

将所述目标图像输入图像识别模型，得到所述目标图像的多个第一关键点；

根据所述目标图像的多个第一关键点，确定每个所述待识别图像各自的第二关键点。

在一些实施例中，所述第一关键点在所述目标图像上的像素坐标为第一关键点坐标，所述根据所述目标图像的多个第一关键点，确定每个所述待识别图像各自的第二关键点，包括：

确定所述第一关键点坐标对应的坐标转换参数；所述坐标转换参数为用于将所述第一关键点坐标转换成在所述待识别图像上确定所述第二关键点的坐标的参数；

按照所述第一关键点坐标对应的坐标转换参数，将所述第一关键点坐标转换为第二关键点坐标；

将所述待识别图像中处于所述第二关键点坐标的像素点，作为所述第二关键点。

在一些实施例中，所述目标图像包括多个图像区域，多个所述图像区域分别具有对应的待识别图像，所述确定所述第一关键点坐标对应的坐标转换参数，包括：

在所述拼接图像中的多个所述图像区域中，确定所述第一关键点坐标在所述拼接图像中所处的目标图像区域；

根据所述目标图像区域对应的待识别图像，确定所述第一关键点坐标对应的坐标转换参数。

在一些实施例中，还包括：

根据所述待识别图像中的像素点的像素坐标，确定所述待识别图像的图像边界；

确定所述待识别图像的图像边界在所述目标图像上的像素坐标，得到图像区域划分坐标；

根据所述图像区域划分坐标，将所述目标图像划分为分别与多个所述待识别图像对应的多个所述图像区域。

在一些实施例中，所述确定所述第一关键点坐标对应的坐标转换参数的坐标转换参数，包括：

确定所述待识别图像中的至少一个像素点，为基准像素点；

确定所述基准像素点在所述待识别图像上的像素坐标，得到拼接前基准像素坐标，以及，确定所述基准像素点在所述目标图像上的像素坐标，得到拼接后基准像素坐标；

基于所述拼接后基准像素坐标与所述拼接前基准像素坐标，确定所述坐标转换参数。

在一些实施例中，所述基于所述拼接后基准像素坐标与所述拼接前基准像素坐标，确定所述坐标转换参数，包括：

将所述拼接后基准像素坐标减去所述拼接前基准像素坐标所得到的差值，作为所述坐标转换参数；或者，

将所述拼接前基准像素坐标减去所述拼接后基准像素坐标的差值，作为所述坐标转换参数。

在一些实施例中，所述按照所述第一关键点坐标对应的坐标转换参数，将所述第一关键点坐标转换为第二关键点坐标，包括：

在所述坐标转换参数为所述拼接后基准像素坐标减去所述拼接前基准像素坐标得到的差值的情况下，将所述第一关键点坐标减去所述坐标转换参数，得到所述第二关键点坐标；

在所述坐标转换参数为拼接前基准像素坐标减去所述拼接后基准像素坐标得到的差值的情况下，将所述第一关键点坐标加上所述坐标转换参数，得到所述第二关键点坐标。

在一些实施例中，所述拼接多个所述待识别图像，得到目标图像，包括：

对多个所述待识别图像中的至少一个所述待处理图像进行缩放，得到缩放后图像；多个所述缩放后图像的图像尺寸相同；

拼接多个所述缩放后图像，得到所述目标图像。

根据本公开实施例的另一方面，提供一种视频直播方法，包括：

获取第一账户的直播视频流，以及，获取第二账户的直播视频流；

从所述第一账户的直播视频流中提取出第一待识别图像，以及，从所述第二账户的直播视频流中提取出第二待识别图像；

拼接所述第一待识别图像和所述第二待识别图像，得到目标图像；

根据所述目标图像的多个第一关键点，确定所述第一待识别图像和所述第二待识别图像各自的第二关键点；

按照所述第一待识别图像的第二关键点，对所述第一待识别图像添加图像特效，得到第一特效化图像，以及，按照所述第二待识别图像的第二关键点，对所述第二待识别图像添加图像特效，得到第二特效化图像；

播放所述第一账户的特效化直播视频和所述第二账户的特效化直播视频；所述第一账户的特效化直播视频包括所述第一特效化图像；所述第二账户的特效化直播视频包括所述第二特效化图像。

根据本公开实施例的另一方面，提供了一种图像识别装置，包括：

图像获取单元，被配置为执行获取多个待识别图像；

图像拼接单元，被配置为执行拼接多个所述待识别图像，得到目标图像；

关键点识别单元，被配置为执行将所述目标图像输入图像识别模型，得到所述目标图像的多个第一关键点；

关键点确定单元，被配置为执行根据所述目标图像的多个第一关键点，确定每个所述待识别图像各自的第二关键点。

在一些实施例中，所述第一关键点在所述目标图像上的像素坐标为第一关键点坐标，所述关键点确定单元，被配置为执行：

在一些实施例中，所述目标图像包括多个图像区域，多个所述图像区域分别具有对应的待识别图像，所述关键点确定单元，被配置为执行：

在一些实施例中，所述装置还包括：

划分单元，被配置为执行根据所述待识别图像中的像素点的像素坐标，确定所述待识别图像的图像边界；确定所述待识别图像的图像边界在所述目标图像上的像素坐标，得到图像区域划分坐标；根据所述图像区域划分坐标，将所述目标图像划分为分别与多个所述待识别图像对应的多个所述图像区域。

在一些实施例中，所述关键点确定单元，被配置为执行：

确定所述待识别图像中的至少一个像素点，为基准像素点；

在一些实施例中，所述关键点确定单元，被配置为执行：

在一些实施例中，所述图像拼接单元，被配置为执行：

拼接多个所述缩放后图像，得到所述目标图像。

根据本公开实施例的另一方面，提供了一种视频直播装置，包括：

视频流获取单元，被配置为执行获取第一账户的直播视频流，以及，获取第二账户的直播视频流；

图像获取单元，被配置为执行从所述第一账户的直播视频流中提取出第一待识别图像，以及，从所述第二账户的直播视频流中提取出第二待识别图像；

图像拼接单元，被配置为执行拼接所述第一待识别图像和所述第二待识别图像，得到目标图像；

关键点确定单元，被配置为执行根据所述目标图像的多个第一关键点，确定所述第一待识别图像和所述第二待识别图像各自的第二关键点；

特效添加单元，被配置为执行按照所述第一待识别图像的第二关键点，对所述第一待识别图像添加图像特效，得到第一特效化图像，以及，按照所述第二待识别图像的第二关键点，对所述第二待识别图像添加图像特效，得到第二特效化图像；

特效播放单元，被配置为执行播放所述第一账户的特效化直播视频和所述第二账户的特效化直播视频；所述第一账户的特效化直播视频包括所述第一特效化图像；所述第二账户的特效化直播视频包括所述第二特效化图像。

根据本公开实施例的另一方面，提供一种计算机设备，包括：处理器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为执行所述指令，以实现上述方面所述的实施方式中的方法。

据本公开实施例的另一方面，提供一种存储介质，所述存储介质中的指令由计算机设备的处理器执行，使得计算机设备能够执行上述方面所述的实施方式中的方法。

根据本公开实施例的另一方面，提供一种计算机程序产品，包括：计算机程序代码，所述计算机程序代码被计算机运行，使得所述计算机执行上述方面所述的实施方式中的方法。

附图说明

图1是一个实施例的一种图像识别方法的流程示意图；

图2是一个实施例的一种图像识别方法的应用环境图；

图3是一个实施例的一种视频直播的应用场景；

图4是一个实施例的一种视频播放界面的示意图；

图5是一个实施例的一种视频直播过程中添加图像特效的示意图；

图6是一个实施例的一种在视频播放界面添加图像特效的示意图；

图7是一个实施例的一种图像的拼接边缘的示意图；

图8是一个实施例的一种拼接图像的示意图；

图9是一个实施例的一种拼接图像的关键点的示意图；

图10是一个实施例的一种图像的关键点的示意图；

图11是一个实施例的一种根据关键点对图像添加图像特效的示意图；

图12是一个实施例的一种确定图像的关键点步骤的流程图；

图13是一个实施例的一种拼接图像的二维坐标系的示意图；

图14是一个实施例的一种确定第二关键点坐标的示意图；

图15是一个实施例的一种视频直播方法的流程示意图；

图16是一个实施例的一种直播系统的结构框图；

图17是一个实施例的一种视频直播方法的流程示意图；

图18是一个实施例的一种图像识别装置的结构框图；

图19是一个实施例的一种视频直播装置的结构框图；

图20是一个实施例的一种计算机设备的结构框图。

具体实施方式

为了使本公开的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本公开进行进一步详细说明。应当理解，此处描述的实施例仅仅用以解释本公开，并不用于限定本公开。

在一些实施例中，如图1所示，提供了一种图像识别方法。本实施例提供的图像识别方法，应用于如图2所示的应用环境中。该应用环境中包括有第一终端21、第二终端22和服务器23。其中，第一终端21和第二终端22包括但不限于个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器23是独立的服务器或者由多个服务器组成的服务器集群来实现。

在一些实施例中，上述的图像识别方法应用于在视频通话、视频会议、视频直播等的视频通讯的应用场景。例如，上述的图像识别方法应用在视频通讯过程中对视频中的图像添加图像特效的应用场景。再如，上述的图像识别方法应用于对多个图像进行识别的应用场景。

例如，参考图3，提供了一个实施例的一种视频直播的应用场景。如图所示，第一用户通过第一终端21在视频直播平台登录第一账户，通过第一终端21自拍，第一终端21将拍摄得到的视频流发送至服务器23，服务器23将第一账户的视频流发送至第二终端22。第二用户通过第二终端22在视频直播平台登录第二账户，通过第二终端22自拍，第二终端22将拍摄得到的视频流发送至服务器23，服务器23将第二账户的视频流发送至第一终端21。由此，第一终端21和第二终端22均得到了第一账户和第二账户各自的视频流，也即，第一终端21和第二终端22均得到了两路视频流。第一终端21和第二终端22分别根据两路视频流进行视频直播。第一用户和第二用户均能够在终端上观看到自身和对方的直播画面。此外，服务器23能够将两路视频流发送至其他用户的第三终端24，其他用户通过第三终端24观看第一用户和第二用户的直播画面。

参考图4，提供了一个实施例的一种视频播放界面的示意图。如图所示，在第一终端21、第二终端22和第三终端24的视频播放界面上，同时播放第一账户的视频流和第二账户的视频流。上述的视频直播的应用场景中，进行视频直播的第一用户和第二用户能够实时观看到自身和对方的直播画面，通过语音和文字等至少一种方式进行交流，自身和对方的直播画面以及双方交流的内容，还能够被其他用户实时观看，因此该应用场景通常也称为“直播连麦”。

在视频直播过程中，用户能够对视频直播中的人物、背景等内容添加图像特效。参考图5，提供了一个实施例的一种视频直播过程中添加图像特效的示意图。如图5所示，第二用户通过第二终端22提交一个特效指令，视频播放界面上的第一账户和第二账户的画面中，针对所显示的人脸添加有表情特效。

为了添加图像特效，第二终端22需要创建图像识别实例，以对视频流中的连续多帧图像进行图像识别，识别出图像中的关键点，根据图像中的关键点添加图像特效，得到添加有图像特效的图像并显示。对于上述的视频直播的应用场景中，由于存在有两路视频流，因此，第二终端22需要对两路视频流中的图像分别创建图像识别实例，以分别将图像输出至图像识别模型，通过图像识别模型输出两路视频流中的图像的关键点。

然而，执行图像识别实例以通过图像识别模型进行图像识别需要耗费第二终端22的处理资源，为了保证视频直播的实时性，则需要同时执行多个图像识别实例同时进行图像识别，因此，相关技术中的图像识别方法需要耗费终端大量的处理资源。对于性能较差的终端而言，执行多个图像识别实例同时对多路视频流进行图像识别，则可能会由于处理资源不足而导致画面卡顿、延迟等的问题。

针对于上述问题，申请人对相关技术中的图像识别方法进行了深入研究，申请人发现，第二终端22创建图像识别实例后，第二终端22则按照图像识别实例执行图像识别处理，将图像输入至图像识别模型，通过图像识别模型进行图像识别处理时，第二终端22则会对整个图像中的每个像素点按照一定的顺序进行扫描处理，每次扫描处理会耗费终端较多的处理资源。因此，申请人提出了一种新的图像识别方法，将该图像识别方法应用于上述的应用场景中，能够通过单个图像识别实例完成图像识别，降低了对终端的处理资源的耗费，提升了图像识别的效率。

本实施例中的一种图像识别方法，以该方法应用于图2中的第二终端22为例进行说明，包括以下步骤：

在步骤S11中，获取多个待识别图像。

其中，待识别图像为当前将要进行图像识别以得到关键点的图像。

在一些实施例中，图像处理方法应用在视频通讯的应用场景中；第一终端21和第二终端22中安装有视频应用，第一用户通过第一终端21的视频应用，登录视频应用平台的第一账户，第二用户通过第二终端22的视频应用，登录视频应用平台的第二账户。第一终端21和第二终端22通过服务器23进行连接，以进行视频通讯。第一用户通过第一终端21进行拍摄，得到第一账户的视频流，通过服务器23将第一账户的视频流转发至第二终端22；并且，第二用户通过第二终端22进行拍摄，得到第二账户的视频流。由此，第二终端22得到了两路视频流。

第二终端22的视频应用提供一个视频播放界面，在该视频播放界面上，根据第一账户和第二账户各自的视频流中的图像进行视频播放。例如，参考图4，第二终端22的视频播放界面上，划分为左右两边的分界面，左边分界面显示第一账户的视频流中的连续多帧的图像，右边分界面显示第二账户的视频流中的连续多帧的图像。

第二终端22的视频应用提供特效添加入口，供用户请求添加图像特效。例如，参考图6，在视频播放界面上设置一个“人脸表情特效”的虚拟按钮51，用户点击该虚拟按钮51，则能够针对图像中的人脸添加表情特效的图像特效。响应于用户请求添加图像特效，第二终端22从两路视频流提取图像。由于每一路视频流包含有多个图像，第二终端22分别从两路视频流中提取出一帧或连续多帧的图像，由此得到了第一账户的图像和第二账户的图像。在本公开实施例中，将第一账户的图像和第二账户的图像作为上述的多个待识别图像。

在步骤S12中，拼接多个待识别图像，得到目标图像。

其中，目标图像为多个待识别图像进行拼接后得到的图像。

在一些实施例中，第二终端22将从两路视频流分别提取出的待识别图像进行拼接，将拼接得到的图像作为上述的目标图像。

拼接图像的实现方式有多种。在一些实施例中，对于每个待识别图像，第二终端22在该待识别图像的多条图像边缘中，选取其中一条图像边缘作为拼接边缘，将多个待识别图像按照拼接边缘进行拼接，使得每个待识别图像的拼接边缘重合，从而完成多个待识别图像的拼接。

在一些实施例中，第二终端22将多个待识别图像进行左右拼接。例如，对于两个待识别图像，选取其中一张图像右侧的图像边缘为拼接边缘，选取另一张图像左侧的图像边缘为拼接边缘，按照两个图像各自的拼接边缘进行拼接。

参考图7，提供了一个实施例的一种待识别图像的拼接边缘的示意图。如图所示，当前存在有两个待识别图像，分别是从第一账户的视频流和第二账户的视频中所提取出的图像61和图像62。选取图像61右侧的图像边缘作为拼接边缘，选取图像62左侧的图像边缘作为拼接边缘，根据图像61和图像62的拼接边缘进行拼接。

参考图8，提供了一个实施例的一种拼接图像的示意图。如图所示，根据图像61和图像62的拼接边缘进行拼接后，得到由图像61和图像62组成的目标图像63。

在一些实施例中，第二终端22将多个待识别图像进行上下拼接。例如，第二终端22选取一个待识别图像的上侧图像边缘作为拼接边缘，选取另一个待识别图像的下侧的图像边缘作为拼接边缘，根据待识别图像的上下侧的拼接边缘进行拼接。

在一些实施例中，第二终端22首先生成一张空白图像，将多个待识别图像添加至空白图像，将添加有多个待识别图像的图像作为上述的目标图像。

在一些实施例中，第二终端22采用多种拼接方式将多个待识别图像拼接为上述的目标图像，本公开对拼接方式不作限制。

在一些实施例中，每一个待识别图像实质上由像素数组组成，待识别图像的每个像素点均具有对应的像素值和像素坐标。将多个待识别图像拼接为目标图像，实质上是根据待识别图像中的像素数组，生成新的代表目标图像的像素数组。将多个待识别图像拼接为拼接图像，即是对像素数组中的像素值和像素坐标进行更改。

在步骤S13中，将目标图像输入图像识别模型，得到目标图像的第一关键点。

其中，第一关键点为目标图像中具有特定特征的像素点。第一关键点为目标图像中的目标对象的任一部位的关键点。例如，第一关键点为人脸关键点或者五官关键点等。

在一些实施例中，第二终端22创建用于对目标图像进行图像识别的图像识别实例，第二终端22执行图像识别实例，以实现将目标图像输入至图像识别模型，第二终端22则按照图像识别实例扫描目标图像中的各个像素点，判断某个像素点是否为关键点。

第二终端22通过图像识别模型，识别得到目标图像中的关键点，作为上述的第一关键点。第二终端22根据目标图像中的第一关键点，确定第一关键点在以目标图像构建的二维坐标系中的像素坐标。

参考图9，提供了一个实施例的一种第一目标图像的关键点的示意图。如图所示，经过图像识别，得到第一图像63中具有人脸轮廓特征的关键点64。

在步骤S14中，根据目标图像的第一关键点，确定每个待识别图像各自的第二关键点。

在一些实施例中，第二终端22利用目标图像的第一关键点，分别确定每个待识别图像各自的一个或多个像素点为关键点，得到上述的第二关键点。例如，第二终端22得到目标图像的第一关键点后，确定目标图像的每个第一关键点在每个待识别图像中所对应的像素点，将目标图像的每个第一关键点在每个待识别图像中所对应的像素点，作为每个待识别图像中的第二关键点。

参考图10，提供了一个实施例的一种每个待识别图像的第二关键点的示意图。如图所示，第二终端22确定目标图像63的第一关键点64之后，则确定图像61和图像62各自的第二关键点65。

在一些实施例中，第二终端22在得到每个待识别图像各自的第二关键点之后，则第二终端22根据每个待识别图像各自的第二关键点，对每个待识别图像添加图像特效，显示添加有图像特效的图像。

参考图11，提供了一个实施例的一种根据第二关键点对待识别图像添加图像特效的示意图。如图所示，第二终端22在得到图像61和图像62中具有人脸轮廓特征的第二关键点65之后，在人脸上添加表情特效。

第二终端22根据目标图像的第一关键点确定每个待识别图像各自的第二关键点的实现方式有多种。

在一些实施例中，第二终端22在得到目标图像之后，记录待识别图像中各个像素点在目标图像中所对应的像素点。在得到目标图像的第一关键点之后，确定目标图像的第一关键点在每个待识别图像中所对应的像素点，由此得到待识别图像的第二关键点。

在一些实施例中，第二终端22首先确定待识别图像中的至少一个像素点作为基准像素点，例如，将待识别图像中处于图像端点的像素点作为基准像素点，记录该基准像素点在以待识别图像构建的二维坐标系中的像素坐标，作为拼接前基准像素坐标。在得到目标图像之后，第二终端22确定该基准像素点在以目标图像构建的二维坐标系中的像素坐标，作为拼接后基准像素坐标。第二终端22计算拼接前基准像素坐标与拼接后基准像素坐标之间的坐标差值，作为坐标转换参数。在得到目标图像的第一关键点之后，第二终端22根据第一关键点在目标图像中的像素坐标和上述的坐标转换参数，将第一关键点在目标图像中的像素坐标转换为对应的像素点在待识别图像中的像素坐标，转换后的像素坐标所对应的像素点，即为待识别图像上的第二关键点，由此得到待识别图像的第二关键点。

当然，第二终端22还能够采用其他方式根据目标图像的第一关键点确定每个待识别图像的第二关键点。

在一些实施例中，第二终端22执行图像识别实例，则会将目标图像输入至图像识别模型，图像识别模型在识别目标图像的过程，实质上是第二终端22对整个图像中的每个像素点进行扫描的处理过程，对每个图像的扫描处理会耗费终端较多的处理资源。上述的图像识别方法，将多个图像拼接为目标图像，将目标图像输入至图像识别模型，实质上第二终端只需要对目标图像进行单次的扫描处理，而无须分别对多个待识别图像进行多次扫描处理，由此，节省了扫描处理所需消耗的处理资源。

上述的图像识别方法中，通过获取多个待识别图像，将多个待识别图像拼接为目标图像，将目标图像输入至图像识别模型，得到目标图像的第一关键点，根据第一关键点确定多个待识别图像各自的第二关键点，由此，只需要将目标图像输入至图像识别模型即能够实现对多个待识别图像的图像识别，得到多个待识别图像各自的关键点，而无须针对多个待识别图像分别执行多个图像识别实例，将多个待识别图像分别输入至图像识别模型，以对多个待识别图像分别识别出关键点，从而，节省了第二终端22进行图像识别所需的处理资源，解决了相关技术中的图像识别方法严重耗费终端处理资源的问题。

而且，将上述的图像识别方法应用于视频通讯时添加图像特效的应用场景时，使得第二终端22在识别图像的关键点以添加图像特效时，降低了处理资源的耗费。由于降低了处理资源的消耗，避免第二终端22由于处理资源不足而导致视频通讯的画面卡顿、延迟等的问题。

如图12所示，在一些实施例中，提供了一种确定图像的关键点步骤的流程图，第一关键点在目标图像上的像素坐标为第一关键点坐标，步骤S14，包括：

S121，确定第一关键点坐标对应的坐标转换参数；坐标转换参数为用于将第一关键点坐标转换成在待识别图像上确定第二关键点的坐标的参数。

其中，第一关键点坐标对应的坐标转换参数可以为第一关键点对应的待识别图像的坐标转换参数，该坐标转换参数为待识别图像与目标图像之间进行像素点坐标转换的参数。相应的，本步骤包括：对于每个第一关键点，确定第一关键点对应的待识别图像，确定该待识别图像的坐标转换参数。

在一些实施例中，第二终端22得到了第一关键点之后，确定第一关键点在目标图像上的像素坐标，作为上述的第一关键点坐标。

在一些实施例中，为了确定第一关键点在目标图像上的像素坐标，首先根据目标图像构建二维坐标系，目标图像上的每个像素点，在该二维坐标系中均具有对应的像素坐标。

图13提供了一个实施例的一种目标图像的二维坐标系的示意图。如图所示，以目标图像左下端的端点作为二维坐标系的原点O，以目标图像下侧的水平边缘为X轴，以目标图像左侧的垂直边缘为Y轴，由此构建出目标图像的二维坐标系。目标图像中的每个第一关键点64在该二维坐标系中均具有对应的第一关键点坐标(X1，Y1)。

第二终端22确定一个或多个的第一关键点坐标之后，确定该第一关键点坐标所对应的坐标转换参数。

在一些实施例中，第二终端22在将多个待识别图像拼接为目标拼接之后，待识别图像的像素点在待识别图像上的像素坐标，会被改变为该像素点在目标图像上的像素坐标，为了根据某个第一关键点在目标图像中的像素坐标确定该第一关键点在待识别图像上的像素坐标，则需要利用坐标转换参数，将第一关键点在目标图像中的像素坐标转换为第一关键点在待识别图像上的像素坐标。

上述的坐标转换参数是在得到目标图像之后，根据待识别图像的像素点在待识别图像上的像素坐标与该像素点在目标图像上的像素坐标之间的差异得到。

例如，某个像素点在待识别图像上的像素坐标为(5，10)，该像素点在目标图像上的像素坐标为(15，10)，由此得到待识别图像的像素点在待识别图像上的像素坐标与该像素点在目标图像上的像素坐标之间的坐标差值为(10，0)，将该坐标差值作为上述的坐标转换参数。

由于在进行图像拼接之后，不同像素点在待识别图像上的像素坐标与该像素点在目标图像上的像素坐标之间的差异也不同，因此，根据第一关键点坐标，确定与其对应的坐标转换参数，以便按照对应的坐标转换参数进行坐标转换。

S122，按照第一关键点坐标对应的坐标转换参数，将第一关键点坐标转换为第二关键点坐标。

在一些实施例中，第一关键点坐标对应的坐标转换参数为待识别图像的坐标转换参数，则本步骤包括：按照待识别图像的坐标转换参数，将第一关键点坐标转换为第二关键点坐标。

在一些实施例中，第二终端22得到第一关键点坐标对应的坐标转换参数，按照该坐标转换参数将第一关键点坐标转换为第二关键点坐标。通过坐标转换参数，将目标图像上的关键点的像素坐标，还原为待识别图像上的关键点的像素坐标。

S123，将待识别图像中处于第二关键点坐标的像素点，作为第二关键点。

在一些实施例中，第二终端22确定第二关键点坐标之后，则在待识别图像上查找处于第二关键点坐标的像素点，作为待识别图像的第二关键点，然后标记该第二关键点。

图14提供了一个实施例的一种确定第二关键点坐标的示意图。假设目标图像63的第一关键点64的第一关键点坐标为(15，10)，坐标转换参数为一个坐标差值(10，0)，将第一关键点坐标(15，10)减去坐标差值(10，0)，得到第二关键点坐标(5，10)，在图像62查找处于第二关键点坐标(5，10)的像素点，得到第二关键点65。

上述的图像识别方法中，通过首先确定第一关键点坐标对应的坐标转换参数，按照坐标转换参数将第一关键点坐标转换为第二关键点坐标，最后将待识别图像中处于第二关键点坐标的像素点，作为待识别图像的第二关键点，由此，通过少量的坐标转换参数，即可根据目标图像的多个第一关键点确定每个待识别图像各自的第二关键点，而无须针对待识别图像的像素点与目标图像的像素点逐一建立对应关系，进一步节省了第二终端22的处理资源。

在一些实施例中，目标图像包括多个图像区域，多个图像区域分别具有对应的待识别图像，步骤S121包括：

在目标图像中的多个图像区域中，确定第一关键点坐标在目标图像中所处的目标图像区域；根据目标图像区域对应的待识别图像，确定第一关键点坐标对应的坐标转换参数。

在一些实施例中，在将多个待识别图像拼接为目标图像时，第二终端22根据每个待识别图像中的像素点的像素坐标，确定待识别图像的图像边界，基于待识别图像的图像边界，对拼接多个待识别图像后得到的目标图像进行划分，得到目标图像中的多个图像区域。得到目标图像的第一关键点之后，第二终端22首先确定第一关键点坐标在目标图像中所处的图像区域，作为上述的目标图像区域。然后，第二终端22确定目标图像区域所对应的待识别图像，根据目标图像区域所对应的待识别图像，确定第一关键点坐标对应的坐标转换参数。其中，第二终端22将目标图像区域所对应的待识别图像，作为第一关键点坐标对应的坐标转换参数。

上述的图像识别方法中，通过根据第一关键点在目标图像上所处的图像区域，确定第一关键点所对应的坐标转换参数，无须对目标图像上每个像素点记录对应的坐标转换参数，节省了进行图像识别所需的处理资源，降低了终端消耗，提升了图像识别效率。

在一些实施例中，在步骤S12之后，还包括：

根据待识别图像中的像素点的像素坐标，确定待识别图像的图像边界；

确定待识别图像的图像边界在目标图像上的像素坐标，得到图像区域划分坐标；

根据图像区域划分坐标，将目标图像划分为分别与多个待识别图像对应的多个图像区域。

在一些实施例中，第二终端22根据待识别图像中的像素点的像素坐标，判断像素点是否处于待识别图像的图像边界，从而确定出在待识别图像的图像边界。然后，第二终端22查找待识别图像的图像边界在目标图像上的像素坐标，从而得到图像区域划分坐标，基于该图像区域划分坐标，将目标图像划分为若干个图像区域，每个图像区域均具有对应的待识别图像。

上述的图像识别方法中，通过待识别图像的像素点的像素坐标确定待识别图像的图像边界，利用图像边界在目标图像上确定出图像区域划分坐标，基于图像区域划分坐标，将目标图像划分出分别与多个待识别图像对应的图像区域，从而通过便捷的方式得到目标图像中分别与各个待识别图像对应的图像区域，提升了图像识别效率。

在一些实施例中，在步骤S12之后，还包括：

确定待识别图像中的至少一个像素点，为基准像素点；确定基准像素点在待识别图像上的像素坐标，得到拼接前基准像素坐标，以及，确定基准像素点在目标图像上的像素坐标，得到拼接后基准像素坐标；基于拼接后基准像素坐标与拼接前基准像素坐标，确定坐标转换参数；记录待识别图像与坐标转换参数的对应关系。

在一些实施例中，第二终端22将待识别图像中任意的一个或多个像素点，作为上述的基准像素点。例如，第二终端22将待识别图像中处于端点的像素点作为上述的基准像素点。

然后，第二终端22确定该基准像素点在待识别图像上的像素坐标，作为拼接前基准像素坐标，以及，确定该基准像素点在目标图像上的像素坐标，作为拼接后基准像素坐标。

最后，基于拼接后基准像素坐标与拼接前基准像素坐标，确定上述的坐标转换参数，记录下待识别图像与该坐标转换参数之间的对应关系。

在一些实施例中，将拼接后基准像素坐标减去拼接前基准像素坐标所得到的差值，作为坐标转换参数；或者，

将拼接前基准像素坐标减去拼接后基准像素坐标的差值，作为坐标转换参数。

在一些实施例中，步骤S122包括：

在该坐标转换参数为拼接后基准像素坐标减去拼接前基准像素坐标得到的差值的情况下，将第一关键点坐标减去坐标转换参数，得到第二关键点坐标。在该坐标转换参数为拼接前基准像素坐标减去拼接后基准像素坐标得到的差值的情况下，将第一关键点坐标加上坐标转换参数，得到第二关键点坐标

例如，某个第一关键点在目标图像上的第一关键点坐标为(20，20)，该第一关键点对应的坐标转换参数为坐标差值(10，0)，因此，将第一关键点坐标(20，20)减去坐标差值(10，0)，得到第二关键点坐标(10，20)，将在待识别图像上处于第二关键点坐标(10，20)的像素点，作为第二关键点。由此，利用坐标转换参数，根据目标图像的第一关键点得到图像的第二关键点。

在一些实施例中，步骤S12包括：

对多个待识别图像进行缩放，得到缩放后图像；多个缩放后图像的图像尺寸相同；拼接多个缩放后图像，得到目标图像。

在一些实施例中，第二终端22分别对多个待识别图像进行缩放，以调整待识别图像的图像尺寸，得到图像尺寸相同的多个图像，作为上述的缩放后图像。第二终端22将多个缩放后图像进行拼接，得到上述的目标图像。

在一些实施例中，第二终端22对多个待识别图像中的全部图像进行缩放，或者对多个待识别图像中的部分图像进行缩放处理。例如，一个图像A的图像尺寸为720像素*1280像素，另一个图像B的图像尺寸为540像素*960像素，将另一个图像B进行缩放，得到720像素*1280像素的的缩放后图像B`，将图像A与缩放后图像B`进行拼接，得到图像尺寸为1440像素*1280像素的目标图像。

上述的图像识别方法，通过将待识别图像缩放为图像尺寸大小相同的缩放后图像，使得终端将相同尺寸的图像拼接为目标图像，降低了图像拼接处理所消耗的资源。

在一些实施例中，步骤S11包括：

接收多路视频流；多路视频流分别来源于第一账户和第二账户；

从第一账户的视频流中提取出第一待识别图像，以及，从第二账户的视频流中提取出第二待识别图像；

在根据目标图像的第一关键点，确定每个待识别图像各自的第二关键点之后，还包括：

按照第一待识别图像的第二关键点，对第一待识别图像添加图像特效，得到第一特效化图像，以及，按照第二待识别图像的第二关键点，对第二待识别图像添加图像特效，得到第二特效化图像；

播放第一账户的特效化直播视频和第二账户的特效化直播视频；第一账户的特效化直播视频包括第一特效化图像；第二账户的特效化直播视频包括第二特效化图像。

在一些实施例中，第二终端22接收到第一账户和第二账户各自的视频流，从第一账户和第二账户各自的视频流分别提取出图像，得到第一待识别图像和第二待识别图像。

通过对第一待识别图像和第二待识别图像进行拼接，得到目标图像。创建以及执行图像识别实例，从而将目标图像输入至图像识别模型中，图像识别模型输出目标图像的第一关键点，第二终端22根据第一关键点得到第一待识别图像和第二待识别图像各自的第二关键点。

第二终端22根据第一待识别图像的第二关键点，对第一待识别图像添加图像特效，得到上述的第一特效化图像。同样地，第二终端22根据第二待识别图像的第二关键点，对第二待识别图像添加图像特效，得到上述的第二特效化图像。

参考图11，根据第一待识别图像61和第二待识别图像62各自的具有人脸轮廓特征的第二关键点65，在待识别图像中的人脸添加表情特效。

对于视频流中的多帧连续的待识别图像，重复执行上述的多个步骤，第二终端22能够得到多帧连续的特效化图像，依次显示多帧连续的特效化图像，即播放包括特效化图像的特效化直播视频。

在一些实施例中，如图15所示，还提供了一种视频直播方法，以该方法应用于图2中的第二终端22为例进行说明，包括以下步骤：

S151，获取第一账户的直播视频流，以及，获取第二账户的直播视频流；

S152，从第一账户的直播视频流中提取出第一待识别图像，以及，从第二账户的直播视频流中提取出第二待识别图像；

S153，拼接第一待识别图像和第二待识别图像，得到目标图像；

S154，将目标图像输入图像识别模型，得到目标图像的多个第一关键点；

S155，根据目标图像的多个第一关键点，确定第一待识别图像和第二待识别图像各自的第二关键点；

S156，按照第一待识别图像的第二关键点，对第一待识别图像添加图像特效，得到第一特效化图像，以及，按照第二待识别图像的第二关键点，对第二待识别图像添加图像特效，得到第二特效化图像；

S157，播放第一账户的特效化直播视频和第二账户的特效化直播视频；第一账户的特效化直播视频包括第一特效化图像；第二账户的特效化直播视频包括第二特效化图像。

由于上述各个步骤的实现方式在前述实施例中已有详细说明，在此不再赘述。

上述的视频直播额方法中，通过获取第一账户和第二账户各自的直播视频流，并分别从中提取出第一待识别图像和第二待识别图像，将第一待识别图像和第二待识别图像拼接为目标图像，将目标图像输入至图像识别模型，得到拼目标图像的第一关键点，根据第一关键点确定待识别图像各自的第二关键点，由此，只需要将目标图像输入至图像识别模型即能够实现对多个待识别图像的图像识别，得到多个待识别图像各自的关键点，而无须针对多个待识别图像分别执行多个图像识别实例，将多个待识别图像分别输入至图像识别模型，以对多个待识别图像分别识别出关键点，从而，节省了终端进行图像识别所需的处理资源，解决了相关技术中的图像识别方法严重耗费终端处理资源的问题。

而且，将上述的图像识别方法应用于视频通讯时添加图像特效的应用场景时，使得终端在识别图像的关键点以添加图像特效时，降低了处理资源的耗费。由于降低了处理资源的消耗，避免终端由于处理资源不足而导致视频通讯的画面卡顿、延迟等的问题。

在一些实施例中，如图16所示，还提供了一种直播系统1600，包括：

第一终端21和第二终端22；

第一终端21，用于生成第一账户的直播视频流，发送第一账户的直播视频流至第二终端22；

在一些实施例中，第一终端21通过服务器23发送第一账户的直播视频流至第二终端22。

第二终端22，用于生成第二账户的直播视频流；

第二终端22，还用于从第一账户的直播视频流中提取出第一待识别图像，以及，从第二账户的直播视频流中提取出第二待识别图像；

第二终端22，还用于将拼接图像输入图像识别模型，得到目标图像的多个第一关键点；

第二终端22，还用于根据目标图像的多个第一关键点，确定第一待识别图像和第二待识别图像各自的第二关键点；

第二终端22，还用于按照第一待识别图像的第二关键点，对第一待识别图像添加图像特效，得到第一特效化图像，以及，按照第二待识别图像的第二关键点，对第二待识别图像添加图像特效，得到第二特效化图像；

第二终端22，还用于播放第一账户的特效化直播视频和第二账户的特效化直播视频；第一账户的特效化直播视频包括第一特效化图像；第二账户的特效化直播视频包括第二特效化图像。

由于上述第一终端21和第二终端22所执行步骤的实现方式在前述实施例中已有详细说明，在此不再赘述。

为了便于本领域技术人员深入理解本公开实施例，如图17所示，以在一个视频直播流程中进行图像处理为例进行说明，包括以下步骤：

S1701，获取第一账户的视频流和第二账户的视频流；

S1702，从第一账户的视频流和第二账户的视频流中分别提取出图像，得到第一待识别图像和第二待识别图像；

S1703，对第一待识别图像和第二待识别图像进行缩放，得到图像尺寸相同的第一待识别图像和第二待识别图像；

S1704，将第一待识别图像和第二待识别图像进行拼接，得到目标图像；

S1705，分别确定第一待识别图像和第二待识别图像各自的基准像素点；

S1706，确定第一待识别图像和第二待识别图像各自的基准像素点在第一图像和第二图像上的拼接前基准像素坐标，以及，确定第一待识别图像和第二待识别图像各自的基准像素点在拼接图像上的拼接后基准像素坐标；

S1707，计算第一待识别图像和第二待识别图像各自的拼接后基准像素坐标与拼接前基准像素坐标之间的差值，得到第一坐标转换参数和第二坐标转换参数；

S1708，建立第一待识别图像与第一坐标转换参数的对应关系，以及，建立第二待识别图像与第二坐标转换参数的对应关系；

S1709，创建以及执行图像识别实例，将目标图像输入至图像识别模型，得到目标图像中的多个第一关键点；

S1710，根据多个第一关键点在目标图像中分别所处的图像区域，确定各个第一关键点分别对应的第一待识别图像或第二待识别图像；

S1711，根据第一关键点对应的第一待识别图像或第二待识别图像，确定对应的第一坐标转换参数或第二坐标转换参数；

S1712，将第一关键点坐标减去第一坐标转换参数或第二坐标转换参数，得到第一待识别图像或第二待识别图像的第二关键点坐标；

S1713，将第一待识别图像或第二待识别图像中处于第二关键点坐标的像素点，作为第一待识别图像或第二待识别图像的第二关键点；

S1714，按照第一待识别图像和第二待识别图像各自的第二关键点，对第一待识别图像和第二待识别图像添加图像特效，得到第一特效化图像和第二特效化图像；

S1715，播放第一账户的包括第一特效化图像的特效化直播视频，以及，播放第二账户的包括第二特效化图像的特效化直播视频。

在一些实施例中，虽然本公开的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤以其它的顺序执行。而且，本公开的流程图的至少一部分步骤包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一些实施例中，如图18所示，提供了一种图像识别装置1800，包括：

图像获取单元1801，被配置为执行获取多个待识别图像；

图像拼接单元1802，被配置为执行拼接多个待识别图像，得到目标图像；

关键点识别单元1803，被配置为执行将目标图像输入图像识别模型，得到目标图像的多个第一关键点；

关键点确定单元1804，被配置为执行根据目标图像的多个第一关键点，确定每个待识别图像各自的第二关键点。

在一些实施例中，第一关键点在目标图像上的像素坐标为第一关键点坐标，关键点确定单元1804，被配置为执行：

确定第一关键点坐标对应的坐标转换参数；坐标转换参数为用于将第一关键点坐标转换成在待识别图像上确定第二关键点的坐标的参数；

按照第一关键点坐标对应的坐标转换参数，将第一关键点坐标转换为第二关键点坐标；

将待识别图像中处于第二关键点坐标的像素点，作为第二关键点。

在一些实施例中，目标图像包括多个图像区域，多个图像区域分别具有对应的待识别图像，关键点确定单元1804，被配置为执行：

在目标图像中的多个图像区域中，确定第一关键点坐标所处的目标图像区域；

将目标图像区域对应的待识别图像，确定为第一关键点坐标对应的待识别图像。

在一些实施例中，装置还包括：

划分单元，被配置为执行根据待识别图像中的像素点的像素坐标，确定待识别图像的图像边界；确定待识别图像的图像边界在目标图像上的像素坐标，得到图像区域划分坐标；根据图像区域划分坐标，将目标图像划分为分别与多个待识别图像对应的多个图像区域。

在一些实施例中，关键点确定单元1804，被配置为执行：

确定待识别图像中的至少一个像素点，为基准像素点；

确定基准像素点在待识别图像上的像素坐标，得到拼接前基准像素坐标，以及，确定基准像素点在目标图像上的像素坐标，得到拼接后基准像素坐标；

基于拼接后基准像素坐标与拼接前基准像素坐标，确定坐标转换参数。

在一些实施例中，关键点确定单元1804，被配置为执行：

将拼接后基准像素坐标减去拼接前基准像素坐标所得到的差值，作为坐标转换参数；或者，

在一些实施例中，关键点确定单元1804，被配置为执行：

在该坐标转换参数为拼接后基准像素坐标减去拼接前基准像素坐标得到的差值的情况下，将第一关键点坐标减去坐标转换参数，得到第二关键点坐标；

在该坐标转换参数为拼接前基准像素坐标减去拼接后基准像素坐标得到的差值的情况下，将第一关键点坐标加上坐标转换参数，得到第二关键点坐标。

在一些实施例中，图像拼接单元1802，还被配置为执行：

对多个待识别图像中的至少一个待识别图像进行缩放处理，缩放处理用于使得多个待识别图像的图像尺寸相同。

在一些实施例中，如图19所示，提供了一种视频直播装置1900，包括：

视频流获取单元1901，被配置为执行获取第一账户的直播视频流，以及，获取第二账户的直播视频流；

图像获取单元1902，被配置为执行从第一账户的直播视频流中提取出第一待识别图像，以及，从第二账户的直播视频流中提取出第二待识别图像；

图像拼接单元1903，被配置为执行拼接第一待识别图像和第二待识别图像，得到目标图像；

关键点识别单元1904，被配置为执行将目标图像输入图像识别模型，得到目标图像的多个第一关键点；

关键点确定单元1905，被配置为执行根据目标图像的多个第一关键点，确定第一待识别图像和第二待识别图像各自的第二关键点；

特效添加单元1906，被配置为执行按照第一待识别图像的第二关键点，对第一待识别图像添加图像特效，得到第一特效化图像，以及，按照第二待识别图像的第二关键点，对第二待识别图像添加图像特效，得到第二特效化图像；

特效播放单元1907，被配置为执行播放第一账户的特效化直播视频和第二账户的特效化直播视频；第一账户的特效化直播视频包括第一特效化图像；第二账户的特效化直播视频包括第二特效化图像。

关于图像识别装置和视频直播装置的限定参见上文中对于图像识别和视频直播方法的限定，在此不再赘述。上述图像识别装置和视频直播装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块能够以硬件形式内嵌于或独立于计算机设备中的处理器中，也能够以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

上述提供的图像识别装置和视频直播装置可用于执行上述任意实施例提供的图像识别方法和视频直播方法，具备相应的功能和有益效果。

本公开实施例示出的一种计算机设备，该计算机设备包括处理器；

用于存储处理器可执行指令的存储器；

其中，处理器被配置为执行指令，以实现如下步骤：

获取多个待识别图像；

拼接多个待识别图像，得到目标图像；

将目标图像输入图像识别模型，得到目标图像的多个第一关键点；

根据目标图像的多个第一关键点，确定每个待识别图像各自的第二关键点。

在一些实施例中，第一关键点在目标图像上的像素坐标为第一关键点坐标，处理器被配置为执行指令，以实现如下步骤：

在一些实施例中，处理器被配置为执行指令，以实现如下步骤：

确定待识别图像中的至少一个像素点，为基准像素点；

对多个待识别图像中的至少一个待处理图像进行缩放，得到缩放后图像；多个缩放后图像的图像尺寸相同；

拼接多个缩放后图像，得到目标图像。

该计算机设备包括处理器；

用于存储处理器可执行指令的存储器；

其中，处理器被配置为执行指令，以实现如下步骤：

从第一账户的直播视频流中提取出第一待识别图像，以及，从第二账户的直播视频流中提取出第二待识别图像；

拼接第一待识别图像和第二待识别图像，得到目标图像；

将目标图像输入图像识别模型，得到目标图像的多个第三关键点；

根据目标图像的多个第三关键点，确定第一待识别图像和第二待识别图像各自的第四关键点；

按照第一待识别图像的第四关键点，对第一待识别图像添加图像特效，得到第一特效化图像，以及，按照第二待识别图像的第四关键点，对第二待识别图像添加图像特效，得到第二特效化图像；

图20是本公开实施例示出的一种计算机设备，该计算机设备提供为终端，其内部结构图如图20所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种图像识别方法和视频直播方法。该计算机设备的显示屏是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置是显示屏上覆盖的触摸层，或者是计算机设备外壳上设置的按键、轨迹球或触控板，或者是外接的键盘、触控板或鼠标等。

本领域技术人员能够理解，图20中示出的结构，仅仅是与本公开方案相关的部分结构的框图，并不构成对本公开方案所应用于其上的计算机设备的限定，计算机设备包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

本公开还提供一种计算机程序产品，包括：计算机程序代码，响应于计算机程序代码被计算机运行，使得计算机执行上述的图像识别方法和视频直播方法。

本领域普通技术人员能够理解实现上述实施例方法中的全部或部分流程，是通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本公开所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

以上实施例的各技术特征能够进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

Claims

一种图像识别方法，包括：

获取多个待识别图像；

拼接多个所述待识别图像，得到目标图像；

将所述目标图像输入图像识别模型，得到所述目标图像的多个第一关键点；

根据所述目标图像的多个第一关键点，确定每个所述待识别图像各自的第二关键点。
根据权利要求1所述的方法，其中，所述第一关键点在所述目标图像上的像素坐标为第一关键点坐标，所述根据所述目标图像的多个第一关键点，确定每个所述待识别图像各自的第二关键点，包括：

确定所述第一关键点坐标对应的坐标转换参数；所述坐标转换参数为用于将所述第一关键点坐标转换成在所述待识别图像上确定所述第二关键点的坐标的参数；

按照所述第一关键点坐标对应的坐标转换参数，将所述第一关键点坐标转换为第二关键点坐标；

将所述待识别图像中处于所述第二关键点坐标的像素点，作为所述第二关键点。
根据权利要求2所述的方法，其特征在于，所述目标图像包括多个图像区域，多个所述图像区域分别具有对应的待识别图像，所述确定所述第一关键点坐标对应的坐标转换参数，包括：

在所述拼接图像中的多个所述图像区域中，确定所述第一关键点坐标在所述拼接图像中所处的目标图像区域；

根据所述目标图像区域对应的待识别图像，确定所述第一关键点坐标对应的坐标转换参数。
根据权利要求3所述的方法，其特征在于，还包括：

根据所述待识别图像中的像素点的像素坐标，确定所述待识别图像的图像边界；

确定所述待识别图像的图像边界在所述目标图像上的像素坐标，得到图像区域划分坐标；

根据所述图像区域划分坐标，将所述目标图像划分为分别与多个所述待识别图像对应的多个所述图像区域。
根据权利要求2所述的方法，其特征在于，所述确定所述第一关键点坐标对应的坐标转换参数，包括：

确定所述待识别图像中的至少一个像素点，为基准像素点；

确定所述基准像素点在所述待识别图像上的像素坐标，得到拼接前基准像素坐标，以及，确定所述基准像素点在所述目标图像上的像素坐标，得到拼接后基准像素坐标；

基于所述拼接后基准像素坐标与所述拼接前基准像素坐标，确定所述坐标转换参数。
根据权利要求5所述的方法，其特征在于，所述基于所述拼接后基准像素坐标与所述拼接前基准像素坐标，确定所述坐标转换参数，包括：

将所述拼接后基准像素坐标减去所述拼接前基准像素坐标所得到的差值，作为所述坐标转换参数；或者，

将所述拼接前基准像素坐标减去所述拼接后基准像素坐标的差值，作为所述坐标转换参数。
根据权利要求6所述的方法，其中，所述按照所述第一关键点坐标对应的坐标转换参数，将所述第一关键点坐标转换为第二关键点坐标，包括：

在所述坐标转换参数为所述拼接后基准像素坐标减去所述拼接前基准像素坐标得到的差值的情况下，将所述第一关键点坐标减去所述坐标转换参数，得到所述第二关键点坐标；

在所述坐标转换参数为拼接前基准像素坐标减去所述拼接后基准像素坐标得到的差值的情况下，将所述第一关键点坐标加上所述坐标转换参数，得到所述第二关键点坐标。
根据权利要求1所述的方法，其中，所述拼接多个所述待识别图像，得到目标图像，包括：

对多个所述待识别图像中的至少一个所述待处理图像进行缩放，得到缩放后图像；多个所述缩放后图像的图像尺寸相同；

拼接多个所述缩放后图像，得到所述目标图像。
一种视频直播方法，包括：

获取第一账户的直播视频流，以及，获取第二账户的直播视频流；

从所述第一账户的直播视频流中提取出第一待识别图像，以及，从所述第二账户的直播视频流中提取出第二待识别图像；

拼接所述第一待识别图像和所述第二待识别图像，得到目标图像；

将所述目标图像输入图像识别模型，得到所述目标图像的多个第一关键点；

根据所述目标图像的多个第一关键点，确定所述第一待识别图像和所述第二待识别图像各自的第二关键点；

按照所述第一待识别图像的第二关键点，对所述第一待识别图像添加图像特效，得到第一特效化图像，以及，按照所述第二待识别图像的第二关键点，对所述第二待识别图像添加图像特效，得到第二特效化图像；

播放所述第一账户的特效化直播视频和所述第二账户的特效化直播视频；所述第一账户的特效化直播视频包括所述第一特效化图像；所述第二账户的特效化直播视频包括所述第二特效化图像。
一种图像识别装置，包括：

图像获取单元，被配置为执行获取多个待识别图像；

图像拼接单元，被配置为执行拼接多个所述待识别图像，得到目标图像；

关键点识别单元，被配置为执行将所述目标图像输入图像识别模型，得到所述目标图像的多个第一关键点；

关键点确定单元，被配置为执行根据所述目标图像的多个第一关键点，确定每个所述待识别图像各自的第二关键点。
根据权利要求10所述的装置，其特征在于，所述第一关键点在所述目标图像上的像素坐标为第一关键点坐标，所述关键点确定单元，被配置为执行：

确定所述第一关键点坐标对应的坐标转换参数；所述坐标转换参数为用于将所述第一关键点坐标转换成在所述待识别图像上确定所述第二关键点的坐标的参数；

按照所述第一关键点坐标对应的坐标转换参数，将所述第一关键点坐标转换为第二关键点坐标；

将所述待识别图像中处于所述第二关键点坐标的像素点，作为所述第二关键点。
根据权利要求11所述的装置，其特征在于，所述目标图像包括多个图像区域，多个所述图像区域分别具有对应的待识别图像，所述关键点确定单元，被配置为执行：

在所述拼接图像中的多个所述图像区域中，确定所述第一关键点坐标在所述拼接图像中所处的目标图像区域；

根据所述目标图像区域对应的待识别图像，确定所述第一关键点坐标对应的坐标转换参数。
根据权利要求12所述的装置，其特征在于，所述装置还包括：

划分单元，被配置为执行根据所述待识别图像中的像素点的像素坐标，确定所述待识别图像的图像边界；确定所述待识别图像的图像边界在所述目标图像上的像素坐标，得到图像区域划分坐标；根据所述图像区域划分坐标，将所述目标图像划分为分别与多个所述待识别图像对应的多个所述图像区域。
根据权利要求11所述的装置，其特征在于，所述关键点确定单元，被配置为执行：

确定所述待识别图像中的至少一个像素点，为基准像素点；

确定所述基准像素点在所述待识别图像上的像素坐标，得到拼接前基准像素坐标，以及，确定所述基准像素点在所述目标图像上的像素坐标，得到拼接后基准像素坐标；

基于所述拼接后基准像素坐标与所述拼接前基准像素坐标，确定所述坐标转换参数。
根据权利要求14所述的装置，其特征在于，所述关键点确定单元，被配置为执行：

将所述拼接后基准像素坐标减去所述拼接前基准像素坐标所得到的差值，作为所述坐标转换参数；或者，

将所述拼接前基准像素坐标减去所述拼接后基准像素坐标的差值，作为所述坐标转换参数。
根据权利要求15所述的装置，其特征在于，所述关键点确定单元，被配置为执行：

在所述坐标转换参数为所述拼接后基准像素坐标减去所述拼接前基准像素坐标得到的差值的情况下，将所述第一关键点坐标减去所述坐标转换参数，得到所述第二关键点坐标；

在所述坐标转换参数为拼接前基准像素坐标减去所述拼接后基准像素坐标得到的差值的情况下，将所述第一关键点坐标加上所述坐标转换参数，得到所述第二关键点坐标。
根据权利要求10所述的装置，其特征在于，所述图像拼接单元，被配置为执行：

对多个所述待识别图像中的至少一个所述待处理图像进行缩放，得到缩放后图像；多个所述缩放后图像的图像尺寸相同；

拼接多个所述缩放后图像，得到所述目标图像。
一种视频直播装置，包括：

视频流获取单元，被配置为执行获取第一账户的直播视频流，以及，获取第二账户的直播视频流；

图像获取单元，被配置为执行从所述第一账户的直播视频流中提取出第一待识别图像，以及，从所述第二账户的直播视频流中提取出第二待识别图像；

图像拼接单元，被配置为执行拼接所述第一待识别图像和所述第二待识别图像，得到目标图像；

关键点识别单元，被配置为执行将所述目标图像输入图像识别模型，得到所述目标图像的多个第三关键点；

关键点确定单元，被配置为执行根据所述目标图像的第三关键点，确定所述第一待识别图像和所述第二待识别图像各自的第四关键点；

特效添加单元，被配置为执行按照所述第一待识别图像的第四关键点，对所述第一待识别图像添加图像特效，得到第一特效化图像，以及，按照所述第二待识别图像的第四关键点，对所述第二待识别图像添加图像特效，得到第二特效化图像；

特效播放单元，被配置为执行播放所述第一账户的特效化直播视频和所述第二账户的特效化直播视频；所述第一账户的特效化直播视频包括所述第一特效化图像；所述第二账户的特效化直播视频包括所述第二特效化图像。
一种计算机设备，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如下步骤：

获取多个待识别图像；

拼接多个所述待识别图像，得到目标图像；

将所述目标图像输入图像识别模型，得到所述目标图像的多个第一关键点；

根据所述目标图像的多个第一关键点，确定每个所述待识别图像各自的第二关键点。
根据权利要求19所述的计算机设备，其中，所述第一关键点在所述目标图像上的像素坐标为第一关键点坐标，所述处理器被配置为执行所述指令，实现如下步骤：

确定所述第一关键点坐标对应的坐标转换参数；所述坐标转换参数为用于将所述第一关键点坐标转换成在所述待识别图像上确定所述第二关键点的坐标的参数；

按照所述第一关键点坐标对应的坐标转换参数，将所述第一关键点坐标转换为第二关键点坐标；

将所述待识别图像中处于所述第二关键点坐标的像素点，作为所述第二关键点。
根据权利要求20所述的计算机设备，其中，所述目标图像包括多个图像区域，多个所述图像区域分别具有对应的待识别图像，所述处理器被配置为执行所述指令，实现如下步骤：

在所述目标图像中的多个所述图像区域中，确定所述第一关键点坐标所处的目标图像区域；

将所述目标图像区域对应的待识别图像，确定为所述第一关键点坐标对应的待识别图像。
根据权利要求21所述的计算机设备，其中，所述处理器被配置为执行所述指令，实现如下步骤：

根据所述待识别图像中的像素点的像素坐标，确定所述待识别图像的图像边界；

确定所述待识别图像的图像边界在所述目标图像上的像素坐标，得到图像区域划分坐标；

根据所述图像区域划分坐标，将所述目标图像划分为分别与多个所述待识别图像对应的多个所述图像区域。
根据权利要求20所述的计算机设备，其中，所述处理器被配置为执行所述指令，实现如下步骤：

确定所述待识别图像中的至少一个像素点，为基准像素点；

确定所述基准像素点在所述待识别图像上的像素坐标，得到拼接前基准像素坐标，以及，确定所述基准像素点在所述目标图像上的像素坐标，得到拼接后基准像素坐标；

基于所述拼接后基准像素坐标与所述拼接前基准像素坐标，确定所述坐标转换参数。
根据权利要求23所述的计算机设备，其中，所述处理器被配置为执行所述指令，实现如下步骤：

将所述拼接后基准像素坐标减去所述拼接前基准像素坐标所得到的差值，作为所述坐标转换参数；或者，

将所述拼接前基准像素坐标减去所述拼接后基准像素坐标的差值，作为所述坐标转换参数。
根据权利要求24所述的计算机设备，其中，所述处理器被配置为执行所述指令，实现如下步骤：

在所述坐标转换参数为所述拼接后基准像素坐标减去所述拼接前基准像素坐标得到的差值的情况下，将所述第一关键点坐标减去所述坐标转换参数，得到所述第二关键点坐标；

在所述坐标转换参数为拼接前基准像素坐标减去所述拼接后基准像素坐标得到的差值的情况下，将所述第一关键点坐标加上所述坐标转换参数，得到所述第二关键点坐标。
根据权利要求19所述的计算机设备，其中，所述处理器被配置为执行所述指令，实现如下步骤：

对多个所述待识别图像中的至少一个所述待处理图像进行缩放，得到缩放后图像；多个所述缩放后图像的图像尺寸相同；

拼接多个所述缩放后图像，得到所述目标图像。
一种计算机设备，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如下步骤：

获取第一账户的直播视频流，以及，获取第二账户的直播视频流；

从所述第一账户的直播视频流中提取出第一待识别图像，以及，从所述第二账户的直播视频流中提取出第二待识别图像；

拼接所述第一待识别图像和所述第二待识别图像，得到目标图像；

将所述目标图像输入图像识别模型，得到所述目标图像的多个第一关键点；

根据所述目标图像的多个第一关键点，确定所述第一待识别图像和所述第二待识别图像各自的第二关键点；

按照所述第一待识别图像的第二关键点，对所述第一待识别图像添加图像特效，得到第一特效化图像，以及，按照所述第二待识别图像的第二关键点，对所述第二待识别图像添加图像特效，得到第二特效化图像；

播放所述第一账户的特效化直播视频和所述第二账户的特效化直播视频；所述第一账户的特效化直播视频包括所述第一特效化图像；所述第二账户的特效化直播视频包括所述第二特效化图像。
一种存储介质，响应于所述存储介质中的指令由计算机设备的处理器执行，使得所述计算机设备能够执行如下步骤：

获取多个待识别图像；

拼接多个所述待识别图像，得到目标图像；

将所述目标图像输入图像识别模型，得到所述目标图像的多个第一关键点；

根据所述目标图像的多个第一关键点，确定每个所述待识别图像各自的第二关键点。
一种存储介质，所述存储介质中的指令由计算机设备的处理器执行，使得所述计算机设备能够执行如下步骤：

获取第一账户的直播视频流，以及，获取第二账户的直播视频流；

从所述第一账户的直播视频流中提取出第一待识别图像，以及，从所述第二账户的直播视频流中提取出第二待识别图像；

拼接所述第一待识别图像和所述第二待识别图像，得到目标图像；

将所述目标图像输入图像识别模型，得到所述目标图像的多个第一关键点；

根据所述目标图像的多个第一关键点，确定所述第一待识别图像和所述第二待识别图像各自的第二关键点；

按照所述第一待识别图像的第二关键点，对所述第一待识别图像添加图像特效，得到第一特效化图像，以及，按照所述第二待识别图像的第二关键点，对所述第二待识别图像添加图像特效，得到第二特效化图像；

播放所述第一账户的特效化直播视频和所述第二账户的特效化直播视频；所述第一账户的特效化直播视频包括所述第一特效化图像；所述第二账户的特效化直播视频包括所述第二特效化图像。