CN115103148A

CN115103148A - 一种视频实现方法、装置、电子设备及可读存储介质

Info

Publication number: CN115103148A
Application number: CN202210494123.XA
Authority: CN
Inventors: 杨帆; 张洪涛
Original assignee: Lenovo Beijing Ltd
Current assignee: Lenovo Beijing Ltd
Priority date: 2022-05-05
Filing date: 2022-05-05
Publication date: 2022-09-23

Abstract

本申请公开了一种视频实现方法、装置、电子设备及可读存储介质，该方法包括：获取第一电子设备发送的多张第一图像，各第一图像是第一电子设备采集的关于目标物体的图像，多张第一图像中目标物体的拍摄角度不同；根据多张第一图像生成目标物体的全局图像；获取第一电子设备发送的第一位姿信息；根据第一位姿信息调整全局图像的大小及全局图像的显示区域。本申请实施例中，第二电子设备基于目标物体的不同拍摄角度的多张第一图像，生成了目标物体的全局图像，从而再基于第一电子设备实时的第一位姿信息，就可以确定使用第一电子设备的用户正在观看目标物体的哪个位置，从而即使第一电子设备所处的环境中网络不稳定，也能实现视频通话同样的效果。

Description

一种视频实现方法、装置、电子设备及可读存储介质

技术领域

本申请涉及图像处理技术领域，尤其涉及一种视频实现方法、装置、电子设备及可读存储介质。

背景技术

AR远程指导的场景中，通常都是用户端通过AR眼镜与专家端进行视频，从而实现专家对用户进行远程指导。但如果用户端所处的环境中网络不稳定，例如弱网、带宽不稳定等，会直接导致视频通话不可用。

发明内容

有鉴于此，本申请实施例通过提供一种视频实现方法、装置、电子设备及可读存储介质，用以至少解决现有技术中存在的上述技术问题。

根据本申请第一方面，本申请实施例提供了一种视频实现方法，包括：获取第一电子设备发送的多张第一图像，各第一图像是第一电子设备采集的关于目标物体的图像，多张第一图像中目标物体的拍摄角度不同；根据多张第一图像生成目标物体的全局图像；获取第一电子设备发送的第一位姿信息；根据第一位姿信息调整全局图像的大小及全局图像的显示区域。

可选地，根据多张第一图像生成目标物体的全局图像，包括：确定多张第一图像分别对应的第一电子设备的第二位姿信息；根据第二位姿信息将多张第一图像进行拼接，形成目标物体的全局图像。

可选地，根据第二位姿信息将多张第一图像进行拼接，形成目标物体的全局图像，包括：根据第二位姿信息确定多张第一图像的空间位置关系；根据多张第一图像的空间位置关系将多张第一图像进行拼接，形成目标物体的全局图像。

可选地，根据第一位姿信息调整全局图像的大小及全局图像的显示区域，包括：根据第一位姿信息确定第一电子设备与目标物体的相对距离，及全局图像中与第一位姿信息对应的第一区域图像；将第一区域图像作为全局图像的显示区域；根据相对距离调整全局图像的大小。

可选地，视频实现方法还包括：获取第一电子设备发送的第二图像及对应的第一电子设备的第三位姿信息；根据第二图像及对应的第三位姿信息更新全局图像。

可选地，根据第二图像及对应的第三位姿信息更新全局图像，包括：确定全局图像中与第三位姿信息对应的第二区域图像；将第二图像替换第二区域图像，以更新全局图像。

可选地，第二图像为缩略图像，

将第二图像替换第二区域图像，以更新全局图像，包括：向用户显示第二图像；响应于用户操作，对第二图像对应的原始图像进行下载；将第二图像对应的原始图像替换第二区域图像，以更新全局图像。

根据本申请第二方面，本申请实施例提供了一种视频实现装置，包括：第一获取单元，用于获取第一电子设备发送的多张第一图像，各第一图像是第一电子设备采集的关于目标物体的图像，多张第一图像中目标物体的拍摄角度不同；生成单元，用于根据多张第一图像生成目标物体的全局图像；第二获取单元，用于获取第一电子设备发送的第一位姿信息；调整单元，用于根据第一位姿信息调整全局图像的大小及全局图像的显示区域。

根据本申请第三方面，本申请实施例提供了一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器执行如第一方面或第一方面任意实施方式中的视频实现方法。

根据本申请第四方面，本申请实施例提供了一种计算机可读存储介质，计算机可读存储介质存储有计算机指令，计算机指令用于使计算机执行如第一方面或第一方面任意实施方式中的视频实现方法。

本申请实施例提供的视频实现方法、装置、电子设备及可读存储介质，通过获取第一电子设备发送的多张第一图像，各第一图像是第一电子设备采集的关于目标物体的图像，多张第一图像中目标物体的拍摄角度不同；根据多张第一图像生成目标物体的全局图像；获取第一电子设备发送的第一位姿信息；根据第一位姿信息调整全局图像的大小及全局图像的显示区域；如此，在第一电子设备与第二电子设备视频通话过程中，第一电子设备不需要将大量的关于目标物体的实时图像发送给第二电子设备，第一电子设备只需要将目标物体的不同拍摄角度的多张第一图像发送给第二电子设备，第二电子设备就可以基于该多张第一图像生成目标物体的全局图像，从而后续视频通话过程中，第一电子设备只需要将第一电子设备的第一位姿信息同步给第二电子设备，第二电子设备基于第一位姿信息就可以确定使用第一电子设备的用户正在观看目标物体的哪个位置，然后基于该位置调整全局图像的大小及全局图像的显示区域，就可以实现使用第二电子设备的用户实时知道使用第一电子设备的用户正在观看目标物体的哪个位置，这样，即使第一电子设备所处的环境中网络不稳定，也能实现视频通话同样的效果。

上述说明仅是本申请技术方案的概述，为了能够更清楚了解本申请的技术手段，而可依照说明书的内容予以实施，并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂，以下特举本申请的具体实施方式。

附图说明

图1为本申请实施例可以应用其中的示例性系统架构图；

图2为本申请实施例中一种视频实现方法的流程示意图；

图3为本申请实施例中第一电子设备与第二电子设备的交互示意图；

图4为本申请实施例中第一电子设备采集目标物体的多张第一图像的示意图；

图5为本申请实施例中多张第一图像的示意图；

图6为本申请实施例中全局图像的显示区域的示意图；

图7为本申请实施例中调整后的全局图像的显示区域的示意图；

图8为本申请实施例中多张第一图像的空间位置关系示意图；

图9为本申请实施例中一种视频实现装置的结构示意图；

图10为本申请实施例中一种电子设备的硬件结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

图1示出了可以应用于本申请的视频实现方法或视频实现装置的实施例的示例性系统架构100。

如图1所示，系统架构100可以包括第一电子设备101，网络102和第二电子设备103。网络102用以在第一电子设备101和第二电子设备103之间提供通信链路的介质。网络102可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用第一电子设备101通过网络102与第二电子设备103交互，以接收或发送消息等。第一电子设备101和第二电子设备103上均可以安装有各种客户端应用，例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

第一电子设备101可以是具有摄像头、显示屏，并且支持语音输入的穿戴式电子设备，包括但不限于AR眼镜。

第二电子设备103可以是具有显示屏并且支持语音输入的各种电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture ExpertsGroupAudio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving PictureExpertsGroup Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。

需要说明的是，本申请实施例所提供的视频实现方法一般由第二电子设备103执行，相应地，视频实现装置一般设置于第二电子设备103中。

继续参考图2，其示出了本申请实施例提供的一种视频实现方法的流程，视频实现方法具体应用于第二电子设备，包括以下步骤：

S201，获取第一电子设备发送的多张第一图像，各第一图像是第一电子设备采集的关于目标物体的图像，多张第一图像中目标物体的拍摄角度不同。

在本实施例中，第二电子设备设置在第一电子设备的远端，第一电子设备与第二电子设备通信，进行语音和图像的传输。其中，使用第二电子设备的用户，例如专家，通过第二电子设备所展示的图像和第二电子设备接收到的语音，实现对使用第一电子设备的用户进行技术指导，例如，专家远程指导工人维修、维护、学习静态的机动车等。

目标物体为第一电子设备的拍摄对象，例如，机动车模型、飞机发动机等。第一电子设备具有摄像头，用于采集目标物体的图像。对于一般的摄像头，其视场角均不大，因此，第一电子设备的摄像头无法采集到目标物体所有拍摄角度的图像，因此，第一电子设备需要采集目标物体的多张静态图像，即多张第一图像，使得多张第一图像中目标物体的拍摄角度不同。

第一电子设备与第二电子设备的交互示意图，如图3所示。

图3中，第一电子设备通过自身的摄像头采集目标物体的多张第一图像。

在一些实施例中，如图4所示，使用第一电子设备的用户可以通过改变站位或头部位置的方式实现采集的多张第一图像中目标物体的拍摄角度不同，得到的多张第一图像如图5所示。图5中，多张第一图像包括高清图片1、高清图片2和高清图片3。

在一些实施例中，如图5所示，各张第一图像包括第一电子设备采集各张第一图像时的第二位姿信息，即6个自由度(6DoF)位置。需要说明的是，如何获得位姿信息是目前广泛研究和应用的公知技术，在此不再赘述。

图3中，第一电子设备将采集到的多张第一图像发送给第二电子设备，第二电子设备接收到多张第一图像。

S202，根据多张第一图像生成目标物体的全局图像。

在本实施例中，全局图像包含了从多个角度观察目标物体时的图像信息，由于多张第一图像是目标物体的多个拍摄角度的图像，因此，将多个拍摄角度的图像进行拼接，就可以形成目标物体的全局图像。例如，分别从目标物体的前后左右四个方向采集得到4张第一图像，则将这4张第一图像进行拼接后得到的图像即为全局图像。进一步地，还可以对各第一图像的拼接位置进行图像矫正，以得到针对目标物体的全景图像。可选的，全局图像也可以指通过多张第一图像生成的目标物体的三维模型。

图3中，第二电子设备将接收到的多张第一图像进行拼接，生成目标物体的全局图像。

在一些实施例中，在形成目标物体的全局图像后，可以在第二电子的显示屏幕上显示该全局图像。显示该全局图像时，可以先确定将该全局图像的显示区域，即全局图像的局部图像，然后将显示区域进行显示。也即，全局图像为三维图像，但第二电子设备的屏幕上显示的是平面图像。在显示该全局图像时，可以以全局图像中对应第一电子设备最后发送的第一图像的局部区域作为全局图像的显示区域，如图6所示。

S203，获取第一电子设备发送的第一位姿信息。

在本实施例中，第一位姿信息为第一电子设备自身的位姿信息，可选的，第一位姿信息为第一电子设备的6DoF信息。

第一电子设备将采集的多张第一图像发送给第二电子设备后，如图3所示，第一电子设备实时采集其自身的第一位姿信息。然后，第一电子设备将采集到的第一位置信息发送给第二电子设备，第二电子设备接收到第一电子设备发送的第一位姿信息。

S204，根据第一位姿信息调整全局图像的大小及全局图像的显示区域。

在本实施例中，全局图像的显示区域为全局图像显示在第二电子设备的屏幕上的区域图像。第一电子设备的位姿信息不同，则使用第一电子设备的用户看到的目标物体的位置不同，与目标物体的距离不同。第一电子设备的位姿信息与用户看到的目标物体的位置，及用户至目标物体的距离具有对应关系。而在确定了目标物体的全局图像后，基于第一电子设备的第一位姿信息，可以确定第一电子设备的用户可以看到的目标物体的位置。从而如图3所示，第二电子设备基于第一位姿信息可以确定第一电子设备的用户正在看目标物体的哪个位置，相比采集第一图像时与目标物体的距离，使用第一电子设备的用户是更靠近目标物体还是更远离目标物体了。然后将全局图像中与该位置对应的图像作为全局图像的显示区域，并基于使用第一电子设备的用户是更靠近目标物体还是更远离目标物体的变分析结果对应调整全局图像的大小，从而对应调整了全局图像中的显示区域的大小，然后将调整大小后的全局图像的显示区域显示在屏幕上，给使用第二电子设备的用户观看，如图7所示。

可选的，在全局图像为目标对象的三维模型的情况下，S204还可替换为：根据根据第一位姿信息调整三维模型的显示角度和显示大小；根据显示角度和显示大小，将三维模型映射为二维图像并显示。

需要说明的是，本申请实施例的视频实现方法适用于第一电子设备网络状态良好和网络状态不好的多种情况。当然，在一些实施例中，如果第一电子设备的网络状态良好，第一电子设备可以优先选择正常视频通话的方式和第二电子设备交互，即第一电子设备实时发送目标物体的动态图像至第二电子设备，实现远程指导。如果第一电子设备的网络状态不好，第一电子设备和第二电子设备可以通过上述的视频实现方法，得到正常视频通话同样的效果。从而，第一电子设备在与第二电子设备进行视频时，可以实时识别当前网络的状态，根据当前的网络状态进行视频方式的转换。

本申请实施例提供的视频实现方法，在第一电子设备与第二电子设备视频通话过程中，第一电子设备不需要将大量的关于目标物体的实时图像发送给第二电子设备，第一电子设备只需要将目标物体的不同拍摄角度的多张第一图像发送给第二电子设备，第二电子设备就可以基于该多张第一图像生成目标物体的全局图像，从而后续视频通话过程中，第一电子设备只需要将第一电子设备的第一位姿信息同步给第二电子设备，第二电子设备基于第一位姿信息就可以确定使用第一电子设备的用户正在观看目标物体的哪个位置，然后基于该位置调整全局图像的大小及全局图像的显示区域，就可以实现使用第二电子设备的用户实时知道使用第一电子设备的用户正在观看目标物体的哪个位置，这样，即使第一电子设备所处的环境中网络不稳定，也能实现视频通话同样的效果。

在一个可选的实施例中，步骤S202，根据多张第一图像生成目标物体的全局图像，包括：确定多张第一图像分别对应的第一电子设备的第二位姿信息；根据第二位姿信息将多张第一图像进行拼接，形成目标物体的全局图像。

具体地，在一些实施方式中，第一电子设备可以通过在各张第一图像中保存第一电子设备采集各张第一图像时的第二位姿信息，从而，第二电子设备根据接收到的各张图像可以确定各张图像分别对应的第一电子设备的第二位姿信息。

在另一些实施方式中，第一电子设备可以在发送各张第一图像时，对应发送各张图像对应的第一电子设备的第二位姿信息，从而，第二电子设备得到各张第一图像对应的第一电子设备的第二位姿信息。

在一个可选的实施方式中，根据第二位姿信息将多张第一图像进行拼接，形成目标物体的全局图像，包括：根据第二位姿信息确定多张第一图像的空间位置关系；根据多张第一图像的空间位置关系将多张第一图像进行拼接，形成目标物体的全局图像。

具体地，第二位姿信息包括第一电子设备采集第一图像时在空间中的位置以及目标物体与第一电子设备的相对位置，因此，基于第二位姿信息可以确定第一电子设备采集的第一图像在空间中的位置。因此，基于多张图像分别对应的第一电子设备的第二位姿信息，可以确定多张第一图像的空间位置关系。例如，如图5所示，每张第一图像包括一个第二位姿信息，从而根据该第二位姿信息，可以确定多张第一图像(包括高清图片1、高清图片2和高清图片3)的空间位置关系，如图8所示。确定了多张第一图像的空间位置关系后，按照该空间位置关系将多张第一图像进行拼接，可以快速、精准地完成多张第一图像的拼接，得到目标物体的全局图像。

在本实施实施例中，通过确定多张第一图像分别对应的第一电子设备的第二位姿信息，根据第二位姿信息将多张第一图像进行拼接，形成目标物体的全局图像，是采用各张第一图像的空间位置来实现多张第一图像的拼接，从而可以实现精确、快速地对将多张第一图像拼接，得到目标物体的全局图像。

在一个可选的实施例中，步骤S204，根据第一位姿信息调整全局图像的大小及全局图像的显示区域，包括：根据第一位姿信息确定第一电子设备与目标物体的相对距离，及全局图像中与第一位姿信息对应的第一区域图像；将第一区域图像作为全局图像的显示区域；根据相对距离调整全局图像的大小。

具体地，由于组成全局图像的各第一张图像包括第一电子设备的第二位姿信息，因此，再基于第一电子设备的第一位姿信息就可以对应到全局图像中的第一区域图像。通过将第一位姿信息与第二位姿信息对比，就可以确定第一电子设备与目标物体的相对距离是变大了还是变小了，从而确定第二电子设备的用户看到的目标物体的第一区域图像是应该放大还是缩小。根据相对位置调整全局图像的大小，就对应调整了第一区域图像的大小，从而在第二电子设备的屏幕上显示的是调整大小后的第一区域图像。

在一些实施例中，也可以在将第一区域图像作为全局图像的显示区域后，截取该显示区域对应的第一区域图像，针对该第一区域图像的大小进行调整，并显示。从而在第二电子设备的屏幕上显示的也是调整大小后的第一区域图像。

需要说明的是，在本申请实施例中，是先将第一区域图像作为全局图像的显示区域，然后再根据相对距离调整全局图像的大小，但是在其他实施例中，这两个步骤的执行顺序可以相反，如先根据相对距离调整全局图像的大小，然后再将第一区域图像作为全局图像的显示区域。

在本申请实施例中，根据第一位姿信息确定第一电子设备与目标物体的相对距离，及全局图像中与第一位姿信息对应的第一区域图像，将第一区域图像作为全局图像的显示区域；根据相对距离调整全局图像的大小，从而可以在第二电子设备上显示第一电子设备的用户正在观看的目标物体的具体位置，以及同步放大和缩小该具体位置对应的第一区域图像，并且通过调整全局图像的大小，可以实现直接对第一区域图像的大小进行调整。

在一个可选的实施例中，视频实现方法还包括：获取第一电子设备发送的第二图像及对应的第一电子设备的第三位姿信息；根据第二图像及对应的第三位姿信息更新全局图像。

具体地，如图3所示，第一电子设备与第二电子设备视频通过过程中，可以按照一定的频率，例如1秒5张的频率，实时采集目标物体的第二图像。

采集目标物体的第二图像时，在一种实现方式中，使用第一电子设备的用户可以通过3D画笔的方式在空间中圈出重点关注位置，从而第一电子设备后续只拍摄重点关注位置对应的目标物体的局部区域，第二图像为目标物体的局部区域图，且第二图像的尺寸小于第一图像的尺寸。

第一电子设备然后将第二图像与发送给第二电子设备的多张第一图像进行特征比对，如果判定第二图像中有些特征发生了变化，则可以将第二图像及该第二图像对应的第一电子设备的第三位姿信息发送给第二电子设备。当然，在发送第二图像之前，还可以在第一电子设备端发出提示信息，使得使用第一电子设备的用户进一步对第二图像中发生变化的特征进行确认，经用户确认有必要发送给第二电子设备后，第一电子设备将第二图像及该第二图像对应的第一电子设备的第三位姿信息发送给第二电子设备。

第二电子设备接收第一电子设备发送的第二图像及对应的第一电子设备的第三位姿信息，根据第二图像及对应的第三位姿信息更新全局图像。

在一个可选的实施方式中，根据第二图像及对应的第三位姿信息更新全局图像，包括：确定全局图像中与第三位姿信息对应的第二区域图像；将第二图像替换第二区域图像，以更新全局图像。如此，可以快速、精准地更新全局图像。

在本申请实施例中，通过获取第一电子设备发送的第二图像及对应的第一电子设备的第三位姿信息，根据第二图像及对应的第三位姿信息更新全局图像，可以实现对全局图像的实时更新。

在一个可选的实施方式中，为了进一步减小第一电子设备的带宽，第一电子设备在发送第二图像时，可以不发送第二图像的原始图像，而是将第二图像的原始图像保存在本地，将原始图像对应的缩略图像发送给第二电子设备，则第二电子设备获取到的第二图像为缩略图像。

则将第二图像替换第二区域图像，以更新全局图像，包括：向用户显示第二图像；响应于用户操作，对第二图像对应的原始图像进行下载；将第二图像对应的原始图像替换第二区域图像，以更新全局图像。

具体地，使用第二电子设备的用户可以浏览缩略图像，选择下载哪些缩略图像对应的原始图像，从而第二电子设备可以将缩略图像对应的原始图像替换第二区域图像，以更新全局图像。

在本申请实施例中，第一电子设备将缩略图像发送至第二电子设备，第二电子设备向用户显示第二图像，响应于用户操作，对第二图像对应的原始图像进行下载，将第二图像对应的原始图像替换第二区域图像，以更新全局图像，一方面，可以减轻第一电子设备的带宽压力，另一方面，使用第二电子设备的用户可以选择性地下载第二图像对应的原始图像，也即，可以选择是否更新全局图像及全局图像的更新位置。

本申请实施例提供了一种视频实现装置，如图9所示，包括：

第一获取单元21，用于获取第一电子设备发送的多张第一图像，各第一图像是第一电子设备采集的关于目标物体的图像，多张第一图像中目标物体的拍摄角度不同。

生成单元22，用于根据多张第一图像生成目标物体的全局图像。

第二获取单元23，用于获取设备发送的第一位姿信息。

调整单元24，用于根据第一位姿信息调整全局图像的大小及全局图像的显示区域。

本申请实施例提供的视频实现装置，在第一电子设备与第二电子设备视频通话过程中，第一电子设备不需要将大量的关于目标物体的实时图像发送给第二电子设备，第一电子设备只需要将目标物体的不同拍摄角度的多张第一图像发送给第二电子设备，第二电子设备就可以基于该多张第一图像生成目标物体的全局图像，从而后续视频通话过程中，第一电子设备只需要将第一电子设备的第一位姿信息同步给第二电子设备，第二电子设备基于第一位姿信息就可以确定使用第一电子设备的用户正在观看目标物体的哪个位置，然后基于该位置调整全局图像的大小及全局图像的显示区域，就可以实现使用第二电子设备的用户实时知道使用第一电子设备的用户正在观看目标物体的哪个位置，这样，即使第一电子设备所处的环境中网络不稳定，也能实现视频通话同样的效果。

在一些实施例中，生成单元22包括：

第一确定子单元，用于确定多张第一图像分别对应的第一电子设备的第二位姿信息。

拼接子单元，用于根据第二位姿信息将多张第一图像进行拼接，形成目标物体的全局图像。

在一些实施例中，拼接子单元用于根据第二位姿信息确定多张第一图像的空间位置关系；根据多张第一图像的空间位置关系将多张第一图像进行拼接，形成目标物体的全局图像。

在一些实施例中，调整单元24包括：

第二确定子单元，用于根据第一位姿信息确定第一电子设备与目标物体的相对距离，及全局图像中与第一位姿信息对应的第一区域图像；

第一调整子单元，用于将第一区域图像作为全局图像的显示区域；

第二调整子单元，用于根据相对距离调整全局图像的大小。

在一些实施例中，视频实现装置还包括：

第三获取单元，用于获取第一电子设备发送的第二图像及对应的第一电子设备的第三位姿信息。

更新单元，用于根据第二图像及对应的第三位姿信息更新全局图像。

在一些实施例中，更新单元包括：

第三确定子单元，用于确定全局图像中与第三位姿信息对应的第二区域图像。

替换子单元，用于将第二图像替换第二区域图像，以更新全局图像。

在一些实施例中，第二图像为缩略图像。替换子单元用于向用户显示第二图像；响应于用户操作，对第二图像对应的原始图像进行下载；将第二图像对应的原始图像替换第二区域图像，以更新全局图像。

根据本申请的实施例，本申请还提供了一种电子设备和一种可读存储介质。

图10示出了可以用来实施本申请的实施例的示例电子设备的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图10所示，电子设备包括计算单元801，其可以根据存储在只读存储器(ROM)802中的计算机程序或者从存储单元808加载到随机访问存储器(RAM)803中的计算机程序，来执行各种适当的动作和处理。在RAM 803中，还可存储电子设备操作所需的各种程序和数据。计算单元801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。

电子设备中的多个部件连接至I/O接口805，包括：输入单元806，例如键盘、鼠标等；输出单元807，例如各种类型的显示器、扬声器等；存储单元808，例如磁盘、光盘等；以及通信单元809，例如网卡、调制解调器、无线通信收发机等。通信单元809允许电子设备通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理，例如视频实现方法。例如，在一些实施例中，视频实现方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元808。在一些实施例中，计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到电子设备上。当计算机程序加载到RAM 803并由计算单元801执行时，可以执行上文描述的视频实现方法的一个或多个步骤。备选地，在其他实施例中，计算单元801可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行视频实现方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本申请的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本申请的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本申请的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种视频实现方法，包括：

获取第一电子设备发送的多张第一图像，各所述第一图像是第一电子设备采集的关于目标物体的图像，多张所述第一图像中所述目标物体的拍摄角度不同；

根据多张所述第一图像生成所述目标物体的全局图像；

获取所述第一电子设备发送的第一位姿信息；

根据所述第一位姿信息调整所述全局图像的大小及所述全局图像的显示区域。

2.根据权利要求1所述的视频实现方法，所述根据多张所述第一图像生成所述目标物体的全局图像，包括：

确定多张所述第一图像分别对应的所述第一电子设备的第二位姿信息；

根据所述第二位姿信息将多张所述第一图像进行拼接，形成所述目标物体的全局图像。

3.根据权利要求2所述的视频实现方法，所述根据所述第二位姿信息将多张所述第一图像进行拼接，形成所述目标物体的全局图像，包括：

根据所述第二位姿信息确定多张所述第一图像的空间位置关系；

根据多张所述第一图像的空间位置关系将多张所述第一图像进行拼接，形成所述目标物体的全局图像。

4.根据权利要求1所述的视频实现方法，所述根据所述第一位姿信息调整所述全局图像的大小及所述全局图像的显示区域，包括：

根据所述第一位姿信息确定所述第一电子设备与所述目标物体的相对距离，及所述全局图像中与所述第一位姿信息对应的第一区域图像；

将所述第一区域图像作为所述全局图像的显示区域；

根据所述相对距离调整所述全局图像的大小。

5.根据权利要求1所述的视频实现方法，还包括：

获取所述第一电子设备发送的第二图像及对应的所述第一电子设备的第三位姿信息；

根据所述第二图像及对应的所述第三位姿信息更新所述全局图像。

6.根据权利要求5所述的视频实现方法，所述根据所述第二图像及对应的所述第三位姿信息更新所述全局图像，包括：

确定所述全局图像中与所述第三位姿信息对应的第二区域图像；

将所述第二图像替换所述第二区域图像，以更新所述全局图像。

7.根据权利要求6所述的视频实现方法，所述第二图像为缩略图像，

所述将所述第二图像替换所述第二区域图像，以更新所述全局图像，包括：

向用户显示所述第二图像；

响应于用户操作，对所述第二图像对应的原始图像进行下载；

将所述第二图像对应的原始图像替换所述第二区域图像，以更新所述全局图像。

8.一种视频实现装置，包括：

第一获取单元，用于获取第一电子设备发送的多张第一图像，各所述第一图像是第一电子设备采集的关于目标物体的图像，多张所述第一图像中所述目标物体的拍摄角度不同；

生成单元，用于根据多张所述第一图像生成所述目标物体的全局图像；

第二获取单元，用于获取所述第一电子设备发送的第一位姿信息；

调整单元，用于根据所述第一位姿信息调整所述全局图像的大小及所述全局图像的显示区域。

9.一种电子设备，包括：

至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器执行如权利要求1-7任意一项所述的视频实现方法。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使计算机执行如权利要求1-7任意一项所述的视频实现方法。