图像传输的方法和装置、存储介质
技术领域
本公开涉及图像处理技术领域,具体地,涉及一种图像传输的方法和装置、存储介质。
背景技术
基于视觉的盲人辅助导盲系统的应用,可以引导盲人理解场景、自主行走和避障,很大程度方便了盲人的日常出行;基于视觉的机器人自主导航系统,可以引导机器人自主行走。
发明内容
本公开提供一种图像传输的方法和装置、存储介质,以解决相关技术中频繁的图像或者视频传输会耗费巨大的流量的技术问题。
为实现上述目的,本公开实施例的第一方面,提供一种图像传输的方法,所述方法包括:
将待传输图像做降维处理;
压缩降维处理后的所述待传输图像;
发送压缩后的所述待传输图像。
可选地,还包括:
接收压缩后的待传输图像;
响应于接收到压缩后的待传输图像,对该待传输图像进行复原。
可选地,所述将待传输图像做降维处理,包括:
使用语义分割或者样例分割待传输图像,以使降维处理后的所述待传输图像为保持场景语义的彩色图。
可选地,所述对该待传输图像进行复原,包括:
解压所述待传输图像;
使用pix2pixHD算法或者Vid2Vid算法复原解压后的所述待传输图像。
本公开实施例的第二方面,提供一种图像传输的装置,所述装置包括:
降维模块,用于将待传输图像做降维处理;
压缩模块,用于压缩降维处理后的所述待传输图像;
发送模块,用于发送压缩后的所述待传输图像。
可选地,所述装置还包括:
接收模块,用于接收压缩后的待传输图像;
复原模块,用于响应于接收到压缩后的待传输图像,对该待传输图像进行复原。
可选地,所述降维模块还用于:
使用语义分割或者样例分割待传输图像,以使降维处理后的所述待传输图像为保持场景语义的彩色图。
可选地,所述复原模块还用于:解压所述待传输图像;使用pix2pixHD算法或者Vid2Vid算法复原解压后的所述待传输图像。
本公开实施例的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述第一方面中任一项所述方法的步骤。
本公开实施例的第四方面,提供一种图像传输的装置,包括:
存储器,其上存储有计算机程序;以及
处理器,用于执行所述存储器中的所述计算机程序,以实现上述第一方面中任一项所述方法的步骤。
采用上述技术方案,至少能够达到如下技术效果:
本公开在待传输图像传输前,进行降维处理,并将降维处理后的所述进行压缩,能够有效降低传输数据量,减少带宽要求,加快传输速度,提高了带宽利用率,解决了相关技术中频繁的图像或者视频传输会耗费巨大的流量的技术问题。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1是本公开一示例性实施例示出的一种图像传输的方法流程图。
图2是本公开根据一示例性实施例示出的一种实施环境的示意图。
图3是本公开一示例性实施例示出的另一种图像传输的方法流程图。
图4是本公开一示例性实施例示出的一种图像传输的装置框图。
图5是本公开一示例性实施例示出的另一种图像传输的装置框图。
具体实施方式
以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
本申请发明人研究发现,在复杂环境下,基于视觉的识别、导航避障会变得不可靠。这种情况下,将当前场景图像发送远程后台人员,由人工引导盲人或者操控机器人可以有效的应对复杂环境,但是这类系统面临一个重要问题就是带宽问题,频繁的图像或者视频传输会耗费巨大的流量,成本较高。因此,图像传输如何提高带宽利用率,而且高效的提供服务,成为迫切需求。
图2是根据一示例性实施例示出的一种实施环境的示意图。如图2所示,该实施环境可以包括移动终端10、11和服务端20。该移动终端10、11可以是通过移动通信网络访问网络服务的用户设备,例如智能手机、平板电脑、笔记本电脑等用户设备。图2以移动终端10、11是智能手机来示意。
具体地,终端设备100可以安装有多种应用程序,应用程序在访问网络服务时,发起网络连接请求,基于该网络连接请求,该移动终端可以连接移动通信网络,进而登录服务端20。
图1是根据一示例性实施例示出的一种图像传输的方法流程图,以解决相关技术中频繁的图像或者视频传输会耗费巨大的流量的技术问题。本实施例示出的该图像传输的方法可以应用于如图2所示的移动终端10或移动终端11,如图1所示,该方法包括以下步骤:
S11,将待传输图像做降维处理。
S12,压缩降维处理后的所述待传输图像。
S13,发送压缩后的所述待传输图像。
在步骤S11中,所述待传输图像可以是静态图像,也可以是视频图像,即视频。移动终端10、11可以是通过摄像机拍摄图像或者拍摄视频获取所述待传输图像。将所述待传输图像做降维处理,可以是使用语义分割或样例分割等方法处理所述待传输图像。当然,在其它的实施例中,也可以使用边缘提取方法处理所述待传输图像。
所述待传输图像经过降维处理后,可以变成保持场景语义的彩色图,不仅减小了图像的数据量,而且降维处理后的所述待传输图像不影响终端的工作人员的观察和判断。
接着,将降维处理后的所述待传输图像进行压缩,进一步减少所述待传输图像的数据量。然后,执行步骤S13,发送压缩后的所述待传输图像。
举例来讲,移动终端10拍摄待传输图像后,使用语义分割方法处理所述待传输图像,然后将降维处理后的所述待传输图像进行压缩,接着,基于tcp、http等网络通讯协议,移动终端10将发送压缩后的所述待传输图像发送给移动终端11或服务端20。
本公开在待传输图像传输前,进行降维处理,并将降维处理后的所述进行压缩,能够有效降低传输数据量,减少带宽要求,加快传输速度,提高了带宽利用率,解决了相关技术中频繁的图像或者视频传输会耗费巨大的流量的技术问题。
值得说明的是,对于图1所示的方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本公开并不受所描述的动作顺序的限制。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本公开所必须的。
图3是根据一示例性实施例示出的一种图像传输的方法流程图,以解决相关技术中频繁的图像或者视频传输会耗费巨大的流量的技术问题。如图1所示,该图像传输的方法还可以包括以下步骤:
S14,接收压缩后的待传输图像。
S15,响应于接收到压缩后的待传输图像,对该待传输图像进行复原。
举例来讲,移动终端10拍摄待传输图像后,使用语义分割方法处理所述待传输图像,然后将降维处理后的所述待传输图像进行压缩,接着,基于tcp、http等网络通讯协议,移动终端10将发送压缩后的所述待传输图像发送给移动终端11或服务端20。
移动终端11或服务端20在接收到压缩后的待传输图像后,执行步骤S55,响应于接收到压缩后的待传输图像,对该待传输图像进行复原。在复原所述待传输图像时,首先需要解压所述待传输图像,接着可以基于GAN(Generative Adversarial Network;生成对抗网络)的算法复原所述待传输图像。对于静态图像,可以使用GAN的pix2pix HD算法GAN的;对于视频图像(即视频),可以使用GAN的Vid2Vid的算法复原。
pix2pixHD的输入可以为语义分割图、样例分割图或者单帧的边缘图,输出为保持场景语义的彩色图,不影响位于服务端或移动终端的工作人员观察和判断。Vid2Vid在pix2pixHD基础上了考虑了帧间信息的连续性,可以输出连续稳定视频,其输入为上一帧恢复结果和当前帧的语义分割图、样例分割图或者单帧的边缘图,输出为当前帧的恢复结果。在复杂环境下,在基于视觉的识别或导航避障时,工作人员可以根据恢复的图像或者视频,远程帮助盲人理解环境,远程引导盲人行走或进行机器人远程操控。
本公开在待传输图像传输前,进行降维处理,并将降维处理后的所述进行压缩,能够有效降低传输数据量,减少带宽要求,加快传输速度,提高了带宽利用率,解决了相关技术中频繁的图像或者视频传输会耗费巨大的流量的技术问题。并且,可以基于GAN的方法复原图像或视频,保证恢复图像的质量,最大限度还原场景信息。
值得说明的是,对于图3所示的方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本公开并不受所描述的动作顺序的限制。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本公开所必须的。
图4是本公开一示例性实施例示出的一种图像传输的装置。如图4所示,所述图像传输的装置300包括:
降维模块310,用于将待传输图像做降维处理;
压缩模块320,用于压缩降维处理后的所述待传输图像;
发送模块330,用于发送压缩后的所述待传输图像。
可选地,如图4所示,所述图像传输的装置300还包括:
接收模块340,用于接收压缩后的待传输图像;
复原模块350,用于响应于接收到压缩后的待传输图像,对该待传输图像进行复原。
可选地,所述降维模块310还用于:
使用语义分割或者样例分割待传输图像,以使降维处理后的所述待传输图像为保持场景语义的彩色图。
可选地,所述复原模块350还用于:解压所述待传输图像;使用pix2pixHD算法或者Vid2Vid算法复原解压后的所述待传输图像。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本公开还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项可选实施例所述图像传输的方法步骤。
本公开还提供一种图像传输的装置,包括:
存储器,其上存储有计算机程序;以及
处理器,用于执行所述存储器中的所述计算机程序,以实现上述任一项可选实施例所述图像传输的方法步骤。
图5是根据一示例性实施例示出的一种图像传输的装置400的框图。如图5所示,该装置400可以包括:处理器401,存储器402,多媒体组件403,输入/输出(I/O)接口404,以及通信组件405。
其中,处理器401用于控制该装置400的整体操作,以完成上述的图像传输的方法中的全部或部分步骤。存储器402用于存储各种类型的数据以支持在该装置400的操作,这些数据例如可以包括用于在该装置400上操作的任何应用程序或方法的指令,以及应用程序相关的数据。该存储器402可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。多媒体组件403可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器402或通过通信组件405发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口404为处理器401和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件405用于该装置400与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(Near Field Communication,简称NFC),2G、3G或4G,或它们中的一种或几种的组合,因此相应的该通信组件405可以包括:Wi-Fi模块,蓝牙模块,NFC模块。
在一示例性实施例中,装置400可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit,简称ASIC)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的图像传输的方法。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,例如包括程序指令的存储器402,上述程序指令可由装置400的处理器401执行以完成上述的图像传输的方法。
以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。
此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。