CN114363627B - 图像处理方法、装置及电子设备 - Google Patents

图像处理方法、装置及电子设备 Download PDF

Info

Publication number
CN114363627B
CN114363627B CN202111566709.4A CN202111566709A CN114363627B CN 114363627 B CN114363627 B CN 114363627B CN 202111566709 A CN202111566709 A CN 202111566709A CN 114363627 B CN114363627 B CN 114363627B
Authority
CN
China
Prior art keywords
file
image
image frames
preset number
displayed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111566709.4A
Other languages
English (en)
Other versions
CN114363627A (zh
Inventor
贺学斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202111566709.4A priority Critical patent/CN114363627B/zh
Publication of CN114363627A publication Critical patent/CN114363627A/zh
Application granted granted Critical
Publication of CN114363627B publication Critical patent/CN114363627B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

本公开提供了一种图像处理方法、装置及电子设备,涉及人工智能领域,具体涉及深度学习、大数据及计算机视觉技术领域。该方案为:获取任一待展示文件并存储于文件缓存区域内;提取第一预设数量的图像帧并存储于图像缓存区域内;对第一预设数量的图像帧进行解码并提取目标图像帧进行展示;在提取目标图像帧之后,从任一待展示文件的剩余图像帧中提取第二预设数量的图像帧,并将第二预设数量的图像帧存储于图像缓存区域内进行解码。由此,本公开不再依赖在将任一待展示文件存储于内存存储区域后,对任一待展示文件的所有图像帧进行解码的方式,能够通过分批解码的方式,达到了节省内存存储空间的目的,提高了图像处理过程中的效率、准确性和可靠性。

Description

图像处理方法、装置及电子设备
技术领域
本公开的实施例总体上涉及图像处理技术领域,并且更具体地涉及人工智能领域,具体涉及深度学习、大数据及计算机视觉技术领域。
背景技术
高效、可靠的图像处理,是确保应用程序(Application,简称APP)能够正常运行的重要条件之一但受限于成本及实用性等严苛要求,相关技术中,图像处理过程中的重要指标之一,即内存存储空间大小,往往被设定为较小值。即言,手机等职能设备的内存存储空间往往较小。这样一来,由于内存存储空间有限,针对帧数较多的待展示文件,往往会出现APP闪退等情况,严重影响了APP的正常使用,进而导致用户体验极差。
因此,如何提高图像处理过程中的效率及可靠性,进而确保待展示文件的正常展示以及待展示文件对应的应用程序的正常使用,已成为了重要的研究方向之一。
发明内容
本公开提供了一种图像处理方法、装置及电子设备。
根据第一方面,提供了一种图像处理方法,包括:
获取任一待展示文件并存储于文件缓存区域内;
从所述任一待展示文件中提取第一预设数量的图像帧,并将所述第一预设数量的图像帧存储于图像缓存区域内;
对所述第一预设数量的图像帧进行解码,并从解码后的第一预设数量的图像帧中提取目标图像帧进行展示;
在提取所述第一预设数量的图像帧之后,从所述任一待展示文件的剩余图像帧中提取第二预设数量的图像帧,并将所述第二预设数量的图像帧存储于所述图像缓存区域内进行解码。
根据第二方面,提供了一种图像处理装置,包括:
第一存储模块,用于获取任一待展示文件并存储于文件缓存区域内;
第二存储模块,用于从所述任一待展示文件中提取第一预设数量的图像帧,并将所述第一预设数量的图像帧存储于图像缓存区域内;
解码模块,用于对所述第一预设数量的图像帧进行解码,并从解码后的第一预设数量的图像帧中提取目标图像帧进行展示;
第三存储模块,用于在提取所述第一预设数量的图像帧之后,从所述任一待展示文件的剩余图像帧中提取第二预设数量的图像帧,并将所述第二预设数量的图像帧存储于所述图像缓存区域内进行解码。
根据第三方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开第一方面所述的图像处理方法。
根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开第一方面所述的图像处理方法。
根据第五方面,提供了一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序在被处理器执行时实现根据本公开第一方面所述的图像处理方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开第一实施例的示意图;
图2是一种内存的存储区域划分的示意图;
图3是根据本公开第二实施例的示意图;
图4是一种存储待展示文件的示意图;
图5是根据本公开第三实施例的示意图;
图6是根据本公开第四实施例的示意图;
图7是一种对待展示文件进行图像处理并展示的示意图;
图8是另一种对待展示文件进行图像处理并展示的示意图;
图9是用来实现本公开实施例的图像处理方法的图像处理装置的框图;
图10是用来实现本公开实施例的图像处理方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
以下对本公开的方案涉及的技术领域进行简要说明:
图像处理(Data Processing),是用计算机对图像信息进行处理的技术。主要包括图像数字化、图像增强和复原、图像数据编码、图像分割和图像识别等。
AI(Artificial Intelligence,人工智能),是研究使计算机来模拟人生的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术,也有软件层面的技术。人工智能硬件技术一般包括计算机视觉技术、语音识别技术、自然语言处理技术以及及其学习/深度学习、大数据处理技术、知识图谱技术等几大方面。
深度学习(Deep Learning,简称DL),是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。
大数据(Big Data),指的是无法在一定时间范围内使用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
计算机视觉,是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。
下面参考附图描述本公开实施例的一种图像处理方法、装置及电子设备。
图1是根据本公开第一实施例的示意图。其中,需要说明的是,本实施例的图像处理方法的执行主体为图像处理装置,图像处理装置具体可以为硬件设备,或者硬件设备中的软件等。其中,硬件设备例如终端设备、服务器等。
如图1所示,本实施例提出的图像处理方法,包括如下步骤:
S101、获取任一待展示文件并存储于文件缓存区域内。
其中,待展示文件,可以为任一具有较多帧图像的文件,例如动画文件、视频文件等。
其中,文件缓存区域,指的是内存中的文件缓存区域,用于存储未解码的待展示文件。
需要说明的是,由于存储于文件缓存区域内的任一待展示文件为压缩文件,这样一来,任一待展示文件在文件缓存区域内所占用的存储空间大小则极小,并不会过分占用存储空间。也就是说,在将任一待展示文件存储于文件缓存区域内之后,内存中剩余的存储空间大小较大。
S102、从任一待展示文件中提取第一预设数量的图像帧,并将第一预设数量的图像帧存储于图像缓存区域内。
需要说明的是,相关技术中,通常使用“空间换时间”的原则进行图像处理。可选地,在待展示文件的初始化阶段,把待展示文件加载到内存中,并于内存中对待展示文件的所有帧图像进行解码。进一步地,在运行阶段再去逐帧显示。
然而,由于图像片加载到内存中会占用大量的内存空间,例如一张300*400分辨率的图像加载到内存中需要占用约460KB的内存存储空间,这样一来,若待展示文件包括50张图片,则需要占用约22MB的内存存储空间。这对于大部分手机等智能设备来说,对内存的压力都是较大的,会极大增加应用程序(Application,简称APP)被系统kill(砍掉)的几率,即会出现APP闪退等情况。
由此,本公开提出一种图像处理方法,可以在获取任一待展示文件并存储于文件缓存区域内之后,从任一待展示文件中提取第一预设数量的图像帧,并将第一预设数量的图像帧存储于图像缓存区域内。
其中,第一预设数量小于或者等于待展示文件中所有的图像帧的总数量,且第一预设数量可以根据实际情况进行设定。
作为一种可能的实现方式,可以设定第一预设数量为2,以确保在将其中一帧进行展示的时候,已经有另一帧已解码的图像帧等待展示。
其中,图像缓存区域,指的是内存中的图像缓存区域,用于存储已解码的第一预设数量的图像帧。例如,如图2所示,内存中包括文件2-1和图像缓存区域2-2。
举例而言,针对共有100帧图像(图像帧1~100)的待展示文件1,在获取待展示文件1并存储于文件缓存区域内之后,从待展示文件1中提取2个图像帧(图像帧1~2),并将图像帧1~2存储于图像缓存区域内。
S103、对第一预设数量的图像帧进行解码,并从解码后的第一预设数量的图像帧中提取目标图像帧进行展示。
本公开实施例中,在将第一预设数量的图像帧存储于图像缓存区域内之后,可以对第一预设数量的图像帧进行解码,并从解码后的第一预设数量的图像帧中提取目标图像帧进行展示。
其中,目标图像帧,指的是解码后的第一预设数量的图像帧中的任一帧图像。
举例而言,针对解码后的第一预设数量的图像帧1~2,可以将图像帧1作为目标图像帧,以提取目标图像帧进行展示。
S104、在提取第一预设数量的图像帧之后,从任一待展示文件的剩余图像帧中提取第二预设数量的图像帧,并将第二预设数量的图像帧存储于图像缓存区域内进行解码。
其中,第二预设数量小于或者等于待展示文件中所有的图像帧的总数量,且第二预设数量可以根据实际情况进行设定。
作为一种可能的实现方式,可以设定第二预设数量为1,以确保在解码后的第一预设数量的图像帧中的剩余图像帧进行展示的时候,已经有另一帧已解码的图像帧等待展示。
举例而言,针对共有100帧图像(图像帧1~100)的待展示文件1,且解码后的第一预设数量的图像帧为图像帧1~2,在将图像帧1作为目标图像帧进行展示后,可以从图像帧3~100(共98帧)中提取图像帧3,并将图像帧3存储于图像缓存区域内进行解码,以确保在将图像帧2进行展示的时候,已经有已解码的图像帧3在等待展示。
根据本公开实施例的图像处理方法,可以通过获取任一待展示文件并存储于文件缓存区域内,并从任一待展示文件中提取第一预设数量的图像帧,并将第一预设数量的图像帧存储于图像缓存区域内,然后对第一预设数量的图像帧进行解码,并从解码后的第一预设数量的图像帧中提取目标图像帧进行展示,进而在提取第一预设数量的目标图像帧之后,从任一待展示文件的剩余图像帧中提取第二预设数量的图像帧,并将第二预设数量的图像帧存储于图像缓存区域内进行解码。由此,本公开不再依赖在将任一待展示文件存储于内存存储区域后,对任一待展示文件的所有图像帧进行解码的方式,能够通过分批解码的方式,达到了节省内存存储空间的目的,减少了因剩余内存存储空间较小导致应用程序闪退等情况的发生,提高了图像处理过程中的效率、准确性和可靠性。
图3是根据本公开第二实施例的示意图。
如图3所示,本实施例提出的图像处理方法,包括如下步骤:
需要说明的是,本公开中,在试图获取任一待展示文件并存储于文件缓存区域内时,可以对展示指令进行检测,并根据展示指令获取待展示文件。
上述步骤S101具体包括以下步骤S301~302。
S301、响应于检测到针对任一待展示文件的展示指令,则根据展示指令,获取任一待展示文件的文件标识。
需要说明的是,本公开中,用户可以通过多种方式发送针对任一待展示文件的展示指令,例如点击目标控件,或者发送目标语音。相应地,在用户发送针对任一待展示文件的展示指令之后,可以对针对任一待展示文件的展示指令进行检测,并响应于检测到针对任一待展示文件的展示指令,则根据展示指令,获取任一待展示文件的文件标识。
其中,文件标识,可以为任一针对任一待展示文件的唯一标识,例如待展示文件的编号等。
S302、根据文件标识,从硬盘存储区域中提取任一待展示文件并存储于文件缓存区域内。
举例而言,如图4所示,在获取到待展示文件1的文件标识file-1时,可以根据文件标识file-1,从硬盘存储区域4-1中提取待展示文件1并存储于文件缓存区域4-2内。
S303、从任一待展示文件中提取第一预设数量的图像帧,并将第一预设数量的图像帧存储于图像缓存区域内。
该步骤S303与上一实施例中的步骤S102相同,此处不再赘述。
S304、对第一预设数量的图像帧进行解码。
该步骤S304与上一实施例中的步骤S103相同,此处不再赘述。
上述步骤S103中从解码后的第一预设数量的图像帧中提取目标图像帧进行展示的具体过程,具体包括以下步骤S305~306。
S305、获取解码后的第一预设数量的图像帧对应的展示顺序。
其中,展示顺序,可以为用户设定的任一顺序。例如,对应于于文件缓存区域内存储的所有的图像帧的排列顺序,展示顺序可以为正序、逆序、乱序等。
举例而言,针对解码后的第一预设数量的图像帧1~2,获取到的对应的展示顺序可以为图像帧2、图像帧1,即先展示图像帧2,然后再展示图像帧1。
需要说明的是,本公开中对于获取展示顺序的具体方式不作限定,可以根据实际情况进行设定。
可选地,可以将针对待展示文件中所有的图像帧的展示顺序携带于展示指令中进行发送,此种情况下,在获取到展示指令后,可以根据展示指令,获取解码后的第一预设数量的图像帧对应的展示顺序。
可选地,可以将解码后的第一预设数量的图像帧对应的展示顺序携带于展示顺序确定指令中进行发送,此种情况下,在获取到展示顺序确定指令后,可以根据展示顺序确定指令,获取解码后的第一预设数量的图像帧对应的展示顺序。
S306、从解码后的第一预设数量的图像帧中选取展示顺序最靠前的图像帧作为目标图像帧并进行展示。
举例而言,针对解码后的第一预设数量的图像帧1~2,获取到的对应的展示顺序为图像帧2、图像帧1,此种情况下,可以将展示顺序靠前的图像帧2作为目标图像帧并进行展示。
S307、在提取第一预设数量的图像帧之后,从任一待展示文件的剩余图像帧中提取第二预设数量的图像帧,并将第二预设数量的图像帧存储于图像缓存区域内进行解码。
根据本公开实施例的图像处理方法,可以通过响应于检测到针对任一待展示文件的展示指令,则根据展示指令,获取任一待展示文件的文件标识,进而根据文件标识,从硬盘存储区域中提取任一待展示文件并存储于文件缓存区域内,使得内存的文件缓存区域内仅需存储未解码的待展示文件,无需存储非相关文件,在不增加不必要的内存占用的同时,确保待展示文件对应的图像处理过程能够更加准确。进一步地,可以通过获取解码后的第一预设数量的图像帧对应的展示顺序,进而从解码后的第一预设数量的图像帧中选取展示顺序最靠前的图像帧作为目标图像帧并进行展示,使得图像帧的展示能够满足用户的自定义需求,进一步提高了图像处理过程中的准确性、可靠性及智能化程度,提升了用户体验。
需要说明的是,本公开中,在对第一预设数量的图像帧进行解码之后,可以检测编辑指令,并根据编辑指令进行编辑。
可选地,可以响应于检测到针对解码后的第一预设数量的图像帧的编辑指令,则根据编辑指令,对解码后的第一预设数量的图像帧进行编辑。
需要说明的是,本公开中,用户可以通过多种方式发送针对解码后的第一预设数量的图像帧的编辑指令,例如点击目标控件,或者发送目标语音。相应地,在用户发送针对解码后的第一预设数量的图像帧的编辑指令之后,可以检测编辑指令,并根据编辑指令进行编辑。
作为一种可能的实现方式,可以根据编辑指令,从解码后的第一预设数量的图像帧中选取待编辑图像帧,并对待编辑图像帧进行编辑。
需要说明的是,本公开中对于选取待编辑图像帧的具体方式不作限定,可以根据实际情况进行设定。
可选地,可以基于默认设定,将所有的解码后的第一预设数量的图像帧作为待编辑图像帧。例如,针对解码后的第一预设数量的图像帧1~2,将图像帧1和图像帧2作为待编辑图像帧。
可选地,可以从编辑指令中获取用户试图进行编辑的图像帧的标识,并根据试图进行编辑的图像帧的标识,获取待编辑图像帧。例如,针对解码后的第一预设数量的图像帧1~2,若编辑指令中携带有图像帧1的标识,则可以将图像帧1作为待编辑图像;若编辑指令中携带有图像帧2的标识,则可以将图像帧2作为待编辑图像;若编辑指令中携带有图像帧1和图像帧2的标识,则可以将图像帧1和图像帧2作为待编辑图像。
作为一种可能的实现方式,如图5所示,在上述实施例的基础上,上述步骤中对待编辑图像帧进行编辑的具体过程,包括以下步骤:
S501、获取待添加信息以及待添加信息的添加位置。
其中,待添加信息,可以为用户设定的任一信息,例如文字、图像等信息。针对视频播放APP,待添加信息可以为视频名称、视频作者、水印等信息。
其中,待添加信息的添加位置,可以为用户设定的任一位置,例如图像帧的左上角、右下角等信息。
S502、将待添加信息添加至待编辑图像帧的添加位置上。
举例而言,获取到添加信息为升序排序的编号,且待添加信息的添加位置为图像帧的左上角,此种情况下,若待编辑图像帧为图像帧1,则可以将编号1添加至图像帧1的左上角。
进一步地,在完成针对待编辑图像帧的编辑后,可以对待编辑图像帧进行渲染。
作为一种可能的实现方式,如图6所示,在上述实施例的基础上,具体包括以下步骤:
S601、获取待添加信息的展示效果。
其中,展示效果,可以为任一效果,例如闪烁、长亮、飞入、百叶窗式等。
需要说明的是,本公开中对于获取待添加信息的展示效果的具体方式不作限定,可以根据实际情况进行设定。
可选地,可以基于默认设定,获取待添加信息的展示效果。
可选地,可以从编辑指令中获取用户试图进行确定的展示效果。
S602、根据展示效果对待添加信息进行渲染,以获取渲染后的待编辑图像帧。
举例而言,针对将编号1添加至左上角的图像帧1,若获取到展示效果为以0.01s为间隔进行闪烁,则可以展示效果对待添加信息进行渲染,以获取渲染后的待编辑图像帧。
根据本公开实施例的图像处理方法,可以通过增设具有扩展性的借口,使得可以检测编辑指令,并根据编辑指令获取用户输入的自定义的修改内容,进一步提高了图像处理过程中的准确性、可靠性及智能化程度,提升了用户体验。
需要说明的是,本公开提出的图像处理方法适用于多种应用场景,针对视频播放APP应用场景,待展示文件即为待播放的视频,例如,如图7所示,硬盘存储区域7-1中存储有电视剧A的全集,即第1~20集。此种情况下,若用户试图播放电视剧A的第1集,则可以将电视剧A的第1集中的所有帧,即图像帧1~100,作为待展示文件存储于内存的文件缓存区域7-2内。进一步地,可以从电视剧A的第1集中提取图像帧1~2并存储于图像缓存区域7-3内,然后对图像帧1~2进行解码并从图像帧1起开始播放。进一步地,在图像帧1开始播放后,可以从图像帧3~100中提取图像帧3存储于图像缓存区域7-3内进行解码。
综上所述,本公开提出的图像处理方法,区别于如图8所示的相关技术中提出的处理方法,不再需要将硬盘存储区域内的待展示文件加载至内存中之后则全部进行解码,能够基于“时间换空间”的原则进行图像处理,明显降低了图像处理过程中需要占用的内存存储空间,甚至将所占用的内存存储空间降低至相关技术中占用的内存存储空间的几十分之一,有效减少了因剩余内存存储空间较小导致应用程序闪退等情况的发生。进一步地,通过提供扩展性接口,方便开发者等用户对动画等待展示文件进行自定义编辑。
需要说明的是,本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用,均符合相关法律法规的规定,且不违背公序良俗。本公开的意图是,应以使无意或未经授权的使用访问风险最小化的方式来管理和处理个人信息数据。通过限制数据收集并在不再需要时删除数据,从而将风险降到最低。需要说明的是,本公开中与人员有关的所有信息,均在人员知情且同意的情况下收集。
与上述几种实施例提供的图像处理方法相对应,本公开的一个实施例还提供一种图像处理装置,由于本公开实施例提供的图像处理装置与上述几种实施例提供的图像处理方法相对应,因此在图像处理方法的实施方式也适用于本实施例提供的图像处理装置,在本实施例中不再详细描述。
图9是根据本公开一个实施例的图像处理装置的结构示意图。
如图9所示,该图像处理装置900,包括:第一存储模块910、第二存储模块920、解码模块930和第三存储模块940。其中:
第一存储模块910,用于获取任一待展示文件并存储于文件缓存区域内;
第二存储模块920,用于从所述任一待展示文件中提取第一预设数量的图像帧,并将所述第一预设数量的图像帧存储于图像缓存区域内;
解码模块930,用于对所述第一预设数量的图像帧进行解码,并从解码后的第一预设数量的图像帧中提取目标图像帧进行展示;
第三存储模块940,用于在提取所述第一预设数量的图像帧之后,从所述任一待展示文件的剩余图像帧中提取第二预设数量的图像帧,并将所述第二预设数量的图像帧存储于所述图像缓存区域内进行解码。
其中,第一存储模块910,还用于:
响应于检测到针对所述任一待展示文件的展示指令,则根据所述展示指令,获取所述任一待展示文件的文件标识;
根据所述文件标识,从硬盘存储区域中提取所述任一待展示文件并存储于所述文件缓存区域内。
其中,解码模块930,还用于:
获取所述解码后的第一预设数量的图像帧对应的展示顺序;
从所述解码后的第一预设数量的图像帧中选取所述展示顺序最靠前的图像帧作为所述目标图像帧并进行展示。
其中,解码模块930,还用于:
响应于检测到针对所述解码后的第一预设数量的图像帧的编辑指令,则根据所述编辑指令,对所述解码后的第一预设数量的图像帧进行编辑。
其中,解码模块930,还用于:
根据所述编辑指令,从所述解码后的第一预设数量的图像帧中选取待编辑图像帧,并对所述待编辑图像帧进行编辑。
其中,解码模块930,还用于:
获取待添加信息以及所述待添加信息的添加位置;
将所述待添加信息添加至所述待编辑图像帧的所述添加位置上。
其中,解码模块930,还用于:
获取所述待添加信息的展示效果;
根据所述展示效果对所述待添加信息进行渲染,以获取渲染后的待编辑图像帧。
根据本公开实施例的图像处理装置,可以通过获取任一待展示文件并存储于文件缓存区域内,并从任一待展示文件中提取第一预设数量的图像帧,并将第一预设数量的图像帧存储于图像缓存区域内,然后对第一预设数量的图像帧进行解码,并从解码后的第一预设数量的图像帧中提取目标图像帧进行展示,进而在提取第一预设数量的目标图像帧之后,从任一待展示文件的剩余图像帧中提取第二预设数量的图像帧,并将第二预设数量的图像帧存储于图像缓存区域内进行解码。由此,本公开不再依赖在将任一待展示文件存储于内存存储区域后,对任一待展示文件的所有图像帧进行解码的方式,能够通过分批解码的方式,达到了节省内存存储空间的目的,减少了因剩余内存存储空间较小导致应用程序闪退等情况的发生,提高了图像处理过程中的效率、准确性和可靠性。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图10示出了可以用来实施本公开的实施例的示例电子设备1000的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图10所示,设备1000包括计算单元1001,其可以根据存储在只读存储器(ROM)1002中的计算机程序或者从存储单元1008加载到随机访问存储器(RAM)1003中的计算机程序,来执行各种适当的动作和处理。在RAM 1003中,还可存储设备1000操作所需的各种程序和数据。计算单元1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。
设备1000中的多个部件连接至I/O接口1005,包括:输入单元1006,例如键盘、鼠标等;输出单元1007,例如各种类型的显示器、扬声器等;存储单元1008,例如磁盘、光盘等;以及通信单元1009,例如网卡、调制解调器、无线通信收发机等。通信单元1009允许设备1000通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元1001可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1001的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1001执行上文所描述的各个方法和处理,例如本公开第一方面实施例所述的图像处理方法。例如,在一些实施例中,图像处理方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1008。在一些实施例中,计算机程序的部分或者全部可以经由ROM 1002和/或通信单元1009而被载入和/或安装到设备1000上。当计算机程序加载到RAM 1003并由计算单元1001执行时,可以执行上文描述的图像处理方法的一个或多个步骤。备选地,在其他实施例中,计算单元1001可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行本公开第一方面实施例所述的图像处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程人物图像的修复装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、互联网以及区块链网络。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务端可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务(“Virtual Private Server”,或简称“VPS”)中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
本公开还提供一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时,实现如本公开第一方面实施例所述的图像处理方法。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (14)

1.一种图像处理方法,包括:
响应于检测到针对任一待展示文件的展示指令,则根据所述展示指令,获取所述任一待展示文件的文件标识;
根据所述文件标识,从硬盘存储区域中提取所述任一待展示文件并存储于所述文件缓存区域内,其中,存储于所述文件缓存区域内的所述任一待展示文件为压缩文件;
从所述任一待展示文件中提取第一预设数量的图像帧,并将所述第一预设数量的图像帧存储于图像缓存区域内;
对所述第一预设数量的图像帧进行解码,并从解码后的第一预设数量的图像帧中提取目标图像帧进行展示;
在提取所述第一预设数量的图像帧之后,从所述任一待展示文件的剩余图像帧中提取第二预设数量的图像帧,并将所述第二预设数量的图像帧存储于所述图像缓存区域内进行解码。
2.根据权利要求1所述的图像处理方法,其中,所述从解码后的第一预设数量的图像帧中提取目标图像帧进行展示,包括:
获取所述解码后的第一预设数量的图像帧对应的展示顺序;
从所述解码后的第一预设数量的图像帧中选取所述展示顺序最靠前的图像帧作为所述目标图像帧并进行展示。
3.根据权利要求1或2所述的图像处理方法,其中,所述对所述第一预设数量的图像帧进行解码之后,还包括:
响应于检测到针对所述解码后的第一预设数量的图像帧的编辑指令,则根据所述编辑指令,对所述解码后的第一预设数量的图像帧进行编辑。
4.根据权利要求3所述的图像处理方法,其中,所述根据所述编辑指令,对所述解码后的第一预设数量的图像帧进行编辑,包括:
根据所述编辑指令,从所述解码后的第一预设数量的图像帧中选取待编辑图像帧,并对所述待编辑图像帧进行编辑。
5.根据权利要求4所述的图像处理方法,其中,所述对所述待编辑图像帧进行编辑,包括:
获取待添加信息以及所述待添加信息的添加位置;
将所述待添加信息添加至所述待编辑图像帧的所述添加位置上。
6.根据权利要求5所述的图像处理方法,其中,还包括:
获取所述待添加信息的展示效果;
根据所述展示效果对所述待添加信息进行渲染,以获取渲染后的待编辑图像帧。
7.一种图像处理装置,包括:
第一存储模块,用于获取任一待展示文件并存储于文件缓存区域内;
第二存储模块,用于从所述任一待展示文件中提取第一预设数量的图像帧,并将所述第一预设数量的图像帧存储于图像缓存区域内;
解码模块,用于对所述第一预设数量的图像帧进行解码,并从解码后的第一预设数量的图像帧中提取目标图像帧进行展示;
第三存储模块,用于在提取所述第一预设数量的图像帧之后,从所述任一待展示文件的剩余图像帧中提取第二预设数量的图像帧,并将所述第二预设数量的图像帧存储于所述图像缓存区域内进行解码;
所述第一存储模块,还用于:
响应于检测到针对所述任一待展示文件的展示指令,则根据所述展示指令,获取所述任一待展示文件的文件标识;
根据所述文件标识,从硬盘存储区域中提取所述任一待展示文件并存储于所述文件缓存区域内,其中,存储于所述文件缓存区域内的所述任一待展示文件为压缩文件。
8.根据权利要求7所述的图像处理装置,其中,所述解码模块,还用于:
获取所述解码后的第一预设数量的图像帧对应的展示顺序;
从所述解码后的第一预设数量的图像帧中选取所述展示顺序最靠前的图像帧作为所述目标图像帧并进行展示。
9.根据权利要求7或8所述的图像处理装置,其中,所述解码模块,还用于:
响应于检测到针对所述解码后的第一预设数量的图像帧的编辑指令,则根据所述编辑指令,对所述解码后的第一预设数量的图像帧进行编辑。
10.根据权利要求9所述的图像处理装置,其中,所述解码模块,还用于:
根据所述编辑指令,从所述解码后的第一预设数量的图像帧中选取待编辑图像帧,并对所述待编辑图像帧进行编辑。
11.根据权利要求10所述的图像处理装置,其中,所述解码模块,还用于:
获取待添加信息以及所述待添加信息的添加位置;
将所述待添加信息添加至所述待编辑图像帧的所述添加位置上。
12.根据权利要求11所述的图像处理装置,其中,所述解码模块,还用于:
获取所述待添加信息的展示效果;
根据所述展示效果对所述待添加信息进行渲染,以获取渲染后的待编辑图像帧。
13.一种电子设备,其特征在于,包括处理器和存储器;
其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如权利要求1-6中任一项所述的图像处理方法。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一项所述的图像处理方法。
CN202111566709.4A 2021-12-20 2021-12-20 图像处理方法、装置及电子设备 Active CN114363627B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111566709.4A CN114363627B (zh) 2021-12-20 2021-12-20 图像处理方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111566709.4A CN114363627B (zh) 2021-12-20 2021-12-20 图像处理方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN114363627A CN114363627A (zh) 2022-04-15
CN114363627B true CN114363627B (zh) 2024-01-19

Family

ID=81101763

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111566709.4A Active CN114363627B (zh) 2021-12-20 2021-12-20 图像处理方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN114363627B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06208658A (ja) * 1993-01-08 1994-07-26 Toshiba Corp 文書作成装置
US5701158A (en) * 1996-03-04 1997-12-23 Mitsubishi Denki Kabushiki Kaisha Digital image decoding apparatus
JP2004214970A (ja) * 2002-12-27 2004-07-29 Sumitomo Electric Ind Ltd 画像表示システム、画像表示方法及び画像処理装置
JP2010021677A (ja) * 2008-07-09 2010-01-28 Casio Hitachi Mobile Communications Co Ltd 端末装置及びプログラム
CN109005447A (zh) * 2018-08-10 2018-12-14 高新兴科技集团股份有限公司 一种安防高清录像倒播方法及装置
CN111866419A (zh) * 2019-04-24 2020-10-30 杭州海康微影传感科技有限公司 热成像图像显示方法、装置及热成像设备
CN113032339A (zh) * 2019-12-09 2021-06-25 腾讯科技(深圳)有限公司 图像处理方法、装置、电子设备及计算机可读存储介质
WO2021217398A1 (zh) * 2020-04-28 2021-11-04 深圳市大疆创新科技有限公司 图像的处理方法及装置、可移动平台及其控制终端、计算机可读存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9648325B2 (en) * 2007-06-30 2017-05-09 Microsoft Technology Licensing, Llc Video decoding implementations for a graphics processing unit
US8947448B2 (en) * 2009-12-24 2015-02-03 Sony Corporation Image processing device, image data generation device, image processing method, image data generation method, and data structure of image file

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06208658A (ja) * 1993-01-08 1994-07-26 Toshiba Corp 文書作成装置
US5701158A (en) * 1996-03-04 1997-12-23 Mitsubishi Denki Kabushiki Kaisha Digital image decoding apparatus
JP2004214970A (ja) * 2002-12-27 2004-07-29 Sumitomo Electric Ind Ltd 画像表示システム、画像表示方法及び画像処理装置
JP2010021677A (ja) * 2008-07-09 2010-01-28 Casio Hitachi Mobile Communications Co Ltd 端末装置及びプログラム
CN109005447A (zh) * 2018-08-10 2018-12-14 高新兴科技集团股份有限公司 一种安防高清录像倒播方法及装置
CN111866419A (zh) * 2019-04-24 2020-10-30 杭州海康微影传感科技有限公司 热成像图像显示方法、装置及热成像设备
CN113032339A (zh) * 2019-12-09 2021-06-25 腾讯科技(深圳)有限公司 图像处理方法、装置、电子设备及计算机可读存储介质
WO2021217398A1 (zh) * 2020-04-28 2021-11-04 深圳市大疆创新科技有限公司 图像的处理方法及装置、可移动平台及其控制终端、计算机可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
朱海涛.基于TMS320DM642的MPEG-4视频解码的软件优化.《中国有线电视》.2005,全文. *

Also Published As

Publication number Publication date
CN114363627A (zh) 2022-04-15

Similar Documents

Publication Publication Date Title
CN111522967A (zh) 知识图谱构建方法、装置、设备以及存储介质
CN113591864B (zh) 文本识别模型框架的训练方法、装置及系统
CN113657395B (zh) 文本识别方法、视觉特征提取模型的训练方法及装置
US12118770B2 (en) Image recognition method and apparatus, electronic device and readable storage medium
CN112989970A (zh) 文档版面分析方法、装置、电子设备及可读存储介质
CN113657289A (zh) 阈值估计模型的训练方法、装置和电子设备
CN113656587A (zh) 文本分类方法、装置、电子设备及存储介质
JP2023060846A (ja) モデル決定方法、装置、電子機器及びメモリ
CN113691864A (zh) 视频剪辑方法、装置、电子设备和可读存储介质
CN114330249A (zh) 信息的编辑方法、装置、设备以及存储介质
CN116257690A (zh) 一种资源推荐方法、装置、电子设备和存储介质
JP7309811B2 (ja) データ注釈方法、装置、電子機器および記憶媒体
CN114547252A (zh) 文本识别方法、装置、电子设备和介质
CN117743577A (zh) 文本分类方法、装置、电子设备及存储介质
CN114363627B (zh) 图像处理方法、装置及电子设备
CN116761020A (zh) 视频处理方法、装置、设备和介质
CN115186738B (zh) 模型训练方法、装置和存储介质
CN113010721B (zh) 一种图片审核方法、装置、电子设备及存储介质
CN113032251B (zh) 应用程序服务质量的确定方法、设备和存储介质
CN114494950A (zh) 视频处理方法、装置、电子设备及存储介质
CN114842541A (zh) 模型的训练及人脸识别方法、装置、设备以及存储介质
CN114119374A (zh) 图像处理方法、装置、设备以及存储介质
CN113360712B (zh) 视频表示的生成方法、装置和电子设备
CN115934181B (zh) 数据加载方法、装置、电子设备和存储介质
CN112988688B (zh) 一种图片共享方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant