CN113742630A - 图像处理方法、电子设备及计算机存储介质 - Google Patents

图像处理方法、电子设备及计算机存储介质 Download PDF

Info

Publication number
CN113742630A
CN113742630A CN202111087594.0A CN202111087594A CN113742630A CN 113742630 A CN113742630 A CN 113742630A CN 202111087594 A CN202111087594 A CN 202111087594A CN 113742630 A CN113742630 A CN 113742630A
Authority
CN
China
Prior art keywords
action
target object
information
image
processed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111087594.0A
Other languages
English (en)
Other versions
CN113742630B (zh
Inventor
吴翰清
刘洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Innovation Co
Original Assignee
Alibaba Singapore Holdings Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Singapore Holdings Pte Ltd filed Critical Alibaba Singapore Holdings Pte Ltd
Priority to CN202111087594.0A priority Critical patent/CN113742630B/zh
Publication of CN113742630A publication Critical patent/CN113742630A/zh
Application granted granted Critical
Publication of CN113742630B publication Critical patent/CN113742630B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Human Computer Interaction (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请实施例提供了一种图像处理方法、电子设备及计算机存储介质。该方法包括:通过web页面获取第一图像及所述第一图像中待处理的目标对象的信息;确定待应用至所述待处理的目标对象的动作信息,所述动作信息用于指示待执行动作和所述目标对象中执行所述待执行动作的执行部位;对所述待处理的目标对象的信息、以及所述动作信息进行结构化处理,获得结构化数据;获取根据所述结构化数据对所述第一图像中目标对象进行基于所述动作信息的动作迁移所获得的第二图像序列。该方法操作简单而且可以减少对资源的占用,以减少浪费。

Description

图像处理方法、电子设备及计算机存储介质
技术领域
本申请实施例涉及计算机技术领域,尤其涉及一种图像处理方法、电子设备及计算机存储介质。
背景技术
随着深度学习技术的发展和成熟,其在计算机视觉方面的应用也越来越多。一种应用深度学习技术的方式是集成于应用程序(如移动端应用程序或者PC端应用程序)中使用,这使得应用程序占用的空间较多,不仅浪费了存储空间,而且每个使用该应用程序的设备都要进行下载,造成带宽等资源的大量占用和浪费。另一种应用深度学习技术的方式是通过API(应用程序编程接口)调用的方式。这种方式使用难度高,难以普及。
综上,现有技术中基于深度学习技术对图像、视频等进行处理的使用成本高。
发明内容
有鉴于此,本申请实施例提供一种图像处理方案,以至少部分解决上述问题。
根据本申请实施例的第一方面,提供了一种图像处理方法,包括:通过web页面获取第一图像及所述第一图像中待处理的目标对象的信息;确定待应用至所述待处理的目标对象的动作信息,所述动作信息用于指示待执行动作和所述目标对象中执行所述待执行动作的执行部位;对所述待处理的目标对象的信息、以及所述动作信息进行结构化处理,获得结构化数据;获取根据所述结构化数据对所述第一图像中目标对象进行基于所述动作信息的动作迁移所获得的第二图像序列。
根据本申请实施例的第二方面,提供了一种图像处理装置包括:第一获取模块,用于通过web页面获取第一图像及所述第一图像中待处理的目标对象的信息;确定模块,用于确定待应用至所述待处理的目标对象的动作信息,所述动作信息用于指示待执行动作和所述目标对象中执行所述待执行动作的执行部位;第二获取模块,用于对所述待处理的目标对象的信息、以及所述动作信息进行结构化处理,获得结构化数据;第三获取模块,用于获取根据所述结构化数据对所述第一图像中目标对象进行基于所述动作信息的动作迁移所获得的第二图像序列。
根据本申请实施例的第三方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如第一方面所述的图像处理方法对应的操作。
根据本申请实施例的第四方面,提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的图像处理方法。
根据本申请实施例提供的图像处理方案,通过web页面接收使用者添加的第一图像、第一图像中待处理的目标对象的信息、以及待应用至目标对象的动作信息,并对目标对象的信息和动作信息进行结构化处理,以获得结构化数据,这样不需要额外下载和安装应用程序也可以获取根据结构化数据对所述第一图像中目标对象进行基于所述动作信息的动作迁移所获得的第二图像序列,从而减少了资源占用,增加便捷性。此外,第二图像序列使用动作迁移获得,保证了第二图像序列的真实度,避免目标对象执行动作信息指示的动作出现割裂感,从而确保了第二图像序列的观看效果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为根据本申请实施例一的一种图像处理方法的步骤流程图;
图2A为根据本申请实施例二的一种图像处理方法的步骤流程图;
图2B为图2A所示实施例中的一种web页面的示意图;
图2C为图2A所示实施例中的一种web页面展示第一图像的示意图;
图2D为图2A所示实施例中的一种web页面展示弹层的示意图;
图3为根据本申请实施例三的一种图像处理装置的结构框图;
图4为根据本申请实施例五的一种电子设备的结构示意图。
具体实施方式
为了使本领域的人员更好地理解本申请实施例中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请实施例一部分实施例,而不是全部的实施例。基于本申请实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本申请实施例保护的范围。
下面结合本申请实施例附图进一步说明本申请实施例具体实现。
实施例一
在本实施例中,以该方法应用于智能终端,如移动端、PC端或者智能电视、智能音箱等为例进行说明。在一示例性的体系架构中,该体系架构包括前述的智能终端和服务端。智能终端可以用于处理和展示web页面,并接收使用者对web页面的操作。服务端中可以配置能够进行动作迁移的深度学习模型。当然,在其他示例中,体系架构可以不同,如能够进行动作迁移的深度学习模型可以配置在智能终端,本实施例对此不作限制。
在一示例中,使用者可以在web页面中添加包含人物或者其他待处理的目标对象的图像,并为其中的至少一个目标对象的一个或多个执行部位(如头部、手部、腿部等等)配置相应的动作,后续服务端基于深度学习模型对添加的图像进行处理并生成目标对象的各执行部位执行使用者配置的动作的视频或者动态图像,并发送给智能终端。这样使用者只需在web页面中进行配置就可以使用服务端上的深度学习模型进行复杂的图像处理,提升了便捷性和易用性,且不需要额外下载应用程序,减少了资源的占用和浪费。
在本实施例中,如图1所示,该方法包括以下步骤:
步骤S102:通过web页面获取第一图像及所述第一图像中待处理的目标对象的信息。
web页面中可以包含用于添加图像的添加控件,使用者通过操作添加控件可以上传第一图像。第一图像中包含至少一个待处理的目标对象,目标对象例如为真人、动画人物、动物、或者拟人物等。
在一示例中,web页面基于使用者对第一图像中的需要应用动作的目标对象的选择操作可以获得目标对象的信息。目标对象的信息包括下述至少之一:目标对象在第一图像中的坐标或者从第一图像中截取出的目标对象对应的图像部分等,但不限于此,该信息也可以是其他适当的信息。
步骤S104:确定待应用至所述待处理的目标对象中的动作信息。
所述动作信息用于指示待执行动作和所述目标对象中执行所述待执行动作的执行部位。执行部位可以是目标对象中的任何部位,以目标对象是人为例,执行部位例如为头部、手部、腿部、肩部等等。又或者,目标对象是拟人动物,执行部位可以是拟人动物的四肢、头、身体、尾巴等等。待执行动作可以与各执行部位对应,以手部为例可以是摆手、抬手等动作。
需要说明的是,针对目标对象中的不同执行部位可以配置不同的待执行动作,并使各执行部位的待执行动作配合形成更加完整的动作,如配合形成一段舞蹈。
步骤S106:对所述待处理的目标对象的信息、以及所述动作信息进行结构化处理,获得结构化数据。
为了保证能够方便地调用服务端提供的深度学习模型,对待处理的目标对象的信息和动作信息进行结构化处理,以使处理后获得的结构化数据能够满足深度学习模型提供的API接口的规范,从而可以顺利地调用深度学习模型,并将目标对象的信息和动作信息输入到深度学习模型中,使深度学习模型可以顺利地对图像进行处理。
在一示例中,若目标对象的信息为目标对象在第一图像中的坐标,动作信息包括头部对应的待执行动作、手部对应的待执行动作和肩部对应的待执行动作,则按照一种API接口约定的规则,对目标对象的信息和动作信息进行结构化处理获得的结构化数据可以表示为:“执行部位-头部,待执行动作-摆动,方向**,角度**”、“执行部位-手部,待执行动作-摆动,方向**,角度**”、“执行部位-肩部部,待执行动作-摆动,方向**,角度**”。
由于结构化处理后的结构化数据满足深度学习模型提供的API接口约定的规则,因此可以通过调用API接口的方式将结构化数据发送给深度学习模型,以指示深度学习模型对目标对象对应的图像进行处理,并生成目标对象执行配置的待执行动作的第二图像序列(例如,视频或者动态图像等)。
步骤S108:获取根据所述结构化数据对所述第一图像中目标对象进行基于所述动作信息的动作迁移所获得的第二图像序列。
web页面可以获取深度学习模型输出的第二图像序列,以提供给使用者进行查看、或者下载等。其中,第二图像序列可以是深度学习模型根据结构化数据对第一图像中的目标对象基于所述动作信息的动作迁移获得的。换而言之,第二图像序列中的目标对象可以执行动作信息所指示的待执行动作。
通过这种方式使用者可以在不下载额外的应用程序、且不需要配置繁琐的API参数的情况下方便地获得目标对象执行动作信息指示的待执行动作的第二图像序列,由此实现了节省资源、简化操作的效果。
此外,对目标对象进行基于所述动作信息的动作迁移所获得的第二图像序列中的目标对象执行的动作真实感更好,不会使观看者产生割裂感,由此提升了观看体验。
综上,本实施例的图像处理方法通过web页面接收使用者添加的第一图像、第一图像中待处理的目标对象的信息、以及待应用至目标对象的动作信息,并对目标对象的信息和动作信息进行结构化处理,以获得结构化数据,这样不需要额外下载和安装应用程序也可以获取根据结构化数据对所述第一图像中目标对象进行基于所述动作信息的动作迁移所获得的第二图像序列,从而减少了资源占用,增加便捷性。此外,第二图像序列使用动作迁移获得,保证了第二图像序列的真实度,避免目标对象执行动作信息指示的动作出现割裂感,从而确保了第二图像序列的观看效果。
本实施例的图像处理方法可以由任意适当的具有数据处理能力的电子设备执行,包括但不限于:服务器、移动终端(如手机、PAD等)和PC机等。
实施例二
参照图2A,示出了本申请实施例二的图像处理方法的步骤流程图。
本实施例的方法包括以下步骤:
步骤S202:通过web页面获取第一图像及所述第一图像中待处理的目标对象的信息。
图2B示出了一示例中的web页面的示意图。如图2B所示,该web页面包括供使用者添加第一图像的添加控件、展示至少部分第一图像的展示区域等,除此之外,还可以包含供使用者配置动作信息的动作配置界面等。当然,在其他实施例中,该web页面可以包含其他控件或者区域,对此不作限制。
在一可行方式中,步骤S202包括以下子步骤:
子步骤S2021:通过web页面获取第一图像,并在所述web页面中展示至少部分所述第一图像。
例如,使用者通过web页面中的添加控件上传第一图像。所述第一图像中包括至少一个待处理的目标对象。具体地,第一图像可以是包含至少一个人的照片或者截图。照片或者截图中的人至少包括人脸,根据需要也可以包括肩部、手部或者腿部等,但并不限定必须包含人的整个身体。
为了方便使用者查看上传的第一图像,并便于从第一图像中选择需要配置动作的目标对象,在web页面的展示区域中展示至少部分第一图像。
子步骤S2022:接收对展示的所述第一图像中的至少一个目标对象的选择操作,并根据所述选择操作确定选择的目标对象的信息。
在一示例中,使用者可以通过框选、点选等选择操作从展示的第一图像中选择需要配置动作的目标对象。目标对象的信息包括下述至少之一:目标对象在第一图像中的坐标、从所述第一图像中截取出所述目标对象对应的图像部分。
例如,选择操作为使用矩形框的框选操作,目标对象的信息可以是根据矩形框的标记点(如左上角点和右下角点)的坐标确定的目标对象在所述第一图像中的坐标。或者,目标对象的信息也可以是从第一图像中截取出的矩形框对应的图像部分。
当然,在其他实施例中框选操作的选择框也可以是其他形状,如使用者在展示的第一图像中绘制出的不规则形状的选择框,本实施例对此不作限制。
使用者可以在展示的第一图像中选择一个或多个目标对象,每个被选择的目标对象均可以获得相应的目标对象的信息。
步骤S204:确定待应用至所述待处理的目标对象的动作信息。
所述动作信息用于指示待执行动作和所述目标对象中执行所述待执行动作的执行部位。
针对使用者选择的每个目标对象均可以为其配置相应的动作信息,不同目标对象的动作信息可以相同或不同,对此不作限制。
一种可行方式中,步骤S204包括以下子步骤:
子步骤S2041:在所述web页面中展示动作配置界面。
动作配置界面可以采用弹窗、浮层、或者弹层的方式展示。例如,图2C示出了以弹层的方式展示的动作配置界面。动作配置界面可以提供不同的方式供使用者配置动作信息,例如,配置详细参数的方式、选择预设动作模板的方式、以及上传驱动视频的方式等。动作配置界面中可以包括前述的一种或一种以上的方式,本实施例对此不作限制。
子步骤S2042:通过所述动作配置界面接收动作配置操作,并根据所述动作配置操作确定待应用至所述待处理的目标对象中的动作信息。
在一示例中,子步骤S2042可以实现为:通过所述动作配置界面接收对所述目标对象中的至少一个执行部位的选择操作、以及对选择的执行部位配置的待执行动作的参数;根据被选择的所述执行部位、以及对被选择的所述执行部位配置的待执行动作的参数,确定所述动作信息。
若使用者选择配置详细参数的方式,则使用者可以在动作配置界面中选择执行部位(如头部、手部、肩部或腿部等),并针对每个执行部位选择其对应的待执行动作的参数。以头部为例,若其待执行动作为摆动,则待执行动作的参数包括但不限于:方向和角度。此种方式中,通过web页面接收对执行部位的选择操作、以及使用者针对每个执行部位配置的待执行动作的参数,以此确定对应的动作信息。
在另一示例中,子步骤S2042可以实现为:通过所述动作配置界面接收对预设的至少一个动作模板的选择操作,所述动作模板用于指示待执行动作的参数和待执行动作与执行部位的对应关系;根据被选择的动作模板指示的待执行动作的参数和待执行动作与执行部位的对应关系,确定所述动作信息。
若使用者选择应用预设的动作模板,则可以在动作配置界面中展示预设的一个或多个动作模板,以供使用者查看。此外,动作配置界面中可以设置供使用者预览动作模板的预览界面,当使用者点击某个动作模板时在预览界面中播放动作目标指示的动作(一段跳舞的视频)。每个动作模板中可以包括至少一个执行部位、以及各执行部位对应的待执行动作的参数,如按照时序将舞蹈动作拆分为各个执行部位对应的待执行动作,该动作模板可以作为动作信息。这样使用者选择一个动作模板就可以一次配置多个执行部位以及各执行部位对应的待执行动作的参数,提升了便捷性。
在又一示例中,子步骤S2043可以实现为:通过所述动作配置界面接收添加的动作驱动视频,并根据所述动作驱动视频确定动作信息。
若使用者选择上传驱动视频的方式,则可以通过动作配置界面接收使用者选择的驱动视频。例如,驱动视频可以是人物或者动物跳舞的视频。又或者,驱动视频可以是某个对象比某个手势的视频等,本实施例对此不作限制。该驱动视频可以作为动作信息。
后续针对目标对象可以使用能够实现动作迁移的深度学习模型对其进行处理,以使目标对象执行动作信息所指示的动作。为了能够将目标对象的信息和动作信息传输至深度学习模型,可以执行步骤S206。
步骤S206:对所述待处理的目标对象的信息、以及所述动作信息进行结构化处理,获得结构化数据。
在一种可行方式中,步骤S206可以实现为:按照设定的处理规则,对所述待处理的目标对象的信息、以及所述动作信息进行结构化处理,获得结构化数据。
设定的处理规则可以是需要调用的深度学习模型提供的API接口约定的规则,对于不同的图像处理需求可以使用不同的深度学习模型,在结构化处理时按照使用的深度学习模型对应的API接口约定的规则进行结构化处理,并获得结构化数据。
例如,目标对象的信息为目标对象在第一图像中的坐标,动作信息包括头部对应的待执行动作、手部对应的待执行动作和肩部对应的待执行动作,则按照一种API接口约定的规则,对目标对象的信息和动作信息进行结构化处理获得的结构化数据可以表示为:“执行部位-头部,待执行动作-摆动,方向**,角度**”、“执行部位-手部,待执行动作-摆动,方向**,角度**”、“执行部位-肩部部,待执行动作-摆动,方向**,角度**”。
通过调用深度学习模型的API接口,将结构化数据发送给深度学习模型。以结构化数据中涉及包含目标对象的图像(如第一图像或者是从第一图像中截取出的目标对象对应的图像部分)、以及驱动视频为例,深度学习模型通过学习驱动视频中的特征对目标对象的图像进行处理,从而生成目标对象执行驱动视频中所示动作的第二图像序列。该第二图像序列可以形成视频或者动态图像,本实施例对此不作限制。
需要说明的是,在对目标对象的信息和动作信息进行结构化处理获得结构化数据后,使用者可以在展示第一图像中继续选择新的目标对象从而获得新选择的目标对象的信息,针对新选择的目标对象可以重复上述的步骤204和步骤S206进行处理,在此不再赘述。这样可以支持使用者在需要时方便地增加目标对象,从而提升了使用便捷性。
步骤S208:获取根据所述结构化数据对所述第一图像中目标对象进行基于所述动作信息的动作迁移所获得的第二图像序列。
在一可行方式中,智能终端可以获取第二图像序列,以便在web界面中展示第二图像序列供使用者查看。除此之外,还可以在web页面中提供下载选项,供使用者下载第二图像序列。
下面结合前述的图2B~图2D,对图像处理方法进行说明如下:
如图2B所示,使用者通过web页面的添加控件上传第一图像。上传的第一图像在展示区域中展示。使用者可以在展示的第一图像上框选出一个或多个目标对象(例如为目标人物)。在选定后web页面可以获得被选择的目标对象在第一图像上的坐标作为该目标对象的信息,并在web页面中显示用于配置动作信息的弹层(如图2C所示)。
在本使用场景中,弹层展示了三种动作信息的配置方式,分别为:配置待执行动作的执行部位(如全身、头部、腿部或者手臂等)以及执行部位对应的待执行动作的参数的详细参数配置方式、选择应用预设的动作模板的模板配置方式、以及上传驱动视频的视频配置方式。
使用者可以采用上述三种方式中至少之一进行动作信息配置。以选择预设动作模板为例,预设的动作模板中包含了一个或多个执行部位、以及各执行部位对应的待执行动作的参数,使用者选择应用某一动作模板后可以根据该动作模板确定动作信息。或者若使用者上传了一段驱动视频,则可以将该驱动视频作为动作信息。
基于获取的目标对象的信息和动作信息按照需要使用的深度学习模型的API接口约定的规则对其进行结构化处理,获得结构化数据。在获得被选择的各目标对象对应的结构化数据后,可以直接通过调用API接口的方式将结构化数据(其中可以包含第一图像也可以不包含第一图像)发送至服务端,由服务端使用深度学习模型按照结构化数据对包含目标对象的图像进行动作迁移处理,以获得目标对象执行动作信息指示的待执行动作的第二图像序列。
web页面可以从服务端获取第二图像序列,并在其中进行展示以供使用者观看和/或下载。
这种图像处理方式无需使用者下载应用程序,可以直接在web页面中进行操作,而且可以对第一图像中的一个或多个目标对象添加不同的待执行动作,也可以对目标对象中的不同执行部位进行单独配置,提升了个性化程度,且无需占用过多资源。
通过这种方式使用者可以在不下载额外的应用程序、且不需要配置繁琐的API参数的情况下方便地获得目标对象执行动作信息指示的待执行动作的第二图像序列,由此实现了节省资源、简化操作的效果。
此外,对目标对象进行基于所述动作信息的动作迁移所获得的第二图像序列中的目标对象执行的动作真实感更好,不会使观看者产生割裂感,由此提升了观看体验。
综上,本实施例的图像处理方法通过web页面接收使用者添加的第一图像、第一图像中待处理的目标对象的信息、以及待应用至目标对象的动作信息,并对目标对象的信息和动作信息进行结构化处理,以获得结构化数据,这样不需要额外下载和安装应用程序也可以获取根据结构化数据对所述第一图像中目标对象进行基于所述动作信息的动作迁移所获得的第二图像序列,从而减少了资源占用,增加便捷性。此外,第二图像序列使用动作迁移获得,保证了第二图像序列的真实度,避免目标对象执行动作信息指示的动作出现割裂感,从而确保了第二图像序列的观看效果。
实施例三
参照图3,示出了本申请的实施例三的图像处理装置的结构框图。
在本实施例中,图像处理装置包括:
第一获取模块302,用于通过web页面获取第一图像及所述第一图像中待处理的目标对象的信息;
确定模块304,用于确定待应用至所述待处理的目标对象的动作信息,所述动作信息用于指示待执行动作和所述目标对象中执行所述待执行动作的执行部位;
第二获取模块306,用于对所述待处理的目标对象的信息、以及所述动作信息进行结构化处理,获得结构化数据;
第三获取模块308,用于获取根据所述结构化数据对所述第一图像中目标对象进行基于所述动作信息的动作迁移所获得的第二图像序列。
可选地,所述第一获取模块302用于通过web页面获取第一图像,并在所述web页面中展示至少部分所述第一图像,所述第一图像中包括至少一个待处理的目标对象;接收对展示的所述第一图像中的至少一个目标对象的选择操作,并根据所述选择操作确定选择的目标对象的信息,所述目标对象的信息包括下述至少之一:所述目标对象在所述第一图像中的坐标、从所述第一图像中截取出所述目标对象对应的图像部分。
可选地,所述确定模块304用于在所述web页面中展示动作配置界面;通过所述动作配置界面接收动作配置操作,并根据所述动作配置操作确定待应用至所述待处理的目标对象中的动作信息。
可选地,所述确定模块304用于在通过所述动作配置界面接收动作配置操作,并根据所述动作配置操作确定待应用至所述待处理的目标对象中的动作信息时,通过所述动作配置界面接收对所述目标对象中的至少一个执行部位的选择操作、以及对选择的执行部位配置的待执行动作的参数;根据被选择的所述执行部位、以及对被选择的所述执行部位配置的待执行动作的参数,确定所述动作信息。
可选地,所述确定模块304用于在通过所述动作配置界面接收动作配置操作,并根据所述动作配置操作确定待应用至所述待处理的目标对象中的动作信息时,通过所述动作配置界面接收对预设的至少一个动作模板的选择操作,所述动作模板用于指示待执行动作的参数和待执行动作与执行部位的对应关系;根据被选择的动作模板指示的待执行动作的参数和待执行动作与执行部位的对应关系,确定所述动作信息。
可选地,所述确定模块304用于在通过所述动作配置界面接收动作配置操作,并根据所述动作配置操作确定待应用至所述待处理的目标对象中的动作信息时,通过所述动作配置界面接收添加的动作驱动视频,并根据所述动作驱动视频确定动作信息。
可选地,所述第二获取模块306用于按照设定的处理规则,对所述待处理的目标对象的信息、以及所述动作信息进行结构化处理,获得结构化数据。
本实施例的图像处理装置用于实现前述多个方法实施例中相应的图像处理方法,并具有相应的方法实施例的有益效果,在此不再赘述。此外,本实施例的图像处理装置中的各个模块的功能实现均可参照前述方法实施例中的相应部分的描述,在此亦不再赘述。
实施例四
参照图4,示出了根据本申请实施例四的一种电子设备的结构示意图,本申请具体实施例并不对电子设备的具体实现做限定。
如图4所示,该电子设备可以包括:处理器(processor)402、通信接口(Communications Interface)404、存储器(memory)406、以及通信总线408。
其中:
处理器402、通信接口404、以及存储器406通过通信总线408完成相互间的通信。
通信接口404,用于与其它电子设备或服务器进行通信。
处理器402,用于执行程序410,具体可以执行上述图像处理方法实施例中的相关步骤。
具体地,程序410可以包括程序代码,该程序代码包括计算机操作指令。
处理器402可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本申请实施例的一个或多个集成电路。智能设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器406,用于存放程序410。存储器406可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序410具体可以用于使得处理器402执行前述图像处理方法对应的操作。
程序410中各步骤的具体实现可以参见上述图像处理方法实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
本申请实施例还提供了一种计算机程序产品,包括计算机指令,该计算机指令指示计算设备执行上述多个方法实施例中的任一图像处理方法对应的操作。
需要指出,根据实施的需要,可将本申请实施例中描述的各个部件/步骤拆分为更多部件/步骤,也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤,以实现本申请实施例的目的。
上述根据本申请实施例的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的图像处理方法。此外,当通用计算机访问用于实现在此示出的图像处理方法的代码时,代码的执行将通用计算机转换为用于执行在此示出的图像处理方法的专用计算机。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请实施例的范围。
以上实施方式仅用于说明本申请实施例,而并非对本申请实施例的限制,有关技术领域的普通技术人员,在不脱离本申请实施例的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本申请实施例的范畴,本申请实施例的专利保护范围应由权利要求限定。

Claims (10)

1.一种图像处理方法,包括:
通过web页面获取第一图像及所述第一图像中待处理的目标对象的信息;
确定待应用至所述待处理的目标对象的动作信息,所述动作信息用于指示待执行动作和所述目标对象中执行所述待执行动作的执行部位;
对所述待处理的目标对象的信息、以及所述动作信息进行结构化处理,获得结构化数据;
获取根据所述结构化数据对所述第一图像中目标对象进行基于所述动作信息的动作迁移所获得的第二图像序列。
2.根据权利要求1所述的方法,其中,所述通过web页面获取第一图像及所述第一图像中待处理的目标对象的信息,包括:
通过web页面获取第一图像,并在所述web页面中展示至少部分所述第一图像,所述第一图像中包括至少一个待处理的目标对象;
接收对展示的所述第一图像中的至少一个目标对象的选择操作,并根据所述选择操作确定选择的目标对象的信息,所述目标对象的信息包括下述至少之一:所述目标对象在所述第一图像中的坐标、从所述第一图像中截取出所述目标对象对应的图像部分。
3.根据权利要求1所述的方法,其中,所述确定待应用至所述待处理的目标对象的动作信息,包括:
在所述web页面中展示动作配置界面;
通过所述动作配置界面接收动作配置操作,并根据所述动作配置操作确定待应用至所述待处理的目标对象中的动作信息。
4.根据权利要求3所述的方法,其中,所述通过所述动作配置界面接收动作配置操作,并根据所述动作配置操作确定待应用至所述待处理的目标对象中的动作信息,包括:
通过所述动作配置界面接收对所述目标对象中的至少一个执行部位的选择操作、以及对选择的执行部位配置的待执行动作的参数;
根据被选择的所述执行部位、以及对被选择的所述执行部位配置的待执行动作的参数,确定所述动作信息。
5.根据权利要求3所述的方法,其中,所述通过所述动作配置界面接收动作配置操作,并根据所述动作配置操作确定待应用至所述待处理的目标对象中的动作信息,包括:
通过所述动作配置界面接收对预设的至少一个动作模板的选择操作,所述动作模板用于指示待执行动作的参数和待执行动作与执行部位的对应关系;
根据被选择的动作模板指示的待执行动作的参数和待执行动作与执行部位的对应关系,确定所述动作信息。
6.根据权利要求3所述的方法,其中,所述通过所述动作配置界面接收动作配置操作,并根据所述动作配置操作确定待应用至所述待处理的目标对象中的动作信息,包括:
通过所述动作配置界面接收添加的动作驱动视频,并根据所述动作驱动视频确定动作信息。
7.根据权利要求1所述的方法,其中,所述对所述待处理的目标对象的信息、以及所述动作信息进行结构化处理,获得结构化数据,包括:
按照设定的处理规则,对所述待处理的目标对象的信息、以及所述动作信息进行结构化处理,获得结构化数据。
8.一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的图像处理方法对应的操作。
9.一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1-7中任一所述的图像处理方法。
10.一种计算机程序产品,包括计算机指令,所述计算机指令指示计算设备执行如权利要求1-7中任一所述的图像处理方法对应的操作。
CN202111087594.0A 2021-09-16 2021-09-16 图像处理方法、电子设备及计算机存储介质 Active CN113742630B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111087594.0A CN113742630B (zh) 2021-09-16 2021-09-16 图像处理方法、电子设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111087594.0A CN113742630B (zh) 2021-09-16 2021-09-16 图像处理方法、电子设备及计算机存储介质

Publications (2)

Publication Number Publication Date
CN113742630A true CN113742630A (zh) 2021-12-03
CN113742630B CN113742630B (zh) 2023-12-15

Family

ID=78739354

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111087594.0A Active CN113742630B (zh) 2021-09-16 2021-09-16 图像处理方法、电子设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN113742630B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017156982A (ja) * 2016-03-02 2017-09-07 コニカミノルタ株式会社 画像変換プログラム及び画像変換装置並びに画像変換方法
CN107169135A (zh) * 2017-06-12 2017-09-15 广州市动景计算机科技有限公司 图像处理方法、装置和电子设备
CN109582136A (zh) * 2018-11-13 2019-04-05 深圳市创凯智能股份有限公司 三维窗口手势导航方法、装置、移动终端及存储介质
CN109978975A (zh) * 2019-03-12 2019-07-05 深圳市商汤科技有限公司 一种动作的迁移方法及装置、计算机设备
CN110032597A (zh) * 2018-11-30 2019-07-19 阿里巴巴集团控股有限公司 应用程序操作行为的可视化处理方法及装置
CN111566664A (zh) * 2017-12-29 2020-08-21 赫尔环球有限公司 用于生成用于机器学习的合成图像数据的方法、设备和系统
JP2020140283A (ja) * 2019-02-27 2020-09-03 国立大学法人東海国立大学機構 情報処理装置、情報処理方法、および、コンピュータプログラム
WO2020228406A1 (zh) * 2019-05-15 2020-11-19 北京字节跳动网络技术有限公司 图像风格化生成方法、装置及电子设备
US20200380660A1 (en) * 2018-07-12 2020-12-03 Tencent Technology (Shenzhen) Company Limited Image processing method and apparatus, computer-readable medium, and electronic device
CN112560605A (zh) * 2020-12-02 2021-03-26 北京字节跳动网络技术有限公司 交互方法、装置、终端、服务器和存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017156982A (ja) * 2016-03-02 2017-09-07 コニカミノルタ株式会社 画像変換プログラム及び画像変換装置並びに画像変換方法
CN107169135A (zh) * 2017-06-12 2017-09-15 广州市动景计算机科技有限公司 图像处理方法、装置和电子设备
CN111566664A (zh) * 2017-12-29 2020-08-21 赫尔环球有限公司 用于生成用于机器学习的合成图像数据的方法、设备和系统
US20200380660A1 (en) * 2018-07-12 2020-12-03 Tencent Technology (Shenzhen) Company Limited Image processing method and apparatus, computer-readable medium, and electronic device
CN109582136A (zh) * 2018-11-13 2019-04-05 深圳市创凯智能股份有限公司 三维窗口手势导航方法、装置、移动终端及存储介质
CN110032597A (zh) * 2018-11-30 2019-07-19 阿里巴巴集团控股有限公司 应用程序操作行为的可视化处理方法及装置
JP2020140283A (ja) * 2019-02-27 2020-09-03 国立大学法人東海国立大学機構 情報処理装置、情報処理方法、および、コンピュータプログラム
CN109978975A (zh) * 2019-03-12 2019-07-05 深圳市商汤科技有限公司 一种动作的迁移方法及装置、计算机设备
WO2020228406A1 (zh) * 2019-05-15 2020-11-19 北京字节跳动网络技术有限公司 图像风格化生成方法、装置及电子设备
CN112560605A (zh) * 2020-12-02 2021-03-26 北京字节跳动网络技术有限公司 交互方法、装置、终端、服务器和存储介质

Also Published As

Publication number Publication date
CN113742630B (zh) 2023-12-15

Similar Documents

Publication Publication Date Title
US11450350B2 (en) Video recording method and apparatus, video playing method and apparatus, device, and storage medium
CN110058685B (zh) 虚拟对象的显示方法、装置、电子设备和计算机可读存储介质
CN111433743B (zh) 一种app远程控制方法及相关设备
CN113099298B (zh) 虚拟形象的改变方法、装置和终端设备
CN108765520B (zh) 文本信息的渲染方法和装置、存储介质、电子装置
JP7395070B1 (ja) ビデオ処理方法及び装置、電子設備及びコンピュータ読み取り可能な記憶媒体
CN109784011A (zh) 水印生成方法及装置
EP4276738A1 (en) Image display method and apparatus, and device and medium
CN112527115A (zh) 用户形象生成方法、相关装置及计算机程序产品
CN112581635B (zh) 一种通用的快速换脸方法、装置、电子设备和存储介质
CN111583379A (zh) 虚拟模型的渲染方法、装置、存储介质与电子设备
CN108364324B (zh) 图像数据处理方法、装置及电子终端
CN106447756B (zh) 用于生成用户定制的计算机生成动画的方法和系统
JPWO2018203374A1 (ja) 線画自動着色プログラム、線画自動着色装置及びグラフィカルユーザインターフェース用プログラム
CN113034658B (zh) 一种模型贴图的生成方法和装置
WO2023227045A1 (zh) 显示对象的确定方法、装置、电子设备及存储介质
CN113742630B (zh) 图像处理方法、电子设备及计算机存储介质
CN112188087A (zh) 一种全景视频的截图方法、装置、存储介质和计算机设备
CN109905753B (zh) 角标的显示方法和装置、存储介质、电子装置
CN111107264A (zh) 图像处理方法、装置、存储介质以及终端
CN114298895A (zh) 图像真实感风格迁移方法、装置、设备及存储介质
CN114140560A (zh) 动画生成方法、装置、设备和存储介质
CN106331834B (zh) 一种多媒体数据处理方法及其设备
KR20160010780A (ko) 3d 이미지 제공 시스템 및 그 제공방법
US20230343038A1 (en) Method and system for creating augmented reality filters on mobile devices

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240313

Address after: 51 Belarusian Pasha Road, Singapore, Lai Zan Da Building 1 # 03-06, Postal Code 189554

Patentee after: Alibaba Innovation Co.

Country or region after: Singapore

Address before: Room 01, 45th Floor, AXA Building, 8 Shanton Road, Singapore

Patentee before: Alibaba Singapore Holdings Ltd.

Country or region before: Singapore

TR01 Transfer of patent right