CN117252942A - 图像生成方法、装置、电子设备及存储介质 - Google Patents

图像生成方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN117252942A
CN117252942A CN202311197816.3A CN202311197816A CN117252942A CN 117252942 A CN117252942 A CN 117252942A CN 202311197816 A CN202311197816 A CN 202311197816A CN 117252942 A CN117252942 A CN 117252942A
Authority
CN
China
Prior art keywords
image
generation
image generation
time
guide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311197816.3A
Other languages
English (en)
Inventor
令可欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Netease Hangzhou Network Co Ltd
Original Assignee
Netease Hangzhou Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Netease Hangzhou Network Co Ltd filed Critical Netease Hangzhou Network Co Ltd
Priority to CN202311197816.3A priority Critical patent/CN117252942A/zh
Publication of CN117252942A publication Critical patent/CN117252942A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/001Texturing; Colouring; Generation of texture or colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04845Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range for image manipulation, e.g. dragging, rotation, expansion or change of colour

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请提供了一种图像生成方法、装置、电子设备及存储介质,其中,该方法包括:执行图像预生成,根据图像预生成过程中的时间信息,确定图像生成的等待时长;获取预设的引导词集合,并按照等待时长,依次根据各引导词集合中的引导词,生成与各引导词对应的多个图像,其中,引导词集合包括顺序排列的多个引导词。本申请能够通过优化图像生成时间、自定义引导词集合提高图像生成效率,进而提升图像生成软件的图像生成效果。

Description

图像生成方法、装置、电子设备及存储介质
技术领域
本申请涉及人工智能技术领域,具体而言,涉及一种图像生成方法、装置、电子设备及存储介质。
背景技术
随着人工智能技术的愈加成熟,基于人工智能技术生成新图像的图像生成软件的应用也愈加广泛。
由于使用图像生成软件需要一定的等待时间才能得到最终结果,为了减少图像生成过程中所需的时间成本,批量生成图像,现有方案在图像生成软件中整合插件服务,其核心内容是能够实现某个单一标签的替换,替换方式采用随机抽取,从而可以生成一批相似图像。
基于上述方法虽然能够实现图像的批量生成,但上述插件服务只适用于特定的图像生成软件,适用范围较小,并且生成的图像也受限于预定义的模板,自定义能力较差,从而导致图像生成软件的图像生成的效果不佳。
发明内容
本申请的目的在于,针对上述现有技术中的不足,提供一种图像生成方法、装置、电子设备及存储介质,以解决现有技术中图像生成软件的图像生成的效果不佳的问题。
为实现上述目的,本申请实施例采用的技术方案如下:
第一方面,本申请实施例提供了一种图像生成方法,所述方法包括:
执行图像预生成,并根据图像预生成过程中的时间信息,确定图像生成的等待时长;
获取预设的引导词集合,并按照所述等待时长,依次根据各所述引导词集合中的引导词,生成与各所述引导词对应的多个图像,其中,所述引导词集合包括顺序排列的多个引导词。
作为一种可能的实现方式,所述方法还包括:响应于预设的选中操作,获取当前界面图像,对所述当前界面图像进行图像识别,得到所述当前界面图像中的选中位置,将所述选中位置作为所述当前界面图像对应的当前图像生成步骤的操作位置。
作为一种可能的实现方式,所述执行图像预生成,包括:
获取多个选中操作及所述选中操作对应的操作顺序;
基于所述多个选中操作及所述选中操作对应的操作顺序确定图像生成步骤;
响应于执行图像预生成的执行命令,针对执行到的当前图像生成步骤,获取所述当前图像生成步骤对应的操作位置,并基于所述操作位置执行所述当前图像生成步骤对应的图像预生成。
作为一种可能的实现方式,所述对所述当前界面图像进行图像识别,得到所述当前界面图像中的选中位置,包括:
基于所述选中操作,确定所述当前图像生成步骤对应的操作位置是否位于所述选中操作所在组件的边缘;
若是,则将所述组件的中心位置作为所述选中位置。
作为一种可能的实现方式,所述根据图像预生成过程中的时间信息,确定图像生成的等待时长,包括:
响应于输入第一引导词的操作,记录第一时间;
响应于生成指令,记录第二时间,所述生成指令用于指示根据所述第一引导词生成第一图像;
根据所述第一时间和所述第二时间计算并记录所述等待时长。
作为一种可能的实现方式,所述响应于生成指令,记录第二时间,包括:
按照预设间隔时间对所述第一图像执行打开操作;
响应于所述第一图像成功打开,记录所述第二时间。
作为一种可能的实现方式,判断图像是否成功打开的判断条件包括:在图像生成界面范围内查找是否存在遮挡的图像区域坐标,若存在,则确定图像成功打开。
作为一种可能的实现方式,所述生成与各所述引导词对应的多个图像之后,所述方法还包括:
获取图像生成位置以及保存操作位置;
响应于保存指令,按照所述图像生成位置获取图像,基于所述保存操作位置保存图像。
作为一种可能的实现方式,所述获取图像生成位置以及保存操作位置,包括:
在执行图形预生成或图像生成时,获取图像生成位置以及保存操作位置。
第二方面,本申请实施例提供了一种图像生成装置,所述装置包括:
执行模块,用于执行图像预生成,并根据图像预生成过程中的时间信息,确定图像生成的等待时长;
生成模块,用于获取预设的引导词集合,并按照所述等待时长,依次根据各所述引导词集合中的引导词,生成与各所述引导词对应的多个图像,其中,所述引导词集合包括顺序排列的多个引导词。
作为一种可能的实现方式,所述执行模块还用于:
响应于预设的选中操作,获取当前界面图像,对所述当前界面图像进行图像识别,得到所述当前界面图像中的选中位置,将所述选中位置作为所述当前界面图像对应的当前图像生成步骤的操作位置。
作为一种可能的实现方式,所述执行模块具体用于:
获取多个选中操作及所述选中操作对应的操作顺序;
基于所述多个选中操作及所述选中操作对应的操作顺序确定图像生成步骤;
响应于执行图像预生成的执行命令,针对执行到的当前图像生成步骤,获取所述当前图像生成步骤对应的操作位置,并基于所述操作位置执行所述当前图像生成步骤对应的图像预生成。
作为一种可能的实现方式,所述执行模块还用于:
基于所述选中操作,确定所述当前图像生成步骤对应的操作位置是否位于所述选中操作所在组件的边缘;
若是,则将所述组件的中心位置作为所述选中位置。
作为一种可能的实现方式,所述执行模块还用于:
响应于输入第一引导词的操作,记录第一时间;
响应于生成指令,记录第二时间,所述生成指令用于指示根据所述第一引导词生成第一图像;
根据所述第一时间和所述第二时间计算并记录所述等待时长。
作为一种可能的实现方式,所述执行模块还用于:
按照预设间隔时间对所述第一图像执行打开操作;
响应于所述第一图像成功打开,记录所述第二时间。
作为一种可能的实现方式,判断图像是否成功打开的判断条件包括:在图像生成界面范围内查找是否存在遮挡的图像区域坐标,若存在,则确定图像成功打开。
作为一种可能的实现方式,所述生成模块还用于:
获取图像生成位置以及保存操作位置;
响应于保存指令,按照所述图像生成位置获取图像,基于所述保存操作位置保存图像。
作为一种可能的实现方式,所述生成模块还用于:
在执行图形预生成或图像生成时,获取图像生成位置以及保存操作位置。
第三方面,本申请实施例提供了一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如上述第一方面任一所述的图像生成方法的步骤。
第四方面,本申请实施例提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述第一方面任一所述的图像生成方法的步骤。
根据本申请实施例的图像生成方法、装置、电子设备及存储介质,执行图像预生成,以在图像预生成的过程中,根据图像预生成过程中的时间信息,确定图像生成的等待时长。然后,按照等待时长依次根据各引导词集合中的引导词,生成与各引导词对应的多个图像。根据本申请实施例,基于图像预生成,确定图像生成的等待时长,利用等待时长进一步确定下一引导词的读取输入时间,以此避免图像生成过程中浪费时间。此外,各引导词是由用户自定义并预先顺序存储在引导词集合中的,能够避免生成的图像受限于预定义的模板,然后自动执行各图像生成步骤,无需人工操作即可完成图像生成过程。基于此,通过优化图像生成所需的时间成本、避免预定义模板的限制、提高图像生成效率,进而提升了图像生成软件整体的图像生成效果。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例提供的一种图像生成方法的流程示意图;
图2示出了本申请实施例提供的一种图像预生成执行方法的流程示意图;
图3示出了本申请实施例提供的一种选中位置确定方法的流程示意图;
图4示出了本申请实施例提供的一种选中位置的示意图;
图5示出了本申请实施例提供的一种等待时长确定方法的流程图;
图6示出了本申请实施例提供的另一种图像生成方法的流程示意图;
图7示出了本申请实施例提供的一种图像生成装置的结构示意图;
图8示出了本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了使得本领域技术人员能够使用本申请内容,结合特定应用场景“利用图像生成软件生成图像”,给出以下实施方式。对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。虽然本申请主要围绕图像生成进行描述,但是应该理解,这仅是一个示例性实施例。
需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。
在快速生成批量图像时,受硬件性能或网络服务器等因素的影响,不管使用何种图像生成软件都需要一定的等待时间才能得到最终结果,而花费时间等待则降低了工作效率。若为在短时间内得到多个图像同时打开多个页面,则容易导致服务崩溃,并且增加一次性生成图像的数量只能使用同一个引导词集合prompt。
为解决上述问题,现有技术中提出在图像生成软件中整合插件服务,其核心步骤是将某一相同类别的词汇放置在同一个文件中,并将文件放置在指定文件目录中,在用于引导图像生成软件生成特定输出的引导词集合prompt中写入文件的命名,即可使用prompt调用该文件,以抽取文件中的词汇进行替换,从而生成批量的相似图像。此外,该插件服务支持同时调用多个引导词集合,若同时调用了两个引导词集合,则会在两个引导词集合中随机抽取词条进行组合,得到新的引导词集合用于生成图像。其中,抽取次数即为指定的图片生成次数。
基于上述方法虽然能够实现图像的批量生成,但受限于服务平台,只能适用于特定的图像生成软件,适应范围较小。此外,图像生成功能受限于预定义的模板,无法满足一些特定的、高度自定义的图像生成需求,例如想利用夜间时间生成几批完全不同的图像,由于只能适用一个引导词集合,当其中的引导词调用完成,内部循环结束便会停止图像生成,则无法满足上述要求,所以自定义能力也较差。基于此,导致图像生成软件的图像生成的效果不佳。
为了解决上述问题,本申请实施例提供了一种图像生成方法,通过优化图像生成所需的时间成本,自定义引导词集合避免预定义模板的限制的方式提高图像生成效率,从而提升图像生成软件整体的图像生成效果。
图1为本申请实施例提供的图像生成方法的流程示意图,该方法的执行主体为具有计算处理能力的电子设备,如图1所示,该方法包括:
S101、执行图像预生成,并根据图像预生成过程中的时间信息,确定图像生成的等待时长。
作为一种示例,在获知用户实际操作图像生成软件时的具体图像生成步骤,以及所确定的各图像生成步骤对应的操作位置后,可通过编写代码程序,按照各图像生成步骤对应的操作位置编译运行图像生成软件的图像生成过程,以通过编译运行代码的方式实现一次图像预生成。
作为一种示例,图像生成的等待时长指图像生成软件从读取一个引导词集合开始执行图像生成命令到图像生成完成的这一时间段,通过执行图像预生成过程中的时间信息,则很容易确定开始执行图像生成命令与图像生成完成对应的时间点,从而便于确定等待时长。
为了实现图像生成软件的图像生成流程的自动执行,需要在自动执行程序中设定等待时长,以节省图像生成过程中的时间成本。需要注意的是,等待时长若小于图像生成的完成时间,则无法保存到清晰的图像,而等待时长若太过大于图像生成的完成时间,则会导致时间的浪费,并且由于图像生成软件的图像生成时间受硬件、网络等因素的影响,并不稳定,所以在得到根据用户实际操作图像生成软件时各图像生成步骤对应的操作位置之后,基于各操作位置执行一次图像预生成,以自动计算更为合适的等待时长。
基于此,通过一次图像预生成,自动计算图像生成的等待时长,既能保证图像生成的顺利运行和存图质量,又能高效的利用时间。
S102、获取预设的引导词集合,并按照等待时长,依次根据各引导词集合中的引导词,生成与各引导词对应的多个图像,其中,引导词集合包括顺序排列的多个引导词。
作为一种示例,各引导词集合中均包括多个用户自定义的引导词,用户预先建立引导词集合文件,将各引导词集合存储在引导词集合文件中,示例性的,引导词集合文件可以为TXT文件,预先将各引导词集合顺序存储在引导词集合文件中,每个引导词集合占一行,并视每个引导词集合为一次单独的任务执行自动程序,在当前引导词集合对应的生成图像保存完成后,再顺序读取下一引导词集合。
作为一种示例,等待时长确定后将等待时长写入图像生成的自动执行程序中,执行图像生成的自动化流程,并按照等待时长分行、逐条读取各引导词集合中的引导词,自动执行各图像生成步骤,完成各种不同类别的图像生成。其中,由于各引导词集合中引导词的内容由用户自定义,不受模板的限制,所以图像生成也具有更高的灵活性。
因此,根据本申请实施例的图像生成方法,基于图像预生成,确定图像生成的等待时长,利用等待时长进一步确定下一引导词的读取输入时间,以此避免图像生成过程中浪费时间。此外,各引导词是由用户自定义并预先顺序存储在引导词集合文件中的,能够避免生成的图像受限于预定义的模板,然后自动执行各图像生成步骤,无需人工操作即可完成图像生成过程。基于此,通过优化图像生成所需的时间成本、避免预定义模板的限制、提高图像生成效率,进而提升了图像生成软件整体的图像生成效果。
作为一种可能的实现方式,图像预生成可以基于图像生成步骤对应的操作位置执行,所以在执行图像预生成之前,先根据用户实际操作图像生成软件时图像生成软件的界面变化信息,确定图像生成软件的各图像生成步骤对应的操作位置。
示例性的,图像生成软件的界面变化信息包括点击、移动鼠标、执行命令等操作带来的界面显示变化,例如鼠标点击位置的变化、显示界面弹出对话框、出现不同操作界面,不同的图像生成步骤对应不同的显示界面。图像生成步骤对应的操作位置是指需要在显示界面上点击鼠标执行图像生成步骤时鼠标对应的操作区域。
以MidJourney这一图像生成软件为例,图像生成步骤包括:鼠标点击对话框,召唤图像生成命令,输入引导词集合prompt,回车,等待图像生成,鼠标移动,鼠标点击生成的图像,右键点击放大后的图像,鼠标移动,点击“保存图片”对应的操作按钮,输入保存名称,回车确认,esc键返回,鼠标再次点击对话框,开始下一次命令。
其中,“鼠标点击对话框”为一个图像生成步骤,对应的操作位置为对话框所在的位置,“输入引导词集合prompt”为一个图像生成步骤,对应的操作位置为引导词集合输入框所在的位置。诸如此类,每个图像生成步骤具有其对应的操作位置。在用户实际操作图像生成软件,执行图像生成步骤引起界面发生变化时,电子设备会实时记录各图像生成步骤对应的操作位置,以便根据确定好的各图像生成步骤的操作位置,自动执行图像预生成。
需要说明的是,此处仅以MidJourney这一图像生成软件为例,而本申请实施例提供的图像生成方法适用于多个图像生成软件,而不同的图像生成软件对应的各图像生成步骤有所不同,对应的操作位置也会有所变化。
作为一种可能的实现方式,图像生成软件中各图像生成步骤对应的操作位置可以通过对界面图像进行图像识别获取。可选的,响应于预设的选中操作,获取当前界面图像,对当前界面图像进行图像识别,得到当前界面图像中的选中位置,并将选中位置作为当前界面图像对应的当前图像生成步骤的操作位置。
示例性的,预设的选中操作对应鼠标当前位置对应的操作,例如点击鼠标操作。在用户实际操作图像生成软件的过程中,可以对用户是否执行点击鼠标操作进行监测,从而获取执行了点击鼠标操作对应的当前界面图像。具体地,可以通过人工执行和电子设备执行两种方式实现对选中操作的监测。例如用户在实际操作图像生成软件的过程中,可手动记录哪些步骤中需要用户点击鼠标。另外,可编写鼠标监测应用程序,由电子设备执行,监测鼠标点击操作并随时获取鼠标位置。
示例性的,以图像生成软件MidJourney为例,其图像生成过程中“点击对话框、点击生成图像、右键点击放大后的图像”等图像生成步骤,都涉及到用户执行点击鼠标操作,所以上述步骤均对应选中操作。而监测当前图像生成步骤用户是否执行点击鼠标操作,也是为了响应于相应的选中操作,便于截取相应的图像生成步骤的界面图像,以确定图像生成步骤对应的操作位置。
作为一种示例,获取当前界面图像可以采用图像截取的方式,例如使用图像处理库(Python Imaging Library,PIL)的ImageGrab.grab()方法截取当前图像生成步骤的当前界面图像,然后使用跨平台计算机视觉库Open CV的cv2.imread()方法cha找鼠标光标所处位置的目标图像,再调用air cv库的find_template()方法,一种基于Python-opencv2的目标定位,在目标图像中查找与当前界面图像一致的像素位置,识别目标图像在当前界面图像中的坐标位置,即得到了当前界面图像中的鼠标光标位置,并将所确定的鼠标光标位置作为当前图像生成步骤对应的操作位置。
基于此,通过图像识别技术确定当前图像生成步骤对应的操作位置,即确定了鼠标点击的关键点。
作为一种可能的实现方式,如图2所示,上述步骤S101执行图像预生成,具体包括如下步骤:
S201、获取多个选中操作及选中操作对应的操作顺序。
同样的,以上述图像生成软件MidJourney为例,按照操作顺序依次排列的选中操作可以包括:选中并点击对话框,在引导词输入框中输入引导词,选中并点击正在生成的图像,放大正在生成的图像等。
S202、基于多个选中操作及选中操作对应的操作顺序确定图像生成步骤。
示例性的,按照各选中操作对应的操作顺序依次执行各选中操作即代表完整的一次图像生成过程,进而确定了图像生成步骤。由于不同的图像生成软件对应的各图像生成步骤的顺序各不相同,在执行图像预生成时,需要按照图像生成软件的各图像生成步骤的顺序,依次执行各图像生成步骤,避免预先确定的各图像生成步骤对应的操作位置的错乱,导致图像生成失败。
S203、响应于执行图像预生成的执行命令,针对执行到的当前图像生成步骤,获取当前图像生成步骤对应的操作位置,并基于操作位置执行当前图像生成步骤对应的图像预生成。
作为一种示例,图像生成步骤对应的操作位置可能为形状不一的操作框,根据用户实际操作图像生成软件所确定的各图像生成步骤对应的操作位置,容易存在因人为因素导致的不准确问题,进而需要根据图像生成步骤对应的操作位置,更为准确的确定待点击位置,以在待点击位置上执行点击操作,完成图像生成步骤。
作为一种可能的实现方式,如图3所示,可以将对当前界面图像进行图像识别得到的选中位置作为当前界面图像对应的当前图像生成步骤的操作位置,而确定选中位置具体可以包括如下步骤:
S301、基于选中操作,确定当前图像生成步骤对应的操作位置是否位于选中操作所在组件的边缘。
作为一种示例,选中操作所在组件可以为执行选中操作对应的操作框、操作按钮等,所在组件的边缘例如为操作框或操作按钮对应位置的左上角、右上角等边缘区域。
S302、若是,则将组件的中心位置作为选中位置。
作为一种示例,在执行当前图像生成步骤时,若当前图像生成步骤对应的操作位置位于选中操作对应的操作框的边缘,则可以通过加减运算指定更准确的位置作为待点击位置。示例性的,如图4所示,位置1为操作框左上角的边缘位置,可将操作框的中心位置,即位置2作为待点击位置。
基于此,根据当前图像生成步骤对应的操作位置,进而确定更为准确的选中位置,能够避免因人为因素而导致的鼠标点击位置不准确的问题。
作为一种可能的实现方式,如图5所示,上述步骤S101根据图像预生成过程中的时间信息,确定图像生成的等待时长,包括:
S501、响应于输入第一引导词的操作,记录第一时间。
作为一种示例,读取用户自定义的引导词集合,并将引导词集合中的引导词依次输入图像生成软件以启动图像生成,开始执行图像生成命令。由于图像生成的等待时长指图像生成软件从读取一个引导词开始执行图像生成命令到图像生成完成的这一时间段,而第一引导词的输入时间与图像生成的启动时间所差无几,所以在启动图像生成时记录图像生成的启动时间,也即记录输入第一引导词的输入时间。
S502、响应于生成指令,记录第二时间,生成指令用于指示根据第一引导词生成第一图像。
可选的,可以按照预设间隔时间对第一图像执行打开操作,并响应于第一图像成功打开,记录第一图像成功打开的第二时间。作为一种示例,预设间隔时间可以设置为1秒,在各个图像生成软件中,图像未生成前仍处于模糊去噪阶段,因此不支持打开图像查看大图,所以若图像能成功打开则说明图像生成已经完成,并记录图像打开时间。其中,判断图像是否成功打开的判断条件包括:在图像生成软件的界面范围内查找是否存在遮挡的图像区域坐标,若存在,则确定图像成功打开。
S503、根据第一时间和第二时间计算并记录等待时长。
作为一种示例,在输入引导词集合启动图像生成,记录一次图像生成的启动时间,也即第一时间。然后每隔1秒点击一次正在生成的图像,直至图像被成功打开,并记录图像成功打开的时间,也即第二时间,将第一时间与第二时间两者相减即可得到图像生成软件在当前的硬件设备和网络情况下生成一次图像所需的等待时长。
需要注意的是,引导词集合文件中包括顺序排列的多个引导词集合,每个引导词集合中又包括多个引导词,为了避免引导词读取等其他过程中不确定因素的影响,可以在所确定的等待时长的基础上添加预留时间,例如为5秒,作为新的等待时长。
作为一种可能的实现方式,如图6所示,上述步骤S102按照等待时长,依次根据各引导词集合中的引导词,生成与各引导词对应的多个图像,包括:
S601、将当前引导词集合输入图像生成软件中,按照图像生成软件的各图像生成步骤的顺序,依次执行各图像生成步骤。
作为一种示例,以行为单位读取存储在引导词集合文本中的引导词集合,可以利用for循环,每执行一次命令读取一次新的引导词集合,并将读取到的引导词集合对应的字符串发送至图像生成软件中当前鼠标光标所在位置,按照各图像生成步骤的顺序依次执行各图像生成步骤。
S602、针对执行到的当前图像生成步骤,根据当前图像生成步骤对应的操作位置,确定待点击位置,并在待点击位置上执行点击操作,以完成当前图像生成步骤。
作为一种示例,同样的,当前图像生成步骤对应的操作位置可能为形状不一的操作框或操作按钮,由于操作位置是根据用户实际操作图像生成软件所确定的,容易存在因人为因素导致的不准确问题,进而需要根据图像生成步骤对应的操作位置,更为准确的确定待点击位置,示例性的,也可将操作位置所处组件的中心位置作为待点击位置,以在待点击位置上执行点击操作,完成图像生成步骤。
S603、在各图像生成步骤均执行完成后,得到当前引导词集合对应的多个图像。
作为一种示例,按照图像生成软件的各图像生成步骤的执行顺序执行各图像生成步骤之后,即可得到当前引导词集合对应的多个图像,并对所得图像进行命名保存。对于各个引导词集合执行相同的步骤,循环执行直至所有的引导词集合均读取完成,生成多个不同类别的图像时结束命令。
需要说明的是,在执行图像预生成和图像生成时所使用的引导词可以相同也可以不同,并且执行图像预生成旨在确定等待时长,也无需使用多个引导词,而在进行图像生成时,可利用引导词集合中的多个引导词批量生成多个图像。
作为一种示例,在步骤S102生成与各引导词对应的多个图像之后,该方法还包括:获取图像生成位置以及保存操作位置,响应于保存指令,按照图像生成位置获取图像,基于保存操作位置保存图像。
示例性的,图像生成位置指所生成的图像在界面范围内的显示位置,保存操作位置例如为保存图标对应的位置。在生成与各引导词对应的多个图像之后,响应于保存指令,从生成图像的显示位置处获取已经生成好的图像,基于保存操作位置点击保存图标,以将生成好的图像进行保存。其中,图像生成位置以及保存操作位置可以在执行图像预生成或图像生成时获取。
因此,本申请实施例的图像生成方法无需人工操作即可实现自动发送由用户自定义的引导词,等待图像生成完成后自动命名保存。在此过程中,节省了图像生成过程的时间成本,并且具有更高的灵活性和适用性,多个图像生成软件皆可适用。
基于同一发明构思,本申请实施例中还提供了与图像生成方法对应的图像生成装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述图像生成方法相似,因此图像生成装置的实施可以参见方法的实施,重复之处不再赘述。
参照图7所示,为本申请实施例提供的一种图像生成装置的示意图,所述图像生成装置700包括:执行模块701、生成模块702;其中,
执行模块701,用于执行图像预生成,并根据图像预生成过程中的时间信息,确定图像生成的等待时长。
生成模块702,用于获取预设的引导词集合,并按照等待时长,依次根据各引导词集合中的引导词,生成与各引导词对应的多个图像,其中,引导词集合包括顺序排列的多个引导词。
因此,根据本申请实施例的图像生成装置,基于图像预生成,确定图像生成的等待时长,利用等待时长进一步确定下一引导词的读取输入时间,以此避免图像生成过程中浪费时间。此外,各引导词是由用户自定义并预先顺序存储在引导词集合中的,能够避免生成的图像受限于预定义的模板,然后自动执行各图像生成步骤,无需人工操作即可完成图像生成过程。基于此,通过优化图像生成所需的时间成本、避免预定义模板的限制、提高图像生成效率,进而提升了图像生成软件整体的图像生成效果。
作为一种可能的实现方式,上述执行模块701还用于:
响应于预设的选中操作,获取当前界面图像,对当前界面图像进行图像识别,得到当前界面图像中的选中位置,将选中位置作为当前界面图像对应的当前图像生成步骤的操作位置。
作为一种可能的实现方式,上述执行模块701具体用于:
获取多个选中操作及选中操作对应的操作顺序;
基于多个选中操作及选中操作对应的操作顺序确定图像生成步骤;
响应于执行图像预生成的执行命令,针对执行到的当前图像生成步骤,获取当前图像生成步骤对应的操作位置,并基于操作位置执行当前图像生成步骤对应的图像预生成。
作为一种可能的实现方式,上述执行模块701还用于:
基于选中操作,确定当前图像生成步骤对应的操作位置是否位于选中操作所在组件的边缘;
若是,则将组件的中心位置作为选中位置。
作为一种可能的实现方式,上述执行模块701还用于:
响应于输入第一引导词的操作,记录第一时间;
响应于生成指令,记录第二时间,生成指令用于指示根据第一引导词生成第一图像;
根据第一时间和第二时间计算并记录等待时长。
作为一种可能的实现方式,上述执行模块701还用于:
按照预设间隔时间对所述第一图像执行打开操作;
响应于所述第一图像成功打开,记录所述第二时间。
作为一种可能的实现方式,判断图像是否成功打开的判断条件包括:在图像生成界面范围内查找是否存在遮挡的图像区域坐标,若存在,则确定图像成功打开。
作为一种可能的实现方式,上述生成模块702还用于:
获取图像生成位置以及保存操作位置;
响应于保存指令,按照图像生成位置获取图像,基于保存操作位置保存图像。
作为一种可能的实现方式,上述生成模块702还用于:
在执行图形预生成或图像生成时,获取图像生成位置以及保存操作位置。
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
本申请实施例还提供了一种电子设备800,如图8所示,为本申请实施例提供的电子设备800结构示意图,包括:处理器801、存储器802,可选的,还可以包括总线803。所述存储器802存储有所述处理器801可执行的机器可读指令,当电子设备800运行时,所述处理器801与所述存储器802之间通过总线803通信,所述机器可读指令被所述处理器801执行时执行如下处理:
执行图像预生成,并根据图像预生成过程中的时间信息,确定图像生成的等待时长;
获取预设的引导词集合,并按照等待时长,依次根据各引导词集合中的引导词,生成与各引导词对应的多个图像,其中,引导词集合包括顺序排列的多个引导词。
作为一种可能的实现方式,处理器801还用于:
响应于预设的选中操作,获取当前界面图像,对当前界面图像进行图像识别,得到当前界面图像中的选中位置,将选中位置作为当前界面图像对应的当前图像生成步骤的操作位置。
作为一种可能的实现方式,处理器801在执行图像预生成时,具体用于:
获取多个选中操作及选中操作对应的操作顺序;
基于多个选中操作及选中操作对应的操作顺序确定图像生成步骤;
响应于执行图像预生成的执行命令,针对执行到的当前图像生成步骤,获取当前图像生成步骤对应的操作位置,并基于操作位置执行当前图像生成步骤对应的图像预生成。
作为一种可能的实现方式,处理器801在执行对当前界面图像进行图像识别,得到当前界面图像中的选中位置时,具体用于:
基于选中操作,确定当前图像生成步骤对应的操作位置是否位于所在组件的边缘;
若是,则将组件的中心位置作为选中位置。
作为一种可能的实现方式,处理器801在执行根据图像预生成过程中的时间信息,确定图像生成的等待时长时,具体用于:
响应于输入第一引导词的操作,记录第一时间;
响应于生成指令,记录第二时间,生成指令用于指示根据第一引导词生成第一图像;
根据第一时间和第二时间计算并记录等待时长。
作为一种可能的实现方式,处理器801在执行响应于生成指令,记录第二时间时,具体用于:
按照预设间隔时间对第一图像执行打开操作;
响应于第一图像成功打开,记录第二时间。
作为一种可能的实现方式,处理器801在执行判断图像是否成功打开的判断条件包括:在图像生成界面范围内查找是否存在遮挡的图像区域坐标,若存在,则确定图像成功打开。
作为一种可能的实现方式,处理器801在执行生成与各引导词对应的多个图像之后,还用于:
获取图像生成位置以及保存操作位置;
响应于保存指令,按照图像生成位置获取图像,基于保存操作位置保存图像。
作为一种可能的实现方式,处理器801在执行获取图像生成位置以及保存操作位置时,具体用于:
在执行图像预生成或图像生成时,获取图像生成位置以及保存操作位置。
由此,根据本申请的图像生成方法,基于图像预生成,确定图像生成的等待时长,利用等待时长进一步确定下一引导词的读取输入时间,以此避免图像生成过程中浪费时间。此外,各引导词是由用户自定义并预先顺序存储在引导词集合中的,能够避免生成的图像受限于预定义的模板,然后自动执行各图像生成步骤,无需人工操作即可完成图像生成过程。基于此,通过优化图像生成所需的时间成本、避免预定义模板的限制、提高图像生成效率,进而提升了图像生成软件整体的图像生成效果。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如下处理:
执行图像预生成,并根据图像预生成过程中的时间信息,确定图像生成的等待时长;
获取预设的引导词集合,并按照等待时长,依次根据各引导词集合中的引导词,生成与各引导词对应的多个图像,其中,引导词集合包括顺序排列的多个引导词。
作为一种可能的实现方式,处理器还用于:
响应于预设的选中操作,获取当前界面图像,对当前界面图像进行图像识别,得到当前界面图像中的选中位置,将选中位置作为当前界面图像对应的当前生成步骤的操作位置。
作为一种可能的实现方式,处理器在执行图像预生成时,具体用于:
获取多个选中操作及选中操作对应的操作顺序;
基于多个选中操作及选中操作对应的操作顺序确定图像生成步骤;
响应于执行图像预生成的执行命令,针对执行到的当前图像生成步骤,获取当前图像生成步骤对应的操作位置,并基于操作位置执行当前图像生成步骤对应的图像预生成。
作为一种可能的实现方式,处理器在执行对当前界面图像进行图像识别,得到当前界面图像中的选中位置时,具体用于:
基于选中操作,确定当前图像生成步骤对应的操作位置是否位于所在组件的边缘;
若是,则将组件的中心位置作为选中位置。
作为一种可能的实现方式,处理器在执行根据图像预生成过程中的时间信息,确定图像生成的等待时长时,具体用于:
响应于输入第一引导词的操作,记录第一时间;
响应于生成指令,记录第二时间,生成指令用于指示根据第一引导词生成第一图像;
根据第一时间和第二时间计算并记录等待时长。
作为一种可能的实现方式,处理器在执行响应于生成指令,记录第二时间时,具体用于:
按照预设间隔时间对第一图像执行打开操作;
响应于第一图像成功打开,记录第二时间。
作为一种可能的实现方式,处理器在执行判断图像是否成功打开的判断条件包括:在图像生成界面范围内查找是否存在遮挡的图像区域坐标,若存在,则确定图像成功打开。
作为一种可能的实现方式,处理器在执行生成与各引导词对应的多个图像之后,还用于:
获取图像生成位置以及保存操作位置;
响应于保存指令,按照图像生成位置获取图像,基于保存操作位置保存图像。
作为一种可能的实现方式,处理器在执行获取图像生成位置以及保存操作位置时,具体用于:
在执行图像预生成或图像生成时,获取图像生成位置以及保存操作位置。
由此,根据本申请的图像生成方法,基于图像预生成,确定图像生成的等待时长,利用等待时长进一步确定下一引导词的读取输入时间,以此避免图像生成过程中浪费时间。此外,各引导词是由用户自定义并预先顺序存储在引导词集合中的,能够避免生成的图像受限于预定义的模板,然后自动执行各图像生成步骤,无需人工操作即可完成图像生成过程。基于此,通过优化图像生成所需的时间成本、避免预定义模板的限制、提高图像生成效率,进而提升了图像生成软件整体的图像生成效果。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考方法实施例中的对应过程,本申请中不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。

Claims (12)

1.一种图像生成方法,其特征在于,包括:
执行图像预生成,并根据图像预生成过程中的时间信息,确定图像生成的等待时长;
获取预设的引导词集合,并按照所述等待时长,依次根据各所述引导词集合中的引导词,生成与各所述引导词对应的多个图像,其中,所述引导词集合包括顺序排列的多个引导词。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于预设的选中操作,获取当前界面图像,对所述当前界面图像进行图像识别,得到所述当前界面图像中的选中位置,将所述选中位置作为所述当前界面图像对应的当前图像生成步骤的操作位置。
3.根据权利要求2所述的方法,其特征在于,所述执行图像预生成,包括:
获取多个选中操作及所述选中操作对应的操作顺序;
基于所述多个选中操作及所述选中操作对应的操作顺序确定图像生成步骤;
响应于执行图像预生成的执行命令,针对执行到的当前图像生成步骤,获取所述当前图像生成步骤对应的操作位置,并基于所述操作位置执行所述当前图像生成步骤对应的图像预生成。
4.根据权利要求2所述的方法,其特征在于,所述对所述当前界面图像进行图像识别,得到所述当前界面图像中的选中位置,包括:
基于所述选中操作,确定所述当前图像生成步骤对应的操作位置是否位于所述选中操作所在组件的边缘;
若是,则将所述组件的中心位置作为所述选中位置。
5.根据权利要求1所述的方法,其特征在于,所述根据图像预生成过程中的时间信息,确定图像生成的等待时长,包括:
响应于输入第一引导词的操作,记录第一时间;
响应于生成指令,记录第二时间,所述生成指令用于指示根据所述第一引导词生成第一图像;
根据所述第一时间和所述第二时间计算并记录所述等待时长。
6.根据权利要求5所述的方法,其特征在于,所述响应于生成指令,记录第二时间,包括:
按照预设间隔时间对所述第一图像执行打开操作;
响应于所述第一图像成功打开,记录所述第二时间。
7.根据权利要求6所述的方法,其特征在于,判断图像是否成功打开的判断条件包括:在图像生成界面范围内查找是否存在遮挡的图像区域坐标,若存在,则确定图像成功打开。
8.根据权利要求1所述的方法,其特征在于,所述生成与各所述引导词对应的多个图像之后,所述方法还包括:
获取图像生成位置以及保存操作位置;
响应于保存指令,按照所述图像生成位置获取图像,基于所述保存操作位置保存图像。
9.根据权利要求8所述的方法,其特征在于,所述获取图像生成位置以及保存操作位置,包括:
在执行图像预生成或图像生成时,获取图像生成位置以及保存操作位置。
10.一种图像生成装置,其特征在于,包括:
执行模块,用于执行图像预生成,并根据图像预生成过程中的时间信息,确定图像生成的等待时长;
生成模块,用于获取预设的引导词集合,并按照所述等待时长,依次根据各所述引导词集合中的引导词,生成与各所述引导词对应的多个图像,其中,所述引导词集合包括顺序排列的多个引导词。
11.一种电子设备,其特征在于,包括:处理器和存储器,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器执行所述机器可读指令,以执行如权利要求1至9任一所述的图像生成方法的步骤。
12.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至9任一所述的图像生成方法的步骤。
CN202311197816.3A 2023-09-15 2023-09-15 图像生成方法、装置、电子设备及存储介质 Pending CN117252942A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311197816.3A CN117252942A (zh) 2023-09-15 2023-09-15 图像生成方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311197816.3A CN117252942A (zh) 2023-09-15 2023-09-15 图像生成方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN117252942A true CN117252942A (zh) 2023-12-19

Family

ID=89125850

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311197816.3A Pending CN117252942A (zh) 2023-09-15 2023-09-15 图像生成方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN117252942A (zh)

Similar Documents

Publication Publication Date Title
US10852898B2 (en) System for interactive help
CN109034069B (zh) 用于生成信息的方法和装置
CN113285868B (zh) 任务生成方法、设备以及计算机可读介质
EP2869195B1 (en) Application coordination system, application coordination method, and application coordination program
CN109344044B (zh) 计算页面首屏渲染时间的方法和系统
CN113159212A (zh) Ocr识别模型训练方法、装置以及计算机可读存储介质
US10810265B2 (en) Automatic note board data capture and export
CN109461147B (zh) 应用于移动终端的fov图片的病理标注方法及装置
CN114299478A (zh) 结合rpa和ai的图像处理方法、装置及电子设备
CN111930633A (zh) 数据测试方法、平台、电子设备及存储介质
CN117174231A (zh) 一种智能病历管理系统
CN116795256A (zh) 任务处理方法、装置、电子设备及存储介质
CN112235632A (zh) 视频处理方法、装置及服务器
CN117252942A (zh) 图像生成方法、装置、电子设备及存储介质
CN116431468A (zh) 测试方法、装置、处理设备及存储介质
CN113672143B (zh) 图像标注方法、系统、设备和存储介质
CN114816719A (zh) 多任务模型的训练方法及装置
CN112286879B (zh) 基于元数据的数据资产构建方法及装置
CN110221952B (zh) 业务数据的处理方法及装置、业务数据处理系统
CN110647841B (zh) 图像识别结果过滤方法、装置、计算机设备及存储介质
CN114140547A (zh) 图像生成方法和装置
CN113849415A (zh) 控件测试方法、装置、存储介质及电子设备
CN112287738A (zh) 图形控件的文本匹配方法及装置、介质、电子设备
CN113821144B (zh) 一种数据标注方法、装置、系统和介质
CN111881270A (zh) 一种智能对话方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination