CN114331932A - 目标图像生成方法和装置、计算设备以及计算机存储介质 - Google Patents
目标图像生成方法和装置、计算设备以及计算机存储介质 Download PDFInfo
- Publication number
- CN114331932A CN114331932A CN202111475123.7A CN202111475123A CN114331932A CN 114331932 A CN114331932 A CN 114331932A CN 202111475123 A CN202111475123 A CN 202111475123A CN 114331932 A CN114331932 A CN 114331932A
- Authority
- CN
- China
- Prior art keywords
- image
- text
- generation
- terminal object
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
Abstract
本申请提出了一种目标图像生成方法,包括:获取目标终端对象的终端对象数据;触发对图像的生成,所述对图像的生成包括利用第一组图像生成步骤生成第一图像以及利用第二组图像生成步骤生成第二图像;所述第一组图像生成步骤包括:获取与目标终端对象的终端对象数据匹配的第一文本和第一背景图;根据所获取的第一文本和第一背景图生成所述第一图像;所述第二组图像生成步骤包括:获取与目标终端对象的终端对象数据匹配的第二文本和第二背景图;根据所获取的第二文本和第二背景图生成所述第二图像;基于当前时刻所述多个图像中已生成的图像中图像质量最高的图像生成目标图像。本申请实施例可应用于云技术、人工智能、地图、智慧交通等各种场景。
Description
技术领域
本公开涉及图像处理的技术领域,尤其涉及目标图像生成方法和装置、计算设备以及存储介质。
背景技术
为了实现信息的快速、准确和生动地传播,结合了文本和背景图的目标图像受到了广泛的应用。例如,股票软件根据当日投资者的股票收益率,生成包含投资者股票收益、相应解说文本和背景图的目标图像。音乐会主办方根据当日的节目和表演者,生成包含节目信息和符合节目气氛的文本及背景图的目标图像。
然而,由于目标图像的生成需要根据文本、背景图等对图像进行渲染、截图等操作,因此在目标图像生成过程中,质量越高的目标图像所耗费的计算资源通常越多,所耗费的时间也通常越长。因此,如果用户需要快速看到目标图像,则通常只能选择快速生成质量较差的目标图像。而如果用户选择观看质量较好的目标图像,则不得不等待较长的出图时间,并在等待出图的时间中处于无图可看的困境。
发明内容
有鉴于此,本公开提供了目标图像生成方法和装置、计算设备以及计算机存储介质,期望克服上面提到的部分或全部缺陷以及其它可能的缺陷。
根据本公开的第一方面,提供了一种目标图像生成方法,包括:获取目标终端对象的终端对象数据;触发对图像的生成,所述对图像的生成包括利用第一组图像生成步骤生成第一图像以及利用第二组图像生成步骤生成第二图像,其中所述第一图像的生成速度快于第二图像的生成速度,并且第二图像的图像质量高于第一图像的图像质量;以及其中,所述第一组图像生成步骤包括:获取与目标终端对象的终端对象数据匹配的第一文本和第一背景图;以及,以第一生成方式根据所述获取的第一文本和第一背景图生成所述第一图像;所述第二组图像生成步骤包括:获取与目标终端对象的终端对象数据匹配的第二文本和第二背景图;以及,以第二生成方式根据所述获取的第二文本和第二背景图生成所述第二图像;基于当前时刻所述多个图像中已生成的图像中图像质量最高的图像生成目标图像,所述目标图像适于在当前时刻针对所述目标终端对象进行展示。
在一些实施例中,对图像的生成还包括利用第三组图像生成步骤生成第三图像,其中,第二图像的生成速度快于第三图像的生成速度,并且第三图像的图像质量高于第二图像的图像质量;其中,所述第三组图像生成步骤包括:获取所述第二文本和第二背景图;以第三生成方式根据所述获取的第二文本和第二背景图确定第三图像。
在一些实施例中,所述目标图像生成方法还包括:响应于请求分享所述目标图像且所述目标图像是第二图像和第三图像之一,则将所述目标图像进行分享。
在一些实施例中,触发对图像的生成包括:触发所述第一图像生成步骤的本地执行以便于生成所述第一图像;触发所述第二图像生成步骤和所述第三图像生成步骤的非本地执行以便于分别生成所述第二图像和所述第三图像。
在一些实施例中,获取与目标终端对象的终端对象数据匹配的第一文本和第一背景图包括:根据目标终端对象的终端对象数据确定数据索引;根据所述数据索引从预定文本库获取与目标终端对象的终端对象数据匹配的第一文本和第一背景图,其中所述预定文本库包括多个预定数据索引和与所述多个预定数据索引中的每个对应的第一文本和第一背景图。
在一些实施例中,以第一生成方式根据所述获取的第一文本和第一背景图生成所述第一图像包括:建立第一文档对象模型,使得所述第一文档对象模型的内容节点包含所述第一文本和第一背景图;对所述第一文档对象模型进行渲染以得到第一页面;对所述第一页面进行全部或部分截图以得到所述第一图像。
在一些实施例中,获取与目标终端对象的终端对象数据匹配的第二文本和第二背景图包括:利用预训练的文本匹配模型获取与目标终端对象的终端对象数据匹配的第二文本和第二背景图,其中预训练的文本匹配模型通过文本训练步骤对深度学习模型进行训练确定,所述文本训练步骤包括:建立文本训练集,所述文本训练集包括多个终端对象数据样本,以及多个与终端对象数据样本中的每个终端对象数据样本匹配的第二文本样本和第二背景图样本;针对所述多个终端对象数据样本中的每个相应终端对象数据样本,以所述相应终端对象数据样本作为深度学习模型的输入,以与相应终端对象数据样本匹配的第二文本样本和第二背景图样本作为深度学习模型的输出,来训练深度学习模型,以得到所述预训练的文本匹配模型。
在一些实施例中,以第二生成方式根据所述获取的第二文本和第二背景图生成所述第二图像包括:获取与所述获取的第二文本和第二背景图相关的第二坐标,第二坐标表示所述获取的第二文本将在所述获取的第二背景图中放置的位置;根据所述获取的第二背景图、第二文本以及第二坐标生成所述第二图像。
在一些实施例中,获取与所述获取的第二文本和第二背景图相关的第二坐标包括:利用预训练的坐标匹配模型获取与所述获取的第二文本和第二背景图相关的第二坐标,所述预训练的坐标匹配模型通过坐标训练步骤训练机器学习模型确定,所述坐标训练步骤包括:建立坐标训练集,所述坐标训练集包括多个样本组和每个样本组对应的坐标,每个样本组包括对应的第二文本样本和第二背景图样本,以及每个样本组对应的坐标表示对应的第二文本样本在对应的第二背景图样本中的位置的坐标;针对多个样本组中的每个相应样本组以及相应样本组对应的坐标,以所述相应样本组对应的第二文本样本和第二背景图样本作为机器学习模型的输入,以对应的第二文本样本在对应的第二背景图样本中的位置的坐标作为输出,来训练机器学习模型,以得到所述预训练的坐标匹配模型。
在一些实施例中,以第三生成方式根据所述获取的第二文本和第二背景图确定第三图像包括:建立第二文档对象模型,使得所述第二文档对象模型的内容节点包含所述获取的第二文本和第二背景图;获取与所述获取的第二文本和第二背景图相关的第三坐标,第三坐标表示所述获取的第二文本将在所述获取的第二背景图中放置的位置;对第二文档对象模型进行渲染确定第二页面,使得第二页面中所述获取的第二文本在第二背景图中的位置是第三坐标;截取第二页面中表示第二内容节点的部分作为第三图像。
在一些实施例中,基于当前时刻所述多个图像中已生成的图像中图像质量最高的图像确定目标图像包括:响应于当前时刻所述多个图像中已生成的图像中图像质量最高的图像存在白边,则去除所述图像质量最高的图像中的白边,以得到去白边图像;将所述去白边图像确定为所述目标图像。
根据本公开的第二方面,提供了一种目标图像生成装置,包括:获取模块,被配置成获取目标终端对象的终端对象数据;触发模块,被配置成触发对图像的生成,所述对图像的生成包括利用第一组图像生成步骤生成第一图像以及利用第二组图像生成步骤生成第二图像,其中所述第一图像的生成速度快于第二图像的生成速度,并且第二图像的图像质量高于第一图像的图像质量;以及其中,所述第一组图像生成步骤包括:获取与目标终端对象的终端对象数据匹配的第一文本和第一背景图;以及,以第一生成方式根据所述获取的第一文本和第一背景图生成所述第一图像;所述第二组图像生成步骤包括:获取与目标终端对象的终端对象数据匹配的第二文本和第二背景图;以及,以第二生成方式根据所述获取的第二文本和第二背景图生成所述第二图像;生成模块,被配置成基于当前时刻所述多个图像中已生成的图像中图像质量最高的图像生成目标图像,所述目标图像适于在当前时刻针对所述目标终端对象进行展示。
根据本公开的第三方面,提供了一种计算设备,包括处理器;以及存储器,配置为在其上存储有计算机可执行指令,当计算机可执行指令被处理器执行时执行如上面所述的任意方法。
根据本公开的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,当所述计算机可执行指令被执行时,执行如上面所述的任意方法。
根据本公开的第五方面,提供了一种计算机程序产品,包括计算机可执行指令,其中所述计算机可执行指令被处理器执行时执行如上面所述的任意方法。
在本公开要求保护的目标图像生成方法和装置、计算设备以及计算机存储介质中,通过触发对图像的生成(即,利用第一组图像生成步骤生成第一图像以及利用第二组图像生成步骤生成第二图像),使得生成速度快于第二图像的第一图像和图像质量高于第一图像的第二图像的生成同时被触发;然后,基于当前时刻所述多个图像中已生成的图像中图像质量最高的图像生成目标图像。以这种方式,如果当前时刻生成速度较快而图像质量较差的第一图像已生成但第二图像尚未生成时,则基于所生成的第一图像生成目标图像并进行展示,使得可以快速看到目标图像;如果当前时刻生成速度较慢而图像质量较高的第二图像也已生成,则基于所生成的第二图像生成目标图像并进行展示,使得用户可以在第二图像生成后看到质量较高的目标图像。由于在目标图像的生成过程中,结合了第一图像生成速度较快但图像质量较差、第二图像生成速度较慢但图像质量较高的特点,使得用于展示的目标图像始终是基于当前时刻所生成的图像中图像质量最高的图像。即通过本公开的方法,既保证了目标图像的生成速度,又使得当前时刻的目标图像是基于当前时刻所生成的图像中图像质量最高的图像。这解决了传统的目标图像生成方法所面临的目标图像的生成质量与耗费时间之间的矛盾,进而提升了目标图像的可用性。
根据下文描述的实施例,本公开的这些和其它优点将变得清楚,并且参考下文描述的实施例来阐明本公开的这些和其它优点。
附图说明
现在将更详细并且参考附图来描述本公开的实施例,其中:
图1示出了根据本公开的实施例的技术方案可以实施在其中的示例性应用场景;
图2图示了根据本公开的一个实施例的一种目标图像生成方法的示意性流程图;
图3图示了根据本公开的一个实施例的触发对图像的生成的方法的示意性流程图;
图4图示了根据本公开的一个实施例的第一文档对象模型进行渲染的示意性流程图;
图5图示了根据本公开的一个实施例的对第二背景图进行数值化的示意性流程图;
图6图示了根据本公开的一个实施例的对第二文档对象模型进行渲染的示意性流程图;
图7图示了根据本公开的一个实施例的一个实施例的一种目标图像生成方法的具体原理架构图;
图8A-8C图示了利用根据本公开的一个实施例的生成的目标图像的示意性效果图;
图9图示了根据本公开的一个实施例的一种目标图像生成装置的示例性结构框图;
图10图示了一个示例系统,其包括代表可以实现本文描述的各种技术的一个或多个系统和/或设备的示例计算设备。
具体实施方式
下面的描述提供了本公开的各种实施例的特定细节,以便本领域的技术人员能够充分理解和实施本公开的各种实施例。应当理解,本公开的技术方案可以在没有这些细节中的一些细节的情况下被实施。在某些情况下,本公开并没有示出或详细描述一些熟知的结构或功能,以避免这些不必要的描述使对本公开的实施例的描述模糊不清。在本公开中使用的术语应当以其最宽泛的合理方式来理解,即使其是结合本公开的特定实施例被使用的。
首先,对本申请实施例中涉及的部分用语进行说明,以便于本领域技术人员理解。
超文本标记语言(HTML):HTML是一种标记语言。它包括一系列标签.通过这些标签可以将网络上的文档格式统一,使分散的网络资源连接为一个逻辑整体。HTML文本是由HTML命令组成的描述性文本,HTML命令可以说明文字,图形、动画、声音、表格、链接等。超文本是一种组织信息的方式,它通过超级链接方法将文本中的文字、图表与其他信息媒体相关联。这些相互关联的信息媒体可能在同一文本中,也可能是其他文件,或是地理位置相距遥远的某台计算机上的文件。这种组织信息方式将分布在不同位置的信息资源用随机方式进行连接,为人们查找,检索信息提供方便。
第五代超文本标记语言(HTML5,HyperText Markup Language 5):HTML5 由不同的技术构成,其在互联网中得到了非常广泛的应用,提供更多增强网络应用的标准机。与传统的技术相比,HTML5 的语法特征更加明显,并且结合了 SVG (Scalable VectorGraphics,可缩放矢量图形)的内容。这些内容在网页中使用可以更加便捷地处理多媒体内容,而且 HTML5中还结合了其他元素,对原有的功能进行调整和修改,进行标准化工作。HTML5 在 2012 年已形成了稳定的版本
层叠样式表(CSS,Cascading Style Sheets):CSS是一种用来表现HTML或XML(Extensible Markup Language,可扩展标记语言)等文件样式的计算机语言。CSS不仅可以静态地修饰网页,还可以配合各种脚本语言动态地对网页各元素进行格式化。CSS 能够对网页中元素位置的排版进行像素级精确控制,支持几乎所有的字体字号样式,拥有对网页对象和模型样式编辑的能力。
文档对象模型(DOM,Document Object Model):DOM是W3C组织(即万维网联盟,是Web技术领域最具权威和影响力的国际中立性技术标准机构)推荐的处理可扩展标志语言的标准编程接口。在网页上,组织页面(或文档)的对象被组织在一个树形结构中,用来表示文档中对象的标准模型就称为DOM。目的是为了能让JavaScript操作HTML元素而指定的一个规范。DOM是HTML在浏览器中的表示形式,用于允许用户操纵页面。其中,D(document)的意思是文档,在DOM中会将HTML这个页面给解析为一个文档,并在解析的同时会提供一个document对象;O(object)就是对象,DOM会把HTML页面中的所有元素都解析为一个对象;M(model)指模型,主要表现的是DOM里面各个对象之间的关系。
渲染:渲染就是根据描述或者定义构建数学模型,通过模型生成图像的过程。浏览器的渲染引擎就是能够将HTML/CSS/JavaScript转换成图像结果的模块。
Canvas:Canvas又名画布,是HTML5的元素,其使用 JavaScript 在网页上绘制图像。它是一个矩形区域,开发者可以控制其每一像素。Canvas 拥有多种绘制路径、矩形、圆形、字符以及添加图像的方法。
html2canvas:又名页面转画布,是一个开源小程序,在计算机中体现为一个JavaScript库,用于自动将当前的页面以图片形式下载下来。它的基本原理是读取已经渲染好的DOM元素的结构和样式信息,然后基于这些信息去构建截图,呈现在canvas中
poster-generator:又名海报生成器,任何客户端发起相应请求即可调用poster-generator生成对应海报,在HTML5中只需要配置一个简单的 调用指令即可调用海报生成器生成所需要的海报。
Puppeteer:Puppeteer 又名无头浏览器,是一个 Node 库,它提供了高级的 API并通过DevTools协议来控制 Chrome浏览器(即谷歌浏览器)。因此又被称为无头chrome 浏览器。Puppeteer可以用于生成网页截图或者PDF(Portable Document Format的简称,意为“可携带文档格式”)、抓取单页应用执行并渲染做表单的自动提交、UI的自动化测试、模拟键盘输入、用浏览器自带的一些调试工具和性能分析工具帮助我们分析问题等。
异步执行:即异步执行模式,是指语句在异步执行模式下,各语句执行结束的顺序与语句执行开始的顺序并不一定相同。例如异步执行查询操作时,客户机上的应用程序在向服务器发出了查询操作的指令后,将立刻执行查询语句指令的下一条语句,而不需要等到服务器将查询结果返回客户机端。异步执行方式使应用程序能摆脱单个任务的牵制,提高了灵活性和应用程序的执行效率。但异步执行模式也存在一些问题,如它增加了编程的复杂性,特别是当编写互用性(interoperable)要求较高的程序时。
自然语言处理:自然语言处理( Natural Language Processing, NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。自然语言处理主要应用于机器翻译、舆情监测、自动摘要、观点提取、文本分类、问题回答、文本语义对比、语音识别、中文OCR等方面。
人工智能(Artificial Intelligence, AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、卷积神经网络、置信网络、强化学习、迁移学习、归纳学习等技术。
深度学习(DL, Deep Learning)是机器学习(ML, Machine Learning)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能(AI,Artificial Intelligence)。深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。
在本申请提供的技术方案中,涉及图像处理技术,并且主要涉及目标图像生成技术。
图1图示了根据本公开的实施例的技术方案可以实施在其中的示例性应用场景100。如图1所示,所示应用场景包括服务器110、服务器120、客户端130,所述客户端130通过网络140与服务器110、120通信地耦合在一起。
作为示例,所述服务器110和所述客户端130可以经由网络140从服务器120获取客户端130的终端对象数据。然后,服务器110和客户端130可以触发对图像的生成,所述对图像的生成包括客户端130利用第一组图像生成步骤生成第一图像以及服务器110利用第二组图像生成步骤生成第二图像,其中所述第一图像的生成速度快于第二图像的生成速度,并且第二图像的图像质量高于第一图像的图像质量。并且,所述第一组图像生成步骤包括:客户端130获取与目标终端对象的终端对象数据匹配的第一文本和第一背景图,然后以第一生成方式根据所述获取的第一文本和第一背景图生成所述第一图像。以及,所述第二组图像生成步骤包括:服务器110获取与目标终端对象的终端对象数据匹配的第二文本和第二背景图再以第二生成方式根据所述获取的第二文本和第二背景图生成所述第二图像。
最后,客户端130可以基于当前时刻所述多个图像中已生成的图像中图像质量最高的图像生成目标图像,所述目标图像适于在当前时刻在客户端130针对所述目标终端对象进行展示。
上面描述的场景仅仅是本公开的实施例可以被实施在其中的一个示例,并不是限制性的。
应当指出,客户端130可以被安装在各种终端上,所述终端可以包括但不限定于手机、电脑、智能语音交互设备、智能家电、车载终端、平板电脑、笔记本电脑、台式计算机等。服务器110、120可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。所述网络140例如可以是广域网(WAN)、局域网(LAN)、无线网络、公用电话网、内联网以及本领域的技术人员熟知的任何其它类型的网络。本发明实施例可应用于各种场景,包括但不限于云技术、人工智能、地图、智慧交通、辅助驾驶等。
在一些实施例中,上述的应用场景100可以是由服务器110的集群和安装所述客户端130的终端构成的分布式系统,所述分布式系统例如可以构成区块链系统。例如,在应用场景100中,目标图像的生成和存储均可以在区块链系统中进行,实现去中心化的效果。作为示例,在生成目标图像后,可以将目标图像存储在区块链系统,以供后续在进行相同的搜索时从所述区块链系统中获取所述目标图像。区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。
图2图示了根据本公开的一个实施例的一种目标图像生成方法200的示意性流程图。所述方法200可以由图1中的服务器110和客户端130实施,但并不限制于此。如图2所示,所述方法200包括如下步骤。
在步骤210,获取目标终端对象的终端对象数据。可选地,终端对象数据可以是当前的终端对象数据,也可以是当前的终端对象数据和历史终端对象数据。当前终端对象数据可以是当前时刻的终端对象数据,历史终端对象数据可以是历史时刻的终端对象数据。例如,当目标终端对象的终端对象数据是目标终端对象的当前终端对象数据和历史终端对象数据时,将可以包含更丰富的终端对象的信息,例如终端对象数据的变化率等。作为示例,步骤210可以由图1中的客户端130实施,例如可以从服务器120获取终端对象(例如,客户端130的使用者)的终端对象数据,终端对象数据可以包括目标终端对象的当前终端对象数据,例如股票账户的当前收益率数据、税务账户的当前应纳税额数据等,终端对象数据还可以包括目标终端对象的历史终端对象数据,例如股票账户对应的历史收益率数据、税务账户对应的历史纳税额数据等。
在步骤220,触发对图像的生成,所述对图像的生成包括利用第一组图像生成步骤生成第一图像以及利用第二组图像生成步骤生成第二图像,其中所述第一图像的生成速度快于第二图像的生成速度,并且第二图像的图像质量高于第一图像的图像质量。在一些实施例中,一个图像的图像质量可以根据所述图像的一个或多个图像参数来确定。所述图像参数可以是能够表征图像质量的任意参数,例如图像的清晰度、对比度、饱和度和信噪比等中的一个或多个,此处不做限制。示例性地,在评价图像的图像质量时,可以对图像的多个图像参数赋予不同的权重以综合判断图像的图像质量。例如,可以选取图像清晰度、图像对比度和图像信噪比作为判断图像质量的图像参数,则当各图像参数大于其对应的预定阈值(可以根据需要确定)时,可以为所述图像参数赋予参数评分1,小于对应的阈值时赋予参数评分0。然后,可以基于各图像参数的权重来计算所述图像的参数评分的加权和以用于表征所述图像的图像质量。各图像参数对应的权重具体数值可以根据需求或者经验确定,不做限制。作为示例,可以由图1中的客户端130或服务器110触发对图像的生成,例如触发在客户端130中执行第一组图像生成步骤以生成第一图像,在服务器110中执行第二组图像生成步骤以生成第二图像。
作为示例,所述第一组图像生成步骤包括:获取与目标终端对象的终端对象数据匹配的第一文本和第一背景图,例如可以从客户端的数据库中获取与目标终端对象的终端对象数据匹配的第一文本和第一背景图;以第一生成方式根据所述获取的第一文本和第一背景图生成所述第一图像,例如可以利用html2canvas等绘图工具根据所述获取的第一文本和第一背景图生成所述第一图像。
作为示例,所述第二组图像生成步骤包括:获取与目标终端对象的终端对象数据匹配的第二文本和第二背景图,例如可以从服务器的数据库中获取与目标终端对象的终端对象数据匹配的第二文本和第二背景图;以第二生成方式根据所述获取的第二文本和第二背景图生成所述第二图像,例如可以利用poster-generator等绘图工具根据所述获取的第二文本和第二背景图生成所述第二图像。
在步骤230,基于当前时刻所述多个图像中已生成的图像中图像质量最高的图像生成目标图像,所述目标图像适于在当前时刻针对所述目标终端对象进行展示。作为示例,步骤230可以在图1中的客户端130执行,例如,若当前时刻生成速度较快而图像质量较差的第一图像已生成但第二图像尚未生成,客户端130则基于所生成的第一图像生成目标图像并进行展示,使得用户可以快速看到目标图像;若当前时刻生成速度较慢而图像质量较高的第二图像也已生成,客户端130则基于所生成的第二图像生成目标图像并进行展示,使得用户可以在第二图像生成后看到质量较高的目标图像。
所述方法200通过触发对图像的生成,且所述对图像的生成包括利用第一组图像生成步骤生成第一图像以及利用第二组图像生成步骤生成第二图像,使得生成速度快于第二图像的第一图像和图像质量高于第一图像的第二图像的生成同时被触发;然后,基于当前时刻所述多个图像中已生成的图像中图像质量最高的图像生成目标图像。由于所述方法200在目标图像的生成过程中,结合了第一图像生成速度较快但图像质量较差、第二图像生成速度较慢但图像质量较高的特点,使得在触发图像生成后能快速展示基于第一图像生成的目标图像,并在第二图像生成后继续展示基于第二图像生成的图像质量更高的目标图像。由此,通过方法200解决了传统的目标图像生成方法所面临的目标图像的生成质量与耗费时间之间的矛盾,即解决了若想快速展示目标图像,则不得不选择快速生成的质量较差的目标图像,若选择展示质量较好的目标图像,则不得不等待较长的出图时间并在所述等待时间中无图可展示的困境,从而提升了目标图像的可用性。
在一些实施例中,对于方法200中的步骤220,所述对图像的生成还包括利用第三组图像生成步骤生成第三图像,并且第二图像的生成速度快于第三图像的生成速度,第三图像的图像质量高于第二图像的图像质量。作为示例,利用第三组图像生成步骤生成第三图像可以由图1中的服务器110执行。示例性地,服务器110可以在确定所述第二文本和第二背景图时直接获取或者从数据库中获取已确定的所述第二文本和第二背景图;然后以第三生成方式根据所述获取的第二文本和第二背景图确定第三图像,例如利用puppeteer根据所述获取的第二文本和第二背景图确定第三图像。
此外,在一些实施例中,还包括响应于请求分享所述目标图像且所述目标图像是第二图像和第三图像之一,则将所述目标图像进行分享。例如,客户端130在接收到分享所述目标图像的请求后,则将确认所述目标图像是否是第二图像或第三图像,若经确认所述目标图像是第二图像或第三图像之一,则客户端130将通过网络140对所述目标图像进行分享。
作为示例,方法200中的步骤220触发对图像的生成包括:触发所述第一图像生成步骤的本地执行以便于生成所述第一图像,例如触发在图1中的客户端130中执行所述第一生成步骤;触发所述第二图像生成步骤和所述第三图像生成步骤的非本地执行以便于分别生成所述第二图像和所述第三图像,例如触发在图1中的服务器110中执行第二图像生成步骤和第三图像生成步骤。
图3图示了根据本公开的一个实施例的触发对图像的生成的方法的示意性流程图。如图3所示,首先获取目标终端对象的终端对象数据,终端对象数据可以包括当前数据和历史数据,当前数据用于表示终端对象数据的当前值,历史数据表示终端对象的历史值。然后,触发对图像的生成,包括触发在计算平台1利用第一组图像生成步骤生成第一图像并输出、触发在计算平台2利用第二组图像生成步骤生成第二图像并输出、触发在计算平台3利用第三组图像生成步骤生成第三图像并输出。作为示例,计算平台1可以是图1中的客户端130,计算平台2和计算平台3可以是图1中的服务器110。作为示例,利用第一组图像生成步骤生成第一图像可以仅利用当前数据,而利用第二组图像生成步骤生成第二图像和利用第三组图像生成步骤生成第三图像可以利用当前数据和历史数据。
在一些实施例中,对于方法200中的步骤220,获取与目标终端对象的终端对象数据匹配的第一文本和第一背景图包括:根据目标终端对象的终端对象数据确定数据索引;然后根据所述数据索引从预定文本库获取与目标终端对象的终端对象数据匹配的第一文本和第一背景图,其中所述预定文本库包括多个预定数据索引和与所述多个预定数据索引中的每个对应的第一文本和第一背景图,作为示例,所述预定文本库可以是客户端(例如图1中的客户端130)中的数据库。
在一些实施例中,对于方法200的步骤220,在以第一生成方式根据所述获取的第一文本和第一背景图生成所述第一图像时,可以首先建立第一文档对象模型,使得所述第一文档对象模型的内容节点包含所述第一文本和第一背景图;然后,对所述第一文档对象模型进行渲染以得到第一页面;最后,对所述第一页面进行全部或部分截图以得到所述第一图像。作为示例,建立第一文档对象模型可以建立包括多个节点的DOM树,所述多个节点中的内容节点包含所述第一文本和第一背景图。然后建立渲染树,所述渲染树包含多个渲染节点,每个渲染节点包含针对所述DOM树中的相应节点的渲染参数。然后利用所述渲染树对DOM数进行渲染,得到包含第一背景图和第一文本的第一页面。最后对得到的第一页面进行全部或部分截图得到第一图像。
图4图示了根据本公开的一个实施例的第一文档对象模型进行渲染的示意性流程图。如图4所示,渲染堆叠内容可看做一个渲染树,其下包含多个渲染节点,包括“渲染背景和边框”下面的“渲染背景图片”节点和“渲染边框”节点,以及“渲染节点内容”下面的“渲染文本节点”、“渲染替换元素”节点和“渲染文本”节点,这些节点包含DOM树中对应节点的渲染信息,它们共同组成了“渲染堆叠内容”。“渲染堆叠内容”从属于“渲染堆叠”。当“渲染堆叠”被发送给“渲染器渲染”后,渲染器会根据“渲染堆叠”对DOM节点进行渲染,即“渲染元素”(元素即DOM),从而得到页面。最后通过绘图入口进行截图得到第一图像。示例性地,对第一文档对象模型进行渲染和截图可以利用html2canvas工具。
在一些实施例中,对于方法200的步骤220,在获取与目标终端对象的终端对象数据匹配的第二文本和第二背景图时,可以利用预训练的文本匹配模型获取与目标终端对象的终端对象数据匹配的第二文本和第二背景图,其中预训练的文本匹配模型通过文本训练步骤对深度学习模型进行训练确定。作为示例,获取与目标终端对象的终端对象数据匹配的第二文本和第二背景图可以在图1中的服务器110上进行。所述文本训练步骤可以包括:建立文本训练集,所述文本训练集包括多个终端对象数据样本,以及多个与终端对象数据样本中的每个终端对象数据样本匹配的第二文本样本和第二背景图样本;针对所述多个终端对象数据样本中的每个相应终端对象数据样本,以所述相应终端对象数据样本作为深度学习模型的输入,以与相应终端对象数据样本匹配的第二文本样本和第二背景图样本作为深度学习模型的输出,来训练深度学习模型,以得到所述预训练的文本匹配模型。示例性地,第二背景图样本与终端对象数据样本中的相应终端对象数据样本匹配可以是数值化后的第二背景图样本与终端对象数据样本中的相应终端对象数据样本匹配。图5图示了根据本公开的一个实施例的对第二背景图进行数值化的示意性流程图。如图5所示,对第二背景图进行数值化包括:采集第二背景图的图像,对采集的图像进行灰度处理,得到0-255的灰度值,然后对灰度处理后的图像进行斑点处理直至满足要求,然后对经处理的图像进行颜色识别,确定该图像的颜色的明亮程度,最后根据图像的明亮程度进行数值化,确定该图像的对应数值。例如,采集100张第二图像中的某张图像,在对其进行灰度处理、斑点处理后,对经处理的图像进行颜色识别,确认其明亮程度在所述100张图像中排名第78位,则可以将它的数值化值确定为78并将78作为该图像的数值化特征输出。这使得在后续训练深度学习模型时,可以以78表征该图像。其中,灰度指黑白图像中点的颜色深度,范围一般从0到255,白色为255,黑色为0。图像灰度化处理可以作为图像处理的预处理步骤,为之后的图像识别和图像分析等上层操作做准备。斑点通常指图像中与周围有着颜色和灰度区别的区域,斑点往往会影响对图像的后续判断,因此需通过斑点处理去除或减弱这些斑点的影响。颜色识别指通过识别图像的颜色深度,确定图像的明亮程度。例如,红色的明亮程度就高于棕色。
在一些实施例中,对于方法200的步骤220,其中,以第二生成方式根据所述获取的第二文本和第二背景图生成所述第二图像包括:获取与所述获取的第二文本和第二背景图相关的第二坐标,第二坐标表示所述获取的第二文本将在所述获取的第二背景图中放置的位置;根据所述获取的第二背景图、第二文本以及第二坐标生成所述第二图像。作为示例,所述第二图像可以调用poster-generator根据获取的第二背景图、第二文本以及第二坐标生成。
作为示例,可以从预先建立的坐标匹配库获取与所述获取的第二文本和第二背景图相关的第二坐标,也可以利用预训练的坐标匹配模型获取与所述获取的第二文本和第二背景图相关的第二坐标,所述预训练的坐标匹配模型通过坐标训练步骤训练机器学习模型确定。作为示例,获取与所述获取的第二文本和第二背景图相关的第二坐标可以在图1所示的服务器110中执行。所述坐标训练步骤可以是首先建立坐标训练集,所述坐标训练集包括多个样本组和每个样本组对应的坐标,每个样本组包括对应的第二文本样本和第二背景图样本,以及每个样本组对应的坐标表示对应的第二文本样本在对应的第二背景图样本中的位置的坐标;然后针对多个样本组中的每个相应样本组以及相应样本组对应的坐标,以所述相应样本组对应的第二文本样本和第二背景图样本作为机器学习模型的输入,以对应的第二文本样本在对应的第二背景图样本中的位置的坐标作为输出,来训练机器学习模型,以得到所述预训练的坐标匹配模型。示例性地,这里的机器学习模型也可以是人工智能模型,此处不做限制。
在一些实施例中,以第三生成方式根据所述获取的第二文本和第二背景图确定第三图像可以首先建立第二文档对象模型,使得所述第二文档对象模型的内容节点包含所述获取的第二文本和第二背景图;然后获取与所述获取的第二文本和第二背景图相关的第三坐标,第三坐标表示所述获取的第二文本将在所述获取的第二背景图中放置的位置;然后对第二文档对象模型进行渲染确定第二页面,使得第二页面中所述获取的第二文本在第二背景图中的位置是第三坐标;最后截取第二页面中表示第二内容节点的部分作为第三图像。作为示例,第二文档对象模型可以是包含多个节点的DOM树,获取与所述获取的第二文本和第二背景图相关的第三坐标可以是将第二文本和第二背景图的第二坐标作为第三坐标,对第二文档对象模型进行渲染可以利用建立的包含多个渲染节点的渲染树,使得渲染得到的第二页面中所述获取的第二文本在第二背景图中的位置是第三坐标。图6图示了根据本公开的一个实施例的对第二文档对象模型进行渲染的示意性流程图。如图6所示,浏览器可以包含多个浏览器内容,每个浏览器内容可以包含多个页面,每个页面可以具有多个框架。在操作时,绘图工具将包含第二内容节点的DOM树传输给浏览器,浏览器对DOM树进行渲染并生成第二页面,绘图工具再截取第二页面中表示第二内容节点的部分作为第三图像。可选地,绘图工具可以使用puppeteer,浏览器可以使用Chrome浏览器。
在一些实施例中,对于方法200的步骤230,在基于当前时刻所述多个图像中已生成的图像中图像质量最高的图像确定目标图像时,可以响应于当前时刻所述多个图像中已生成的图像中图像质量最高的图像存在白边,则去除所述图像质量最高的图像中的白边,以得到去白边图像;然后将所述去白边图像确定为所述目标图像。作为示例,在确定所述图像质量最高的图像中是否存在白边时,可以利用轮廓发现或者直线检测,在获得除白边的图像时,可以选择截取所述图像质量最高的图像的最大外界矩形。
图7图示了根据本公开的一个实施例的一个实施例的一种目标图像生成方法的具体原理架构图。
如图7所示,目标终端对象是本地端的对象,目标终端对象的终端对象数据是针对本地端的对象的收益率数据,可以包括当前收益率数据(即当前终端对象数据)和历史收益率数据(即历史终端对象数据)。此处,非本地端1可以是图1中的服务器120,非本地端2可以是图1中的服务器110,本地端可以是图1中的客户端130。
首先,本地端从非本地端1获取了当前收益率数据,非本地端2从非本地端1获取了当前收益率数据和历史收益率数据。触发本地端执行第一组图像生成步骤、非本地端2执行第二组图像生成步骤和第三图像生成步骤。第一组图像生成步骤在本地端利用页面转画布(html2canvas)根据本地展示素材(即第一背景图)和本地文案(即第一文本)以三组中最快的速度生成三组中图像质量较差的图像1(即第一图像)。第二组图像生成步骤在非本地端2利用文本匹配模型和坐标匹配模型确定展示风格(即第二背景图)和展示文案(即第二文本),以及展示文案在所述展示风格中的坐标(即第二坐标),然后利用海报生成器(poster-generator)根据所述展示风格和展示文案生成图像2(即第二图像)并输出到本地端。第二组图像生成步骤的图像生成速度在三组中排第二,图像2的图像质量也排第二。第三组图像生成步骤在非本地端2利用无头浏览器(puppeteer)根据所述展示风格和展示文案生成图像3并输出到本地端。第二组图像生成步骤的图像生成速度在三组中最慢,但图像3的图像质量最高。本地端基于当前时刻图像1、图像2、图像3中已生成的图像中图像质量最高的图像生成目标图像,所述目标图像适于在当前时刻针对所述目标终端对象进行展示。例如,若当前时刻生成速度较快而图像质量较差的图像1已生成但图像2尚未生成,则基于图像1生成目标图像并进行展示,使得本地端可以展示目标图像;若当前时刻生成速度较慢而图像质量较高的图像2已生成但生成速度最慢而图像质量最高的图像3尚未生成,则基于所生成的图像2生成目标图像并进行展示,使得用户不必继续观看基于图像质量较差的图像1生成的目标图像;若当前时刻生成速度最慢而图像质量最高的图像3已生成,则基于所生成的图像3生成目标图像并进行展示,使得用户可以观看基于图像质量最高的图像3生成的目标图像。
可以看出,由于同时触发了三组图像生成步骤,使得随着时间的推移逐渐有生成速度更慢但图像质量更高的图像生成,并总是基于当前已生成的图像中图像质量最高的图像生成目标图像。可选地,可以以新生成的目标图像替换旧有的目标图像,使得本地端始终在展现当前时刻图像质量最高的图像。
作为示例,在非本地端2执行的文本匹配模型通过文本训练步骤对深度学习模型进行训练确定。深度学习模型可以提取历史收益率数据中的特征(例如历史收益率数据的增长率/递减率、市场周转额、信用价差等)来表征所述历史收益率,并将其与对应的展示风格和展示文案相匹配。展示风格可以是不同明亮程度的背景图,展示文案可以是不同感情倾向的文本。例如,对于当前收益率更高的数据,可以选择颜色更明亮的背景图和感情倾向更积极的文本与之匹配。
表I示出了不同收益率数据对应的本地文案。
表I
当前收益率数据 | 对应的本地文案 |
0%以下 | 难免挫折、静待花开 |
0-2% | 波澜不惊、且看未来 |
2%-13.87% | 收获不错、再接再厉 |
13.87%-23% | 跑赢大盘、财富增长 |
23%-50% | 收益进击、牛气冲天 |
50%+ | 红红火火、理财王者 |
收益率为空-兜底 | 点滴积累、从这开始 |
图8A-8C图示了根据本公开的一个实施例的生成的目标图像的示意性效果图。如图8A-8C所示,图8A、8B、8C分别展示了当前收益率为-10.24%、0.00%、+10.24%的目标图像的示例。在该示例中,所述目标图像是在已生成的图像中图像质量最高的图像是第一图像的时刻生成的。可以看出,针对不同的当前收益率,图中的文本根据表I中的对应规则而变化,同时,其背景图也随之变化,当前收益率越高,背景图所表达的氛围也越积极。
图9图示了根据本公开的一个实施例的一种目标图像生成装置900的示例性结构框图。如图9所示,所述目标图像生成装置包括:获取模块910、触发模块920和生成模块930。
获取模块910,被配置成获取目标终端对象的终端对象数据。
触发模块920,被配置成触发对图像的生成,所述对图像的生成包括利用第一组图像生成步骤生成第一图像以及利用第二组图像生成步骤生成第二图像,其中所述第一图像的生成速度快于第二图像的生成速度,并且第二图像的图像质量高于第一图像的图像质量;以及其中,所述第一组图像生成步骤包括:获取与目标终端对象的终端对象数据匹配的第一文本和第一背景图;以及,以第一生成方式根据所述获取的第一文本和第一背景图生成所述第一图像;所述第二组图像生成步骤包括:获取与目标终端对象的终端对象数据匹配的第二文本和第二背景图;以及,以第二生成方式根据所述获取的第二文本和第二背景图生成所述第二图像。
生成模块930,被配置成基于当前时刻所述多个图像中已生成的图像中图像质量最高的图像生成目标图像,所述目标图像适于在当前时刻针对所述目标终端对象进行展示
图10图示了示例系统1000,其包括代表可以实现本文描述的各种技术的一个或多个系统和/或设备的示例计算设备1010。计算设备1010可以是例如服务提供商的服务器、与服务器相关联的设备、片上系统、和/或任何其它合适的计算设备或计算系统。上面参照图9描述的目标图像生成装置900可以采取计算设备1010的形式。替换地,目标图像生成装置900可以以应用1016的形式被实现为计算机程序。
如图示的示例计算设备1010包括彼此通信耦合的处理系统1011、一个或多个计算机可读介质1012以及一个或多个I/O接口1013。尽管未示出,但是计算设备1010还可以包括系统总线或其他数据和命令传送系统,其将各种组件彼此耦合。系统总线可以包括不同总线结构的任何一个或组合,所述总线结构诸如存储器总线或存储器控制器、外围总线、通用串行总线、和/或利用各种总线架构中的任何一种的处理器或局部总线。还构思了各种其他示例,诸如控制和数据线。
处理系统1011代表使用硬件执行一个或多个操作的功能。因此,处理系统1011被图示为包括可被配置为处理器、功能块等的硬件元件1014。这可以包括在硬件中实现为专用集成电路或使用一个或多个半导体形成的其它逻辑器件。硬件元件1014不受其形成的材料或其中采用的处理机构的限制。例如,处理器可以由(多个)半导体和/或晶体管(例如,电子集成电路(IC))组成。在这样的上下文中,处理器可执行指令可以是电子可执行指令。
计算机可读介质1012被图示为包括存储器/存储装置1015。存储器/存储装置1015表示与一个或多个计算机可读介质相关联的存储器/存储容量。存储器/存储装置1015可以包括易失性介质(诸如随机存取存储器(RAM))和/或非易失性介质(诸如只读存储器(ROM)、闪存、光盘、磁盘等)。存储器/存储装置1015可以包括固定介质(例如,RAM、ROM、固定硬盘驱动器等)以及可移动介质(例如,闪存、可移动硬盘驱动器、光盘等)。计算机可读介质1012可以以下面进一步描述的各种其他方式进行配置。
一个或多个I/O接口1013代表允许用户使用各种输入设备向计算设备1010输入命令和信息并且可选地还允许使用各种输出设备将信息呈现给用户和/或其他组件或设备的功能。输入设备的示例包括键盘、光标控制设备(例如,鼠标)、麦克风(例如,用于语音输入)、扫描仪、触摸功能(例如,被配置为检测物理触摸的容性或其他传感器)、相机(例如,可以采用可见或不可见的波长(诸如红外频率)将不涉及触摸的运动检测为手势)等等。输出设备的示例包括显示设备(例如,监视器或投影仪)、扬声器、打印机、网卡、触觉响应设备等。因此,计算设备1010可以以下面进一步描述的各种方式进行配置以支持用户交互。
计算设备1010还包括应用1016。应用1016可以例如是目标图像生成装置900的软件实例,并且与计算设备1010中的其他元件相组合地实现本文描述的技术。
本文可以在软件硬件元件或程序模块的一般上下文中描述各种技术。一般地,这些模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、元素、组件、数据结构等。本文所使用的术语“模块”,“功能”和“组件”一般表示软件、固件、硬件或其组合。本文描述的技术的特征是与平台无关的,意味着这些技术可以在具有各种处理器的各种计算平台上实现。
所描述的模块和技术的实现可以存储在某种形式的计算机可读介质上或者跨某种形式的计算机可读介质传输。计算机可读介质可以包括可由计算设备1010访问的各种介质。作为示例而非限制,计算机可读介质可以包括“计算机可读存储介质”和“计算机可读信号介质”。
与单纯的信号传输、载波或信号本身相反,“计算机可读存储介质”是指能够持久存储信息的介质和/或设备,和/或有形的存储装置。因此,计算机可读存储介质是指非信号承载介质。计算机可读存储介质包括诸如易失性和非易失性、可移动和不可移动介质和/或以适用于存储信息(诸如计算机可读指令、数据结构、程序模块、逻辑元件/电路或其他数据)的方法或技术实现的存储设备之类的硬件。计算机可读存储介质的示例可以包括但不限于RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字通用盘(DVD)或其他光学存储装置、硬盘、盒式磁带、磁带,磁盘存储装置或其他磁存储设备,或其他存储设备、有形介质或适于存储期望信息并可以由计算机访问的制品。
“计算机可读信号介质”是指被配置为诸如经由网络将指令发送到计算设备1010的硬件的信号承载介质。信号介质典型地可以将计算机可读指令、数据结构、程序模块或其他数据体现在诸如载波、数据信号或其它传输机制的调制数据信号中。信号介质还包括任何信息传递介质。术语“调制数据信号”是指这样的信号,该信号的特征中的一个或多个被设置或改变,从而将信息编码到该信号中。作为示例而非限制,通信介质包括诸如有线网络或直接连线的有线介质以及诸如声、RF、红外和其它无线介质的无线介质。
如前所述,硬件元件1014和计算机可读介质1012代表以硬件形式实现的指令、模块、可编程器件逻辑和/或固定器件逻辑,其在一些实施例中可以用于实现本文描述的技术的至少一些方面。硬件元件可以包括集成电路或片上系统、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、复杂可编程逻辑器件(CPLD)以及硅中的其它实现或其他硬件设备的组件。在这种上下文中,硬件元件可以作为执行由硬件元件所体现的指令、模块和/或逻辑所定义的程序任务的处理设备,以及用于存储用于执行的指令的硬件设备,例如,先前描述的计算机可读存储介质。
前述的组合也可以用于实现本文所述的各种技术和模块。因此,可以将软件、硬件或程序模块和其它程序模块实现为在某种形式的计算机可读存储介质上和/或由一个或多个硬件元件1014体现的一个或多个指令和/或逻辑。计算设备1010可以被配置为实现与软件和/或硬件模块相对应的特定指令和/或功能。因此,例如通过使用处理系统的计算机可读存储介质和/或硬件元件1014,可以至少部分地以硬件来实现将模块实现为可由计算设备1010作为软件执行的模块。指令和/或功能可以由一个或多个制品(例如,一个或多个计算设备1010和/或处理系统1011)可执行/可操作以实现本文所述的技术、模块和示例。
在各种实施方式中,计算设备1010可以采用各种不同的配置。例如,计算设备1010可以被实现为包括个人计算机、台式计算机、多屏幕计算机、膝上型计算机、上网本等的计算机类设备。计算设备1010还可以被实现为包括诸如移动电话、便携式音乐播放器、便携式游戏设备、平板计算机、多屏幕计算机等移动设备的移动装置类设备。计算设备1010还可以实现为电视类设备,其包括具有或连接到休闲观看环境中的一般地较大屏幕的设备。这些设备包括电视、机顶盒、游戏机等。
本文描述的技术可以由计算设备1010的这些各种配置来支持,并且不限于本文所描述的技术的具体示例。功能还可以通过使用分布式系统、诸如通过如下所述的平台1022而在“云”1020上全部或部分地实现。
云1020包括和/或代表用于资源1024的平台1022。平台1022抽象云1020的硬件(例如,服务器)和软件资源的底层功能。资源1024可以包括在远离计算设备1010的服务器上执行计算机处理时可以使用的应用和/或数据。资源1024还可以包括通过因特网和/或通过诸如蜂窝或Wi-Fi网络的订户网络提供的服务。
平台1022可以抽象资源和功能以将计算设备1010与其他计算设备连接。平台1022还可以用于抽象资源的分级以提供遇到的对于经由平台1022实现的资源1024的需求的相应水平的分级。因此,在互连设备实施例中,本文描述的功能的实现可以分布在整个系统1000内。例如,功能可以部分地在计算设备1010上以及通过抽象云1020的功能的平台1022来实现。
本申请提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算设备执行上述各种可选实现方式中提供的目标图像生成方法。
应当理解,为清楚起见,参考不同的功能单元对本公开的实施例进行了描述。然而,将明显的是,在不偏离本公开的情况下,每个功能单元的功能性可以被实施在单个单元中、实施在多个单元中或作为其它功能单元的一部分被实施。例如,被说明成由单个单元执行的功能性可以由多个不同的单元来执行。因此,对特定功能单元的参考仅被视为对用于提供所描述的功能性的适当单元的参考,而不是表明严格的逻辑或物理结构或组织。因此,本公开可以被实施在单个单元中,或者可以在物理上和功能上被分布在不同的单元和电路之间。
将理解的是,尽管第一、第二、第三等术语在本文中可以用来描述各种设备、元件、部件或部分,但是这些设备、元件、部件或部分不应当由这些术语限制。这些术语仅用来将一个设备、元件、部件或部分与另一个设备、元件、部件或部分相区分。
尽管已经结合一些实施例描述了本公开,但是其不旨在被限于在本文中所阐述的特定形式。相反,本公开的范围仅由所附权利要求来限制。附加地,尽管单独的特征可以被包括在不同的权利要求中,但是这些可以可能地被有利地组合,并且包括在不同权利要求中不暗示特征的组合不是可行的和/或有利的。特征在权利要求中的次序不暗示特征必须以其工作的任何特定次序。此外,在权利要求中,词“包括”不排除其它元件,并且术语“一”或“一个”不排除多个。权利要求中的附图标记仅作为明确的例子被提供,不应该被解释为以任何方式限制权利要求的范围。
Claims (15)
1.一种目标图像生成方法,包括:
获取目标终端对象的终端对象数据;
触发对图像的生成,所述对图像的生成包括利用第一组图像生成步骤生成第一图像以及利用第二组图像生成步骤生成第二图像,其中所述第一图像的生成速度快于第二图像的生成速度,并且第二图像的图像质量高于第一图像的图像质量;以及其中,
所述第一组图像生成步骤包括:获取与目标终端对象的终端对象数据匹配的第一文本和第一背景图;以及,以第一生成方式根据所述获取的第一文本和第一背景图生成所述第一图像;
所述第二组图像生成步骤包括:获取与目标终端对象的终端对象数据匹配的第二文本和第二背景图;以及,以第二生成方式根据所述获取的第二文本和第二背景图生成所述第二图像;
基于当前时刻所述多个图像中已生成的图像中图像质量最高的图像生成目标图像,所述目标图像适于在当前时刻针对所述目标终端对象进行展示。
2.根据权利要求1所述的方法,其中,所述对图像的生成还包括利用第三组图像生成步骤生成第三图像,其中,第二图像的生成速度快于第三图像的生成速度,并且第三图像的图像质量高于第二图像的图像质量;
其中,所述第三组图像生成步骤包括:
获取所述第二文本和第二背景图;
以第三生成方式根据所述获取的第二文本和第二背景图确定第三图像。
3.根据权利要求2所述的方法,还包括:
响应于请求分享所述目标图像且所述目标图像是第二图像和第三图像之一,则将所述目标图像进行分享。
4.根据权利要求2所述的方法,其中,触发对图像的生成包括:
触发所述第一图像生成步骤的本地执行以便于生成所述第一图像;
触发所述第二图像生成步骤和所述第三图像生成步骤的非本地执行以便于分别生成所述第二图像和所述第三图像。
5.根据权利要求1所述的方法,其中,获取与目标终端对象的终端对象数据匹配的第一文本和第一背景图包括:
根据目标终端对象的终端对象数据确定数据索引;
根据所述数据索引从预定文本库获取与目标终端对象的终端对象数据匹配的第一文本和第一背景图,其中所述预定文本库包括多个预定数据索引和与所述多个预定数据索引中的每个对应的第一文本和第一背景图。
6.根据权利要求1所述的方法,其中,以第一生成方式根据所述获取的第一文本和第一背景图生成所述第一图像包括:
建立第一文档对象模型,使得所述第一文档对象模型的内容节点包含所述第一文本和第一背景图;
对所述第一文档对象模型进行渲染以得到第一页面;
对所述第一页面进行全部或部分截图以得到所述第一图像。
7.根据权利要求1所述的方法,其中,获取与目标终端对象的终端对象数据匹配的第二文本和第二背景图包括:
利用预训练的文本匹配模型获取与目标终端对象的终端对象数据匹配的第二文本和第二背景图,其中预训练的文本匹配模型通过文本训练步骤对深度学习模型进行训练确定,所述文本训练步骤包括:
建立文本训练集,所述文本训练集包括多个终端对象数据样本,以及多个与终端对象数据样本中的每个终端对象数据样本匹配的第二文本样本和第二背景图样本;
针对所述多个终端对象数据样本中的每个相应终端对象数据样本,以所述相应终端对象数据样本作为深度学习模型的输入,以与相应终端对象数据样本匹配的第二文本样本和第二背景图样本作为深度学习模型的输出,来训练深度学习模型,以得到所述预训练的文本匹配模型。
8.根据权利要求1所述的方法,其中,以第二生成方式根据所述获取的第二文本和第二背景图生成所述第二图像包括:
获取与所述获取的第二文本和第二背景图相关的第二坐标,第二坐标表示所述获取的第二文本将在所述获取的第二背景图中放置的位置;
根据所述获取的第二背景图、第二文本以及第二坐标生成所述第二图像。
9.根据权利要求8所述的方法,其中,获取与所述获取的第二文本和第二背景图相关的第二坐标包括:
利用预训练的坐标匹配模型获取与所述获取的第二文本和第二背景图相关的第二坐标,所述预训练的坐标匹配模型通过坐标训练步骤训练机器学习模型确定,所述坐标训练步骤包括:
建立坐标训练集,所述坐标训练集包括多个样本组和每个样本组对应的坐标,每个样本组包括对应的第二文本样本和第二背景图样本,以及每个样本组对应的坐标表示对应的第二文本样本在对应的第二背景图样本中的位置的坐标;
针对多个样本组中的每个相应样本组以及相应样本组对应的坐标,以所述相应样本组对应的第二文本样本和第二背景图样本作为机器学习模型的输入,以对应的第二文本样本在对应的第二背景图样本中的位置的坐标作为输出,来训练机器学习模型,以得到所述预训练的坐标匹配模型。
10.根据权利要求2所述的方法,其中以第三生成方式根据所述获取的第二文本和第二背景图确定第三图像包括:
建立第二文档对象模型,使得所述第二文档对象模型的内容节点包含所述获取的第二文本和第二背景图;
获取与所述获取的第二文本和第二背景图相关的第三坐标,第三坐标表示所述获取的第二文本将在所述获取的第二背景图中放置的位置;
对第二文档对象模型进行渲染确定第二页面,使得第二页面中所述获取的第二文本在第二背景图中的位置是第三坐标;
截取第二页面中表示第二内容节点的部分作为第三图像。
11.根据权利要求1所述的方法,其中基于当前时刻所述多个图像中已生成的图像中图像质量最高的图像确定目标图像包括:
响应于当前时刻所述多个图像中已生成的图像中图像质量最高的图像存在白边,则去除所述图像质量最高的图像中的白边,以得到去白边图像;
将所述去白边图像确定为所述目标图像。
12.一种目标图像生成装置,包括:
获取模块,被配置成获取目标终端对象的终端对象数据;
触发模块,被配置成触发对图像的生成,所述对图像的生成包括利用第一组图像生成步骤生成第一图像以及利用第二组图像生成步骤生成第二图像,其中所述第一图像的生成速度快于第二图像的生成速度,并且第二图像的图像质量高于第一图像的图像质量;以及其中,
所述第一组图像生成步骤包括:获取与目标终端对象的终端对象数据匹配的第一文本和第一背景图;以及,以第一生成方式根据所述获取的第一文本和第一背景图生成所述第一图像;
所述第二组图像生成步骤包括:获取与目标终端对象的终端对象数据匹配的第二文本和第二背景图;以及,以第二生成方式根据所述获取的第二文本和第二背景图生成所述第二图像;
生成模块,被配置成基于当前时刻所述多个图像中已生成的图像中图像质量最高的图像生成目标图像,所述目标图像适于在当前时刻针对所述目标终端对象进行展示。
13.一种计算设备,包括:
存储器,其被配置成存储计算机可执行指令;
处理器,其被配置成当所述计算机可执行指令被处理器执行时执行根据权利要求1-11中的任一项所述的方法。
14.一种计算机可读存储介质,其存储有计算机可执行指令,当所述计算机可执行指令被执行时,执行根据权利要求1-11中的任一项所述的方法。
15.一种计算机程序产品,包括计算机可执行指令,其中所述计算机可执行指令被处理器执行时执行根据权利要求1-11中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111475123.7A CN114331932A (zh) | 2021-12-06 | 2021-12-06 | 目标图像生成方法和装置、计算设备以及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111475123.7A CN114331932A (zh) | 2021-12-06 | 2021-12-06 | 目标图像生成方法和装置、计算设备以及计算机存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114331932A true CN114331932A (zh) | 2022-04-12 |
Family
ID=81047859
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111475123.7A Pending CN114331932A (zh) | 2021-12-06 | 2021-12-06 | 目标图像生成方法和装置、计算设备以及计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114331932A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115984720A (zh) * | 2022-12-19 | 2023-04-18 | 山东和同信息科技股份有限公司 | 一种基于大数据技术的供热管网管理系统 |
-
2021
- 2021-12-06 CN CN202111475123.7A patent/CN114331932A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115984720A (zh) * | 2022-12-19 | 2023-04-18 | 山东和同信息科技股份有限公司 | 一种基于大数据技术的供热管网管理系统 |
CN115984720B (zh) * | 2022-12-19 | 2024-04-12 | 山东和同信息科技股份有限公司 | 一种基于大数据技术的供热管网管理系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Choi et al. | Visualizing for the non‐visual: Enabling the visually impaired to use visualization | |
CN111753060B (zh) | 信息检索方法、装置、设备及计算机可读存储介质 | |
CN110795543B (zh) | 基于深度学习的非结构化数据抽取方法、装置及存储介质 | |
CN108595583B (zh) | 动态图表类页面数据爬取方法、装置、终端及存储介质 | |
CN114155543B (zh) | 神经网络训练方法、文档图像理解方法、装置和设备 | |
EP3570208A1 (en) | Two-dimensional document processing | |
CN110446063B (zh) | 视频封面的生成方法、装置及电子设备 | |
US20230401828A1 (en) | Method for training image recognition model, electronic device and storage medium | |
US9710440B2 (en) | Presenting fixed format documents in reflowed format | |
CN112287069B (zh) | 基于语音语义的信息检索方法、装置及计算机设备 | |
JP6693582B2 (ja) | 文書要約の生成方法、装置、電子機器、コンピュータ読み取り可能な記憶媒体 | |
CN112541332B (zh) | 表单信息抽取方法、装置、电子设备及存储介质 | |
CN104881428B (zh) | 一种信息图网页的信息图提取、检索方法和装置 | |
CN114896417A (zh) | 一种基于知识图谱构建计算机教育知识图谱的方法 | |
CN115393872B (zh) | 一种训练文本分类模型的方法、装置、设备及存储介质 | |
CN110321882A (zh) | 一种学习资源获取方法、装置、学习终端和存储介质 | |
CN111881900B (zh) | 语料生成、翻译模型训练、翻译方法、装置、设备及介质 | |
CN114331932A (zh) | 目标图像生成方法和装置、计算设备以及计算机存储介质 | |
CN113505786A (zh) | 试题拍照评判方法、装置及电子设备 | |
CN116306506A (zh) | 一种基于内容识别的智能邮件模板方法 | |
CN115546815A (zh) | 一种表格识别方法、装置、设备及存储介质 | |
CN113822521A (zh) | 题库题目的质量检测方法、装置及存储介质 | |
CN113569112A (zh) | 基于题目的辅导策略提供方法、系统、装置及介质 | |
US20240126978A1 (en) | Determining attributes for elements of displayable content and adding them to an accessibility tree | |
CN112686052B (zh) | 试题推荐及相关模型的训练方法、电子设备、存储装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |