CN117649466A - 基于ai算法的装饰画雕刻凹纹的生成系统及方法 - Google Patents
基于ai算法的装饰画雕刻凹纹的生成系统及方法 Download PDFInfo
- Publication number
- CN117649466A CN117649466A CN202410123818.6A CN202410123818A CN117649466A CN 117649466 A CN117649466 A CN 117649466A CN 202410123818 A CN202410123818 A CN 202410123818A CN 117649466 A CN117649466 A CN 117649466A
- Authority
- CN
- China
- Prior art keywords
- sequence
- semantic
- decorative picture
- feature vectors
- interaction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 239000013598 vector Substances 0.000 claims abstract description 189
- 230000003993 interaction Effects 0.000 claims abstract description 90
- 230000002457 bidirectional effect Effects 0.000 claims abstract description 13
- 238000012098 association analyses Methods 0.000 claims abstract description 10
- 238000007499 fusion processing Methods 0.000 claims abstract description 8
- 230000004927 fusion Effects 0.000 claims description 42
- 238000012545 processing Methods 0.000 claims description 20
- 238000011176 pooling Methods 0.000 claims description 14
- 238000005457 optimization Methods 0.000 claims description 8
- 238000010422 painting Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 7
- 230000000903 blocking effect Effects 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 238000009792 diffusion process Methods 0.000 claims description 4
- 238000009826 distribution Methods 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims description 2
- 238000010219 correlation analysis Methods 0.000 claims 1
- 239000003973 paint Substances 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 6
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000005034 decoration Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000005465 channeling Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/60—Editing figures and text; Combining figures or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Probability & Statistics with Applications (AREA)
- Processing Or Creating Images (AREA)
Abstract
公开了一种基于AI算法的装饰画雕刻凹纹的生成系统及方法。其首先对参考装饰画进行局部区域上下文语义关联分析以得到上下文参考装饰画图像块语义特征向量的序列,接着,对需求偏好文本描述进行基于词粒度的上下文语义编码以得到需求偏好词粒度语义特征向量的序列,然后,对上述两个向量的序列进行跨模态特征双向交互融合处理以得到参考装饰画图像块‑需求词粒度交互特征向量的序列,最后,将所述参考装饰画图像块‑需求词粒度交互特征向量的序列进行二维排列为参考装饰画‑需求语义交互特征,并基于所述参考装饰画‑需求语义交互特征,得到生成饰画雕刻凹纹图案。这样,可以提高艺术创作的效率和创新性。
Description
技术领域
本申请涉及智能化创作领域,且更为具体地,涉及一种基于AI算法的装饰画雕刻凹纹的生成系统及方法。
背景技术
装饰画雕刻凹纹是一种常见的艺术形式,它可以用来装饰墙壁、家具、门窗等物体的表面,增加美感和个性。目前,装饰画雕刻凹纹的设计和制作通常需要专业的艺术家和工匠,不仅耗时耗力,而且由于每个用户的需求和偏好各不相同,现有方案难以满足用户的个性化需求。
因此,期望一种基于AI算法的装饰画雕刻凹纹的生成系统。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于AI算法的装饰画雕刻凹纹的生成系统及方法,其可以基于用户的输入和偏好利用AI算法自动地生成具有不同风格和主题的装饰画雕刻凹纹图案,以满足用户的个性化需求,并提高装饰画雕刻凹纹的生成效率和质量,进而提高艺术创作的效率和创新性。
根据本申请的一个方面,提供了一种基于AI算法的装饰画雕刻凹纹的生成系统,其包括:
参考装饰画采集模块,用于获取由用户选择的具有特定风格的参考装饰画;
需求偏好文本采集模块,用于获取由用户输入的需求偏好文本描述;
参考装饰画局部上下文语义特征提取模块,用于对所述参考装饰画进行局部区域上下文语义关联分析以得到上下文参考装饰画图像块语义特征向量的序列;
需求文本语义理解模块,用于对所述需求偏好文本描述进行基于词粒度的上下文语义编码以得到需求偏好词粒度语义特征向量的序列;
跨模态特征交互融合模块,用于对所述上下文参考装饰画图像块语义特征向量的序列和所述需求偏好词粒度语义特征向量的序列进行跨模态特征双向交互融合处理以得到参考装饰画图像块-需求词粒度交互特征向量的序列;以及
饰画雕刻凹纹图案生成模块,用于将所述参考装饰画图像块-需求词粒度交互特征向量的序列进行二维排列为参考装饰画-需求语义交互特征,并基于所述参考装饰画-需求语义交互特征,得到生成饰画雕刻凹纹图案。
根据本申请的另一个方面,提供了一种基于AI算法的装饰画雕刻凹纹的生成方法,其包括:
获取由用户选择的具有特定风格的参考装饰画;
获取由用户输入的需求偏好文本描述;
对所述参考装饰画进行局部区域上下文语义关联分析以得到上下文参考装饰画图像块语义特征向量的序列;
对所述需求偏好文本描述进行基于词粒度的上下文语义编码以得到需求偏好词粒度语义特征向量的序列;
对所述上下文参考装饰画图像块语义特征向量的序列和所述需求偏好词粒度语义特征向量的序列进行跨模态特征双向交互融合处理以得到参考装饰画图像块-需求词粒度交互特征向量的序列;以及
将所述参考装饰画图像块-需求词粒度交互特征向量的序列进行二维排列为参考装饰画-需求语义交互特征,并基于所述参考装饰画-需求语义交互特征,得到生成饰画雕刻凹纹图案。
与现有技术相比,本申请提供的基于AI算法的装饰画雕刻凹纹的生成系统及方法,其首先对参考装饰画进行局部区域上下文语义关联分析以得到上下文参考装饰画图像块语义特征向量的序列,接着,对需求偏好文本描述进行基于词粒度的上下文语义编码以得到需求偏好词粒度语义特征向量的序列,然后,对上述两个向量的序列进行跨模态特征双向交互融合处理以得到参考装饰画图像块-需求词粒度交互特征向量的序列,最后,将所述参考装饰画图像块-需求词粒度交互特征向量的序列进行二维排列为参考装饰画-需求语义交互特征,并基于所述参考装饰画-需求语义交互特征,得到生成饰画雕刻凹纹图案。这样,可以提高艺术创作的效率和创新性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,以下附图并未刻意按实际尺寸等比例缩放绘制,重点在于示出本申请的主旨。
图1为根据本申请实施例的基于AI算法的装饰画雕刻凹纹的生成系统的框图示意图。
图2为根据本申请实施例的基于AI算法的装饰画雕刻凹纹的生成方法的流程图。
图3为根据本申请实施例的基于AI算法的装饰画雕刻凹纹的生成方法的系统架构的示意图。
图4为根据本申请实施例的基于AI算法的装饰画雕刻凹纹的生成系统的应用场景图。
具体实施方式
下面将结合附图对本申请实施例中的技术方案进行清楚、完整地描述,显而易见地,所描述的实施例仅仅是本申请的部分实施例,而不是全部的实施例。基于本申请实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,也属于本申请保护的范围。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其他的步骤或元素。
虽然本申请对根据本申请的实施例的系统中的某些模块做出了各种引用,然而,任何数量的不同模块可以被使用并运行在用户终端和/或服务器上。所述模块仅是说明性的,并且所述系统和方法的不同方面可以使用不同模块。
本申请中使用了流程图用来说明根据本申请的实施例的系统所执行的操作。应当理解的是,前面或下面操作不一定按照顺序来精确地执行。相反,根据需要,可以按照倒序或同时处理各种步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
针对上述技术问题,本申请的技术构思为通过采集用户选择的具有特定风格的参考装饰画,同时采集用户输入的需求偏好,并在后端引入基于人工智能的图像处理和语义理解算法来进行所述参考装饰画和所述需求偏好的协同关联分析,以根据用户的需求偏好对所述参考装饰画进行基于AI的装饰画雕刻凹纹图案的生成。这样,能够基于用户的输入和偏好利用AI算法自动地生成具有不同风格和主题的装饰画雕刻凹纹图案,以满足用户的个性化需求,并提高装饰画雕刻凹纹的生成效率和质量,进而提高艺术创作的效率和创新性。
图1为根据本申请实施例的基于AI算法的装饰画雕刻凹纹的生成系统的框图示意图。如图1所示,根据本申请实施例的基于AI算法的装饰画雕刻凹纹的生成系统100,包括:参考装饰画采集模块110,用于获取由用户选择的具有特定风格的参考装饰画;需求偏好文本采集模块120,用于获取由用户输入的需求偏好文本描述;参考装饰画局部上下文语义特征提取模块130,用于对所述参考装饰画进行局部区域上下文语义关联分析以得到上下文参考装饰画图像块语义特征向量的序列;需求文本语义理解模块140,用于对所述需求偏好文本描述进行基于词粒度的上下文语义编码以得到需求偏好词粒度语义特征向量的序列;跨模态特征交互融合模块150,用于对所述上下文参考装饰画图像块语义特征向量的序列和所述需求偏好词粒度语义特征向量的序列进行跨模态特征双向交互融合处理以得到参考装饰画图像块-需求词粒度交互特征向量的序列;以及,饰画雕刻凹纹图案生成模块160,用于将所述参考装饰画图像块-需求词粒度交互特征向量的序列进行二维排列为参考装饰画-需求语义交互特征,并基于所述参考装饰画-需求语义交互特征,得到生成饰画雕刻凹纹图案。
应可以理解,参考装饰画采集模块110可以从数据库、网络或其他来源中获取相关的装饰画图像。需求偏好文本采集模块120)用于获取用户输入的需求偏好文本描述,用户可以通过文本输入描述他们对装饰画雕刻凹纹的需求和偏好。参考装饰画局部上下文语义特征提取模块130可以通过分析装饰画的不同区域之间的语义关系来提取特征。需求文本语义理解模块140可以通过自然语言处理技术对文本进行理解和编码。跨模态特征交互融合模块150可以将图像和文本的特征进行交互和融合,以提取更丰富的特征表示。饰画雕刻凹纹图案生成模块160将特征向量序列转换为二维排列,并利用这些特征生成最终的饰画雕刻凹纹图案。这些模块一起工作,通过对参考装饰画和用户需求的分析、特征提取和交互融合,实现了基于AI算法的装饰画雕刻凹纹的生成。
具体地,在本申请的技术方案中,首先,获取由用户选择的具有特定风格的参考装饰画,并获取由用户输入的需求偏好文本描述。应可以理解,由于所述参考装饰画通常具有复杂的结构和细节,将整个图像作为输入可能会导致信息过于冗杂或模糊。因此,为了能够捕捉到所述参考装饰画中不同部分的细节和特征,在本申请的技术方案中,进一步对所述参考装饰画进行图像分块处理后通过基于ViT模型的图像编码器以得到上下文参考装饰画图像块语义特征向量的序列。应可以理解,ViT是一种基于Transformer架构的图像处理模型,它能够将所述参考装饰画的各个图像块视为一个序列,通过自注意力机制来捕捉图像中不同区域位置的特征分布和关联关系。也就是说,使用所述基于ViT模型的图像编码器可以将所述参考装饰画的每个图像块转化为语义特征向量,这些特征向量可以捕捉到各个图像块之间的相互关系和上下文信息。这样,有助于提高系统对所述参考装饰画的理解和特征表达能力,从而为后续的处理和生成步骤提供更有意义的输入。
相应地,所述参考装饰画局部上下文语义特征提取模块130,用于:对所述参考装饰画进行图像分块处理后通过基于ViT模型的图像编码器以得到所述上下文参考装饰画图像块语义特征向量的序列。
然后,考虑到所述需求偏好文本描述中可能包含了大量关于用户需求和偏好的语义特征,并且,所述需求偏好文本描述是由多个词组成的,各个词之间具有着上下文的语义关联关系。因此,为了能够使得模型能够更好地理解和处理该需求偏好文本描述的语义信息,以便于对于用户的个性化需求进行语义捕捉和刻画,在本申请的技术方案中,进一步对所述需求偏好文本描述进行分词处理后通过包含词嵌入层的语义编码器中进行编码处理,以捕捉到所述需求偏好本文描述中不同词之间的关系和上下文含义,从而提取出所述需求偏好本文描述中基于词粒度的上下文语义理解特征信息,以得到需求偏好词粒度语义特征向量的序列。
相应地,所述需求文本语义理解模块140,用于:对所述需求偏好文本描述进行基于词粒度的上下文语义编码以得到所述需求偏好词粒度语义特征向量的序列。
应可以理解,词粒度(Word-level granularity)是指将文本分解为单词(词)作为处理和分析的最小单位,在需求文本语义理解模块中,基于词粒度的上下文语义编码是指将需求偏好文本描述中的每个单词进行语义编码,以获得表示每个单词语义信息的特征向量。词粒度的语义编码可以使用预训练的词嵌入模型(如Word2Vec、GloVe、BERT等)来实现。这些模型将单词映射到低维向量空间中,使得具有相似语义的单词在向量空间中距离较近。通过将需求文本中的每个单词输入到词嵌入模型中,可以获得每个单词的语义特征向量。在基于词粒度的上下文语义编码中,还可以考虑上下文信息,即将单词的语义编码与其周围的单词进行交互和融合,以捕捉更丰富的语义关系。例如,可以使用循环神经网络(RNN)或Transformer等模型来对上下文进行建模,并生成每个单词的上下文语义特征向量。总之,词粒度指的是将文本分解为单词作为最小处理单位,并通过语义编码将每个单词转换为特征向量,以表示其语义信息。
进一步地,考虑到所述上下文参考装饰画图像块语义特征向量的序列和所述需求偏好词粒度语义特征向量的序列分别表示了有关于所述参考装饰画的各个区域的上下文语义关联特征和所述需求偏好文本描述的上下文语义关联特征,而所述参考装饰画和所述需求偏好文本描述属于不同的模态,即图像和文本。因此,为了能够对于图像语义和文本语义的特征进行有效地融合,以更好地捕捉到参考装饰画和需求偏好文本之间的语义关系,从而生成更符合用户期望的装饰画雕刻凹纹图案,在本申请的技术方案中,进一步使用跨模态双向交互器来对所述上下文参考装饰画图像块语义特征向量的序列和所述需求偏好词粒度语义特征向量的序列进行处理以得到参考装饰画图像块-需求词粒度交互特征向量的序列。通过跨模态交互处理,可以将这两种不同类型的信息进行有效的融合和交互,这样得到的所述参考装饰画图像块-需求词粒度交互特征向量的序列中的每个向量表示了图像块和需求词之间的语义交互信息,从而有利于更好地捕捉到图像和文本之间的语义关系和一致性,以获得更全面、更细致的特征表示。这有助于系统更好地理解用户需求和参考装饰画之间的语义交互关联信息,从而生成更符合用户期望的装饰画雕刻凹纹图案。
相应地,所述跨模态特征交互融合模块150,用于:使用跨模态双向交互器来对所述上下文参考装饰画图像块语义特征向量的序列和所述需求偏好词粒度语义特征向量的序列进行处理以得到所述参考装饰画图像块-需求词粒度交互特征向量的序列。
应可以理解,跨模态双向交互器(Cross-Modal Bi-Interaction)用于处理不同模态(例如图像和文本)之间的特征交互和融合。在装饰画雕刻凹纹生成系统中的跨模态特征交互融合模块150,跨模态双向交互器被用于处理上下文参考装饰画图像块语义特征向量序列和需求偏好词粒度语义特征向量序列,以获得参考装饰画图像块-需求词粒度交互特征向量的序列。跨模态双向交互器的作用是在不同模态的特征之间建立双向的交互关系,以捕捉模态之间的语义关联和互补信息。具体而言,对于装饰画雕刻凹纹生成系统,跨模态双向交互器可以实现以下功能:1.图像到文本交互:通过将上下文参考装饰画图像块的语义特征向量序列与需求偏好词粒度语义特征向量序列进行交互,可以将图像中的语义信息与文本描述进行对齐和关联。这有助于将图像的视觉特征与用户需求的文本描述进行匹配和融合,以更好地理解用户的需求。2.文本到图像交互:通过将需求偏好词粒度语义特征向量序列与上下文参考装饰画图像块的语义特征向量序列进行交互,可以将文本描述的语义信息与图像的视觉特征进行关联。这有助于将用户需求的文本描述转化为图像特征,以指导生成饰画雕刻凹纹图案。通过跨模态双向交互器的处理,参考装饰画图像块和需求偏好词粒度特征之间的交互特征向量序列可以捕捉到图像和文本之间的语义关系和互补信息,为生成饰画雕刻凹纹图案提供更全面和准确的特征表示。
具体地,所述跨模态特征交互融合模块150,包括:注意力增强单元,用于基于所述上下文参考装饰画图像块语义特征向量的序列和所述需求偏好词粒度语义特征向量的序列之间的相关度进行注意力增强以得到注意力增强上下文参考装饰画图像块语义特征向量的序列和注意力增强需求偏好词粒度语义特征向量的序列;第一融合单元,用于融合所述上下文参考装饰画图像块语义特征向量的序列和所述注意力增强上下文参考装饰画图像块语义特征向量的序列中相应位置的特征向量以得到参考装饰画局部融合特征向量的序列,并融合所述需求偏好词粒度语义特征向量的序列和所述注意力增强需求偏好词粒度语义特征向量的序列中相应位置的特征向量以得到需求偏好局部融合特征向量的序列;最大值池化单元,用于对所述参考装饰画局部融合特征向量的序列进行最大值池化处理以得到参考装饰画局部融合最大值池化特征向量的序列,并对所述需求偏好局部融合特征向量的序列进行最大值池化处理以得到需求偏好局部融合最大值池化特征向量的序列;以及,第二融合单元,用于融合所述参考装饰画局部融合最大值池化特征向量的序列和所述需求偏好局部融合最大值池化特征向量的序列以得到所述参考装饰画图像块-需求词粒度交互特征向量的序列。
继而,再将所述参考装饰画图像块-需求词粒度交互特征向量的序列进行二维排列后通过基于扩散模型的饰画雕刻凹纹生成器以得到生成饰画雕刻凹纹图案。特别地,通过二维排列的方式,有助于保留各个参考装饰画图像块-需求词粒度交互特征向量之间的空间关系和上下文信息,从而更好地利用到特征向量之间的相互作用和依赖关系来进行饰画雕刻凹纹图案的生成。这样,能够利用AI算法根据用户的需求偏好对所述参考装饰画进行装饰画雕刻凹纹图案的生成,以此来确保生成的装饰画雕刻凹纹图案满足用户的个性化需求,并提高装饰画雕刻凹纹的生成效率和质量。
相应地,所述饰画雕刻凹纹图案生成模块160,包括:跨模态交互特征优化单元,用于对所述参考装饰画图像块-需求词粒度交互特征向量的序列进行特征分布优化以得到优化参考装饰画图像块-需求词粒度交互特征向量的序列;跨模态局部交互特征整合单元,用于将所述优化参考装饰画图像块-需求词粒度交互特征向量的序列进行二维排列为参考装饰画-需求语义交互特征矩阵作为所述参考装饰画-需求语义交互特征;以及,图案生成单元,用于将所述参考装饰画-需求语义交互特征矩阵通过基于扩散模型的饰画雕刻凹纹生成器以得到生成饰画雕刻凹纹图案。
特别地,在上述技术方案中,所述上下文参考装饰画图像块语义特征向量的序列和所述需求偏好词粒度语义特征向量的序列分别表达所述参考装饰画的基于图像源语义局部语义空间上下文关联的图像语义特征以及所述需求偏好文本描述的基于需求偏好源文本的基于词粒度划分的上下文关联的文本语义特征,因此,考虑到所述参考装饰画和所述需求偏好文本描述之间存在的模态差异和信息表达差异,这种差异会因特征编码方式的不同而被放大,也就是说,所述上下文参考装饰画图像块语义特征向量的序列和所述需求偏好词粒度语义特征向量的序列在特征向量粒度的模态表达对应上也会具有显著差异。
由此,在使用跨模态双向交互器来对所述上下文参考装饰画图像块语义特征向量的序列和所述需求偏好词粒度语义特征向量的序列进行处理时,为了提升使用所述跨模态双向交互器对所述上下文参考装饰画图像块语义特征向量的序列和所述需求偏好词粒度语义特征向量的序列进行基于注意力机制的双向交互效果,本申请优选地对所述上下文参考装饰画图像块语义特征向量的序列和所述需求偏好词粒度语义特征向量的序列以特征值为粒度进行优化融合。
相应地,所述跨模态交互特征优化单元,包括:优化融合子单元,用于对所述上下文参考装饰画图像块语义特征向量的序列和所述需求偏好词粒度语义特征向量的序列进行优化融合以获得优化融合特征向量;以及,优化特征融合子单元,用于将所述优化融合特征向量与所述参考装饰画图像块-需求词粒度交互特征向量的序列进行融合以得到所述优化参考装饰画图像块-需求词粒度交互特征向量的序列。
其中,所述优化融合子单元,进一步用于:以如下校正公式对所述上下文参考装饰画图像块语义特征向量的序列和所述需求偏好词粒度语义特征向量的序列进行优化融合以获得所述优化融合特征向量;其中,所述校正公式为:
其中,和/>分别是所述上下文参考装饰画图像块语义特征向量的序列级联得到的第一特征向量/>和所述需求偏好词粒度语义特征向量的序列级联得到的第二特征向量/>的特征值,/>和/>分别表示特征向量的一范数的平方和特征向量的二范数的平方根,所述第一特征向量/>和第二特征向量/>具有相同的特征向量长度/>,且/>是权重超参数,/>表示数值的指数运算,所述数值的指数运算表示计算以所述数值为幂的自然指数函数值,/>表示向量加法,/>表示向量减法,/>表示所述优化融合特征向量的特征值。
这里,上述优化融合基于特征值粒度下的对应性来将所述上下文参考装饰画图像块语义特征向量的序列和所述需求偏好词粒度语义特征向量的序列的序列化融合表示进行基于向量尺度的前景流形和背景流形的划分,以在特征对应通道超流形体聚合机制下堆叠所述上下文参考装饰画图像块语义特征向量的序列和所述需求偏好词粒度语义特征向量的序列的动态的特征值通道化关联,从而标记所述上下文参考装饰画图像块语义特征向量的序列和所述需求偏好词粒度语义特征向量的序列的序列间的变化的特征语义信息,实现根据所述上下文参考装饰画图像块语义特征向量的序列和所述需求偏好词粒度语义特征向量的序列间的语义内容在不同计算维度下的变化性的类全连接式堆叠融合,这样在得到所述优化融合特征向量后,计算其与所述参考装饰画图像块-需求词粒度交互特征向量的序列级联得到的第三特征向量之间的按位置点乘并重新向量拆分以得到优化参考装饰画图像块-需求词粒度交互特征向量的序列,通过这样的方式,来提升所述上下文参考装饰画图像块语义特征向量的序列和所述需求偏好词粒度语义特征向量的序列的融合效果。这样,改进所述优化参考装饰画图像块-需求词粒度交互特征向量的序列排列得到的特征矩阵通过基于扩散模型的饰画雕刻凹纹生成器得到的生成饰画雕刻凹纹图案的图像质量。这样,能够利用AI算法,并根据用户的需求偏好自动地生成具有不同风格和主题的装饰画雕刻凹纹图案,以确保生成的装饰画雕刻凹纹图案满足用户的个性化需求,并提高图案生成的效率和质量,进而提高艺术创作的效率和创新性。
综上,基于本申请实施例的基于AI算法的装饰画雕刻凹纹的生成系统100被阐明,其可以提高艺术创作的效率和创新性。
如上所述,根据本申请实施例的基于本申请实施例的基于AI算法的装饰画雕刻凹纹的生成系统100可以实现在各种终端设备中,例如具有基于本申请实施例的基于AI算法的装饰画雕刻凹纹的生成算法的服务器等。在一个示例中,基于本申请实施例的基于AI算法的装饰画雕刻凹纹的生成系统100可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该基于本申请实施例的基于AI算法的装饰画雕刻凹纹的生成系统100可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该基于本申请实施例的基于AI算法的装饰画雕刻凹纹的生成系统100同样可以是该终端设备的众多硬件模块之一。
替换地,在另一示例中,该基于本申请实施例的基于AI算法的装饰画雕刻凹纹的生成系统100与该终端设备也可以是分立的设备,并且该基于AI算法的装饰画雕刻凹纹的生成系统100可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
图2为根据本申请实施例的基于AI算法的装饰画雕刻凹纹的生成方法的流程图。图3为根据本申请实施例的基于AI算法的装饰画雕刻凹纹的生成方法的系统架构的示意图。如图2和图3所示,根据本申请实施例的基于AI算法的装饰画雕刻凹纹的生成方法,其包括:S110,获取由用户选择的具有特定风格的参考装饰画;S120,获取由用户输入的需求偏好文本描述;S130,对所述参考装饰画进行局部区域上下文语义关联分析以得到上下文参考装饰画图像块语义特征向量的序列;S140,对所述需求偏好文本描述进行基于词粒度的上下文语义编码以得到需求偏好词粒度语义特征向量的序列;S150,对所述上下文参考装饰画图像块语义特征向量的序列和所述需求偏好词粒度语义特征向量的序列进行跨模态特征双向交互融合处理以得到参考装饰画图像块-需求词粒度交互特征向量的序列;以及,S160,将所述参考装饰画图像块-需求词粒度交互特征向量的序列进行二维排列为参考装饰画-需求语义交互特征,并基于所述参考装饰画-需求语义交互特征,得到生成饰画雕刻凹纹图案。
在一个具体示例中,在上述基于AI算法的装饰画雕刻凹纹的生成方法中,对所述参考装饰画进行局部区域上下文语义关联分析以得到上下文参考装饰画图像块语义特征向量的序列,包括:对所述参考装饰画进行图像分块处理后通过基于ViT模型的图像编码器以得到所述上下文参考装饰画图像块语义特征向量的序列。
在一个具体示例中,在上述基于AI算法的装饰画雕刻凹纹的生成方法中,对所述需求偏好文本描述进行基于词粒度的上下文语义编码以得到需求偏好词粒度语义特征向量的序列,包括:对所述需求偏好文本描述进行基于词粒度的上下文语义编码以得到所述需求偏好词粒度语义特征向量的序列。
这里,本领域技术人员可以理解,上述基于AI算法的装饰画雕刻凹纹的生成方法中的各个步骤的具体操作已经在上面参考图1的基于AI算法的装饰画雕刻凹纹的生成系统100的描述中得到了详细介绍,并因此,将省略其重复描述。
图4为根据本申请实施例的基于AI算法的装饰画雕刻凹纹的生成系统的应用场景图。如图4所示,在该应用场景中,首先,获取由用户选择的具有特定风格的参考装饰画(例如,图4中所示意的D1),以及,由用户输入的需求偏好文本描述(例如,图4中所示意的D2),然后,将所述参考装饰画和所述需求偏好文本描述输入至部署有基于AI算法的装饰画雕刻凹纹的生成算法的服务器(例如,图4中所示意的S)中,其中,所述服务器能够使用所述基于AI算法的装饰画雕刻凹纹的生成算法对所述参考装饰画和所述需求偏好文本描述进行处理以得到生成饰画雕刻凹纹图案。
本申请使用了特定词语来描述本申请的实施例。如“第一/第二实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一替代性实施例”并不一定是指同一实施例。此外,本申请的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,本领域技术人员可以理解,本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本申请的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
除非另有定义,这里使用的所有术语(包括技术和科学术语)具有与本申请所属领域的普通技术人员共同理解的相同含义。还应当理解,诸如在通常字典里定义的那些术语应当被解释为具有与它们在相关技术的上下文中的含义相一致的含义,而不应用理想化或极度形式化的意义来解释,除非这里明确地这样定义。
上面是对本申请的说明,而不应被认为是对其的限制。尽管描述了本申请的若干示例性实施例,但本领域技术人员将容易地理解,在不背离本申请的新颖教学和优点的前提下可以对示例性实施例进行许多修改。因此,所有这些修改都意图包含在权利要求书所限定的本申请范围内。应当理解,上面是对本申请的说明,而不应被认为是限于所公开的特定实施例,并且对所公开的实施例以及其他实施例的修改意图包含在所附权利要求书的范围内。本申请由权利要求书及其等效物限定。
Claims (10)
1.一种基于AI算法的装饰画雕刻凹纹的生成系统,其特征在于,包括:
参考装饰画采集模块,用于获取由用户选择的具有特定风格的参考装饰画;
需求偏好文本采集模块,用于获取由用户输入的需求偏好文本描述;
参考装饰画局部上下文语义特征提取模块,用于对所述参考装饰画进行局部区域上下文语义关联分析以得到上下文参考装饰画图像块语义特征向量的序列;
需求文本语义理解模块,用于对所述需求偏好文本描述进行基于词粒度的上下文语义编码以得到需求偏好词粒度语义特征向量的序列;
跨模态特征交互融合模块,用于对所述上下文参考装饰画图像块语义特征向量的序列和所述需求偏好词粒度语义特征向量的序列进行跨模态特征双向交互融合处理以得到参考装饰画图像块-需求词粒度交互特征向量的序列;以及
饰画雕刻凹纹图案生成模块,用于将所述参考装饰画图像块-需求词粒度交互特征向量的序列进行二维排列为参考装饰画-需求语义交互特征,并基于所述参考装饰画-需求语义交互特征,得到生成饰画雕刻凹纹图案。
2.根据权利要求1所述的基于AI算法的装饰画雕刻凹纹的生成系统,其特征在于,所述参考装饰画局部上下文语义特征提取模块,用于:对所述参考装饰画进行图像分块处理后通过基于ViT模型的图像编码器以得到所述上下文参考装饰画图像块语义特征向量的序列。
3.根据权利要求2所述的基于AI算法的装饰画雕刻凹纹的生成系统,其特征在于,所述需求文本语义理解模块,用于:对所述需求偏好文本描述进行基于词粒度的上下文语义编码以得到所述需求偏好词粒度语义特征向量的序列。
4.根据权利要求3所述的基于AI算法的装饰画雕刻凹纹的生成系统,其特征在于,所述跨模态特征交互融合模块,用于:使用跨模态双向交互器来对所述上下文参考装饰画图像块语义特征向量的序列和所述需求偏好词粒度语义特征向量的序列进行处理以得到所述参考装饰画图像块-需求词粒度交互特征向量的序列。
5.根据权利要求4所述的基于AI算法的装饰画雕刻凹纹的生成系统,其特征在于,所述跨模态特征交互融合模块,包括:
注意力增强单元,用于基于所述上下文参考装饰画图像块语义特征向量的序列和所述需求偏好词粒度语义特征向量的序列之间的相关度进行注意力增强以得到注意力增强上下文参考装饰画图像块语义特征向量的序列和注意力增强需求偏好词粒度语义特征向量的序列;
第一融合单元,用于融合所述上下文参考装饰画图像块语义特征向量的序列和所述注意力增强上下文参考装饰画图像块语义特征向量的序列中相应位置的特征向量以得到参考装饰画局部融合特征向量的序列,并融合所述需求偏好词粒度语义特征向量的序列和所述注意力增强需求偏好词粒度语义特征向量的序列中相应位置的特征向量以得到需求偏好局部融合特征向量的序列;
最大值池化单元,用于对所述参考装饰画局部融合特征向量的序列进行最大值池化处理以得到参考装饰画局部融合最大值池化特征向量的序列,并对所述需求偏好局部融合特征向量的序列进行最大值池化处理以得到需求偏好局部融合最大值池化特征向量的序列;以及
第二融合单元,用于融合所述参考装饰画局部融合最大值池化特征向量的序列和所述需求偏好局部融合最大值池化特征向量的序列以得到所述参考装饰画图像块-需求词粒度交互特征向量的序列。
6.根据权利要求5所述的基于AI算法的装饰画雕刻凹纹的生成系统,其特征在于,所述饰画雕刻凹纹图案生成模块,包括:
跨模态交互特征优化单元,用于对所述参考装饰画图像块-需求词粒度交互特征向量的序列进行特征分布优化以得到优化参考装饰画图像块-需求词粒度交互特征向量的序列;
跨模态局部交互特征整合单元,用于将所述优化参考装饰画图像块-需求词粒度交互特征向量的序列进行二维排列为参考装饰画-需求语义交互特征矩阵作为所述参考装饰画-需求语义交互特征;以及
图案生成单元,用于将所述参考装饰画-需求语义交互特征矩阵通过基于扩散模型的饰画雕刻凹纹生成器以得到生成饰画雕刻凹纹图案。
7.根据权利要求6所述的基于AI算法的装饰画雕刻凹纹的生成系统,其特征在于,所述跨模态交互特征优化单元,包括:
优化融合子单元,用于对所述上下文参考装饰画图像块语义特征向量的序列和所述需求偏好词粒度语义特征向量的序列进行优化融合以获得优化融合特征向量;以及
优化特征融合子单元,用于将所述优化融合特征向量与所述参考装饰画图像块-需求词粒度交互特征向量的序列进行融合以得到所述优化参考装饰画图像块-需求词粒度交互特征向量的序列。
8.一种基于AI算法的装饰画雕刻凹纹的生成方法,其特征在于,包括:
获取由用户选择的具有特定风格的参考装饰画;
获取由用户输入的需求偏好文本描述;
对所述参考装饰画进行局部区域上下文语义关联分析以得到上下文参考装饰画图像块语义特征向量的序列;
对所述需求偏好文本描述进行基于词粒度的上下文语义编码以得到需求偏好词粒度语义特征向量的序列;
对所述上下文参考装饰画图像块语义特征向量的序列和所述需求偏好词粒度语义特征向量的序列进行跨模态特征双向交互融合处理以得到参考装饰画图像块-需求词粒度交互特征向量的序列;以及
将所述参考装饰画图像块-需求词粒度交互特征向量的序列进行二维排列为参考装饰画-需求语义交互特征,并基于所述参考装饰画-需求语义交互特征,得到生成饰画雕刻凹纹图案。
9.根据权利要求8所述的基于AI算法的装饰画雕刻凹纹的生成方法,其特征在于,对所述参考装饰画进行局部区域上下文语义关联分析以得到上下文参考装饰画图像块语义特征向量的序列,包括:对所述参考装饰画进行图像分块处理后通过基于ViT模型的图像编码器以得到所述上下文参考装饰画图像块语义特征向量的序列。
10.根据权利要求9所述的基于AI算法的装饰画雕刻凹纹的生成方法,其特征在于,对所述需求偏好文本描述进行基于词粒度的上下文语义编码以得到需求偏好词粒度语义特征向量的序列,包括:对所述需求偏好文本描述进行基于词粒度的上下文语义编码以得到所述需求偏好词粒度语义特征向量的序列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410123818.6A CN117649466B (zh) | 2024-01-30 | 2024-01-30 | 基于ai算法的装饰画雕刻凹纹的生成系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410123818.6A CN117649466B (zh) | 2024-01-30 | 2024-01-30 | 基于ai算法的装饰画雕刻凹纹的生成系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117649466A true CN117649466A (zh) | 2024-03-05 |
CN117649466B CN117649466B (zh) | 2024-05-14 |
Family
ID=90046401
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410123818.6A Active CN117649466B (zh) | 2024-01-30 | 2024-01-30 | 基于ai算法的装饰画雕刻凹纹的生成系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117649466B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102163249A (zh) * | 2011-04-12 | 2011-08-24 | 中国矿业大学 | 用于窗帘设计的交互式进化优化方法 |
US20210081729A1 (en) * | 2019-09-16 | 2021-03-18 | Beijing Baidu Netcom Science Technology Co., Ltd. | Method for image text recognition, apparatus, device and storage medium |
US20220156303A1 (en) * | 2020-11-19 | 2022-05-19 | Cortical.Io Ag | Methods and systems for reuse of data item fingerprints in generation of semantic maps |
CN115114432A (zh) * | 2022-04-29 | 2022-09-27 | 北京邮电大学 | 一种融合全局语义特征与拼接特征的标准内容文本分类方法 |
US11488586B1 (en) * | 2021-07-19 | 2022-11-01 | Institute Of Automation, Chinese Academy Of Sciences | System for speech recognition text enhancement fusing multi-modal semantic invariance |
US20230173395A1 (en) * | 2021-07-14 | 2023-06-08 | Strong Force TX Portfolio 2018, LLC | Systems and methods with integrated gaming engines and smart contracts |
-
2024
- 2024-01-30 CN CN202410123818.6A patent/CN117649466B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102163249A (zh) * | 2011-04-12 | 2011-08-24 | 中国矿业大学 | 用于窗帘设计的交互式进化优化方法 |
US20210081729A1 (en) * | 2019-09-16 | 2021-03-18 | Beijing Baidu Netcom Science Technology Co., Ltd. | Method for image text recognition, apparatus, device and storage medium |
US20220156303A1 (en) * | 2020-11-19 | 2022-05-19 | Cortical.Io Ag | Methods and systems for reuse of data item fingerprints in generation of semantic maps |
US20230173395A1 (en) * | 2021-07-14 | 2023-06-08 | Strong Force TX Portfolio 2018, LLC | Systems and methods with integrated gaming engines and smart contracts |
US11488586B1 (en) * | 2021-07-19 | 2022-11-01 | Institute Of Automation, Chinese Academy Of Sciences | System for speech recognition text enhancement fusing multi-modal semantic invariance |
CN115114432A (zh) * | 2022-04-29 | 2022-09-27 | 北京邮电大学 | 一种融合全局语义特征与拼接特征的标准内容文本分类方法 |
Non-Patent Citations (1)
Title |
---|
刘硕研;须德;冯松鹤;刘镝;裘正定;: "一种基于上下文语义信息的图像块视觉单词生成算法", 电子学报, no. 05, 15 May 2010 (2010-05-15) * |
Also Published As
Publication number | Publication date |
---|---|
CN117649466B (zh) | 2024-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110503598B (zh) | 基于条件循环一致性生成对抗网络的字体风格迁移方法 | |
KR20000064110A (ko) | 얼굴 영상에 기반한 캐릭터 자동 생성 장치 및 방법 | |
Aghamaleki et al. | Multi-stream CNN for facial expression recognition in limited training data | |
CN102567716B (zh) | 一种人脸合成系统及实现方法 | |
KR20200052438A (ko) | 딥러닝 기반 웹툰 자동 채색 프로그램 및 애플리케이션 | |
CN112766079A (zh) | 一种基于内容风格分离的无监督图像到图像翻译方法 | |
WO2024046189A1 (zh) | 文本生成方法以及装置 | |
KR102334705B1 (ko) | 웹툰 드로잉 장치 및 방법 | |
CN117994447B (zh) | 面向型片的车型设计3d图像辅助生成方法和系统 | |
CN116797868A (zh) | 文本图像生成方法以及扩散生成模型训练方法 | |
CN117576246B (zh) | 一种服装二次设计系统及方法 | |
CN114581334A (zh) | 一种基于生成对抗网络的自调节文本生成图像方法 | |
CN117649466B (zh) | 基于ai算法的装饰画雕刻凹纹的生成系统及方法 | |
CN118036322A (zh) | 一种基于aigc的纺织品图案设计评价与推荐系统 | |
CN117557708A (zh) | 图像生成方法、装置、存储介质及计算机设备 | |
Yan et al. | Mixing and Matching Elements for Intelligent Fashion Design: A Generative Adversarial Network with Structure and Texture Disentanglement | |
CN117056828A (zh) | 基于大数据的服装装饰图案定制方法及系统 | |
CN112613439A (zh) | 一种新型的虚拟试衣网络 | |
CN105809612A (zh) | 一种照片转化为表情的方法及智能终端 | |
CN113705241B (zh) | 面向高考咨询基于多视角注意力的智能语义匹配方法与装置 | |
CN115169348A (zh) | 一种基于混合神经网络的事件抽取方法 | |
CN118821461A (zh) | 基于人工智能的方案辅助设计方法及系统 | |
CN112270727B (zh) | 基于ai技术绘制毒株蛋白质图像的方法 | |
CN118247440B (zh) | 一种电视机外壳3d模型构建方法及系统 | |
CN117523050B (zh) | 一种ai视频处理方法与装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |