CN111583352B - 一种用于移动终端的风格化图标智能生成方法 - Google Patents
一种用于移动终端的风格化图标智能生成方法 Download PDFInfo
- Publication number
- CN111583352B CN111583352B CN202010334947.1A CN202010334947A CN111583352B CN 111583352 B CN111583352 B CN 111583352B CN 202010334947 A CN202010334947 A CN 202010334947A CN 111583352 B CN111583352 B CN 111583352B
- Authority
- CN
- China
- Prior art keywords
- icon
- hand
- decoder
- style
- codecs
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/001—Texturing; Colouring; Generation of texture or colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/80—Creating or modifying a manually drawn or painted image using a manual input device, e.g. mouse, light pen, direction keys on keyboard
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/002—Image coding using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种用于移动终端的风格化图标智能生成方法,采用编解码器中的编码器分别对手绘风格图标及非手绘风格图标进行特征图提取,设提取的手绘风格图标的特征图为FS;设提取的非手绘风格图标的特征图为FC;将FS和FC融合后输入解码器,由解码器生成风格化图标。本发明该方法利用深度学习的相关技术,在设计人员提供少量的手绘图标后可以自动生成同风格的应用图标,节省了设计工时。
Description
技术领域
本发明涉及计算机应用技术中的图像处理技术领域,特别涉及一种用于移动终端的风格化图标智能生成方法。
背景技术
目前,随着移动终端越来越多,尤其是智能手机的普及。用户对于终端界面的交互设计更加重视,对于主题的多样化也有了更多的需求。目前主题图标的制作分为两类,第一类是只改变图标的背板与色系,一套主题中的图标采用同一种背板,直观上比较单调;第二类是设计师手绘图标,每一款应用都对应一个手工绘制的图标,这类图标更受到消费者喜爱,但是需要消耗更多的人工。智能手机上的应用有成百上千个,若要对所有的图标都进行重绘,工作量是很大的,通常为了减少工作量,选取排名靠前的一些应用进行重新绘制,这也就意味着很大一部分图标还是原始图标,并不符合当前主题。
目前的一些技术主要是针对第一类图标进行辅助设计,通过计算技术帮助设计人员快速合成应用图标。但是针对第二类图标,并没有有效的方法可以帮助设计人员提高效率。
发明内容
本发明为解决公知技术中存在的技术问题而提供一种用于移动终端的风格化图标智能生成方法。
本发明为解决公知技术中存在的技术问题所采取的技术方案是:一种用于移动终端的风格化图标智能生成方法,构建基于深度神经网络的编解码器;采用编解码器中的编码器分别对手绘风格图标及非手绘风格图标进行特征图提取,设提取的手绘风格图标的特征图为FS;设提取的非手绘风格图标的特征图为FC;将FS和FC融合后输入编解码器中的解码器,由解码器生成风格化图标。
进一步地,包括如下步骤:采集手绘风格图标及非手绘风格图标作为训练样本,并对手绘风格图标训练样本进行预处理;构建编解码器;使用非手绘风格图标训练样本及经过预处理的手绘风格图标训练样本训练解码器;编码器采用ImageNet上预训练的参数;采用编码器分别提取FS和FC;将FS和FC融合后输入训练完成的解码器。
进一步地,对手绘风格图标训练样本进行预处理的方法包括:对手绘风格图标训练样本进行应用类别的标注。
进一步地,构建编解码器的方法包括:编码器采用没有归一化的VGG网络,在每次池化后的第一个卷积层都输出当前的特征图,在不同的节点输出的特征图尺寸不同,对应不同尺度特征图,分别构建对应的解码器,构成多对编解码器。
进一步地,训练编解码器方法包括:每对编解码器单独训练。
进一步地,将多对编解码器依次顺序编号:分别为第1对编解码器至第n对编解码器;各对编解码器中的编码器分别提取手绘风格图标的特征图;设第i对编解码器中的编码器提取的手绘风格图标的特征图为FSi,i=1、2…n;将非手绘风格图标输入至第1对编解码器中;设第i对编解码器中的编码器输出的特征图为FCi,i=1、2…n;将FSi和FCi融合后输入至第i对编解码器中的解码器中;设第i对编解码器中的解码器的输出为Ii,i=1、2…n-1;将Ii输入至第i+1对编解码器中的编码器中;第n对编解码器中的解码器的输出为风格化图标。
进一步地,训练编解码器方法包括:训练过程中的损失包括结构损失、颜色矩损失及像素级损失;采用这三个损失的加权和作为整个网络的损失函数。
本发明具有的优点和积极效果是:该方法利用深度学习的相关技术,在设计人员提供少量的手绘图标后可以自动生成同风格的应用图标,节省了设计工时。
附图说明
图1是本发明的一种工作原理示意图。
图2是本发明的损失函数中的结构损失原理图。
图3是本发明的一种工作流程示意图。
具体实施方式
为能进一步了解本发明的发明内容、特点及功效,兹列举以下实施例,并配合附图详细说明如下:
请参见图1至图3,一种用于移动终端的风格化图标智能生成方法,构建基于深度神经网络的编解码器;采用编解码器中的编码器分别对手绘风格图标及非手绘风格图标进行特征图提取,设提取的手绘风格图标的特征图为FS;设提取的非手绘风格图标的特征图为FC;将FS和FC融合后输入编解码器中的解码器,由解码器生成风格化图标。
附图及说明书中的英文feature map中文释义为特征图。CNN中文释义为卷积神经网络。
可采用现有技术中的适用神经网络构建编解码器;编解码器包括编码器和解码器;采用编码器提取特征图,将不同的特征图融合后输入至解码器,由解码器生成融合两种特征的风格化图标。
可采用现有技术中的各种特征图融合方法将几种特征图进行融合,例如可采用如下几种特征图像融合的方法:加权平均法、贝叶斯估计方法、聚类分析方法等。
优选地,该方法可包括如下步骤:采集手绘风格图标及非手绘风格图标作为训练样本,并对手绘风格图标训练样本进行预处理;构建编解码器;使用非手绘风格图标训练样本及经过预处理的手绘风格图标训练样本训练解码器;编码器采用ImageNet上预训练的参数;采用编码器分别提取FS和FC;将FS和FC融合后输入训练完成的解码器,由解码器生成风格化图标。
优选地,对手绘风格图标训练样本进行预处理的方法可包括:对手绘风格图标训练样本进行应用类别的标注。
优选地,构建编解码器的方法可包括:编码器可采用没有归一化的VGG网络,在每次池化后的第一个卷积层都输出当前的特征图,在不同的节点输出的特征图尺寸可不同,对应不同尺度特征图,分别构建对应的解码器,构成多对编解码器。
VGG网络通过反复堆叠3*3的小卷积核和2*2的最大池化层,可成功的搭建了16-19层的深度卷积神经网络。VGG网络错误率低同时泛化能力非常好,在不同的图片数据集上都有良好的表现。VGG网络可用来提取特征图像。
优选地,训练编解码器方法可包括:每对编解码器单独训练。
优选地,可将多对编解码器依次顺序编号:分别为第1对编解码器至第n对编解码器,各对编解码器中的编码器分别提取手绘风格图标的特征图;可设第i对编解码器中的编码器提取的手绘风格图标的特征图为FSi,i=1、2…n;将非手绘风格图标输入至第1对编解码器中;可设第i对编解码器中的编码器输出的特征图为FCi,i=1、2…n;将FSi和FCi融合后输入至第i对编解码器中的解码器中;可设第i对编解码器中的解码器的输出为Ii,i=1、2…n-1;将Ii输入至第i+1对编解码器中的编码器中;第n对编解码器中的解码器的输出为风格化图标。
优选地,训练编解码器方法包括:训练过程中的损失可包括结构损失、颜色矩损失及像素级损失;采用这三个损失的加权和作为整个网络的损失函数。
下面以本发明的一个优选实施例来进一步说明本发明的工作流程及工作原理:
一种用于移动终端的风格化图标智能生成方法,具体包括如下步骤:
数据预处理步骤:对不同风格的手绘图标进行类别的标注。这里的类别是指应用的类别,不用的应用具有不同的类别标签。
模型构建步骤:整体的结构采用自编码器神经网络模型结构。对于解码器,在不同的节点有不同尺度的特征图的输出,对应不同尺度特征图,分别构建解码器。
模型训练步骤:训练过程中的损失包括结构损失、颜色矩损失及像素级损失;采用这三个损失的加权和作为整个网络的损失函数。其中结构损失函数是根据应用图标特点设计的,由边缘提取和分类器组成。
生成应用图标步骤:解码器对设计师手绘的小部分同风格图标进行特征提取并压缩得到FS。对未绘制的图标进行风格化时,由解码器提取原始图标的特征FC,融合FS和FC,应用解码器生成风格化后的图标。
在数据预处理步骤中,为了保证神经网络可以得到有效的训练,要尽可能多的收集适合的图标数据。我们主要是针对手绘风格进行收集。对收集的图标进行标注,确保标签与应用类型一一对应。
在模型构建步骤中,编码器采用没有归一化的vgg网络,在每次池化后的第一个卷积层都输出当前的特征图,一共输出四个特征图,他们的尺寸分别为128*128*64、64*64*128、32*32*256、16*16*512;对于不同大小的特征图设计不同的解码器,目的是将featuremap解码成图标图片。
在模型训练步骤中,要分别训练四对编解码器,其中编码器使用ImageNet数据集上预训练的参数,解码器的参数需要进行训练。ImageNet数据集是一个用于视觉对象识别软件研究的大型可视化数据库,超过1400万的图像URL被ImageNet手动注释,以指示图片中的对象;在至少一百万个图像中,还提供了边界框。ImageNet包含2万多个类别。
训练过程中的损失函数一共由三部分构成,第一部分是结构损失,公式表示为:
F1=Lcross_entropy(y,f(x));
其中Lcross_entropy表示交叉熵损失函数,y为图标的真实类别,f(x)为预测类别,f(x)的结构如图2所示。结构损失函数主要由边缘提取和分类器构成,其中分类器需要事先进行训练,它是对解码器生成的图像先使用边缘检测算子进行边缘提取,然后进行类别判断。
第二部分是颜色矩损失,颜色矩包括一阶颜色矩(均值):
二阶颜色矩(标准差):
三阶颜色矩(方差):
对RGB每个颜色通道都提取颜色矩,可得到一个9维颜色矩向量:
LC=[μR,σR,sR,μG,σG,sG,μB,σB,sB];
对原始图像的颜色矩向量和解码后图像的颜色矩向量求L1loss作为两张图像的颜色矩损失,即:
F2=L1(LCsource,LCtarget);
其中,L1表示L1loss,LCsource为原始图像颜色矩,LCtarget为解码后图像颜色矩。
第三部分是像素级损失,是对解码后的图像与原始图像求解L2loss。即:
F3=L2(Isource,Idecoder);
其中L2为L2loss损失函数,Isource为图标的原始图像,Idecoder为解码器输出后的图标图像。
使用这三个损失的加权和作为整个网络的损失函数L:
L=λ1F1+λ2F2+λ3F3。
这样训练得到的解码器在尽可能复原图像的前提下能够对图标结构和颜色分布更加敏感。通过训练可以得到4个网络层数由浅到深的编码器E1、E2、E3、E4,以及阈值对应的4个解码器D1、D2、D3、D4。
在生成应用图标步骤中,首先对已经绘制的应用图标提取特征,如图1所示,对多对编解码器依次顺序编号;分别为第1对编解码器至第4对编解码器,第1对编解码器的编码器为编码器1,第2对编解码器的编码器为编码器2,第2对编解码器的编码器为编码器3,第2对编解码器的编码器为编码器4;,第1对编解码器的解码器为解码器1,第2对编解码器的解码器为解码器2,第2对编解码器的解码器为解码器3,第2对编解码器的解码器为解码器4。
各对编解码器中的编码器分别提取手绘风格图标的特征图;将N个手绘图标送入编码器中,得到W*H*C*N大小的特征图,然后再调整尺寸为M*C*N(其中M=W*H),由四个编码器可以得到四个不同的特征图Fs1、Fs2、Fs3、Fs4。
融合四个不同的特征Fs1、Fs2、Fs3、Fs4生成风格化的应用图标的流程可如图3所示。
具体包括如下步骤:
步骤1:用编码器1对非手绘图标Iin进行编码得到Fc1;
步骤2:融合Fc1与Fs1得到F1;
步骤3:解码器1对F1解码得到风格化的图标图像I1;
步骤4:I1作为编码器2的输入,得到Fc2;
步骤5:融合Fc2与Fs2得到F2;
步骤6:解码器2对F2解码得到风格化后的图标图像I2;
步骤7:I2作为编码器3的输入,得到Fc3;
步骤8:融合Fc3与Fs3得到F3;
步骤9:解码器3对F3解码得到风格化后的图标图像I3;
步骤10:I3作为编码器4的输入,得到Fc4;
步骤11:融合Fc4和Fs4得到F4;
步骤12:解码器4对F4解码得到最终生成的应用图标Iout。
其中,可采用如下方法融合FS和FC:
对于Fs∈RM×C×N,Fs可以表示为fi∈RM×C,i=1,2,…,N的集合,对每一个fi定义为:
其中Ei为进行特征分解后的特征向量构成的矩阵,Di为特征值构成的对角矩阵,令:
有对于整个Fs,会得到N个si,i=1,2,...,N,对其求均值有:
S=mean({s1,s2,...,sN});
对于Fc∈Rw×h×C,对齐调整大小F′C∈RM×C,其中M=w×h,定义为:
其中Ec为进行特征分解后的特征向量构成的矩阵,Dc为特征值构成的对角矩阵,将Fc和Fs融合时执行如下公式:
以上所述的实施例仅用于说明本发明的技术思想及特点,其目的在于使本领域内的技术人员能够理解本发明的内容并据以实施,不能仅以本实施例来限定本发明的专利范围,即凡本发明所揭示的精神所作的同等变化或修饰,仍落在本发明的专利范围内。
Claims (5)
1.一种用于移动终端的风格化图标智能生成方法,其特征在于,构建基于深度神经网络的编解码器;采用编解码器中的编码器分别对手绘风格图标及非手绘风格图标进行特征图提取,设提取的手绘风格图标的特征图为FS;设提取的非手绘风格图标的特征图为FC;将FS和FC融合后输入编解码器中的解码器,由解码器生成风格化图标;
包括如下步骤:采集手绘风格图标及非手绘风格图标作为训练样本,并对手绘风格图标训练样本进行预处理;构建编解码器;使用非手绘风格图标训练样本及经过预处理的手绘风格图标训练样本训练解码器;编码器采用ImageNet上预训练的参数;采用编码器分别提取FS和FC;将FS和FC融合后输入训练完成的解码器;
训练编解码器方法包括:训练过程中的损失包括结构损失、颜色矩损失及像素级损失;采用这三个损失的加权和作为整个网络的损失函数;
结构损失公式表示为:
F1=Lcross_entropy(f,f(x));
其中Lcross_entropy表示交叉熵损失函数,y为图标的真实类别,f(x)为预测类别,结构损失函数主要由边缘提取和分类器构成,其中分类器需要事先进行训练,它是对解码器生成的图像先使用边缘检测算子进行边缘提取,然后进行类别判断;
颜色矩损失:
颜色矩包括一阶颜色矩(均值):
二阶颜色矩(标准差):
三阶颜色矩(方差):
对RGB每个颜色通道都提取颜色矩,得到一个9维颜色矩向量:
LC=[μR,σR,sR,μG,σG,sG,μB,σB,sB];
对原始图像的颜色矩向量和解码后图像的颜色矩向量求L1loss作为两张图像的颜色矩损失,即:
F2=L1(LCsource,LCtarget);
其中,L1表示L1loss,LCsource为原始图像颜色矩,LCtarget为解码后图像颜色矩;
第三部分是像素级损失,是对解码后的图像与原始图像求解L2loss;即:
F3=L2(Isource,Idec);
其中L2为L2loss损失函数,Isource为图标的原始图像,Idecoder为解码器输出后的图标图像;
使用这三个损失的加权和作为整个网络的损失函数L:
L=λ1F1+λ2F2+λ3F3。
2.根据权利要求1所述的用于移动终端的风格化图标智能生成方法,其特征在于,对手绘风格图标训练样本进行预处理的方法包括:对手绘风格图标训练样本进行应用类别的标注。
3.根据权利要求1所述的用于移动终端的风格化图标智能生成方法,其特征在于,构建编解码器的方法包括:编码器采用没有归一化的VGG网络,在每次池化后的第一个卷积层都输出当前的特征图,在不同的节点输出的特征图尺寸不同,对应不同尺度特征图,分别构建对应的解码器,构成多对编解码器。
4.根据权利要求3所述的用于移动终端的风格化图标智能生成方法,其特征在于,训练编解码器方法包括:每对编解码器单独训练。
5.根据权利要求3所述的用于移动终端的风格化图标智能生成方法,其特征在于,将多对编解码器依次顺序编号:分别为第1对编解码器至第n对编解码器;各对编解码器中的编码器分别提取手绘风格图标的特征图;设第i对编解码器中的编码器提取的手绘风格图标的特征图为FSi,i=1、2…n;将非手绘风格图标输入至第1对编解码器中;设第i对编解码器中的编码器输出的特征图为FCi,i=1、2…n;将FSi和FCi融合后输入至第i对编解码器中的解码器中;设第i对编解码器中的解码器的输出为Ii,i=1、2…n-1;将Ij输入至第i+1对编解码器中的编码器中;第n对编解码器中的解码器的输出为风格化图标。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010334947.1A CN111583352B (zh) | 2020-04-24 | 2020-04-24 | 一种用于移动终端的风格化图标智能生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010334947.1A CN111583352B (zh) | 2020-04-24 | 2020-04-24 | 一种用于移动终端的风格化图标智能生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111583352A CN111583352A (zh) | 2020-08-25 |
CN111583352B true CN111583352B (zh) | 2023-10-13 |
Family
ID=72112551
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010334947.1A Active CN111583352B (zh) | 2020-04-24 | 2020-04-24 | 一种用于移动终端的风格化图标智能生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111583352B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112908146A (zh) * | 2020-12-26 | 2021-06-04 | 云景文旅科技有限公司 | 一种手绘地图切割呈现方法以及智慧导游导览系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108596830A (zh) * | 2018-04-28 | 2018-09-28 | 国信优易数据有限公司 | 一种图像风格迁移模型训练方法以及图像风格迁移方法 |
CN109766895A (zh) * | 2019-01-03 | 2019-05-17 | 京东方科技集团股份有限公司 | 用于图像风格迁移的卷积神经网络的训练方法和图像风格迁移方法 |
CN110084741A (zh) * | 2019-04-26 | 2019-08-02 | 衡阳师范学院 | 基于显著性检测和深度卷积神经网络的图像风络迁移方法 |
CN110473141A (zh) * | 2019-08-02 | 2019-11-19 | Oppo广东移动通信有限公司 | 图像处理方法、装置、存储介质及电子设备 |
CN110490791A (zh) * | 2019-07-10 | 2019-11-22 | 西安理工大学 | 基于深度学习风格迁移的服饰图像艺术化生成方法 |
-
2020
- 2020-04-24 CN CN202010334947.1A patent/CN111583352B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108596830A (zh) * | 2018-04-28 | 2018-09-28 | 国信优易数据有限公司 | 一种图像风格迁移模型训练方法以及图像风格迁移方法 |
CN109766895A (zh) * | 2019-01-03 | 2019-05-17 | 京东方科技集团股份有限公司 | 用于图像风格迁移的卷积神经网络的训练方法和图像风格迁移方法 |
CN110084741A (zh) * | 2019-04-26 | 2019-08-02 | 衡阳师范学院 | 基于显著性检测和深度卷积神经网络的图像风络迁移方法 |
CN110490791A (zh) * | 2019-07-10 | 2019-11-22 | 西安理工大学 | 基于深度学习风格迁移的服饰图像艺术化生成方法 |
CN110473141A (zh) * | 2019-08-02 | 2019-11-19 | Oppo广东移动通信有限公司 | 图像处理方法、装置、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111583352A (zh) | 2020-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109918671B (zh) | 基于卷积循环神经网络的电子病历实体关系抽取方法 | |
WO2022001623A1 (zh) | 基于人工智能的图像处理方法、装置、设备及存储介质 | |
CN111291212A (zh) | 基于图卷积神经网络的零样本草图图像检索方法和系统 | |
CN110428428A (zh) | 一种图像语义分割方法、电子设备和可读存储介质 | |
CN112699937B (zh) | 基于特征引导网络的图像分类与分割的装置、方法、设备及介质 | |
WO2021129181A1 (en) | Portrait segmentation method, model training method and electronic device | |
WO2021238333A1 (zh) | 一种文本处理网络、神经网络训练的方法以及相关设备 | |
CN114973049B (zh) | 一种统一卷积与自注意力的轻量视频分类方法 | |
CN115438215A (zh) | 图文双向搜索及匹配模型训练方法、装置、设备及介质 | |
CN110110724A (zh) | 基于指数型挤压函数驱动胶囊神经网络的文本验证码识别方法 | |
CN111985525A (zh) | 基于多模态信息融合处理的文本识别方法 | |
CN114648535A (zh) | 一种基于动态transformer的食品图像分割方法及系统 | |
CN114596566A (zh) | 文本识别方法及相关装置 | |
CN114495916B (zh) | 背景音乐的插入时间点确定方法、装置、设备和存储介质 | |
WO2022222854A1 (zh) | 一种数据处理方法及相关设备 | |
CN113436224B (zh) | 一种基于显式构图规则建模的智能图像裁剪方法及装置 | |
CN111583352B (zh) | 一种用于移动终端的风格化图标智能生成方法 | |
CN113378938B (zh) | 一种基于边Transformer图神经网络的小样本图像分类方法及系统 | |
US11948090B2 (en) | Method and apparatus for video coding | |
CN117033609B (zh) | 文本视觉问答方法、装置、计算机设备和存储介质 | |
CN112668543B (zh) | 一种手模型感知的孤立词手语识别方法 | |
Zhang et al. | A simple and effective static gesture recognition method based on attention mechanism | |
Cambuim et al. | An efficient static gesture recognizer embedded system based on ELM pattern recognition algorithm | |
CN109145140A (zh) | 一种基于手绘轮廓图匹配的图像检索方法及系统 | |
CN117094362A (zh) | 一种任务处理方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |