CN110287484B

CN110287484B - 一种基于人脸特征的汉语文本描述人脸图像生成方法

Info

Publication number: CN110287484B
Application number: CN201910499411.2A
Authority: CN
Inventors: 杨静; 付志超
Original assignee: East China Normal University
Current assignee: East China Normal University
Priority date: 2019-06-11
Filing date: 2019-06-11
Publication date: 2022-12-06
Anticipated expiration: 2039-06-11
Also published as: CN110287484A

Abstract

本发明公开了一种基于人脸特征的汉语文本描述人脸图像生成方法，其特点是该方法对描述人脸特征的中文文本经分句、分词、词性分析、过滤和字典映射，从文本的句子、词语中抽取特征向量，实现中文文本序列到数学表示的转换，将抽取的特征表示与面部图像模版结合，并输入到深度神经网络模型中，生成与文本描述相匹配的人脸图像。本发明与现有技术相比生成符合相应汉语文本所描述特征的人脸图像具有较强的针对性，在处理描述文本的过程中应用了词性过滤操作，并通过自动编码器进行语义过滤以及融合，有效消除了描述文本中与任务无关以及无意义文本的干扰，方法简单、易行，较好的解决了自然语言描述的随意性。

Description

一种基于人脸特征的汉语文本描述人脸图像生成方法

技术领域

本发明涉及自然语言处理及图像生成技术领域，尤其是一种基于人脸特征的汉语文本描述人脸图像生成方法。

背景技术

在一些特定场景下，需要根据给定的部分信息快速获取人物的面部画像，其中就包括基于自然语言的描述性文本生成面部图像的任务。通常这一任务由于描述的内容、信息较为模糊，常常由人力手工完成并加以核对，而随着机器学习方法的发展，向计算机输入人物面部特征从而获取面部图像成为可能。较早的面部图像的方法输入多为一些简单的短语描述或人为规定格式的信息，例如确定发色是黑、红、黄等给定颜色列表中的一种，则相应的发色属性用一个属性-值对来表示，而现实场景中，常常需要直接从自然语言文本中提炼信息并转换为对应图像。

现有技术的自然语言的描述具有相当的随意性，难以直接用简单的属性完全表示，而且目前的方法以英语等语言为基础，这些语言与中文语法、字词格式等方面存在着重要的区别，相关的方法难以通用，因此亟需研发建立相关模型抽取特征进而生成图像尤为重要。

发明内容

本发明的目的是针对现有技术的不足而设计的一种基于人脸特征的汉语文本描述人脸图像生成方法，采用深度神经网络模型将抽取的人脸特征表示与面部图像模版融合，生成与文本描述相匹配的人脸图像，方法简单、易行，在处理描述文本的过程中应用了词性过滤操作，并通过自动编码器进行语义过滤以及融合，有效消除了描述文本中与任务无关以及无意义文本的干扰，精准度高。

本发明的目的是这样实现的：一种基于人脸特征的汉语文本描述人脸图像生成方法，其特点是该方法对描述人脸特征的中文文本经分句、分词、词性分析、过滤和字典映射，从文本的句子、词语中抽取特征向量，实现中文文本序列到数学表示的转换，将抽取的特征表示与面部图像模版结合，并输入到深度神经网络模型中，生成与文本描述相匹配的人脸图像，其具体实现包括以下步骤：

a、获取描述面部特征的汉语言文本输入；

b、提取文本中可以切分短句的分隔符位置，选择定位短句的分隔符；

c、使用上述选择的分隔符，将描述面部特征的汉语言文本分割成描述短句列表S，且分割后的短句中不包含上述分隔符；

d、对短句列表S中的每个短句S_i进行中文分词以及词性标注，并过滤部分词性词语，保留具备特征描述能力的词或短语，得到对应的分词结果S(e)_i，对应短句列表S得到分词结果列表S(e)；所述短句S_i为短句列表S中的第i个短句；

e、利用word2vec词向量工具对每个S(e)_i中的每个单词S(e)_ij进行向量化，得到短句S(e)_i对应的向量化结果为V_i；单词S(e)_ij对应的向量化结果为V_ij；短句列表S对应的向量化结果为V；所述单词S(e)_ij为短句S_i分词列表S(e)_i中的第j个单词；

f、将每个短句S(e)_i对应的向量化结果V_i输入系统中第一个递归自动编码器(Recursive AutoEncoder)，将输出的单一向量VS_i作为句子的表示向量，得到短句列表S所对应的向量列表VS；

g、将向量列表VS输入系统中的第二个递归自动编码器(RecursiveAutoEncoder)，并将中间层输出的单一向量VF作为整个面部特征描述文本的最终向量表示；

h、将上述步骤获取的向量VF与面部图像模版组合后输入系统中的面部图像生成模型中，得到与输入文本描述相符的人脸图像，所述生成模型基于深度神经网络。

所述描述面部特征的汉语言文本包括不确定类型数目的其它类型语言文本，且只包含对单一人物面部特征的描述。

所述分词结果列表S(e)中包括具有名词、代词、形容词、数词、量词、介词当中一种词性的词或短语。

本发明与现有技术相比生成符合相应汉语文本所描述特征的人脸图像具有较强的针对性，在处理描述文本的过程中应用了词性过滤操作，并通过自动编码器进行语义过滤以及融合，有效消除了描述文本中与任务无关以及无意义文本的干扰，方法简单、易行，较好的解决了自然语言描述的随意性。

附图说明

图1为本发明流程示意图。

具体实施方式

参阅附图1，本发明对描述人脸特征的中文文本经分句、分词、词性分析、过滤和字典映射，从文本的句子、词语中抽取特征向量，实现中文文本序列到数学表示的转换，将抽取的特征表示与面部图像模版结合，并输入到深度神经网络模型中，生成与文本描述相匹配的人脸图像，其具体实现包括以下步骤：

a、获取描述面部特征的汉语言文本输入；

下面以具体实施为例对本发明作进一步阐述：

实施例1

本发明按下述步骤抽取的特征表示与面部图像模版结合，并输入到深度神经网络模型中，生成与文本描述相匹配的人脸图像的：

(1)通过自定的不确定的服务形式，在一次会话范围内，获取描述面部特征的汉语言文本序列，作为输入。

(2)对于除语言字母、文字和数字外的文本字符，包括标点符号在内的部分特殊符号，将之作为分隔符，并提取出其在文本中的位置。

(3)使用步骤(2)中选择的分隔符，将描述人脸特征的汉语言文本分割成描述短句列表S，且分割后的短句中讲不包含上述分隔符。

(4)对于短句列表S中的短句S_i，(i表示短句S_i在短句列表中的顺序，下同)，对其进行中文分词以及词性标注，分词结果保留具备特征描述能力的词或短语，记短句S_i对应分词结果为S(e)_i，整个短句列表S对应的分词结果为S(e)。

(5)对于任一S(e)_i中的任一单词S(e)_ij，(j表示词语S(e)_ij在短句S_i分词列表S(e)_i中的顺序，下同)，利用word2vec词向量工具将其进行向量化，对应完整S的向量化结果记为V，处理后短句S(e)_i的向量化结果记为V_i，单词S(e)_ij的向量化结果记为V_ij。

(6)对于步骤(5)获取的每个S(e)_i，将其对应向量列表V_i输入系统中第一个的Recursive AutoEncoder(递归自动编码器)，并将输出的单一向量VS_i作为句子的表示向量，并将整个短句列表得到的向量列表记为VS。

(7)将步骤(6)取得的短句列表对应的向量列表VS输入系统中的第二个RecursiveAutoEncoder，并将中间层输出的单一向量VF作为整个面部特征描述文本的最终向量表示。

(8)将步骤(7)中获取的向量VF和面部图像模版输入系统中的面部图像生成模型部分，输出结果为最终的脸部图像，该部分使用的生成模型基于深度神经网络。

(9)结束。

本发明关注基于自然语言文本生成关联图像的问题，并针对汉语文本进行设计，旨在生成符合相应汉语文本所描述特征的人脸图像，具有较强的针对性，和健壮性，在处理描述文本的过程中应用了词性过滤操作，并通过自动编码器进行语义过滤以及融合，有效消除了描述文本中与任务无关以及无意义文本的干扰。

以上只是对本发明作进一步的说明，并非用以限制本专利，凡为本发明等效实施，均应包含于本专利的权利要求范围之内。

Claims

1.一种基于人脸特征的汉语文本描述人脸图像生成方法，其特征在于该方法对描述人脸特征的中文文本经分句、分词、词性分析、过滤和字典映射，从文本的句子、词语中抽取特征向量，实现中文文本序列到数学表示的转换，将抽取的特征表示与面部图像模版结合，并输入到深度神经网络模型中，生成与文本描述相匹配的人脸图像，其具体实现过程包括以下步骤：

a、获取描述面部特征的汉语言文本输入；

c、使用上述选择的分隔符，将描述面部特征的汉语言文本分割成描述短句列表