CN111667342B

CN111667342B - 一种顾客发型推荐的模型

Info

Publication number: CN111667342B
Application number: CN202010493285.2A
Authority: CN
Inventors: 帅仁俊; 刘开凯
Original assignee: Nanjing Tech University
Current assignee: Nanjing Tech University
Priority date: 2020-06-03
Filing date: 2020-06-03
Publication date: 2022-05-17
Anticipated expiration: 2040-06-03
Also published as: CN111667342A

Abstract

本发明公开了一种顾客发型推荐的模型，编码器从顾客的图像中采样，产生隐空间的概率分布，解码器在隐空间中采样该点，然后返回一个伪造的图像。条件变分自编码器(CVAE)对于我们对数据进行条件处理，生成具有特定属性的数据。我们目标是将相似但不同的发型和发色提供给顾客而不是完全重建一个完整的人。采用本发明的技术方案，采集顾客的头像特征，根据顾客的需求条件，输出各种不同的发型和头发颜色，而且同时能够保证顾客的面部特征不失真，做的输入顾客头像而采用本发明的技术方案，只对发型和头发颜色进行多种组合变换，从而供顾客选择。

Description

一种顾客发型推荐的模型

技术领域

本发明涉图像处理的技术领域，具体涉及采用条件变分自编码器输出图像的技术领域。

背景技术

现在顾客想要理发时并不能直观的看到自己可以有什么样的造型，很难想象自己在搭配某些发型或者染成某种颜色后能否得到满意的效果，往往在根据固定的发型设计图片选择发型，而这会导致部分顾客理完发后觉得没有达到自己想要的效果，亦或是选择理发师推荐发型后没有得到直观的视觉感受而导致对发型的不满意。本发明可以自动生成各式各样的发型以供顾客选择，这样可以有效避免理发纠纷，让顾客理完发后不再遗憾。

条件变分自编码器(CVAE)是变分自编码器(VAE)的一种特殊类型，不同之处在于我们对数据进行条件处理，生成具有特定属性的数据。我们目标是将相似但不同的发型和发色提供给顾客而不是完全重建一个完整的人。如果是变分自编码器VAE，生成的图像不仅发型会发生变化，人的样貌也会发生明显变化。就像将数字“1”切去一半，如果我们单纯的使用VAE，则有可能生成的是7而不是1。标准回归模型仅仅对一种预测与实际之间的差异进行惩罚，它是将所有可能性的平均值展现出来，这会使得标准回归模型预测出的是一片模糊噪声，意味着结果被平均化了。我们需要一个可以将一系列(或一个)图像作为输入并同时输出更复杂的分布模型的模型，通过CVAE可以使得每一个输入对应一个输出。而CVAE输出无需预先确定空间的分布结构。

发明内容

本发明使用条件变分自编码器对输入的图像进行处理，输出特定目标变化的图像，提供给顾客多样化的选择，CVAE可以生成很多顾客想象不到的发型和发色。给定输入X，这里的X不是完整的，而是有缺失部分的。同时给定X对应的输出Y，这里的Y是基准真相，即指相对于新的方式得到的图像，作为基准的，由已有的、可靠的方式得到的图像。假设潜变量z～N(0，I)，N(0，I)是标准正态分布。

P(Y|X)＝N(f(z，X)，σ2*I)

增加一个编码函数g(X)来对分布P(z|X)进行估计，我们记g(X)的估计分布为Q(z|X)。这里f是将潜变量z与残缺输入的X映射到基准真相Y确定性函数，将X作为先验条件，可以得到如下表达式：

D[Q(z|Y，X)P(z|Y，X)]

＝Ez～Q(z|X，Y)[log(Q(z|Y，X))-log(P(z|Y，X))]

P(z|Y，X)

＝P(z，Y，X)P(Y，X)

＝P(Y|z，X)P(z|X)P(X)P(Y|X)P(X)

＝P(Y|z，X)P(z|X)P(Y|X)

最后可以得到

log(P(Y|X))-D[Q(z|Y，X)P(z|Y，X)]

＝Ez～Q(z|Y，X)[log(P(Y|z，X))]-D[Q(z|Y，X)P(z|X)]

这里的P(z|X)服从N(0，I)，因为模型假设z独立于X进行采样，给定f，通过对z～N(0，I)进行采样来得到P(Y|X)中对Y的采样。

P(z|X)是z的先验分布，D是kl散度，E是期望。

采用本发明的技术方案，采集顾客的头像特征，根据顾客的需求条件，输出各种不同的发型和头发颜色，而且同时能够保证顾客的面部特征不失真，做的输入顾客头像而采用本发明的技术方案，只对发型和头发颜色进行多种组合变换，从而供顾客选择。

附图说明

下面结合附图对本发明的具体实施方式作进一步详细的描述。

图1是条件变分自编码器模型结构图。

图2是顾客发型推荐的模型结构图。

图3是使用条件变分自编码器对发型颜色进行选择性调整。

图4是使用条件自变分编码器对发型进行自动生成。

具体实施方式

下面结合附图和实施例对本发明的具体技术方案进行说明。

如图1所示，条件变分自编码器模型的结构图，给定输入X，这里的X不是完整的，而是有缺失部分的，X为顾客图像的信息点；同时给定X对应的输出 Y，这里的Y是基准真相，即指相对于新的方式得到的图像，作为基准的，由已有的、可靠的方式得到的图像；

假设潜变量z～N(0，I)，N(0，I)是标准正态分布；

P(Y|X)＝N(f(z，X)，σ2*I)

增加一个编码函数g(X)来对分布P(z|X)进行估计，我们记g(X)的估计分布为Q(z|X)；这里f是将潜变量z与残缺输入的X映射到基准真相Y确定性函数，将X作为先验条件，可以得到如下表达式：

D[Q(z|Y，X)P(z|Y，X)]

＝Ez～Q(z|X，Y)[log(Q(z|Y，X))-log(P(z|Y，X))]

P(z|Y，X)

＝P(z，Y，X)P(Y，X)

＝P(Y|z，X)P(z|X)P(X)P(Y|X)P(X)

＝P(Y|z，X)P(z|X)P(Y|X)

最后可以得到

log(P(Y|X))-D[Q(z|Y，X)P(z|Y，X)]

＝Ez～Q(z|Y，X)[log(P(Y|z，X))]-D[Q(z|Y，X)P(z|X)]

这里的P(z|X)服从N(0，I)，因为模型假设z独立于X进行采样，给定f，通过对z～N(0，I)进行采样来得到P(Y|X)中对Y的采样；

其中，P(z|X)是z的先验分布，D是kl散度，E是期望。

如图3所示，有一个编码器encoder从顾客的图像中采样，产生隐空间 latentspace的概率分布，解码器decoder在隐空间中采样该点，然后返回一个伪造的图像。

如图2所示，M代表产生的编码，N代表每个维度的变量。对于一张给定的图像来说，编码器产生一个分布，在隐空间中采样出一个点出来，然后将该点输入到解码器当中，产生一个人造图像。

输入一张图片，编码器把图片降维成编码如

然后通过解码器将编码生成高维向量即新的图片，输出的图片要和输入图片越接近越好。每个输入向量的维度都代表着一些图像特点，假设0.3对应的是头发的长度，那要是将0.3调到 3，那么生成拥有长头发的图片，若最后一个维度0.9代表头发是不是蓝色，那么值越大，代表头发越蓝。这样生成的图片会和原来图片非常相似，因为只改变了头发长度和颜色而已。就算输入的图片是编码器从未见过的图片，生成的图片仍然会是合理的。

图3是依据顾客发型推荐的模型对发型的颜色进行改变，将顾客的图像信息输入解码器，给定相关的发型颜色的条件，潜在空间进行选择，给定解码器以条件，输出一个新的图像。

图4是依据顾客发型推荐的模型对发型进行的输出，通过cave模型，在不改变客户面部特征的前提下，给予客户多种发型的推荐。

Claims

1.一种顾客发型推荐的模型，其特征在于，编码器从顾客的图像中采样，产生隐空间的概率分布，解码器在隐空间中采样，然后返回一个伪造的图像；给定输入X，X为顾客图像的信息点，这里的X不是完整的，而是有缺失部分的；同时给定X对应的输出Y，这里的Y是基准真相，即指相对于新的方式得到的图像，作为基准的，由已有的、可靠的方式得到的图像；

假设潜变量z～N(0，I)，N(0，I)是标准正态分布；

P(Y|X)＝N(f(z，X)，σ2*I)

D[Q(z|Y，X) P(z|Y，X)]

＝Ez～Q(z|X，Y)[log(Q(z|Y，X))-log(P(z|Y，X))]

而

P(z|Y，X)

＝P(z，Y，X)P(Y，X)

＝P(Y|z，X)P(z|X)P(X)P(Y|X)P(X)

＝P(Y|z，X)P(z|X)P(Y|X)

最后可以得到

log(P(Y|X))-D[Q(z|Y，X) P(z|Y，X)]

＝Ez～Q(z|Y，X)[log(P(Y|z，X))]-D[Q(z|Y，X) P(z|X)]

其中，P(z|X)是z的先验分布，D是kl散度，E是期望。