CN117033688A - 一种基于ai交互的人物图像场景生成系统 - Google Patents

一种基于ai交互的人物图像场景生成系统 Download PDF

Info

Publication number
CN117033688A
CN117033688A CN202311011914.3A CN202311011914A CN117033688A CN 117033688 A CN117033688 A CN 117033688A CN 202311011914 A CN202311011914 A CN 202311011914A CN 117033688 A CN117033688 A CN 117033688A
Authority
CN
China
Prior art keywords
user
image
clothing
scene
hairstyle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311011914.3A
Other languages
English (en)
Other versions
CN117033688B (zh
Inventor
胡海杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Feiwu Shanghai Creative Design Co ltd
Original Assignee
Feiwu Shanghai Creative Design Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Feiwu Shanghai Creative Design Co ltd filed Critical Feiwu Shanghai Creative Design Co ltd
Priority to CN202311011914.3A priority Critical patent/CN117033688B/zh
Publication of CN117033688A publication Critical patent/CN117033688A/zh
Application granted granted Critical
Publication of CN117033688B publication Critical patent/CN117033688B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/535Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/001Texturing; Colouring; Generation of texture or colour

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明涉及图像生成技术领域,具体为一种基于AI交互的人物图像场景生成系统,该人物图像场景生成系统包括用户交互设计模块、人物图像拍摄模块、人物图像分析处理模块、人物图像处理模块、图像整合修正模块、图像生成模块、管理数据库。本系统根据用户通过语音识别接口选择的关键词为用户匹配相应的场景主题,同时对拍摄的用户静态图像进行年龄评估并以此为基础,层层筛选,为用户人物图像匹配最合适的发型、服装,弥补了现有技术中对年龄关注度不高的缺陷,提供了更符合年龄特征和审美偏好的选择,达到了用户需求和喜好进行个性化定制的标准,提升了视觉效果和真实感,增强了生成图像的逼真度和质量,使其更符合用户的期望。

Description

一种基于AI交互的人物图像场景生成系统
技术领域
本发明涉及图像生成技术领域,具体而言,涉及一种基于AI交互的人物图像场景生成系统。
背景技术
随着人工智能技术的快速发展,图像生成领域取得了显著的进步。其中,基于AI交互的人物图像场景生成系统成为了备受关注的研究方向。基于AI交互的人物图像场景生成系统是一种利用人工智能技术生成人物图像和相应场景的系统,这种系统利用深度学习、计算机视觉等技术,能够根据用户的输入和需求,实时生成具有多样化场景背景的人物图像。
尽管现有技术在人物图像场景生成领域取得了显著进展,但仍然存在一些不足之处,限制了系统的性能和实用性,具体体现在以下方面:
一、现有系统在生成复杂、个性化发型方面仍面临挑战,由于发型结构和纹理具有复杂性,现有系统往往难以捕捉和生成不同发型间的细微差别,想要生成准确、有真实感的发型图像有一定难度。此外,现有系统往往会忽略人物年龄特征,年龄也会影响发型选择,如年轻人时尚发型与年长者成熟稳重的发型有所不同,而现有系统在这方面上的考虑还不够全面。
二、服装生成的多样性有限,在服装方面,系统也可能受限于可用的训练数据,对不同年龄段和场景下的服装风格理解可能不够准确。例如,对于一位儿童或年轻人而言,系统可能会生成更为活泼和色彩鲜艳的服装,而对于中年人或者职业人士,则可能需要更加正式和专业的服装。此外,不同场景下的服装要求和风格也会存在差异,而现有系统目前没有充分考虑到这一点。
三、现有技术还面临着图像语义理解和场景感知方面的挑战。在人物图像场景生成中,系统需要准确理解用户的输入,并在生成图像时合理地融入场景背景,这就对系统的算法和模型提出了更高的要求。同时现有系统在生成场景时可能未能充分考虑人物与场景之间的协调性,如光照和阴影的一致性,容易使得生成的图像在整体感和真实度方面出现不协调的情况。
发明内容
为了克服背景技术中的缺点,本发明实施例提供了一种基于AI交互的人物图像场景生成系统,能够有效解决上述背景技术中涉及的问题。
本发明的目的可以通过以下技术方案来实现:一种基于AI交互的人物图像场景生成系统,包括用户交互设计模块、人物图像拍摄模块、人物图像分析处理模块、人物图像处理模块、图像整合修正模块、图像生成模块、管理数据库。
用户交互设计模块,包括语音识别单元和场景匹配单元,语音识别单元用于采集用户的语音信息,将用户的语音信息转换成文字,并提取相应的关键字,场景匹配单元用于将提取的关键字与数据库中的场景关键词进行匹配,进行筛选得到用户交互场景。
人物图像拍摄模块,用于通过使用高清相机获取用户的图像,将其记为用户静态图像。
人物图像分析处理模块,用于根据用户静态图像获取用户年龄评估关联数据,对用户的年龄进行分析评估,进而获得用户的用户年龄评估关联系数。
人物图像处理模块,用于根据用户的用户年龄评估关联系数进行相应的服装、发型匹配,得到预选服装和预选发型,将用户静态图像中用户的原始发型和原始服装与预选发型和预选服装分别进行比较处理,筛选出用户待确定发型集合和用户待确定服装集合,从而进一步筛选得到用户的图像发型和图像服装,并将用户的图像发型和图像服装导入用户的图像中,进而得到用户装饰图像。
图像整合修正模块,用于将用户交互场景、用户装饰图像进行整合,得到用户场景装饰图像,并将用户场景装饰图像进行亮度修正。
图像生成模块,用于读取亮度修正后的用户场景装饰图像,将其记为最终用户图像,并将其进行生成展示。
管理数据库,用于存储图像的像素密度、各场景主题词、各场景主题词对应的场景、场景对应的各服装、场景对应的各发型、年龄评价指数阈值、各年龄段对应的服装、各年龄段对应的发型、各年龄区间对应的年龄评价指数范围、各光泽度对应皮肤亮度、色度分量修正系数、用户头发标准密集度阈值、皱纹特征数据匹配系数对应的皱纹级别数据、皱纹特征数据修正系数。
优选的,所述人物图像分析处理模块中用户的用户年龄评估关联数据包括皮肤光泽度参考值、皱纹级别参考值、头发覆盖率。
优选的,所述皮肤光泽度参考值的具体分析方法包括以下步骤:第一步,通过对用户静态图像中用户的皮肤区域进行分割和肤色检测,区分出皮肤区域和其他区域并将皮肤区域划分为若干个皮肤子区域进行RGB颜色检测,将各皮肤子区域中皮肤的红、绿、蓝分量值分别记为Ri、Gi、Bi,i表示划分的第i个皮肤子区域的编号,i=1,2,...,k。
第二步,将各皮肤子区域中皮肤的红、绿、蓝分量值代入公式分析获取用户的皮肤亮度Y,k表示皮肤子区域的数量。
第三步,将用户的皮肤亮度与管理数据库中预设的各光泽度对应皮肤亮度范围进行对比,从中筛选用户的皮肤亮度对应的光泽度,记为皮肤光泽度参考值ψ。
优选的,所述皱纹级别参考值的具体分析方法为:通过将用户静态图像中用户的皮肤区域进行去噪、灰度化、边缘增强处理,并从用户静态图像的人脸部分提取相应的皱纹特征数据;皱纹特征数据包括皱纹条数、各条皱纹的皱纹深度、各条皱纹的皱纹长度,将皱纹条数记为a,各条皱纹对应的皱纹深度记为bj,j表示各条皱纹的编号,j=1,2,...a,各条皱纹对应的皱纹长度记为cj,并将其代入公式得到用户皮肤区域与各级别皱纹的特征数据匹配系数εq,aq参考表示第q级别皱纹的参考皱纹条数,q表示各级别皱纹的编号,q=1,2,...,p,bq参考表示第q级别皱纹的参照皱纹深度,cq参考表示第q级别皱纹的参考皱纹长度,η1、η2、η3分别表示设定的皱纹条数修正系数、皱纹深度修正系数、皱纹长度修正系数,e表示为自然常数;从用户皮肤区域与各级别皱纹的特征数据匹配系数中筛选出最大特征数据匹配系数对应级别皱纹作为皱纹级别参考值,记为ξ。
优选的,所述头发覆盖率的具体方法包括以下步骤:第一步,将用户静态图像中人物的头发区域单独划分出来记为人物头发区域图像,读取人物头发区域图像的宽度w头发、高度h头发,并将人物头发区域图像转换为灰度图像,检测转换后的灰度图像中每一个像素点的灰度值,将其与设定的用户头发标准密集度阈值对应的灰度值范围进行对比,得到符合范围的像素点数量,记为σ。
第二步,将符合范围的像素点数量与人物头发区域图像的总像素数量进行比较,代入公式dpi表示管理数据库中存储的图像的像素密度,进而分析获得头发的覆盖率λ。
优选的,所述用户年龄评估关联系数的具体分析方式为:通过对皮肤光泽度参考值、皱纹级别参考值和头发覆盖率进行权值分配来综合分析用户年龄评估关联系数用户年龄评估关联系数的计算公式为/>θ1表示皮肤光泽度参考值的权值因子,θ2表示皱纹级别参考值的权值因子,θ3表示头发覆盖率的权值因子,且θ2>θ13,θ1>θ3,根据用户年龄评估关联系数与各年龄区间对应的年龄评价指数范围进行对比,进而得到用户的评估年龄区间。
优选的,所述人物图像处理模块中用户的图像发型和图像服装的获取方法包括以下步骤:第一步,根据获取用户的评估年龄区间从管理数据库中筛选出对应年龄区间对应的发型图像集合、服装图像集合,构成用户预选发型集合和用户预选服装集合,分别记为表示用户预选发型的第c个发型,/>表示用户预选服装的第f套服装。
第二步,根据获取的用户交互场景,同管理数据库中的各场景主题词进行匹配,选取场景主题词对应的场景,并以此为基础进一步筛选出场景对应的各服装、场景对应的各发型,和用户预选发型集合、用户预选服装的集合进行比较,筛选出交集部分进一步构成用户待确定发型集合和用户待确定服装集合,分别记为表示用户待确定发型的第s个发型,/>表示用户待确定服装的第y套服装。
第三步,根据用户静态图像分割得到人物发型区域图像,并提取用户待确定发型集合中各发型图像,将其与人物发型区域图像进行图像重叠,并对重叠后的图像进行二值化处理,重叠区域设置为白色,非重叠区域设置为黑色,遍历重叠区域的每个像素,统计用户待确定发型集合中各发型图像中白色像素的数量。
第四步,将获取的各发型图像中白色像素的数量代入公式 表示待确定发型集合中第s个发型图像中白色像素的数量,P表示用户静态图像中人物发型区域图像的像素数量,分析得到人物发型区域图像与用户待确定发型集合中各发型图像的相似度Fs,筛选出图像相似度最高的用户待确定发型集合中对应发型图像,将其记为用户的图像发型。
第五步,将用户静态图像中人物的服装部分单独划分出来记为人物服装区域图像,对人物服装区域图像中每个像素以及用户待确定服装集合中各服装的每个像素进行RGB颜色检测,将人物服装区域图像中各像素的RGB分量值与用户待确定服装集合中各服装图像中各像素的RGB分量值,同设定的各颜色分组对应的RGB分量值范围进行匹配,得到人物服装区域图像中各颜色分组的像素数量和用户待确定服装集合中各服装图像中各颜色分组的像素数量,进而绘制以颜色分组为横轴、像素数量为纵轴的颜色直方图。
第六步,将人物服装区域图像的颜色直方图与用户待确定服装集合中各场景服装图像的颜色直方图进行对比,得到人物服装区域图像的颜色直方图与用户待确定服装集合中各服装图像的颜色直方图的重叠面积,为图像匹配重叠面积最高的服装,并将其记为用户的图像服装。
优选的,所述图像整合修正模块的具体方法为:将用户场景装饰图像转换为灰度图像,检测转换后的灰度图像中每一个像素的亮度值,通过平均值计算获得灰度图像的亮度平均值,将每个像素的亮度值与亮度平均值进行比较,得到每个像素对应的亮度差异值,并根据亮度差异值对对应像素进行亮度修正。
相对于现有技术,本发明的实施例至少具有如下优点或有益效果:(1)本发明在用户交互设计模块通过语音识别接口,让用户对图像的场景主题词进行选择,达到了用户需求和喜好进行个性化定制的标准,使生成图像更符合用户的期望。
(2)本发明在人物图像分析处理模块中通过皮肤光泽度参考值、皱纹级别参考值、头发覆盖率综合分析用户年龄评估关联数据,弥补了现有技术中对年龄评估关注度不高的缺陷,进而为后续系统的发型、服装筛选奠定了基础,提供了更符合年龄特征和审美偏好的选择,增强了图像的真实感和逼真度。
(3)本发明在人物图像处理模块中基于场景主题词、用户年龄评估关联数据、发型图像重叠像素的数量、服装颜色直方图的重叠面积进行层层筛选,为人物图像匹配了最合适的发型、服装,提升了视觉效果和真实感,增强了生成图像的逼真度和质量,使其更符合用户的期望。
(4)本发明在图像整合修正模块中将用户交互场景、用户装饰图像进行整合,并将得到的用户场景装饰图像通过将生成的图像转换为灰度图像,根据亮度值分析获得图像平均亮度的方法,对所有像素进行了亮度修正,改善了照片的质量和观赏性,避免了图像在整体感和真实度方面出现不协调的情况,使其更加平衡、舒适和具有吸引力。
附图说明
利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1是一种基于AI交互的人物图像场景生成系统的各模块之间的连接示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1所示,本发明提供一种基于AI交互的人物图像场景生成系统,包括:用户交互设计模块、人物图像拍摄模块、人物图像分析处理模块、人物图像处理模块、图像整合修正模块、图像生成模块、管理数据库。
上述模块中管理数据库与用户交互设计模块、人物图像分析处理模块、人物图像处理模块、图像生成模块、图像整合修正模块连接,用户交互设计模块与人物图像拍摄模块连接,人物图像分析处理模块与人物图像拍摄模块、人物图像处理模块连接,人物图像处理模块与图像生成模块连接,图像生成模块与图像整合修正模块连接。
所述用户交互设计模块,包括语音识别单元和场景匹配单元,语音识别单元用于采集用户的语音信息,将用户的语音信息转换成文字,并提取相应的关键字,场景匹配单元用于将提取的关键字与数据库中的场景关键词进行匹配,进行筛选得到用户交互场景;通过语音识别单元,使得用户可以通过自然语言的方式与系统进行交互,提供了更直接、方便的用户体验,而场景匹配单元能够准确判断用户所需的交互场景,使得系统能够针对不同场景提供个性化的图像生成,并满足用户的特定需求。
所述人物图像拍摄模块,用于通过使用高清相机获取用户的图像,将其记为用户静态图像;将用户图像保存为用户静态图像,能够方便后续的数据处理和应用,确保了用户的图像和数据可用于进一步的分析、生成。
所述人物图像分析处理模块,用于根据用户静态图像获取用户年龄评估关联数据,对用户的年龄进行分析评估,进而获得用户的用户年龄评估关联系数。
优选的,所述人物图像分析处理模块中用户的用户年龄评估关联数据包括包含皮肤光泽度参考值、皱纹级别参考值、头发覆盖率。
所述皮肤光泽度参考值的具体分析方法包括以下步骤:第一步,通过对用户静态图像中用户的皮肤区域进行分割和肤色检测,区分出皮肤区域和其他区域并将皮肤区域划分为若干个皮肤子区域进行RGB颜色检测,将各皮肤子区域中皮肤的红、绿、蓝分量值分别记为Ri、Gi、Bi,i表示划分的第i个皮肤子区域的编号,i=1,2,...,k;通过将皮肤区域划分为多个子区域,并对每个子区域进行RGB颜色检测,提高了皮肤检测的准确性,不同部位的皮肤颜色可能存在微小差异,进行子区域划分可以更精确地检测皮肤,同时相比于对整个皮肤区域进行检测,对每个子区域进行检测,可以减少计算量、加快检测速度,更适合实时应用场景。
第二步,将各皮肤子区域中皮肤的红、绿、蓝分量值代入公式分析获取用户的皮肤亮度Y,k表示皮肤子区域的数量;通过测量皮肤亮度辅助推测用户的年龄范围,可实现无需个人信息的年龄预测,这有助于保护用户隐私,并降低使用门槛,使年龄检测更加便捷和广泛应用。
第三步,将用户的皮肤亮度与管理数据库中预设的各光泽度对应皮肤亮度范围进行对比,从中筛选用户的皮肤亮度对应的光泽度,记为皮肤光泽度参考值ψ;采用预设的皮肤亮度阈值,可以得到相对客观的皮肤光泽度数据,减少了人为偏差的可能性,同时这种标准化的数据可用于后续分析和比较,提供了一种统一的指标来评估皮肤的光泽度水平。
优选的,所述皱纹级别参考值的具体分析方法为:
通过将用户静态图像中用户的皮肤区域进行去噪、灰度化、边缘增强处理,并从用户静态图像的人脸部分提取相应的皱纹特征数据;皱纹特征数据包括皱纹条数、各条皱纹的皱纹深度、各条皱纹的皱纹长度,将皱纹条数记为a,各条皱纹对应的皱纹深度记为bj,j表示各条皱纹的编号,j=1,2,...a,各条皱纹对应的皱纹长度记为cj,并将其代入公式
得到用户皮肤区域与各级别皱纹的特征数据匹配系数εq,aq参考表示第q级别皱纹的参考皱纹条数,q表示各级别皱纹的编号,q=1,2,...,p,bq参考表示第q级别皱纹的参照皱纹深度,cq参考表示第q级别皱纹的参考皱纹长度,η1、η2、η3分别表示设定的皱纹条数修正系数、皱纹深度修正系数、皱纹长度修正系数,e表示为自然常数;从用户皮肤区域与各级别皱纹的特征数据匹配系数中筛选出最大特征数据匹配系数对应级别皱纹作为皱纹级别参考值,记为ξ;皱纹条数、深度和长度可以用数字来表示,因此可以被量化和比较,使得不同个体的年龄分析更客观,同时观察皱纹条数、深度和长度来估算年龄是一种相对简便和经济的方法,更容易实施,降低了成本。
优选的,所述头发覆盖率的具体方法包括以下步骤:
第一步,将用户静态图像中人物的头发区域单独划分出来记为人物头发区域图像,读取人物头发区域图像的宽度w头发、高度h头发,并将人物头发区域图像转换为灰度图像,检测转换后的灰度图像中每一个像素点的灰度值,将其与设定的用户头发标准密集度阈值对应的灰度值范围进行对比,得到符合范围的像素点数量,记为σ;灰度值可以了解到头发的密度,通过不同灰度值的分析,可以识别头发稠密区域和稀疏区域,从而对头发覆盖率有更为准确的评估。
第二步,将符合范围的像素点数量与人物头发区域图像的总像素数量进行比较,代入公式dpi表示管理数据库中存储的图像的像素密度,进而分析获得头发的覆盖率λ;通过比较符合范围的像素点数量与总像素数量的比例,可以提供一个精确的头发覆盖率,不同头发区域图像的大小可能会有所差异,而将符合范围的像素点数量与头发区域的总像素数量进行比较可以消除这种差异,使得评估结果更具准确性、可比性。
优选的,所述用户年龄评估关联系数的具体分析方式为:通过对皮肤光泽度参考值、皱纹级别参考值和头发覆盖率进行权值分配来综合分析用户年龄评估关联系数用户年龄评估关联系数的计算公式为/>θ1表示皮肤光泽度参考值的权值因子,θ2表示皱纹级别参考值的权值因子,θ3表示头发覆盖率的权值因子,且θ2>θ13,θ1>θ3,根据用户年龄评估关联系数与各年龄区间对应的年龄评价指数范围进行对比,进而得到用户的评估年龄区间;通过分配权值因子,可以同时考虑多个指标,而不仅仅局限于其中一个指标,对于评估用户的年龄情况更具有全面性,避免了单一指标带来的不准确性和主观性,同时根据具体情况和数据的重要性,可以给予不同指标不同的权重,使得评估更加灵活和可定制,更好地满足特定的评估需求。
所述人物图像处理模块用于根据用户的用户年龄评估关联系数进行相应的服装、发型匹配,得到预选服装和预选发型,将用户静态图像中用户的原始发型和原始服装与预选发型和预选服装分别进行比较处理,筛选出用户待确定发型集合和用户待确定服装集合,从而进一步筛选得到用户的图像发型和图像服装,并将用户的图像发型和图像服装导入用户的图像中,进而得到用户装饰图像;通过比较分析用户原始服装和发型与预选项,可以根据用户的特点和个人喜好筛选出适合的图像发型和图像服饰,这样可以为用户提供个性化的装饰方案,使其外观更符合其风格和偏好。
优选的,所述人物图像处理模块中用户的图像发型和图像服装的获取方法包括以下步骤:第一步,根据获取用户的评估年龄区间从管理数据库中筛选出对应年龄区间对应的发型图像集合、服装图像集合,构成用户预选发型集合和用户预选服装集合,分别记为表示用户预选发型的第c个发型,/>表示用户预选服装的第f套服装。
第二步,根据获取的用户交互场景,同管理数据库中的各场景主题词进行匹配,选取场景主题词对应的场景,并以此为基础进一步筛选出场景对应的各服装、场景对应的各发型,和用户预选发型集合、用户预选服装的集合进行比较,筛选出交集部分进一步构成用户待确定发型集合和用户待确定服装集合,分别记为表示用户待确定发型的第s个发型,表示用户待确定服装的第y套服装;通过从用户获取关键字并与场景主题词匹配,可以根据用户提供的信息为其提供定制化的场景体验,这样用户可以更好地感受到与其所描述场景相匹配的服装和装饰,增强整体的沉浸感和参与度。
第三步,根据用户静态图像分割得到人物发型区域图像,并提取用户待确定发型集合中各发型图像,将其与人物发型区域图像进行图像重叠,并对重叠后的图像进行二值化处理,重叠区域设置为白色,非重叠区域设置为黑色,遍历重叠区域的每个像素,统计用户待确定发型集合中各发型图像中白色像素的数量;通过计算重叠区域中白色像素的数量来量化各个发型与用户实际发型的匹配程度,提高了发型匹配的精确性。
第四步 将获取的各发型图像中白色像素的数量代入公式 表示待确定发型集合中第s个发型图像中白色像素的数量,P表示用户静态图像中人物发型区域图像的像素数量,分析得到人物发型区域图像与用户待确定发型集合中各发型图像的相似度Fs,筛选出图像相似度最高的用户待确定发型集合中对应发型图像,将其记为用户的图像发型。
第五步,将用户静态图像中人物的服装部分单独划分出来记为人物服装区域图像,对人物服装区域图像中每个像素以及用户待确定服装集合中各服装的每个像素进行RGB颜色检测,将人物服装区域图像中各像素的RGB分量值与用户待确定服装集合中各服装图像中各像素的RGB分量值,同设定的各颜色分组对应的RGB分量值范围进行匹配,得到人物服装区域图像中各颜色分组的像素数量和用户待确定服装集合中各服装图像中各颜色分组的像素数量,进而绘制以颜色分组为横轴、像素数量为纵轴的颜色直方图;通过颜色直方图,可以了解不同颜色分组中像素的数量,从而确定每个颜色分组的对比度和饱和度,有助于评估人物服装区域和场景服装在色彩上的相似性或差异性,从而进行更准确的服装匹配。
第六步,将人物服装区域图像的颜色直方图与用户待确定服装集合中各场景服装图像的颜色直方图进行对比,得到人物服装区域图像的颜色直方图与用户待确定服装集合中各服装图像的颜色直方图的重叠面积,为图像匹配重叠面积最高的服装,并将其记为用户的图像服装;采用颜色直方图进行对比,可以快速筛选与人物服装相似的服装,避免了逐一比对每个像素的复杂计算。这样可以大大提高匹配的效率和准确性,为用户提供更好的服装选择体验。
所述图像整合修正模块,用于将用户交互场景、用户装饰图像进行整合,得到用户场景装饰图像,并将用户场景装饰图像进行亮度修正。
所述图像整合修正模块的具体方法为:将用户场景装饰图像转换为灰度图像,检测转换后的灰度图像中每一个像素的亮度值,通过平均值计算获得灰度图像的亮度平均值,将每个像素的亮度值与亮度平均值进行比较,得到每个像素对应的亮度差异值,并根据亮度差异值对对应像素进行亮度修正;在用户场景装饰图像中,由于光照条件或拍摄角度等因素,图像中可能存在亮度不均匀的问题,通过将每个像素的亮度与平均亮度进行比较,并进行相应的亮度修正,可以减少图像中亮度不均匀的程度,改善图像的质量和观感。
所述图像生成模块用于读取亮度修正后的用户场景装饰图像,将其记为最终用户图像,并将其进行生成展示。
管理数据库,用于存储图像的像素密度、各场景主题词、各场景主题词对应的场景、场景对应的各服装、场景对应的各发型、年龄评价指数阈值、各年龄段对应的服装、各年龄段对应的发型、各年龄区间对应的年龄评价指数范围进行对比、皮肤亮度阈值、色度分量修正系数、用户头发标准密集度阈值、皱纹特征数据修正系数。
本系统根据用户通过语音识别接口选择的关键词为用户匹配相应的场景主题,同时对拍摄的用户静态图像进行年龄评估并以此为基础,层层筛选,为用户人物图像匹配最合适的发型、服装,弥补了现有技术中对年龄关注度不高的缺陷,提供了更符合年龄特征和审美偏好的选择,达到了用户需求和喜好进行个性化定制的标准,提升了视觉效果和真实感,增强了生成图像的逼真度和质量,使其更符合用户的期望。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型,仍涵盖在本发明的保护范围。

Claims (8)

1.一种基于AI交互的人物图像场景生成系统,其特征在于,该人物图像场景生成系统具体包括以下模块:
用户交互设计模块,包括语音识别单元和场景匹配单元,语音识别单元用于采集用户的语音信息,将用户的语音信息转换成文字,并提取相应的关键字,场景匹配单元用于将提取的关键字与数据库中的场景关键词进行匹配,进行筛选得到用户交互场景;
人物图像拍摄模块,用于通过使用高清相机获取用户的图像,将其记为用户静态图像;
人物图像分析处理模块,用于根据用户静态图像获取用户年龄评估关联数据,对用户的年龄进行分析评估,进而获得用户的用户年龄评估关联系数;
人物图像处理模块,用于根据用户的用户年龄评估关联系数进行相应的服装、发型匹配,得到预选服装和预选发型,将用户静态图像中用户的原始发型和原始服装与预选发型和预选服装分别进行比较处理,筛选出用户待确定发型集合和用户待确定服装集合,从而进一步筛选得到用户的图像发型和图像服装,并将用户的图像发型和图像服装导入用户的图像中,进而得到用户装饰图像;
图像整合修正模块,用于将用户交互场景、用户装饰图像进行整合,得到用户场景装饰图像,并将用户场景装饰图像进行亮度修正;
图像生成模块,用于读取亮度修正后的用户场景装饰图像,将其记为最终用户图像,并将其进行生成展示;
管理数据库,用于存储图像的像素密度、各场景主题词、各场景主题词对应的场景、场景对应的各服装、场景对应的各发型、年龄评价指数阈值、各年龄段对应的服装、各年龄段对应的发型、各年龄区间对应的年龄评价指数范围、各光泽度对应皮肤亮度、色度分量修正系数、用户头发标准密集度阈值、皱纹特征数据匹配系数对应的皱纹级别数据、皱纹特征数据修正系数。
2.根据权利要求1所述一种基于AI交互的人物图像场景生成系统,其特征在于,所述人物图像分析处理模块中用户的用户年龄评估关联数据包括皮肤光泽度参考值、皱纹级别参考值、头发覆盖率。
3.根据权利要求2所述一种基于AI交互的人物图像场景生成系统,其特征在于,所述皮肤光泽度参考值的具体分析方法包括以下步骤:
第一步,通过对用户静态图像中用户的皮肤区域进行分割和肤色检测,区分出皮肤区域和其他区域并将皮肤区域划分为若干个皮肤子区域进行RGB颜色检测,将各皮肤子区域中皮肤的红、绿、蓝分量值分别记为Ri、Gi、Bi,i表示划分的第i个皮肤子区域的编号,i=1,2,...,k;
第二步,将各皮肤子区域中皮肤的红、绿、蓝分量值代入公式分析获取用户的皮肤亮度Y,k表示皮肤子区域的数量;
第三步,将用户的皮肤亮度与管理数据库中预设的各光泽度对应皮肤亮度范围进行对比,从中筛选用户的皮肤亮度对应的光泽度,记为皮肤光泽度参考值ψ。
4.根据权利要求3所述一种基于AI交互的人物图像场景生成系统,其特征在于,所述皱纹级别参考值的具体分析方法为:
通过将用户静态图像中用户的皮肤区域进行去噪、灰度化、边缘增强处理,并从用户静态图像的人脸部分提取相应的皱纹特征数据;皱纹特征数据包括皱纹条数、各条皱纹的皱纹深度、各条皱纹的皱纹长度,将皱纹条数记为a,各条皱纹对应的皱纹深度记为bj,j表示各条皱纹的编号,j=1,2,...a,各条皱纹对应的皱纹长度记为cj,并将其代入公式得到用户皮肤区域与各级别皱纹的特征数据匹配系数εq,aq参考表示第q级别皱纹的参考皱纹条数,q表示各级别皱纹的编号,q=1,2,...,p,bq参考表示第q级别皱纹的参照皱纹深度,cq参考表示第q级别皱纹的参考皱纹长度,η1、η2、η3分别表示设定的皱纹条数修正系数、皱纹深度修正系数、皱纹长度修正系数,e表示为自然常数;从用户皮肤区域与各级别皱纹的特征数据匹配系数中筛选出最大特征数据匹配系数对应级别皱纹作为皱纹级别参考值,记为ξ。
5.根据权利要求4所述一种基于AI交互的人物图像场景生成系统,其特征在于,所述头发覆盖率的具体方法包括以下步骤:
第一步,将用户静态图像中人物的头发区域单独划分出来记为人物头发区域图像,读取人物头发区域图像的宽度w头发、高度h头发,并将人物头发区域图像转换为灰度图像,检测转换后的灰度图像中每一个像素点的灰度值,将其与设定的用户头发标准密集度阈值对应的灰度值范围进行对比,得到符合范围的像素点数量,记为σ;
第二步,将符合范围的像素点数量与人物头发区域图像的总像素数量进行比较,代入公式dpi表示管理数据库中存储的图像的像素密度,进而分析获得头发的覆盖率λ。
6.根据权利要求5所述一种基于AI交互的人物图像场景生成系统,其特征在于,所述用户年龄评估关联系数的具体分析方式为:通过对皮肤光泽度参考值、皱纹级别参考值和头发覆盖率进行权值分配来综合分析用户年龄评估关联系数θ,用户年龄评估关联系数的计算公式为θ1表示皮肤光泽度参考值的权值因子,θ2表示皱纹级别参考值的权值因子,θ3表示头发覆盖率的权值因子,且θ2>θ13,θ1>θ3,根据用户年龄评估关联系数与各年龄区间对应的年龄评价指数范围进行对比,进而得到用户的评估年龄区间。
7.根据权利要求1所述一种基于AI交互的人物图像场景生成系统,其特征在于,所述人物图像处理模块中用户的图像发型和图像服装的获取方法包括以下步骤:
第一步,根据获取用户的评估年龄区间从管理数据库中筛选出对应年龄区间对应的发型图像集合、服装图像集合,构成用户预选发型集合和用户预选服装集合,分别记为 表示用户预选发型的第c个发型,/>表示用户预选服装的第f套服装;
第二步,根据获取的用户交互场景,同管理数据库中的各场景主题词进行匹配,选取场景主题词对应的场景,并以此为基础进一步筛选出场景对应的各服装、场景对应的各发型,和用户预选发型集合、用户预选服装的集合进行比较,筛选出交集部分进一步构成用户待确定发型集合和用户待确定服装集合,分别记为 表示用户待确定发型的第s个发型,/>表示用户待确定服装的第y套服装;
第三步,根据用户静态图像分割得到人物发型区域图像,并提取用户待确定发型集合中各发型图像,将其与人物发型区域图像进行图像重叠,并对重叠后的图像进行二值化处理,重叠区域设置为白色,非重叠区域设置为黑色,遍历重叠区域的每个像素,统计用户待确定发型集合中各发型图像中白色像素的数量;
第四步,将获取的各发型图像中白色像素的数量代入公式 表示待确定发型集合中第s个发型图像中白色像素的数量,P表示用户静态图像中人物发型区域图像的像素数量,分析得到人物发型区域图像与用户待确定发型集合中各发型图像的相似度Fs,筛选出图像相似度最高的用户待确定发型集合中对应发型图像,将其记为用户的图像发型;
第五步,将用户静态图像中人物的服装部分单独划分出来记为人物服装区域图像,对人物服装区域图像中每个像素以及用户待确定服装集合中各服装的每个像素进行RGB颜色检测,将人物服装区域图像中各像素的RGB分量值与用户待确定服装集合中各服装图像中各像素的RGB分量值,同设定的各颜色分组对应的RGB分量值范围进行匹配,得到人物服装区域图像中各颜色分组的像素数量和用户待确定服装集合中各服装图像中各颜色分组的像素数量,进而绘制以颜色分组为横轴、像素数量为纵轴的颜色直方图;
第六步,将人物服装区域图像的颜色直方图与用户待确定服装集合中各场景服装图像的颜色直方图进行对比,得到人物服装区域图像的颜色直方图与用户待确定服装集合中各服装图像的颜色直方图的重叠面积,为图像匹配重叠面积最高的服装,并将其记为用户的图像服装。
8.根据权利要求1所述一种基于AI交互的人物图像场景生成系统,其特征在于,所述图像整合修正模块的具体方法为:将用户场景装饰图像转换为灰度图像,检测转换后的灰度图像中每一个像素的亮度值,通过平均值计算获得灰度图像的亮度平均值,将每个像素的亮度值与亮度平均值进行比较,得到每个像素对应的亮度差异值,并根据亮度差异值对对应像素进行亮度修正。
CN202311011914.3A 2023-08-11 2023-08-11 一种基于ai交互的人物图像场景生成系统 Active CN117033688B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311011914.3A CN117033688B (zh) 2023-08-11 2023-08-11 一种基于ai交互的人物图像场景生成系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311011914.3A CN117033688B (zh) 2023-08-11 2023-08-11 一种基于ai交互的人物图像场景生成系统

Publications (2)

Publication Number Publication Date
CN117033688A true CN117033688A (zh) 2023-11-10
CN117033688B CN117033688B (zh) 2024-03-12

Family

ID=88627617

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311011914.3A Active CN117033688B (zh) 2023-08-11 2023-08-11 一种基于ai交互的人物图像场景生成系统

Country Status (1)

Country Link
CN (1) CN117033688B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118445438A (zh) * 2024-05-17 2024-08-06 洛可银洲(深圳)科技有限公司 一种基于图像处理的人机交互优化系统及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011067162A1 (en) * 2009-12-02 2011-06-09 Unilever Plc Apparatus for and method of measuring skin age
CN107924532A (zh) * 2015-08-10 2018-04-17 立体丈量公司 用于提供服装模型的描绘的方法及设备
CN108154142A (zh) * 2018-01-29 2018-06-12 杭州美界科技有限公司 一种基于语音识别的皮肤皱纹评估方法及系统
CN110264299A (zh) * 2019-05-07 2019-09-20 平安科技(深圳)有限公司 基于人脸识别的服装推荐方法、装置及计算机设备
CN116091487A (zh) * 2023-03-07 2023-05-09 深圳市宝安区石岩人民医院 一种基于图像识别的皮肤皱纹分析比对方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011067162A1 (en) * 2009-12-02 2011-06-09 Unilever Plc Apparatus for and method of measuring skin age
CN107924532A (zh) * 2015-08-10 2018-04-17 立体丈量公司 用于提供服装模型的描绘的方法及设备
CN108154142A (zh) * 2018-01-29 2018-06-12 杭州美界科技有限公司 一种基于语音识别的皮肤皱纹评估方法及系统
CN110264299A (zh) * 2019-05-07 2019-09-20 平安科技(深圳)有限公司 基于人脸识别的服装推荐方法、装置及计算机设备
CN116091487A (zh) * 2023-03-07 2023-05-09 深圳市宝安区石岩人民医院 一种基于图像识别的皮肤皱纹分析比对方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118445438A (zh) * 2024-05-17 2024-08-06 洛可银洲(深圳)科技有限公司 一种基于图像处理的人机交互优化系统及方法

Also Published As

Publication number Publication date
CN117033688B (zh) 2024-03-12

Similar Documents

Publication Publication Date Title
JP7200139B2 (ja) 仮想顔化粧の除去、高速顔検出およびランドマーク追跡
CN105118082B (zh) 个性化视频生成方法及系统
Žeger et al. Grayscale image colorization methods: Overview and evaluation
JP2020526809A5 (zh)
US20200401842A1 (en) Human Hairstyle Generation Method Based on Multi-Feature Retrieval and Deformation
CN111242841B (zh) 一种基于语义分割和深度学习的图片背景风格迁移方法
CN106462771A (zh) 一种3d图像的显著性检测方法
CN111161137B (zh) 一种基于神经网络的多风格国画花生成方法
CN117033688B (zh) 一种基于ai交互的人物图像场景生成系统
CN107085654B (zh) 基于人脸图像的健康分析方法及装置
CN106507199A (zh) 电视节目推荐方法及装置
CN108460398A (zh) 图像处理方法、装置、云处理设备和计算机程序产品
KR20180130778A (ko) 화장품 추천 방법, 이를 구현하기 위한 프로그램이 저장된 기록매체, 이를 구현하기 위해 매체에 저장된 컴퓨터프로그램 및 화장품 추천 시스템
US11682143B2 (en) System and method for hair analysis of user
CN110263768A (zh) 一种基于深度残差网络的人脸识别方法
Obrador et al. Towards category-based aesthetic models of photographs
CN113362422A (zh) 一种阴影鲁棒的基于解耦表示的妆容迁移系统及方法
CN106485266A (zh) 一种基于提取颜色特征的古代壁画分类识别方法
Wu et al. Automatic colorization of Chinese ink painting combining multi-level features and generative adversarial networks
EP4040348A1 (en) Data augmentation-based style analysis model training device and method
Guo Digital anti-aging in face images
CN116777738A (zh) 基于服装区域对齐和风格保持调制的真实性虚拟试穿方法
Liu et al. A3GAN: An attribute-aware attentive generative adversarial network for face aging
CN115994994A (zh) 虚拟试衣及试衣模型训练的方法、装置和设备
CN115018729A (zh) 一种面向内容的白盒图像增强方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant