CN116541911A - 一种基于人工智能的包装设计系统 - Google Patents

一种基于人工智能的包装设计系统 Download PDF

Info

Publication number
CN116541911A
CN116541911A CN202310817196.2A CN202310817196A CN116541911A CN 116541911 A CN116541911 A CN 116541911A CN 202310817196 A CN202310817196 A CN 202310817196A CN 116541911 A CN116541911 A CN 116541911A
Authority
CN
China
Prior art keywords
design
packaging
model
module
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310817196.2A
Other languages
English (en)
Other versions
CN116541911B (zh
Inventor
陈彦
郝晓伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dajia Zhihe Beijing Network Technology Co ltd
Original Assignee
Dajia Zhihe Beijing Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dajia Zhihe Beijing Network Technology Co ltd filed Critical Dajia Zhihe Beijing Network Technology Co ltd
Priority to CN202310817196.2A priority Critical patent/CN116541911B/zh
Publication of CN116541911A publication Critical patent/CN116541911A/zh
Application granted granted Critical
Publication of CN116541911B publication Critical patent/CN116541911B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/10Geometric CAD
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Geometry (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Computational Mathematics (AREA)
  • Computer Graphics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Pure & Applied Mathematics (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及一种基于人工智能的包装设计系统,属于包装设计技术领域。本发明技术方案主要包括:需求分析模块,基于包装语言模型与用户进行多轮问询交互,根据用户输入分析获得设计需求;方案生成模块,包括包装模型获取单元、设计图像生成单元和设计模板获取单元;所述包装模型获取单元根据所述包装类型从盒型库中调用相应的包装模型;所述设计图像生成单元基于图像生成模型,根据所述被包装产品类型和所述设计风格生成包装设计图案;所述设计模板获取单元根据所述设计风格从模板库中调用相应的设计模板;所述方案生成模块根据所述包装模型、所述包装设计图案和所述设计模板生成设计方案;编辑模块,用于对所述设计方案中的设计元素进行编辑。

Description

一种基于人工智能的包装设计系统
技术领域
本发明属于包装设计技术领域,具体而言涉及一种基于人工智能的包装设计系统。
背景技术
随着市场竞争的加剧,各种产品的包装设计越来越受到企业和消费者的重视。
传统的包装设计方法耗时、耗费人力物力,且设计师与客户沟通存在误解,导致设计效果与客户需求存在一定的差距。因此,能够提高设计效率并满足客户需求,具有重要的现实意义。
本发明的目的在于降低现有的包装设计作业中由于需要设计师与客户沟通带来的一系列设计成本。
发明内容
鉴于上述的分析,本发明实施例旨在提供一种基于人工智能的包装设计系统,包括:
需求分析模块,基于包装语言模型与用户进行多轮问询交互,根据用户输入分析获得设计需求,所述设计需求包括包装类型、被包装产品类型或者设计风格;
方案生成模块,与所述需求分析模块通讯连接,包括包装模型获取单元、设计图像生成单元和设计模板获取单元;
所述包装模型获取单元根据所述包装类型从盒型库中调用相应的包装模型;
所述设计图像生成单元基于图像生成模型,根据所述被包装产品类型和所述设计风格生成包装设计图案;
所述设计模板获取单元根据所述设计风格从模板库中调用相应的设计模板;
所述方案生成模块根据所述包装模型、所述包装设计图案和所述设计模板生成设计方案;
编辑模块,与所述方案生成模块通讯连接,用于对所述设计方案中的设计元素进行编辑。
在一些实施例中,所述包装语言模型的训练方法包括:
获取包装设计用语数据和预训练语言模型;
对所述包装设计用语数据进行第一预处理,所述第一预处理包括去除HTML标签和特殊字符、进行数据清洗以及去除停用词;
对预处理后的所述包装设计用语数据进行分词处理,以提取所述包装设计用语数据中的关键词、短语或者行业术语;
将所述关键词、短语和行业术语进行去重之后加入所述预训练语言模型的词汇表中;
获取自定义包装设计数据集,包括对包装设计行业数据进行第二预处理以使得所述包装设计行业数据满足所述预训练语言模型的输入格式,进而形成所述自定义包装设计数据集;
根据选定损失函数和优化器,基于所述自定义包装设计数据集对所述预训练语言模型进行微调,以更新所述预训练语言模型的网络权重和所述词汇表中词汇对应的词向量,获得所述包装语言模型。
在一些实施例中,所述分词处理包括采用文本处理工具对所述包装设计用语数据进行分词处理以获得分词结果,所述文本处理工具包括jieba分词或者THULAC;
所述关键词的提取方法包括基于BERT的TextRank或者BERT关键词抽取库从所述分词结果中提取所述关键词,所述BERT关键词抽取库包括Bert-extractive-keywords;
所述短语和所述行业术语的提取包括,通过词性标注工具对所述分词结果进行词性分析,通过组合不同词性的词汇提取包含实际意义的短语和行业术语,所述词性标注工具包括jieba词性标注或者LTP。
在一些实施例中,还包括注册模块,与所述需求分析模块和所述方案生成模块通讯连接,用于获取用户的注册信息并为用户分配账户。
在一些实施例中,所述需求分析模块,基于包装语言模型与用户进行多轮问询交互,根据用户输入分析获得设计需求,包括:
根据所述用户输入分析获得第一设计需求;
通过所述方案生成模块根据所述第一设计需求生成若干备选方案;
根据被选择的所述备选方案和对所述备选方案的修改获取第二设计需求;
所述用户输入包括所述注册信息、用户对于问询引导标签的选择、用户对于所述备选方案的选择或者用户需求描述。
在一些实施例中,所述盒型库包括多种包装类型的包装模型,所述包装模型包括标准刀模和标签,所述标签包括尺寸、材料、适用范围描述或者制作工艺,所述包装类型包括盒、袋、瓶、箱或者罐;
所述盒型库还包括对所述包装模型的三维建模和对所述标准刀模的二维平面图。
在一些实施例中,所述模板库包括预先收集的若干设计模板,所述设计模板包括文字排版、整体布局、颜色或者字体中的一种或多种的组合;
还包括通过图像聚类和样式迁移算法对所述若干设计模板进行风格类别的归类。
在一些实施例中,还包括三维渲染模块,与所述方案生成模块、所述需求分析模块和所述编辑模块均通讯连接,所述三维渲染模块依据所述包装模型和所述设计方案生成对应的三维渲染图,以使得用户能够通过所述需求分析模块和所述编辑模块查看所述三维渲染图。
在一些实施例中,所述图像生成模型的训练方法包括:
获取包装设计图像数据并且通过数据增强方法进行数据扩充以获得图像数据集;
对所述图像数据集中的图像数据进行第三预处理以使得所述图像数据满足神经网络的输入要求;
对第三预处理之后的所述图像数据进行分类,并通过卷积神经网络提取各类别的特征;
根据分类后的所述图像数据训练若干嵌入式模型,以使得各所述嵌入式模型分别学习不同设计风格的特点,所述嵌入式模型包括StyleGAN;
根据所述图像数据训练生成式模型,以使得所述生成式模型生成图像时可以进行优化调整,所述生成式模型包括Hypernetwork、Lora或者VAE;
融合将分别具有不同风格的所述若干嵌入式模型和所述生成式模型,以训练生成所述图像生成模型,所述图像生成模型用于根据用户描述生成设计元素图像。
在一些实施例中,所述编辑模块包括设计方案显示单元,所述设计方案显示单元包括所述设计方案的三维效果图和二维刀模展开图;
所述编辑模块包括布局编辑单元,所述布局编辑单元用于修改各所述设计元素的位置关系或者对增加或删除设计元素,所述设计元素至少包括文字元素或者图案元素;
所述编辑模块还包括文字编辑单元,所述文字编辑单元用于修改和添加文字,所述文字编辑单元与所述包装语言模型通讯连接以根据用户输入生成文案;
所述编辑模块还包括图案编辑单元,所述图案编辑单元与所述图像生成模型通讯连接以根据用户输入生成图案元素。
本发明实施例至少具有以下有益效果:
1、本发明采用自然语言处理技术与用户进行实时互动,更加准确地了解用户需求,降低了设计误解。
2、通过图像生成模型,实现了对用户需求的快速响应和实时设计方案效果展示,大大提高了包装设计效率。
3、在线编辑模块允许客户对生成的设计方案进行实时调整,更加符合用户的实际需求。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于人工智能的包装设计系统架构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。需要说明的是,在不冲突的情况下,本公开中的实施方式及实施方式中的特征可以相互组合、分离、互换和/或重新布置。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
这里使用的术语是为了描述具体实施例的目的,而不意图是限制性的。如这里所使用的,除非上下文另外清楚地指出,否则单数形式“一个(种、者)”和“所述(该)”也意图包括复数形式。此外,当在本说明书中使用术语“包含”和/或“包括”以及它们的变型时,说明存在所陈述的特征、整体、步骤、操作、部件、组件和/或它们的组,但不排除存在或附加一个或更多个其它特征、整体、步骤、操作、部件、组件和/或它们的组。还要注意的是,如这里使用的,术语“基本上”、“大约”和其它类似的术语被用作近似术语而不用作程度术语,如此,它们被用来解释本领域普通技术人员将认识到的测量值、计算值和/或提供的值的固有偏差。
以下通过具体实施例对本发明实施例提供的一种基于人工智能的包装设计系统进行说明,如图1所示,包括:
需求分析模块,基于包装语言模型与用户进行多轮问询交互,根据用户输入分析获得设计需求,所述设计需求包括包装类型、被包装产品类型或者设计风格。
方案生成模块,与所述需求分析模块通讯连接,包括包装模型获取单元、设计图像生成单元和设计模板获取单元。
所述包装模型获取单元根据所述包装类型从盒型库中调用相应的包装模型。
所述设计图像生成单元基于图像生成模型,根据所述被包装产品类型和所述设计风格生成包装设计图案。
所述设计模板获取单元根据所述设计风格从模板库中调用相应的设计模板。
所述方案生成模块根据所述包装模型、所述包装设计图案和所述设计模板生成设计方案。
编辑模块,与所述方案生成模块通讯连接,用于对所述设计方案中的设计元素进行编辑。
本发明的包装语言模型采用了LLM(Large Language Model)语言模型技术,这是一种当前自然语言处理领域的前沿技术,它可以通过训练模型,让模型预测下一个词或者句子,实现对自然语言的理解。相比于传统的基于规则的自然语言处理技术,LLM语言模型技术可以更加准确地理解自然语言输入。在本发明中,LLM语言模型技术可以帮助系统更加准确地解析客户的自然语言输入,理解客户的需求,从而生成更加符合客户需求的设计方案效果。
LLM语言模型技术的另一个优点是可以进行无监督预训练。这意味着,通过大量的无标签数据进行预训练,LLM语言模型可以学习到更多的语言知识,提高对自然语言的理解能力。在本发明中,通过对大量的包装设计相关文本进行无监督预训练,LLM语言模型可以更好地理解与包装设计相关的自然语言输入,并生成更加符合客户需求的设计方案效果。
此外,LLM语言模型技术还可以对客户输入的数据进行分析和挖掘,为系统的持续优化和更新提供支持。通过对客户输入的大量数据进行分析,LLM语言模型可以发现一些隐藏的规律和模式。例如,LLM语言模型可以发现一些类型相似的包装设计方案,从而为客户提供更多的选择。同时,LLM语言模型还可以发现一些客户需求的变化和趋势,为系统的持续优化和更新提供支持。
LLM语言模型技术是一种非常有前途的自然语言处理技术,它可以帮助系统更加准确地理解客户的自然语言输入,生成更加符合客户需求的设计方案效果,并为系统的持续优化和更新提供支持。
优选地,在一些实施例中,所述包装语言模型的训练方法包括:
获取包装设计用语数据和预训练语言模型。
具体地,本发明实施例提供一种针对包装设计行业的垂直领域语言模型,用于在包装设计行业中实现人机交互、设计需求预测和设计案例生成。使用包装设计领域的专业数据微调预训练的深度学习语言模型,以提供对包装设计专业术语和概念的理解。首先选择一个适用于本发明的预训练语言模型。该预训练模型为基于深度学习的Transformer架构,并在自然语言处理任务中表现出优越性能的生成式预训练式Transformer(OpenAI GPT系列)或者双向Transformer(例如BERT系列)模型。在一些实施例中,预训练语言模型直接使用已经训练好的上述模型即可,也可以是采用通过以下方法训练的预训练语言模型。
预训练语言模型的训练过程概括:首先根据任务特性收集大量相关数据,然后将数据集对选定的Transformer模型中进行模型训练,然后通过测试集在训练好的模型上做推理查看模型的表现是否符合预期来决定超参数优化的策略,最后将微调后的模型用于最终的推理应用。
预训练语言模型的训练过程包括:
数据收集,首先,收集大量与本发明相关的数据,包括文本、图像等。为了构建高质量数据集,可以从多个来源搜集数据,例如行业论坛、设计博客、学术论文等。
数据预处理,对收集到的数据进行预处理,包括去除无关元素、转换图片格式、分词、标注等。数据预处理的目的是将原始数据转化为神经网络适合输入的格式。
选定Transformer模型,选择一个适用于本发明的生成式预训练Transformer模型,例如OpenAI GPT系列。这些模型在自然语言处理任务中表现出优越性能,有利于本发明的实现。
模型训练,将预处理过的数据集划分为训练集和验证集。将训练集数据送入选定的Transformer模型中,进行多轮训练。在训练过程中,可以适时调整学习速率、模型参数等超参数以优化模型表现。
模型验证,使用验证集对训练好的模型进行验证。通过验证集上的损失函数值、准确率等指标,评估模型的表现。如果模型验证结果不佳,需要返回至超参数调整环节优化模型。
以上完成预训练语言模型的训练之后需要对模型进行微调,当模型在验证集上的表现符合预期时,可以对模型进行微调。微调通常通过继续在针对性的数据上训练模型实现,例如本发明中收集的专业包装设计相关数据。这可以使模型更好地适应具体任务,提高最终推理应用的表现。
模型测试,在模型微调后,使用之前留出的测试集对模型进行最终测试。评估模型在各项指标上的表现,确认是否符合实际应用场景的需求。
模型部署,将训练和微调好的模型部署到实际应用环境,如API、嵌入式系统等。此时模型可以用于生成包装设计描述、解答设计相关问题等任务,实现本发明的目标。
具体地,本发明实施例选用现有的预训练语言模型,在确定预训练语言模型之后,先收集与包装设计行业密切相关的文本数据,本实施例中对此称作包装设计用语数据。这些数据包括但不限于包装设计论坛、博客、教程、行业文章等内容。通过网络爬虫技术和API技术从网站、社交平台、在线论坛等来源爬取数据。
接着,对所述包装设计用语数据进行第一预处理,所述第一预处理包括去除HTML标签和特殊字符、进行数据清洗以及去除停用词。对于数据清洗,在数据采集阶段,为了获得更加准确可靠的数据,可以从多个数据源采集相同的数据,然后通过比较和核验来删除错误的数据,这一方法称为“数据融合”。数据清洗的一般过程包括:1、数据采集;2、数据整理:填补缺失值、格式化数据等;3、数据校验:比如长度校验、值域校验、相关性校验等;4、数据筛选:根据业务需求筛选正确的数据;5、数据转换:进行数据提炼、归一化等转换。对于文本数据,常用的清洗方法是:删除空格和换行符;更正拼写错误;归一化大小写;去掉标点符号等。对数字数据,常用的方法是:去除异常值;插补缺失值;校准不同量纲的数据等。数据清洗结束后,需要进行数据校验,以确保数据的质量。常用的校验方法有:与原始数据源进行对比,校验清洗过程是否产生新的错误;抽样调查清洗后的数据,核验其准确性;专业人员审核部分清洗结果等。
对预处理后的所述包装设计用语数据进行分词处理,以提取所述包装设计用语数据中的关键词、短语或者行业术语。
在一些实施例中,所述分词处理包括采用文本处理工具对所述包装设计用语数据进行分词处理以获得分词结果,所述文本处理工具包括jieba分词或者THULAC。
较佳地,这里先对分词结果去除停用词,去除文本中的常见停用词,如“的”、“和”等,留下有实际意义的词汇,方便后续的关键词提取。
所述关键词的提取方法包括基于BERT的TextRank或者BERT关键词抽取库从所述分词结果中提取所述关键词,所述BERT关键词抽取库包括Bert-extractive-keywords。
所述短语和所述行业术语的提取包括,通过词性标注工具对所述分词结果进行词性分析,通过组合不同词性的词汇提取包含实际意义的短语和行业术语,所述词性标注工具包括jieba词性标注或者LTP。
应当理解的是,关键词、短语和行业术语构成了该包装设计领域的关键性词语,可以更好的表达包装设计语言之中的重点和主题,有利于模型理解用户的输入。常用的方法有:统计方法,如TF-IDF,提取高频词的短语;语义方法,利用词与词之间的关系提取代表意思的词和短语;专家知识方法,聘请领域专家根据专利内容提取关键词。
将所述关键词、短语和行业术语进行去重之后加入所述预训练语言模型的词汇表中。
具体地,将提取出的关键词、短语和行业术语集合起来,创建一个词汇表。可以将这些词汇排序并去重,保证词汇表的唯一性和准确性。将新创建的词汇表中的词汇添加到预训练模型的词汇表中。这样,预训练模型在处理包装设计相关任务时,可以更好地识别和理解行业相关术语,提高模型在该领域应用的表现。
通过以上过程,可以有效地对文本数据进行分词处理,并提取关键词、短语及行业术语,进而将这些术语添加到预训练语言模型的词汇表中,为后续任务提供更准确的行业领域信息。
然后需要使用收集到的专业数据对预训练语言模型进行微调。微调过程包括导入预训练语言模型权重,并使用面向包装设计行业的自定义数据集和损失函数对模型进行逐步优化。在优化过程中,可调整不同的超参数以达到最佳性能。包括:
获取自定义包装设计数据集,包括对包装设计行业数据进行第二预处理以使得所述包装设计行业数据满足所述预训练语言模型的输入格式,进而形成所述自定义包装设计数据集。
根据选定损失函数和优化器,基于所述自定义包装设计数据集对所述预训练语言模型进行微调,以更新所述预训练语言模型的网络权重和所述词汇表中词汇对应的词向量,获得所述包装语言模型。
其中,预训练语言模型权重是指在训练好的神经网络模型中,各层神经元之间连接的数值。这些权重经过大量数据的训练,得到了对输入数据进行有效表示和学习任务的能力。在预训练语言模型中,权重通常包括两个部分:词嵌入权重和Transformer网络权重。词嵌入权重:词嵌入权重用于将文本数据中的每个词汇映射为一个固定长度的向量(通常称为词向量)。这些向量可以捕捉词之间的语义关系,如相似词在向量空间中的距离较近。预训练语言模型的词嵌入权重是经过大量数据训练得到的,具有较好的语义表达能力。Transformer网络权重:Transformer网络权重包含多层的自注意力机制和位置前馈神经网络。这些权重在训练过程中不断地调整,以学习输入文本数据的复杂关系和结构。预训练语言模型的Transformer网络权重已经学习到了一定程度的文本表示,可以直接用于解决一些自然语言处理任务。
在微调过程中,使用收集到的专业数据即包装设计行业数据(如已积累的设计资料或网络资源)对预训练语言模型权重进行优化。这包括:
导入预训练语言模型权重:将已经训练好的预训练语言模型权重(如GPT系列模型权重)导入自定义模型中,作为模型初始权重。
使用自定义包装设计数据集将收集到的包装设计行业数据,按照模型输入要求进行预处理,构建自定义数据集。
设定损失函数和优化器:选择一个适用于模型的损失函数(如交叉熵损失、均方误差损失等)和优化器(如Adam、SGD等),用于指导模型的优化过程。
微调模型:自定义包装设计数据集喂入模型中,计算损失值。在优化过程中,根据损失值调整模型的权重。通过迭代训练数轮(Epochs),使模型在自定义包装设计数据集上表现更好。
超参数调整:在微调过程中,可尝试调整不同的超参数,如学习速率、权重衰减等,以达到最佳性能。超参数的选取可以通过网格搜索、随机搜索等方法进行确定。
在完成微调过程后,预训练语言模型将具有更好地理解和处理包装设计行业任务的能力。
较佳地,在微调过程中,将自定义包装设计数据集分为训练集和验证集。使用验证集评估模型在包装设计专业任务上的性能。结合准确率、召回率、F1分等评价指标,对所述模型进行性能优化。在微调过程中,将数据集分为训练集和验证集是为了评估模型在包装设计专业任务上的性能,并避免过拟合。具体包括:
划分数据集:首先,将收集到的专业数据集按照80%和20%的比例随机分为训练集和验证集。训练集用于模型训练,更新模型权重。验证集用于在训练过程中评估模型在包装设计任务上的表现。
防止过拟合:通过在验证集上评估模型性能,我们可以观察到模型是否对训练数据过拟合。过拟合是指模型在训练数据上表现很好,但在新数据上表现较差。通过设置一个验证集,我们可以追踪模型在新数据(验证集)上的性能,并在模型开始过拟合时停止训练。
评价指标:为了衡量模型在包装设计专业任务上的性能,我们可以使用准确率、召回率、F1分等评价指标。准确率衡量的是模型预测正确的结果占总预测结果的比例;召回率衡量的是模型正确预测的结果占真实正例的比例;F1分则是准确率和召回率的调和平均值,可以综合考虑准确率和召回率。这些评价指标有助于我们更全面地了解模型的性能。
性能优化:在训练过程中,根据验证集上的准确率、召回率和F1分等指标情况,我们可以对模型进行性能优化。这包括调整学习速率、权重衰减等超参数,以及尝试不同的模型结构、损失函数等。优化目标是使模型在包装设计专业任务上取得更好的性能。
通过以上步骤,我们可以有效地利用训练集和验证集,评估并优化模型在包装设计任务上的性能。在验证集上表现良好的模型预计在实际应用中也能取得较好的效果。
完成模型调优后,使用容器技术(例如Docker)将模型部署到服务器上。也可以利用云服务(例如AWS、Google Cloud、Azure)进行部署。为便于客户端调用,创建API接口供客户端调用,将语言模型嵌入实际应用场景,如Web平台和移动应用程序。
此外,周期性地重新收集数据并对模型进行重新微调,以适应包装设计领域的变化。对模型的实际使用情况进行监控,并收集反馈,根据需求对模型进行优化和更新。以实现模型的监控与更新。
在一些实施例中,还包括注册模块,与所述需求分析模块和所述方案生成模块通讯连接,用于获取用户的注册信息并为用户分配账户。根据用户注册信息自动分析可能需要的包装类型,自动给出描述词建议。例如,通过用户注册信息可以知道是一家水果零售连锁品牌,系统通过互联网数据分析品牌的品类,生成描述词的建议,匹配出适合包装水果的包装类型推荐至用户。
本发明通过以上过程,实现了一种针对包装设计行业的垂直领域语言模型。该包装语言模型具备对包装设计专业术语和概念的理解,可有效完成人机交互、设计需求预测和设计案例生成等任务。本发明提供了一种实用、高性能的包装设计智能助手,有益于提升包装设计行业的工作效率。
在一些实施例中,所述需求分析模块,基于包装语言模型与用户进行多轮问询交互,根据用户输入分析获得设计需求,包括:
根据所述用户输入分析获得第一设计需求;
通过所述方案生成模块根据所述第一设计需求生成若干备选方案;
根据被选择的所述备选方案和对所述备选方案的修改获取第二设计需求;
所述用户输入包括所述注册信息、用户对于问询引导标签的选择、用户对于所述备选方案的选择或者用户需求描述。
需求分析模块通过引导式多轮对话,帮助客户迅速找到适合的包装类型。包装类型、标准、尺寸根据训练数据模型,匹配适合用户需求的包装盒。问询引导标签指的是包装语言模型根据用户输入对于用户下一步想要输入的内容的预测,并且以问询引导标签的形式展现给用户。
例如,根据用户输入的“设计一个可以装新鲜葡萄的包装盒”,智能推荐用户使用便于携带的自提箱式包装,并提取关键元素词“新鲜”“葡萄”,生成葡萄的图案,根据葡萄特点生成主题文字“葡萄很甜”。再根据丰富的预设模板自动套入包装盒的标准刀模的二维平面图,并实时渲染成3D包装效果。通过包装语言模型生成对中间设计方案的介绍,包括材质特点和优点。也可以根据客户需求自动生成包装效果,包装效果由图像生成模型自动生成的图案叠加用户需求中提炼的文字渲染生成。
在一些实施例中,还包括对设计方案的存储模块,对中间形成每一版本进行保存以供用户随时调用或者修改。
在一些实施例中,所述盒型库包括多种包装类型的包装模型,所述包装模型包括标准刀模和标签,所述标签包括尺寸、材料、适用范围描述或者制作工艺,所述包装类型包括盒、袋、瓶、箱或者罐;较佳地,标签还包括包装类型适用的被包装产品以及适用的设计模板,本实施例在调用包装模型的时候通过标签的该内容进行匹配。
所述盒型库还包括对所述包装模型的三维建模和对所述标准刀模的二维平面图。
盒型库也叫做包装模型库,是事先建立的包括盒、袋、瓶、箱、罐等各种包装类型的不同尺寸形状的基础模型,每个模型都具有三维建模和相应的展开刀版图。在本发明中,使用计算机辅助设计(CAD)软件进行三维建模,并设计一基于数据库的模型库管理系统,使得模型在整个系统中易于访问和重用。
在一些实施例中,所述模板库包括预先收集的若干设计模板,所述设计模板包括文字排版、整体布局、颜色或者字体中的一种或多种的组合;较佳地,模板库还包括设计模板适用的包装模型,在确定了包装模型之后,调用设计模板时通过该信息自动匹配适合的设计模板。
还包括通过图像聚类和样式迁移算法对所述若干设计模板进行风格类别的归类。
在一些实施例中,还包括三维渲染模块,与所述方案生成模块、所述需求分析模块和所述编辑模块均通讯连接,所述三维渲染模块依据所述包装模型和所述设计方案生成对应的三维渲染图,以使得用户能够通过所述需求分析模块和所述编辑模块查看所述三维渲染图。
在一些实施例中,建立包装设计专用的生成式AI图像生成模型,能够通过输入文字描述,自动生成所需的设计元素。在本发明中,使用如Stable Diffusion Models、Generative Adversarial Networks(GAN)或 Variational Autoencoder(VAE)等生成式模型。使用包装设计的专业数据集对这些模型进行训练,从而能够将用户描述生成为相应的设计元素。
所述图像生成模型的训练方法包括:
获取包装设计图像数据并且通过数据增强方法进行数据扩充以获得图像数据集。
具体地,首先需要收集大量的包装设计图像数据,这些数据应该涵盖多种风格和类型的设计。使用适当的数据增强手段(如旋转、缩放等)可以进一步扩充数据集,提高模型的泛化能力。
对所述图像数据集中的图像数据进行第三预处理以使得所述图像数据满足神经网络的输入要求。第三预处理包括缩放、裁剪和归一化等操作,使图像数据适合送入神经网络进行训练。
接着,对第三预处理之后的所述图像数据进行分类,并通过卷积神经网络提取各类别的特征。按照常用的图形分类和样式进行分组。接下来,需要提取各类别的特征,包括例如尺寸、颜色、形状等信息。可以通过预训练的卷积神经网络(如ResNet、VGG等)实现这一目标。
根据分类后的所述图像数据训练若干嵌入式模型,以使得各所述嵌入式模型分别学习不同设计风格的特点,所述嵌入式模型包括StyleGAN。根据分类后的数据,分别训练各种风格的嵌入式模型。这些模型的目的是学习不同设计风格的特点。使用如 StyleGAN 等生成对抗网络(GAN)可以实现这一目标。
根据所述图像数据训练生成式模型,以使得所述生成式模型生成图像时可以进行优化调整,所述生成式模型包括Hypernetwork、Lora或者VAE。需要训练生成式模型,如Hypernetwork、Lora、VAE等,使它们能够在生成图像时对其进行优化和调整。这些模型可以在生成过程中保留输入图像的主要特征,同时在局部进行调整以改善最终的结果。
融合将分别具有不同风格的所述若干嵌入式模型和所述生成式模型,以训练生成所述图像生成模型,所述图像生成模型用于根据用户描述生成设计元素图像。使其能同时处理各种设计元素,如人物、动植物、产品等。
通过测试数据对训练好的图像生成模型进行评估,分析模型生成的包装设计图像质量、创意程度等方面的表现,并及时针对问题进行调整优化。接收用户提供的设计需求及参考样式,将其送入训练好的图像生成模型,生成满足用户需求的创意包装设计。
在一些实施例中,所述编辑模块包括设计方案显示单元,所述设计方案显示单元包括所述设计方案的三维效果图和二维刀模展开图;
所述编辑模块包括布局编辑单元,所述布局编辑单元用于修改各所述设计元素的位置关系或者对增加或删除设计元素,所述设计元素至少包括文字元素或者图案元素;
所述编辑模块还包括文字编辑单元,所述文字编辑单元用于修改和添加文字,所述文字编辑单元与所述包装语言模型通讯连接以根据用户输入生成文案;
所述编辑模块还包括图案编辑单元,所述图案编辑单元与所述图像生成模型通讯连接以根据用户输入生成图案元素。
在一些实施例中,本发明实施例提供的包装设计系统还包括记忆模块和输出模块,记忆模块用于对用户在设计过程中的操作进行记录,并反馈到包装语言模型和图像生成模型中,以便于更好的为用户推送符合设计喜好的方案。输出模块用于,根据用户选定的设计方案,将方案的刀模图发送至后续生产环节用于印刷生产。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于人工智能的包装设计系统,其特征在于,包括:
需求分析模块,基于包装语言模型与用户进行多轮问询交互,根据用户输入分析获得设计需求,所述设计需求包括包装类型、被包装产品类型或者设计风格;
方案生成模块,与所述需求分析模块通讯连接,包括包装模型获取单元、设计图像生成单元和设计模板获取单元;
所述包装模型获取单元根据所述包装类型从盒型库中调用相应的包装模型;
所述设计图像生成单元基于图像生成模型,根据所述被包装产品类型和所述设计风格生成包装设计图案;
所述设计模板获取单元根据所述设计风格从模板库中调用相应的设计模板;
所述方案生成模块根据所述包装模型、所述包装设计图案和所述设计模板生成设计方案;
编辑模块,与所述方案生成模块通讯连接,用于对所述设计方案中的设计元素进行编辑。
2.根据权利要求1所述的基于人工智能的包装设计系统,其特征在于:所述包装语言模型的训练方法包括:
获取包装设计用语数据和预训练语言模型;
对所述包装设计用语数据进行第一预处理,所述第一预处理包括去除HTML标签和特殊字符、进行数据清洗以及去除停用词;
对预处理后的所述包装设计用语数据进行分词处理,以提取所述包装设计用语数据中的关键词、短语或者行业术语;
将所述关键词、短语和行业术语进行去重之后加入所述预训练语言模型的词汇表中;
获取自定义包装设计数据集,包括对包装设计行业数据进行第二预处理以使得所述包装设计行业数据满足所述预训练语言模型的输入格式,进而形成所述自定义包装设计数据集;
根据选定损失函数和优化器,基于所述自定义包装设计数据集对所述预训练语言模型进行微调,以更新所述预训练语言模型的网络权重和所述词汇表中词汇对应的词向量,获得所述包装语言模型。
3.根据权利要求2所述的基于人工智能的包装设计系统,其特征在于:所述分词处理包括采用文本处理工具对所述包装设计用语数据进行分词处理以获得分词结果,所述文本处理工具包括jieba分词或者THULAC;
所述关键词的提取方法包括基于BERT的TextRank或者BERT关键词抽取库从所述分词结果中提取所述关键词,所述BERT关键词抽取库包括Bert-extractive-keywords;
所述短语和所述行业术语的提取包括,通过词性标注工具对所述分词结果进行词性分析,通过组合不同词性的词汇提取包含实际意义的短语和行业术语,所述词性标注工具包括jieba词性标注或者LTP。
4.根据权利要求1所述的基于人工智能的包装设计系统,其特征在于:还包括注册模块,与所述需求分析模块和所述方案生成模块通讯连接,用于获取用户的注册信息并为用户分配账户。
5.根据权利要求4所述的基于人工智能的包装设计系统,其特征在于:
所述需求分析模块,基于包装语言模型与用户进行多轮问询交互,根据用户输入分析获得设计需求,包括:
根据所述用户输入分析获得第一设计需求;
通过所述方案生成模块根据所述第一设计需求生成若干备选方案;
根据被选择的所述备选方案和对所述备选方案的修改获取第二设计需求;
所述用户输入包括所述注册信息、用户对于问询引导标签的选择、用户对于所述备选方案的选择或者用户需求描述。
6.根据权利要求1所述的基于人工智能的包装设计系统,其特征在于:所述盒型库包括多种包装类型的包装模型,所述包装模型包括标准刀模和标签,所述标签包括尺寸、材料、适用范围描述或者制作工艺,所述包装类型包括盒、袋、瓶、箱或者罐;
所述盒型库还包括对所述包装模型的三维建模和对所述标准刀模的二维平面图。
7.根据权利要求1所述的基于人工智能的包装设计系统,其特征在于:
所述模板库包括预先收集的若干设计模板,所述设计模板包括文字排版、整体布局、颜色或者字体中的一种或多种的组合;
还包括通过图像聚类和样式迁移算法对所述若干设计模板进行风格类别的归类。
8.根据权利要求1所述的基于人工智能的包装设计系统,其特征在于:还包括三维渲染模块,与所述方案生成模块、所述需求分析模块和所述编辑模块均通讯连接,所述三维渲染模块依据所述包装模型和所述设计方案生成对应的三维渲染图,以使得用户能够通过所述需求分析模块和所述编辑模块查看所述三维渲染图。
9.根据权利要求1所述的基于人工智能的包装设计系统,其特征在于:所述图像生成模型的训练方法包括:
获取包装设计图像数据并且通过数据增强方法进行数据扩充以获得图像数据集;
对所述图像数据集中的图像数据进行第三预处理以使得所述图像数据满足神经网络的输入要求;
对第三预处理之后的所述图像数据进行分类,并通过卷积神经网络提取各类别的特征;
根据分类后的所述图像数据训练若干嵌入式模型,以使得各所述嵌入式模型分别学习不同设计风格的特点,所述嵌入式模型包括StyleGAN;
根据所述图像数据训练生成式模型,以使得所述生成式模型生成图像时可以进行优化调整,所述生成式模型包括Hypernetwork、Lora或者VAE;
融合将分别具有不同风格的所述若干嵌入式模型和所述生成式模型,以训练生成所述图像生成模型,所述图像生成模型用于根据用户描述生成设计元素图像。
10.根据权利要求1所述的基于人工智能的包装设计系统,其特征在于:所述编辑模块包括设计方案显示单元,所述设计方案显示单元包括所述设计方案的三维效果图和二维刀模展开图;
所述编辑模块包括布局编辑单元,所述布局编辑单元用于修改各所述设计元素的位置关系或者对增加或删除设计元素,所述设计元素至少包括文字元素或者图案元素;
所述编辑模块还包括文字编辑单元,所述文字编辑单元用于修改和添加文字,所述文字编辑单元与所述包装语言模型通讯连接以根据用户输入生成文案;
所述编辑模块还包括图案编辑单元,所述图案编辑单元与所述图像生成模型通讯连接以根据用户输入生成图案元素。
CN202310817196.2A 2023-07-05 2023-07-05 一种基于人工智能的包装设计系统 Active CN116541911B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310817196.2A CN116541911B (zh) 2023-07-05 2023-07-05 一种基于人工智能的包装设计系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310817196.2A CN116541911B (zh) 2023-07-05 2023-07-05 一种基于人工智能的包装设计系统

Publications (2)

Publication Number Publication Date
CN116541911A true CN116541911A (zh) 2023-08-04
CN116541911B CN116541911B (zh) 2023-12-08

Family

ID=87456388

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310817196.2A Active CN116541911B (zh) 2023-07-05 2023-07-05 一种基于人工智能的包装设计系统

Country Status (1)

Country Link
CN (1) CN116541911B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116824020A (zh) * 2023-08-25 2023-09-29 北京生数科技有限公司 图像生成方法和装置、设备、介质和程序
CN117237930A (zh) * 2023-11-13 2023-12-15 成都大学 基于ResNet与迁移学习的腐蚀金具SEM图像识别方法
CN117274511A (zh) * 2023-11-22 2023-12-22 大家智合(北京)网络科技股份有限公司 一种包装领域的盒型3d预览系统及其方法
CN117632098A (zh) * 2024-01-25 2024-03-01 中国建筑设计研究院有限公司 一种基于aigc的建筑智能设计系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105068661A (zh) * 2015-09-07 2015-11-18 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法和系统
CN107025593A (zh) * 2017-04-11 2017-08-08 道中康(天津)文化传播有限公司 包装定制方法、装置及系统
KR20200055813A (ko) * 2018-11-08 2020-05-22 주식회사 하마소프트 딥 러닝을 이용한 산업용 패턴 디자인 자동 생성 시스템
CN113722783A (zh) * 2021-07-08 2021-11-30 浙江海阔人工智能科技有限公司 基于深度学习模型的面向用户的服装智能设计系统及方法
CN115438396A (zh) * 2022-09-05 2022-12-06 深圳市智码通科技有限公司 一种包装设计方法和装置
CN116150826A (zh) * 2022-09-27 2023-05-23 重庆鹪鹩茶文化传播有限公司 一种智能包装设计系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105068661A (zh) * 2015-09-07 2015-11-18 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法和系统
CN107025593A (zh) * 2017-04-11 2017-08-08 道中康(天津)文化传播有限公司 包装定制方法、装置及系统
KR20200055813A (ko) * 2018-11-08 2020-05-22 주식회사 하마소프트 딥 러닝을 이용한 산업용 패턴 디자인 자동 생성 시스템
CN113722783A (zh) * 2021-07-08 2021-11-30 浙江海阔人工智能科技有限公司 基于深度学习模型的面向用户的服装智能设计系统及方法
CN115438396A (zh) * 2022-09-05 2022-12-06 深圳市智码通科技有限公司 一种包装设计方法和装置
CN116150826A (zh) * 2022-09-27 2023-05-23 重庆鹪鹩茶文化传播有限公司 一种智能包装设计系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116824020A (zh) * 2023-08-25 2023-09-29 北京生数科技有限公司 图像生成方法和装置、设备、介质和程序
CN117237930A (zh) * 2023-11-13 2023-12-15 成都大学 基于ResNet与迁移学习的腐蚀金具SEM图像识别方法
CN117274511A (zh) * 2023-11-22 2023-12-22 大家智合(北京)网络科技股份有限公司 一种包装领域的盒型3d预览系统及其方法
CN117274511B (zh) * 2023-11-22 2024-03-12 大家智合(北京)网络科技股份有限公司 一种包装领域的盒型3d预览系统及其方法
CN117632098A (zh) * 2024-01-25 2024-03-01 中国建筑设计研究院有限公司 一种基于aigc的建筑智能设计系统
CN117632098B (zh) * 2024-01-25 2024-04-23 中国建筑设计研究院有限公司 一种基于aigc的建筑智能设计系统

Also Published As

Publication number Publication date
CN116541911B (zh) 2023-12-08

Similar Documents

Publication Publication Date Title
CN116541911B (zh) 一种基于人工智能的包装设计系统
CN110597735B (zh) 一种面向开源软件缺陷特征深度学习的软件缺陷预测方法
CN111026842B (zh) 自然语言处理方法、自然语言处理装置及智能问答系统
WO2018218708A1 (zh) 一种基于深度学习的舆情热点类别划分方法
CN106021364A (zh) 图片搜索相关性预测模型的建立、图片搜索方法和装置
CN104679743A (zh) 一种确定用户的偏好模式的方法及装置
CN109670191A (zh) 机器翻译的校准优化方法、装置与电子设备
CN112015902B (zh) 基于度量的元学习框架下的少次文本分类方法
CN106844632A (zh) 基于改进支持向量机的产品评论情感分类方法及装置
CN107357793A (zh) 信息推荐方法和装置
CN116611131B (zh) 一种包装图形自动生成方法、装置、介质及设备
CN114419642A (zh) 一种文档图像中键值对信息的抽取方法、装置及系统
CN114443899A (zh) 视频分类方法、装置、设备及介质
CN112990973A (zh) 线上店铺画像构建方法及系统
CN109726331A (zh) 对象偏好预测的方法、装置和计算机可读介质
CN113886562A (zh) 一种ai简历筛选方法、系统、设备和存储介质
CN116522912B (zh) 一种包装设计语言模型的训练方法、装置、介质及设备
CN107798137B (zh) 一种基于可加模型的多源异构数据融合架构系统
CN113869609A (zh) 一种根因分析频繁子图置信度预测方法及系统
CN117494760A (zh) 一种基于超大规模语言模型的富语义标签数据增广方法
CN114969511A (zh) 基于分片的内容推荐方法、设备及介质
Joppi et al. POP: mining POtential Performance of new fashion products via webly cross-modal query expansion
CN114936279A (zh) 一种面向协同制造企业的非结构化图表数据分析方法
WO2022231522A1 (en) Explainable recommendation system and method
CN114254622A (zh) 一种意图识别方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant