CN113032606B - 一种基于大数据的下载管理系统及方法 - Google Patents

一种基于大数据的下载管理系统及方法 Download PDF

Info

Publication number
CN113032606B
CN113032606B CN202110378279.7A CN202110378279A CN113032606B CN 113032606 B CN113032606 B CN 113032606B CN 202110378279 A CN202110378279 A CN 202110378279A CN 113032606 B CN113032606 B CN 113032606B
Authority
CN
China
Prior art keywords
color
unit
picture
module
design file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110378279.7A
Other languages
English (en)
Other versions
CN113032606A (zh
Inventor
褚亚亚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Yuefei Finance Cloud Technology Co ltd
Original Assignee
Guangdong Yuefei Finance Cloud Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Yuefei Finance Cloud Technology Co ltd filed Critical Guangdong Yuefei Finance Cloud Technology Co ltd
Priority to CN202110378279.7A priority Critical patent/CN113032606B/zh
Priority to CN202210273546.9A priority patent/CN114722227A/zh
Publication of CN113032606A publication Critical patent/CN113032606A/zh
Application granted granted Critical
Publication of CN113032606B publication Critical patent/CN113032606B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Processing Or Creating Images (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于大数据的下载管理系统及方法,属于大数据下载管理技术领域。本系统包括素材库、距离抓取模块、智能选择模块、视觉评价模块、下载管理模块、输出反馈模块;所述素材库的输出端与距离抓取模块、智能选择模块、视觉评价模块的输入端相连接;所述距离抓取模块的输出端与智能选择模块的输入端相连接;所述智能选择模块的输出端与视觉评价模块的输入端相连接;所述视觉评价模块的输出端与下载管理模块的输入端相连接;所述下载管理模块的输出端与输出反馈模块的输出端相连接。本发明还提供一种基于大数据的下载管理方法,实现了设计文件色彩匹配的自动化,解决了下载过程中下载量冗杂的问题。

Description

一种基于大数据的下载管理系统及方法
技术领域
本发明涉及大数据下载管理技术领域,具体为一种基于大数据的下载管理系统及方法。
背景技术
在如今这样一个高速发展的社会中,人们之间的交流越来越密切,随着科技手段的不断升级,人们的生活也越来越方便,高科技时代下,大数据应运而生。利用大数据进行分析和决策能够帮助降低成本、提高效率、开发新产品、做出更明智的业务决策等。
在人们的生活中,从网络下载相应的资源进行自我运用已经是一项日常,而在日常的工作中,PPT演示文稿更是不可或缺,它能够帮助人们更好地表达自己的想法,图片比文字能够更加清晰地展示各项数据,然而依然存在大量的不懂设计的人员,在对PPT进行设计的过程中,他们对于PPT文稿整体的色彩搭配缺乏必要的判定标准,对于美观情况难以抉择,然而在目前的各项软件中,只能够提供完整的PPT演示文件,当制作者想插其他的一些图片时,就会出现整体色彩搭配突兀,极度不美观的情况,进而影响整体的表达效果;另外在下载图片的过程中,往往下载了许多并不需要的图片,占用电脑内存,而且在其中筛选也存在很大的困难。综上,人们需要一种能够进行自动智能挑选的下载管理系统,用于对下载时进行分析处理。
发明内容
本发明的目的在于提供一种基于大数据的下载管理系统及方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:一种基于大数据的下载管理系统,该系统包括素材库、距离抓取模块、智能选择模块、视觉评价模块、下载管理模块、输出反馈模块;
所述素材库用于存储和调用历史数据;所述距离抓取模块用于确定当前设计文件插入图片的范围所需的最佳配色情况;所述智能选择模块用于挑选出下载列表中满足最佳配色的图片;所述视觉评价模块用于根据相应的评价标准评价得出下载列表中图片的优先级;所述下载管理模块用于对下载列表的图片进行管理;所述输出反馈模块用于对最终结果进行输出和反馈;
所述素材库的输出端与距离抓取模块、智能选择模块、视觉评价模块的输入端相连接;所述距离抓取模块的输出端与智能选择模块的输入端相连接;所述智能选择模块的输出端与视觉评价模块的输入端相连接;所述视觉评价模块的输出端与下载管理模块的输入端相连接;所述下载管理模块的输出端与输出反馈模块的输出端相连接。
根据上述技术方案,所述距离抓取模块包括如下单元:
区域圈定单元,用于对当前设计的PPT文件需要插入的图片区域进行圈定,并将无关区域进行按照指令划分;所述无关区域为除去圈定区域外的其他区域;
距离测算单元,用于测量圈定区域中心点和无关区域中心点之间的距离情况;
处理单元,用于对历史设计文件根据区域圈定单元进行等比例圈定处理,根据距离测算单元进行相同测算;
所述区域圈定单元、距离测算单元的输出端与处理单元的输入端相连接;所述处理单元的输出端与智能选择模块输入端相连接。
根据上述技术方案,所述智能选择模块包括如下单元:
距离检测单元,用于检测历史设计文件与当前PPT设计文件之间是否超出了距离阈值;
色彩选择单元,用于挑选出符合距离阈值的历史设计文件中区域范围内的最佳配色;
图片下载单元,用于为当前设计文件提供图片数据支持;
图片取色单元,用于对图片下载单元中的图片进行最终取色,选取得到满足最佳配色的图片;
所述距离检测单元的输出端与色彩选择单元的输入端相连接;所述图片下载单元的输出端与图片取色单元的输入端相连接;所述色彩选择单元的输出端与图片取色单元的输入端相连接;所述图片取色单元的输出端与视觉评价模块的输入端相连接。
根据上述技术方案,所述视觉评价模块包括如下单元:
视觉知识学习单元,用于根据历史数据采集视觉知识,从而对计算机进行训练学习;
特征评价单元,用于根据各项特征进行评价,决定图片的下载优先级,并输出结果到下载管理模块;
所述视觉知识学习单元的输出端与所述特征评价单元的输入端相连接;所述特征评价单元的输出端与下载管理模块的输入端相连接。
在视觉知识学习单元,利用计算机学习人脑的机制,能够对其建立大量模型进行训练,采取深度学习,形成评价机制,进行标准准确的评分。
根据上述技术方案,所述下载管理模块包括如下单元:
下载单元,用于进行图片的自动下载;
管理单元,用于根据智能选择模块与视觉评价模块的输出结果对下载单元中的图片进行增删、排序操作;
所述管理单元的输出端与下载单元的输入端相连接;所述下载单元的输出端与输出反馈模块的输入端相连接。
一种基于大数据的下载管理方法,该方法包括如下步骤:
S1、抓取当前PPT设计文件页面的色彩情况,圈定出插入图片的范围,记为L;
S2、将当前PPT设计文件与历史设计文件进行等比例区域划分,利用相似度比对,选取出满足条件的历史设计文件;
S3、对步骤S2中得出的满足阈值的历史设计文件进行色彩范围抓取,根据HSB值进行色彩范围分类,得出范围L的最佳配色情况,对图片下载单元内的图片进行第一重筛选,选取出满足条件的图片;
S4、建立视觉评价方法,对步骤S3中的图片进行第二重筛选,将选取出的图片送入下载管理单元进行下载管理。
根据上述技术方案,在步骤S2中,选取出满足阈值的历史设计文件的步骤如下:
S7-1、选取当前PPT设计文件的插入图片的范围的中心点作为坐标原点,建立平面直角坐标系,在除去范围L内的页面其他范围上建立N个无关区域,选取N个无关中心点,计算其到达坐标原点的距离;
S7-2、在步骤S7-1中,可得出一个距离集合,记为A={x1,x2,……,xn},对历史设计文件按照当前设计文件进行等比例区域划分,得出L的对应区域,并根据当前设计文件的无关区域的色彩进行圈定其他区域以所述插入图片的范围L的对应区域Li的中心为坐标原点,选取其他区域内的N个中心点,计算得出距离集合B={y1,y2,……,yn};
S7-3、根据公式:
Figure BDA0003011723880000041
其中,M为检测均值,k为比例系数,即历史设计文件相对于当前PPT设计文件的放大或缩小的比例值;
设置可调节允许范围阈值为Mi;对于每一份历史设计文件与当前PPT设计文件所得出的M值,若大于Mi进行舍弃处理;若小于Mi,选取成为输出结果。
首先选取当前文件的待插入图片区域,以该区域中心点建立一个平面直角坐标系,而对于其他区域根据色彩情况进行划分,这里的根据色彩情况以主色调为主,例如一块区域内有红色、粉红色,则可以划分在同一无关区域;但是若一块区域内存在红色、绿色;则在交界处进行划分,使其成为两个无关区域,以这样的方式划分结束后,保证每个无关区域仅存在一个鲜明的主色调;随后对历史设计文件进行等比例划分,选定出L对应的区域建立坐标系,依然按照色彩进行划分无关区域,随后利用公式进行计算距离,这里的检测均值计算得出的结果是距离差值的等比例平均值,若该值在设定的阈值范围内,就说明历史文件与当前设计文件整体的布局相仿;若不在,则说明相差很大,主要是利用各区域之间的距离进行判定,此方法进行判定能够更加精准。
根据上述技术方案,在步骤S3中,得出范围L的最佳配色的步骤如下:
S8-1、利用RGB颜色空间,将颜色切割成H*H*H个色块;
S8-2、提取步骤S7-3的输出结果中的文件,选择相对应的区域Li,提取区域Li的每个像素点,将其分配到相应色块中;
S8-3、对同一色块的像素点,计算平均颜色,作为该色块的最终取色;
S8-4、选取像素点最多的色块作为主色块,主色块的最终取色为范围L的最佳配色。
RGB颜色空间是用一个单位长度的立方体来表示颜色的,黑蓝绿青红紫黄白8种常见颜色分别位居立方体的8个顶点,通常将黑色置于三维直角坐标系的原点,红绿蓝分别置于3根坐标轴,各参数的取值范围是:R:0-255;G:0-255;B:0-255。由于每个灰度级都定为256,所以,红绿蓝分量全部组合起来共可表示16777216种不同的颜色。
这里利用颜色空间进行分布色块,然后提取像素点,以像素点最多的色块作为主色块,能够将颜色分类到很细微的差别,能够更加准确地进行确定最佳的配色情况,有利于后期进行图片下载的相关处理。
根据上述技术方案,在步骤S3中,进行第一重筛选的步骤如下:
S9-1、提取图片下载单元内的图片的像素点,分配到相应色块,选取像素点最多的色块作为主色块,主色块的最终取色为图片的最终取色;
S9-2、进行第一重筛选,根据公式:
D=sqrt((r2-r1)2+(g2-g1)2+(b2-b1)2);
其中,D为颜色间的距离,r1、g1、b1代表S8-4中范围L的最佳配色的三个分量;r2、g2、b2代表图片下载单元内的图片的最终取色的三个分量;
S9-3、在图片下载单元内的图片的最终取色与范围L的最佳配色之间的颜色距离D不超出阈值Dmax时,可选取作为输出。
这里利用颜色距离作为一重筛选的关键,颜色之间的距离代表着两个颜色之间的相似情况,因为很难从历史文件中去寻找得到和当前PPT设计文件完全一模一样的颜色,因此可以根据自身相关的需要去进行设置阈值,以不同的颜色距离去限定需要的颜色,进行下载的筛选。
根据上述技术方案,在步骤S4中,视觉评价方法的建立及筛选步骤如下:
S10-1、建立视觉知识学习单元,采集历史设计文件中的美学评价特征、自身价值特征、用户偏好信息;所述美学评价特征包括主题风格、布局排版、历史评价;所述自身价值特征包括尺寸、清晰度、边缘适配性;所述用户偏好信息包括用户下载量、用户好评度、用户行业信息;
S10-2、利用深度学习的机制,将美学评价特征、自身价值特征、用户偏好信息转换为计算机可识别语义信息,计算评分,评分值越高,排名越靠前;
S10-3、所述美学评价特征评分方式为抽取当前PPT设计文件中可以作为中心词的单词,所述中心词即为出现次数最多的单词;根据图片下载单元提供的图片说明信息,与中心词相关联词语出现次数越多,位置越靠前,则得分越高;
S10-4、所述自身价值特征评分方式为对图片下载单元中的图片的边缘区域进行边缘色彩提取,越靠近最佳配色的,则得分越高;
S10-5、所述用户偏好信息评分方式为根据图片下载单元提供的图片评价信息,用户好评度越高,位置越靠前,则评分越高;
S10-6、根据公式:
S=(w1S1+w2S2+w3S3)*h;
其中,w1、w2、w3分别为美学评价特征、自身价值特征、用户偏好信息的评价得分权重;S1、S2、S3分别为美学评价特征、自身价值特征、用户偏好信息的得分情况;S为最终得分;h为评价误差函数;
设置阈值Smin,将图片下载单元中得分小于阈值Smin的图片从下载列表删除。
建立视觉评价为第二重筛选,以美学评价特征、自身价值特征、用户偏好信息三种评价建立评价机制,根据所占权重,利用评分方式,计算得出评价分数,由于会存在一些特殊情况,例如恶意差评,曝光度不够等等原因,导致本身可用图片会存在评分误差,因此设置了误差函数以保证降低误差,提高精准性,使评分机制更加完善。
本文中的下载管理从两点进行出发,第一是根据自身需要,确定颜色的相似,自行设置第一个阈值,选取到最佳配色满足的下载图片,也就是根据图片自身的意义进行筛选;第二是根据图片本身的效果进行筛选,通过视觉评价机制,对图片本身的清晰度、好评度、适应性等等方面进行评价后进行筛选,也可以根据自身需要去放大或缩小相关阈值,以得到更为精确的结果。
与现有技术相比,本发明所达到的有益效果是:本发明能够解决非设计人员在进行设计PPT文件插入图片的过程中色彩不搭配的问题,方法精准高效,根据历史设计文件分析,对色彩搭配范围给出确定设置,同时还设置有视觉评价模块,能够基于深度学习进行图片的评价,从而在下载的过程中,减少了下载量,更加针对有目的性地进行下载,避免了下载量冗杂,挑选困难等一系列亟待解决的问题。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明一种基于大数据的下载管理系统的结构示意图;
图2是本发明一种基于大数据的下载管理方法的步骤示意图;
图3是本发明一种基于大数据的下载管理方法的RGB颜色空间示意图;
图4是本发明一种基于大数据的下载管理方法的流程示意图;
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-4,本发明提供技术方案:一种基于大数据的下载管理系统,该系统包括素材库、距离抓取模块、智能选择模块、视觉评价模块、下载管理模块、输出反馈模块;
所述素材库用于存储和调用历史数据;所述距离抓取模块用于确定当前设计文件插入图片的范围所需的最佳配色情况;所述智能选择模块用于挑选出下载列表中满足最佳配色的图片;所述视觉评价模块用于根据相应的评价标准评价得出下载列表中图片的优先级;所述下载管理模块用于对下载列表的图片进行管理;所述输出反馈模块用于对最终结果进行输出和反馈;
所述素材库的输出端与距离抓取模块、智能选择模块、视觉评价模块的输入端相连接;所述距离抓取模块的输出端与智能选择模块的输入端相连接;所述智能选择模块的输出端与视觉评价模块的输入端相连接;所述视觉评价模块的输出端与下载管理模块的输入端相连接;所述下载管理模块的输出端与输出反馈模块的输出端相连接。
所述距离抓取模块包括如下单元:
区域圈定单元,用于对当前设计的PPT文件需要插入的图片区域进行圈定,并将无关区域进行按照指令划分;所述无关区域为除去圈定区域外的其他区域;
距离测算单元,用于测量圈定区域中心点和无关区域中心点之间的距离情况;
处理单元,用于对历史设计文件根据区域圈定单元进行等比例圈定处理,根据距离测算单元进行相同测算;
所述区域圈定单元、距离测算单元的输出端与处理单元的输入端相连接;所述处理单元的输出端与智能选择模块输入端相连接。
所述智能选择模块包括如下单元:
距离检测单元,用于检测历史设计文件与当前PPT设计文件之间是否超出了距离阈值;
色彩选择单元,用于挑选出符合距离阈值的历史设计文件中区域范围内的最佳配色;
图片下载单元,用于为当前设计文件提供图片数据支持;
图片取色单元,用于对图片下载单元中的图片进行最终取色,选取得到满足最佳配色的图片;
所述距离检测单元的输出端与色彩选择单元的输入端相连接;所述图片下载单元的输出端与图片取色单元的输入端相连接;所述色彩选择单元的输出端与图片取色单元的输入端相连接;所述图片取色单元的输出端与视觉评价模块的输入端相连接。
所述视觉评价模块包括如下单元:
视觉知识学习单元,用于根据历史数据采集视觉知识,从而对计算机进行训练学习;
特征评价单元,用于根据各项特征进行评价,决定图片的下载优先级,并输出结果到下载管理模块;
所述视觉知识学习单元的输出端与所述特征评价单元的输入端相连接;所述特征评价单元的输出端与下载管理模块的输入端相连接。
所述下载管理模块包括如下单元:
下载单元,用于进行图片的自动下载;
管理单元,用于根据智能选择模块与视觉评价模块的输出结果对下载单元中的图片进行增删、排序操作;
所述管理单元的输出端与下载单元的输入端相连接;所述下载单元的输出端与输出反馈模块的输入端相连接。
一种基于大数据的下载管理方法,该方法包括如下步骤:
S1、抓取当前PPT设计文件页面的色彩情况,圈定出插入图片的范围,记为L;
S2、将当前PPT设计文件与历史设计文件进行等比例区域划分,利用相似度比对,选取出满足条件的历史设计文件;
S3、对步骤S2中得出的满足阈值的历史设计文件进行色彩范围抓取,根据HSB值进行色彩范围分类,得出范围L的最佳配色情况,对图片下载单元内的图片进行第一重筛选,选取出满足条件的图片;
S4、建立视觉评价方法,对步骤S3中的图片进行第二重筛选,将选取出的图片送入下载管理单元进行下载管理。
在步骤S2中,选取出满足阈值的历史设计文件的步骤如下:
S7-1、选取当前PPT设计文件的插入图片的范围的中心点作为坐标原点,建立平面直角坐标系,在除去范围L内的页面其他范围上建立N个无关区域,选取N个无关中心点,计算其到达坐标原点的距离;
S7-2、在步骤S7-1中,可得出一个距离集合,记为A={x1,x2,……,xn},对历史设计文件按照当前设计文件进行等比例区域划分,得出L的对应区域,并根据当前设计文件的无关区域的色彩进行圈定其他区域以所述插入图片的范围L的对应区域Li的中心为坐标原点,选取其他区域内的N个中心点,计算得出距离集合B={y1,y2,……,yn};
S7-3、根据公式:
Figure BDA0003011723880000111
其中,M为检测均值,k为比例系数,即历史设计文件相对于当前PPT设计文件的放大或缩小的比例值;
设置可调节允许范围阈值为Mi;对于每一份历史设计文件与当前PPT设计文件所得出的M值,若大于Mi进行舍弃处理;若小于Mi,选取成为输出结果。
在步骤S3中,得出范围L的最佳配色的步骤如下:
S8-1、利用RGB颜色空间,将颜色切割成H*H*H个色块;
S8-2、提取步骤S7-3的输出结果中的文件,选择相对应的区域Li,提取区域Li的每个像素点,将其分配到相应色块中;
S8-3、对同一色块的像素点,计算平均颜色,作为该色块的最终取色;
S8-4、选取像素点最多的色块作为主色块,主色块的最终取色为范围L的最佳配色。
在步骤S3中,进行第一重筛选的步骤如下:
S9-1、提取图片下载单元内的图片的像素点,分配到相应色块,选取像素点最多的色块作为主色块,主色块的最终取色为图片的最终取色;
S9-2、进行第一重筛选,根据公式:
D=sqrt((r2-r1)2+(g2-g1)2+(b2-b1)2);
其中,D为颜色间的距离,r1、g1、b1代表S8-4中范围L的最佳配色的三个分量;r2、g2、b2代表图片下载单元内的图片的最终取色的三个分量;
S9-3、在图片下载单元内的图片的最终取色与范围L的最佳配色之间的颜色距离D不超出阈值Dmax时,可选取作为输出。
在步骤S4中,视觉评价方法的建立及筛选步骤如下:
S10-1、建立视觉知识学习单元,采集历史设计文件中的美学评价特征、自身价值特征、用户偏好信息;所述美学评价特征包括主题风格、布局排版、历史评价;所述自身价值特征包括尺寸、清晰度、边缘适配性;所述用户偏好信息包括用户下载量、用户好评度、用户行业信息;
S10-2、利用深度学习的机制,将美学评价特征、自身价值特征、用户偏好信息转换为计算机可识别语义信息,计算评分,评分值越高,排名越靠前;
S10-3、所述美学评价特征评分方式为抽取当前PPT设计文件中可以作为中心词的单词,所述中心词即为出现次数最多的单词;根据图片下载单元提供的图片说明信息,与中心词相关联词语出现次数越多,位置越靠前,则得分越高;
S10-4、所述自身价值特征评分方式为对图片下载单元中的图片的边缘区域进行边缘色彩提取,越靠近最佳配色的,则得分越高;
S10-5、所述用户偏好信息评分方式为根据图片下载单元提供的图片评价信息,用户好评度越高,位置越靠前,则评分越高;
S10-6、根据公式:
S=(w1S1+w2S2+w3S3)*h;
其中,w1、w2、w3分别为美学评价特征、自身价值特征、用户偏好信息的评价得分权重;S1、S2、S3分别为美学评价特征、自身价值特征、用户偏好信息的得分情况;S为最终得分;h为评价误差函数;
设置阈值Smin,将图片下载单元中得分小于阈值Smin的图片从下载列表删除。
在本实施例中,设置有人员J进行PPT文件设计,其想插入一张图片在页面左上方空闲位置;图片下载单元中共计有1000张图片;
首先对左上方进行范围圈定,圈出了区域范围L,并将其他无关区域进行拆分,共分解成128块区域,对每个区域色彩及中心点进行采集,得到距离集合A={x1,x2,……,x128};
提取历史设计文件,根据当前设计文件的无关区域的色彩进行圈定其他区域,以所述插入图片的范围L的对应区域Li的中心为坐标原点,选取其他区域内的中心点,计算得出距离集合B={y1,y2,……,y128};
根据公式:
Figure BDA0003011723880000131
其中,k=1;
设置可调节允许范围阈值为Mi;对历史设计文件得出的所有小于Mi的M进行选择输出;
利用RGB颜色空间,将颜色切割成3*3*3个色块;
提取上述输出的文件,选择相对应的区域Li,提取区域Li的每个像素点,将其分配到相应色块中;
对同一色块的像素点,计算平均颜色,选取像素点最多的色块作为主色块,主色块的最终取色为范围L的最佳配色;
提取图片下载单元内的图片的像素点,分配到相应色块,选取像素点最多的色块作为主色块,主色块的最终取色为图片的最终取色;
对图片下载单元进行第一重筛选,根据公式:
D=sqrt((r2-r1)2+(g2-g1)2+(b2-b1)2);
其中,D为颜色间的距离,r1、g1、b1代表S8-4中范围L的最佳配色的三个分量;r2、g2、b2代表图片下载单元内的图片的最终取色的三个分量;
在图片下载单元内的图片的最终取色与范围L的最佳配色之间的颜色距离D不超出阈值Dmax时,可选取作为输出,输出后图片下载单元还剩余520张图片;
抽取当前PPT设计文件中可以作为中心词的单词,其中“森林公园”出现次数最多,因此作为中心词,根据图片下载单元提供的图片说明信息,与中心词相关联词语出现次数越多,位置越靠前,则得分越高;对剩余520张图片进行分值计算;
对图片下载单元中的图片的边缘区域进行边缘色彩提取,越靠近最佳配色的,则得分越高;对剩余520张图片进行分值计算;
根据图片下载单元提供的图片评价信息,用户好评度越高,位置越靠前,则评分越高;对剩余520张图片进行分值计算;.
根据公式:
S=(w1S1+w2S2+w3S3)*h;
计算得出剩余520张图片的分数,设置阈值Smin,将图片下载单元中得分小于阈值Smin的图片从下载列表删除,剩余的进行排序;
其中共计删除了420张,对最后100张按照分数从高到低进行下载排序。
本发明的工作原理:本发明利用素材库进行存储和调用历史数据,作为后续数据处理的基础;利用距离抓取模块确定当前设计文件插入图片的范围所需的最佳配色情况和距离情况;利用智能选择模块挑选出图片下载列表中满足最佳配色的图片;利用视觉评价模块根据相应的评价标准评价得出下载列表中图片的优先级,从而避免下载量冗杂;利用下载管理模块对下载列表的图片进行管理,进行增删和排序;利用输出反馈模块对最终结果进行输出和反馈。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (1)

1.一种基于大数据的下载管理系统,其特征在于:该系统包括素材库、距离抓取模块、智能选择模块、视觉评价模块、下载管理模块、输出反馈模块;
所述素材库用于存储和调用历史数据;所述距离抓取模块用于确定当前设计文件插入图片的范围所需的最佳配色情况;所述智能选择模块用于挑选出下载列表中满足最佳配色的图片;所述视觉评价模块用于根据相应的评价标准评价得出下载列表中图片的优先级;所述下载管理模块用于对下载列表的图片进行管理;所述输出反馈模块用于对最终结果进行输出和反馈;
所述素材库的输出端与距离抓取模块、智能选择模块、视觉评价模块的输入端相连接;所述距离抓取模块的输出端与智能选择模块的输入端相连接;所述智能选择模块的输出端与视觉评价模块的输入端相连接;所述视觉评价模块的输出端与下载管理模块的输入端相连接;所述下载管理模块的输出端与输出反馈模块的输出端相连接;
所述距离抓取模块包括如下单元:
区域圈定单元,用于对当前设计的PPT文件需要插入的图片区域进行圈定,并将无关区域进行按照指令划分;所述无关区域为除去圈定区域外的其他区域;
距离测算单元,用于测量圈定区域中心点和无关区域中心点之间的距离情况;
处理单元,用于对历史设计文件根据区域圈定单元进行等比例圈定处理,根据距离测算单元进行相同测算;
所述区域圈定单元、距离测算单元的输出端与处理单元的输入端相连接;所述处理单元的输出端与智能选择模块输入端相连接;
所述智能选择模块包括如下单元:
距离检测单元,用于检测历史设计文件与当前PPT设计文件之间是否超出了距离阈值;
色彩选择单元,用于挑选出符合距离阈值的历史设计文件中区域范围内的最佳配色;
图片下载单元,用于为当前设计文件提供图片数据支持;
图片取色单元,用于对图片下载单元中的图片进行最终取色,选取得到满足最佳配色的图片;
所述距离检测单元的输出端与色彩选择单元的输入端相连接;所述图片下载单元的输出端与图片取色单元的输入端相连接;所述色彩选择单元的输出端与图片取色单元的输入端相连接;所述图片取色单元的输出端与视觉评价模块的输入端相连接;
所述视觉评价模块包括如下单元:
视觉知识学习单元,用于根据历史数据采集视觉知识,从而对计算机进行训练学习;
特征评价单元,用于根据各项特征进行评价,决定图片的下载优先级,并输出结果到下载管理模块;
所述视觉知识学习单元的输出端与所述特征评价单元的输入端相连接;所述特征评价单元的输出端与下载管理模块的输入端相连接;
所述下载管理模块包括如下单元:
下载单元,用于进行图片的自动下载;
管理单元,用于根据智能选择模块与视觉评价模块的输出结果对下载单元中的图片进行增删、排序操作;
所述管理单元的输出端与下载单元的输入端相连接;所述下载单元的输出端与输出反馈模块的输入端相连接;
包括如下步骤:
S1、抓取当前PPT设计文件页面的色彩情况,圈定出插入图片的范围,记为L;
S2、将当前PPT设计文件与历史设计文件进行等比例区域划分,利用相似度比对,选取出满足条件的历史设计文件;
S3、对步骤S2中得出的满足阈值的历史设计文件进行色彩范围抓取,根据HSB值进行色彩范围分类,得出范围L的最佳配色情况,对图片下载单元内的图片进行第一重筛选,选取出满足条件的图片;
S4、建立视觉评价方法,对步骤S3中的图片进行第二重筛选,将选取出的图片送入下载管理单元进行下载管理;
在步骤S2中,选取出满足阈值的历史设计文件的步骤如下:
S7-1、选取当前PPT设计文件的插入图片的范围的中心点作为坐标原点,建立平面直角坐标系,在除去范围L内的页面其他范围上建立N个无关区域,选取N个无关中心点,计算其到达坐标原点的距离;
S7-2、在步骤S7-1中,可得出一个距离集合,记为A={x1,x2,……,xn},对历史设计文件按照当前设计文件进行等比例区域划分,得出L的对应区域,并根据当前设计文件的无关区域的色彩进行圈定其他区域,以所述插入图片的范围L的对应区域
Figure 872494DEST_PATH_IMAGE002
的中心为坐标原点,选取其他区域内的N个中心点,计算得出距离集合B={y1,y2,……,yn};
S7-3、根据公式:
Figure 320793DEST_PATH_IMAGE004
其中,
Figure 631688DEST_PATH_IMAGE006
为检测均值,
Figure 558056DEST_PATH_IMAGE008
为比例系数,即历史设计文件相对于当前PPT设计文件的放大或缩小的比例值,n为无关区域的数量;
设置可调节允许范围阈值为
Figure 152854DEST_PATH_IMAGE010
;对于每一份历史设计文件与当前PPT设计文件所得出的
Figure 240896DEST_PATH_IMAGE006
值,若大于
Figure 39088DEST_PATH_IMAGE010
进行舍弃处理;若小于
Figure 769146DEST_PATH_IMAGE010
,选取成为输出结果;
在步骤S3中,得出范围L的最佳配色的步骤如下:
S8-1、利用RGB颜色空间,将颜色切割成H*H*H个色块;
S8-2、提取步骤S7-3的输出结果中的文件,选择相对应的区域
Figure 703604DEST_PATH_IMAGE002
,提取区域
Figure DEST_PATH_IMAGE011
的每个像素点,将其分配到相应色块中;
S8-3、对同一色块的像素点,计算平均颜色,作为该色块的最终取色;
S8-4、选取像素点最多的色块作为主色块,主色块的最终取色为范围L的最佳配色;
在步骤S3中,进行第一重筛选的步骤如下:
S9-1、提取图片下载单元内的图片的像素点,分配到相应色块,选取像素点最多的色块作为主色块,主色块的最终取色为图片的最终取色;
S9-2、进行第一重筛选,根据公式:
Figure DEST_PATH_IMAGE013
其中,D为颜色间的距离,
Figure DEST_PATH_IMAGE015
代表S8-4中范围L的最佳配色的三个分量;
Figure DEST_PATH_IMAGE017
代表图片下载单元内的图片的最终取色的三个分量;
S9-3、在图片下载单元内的图片的最终取色与范围L的最佳配色之间的颜色距离D不超出阈值
Figure DEST_PATH_IMAGE019
时,可选取作为输出;
在步骤S4中,视觉评价方法的建立及筛选步骤如下:
S10-1、建立视觉知识学习单元,采集历史设计文件中的美学评价特征、自身价值特征、用户偏好信息;所述美学评价特征包括主题风格、布局排版、历史评价;所述自身价值特征包括尺寸、清晰度、边缘适配性;所述用户偏好信息包括用户下载量、用户好评度、用户行业信息;
S10-2、利用深度学习的机制,将美学评价特征、自身价值特征、用户偏好信息转换为计算机可识别语义信息,计算评分,评分值越高,排名越靠前;
S10-3、所述美学评价特征评分方式为抽取当前PPT设计文件中可以作为中心词的单词,所述中心词即为出现次数最多的单词;根据图片下载单元提供的图片说明信息,与中心词相关联词语出现次数越多,位置越靠前,则得分越高;
S10-4、所述自身价值特征评分方式为对图片下载单元中的图片的边缘区域进行边缘色彩提取,越靠近最佳配色的,则得分越高;
S10-5、所述用户偏好信息评分方式为根据图片下载单元提供的图片评价信息,用户好评度越高,位置越靠前,则评分越高;
S10-6、根据公式:
Figure DEST_PATH_IMAGE021
其中,
Figure DEST_PATH_IMAGE023
分别为美学评价特征、自身价值特征、用户偏好信息的评价得分权重;
Figure DEST_PATH_IMAGE025
分别为美学评价特征、自身价值特征、用户偏好信息的得分情况;
Figure DEST_PATH_IMAGE027
为最终得分;
Figure DEST_PATH_IMAGE029
为评价误差函数;
设置阈值
Figure DEST_PATH_IMAGE031
,将图片下载单元中得分小于阈值
Figure 231056DEST_PATH_IMAGE031
的图片从下载列表删除。
CN202110378279.7A 2021-04-08 2021-04-08 一种基于大数据的下载管理系统及方法 Active CN113032606B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202110378279.7A CN113032606B (zh) 2021-04-08 2021-04-08 一种基于大数据的下载管理系统及方法
CN202210273546.9A CN114722227A (zh) 2021-04-08 2021-04-08 一种基于大数据的下载管理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110378279.7A CN113032606B (zh) 2021-04-08 2021-04-08 一种基于大数据的下载管理系统及方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202210273546.9A Division CN114722227A (zh) 2021-04-08 2021-04-08 一种基于大数据的下载管理系统

Publications (2)

Publication Number Publication Date
CN113032606A CN113032606A (zh) 2021-06-25
CN113032606B true CN113032606B (zh) 2022-05-10

Family

ID=76454276

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202110378279.7A Active CN113032606B (zh) 2021-04-08 2021-04-08 一种基于大数据的下载管理系统及方法
CN202210273546.9A Pending CN114722227A (zh) 2021-04-08 2021-04-08 一种基于大数据的下载管理系统

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202210273546.9A Pending CN114722227A (zh) 2021-04-08 2021-04-08 一种基于大数据的下载管理系统

Country Status (1)

Country Link
CN (2) CN113032606B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103218619A (zh) * 2013-03-15 2013-07-24 华南理工大学 一种图像美学评价方法
CN104636046A (zh) * 2015-03-10 2015-05-20 上海斐讯数据通信技术有限公司 一种改变移动终端主题的系统及其方法
CN108052765A (zh) * 2017-12-26 2018-05-18 四川大学 基于人格印象的配色方案自动生成方法及装置
CN110889883A (zh) * 2019-11-29 2020-03-17 焦点科技股份有限公司 一种自适应的智能横幅广告图片生成方法及系统
CN110910470A (zh) * 2019-11-11 2020-03-24 广联达科技股份有限公司 一种生成高质量缩略图的方法和装置
CN112101370A (zh) * 2020-11-11 2020-12-18 广州卓腾科技有限公司 一种纯色背景图像自动抠像算法、计算机可读存储介质及设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2002336504A1 (en) * 2001-09-12 2003-03-24 The State Of Oregon, Acting By And Through The State Board Of Higher Education On Behalf Of Oregon S Method and system for classifying a scenario
US10134154B2 (en) * 2016-12-30 2018-11-20 Google Llc Selective dynamic color management for user interface components of a media player
CN108550002B (zh) * 2018-01-17 2021-06-08 桂林电子科技大学 一种银行贵金属智能盘库系统及方法
CN110473164B (zh) * 2019-05-31 2021-10-15 北京理工大学 一种基于注意力机制的图像美学质量评价方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103218619A (zh) * 2013-03-15 2013-07-24 华南理工大学 一种图像美学评价方法
CN104636046A (zh) * 2015-03-10 2015-05-20 上海斐讯数据通信技术有限公司 一种改变移动终端主题的系统及其方法
CN108052765A (zh) * 2017-12-26 2018-05-18 四川大学 基于人格印象的配色方案自动生成方法及装置
CN110910470A (zh) * 2019-11-11 2020-03-24 广联达科技股份有限公司 一种生成高质量缩略图的方法和装置
CN110889883A (zh) * 2019-11-29 2020-03-17 焦点科技股份有限公司 一种自适应的智能横幅广告图片生成方法及系统
CN112101370A (zh) * 2020-11-11 2020-12-18 广州卓腾科技有限公司 一种纯色背景图像自动抠像算法、计算机可读存储介质及设备

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A method for color content matching of images;A. Mojsilovic等;《2000 IEEE International Conference on Multimedia and Expo. ICME2000. Proceedings. Latest Advances in the Fast Changing World of Multimedia (Cat. No.00TH8532)》;20020806;1-4 *
基于两轴分析法的标志设计中文化符号构建研究;孙华锋等;《包装工程》;20201120;第41卷(第22期);258-263 *
基于神经网络的高光谱遥感;于君娜;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20071015(第4期);I140-394 *
视觉体验导向下的网页界面设计研究;谢涛;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20130515(第5期);I139-123 *

Also Published As

Publication number Publication date
CN113032606A (zh) 2021-06-25
CN114722227A (zh) 2022-07-08

Similar Documents

Publication Publication Date Title
US6460049B1 (en) Method system and computer program product for visualizing an evidence classifier
US20080162469A1 (en) Content register device, content register method and content register program
Hsiao A systematic method for color planning in product design
CN108447064B (zh) 一种图片处理方法及装置
CN108647729B (zh) 一种用户画像获取方法
CN113537496A (zh) 一种深度学习模型可视化构建系统及其应用和设计方法
CN112396428B (zh) 一种基于用户画像数据的客群分类管理方法及装置
CN113836338B (zh) 细粒度图像分类方法、装置、存储介质及终端
Carballal et al. Distinguishing paintings from photographs by complexity estimates
CN110737805A (zh) 图模型数据的处理方法、装置和终端设备
CN110781633A (zh) 基于深度学习模型的图文设计质量检测方法、装置及系统
CN114863125A (zh) 一种书法/美术作品智能评分方法及系统
CN107506362A (zh) 基于用户群优化的图像分类仿脑存储方法
CN110097603B (zh) 一种时尚图像主色调解析方法
CN113032606B (zh) 一种基于大数据的下载管理系统及方法
CN112767038A (zh) 基于美学特征的海报ctr预测方法及装置
CN115393351B (zh) 一种基于朗格汉斯细胞判断角膜免疫状态的方法及装置
CN110618980A (zh) 基于法律文本精确匹配和矛盾检测的系统及方法
CN113641918B (zh) 一种基于大数据的区域空气环境质量监测系统及方法
CN115239947A (zh) 基于无监督学习的小麦条锈病严重度评估方法及装置
CN114969467A (zh) 数据分析分类方法、装置、计算机设备及存储介质
CN117648635B (zh) 敏感信息分类分级方法及系统、电子设备
CN116863099B (zh) 一种基于点云数据的建筑物自动化建模方法及系统
CN112950556B (zh) 图像真实度评估方法、装置、系统及计算机可读存储介质
Hrabovskyi et al. IMPROVING THE TECHNOLOGY FOR CONSTRUCTING A SOFTWARE TOOL TO DETERMINE THE SIMILARITY OF RASTER GRAPHIC IMAGES.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220415

Address after: 519000 room 105-15178, No.6 Baohua Road, Hengqin New District, Zhuhai City, Guangdong Province

Applicant after: Guangdong Yuefei Finance Cloud Technology Co.,Ltd.

Address before: 221000 No.59 Mingzheng Road, Yunlong District, Xuzhou City, Jiangsu Province

Applicant before: Chu Yaya

GR01 Patent grant
GR01 Patent grant