CN106776972A - 一种云计算网络中的虚拟化资源整合平台 - Google Patents

一种云计算网络中的虚拟化资源整合平台 Download PDF

Info

Publication number
CN106776972A
CN106776972A CN201611105575.5A CN201611105575A CN106776972A CN 106776972 A CN106776972 A CN 106776972A CN 201611105575 A CN201611105575 A CN 201611105575A CN 106776972 A CN106776972 A CN 106776972A
Authority
CN
China
Prior art keywords
cloud computing
data
component
integration platform
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611105575.5A
Other languages
English (en)
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Magic Joint Technology Co Ltd
Original Assignee
Shenzhen Magic Joint Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Magic Joint Technology Co Ltd filed Critical Shenzhen Magic Joint Technology Co Ltd
Priority to CN201611105575.5A priority Critical patent/CN106776972A/zh
Publication of CN106776972A publication Critical patent/CN106776972A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种云计算网络中的虚拟化资源整合平台,包括云计算资源组件、云计算管理组件和云计算应用组件,所述云计算应用组件包括数据采集模块、数据分类模块、分类检测模块和检测融合模块,所述云计算资源组件与所述云计算应用组件之间通过存储区域网通信连接,所述云计算资源组件与所述云计算管理组件通过以太网通信连接。本发明的有益效果为:利用了现有设备,大大降低了云计算网络的搭建成本。

Description

一种云计算网络中的虚拟化资源整合平台
技术领域
本发明涉及云计算领域,具体涉及一种云计算网络中的虚拟化资源整合平台。
背景技术
云计算网络对计算资源的性能要求较高,但是,如果计算资源配置过高容易造成资源的浪费,而是用过低的计算资源又会导致云计算网络堵塞,同时,常规的云计算网络平台延展性和可扩充性也较差,导致搭建成本过高。
发明内容
针对上述问题,本发明旨在提供一种云计算网络中的虚拟化资源整合平台。
本发明的目的采用以下技术方案来实现:
提供了一种云计算网络中的虚拟化资源整合平台,包括云计算资源组件、云计算管理组件和云计算应用组件,所述云计算应用组件包括数据采集模块、数据分类模块、分类检测模块和检测融合模块,所述云计算资源组件与所述云计算应用组件之间通过存储区域网通信连接,所述云计算资源组件与所述云计算管理组件通过以太网通信连接。
本发明的有益效果为:利用了现有设备,大大降低了云计算网络的搭建成本。
附图说明
利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1是本发明的结构连接示意图。
附图标记:
云计算资源组件1、云计算管理组件2、云计算应用组件3。
具体实施方式
结合以下实施例对本发明作进一步描述。
参见图1,本实施例的一种云计算网络中的虚拟化资源整合平台,包括云计算资源组件1、云计算管理组件2和云计算应用组件3,所述云计算应用组件3包括数据采集模块、数据分类模块、分类检测模块、检测融合模块,所述数据采集模块用于采集需要进行检测的数据;所述数据分类模块用于将由数据采集模块输出的数据划分为图像数据和文本数据,并对分类后的数据进行过滤处理;所述分类检测模块用于对分类后的数据进行分析检测;所述检测融合模块用于根据检测需求筛选所需的图像数据和文本数据,所述云计算资源组件1与所述云计算应用组件3之间通过存储区域网通信连接,所述云计算资源组件1与所述云计算管理组件2通过以太网通信连接。
优选地,所述云计算资源组件1包括服务器节点设备和云存储设备。
本优选实施例实现了数据存储。
优选地,所述云存储设备为SAN磁盘阵列存储设备。
本优选实施例存储数据速度快。
优选的,所述采集需要进行检测的数据,包括:
采集一定时间段内需要进行检测的数据,按设定的过滤规则对该数据进行初步过滤处理,所述设定的过滤规则包括删除包含特殊字符、推广相关的特殊汉字和网页链接的内容的数据;设所述一定时间段的时间范围为[UB,UE],将[UB,UE]按照时间顺序平均分为n个子时间段,对每个子时间段内的数据进行重要度评估,评估公式定义为:
公式中,Ri为第i个子时间段的重要程度,RTi为设定的第i个子时间段的重要程度值,Yi为第i个子时间段的数据的数量,Y为在[UB,UE]内的数据的数量;将各重要度按照由小到大进行排序,按照重要度的排列顺序,将数据依次发送至数据分类模块。
本优选实施例通过设定过滤规则,将不需要进行检测的数据进行删除,减少了检测后续处理的数据量;通过对各子时间段的数据进行重要度评估,并按照重要度的排列顺序,将数据依次发送至数据分类模块,使后续的模块能够预先处理重要程度高的数据,提高了检测的速度。
优选的,所述对分类后的数据进行过滤处理,包括:提取文本数据,对该文本数据进行聚类处理,形成多个类别的文本数据集;计算每个类别的文本数据集中的数据的数量,按照数量由少到大的顺序对多个文本数据集进行排序;删除前21%的文本数据集,将剩余的文本数据集以及图像数据发送至分类检测模块。
本优选实施例进一步对文本数据进行聚类处理,过滤掉数量较少的文本数据集,减少了后续检测的数据量,从而进一步提高了检测的速度。
优选的,所述对该文本数据进行聚类处理,包括:
Step1:确定聚簇的个数K,包括:对该文本数据采用等距法设定k-means聚类算法的初始中心,得到聚类中心;在得到聚类中心后将相邻的聚类中心的中点作为分类的划分点,将各个对象加入到距离最近的类中,从而确定聚簇的个数K;将该文本数据划分为n个样本,对n个样本进行向量化,通过夹角余弦函数计算所有样本两两之间的相似度,得到相似度矩阵SIM:SIM=[sim(bi,bj)]n×n,i,j=1,…,n;Step2:计算每一个样本与其它所有样本的相似度之和,求和公式为:
公式中,为样本bi与其它所有样本的相似度之和,sim(bi,bj)表示样本bi,bj间的相似度,i,j=1,…,n;Step3:按降序排列i=1,…,n,设按从大到小排列的前4个值对应的样本为bmax,bmax-1,bmax-2,bmax-3,根据下列公式确定第一个初始的聚簇中心MI:
公式中,ωmax-μ表示bmax-μ的重要度权值;Step4:对中的最大值对应的矩阵中行向量的元素进行升序排列,假设前k-1个最小的元素为SIMpq,q=1,…,k-1,选择前k-1个最小的元素SIMpq相对应的样本作为剩余的k-1个初始的聚簇中心;Step5:计算剩余样本与各初始的聚簇中心之间的相似度,将剩余样本分发到相似度最高的聚簇中,形成变化后的k个聚簇;Step6:计算变化后的聚簇中各样本的均值,将其作为更新后的聚簇中心代替更新前的聚簇中心;若更新前的聚簇中心与更新后的聚簇中心相同,或者目标函数达到了最小值,停止更新,所述目标函数为:
公式中,Cl表示k个聚簇中的第l个聚簇,bx为第l个聚簇中的样本,为第l个聚簇的中心。
本优选实施例有效避免单一采取随机抽样方法所带来的偶然性,解决对该文本数据进行聚类处理时在选取k值以及初始化聚类中心时所存在的问题,提高了聚类稳定性,进一步提高了对文本数据进行过滤处理的精度。
优选的,所述分类检测模块包括图像数据检测单元和文本数据检测单元;所述图像数据检测单元基于语义特征对图像数据进行检测,具体为:采用小波变换的方法对图像进行分割,对区域低层特征进行提取,构造特征矩阵,再应用非负矩阵分解训练算法构造语义空间,将图像投影到该空间以获取图像语义特征;所述文本数据检测单元包括文本数据建模子单元、文本数据分类子单元、检测子单元,具体为:
(1)文本数据建模子单元,用于使用构成文档的词项来表达文档的语义,其将n篇文档t1,t2,…,tn的每篇文档表示成m维特征向量v1,v2,…,vm,构成n×m的文档-特征矩阵:
公式中,m为构成文档的词项的数量;
公式中,e(ti,vj)表示词项vj在文档ti中所占权重,f(ti,vj)表示词项vj在文档ti中出现的次数,f(vj)表示词项vj在所有文档中出现的次数总和;
(2)文本数据分类子单元,用于对建模后的文本文档进行分类,具体包括:
步骤1、将文本集中的文档随机映射到一个二维平面网格空间,每个网格中只能投影一篇文档,同时,在二维平面上放置一定数量的蚂蚁;步骤2、每只蚂蚁随机在二维网格空间移动,选择一个文档捡起,并携带它在二维网格空间随机移动,每移动一次,蚂蚁计算它所携带文档或者所在网格中的文档与周围环境的群体相似度,决定是否捡起或者放下该文档,将每个网格作为二维网格空间离散值,设蚂蚁所在位置为p,它所在环境的群体相似度定义为:
公式中,ti∈p(a×a)表示文档ti在位置p的边长a×a的邻域,r(ti,tj)表示两篇文档之间的文本距离,σ表示相似度因子,σ的取值范围是[1,2],
公式中,m表示文档中词项数量;步骤3、捡起和放下,如果蚂蚁没有携带任何文档移动,那么它将捡起与周围环境群体相似度较低的文档;如果蚂蚁正在携带一篇文档移动,那么当蚂蚁处于空网格,并且这篇文档与周围环境的群体相似度较高时,它将放下这篇文档,捡起概率Pj(ti)和放下概率Pf(ti)定义为:
公式中,T1和T2为常数阈值,T1=0.14,T2=0.16;步骤4、重复步骤2和步骤3,经过一段时间,相似性高的文档将被聚集在同一区域。
本优选实施例对数据进行分类检测,能够充分利用不同类型数据特点,采用对应的方法进行检测,提高了检测的针对性;对文档进行建模,将非结构化的文本数据转换成可计算的结构化数据,同时便于后续对文档进行分类;文本数据分类子单元提高了检测效率,节约了检测时间。
本发明与传统资源整合平台的数据检测结果如下表所示:
数据检测速度 数据检侧准确率
本发明 0.18s 97%
传统资源整合平台 0.24s 92%
最后应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细地说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。

Claims (4)

1.一种云计算网络中的虚拟化资源整合平台,其特征是,包括云计算资源组件、云计算管理组件和云计算应用组件,所述云计算应用组件包括数据采集模块、数据分类模块、分类检测模块和检测融合模块,所述云计算资源组件与所述云计算应用组件之间通过存储区域网通信连接,所述云计算资源组件与所述云计算管理组件通过以太网通信连接。
2.根据权利要求1所述的一种云计算网络中的虚拟化资源整合平台,其特征是,所述云计算资源组件包括服务器节点设备和云存储设备。
3.根据权利要求2所述的一种云计算网络中的虚拟化资源整合平台,其特征是,所述云存储设备为SAN磁盘阵列存储设备。
4.根据权利要求3所述的一种云计算网络中的虚拟化资源整合平台,其特征是,所述采集需要进行检测的数据,包括:
采集一定时间段内需要进行检测的数据,按设定的过滤规则对该数据进行初步过滤处理,所述设定的过滤规则包括删除包含特殊字符、推广相关的特殊汉字和网页链接的内容的数据;设所述一定时间段的时间范围为[UB,UE],将[UB,UE]按照时间顺序平均分为n个子时间段,对每个子时间段内的数据进行重要度评估,评估公式定义为:
R i = R T i + Y i Y × 100 % , 1 ≤ i ≤ n
公式中,Ri为第i个子时间段的重要程度,RTi为设定的第i个子时间段的重要程度值,Yi为第i个子时间段的数据的数量,Y为在[UB,UE]内的数据的数量;将各重要度按照由小到大进行排序,按照重要度的排列顺序,将数据依次发送至数据分类模块。
CN201611105575.5A 2016-12-05 2016-12-05 一种云计算网络中的虚拟化资源整合平台 Pending CN106776972A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611105575.5A CN106776972A (zh) 2016-12-05 2016-12-05 一种云计算网络中的虚拟化资源整合平台

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611105575.5A CN106776972A (zh) 2016-12-05 2016-12-05 一种云计算网络中的虚拟化资源整合平台

Publications (1)

Publication Number Publication Date
CN106776972A true CN106776972A (zh) 2017-05-31

Family

ID=58874230

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611105575.5A Pending CN106776972A (zh) 2016-12-05 2016-12-05 一种云计算网络中的虚拟化资源整合平台

Country Status (1)

Country Link
CN (1) CN106776972A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102880873A (zh) * 2012-08-31 2013-01-16 公安部第三研究所 基于图像分割和语义提取实现人员行为识别的系统及方法
CN103473255A (zh) * 2013-06-06 2013-12-25 中国科学院深圳先进技术研究院 一种数据聚类方法、系统及数据处理设备
CN104391835A (zh) * 2014-09-30 2015-03-04 中南大学 文本中特征词选择方法及装置
CN104715024A (zh) * 2015-03-03 2015-06-17 湖北光谷天下传媒股份有限公司 一种多媒体热点分析方法
CN204650507U (zh) * 2015-04-23 2015-09-16 江苏集瑞信息科技有限公司 一种云计算网络中的虚拟化资源整合平台

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102880873A (zh) * 2012-08-31 2013-01-16 公安部第三研究所 基于图像分割和语义提取实现人员行为识别的系统及方法
CN103473255A (zh) * 2013-06-06 2013-12-25 中国科学院深圳先进技术研究院 一种数据聚类方法、系统及数据处理设备
CN104391835A (zh) * 2014-09-30 2015-03-04 中南大学 文本中特征词选择方法及装置
CN104715024A (zh) * 2015-03-03 2015-06-17 湖北光谷天下传媒股份有限公司 一种多媒体热点分析方法
CN204650507U (zh) * 2015-04-23 2015-09-16 江苏集瑞信息科技有限公司 一种云计算网络中的虚拟化资源整合平台

Similar Documents

Publication Publication Date Title
CN109033387B (zh) 一种融合多源数据的物联网搜索系统、方法及存储介质
US10235568B2 (en) Indoor semantic map updating method and system based on semantic information extraction
US8340405B2 (en) Systems and methods for scalable media categorization
CN105956015A (zh) 一种基于大数据的服务平台整合方法
CN109543067A (zh) 基于人工智能的企业生产状况实时监控分析系统
CN106506528A (zh) 一种大数据环境下的网络安全分析系统
CN105095223A (zh) 文本分类方法及服务器
CN102141978A (zh) 一种文本分类的方法及系统
CN103279505B (zh) 一种基于语义的海量数据处理方法
CN106528870B (zh) 一种大数据智能分析系统
CN110297990A (zh) 众包营销微博与水军的联合检测方法及系统
CN109241392A (zh) 目标词的识别方法、装置、系统及存储介质
CN111538859B (zh) 一种动态更新视频标签的方法、装置及电子设备
CN102567405A (zh) 一种基于改进的文本空间向量表示的热点发现方法
CN115456093A (zh) 一种基于注意力图神经网络的高性能图聚类方法
CN112486676B (zh) 一种基于边缘计算的数据共享分发装置
CN106776972A (zh) 一种云计算网络中的虚拟化资源整合平台
WO2023056802A1 (zh) 一种最大化互信息的图像分类方法、设备、介质及系统
CN106780065A (zh) 一种社交网络资源分享系统
CN115034839A (zh) 办公区域状态的检测方法、装置和存储介质及电子设备
CN114049522A (zh) 一种基于深度学习的垃圾分类系统
CN113011968B (zh) 账号状态的检测方法、装置和存储介质及电子设备
CN106777937A (zh) 一种智能医疗综合检测系统
CN108921835A (zh) 基于机器视觉的作物防治方法及相关装置和存储介质
CN106528869A (zh) 一种话题检测装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170531

RJ01 Rejection of invention patent application after publication