CN106203165A - 基于可信云计算的信息大数据分析支撑方法 - Google Patents

基于可信云计算的信息大数据分析支撑方法 Download PDF

Info

Publication number
CN106203165A
CN106203165A CN201610525169.8A CN201610525169A CN106203165A CN 106203165 A CN106203165 A CN 106203165A CN 201610525169 A CN201610525169 A CN 201610525169A CN 106203165 A CN106203165 A CN 106203165A
Authority
CN
China
Prior art keywords
image
feature
credible
attribute
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610525169.8A
Other languages
English (en)
Other versions
CN106203165B (zh
Inventor
陈祖斌
谢铭
胡继军
翁小云
袁勇
邓戈锋
莫英红
谢菁
张鹏
唐玲丽
黄连月
杭聪
贺冠博
苏宇琦
宋骏豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Isomorphism Mdt Infotech Ltd
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201610525169.8A priority Critical patent/CN106203165B/zh
Publication of CN106203165A publication Critical patent/CN106203165A/zh
Application granted granted Critical
Publication of CN106203165B publication Critical patent/CN106203165B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/57Certifying or maintaining trusted computer platforms, e.g. secure boots or power-downs, version controls, system software checks, secure updates or assessing vulnerabilities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明公开了基于可信云计算的信息大数据分析支撑方法,该方法是在具有保护性功能、认证和完整性度量等特征基础上构建一种可信度评估机制和可信关系传递机制,通过关键词和标记的运用,预先将数据库划分为多个子数据库,检索时先在相关度高的子数据库中进行检索,减少了计算量,提高了运算速度;基于单词包表示图像时,提出了加权表示和第一视觉相似度,减少了时间开销;基于特征组合表示图像时,利用了局部特征之间的空间包含关系,提出将相关的局部特征组合在一起以增强其视觉表达能力;该特征组合不但具有良好的尺度和旋转不变性,而且还能够自然地利用各特征元素之间的相对位置信息进行局部几何校验,剔除可能存在的错误匹配,以提高图像检索的准确率;特征量化以及组合表达大幅地提高了检索的精度。

Description

基于可信云计算的信息大数据分析支撑方法
技术领域
本发明涉及大数据领域,具体涉及基于可信云计算的信息大数据分析支撑方法。
背景技术
随着移动互联网、物联网等技术的兴起,全球范围内数据量迅猛增长,大数据时代己经来临。伴随着大数据的产生,其在现代社会和经济活动中发挥着极其重要的作用。
大数据基本都是基于云计算,在这其中,数据的分析以及检索技术,是整个大数据领域的关键支撑技术。大规模数据给传统的多媒体研究,尤其是基于图像的应用和研究带来了新的挑战和机遇。
可信计算是在计算和通信系统中广泛使用基于硬件安全模块支持下的可信计算平台,以提高系统整体的安全性。信息安全具有四个侧面:设备安全、数据安全、内容安全与行为安全。行为安全包括:行为的机密性、行为的完整性、行为的真实性等特征。可信计算为行为安全而生。
发明内容
针对上述问题,本发明提供基于可信云计算的信息大数据分析支撑方法。
本发明的目的采用以下技术方案来实现:
基于可信云计算的信息大数据分析支撑方法,其特征是,包括以下步骤:
(1)由云服务器获取信息数据,将图像信息和非图像信息进行分类后,分别储存到图像数据库和非图像数据库中,并将来源相同的图像信息和非图像信息作标记;
(2)将非图像数据库按照预先设定的多个关键词划分为多个第一子数据库,同时按照所述关键词对非图像信息进行分类,分别储存到对应的所述第一子数据库中,未匹配到关键词的非图像信息单独划分为一类;
(3)将图像数据库按照所述关键词划分为多个第二子数据库,并对图像信息根据与其来源相同的非图像信息进行分类,分别储存到对应所述第二子数据库中,无来源相同标记的图像信息,或者其对应的非图像信息未匹配到关键词的图像信息单独划分为一类;
(4)当用户输入关键词进行检索时,按照输入的关键词与预先设定的关键词的相关度排序依次在各个第一字数据库和第二子数据库中分别进行检索,并分别输出图像数据和非图像数据的检索结果;每个第二子数据库的图像检索中还提供了通过输入查询图像Ip来检索相似图像的功能,该功能由以下步骤实现:
(1-1)采用SIFT特征对图像局部区域进行描述;
(1‐2)基于单词包的图像表示:
a.采用基于单词包模型对局部特征进行量化,设由M个局部特征向量组成的样本空间X={x1,…,xM},以无监督方式快速聚类生成初始视觉码本,采用最近邻策略建立局部特征xj与相对应的视觉单词的映射关系,j=1,…,M;
b.设码本空间中包含N个视觉单词,则任一图像表示为高维稀疏向量{w1,…,wN},wi表示视觉单词i的权值,i=1,…,N;
w i = t i p t i - t i p × 1 f i
式中,表示该图像中视觉单词i出现的次数,ti表示图像数据库中视觉单词i出现的总次数,fi表示图像数据库中包含视觉单词i的图像数目;
对权值wi进行归一化处理,令iδi=1,此时任一图像的高维稀疏向量表示为{δ1,…,δN};
c.对于任意两幅图像p和q,定义两幅图像之间的第一视觉相似度S(p,q):
S ( p , q ) = 1 Σ i = 1 N ( t i p t i - t i p × 1 f i Σ i t i p t i - t i p × 1 f i - t i q t i - t i q × 1 f i Σ i t i q t i - t i q × 1 f i ) 2
S(p,q)越大,表明两幅图像越接近;
(5)对计算结果进行可信评估。
优选地,其特征是,步骤(4)还包括:
(1‐3)基于特征组合的图像表示:
a、将包含一个具有较大尺度的主特征和由这个主特征空间覆盖的若干个具有较小尺度的元素特征的集合定义为特征组合,给定任一图像P,抽取其包含的特征组合集其中,Cl=(Zl,Yl);
式中,Cl表示第l个特征组合,Zl为第l个特征组合的主特征,Yl为第l个特征组合的一组元素特征,Zl和Yl满足0.02×a(P)<a(Zl),a(Yl)<0.2×a(P),且Yl对应的局部空间区域完全被主特征Cl的局部空间覆盖,a(·)表示覆盖空间区域的面积;
b、对于任意两个特征组合Cf(Zf,Yf)和Cg(Zg,Yg),定义两个特征组合的第二视觉相似度R:
当cos(Zf,Zg)>T1时:
R(Cf,Cg)=1{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
当T1≥cos(Zf,Zg)>T2时:
R(Cf,Cg)=0.5{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
当cos(Zf,Zg)≤T2时:
R(Cf,Cg)=0
式中,T1=(0.8,1),T2=(0.5,0.8],cos(·,·)表示两个特征的余弦相似度,Yfi是Yf中的元素,Yfi是Yg中的元素,{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}表示Yf和Yg中匹配的元素特征数;
(1‐4)图像检索:对于给定的查询图像Ip,首先提取其特征组合集,将每个特征的主特征映射到视觉单词,找出包含该视觉单词的数据库图像Iq,计算其与查询图像的相似度距离,通过将相似度距离与设定阈值比较,完成图像检索;
所述的相似度距离采用以下公式计算:
d=S(Ip,Iq)×maxR(Ip,Iq)
其中,S(p,q)表示两幅图像的第一视觉相似度度量,maxR(Ip,Iq)表示对两幅图像的所有特征组合进行第二视觉相似度度量的最大值。
优选地,所述可信评估包含以下步骤:
步骤1:定义用于评估的各项可信属性,可信属性是分类的,可信属性可以向下分解为子属性;
步骤2:对于每项可信属性或子属性,提炼出对它的评价指标,可以用这些评价指标从不同的侧面对可信属性或子属性进行评价;
步骤3:对于每项可信属性或子属性,定义出对它的评价标准,评价标准分为四级:优、良、中、差,评价标准是基于评价指标的,即根据每个评价指标的取值组合来决定可信属性或子属性达到了哪一级评价标准;
步骤4:在开展可信评估活动之前,根据评估重点的不同,形成不同可信评估模板,并基于此模板开展可信评估活动,从而使得可信评估更有针对性,评估的结果更精确。
本发明的有益效果为:通过关键词和标记的运用,预先将数据库划分为多个子数据库,检索时先在相关度高的子数据库中进行检索,减少了计算量,提高了运算速度;基于单词包表示图像时,提出了加权表示和第一视觉相似度,减少了时间开销;基于特征组合表示图像时,利用了局部特征之间的空间包含关系,提出将相关的局部特征组合在一起以增强其视觉表达能力;该特征组合不但具有良好的尺度和旋转不变性,而且还能够自然地利用各特征元素之间的相对位置信息进行局部几何校验,剔除可能存在的错误匹配,以提高图像检索的准确率;特征量化以及组合表达大幅地提高了检索的精度;保护了指定的数据存储区,防止敌手实施特定类型的物理访问;赋予了所有在计算平台上执行的代码以证明它在一个未被篡改环境中运行的能力,从广义的角度,可信计算平台为网络用户提供了一个更为宽广的安全环境,它从安全体系的角度来描述安全问题,确保用户的安全执行环境,突破被动防御打补丁方式。
附图说明
利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1是基于可信云计算的信息大数据分析支撑方法的示意图。
具体实施方式
结合以下实施例对本发明作进一步描述。
实施例1:基于可信云计算的信息大数据分析支撑方法,包括以下步骤:
(1)由云服务器获取信息数据,将图像信息和非图像信息进行分类后,分别储存到图像数据库和非图像数据库中,并将来源相同的图像信息和非图像信息作标记,例如将一张图片和对这张图片的说明信息视为来源相同,并作对应标记。这里所指的来源相同,一般是指在在同一时间接收到的来自同一网络地址的图像信息和非图像信息。
(2)将非图像数据库按照预先设定的多个关键词划分为多个第一子数据库,同时按照所述关键词对非图像信息进行分类,分别储存到对应的所述第一子数据库中,未匹配到关键词的非图像信息单独划分为一类。
(3)将图像数据库按照所述关键词划分为多个第二子数据库,并对图像信息根据与其来源相同的非图像信息进行分类,分别储存到对应所述第二子数据库中,无来源相同标记的图像信息,或者其对应的非图像信息未匹配到关键词的图像信息单独划分为一类。
(4)当用户输入关键词进行检索时,按照输入的关键词与预先设定的关键词的相关度排序依次在各个第一字数据库和第二子数据库中分别进行检索,并分别输出图像数据和非图像数据的检索结果。关键词的相关度计算,可以按照顺序、同字符数量等标准来计算,这类计算方法在现有技术中已经很成熟,在此不再详述。
每个第二子数据库的图像检索中还提供了通过输入查询图像Ip来检索相似图像的功能,该功能由以下步骤实现:
(1-1)采用SIFT特征对图像局部区域进行描述;
(1‐2)基于单词包的图像表示:
a.采用基于单词包模型对局部特征进行量化,设由M个局部特征向量组成的样本空间X={x1,…,xM},以无监督方式快速聚类生成初始视觉码本,采用最近邻策略建立局部特征xj与相对应的视觉单词的映射关系,j=1,…,M;
b.设码本空间中包含N个视觉单词,则任一图像表示为高维稀疏向量{w1,…,wN},wi表示视觉单词i的权值,i=1,…,N;
w i = t i p t i - t i p × 1 f i
式中,表示该图像中视觉单词i出现的次数,ti表示图像数据库中视觉单词i出现的总次数,fi表示图像数据库中包含视觉单词i的图像数目;
对权值wi进行归一化处理,令iδi=1,此时任一图像的高维稀疏向量表示为{δ1,…,δN};
c.对于任意两幅图像p和q,定义两幅图像之间的第一视觉相似度S(p,q):
S ( p , q ) = 1 Σ i = 1 N ( t i p t i - t i p × 1 f i Σ i t i p t i - t i p × 1 f i - t i q t i - t i q × 1 f i Σ i t i q t i - t i q × 1 f i ) 2
S(p,q)越大,表明两幅图像越接近;
(5)对计算结果进行可信评估。
优选地,其特征是,步骤(4)还包括:
(1‐3)基于特征组合的图像表示:
a、将包含一个具有较大尺度的主特征和由这个主特征空间覆盖的若干个具有较小尺度的元素特征的集合定义为特征组合,给定任一图像P,抽取其包含的特征组合集其中,Cl=(Zl,Yl);
式中,Cl表示第l个特征组合,Zl为第l个特征组合的主特征,Yl为第l个特征组合的一组元素特征,Zl和Yl满足0.02×a(P)<a(Zl),a(Yl)<0.2×a(P),且Yl对应的局部空间区域完全被主特征Cl的局部空间覆盖,a(·)表示覆盖空间区域的面积;
b、对于任意两个特征组合Cf(Zf,Yf)和Cg(Zg,Yg),定义两个特征组合的第二视觉相似度R:
当cos(Zf,Zg)>T1时:
R(Cf,Cg)=1{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
当T1≥cos(Zf,Zg)>T2时:
R(Cf,Cg)=0.5{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
当cos(Zf,Zg)≤T2时:
R(Cf,Cg)=0
式中,T1=(0.8,1),T2=(0.5,0.8],cos(·,·)表示两个特征的余弦相似度,Yfi是Yf中的元素,Ygi是Yg中的元素,{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}表示Yf和Yg中匹配的元素特征数;
(1‐4)图像检索:对于给定的查询图像Ip,首先提取其特征组合集,将每个特征的主特征映射到视觉单词,找出包含该视觉单词的数据库图像Iq,计算其与查询图像的相似度距离,通过将相似度距离与设定阈值比较,完成图像检索;
所述的相似度距离采用以下公式计算:
d=S(Ip,Iq)×maxR(Ip,Iq)
其中,S(p,q)表示两幅图像的第一视觉相似度度量,maxR(Ip,Iq)表示对两幅图像的所有特征组合进行第二视觉相似度度量的最大值。
优选地,所述可信评估包含以下步骤:
步骤1:定义用于评估的各项可信属性,可信属性是分类的,可信属性可以向下分解为子属性;
步骤2:对于每项可信属性或子属性,提炼出对它的评价指标,可以用这些评价指标从不同的侧面对可信属性或子属性进行评价;
步骤3:对于每项可信属性或子属性,定义出对它的评价标准,评价标准分为四级:优、良、中、差,评价标准是基于评价指标的,即根据每个评价指标的取值组合来决定可信属性或子属性达到了哪一级评价标准;
步骤4:在开展可信评估活动之前,根据评估重点的不同,形成不同可信评估模板,并基于此模板开展可信评估活动,从而使得可信评估更有针对性,评估的结果更精确。
在本实施例的基于可信云计算的信息大数据分析支撑方法中,通过关键词和标记的运用,预先将数据库划分为多个子数据库,检索时先在相关度高的子数据库中进行检索,减少了计算量,提高了运算速度;基于单词包表示图像时,提出了加权表示和第一视觉相似度,减少了时间开销;基于特征组合表示图像时,利用了局部特征之间的空间包含关系,提出将相关的局部特征组合在一起以增强其视觉表达能力;该特征组合不但具有良好的尺度和旋转不变性,而且还能够自然地利用各特征元素之间的相对位置信息进行局部几何校验,剔除可能存在的错误匹配,以提高图像检索的准确率;特征量化以及组合表达大幅地提高了检索的精度;T1=0.95,T2=0.78,检索精度提高了50%,检索速度提高了1%;保护了指定的数据存储区,防止敌手实施特定类型的物理访问;赋予了所有在计算平台上执行的代码以证明它在一个未被篡改环境中运行的能力,从广义的角度,可信计算平台为网络用户提供了一个更为宽广的安全环境,它从安全体系的角度来描述安全问题,确保用户的安全执行环境,突破被动防御打补丁方式。
实施例2:基于可信云计算的信息大数据分析支撑方法,包括以下步骤:
(1)由云服务器获取信息数据,将图像信息和非图像信息进行分类后,分别储存到图像数据库和非图像数据库中,并将来源相同的图像信息和非图像信息作标记,例如将一张图片和对这张图片的说明信息视为来源相同,并作对应标记。这里所指的来源相同,一般是指在在同一时间接收到的来自同一网络地址的图像信息和非图像信息。
(2)将非图像数据库按照预先设定的多个关键词划分为多个第一子数据库,同时按照所述关键词对非图像信息进行分类,分别储存到对应的所述第一子数据库中,未匹配到关键词的非图像信息单独划分为一类。
(3)将图像数据库按照所述关键词划分为多个第二子数据库,并对图像信息根据与其来源相同的非图像信息进行分类,分别储存到对应所述第二子数据库中,无来源相同标记的图像信息,或者其对应的非图像信息未匹配到关键词的图像信息单独划分为一类。
(4)当用户输入关键词进行检索时,按照输入的关键词与预先设定的关键词的相关度排序依次在各个第一字数据库和第二子数据库中分别进行检索,并分别输出图像数据和非图像数据的检索结果。关键词的相关度计算,可以按照顺序、同字符数量等标准来计算,这类计算方法在现有技术中已经很成熟,在此不再详述。
每个第二子数据库的图像检索中还提供了通过输入查询图像Ip来检索相似图像的功能,该功能由以下步骤实现:
(1-1)采用SIFT特征对图像局部区域进行描述;
(1‐2)基于单词包的图像表示:
a.采用基于单词包模型对局部特征进行量化,设由M个局部特征向量组成的样本空间X={x1,…,xM},以无监督方式快速聚类生成初始视觉码本,采用最近邻策略建立局部特征xj与相对应的视觉单词的映射关系,j=1,…,M;
b.设码本空间中包含N个视觉单词,则任一图像表示为高维稀疏向量{w1,…,wN},wi表示视觉单词i的权值,i=1,…,N;
w i = t i p t i - t i p × 1 f i
式中,表示该图像中视觉单词i出现的次数,ti表示图像数据库中视觉单词i出现的总次数,fi表示图像数据库中包含视觉单词i的图像数目;
对权值wi进行归一化处理,令iδi=1,此时任一图像的高维稀疏向量表示为{δ1,…,δN};
c.对于任意两幅图像p和q,定义两幅图像之间的第一视觉相似度S(p,q):
S ( p , q ) = 1 Σ i = 1 N ( t i p t i - t i p × 1 f i Σ i t i p t i - t i p × 1 f i - t i q t i - t i q × 1 f i Σ i t i q t i - t i q × 1 f i ) 2
S(p,q)越大,表明两幅图像越接近;
(5)对计算结果进行可信评估。
优选地,其特征是,步骤(4)还包括:
(1‐3)基于特征组合的图像表示:
a、将包含一个具有较大尺度的主特征和由这个主特征空间覆盖的若干个具有较小尺度的元素特征的集合定义为特征组合,给定任一图像P,抽取其包含的特征组合集其中,Cl=(Zl,Yl);
式中,Cl表示第l个特征组合,Zl为第l个特征组合的主特征,Yl为第l个特征组合的一组元素特征,Zl和Yl满足0.02×a(P)<a(Zl),a(Yl)<0.2×a(P),且Yl对应的局部空间区域完全被主特征Cl的局部空间覆盖,a(·)表示覆盖空间区域的面积;
b、对于任意两个特征组合Cf(Zf,Yf)和Cg(Zg,Yg),定义两个特征组合的第二视觉相似度R:
当cos(Zf,Zg)>T1时:
R(Cf,Cg)=1{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
当T1≥cos(Zf,Zg)>T2时:
R(Cf,Cg)=0.5{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
当cos(Zf,Zg)≤T2时:
R(Cf,Cg)=0
式中,T1=(0.8,1),T2=(0.5,0.8],cos(·,·)表示两个特征的余弦相似度,Yfi是Yf中的元素,Ygi是Yg中的元素,{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}表示Yf和Yg中匹配的元素特征数;
(1‐4)图像检索:对于给定的查询图像Ip,首先提取其特征组合集,将每个特征的主特征映射到视觉单词,找出包含该视觉单词的数据库图像Iq,计算其与查询图像的相似度距离,通过将相似度距离与设定阈值比较,完成图像检索;
所述的相似度距离采用以下公式计算:
d=S(Ip,Iq)×maxR(Ip,Iq)
其中,S(p,q)表示两幅图像的第一视觉相似度度量,maxR(Ip,Iq)表示对两幅图像的所有特征组合进行第二视觉相似度度量的最大值。
优选地,所述可信评估包含以下步骤:
步骤1:定义用于评估的各项可信属性,可信属性是分类的,可信属性可以向下分解为子属性;
步骤2:对于每项可信属性或子属性,提炼出对它的评价指标,可以用这些评价指标从不同的侧面对可信属性或子属性进行评价;
步骤3:对于每项可信属性或子属性,定义出对它的评价标准,评价标准分为四级:优、良、中、差,评价标准是基于评价指标的,即根据每个评价指标的取值组合来决定可信属性或子属性达到了哪一级评价标准;
步骤4:在开展可信评估活动之前,根据评估重点的不同,形成不同可信评估模板,并基于此模板开展可信评估活动,从而使得可信评估更有针对性,评估的结果更精确。
在本实施例的基于可信云计算的信息大数据分析支撑方法中,通过关键词和标记的运用,预先将数据库划分为多个子数据库,检索时先在相关度高的子数据库中进行检索,减少了计算量,提高了运算速度;基于单词包表示图像时,提出了加权表示和第一视觉相似度,减少了时间开销;基于特征组合表示图像时,利用了局部特征之间的空间包含关系,提出将相关的局部特征组合在一起以增强其视觉表达能力;该特征组合不但具有良好的尺度和旋转不变性,而且还能够自然地利用各特征元素之间的相对位置信息进行局部几何校验,剔除可能存在的错误匹配,以提高图像检索的准确率;特征量化以及组合表达大幅地提高了检索的精度;T1=0.95,T2=0.78,检索精度提高了50%,检索速度提高了1%;保护了指定的数据存储区,防止敌手实施特定类型的物理访问;赋予了所有在计算平台上执行的代码以证明它在一个未被篡改环境中运行的能力,从广义的角度,可信计算平台为网络用户提供了一个更为宽广的安全环境,它从安全体系的角度来描述安全问题,确保用户的安全执行环境,突破被动防御打补丁方式。
实施例3:基于可信云计算的信息大数据分析支撑方法,包括以下步骤:
(1)由云服务器获取信息数据,将图像信息和非图像信息进行分类后,分别储存到图像数据库和非图像数据库中,并将来源相同的图像信息和非图像信息作标记,例如将一张图片和对这张图片的说明信息视为来源相同,并作对应标记。这里所指的来源相同,一般是指在在同一时间接收到的来自同一网络地址的图像信息和非图像信息。
(2)将非图像数据库按照预先设定的多个关键词划分为多个第一子数据库,同时按照所述关键词对非图像信息进行分类,分别储存到对应的所述第一子数据库中,未匹配到关键词的非图像信息单独划分为一类。
(3)将图像数据库按照所述关键词划分为多个第二子数据库,并对图像信息根据与其来源相同的非图像信息进行分类,分别储存到对应所述第二子数据库中,无来源相同标记的图像信息,或者其对应的非图像信息未匹配到关键词的图像信息单独划分为一类。
(4)当用户输入关键词进行检索时,按照输入的关键词与预先设定的关键词的相关度排序依次在各个第一字数据库和第二子数据库中分别进行检索,并分别输出图像数据和非图像数据的检索结果。关键词的相关度计算,可以按照顺序、同字符数量等标准来计算,这类计算方法在现有技术中已经很成熟,在此不再详述。
每个第二子数据库的图像检索中还提供了通过输入查询图像Ip来检索相似图像的功能,该功能由以下步骤实现:
(1-1)采用SIFT特征对图像局部区域进行描述;
(1‐2)基于单词包的图像表示:
a.采用基于单词包模型对局部特征进行量化,设由M个局部特征向量组成的样本空间X={x1,…,xM},以无监督方式快速聚类生成初始视觉码本,采用最近邻策略建立局部特征xj与相对应的视觉单词的映射关系,j=1,…,M;
b.设码本空间中包含N个视觉单词,则任一图像表示为高维稀疏向量{w1,…,wN},wi表示视觉单词i的权值,i=1,…,N;
w i = t i p t i - t i p × 1 f i
式中,表示该图像中视觉单词i出现的次数,ti表示图像数据库中视觉单词i出现的总次数,fi表示图像数据库中包含视觉单词i的图像数目;
对权值wi进行归一化处理,令iδi=1,此时任一图像的高维稀疏向量表示为{δ1,…,δN};
c.对于任意两幅图像p和q,定义两幅图像之间的第一视觉相似度S(p,q):
S ( p , q ) = 1 Σ i = 1 N ( t i p t i - t i p × 1 f i Σ i t i p t i - t i p × 1 f i - t i q t i - t i q × 1 f i Σ i t i q t i - t i q × 1 f i ) 2
S(p,q)越大,表明两幅图像越接近;
(5)对计算结果进行可信评估。
优选地,其特征是,步骤(4)还包括:
(1‐3)基于特征组合的图像表示:
a、将包含一个具有较大尺度的主特征和由这个主特征空间覆盖的若干个具有较小尺度的元素特征的集合定义为特征组合,给定任一图像P,抽取其包含的特征组合集其中,Cl=(Zl,Yl);
式中,Cl表示第l个特征组合,Zl为第l个特征组合的主特征,Yl为第l个特征组合的一组元素特征,Zl和Yl满足0.02×a(P)<a(Zl),a(Yl)<0.2×a(P),且Yl对应的局部空间区域完全被主特征Cl的局部空间覆盖,a(·)表示覆盖空间区域的面积;
b、对于任意两个特征组合Cf(Zf,Yf)和Cg(Zg,Yg),定义两个特征组合的第二视觉相似度R:
当cos(Zf,Zg)>T1时:
R(Cf,Cg)=1{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
当T1≥cos(Zf,Zg)>T2时:
R(Cf,Cg)=0.5{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
当cos(Zf,Zg)≤T2时:
R(Cf,Cg)=0
式中,T1=(0.8,1),T2=(0.5,0.8],cos(·,·)表示两个特征的余弦相似度,Yfi是Yf中的元素,Ygi是Yg中的元素,{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}表示Yf和Yg中匹配的元素特征数;
(1‐4)图像检索:对于给定的查询图像Ip,首先提取其特征组合集,将每个特征的主特征映射到视觉单词,找出包含该视觉单词的数据库图像Iq,计算其与查询图像的相似度距离,通过将相似度距离与设定阈值比较,完成图像检索;
所述的相似度距离采用以下公式计算:
d=S(Ip,Iq)×maxR(Ip,Iq)
其中,S(p,q)表示两幅图像的第一视觉相似度度量,maxR(Ip,Iq)表示对两幅图像的所有特征组合进行第二视觉相似度度量的最大值。
优选地,所述可信评估包含以下步骤:
步骤1:定义用于评估的各项可信属性,可信属性是分类的,可信属性可以向下分解为子属性;
步骤2:对于每项可信属性或子属性,提炼出对它的评价指标,可以用这些评价指标从不同的侧面对可信属性或子属性进行评价;
步骤3:对于每项可信属性或子属性,定义出对它的评价标准,评价标准分为四级:优、良、中、差,评价标准是基于评价指标的,即根据每个评价指标的取值组合来决定可信属性或子属性达到了哪一级评价标准;
步骤4:在开展可信评估活动之前,根据评估重点的不同,形成不同可信评估模板,并基于此模板开展可信评估活动,从而使得可信评估更有针对性,评估的结果更精确。
在本实施例的基于可信云计算的信息大数据分析支撑方法中,通过关键词和标记的运用,预先将数据库划分为多个子数据库,检索时先在相关度高的子数据库中进行检索,减少了计算量,提高了运算速度;基于单词包表示图像时,提出了加权表示和第一视觉相似度,减少了时间开销;基于特征组合表示图像时,利用了局部特征之间的空间包含关系,提出将相关的局部特征组合在一起以增强其视觉表达能力;该特征组合不但具有良好的尺度和旋转不变性,而且还能够自然地利用各特征元素之间的相对位置信息进行局部几何校验,剔除可能存在的错误匹配,以提高图像检索的准确率;特征量化以及组合表达大幅地提高了检索的精度;T1=0.95,T2=0.78,检索精度提高了50%,检索速度提高了1%;保护了指定的数据存储区,防止敌手实施特定类型的物理访问;赋予了所有在计算平台上执行的代码以证明它在一个未被篡改环境中运行的能力,从广义的角度,可信计算平台为网络用户提供了一个更为宽广的安全环境,它从安全体系的角度来描述安全问题,确保用户的安全执行环境,突破被动防御打补丁方式。
实施例4:基于可信云计算的信息大数据分析支撑方法,包括以下步骤:
(1)由云服务器获取信息数据,将图像信息和非图像信息进行分类后,分别储存到图像数据库和非图像数据库中,并将来源相同的图像信息和非图像信息作标记,例如将一张图片和对这张图片的说明信息视为来源相同,并作对应标记。这里所指的来源相同,一般是指在在同一时间接收到的来自同一网络地址的图像信息和非图像信息。
(2)将非图像数据库按照预先设定的多个关键词划分为多个第一子数据库,同时按照所述关键词对非图像信息进行分类,分别储存到对应的所述第一子数据库中,未匹配到关键词的非图像信息单独划分为一类。
(3)将图像数据库按照所述关键词划分为多个第二子数据库,并对图像信息根据与其来源相同的非图像信息进行分类,分别储存到对应所述第二子数据库中,无来源相同标记的图像信息,或者其对应的非图像信息未匹配到关键词的图像信息单独划分为一类。
(4)当用户输入关键词进行检索时,按照输入的关键词与预先设定的关键词的相关度排序依次在各个第一字数据库和第二子数据库中分别进行检索,并分别输出图像数据和非图像数据的检索结果。关键词的相关度计算,可以按照顺序、同字符数量等标准来计算,这类计算方法在现有技术中已经很成熟,在此不再详述。
每个第二子数据库的图像检索中还提供了通过输入查询图像Ip来检索相似图像的功能,该功能由以下步骤实现:
(1-1)采用SIFT特征对图像局部区域进行描述;
(1‐2)基于单词包的图像表示:
a.采用基于单词包模型对局部特征进行量化,设由M个局部特征向量组成的样本空间X={x1,…,xM},以无监督方式快速聚类生成初始视觉码本,采用最近邻策略建立局部特征xj与相对应的视觉单词的映射关系,j=1,…,M;
b.设码本空间中包含N个视觉单词,则任一图像表示为高维稀疏向量{w1,…,wN},wi表示视觉单词i的权值,i=1,…,N;
w i = t i p t i - t i p × 1 f i
式中,表示该图像中视觉单词i出现的次数,ti表示图像数据库中视觉单词i出现的总次数,fi表示图像数据库中包含视觉单词i的图像数目;
对权值wi进行归一化处理,令iδi=1,此时任一图像的高维稀疏向量表示为{δ1,…,δN};
c.对于任意两幅图像p和q,定义两幅图像之间的第一视觉相似度S(p,q):
S ( p , q ) = 1 Σ i = 1 N ( t i p t i - t i p × 1 f i Σ i t i p t i - t i p × 1 f i - t i q t i - t i q × 1 f i Σ i t i q t i - t i q × 1 f i ) 2
S(p,q)越大,表明两幅图像越接近;
(5)对计算结果进行可信评估。
优选地,其特征是,步骤(4)还包括:
(1‐3)基于特征组合的图像表示:
a、将包含一个具有较大尺度的主特征和由这个主特征空间覆盖的若干个具有较小尺度的元素特征的集合定义为特征组合,给定任一图像P,抽取其包含的特征组合集其中,Cl=(Zl,Yl);
式中,Cl表示第l个特征组合,Zl为第l个特征组合的主特征,Yl为第l个特征组合的一组元素特征,Zl和Yl满足0.02×a(P)<a(Zl),a(Yl)<0.2×a(P),且Yl对应的局部空间区域完全被主特征Cl的局部空间覆盖,a(·)表示覆盖空间区域的面积;
b、对于任意两个特征组合Cf(Zf,Yf)和Cg(Zg,Yg),定义两个特征组合的第二视觉相似度R:
当cos(Zf,Zg)>T1时:
R(Cf,Cg)=1{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
当T1≥cos(Zf,Zg)>T2时:
R(Cf,Cg)=0.5{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
当cos(Zf,Zg)≤T2时:
R(Cf,Cg)=0
式中,T1=(0.8,1),T2=(0.5,0.8],cos(·,·)表示两个特征的余弦相似度,Yfi是Yf中的元素,Ygi是Yg中的元素,{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}表示Yf和Yg中匹配的元素特征数;
(1‐4)图像检索:对于给定的查询图像Ip,首先提取其特征组合集,将每个特征的主特征映射到视觉单词,找出包含该视觉单词的数据库图像Iq,计算其与查询图像的相似度距离,通过将相似度距离与设定阈值比较,完成图像检索;
所述的相似度距离采用以下公式计算:
d=S(Ip,Iq)×maxR(Ip,Iq)
其中,S(p,q)表示两幅图像的第一视觉相似度度量,maxR(Ip,Iq)表示对两幅图像的所有特征组合进行第二视觉相似度度量的最大值。
优选地,所述可信评估包含以下步骤:
步骤1:定义用于评估的各项可信属性,可信属性是分类的,可信属性可以向下分解为子属性;
步骤2:对于每项可信属性或子属性,提炼出对它的评价指标,可以用这些评价指标从不同的侧面对可信属性或子属性进行评价;
步骤3:对于每项可信属性或子属性,定义出对它的评价标准,评价标准分为四级:优、良、中、差,评价标准是基于评价指标的,即根据每个评价指标的取值组合来决定可信属性或子属性达到了哪一级评价标准;
步骤4:在开展可信评估活动之前,根据评估重点的不同,形成不同可信评估模板,并基于此模板开展可信评估活动,从而使得可信评估更有针对性,评估的结果更精确。
在本实施例的基于可信云计算的信息大数据分析支撑方法中,通过关键词和标记的运用,预先将数据库划分为多个子数据库,检索时先在相关度高的子数据库中进行检索,减少了计算量,提高了运算速度;基于单词包表示图像时,提出了加权表示和第一视觉相似度,减少了时间开销;基于特征组合表示图像时,利用了局部特征之间的空间包含关系,提出将相关的局部特征组合在一起以增强其视觉表达能力;该特征组合不但具有良好的尺度和旋转不变性,而且还能够自然地利用各特征元素之间的相对位置信息进行局部几何校验,剔除可能存在的错误匹配,以提高图像检索的准确率;特征量化以及组合表达大幅地提高了检索的精度;T1=0.95,T2=0.78,检索精度提高了50%,检索速度提高了1%;保护了指定的数据存储区,防止敌手实施特定类型的物理访问;赋予了所有在计算平台上执行的代码以证明它在一个未被篡改环境中运行的能力,从广义的角度,可信计算平台为网络用户提供了一个更为宽广的安全环境,它从安全体系的角度来描述安全问题,确保用户的安全执行环境,突破被动防御打补丁方式。
实施例5:基于可信云计算的信息大数据分析支撑方法,包括以下步骤:
(1)由云服务器获取信息数据,将图像信息和非图像信息进行分类后,分别储存到图像数据库和非图像数据库中,并将来源相同的图像信息和非图像信息作标记,例如将一张图片和对这张图片的说明信息视为来源相同,并作对应标记。这里所指的来源相同,一般是指在在同一时间接收到的来自同一网络地址的图像信息和非图像信息。
(2)将非图像数据库按照预先设定的多个关键词划分为多个第一子数据库,同时按照所述关键词对非图像信息进行分类,分别储存到对应的所述第一子数据库中,未匹配到关键词的非图像信息单独划分为一类。
(3)将图像数据库按照所述关键词划分为多个第二子数据库,并对图像信息根据与其来源相同的非图像信息进行分类,分别储存到对应所述第二子数据库中,无来源相同标记的图像信息,或者其对应的非图像信息未匹配到关键词的图像信息单独划分为一类。
(4)当用户输入关键词进行检索时,按照输入的关键词与预先设定的关键词的相关度排序依次在各个第一字数据库和第二子数据库中分别进行检索,并分别输出图像数据和非图像数据的检索结果。关键词的相关度计算,可以按照顺序、同字符数量等标准来计算,这类计算方法在现有技术中已经很成熟,在此不再详述。
每个第二子数据库的图像检索中还提供了通过输入查询图像Ip来检索相似图像的功能,该功能由以下步骤实现:
(1-1)采用SIFT特征对图像局部区域进行描述;
(1‐2)基于单词包的图像表示:
a.采用基于单词包模型对局部特征进行量化,设由M个局部特征向量组成的样本空间X={x1,…,xM},以无监督方式快速聚类生成初始视觉码本,采用最近邻策略建立局部特征xj与相对应的视觉单词的映射关系,j=1,…,M;
b.设码本空间中包含N个视觉单词,则任一图像表示为高维稀疏向量{w1,…,wN},wi表示视觉单词i的权值,i=1,...,N;
w i = t i p t i - t i p × 1 f i
式中,表示该图像中视觉单词i出现的次数,ti表示图像数据库中视觉单词i出现的总次数,fi表示图像数据库中包含视觉单词i的图像数目;
对权值wi进行归一化处理,令iδi=1,此时任一图像的高维稀疏向量表示为{δ1,…,δN};
c.对于任意两幅图像p和q,定义两幅图像之间的第一视觉相似度S(p,q):
S ( p , q ) = 1 Σ i = 1 N ( t i p t i - t i p × 1 f i Σ i t i p t i - t i p × 1 f i - t i q t i - t i q × 1 f i Σ i t i q t i - t i q × 1 f i ) 2
S(p,q)越大,表明两幅图像越接近;
(5)对计算结果进行可信评估。
优选地,其特征是,步骤(4)还包括:
(1‐3)基于特征组合的图像表示:
a、将包含一个具有较大尺度的主特征和由这个主特征空间覆盖的若干个具有较小尺度的元素特征的集合定义为特征组合,给定任一图像P,抽取其包含的特征组合集其中,Cl=(Zl,Yl);
式中,Cl表示第l个特征组合,Zl为第l个特征组合的主特征,Yl为第l个特征组合的一组元素特征,Zl和Yl满足0.02×a(P)<a(Zl),a(Yl)<0.2×a(P),且Yl对应的局部空间区域完全被主特征Cl的局部空间覆盖,a(·)表示覆盖空间区域的面积;
b、对于任意两个特征组合Cf(Zf,Yf)和Cg(Zg,Yg),定义两个特征组合的第二视觉相似度R:
当cos(Zf,Zg)>T1时:
R(Cf,Cg)=1{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
当T1≥cos(Zf,Zg)>T2时:
R(Cf,Cg)=0.5{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}
当cos(Zf,Zg)≤T2时:
R(Cf,Cg)=0
式中,T1=(0.8,1),T2=(0.5,0.8],cos(·,·)表示两个特征的余弦相似度,Yfi是Yf中的元素,Ygi是Yg中的元素,{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}表示Yf和Yg中匹配的元素特征数;
(1‐4)图像检索:对于给定的查询图像Ip,首先提取其特征组合集,将每个特征的主特征映射到视觉单词,找出包含该视觉单词的数据库图像Iq,计算其与查询图像的相似度距离,通过将相似度距离与设定阈值比较,完成图像检索;
所述的相似度距离采用以下公式计算:
d=S(Ip,Iq)×maxR(Ip,Iq)
其中,S(p,q)表示两幅图像的第一视觉相似度度量,maxR(Ip,Iq)表示对两幅图像的所有特征组合进行第二视觉相似度度量的最大值。
优选地,所述可信评估包含以下步骤:
步骤1:定义用于评估的各项可信属性,可信属性是分类的,可信属性可以向下分解为子属性;
步骤2:对于每项可信属性或子属性,提炼出对它的评价指标,可以用这些评价指标从不同的侧面对可信属性或子属性进行评价;
步骤3:对于每项可信属性或子属性,定义出对它的评价标准,评价标准分为四级:优、良、中、差,评价标准是基于评价指标的,即根据每个评价指标的取值组合来决定可信属性或子属性达到了哪一级评价标准;
步骤4:在开展可信评估活动之前,根据评估重点的不同,形成不同可信评估模板,并基于此模板开展可信评估活动,从而使得可信评估更有针对性,评估的结果更精确。
在本实施例的基于可信云计算的信息大数据分析支撑方法中,通过关键词和标记的运用,预先将数据库划分为多个子数据库,检索时先在相关度高的子数据库中进行检索,减少了计算量,提高了运算速度;基于单词包表示图像时,提出了加权表示和第一视觉相似度,减少了时间开销;基于特征组合表示图像时,利用了局部特征之间的空间包含关系,提出将相关的局部特征组合在一起以增强其视觉表达能力;该特征组合不但具有良好的尺度和旋转不变性,而且还能够自然地利用各特征元素之间的相对位置信息进行局部几何校验,剔除可能存在的错误匹配,以提高图像检索的准确率;特征量化以及组合表达大幅地提高了检索的精度;T1=0.95,T2=0.78,检索精度提高了50%,检索速度提高了1%;保护了指定的数据存储区,防止敌手实施特定类型的物理访问;赋予了所有在计算平台上执行的代码以证明它在一个未被篡改环境中运行的能力,从广义的角度,可信计算平台为网络用户提供了一个更为宽广的安全环境,它从安全体系的角度来描述安全问题,确保用户的安全执行环境,突破被动防御打补丁方式。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细地说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。

Claims (3)

1.基于可信云计算的信息大数据分析支撑方法,其特征是,包括以下步骤:
(1)由云服务器获取信息数据,认证所需进行信息收集的网络中的硬件节点,判断网络硬件节点可信度,建立所采集信息的信任关系,将图像信息和非图像信息进行分类后,分别储存到图像数据库和非图像数据库中,并将来源相同的图像信息和非图像信息作标记;
(2)将非图像数据库按照预先设定的多个关键词划分为多个第一子数据库,同时按照所述关键词对非图像信息进行分类,分别储存到对应的所述第一子数据库中,未匹配到关键词的非图像信息单独划分为一类;
(3)将图像数据库按照所述关键词划分为多个第二子数据库,并对图像信息根据与其来源相同的非图像信息进行分类,分别储存到对应所述第二子数据库中,无来源相同标记的图像信息,或者其对应的非图像信息未匹配到关键词的图像信息单独划分为一类;
(4)当用户输入关键词进行检索时,按照输入的关键词与预先设定的关键词的相关度排序依次在各个第一字数据库和第二子数据库中分别进行检索,并分别输出图像数据和非图像数据的检索结果;每个第二子数据库的图像检索中还提供了通过输入查询图像Ip来检索相似图像的功能,该功能由以下步骤实现:
(1-1)采用SIFT特征对图像局部区域进行可信描述;
(1‐2)基于单词包的图像可信表示:
a.采用基于单词包模型对局部特征进行量化,设由M个局部特征向量组成的样本空间X={x1,…,xM},以无监督方式快速聚类生成初始视觉码本,采用最近邻策略建立局部特征xj与相对应的视觉单词的映射关系,j=1,…,M;
b.设码本空间中包含N个视觉单词,则任一图像表示为高维稀疏向量{w1,…,wN},wi表示视觉单词i的权值,i=1,…,N;
w i = t i p t i - t i p × 1 f i
式中,表示该图像中视觉单词i出现的次数,ti表示图像数据库中视觉单词i出现的总次数,fi表示图像数据库中包含视觉单词i的图像数目;
对权值wi进行归一化处理,令iδi=1,此时任一图像的高维稀疏向量表示为{δ1,…,δN};
c.对于任意两幅图像p和q,定义两幅图像之间的第一视觉相似度S(p,q):
S ( p , q ) = 1 Σ i = 1 N ( t i p t i - t i p × 1 f i Σ i t i p t i - t i p × 1 f i - t i q t i - t i q × 1 f i Σ i t i q t i - t i q × 1 f i ) 2
S(p,q)越大,表明两幅图像越接近;
(5)对计算结果进行可信评估。
2.根据权利要求1所述的基于可信云计算的信息大数据分析支撑方法,其特征是,步骤(4)还包括:
(1‐3)基于特征组合的图像可信表示:
a、将包含一个具有较大尺度的主特征和由这个主特征空间覆盖的若干个具有较小尺度的元素特征的集合定义为特征组合,给定任一图像P,抽取其包含的特征组合集其中,Cl=(Zl,Yl);
式中,Cl表示第l个特征组合,Zl为第l个特征组合的主特征,Yl为第l个特征组合的一组元素特征,Zl和Yl满足0.02×a(P)<a(Zl),a(Yl)<0.2×a(P),且Yl对应的局部空间区域完全被主特征Cl的局部空间覆盖,a(·)表示覆盖空间区域的面积;
b、对于任意两个特征组合Cf(Zf,Yf)和Cg(Zg,Yg),定义两个特征组合的第二视觉相似度R:
当cos(Zf,Zg)>T1时:
R(Cf,Cg)=1{(Yfi,Ygj)|Yfi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1
当T1≥cos(Zf,Zg)>T2时:
R(Cf,Cg)=0.5{(Yfi,Ygj)|fi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1
当cos(Zf,Zg)≤T2时:
R(Cf,Cg)=0
式中,T1=(0.8,1),T1=(0.5,0.8],cos(·,·)表示两个特征的余弦相似度,Yfi是Yf中的元素,Ygi是Yg中的元素,{(Yfi,Ygj)|fi∈Yf,Ygj∈Yg,cos(Yf,Yg)>T1}表示Yf和Yg中匹配的元素特征数;
(1‐4)图像可信检索:对于给定的查询图像Ip,首先提取其特征组合集,将每个特征的主特征映射到视觉单词,找出包含该视觉单词的数据库图像Iq,计算其与查询图像的相似度距离,通过将相似度距离与设定阈值比较,完成图像检索;
所述的相似度距离采用以下公式计算:
d=S(Ip,Iq)×maxR(Ip,Iq)
其中,S(p,q)表示两幅图像的第一视觉相似度度量,maxR(Ip,Iq)表示对两幅图像的所有特征组合进行第二视觉相似度度量的最大值。
3.根据权利要求1所述的基于大数据可信计算的信息运维服务知识共享方法,其特征在于,所述可信评估包含以下步骤:
步骤1:定义用于评估的各项可信属性,可信属性是分类的,可信属性可以向下分解为子属性;
步骤2:对于每项可信属性或子属性,提炼出对它的评价指标,可以用这些评价指标从不同的侧面对可信属性或子属性进行评价;
步骤3:对于每项可信属性或子属性,定义出对它的评价标准,评价标准分为四级:优、良、中、差,评价标准是基于评价指标的,即根据每个评价指标的取值组合来决定可信属性或子属性达到了哪一级评价标准;
步骤4:在开展可信评估活动之前,根据评估重点的不同,形成不同可信评估模板,并基于此模板开展可信评估活动,从而使得可信评估更有针对性,评估的结果更精确。
CN201610525169.8A 2016-07-01 2016-07-01 基于可信云计算的信息大数据分析支撑方法 Active CN106203165B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610525169.8A CN106203165B (zh) 2016-07-01 2016-07-01 基于可信云计算的信息大数据分析支撑方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610525169.8A CN106203165B (zh) 2016-07-01 2016-07-01 基于可信云计算的信息大数据分析支撑方法

Publications (2)

Publication Number Publication Date
CN106203165A true CN106203165A (zh) 2016-12-07
CN106203165B CN106203165B (zh) 2017-09-22

Family

ID=57466384

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610525169.8A Active CN106203165B (zh) 2016-07-01 2016-07-01 基于可信云计算的信息大数据分析支撑方法

Country Status (1)

Country Link
CN (1) CN106203165B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106651741A (zh) * 2016-12-09 2017-05-10 西华大学 一种基于云计算的图形处理系统
CN107103073A (zh) * 2017-04-21 2017-08-29 北京恒冠网络数据处理有限公司 一种图像检索系统
CN109597890A (zh) * 2018-11-23 2019-04-09 福建榕基软件股份有限公司 一种数据感知自动分发的方法及存储装置
CN113612727A (zh) * 2021-06-24 2021-11-05 北京华云安信息技术有限公司 攻击ip识别方法、装置、设备和计算机可读存储介质
WO2022011851A1 (zh) * 2020-07-16 2022-01-20 深圳计算科学研究院 度量空间划分方式评价方法、装置、计算机设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102368237A (zh) * 2010-10-18 2012-03-07 中国科学技术大学 图像检索方法、装置及系统
CN102508901A (zh) * 2011-11-07 2012-06-20 康佳集团股份有限公司 基于内容的海量图像检索方法和系统
US20140280257A1 (en) * 2013-03-15 2014-09-18 Konstantinos (Constantin) F. Aliferis Data Analysis Computer System and Method For Parallelized and Modularized Analysis of Big Data

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102368237A (zh) * 2010-10-18 2012-03-07 中国科学技术大学 图像检索方法、装置及系统
CN102508901A (zh) * 2011-11-07 2012-06-20 康佳集团股份有限公司 基于内容的海量图像检索方法和系统
US20140280257A1 (en) * 2013-03-15 2014-09-18 Konstantinos (Constantin) F. Aliferis Data Analysis Computer System and Method For Parallelized and Modularized Analysis of Big Data

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106651741A (zh) * 2016-12-09 2017-05-10 西华大学 一种基于云计算的图形处理系统
CN106651741B (zh) * 2016-12-09 2019-12-13 西华大学 一种基于云计算的图形处理系统
CN107103073A (zh) * 2017-04-21 2017-08-29 北京恒冠网络数据处理有限公司 一种图像检索系统
CN109597890A (zh) * 2018-11-23 2019-04-09 福建榕基软件股份有限公司 一种数据感知自动分发的方法及存储装置
CN109597890B (zh) * 2018-11-23 2022-09-09 福建榕基软件股份有限公司 一种数据感知自动分发的方法及存储装置
WO2022011851A1 (zh) * 2020-07-16 2022-01-20 深圳计算科学研究院 度量空间划分方式评价方法、装置、计算机设备及存储介质
CN113612727A (zh) * 2021-06-24 2021-11-05 北京华云安信息技术有限公司 攻击ip识别方法、装置、设备和计算机可读存储介质
CN113612727B (zh) * 2021-06-24 2023-04-18 北京华云安信息技术有限公司 攻击ip识别方法、装置、设备和计算机可读存储介质

Also Published As

Publication number Publication date
CN106203165B (zh) 2017-09-22

Similar Documents

Publication Publication Date Title
US11689561B2 (en) Detecting unknown malicious content in computer systems
CN107688823B (zh) 一种图像特征获取方法及装置,电子设备
CN106203165B (zh) 基于可信云计算的信息大数据分析支撑方法
CN104751055B (zh) 一种基于纹理的分布式恶意代码检测方法、装置及系统
CN111797214A (zh) 基于faq数据库的问题筛选方法、装置、计算机设备及介质
CN103617157A (zh) 基于语义的文本相似度计算方法
CN104361059B (zh) 一种基于多示例学习的有害信息识别和网页分类方法
CN106126741B (zh) 一种基于大数据的电网信息安全可信工作系统
CN112131471B (zh) 基于无权无向图进行关系推荐的方法、装置、设备及介质
CN113779429A (zh) 交通拥堵态势预测方法、装置、设备及存储介质
CN111177719A (zh) 地址类别判定方法、装置、计算机可读存储介质及设备
CN104537280A (zh) 基于文本关系相似性的蛋白质交互关系识别方法
CN103440292A (zh) 基于比特向量的多媒体信息检索方法和系统
CN106156349A (zh) 基于信息安全的图像检索方法
Wang et al. Block-based image matching for image retrieval
US8560468B1 (en) Learning expected values for facts
CN112149747A (zh) 一种基于改良Ghost3D模块和协方差池化的高光谱图像分类方法
CN109543712B (zh) 时态数据集上的实体识别方法
CN108519983A (zh) 一种基于潜层语义分析的安全的文档相似性计算方法和系统
CN106294550A (zh) 一种遥感图像智能检索方法
Shamoyan et al. On distance function in some new analytic bergman type spaces in ℂn
CN106227818A (zh) 一种异常图像数据处理及检索方法
CN115017290B (zh) 基于协同对抗训练的档案问答系统优化方法和装置
CN106202512A (zh) 一种视频监控图像显示和检索方法
CN117786732B (zh) 一种基于大数据信息脱敏方法的智慧机关数据存储系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
CB03 Change of inventor or designer information

Inventor after: Chen Zubin

Inventor after: Tang Lingli

Inventor after: Huang Lianyue

Inventor after: Hang Cong

Inventor after: He Guanbo

Inventor after: Su Yuqi

Inventor after: Song Junhao

Inventor after: He Zhongzhu

Inventor after: Xie Ming

Inventor after: Hu Jijun

Inventor after: Weng Xiaoyun

Inventor after: Yuan Yong

Inventor after: Deng Gefeng

Inventor after: Mo Yinghong

Inventor after: Xie Jing

Inventor after: Zhang Peng

Inventor before: Chen Zubin

Inventor before: Tang Lingli

Inventor before: Huang Lianyue

Inventor before: Hang Cong

Inventor before: He Guanbo

Inventor before: Su Yuqi

Inventor before: Song Junhao

Inventor before: Xie Ming

Inventor before: Hu Jijun

Inventor before: Weng Xiaoyun

Inventor before: Yuan Yong

Inventor before: Deng Gefeng

Inventor before: Mo Yinghong

Inventor before: Xie Jing

Inventor before: Zhang Peng

COR Change of bibliographic data
TA01 Transfer of patent application right

Effective date of registration: 20170217

Address after: 530000 Xingning, Nanning District, democratic road, No. 6,

Applicant after: GUANGXI POWER GRID Co.,Ltd.

Address before: 530000 Xingning, Nanning District, democratic road, No. 6,

Applicant before: He Zhongzhu

CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Ou Hao

Inventor after: Li Xiaohua

Inventor after: Liu Shuiping

Inventor before: Chen Zubin

Inventor before: Tang Lingli

Inventor before: Huang Lianyue

Inventor before: Hang Cong

Inventor before: He Guanbo

Inventor before: Su Yuqi

Inventor before: Song Junhao

Inventor before: He Zhongzhu

Inventor before: Xie Ming

Inventor before: Hu Jijun

Inventor before: Weng Xiaoyun

Inventor before: Yuan Yong

Inventor before: Deng Gefeng

Inventor before: Mo Yinghong

Inventor before: Xie Jing

Inventor before: Zhang Peng

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20170829

Address after: 510000 room 15, 203 Cheng Cheng Road, Guangzhou, Guangdong, Tianhe District

Applicant after: Guangzhou isomorphism Mdt InfoTech Ltd.

Address before: 530000 Xingning, Nanning District, democratic road, No. 6,

Applicant before: GUANGXI POWER GRID Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 510000 room 611, 1933 Huaguan Road, Tianhe District, Guangzhou City, Guangdong Province (office only)

Patentee after: Guangzhou isomorphism Mdt InfoTech Ltd.

Address before: 510000 Room 203, 15 Sicheng Road, Tianhe District, Guangzhou City, Guangdong Province

Patentee before: Guangzhou isomorphism Mdt InfoTech Ltd.

PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A Support Method for Information Big Data Analysis Based on Trusted Cloud Computing

Granted publication date: 20170922

Pledgee: China Construction Bank Corporation Guangzhou Development Zone Branch

Pledgor: Guangzhou isomorphism Mdt InfoTech Ltd.

Registration number: Y2024980013601