CN108573308A - 基于大数据的软件工程知识库的自动化构建方法及系统 - Google Patents

基于大数据的软件工程知识库的自动化构建方法及系统 Download PDF

Info

Publication number
CN108573308A
CN108573308A CN201810322489.2A CN201810322489A CN108573308A CN 108573308 A CN108573308 A CN 108573308A CN 201810322489 A CN201810322489 A CN 201810322489A CN 108573308 A CN108573308 A CN 108573308A
Authority
CN
China
Prior art keywords
data
user
module
knowledge base
cloud server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201810322489.2A
Other languages
English (en)
Inventor
陈宏�
刘叶红
陈宙
陈宇
韩月新
袁勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HUNAN WOMEN'S UNIVERSITY
Original Assignee
HUNAN WOMEN'S UNIVERSITY
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HUNAN WOMEN'S UNIVERSITY filed Critical HUNAN WOMEN'S UNIVERSITY
Priority to CN201810322489.2A priority Critical patent/CN108573308A/zh
Publication of CN108573308A publication Critical patent/CN108573308A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/20Software design

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于软件工程技术领域,公开了一种基于大数据的软件工程知识库的自动化构建方法及系统,基于大数据的软件工程知识库的自动化构建系统包括:数据获取模块、可行性分析模块、信息存储构建模块、匹配模块、开发模块。本发明通过数据获取模块根据关键指标来反映某一部分数据的数据形态;同时公开一种基于大数据的软件工程知识库的自动化构建方法。本发明可以简单、快速、完整的反映数据的数据形态;同时本发明通过匹配模块可以智能获取开发相关信息经验,便于工作人员有效利用历史经验和相关规程及时处理开发问题,极大提高工作效率。

Description

基于大数据的软件工程知识库的自动化构建方法及系统
技术领域
本发明属于软件工程技术领域,尤其涉及一种基于大数据的软件工程知识库的自动化构建方法。
背景技术
目前,业内常用的现有技术是这样的:
软件工程是一门研究用工程化方法构建和维护有效的、实用的和高质量的软件的学科。它涉及程序设计语言、数据库、软件开发工具、系统平台、标准、设计模式等方面。在现代社会中,软件应用于多个方面。典型的软件有电子邮件、嵌入式系统、人机界面、办公套件、操作系统、编译器、数据库、游戏等。同时,各个行业几乎都有计算机软件的应用,如工业、农业、银行、航空、政府部门等。这些应用促进了经济和社会的发展,也提高了工作效率和生活效率。然而,现有的软件工程知识库的自动化构建复杂、速度慢;同时遇到问题无法及时获取解决,工作效率低。
然而云计算在提供多种高效弹性的服务的同时,也遇到很多挑战和亟需处理的问题。随着数据的爆发式增长,根据国际数据公司(IDC)的最新统计分析,全球产生和复制的数据以每2年翻一番的速度激增,到2020年,全球数据总量将达到44ZB。这些大量的数据将会给云服务器带来了前所未有的挑战。另一方面,存储在服务器中大量的冗余数据就是限制云存储发展的另一大瓶颈。根据EMC的调查报告显示,随着云端数据的快速增长,云存储中的冗余数据在备份应用中达到80%以上,在文件系统中已经达到60%以上,这些冗余数据消耗着大量的存储资源和管理资源。这就不可避免地给服务器带来了巨大的数据存储开销,并造成网络传输带宽的浪费,大量的重复数据将会消耗大量的计算开销和存储开销。因此,如何通过删除重复数据从而保证数据存储的高效性成为了亟待解决的问题。为了解决上述问题,数据去重技术应运而生,通过数据去重技术可以消除数据冗余,相同文件只保留一个物理副本,从而有效降低用户端上传数据耗费的带宽及节省服务器端的存储空间。对于云计算平台而言,数据去重不仅可以减少存储时付出的硬件成本,还可以提升存储空间的利用率,提高访问效率。数据去重存储技术目前广泛应用于商业云存储及数据备份服务,例如Dropbox、Mozy和Memopal等商业存储中。然而在去重技术在节省用户和云服务器大量的存储与管理资源的同时,出现了许多安全问题。其中最严重的问题之一就是标签欺骗攻击。标签欺骗攻击指的是敌手并不拥有数据,而服务器只是使用简单的询问数据的标签的方式判断一个新的用户是否拥有与服务器存储的数据是否相同。如果标签一致,则新的用户通过服务器的验证,云服务器就允许新的用户访问存储在云服务器上的数据而不需要用户再次上传数据。因此,敌手可以通过穷举方案或者各种其他攻击方案获得数据的标签,从而获得云服务器数据的访问权限。为了解决这一问题,许多数据拥有证明方案被提出,使用数据拥有证明方案可以让云服务器有效验证新的用户是否拥有服务器存储的数据。只有当用户通过服务器的数据拥有证明之后,用户才允许访问存储在云服务器上的数据。然而,现有的方案只针对于相同的数据拥有证明,并没有方案可以实现相似的数据拥有证明。实际上,对密文数据进行相似数据拥有证明是困难,这是因为用户的数据通常以密文的形式存储在云服务器上,如果使用传统加密方案,不同数据的密钥选择是随机选择的,因此即使是相似的数据加密之后也会获得相差度很大的密文数据,云服务器就无法判断这些密文数据的明文是否是相似的,这也就阻碍了相似数据拥有证明的实现。如果相似数据拥有证明方案可以实现,则云服务器将进一步提升数据去重的效率,即可以实现相似数据的去重,这将进一步提升云服务器存储空间的利用率并减少带宽浪费。
安全与效率一直是一对矛盾,安全意味着花费更多代价来认证、加密、解密等,效率则反之,是让这些过程更简单。因此,在检验行业的云计算也应该在增强安全性的同时保证其效率,达到安全与效率的平衡。另外,使用检验行业的云计算的用户也会是多种多样的,可能有管理员、系统开发人员、第三方、人民群众、检验工作人员、省局工作人员或者其他等等,这样用户的安全需要,访问权限及所需服务都可能不同,所以安全级别不能一概而论。由于以上存在的问题,研究检验行业的云计算安全性对提高访问效率、增强安全性、节约能耗、能使云服务更好更快地运行等有重大意义。
随着云计算在各种行业的广泛应用,越来越多的热点被挖掘出来了。安全问题作为云计算应用保障的重要一环更受到关注。一般的安全问题解决策略都是提高了安全性却降低了效率,且缺少用户对安全情况的反馈,不能区别对待不同的安全用户及安全类型。
综上所述,现有技术存在的问题是:
现有的软件工程知识库的自动化构建复杂、速度慢;同时遇到问题无法及时获取解决,工作效率低。
现有的数据拥有证明方案仅能支持相同的数据拥有证明,不能支持相似数据的拥有证明。如果云服务器仅通过验证数据标签的方案判断用户是否拥有数据,则存在标签欺骗攻击,用户可以通过穷举等攻击方案获得云服务器数据的访问权限。
解决目前检验行业的云计算缺少用户对安全情况的反馈,不能区别对待不同的安全用户及安全类型的问题。
发明内容
针对现有技术存在的问题,本发明提供了一种基于大数据的软件工程知识库的自动化构建方法系统。
本发明是这样实现的,一种基于大数据的软件工程知识库的自动化构建系统,包括:
数据获取模块,与可行性分析模块连接,用于获取程序开发需求信息;具体包括:
用户向检验云计算系统管理平台申请访问,检验云计算系统管理平台通过用户账号安全库对该账号验证是否具有合法性;
通过PB策略库中的四个库CS、AA、EA、SS为该账号本次访问建立相应的状态策略;
对X1,X2,X3……Xi的状态用所述的安全与效率量化规则进行量化并分别得到相应的概率;
根据安全与效率评价规则得到Xi+1,Xi+2的概率;
构建基于马尔科夫过程的状态矩阵,并求出对应的吸收矩阵B,通过比较B矩阵的每一行得出在X1,X2,X3……Xi中成功概率最高的认为该策略是安全、高效、且评价较好;
可行性分析模块,与数据获取模块、信息存储构建模块连接,用于对获取的开发需求信息进行可行性分析;
信息存储构建模块,与可行性分析模块、匹配模块连接,用于根据信息的类型,基于分词引擎提取的特征词,分别采用倒排表的方法构建特征项到文档的索引表,采用最小割集方法建立约简的规则树,并将倒排表和规则树进行存储,构建标准知识库和构建经验知识库;
匹配模块,与信息存储构建模块、开发模块连接,用于在对程序开发知识的访问时,对存储的倒排表和规则树进行知识匹配;具体包括:计算出数据w'和数据w的实际距离;用户C和云服务器S分别以密文数据cw'和cw作为输入;如果用户C声称拥有数据w'的标签tw'与存储在云服务器上的数据cw的标签tw相似,则用户C需要向云服务器S证明dis(cw',cw)≤t,t是设置用于判断数据是否相似的参数;disHam(a,b)表示a和b的汉明距离;云服务器S仅获得密文数据cw'和cw的汉明距离且不能获得数据w'的任何信息,用户C不能获得数据w的任何信息;相似数据拥有证明定义为下面的两方交互式协议:
FuzzyPow:[C:cw';S:cw]→[C:⊥;S:disHam(cw,cw')];
开发模块,与匹配模块连接,用于根据匹配模块获取的标准知识库和构建经验知识库进行开发。
进一步,所述云环境中安全的相似数据拥有证明方案通过统计的个数来计算汉明距离;用户C和云服务器S分别拥有输入串cw'=(cw'[1],...,cw'[|w'|])和串cw=(cw[1],...,cw[|w|]);用户C作为发送者生成N个随机数作为盲化因子并与云服务器S发起N个不经意传输协议;
所述云环境中安全的相似数据拥有证明方案当用户C的输入为0时,令不经意传输的输出值为ri+cw'[i];当用户C的输入为1时,令不经意传输的输出值为如果cw[i]=0,那么有如果cw[i]=1,那么有云服务器S是N轮不经意传输协议的接收者,输入cw=(cw[1],...,cw[|w|])得到对于i=1,...,N的值然后云服务器将所有的相加得到最后,用户发送∑r给云服务器S,云服务器S的最终输出为disHam(cw',cw)=∑t-∑r;如果设置的最大汉明距离为t且disHam(cw',cw)≤t,将得到数据cw'和cw是相似数据且用户C的确拥有与云服务器存储的数据cw相似的数据cw'
所述云环境中安全的相似数据拥有证明方案具体包括:
协议输入:
用户C输入长度为|cw'|的串cw'=(cw'[1],...,cw'[|w'|]),云服务器S输入长度为|cw|的串cw=(cw[1],...,cw[|w|]),|cw'|=|cw|=N;
协议输出:
云服务器S获得dis(cw',cw),用户C不获得任何信息;
协议:
用户C生成N个随机数并且计算
对于每一个i=1,...,N,用户C作为发送者,服务器S作为接受者运行不经意传输协议OT1 2
a.用户C的输入为(ri+cw'[i];ri+cw'[i]);
b.云服务器S选择比特cw[i];
c.云服务器S最终获得
服务器S输出
用户C发送∑r给服务器S;
服务器S通过计算∑t-∑r得到disHam(cw',cw)。
进一步,用户访问检验云计算通过多次握手协议进行,包括:
各种用户向检验云计算系统管理平台提出访问申请,并提交身份验证信息;
检验云计算系统管理平台接到请求后,对比账号安全库以验证用户身份的合法性,验证用户身份合法后询问用户的访问要求,如果用户身份不合法则拒绝访问;
用户提出访问行为及本次访问的状态信息,并要求相应的访问权限与安全状态级别;
检验云计算系统管理平台接收到后,根据检验云计算安全状态知识库对该账号做出评估,规划传输与存储的安全策略,然后发送数据包与用户协商安全策略;
用户接到数据包后与检验云计算系统管理平台协商策略,建立加密、存储、服务策略;
用户访问检验云计算;
检验云计算安全状态评价模型包括:
确定获取相应的安全与效率的偏移概率,构建出过渡状态过程;
通过系统与用户的评价获取最后两种评价状态策略成功、策略失败;
构建相应的马尔科夫状态图;
X0为初始状态,X1,X2,X3……Xi为由X0通过效率与安全规则后可能会转移的状态;
P01,P02,P03……P0i为由X0到X1,X2,X3……Xi的概率,Xi+1,Xi+2为最后经过系统评价和用户评价后获取的两个状态,分别代表成功策略和失败策略;
r1,i+1,r1,i+2为X1到Xi+1,Xi+2的概率,r2,i+1,r2,i+2为X2到Xi+1,Xi+2的概率……ri,i+1,ri,i+2为Xi到Xi+1,Xi+2的概率,从概率得到检验云计算策略的效率、安全、评价状态转移矩阵:
在矩阵中,p为从状态过渡态的概率,r为吸收态的概率,p和r的关系如下形式:
基本矩阵F:
F=(I-Q)-1
吸收矩阵B如下:
B=FR=(I-Q)-1×R;
所述安全与效率量化规则包括:
安全评价指标量化:
选用的指标量化参数被定义为S,其中每个因素定义为(s0,s1,s2,……),并对每种因素赋予相应的权重值(n0,n1,n2,……),则该算法的安全总值为:
S=s0*n0+s1*n1+s2*n2……;
效率评价指标量化:
选用量化参数被定义为E,其中每个因素定义为(e0,e1,e2,……),并对每种因素赋予相应的权重值(m0,m1,m2,……),则算法的效率总值为:
E=e0*m0+e1*m1+e2*m2……;
对每种规则的策略进行排序,以S/E的值为标量,接近1的说明安全性与效率最好,大于1的说明安全性高效率低,小于1的说明安全性低效率高,根据离1的距离划分相应的概率,离1越远概率越小,离1越近概率越大;
所述安全与效率评价规则包括:
具体公式如下所示:
P1=w1*50%+w2*50%
P2=1-P1
P1代表着效率与安全情况好,P2代表着效率与安全情况差,w1代表着用户评价,w2代表着系统评价。
本发明另一目的在于提供一种搭载有所述基于大数据的软件工程知识库的自动化构建系统的信息数据处理终端。
本发明另一目的在于提供一种基于大数据的软件工程知识库的自动化构建方法包括以下步骤:
步骤一,获取程序开发需求信息;
步骤二,对获取的开发需求信息进行可行性分析;
步骤三,构建标准知识库和构建经验知识库;
步骤四,通过倒排表和规则树进行知识匹配;根据匹配模块获取的标准知识库和构建经验知识库进行开发。
进一步,获取程序开发需求信息的方法包括:
首先,通过在线调查、填表访问等方式获取调查数据;
然后,对获取的数据结合需求建立数据表;
最后,根据数据形态关键指标对数据表进行清洗,获得数据表中目标数据的数据形态。
本发明另一目的在于提供一种实现所述基于大数据的软件工程知识库的自动化构建方法的计算机程序。
本发明另一目的在于提供一种实现所述基于大数据的软件工程知识库的自动化构建方法的信息数据处理终端。
本发明另一目的在于提供一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行基于大数据的软件工程知识库的自动化构建方法。
本发明的优点及积极效果为:
本发明通过数据获取模块根据关键指标来反映某一部分数据的数据形态,从而可以简单、快速、完整的反映数据的数据形态;同时本发明通过匹配模块可以智能获取开发相关信息经验,便于工作人员有效利用历史经验和相关规程及时处理开发问题,极大提高工作效率。
本发明针对云环境中去重技术实现所面临的标签欺骗问题,在匹配模块匹配中,提出了两个相似数据拥有证明方案。可以有效的使云服务器验证用户是否拥有与云服务器存储的密文数据相同的密文数据。使得用户只有在通过服务器的数据拥有证明协议之后才允许用户访问相应的密文数据,进而保证了数据的安全性。然而由于数据量不断变大,如果对所有的数据进行验证将消耗大量的计算与通信开销,为了解决这一问题并进一步提高相似数据拥有证明方案的效率,本发明提出了概率性相似数据拥有证明方案。概率性相似数据拥有证明方案通过使用伪随机置换让云服务器随机的选择一定数量的随机比特对用户的密文数据进行验证。通过概率性的验证算法,用户与云服务器的计算开销通信开销将大大降低,更具有实用性。
随着云计算技术的快速发展,越来越多的用户和企业倾向于将数据外包存储在云服务器上。在外包计算模型下,资源受限的用户可以通过按需付费的方式(pay-per-use-manner)来购买云计算服务商提供的无尽的计算和存储资源,在用户享受海量存储服务的同时大大减轻了用户端软硬件管理和维护的负担。通过采用不经意传输协议实现数据拥有证明。本发明的方案可以使云服务器授予用户访问权之前有效的验证用户是否拥有相似的数据。
附图说明
图1是本发明实施提供的基于大数据的软件工程知识库的自动化构建方法流程图。
图2是本发明实施提供的基于大数据的软件工程知识库的自动化构建系统结构框图。
图中:1、数据获取模块;2、可行性分析模块;3、信息存储构建模块;4、匹配模块;5、开发模块。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
下面结合附图及具体实施例对本发明的应用原理作进一步描述。
如图1所示,本发明提供的一种基于大数据的软件工程知识库的自动化构建方法包括以下步骤:
S101,通过数据获取模块获取程序开发需求信息;
S102,通过可行性分析模块对获取的开发需求信息进行可行性分析;
S103,通过信息存储构建模块构建标准知识库和构建经验知识库;
S104,通过匹配模块存储的倒排表和规则树进行知识匹配,通过开发模块根据匹配模块获取的标准知识库和构建经验知识库。
如图2所示,本发明提供的基于大数据的软件工程知识库的自动化构建系统包括:数据获取模块1、可行性分析模块2、信息存储构建模块3、匹配模块4、开发模块5。
数据获取模块1,与可行性分析模块2连接,用于获取程序开发需求信息;
可行性分析模块2,与数据获取模块1、信息存储构建模块3连接,用于对获取的开发需求信息进行可行性分析;
信息存储构建模块3,与可行性分析模块2、匹配模块4连接,用于根据信息的类型,基于分词引擎提取的特征词,分别采用倒排表的方法构建特征项到文档的索引表,采用最小割集方法建立约简的规则树,并将倒排表和规则树进行存储,从而构建标准知识库和构建经验知识库;
匹配模块4,与信息存储构建模块3、开发模块5连接,用于在对程序开发知识的访问时,对存储的倒排表和规则树进行知识匹配,返回使用者规程信息和相关的经验信息;
开发模块5,与匹配模块4连接,用于根据匹配模块获取的匹配模块获取的标准知识库和构建经验知识库进行开发。
本发明实施例提供的数据获取模块1获取方法如下:
首先,通过在线调查、填表访问等方式获取调查数据;
然后,对获取的数据根据需求建立数据表;
最后,根据数据形态关键指标对数据表进行清洗,获得数据表中目标数据的数据形态。
下面结合具体分析对本发明作进一步描述。
数据获取模块,与可行性分析模块连接,用于获取程序开发需求信息;具体包括:
用户向检验云计算系统管理平台申请访问,检验云计算系统管理平台通过用户账号安全库对该账号验证是否具有合法性;
通过PB策略库中的四个库CS、AA、EA、SS为该账号本次访问建立相应的状态策略;
对X1,X2,X3……Xi的状态用所述的安全与效率量化规则进行量化并分别得到相应的概率;
根据安全与效率评价规则得到Xi+1,Xi+2的概率;
构建基于马尔科夫过程的状态矩阵,并求出对应的吸收矩阵B,通过比较B矩阵的每一行得出在X1,X2,X3……Xi中成功概率最高的认为该策略是安全、高效、且评价较好;
可行性分析模块,与数据获取模块、信息存储构建模块连接,用于对获取的开发需求信息进行可行性分析;
信息存储构建模块,与可行性分析模块、匹配模块连接,用于根据信息的类型,基于分词引擎提取的特征词,分别采用倒排表的方法构建特征项到文档的索引表,采用最小割集方法建立约简的规则树,并将倒排表和规则树进行存储,构建标准知识库和构建经验知识库;
匹配模块,与信息存储构建模块、开发模块连接,用于在对程序开发知识的访问时,对存储的倒排表和规则树进行知识匹配;具体包括:计算出数据w'和数据w的实际距离;用户C和云服务器S分别以密文数据cw'和cw作为输入;如果用户C声称拥有数据w'的标签tw'与存储在云服务器上的数据cw的标签tw相似,则用户C需要向云服务器S证明dis(cw',cw)≤t,t是设置用于判断数据是否相似的参数;disHam(a,b)表示a和b的汉明距离;云服务器S仅获得密文数据cw'和cw的汉明距离且不能获得数据w'的任何信息,用户C不能获得数据w的任何信息;相似数据拥有证明定义为下面的两方交互式协议:
FuzzyPow:[C:cw';S:cw]→[C:⊥;S:disHam(cw,cw')];
开发模块,与匹配模块连接,用于根据匹配模块获取的标准知识库和构建经验知识库进行开发。
进一步,所述云环境中安全的相似数据拥有证明方案通过统计的个数来计算汉明距离;用户C和云服务器S分别拥有输入串cw'=(cw'[1],...,cw'[|w'|])和串cw=(cw[1],...,cw[|w|]);用户C作为发送者生成N个随机数作为盲化因子并与云服务器S发起N个不经意传输协议;
所述云环境中安全的相似数据拥有证明方案当用户C的输入为0时,令不经意传输的输出值为ri+cw'[i];当用户C的输入为1时,令不经意传输的输出值为如果cw[i]=0,那么有如果cw[i]=1,那么有云服务器S是N轮不经意传输协议的接收者,输入cw=(cw[1],...,cw[|w|])得到对于i=1,...,N的值然后云服务器将所有的相加得到最后,用户发送∑r给云服务器S,云服务器S的最终输出为disHam(cw',cw)=∑t-∑r;如果设置的最大汉明距离为t且disHam(cw',cw)≤t,将得到数据cw'和cw是相似数据且用户C的确拥有与云服务器存储的数据cw相似的数据cw'
所述云环境中安全的相似数据拥有证明方案具体包括:
协议输入:
用户C输入长度为|cw'|的串cw'=(cw'[1],...,cw'[|w'|]),云服务器S输入长度为|cw|的串cw=(cw[1],...,cw[|w|]),|cw'|=|cw|=N;
协议输出:
云服务器S获得dis(cw',cw),用户C不获得任何信息;
协议:
用户C生成N个随机数并且计算
对于每一个i=1,...,N,用户C作为发送者,服务器S作为接受者运行不经意传输协议OT1 2
a.用户C的输入为(ri+cw'[i];ri+cw'[i]);
b.云服务器S选择比特cw[i];
c.云服务器S最终获得
服务器S输出
用户C发送∑r给服务器S;
服务器S通过计算∑t-∑r得到disHam(cw',cw)。
进一步,用户访问检验云计算通过多次握手协议进行,包括:
各种用户向检验云计算系统管理平台提出访问申请,并提交身份验证信息;
检验云计算系统管理平台接到请求后,对比账号安全库以验证用户身份的合法性,验证用户身份合法后询问用户的访问要求,如果用户身份不合法则拒绝访问;
用户提出访问行为及本次访问的状态信息,并要求相应的访问权限与安全状态级别;
检验云计算系统管理平台接收到后,根据检验云计算安全状态知识库对该账号做出评估,规划传输与存储的安全策略,然后发送数据包与用户协商安全策略;
用户接到数据包后与检验云计算系统管理平台协商策略,建立加密、存储、服务策略;
用户访问检验云计算;
检验云计算安全状态评价模型包括:
确定获取相应的安全与效率的偏移概率,构建出过渡状态过程;
通过系统与用户的评价获取最后两种评价状态策略成功、策略失败;
构建相应的马尔科夫状态图;
X0为初始状态,X1,X2,X3……Xi为由X0通过效率与安全规则后可能会转移的状态;
P01,P02,P03……P0i为由X0到X1,X2,X3……Xi的概率,Xi+1,Xi+2为最后经过系统评价和用户评价后获取的两个状态,分别代表成功策略和失败策略;
r1,i+1,r1,i+2为X1到Xi+1,Xi+2的概率,r2,i+1,r2,i+2为X2到Xi+1,Xi+2的概率……ri,i+1,ri,i+2为Xi到Xi+1,Xi+2的概率,从概率得到检验云计算策略的效率、安全、评价状态转移矩阵:
在矩阵中,p为从状态过渡态的概率,r为吸收态的概率,p和r的关系如下形式:
基本矩阵F:
F=(I-Q)-1
吸收矩阵B如下:
B=FR=(I-Q)-1×R;
所述安全与效率量化规则包括:
安全评价指标量化:
选用的指标量化参数被定义为S,其中每个因素定义为(s0,s1,s2,……),并对每种因素赋予相应的权重值(n0,n1,n2,……),则该算法的安全总值为:
S=s0*n0+s1*n1+s2*n2……;
效率评价指标量化:
选用量化参数被定义为E,其中每个因素定义为(e0,e1,e2,……),并对每种因素赋予相应的权重值(m0,m1,m2,……),则算法的效率总值为:
E=e0*m0+e1*m1+e2*m2……;
对每种规则的策略进行排序,以S/E的值为标量,接近1的说明安全性与效率最好,大于1的说明安全性高效率低,小于1的说明安全性低效率高,根据离1的距离划分相应的概率,离1越远概率越小,离1越近概率越大;
所述安全与效率评价规则包括:
具体公式如下所示:
P1=w1*50%+w2*50%
P2=1-P1
P1代表着效率与安全情况好,P2代表着效率与安全情况差,w1代表着用户评价,w2代表着系统评价。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种基于大数据的软件工程知识库的自动化构建系统,其特征在于,所述基于大数据的软件工程知识库的自动化构建系统包括:
数据获取模块,与可行性分析模块连接,用于获取程序开发需求信息;具体包括:
用户向检验云计算系统管理平台申请访问,检验云计算系统管理平台通过用户账号安全库对该账号验证是否具有合法性;
通过PB策略库中的四个库CS、AA、EA、SS为该账号本次访问建立相应的状态策略;
对X1,X2,X3……Xi的状态用所述的安全与效率量化规则进行量化并分别得到相应的概率;
根据安全与效率评价规则得到Xi+1,Xi+2的概率;
构建基于马尔科夫过程的状态矩阵,并求出对应的吸收矩阵B,通过比较B矩阵的每一行得出在X1,X2,X3……Xi中成功概率最高的认为该策略是安全、高效、且评价较好;
可行性分析模块,与数据获取模块、信息存储构建模块连接,用于对获取的开发需求信息进行可行性分析;
信息存储构建模块,与可行性分析模块、匹配模块连接,用于根据信息的类型,基于分词引擎提取的特征词,分别采用倒排表的方法构建特征项到文档的索引表,采用最小割集方法建立约简的规则树,并将倒排表和规则树进行存储,构建标准知识库和构建经验知识库;
匹配模块,与信息存储构建模块、开发模块连接,用于在对程序开发知识的访问时,对存储的倒排表和规则树进行知识匹配;具体包括:计算出数据w'和数据w的实际距离;用户C和云服务器S分别以密文数据cw'和cw作为输入;如果用户C声称拥有数据w'的标签tw'与存储在云服务器上的数据cw的标签tw相似,则用户C需要向云服务器S证明dis(cw',cw)≤t,t是设置用于判断数据是否相似的参数;disHam(a,b)表示a和b的汉明距离;云服务器S仅获得密文数据cw'和cw的汉明距离且不能获得数据w'的任何信息,用户C不能获得数据w的任何信息;相似数据拥有证明定义为下面的两方交互式协议:
FuzzyPow:[C:cw';S:cw]→[C:⊥;S:disHam(cw,cw')];
开发模块,与匹配模块连接,用于根据匹配模块获取的标准知识库和构建经验知识库进行开发。
2.如权利要求1所述的基于大数据的软件工程知识库的自动化构建系统的,其特征在于,
所述云环境中安全的相似数据拥有证明方案通过统计的个数来计算汉明距离;用户C和云服务器S分别拥有输入串cw'=(cw'[1],...,cw'[|w'|])和串cw=(cw[1],...,cw[|w|]);用户C作为发送者生成N个随机数作为盲化因子并与云服务器S发起N个不经意传输协议;
所述云环境中安全的相似数据拥有证明方案当用户C的输入为0时,令不经意传输的输出值为ri+cw'[i];当用户C的输入为1时,令不经意传输的输出值为如果cw[i]=0,那么有如果cw[i]=1,那么有云服务器S是N轮不经意传输协议的接收者,输入cw=(cw[1],...,cw[|w|])得到对于i=1,...,N的值然后云服务器将所有的相加得到最后,用户发送∑r给云服务器S,云服务器S的最终输出为disHam(cw',cw)=∑t-∑r;如果设置的最大汉明距离为t且disHam(cw',cw)≤t,将得到数据cw'和cw是相似数据且用户C的确拥有与云服务器存储的数据cw相似的数据cw'
所述云环境中安全的相似数据拥有证明方案具体包括:
协议输入:
用户C输入长度为|cw'|的串cw'=(cw'[1],...,cw'[|w'|]),云服务器S输入长度为|cw|的串cw=(cw[1],...,cw[|w|]),|cw'|=|cw|=N;
协议输出:
云服务器S获得dis(cw',cw),用户C不获得任何信息;
协议:
用户C生成N个随机数并且计算
对于每一个i=1,...,N,用户C作为发送者,服务器S作为接受者运行不经意传输协议
a.用户C的输入为(ri+cw'[i];ri+cw'[i]);
b.云服务器S选择比特cw[i];
c.云服务器S最终获得
服务器S输出
用户C发送∑r给服务器S;
服务器S通过计算∑t-∑r得到disHam(cw',cw)。
3.如权利要求1所述的基于大数据的软件工程知识库的自动化构建系统,其特征在于,用户访问检验云计算通过多次握手协议进行,包括:
各种用户向检验云计算系统管理平台提出访问申请,并提交身份验证信息;
检验云计算系统管理平台接到请求后,对比账号安全库以验证用户身份的合法性,验证用户身份合法后询问用户的访问要求,如果用户身份不合法则拒绝访问;
用户提出访问行为及本次访问的状态信息,并要求相应的访问权限与安全状态级别;
检验云计算系统管理平台接收到后,根据检验云计算安全状态知识库对该账号做出评估,规划传输与存储的安全策略,然后发送数据包与用户协商安全策略;
用户接到数据包后与检验云计算系统管理平台协商策略,建立加密、存储、服务策略;
用户访问检验云计算;
检验云计算安全状态评价模型包括:
确定获取相应的安全与效率的偏移概率,构建出过渡状态过程;
通过系统与用户的评价获取最后两种评价状态策略成功、策略失败;
构建相应的马尔科夫状态图;
X0为初始状态,X1,X2,X3……Xi为由X0通过效率与安全规则后可能会转移的状态;
P01,P02,P03……P0i为由X0到X1,X2,X3……Xi的概率,Xi+1,Xi+2为最后经过系统评价和用户评价后获取的两个状态,分别代表成功策略和失败策略;
r1,i+1,r1,i+2为X1到Xi+1,Xi+2的概率,r2,i+1,r2,i+2为X2到Xi+1,Xi+2的概率……ri,i+1,ri,i+2为Xi到Xi+1,Xi+2的概率,从概率得到检验云计算策略的效率、安全、评价状态转移矩阵:
在矩阵中,p为从状态过渡态的概率,r为吸收态的概率,p和r的关系如下形式:
基本矩阵F:
F=(I-Q)-1
吸收矩阵B如下:
B=FR=(I-Q)-1×R;
所述安全与效率量化规则包括:
安全评价指标量化:
选用的指标量化参数被定义为S,其中每个因素定义为(s0,s1,s2,……),并对每种因素赋予相应的权重值(n0,n1,n2,……),则该算法的安全总值为:
S=s0*n0+s1*n1+s2*n2……;
效率评价指标量化:
选用量化参数被定义为E,其中每个因素定义为(e0,e1,e2,……),并对每种因素赋予相应的权重值(m0,m1,m2,……),则算法的效率总值为:
E=e0*m0+e1*m1+e2*m2……;
对每种规则的策略进行排序,以S/E的值为标量,接近1的说明安全性与效率最好,大于1的说明安全性高效率低,小于1的说明安全性低效率高,根据离1的距离划分相应的概率,离1越远概率越小,离1越近概率越大;
所述安全与效率评价规则包括:
具体公式如下所示:
P1=w1*50%+w2*50%
P2=1-P1
P1代表着效率与安全情况好,P2代表着效率与安全情况差,w1代表着用户评价,w2代表着系统评价。
4.一种搭载有权利要求1~3任意一项所述基于大数据的软件工程知识库的自动化构建系统的信息数据处理终端。
5.一种如权利要求1所述基于大数据的软件工程知识库的自动化构建系统的基于大数据的软件工程知识库的自动化构建方法,其特征在于,所述基于大数据的软件工程知识库的自动化构建方法包括以下步骤:
步骤一,获取程序开发需求信息;
步骤二,对获取的开发需求信息进行可行性分析;
步骤三,构建标准知识库和构建经验知识库;
步骤四,通过倒排表和规则树进行知识匹配;根据匹配模块获取的标准知识库和构建经验知识库进行开发。
6.如权利要求5所述基于大数据的软件工程知识库的自动化构建方法,其特征在于,获取程序开发需求信息的方法包括:
首先,通过在线调查、填表访问等方式获取调查数据;
然后,对获取的数据结合需求建立数据表;
最后,根据数据形态关键指标对数据表进行清洗,获得数据表中目标数据的数据形态。
7.一种实现权利要求5~6任意一项所述基于大数据的软件工程知识库的自动化构建方法的计算机程序。
8.一种实现权利要求5~6任意一项所述基于大数据的软件工程知识库的自动化构建方法的信息数据处理终端。
9.一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行如权利要求5~6任意一项所述的基于大数据的软件工程知识库的自动化构建方法。
CN201810322489.2A 2018-04-11 2018-04-11 基于大数据的软件工程知识库的自动化构建方法及系统 Withdrawn CN108573308A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810322489.2A CN108573308A (zh) 2018-04-11 2018-04-11 基于大数据的软件工程知识库的自动化构建方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810322489.2A CN108573308A (zh) 2018-04-11 2018-04-11 基于大数据的软件工程知识库的自动化构建方法及系统

Publications (1)

Publication Number Publication Date
CN108573308A true CN108573308A (zh) 2018-09-25

Family

ID=63574636

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810322489.2A Withdrawn CN108573308A (zh) 2018-04-11 2018-04-11 基于大数据的软件工程知识库的自动化构建方法及系统

Country Status (1)

Country Link
CN (1) CN108573308A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109145379A (zh) * 2018-07-20 2019-01-04 武汉市测绘研究院 一种建筑物层高图智能化绘制系统及管理方法
CN111366783A (zh) * 2020-03-18 2020-07-03 卫爱静 一种基于物联网的变压器运行参数在线监测系统及方法
CN111580786A (zh) * 2020-05-06 2020-08-25 厦门理工学院 基于互联网+的软件工程开发系统
CN113949571A (zh) * 2021-10-18 2022-01-18 安天科技集团股份有限公司 一种基于行为特征知识库的软件行为识别方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7870117B1 (en) * 2006-06-01 2011-01-11 Monster Worldwide, Inc. Constructing a search query to execute a contextual personalized search of a knowledge base
US20130132327A1 (en) * 2011-11-23 2013-05-23 Tata Consultancy Services Limited Self configuring knowledge base representation
CN106875014A (zh) * 2017-03-02 2017-06-20 上海交通大学 基于半监督学习的软件工程知识库的自动化构建实现方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7870117B1 (en) * 2006-06-01 2011-01-11 Monster Worldwide, Inc. Constructing a search query to execute a contextual personalized search of a knowledge base
US20130132327A1 (en) * 2011-11-23 2013-05-23 Tata Consultancy Services Limited Self configuring knowledge base representation
CN106875014A (zh) * 2017-03-02 2017-06-20 上海交通大学 基于半监督学习的软件工程知识库的自动化构建实现方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109145379A (zh) * 2018-07-20 2019-01-04 武汉市测绘研究院 一种建筑物层高图智能化绘制系统及管理方法
CN109145379B (zh) * 2018-07-20 2023-08-25 武汉市测绘研究院 一种建筑物层高图智能化绘制系统及管理方法
CN111366783A (zh) * 2020-03-18 2020-07-03 卫爱静 一种基于物联网的变压器运行参数在线监测系统及方法
CN111580786A (zh) * 2020-05-06 2020-08-25 厦门理工学院 基于互联网+的软件工程开发系统
CN113949571A (zh) * 2021-10-18 2022-01-18 安天科技集团股份有限公司 一种基于行为特征知识库的软件行为识别方法及系统
CN113949571B (zh) * 2021-10-18 2023-12-22 安天科技集团股份有限公司 一种基于行为特征知识库的软件行为识别方法及系统

Similar Documents

Publication Publication Date Title
Sikorski et al. Blockchain technology in the chemical industry: Machine-to-machine electricity market
Zhang et al. Towards Dependable, Scalable, and Pervasive Distributed Ledgers with Blockchains.
Mohammed et al. Hyperledger, Ethereum and blockchain technology: a short overview
Florêncio et al. Password Portfolios and the {Finite-Effort} User: Sustainably Managing Large Numbers of Accounts
CN108573308A (zh) 基于大数据的软件工程知识库的自动化构建方法及系统
Chen et al. Differentially private transit data publication: a case study on the montreal transportation system
US20210089670A1 (en) Hierarchical temporal memory for access control
Jia et al. ElasticChain: Support very large blockchain by reducing data redundancy
CN109947740B (zh) 区块链系统的性能优化方法及装置
CN102571771B (zh) 一种云存储系统的安全认证方法
US11468044B2 (en) Optimizations for verification of interactions system and method using probability density functions
CN110334053A (zh) 一种基于区块链的数据存证数据处理方法
Huang et al. Towards trusted services: Result verification schemes for MapReduce
Wang et al. Bft in blockchains: From protocols to use cases
Filatovas et al. A MCDM-based framework for blockchain consensus protocol selection
Fan et al. Scalable blockchain storage systems: research progress and models
CN109639436A (zh) 基于盐值的数据持有性验证方法及终端设备
Li et al. Blockchain-enabled data provenance in cloud datacenter reengineering
Guo et al. Dynamic proof of data possession and replication with tree sharing and batch verification in the cloud
CN108416221A (zh) 一种云环境中安全的相似数据拥有证明方案
Lee et al. Blockchain-based perfect sharing project platform based on the proof of atomicity consensus algorithm
CN105306486A (zh) 一种基于马尔科夫过程的药检云计算安全状态评价方法
CN104253687A (zh) 降低验证效率方法、生成验证码方法、相关系统及服务器
CN110149198A (zh) 一种自主可控地对数据进行安全保护与存储的系统和方法
CN113342418A (zh) 基于区块链的分布式机器学习任务卸载方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20180925