CN107977575A - 一种基于私有云平台的代码组成分析系统和方法 - Google Patents
一种基于私有云平台的代码组成分析系统和方法 Download PDFInfo
- Publication number
- CN107977575A CN107977575A CN201711380812.3A CN201711380812A CN107977575A CN 107977575 A CN107977575 A CN 107977575A CN 201711380812 A CN201711380812 A CN 201711380812A CN 107977575 A CN107977575 A CN 107977575A
- Authority
- CN
- China
- Prior art keywords
- code
- privately owned
- theme
- owned cloud
- cloud platform
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/50—Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
- G06F21/55—Detecting local intrusion or implementing counter-measures
- G06F21/56—Computer malware detection or handling, e.g. anti-virus arrangements
- G06F21/562—Static detection
- G06F21/563—Static detection by source code analysis
Landscapes
- Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Virology (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于私有云平台的代码组成分析系统和方法,它涉及代码安全分析技术领域。本发明基于私有云计算的多任务并行高速处理平台,采用自动化的网络收集技术,通过在线收集构建代码知识库与知识图谱,使用代码混源技术,先识别混源代码的组成,如开源代码、闭源代码、恶意代码和可疑代码,再与代码安全漏洞关联,实现对代码安全的量化评估,构建混源代码组成量化分析评估体系,可准确量化软件代码组成,减少软件安全隐患,发现软件知识产权风险,科学评价软件自主化水平。
Description
技术领域
本发明涉及的是代码安全分析技术领域,具体涉及一种基于私有云平台的代码组成分析系统和方法。
背景技术
随着信息化建设的发展,软件作为信息化建设的核心组成要素,其所占的比重会越来越大。软件开发已经从知识密集型向劳动密集型行业转化,软件代码复用、功能模块化、开源代码使用、第三方插件应用等快速开发方法已成为普遍现象,软件的安全性风险日益增大。开展自主代码组成分析技术研究,解决软件开源代码、第三方插件、私有代码重用所带来的合规性、安全性、自主可控性等方面的风险,已成为我国当前信息化建设中需迫切解决的重要问题。目前,对海量软件进行代码审计,将成为科研订购部门、试验鉴定部门、软件测评中心等部门的重点工作之一,建设完善的用于支撑工作开展的软件代码组成分析系统已成为迫切需求。
综上所述,本发明设计了一种基于私有云平台的代码组成分析系统和方法。
发明内容
针对现有技术上存在的不足,本发明目的是在于提供一种基于私有云平台的代码组成分析系统和方法,基于私有云计算的多任务并行高速处理平台,采用自动化的网络收集技术,通过在线收集构建代码知识库与知识图谱,使用代码混源技术,先识别混源代码的组成,如开源代码、闭源代码、恶意代码和可疑代码,再与代码安全漏洞关联,实现对代码安全的量化评估,构建混源代码组成量化分析评估体系,可准确量化软件代码组成,减少软件安全隐患,发现软件知识产权风险,科学评价软件自主化水平。
为了实现上述目的,本发明是通过如下的技术方案来实现:一种基于私有云平台的代码组成分析系统,包括项目管理子系统、代码分析子系统、分析评估子系统、代码收集子系统和代码知识库子系统;
所述的代码收集子系统利用网络爬虫技术获取互联网代码和安全漏洞信息,提供持续在线、站点轮询和代码文件自动过滤等技术能力,实现对网络开源二进制代码和安全漏洞信息的高效抓取,实现代码和安全信息的持续、全面、自动的收集和存储。
所述的代码收集子系统应用的关键技术包括:基于代码主题的互联网爬虫技术和知识库增量管理与冗余备份方法。
所述的代码知识库子系统利用互联网收集到的代码和安全漏洞数据建立代码知识库,存储处理过后的代码多级特征,按危害等级管理安全漏洞,提供代码文件、代码多级特征、安全漏洞之间的数据关联能力,形成代码的大数据资源,构建代码知识图谱。
所述的代码知识库子系统应用的关键技术包括:基于分级特征的知识图谱构建方法和软件代码安全风险知识管理技术。
所述的代码分析子系统应用的关键技术包括:基于关键字的开源代码分析技术、混源代码多级特征分析与检测技术、变尺度滚动哈希二进制代码分析技术和基于反汇编的代码多级特征分析技术。
所述的代码评估子系统负责对代码分析结果的量化评估和可视化展示,利用代码分析结果构建评估体系,根据选择度量元、获取评价指标、建立评估要素之间的相互关系,实现代码组成量化评估、许可证合规性评估、代码风险评估和代码自主化评估能力,并将上述量化评估结果以用户易理解的形式进行可视化展示。
所述的代码评估子系统应用的关键技术包括:代码组成量化评估、代码许可证合规性评估、代码安全风险评估和软件代码自主化评估。
所述的项目管理子系统根据代码分析组成任务管理需求,实现对用户进行角色密码管理、用户群组权限控制、代码版本和信息描述、源文件和特征分类存储、代码分析结果关联检索等能力。此外,可对历史代码分析项目进行归档、分类存储和结果检索。
一种基于私有云平台的代码组成分析方法,包括代码知识库在线收集与知识图谱构建方法、混源代码智能检测与分析的方法、基于私有云平台的计算多任务并行高速处理方法、混源代码组成量化分析评估方法。
本发明的有益效果:基于私有云计算的多任务并行高速处理平台,采用自动化的网络收集技术,通过在线收集构建代码知识库与知识图谱,使用代码混源技术,先识别混源代码的组成,如开源代码、闭源代码、恶意代码和可疑代码,再与代码安全漏洞关联,实现对代码安全的量化评估,构建混源代码组成量化分析评估体系,可准确量化软件代码组成,减少软件安全隐患,发现软件知识产权风险,科学评价软件自主化水平。
附图说明
下面结合附图和具体实施方式来详细说明本发明;
图1为本发明的系统图;
图2为本发明的项目管理子系统图;
图3为本发明的代码分析子系统图;
图4为本发明的分析评估子系统图;
图5为本发明的代码知识库子系统图;
图6为本发明的代码收集子系统图;
图7为本发明的私有云平台子系统图;
图8为本发明的系统功能组成图。
具体实施方式
为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明。
参照图1-8,本具体实施方式采用以下技术方案:一种基于私有云平台的代码组成分析系统,包括项目管理子系统、代码分析子系统、分析评估子系统、代码收集子系统和代码知识库子系统;
所述的代码收集子系统利用网络爬虫技术获取互联网代码和安全漏洞信息,提供持续在线、站点轮询和代码文件自动过滤等技术能力,实现对网络开源二进制代码和安全漏洞信息的高效抓取,实现代码和安全信息的持续、全面、自动的收集和存储。
所述的代码收集子系统应用的关键技术包括:基于代码主题的互联网爬虫技术和知识库增量管理与冗余备份方法。
所述的代码知识库子系统利用互联网收集到的代码和安全漏洞数据建立代码知识库,存储处理过后的代码多级特征,按危害等级管理安全漏洞,提供代码文件、代码多级特征、安全漏洞之间的数据关联能力,形成代码的大数据资源,构建代码知识图谱。
所述的代码知识库子系统应用的关键技术包括:基于分级特征的知识图谱构建方法和软件代码安全风险知识管理技术。
所述的代码分析子系统应用的关键技术包括:基于关键字的开源代码分析技术、混源代码多级特征分析与检测技术、变尺度滚动哈希二进制代码分析技术和基于反汇编的代码多级特征分析技术。
所述的代码评估子系统负责对代码分析结果的量化评估和可视化展示,利用代码分析结果构建评估体系,根据选择度量元、获取评价指标、建立评估要素之间的相互关系,实现代码组成量化评估、许可证合规性评估、代码风险评估和代码自主化评估能力,并将上述量化评估结果以用户易理解的形式进行可视化展示。
所述的代码评估子系统应用的关键技术包括:代码组成量化评估、代码许可证合规性评估、代码安全风险评估和软件代码自主化评估。
所述的项目管理子系统根据代码分析组成任务管理需求,实现对用户进行角色密码管理、用户群组权限控制、代码版本和信息描述、源文件和特征分类存储、代码分析结果关联检索等能力。此外,可对历史代码分析项目进行归档、分类存储和结果检索。
一种基于私有云平台的代码组成分析方法,包括代码知识库在线收集与知识图谱构建方法、混源代码智能检测与分析的方法、基于私有云平台的计算多任务并行高速处理方法、混源代码组成量化分析评估方法。
所述的代码知识库在线收集与知识图谱构建方法的一个方面,基于代码主题的互联网爬虫技术是根据特定的主题,在网络上访问与主题相关的链接,进而获取与特定主题相关的信息。主题爬虫根据一定的主题有针对性地在网络上获取信息,分析网页的主题内容,过滤掉与主题无关的链接,保留与主题相关的链接。
值得注意的是,所述的代码知识库在线收集与知识图谱构建方法的一个方面,Fish-Search算法将主题爬虫爬取网页的过程形象地表示为鱼群在大海里觅食的过程。一个链接用一条鱼进行表示。主题相关信息用鱼的食物进行表示。该算法具有三个重要的参数搜索深度depth、搜索宽度width(即每个页面最多能够爬取的子页面的数目)、得分score(主题相关度,表示的URL优先级)。当鱼找到食物(发现主题相关网页,相关网页的子链接的前a*width个的score值设为1,其余设为0),它继续繁殖并且繁殖能力增强(width增加),它繁殖的后代寿命与它相同(depth不变);当鱼没有找到食物(没有发现主题相关网页,子链接的前width个的score值设为0.5,其余设为时0),它的繁殖能力不变(width不变),它的后代寿命缩短(depth-1);当鱼进入污染区(网页不存在或读取时间超出给定值),则这条鱼死去(放弃对该链接的爬行)。
当一个网页被爬取之后,解析该网页并找出其所有的子链接(URL),如果子链接深度为0,则停止这个方向的搜索如果深度大于0,则将其根据下述策略放入URL队列中:
主题相关网页的前a*width个子链接加入URL队列的首部;
主题不相关网页的前width个子链接放入前一项之后;
剩下的子链接URL放入尾部。
值得注意的是,所述的代码知识库在线收集与知识图谱构建方法的一个方面,shark-search算法是在fish-search算法的基础上进行了改进。首先,用连续的值函数取值(介于0-1之间)来表示网页的主题相关性,而不是像fish-search算法那样采用离散的二值判断;其次,引入了锚文本、锚文本上下文和父链接相关性的继承值来计算URL的主题相关性。这使得shark-search算法更加准确地表示的主题相关性。但是在网页中若存在大量的噪声链接的话,shark-search算法很难计算其网页与主题的相关程度,很容易提高噪声链接的优先级。
值得注意的是,所述代码知识库在线收集与知识图谱构建方法的一个方面,BestFirst Search算法首先访问与主题相关度最高的页面。在Best First Search算法中,首先给定待爬取的URL队列,然后根据主题关键词与网页中的文字内容的相关度来计算URL的优先级。判断是否相关的方法是如果字符串或其对应的锚文本中含有主题关键词,则相关。待爬取网页相关度越大,则优先级越高。若相关,则将其放入已下载URL队列中。如果待爬取的队列的缓冲区已满,则从队列中移去优先级最低的URL。由于在关键词较多的情况下,URL字符串和锚文本并不能很好的反映主题,所以Best First Search算法比较适用于单个关键词的主题而不太适用于多个关键词的主题。除此之外,在URL字符串中,大部分是英文,很少包含中文,所以Best First Search算法往往忽略那些URL字符串中包含关键词汉语拼音的网页,而很多这种类型的网页往往是主题相关的。
值得注意的是,所述的代码知识库在线收集与知识图谱构建方法的一个方面,算法HITS中,根据用户的查询请求,每个页面有两个权值,权值由网页链入的链接所决定和权值由网页链出的链接所决定。通过计算这两种类型的权值,提取两种类型的重要网页:authority网页是指与查询主题上下文最为相关且具有权威性;hub网页是指本身内容未必具有权威性但包含多个指向authority的超链接。
值得注意的是,所述的代码知识库在线收集与知识图谱构建方法的一个方面,PageRank算法中,若网页A存在有链接指向网页B,则增加网页的重要性。特别地,当A是重要的网页,则B的重要性也提高。
基于链接结构的主题爬行策略通过分析网页超链接所包含的信息,得到网页的重要性,并且以此决定爬虫的爬行顺序。因此,每当下载完新网页时,待爬行队列中网页的优先级也需要重新进行计算,这个计算量是很大的,影响了主题爬虫的速度。基于链接结构的主题爬行策略更适合于发现权威网页,以此进行网页排序,而并不适合于引导主题爬虫的爬行。
基于链接结构的主题爬行策略也忽略了页面的主题内容相关性。在实际应用中,项目将两种爬行策略相结合使用,利用各自的优点来弥补各自的不足,在爬行过程中,既考虑网页的文本内容,又考虑其链接信息。这样不仅可以提高爬行内容与主题的相关度,还可以提高爬行的覆盖率。
值得注意的是,所述的混源代码智能检测与分析的方法的一个方面,使用属性计数法提取特征值时只对代码的一些统计属性进行处理,而不考虑代码的内部结构。例如前面提到的对要提取特征值的代码提取四个值:n1=单一操作符的数量,n2=单一操作数的数量,N1=所有操作符的总数,N2=所有操作数的总数。根据这四个基本属性,定义:n=n1+n2为词汇量,N=N1+N2为执行长度,再依此计算出代码的容量:V=Nlog2(n),然后再将这些信息组合生成一个特征向量H(n,N,V)。
值得注意的是,所述的混源代码智能检测与分析的方法的一个方面,词频统计法源于信息检索技术中的向量空间模型。这类方法首先要统计每个代码段中各个词法元素出现的频率,并构成特征向量,最后采用向量空间模型的点积或者余弦公式来度量两个代码段的相似性。该方法就是对开源代码中的词元进行词频统计。n1为操作符的种类数,n2为操作数的种类数,N1为所有操作符总数,N2为所有操作数总数。并由此计算出:
词汇量:n=n1+n2,长度:N=N1+N2,容量:V=Nlog2(n),然后可用Halstead特征向量:H(n,N,V)来标志一段代码。
所述的基于私有云平台的计算多任务并行高速处理方法的一个方面,调度算法就是根据用户提交的任务需求以及任务对资源的信任效益值需求,采用适当的策略将用户任务集合T={t1,t2,...,tn}中n个相互独立的任务分配到虚拟化的资源池M={m1,m2,...,mm}中m个可用资源上。在私有云计算环境中,m个资源和n个任务求映射方案map=(a,s)。其中a:T→M表示资源分配的映射,a(i)=j表示将ti分配到mj上;s:{(i,a(i))|i∈T}→N={1,2,...,n}表示在资源上的任务调度函数,s(i,j)=k表示在计算资源mj上第k个执行的任务是ti,在满足最大信任效益值Maximize TrustUtil(map)的情况下,进行多资源选择,利用最短完成时间MCT调节资源负载,从而使得任务执行时间跨度最短,即Minimize makespan(map)。
本具体实施方式基于私有云计算的多任务并行高速处理平台,采用自动化的网络收集技术,通过在线收集构建代码知识库与知识图谱,使用代码混源技术,先识别混源代码的组成,如开源代码、闭源代码、恶意代码和可疑代码,再与代码安全漏洞关联,实现对代码安全的量化评估,构建混源代码组成量化分析评估体系,可准确量化软件代码组成,减少软件安全隐患,发现软件知识产权风险,科学评价软件自主化水平。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (11)
1.一种基于私有云平台的代码组成分析系统,其特征在于,包括项目管理子系统、代码分析子系统、分析评估子系统、代码收集子系统和代码知识库子系统;
所述的代码收集子系统利用网络爬虫技术获取互联网代码和安全漏洞信息,提供持续在线、站点轮询和代码文件自动过滤的技术能力,实现对网络开源二进制代码和安全漏洞信息的高效抓取,实现代码和安全信息的持续、全面、自动的收集和存储;
所述的代码收集子系统应用的关键技术包括:基于代码主题的互联网爬虫技术和知识库增量管理与冗余备份方法;
所述的代码知识库子系统利用互联网收集到的代码和安全漏洞数据建立代码知识库,存储处理过后的代码多级特征,按危害的级管理安全漏洞,提供代码文件、代码多级特征、安全漏洞之间的数据关联能力,形成代码的大数据资源,构建代码知识图谱;
所述的代码知识库子系统应用的关键技术包括:基于分级特征的知识图谱构建方法和软件代码安全风险知识管理技术;
所述的代码分析子系统应用的关键技术包括:基于关键字的开源代码分析技术、混源代码多级特征分析与检测技术、变尺度滚动哈希二进制代码分析技术和基于反汇编的代码多级特征分析技术;
所述的代码评估子系统负责对代码分析结果的量化评估和可视化展示,利用代码分析结果构建评估体系,根据选择度量元、获取评价指标、建立评估要素之间的相互关系,实现代码组成量化评估、许可证合规性评估、代码风险评估和代码自主化评估能力,并将上述量化评估结果以用户易理解的形式进行可视化展示;
所述的代码评估子系统应用的关键技术包括:代码组成量化评估、代码许可证合规性评估、代码安全风险评估和软件代码自主化评估;
所述的项目管理子系统根据代码分析组成任务管理需求,实现对用户进行角色密码管理、用户群组权限控制、代码版本和信息描述、源文件和特征分类存储、代码分析结果关联检索的能力。
2.一种基于私有云平台的代码组成分析方法,其特征在于,包括代码知识库在线收集与知识图谱构建方法、混源代码智能检测与分析的方法、基于私有云平台的计算多任务并行高速处理方法、混源代码组成量化分析评估方法。
3.根据权利要求2所述的一种基于私有云平台的代码组成分析方法,其特征在于,所述的代码知识库在线收集与知识图谱构建方法,基于代码主题的互联网爬虫技术是根据特定的主题,在网络上访问与主题相关的链接,进而获取与特定主题相关的信息;主题爬虫根据一定的主题有针对性地在网络上获取信息,分析网页的主题内容,过滤掉与主题无关的链接,保留与主题相关的链接。
4.根据权利要求2所述的一种基于私有云平台的代码组成分析方法,其特征在于,所述的代码知识库在线收集与知识图谱构建方法,Fish-Search算法将主题爬虫爬取网页的过程形象地表示为鱼群在大海里觅食的过程,一个链接用一条鱼进行表示;主题相关信息用鱼的食物进行表示,该算法具有三个重要的参数搜索深度depth、搜索宽度width、得分score;当鱼找到食物,它继续繁殖并且繁殖能力增强,它繁殖的后代寿命与它相同;当鱼没有找到食物,它的繁殖能力不变,它的后代寿命缩短;当鱼进入污染区,则这条鱼死去;
当一个网页被爬取之后,解析该网页并找出其所有的子链接(URL),如果子链接深度为0,则停止这个方向的搜索如果深度大于0,则将其根据下述策略放入URL队列中:
主题相关网页的前a*width个子链接加入URL队列的首部;
主题不相关网页的前width个子链接放入前一项之后;
剩下的子链接URL放入尾部。
5.根据权利要求2所述的一种基于私有云平台的代码组成分析方法,其特征在于,所述的代码知识库在线收集与知识图谱构建方法,shark-search算法是在fish-search算法的基础上进行了改进,首先,用连续介于0-1之间的值函数取值来表示网页的主题相关性;其次,引入了锚文本、锚文本上下文和父链接相关性的继承值来计算URL的主题相关性。
6.根据权利要求2所述的一种基于私有云平台的代码组成分析方法,其特征在于,所述代码知识库在线收集与知识图谱构建方法,Best First Search算法首先访问与主题相关度最高的页面,在Best First Search算法中,首先给定待爬取的URL队列,然后根据主题关键词与网页中的文字内容的相关度来计算URL的优先级;判断是否相关的方法是如果字符串或其对应的锚文本中含有主题关键词,则相关;待爬取网页相关度越大,则优先级越高;若相关,则将其放入已下载URL队列中;如果待爬取的队列的缓冲区已满,则从队列中移去优先级最低的URL。
7.根据权利要求2所述的一种基于私有云平台的代码组成分析方法,其特征在于,所述的代码知识库在线收集与知识图谱构建方法,算法HITS中,根据用户的查询请求,每个页面有两个权值,权值由网页链入的链接所决定和权值由网页链出的链接所决定;通过计算这两种类型的权值,提取两种类型的重要网页:authority网页是指与查询主题上下文最为相关且具有权威性;hub网页是指本身内容未必具有权威性但包含多个指向authority的超链接。
8.根据权利要求2所述的一种基于私有云平台的代码组成分析方法,其特征在于,所述的代码知识库在线收集与知识图谱构建方法,PageRank算法中,若网页A存在有链接指向网页B,则增加网页的重要性。
9.根据权利要求2所述的一种基于私有云平台的代码组成分析方法,其特征在于,所述的混源代码智能检测与分析的方法,使用属性计数法提取特征值时只对代码的一些统计属性进行处理,而不考虑代码的内部结构。
10.根据权利要求2所述的一种基于私有云平台的代码组成分析方法,其特征在于,所述的混源代码智能检测与分析的方法,词频统计法源于信息检索技术中的向量空间模型;首先要统计每个代码段中各个词法元素出现的频率,并构成特征向量,最后采用向量空间模型的点积或者余弦公式来度量两个代码段的相似性;该方法就是对开源代码中的词元进行词频统计,n1为操作符的种类数,n2为操作数的种类数,N1为所有操作符总数,N2为所有操作数总数,并由此计算出:
词汇量:n=n1+n2,长度:N=N1+N2,容量:V=Nlog2(n),然后可用Halstead特征向量:H(n,N,V)来标志一段代码。
11.根据权利要求2所述的一种基于私有云平台的代码组成分析方法,其特征在于,所述的基于私有云平台的计算多任务并行高速处理方法,调度算法就是根据用户提交的任务需求以及任务对资源的信任效益值需求,采用适当的策略将用户任务集合T={t1,t2,...,tn}中n个相互独立的任务分配到虚拟化的资源池M={m1,m2,...,mm}中m个可用资源上;在私有云计算环境中,m个资源和n个任务求映射方案map=(a,s);其中a:T→M表示资源分配的映射,a(i)=j表示将ti分配到mj上;s:{(i,a(i))|i∈T}→N={1,2,...,n}表示在资源上的任务调度函数,s(i,j)=k表示在计算资源mj上第k个执行的任务是ti,在满足最大信任效益值Maximize TrustUtil(map)的情况下,进行多资源选择,利用最短完成时间MCT调节资源负载,从而使得任务执行时间跨度最短,即Minimize makespan(map)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711380812.3A CN107977575B (zh) | 2017-12-20 | 2017-12-20 | 一种基于私有云平台的代码组成分析系统和方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711380812.3A CN107977575B (zh) | 2017-12-20 | 2017-12-20 | 一种基于私有云平台的代码组成分析系统和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107977575A true CN107977575A (zh) | 2018-05-01 |
CN107977575B CN107977575B (zh) | 2021-03-09 |
Family
ID=62006859
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711380812.3A Expired - Fee Related CN107977575B (zh) | 2017-12-20 | 2017-12-20 | 一种基于私有云平台的代码组成分析系统和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107977575B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108985068A (zh) * | 2018-06-26 | 2018-12-11 | 广东电网有限责任公司信息中心 | 漏洞快速感知、定位及验证的方法与系统 |
CN109858740A (zh) * | 2018-12-21 | 2019-06-07 | 中化资本有限公司 | 企业风险的评估方法、装置、计算机设备及存储介质 |
CN109918294A (zh) * | 2019-01-29 | 2019-06-21 | 刘建鹏 | 一种混源软件自主可控性检测方法及系统 |
CN110147235A (zh) * | 2019-03-29 | 2019-08-20 | 中国科学院信息工程研究所 | 一种源代码与二进制代码间的语义比对方法和装置 |
CN110162976A (zh) * | 2019-02-20 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 风险评估方法、装置及终端 |
CN110990249A (zh) * | 2019-10-11 | 2020-04-10 | 平安科技(深圳)有限公司 | 代码扫描结果处理方法、装置、计算机设备及存储介质 |
CN111291331A (zh) * | 2019-06-27 | 2020-06-16 | 北京关键科技股份有限公司 | 混源文件许可冲突检测方法 |
CN111367566A (zh) * | 2019-06-27 | 2020-07-03 | 北京关键科技股份有限公司 | 混源代码特征提取与匹配方法 |
CN112084309A (zh) * | 2020-09-17 | 2020-12-15 | 北京中科微澜科技有限公司 | 基于开源软件图谱的许可证选取方法和系统 |
CN112187716A (zh) * | 2020-08-26 | 2021-01-05 | 中国科学院信息工程研究所 | 一种网络攻击中恶意代码的知识图谱展示方法 |
CN113139192A (zh) * | 2021-04-09 | 2021-07-20 | 扬州大学 | 基于知识图谱的第三方库安全风险分析方法及系统 |
CN113656123A (zh) * | 2021-07-28 | 2021-11-16 | 上海纽盾科技股份有限公司 | 面向等保测评的信息评估方法、装置及系统 |
CN110298669B (zh) * | 2019-06-27 | 2023-09-12 | 上海麦克风文化传媒有限公司 | 一种基于图形结构的iOS代充风险控制系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102799814A (zh) * | 2012-06-28 | 2012-11-28 | 北京奇虎科技有限公司 | 一种钓鱼网站查找系统及方法 |
US20150205626A1 (en) * | 2011-05-12 | 2015-07-23 | Microsoft Technology Licensing, Llc | Emulating mixed-code programs using a virtual machine instance |
CN105740132A (zh) * | 2016-01-25 | 2016-07-06 | 中国人民解放军国防科学技术大学 | 基于修改日志的软件包来源自动分析方法 |
CN105740335A (zh) * | 2016-01-22 | 2016-07-06 | 山东合天智汇信息技术有限公司 | 一种基于titan的企业信息分析平台及其构建方法 |
US9721098B2 (en) * | 2014-12-12 | 2017-08-01 | International Business Machines Corporation | Normalizing and detecting inserted malicious code |
-
2017
- 2017-12-20 CN CN201711380812.3A patent/CN107977575B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150205626A1 (en) * | 2011-05-12 | 2015-07-23 | Microsoft Technology Licensing, Llc | Emulating mixed-code programs using a virtual machine instance |
CN102799814A (zh) * | 2012-06-28 | 2012-11-28 | 北京奇虎科技有限公司 | 一种钓鱼网站查找系统及方法 |
US9721098B2 (en) * | 2014-12-12 | 2017-08-01 | International Business Machines Corporation | Normalizing and detecting inserted malicious code |
CN105740335A (zh) * | 2016-01-22 | 2016-07-06 | 山东合天智汇信息技术有限公司 | 一种基于titan的企业信息分析平台及其构建方法 |
CN105740132A (zh) * | 2016-01-25 | 2016-07-06 | 中国人民解放军国防科学技术大学 | 基于修改日志的软件包来源自动分析方法 |
Non-Patent Citations (1)
Title |
---|
吴昊: "垂直搜索引擎关键技术研究及分布式实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108985068A (zh) * | 2018-06-26 | 2018-12-11 | 广东电网有限责任公司信息中心 | 漏洞快速感知、定位及验证的方法与系统 |
CN109858740A (zh) * | 2018-12-21 | 2019-06-07 | 中化资本有限公司 | 企业风险的评估方法、装置、计算机设备及存储介质 |
CN109858740B (zh) * | 2018-12-21 | 2022-03-25 | 中化资本有限公司 | 企业风险的评估方法、装置、计算机设备及存储介质 |
CN109918294A (zh) * | 2019-01-29 | 2019-06-21 | 刘建鹏 | 一种混源软件自主可控性检测方法及系统 |
CN109918294B (zh) * | 2019-01-29 | 2022-06-07 | 刘建鹏 | 一种混源软件自主可控性检测方法及系统 |
CN110162976B (zh) * | 2019-02-20 | 2023-04-18 | 腾讯科技(深圳)有限公司 | 风险评估方法、装置及终端 |
CN110162976A (zh) * | 2019-02-20 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 风险评估方法、装置及终端 |
CN110147235B (zh) * | 2019-03-29 | 2021-01-01 | 中国科学院信息工程研究所 | 一种源代码与二进制代码间的语义比对方法和装置 |
CN110147235A (zh) * | 2019-03-29 | 2019-08-20 | 中国科学院信息工程研究所 | 一种源代码与二进制代码间的语义比对方法和装置 |
CN110298669B (zh) * | 2019-06-27 | 2023-09-12 | 上海麦克风文化传媒有限公司 | 一种基于图形结构的iOS代充风险控制系统 |
CN111291331B (zh) * | 2019-06-27 | 2022-02-22 | 北京关键科技股份有限公司 | 混源文件许可冲突检测方法 |
CN111367566A (zh) * | 2019-06-27 | 2020-07-03 | 北京关键科技股份有限公司 | 混源代码特征提取与匹配方法 |
CN111291331A (zh) * | 2019-06-27 | 2020-06-16 | 北京关键科技股份有限公司 | 混源文件许可冲突检测方法 |
CN110990249A (zh) * | 2019-10-11 | 2020-04-10 | 平安科技(深圳)有限公司 | 代码扫描结果处理方法、装置、计算机设备及存储介质 |
CN110990249B (zh) * | 2019-10-11 | 2023-11-14 | 平安科技(深圳)有限公司 | 代码扫描结果处理方法、装置、计算机设备及存储介质 |
CN112187716A (zh) * | 2020-08-26 | 2021-01-05 | 中国科学院信息工程研究所 | 一种网络攻击中恶意代码的知识图谱展示方法 |
CN112084309A (zh) * | 2020-09-17 | 2020-12-15 | 北京中科微澜科技有限公司 | 基于开源软件图谱的许可证选取方法和系统 |
CN112084309B (zh) * | 2020-09-17 | 2024-06-04 | 北京中科微澜科技有限公司 | 基于开源软件图谱的许可证选取方法和系统 |
CN113139192A (zh) * | 2021-04-09 | 2021-07-20 | 扬州大学 | 基于知识图谱的第三方库安全风险分析方法及系统 |
CN113139192B (zh) * | 2021-04-09 | 2024-04-19 | 扬州大学 | 基于知识图谱的第三方库安全风险分析方法及系统 |
CN113656123A (zh) * | 2021-07-28 | 2021-11-16 | 上海纽盾科技股份有限公司 | 面向等保测评的信息评估方法、装置及系统 |
CN113656123B (zh) * | 2021-07-28 | 2023-05-16 | 上海纽盾科技股份有限公司 | 面向等保测评的信息评估方法、装置及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107977575B (zh) | 2021-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107977575A (zh) | 一种基于私有云平台的代码组成分析系统和方法 | |
CN106685936B (zh) | 网页篡改的检测方法及装置 | |
CN109714341A (zh) | 一种Web恶意攻击识别方法、终端设备及存储介质 | |
US20160140344A1 (en) | Security information management system and security information management method | |
KR20180072167A (ko) | 유사특허 추출 시스템 및 그 방법 | |
KR101505546B1 (ko) | 텍스트 마이닝을 이용한 키워드 도출 방법 | |
CN102591965A (zh) | 一种黑链检测的方法及装置 | |
US20200394318A1 (en) | Privacy trustworthiness based api access | |
CN114338195A (zh) | 基于改进孤立森林算法的web流量异常检测方法及装置 | |
WO2021210992A9 (en) | Systems and methods for determining entity attribute representations | |
CN103049484A (zh) | 一种网页危险性的识别方法和装置 | |
CN103049483A (zh) | 网页危险性的识别系统 | |
Piñeiro et al. | Web architecture for URL-based phishing detection based on Random Forest, Classification Trees, and Support Vector Machine | |
CN109344400A (zh) | 一种文献入库的判断方法和装置 | |
Hati et al. | Unvisited URL relevancy calculation in focused crawling based on Naïve Bayesian classification | |
Liu et al. | A Markov detection tree-based centralized scheme to automatically identify malicious webpages on cloud platforms | |
CN116366312A (zh) | 一种Web攻击检测方法、装置及存储介质 | |
CN109284360A (zh) | 一种专利检索自动去噪方法和装置 | |
CN109189955A (zh) | 一种自动检索关键词的确定方法和装置 | |
Zhang et al. | Research on keyword extraction and sentiment orientation analysis of educational texts | |
Liu et al. | An illegal billboard advertisement detection framework based on machine learning | |
Qureshi et al. | Detecting social polarization and radicalization | |
CN110866177B (zh) | 化工事故新闻采集方法及机器可读存储介质 | |
Park et al. | A new forecasting system using the latent dirichlet allocation (LDA) topic modeling technique | |
Huang et al. | The Weibo spammers’ identification and detection based on Bayesian-algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210309 Termination date: 20211220 |