CN108009298B - 一种互联网人物搜索信息整合分析控制方法 - Google Patents

一种互联网人物搜索信息整合分析控制方法 Download PDF

Info

Publication number
CN108009298B
CN108009298B CN201711451026.8A CN201711451026A CN108009298B CN 108009298 B CN108009298 B CN 108009298B CN 201711451026 A CN201711451026 A CN 201711451026A CN 108009298 B CN108009298 B CN 108009298B
Authority
CN
China
Prior art keywords
information
interpolation
path
state
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711451026.8A
Other languages
English (en)
Other versions
CN108009298A (zh
Inventor
刘婧
李坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Haikou College Of Economics
Original Assignee
Haikou College Of Economics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Haikou College Of Economics filed Critical Haikou College Of Economics
Priority to CN201711451026.8A priority Critical patent/CN108009298B/zh
Publication of CN108009298A publication Critical patent/CN108009298A/zh
Application granted granted Critical
Publication of CN108009298B publication Critical patent/CN108009298B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Abstract

本发明属于互联网搜索领域,公开了一种互联网人物搜索信息整合分析控制方法,利用网页信息集合模块将网页搜索模块搜索到的零碎信息进行整合,经由信息分类提取模块进行分类,将搜索信息分为身份信息、账号信息等多类,经过信息比对模块进行比对后,将未知信息存入信息存储模块或者读取信息存储模块中的已知信息。本发明能够对互联网搜索信息进行整合,且能够将信息存储于信息存储模块中以备日后使用,有利于整合互联网上分散的信息;且搜索更加高效,能够防止人工搜索的疏漏。

Description

一种互联网人物搜索信息整合分析控制方法
技术领域
本发明属于互联网搜索技术领域,尤其涉及一种互联网人物搜索信息整合分析控制方法。
背景技术
随着生活水平的提高,经济的发展,互联网在人们的生活中扮演了越来越重要的角色。互联网上的信息通常是分散分布的,碎片化比较严重,单纯的搜索获得的信息并不完整,而且互联网信息庞杂,简单的搜索方式会搜索出过多的无用信息,并没有一个存储相关信息的信息存储模块,搜索效率较低。
随着科技的快速发展和工业需求的不断提高,各种软硬件设计的复杂度也日益增加,对于可靠性和安全性的要求也不断提高。系统的可靠性,安全性和正确性已经受到了科学界和工业界的广泛关注。形式化验证和测试是解决该问题的主要方法。形式化验证方法始于20世纪60年代末的Floyd、Hoare和Manna等在程序规范和验证方面的研究。形式化验证方法分为两大类:基于定理证明和基于模型。20世纪80年代初提出的模型检测(ModelChecking)属于基于模型的形式化验证方法,思想相对简单和自动化程度高,可以广泛用于硬件电路系统和网络协议系统的验证。模型检测就是先把系统建模为有限状态转移系统,并用时态逻辑描述特验证的规范,在有限状态转移系统上进行穷尽搜索,确定规范是否被满足,若没有满足,给出反例指出为什么没有满足。模型检测面临状态爆炸问题,所谓状态爆炸问题即系统状态数随着状态规模的增加呈指数级增加。所以该领域的研究人员使用各种方法缩减搜索的状态空间,基于反例引导的抽象模型检测是常用的技术。基于反例路径的抽象细化(Counterexample-Guided Abstraction Refinement,CEGAR)技术的过程如下:给定一个模型和性质,首先通过抽象的方法生成一个抽象模型。抽象模型包含的行为可能会多于原始模型,但是,抽象模型的结构和描述都比原始模型简单,所以可以缓解状态空间爆炸问题。然后调用模型检测器,检测公式是否在抽象模型中有效。如果有效,则程序终止;否则,会给出反例路径,然后进行重构(reconstruction)过程,即在原始模型中,如果成功找到一条路径对应于反例路径,则程序结束;否则,反例路径为虚假反例路径,下一个迭代过程开始,重新生成抽象模型,进行验证。重复此过程,直到返回有效或者无效,或者状态空间爆炸造成程序停止。动态符号执行技术是一种符号执行与具体执行相结合的测试手段。符号执行是指在不执行程序的前提下,用符号值表示程序变量的值,然后模拟程序执行来进行相关分析。首先,对待分析代码构建控制流图(Control Flow Graph,CFG),它是编译器内部用有向图表示一个程序过程的抽象数据结构。在CFG上从入口节点开始模拟执行,在遇到分支节点时,使用约束求解器判定哪条分支可行,并根据预先设计的路径调度策略实现对该过程所有路径的遍历分析,最后输出每条可执行路径的分析结果。动态符号执行是以具体数值作为输入,同时启动代码模拟执行器,并从当前路径的分支语句的谓词中搜集所有符号约束。然后根据策略反转约束中的一个分支,构造一条新的可行的路径约束,并用约束求解器求解出一个可行的新的具体输入,接着符号执行引擎对新输入值进行新一轮的分析。通过使用这种输入迭代产生新输入的方法,理论上所有可行的路径都可以被计算并分析一遍。动态符号执行技术的主要瓶颈是路径爆炸问题,即随着程序中分支数的增多,路径呈指数级增加。插值是缓解路径爆炸问题的有效方法,主要是一种搜索剪枝的思想,通过利用不可行路径给行节点标记插值,插值是指一定不会到达被标记为错误行的条件约束。对于分支节点,若该节点的每个分支都被探索过,那么在该节点标记的插值为全插值,否则为半插值。在动态符号执行中,若从开始节点到当前节点的路径约束满足当前节点的全插值,则该路径可被归并,即不被探索。
对于大规模系统,抽象模型在进行验证时细化次数过多,且模型检测的瓶颈是状态繁琐问题,因此提出一种行之有效并加快抽象模型验证的方法便于快速搜索刻不容缓。
综上,现有技术存在的问题是:互联网上的信息通常是分散分布的,碎片化比较严重,单纯的搜索获得的信息并不完整,而且互联网信息庞杂,简单的搜索方式会搜索出过多的无用信息,并没有一个存储相关信息的信息存储模块,搜索效率较低。
发明内容
针对现有技术存在的问题,本发明提供了一种互联网人物搜索信息整合分析控制方法。
本发明是这样实现的,一种互联网人物搜索信息整合分析控制系统包括:
输入界面、信息提取模块、网页搜索模块、网页信息集合模块、信息分类提取模块、信息比对模块、信息存储模块、信息整合模块与显示模块;
输入界面,与信息提取模块连接,用户可以在输入界面输入所要搜索的信息,并传输给信息提取模块;
信息提取模块,与网页搜索模块连接,用于对用户在输入界面输入的信息进行提取,并传输给网页搜索模块;
网页搜索模块,与网页信息集合模块连接,用于对信息提取模块提取出的信息在网页上进行搜索;
网页信息集合模块,与信息分类提取模块连接,用于对搜索到的信息进行集合,能够将网页搜索模块搜索到的零碎信息进行整合;
信息分类提取模块,与信息比对模块连接,用于对集合后的信息进行分类提取,采用数据处理分析算法,对集合信息进行分析处理,利用分布式的程序算法,缩短信息处理时间;
信息比对模块,与信息存储模块和信息整合模块连接,用于比对分类提取的数据与信息存储模块中存储的数据,当信息不匹配或信息存储模块中缺少本信息时,对信息存储模块进行更新;当信息相同时,可以提取信息存储模块中的数据;
信息存储模块,与信息比对模块连接,用于存储以前所搜索到的人物信息;
信息整合模块,与显示模块连接,用于将信息比对模块中的数据进行整合,将身份信息、账户信息、社交信息等整合为所搜索人物的详细资料;
显示模块,与信息整合模块连接,用于显示信息整合模块整合后的所搜索人物的详细资料。
本发明的另一目的在于提供一种所述互联网人物搜索信息整合分析控制系统的互联网人物搜索信息整合分析控制方法,所述互联网人物搜索信息整合分析控制方法包括:
用户在输入界面输入所要搜索的信息,并将输入的信息传输给信息提取模块;信息提取模块对用户在输入界面输入的信息进行提取,并将信息传输给网页搜索模块;
网页搜索模块对信息提取模块提取出的信息在网页上进行搜索;网页信息集合模块对搜索到的信息进行集合,对网页搜索模块搜索到的零碎信息进行整合;
信息分类提取模块对集合后的信息进行分类提取,采用数据处理分析算法,对集合信息进行分析处理,利用分布式的程序算法,缩短信息处理时间;信息比对模块比对分类提取的数据与信息存储模块中存储的数据,当信息不匹配或信息存储模块中缺少本信息时,对信息存储模块进行更新;当信息相同时,可以提取信息存储模块中的数据;
信息整合模块将信息比对模块中的数据进行整合,将身份信息、账户信息、社交信息整合为所搜索人物的详细资料;显示模块显示出信息整合模块整合后的所搜索人物的详细资料。
所述分布式的程序算法包括;
步骤一,根据待验证的程序,生成控制流图CFG,给CFG中的结点添加3个属性:R插值,S插值和E插值,R插值是结点可达的约束条件,判断一个状态的可达性;S插值和E插值对路径进行规约,加快程序的验证;给CFG的边添加属性W;一条边的W值表示以该边指向的结点为根结点的子图中,还没有被遍历的分支的个数;
步骤二,根据生成的CFG,生成抽象可达图ARG,如果沿着一条路径生成一个新状态s,如果s对应的R插值被满足,说明状态s可达,继续沿着状态s遍历该路径;否则,状态s不可达,则该路径终止,遍历其他路径;对于一个可达的状态s,如果状态s对应的E插值被该路径对应的路径公式蕴含,说明沿着该状态存在一条到达目标状态的路径,程序不安全;如果状态s对应的S插值被蕴含,说明以状态为起点的所有路径都是安全的,不需要沿着状态s探索程序;如果状态s是可达的,且E插值和S插值都不被蕴含,则继续沿着状态s遍历该路径;
步骤三,在生成ARG的过程中,发现一条反例路径,到达目标状态,则需要进一步判断反例路径是否虚假;不是虚假反例,则说明程序是不安全的;否则,根据虚假反例,细化模型,分别计算并更新对应状态的R插值,S插值和E插值,执行重新生成ARG,直到找到一条真反例路径或不存在反例路径;
所述对信息存储模块进行更新的方法包括:
接收维护更新指令;
根据所述维护更新指令获取用户搜索的信息以及需要维护更新的维度表的维度表信息;
根据所述维度表信息获取预先设置的维度表配置信息;其中,所述维度表配置信息中带有所述需要维护更新的维度表所在的源数据库、所述维度表需要同步的目的数据库以及维度表操作权限信息;
根据所述用户搜索的信息以及所述维度表操作权限信息,判断所述用户搜索的信息是否满足所述维度表操作权限信息;
若所述用户搜索的信息足所述维度表操作权限信息,对所述需要维护更新的维度表进行更新操作;
将进行更新操作后的维度表同步到所述信息存储模块;
所述维度表操作权限信息包括:具有维度表操作权限的用户搜索的信息标识;
所述判断所述用户搜索的信息是否满足所述维度表操作权限信息,包括:
判断所述用户搜索的信息是否在所述具有维度表操作权限的用户搜索的信息标识中;
所述维护更新指令为增加内容指令、更改内容指令或删除内容指令;
在对所述需要维护更新的维度表进行更新操作之前,包括:
根据所述维护更新指令,确定需要维护更新的字段,并获取到所述需要维护更新的字段标识;
根据所述字段标识以及所述维度表配置信息获取到预先设置的字段配置信息;其中,所述字段配置信息包括所述字段的字段内容排序规则、字段次序信息、字段限制条件;
若所述维护更新指令为增加内容指令,所述对所述需要维护更新的维度表进行更新操作,包括:
获取所述增加内容指令对应的批量数据内容;
根据所述批量数据内容,在所述维度表中的一个或多个字段中增加字段内容;
根据所述字段内容排序规则,将所述字段内容进行排序;
根据所述字段次序信息,将维度表中的各个字段进行排序;
若所述维护更新指令为更改内容指令,所述对所述需要维护更新的维度表进行更新操作,包括:
获取所述更改内容指令对应的批量数据内容;
根据所述批量数据内容,在所述维度表中的一个或多个字段中更改字段内容;
若所述维护更新指令为删除内容指令,所述对所述需要维护更新的维度表进行更新操作,包括:
在所述维度表中的一个或多个字段中删除字段内容;
判断所述增加字段内容、更改字段内容或者删除字段内容之后的各字段是否满足所述字段限制条件;
若有字段不满足所述字段限制条件,生成提示信息;所述提示信息用于提示不满足所述字段限制条件的字段数,并提示不满足所述字段限制条件的字段相关信息;所述字段相关信息包括所述字段的所述字段标识或者字段名称;所述段相关信息为搜索的零碎信息。
进一步,所述步骤一生成待验证程序的CFG,并且初始化结点和边的属性,包括以下步骤:
(1)找到CFG中的目标结点,从目标结点开始反向遍历CFG,遍历的结点和边都保留,没有遍历到的结点和边都删除;
(2)得到裁剪后的CFG,初始化属性的值,对各个结点的三种插值进行初始化,初次遍历CFG,生成ARG的过程中,每一个结点的R插值的初始值都为{true};对于S插值,定义了为一个二元组:(F,Is),其中,F的值域为{full,half},Is的值是一个由谓词组成的合取式;对于一个结点l,如果l没有后继结点或者l的所有后继结点的S插值都是full,记为f,表示l的所有后继结点都被遍历过,则l的S插值也是full,否则,l的S插值为half,记为h,具体的形式如下:
Figure BDA0001528479470000071
l是终结点,S插值的初始值为(full,true),表示如果到达终结点,路径一定是安全的;l是目标结点,S插值的初始值为(full,false),表示如果到达目标结点,路径一定是反例路径;对于其他结点,S插值的初始值为(half,true),具体的形式如下:
Figure BDA0001528479470000081
l是目标结点,E插值的初始值为true,表示路径一定是真反例;l是终结点,E插值的初始值为false,表示路径一定不可能到达目标结点;对于其他结点,E插值的初始值为false,初始认为都不能到达目标结点;对于每一条迁移的W属性,初始值为⊥,表示还没开始遍历,其中,W的值域为{N+,⊥},N+是正整数集合;
所述步骤二中,利用W属性决定分支边的遍历顺序,同时,利用S插值和E插值,加快验证的效率,具体的步骤包括:
(1)得到一个可达状态s',根据CFG的迁移关系,产生后继状态;如果存在多个可能的后继,根据边的W值,决定遍历顺序;边的W值的优先级为:(>0)>⊥>0;如果边的W值相同,则随机选择;对于一个后继状态s,根据R插值,如果状态s不可达,则当前路径终止,遍历其他路径;如果当前状态s可达,首先判断s的E插值是否为false;如果是false,说明s[0]的后继结点还没被遍历过,跳转到(2);如果不是false,首先采用SSA原则,每一个变量至多被赋值一次,得到从初始状态s0到达s的路径公式,记为Pf(s0,…,s);用求解器判断Pf(s0,…,s)是否蕴含s的E插值;如果蕴含,则说明程序存在一条真反例,程序不安全,验证结束;否则跳转到(2);
(2)判断s的S插值是否为full插值;如果不是full插值,则跳转到(3);如果是full插值,得到从初始状态s0到达s的路径公式,记为Pf(s0,…,s),然后用求解器判断Pf(s0,…,s)是否蕴含s的S插值;如果蕴含,则说明以状态s为起点的所有路径都是安全的,不需要探索,当前路径终止,遍历其他路径;
(3)判断s是否目标状态,如果是目标状态,则发现一条反例路径,执行步骤三;如果不是,进一步判断s是否被其他状态覆盖;如果s被覆盖,则不需要探索当前路径,遍历其他路径;如果s不被覆盖,则继续探索当前路径;
(4)如果存在没有被遍历的可达状态,则跳转到(1);否则,验证结束,程序安全。
进一步,所述步骤三中优化策略包括:
在步骤一中,生成程序对应的CFG,根据目标结点,遍历整个CFG减掉不可能到达目标状态的结点和边;
在步骤三中,如果存在一条虚假反例路径,在计算三种插值的同时,计算反例路径中每一条边的W值;在步骤二中,一个状态如果存在多个后继状态,根据边的W值,决定后继状态的遍历顺序;
所述步骤三中计算插值和W属性的具体步骤包括:
1)在生成ARG的过程中,发现一条反例路径path:〈s0,e0,s1,…,en-1,sn〉;利用SMT求解器判断path是不是虚假;如果path是真反例,则程序不安全,验证结束;如果path是虚假的,则执行2);
2)计算R插值,对于状态si,0<i<n,将path划分为两部分:pre和post;pre子序列为<s0,…,si>,post子序列为<si,…,sn>,利用Craig插值公式计算新的R插值,Craig(pre,post),更新si[0]的R插值,形式化地表示为:
R-Intp(si[0])=R-Intp(si[0])∪Craig(Pf(s0,..,si),Pf(si,…,sn));
其中,Pf(s0,…,si)表示从s0到si的路径对应的路径公式;
3)计算S插值,首先找到path的可达的有效序列Π=<s0,...,sm>,0<m<n,且si状态可达,si+1状态不可达;对于Π的每一个状态si,0<i≤m,判断S插值的的第一个元素是full还是half;si[0]的所有后继结点的S插值都是full,则si[0]的S插值为full,否则,si[0]的S插值为half;具体的形式如下:
Figure BDA0001528479470000091
对于S插值的第二个元素,记为Is(si[0]),分两种情况,如果i=m,则Is(si[0])是边ei+1的路径公式取反;如果0<i<m,Is(si[0])利用Craig插值计算,记为Craig(A,B);其中,A表示从s0到si的路径公式,B是边ei对应的公式和状态si+1对应的S插值取反的合取式;具体的形式如下:
Figure BDA0001528479470000101
其中,A=Pf(s0,…,si),B=Pf(si,ei,si+1)∧!(Is(si+1[0]);从sm状态开始倒序地计算每个状态的插值,直到初始状态或者某一状态的S插值为half;
4)计算E插值,找到path的最大有效后缀序列Π=<si,…,sn>,0<i≤n;从si状态开始,利用Craig插值,倒序地计算对应的E插值,记为Craig(A,B);对于si,A是从si到sn的路径公式和sn的E插值的合取式,B是从s0到si的路径公式;对于状态sj,0<j<i,A是从sj到sj+1的路径公式和sj+1的E插值的合取式,B是从s0到sj的路径公式,具体的形式如下:
Figure BDA0001528479470000102
5)计算边的W值,根据反例路径和更新后的S插值,来计算对应边的W值,对于一条边e:(s,op,s'),如果s'的S插值是full,则e的W值为0;如果s'的S插值是half,且s'是最后一个可达状态,e的W值为s'[0]的出边的个数-1;如果s'的S插值是half,且s'不是最后一个可达状态,e的W值为两部分的和:1)s'[0]的出边中W值不为⊥的边的W值的和,2)s'[0]的出边中W值为⊥的边的个数;对于边e:(s,op,s'),s':(l',c',p')具体的形式如下:
Figure BDA0001528479470000103
6)跳转到步骤二,重新生成ARG。
本发明能够对互联网搜索信息进行整合,且能够将信息存储于信息存储模块中以备日后使用,有利于整合互联网上分散的信息;且搜索更加高效,能够防止人工搜索的疏漏。
本发明更加充分地利用了模型检测中虚假反例路径提供的信息,通过计算S插值和E插值,提高了检测的效率,使得模型检测算法可以更好地应用于大规模的程序;S插值可以判断出一个状态后续所有可能的路径序列是否都是安全的,从而避免不必要的探索,大大地减少ARG的状态数;E插值可以运用于快速地判断程序中是否存在真反例路径,加快了程序的验证,提高了效率。
本发明裁剪了CFG中无用的结点和边,进一步缩小了遍历的状态空间,在CFG的边上添加W属性,使得程序验证的效率得到进一步的提升。通过缩减抽象模型验证时的路径搜索空间从而缓解状态爆炸问题,加快验证效率。同时提供了两种优化操作,使得验证过程更加高效;应用于工业,军事,农业,科研等领域设计的软硬件系统正确性的形式化验证,以及各类通信协议安全性,可靠性的形式化验证。
本发明的数据更新方法,获得的零碎图像信息数据准确,为快速获取数据提供了保证。
附图说明
图1是本发明实施例提供的互联网人物搜索信息整合分析控制系统结构示意图;
图中:1输入界面;2、信息提取模块;3、网页搜索模块;4、网页信息集合模块;5、信息分类提取模块;6、信息比对模块;7、信息存储模块;8、信息整合模块;9、显示模块。
具体实施方式
为能进一步了解本发明的发明内容、特点及功能,兹例举以下实施例,并配合附图详细说明如下。
下面结合附图对本发明的结构作详细的描述。
如图1所示,本发明实施例提供的互联网人物搜索信息整合分析控制系统包括:输入界面1、信息提取模块2、网页搜索模块3、网页信息集合模块4、信息分类提取模块5、信息比对模块6、信息存储模块7、信息整合模块8、显示模块9。
输入界面1,与信息提取模块2连接,用户可以在输入界面1输入所要搜索的信息,并传输给信息提取模块2;
信息提取模块2,与网页搜索模块4连接,用于对用户在输入界面1输入的信息进行提取,并传输给网页搜索模块4;
网页搜索模块3,与网页信息集合模块4连接,用于对信息提取模块2提取出的信息在网页上进行搜索;
网页信息集合模块4,与信息分类提取模块5连接,用于对搜索到的信息进行集合,能够将网页搜索模块3搜索到的零碎信息进行整合;
信息分类提取模块5,与信息比对模块6连接,用于对集合后的信息进行分类提取,采用数据处理分析算法,对集合信息进行分析处理,利用分布式的程序算法,缩短信息处理时间;
信息比对模块6,与信息存储模块7和信息整合模块8连接,用于比对分类提取的数据与信息存储模块中存储的数据,当信息不匹配或信息存储模块中缺少本信息时,对信息存储模块7进行更新;当信息相同时,可以提取信息存储模块7中的数据;
信息存储模块7,与信息比对模块6连接,用于存储以前所搜索到的人物信息;
信息整合模块8,与显示模块9连接,用于将信息比对模块6中的数据进行整合,将身份信息、账户信息、社交信息等整合为所搜索人物的详细资料;
显示模块9,与信息整合模块8连接,用于显示信息整合模块8整合后的所搜索人物的详细资料。
所述分布式的程序算法包括;
步骤一,根据待验证的程序,生成控制流图CFG,给CFG中的结点添加3个属性:R插值,S插值和E插值,R插值是结点可达的约束条件,判断一个状态的可达性;S插值和E插值对路径进行规约,加快程序的验证;给CFG的边添加属性W;一条边的W值表示以该边指向的结点为根结点的子图中,还没有被遍历的分支的个数;
步骤二,根据生成的CFG,生成抽象可达图ARG,如果沿着一条路径生成一个新状态s,如果s对应的R插值被满足,说明状态s可达,继续沿着状态s遍历该路径;否则,状态s不可达,则该路径终止,遍历其他路径;对于一个可达的状态s,如果状态s对应的E插值被该路径对应的路径公式蕴含,说明沿着该状态存在一条到达目标状态的路径,程序不安全;如果状态s对应的S插值被蕴含,说明以状态为起点的所有路径都是安全的,不需要沿着状态s探索程序;如果状态s是可达的,且E插值和S插值都不被蕴含,则继续沿着状态s遍历该路径;
步骤三,在生成ARG的过程中,发现一条反例路径,到达目标状态,则需要进一步判断反例路径是否虚假;不是虚假反例,则说明程序是不安全的;否则,根据虚假反例,细化模型,分别计算并更新对应状态的R插值,S插值和E插值,执行重新生成ARG,直到找到一条真反例路径或不存在反例路径;
所述对信息存储模块进行更新的方法包括:
接收维护更新指令;
根据所述维护更新指令获取用户搜索的信息以及需要维护更新的维度表的维度表信息;
根据所述维度表信息获取预先设置的维度表配置信息;其中,所述维度表配置信息中带有所述需要维护更新的维度表所在的源数据库、所述维度表需要同步的目的数据库以及维度表操作权限信息;
根据所述用户搜索的信息以及所述维度表操作权限信息,判断所述用户搜索的信息是否满足所述维度表操作权限信息;
若所述用户搜索的信息足所述维度表操作权限信息,对所述需要维护更新的维度表进行更新操作;
将进行更新操作后的维度表同步到所述信息存储模块;
所述维度表操作权限信息包括:具有维度表操作权限的用户搜索的信息标识;
所述判断所述用户搜索的信息是否满足所述维度表操作权限信息,包括:
判断所述用户搜索的信息是否在所述具有维度表操作权限的用户搜索的信息标识中;
所述维护更新指令为增加内容指令、更改内容指令或删除内容指令;
在对所述需要维护更新的维度表进行更新操作之前,包括:
根据所述维护更新指令,确定需要维护更新的字段,并获取到所述需要维护更新的字段标识;
根据所述字段标识以及所述维度表配置信息获取到预先设置的字段配置信息;其中,所述字段配置信息包括所述字段的字段内容排序规则、字段次序信息、字段限制条件;
若所述维护更新指令为增加内容指令,所述对所述需要维护更新的维度表进行更新操作,包括:
获取所述增加内容指令对应的批量数据内容;
根据所述批量数据内容,在所述维度表中的一个或多个字段中增加字段内容;
根据所述字段内容排序规则,将所述字段内容进行排序;
根据所述字段次序信息,将维度表中的各个字段进行排序;
若所述维护更新指令为更改内容指令,所述对所述需要维护更新的维度表进行更新操作,包括:
获取所述更改内容指令对应的批量数据内容;
根据所述批量数据内容,在所述维度表中的一个或多个字段中更改字段内容;
若所述维护更新指令为删除内容指令,所述对所述需要维护更新的维度表进行更新操作,包括:
在所述维度表中的一个或多个字段中删除字段内容;
判断所述增加字段内容、更改字段内容或者删除字段内容之后的各字段是否满足所述字段限制条件;
若有字段不满足所述字段限制条件,生成提示信息;所述提示信息用于提示不满足所述字段限制条件的字段数,并提示不满足所述字段限制条件的字段相关信息;所述字段相关信息包括所述字段的所述字段标识或者字段名称;所述段相关信息为搜索的零碎信息。
进一步,所述步骤一生成待验证程序的CFG,并且初始化结点和边的属性,包括以下步骤:
(1)找到CFG中的目标结点,从目标结点开始反向遍历CFG,遍历的结点和边都保留,没有遍历到的结点和边都删除;
(2)得到裁剪后的CFG,初始化属性的值,对各个结点的三种插值进行初始化,初次遍历CFG,生成ARG的过程中,每一个结点的R插值的初始值都为{true};对于S插值,定义了为一个二元组:(F,Is),其中,F的值域为{full,half},Is的值是一个由谓词组成的合取式;对于一个结点l,如果l没有后继结点或者l的所有后继结点的S插值都是full,记为f,表示l的所有后继结点都被遍历过,则l的S插值也是full,否则,l的S插值为half,记为h,具体的形式如下:
Figure BDA0001528479470000151
l是终结点,S插值的初始值为(full,true),表示如果到达终结点,路径一定是安全的;l是目标结点,S插值的初始值为(full,false),表示如果到达目标结点,路径一定是反例路径;对于其他结点,S插值的初始值为(half,true),具体的形式如下:
Figure BDA0001528479470000161
l是目标结点,E插值的初始值为true,表示路径一定是真反例;l是终结点,E插值的初始值为false,表示路径一定不可能到达目标结点;对于其他结点,E插值的初始值为false,初始认为都不能到达目标结点;对于每一条迁移的W属性,初始值为⊥,表示还没开始遍历,其中,W的值域为{N+,⊥},N+是正整数集合;
所述步骤二中,利用W属性决定分支边的遍历顺序,同时,利用S插值和E插值,加快验证的效率,具体的步骤包括:
(1)得到一个可达状态s',根据CFG的迁移关系,产生后继状态;如果存在多个可能的后继,根据边的W值,决定遍历顺序;边的W值的优先级为:(>0)>⊥>0;如果边的W值相同,则随机选择;对于一个后继状态s,根据R插值,如果状态s不可达,则当前路径终止,遍历其他路径;如果当前状态s可达,首先判断s的E插值是否为false;如果是false,说明s[0]的后继结点还没被遍历过,跳转到(2);如果不是false,首先采用SSA原则,每一个变量至多被赋值一次,得到从初始状态s0到达s的路径公式,记为Pf(s0,…,s);用求解器判断Pf(s0,…,s)是否蕴含s的E插值;如果蕴含,则说明程序存在一条真反例,程序不安全,验证结束;否则跳转到(2);
(2)判断s的S插值是否为full插值;如果不是full插值,则跳转到(3);如果是full插值,得到从初始状态s0到达s的路径公式,记为Pf(s0,…,s),然后用求解器判断Pf(s0,…,s)是否蕴含s的S插值;如果蕴含,则说明以状态s为起点的所有路径都是安全的,不需要探索,当前路径终止,遍历其他路径;
(3)判断s是否目标状态,如果是目标状态,则发现一条反例路径,执行步骤三;如果不是,进一步判断s是否被其他状态覆盖;如果s被覆盖,则不需要探索当前路径,遍历其他路径;如果s不被覆盖,则继续探索当前路径;
(4)如果存在没有被遍历的可达状态,则跳转到(1);否则,验证结束,程序安全。
进一步,所述步骤三中优化策略包括:
在步骤一中,生成程序对应的CFG,根据目标结点,遍历整个CFG减掉不可能到达目标状态的结点和边;
在步骤三中,如果存在一条虚假反例路径,在计算三种插值的同时,计算反例路径中每一条边的W值;在步骤二中,一个状态如果存在多个后继状态,根据边的W值,决定后继状态的遍历顺序;
所述步骤三中计算插值和W属性的具体步骤包括:
1)在生成ARG的过程中,发现一条反例路径path:〈s0,e0,s1,…,en-1,sn〉;利用SMT求解器判断path是不是虚假;如果path是真反例,则程序不安全,验证结束;如果path是虚假的,则执行2);
2)计算R插值,对于状态si,0<i<n,将path划分为两部分:pre和post;pre子序列为<s0,…,si>,post子序列为<si,…,sn>,利用Craig插值公式计算新的R插值,Craig(pre,post),更新si[0]的R插值,形式化地表示为:
R-Intp(si[0])=R-Intp(si[0])∪Craig(Pf(s0,..,si),Pf(si,…,sn));
其中,Pf(s0,…,si)表示从s0到si的路径对应的路径公式;
3)计算S插值,首先找到path的可达的有效序列Π=<s0,...,sm>,0<m<n,且si状态可达,si+1状态不可达;对于Π的每一个状态si,0<i≤m,判断S插值的的第一个元素是full还是half;si[0]的所有后继结点的S插值都是full,则si[0]的S插值为full,否则,si[0]的S插值为half;具体的形式如下:
Figure BDA0001528479470000171
对于S插值的第二个元素,记为Is(si[0]),分两种情况,如果i=m,则Is(si[0])是边ei+1的路径公式取反;如果0<i<m,Is(si[0])利用Craig插值计算,记为Craig(A,B);其中,A表示从s0到si的路径公式,B是边ei对应的公式和状态si+1对应的S插值取反的合取式;具体的形式如下:
Figure BDA0001528479470000181
其中,A=Pf(s0,…,si),B=Pf(si,ei,si+1)∧!(Is(si+1[0]);从sm状态开始倒序地计算每个状态的插值,直到初始状态或者某一状态的S插值为half;
4)计算E插值,找到path的最大有效后缀序列Π=<si,…,sn>,0<i≤n;从si状态开始,利用Craig插值,倒序地计算对应的E插值,记为Craig(A,B);对于si,A是从si到sn的路径公式和sn的E插值的合取式,B是从s0到si的路径公式;对于状态sj,0<j<i,A是从sj到sj+1的路径公式和sj+1的E插值的合取式,B是从s0到sj的路径公式,具体的形式如下:
Figure BDA0001528479470000182
5)计算边的W值,根据反例路径和更新后的S插值,来计算对应边的W值,对于一条边e:(s,op,s'),如果s'的S插值是full,则e的W值为0;如果s'的S插值是half,且s'是最后一个可达状态,e的W值为s'[0]的出边的个数-1;如果s'的S插值是half,且s'不是最后一个可达状态,e的W值为两部分的和:1)s'[0]的出边中W值不为⊥的边的W值的和,2)s'[0]的出边中W值为⊥的边的个数;对于边e:(s,op,s'),s':(l',c',p')具体的形式如下:
Figure BDA0001528479470000191
6)跳转到步骤二,重新生成ARG。
当本系统进行工作时,首先,用户在输入界面1输入所要搜索的信息,并将输入的信息传输给信息提取模块2;信息提取模块2对用户在输入界面1输入的信息进行提取,并将信息传输给网页搜索模块3;网页搜索模块3,对信息提取模块2提取出的信息在网页上进行搜索;网页信息集合模块4,对搜索到的信息进行集合,对网页搜索模块3搜索到的零碎信息进行整合;然后信息分类提取模块5,对集合后的信息进行分类提取,采用数据处理分析算法,对集合信息进行分析处理,利用分布式的程序算法,缩短信息处理时间;接着信息比对模块6,比对分类提取的数据与信息存储模块中存储的数据,当信息不匹配或信息存储模块中缺少本信息时,对信息存储模块7进行更新;当信息相同时,可以提取信息存储模块7中的数据,信息存储模块7的存在,提高了搜索的效率;信息整合模块8,将信息比对模块6中的数据进行整合,将身份信息、账户信息、社交信息等整合为所搜索人物的详细资料;最后,显示模块9显示出信息整合模块8整合后的所搜索人物的详细资料。
以上所述仅是对本发明的较佳实施例而已,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化与修饰,均属于本发明技术方案的范围内。

Claims (3)

1.一种互联网人物搜索信息整合分析控制方法,其特征在于,所述互联网人物搜索信息整合分析控制方法包括:
用户在输入界面输入所要搜索的信息,并将输入的信息传输给信息提取模块;信息提取模块对用户在输入界面输入的信息进行提取,并将信息传输给网页搜索模块;
网页搜索模块对信息提取模块提取出的信息在网页上进行搜索;网页信息集合模块对搜索到的信息进行集合,对网页搜索模块搜索到的零碎信息进行整合;
信息分类提取模块对集合后的信息进行分类提取,采用数据处理分析算法,对集合信息进行分析处理,利用分布式的程序算法,缩短信息处理时间;信息比对模块比对分类提取的数据与信息存储模块中存储的数据,当信息不匹配或信息存储模块中缺少本信息时,对信息存储模块进行更新;当信息相同时,可以提取信息存储模块中的数据;
信息整合模块将信息比对模块中的数据进行整合,将身份信息、账户信息、社交信息整合为所搜索人物的详细资料;显示模块显示出信息整合模块整合后的所搜索人物的详细资料;
所述分布式的程序算法包括;
步骤一,根据待验证的程序,生成控制流图CFG,给CFG中的结点添加3个属性:R插值,S插值和E插值,R插值是结点可达的约束条件,判断一个状态的可达性;S插值和E插值对路径进行规约,加快程序的验证;给CFG的边添加属性W;一条边的W值表示以该边指向的结点为根结点的子图中,还没有被遍历的分支的个数;具体包括:
(1)找到CFG中的目标结点,从目标结点开始反向遍历CFG,遍历的结点和边都保留,没有遍历到的结点和边都删除;
(2)得到裁剪后的CFG,初始化属性的值,对各个结点的三种插值进行初始化,初次遍历CFG,生成ARG的过程中,每一个结点的R插值的初始值都为{true};对于S插值,定义了为一个二元组:(F,Is),其中,F的值域为{full,half},Is的值是一个由谓词组成的合取式;对于一个结点l,如果l没有后继结点或者l的所有后继结点的S插值都是full,记为f,表示l的所有后继结点都被遍历过,则l的S插值也是full,否则,l的S插值为half,记为h,具体的形式如下:
Figure FDA0003178124040000021
l是终结点,S插值的初始值为(full,true),表示如果到达终结点,路径一定是安全的;l是目标结点,S插值的初始值为(full,false),表示如果到达目标结点,路径一定是反例路径;对于其他结点,S插值的初始值为(half,true),具体的形式如下:
Figure FDA0003178124040000022
l是目标结点,E插值的初始值为true,表示路径一定是真反例;l是终结点,E插值的初始值为false,表示路径一定不可能到达目标结点;对于其他结点,E插值的初始值为false,初始认为都不能到达目标结点;对于每一条迁移的W属性,初始值为⊥,表示还没开始遍历,其中,W的值域为{N+,⊥},N+是正整数集合;
步骤二,根据生成的CFG,生成抽象可达图ARG,如果沿着一条路径生成一个新状态s,如果s对应的R插值被满足,说明状态s可达,继续沿着状态s遍历该路径;否则,状态s不可达,则该路径终止,遍历其他路径;对于一个可达的状态s,如果状态s对应的E插值被该路径对应的路径公式蕴含,说明沿着该状态存在一条到达目标状态的路径,程序不安全;如果状态s对应的S插值被蕴含,说明以状态为起点的所有路径都是安全的,不需要沿着状态s探索程序;如果状态s是可达的,且E插值和S插值都不被蕴含,则继续沿着状态s遍历该路径;具体的步骤包括:
(1)得到一个可达状态s',根据CFG的迁移关系,产生后继状态;如果存在多个可能的后继,根据边的W值,决定遍历顺序;边的W值的优先级为:(>0)>⊥>0;如果边的W值相同,则随机选择;对于一个后继状态s,根据R插值,如果状态s不可达,则当前路径终止,遍历其他路径;如果当前状态s可达,首先判断s的E插值是否为false;如果是false,说明s[0]的后继结点还没被遍历过,跳转到(2);如果不是false,首先采用SSA原则,每一个变量至多被赋值一次,得到从初始状态s0到达s的路径公式,记为Pf(s0,…,s);用求解器判断Pf(s0,…,s)是否蕴含s的E插值;如果蕴含,则说明程序存在一条真反例,程序不安全,验证结束;否则跳转到(2);
(2)判断s的S插值是否为full插值;如果不是full插值,则跳转到(3);如果是full插值,得到从初始状态s0到达s的路径公式,记为Pf(s0,…,s),然后用求解器判断Pf(s0,…,s)是否蕴含s的S插值;如果蕴含,则说明以状态s为起点的所有路径都是安全的,不需要探索,当前路径终止,遍历其他路径;
(3)判断s是否目标状态,如果是目标状态,则发现一条反例路径,执行步骤三;如果不是,进一步判断s是否被其他状态覆盖;如果s被覆盖,则不需要探索当前路径,遍历其他路径;如果s不被覆盖,则继续探索当前路径;
(4)如果存在没有被遍历的可达状态,则跳转到(1);否则,验证结束,程序安全;
步骤三,在生成ARG的过程中,发现一条反例路径,到达目标状态,则需要进一步判断反例路径是否虚假;不是虚假反例,则说明程序是不安全的;否则,根据虚假反例,细化模型,分别计算并更新对应状态的R插值,S插值和E插值,执行重新生成ARG,直到找到一条真反例路径或不存在反例路径;具体步骤包括:
1)在生成ARG的过程中,发现一条反例路径path:〈s0,e0,s1,…,en-1,sn〉;利用SMT求解器判断path是不是虚假;如果path是真反例,则程序不安全,验证结束;如果path是虚假的,则执行2);
2)计算R插值,对于状态si,0<i<n,将path划分为两部分:pre和post;pre子序列为<s0,…,si>,post子序列为<si,…,sn>,利用Craig插值公式计算新的R插值,Craig(pre,post),更新si[0]的R插值,形式化地表示为:
R-Intp(si[0])=R-Intp(si[0])∪Craig(Pf(s0,..,si),Pf(si,…,sn));
其中,Pf(s0,…,si)表示从s0到si的路径对应的路径公式;
3)计算S插值,首先找到path的可达的有效序列Π=<s0,...,sm>,0<m<n,且si状态可达,si+1状态不可达;对于Π的每一个状态si,0<i≤m,判断S插值的的第一个元素是full还是half;si[0]的所有后继结点的S插值都是full,则si[0]的S插值为full,否则,si[0]的S插值为half;具体的形式如下:
Figure FDA0003178124040000041
对于S插值的第二个元素,记为Is(si[0]),分两种情况,如果i=m,则Is(si[0])是边ei+1的路径公式取反;如果0<i<m,Is(si[0])利用Craig插值计算,记为Craig(A,B);其中,A表示从s0到si的路径公式,B是边ei对应的公式和状态si+1对应的S插值取反的合取式;具体的形式如下:
Figure FDA0003178124040000042
其中,A=Pf(s0,…,si),B=Pf(si,ei,si+1)∧!(Is(si+1[0]);从sm状态开始倒序地计算每个状态的插值,直到初始状态或者某一状态的S插值为half;
4)计算E插值,找到path的最大有效后缀序列Π=<si,…,sn>,0<i≤n;从si状态开始,利用Craig插值,倒序地计算对应的E插值,记为Craig(A,B);对于si,A1是从si到sn的路径公式和sn的E插值的合取式,B1是从s0到si的路径公式;对于状态sj,0<j<i,A2是从sj到sj+1的路径公式和sj+1的E插值的合取式,B2是从s0到sj的路径公式,具体的形式如下:
Figure FDA0003178124040000051
5)计算边的W值,根据反例路径和更新后的S插值,来计算对应边的W值,对于一条边e:(s,op,s'),如果s'的S插值是full,则e的W值为0;如果s'的S插值是half,且s'是最后一个可达状态,e的W值为s'[0]的出边的个数-1;如果s'的S插值是half,且s'不是最后一个可达状态,e的W值为两部分的和:1)s'[0]的出边中W值不为⊥的边的W值的和,2)s'[0]的出边中W值为⊥的边的个数;对于边e:(s,op,s'),s':(l',c',p')具体的形式如下:
Figure FDA0003178124040000052
6)跳转到步骤二,重新生成ARG;
所述对信息存储模块进行更新的方法包括:
接收维护更新指令;
根据所述维护更新指令获取用户搜索的信息以及需要维护更新的维度表的维度表信息;
根据所述维度表信息获取预先设置的维度表配置信息;其中,所述维度表配置信息中带有所述需要维护更新的维度表所在的源数据库、所述维度表需要同步的目的数据库以及维度表操作权限信息;
根据所述用户搜索的信息以及所述维度表操作权限信息,判断所述用户搜索的信息是否满足所述维度表操作权限信息;
若所述用户搜索的信息足所述维度表操作权限信息,对所述需要维护更新的维度表进行更新操作;
将进行更新操作后的维度表同步到所述信息存储模块;
所述维度表操作权限信息包括:具有维度表操作权限的用户搜索的信息标识;
所述判断所述用户搜索的信息是否满足所述维度表操作权限信息,包括:
判断所述用户搜索的信息是否在所述具有维度表操作权限的用户搜索的信息标识中;
所述维护更新指令为增加内容指令、更改内容指令或删除内容指令;
在对所述需要维护更新的维度表进行更新操作之前,包括:
根据所述维护更新指令,确定需要维护更新的字段,并获取到所述需要维护更新的字段标识;
根据所述字段标识以及所述维度表配置信息获取到预先设置的字段配置信息;其中,所述字段配置信息包括所述字段的字段内容排序规则、字段次序信息、字段限制条件;
若所述维护更新指令为增加内容指令,所述对所述需要维护更新的维度表进行更新操作,包括:
获取所述增加内容指令对应的批量数据内容;
根据所述批量数据内容,在所述维度表中的一个或多个字段中增加字段内容;
根据所述字段内容排序规则,将所述字段内容进行排序;
根据所述字段次序信息,将维度表中的各个字段进行排序;
若所述维护更新指令为更改内容指令,所述对所述需要维护更新的维度表进行更新操作,包括:
获取所述更改内容指令对应的批量数据内容;
根据所述批量数据内容,在所述维度表中的一个或多个字段中更改字段内容;
若所述维护更新指令为删除内容指令,所述对所述需要维护更新的维度表进行更新操作,包括:
在所述维度表中的一个或多个字段中删除字段内容;
判断所述增加字段内容、更改字段内容或者删除字段内容之后的各字段是否满足所述字段限制条件;
若有字段不满足所述字段限制条件,生成提示信息;所述提示信息用于提示不满足所述字段限制条件的字段数,并提示不满足所述字段限制条件的字段相关信息;所述字段相关信息包括所述字段的所述字段标识或者字段名称;所述段相关信息为搜索的零碎信息;
在步骤一中,生成程序对应的CFG,根据目标结点,遍历整个CFG减掉不可能到达目标状态的结点和边;
在步骤三中,如果存在一条虚假反例路径,在计算三种插值的同时,计算反例路径中每一条边的W值;在步骤二中,一个状态如果存在多个后继状态,根据边的W值,决定后继状态的遍历顺序。
2.一种如权利要求1所述的互联网人物搜索信息整合分析控制方法的互联网人物搜索信息整合分析控制系统,其特征在于,所述互联网人物搜索信息整合分析控制系统包括:
输入界面,与信息提取模块连接,用户可以在输入界面输入所要搜索的信息,并传输给信息提取模块;
信息提取模块,与网页搜索模块连接,用于对用户在输入界面输入的信息进行提取,并传输给网页搜索模块;
网页搜索模块,与网页信息集合模块连接,用于对信息提取模块提取出的信息在网页上进行搜索;
网页信息集合模块,与信息分类提取模块连接,用于对搜索到的信息进行集合,能够将网页搜索模块搜索到的零碎信息进行整合;
信息分类提取模块,与信息比对模块连接,用于对集合后的信息进行分类提取,采用数据处理分析算法,对集合信息进行分析处理,利用分布式的程序算法,缩短信息处理时间;
信息比对模块,与信息存储模块和信息整合模块连接,用于比对分类提取的数据与信息存储模块中存储的数据,当信息不匹配或信息存储模块中缺少本信息时,对信息存储模块进行更新;当信息相同时,可以提取信息存储模块中的数据;
信息存储模块,与信息比对模块连接,用于存储以前所搜索到的人物信息;
信息整合模块,与显示模块连接,用于将信息比对模块中的数据进行整合,将身份信息、账户信息、社交信息整合为所搜索人物的详细资料;
显示模块,与信息整合模块连接,用于显示信息整合模块整合后的所搜索人物的详细资料。
3.如权利要求2所述的互联网人物搜索信息整合分析控制系统,其特征在于,所述网页搜索模块为系统根据所搜索的人物在搜索引擎中进行搜索,获取网页信息后,经由网页信息集合模块将各个网页的信息进行集合,然后通过信息分类提取模块对所搜索人物的邮箱、联系方式、账户信息进行分类提取。
CN201711451026.8A 2017-12-27 2017-12-27 一种互联网人物搜索信息整合分析控制方法 Active CN108009298B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711451026.8A CN108009298B (zh) 2017-12-27 2017-12-27 一种互联网人物搜索信息整合分析控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711451026.8A CN108009298B (zh) 2017-12-27 2017-12-27 一种互联网人物搜索信息整合分析控制方法

Publications (2)

Publication Number Publication Date
CN108009298A CN108009298A (zh) 2018-05-08
CN108009298B true CN108009298B (zh) 2021-08-31

Family

ID=62061795

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711451026.8A Active CN108009298B (zh) 2017-12-27 2017-12-27 一种互联网人物搜索信息整合分析控制方法

Country Status (1)

Country Link
CN (1) CN108009298B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108822583A (zh) * 2018-07-31 2018-11-16 湖南工业大学 一种表面无机和有机包膜的金红石型钛白粉的制备方法
CN111126103B (zh) * 2018-10-30 2023-09-26 百度在线网络技术(北京)有限公司 用户人生阶段状态的判断方法和装置
CN112860754A (zh) * 2021-03-11 2021-05-28 恒基文化实业(深圳)有限公司 一种基于大数据筛选相应用户的数据处理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103778162A (zh) * 2012-10-26 2014-05-07 广州市邦富软件有限公司 一种互联网人物搜索信息整合分析方法
CN104252452A (zh) * 2013-06-25 2014-12-31 腾讯科技(深圳)有限公司 数据管理的方法及装置
CN106446084A (zh) * 2016-09-09 2017-02-22 北京高地信息技术有限公司 一种互联网人物搜索信息整合分析方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103778162A (zh) * 2012-10-26 2014-05-07 广州市邦富软件有限公司 一种互联网人物搜索信息整合分析方法
CN104252452A (zh) * 2013-06-25 2014-12-31 腾讯科技(深圳)有限公司 数据管理的方法及装置
CN106446084A (zh) * 2016-09-09 2017-02-22 北京高地信息技术有限公司 一种互联网人物搜索信息整合分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于动态执行的C程序复杂循环检测方法;张波;《中国优秀硕士学位论文全文数据库信息科技辑》;20170315;I138-1787 *

Also Published As

Publication number Publication date
CN108009298A (zh) 2018-05-08

Similar Documents

Publication Publication Date Title
Ristoski et al. Semantic Web in data mining and knowledge discovery: A comprehensive survey
Fan et al. Incremental graph pattern matching
CN107844415B (zh) 一种基于插值的模型检测路径缩减方法、计算机
CN109240901B (zh) 性能分析方法、性能分析装置、存储介质和电子设备
Izza et al. On explaining random forests with SAT
CN108009298B (zh) 一种互联网人物搜索信息整合分析控制方法
CN113254630B (zh) 一种面向全球综合观测成果的领域知识图谱推荐方法
KR20150091521A (ko) 데이터 정규표현식의 마이닝 방법 및 장치
Movshovitz-Attias et al. Kb-lda: Jointly learning a knowledge base of hierarchy, relations, and facts
CN115495755B (zh) 一种基于CodeBERT和R-GCN的源代码漏洞多分类检测的方法
CN107368526A (zh) 一种数据处理方法及装置
CN113609261A (zh) 基于网络信息安全的知识图谱的漏洞信息挖掘方法和装置
CN113868406B (zh) 搜索方法、系统、计算机可读存储介质
CN105354224A (zh) 知识数据的处理方法和装置
Chen et al. Scaling up Markov logic probabilistic inference for social graphs
CN116400910A (zh) 一种基于api替换的代码性能优化方法
Acosta-Mendoza et al. A new algorithm for approximate pattern mining in multi-graph collections
CN113342995B (zh) 一种基于路径语义和特征提取的负样本提取方法
CN113792726B (zh) 一种基于视觉图像快速生成poi的方法及系统
CN115185920A (zh) 一种日志类型的检测方法、装置及设备
CN114511085A (zh) 实体属性值的识别方法、装置、设备、介质及程序产品
CN114564543A (zh) 一种基于知识图谱的碳足迹获取方法
CN113553246A (zh) 一种面向计算平台的系统评估装置
CN112883735A (zh) 一种表单图像的结构化处理方法、装置、设备及存储介质
Breckel Error mining: Bug detection through comparison with large code databases

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant