CN108009298A - 一种互联网人物搜索信息整合分析控制方法 - Google Patents
一种互联网人物搜索信息整合分析控制方法 Download PDFInfo
- Publication number
- CN108009298A CN108009298A CN201711451026.8A CN201711451026A CN108009298A CN 108009298 A CN108009298 A CN 108009298A CN 201711451026 A CN201711451026 A CN 201711451026A CN 108009298 A CN108009298 A CN 108009298A
- Authority
- CN
- China
- Prior art keywords
- information
- interpolation
- path
- state
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010354 integration Effects 0.000 title claims abstract description 40
- 238000004458 analytical method Methods 0.000 title claims abstract description 31
- 238000000605 extraction Methods 0.000 claims abstract description 50
- 238000003860 storage Methods 0.000 claims abstract description 42
- 238000012795 verification Methods 0.000 claims description 28
- 238000000034 method Methods 0.000 claims description 26
- 238000012423 maintenance Methods 0.000 claims description 19
- 238000004422 calculation algorithm Methods 0.000 claims description 14
- 230000008859 change Effects 0.000 claims description 10
- 239000000284 extract Substances 0.000 claims description 7
- 230000001360 synchronised effect Effects 0.000 claims description 6
- 238000013523 data management Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 230000006399 behavior Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000005520 cutting process Methods 0.000 claims description 3
- 235000013399 edible fruits Nutrition 0.000 claims description 3
- 238000013508 migration Methods 0.000 claims description 3
- 230000005012 migration Effects 0.000 claims description 3
- 230000007704 transition Effects 0.000 claims description 3
- 239000000463 material Substances 0.000 claims 1
- 238000005516 engineering process Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000004880 explosion Methods 0.000 description 7
- 238000007689 inspection Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 241000238876 Acari Species 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 241001289435 Astragalus brachycalyx Species 0.000 description 1
- 235000002917 Fraxinus ornus Nutrition 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于互联网搜索领域,公开了一种互联网人物搜索信息整合分析控制方法,利用网页信息集合模块将网页搜索模块搜索到的零碎信息进行整合,经由信息分类提取模块进行分类,将搜索信息分为身份信息、账号信息等多类,经过信息比对模块进行比对后,将未知信息存入信息存储模块或者读取信息存储模块中的已知信息。本发明能够对互联网搜索信息进行整合,且能够将信息存储于信息存储模块中以备日后使用,有利于整合互联网上分散的信息;且搜索更加高效,能够防止人工搜索的疏漏。
Description
技术领域
本发明属于互联网搜索技术领域,尤其涉及一种互联网人物搜索信息整合分析控制方法。
背景技术
随着生活水平的提高,经济的发展,互联网在人们的生活中扮演了越来越重要的角色。互联网上的信息通常是分散分布的,碎片化比较严重,单纯的搜索获得的信息并不完整,而且互联网信息庞杂,简单的搜索方式会搜索出过多的无用信息,并没有一个存储相关信息的信息存储模块,搜索效率较低。
随着科技的快速发展和工业需求的不断提高,各种软硬件设计的复杂度也日益增加,对于可靠性和安全性的要求也不断提高。系统的可靠性,安全性和正确性已经受到了科学界和工业界的广泛关注。形式化验证和测试是解决该问题的主要方法。形式化验证方法始于20世纪60年代末的Floyd、Hoare和Manna等在程序规范和验证方面的研究。形式化验证方法分为两大类:基于定理证明和基于模型。20世纪80年代初提出的模型检测(ModelChecking)属于基于模型的形式化验证方法,思想相对简单和自动化程度高,可以广泛用于硬件电路系统和网络协议系统的验证。模型检测就是先把系统建模为有限状态转移系统,并用时态逻辑描述特验证的规范,在有限状态转移系统上进行穷尽搜索,确定规范是否被满足,若没有满足,给出反例指出为什么没有满足。模型检测面临状态爆炸问题,所谓状态爆炸问题即系统状态数随着状态规模的增加呈指数级增加。所以该领域的研究人员使用各种方法缩减搜索的状态空间,基于反例引导的抽象模型检测是常用的技术。基于反例路径的抽象细化(Counterexample-Guided Abstraction Refinement,CEGAR)技术的过程如下:给定一个模型和性质,首先通过抽象的方法生成一个抽象模型。抽象模型包含的行为可能会多于原始模型,但是,抽象模型的结构和描述都比原始模型简单,所以可以缓解状态空间爆炸问题。然后调用模型检测器,检测公式是否在抽象模型中有效。如果有效,则程序终止;否则,会给出反例路径,然后进行重构(reconstruction)过程,即在原始模型中,如果成功找到一条路径对应于反例路径,则程序结束;否则,反例路径为虚假反例路径,下一个迭代过程开始,重新生成抽象模型,进行验证。重复此过程,直到返回有效或者无效,或者状态空间爆炸造成程序停止。动态符号执行技术是一种符号执行与具体执行相结合的测试手段。符号执行是指在不执行程序的前提下,用符号值表示程序变量的值,然后模拟程序执行来进行相关分析。首先,对待分析代码构建控制流图(Control Flow Graph,CFG),它是编译器内部用有向图表示一个程序过程的抽象数据结构。在CFG上从入口节点开始模拟执行,在遇到分支节点时,使用约束求解器判定哪条分支可行,并根据预先设计的路径调度策略实现对该过程所有路径的遍历分析,最后输出每条可执行路径的分析结果。动态符号执行是以具体数值作为输入,同时启动代码模拟执行器,并从当前路径的分支语句的谓词中搜集所有符号约束。然后根据策略反转约束中的一个分支,构造一条新的可行的路径约束,并用约束求解器求解出一个可行的新的具体输入,接着符号执行引擎对新输入值进行新一轮的分析。通过使用这种输入迭代产生新输入的方法,理论上所有可行的路径都可以被计算并分析一遍。动态符号执行技术的主要瓶颈是路径爆炸问题,即随着程序中分支数的增多,路径呈指数级增加。插值是缓解路径爆炸问题的有效方法,主要是一种搜索剪枝的思想,通过利用不可行路径给行节点标记插值,插值是指一定不会到达被标记为错误行的条件约束。对于分支节点,若该节点的每个分支都被探索过,那么在该节点标记的插值为全插值,否则为半插值。在动态符号执行中,若从开始节点到当前节点的路径约束满足当前节点的全插值,则该路径可被归并,即不被探索。
对于大规模系统,抽象模型在进行验证时细化次数过多,且模型检测的瓶颈是状态繁琐问题,因此提出一种行之有效并加快抽象模型验证的方法便于快速搜索刻不容缓。
综上,现有技术存在的问题是:互联网上的信息通常是分散分布的,碎片化比较严重,单纯的搜索获得的信息并不完整,而且互联网信息庞杂,简单的搜索方式会搜索出过多的无用信息,并没有一个存储相关信息的信息存储模块,搜索效率较低。
发明内容
针对现有技术存在的问题,本发明提供了一种互联网人物搜索信息整合分析控制方法。
本发明是这样实现的,一种互联网人物搜索信息整合分析控制系统包括:
输入界面、信息提取模块、网页搜索模块、网页信息集合模块、信息分类提取模块、信息比对模块、信息存储模块、信息整合模块与显示模块;
输入界面,与信息提取模块连接,用户可以在输入界面输入所要搜索的信息,并传输给信息提取模块;
信息提取模块,与网页搜索模块连接,用于对用户在输入界面输入的信息进行提取,并传输给网页搜索模块;
网页搜索模块,与网页信息集合模块连接,用于对信息提取模块提取出的信息在网页上进行搜索;
网页信息集合模块,与信息分类提取模块连接,用于对搜索到的信息进行集合,能够将网页搜索模块搜索到的零碎信息进行整合;
信息分类提取模块,与信息比对模块连接,用于对集合后的信息进行分类提取,采用数据处理分析算法,对集合信息进行分析处理,利用分布式的程序算法,缩短信息处理时间;
信息比对模块,与信息存储模块和信息整合模块连接,用于比对分类提取的数据与信息存储模块中存储的数据,当信息不匹配或信息存储模块中缺少本信息时,对信息存储模块进行更新;当信息相同时,可以提取信息存储模块中的数据;
信息存储模块,与信息比对模块连接,用于存储以前所搜索到的人物信息;
信息整合模块,与显示模块连接,用于将信息比对模块中的数据进行整合,将身份信息、账户信息、社交信息等整合为所搜索人物的详细资料;
显示模块,与信息整合模块连接,用于显示信息整合模块整合后的所搜索人物的详细资料。
本发明的另一目的在于提供一种所述互联网人物搜索信息整合分析控制系统的互联网人物搜索信息整合分析控制方法,所述互联网人物搜索信息整合分析控制方法包括:
用户在输入界面输入所要搜索的信息,并将输入的信息传输给信息提取模块;信息提取模块对用户在输入界面输入的信息进行提取,并将信息传输给网页搜索模块;
网页搜索模块对信息提取模块提取出的信息在网页上进行搜索;网页信息集合模块对搜索到的信息进行集合,对网页搜索模块搜索到的零碎信息进行整合;
信息分类提取模块对集合后的信息进行分类提取,采用数据处理分析算法,对集合信息进行分析处理,利用分布式的程序算法,缩短信息处理时间;信息比对模块比对分类提取的数据与信息存储模块中存储的数据,当信息不匹配或信息存储模块中缺少本信息时,对信息存储模块进行更新;当信息相同时,可以提取信息存储模块中的数据;
信息整合模块将信息比对模块中的数据进行整合,将身份信息、账户信息、社交信息整合为所搜索人物的详细资料;显示模块显示出信息整合模块整合后的所搜索人物的详细资料。
所述分布式的程序算法包括;
步骤一,根据待验证的程序,生成控制流图CFG,给CFG中的结点添加3个属性:R插值,S插值和E插值,R插值是结点可达的约束条件,判断一个状态的可达性;S插值和E插值对路径进行规约,加快程序的验证;给CFG的边添加属性W;一条边的W值表示以该边指向的结点为根结点的子图中,还没有被遍历的分支的个数;
步骤二,根据生成的CFG,生成抽象可达图ARG,如果沿着一条路径生成一个新状态s,如果s对应的R插值被满足,说明状态s可达,继续沿着状态s遍历该路径;否则,状态s不可达,则该路径终止,遍历其他路径;对于一个可达的状态s,如果状态s对应的E插值被该路径对应的路径公式蕴含,说明沿着该状态存在一条到达目标状态的路径,程序不安全;如果状态s对应的S插值被蕴含,说明以状态为起点的所有路径都是安全的,不需要沿着状态s探索程序;如果状态s是可达的,且E插值和S插值都不被蕴含,则继续沿着状态s遍历该路径;
步骤三,在生成ARG的过程中,发现一条反例路径,到达目标状态,则需要进一步判断反例路径是否虚假;不是虚假反例,则说明程序是不安全的;否则,根据虚假反例,细化模型,分别计算并更新对应状态的R插值,S插值和E插值,执行重新生成ARG,直到找到一条真反例路径或不存在反例路径;
所述对信息存储模块进行更新的方法包括:
接收维护更新指令;
根据所述维护更新指令获取用户搜索的信息以及需要维护更新的维度表的维度表信息;
根据所述维度表信息获取预先设置的维度表配置信息;其中,所述维度表配置信息中带有所述需要维护更新的维度表所在的源数据库、所述维度表需要同步的目的数据库以及维度表操作权限信息;
根据所述用户搜索的信息以及所述维度表操作权限信息,判断所述用户搜索的信息是否满足所述维度表操作权限信息;
若所述用户搜索的信息足所述维度表操作权限信息,对所述需要维护更新的维度表进行更新操作;
将进行更新操作后的维度表同步到所述信息存储模块;
所述维度表操作权限信息包括:具有维度表操作权限的用户搜索的信息标识;
所述判断所述用户搜索的信息是否满足所述维度表操作权限信息,包括:
判断所述用户搜索的信息是否在所述具有维度表操作权限的用户搜索的信息标识中;
所述维护更新指令为增加内容指令、更改内容指令或删除内容指令;
在对所述需要维护更新的维度表进行更新操作之前,包括:
根据所述维护更新指令,确定需要维护更新的字段,并获取到所述需要维护更新的字段标识;
根据所述字段标识以及所述维度表配置信息获取到预先设置的字段配置信息;其中,所述字段配置信息包括所述字段的字段内容排序规则、字段次序信息、字段限制条件;
若所述维护更新指令为增加内容指令,所述对所述需要维护更新的维度表进行更新操作,包括:
获取所述增加内容指令对应的批量数据内容;
根据所述批量数据内容,在所述维度表中的一个或多个字段中增加字段内容;
根据所述字段内容排序规则,将所述字段内容进行排序;
根据所述字段次序信息,将维度表中的各个字段进行排序;
若所述维护更新指令为更改内容指令,所述对所述需要维护更新的维度表进行更新操作,包括:
获取所述更改内容指令对应的批量数据内容;
根据所述批量数据内容,在所述维度表中的一个或多个字段中更改字段内容;
若所述维护更新指令为删除内容指令,所述对所述需要维护更新的维度表进行更新操作,包括:
在所述维度表中的一个或多个字段中删除字段内容;
判断所述增加字段内容、更改字段内容或者删除字段内容之后的各字段是否满足所述字段限制条件;
若有字段不满足所述字段限制条件,生成提示信息;所述提示信息用于提示不满足所述字段限制条件的字段数,并提示不满足所述字段限制条件的字段相关信息;所述字段相关信息包括所述字段的所述字段标识或者字段名称;所述段相关信息为搜索的零碎信息。
进一步,所述步骤一生成待验证程序的CFG,并且初始化结点和边的属性,包括以下步骤:
(1)找到CFG中的目标结点,从目标结点开始反向遍历CFG,遍历的结点和边都保留,没有遍历到的结点和边都删除;
(2)得到裁剪后的CFG,初始化属性的值,对各个结点的三种插值进行初始化,初次遍历CFG,生成ARG的过程中,每一个结点的R插值的初始值都为{true};对于S插值,定义了为一个二元组:(F,Is),其中,F的值域为{full,half},Is的值是一个由谓词组成的合取式;对于一个结点l,如果l没有后继结点或者l的所有后继结点的S插值都是full,记为f,表示l的所有后继结点都被遍历过,则l的S插值也是full,否则,l的S插值为half,记为h,具体的形式如下:
l是终结点,S插值的初始值为(full,true),表示如果到达终结点,路径一定是安全的;l是目标结点,S插值的初始值为(full,false),表示如果到达目标结点,路径一定是反例路径;对于其他结点,S插值的初始值为(half,true),具体的形式如下:
l是目标结点,E插值的初始值为true,表示路径一定是真反例;l是终结点,E插值的初始值为false,表示路径一定不可能到达目标结点;对于其他结点,E插值的初始值为false,初始认为都不能到达目标结点;对于每一条迁移的W属性,初始值为⊥,表示还没开始遍历,其中,W的值域为{N+,⊥},N+是正整数集合;
所述步骤二中,利用W属性决定分支边的遍历顺序,同时,利用S插值和E插值,加快验证的效率,具体的步骤包括:
(1)得到一个可达状态s',根据CFG的迁移关系,产生后继状态;如果存在多个可能的后继,根据边的W值,决定遍历顺序;边的W值的优先级为:(>0)>⊥>0;如果边的W值相同,则随机选择;对于一个后继状态s,根据R插值,如果状态s不可达,则当前路径终止,遍历其他路径;如果当前状态s可达,首先判断s的E插值是否为false;如果是false,说明s[0]的后继结点还没被遍历过,跳转到(2);如果不是false,首先采用SSA原则,每一个变量至多被赋值一次,得到从初始状态s0到达s的路径公式,记为Pf(s0,…,s);用求解器判断Pf(s0,…,s)是否蕴含s的E插值;如果蕴含,则说明程序存在一条真反例,程序不安全,验证结束;否则跳转到(2);
(2)判断s的S插值是否为full插值;如果不是full插值,则跳转到(3);如果是full插值,得到从初始状态s0到达s的路径公式,记为Pf(s0,…,s),然后用求解器判断Pf(s0,…,s)是否蕴含s的S插值;如果蕴含,则说明以状态s为起点的所有路径都是安全的,不需要探索,当前路径终止,遍历其他路径;
(3)判断s是否目标状态,如果是目标状态,则发现一条反例路径,执行步骤三;如果不是,进一步判断s是否被其他状态覆盖;如果s被覆盖,则不需要探索当前路径,遍历其他路径;如果s不被覆盖,则继续探索当前路径;
(4)如果存在没有被遍历的可达状态,则跳转到(1);否则,验证结束,程序安全。
进一步,所述步骤三中优化策略包括:
在步骤一中,生成程序对应的CFG,根据目标结点,遍历整个CFG减掉不可能到达目标状态的结点和边;
在步骤三中,如果存在一条虚假反例路径,在计算三种插值的同时,计算反例路径中每一条边的W值;在步骤二中,一个状态如果存在多个后继状态,根据边的W值,决定后继状态的遍历顺序;
所述步骤三中计算插值和W属性的具体步骤包括:
1)在生成ARG的过程中,发现一条反例路径path:〈s0,e0,s1,…,en-1,sn〉;利用SMT求解器判断path是不是虚假;如果path是真反例,则程序不安全,验证结束;如果path是虚假的,则执行2);
2)计算R插值,对于状态si,0<i<n,将path划分为两部分:pre和post;pre子序列为<s0,…,si>,post子序列为<si,…,sn>,利用Craig插值公式计算新的R插值,Craig(pre,post),更新si[0]的R插值,形式化地表示为:
R-Intp(si[0])=R-Intp(si[0])∪Craig(Pf(s0,..,si),Pf(si,…,sn));
其中,Pf(s0,…,si)表示从s0到si的路径对应的路径公式;
3)计算S插值,首先找到path的可达的有效序列Π=<s0,...,sm>,0<m<n,且si状态可达,si+1状态不可达;对于Π的每一个状态si,0<i≤m,判断S插值的的第一个元素是full还是half;si[0]的所有后继结点的S插值都是full,则si[0]的S插值为full,否则,si[0]的S插值为half;具体的形式如下:
对于S插值的第二个元素,记为Is(si[0]),分两种情况,如果i=m,则Is(si[0])是边ei+1的路径公式取反;如果0<i<m,Is(si[0])利用Craig插值计算,记为Craig(A,B);其中,A表示从s0到si的路径公式,B是边ei对应的公式和状态si+1对应的S插值取反的合取式;具体的形式如下:
其中,A=Pf(s0,…,si),B=Pf(si,ei,si+1)∧!(Is(si+1[0]);从sm状态开始倒序地计算每个状态的插值,直到初始状态或者某一状态的S插值为half;
4)计算E插值,找到path的最大有效后缀序列Π=<si,…,sn>,0<i≤n;从si状态开始,利用Craig插值,倒序地计算对应的E插值,记为Craig(A,B);对于si,A是从si到sn的路径公式和sn的E插值的合取式,B是从s0到si的路径公式;对于状态sj,0<j<i,A是从sj到sj+1的路径公式和sj+1的E插值的合取式,B是从s0到sj的路径公式,具体的形式如下:
5)计算边的W值,根据反例路径和更新后的S插值,来计算对应边的W值,对于一条边e:(s,op,s'),如果s'的S插值是full,则e的W值为0;如果s'的S插值是half,且s'是最后一个可达状态,e的W值为s'[0]的出边的个数-1;如果s'的S插值是half,且s'不是最后一个可达状态,e的W值为两部分的和:1)s'[0]的出边中W值不为⊥的边的W值的和,2)s'[0]的出边中W值为⊥的边的个数;对于边e:(s,op,s'),s':(l',c',p')具体的形式如下:
6)跳转到步骤二,重新生成ARG。
本发明能够对互联网搜索信息进行整合,且能够将信息存储于信息存储模块中以备日后使用,有利于整合互联网上分散的信息;且搜索更加高效,能够防止人工搜索的疏漏。
本发明更加充分地利用了模型检测中虚假反例路径提供的信息,通过计算S插值和E插值,提高了检测的效率,使得模型检测算法可以更好地应用于大规模的程序;S插值可以判断出一个状态后续所有可能的路径序列是否都是安全的,从而避免不必要的探索,大大地减少ARG的状态数;E插值可以运用于快速地判断程序中是否存在真反例路径,加快了程序的验证,提高了效率。
本发明裁剪了CFG中无用的结点和边,进一步缩小了遍历的状态空间,在CFG的边上添加W属性,使得程序验证的效率得到进一步的提升。通过缩减抽象模型验证时的路径搜索空间从而缓解状态爆炸问题,加快验证效率。同时提供了两种优化操作,使得验证过程更加高效;应用于工业,军事,农业,科研等领域设计的软硬件系统正确性的形式化验证,以及各类通信协议安全性,可靠性的形式化验证。
本发明的数据更新方法,获得的零碎图像信息数据准确,为快速获取数据提供了保证。
附图说明
图1是本发明实施例提供的互联网人物搜索信息整合分析控制系统结构示意图;
图中:1输入界面;2、信息提取模块;3、网页搜索模块;4、网页信息集合模块;5、信息分类提取模块;6、信息比对模块;7、信息存储模块;8、信息整合模块;9、显示模块。
具体实施方式
为能进一步了解本发明的发明内容、特点及功能,兹例举以下实施例,并配合附图详细说明如下。
下面结合附图对本发明的结构作详细的描述。
如图1所示,本发明实施例提供的互联网人物搜索信息整合分析控制系统包括:输入界面1、信息提取模块2、网页搜索模块3、网页信息集合模块4、信息分类提取模块5、信息比对模块6、信息存储模块7、信息整合模块8、显示模块9。
输入界面1,与信息提取模块2连接,用户可以在输入界面1输入所要搜索的信息,并传输给信息提取模块2;
信息提取模块2,与网页搜索模块4连接,用于对用户在输入界面1输入的信息进行提取,并传输给网页搜索模块4;
网页搜索模块3,与网页信息集合模块4连接,用于对信息提取模块2提取出的信息在网页上进行搜索;
网页信息集合模块4,与信息分类提取模块5连接,用于对搜索到的信息进行集合,能够将网页搜索模块3搜索到的零碎信息进行整合;
信息分类提取模块5,与信息比对模块6连接,用于对集合后的信息进行分类提取,采用数据处理分析算法,对集合信息进行分析处理,利用分布式的程序算法,缩短信息处理时间;
信息比对模块6,与信息存储模块7和信息整合模块8连接,用于比对分类提取的数据与信息存储模块中存储的数据,当信息不匹配或信息存储模块中缺少本信息时,对信息存储模块7进行更新;当信息相同时,可以提取信息存储模块7中的数据;
信息存储模块7,与信息比对模块6连接,用于存储以前所搜索到的人物信息;
信息整合模块8,与显示模块9连接,用于将信息比对模块6中的数据进行整合,将身份信息、账户信息、社交信息等整合为所搜索人物的详细资料;
显示模块9,与信息整合模块8连接,用于显示信息整合模块8整合后的所搜索人物的详细资料。
所述分布式的程序算法包括;
步骤一,根据待验证的程序,生成控制流图CFG,给CFG中的结点添加3个属性:R插值,S插值和E插值,R插值是结点可达的约束条件,判断一个状态的可达性;S插值和E插值对路径进行规约,加快程序的验证;给CFG的边添加属性W;一条边的W值表示以该边指向的结点为根结点的子图中,还没有被遍历的分支的个数;
步骤二,根据生成的CFG,生成抽象可达图ARG,如果沿着一条路径生成一个新状态s,如果s对应的R插值被满足,说明状态s可达,继续沿着状态s遍历该路径;否则,状态s不可达,则该路径终止,遍历其他路径;对于一个可达的状态s,如果状态s对应的E插值被该路径对应的路径公式蕴含,说明沿着该状态存在一条到达目标状态的路径,程序不安全;如果状态s对应的S插值被蕴含,说明以状态为起点的所有路径都是安全的,不需要沿着状态s探索程序;如果状态s是可达的,且E插值和S插值都不被蕴含,则继续沿着状态s遍历该路径;
步骤三,在生成ARG的过程中,发现一条反例路径,到达目标状态,则需要进一步判断反例路径是否虚假;不是虚假反例,则说明程序是不安全的;否则,根据虚假反例,细化模型,分别计算并更新对应状态的R插值,S插值和E插值,执行重新生成ARG,直到找到一条真反例路径或不存在反例路径;
所述对信息存储模块进行更新的方法包括:
接收维护更新指令;
根据所述维护更新指令获取用户搜索的信息以及需要维护更新的维度表的维度表信息;
根据所述维度表信息获取预先设置的维度表配置信息;其中,所述维度表配置信息中带有所述需要维护更新的维度表所在的源数据库、所述维度表需要同步的目的数据库以及维度表操作权限信息;
根据所述用户搜索的信息以及所述维度表操作权限信息,判断所述用户搜索的信息是否满足所述维度表操作权限信息;
若所述用户搜索的信息足所述维度表操作权限信息,对所述需要维护更新的维度表进行更新操作;
将进行更新操作后的维度表同步到所述信息存储模块;
所述维度表操作权限信息包括:具有维度表操作权限的用户搜索的信息标识;
所述判断所述用户搜索的信息是否满足所述维度表操作权限信息,包括:
判断所述用户搜索的信息是否在所述具有维度表操作权限的用户搜索的信息标识中;
所述维护更新指令为增加内容指令、更改内容指令或删除内容指令;
在对所述需要维护更新的维度表进行更新操作之前,包括:
根据所述维护更新指令,确定需要维护更新的字段,并获取到所述需要维护更新的字段标识;
根据所述字段标识以及所述维度表配置信息获取到预先设置的字段配置信息;其中,所述字段配置信息包括所述字段的字段内容排序规则、字段次序信息、字段限制条件;
若所述维护更新指令为增加内容指令,所述对所述需要维护更新的维度表进行更新操作,包括:
获取所述增加内容指令对应的批量数据内容;
根据所述批量数据内容,在所述维度表中的一个或多个字段中增加字段内容;
根据所述字段内容排序规则,将所述字段内容进行排序;
根据所述字段次序信息,将维度表中的各个字段进行排序;
若所述维护更新指令为更改内容指令,所述对所述需要维护更新的维度表进行更新操作,包括:
获取所述更改内容指令对应的批量数据内容;
根据所述批量数据内容,在所述维度表中的一个或多个字段中更改字段内容;
若所述维护更新指令为删除内容指令,所述对所述需要维护更新的维度表进行更新操作,包括:
在所述维度表中的一个或多个字段中删除字段内容;
判断所述增加字段内容、更改字段内容或者删除字段内容之后的各字段是否满足所述字段限制条件;
若有字段不满足所述字段限制条件,生成提示信息;所述提示信息用于提示不满足所述字段限制条件的字段数,并提示不满足所述字段限制条件的字段相关信息;所述字段相关信息包括所述字段的所述字段标识或者字段名称;所述段相关信息为搜索的零碎信息。
进一步,所述步骤一生成待验证程序的CFG,并且初始化结点和边的属性,包括以下步骤:
(1)找到CFG中的目标结点,从目标结点开始反向遍历CFG,遍历的结点和边都保留,没有遍历到的结点和边都删除;
(2)得到裁剪后的CFG,初始化属性的值,对各个结点的三种插值进行初始化,初次遍历CFG,生成ARG的过程中,每一个结点的R插值的初始值都为{true};对于S插值,定义了为一个二元组:(F,Is),其中,F的值域为{full,half},Is的值是一个由谓词组成的合取式;对于一个结点l,如果l没有后继结点或者l的所有后继结点的S插值都是full,记为f,表示l的所有后继结点都被遍历过,则l的S插值也是full,否则,l的S插值为half,记为h,具体的形式如下:
l是终结点,S插值的初始值为(full,true),表示如果到达终结点,路径一定是安全的;l是目标结点,S插值的初始值为(full,false),表示如果到达目标结点,路径一定是反例路径;对于其他结点,S插值的初始值为(half,true),具体的形式如下:
l是目标结点,E插值的初始值为true,表示路径一定是真反例;l是终结点,E插值的初始值为false,表示路径一定不可能到达目标结点;对于其他结点,E插值的初始值为false,初始认为都不能到达目标结点;对于每一条迁移的W属性,初始值为⊥,表示还没开始遍历,其中,W的值域为{N+,⊥},N+是正整数集合;
所述步骤二中,利用W属性决定分支边的遍历顺序,同时,利用S插值和E插值,加快验证的效率,具体的步骤包括:
(1)得到一个可达状态s',根据CFG的迁移关系,产生后继状态;如果存在多个可能的后继,根据边的W值,决定遍历顺序;边的W值的优先级为:(>0)>⊥>0;如果边的W值相同,则随机选择;对于一个后继状态s,根据R插值,如果状态s不可达,则当前路径终止,遍历其他路径;如果当前状态s可达,首先判断s的E插值是否为false;如果是false,说明s[0]的后继结点还没被遍历过,跳转到(2);如果不是false,首先采用SSA原则,每一个变量至多被赋值一次,得到从初始状态s0到达s的路径公式,记为Pf(s0,…,s);用求解器判断Pf(s0,…,s)是否蕴含s的E插值;如果蕴含,则说明程序存在一条真反例,程序不安全,验证结束;否则跳转到(2);
(2)判断s的S插值是否为full插值;如果不是full插值,则跳转到(3);如果是full插值,得到从初始状态s0到达s的路径公式,记为Pf(s0,…,s),然后用求解器判断Pf(s0,…,s)是否蕴含s的S插值;如果蕴含,则说明以状态s为起点的所有路径都是安全的,不需要探索,当前路径终止,遍历其他路径;
(3)判断s是否目标状态,如果是目标状态,则发现一条反例路径,执行步骤三;如果不是,进一步判断s是否被其他状态覆盖;如果s被覆盖,则不需要探索当前路径,遍历其他路径;如果s不被覆盖,则继续探索当前路径;
(4)如果存在没有被遍历的可达状态,则跳转到(1);否则,验证结束,程序安全。
进一步,所述步骤三中优化策略包括:
在步骤一中,生成程序对应的CFG,根据目标结点,遍历整个CFG减掉不可能到达目标状态的结点和边;
在步骤三中,如果存在一条虚假反例路径,在计算三种插值的同时,计算反例路径中每一条边的W值;在步骤二中,一个状态如果存在多个后继状态,根据边的W值,决定后继状态的遍历顺序;
所述步骤三中计算插值和W属性的具体步骤包括:
1)在生成ARG的过程中,发现一条反例路径path:〈s0,e0,s1,…,en-1,sn〉;利用SMT求解器判断path是不是虚假;如果path是真反例,则程序不安全,验证结束;如果path是虚假的,则执行2);
2)计算R插值,对于状态si,0<i<n,将path划分为两部分:pre和post;pre子序列为<s0,…,si>,post子序列为<si,…,sn>,利用Craig插值公式计算新的R插值,Craig(pre,post),更新si[0]的R插值,形式化地表示为:
R-Intp(si[0])=R-Intp(si[0])∪Craig(Pf(s0,..,si),Pf(si,…,sn));
其中,Pf(s0,…,si)表示从s0到si的路径对应的路径公式;
3)计算S插值,首先找到path的可达的有效序列Π=<s0,...,sm>,0<m<n,且si状态可达,si+1状态不可达;对于Π的每一个状态si,0<i≤m,判断S插值的的第一个元素是full还是half;si[0]的所有后继结点的S插值都是full,则si[0]的S插值为full,否则,si[0]的S插值为half;具体的形式如下:
对于S插值的第二个元素,记为Is(si[0]),分两种情况,如果i=m,则Is(si[0])是边ei+1的路径公式取反;如果0<i<m,Is(si[0])利用Craig插值计算,记为Craig(A,B);其中,A表示从s0到si的路径公式,B是边ei对应的公式和状态si+1对应的S插值取反的合取式;具体的形式如下:
其中,A=Pf(s0,…,si),B=Pf(si,ei,si+1)∧!(Is(si+1[0]);从sm状态开始倒序地计算每个状态的插值,直到初始状态或者某一状态的S插值为half;
4)计算E插值,找到path的最大有效后缀序列Π=<si,…,sn>,0<i≤n;从si状态开始,利用Craig插值,倒序地计算对应的E插值,记为Craig(A,B);对于si,A是从si到sn的路径公式和sn的E插值的合取式,B是从s0到si的路径公式;对于状态sj,0<j<i,A是从sj到sj+1的路径公式和sj+1的E插值的合取式,B是从s0到sj的路径公式,具体的形式如下:
5)计算边的W值,根据反例路径和更新后的S插值,来计算对应边的W值,对于一条边e:(s,op,s'),如果s'的S插值是full,则e的W值为0;如果s'的S插值是half,且s'是最后一个可达状态,e的W值为s'[0]的出边的个数-1;如果s'的S插值是half,且s'不是最后一个可达状态,e的W值为两部分的和:1)s'[0]的出边中W值不为⊥的边的W值的和,2)s'[0]的出边中W值为⊥的边的个数;对于边e:(s,op,s'),s':(l',c',p')具体的形式如下:
6)跳转到步骤二,重新生成ARG。
当本系统进行工作时,首先,用户在输入界面1输入所要搜索的信息,并将输入的信息传输给信息提取模块2;信息提取模块2对用户在输入界面1输入的信息进行提取,并将信息传输给网页搜索模块3;网页搜索模块3,对信息提取模块2提取出的信息在网页上进行搜索;网页信息集合模块4,对搜索到的信息进行集合,对网页搜索模块3搜索到的零碎信息进行整合;然后信息分类提取模块5,对集合后的信息进行分类提取,采用数据处理分析算法,对集合信息进行分析处理,利用分布式的程序算法,缩短信息处理时间;接着信息比对模块6,比对分类提取的数据与信息存储模块中存储的数据,当信息不匹配或信息存储模块中缺少本信息时,对信息存储模块7进行更新;当信息相同时,可以提取信息存储模块7中的数据,信息存储模块7的存在,提高了搜索的效率;信息整合模块8,将信息比对模块6中的数据进行整合,将身份信息、账户信息、社交信息等整合为所搜索人物的详细资料;最后,显示模块9显示出信息整合模块8整合后的所搜索人物的详细资料。
以上所述仅是对本发明的较佳实施例而已,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化与修饰,均属于本发明技术方案的范围内。
Claims (5)
1.一种互联网人物搜索信息整合分析控制方法,其特征在于,所述互联网人物搜索信息整合分析控制方法包括:
用户在输入界面输入所要搜索的信息,并将输入的信息传输给信息提取模块;信息提取模块对用户在输入界面输入的信息进行提取,并将信息传输给网页搜索模块;
网页搜索模块对信息提取模块提取出的信息在网页上进行搜索;网页信息集合模块对搜索到的信息进行集合,对网页搜索模块搜索到的零碎信息进行整合;
信息分类提取模块对集合后的信息进行分类提取,采用数据处理分析算法,对集合信息进行分析处理,利用分布式的程序算法,缩短信息处理时间;信息比对模块比对分类提取的数据与信息存储模块中存储的数据,当信息不匹配或信息存储模块中缺少本信息时,对信息存储模块进行更新;当信息相同时,可以提取信息存储模块中的数据;
信息整合模块将信息比对模块中的数据进行整合,将身份信息、账户信息、社交信息整合为所搜索人物的详细资料;显示模块显示出信息整合模块整合后的所搜索人物的详细资料;
所述分布式的程序算法包括;
步骤一,根据待验证的程序,生成控制流图CFG,给CFG中的结点添加3个属性:R插值,S插值和E插值,R插值是结点可达的约束条件,判断一个状态的可达性;S插值和E插值对路径进行规约,加快程序的验证;给CFG的边添加属性W;一条边的W值表示以该边指向的结点为根结点的子图中,还没有被遍历的分支的个数;
步骤二,根据生成的CFG,生成抽象可达图ARG,如果沿着一条路径生成一个新状态s,如果s对应的R插值被满足,说明状态s可达,继续沿着状态s遍历该路径;否则,状态s不可达,则该路径终止,遍历其他路径;对于一个可达的状态s,如果状态s对应的E插值被该路径对应的路径公式蕴含,说明沿着该状态存在一条到达目标状态的路径,程序不安全;如果状态s对应的S插值被蕴含,说明以状态为起点的所有路径都是安全的,不需要沿着状态s探索程序;如果状态s是可达的,且E插值和S插值都不被蕴含,则继续沿着状态s遍历该路径;
步骤三,在生成ARG的过程中,发现一条反例路径,到达目标状态,则需要进一步判断反例路径是否虚假;不是虚假反例,则说明程序是不安全的;否则,根据虚假反例,细化模型,分别计算并更新对应状态的R插值,S插值和E插值,执行重新生成ARG,直到找到一条真反例路径或不存在反例路径;
所述对信息存储模块进行更新的方法包括:
接收维护更新指令;
根据所述维护更新指令获取用户搜索的信息以及需要维护更新的维度表的维度表信息;
根据所述维度表信息获取预先设置的维度表配置信息;其中,所述维度表配置信息中带有所述需要维护更新的维度表所在的源数据库、所述维度表需要同步的目的数据库以及维度表操作权限信息;
根据所述用户搜索的信息以及所述维度表操作权限信息,判断所述用户搜索的信息是否满足所述维度表操作权限信息;
若所述用户搜索的信息足所述维度表操作权限信息,对所述需要维护更新的维度表进行更新操作;
将进行更新操作后的维度表同步到所述信息存储模块;
所述维度表操作权限信息包括:具有维度表操作权限的用户搜索的信息标识;
所述判断所述用户搜索的信息是否满足所述维度表操作权限信息,包括:
判断所述用户搜索的信息是否在所述具有维度表操作权限的用户搜索的信息标识中;
所述维护更新指令为增加内容指令、更改内容指令或删除内容指令;
在对所述需要维护更新的维度表进行更新操作之前,包括:
根据所述维护更新指令,确定需要维护更新的字段,并获取到所述需要维护更新的字段标识;
根据所述字段标识以及所述维度表配置信息获取到预先设置的字段配置信息;其中,所述字段配置信息包括所述字段的字段内容排序规则、字段次序信息、字段限制条件;
若所述维护更新指令为增加内容指令,所述对所述需要维护更新的维度表进行更新操作,包括:
获取所述增加内容指令对应的批量数据内容;
根据所述批量数据内容,在所述维度表中的一个或多个字段中增加字段内容;
根据所述字段内容排序规则,将所述字段内容进行排序;
根据所述字段次序信息,将维度表中的各个字段进行排序;
若所述维护更新指令为更改内容指令,所述对所述需要维护更新的维度表进行更新操作,包括:
获取所述更改内容指令对应的批量数据内容;
根据所述批量数据内容,在所述维度表中的一个或多个字段中更改字段内容;
若所述维护更新指令为删除内容指令,所述对所述需要维护更新的维度表进行更新操作,包括:
在所述维度表中的一个或多个字段中删除字段内容;
判断所述增加字段内容、更改字段内容或者删除字段内容之后的各字段是否满足所述字段限制条件;
若有字段不满足所述字段限制条件,生成提示信息;所述提示信息用于提示不满足所述字段限制条件的字段数,并提示不满足所述字段限制条件的字段相关信息;所述字段相关信息包括所述字段的所述字段标识或者字段名称;所述段相关信息为搜索的零碎信息。
2.如权利要求1所述的互联网人物搜索信息整合分析控制方法,其特征在于,
所述步骤一生成待验证程序的CFG,并且初始化结点和边的属性,包括以下步骤:
(1)找到CFG中的目标结点,从目标结点开始反向遍历CFG,遍历的结点和边都保留,没有遍历到的结点和边都删除;
(2)得到裁剪后的CFG,初始化属性的值,对各个结点的三种插值进行初始化,初次遍历CFG,生成ARG的过程中,每一个结点的R插值的初始值都为{true};对于S插值,定义了为一个二元组:(F,Is),其中,F的值域为{full,half},Is的值是一个由谓词组成的合取式;对于一个结点l,如果l没有后继结点或者l的所有后继结点的S插值都是full,记为f,表示l的所有后继结点都被遍历过,则l的S插值也是full,否则,l的S插值为half,记为h,具体的形式如下:
l是终结点,S插值的初始值为(full,true),表示如果到达终结点,路径一定是安全的;l是目标结点,S插值的初始值为(full,false),表示如果到达目标结点,路径一定是反例路径;对于其他结点,S插值的初始值为(half,true),具体的形式如下:
l是目标结点,E插值的初始值为true,表示路径一定是真反例;l是终结点,E插值的初始值为false,表示路径一定不可能到达目标结点;对于其他结点,E插值的初始值为false,初始认为都不能到达目标结点;对于每一条迁移的W属性,初始值为⊥,表示还没开始遍历,其中,W的值域为{N+,⊥},N+是正整数集合;
所述步骤二中,利用W属性决定分支边的遍历顺序,同时,利用S插值和E插值,加快验证的效率,具体的步骤包括:
(1)得到一个可达状态s',根据CFG的迁移关系,产生后继状态;如果存在多个可能的后继,根据边的W值,决定遍历顺序;边的W值的优先级为:(>0)>⊥>0;如果边的W值相同,则随机选择;对于一个后继状态s,根据R插值,如果状态s不可达,则当前路径终止,遍历其他路径;如果当前状态s可达,首先判断s的E插值是否为false;如果是false,说明s[0]的后继结点还没被遍历过,跳转到(2);如果不是false,首先采用SSA原则,每一个变量至多被赋值一次,得到从初始状态s0到达s的路径公式,记为Pf(s0,…,s);用求解器判断Pf(s0,…,s)是否蕴含s的E插值;如果蕴含,则说明程序存在一条真反例,程序不安全,验证结束;否则跳转到(2);
(2)判断s的S插值是否为full插值;如果不是full插值,则跳转到(3);如果是full插值,得到从初始状态s0到达s的路径公式,记为Pf(s0,…,s),然后用求解器判断Pf(s0,…,s)是否蕴含s的S插值;如果蕴含,则说明以状态s为起点的所有路径都是安全的,不需要探索,当前路径终止,遍历其他路径;
(3)判断s是否目标状态,如果是目标状态,则发现一条反例路径,执行步骤三;如果不是,进一步判断s是否被其他状态覆盖;如果s被覆盖,则不需要探索当前路径,遍历其他路径;如果s不被覆盖,则继续探索当前路径;
(4)如果存在没有被遍历的可达状态,则跳转到(1);否则,验证结束,程序安全。
3.如权利要求1所述的互联网人物搜索信息整合分析控制方法,其特征在于,所述步骤三中优化策略包括:
在步骤一中,生成程序对应的CFG,根据目标结点,遍历整个CFG减掉不可能到达目标状态的结点和边;
在步骤三中,如果存在一条虚假反例路径,在计算三种插值的同时,计算反例路径中每一条边的W值;在步骤二中,一个状态如果存在多个后继状态,根据边的W值,决定后继状态的遍历顺序;
所述步骤三中计算插值和W属性的具体步骤包括:
1)在生成ARG的过程中,发现一条反例路径path:〈s0,e0,s1,…,en-1,sn〉;利用SMT求解器判断path是不是虚假;如果path是真反例,则程序不安全,验证结束;如果path是虚假的,则执行2);
2)计算R插值,对于状态si,0<i<n,将path划分为两部分:pre和post;pre子序列为<s0,…,si>,post子序列为<si,…,sn>,利用Craig插值公式计算新的R插值,Craig(pre,post),更新si[0]的R插值,形式化地表示为:
R-Intp(si[0])=R-Intp(si[0])∪Craig(Pf(s0,..,si),Pf(si,…,sn));
其中,Pf(s0,…,si)表示从s0到si的路径对应的路径公式;
3)计算S插值,首先找到path的可达的有效序列Π=<s0,...,sm>,0<m<n,且si状态可达,si+1状态不可达;对于Π的每一个状态si,0<i≤m,判断S插值的的第一个元素是full还是half;si[0]的所有后继结点的S插值都是full,则si[0]的S插值为full,否则,si[0]的S插值为half;具体的形式如下:
对于S插值的第二个元素,记为Is(si[0]),分两种情况,如果i=m,则Is(si[0])是边ei+1的路径公式取反;如果0<i<m,Is(si[0])利用Craig插值计算,记为Craig(A,B);其中,A表示从s0到si的路径公式,B是边ei对应的公式和状态si+1对应的S插值取反的合取式;具体的形式如下:
其中,A=Pf(s0,…,si),B=Pf(si,ei,si+1)∧!(Is(si+1[0]);从sm状态开始倒序地计算每个状态的插值,直到初始状态或者某一状态的S插值为half;
4)计算E插值,找到path的最大有效后缀序列Π=<si,…,sn>,0<i≤n;从si状态开始,利用Craig插值,倒序地计算对应的E插值,记为Craig(A,B);对于si,A是从si到sn的路径公式和sn的E插值的合取式,B是从s0到si的路径公式;对于状态sj,0<j<i,A是从sj到sj+1的路径公式和sj+1的E插值的合取式,B是从s0到sj的路径公式,具体的形式如下:
5)计算边的W值,根据反例路径和更新后的S插值,来计算对应边的W值,对于一条边e:(s,op,s'),如果s'的S插值是full,则e的W值为0;如果s'的S插值是half,且s'是最后一个可达状态,e的W值为s'[0]的出边的个数-1;如果s'的S插值是half,且s'不是最后一个可达状态,e的W值为两部分的和:1)s'[0]的出边中W值不为⊥的边的W值的和,2)s'[0]的出边中W值为⊥的边的个数;对于边e:(s,op,s'),s':(l',c',p')具体的形式如下:
6)跳转到步骤二,重新生成ARG。
4.一种如权利要求1所述的互联网人物搜索信息整合分析控制方法的互联网人物搜索信息整合分析控制系统,其特征在于,所述互联网人物搜索信息整合分析控制系统包括:
输入界面,与信息提取模块连接,用户可以在输入界面输入所要搜索的信息,并传输给信息提取模块;
信息提取模块,与网页搜索模块连接,用于对用户在输入界面输入的信息进行提取,并传输给网页搜索模块;
网页搜索模块,与网页信息集合模块连接,用于对信息提取模块提取出的信息在网页上进行搜索;
网页信息集合模块,与信息分类提取模块连接,用于对搜索到的信息进行集合,能够将网页搜索模块搜索到的零碎信息进行整合;
信息分类提取模块,与信息比对模块连接,用于对集合后的信息进行分类提取,采用数据处理分析算法,对集合信息进行分析处理,利用分布式的程序算法,缩短信息处理时间;
信息比对模块,与信息存储模块和信息整合模块连接,用于比对分类提取的数据与信息存储模块中存储的数据,当信息不匹配或信息存储模块中缺少本信息时,对信息存储模块进行更新;当信息相同时,可以提取信息存储模块中的数据;
信息存储模块,与信息比对模块连接,用于存储以前所搜索到的人物信息;
信息整合模块,与显示模块连接,用于将信息比对模块中的数据进行整合,将身份信息、账户信息、社交信息整合为所搜索人物的详细资料;
显示模块,与信息整合模块连接,用于显示信息整合模块整合后的所搜索人物的详细资料。
5.如权利要求4所述的互联网人物搜索信息整合分析控制系统,其特征在于,所述网页搜索模块为系统根据所搜索的人物在搜索引擎中进行搜索,获取网页信息后,经由网页信息集合模块将各个网页的信息进行集合,然后通过信息分类提取模块对所搜索人物的邮箱、联系方式、账户信息进行分类提取。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711451026.8A CN108009298B (zh) | 2017-12-27 | 2017-12-27 | 一种互联网人物搜索信息整合分析控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711451026.8A CN108009298B (zh) | 2017-12-27 | 2017-12-27 | 一种互联网人物搜索信息整合分析控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108009298A true CN108009298A (zh) | 2018-05-08 |
CN108009298B CN108009298B (zh) | 2021-08-31 |
Family
ID=62061795
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711451026.8A Expired - Fee Related CN108009298B (zh) | 2017-12-27 | 2017-12-27 | 一种互联网人物搜索信息整合分析控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108009298B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108822583A (zh) * | 2018-07-31 | 2018-11-16 | 湖南工业大学 | 一种表面无机和有机包膜的金红石型钛白粉的制备方法 |
CN111126103A (zh) * | 2018-10-30 | 2020-05-08 | 百度在线网络技术(北京)有限公司 | 用户人生阶段状态的判断方法和装置 |
CN112860754A (zh) * | 2021-03-11 | 2021-05-28 | 恒基文化实业(深圳)有限公司 | 一种基于大数据筛选相应用户的数据处理方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103778162A (zh) * | 2012-10-26 | 2014-05-07 | 广州市邦富软件有限公司 | 一种互联网人物搜索信息整合分析方法 |
CN104252452A (zh) * | 2013-06-25 | 2014-12-31 | 腾讯科技(深圳)有限公司 | 数据管理的方法及装置 |
CN106446084A (zh) * | 2016-09-09 | 2017-02-22 | 北京高地信息技术有限公司 | 一种互联网人物搜索信息整合分析方法 |
-
2017
- 2017-12-27 CN CN201711451026.8A patent/CN108009298B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103778162A (zh) * | 2012-10-26 | 2014-05-07 | 广州市邦富软件有限公司 | 一种互联网人物搜索信息整合分析方法 |
CN104252452A (zh) * | 2013-06-25 | 2014-12-31 | 腾讯科技(深圳)有限公司 | 数据管理的方法及装置 |
CN106446084A (zh) * | 2016-09-09 | 2017-02-22 | 北京高地信息技术有限公司 | 一种互联网人物搜索信息整合分析方法 |
Non-Patent Citations (1)
Title |
---|
张波: "基于动态执行的C程序复杂循环检测方法", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108822583A (zh) * | 2018-07-31 | 2018-11-16 | 湖南工业大学 | 一种表面无机和有机包膜的金红石型钛白粉的制备方法 |
CN111126103A (zh) * | 2018-10-30 | 2020-05-08 | 百度在线网络技术(北京)有限公司 | 用户人生阶段状态的判断方法和装置 |
CN111126103B (zh) * | 2018-10-30 | 2023-09-26 | 百度在线网络技术(北京)有限公司 | 用户人生阶段状态的判断方法和装置 |
CN112860754A (zh) * | 2021-03-11 | 2021-05-28 | 恒基文化实业(深圳)有限公司 | 一种基于大数据筛选相应用户的数据处理方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108009298B (zh) | 2021-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107844415A (zh) | 一种基于插值的模型检测路径缩减方法、计算机 | |
Bang et al. | Explaining a black-box by using a deep variational information bottleneck approach | |
Wang et al. | Learning semantic program embeddings with graph interval neural network | |
CN109426722A (zh) | Sql注入缺陷检测方法、系统、设备及存储介质 | |
CN113641586A (zh) | 软件源代码缺陷检测方法、系统、电子设备及储存介质 | |
Fan et al. | Answering graph pattern queries using views | |
CN113254630B (zh) | 一种面向全球综合观测成果的领域知识图谱推荐方法 | |
CN108009298A (zh) | 一种互联网人物搜索信息整合分析控制方法 | |
Zeng et al. | EtherGIS: a vulnerability detection framework for Ethereum smart contracts based on graph learning features | |
CN109670306A (zh) | 基于人工智能的电力恶意代码检测方法、服务器及系统 | |
Yang | An example of local reasoning in BI pointer logic: the Schorr-Waite graph marking algorithm | |
CN112860263B (zh) | 一种基于智能合约知识图谱的合约缺陷检测方法 | |
CN106708739A (zh) | 基于扩展状态机模型的Web服务测试用例生成方法及系统 | |
CN106934011A (zh) | 一种json数据的结构化解析方法及装置 | |
CN103559125A (zh) | 一种利用图同构验证编译器的方法 | |
CN103793589B (zh) | 一种高速列车故障处理方法 | |
CN105487983A (zh) | 基于智能路径引导的敏感点逼近方法 | |
Seref et al. | Software code maintainability: a literature review | |
Li et al. | Subgraph matching on temporal graphs | |
Hogan et al. | In-database graph analytics with recursive SPARQL | |
Kunc et al. | Reversibility of computations in graph-walking automata | |
Alian et al. | Bridging semantics for automated web form testing | |
Simiński | Extraction of rules dependencies for optimization of backward inference algorithm | |
Li et al. | Model checking approach to automated planning | |
Torta et al. | Representing ecological network specifications with semantic web techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210831 |
|
CF01 | Termination of patent right due to non-payment of annual fee |