CN101937455B - 基于无限分层和信息遗传实现多维分类集群的创建方法 - Google Patents
基于无限分层和信息遗传实现多维分类集群的创建方法 Download PDFInfo
- Publication number
- CN101937455B CN101937455B CN201010264673XA CN201010264673A CN101937455B CN 101937455 B CN101937455 B CN 101937455B CN 201010264673X A CN201010264673X A CN 201010264673XA CN 201010264673 A CN201010264673 A CN 201010264673A CN 101937455 B CN101937455 B CN 101937455B
- Authority
- CN
- China
- Prior art keywords
- website
- websites
- setting value
- hereditary information
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000012217 deletion Methods 0.000 claims description 7
- 230000037430 deletion Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 3
- 230000006978 adaptation Effects 0.000 claims 1
- 238000011156 evaluation Methods 0.000 claims 1
- 230000010429 evolutionary process Effects 0.000 claims 1
- 230000007812 deficiency Effects 0.000 abstract 1
- 238000002955 isolation Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 12
- 238000013507 mapping Methods 0.000 description 6
- 238000010276 construction Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 230000002950 deficient Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了互联网技术领域中的一种基于无限分层和信息遗传实现多维分类集群的创建方法,用于解决门户网站集群数据孤立、搜索复杂和缺乏扩展性的问题。该方法包括:创建多叉树;为每个网站进行编码;对网站集合进行多次划分并确定各个网站的上下级关系;每次进行网站集合划分时,设定每个网站的遗传信息设定值;保存每次进行网站集合划分后形成的多叉树结构,并将网站编码存入该多叉树结点;创建网站分类遗传信息表,存入网站编码、遗传信息设定值和网站名称;利用导入程序将每个网站的遗传信息设定值写入到入口地址中,并存入网站基本信息表中。本发明在各个网站之间建立起数据关联性,灵活地动态增加和减少系统,为网站的扩展分层提供了保证。
Description
技术领域
本发明属于互联网技术领域,尤其涉及一种基于无限分层和信息遗传实现多维分类集群的创建方法。
背景技术
云计算是一种面向未来的网络应用模式。云计算是指服务的交付和使用模式,是指通过网络以按需、易扩展的方式获得所需的服务,这种服务可以是IT和软件、互联网相关的,也可以是任意其他的服务,它具有超大规模、巨复杂、虚拟化、可靠安全等独特功效。
门户网站集群是互联网服务提供商将诸多不同用户、不同类型和不同行业的门户网站集成在一起,统一提供软、硬件资源的服务形式,这种服务形式是用户自己可以独立地创建和管理自己的网站。在使用本方法创建和管理门户网站集群之前,出现了如下一些问题:
1、数据信息相互孤立。虽然各个网站的软、硬件资源(包括计算资源、存储资源等)统一提供,但是每个网站独立运行,各个网站之间的数据信息相互独立,形成了网络信息孤岛。
2、数据搜索时间长、精度低。由于网站之间的信息相互孤立,缺乏相互关联,进一步导致了数据信息搜索的时间增长和精度降低。在信息量小,网站集群规模很小时,这种缺陷还不是很明显,但是随着信息量的不断增大以及网站集群规模的不断增加,这种缺陷就会越来越明显。
3、不能动态地增加和减少系统以实现数据信息的无限扩展。由于目前常用的门户网站集群使用简单的超链接方式、数据链表或者简单的树状结构等组织结构组织数据信息,这使得在数据增加到一定程度后,在这些组织结构中增加或者减少内容将变得十分困难。
针对目前门户网站集群存在的不适合云计算的发展趋势的上述问题,本发明提供了一种基于无限分层和信息遗传实现多维分类集群的创建方法,通过构建多叉树来描述数据结构,使数据信息具有无限扩展的能力;并建立带遗传信息的多维架构,使数据信息之间相互关联,解决信息孤岛问题的同时,也使数据信息搜索的速度和精度得到了提高。
发明内容
本发明的目的在于,针对目前门户网站集群不适合云计算发展趋势,存储在各网站之间数据信息相互孤立、数据搜索时间长且精度低、网站集群无法实现数据信息无限扩展的问题,提出一种基于无限分层和信息遗传实现多维分类集群的创建方法。
技术方案是,一种基于无限分层和信息遗传实现多维分类集群的创建方法,其特征是所述方法包括下列步骤:
步骤1:创建多叉树,所述多叉树结点用于存储与网站对应的编码;
步骤2:为网站集合中的每个网站进行编码;
步骤3:对网站集合进行多次划分,并在每次划分时,确定网站集合中的各个网站的上下级关系;
步骤4:每次进行网站集合划分时,设定网站集合中每个网站的遗传信息设定值;所述遗传信息设定值满足下级网站的遗传信息设定值含有其上级网站的遗传信息设定值;
步骤5:每次进行网站集合划分后,根据划分出的网站的上下级关系,都会形成一棵多叉树,将所述多叉树存入步骤1创建的多叉树结构中,并将网站编码存入所述多叉树结点;
步骤6:创建网站分类遗传信息表,将网站编码、每次网站集合划分时获得的遗传信息设定值和网站的名称存入所述网站分类遗传信息表;
步骤7:利用导入程序将每个网站的遗传信息设定值写入到入口地址中,并将所述入口地址存入服务器端的设定路径下,并将该设定路径存入网站基本信息表中。
所述多叉树为hm树,所述hm树的创建过程是:
步骤A:初始化,设置进化代数计数器t=0,设置最大进化代数T,随机生成M个个体作为初始群体P(0);
步骤B:个体评价,计算群体P(t)中各个个体的适应度;
步骤C:选择运算,将选择算子作用于群体。选择的目的是把优化的个体直接遗传到下一代。选择操作是建立在群体中个体的适应度评估基础上的。群体P(t)经过选择运算之后得到下一代群体P(t1);
步骤D:终止条件判断,若t=T,则以进化过程中所得到的具有最大适应度个体作为最优解输出,终止计算。
所述为网站集合中的每个网站进行编码后,每个网站的编码各不相同。
所述对网站集合进行多次划分的次数大于等于1次。
所述网站集合在所述创建方法完成后,增加网站包括下列步骤:
步骤11:为待增加的网站进行编码;
步骤12:确定待增加的网站在每次进行网站集合划分后的上级网站,并根据各个上级网站的遗传信息设定值,设定待增加的网站的遗传信息设定值;
步骤13:在每次网站集合划分后形成的多叉树结构中,找到待增加的网站的上级网站对应的结点,并在该结点下增加结点,将待增加的网站编码存储到所述增加的结点中;
步骤14:将待增加的网站编码、待增加的网站的遗传信息设定值和待增加的网站名称存入网站分类遗传信息表;
步骤15:利用导入程序将待增加的网站的遗传信息设定值写入到入口地址中,并将所述入口地址存入服务器端的设定路径下,并将该设定路径存入网站基本信息表中。
所述网站集合在所述创建方法完成后,删除网站包括下列步骤:
步骤21:判断待删除的网站在多叉树结构中是否是叶子结点,如果是,则执行步骤22;否则,删除的网站在多叉树结构中是树枝结点,此时执行步骤23;
步骤22:直接在多叉树结构中删除该叶子结点,并在网站分类遗传信息表中,删除所述待删除的网站的编码、遗传信息设定值、入口地址;
步骤23:在多叉树结构中,将待删除的网站的下级网站所对应的结点连接到待删除的网站的上级网站所对应的结点,然后删除待删除的网站对应的结点;
步骤24:在网站分类遗传信息表中,删除所述待删除的网站的编码、遗传信息设定值和入口地址。
本发明基于无限分层和信息遗传实现多维分类集群的创建,网站集合通过多次划分,形成多维结构,便于网站的快速定位;带遗传信息的多叉树结构在各个网站之间的建立起数据关联性,既便于数据的搜索,又为网站的扩展分层提供了保证。
附图说明
图1是本发明提供的方法流程图;
图2是按地域对网站集合进行划分确立各个网站上下级关系后形成的多叉树树型结构示意图;
图3是按行业对网站集合进行划分确立各个网站上下级关系后形成的多叉树树型结构示意图;
图4是按栏目对网站集合进行划分确立各个网站上下级关系后形成的多叉树树型结构示意图;
图5是按地域对网站集合进行划分后网站、网站编码和遗传信息设定值的对应关系表;
图6是按行业对网站集合进行划分后网站、网站编码和遗传信息设定值的对应关系表;
图7是按栏目对网站集合进行划分后网站、网站编码和遗传信息设定值的对应关系表;
图8是网站分类遗传信息表结构图;
图9是存入了网站入口地址的网站分类遗传信息表结构图;
图10是按本发明实施例提供的三种方式对网站集合划分后的三维空间定位示意图;
图11是网站集合无限分层可扩展示意图。
具体实施方式
下面结合附图,对优选实施例作详细说明。应该强调的是,下述说明仅仅是示例性的,而不是为了限制本发明的范围及其应用。
目前的门户网站集群的数据信息组织结构主要以超链接方式和数据链表方式。超链接方式数据之间没有任何关系,组织随意。数据链表方式只能体现数据之间的位置关系,即提取相邻的数据没有问题,但是不相邻的数据提取就显得无能为力了。一些大型的门户网站集群使用的树的结构进行数据组织,这种组织结构的一大进步在于,使所有数据能够按照一定的规律排列,使所有数据呈现出“树”的相互关系,因此对不相邻的数据的提取通过对树或者子树的遍历即可实现。但是,目前采用的这种树结构还有个问题,那就是树节点存储的是网站对象,这种存储方式造成数据提取要遍历整个树形结构,并且在数据不断增加时,遍历速度急剧下降。
图1是本发明提供的方法流程图。图1中,本发明针对上述门户网站集群存在的问题,提出一种基于无限分层和信息遗传实现多维分类集群的创建方法,所述方法包括下列步骤:
步骤1:创建多叉树,所述多叉树结点用于存储与网站对应的编码。
本发明使用的多叉树用来表示网站之间的关系。多叉树是指树的每个结点允许含有多个(2个以上)子结点的树。多叉树的每个结点(叶子结点除外)下会有多个分支,每个分支要么是一个新的结点,要么是树的结尾,称为叶子。而由于网站的整体布局和结构对网页的分类提供了重要的信息,因此多叉树对结点信息的获取是把网站作为“代码”进行描述的,这是对分类的一个大的跨跃,大大提高了提取分类结构信息的效率。在本发明中,树中每个结点并不是用来存储网站对象的,而是用来存储网站对应的编码的。
在本发明中,多叉树可以采用hm树,其创建过程是:
步骤A:初始化,设置进化代数计数器t=0,设置最大进化代数T,随机生成M个个体作为初始群体P(0)。
步骤B:个体评价,计算群体P(t)中各个个体的适应度。
步骤C:选择运算,将选择算子作用于群体。选择的目的是把优化的个体直接遗传到下一代。选择操作是建立在群体中个体的适应度评估基础上的。群体P(t)经过选择运算之后得到下一代群体P(t1)。
步骤D:终止条件判断,若t=T,则以进化过程中所得到的具有最大适应度个体作为最优解输出,终止计算。
步骤2:为网站集合中的每个网站进行编码。
为网站集合中的每个网站进行编码后,应当保证每个网站的编码各不相同,从而使每个网站对应的编码唯一。
步骤3:对网站集合进行多次划分,并在每次划分时,确定网站集合中的各个网站的上下级关系。
网站集合的划分方式可以依据网站的属性,网站的地域、网站的行业等方式进行划分。在本实施例中,分别对网站集合进行地域划分、行业划分和栏目划分。每次划分后,需要确定网站集合中的各个网站的上下级关系。
进行地域划分,可以按照行政区划确定各个网站的上下级关系,即按照国家、省/自治区/直辖市、市、县、乡镇和村确定各个网站的上下级关系。
当为每次划分的网站集合的各个网站确定了上下级关系后,就形成了一棵树形结构。
图2是按地域对网站集合进行划分确立各个网站上下级关系后形成的多叉树树型结构示意图。树的根节点是“国家”,下层节点是“省/自治区/直辖市”,再下层是“市”,依次类推。
图3是按行业对网站集合进行划分确立各个网站上下级关系后形成的多叉树树型结构示意图。树的根节点是“行业分类”,下层节点是大的行业领域,再下层是大的行业领域中的细分行业。
图4是按栏目对网站集合进行划分确立各个网站上下级关系后形成的多叉树树型结构示意图。树的根节点是某一个栏目,如IT,下层节点是该栏目的下属细分栏目,再下层是具体栏目。
步骤4:每次进行网站集合划分时,设定网站集合中每个网站的遗传信息设定值;所述遗传信息设定值满足下级网站的遗传信息设定值含有其上级网站的遗传信息设定值。
图5是按地域对网站集合进行划分后网站、网站编码和遗传信息设定值的对应关系表。图5中,按地域进行网站集合划分后,各个网站按照行政区划确立了上下级关系。此时,对各个网站设定遗传信息设定值。如果多次对网站集合进行划分,则第一次划分后设定的遗传信息设定值为第一遗传信息设定值,第二次划分后设定的遗传信息设定值为第二遗传信息设定值,以此类推。另外,下级网站的遗传信息设定值应当含有其上级网站的遗传信息设定值。比如图5中,中国主站的第一遗传信息设定值为“bb”,其下级网站北京站的第一遗传信息设定值为“bbb”,含有了其上级网站的遗传信息设定值。同样的,北京站的下级网站海淀站的第一遗传信息设定值为“bbbc”,含有了其上级网站“北京站”的遗传信息设定值“bbb”和上上级网站“中国主站”的遗传信息设定值“bb”。
图6是按行业对网站集合进行划分后网站、网站编码和遗传信息设定值的对应关系表。按行业对网站集合进行划分是本实施例中的第二次划分,因此设定的遗传信息设定值为第二遗传信息设定值。图6中,行业主站的第二遗传信息设定值为“cc”,其下级网站教育站的第二遗传信息设定值为“ccb”,含有了其上级网站的遗传信息设定值。同样的,教育站的下级网站学校教育站的第二遗传信息设定值为“ccbc”,含有了其上级网站“教育站”和上上级网站“行业主站”的遗传信息设定值。
图7是按栏目对网站集合进行划分后网站、网站编码和遗传信息设定值的对应关系表。按栏目对网站集合进行划分是本实施例中的第三次划分,因此设定的遗传信息设定值为第三遗传信息设定值。图7中,第三遗传信息设定值也符合下级网站的遗传信息设定值含有其上级网站的遗传信息设定值的要求。
步骤5:每次进行网站集合划分后,根据划分出的网站的上下级关系,都会形成一棵多叉树,将所述多叉树存入步骤1创建的多叉树结构中,并将网站编码存入所述多叉树结点。
在本发明的实施例中,进行了三次划分,每次划分后都形成一棵多叉树树形结构。将每颗多叉树存入步骤1创建的多叉树结构中,并在每颗多叉树的树形结构的结点中存入网站对应的编码。
步骤6:创建网站分类遗传信息表,将网站编码、每次网站集合划分时获得的遗传信息设定值和网站的名称存入所述网站分类遗传信息表。
图8是网站分类遗传信息表结构图。将每次网站集合划分时获得的遗传信息设定值(包括第一遗传信息设定值、第二遗传信息设定值和第三遗传信息设定值)、网站编码和网站的名称存入所述网站分类遗传信息表。
步骤7:利用导入程序将每个网站的遗传信息设定值写入到入口地址中,并将所述入口地址存入服务器端的设定路径下,并将该设定路径存入网站基本信息表中。
图9是存入了网站入口地址的网站分类遗传信息表结构图。
在使用上述基于无限分层和信息遗传实现多维分类集群的创建方法完成网站集群的划分与创建后,如果在网站集合中增加网站,其步骤具体如下:
步骤11:为待增加的网站进行编码。
步骤12:确定待增加的网站在每次进行网站集合划分后的上级网站,并根据各个上级网站的遗传信息设定值,设定待增加的网站的遗传信息设定值。
在本实施例中,分别按地域、按行业、按栏目对网站集合进行了划分,因此,待增加的网站要分别按地域、按行业、按栏目确定其上级网站和相应的遗传信息设定值。
步骤13:在每次网站集合划分后形成的多叉树结构中,找到待增加的网站的上级网站对应的结点,并在该结点下增加结点,将待增加的网站编码存储到所述增加的结点中。
步骤14:将待增加的网站编码、待增加的网站的遗传信息设定值和待增加的网站名称存入网站分类遗传信息表。
本实施例中的遗传信息设定值包括按地域、按行业、按栏目确定其上级网站后所对应的遗传信息设定值。
步骤15:利用导入程序将待增加的网站的遗传信息设定值写入到入口地址中,并将所述入口地址存入服务器端的设定路径下,并将该设定路径存入网站基本信息表中。
在使用上述基于无限分层和信息遗传实现多维分类集群的创建方法完成网站集群的划分与创建后,如果在网站集合中删除网站,其步骤具体如下:
步骤21:判断待删除的网站在多叉树结构中是否是叶子结点,如果是,则执行步骤22;否则,待删除的网站在多叉树结构中是树枝结点,此时执行步骤23。
步骤22:直接在多叉树结构中删除该叶子结点,并在网站分类遗传信息表中,删除所述待删除的网站的编码、遗传信息设定值、入口地址。
如果待删除的网站是叶子结点,则其没有下级结点。此时处理较为简单,直接在树结构中删除结点,并在网站分类遗传信息表中删除此网站的记录,包括待删除的网站的编码、遗传信息设定值、入口地址。
步骤23:在多叉树结构中,将待删除的网站的下级网站所对应的结点连接到待删除的网站的上级网站所对应的结点,然后删除待删除的网站对应的结点。
如果待删除的网站不是叶子结点,则说明其是树枝结点。此时处理较为复杂,需要考虑该结点的下级结点,即下级网站。要将待删除的网站的下级网站所对应的结点连接到待删除的网站的上级网站所对应的结点。因为待删除的网站的下级网站和其上级网站之间存在上下级关系,所以在待删除的网站删除后,要保证待删除的网站的下级网站和其上级网站之间依然保留上下级关系。
步骤24:在网站分类遗传信息表中,删除所述待删除的网站的编码、遗传信息设定值和入口地址。在网站分类遗传信息表中,删除待删除的网站的记录,包括编码、遗传信息设定值和入口地址。
此时不需要改变待删除的网站的下级网站的遗传信息设定值。因为,待删除的网站的下级网的遗传信息设定值含有待删除的网站的上级网站的遗传信息设定值,其遗传信息设定值的继承关系没有任何变化。
依照上述方式创建网站集群,具有下述效果:
1、解决了数据孤岛的问题。
常用的网站集群的各个网站之间的信息是相互孤立的。比如:从一个网站切换到另一个网站往往不会携带前一个网站的信息。但是,按照本发明的方式创建网站集群,从一个网站切换到另一个网站时,会携带遗传信息设定值。比如,从北京的软件站切换到中国主站,不会直接进入中国的主站,而是会进入中国的软件站,这是因为在切换时,携带了“软件站”的遗传信息设定值的缘故。因而,分类集群网站的数据不仅是连通的,而且会自动属于其上级网站,有父子继承关联。
2、解决了数据搜索的时间和精度问题。
常用的网站集群的搜索方式是网页关键字、链表或者树结构遍历的方式,而本发明的数据搜索则是子树搜索方式。所谓子树搜索,即搜索到某个节点具有与需要检索的信息有相对应的信息时,就立即停止搜索,而将该节点下的所有节点都提取出来,因为该节点下的所有节点都有该节点的遗传信息。举例来说,如果搜索信息为“北京”,则在本发明中,会在按地域划分的多叉树中,将“北京”对应的节点下的所有节点都提取出来,因为“北京”节点下的节点“海淀”、“北太平庄”等节点一定携带“北京”节点的遗传信息。因此,本发明的搜索已经不是网页关键字、链表或者树结构遍历方式的搜索,而是对多叉树子树的搜索,这种搜索方式的搜索速度一定高于其他方式。
另外,由于本发明采用多维结构,每一维就是一个多叉树或者是一次划分,对多维结构的定位更加快速和准确。图10是按本发明实施例提供的三种方式对网站集合划分后的三维空间定位示意图。假设对“北京”、“教育行业”和“软件”进行定位,则通过检索网站分类遗传信息表能够迅速定位与上述三个主题相关的入口地址为“../bbb/ccb/ddb/index.jsp”,能够迅速将涉及北京教育行业的软件网站提取出来。
3、灵活地动态增加和减少系统,实现结构信息的无限扩展。
常用的网站集群管理的网站当数量众多时,由于网站结构的问题,使得网站数量在增加到一定程度后,其搜索、定位等服务效能迅速降低,从而出现了网站集群无法扩展的问题。
而在本发明中,网站集合首先是多维的,用户可以根据需要进行网站集合的划分,并将网站编码存入到划分形成的多叉树结构的节点中。其次,本发明的子树是可以动态增加的。图11是网站集合无限分层可扩展示意图,图11中,以行业为例,如果增加一个行业,则在行业树中的相应节点下,增加该行业子树即可。而由于本发明的搜索是基于子树的,因此增加一个子树(一个子树会有多个节点,每个节点会对应一个网站,因此一个子树会对应多个网站)的搜索复杂度最多是在原复杂度的基础上加1。这与其他网站集群不同,其他网站集群在增加同样多的网站的情况下,搜索复杂度可能会呈指数级增长。因此,本发明提供的方法,能够保证搜索复杂度的增长速度远远低于网站的增长速度,这使得本发明的扩展可以不受限制。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
Claims (5)
1.一种基于无限分层和信息遗传实现多维分类集群的创建方法,其特征是所述方法包括下列步骤:
步骤1:创建多叉树,所述多叉树结点用于存储与网站对应的编码;
所述多叉树为hm树,所述hm树的创建过程是:
步骤A:初始化,设置进化代数计数器t=0,设置最大进化代数T,随机生成M个个体作为初始群体P(0);
步骤B:个体评价,计算群体P(t)中各个个体的适应度;
步骤C:选择运算,将选择算子作用于群体;选择的目的是把优化的个体直接遗传到下一代;选择操作是建立在群体中个体的适应度评估基础上的;群体P(t)经过选择运算之后得到下一代群体P(t1);
步骤D:终止条件判断,若t=T,则以进化过程中所得到的具有最大适应度个体作为最优解输出,终止计算;
步骤2:为网站集合中的每个网站进行编码;
步骤3:对网站集合进行多次划分,并在每次划分时,确定网站集合中的各个网站的上下级关系;
步骤4:每次进行网站集合划分时,设定网站集合中每个网站的遗传信息设定值;所述遗传信息设定值满足下级网站的遗传信息设定值含有其上级网站的遗传信息设定值;
步骤5:每次进行网站集合划分后,根据划分出的网站的上下级关系,都会形成一棵多叉树,将所述多叉树存入步骤1创建的多叉树结构中,并将网站编码存入所述多叉树结点;
步骤6:创建网站分类遗传信息表,将网站编码、每次网站集合划分时获得的遗传信息设定值和网站的名称存入所述网站分类遗传信息表;
步骤7:利用导入程序将每个网站的遗传信息设定值写入到入口地址中,并将所述入口地址存入服务器端的设定路径下,并将该设定路径存入网站基本信息表中。
2.根据权利要求1所述的一种基于无限分层和信息遗传实现多维分类集群的创建方法,其特征是所述为网站集合中的每个网站进行编码后,每个网站的编码各不相同。
3.根据权利要求1所述的一种基于无限分层和信息遗传实现多维分类集群的创建方法,其特征是所述对网站集合进行多次划分的次数大于等于1次。
4.根据权利要求1所述的一种基于无限分层和信息遗传实现多维分类集群的创建方法,其特征是所述网站集合在所述创建方法完成后,增加网站包括下列步骤:
步骤11:为待增加的网站进行编码;
步骤12:确定待增加的网站在每次进行网站集合划分后的上级网站,并根据各个上级网站的遗传信息设定值,设定待增加的网站的遗传信息设定值;
步骤13:在每次网站集合划分后形成的多叉树结构中,找到待增加的网站的上级网站对应的结点,并在该结点下增加结点,将待增加的网站编码存储到所述增加的结点中;
步骤14:将待增加的网站编码、待增加的网站的遗传信息设定值和待增加的网站名称存入网站分类遗传信息表;
步骤15:利用导入程序将待增加的网站的遗传信息设定值写入到入口地址中,并将所述入口地址存入服务器端的设定路径下,并将该设定路径存入网站基本信息表中。
5.根据权利要求1所述的一种基于无限分层和信息遗传实现多维分类集群的创建方法,其特征是所述网站集合在所述创建方法完成后,删除网站包括下列步骤:
步骤21:判断待删除的网站在多叉树结构中是否是叶子结点,如果是,则执行步骤22;否则,待删除的网站在多叉树结构中是树枝结点,此时执行步骤23;
步骤22:直接在多叉树结构中删除该叶子结点,并在网站分类遗传信息表中,删除所述待删除的网站的编码、遗传信息设定值、入口地址;
步骤23:在多叉树结构中,将待删除的网站的下级网站所对应的结点连接到待删除的网站的上级网站所对应的结点,然后删除待删除的网站对应的结点;
步骤24:在网站分类遗传信息表中,删除所述待删除的网站的编码、遗传信息设定值和入口地址。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010264673XA CN101937455B (zh) | 2010-08-27 | 2010-08-27 | 基于无限分层和信息遗传实现多维分类集群的创建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201010264673XA CN101937455B (zh) | 2010-08-27 | 2010-08-27 | 基于无限分层和信息遗传实现多维分类集群的创建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101937455A CN101937455A (zh) | 2011-01-05 |
CN101937455B true CN101937455B (zh) | 2012-02-08 |
Family
ID=43390784
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201010264673XA Active CN101937455B (zh) | 2010-08-27 | 2010-08-27 | 基于无限分层和信息遗传实现多维分类集群的创建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101937455B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103226614A (zh) * | 2013-05-13 | 2013-07-31 | 济南政和科技有限公司 | 一种县市级科技经济管理部门门户网站快速生成方法 |
CN105491000B (zh) * | 2014-12-31 | 2019-05-07 | 哈尔滨安天科技股份有限公司 | 使用网页校验码来防止任意上传文件的方法及系统 |
CN106845798A (zh) * | 2016-12-29 | 2017-06-13 | 兰州大学淮安高新技术研究院 | 一种基于多叉树的跨领域专利预警信息分析方法 |
CN107545073A (zh) * | 2017-09-26 | 2018-01-05 | 北京荣播天下文化传媒有限公司 | 基于微信公众平台的信息查询系统及方法 |
CN110309596B (zh) * | 2019-07-02 | 2022-12-23 | 上海天诚通信技术股份有限公司 | 基于多叉树算法的综合布线信息管理方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7774288B2 (en) * | 2006-05-16 | 2010-08-10 | Sony Corporation | Clustering and classification of multimedia data |
CN101388024B (zh) * | 2008-10-09 | 2010-11-10 | 浙江大学 | 一种基于复杂网络的压缩空间高效搜索方法 |
CN101556604B (zh) * | 2009-05-06 | 2011-03-23 | 北京大学 | 一种面向复杂数据仓库环境的优化策略自动生成方法 |
-
2010
- 2010-08-27 CN CN201010264673XA patent/CN101937455B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN101937455A (zh) | 2011-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102467521B (zh) | 一种易扩展的多级分类检索方法及系统 | |
CN104160394B (zh) | 用于半结构化数据的可缩放分析平台 | |
CN101840400B (zh) | 一种多级分类检索方法及系统 | |
CN104239511B (zh) | 一种面向MongoDB的用户空间文件系统实现方法 | |
CN101937455B (zh) | 基于无限分层和信息遗传实现多维分类集群的创建方法 | |
CN104281701B (zh) | 分布式多尺度空间数据查询方法及系统 | |
CN103984755A (zh) | 基于多维度模型的油气资源数据要览系统实现方法及系统 | |
CN104216989A (zh) | 一种基于HBase的输电线路综合数据存储方法 | |
CN102855332A (zh) | 一种基于图形数据库的图形配置管理数据库 | |
CN106708993A (zh) | 基于大数据技术的空间数据存储处理中间件框架实现方法 | |
CN106446126A (zh) | 一种海量空间信息数据存储管理方法及存储管理系统 | |
CN105630803B (zh) | 文档型数据库建立索引的方法和装置 | |
CN105488048A (zh) | 一种数据查询的方法及装置 | |
CN102122291A (zh) | 一种基于树形日志模式分析的博客好友推荐方法 | |
CN106294545A (zh) | 一种树形结构数据的访问方法及装置 | |
CN103793489A (zh) | 一种在线社交网络中社群话题的发现方法 | |
CN107766433A (zh) | 一种基于Geo‑BTree的范围查询方法及装置 | |
CN104331491A (zh) | 一种组织机构的展示方法及装置 | |
CN105205247B (zh) | 一种基于树结构的仿真路网数据管理方法 | |
CN106161106A (zh) | 一种应用于有向拓扑图的节点聚合方法及装置 | |
CN105608228A (zh) | 一种高效的分布式的rdf数据存储方法 | |
CN105787090A (zh) | 一种电力数据的olap系统的索引建立方法和系统 | |
CN107357522A (zh) | 数据处理方法和装置 | |
CN1326363C (zh) | 网络管理配置方法及其装置 | |
JP5937038B2 (ja) | トポロジー図の作成方法及び作成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address | ||
CP03 | Change of name, title or address |
Address after: No. 912, 9th Floor, Jingtie Shengda Building, No.4 Shitiao, Zhenwu Temple, Xicheng District, Beijing 100045 Patentee after: BEIJING HONGMENG NETWORK TECHNOLOGY Co.,Ltd. Country or region after: China Address before: Room 1001, Building D, No. 17 Yuyuantan South Road, Haidian District, Beijing 100086 Patentee before: BEIJING HONGMENG NETWORK TECHNOLOGY Co.,Ltd. Country or region before: China |