CN103699593A - 一种广义后缀树快速遍历的方法及系统 - Google Patents

一种广义后缀树快速遍历的方法及系统 Download PDF

Info

Publication number
CN103699593A
CN103699593A CN201310674975.8A CN201310674975A CN103699593A CN 103699593 A CN103699593 A CN 103699593A CN 201310674975 A CN201310674975 A CN 201310674975A CN 103699593 A CN103699593 A CN 103699593A
Authority
CN
China
Prior art keywords
node
broad sense
suffix tree
data structure
sense suffix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310674975.8A
Other languages
English (en)
Inventor
黄鑫
罗军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201310674975.8A priority Critical patent/CN103699593A/zh
Publication of CN103699593A publication Critical patent/CN103699593A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明适用于计算机科学领域,提供了一种广义后缀树快速遍历的方法,包括:为广义后缀树的数据结构添加第一属性,以更改所述广义后缀树的数据结构;为广义后缀树节点的数据结构添加第二属性,以更改所述广义后缀树节点的数据结构;利用更改后的所述广义后缀树的数据结构以及更改后的所述广义后缀树节点的数据结构,通过自下而上的方式对广义后缀树的节点信息进行遍历统计。本发明还提供了一种广义后缀树快速遍历的系统。本发明所提供的广义后缀树快速遍历的方法及系统能极大降低遍历统计过程的时间复杂度,且不需要递归,进而大大提高了运行效率。

Description

一种广义后缀树快速遍历的方法及系统
技术领域
本发明涉及计算机科学领域,尤其涉及一种广义后缀树快速遍历的方法及系统。
背景技术
后缀树是一种广泛使用的数据结构,通常用于字符串的处理,能快速解决很多关于字符串的问题。当同时用于多个字符串,即是说把给定的N个源字符串的所有的后缀建成一颗树,这种数据结构叫做广义后缀树。
目前,传统的广义后缀树遍历采用广度优先遍历的方法,不过当需要进行信息统计,比如统计根节点(Root)到每个节点的路径所代表的子字符串的时候,传统的方法会通过递归多次重复遍历底层节点,需要在遍历每个节点的时候递归调用方法来统计该节点子节点里叶子的个数和索引数,使得时间复杂度大大提高,并且递归嵌套过多程序容易发生堆栈溢出,而且运行效率降低很多。
因此,亟需设计一种广义后缀树快速遍历的方法及系统,从而可以实现能极大降低遍历统计过程的时间复杂度,进而大大提高了运行效率。
发明内容
有鉴于此,本发明实施例的目的在于提供一种广义后缀树快速遍历的方法及系统,旨在解决现有技术中在采用广度优先遍历的方法时调用递归统计会造成底层节点的多次访问和底层堆栈负担的加大,进而影响运行效率的问题。
本发明实施例是这样实现的,一种广义后缀树快速遍历的方法,包括:
为广义后缀树的数据结构添加第一属性,以更改所述广义后缀树的数据结构;
为广义后缀树节点的数据结构添加第二属性,以更改所述广义后缀树节点的数据结构;
利用更改后的所述广义后缀树的数据结构以及更改后的所述广义后缀树节点的数据结构,通过自下而上的方式对广义后缀树的节点信息进行遍历统计。
优选的,所述第一属性为循环链表,用于表示广义后缀树叶子的信息,其中,更后的所述广义后缀树的数据结构的属性包括类型、内容、树里节点、根节点、所述循环链表以及所有叶子循环链表。
优选的,所述循环链表中的每一个节点的属性包括类型、内容、循环链表里的节点、树里的一个叶节点的引用、指针以及指针指向链表里的下一个节点。
优选的,所述第二属性包括计数器计数、判断区号以及索引集合,其中,所述计数器计数用于计算对应节点的子节点里的索引数量之和,所述判断区号用于表示对应节点的子节点里已经完成统计遍历的个数,所述索引集合用于表示对应节点的子节点里的所有叶子的索引的集合。
优选的,所述通过自下而上的方式对广义后缀树的节点信息进行遍历统计的步骤具体包括:
对于所述所有叶子循环链表,设LNode代表链表里的每一个节点,对于每一个LNode依次遍历,遍历完一个节点后调用next指针遍历对应的下一个节点;
重复上述第一步里对每一个节点的处理,直到循环链表里只有一个节点且其LNode为根节点。
另一方面,本发明还提供一种广义后缀树快速遍历的系统,包括:
第一更改模块,用于为广义后缀树的数据结构添加第一属性,以更改所述广义后缀树的数据结构;
第二更改模块,用于为广义后缀树节点的数据结构添加第二属性,以更改所述广义后缀树节点的数据结构;
遍历统计模块,用于利用更改后的所述广义后缀树的数据结构以及更改后的所述广义后缀树节点的数据结构,通过自下而上的方式对广义后缀树的节点信息进行遍历统计。
优选的,所述第一属性为循环链表,用于表示广义后缀树叶子的信息,其中,更后的所述广义后缀树的数据结构的属性包括类型、内容、树里节点、根节点、所述循环链表以及所有叶子循环链表。
优选的,所述循环链表中的每一个节点的属性包括类型、内容、循环链表里的节点、树里的一个叶节点的引用、指针以及指针指向链表里的下一个节点。
优选的,所述第二属性包括计数器计数、判断区号以及索引集合,其中,所述计数器计数用于计算对应节点的子节点里的索引数量之和,所述判断区号用于表示对应节点的子节点里已经完成统计遍历的个数,所述索引集合用于表示对应节点的子节点里的所有叶子的索引的集合。
优选的,所述遍历统计模块包括:
遍历调用子模块,用于对于所述所有叶子循环链表,设LNode代表链表里的每一个节点,对于每一个LNode依次遍历,遍历完一个节点后调用next指针遍历对应的下一个节点;
循环处理子模块,用于重复上述第一步里对每一个节点的处理,直到循环链表里只有一个节点且其LNode为根节点。
在本发明实施例中,本发明提供的技术方案,通过更改广义后缀树的数据结构以及更改广义后缀树节点的数据结构,提出了一种自下而上的高效快速遍历统计方法,使得在遍历统计的过程中时间复杂度大大降低,而且不需要调用递归统计,极大的降低了计算机硬件负担,避免了程序堆栈溢出,进而大大提高了运行效率。
附图说明
图1为本发明一实施方式中广义后缀树快速遍历的方法流程图;
图2为本发明一实施方式中新增属性的新型数据结构示例示意图;
图3为本发明一实施方式中图1的步骤S13的具体方法流程图;
图4为本发明一实施方式中假设的广义后缀树的初始状态图;
图5为本发明一实施方式中假设的广义后缀树在完成第一次迭代后的状态图;
图6为本发明一实施方式中广义后缀树快速遍历的系统的结构示意图;
图7为本发明一实施方式中图6所示的遍历统计模块103的具体结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明具体实施方式提供了一种广义后缀树快速遍历的方法,主要包括如下步骤:
S11、为广义后缀树的数据结构添加第一属性,以更改所述广义后缀树的数据结构;
S12、为广义后缀树节点的数据结构添加第二属性,以更改所述广义后缀树节点的数据结构;
S13、利用更改后的所述广义后缀树的数据结构以及更改后的所述广义后缀树节点的数据结构,通过自下而上的方式对广义后缀树的节点信息进行遍历统计。
本发明所提供的一种广义后缀树快速遍历的方法,通过更改广义后缀树的数据结构以及更改广义后缀树节点的数据结构,提出了一种自下而上的高效快速遍历统计方法,使得在遍历统计的过程中时间复杂度大大降低,而且不需要调用递归统计,极大的降低了计算机硬件负担,避免了程序堆栈溢出,进而大大提高了运行效率。
以下将对本发明所提供的一种广义后缀树快速遍历的方法进行详细说明。
请参阅图1,为本发明一实施方式中广义后缀树快速遍历的方法流程图。
在步骤S11中,为广义后缀树的数据结构添加第一属性,以更改所述广义后缀树的数据结构。
在本实施方式中,后缀树是一种广泛使用的数据结构,通常用于字符串的处理,能快速解决很多关于字符串的问题,当同时用于多个字符串,即是说把给定的N个源字符串的所有的后缀建成一颗树,这种数据结构叫做广义后缀树。
在本实施方式中,所述第一属性为循环链表(List),用于表示广义后缀树叶子的信息,其中,更后的所述广义后缀树的数据结构的属性包括类型、内容、树里节点(Node)、根节点(Root)、所述循环链表以及所有叶子循环链表。
在本实施方式中,所述循环链表中的每一个节点的属性包括类型、内容、循环链表里的节点(LNode)、树里的一个叶节点的引用、指针(Next)以及指针指向链表里的下一个节点。
在本实施方式中,在建立广义后缀树过程里每次新增一个叶节点,便将原始循环链表剪断,然后将末尾节点的next指针指向代表新叶子的节点。
在步骤S12中,为广义后缀树节点的数据结构添加第二属性,以更改所述广义后缀树节点的数据结构。
在本实施方式中,所述第二属性包括计数器计数(Counting)、判断区号(Num)以及索引集合(Set),其中,所述计数器计数用于计算对应节点的子节点里的索引数量之和,所述判断区号用于表示对应节点的子节点里已经完成统计遍历的个数,所述索引集合用于表示对应节点的子节点里的所有叶子的索引的集合。
在本实施方式中,在传统数据结构的基础上新增了第二属性以形成新的广义后缀树节点的数据结构,新增的第二属性目的是便于保存每一个子树的统计信息,从而避免了多层递归和底层的多次调用,进而提高系统运行的效率。在本实施方式中,图2是这些新增属性的新型数据结构示例示意图。
请参阅图2,为本发明一实施方式中新增属性的新型数据结构示例示意图。
在图2中,“C”表示计数器计数Counting,“N”表示判断区号Num,广义后缀树代表两个字符串“BANANA”和“NA”,注意该图2只是对于属性的示例介绍而并不代表后续算法的具体状态参数。
请继续参阅图1,在步骤S13中,利用更改后的所述广义后缀树的数据结构以及更改后的所述广义后缀树节点的数据结构,通过自下而上的方式对广义后缀树的节点信息进行遍历统计。
在本实施方式中,所述通过自下而上的方式对广义后缀树的节点信息进行遍历统计的步骤具体包括S131,如图3所示。
请参阅图3,为本发明一实施方式中图1的步骤S13的具体方法流程图。
在步骤S131中,对于所述所有叶子循环链表,设LNode代表链表里的每一个节点,对于每一个LNode依次遍历,遍历完一个节点后调用next指针遍历对应的下一个节点。
在本实施方式中,对每一个LNode的处理如下:
如果LNode指向的节点为根节点,则如果LNode的next指针也指向根节点,则退出程序,以及如果LNode的next指针不是指向根节点,则LNode的前趋next指针指向LNode.next;
如果LNode所指向的节点Node的判断区Num大小等于Node.edges的个数即Node出发指向后代的边的个数则分以下情况处理:1)如果LNode的父节点的判断区等于0,则LNode的Set信息及其Counting信息加到其父节点,其父节点的判断区Num置为1,最后将父节点赋值到LNode(current.LNode=current.parent);2)如果LNode的父节点判断区不等于0,则LNode的Set信息及其Counting信息加到其父节点,其父节点的判断区Num加上1,最后该LNode退休,即将LNode前趋的next指针指向LNode.next。
在步骤S132中,重复上述第一步(即步骤S131)里对每一个节点的处理,直到循环链表里只有一个节点且其LNode为根节点。
在本实施方式中,在步骤S131与步骤S132的基础上直接进行遍历便可知道每个子串重复了多少次,且在哪些位置重复出现,由于这个遍历过程无需再调用递归方法,时间复杂度也就降低到线性复杂度,也避免了程序溢出。
举例来说明,假如广义后缀树的初始状态图如图4所示。
请参阅图4,为本发明一实施方式中假设的广义后缀树的初始状态图。在本实施方式中,当完成第一次迭代,即将循环链表每个节点遍历过一次后状态变为图5所示,余下部分按照本部分给出的方法介绍依次类推。
请参阅图5,为本发明一实施方式中假设的广义后缀树在完成第一次迭代后的状态图。
本发明所提供的一种广义后缀树快速遍历的方法,通过更改广义后缀树的数据结构以及更改广义后缀树节点的数据结构,提出了一种自下而上的高效快速遍历统计方法,使得在遍历统计的过程中时间复杂度大大降低,而且不需要调用递归统计,极大的降低了计算机硬件负担,避免了程序堆栈溢出,进而大大提高了运行效率。
本发明具体实施方式还提供一种广义后缀树快速遍历的系统10,主要包括:
第一更改模块101,用于为广义后缀树的数据结构添加第一属性,以更改所述广义后缀树的数据结构;
第二更改模块102,用于为广义后缀树节点的数据结构添加第二属性,以更改所述广义后缀树节点的数据结构;
遍历统计模块103,用于利用更改后的所述广义后缀树的数据结构以及更改后的所述广义后缀树节点的数据结构,通过自下而上的方式对广义后缀树的节点信息进行遍历统计。
本发明所提供的一种广义后缀树快速遍历的系统10,通过更改广义后缀树的数据结构以及更改广义后缀树节点的数据结构,提出了一种自下而上的高效快速遍历统计方法,使得在遍历统计的过程中时间复杂度大大降低,而且不需要调用递归统计,极大的降低了计算机硬件负担,避免了程序堆栈溢出,进而大大提高了运行效率。
以下将对本发明所提供的一种广义后缀树快速遍历的系统10进行详细说明。
请参阅图6,所示为本发明一实施方式中广义后缀树快速遍历的系统10的结构示意图。在本实施方式中,广义后缀树快速遍历的系统10包括第一更改模块101、第二更改模块102以及遍历统计模块103。
第一更改模块101,用于为广义后缀树的数据结构添加第一属性,以更改所述广义后缀树的数据结构。
在本实施方式中,后缀树是一种广泛使用的数据结构,通常用于字符串的处理,能快速解决很多关于字符串的问题,当同时用于多个字符串,即是说把给定的N个源字符串的所有的后缀建成一颗树,这种数据结构叫做广义后缀树。
在本实施方式中,所述第一属性为循环链表(List),用于表示广义后缀树叶子的信息,其中,更后的所述广义后缀树的数据结构的属性包括类型、内容、树里节点(Node)、根节点(Root)、所述循环链表以及所有叶子循环链表。
在本实施方式中,所述循环链表中的每一个节点的属性包括类型、内容、循环链表里的节点(LNode)、树里的一个叶节点的引用、指针(Next)以及指针指向链表里的下一个节点。
在本实施方式中,在建立广义后缀树过程里每次新增一个叶节点,便将原始循环链表剪断,然后将末尾节点的next指针指向代表新叶子的节点。
第二更改模块102,用于为广义后缀树节点的数据结构添加第二属性,以更改所述广义后缀树节点的数据结构。
在本实施方式中,所述第二属性包括计数器计数(Counting)、判断区号(Num)以及索引集合(Set),其中,所述计数器计数用于计算对应节点的子节点里的索引数量之和,所述判断区号用于表示对应节点的子节点里已经完成统计遍历的个数,所述索引集合用于表示对应节点的子节点里的所有叶子的索引的集合。
在本实施方式中,在传统数据结构的基础上新增了第二属性以形成新的广义后缀树节点的数据结构,新增的第二属性目的是便于保存每一个子树的统计信息,从而避免了多层递归和底层的多次调用,进而提高系统运行的效率。
遍历统计模块103,用于利用更改后的所述广义后缀树的数据结构以及更改后的所述广义后缀树节点的数据结构,通过自下而上的方式对广义后缀树的节点信息进行遍历统计。
在本实施方式中,遍历统计模块103具体包括遍历调用子模块1031以及循环处理子模块1032,如图7所示。
请参阅图7,所示为本发明一实施方式中图6所示的遍历统计模块103的具体结构示意图。
遍历调用子模块1031,用于对于所述所有叶子循环链表,设LNode代表链表里的每一个节点,对于每一个LNode依次遍历,遍历完一个节点后调用next指针遍历对应的下一个节点。
在本实施方式中,对每一个LNode的处理如下:
如果LNode指向的节点为根节点,则如果LNode的next指针也指向根节点,则退出程序,以及如果LNode的next指针不是指向根节点,则LNode的前趋next指针指向LNode.next;
如果LNode所指向的节点Node的判断区Num大小等于Node.edges的个数即Node出发指向后代的边的个数则分以下情况处理:1)如果LNode的父节点的判断区等于0,则LNode的Set信息及其Counting信息加到其父节点,其父节点的判断区Num置为1,最后将父节点赋值到LNode(current.LNode=current.parent);2)如果LNode的父节点判断区不等于0,则LNode的Set信息及其Counting信息加到其父节点,其父节点的判断区Num加上1,最后该LNode退休,即将LNode前趋的next指针指向LNode.next。
循环处理子模块1032,用于重复上述遍历调用子模块1031对每一个节点的处理,直到循环链表里只有一个节点且其LNode为根节点。
在本实施方式中,在经过遍历调用子模块1031以及循环处理子模块1032处理的基础上直接进行遍历便可知道每个子串重复了多少次,且在哪些位置重复出现,由于这个遍历过程无需再调用递归方法,时间复杂度也就降低到线性复杂度,也避免了程序溢出。
本发明所提供的一种广义后缀树快速遍历的系统10,通过更改广义后缀树的数据结构以及更改广义后缀树节点的数据结构,提出了一种自下而上的高效快速遍历统计方法,使得在遍历统计的过程中时间复杂度大大降低,而且不需要调用递归统计,极大的降低了计算机硬件负担,避免了程序堆栈溢出,进而大大提高了运行效率。
在本发明实施例中,本发明提供的技术方案,通过更改广义后缀树的数据结构以及更改广义后缀树节点的数据结构,提出了一种自下而上的高效快速遍历统计方法,使得在遍历统计的过程中时间复杂度大大降低,而且不需要调用递归统计,极大的降低了计算机硬件负担,避免了程序堆栈溢出,进而大大提高了运行效率。
值得注意的是,上述实施例中,所包括的各个单元只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
另外,本领域普通技术人员可以理解实现上述各实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,相应的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如ROM/RAM、磁盘或光盘等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种广义后缀树快速遍历的方法,其特征在于,所述方法包括:
为广义后缀树的数据结构添加第一属性,以更改所述广义后缀树的数据结构;
为广义后缀树节点的数据结构添加第二属性,以更改所述广义后缀树节点的数据结构;
利用更改后的所述广义后缀树的数据结构以及更改后的所述广义后缀树节点的数据结构,通过自下而上的方式对广义后缀树的节点信息进行遍历统计。
2.如权利要求1所述的广义后缀树快速遍历的方法,其特征在于,所述第一属性为循环链表,用于表示广义后缀树叶子的信息,其中,更后的所述广义后缀树的数据结构的属性包括类型、内容、树里节点、根节点、所述循环链表以及所有叶子循环链表。
3.如权利要求2所述的广义后缀树快速遍历的方法,其特征在于,所述循环链表中的每一个节点的属性包括类型、内容、循环链表里的节点、树里的一个叶节点的引用、指针以及指针指向链表里的下一个节点。
4.如权利要求3所述的广义后缀树快速遍历的方法,其特征在于,所述第二属性包括计数器计数、判断区号以及索引集合,其中,所述计数器计数用于计算对应节点的子节点里的索引数量之和,所述判断区号用于表示对应节点的子节点里已经完成统计遍历的个数,所述索引集合用于表示对应节点的子节点里的所有叶子的索引的集合。
5.如权利要求4所述的广义后缀树快速遍历的方法,其特征在于,所述通过自下而上的方式对广义后缀树的节点信息进行遍历统计的步骤具体包括:
对于所述所有叶子循环链表,设LNode代表链表里的每一个节点,对于每一个LNode依次遍历,遍历完一个节点后调用next指针遍历对应的下一个节点;
重复上述第一步里对每一个节点的处理,直到循环链表里只有一个节点且其LNode为根节点。
6.一种广义后缀树快速遍历的系统,其特征在于,所述系统包括:
第一更改模块,用于为广义后缀树的数据结构添加第一属性,以更改所述广义后缀树的数据结构;
第二更改模块,用于为广义后缀树节点的数据结构添加第二属性,以更改所述广义后缀树节点的数据结构;
遍历统计模块,用于利用更改后的所述广义后缀树的数据结构以及更改后的所述广义后缀树节点的数据结构,通过自下而上的方式对广义后缀树的节点信息进行遍历统计。
7.如权利要求6所述的广义后缀树快速遍历的系统,其特征在于,所述第一属性为循环链表,用于表示广义后缀树叶子的信息,其中,更后的所述广义后缀树的数据结构的属性包括类型、内容、树里节点、根节点、所述循环链表以及所有叶子循环链表。
8.如权利要求7所述的广义后缀树快速遍历的系统,其特征在于,所述循环链表中的每一个节点的属性包括类型、内容、循环链表里的节点、树里的一个叶节点的引用、指针以及指针指向链表里的下一个节点。
9.如权利要求8所述的广义后缀树快速遍历的系统,其特征在于,所述第二属性包括计数器计数、判断区号以及索引集合,其中,所述计数器计数用于计算对应节点的子节点里的索引数量之和,所述判断区号用于表示对应节点的子节点里已经完成统计遍历的个数,所述索引集合用于表示对应节点的子节点里的所有叶子的索引的集合。
10.如权利要求9所述的广义后缀树快速遍历的系统,其特征在于,所述遍历统计模块包括:
遍历调用子模块,用于对于所述所有叶子循环链表,设LNode代表链表里的每一个节点,对于每一个LNode依次遍历,遍历完一个节点后调用next指针遍历对应的下一个节点;
循环处理子模块,用于重复上述第一步里对每一个节点的处理,直到循环链表里只有一个节点且其LNode为根节点。
CN201310674975.8A 2013-12-11 2013-12-11 一种广义后缀树快速遍历的方法及系统 Pending CN103699593A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310674975.8A CN103699593A (zh) 2013-12-11 2013-12-11 一种广义后缀树快速遍历的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310674975.8A CN103699593A (zh) 2013-12-11 2013-12-11 一种广义后缀树快速遍历的方法及系统

Publications (1)

Publication Number Publication Date
CN103699593A true CN103699593A (zh) 2014-04-02

Family

ID=50361121

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310674975.8A Pending CN103699593A (zh) 2013-12-11 2013-12-11 一种广义后缀树快速遍历的方法及系统

Country Status (1)

Country Link
CN (1) CN103699593A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015172529A1 (zh) * 2014-05-13 2015-11-19 华为技术有限公司 一种挖掘最大重复序列的方法及装置
CN107004221A (zh) * 2014-11-28 2017-08-01 Bc卡有限公司 用于预测使用行业的卡使用模式分析方法及执行其的服务器
CN111597185A (zh) * 2020-04-01 2020-08-28 深圳英飞拓智能技术有限公司 一种基于树状结构资源分布的实时状态数快速统计方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1387119A (zh) * 2002-06-28 2002-12-25 西安交通大学 一种适应于快速数据查找的树形链表及其生成算法
US20070282835A1 (en) * 2006-04-28 2007-12-06 Roke Manor Research Limited Aho-corasick methodology for string searching

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1387119A (zh) * 2002-06-28 2002-12-25 西安交通大学 一种适应于快速数据查找的树形链表及其生成算法
US20070282835A1 (en) * 2006-04-28 2007-12-06 Roke Manor Research Limited Aho-corasick methodology for string searching

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张峰: "一种基于后缀树的时态XML索引研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015172529A1 (zh) * 2014-05-13 2015-11-19 华为技术有限公司 一种挖掘最大重复序列的方法及装置
CN107004221A (zh) * 2014-11-28 2017-08-01 Bc卡有限公司 用于预测使用行业的卡使用模式分析方法及执行其的服务器
CN111597185A (zh) * 2020-04-01 2020-08-28 深圳英飞拓智能技术有限公司 一种基于树状结构资源分布的实时状态数快速统计方法
CN111597185B (zh) * 2020-04-01 2023-04-28 深圳英飞拓仁用信息有限公司 一种基于树状结构资源分布的实时状态数快速统计方法

Similar Documents

Publication Publication Date Title
CN112364213A (zh) 一种基于图数据库的电网检索方法及系统
US11416473B2 (en) Using path encoding method and relational set operations for search and comparison of hierarchial structures
CN105630803B (zh) 文档型数据库建立索引的方法和装置
WO2021068346A1 (zh) 基于Geohash算法的位置查询方法、装置、计算机设备及存储介质
CN104216961A (zh) 一种数据处理方法和装置
CN103699593A (zh) 一种广义后缀树快速遍历的方法及系统
CN111382155A (zh) 一种数据仓库的数据处理方法、电子设备及介质
CN103092992A (zh) 基于Key/Value型NoSQL数据库的矢量数据先序四叉树编码和索引方法
CN104408128B (zh) 一种基于b+树异步更新索引的读优化方法
CN116301656A (zh) 基于日志结构合并树的数据存储方法、系统及设备
CN103699653A (zh) 数据聚类方法和装置
CN115982346A (zh) 一种问答库构建方法、终端设备及存储介质
WO2024078122A1 (zh) 数据库表扫描的方法、装置以及设备
CN113468080A (zh) 一种全闪元数据的缓存方法、系统及相关装置
CN113656414B (zh) 一种数据处理方法、装置、设备及介质
CN116402113A (zh) 一种任务执行的方法、装置、存储介质及电子设备
CN109902178A (zh) 一种多级文本分类方法及系统
CN107369192B (zh) 一种连接关系处理方法及装置
CN113641872B (zh) 一种散列方法、装置、设备及介质
CN109753351B (zh) 一种限时任务处理方法、装置、设备及介质
US20200183590A1 (en) Distributed data structures for sliding window aggregation or similar applications
CN114676132A (zh) 一种数据表关联方法、装置、存储介质及电子设备
CN111985740A (zh) 任务处理方法与装置
CN117076515B (zh) 医疗管理系统中元数据的溯源方法、装置、服务器及存储介质
US8843495B2 (en) High-efficiency selection of runtime rules for programmable search

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140402

RJ01 Rejection of invention patent application after publication