CN100576750C - 用于从索引树中产生比特流的方法 - Google Patents
用于从索引树中产生比特流的方法 Download PDFInfo
- Publication number
- CN100576750C CN100576750C CN200380108832A CN200380108832A CN100576750C CN 100576750 C CN100576750 C CN 100576750C CN 200380108832 A CN200380108832 A CN 200380108832A CN 200380108832 A CN200380108832 A CN 200380108832A CN 100576750 C CN100576750 C CN 100576750C
- Authority
- CN
- China
- Prior art keywords
- index
- node
- path
- bit stream
- tree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
- G06F40/143—Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
- G06F40/154—Tree transformation for tree-structured or markup documents, e.g. XSLT, XSL-FO or stylesheets
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
- H04N21/2353—Processing of additional data, e.g. scrambling of additional data or processing content descriptors specifically adapted to content descriptors, e.g. coding, compressing or processing of metadata
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/435—Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/8543—Content authoring using a description language, e.g. Multimedia and Hypermedia information coding Expert Group [MHEG], eXtensible Markup Language [XML]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99943—Generating database or data structure, e.g. via user interface
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Small-Scale Networks (AREA)
- Communication Control (AREA)
Abstract
本发明涉及一种用于从索引树中产生比特流的方法,其中索引树包括多个层级,并且给每一个层级分配了一个或多个索引节点,其中索引节点包含索引数据,这些索引数据在索引树中是按照一个或多个预先给定的准则来分类的。在该方法中将索引节点的索引数据插入到比特流中,并且针对索引节点分别将以下信息插入到比特流中,即处于相应节点的层级之下的层级的一个或多个索引节点的索引数据位于比特流中的哪个位置上。
Description
技术领域
本发明涉及一种用于从索引树中产生比特流的方法,以及由用于产生比特流的方法所使用的一种编码方法和一种解码方法。本发明还涉及一种编码和解码装置。
背景技术
常常有必要,根据由用户事先进行的查询来从比特流中读出某些内容,或者鉴于某些内容来确定,在比特流中究竟是否包含这些内容。在这种情况下可以借助像SQL(请参阅参考文献[1])或XPATH(请参阅参考文献[2])那样的查询语言来表达由用户定义的查询。在此有利的是,如果不必在整个比特流中搜索所希望的内容,而是如果在索引表中或在索引树中存放信息,则因此只须搜索存储了索引树或索引表的那部分比特流。
例如在借助XML语言(XML=可扩展置标语言)制定的、以MPEG7-BiM格式表现的文件中,产生了从比特流中读出数据的问题。关于XML文件的MPEG7-BiM格式,在此尤其请参阅文件[3]。在这种表现中,将所产生的比特流划分成多个单元(存取单元),这些单元在它们这方面又由多个段(段更新单元)组成。对这些单元进行编码,并且在需要时作为MPEG7-BiM流发送到一个或多个接收机上。
关于来自XML文件的信息的查询已经公开了许多查询语言,这些查询语言允许在文件中搜索某些信息。在此处示范性地参阅已经提及的查询语言XPATH(请参阅参考文献[2])。利用查询语言XPATH可以定义用于过滤XML文件之内的所希望的信息的选择准则。在此情况下,查询的目的一方面可以是对比特流的单元对于接收机来说是否重要的评价。另一方面,可以借助查询来有针对性地动用XML文件中的所希望的信息。MPEG7编码方法迄今在产生XML文件的比特流时还未规定能够实现自由选择地访问XML文件的某些元素的机制。因此为了搜索元素,必须对MPEG7比特流进行解码。于是又获得XML格式的文件,该文件可以借助查询语言XPATH来搜索。用于搜索特定内容的XML文件的解码和随后的处理因此是很费时间的,并且对于某些时间关键的应用来说是不可接受的。还可能出现存储器在解码器中受限制的问题,使得比特流被不完全解码。除此之外,如果在所解码的XML文件上执行的XPATH查询负面地进行,则该解码的工作量是不必要的。
在文件[4]中所描述的TV-Anytime(TVA)的范围内,采用一种允许自由选择地访问数据段的某些元素的索引结构。该索引结构由多个部分组成,并且包括所谓的关键字索引表,在该关键字索引表中存放了文件的全部加索引的路径。在查询时,将这些路径依次与查询进行比较,直至在关键字索引表中找到了相应的录入项为止。通过在关键字索引表中存储到该录入项的信息,可以确定在描述流中编码地存在加索引的录入项的位置。通过采用关键字索引表,不再需要对不感兴趣的数据段进行解码,因此在查询期间需要较少的存储位置。但是线性地穿越关键字索引表是耗时的,而所有加索引的路径的传输是费事的。
Lam S.W.及其他人所著的文献:“Representing lexicons bymodified trie for fast partial string matching”(CharacterRecognition Technologies,San Jose,1993年2月1-2日,Bellingham,SPIE,第229-237页)描述了一种快速的词典编纂的搜索方法,在该方法中输入序列既可以包括不清楚的长度,又可以包括几个未详细说明的字母。
Wong R.K.及其他人所著的文献:“An XML repository formolecular sequence data”(Proceedings IEEE InternationalSymposium on Bio Informatics and Biomedical Engineering,第35-42页)描述了一种方法,在该方法中借助“跳越树(Skip-Tree)”可以有效地搜索大的数据量。
发明内容
因此,本发明的任务是提供一种从索引树中产生比特流的方法,在该方法中能够简单而有效地实现对加索引的数据的搜索。
该任务根据本发明方法来解决。由从属技术方案得出本发明的改进方案。
利用本发明方法从索引树中产生比特流,该索引树包括多个层级,其中给每一层级分配一个或多个索引节点,并且这些索引节点包含索引数据,这些索引数据在索引树中是按照一个或多个预先给定的准则来分类。在本发明方法中,将索引节点的索引数据插入到比特流中,并且还针对索引节点分别将以下信息插入到比特流中,即处于相应节点的层级之下的层级的一个或多个索引节点的索引数据位于比特流中的哪个位置上。通过存储有关处于其下的层级中的索引节点的附加信息,显著地简化了对某些索引数据的搜索,因为由此能够实现向对于搜索来说相关的索引节点的转移。因此确保了对索引数据的显著更有效的查询和搜索。
在一种优选的实施形式中建立了作为所谓的B树(=平衡树)的索引树,该索引树确保数据均衡地分布到该树的节点上。B树的准确的描述可以在参考文献[5]中找到。
可以按任意的准则、例如以词典编纂的方式对索引树中的索引数据进行分类。
在一种特别优选的实施形式中,按照深度优先次序将索引数据插入到比特流中。通过深度优先次序的采用,首先按照深度将索引树中的索引数据插入到比特流中,由此在比特流中彼此相邻地布置对于查询来说相关的信息,并且可以有效地跳过不相关的信息。深度优先次序的准确的描述可以在参考文献[6]中找到。
在本发明的另一种优选的实施形式中,索引数据包括文件结构树的路径,该文件结构树包括一个根节点和多个叶节点。索引数据还优选地包括路径的值特征(Werteauspraegung)和值特征在由文件结构树所表示的文件中的位置。除此之外,在一种优选的实施形式中,索引数据也还包括索引节点中的路径的数量。
路径在此可以是绝对路径,这些绝对路径从文件结构树的根节点开始并且通向文件结构树的叶节点。在本发明的一种特别优选的实施形式中,路径却是相对路径,其中相应索引节点的相对路径是相对于该相应索引节点或位于该相应索引节点的层级之上的层级的索引节点的、以前被插入到比特流中的路径的路径。通过相对路径的采用,充分利用了路径的共同点,因为相邻节点的路径大多具有共同的部分。以此方式可以降低比特流中索引数据所需要的存储需求。存储需求的进一步降低可以通过以下方式来实现,即将其索引数据作为层级的第一批被插入到比特流中的索引节点的路径以与在该索引节点中布置索引数据的顺序相反的顺序插入到比特流中。在此情况下考虑了以下事实,即与在层级的第一索引节点的开头的索引数据相比,在第一索引节点的末端的索引数据与下一较高层级的索引节点具有更大的相似性。因而在某些情况下借助相对路径来产生特别有效的编码。
在本发明的一种特别优选的实施形式中,路径包括XML文件(XML=可扩展置标语言)的描述元素,其中路径尤其是XML文件的XPATH路径。
在本发明的另一种实施形式中,利用编码方法、尤其是利用MPEG编码方法来对索引数据进行二进制编码。在一种特别优选的实施形式中,采用MPEG7编码方法作为编码方法。
除了上述用于产生比特流的方法之外,本发明还包括一种用于对数据结构进行编码的方法,在该方法中在索引树中给数据结构的数据元素加索引,其中根据本发明方法产生比特流,并且该比特流是所编码的数据流的一部分。除此之外,本发明包括一种用于对数据结构进行解码的方法,其中如此来构成该方法,使得对利用刚才所描述的编码方法所编码的数据结构进行解码。
除此之外,本发明还包括一种用于对数据结构进行编码和解码的方法,该方法包括上面所描述的编码方法和解码方法。
本发明也包括一种编码装置,利用该编码装置可以执行本发明的编码方法,以及包括一种解码装置,利用该解码装置可以执行本发明的解码方法。本发明还涉及一种用于编码和解码的相应装置,利用该装置可以执行上面所描述的组合的编码和解码方法。
附图说明
以下借助附图来示出和阐述本发明的实施例。
图1展示了本发明方法中所采用的索引树的实例;
图2展示了图1中所展示的索引树的一段;
图3展示了比特流的一段,该比特流是利用本发明方法从图1的索引树中产生的;
图4展示了一种简化的索引树,在该索引树中以词典编纂的方式排列索引数据并且示出了文件结构树的路径;
图5展示了图4的索引树,其中将第二层级的路径部分地作为相对路径示出;
图6展示了图4的索引树,其中将第二层级的所有路径作为相对路径示出;
图7展示了根据图4的索引树的变型。
具体实施方式
图1示范性地展示了在本发明方法中所采用的索引树。该树是所谓的B树(B代表平衡),该B树常常在给数据加索引时得到应用。例如在已经提及的参考文献[5]中描述了B树的结构。B树具有平衡的结构,并且由此以与录入项的数量相比仅对数的工作量来实现搜索,而在利用表(Liste)来搜索时需要线性的工作量。
索引树包含多个节点1至10,其中在每一个节点中以所谓的密钥形式存储一个或多个索引数据。在本情况下,索引数据是XML文件的描述树的所谓的XPATH路径。XPATH路径的描述可在已经提及的参考文献[2]中找到。XPATH路径从XML文件的描述树的根节点向XML文件的描述树的各个叶节点延伸。在该实施形式中所采用的描述树中,将具有简单内容的XML元素和所有的XML属性用作为叶节点。因此图1中所展示的索引树的索引数据包括XML描述树的根叶路径。
在图1的索引树中,XPATH路径是作为由大小写字母组成的系列示出并且以词典编纂的方式排列的,其中每一个字母代表XML描述树中的一个元素名称。例如节点1中的路径MDMVUFACN意味着MPEG7/描述/多媒体内容/视频/使用信息/财务结果/账目/成本类型/名称。在节点中除了路径之外也存储值特征,该路径以这些值特征出现在XML文件中。在本情况下,在索引节点1中路径MDMVUFACN两次以特征“全部用于生产”和“广播”出现。与此相对地,例如在索引节点2中路径MDMVUAFAc仅一次以特征“EUR”出现。
图1的索引树中的索引节点的编号对应于借助本发明方法将索引数据插入到比特流中的顺序。该顺序在此情况下相当于所谓的深度优先次序,例如在已经提及的参考文献[6]中描述了该深度优先次序。通过根据深度优先次序将索引数据插入到比特流中,得出在访问索引数据时较小的复杂性,因为在对索引数据进行搜索时跳过不相关的信息。
在图2中展示了图1的索引树的一段,借助于该段作为例子来阐述在该树中的索引数据的查询。在此涉及XPATH路径MPEG7/描述/多媒体内容/视频/使用信息/可用性/传播/传播者/代理/名称是否包含值特征“发现”(以简写方式MDMVUADDAN=“发现”)的查询。由于搜索字符串MDMVUADDAN在词典编纂上小于索引节点1的XPATH路径“MDMVUFACN”,所以动用索引节点2。该搜索字符串又在词典编纂上小于索引节点2的录入项“MDMVUAFAc”。所以过渡到被置于索引节点2的左边的索引节点3上。该索引节点包含两个XPATH路径“MDMVUAAt”和“MDMVUADFh”。该搜索字符串位于这两个XPATH路径之间,因此在下一个层级中过渡到位于索引节点4和索引节点6之间的索引节点5上。该索引节点从现在起包含所搜索的XPATH路径“MDMVUADDAN”以及所搜索的值特征“发现”作为第一元素。因此在索引节点5中找到了匹配的值特征,并且于是获得相应元素在加索引的XML文件中的位置。通过按照深度优先次序将索引节点插入到比特流中,在搜索时忽略或跳过索引树的所有其它节点,因此对索引树中的元素的搜索具有小的复杂性。
以下详细地深入讨论借助本发明方法将索引数据插入到比特流中。这借助图3来实现,图3示出了利用本发明方法所产生的比特流中的一段。在图3中所展示的比特流中,为了清晰起见列出了索引节点的编号,其中但是这些编号不随着该流一起被传送。在图3中详细展示了索引节点1和3的内容。这些节点首先包含作为第一元素的录入项的数量、即存储在节点中的XPATH路径的数量。在这里针对索引节点1得出数字1,而针对索引节点3得出数字2。然后跟随着针对每一个录入项的密钥,即相应的XPATH路径以及层级(Instanzierung)的数量、即在XML文件中该XPATH路径所具有的值特征的数量。对于索引节点1来说例如针对XPATH路径“MDMVUAFCN”得出层级数量2,因为该路径在XML文件中以两个值特征“全部用于生产”和“广播”出现。针对每一个值特征,还将该值特征在XML文件中的位置插入到比特流中。在本发明方法中重要的是,除了这些信息之外还将以下信息插入到比特流中,即处于其之下的层级的与相应索引节点相连接的索引节点的索引数据位于比特流中的哪个位置上、尤其是位于相对于瞬间位置(偏移)的哪个位置上。由此能够实现跳过对于预先给定的搜索查询来说不相关的节点。
以下将从一个节点分支到更低的层级中的节点称为子节点。在本发明方法中应注意,不必存储关于层级的第一子节点的位置的信息,因为该子节点在比特流中作为下一个被读入。如从图3中可获知的那样,因此针对索引节点1仅仅存储了索引节点10的位置(称为“偏移(10)”),而针对索引节点3仅仅存储了索引节点5和6的位置(称为“偏移(5)”和“偏移(6)”)。如果例如得出在查询时所搜索的信息在词典编纂上大于节点1中的XPATH,则立即向节点10转移,使得不再需要搜索索引节点2和从索引节点2分支的索引节点。由此能够实现有效的搜索。
在以下的表中再次列出了在比特流中存储每一个节点的哪些信息。
表:
节点1{ |
录入项的数量 |
针对每一个录入项: |
密钥 |
层级的数量 |
针对每一个层级: |
值特征 |
位置 |
针对除第一子节点之外的每一个子节点 |
在流中的偏移 |
利用本发明方法所产生的比特流被传送到接收机上,并且可以根据参照图2已示范性地阐述的查询被读出。通过要查询的XPATH和索引节点中的录入项之间的比较,一直从流中读出某些节点信息,直至找到了具有所搜索的值特征的、相应的搜索的XPATH时为止,或者直至基于分类而不再可能有匹配的XPATH路径时为止。在后一种情况下,加索引的文件中不包含所期望的信息。
以下借助图4至7来阐述本发明方法的其它的实施形式,图4至7示出了具有以词典编纂的方式排列的录入项的简化的索引树。在图4中展示了一种能够借助本发明方法来编码的索引树,该索引树包括节点K1至K4。节点K1在此被称为父节点,而从节点K1中分支的节点K2至K4被称为子节点。录入项是文件结构树的路径。代替在比特流中以路径的整个长度来传输路径,存在着在要传输的索引节点中存放所谓的相对路径的可能性,其中这些路径就父节点的以前所传输的路径或目前要传输的索引节点的以前所传输的路径而言是相对的。
在图5中描述了将相对路径插入到比特流中。在此情况下,表示“.”意味着在相对路径所涉及的路径中返回一个步骤。在节点K1中,针对录入项“AE”传输相对于之前的录入项ACB的相对路径“..E”。在子节点K1、K2和K3中,分别在第二和第三录入项中传输相对于相应子节点的第一路径的相对路径。
在图5的实施形式中,为子节点K2、K3或K4的第一路径AA、ACC或AEF传输完整的绝对路径。现在可以附加地还将子节点的第一路径作为相对于父节点K1的路径的相对路径来传输。这在图6中示出。代替第一和第二子节点的路径AA和ACC,在此情况下传输相对于父节点的第一路径的相对路径“..A”和“.C”。代替第三子节点的路径“AEF”,传输相对于父节点的第二路径的相对路径“F”。在此,这些路径优选地以其字节表示的方式被存放到比特流中。
通过相对路径的采用,大大减小了流中的数据量,因为在存储路径时充分利用路径的共同点,使得需要较少的存储位置。尤其是在相对路径的情况下只须一次性地传送路径的相应的共同部分。
在本发明的另一个实施形式中,通过以下方式来实现数据节省,即在布置索引节点的录入项时,将一种与图4相反的顺序用于第一子节点K2。由此实现与之前的父节点K1具有最大的相似性的录入项位于子节点K2的开头。因此在索引树的特定的构造中,可以得出显著缩短的相对路径和减小的存储需求。
路径可以是之前已经提及的XML描述树的XPATH路径。还可以例如利用MPEG7编码方法来对路径进行二进制编码。尤其可以采用在已经提及的参考文献[3]中详细说明的二进制编码方法。与文本表示相比较,经二进制编码的路径的采用可以导致要传送的比特数量的节省。
参考文献
[1]http://dxl.hrz.uni-dortmund.de:8001/docl/hrz/sqlref/sqloracle.html
[2]XML Path Language(XPath),Version 1.0,W3CRecommendation,1999年11月16日,http://www.w3.org/TR/xpath
[3]ISO/IEC 15938-1,Multimedia Content DescriptionInterface-Part 1:Systems,日内瓦,2002年
[4]TV-Anytime Specification Series S-3 on Metadata,Part-B:System Aspects in a Unidirectional Environment,版本13,www.tv-anytime.org
[5]B-Trees:Balanced Tree Data Structures,http://www.public.asu.edu/~peterjn/btree/
[6]Simple Tree Searches,http://www.generation5.org/simple_search.shtml
Claims (15)
1.用于从索引树中产生比特流的方法,其中,
a)所述索引树包括多个层级,并且给每一个层级分配了一个或多个索引节点(K1,K2,K3,K4),
b)所述索引节点(K1,K2,K3,K4)包含索引数据,这些索引数据在所述索引树中是按照一个或多个预先给定的准则来分类的,
c)所述索引节点之一(K1)被称为父节点,而至少一个另外的索引节点(K2,K3,K4)被称为子节点,其中至少一个子节点从所述父节点(K1)分支,并且该至少一个子节点位于更低的层级中,
其特征在于,
-将所述索引节点(K1,K2,K3,K4)的索引数据插入到所述比特流中,其中在插入了所述父节点(K1)的索引数据之后,插入在所述索引树中基于所述分类而作为第一个跟随着所述父节点(K1)的那个子节点(K2)的索引数据,而不带所述那个子节点(K2)的索引数据位于所述比特流中的哪个位置上的信息;
-针对不是作为第一个跟随着所述父节点(K1)的子节点(K3,K4),分别将该子节点(K3,K4)的索引数据位于所述比特流中的哪个位置上的信息插入到所述比特流中。
2.按权利要求1所述的方法,其中所述索引树是平衡树。
3.按权利要求1或2所述的方法,其中所述索引树中的索引数据是以词典编纂的方式来分类的。
4.按权利要求1或2所述的方法,其中将所述索引数据按照深度优先次序插入到所述比特流中。
5.按权利要求1或2所述的方法,其中所述索引数据包括文件结构树的路径,所述文件结构树由至少一个根节点和多个叶节点组成。
6.按权利要求5所述的方法,其中所述索引数据包括所述路径的值特征和所述值特征在由所述文件结构树所表示的文件中的位置。
7.按权利要求5所述的方法,其中所述索引数据包括索引节点(K1,K2,K3,K4)中的路径的数量。
8.按权利要求5所述的方法,其中所述路径包括绝对路径,这些绝对路径从所述根节点开始并且通向叶节点。
9.按权利要求5所述的方法,其中所述路径包括相对路径,其中相应索引节点(K1,K2,K3,K4)的相对路径是相对于所述相应索引节点(K1,K2,K3,K4)的或者处于所述相应索引节点(K1,K2,K3,K4)的层级之上的层级的索引节点(K1,K2,K3,K4)的、以前被插入到比特流中的路径的路径。
10.按权利要求9所述的方法,其中将其索引数据作为层级的第一批被插入到比特流中的索引节点的路径以与所述索引数据布置在所述索引节点(K1,K2,K3,K4)中的顺序相反的顺序插入到所述比特流中。
11.按权利要求5所述的方法,其中所述路径包括XML文件的描述元素。
12.按权利要求11所述的方法,其中所述路径是所述XML文件的XPATH路径。
13.按权利要求1或2所述的方法,其中利用编码方法来对所述索引数据进行二进制编码。
14.按权利要求13所述的方法,其中所述编码方法是MPEG编码方法。
15.按权利要求13所述的方法,其中所述编码方法是MPEG7编码方法。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10253275.3 | 2002-11-15 | ||
DE10253275 | 2002-11-15 | ||
DE10337825A DE10337825A1 (de) | 2002-11-15 | 2003-08-18 | Verfahren zur Erzeugung eines Bitstroms aus einem Indizierungsbaum |
DE10337825.1 | 2003-08-18 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1739243A CN1739243A (zh) | 2006-02-22 |
CN100576750C true CN100576750C (zh) | 2009-12-30 |
Family
ID=32327491
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200380108832A Expired - Fee Related CN100576750C (zh) | 2002-11-15 | 2003-10-30 | 用于从索引树中产生比特流的方法 |
Country Status (10)
Country | Link |
---|---|
US (1) | US7330854B2 (zh) |
EP (1) | EP1561281B1 (zh) |
JP (1) | JP2006515450A (zh) |
KR (1) | KR101032240B1 (zh) |
CN (1) | CN100576750C (zh) |
AT (1) | ATE416514T1 (zh) |
AU (1) | AU2003293638A1 (zh) |
BR (1) | BRPI0316335B1 (zh) |
DE (2) | DE10337825A1 (zh) |
WO (1) | WO2004047304A2 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103532565A (zh) * | 2012-06-28 | 2014-01-22 | 富士通株式会社 | 码处理技术 |
TWI750022B (zh) * | 2020-12-18 | 2021-12-11 | 威盛電子股份有限公司 | 應用於鍵樹的編碼方法、應用於鍵樹的解碼方法與電子裝置 |
US12105695B2 (en) | 2020-12-18 | 2024-10-01 | Via Technologies Inc. | Encoding method for key Trie, decoding method for key Trie, and electronic devices |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7418455B2 (en) * | 2003-11-26 | 2008-08-26 | International Business Machines Corporation | System and method for indexing weighted-sequences in large databases |
US7216127B2 (en) * | 2003-12-13 | 2007-05-08 | International Business Machines Corporation | Byte stream organization with improved random and keyed access to information structures |
DE102004034004A1 (de) * | 2004-07-14 | 2006-02-09 | Siemens Ag | Verfahren zum Codieren eines XML-Dokuments, sowie Verfahren zum Decodieren, Verfahren zum Codieren und Decodieren, Codiervorrichtung, Decodiervorrichtung und Vorrichtung zum Codieren und Decodieren |
KR100660028B1 (ko) * | 2005-02-23 | 2006-12-20 | 인천대학교 산학협력단 | 데이터베이스 개념 구조에 기반한 xml 트리의 색인 및질의 방법 |
US7499931B2 (en) * | 2005-05-09 | 2009-03-03 | International Business Machines Corporation | Method and apparatus for approximate projection of XML documents |
US8229891B2 (en) * | 2007-08-16 | 2012-07-24 | International Business Machines Corporation | Method, apparatus and computer program for model-driven message parsing |
US8442998B2 (en) | 2011-01-18 | 2013-05-14 | Apple Inc. | Storage of a document using multiple representations |
US8683027B2 (en) * | 2011-06-08 | 2014-03-25 | International Business Machines Corporation | Utilization of uncertainty dependency relationships between items in a data stream |
US8930374B2 (en) * | 2012-06-29 | 2015-01-06 | Nokia Corporation | Method and apparatus for multidimensional data storage and file system with a dynamic ordered tree structure |
JP6011421B2 (ja) | 2013-03-29 | 2016-10-19 | 富士通株式会社 | ストレージシステム、情報処理装置の制御プログラム及びストレージシステムの制御方法 |
CN109933584B (zh) * | 2019-01-31 | 2021-04-02 | 北京大学 | 一种多级无序索引方法与系统 |
CN112287642B (zh) * | 2020-12-30 | 2021-06-08 | 华南理工大学 | 树形结构自增数据节点id及其路径链二进制编码方法 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB8815978D0 (en) * | 1988-07-05 | 1988-08-10 | British Telecomm | Method & apparatus for encoding decoding & transmitting data in compressed form |
US5509088A (en) * | 1993-12-06 | 1996-04-16 | Xerox Corporation | Method for converting CCITT compressed data using a balanced tree |
US5557786A (en) * | 1994-01-24 | 1996-09-17 | Advanced Computer Applications, Inc. | Threaded, height-balanced binary tree data structure |
US5794249A (en) * | 1995-12-21 | 1998-08-11 | Hewlett-Packard Company | Audio/video retrieval system that uses keyword indexing of digital recordings to display a list of the recorded text files, keywords and time stamps associated with the system |
US6721723B1 (en) * | 1999-12-23 | 2004-04-13 | 1St Desk Systems, Inc. | Streaming metatree data structure for indexing information in a data base |
KR20020076272A (ko) * | 2000-01-31 | 2002-10-09 | 캐논 가부시끼가이샤 | 데이터 처리 장치, 데이터 처리 시스템, 데이터 처리 방법및 기억 매체 |
US6354126B1 (en) * | 2000-04-25 | 2002-03-12 | Burr Oak Tool And Gauge Company | Tube straightener and drive therefor |
US7747782B2 (en) * | 2000-04-26 | 2010-06-29 | Novarra, Inc. | System and method for providing and displaying information content |
US7080318B2 (en) * | 2001-02-28 | 2006-07-18 | Koninklijke Philips Electronics N.V. | Schema, syntactic analysis method and method of generating a bit stream based on a schema |
US7231394B2 (en) * | 2001-07-17 | 2007-06-12 | Sony Corporation | Incremental bottom-up construction of data documents |
US7020643B2 (en) * | 2002-01-25 | 2006-03-28 | Microsoft Corporation | Method and system for clickpath funnel analysis |
US20040010752A1 (en) * | 2002-07-09 | 2004-01-15 | Lucent Technologies Inc. | System and method for filtering XML documents with XPath expressions |
US6711300B2 (en) * | 2002-08-15 | 2004-03-23 | Envivio, Inc. | Quantization and compression of information in a direct acyclic graph |
US7133877B2 (en) * | 2002-10-03 | 2006-11-07 | International Business Machines Corporation | Method and apparatus for managing a set of data structures associated with a large file |
US7171407B2 (en) * | 2002-10-03 | 2007-01-30 | International Business Machines Corporation | Method for streaming XPath processing with forward and backward axes |
US7653636B2 (en) * | 2003-02-28 | 2010-01-26 | Bea Systems, Inc. | Systems and methods for streaming XPath query |
-
2003
- 2003-08-18 DE DE10337825A patent/DE10337825A1/de not_active Ceased
- 2003-10-30 KR KR1020057008717A patent/KR101032240B1/ko not_active IP Right Cessation
- 2003-10-30 BR BRPI0316335A patent/BRPI0316335B1/pt not_active IP Right Cessation
- 2003-10-30 WO PCT/EP2003/012098 patent/WO2004047304A2/de active Application Filing
- 2003-10-30 EP EP03788984A patent/EP1561281B1/de not_active Expired - Lifetime
- 2003-10-30 AU AU2003293638A patent/AU2003293638A1/en not_active Abandoned
- 2003-10-30 JP JP2004570271A patent/JP2006515450A/ja active Pending
- 2003-10-30 CN CN200380108832A patent/CN100576750C/zh not_active Expired - Fee Related
- 2003-10-30 US US10/535,166 patent/US7330854B2/en not_active Expired - Fee Related
- 2003-10-30 AT AT03788984T patent/ATE416514T1/de not_active IP Right Cessation
- 2003-10-30 DE DE50310876T patent/DE50310876D1/de not_active Expired - Lifetime
Non-Patent Citations (5)
Title |
---|
AN MPEG-7 TOOL FOR COMPRESSION AND STREAMINGOF XML DATA. NIEDENNEIER U ET AL.PROCEEDINGS OF IEEE INTERNATIONAL CONFERENCE ON MULTIMEDIA AND EXPO(ICME). 2002 |
AN MPEG-7 TOOL FOR COMPRESSION AND STREAMINGOF XML DATA. NIEDENNEIER U ET AL.PROCEEDINGS OF IEEE INTERNATIONAL CONFERENCE ON MULTIMEDIA AND EXPO(ICME). 2002 * |
AN XML REPOSITORY FOR MOLECULAR SEQUENCEDATA. WONG R K ET AL.PROCEEDINGS IEEE INTERNATIONAL SYMPOSIUM ON BIO-INFORMATICS AND BIOMEDICAL ENGINEERING. 2000 |
AN XML REPOSITORY FOR MOLECULAR SEQUENCEDATA. WONG R K ET AL.PROCEEDINGS IEEE INTERNATIONAL SYMPOSIUM ON BIO-INFORMATICS AND BIOMEDICAL ENGINEERING. 2000 * |
REPRESENTING LEXICONS BY MODIFIED TRIEFORFAST PARTIAL STRING MATCHING. LAM S W ET AL.CHARACTER RECOGNITION TECHNOLOGIES. 1993 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103532565A (zh) * | 2012-06-28 | 2014-01-22 | 富士通株式会社 | 码处理技术 |
CN103532565B (zh) * | 2012-06-28 | 2016-12-28 | 富士通株式会社 | 码处理技术 |
TWI750022B (zh) * | 2020-12-18 | 2021-12-11 | 威盛電子股份有限公司 | 應用於鍵樹的編碼方法、應用於鍵樹的解碼方法與電子裝置 |
US12105695B2 (en) | 2020-12-18 | 2024-10-01 | Via Technologies Inc. | Encoding method for key Trie, decoding method for key Trie, and electronic devices |
Also Published As
Publication number | Publication date |
---|---|
DE10337825A1 (de) | 2004-06-03 |
WO2004047304A2 (de) | 2004-06-03 |
EP1561281B1 (de) | 2008-12-03 |
BR0316335A (pt) | 2005-09-27 |
ATE416514T1 (de) | 2008-12-15 |
US20060064424A1 (en) | 2006-03-23 |
US7330854B2 (en) | 2008-02-12 |
KR101032240B1 (ko) | 2011-05-02 |
DE50310876D1 (de) | 2009-01-15 |
AU2003293638A1 (en) | 2004-06-15 |
EP1561281A2 (de) | 2005-08-10 |
JP2006515450A (ja) | 2006-05-25 |
BRPI0316335B1 (pt) | 2016-02-10 |
CN1739243A (zh) | 2006-02-22 |
KR20050086657A (ko) | 2005-08-30 |
WO2004047304A3 (de) | 2004-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1998241B (zh) | 用于对xml文档编码和/或解码的方法及装置 | |
CN100576750C (zh) | 用于从索引树中产生比特流的方法 | |
CN1401188B (zh) | Mpeg-7样品的二进制格式 | |
KR101066628B1 (ko) | 계층적 데이터 포맷의 데이터베이스 모델 | |
ES2262000T3 (es) | Procedimiento y dispositivos para codificar/decodificar documentos estructurados, en particular documentos xml. | |
KR100419766B1 (ko) | 메타데이터의 인덱스 구조와, 메타데이터의 인덱스의 제공방법 메타데이터의 인덱스를 이용한 메타데이터의 검색방법 및 검색 장치 | |
US20070143664A1 (en) | A compressed schema representation object and method for metadata processing | |
EP1542140B1 (en) | Method and apparatus for managing data written in markup language | |
US20060212467A1 (en) | Encoding of hierarchically organized data for efficient storage and processing | |
US20080077606A1 (en) | Method and apparatus for facilitating efficient processing of extensible markup language documents | |
CN102122285A (zh) | 一种数据缓存系统和数据查询方法 | |
US20060167907A1 (en) | System and method for processing XML documents | |
US7797346B2 (en) | Method for improving the functionality of the binary representation of MPEG-7 and other XML based content descriptions | |
Leighton et al. | TREECHOP: A Tree-based Query-able Compressor for XML | |
KR20050118171A (ko) | 구성된 문서를 인코딩하기 위한 방법 | |
Senthilkumar et al. | QRFXFreeze: Queryable compressor for RFX | |
Demmings | FILTERING,(C () MPRESSED) XMI, STREAMS | |
US20080189310A1 (en) | Method for Encoding an Xml-Based Document | |
JP2003092744A (ja) | 構造化メタデータの分割方法 | |
CN102214178A (zh) | 一种基于版本树的三阶段xml枝匹配算法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20091230 Termination date: 20171030 |