CN102023980A - 文件描述信息存储以及文件数据读取的方法、装置 - Google Patents

文件描述信息存储以及文件数据读取的方法、装置 Download PDF

Info

Publication number
CN102023980A
CN102023980A CN2009100928531A CN200910092853A CN102023980A CN 102023980 A CN102023980 A CN 102023980A CN 2009100928531 A CN2009100928531 A CN 2009100928531A CN 200910092853 A CN200910092853 A CN 200910092853A CN 102023980 A CN102023980 A CN 102023980A
Authority
CN
China
Prior art keywords
sign
definitive
original document
document
document sign
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2009100928531A
Other languages
English (en)
Other versions
CN102023980B (zh
Inventor
仇睿恒
王毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Founder Holdings Development Co ltd
Peking University
Peking University Founder Research and Development Center
Original Assignee
BEIDA FANGZHENG TECHN INST Co Ltd BEIJING
Peking University
Peking University Founder Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIDA FANGZHENG TECHN INST Co Ltd BEIJING, Peking University, Peking University Founder Group Co Ltd filed Critical BEIDA FANGZHENG TECHN INST Co Ltd BEIJING
Priority to CN2009100928531A priority Critical patent/CN102023980B/zh
Publication of CN102023980A publication Critical patent/CN102023980A/zh
Application granted granted Critical
Publication of CN102023980B publication Critical patent/CN102023980B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明涉及数据处理领域,尤其涉及一种文件描述信息存储以及文件数据读取的方法、装置。所述文件描述信息存储的方法包括:收集所有文件描述信息,每项所述文件描述信息中包括初始文件标识;按照预定的最终文件标识确定规则,根据所述初始文件标识确定对应的固定长度的最终文件标识;将每项所述文件描述信息中的初始文件标识用确定出的对应的最终文件标识替换;根据替换后的最终文件标识对所有文件描述信息进行排序;以及将排序后的所有文件描述信息存储到包文件中。通过该方法,缩短了第一次读取文件数据的时间,提高了读取效率及用户体验,同时提高了包文件的安全性。

Description

文件描述信息存储以及文件数据读取的方法、装置
技术领域
本发明涉及数据处理领域,尤其涉及一种文件描述信息存储以及文件数据读取的方法、装置。
背景技术
目前人们往往会使用winzip、winrar等软件对多个文件数据打包压缩成包文件后进行存储。包文件中包括各个文件数据及其对应的文件描述信息,文件描述信息用于描述对应的文件数据的相关信息,如初始文件标识(文件名或全路径)、文件数据大小、压缩后大小以及压缩方法等。在第一次读取包文件中的文件数据前,需要对包文件中所有的文件描述信息进行解析并读取到内存后才能读取所需的文件数据,从而使得第一次读取文件数据的时间过长,影响读取效率及用户体验。
上述缺陷是由每个文件描述信息(file header)的结构引起的。因为传统方案中的文件描述信息是可变长的,并且各个文件描述信息在包文件中的存储是按照文件数据写入的顺序排列的,而写入的顺序是不固定的,因此在第一次读取包文件中的文件数据前,必须先按照该写入的顺序依次对包文件中所有的文件描述信息进行解析。此外,包文件中存储的文件描述信息中包括初始文件标识,任何人都可以在打开包文件时看到其中包括哪些文件数据,因此安全性不好,容易引起信息泄露。
发明内容
本发明实施例提供一种文件描述信息存储以及文件数据读取的方法、装置,用以在第一次读取包文件中的文件数据前,无需对包文件中所有文件描述信息进行解析并读取,从而缩短第一次读取文件数据的时间,提高读取效率及用户体验,还可以提高包文件的安全性。
一种文件描述信息存储的方法,包括:
收集所有文件描述信息,每项所述文件描述信息中包括初始文件标识;
按照预定的最终文件标识确定规则,根据所述初始文件标识确定对应的固定长度的最终文件标识;
将每项所述文件描述信息中的初始文件标识用确定出的对应的最终文件标识替换;
根据替换后的最终文件标识对所有文件描述信息进行排序;以及
将排序后的所有文件描述信息存储到包文件中。
一种文件描述信息存储的装置,包括:
收集单元,用于收集所有文件描述信息,每项所述文件描述信息中包括初始文件标识;
确定单元,用于按照预定的最终文件标识确定规则,根据所述初始文件标识确定对应的固定长度的最终文件标识;
替换单元,用于将每项所述文件描述信息中的初始文件标识用确定出的对应的最终文件标识替换;
排序单元,用于根据替换后的最终文件标识对所有文件描述信息进行排序;以及
存储单元,用于将排序后的所有文件描述信息存储到包文件中。
一种文件数据读取的方法,包括:
确定所有文件描述信息在包文件中的位置信息,每项所述文件描述信息中包括固定长度的最终文件标识;
根据用户指定的初始文件标识确定对应的最终文件标识;
根据确定出的对应的最终文件标识以及所述位置信息,在所述所有文件描述信息中查找对应的文件描述信息;
根据查找到的文件描述信息读取对应的文件数据。
一种文件数据读取的装置,包括:
第一确定单元,用于确定所有文件描述信息在包文件中的位置信息,每项所述文件描述信息中包括固定长度的最终文件标识;
第二确定单元,用于根据用户指定的初始文件标识确定对应的最终文件标识;
查找单元,用于根据所述第二确定单元确定出的对应的最终文件标识及所述第一确定单元确定出的位置信息,在所述所有文件描述信息中查找对应的文件描述信息;
读取单元,用于根据所述查找单元查找到的文件描述信息读取对应的文件数据。
本发明有益效果如下:本发明实施例在存储文件描述信息到包文件中时,按照预定的最终文件标识确定规则,根据文件描述信息中的初始文件标识确定对应的固定长度的最终文件标识,然后用确定出的最终文件标识替换初始文件标识,并根据最终文件标识对所有文件描述信息进行排序,再将排序后的所有文件描述信息存储到包文件中。这样,由于存储的文件描述信息中的最终文件标识长度固定,且各文件描述信息有序排列,因此在第一次读取包文件中的文件数据前,无需对包文件中的所有文件描述信息进行解析并读取,只要根据用户指定的初始文件标识确定对应的最终文件标识,再根据最终文件标识查找对应的文件描述信息,即可读取对应的文件数据,从而缩短了第一次读取文件数据的时间,提高了读取效率及用户体验。另外,由于用保密性强的最终文件标识替换了初始文件标识,因此在打开包文件时看到的只是其中的文件数据的最终文件标识,而无法知道其初始文件标识,即无法知道具体是哪些文件数据,而只有知道文件数据的初始文件标识的用户才能够读取其中的文件数据,从而提高了包文件的安全性。
附图说明
图1为本发明实施例中一种文件描述信息存储方法的流程图;
图2为本发明实施例中一种文件描述信息存储装置的结构图;
图3为本发明实施例中一种文件数据读取方法的流程图;
图4为本发明实施例中一种文件数据读取装置的结构图。
具体实施方式
本发明实施例提供了一种文件描述信息存储的方法、装置,以及一种文件数据读取的方法、装置,通过将可变长的初始文件标识转换成固定长度的最终文件标识,并根据最终文件标识对所有文件描述信息进行排序,从而在第一次读取包文件中的文件数据前,无需对包文件中的所有文件描述信息进行解析并读取,只要根据用户指定的初始文件标识确定对应的最终文件标识,再根据最终文件标识查找对应的文件描述信息,即可读取对应的文件数据,从而缩短了第一次读取文件数据的时间,提高了读取效率及用户体验。此外,通过用保密性强的最终文件标识替换初始文件标识,提高包文件的安全性。
下面结合附图对本发明的具体实施方式及对应产生的有益效果进行详细描述。
如图1所示,为本发明实施例提供的文件描述信息存储方法的流程图,该方法包括如下步骤:
步骤101、收集所有文件描述信息,每项文件描述信息中包括初始文件标识。
其中,初始文件标识可以为文件名或全路径。
步骤102、按照预定的最终文件标识确定规则,根据初始文件标识确定对应的固定长度的最终文件标识。
其中,预定的最终文件标识确定规则可以有多种,包括但不限于以下两种最终文件标识确定规则:
1、将所有初始文件标识保存在初始文件标识列表中,按照该列表中的保存顺序依次为所有初始文件标识进行编号,将该编号作为对应的最终文件标识。例如,列表中第一个初始文件标识的编号为0,第二个初始文件标识的编号为1,第三个初始文件标识的编号为2,以此类推。当然,也可以采用其他的编号形式进行编号,只要每个初始文件标识对应唯一的一个编号即可。
2、利用哈希函数,根据初始文件标识,计算对应的哈希值作为最终文件标识。当哈希函数足够优秀、哈希值域远远大于初始文件标识的数目时,可以认为计算出的各个哈希值不会冲突。
在采用第一种最终文件标识确定规则时,可以将初始文件标识列表进行保存,既可以保存在包文件中,也可以保存在包文件之外的其他外存中,以方便在读取包文件中的文件数据时进行利用该列表。另外,该列表中还可以对应保存确定出的最终文件标识,以方便在读取包文件中的文件数据时,根据用户指定的初始文件标识在该列表中直接查找到对应的最终文件标识。该包括初始文件标识及对应的最终文件标识的初始文件标识列表可以保存在包文件中。
在采用第二种最终文件标识确定规则时,由于不需要有初始文件标识列表,因此进一步隐藏了包文件中的文件数据信息。
此外,所述最终文件标识的固定长度可以根据实际需要进行设定,也可以根据系统的不同设定不同的固定长度,只要确保同一包文件中的所有最终文件标识的长度相同且该长度可以满足实际需要即可实现本发明的目的。
步骤103、将每项所述文件描述信息中的初始文件标识用确定出的对应的最终文件标识替换。
这样保证了所有文件描述信息都是等长的。而且,由于最终文件标识不会直接反映出文件数据信息,保密性强,因此在用户打开包文件时看到的只是其中的文件数据的最终文件标识,而无法知道其初始文件标识,如文件名或路径名,即无法知道具体是哪些文件数据,而只有知道文件数据的初始文件标识的用户才能够读取其中的文件数据,从而提高了包文件的安全性。
步骤104、根据替换后的最终文件标识对所有文件描述信息进行排序。
其中,可以根据上述编号的大小顺序对所有文件描述信息进行排序,也可以根据实际需要按照其他排序规则对所有文件描述信息进行排序,例如利用哈希(hash)表、树等规则对所有文件描述信息进行排序,只要保证在读取包文件中的文件数据时,可以方便地根据该顺序确定对应的文件描述信息即可。
步骤105、将排序后的所有文件描述信息存储到包文件中。
相应地,本发明实施例提供了一种文件描述信息存储的装置,其结构如图2所示,包括:
收集单元201,用于收集所有文件描述信息,每项文件描述信息中包括初始文件标识;
其中,初始文件标识为文件名或全路径。
确定单元202,用于按照预定的最终文件标识确定规则,根据初始文件标识确定对应的固定长度的最终文件标识;
其中的预定的最终文件标识确定规则与上述方法中的最终文件标识确定规则相同,此处不再赘述。
替换单元203,用于将每项文件描述信息中的初始文件标识用确定出的对应的最终文件标识替换;
排序单元204,用于根据替换后的最终文件标识对所有文件描述信息进行排序;
其中的排序方式与上述方法中描述的排序方式相同,此处不再赘述。
存储单元205,用于将排序后的所有文件描述信息存储到包文件中。
此外,本发明实施例还提供一种文件数据读取方法,用于从包文件中读取用户指定的文件数据,其具体流程如图3所示,包括以下步骤:
步骤301、确定所有文件描述信息在包文件中的位置信息,每项文件描述信息中包括固定长度的最终文件标识。
其中,该包文件中的所有文件描述信息是根据上述文件描述信息存储方法存储到包文件中的,包文件中记录有文件描述信息的位置信息。
步骤302、根据用户指定的初始文件标识确定对应的最终文件标识。
其中,初始文件标识可以为文件名或全路径。
根据用户指定的初始文件标识确定对应的最终文件标识的方式包括如下之一:
1、根据保存有所有文件描述信息中的最终文件标识对应的初始文件标识的初始文件标识列表,按照该列表中的保存顺序确定用户指定的初始文件标识对应的编号,将该编号作为对应的最终文件标识。
2、利用哈希函数,根据用户指定的初始文件标识,计算对应的哈希值作为最终文件标识。
其中,根据用户指定的初始文件标识确定对应的最终文件标识的方式应与将文件描述信息存储到包文件中时根据初始文件标识确定对应的最终文件标识采用的最终文件标识确定规则相应,从而保证初始文件标识和最终文件标识之间的唯一对应关系。
在采用第一种方式确定用户指定的初始文件标识对应的最终文件标识时,如果初始文件标识列表中还包括各个初始文件标识对应的最终文件标识,则可以直接在该列表中查找用户指定的初始文件标识对应的最终文件标识。
步骤303、根据确定出的对应的最终文件标识以及位置信息,在所有文件描述信息中查找对应的文件描述信息。
其中,可以将所有文件描述信息从包文件中读取到内存中,但是只是读取而无需像现有技术中那样进行深度解析。或者,也可以在将所有文件描述信息从包文件中读取到内存中后,根据所有文件描述信息中的最终文件标识在内存中建立相应的数据结构或hash表。于是,可以利用多路查找等方式直接在这些排序后的文件描述信息中进行查找。
步骤304、根据查找到的文件描述信息读取对应的文件数据。
相应地,本发明实施例还提供一种文件数据读取的装置,其结构如图4所示,包括:
第一确定单元401,用于确定所有文件描述信息在包文件中的位置信息,每项文件描述信息中包括固定长度的最终文件标识;
其中,该包文件中的所有文件描述信息是根据上述文件描述信息存储方法存储到包文件中的,包文件中记录有文件描述信息的位置信息。
第二确定单元402,用于根据用户指定的初始文件标识确定对应的最终文件标识;
其中,初始文件标识为文件名或全路径。
查找单元403,用于根据第二确定单元402确定出的对应的最终文件标识及第一确定单元401确定出的位置信息,在所有文件描述信息中查找对应的文件描述信息;
读取单元404,用于根据查找单元403查找到的文件描述信息读取对应的文件数据。
第二确定单元402可以包括如下之一:
确定子单元,用于根据保存有所有文件描述信息中的最终文件标识对应的初始文件标识的初始文件标识列表,按照该列表中的保存顺序确定用户指定的初始文件标识对应的编号,将该编号作为对应的最终文件标识;或
计算子单元,用于根据用户指定的初始文件标识,计算对应的哈希值作为最终文件标识。
如果初始文件标识列表中还包括各个初始文件标识对应的最终文件标识,则第二确定单元402可以包括:
查找子单元,用于在包括最终文件标识的初始文件标识列表中查找用户指定的初始文件标识对应的最终文件标识。
下面举例说明本发明实施例提供的方法、装置在一种包文件结构中的应用,该包文件由文件头(Header),文件描述信息块(Entry块)和文件数据信息块(文件流,Bitstream块)组成。其中,Entry块和Bitstream块在一个包文件中可以出现多个。对包文件中的各元素的说明如表1所示。
表1
Figure B2009100928531D0000091
其中,文件头结构中各元素的具体说明如表2所示。
表2
Figure B2009100928531D0000092
Entry块结构中各文件信息的具体说明如表3所示。
表3
Figure B2009100928531D0000101
Bitstream块结构中各文件信息的具体说明如表4所示。
表4
Figure B2009100928531D0000102
Figure B2009100928531D0000111
其中,Entry块中的item即为文件描述信息。将上述文件描述信息存储方法应用到该文件包结构中时,具体步骤如下:
步骤1、收集所有的item,每项item对应一个初始文件标识(即Path)。
步骤2、为每个Path显式分配一个唯一数值NameValue,例如,可以为第一个Path分配数值0,后续的Path对应的数值依次加1。
步骤3、用NameValue替换对应的Path。
步骤4、根据NameValue对所有item进行排序。
步骤5、将Path与对应的NameValue组成一对,并将所有的Path与NameValue对保存成一个列表NameTable.
步骤6、将排序后的所有item以及NameTable存储到包文件中。
采用上述方法后,表3中的Entry块结构更改为表5所示的结构。
表5
Figure B2009100928531D0000112
Figure B2009100928531D0000121
其中,NameTable的结构如表6所示。
表6
Figure B2009100928531D0000122
其中,ItemList的结构如表7所示。
表7
Figure B2009100928531D0000131
相应地,从该包文件中读取文件数据的方法具体包括:
步骤1、读取NameTable(如果Entry块已压缩,需要先解压缩)。
步骤2、确定第一个item的位置。
步骤3、用户指定初始文件标识(Path)。
步骤4、根据该Path在NameTable中查找对应的NameValue。
步骤5、在包文件中,直接根据EntryLength和第一个item的位置,利用查找到的NameValue在所有的Item中进行2分查找,找到对应的Item。
步骤6、根据该Item读取对应的文件数据。
以上应用中,采用初始文件标识和最终文件标识的第一种最终文件标识确定规则。在采用第二种最终文件标识确定规则,即利用哈希函数,计算初始文件标识对应的最终文件标识时,文件描述信息存储方法的具体步骤如下:
其中,所用的哈希函数是MD5算法。
步骤1、收集所有的Item,每项Item对应一个初始文件标识(即Path)。
步骤2、利用上述哈希函数,为每个Path计算对应的NameValue。
其中,根据上述MD5算法得到的NameValue的长度为16字节(如表8所示),这样的固定长度可以确保Hash冲突足够小。
步骤3、用NameValue替换对应的Path。
步骤4、根据NameValue对所有item进行排序。
步骤5、将排序后的所有item存储到包文件中。
采用上述方法后,表3中的Entry块结构更改为表8所示的结构。
表8
其中,ItemList的结构如表9所示。
表9
相应地,从该包文件中读取文件数据的方法具体包括:
步骤1、确定第一个item的位置。
步骤2、根据EntryLength和第一个item的位置直接读取所有的Item到内存中,但无需进行解析。
步骤3、用户指定初始文件标识(Path)。
步骤4、利用上述哈希函数,计算该Path对应的NameValue。
步骤5、在内存中,根据该NameValue在所有Item中进行2分查找,找到对应的Item。
步骤6、根据该Item读取对应的文件数据。
此外,从该包文件中读取文件数据的方法还可以采用如下步骤进行,具体包括:
步骤1、确定第一个item的位置。
步骤2、依次读取Item,并根据其中的NameValue放置到一个哈希表中。
步骤3、用户指定初始文件标识(Path)。
步骤4、利用上述哈希函数,计算该Path对应的NameValue。
步骤5、在内存中,根据该计算出的NameValue直接在上述哈希表中找到对应的Item。
步骤6、根据该Item读取对应的文件数据。
以上的本发明实施例在存储文件描述信息到包文件中时,按照预定的最终文件标识确定规则,根据文件描述信息中的初始文件标识确定对应的固定长度的最终文件标识,然后用确定出的最终文件标识替换初始文件标识,并根据最终文件标识对所有文件描述信息进行排序,再将排序后的所有文件描述信息存储到包文件中。这样,由于存储的文件描述信息中的最终文件标识长度固定,且各文件描述信息有序排列,因此在第一次读取包文件中的文件数据前,无需对包文件中的所有文件描述信息进行解析并读取,只要根据用户指定的初始文件标识确定对应的最终文件标识,再根据最终文件标识查找对应的文件描述信息,即可读取对应的文件数据,从而缩短了第一次读取文件数据的时间,提高了读取效率及用户体验。另外,由于用保密性强的最终文件标识替换了初始文件标识,即隐藏了文件数据的初始文件标识,因此在打开包文件时看到的只是其中的文件数据的最终文件标识,而无法知道其初始文件标识,即无法知道具体是哪些文件数据,而只有知道文件数据的初始文件标识的用户才能够读取其中的文件数据,从而提高了包文件的安全性。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (26)

1.一种文件描述信息存储的方法,其特征在于,包括:
收集所有文件描述信息,每项所述文件描述信息中包括初始文件标识;
按照预定的最终文件标识确定规则,根据所述初始文件标识确定对应的固定长度的最终文件标识;
将每项所述文件描述信息中的初始文件标识用确定出的对应的最终文件标识替换;
根据替换后的最终文件标识对所有文件描述信息进行排序;以及
将排序后的所有文件描述信息存储到包文件中。
2.如权利要求1所述的方法,其特征在于,所述初始文件标识为文件名或全路径。
3.如权利要求1或2所述的方法,其特征在于,所述预定的最终文件标识确定规则包括:
将所有所述初始文件标识保存在初始文件标识列表中,按照所述列表中的保存顺序依次为所有所述初始文件标识进行编号,将所述编号作为对应的最终文件标识。
4.如权利要求3所述的方法,其特征在于,所述根据替换后的最终文件标识对所有文件描述信息进行排序,包括:
根据所述作为对应的最终文件标识的编号大小顺序,对所有文件描述信息进行排序。
5.如权利要求3所述的方法,其特征在于,保存所述初始文件标识列表。
6.如权利要求3所述的方法,其特征在于,所述按照预定的最终文件标识确定规则,根据所述初始文件标识确定对应的最终文件标识之后,还包括:
将确定出的最终文件标识对应保存在所述初始文件标识列表中;以及
将所述包括初始文件标识及对应的最终文件标识的初始文件标识列表保存到包文件中。
7.如权利要求1或2所述的方法,其特征在于,所述预定的最终文件标识确定规则包括:
根据所述初始文件标识,计算对应的哈希值作为最终文件标识。
8.如权利要求7所述的方法,其特征在于,所述根据替换后的最终文件标识对所有文件描述信息进行排序,包括:
根据所述作为最终文件标识的哈希值,利用哈希表或树对所有文件描述信息进行排序。
9.一种文件描述信息存储的装置,其特征在于,包括:
收集单元,用于收集所有文件描述信息,每项所述文件描述信息中包括初始文件标识;
确定单元,用于按照预定的最终文件标识确定规则,根据所述初始文件标识确定对应的固定长度的最终文件标识;
替换单元,用于将每项所述文件描述信息中的初始文件标识用确定出的对应的最终文件标识替换;
排序单元,用于根据替换后的最终文件标识对所有文件描述信息进行排序;以及
存储单元,用于将排序后的所有文件描述信息存储到包文件中。
10.如权利要求9所述的装置,其特征在于,所述初始文件标识为文件名或全路径。
11.如权利要求9或10所述的装置,其特征在于,所述预定的最终文件标识确定规则包括:
将所有所述初始文件标识保存在初始文件标识列表中,按照所述列表中的保存顺序依次为所有所述初始文件标识进行编号,将所述编号作为对应的最终文件标识。
12.如权利要求11所述的装置,其特征在于,所述排序单元进一步用于根据所述作为对应的最终文件标识的编号大小顺序,对所有文件描述信息进行排序。
13.如权利要求11所述的装置,其特征在于,还包括:
第一保存单元,用于保存所述初始文件标识列表。
14.如权利要求11所述的装置,其特征在于,还包括:
第二保存单元,用于将确定出的最终文件标识对应保存在所述初始文件标识列表中;以及
第三保存单元,用于将所述包括初始文件标识及对应的最终文件标识的初始文件标识列表保存到包文件中。
15.如权利要求9或10所述的装置,其特征在于,所述预定的最终文件标识确定规则包括:
根据所述初始文件标识,计算对应的哈希值作为最终文件标识。
16.如权利要求15所述的装置,其特征在于,所述排序单元进一步用于根据所述作为最终文件标识的哈希值,利用哈希表或树对所有文件描述信息进行排序。
17.一种文件数据读取的方法,其特征在于,包括:
确定所有文件描述信息在包文件中的位置信息,每项所述文件描述信息中包括固定长度的最终文件标识;
根据用户指定的初始文件标识确定对应的最终文件标识;
根据确定出的对应的最终文件标识以及所述位置信息,在所述所有文件描述信息中查找对应的文件描述信息;
根据查找到的文件描述信息读取对应的文件数据。
18.如权利要求17所述的方法,其特征在于,所述初始文件标识为文件名或全路径。
19.如权利要求17或18所述的方法,其特征在于,所述根据用户指定的初始文件标识确定对应的最终文件标识,包括:
根据保存有所述所有文件描述信息中的最终文件标识对应的初始文件标识的初始文件标识列表,按照所述列表中的保存顺序确定所述用户指定的初始文件标识对应的编号,将所述编号作为对应的最终文件标识。
20.如权利要求19所述的方法,其特征在于,所述初始文件标识列表中还包括各个初始文件标识对应的最终文件标识,则所述根据用户指定的初始文件标识确定对应的最终文件标识,包括:在所述包括最终文件标识的初始文件标识列表中查找所述用户指定的初始文件标识对应的最终文件标识。
21.如权利要求17或18所述的方法,其特征在于,所述根据用户指定的初始文件标识确定对应的最终文件标识,包括:
根据所述用户指定的初始文件标识,计算对应的哈希值作为最终文件标识。
22.一种文件数据读取的装置,其特征在于,包括:
第一确定单元,用于确定所有文件描述信息在包文件中的位置信息,每项所述文件描述信息中包括固定长度的最终文件标识;
第二确定单元,用于根据用户指定的初始文件标识确定对应的最终文件标识;
查找单元,用于根据所述第二确定单元确定出的对应的最终文件标识及所述第一确定单元确定出的位置信息,在所述所有文件描述信息中查找对应的文件描述信息;
读取单元,用于根据所述查找单元查找到的文件描述信息读取对应的文件数据。
23.如权利要求22所述的装置,其特征在于,所述初始文件标识为文件名或全路径。
24.如权利要求22或23所述的装置,其特征在于,所述第二确定单元包括:
确定子单元,用于根据保存有所述所有文件描述信息中的最终文件标识对应的初始文件标识的初始文件标识列表,按照所述列表中的保存顺序确定所述用户指定的初始文件标识对应的编号,将所述编号作为对应的最终文件标识。
25.如权利要求22或23所述的装置,其特征在于,所述第二确定单元包括:
计算子单元,用于根据所述用户指定的初始文件标识,计算对应的哈希值作为最终文件标识。
26.如权利要求24所述的装置,其特征在于,所述初始文件标识列表中还包括各个初始文件标识对应的最终文件标识,则所述第二确定单元包括:
查找子单元,用于在所述包括最终文件标识的初始文件标识列表中查找所述用户指定的初始文件标识对应的最终文件标识。
CN2009100928531A 2009-09-09 2009-09-09 文件描述信息存储以及文件数据读取的方法、装置 Expired - Fee Related CN102023980B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009100928531A CN102023980B (zh) 2009-09-09 2009-09-09 文件描述信息存储以及文件数据读取的方法、装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100928531A CN102023980B (zh) 2009-09-09 2009-09-09 文件描述信息存储以及文件数据读取的方法、装置

Publications (2)

Publication Number Publication Date
CN102023980A true CN102023980A (zh) 2011-04-20
CN102023980B CN102023980B (zh) 2012-10-31

Family

ID=43865288

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100928531A Expired - Fee Related CN102023980B (zh) 2009-09-09 2009-09-09 文件描述信息存储以及文件数据读取的方法、装置

Country Status (1)

Country Link
CN (1) CN102023980B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102902814A (zh) * 2012-10-24 2013-01-30 厦门市美亚柏科信息股份有限公司 一种im删除信息的恢复方法
CN104580240A (zh) * 2015-01-22 2015-04-29 杭州安存网络科技有限公司 聊天证据固定方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7313634B1 (en) * 2003-11-10 2007-12-25 Sap Portals Israel Ltd. Techniques for importing compressed content packages into a network portal
CN101398853A (zh) * 2008-10-14 2009-04-01 北京大学 一种文件打包的方法和装置
CN101394451B (zh) * 2008-11-06 2012-09-05 北京中创信测科技股份有限公司 呼叫详细记录数据的存储方法、显示方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102902814A (zh) * 2012-10-24 2013-01-30 厦门市美亚柏科信息股份有限公司 一种im删除信息的恢复方法
CN102902814B (zh) * 2012-10-24 2015-09-16 厦门市美亚柏科信息股份有限公司 一种im删除信息的恢复方法
CN104580240A (zh) * 2015-01-22 2015-04-29 杭州安存网络科技有限公司 聊天证据固定方法及装置

Also Published As

Publication number Publication date
CN102023980B (zh) 2012-10-31

Similar Documents

Publication Publication Date Title
CN111400408B (zh) 数据同步方法、装置、设备及存储介质
US11620397B2 (en) Methods and apparatus to provide group-based row-level security for big data platforms
CN101655877B (zh) 一种文件打包、提取的方法和装置
CN101553813B (zh) 管理可单独访问的数据单元的存储器
CN101546342B (zh) 实现搜索服务的方法与系统
CN103488709B (zh) 一种索引建立方法及系统、检索方法及系统
EP2973034B1 (en) Methods and systems for arranging and searching a database of media content recordings
CN105468642A (zh) 数据的存储方法及装置
CA2905385C (en) Methods and systems for arranging and searching a database of media content recordings
CN101158981A (zh) 一种对下载资源进行分类的方法、系统和装置
CN104679830A (zh) 一种文件处理方法和装置
CN109165222A (zh) 一种基于协处理器的HBase二级索引创建方法以及系统
CN107515931B (zh) 一种基于聚类的重复数据检测方法
CN103207889A (zh) 一种基于Hadoop的海量人脸图像的检索方法
CN106557571A (zh) 一种基于k‑v存储引擎的数据去重方法及装置
CN107704520B (zh) 基于人脸识别的多文件检索方法和装置
CN107391769B (zh) 一种索引查询方法及装置
CN113312313A (zh) 数据查询方法、非易失性存储介质及电子设备
CN102023980B (zh) 文件描述信息存储以及文件数据读取的方法、装置
CN100357943C (zh) 一种检查机群文件系统中垃圾文件的方法
CN107301203B (zh) 一种海量数据的比对方法及系统
CN102693315A (zh) 一种基于共享内存映射的url去重方法及装置
CN109271097A (zh) 数据处理方法、数据处理装置和服务器
CN107590233B (zh) 一种文件管理方法及装置
US20150066947A1 (en) Indexing apparatus and method for search of security monitoring data

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220915

Address after: 100871 No. 5, the Summer Palace Road, Beijing, Haidian District

Patentee after: Peking University

Patentee after: New founder holdings development Co.,Ltd.

Patentee after: PEKING University FOUNDER R & D CENTER

Address before: 100871 No. 5, the Summer Palace Road, Beijing, Haidian District

Patentee before: Peking University

Patentee before: PEKING UNIVERSITY FOUNDER GROUP Co.,Ltd.

Patentee before: PEKING University FOUNDER R & D CENTER

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20121031

CF01 Termination of patent right due to non-payment of annual fee