WO2014000458A1 - 小文件处理方法及装置 - Google Patents

小文件处理方法及装置 Download PDF

Info

Publication number
WO2014000458A1
WO2014000458A1 PCT/CN2013/072039 CN2013072039W WO2014000458A1 WO 2014000458 A1 WO2014000458 A1 WO 2014000458A1 CN 2013072039 W CN2013072039 W CN 2013072039W WO 2014000458 A1 WO2014000458 A1 WO 2014000458A1
Authority
WO
WIPO (PCT)
Prior art keywords
file
small
data
read
block
Prior art date
Application number
PCT/CN2013/072039
Other languages
English (en)
French (fr)
Inventor
叶林睿
张宗全
钟延辉
Original Assignee
华为技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 华为技术有限公司 filed Critical 华为技术有限公司
Publication of WO2014000458A1 publication Critical patent/WO2014000458A1/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/162Delete operations

Definitions

  • the present invention relates to file processing technologies, and in particular, to a small file processing method and apparatus.
  • Deduplication technology is a new type of application in storage systems. By deleting duplicate data from the storage system, only one of them is retained, eliminating redundant data. Deduplicating files requires operations such as blocking, similarity analysis, and querying duplicate blocks. When deleting a small file, it takes a lot of time to eliminate small blocks of redundant data, which is not only time consuming, but also Occupy system resources.
  • Embodiments of the present invention provide a small file processing method, which can be used in a deduplication operation to speed up a large number of small file deduplication speeds and reduce a large amount of small file occupation space.
  • a small file processing method provided by an embodiment of the present invention includes:
  • Reading N small files wherein the small file is a small file smaller than a preset size
  • the N small files that are read are integrated into one large file, and the integrated large file is divided by a sliding window; and the integrated large file is divided by using a sliding window, including: Determining whether the end position of the sliding window is the tail of any of the small files, and if so, the data from the end position of the previous block to the end position of the current sliding window as a data block; No, it is judged whether the data currently covered by the sliding window satisfies the data blocking condition; If the blocking condition is satisfied, data between the end position of the previous block and the end position of the current sliding window is used as a data block; if the blocking condition is not satisfied, the sliding window is Moving one byte, continuing to block the integrated large file by using a sliding window until data partitioning of the integrated large file is completed;
  • the embodiment of the invention further provides a small file processing device, including:
  • a reading unit configured to read N small files, where the small file is a small file smaller than a preset size
  • a splitting unit configured to integrate the read N small files into one large file, and perform data partitioning on the integrated large file
  • a determining unit configured to determine a duplicate block and a new block in the obtained data block according to the preset data block metadata information base
  • Processing unit adding metadata information of the determined new block to the metadata information base, and adding data of the new block to the record file, and updating the number of times of repeated block references in the metadata information base ;
  • the splitting unit includes:
  • An integration unit configured to integrate the read small file into one large file
  • a first determining unit configured to determine whether an end position of the sliding window is a tail of any of the small files, and if yes, send the determination result to the split processing unit; if not, send the determination result to the second judgment Unit
  • the second determining unit is configured to determine whether the data currently covered by the sliding window meets the data blocking condition, and if yes, send the determination result to the split processing unit, if not, move the sliding window by one byte, and then return to the execution center. Determining, by the first determining unit, the partitioning of the integrated large file by using a sliding window until the data partitioning of the integrated large file is completed;
  • a split processing unit configured to: when determining that the end position of the sliding window is the tail of any of the small files or determining that the data currently covered by the sliding window satisfies the data blocking condition, the partition will be from the previous block Returning the data from the end position to the end position of the current sliding window as a data block, and after moving the sliding window by one byte, returning to perform the first determining unit function to continue using the sliding window to the integrated
  • the large file is chunked until the data chunking of the integrated large file is completed.
  • the embodiment of the invention provides a small file processing method and device, which can integrate small files into one large file for the process of deduplication of large files, and then perform data segmentation on the integrated large files, and then repeat Operations such as data lookups improve the efficiency of deduplication of small files; reduce the occupation of disk space.
  • FIG. 1 is a flowchart of a small file processing method according to an embodiment of the present invention
  • FIG. 2 is a flowchart of splitting a large file obtained by using a sliding window according to an embodiment of the present invention
  • FIG. 3 is a flowchart of another small file processing method according to an embodiment of the present invention.
  • FIG. 4 is a schematic diagram of application of a small file processing method according to an embodiment of the present invention.
  • FIG. 5 is a schematic structural diagram of a small file processing apparatus according to an embodiment of the present invention
  • FIG. 6 is a schematic structural diagram of another small file processing apparatus according to an embodiment of the present invention
  • FIG. 1 is a flowchart of a small file processing method according to Embodiment 1 of the present invention. As shown in FIG. 1, the method includes:
  • Step 101 Read N small files, where the small file is a file smaller than MkB.
  • step 101 can be performed by the management management (MGT).
  • MGT management management
  • the available mode is: MGT reads N files in the same directory of the disk, which has the advantages of fast reading speed and convenient management. .
  • M is a value that can be artificially defined as needed.
  • N indicates the number of small files. Obviously, N can be a natural number greater than 0.
  • Step 103 Consolidate the N small files into one large file, and block the integrated large file by using a sliding window;
  • the read N small files are logically combined into one large file, that is, N small files are logically combined into N parts of a large file, and the N small files are physically dispersed, but only Look at a file as virtual, while the end of each small file is known.
  • the integrated large file is the large file obtained after the integration of small files.
  • the step of dividing the integrated large file by using a sliding window includes: Step 1031: determining whether an end position of the sliding window is a tail of any small file, and if yes, entering Step 1034; If no, proceed to step 1033;
  • Step 1033 determining whether the data currently covered by the sliding window meets the data blocking condition; if the blocking condition is satisfied, proceeding to step 1034; if the blocking condition is not satisfied, proceeding to step 1035;
  • Step 1034 the data from the end position of the previous block to the end position of the current sliding window as a data block, and proceeds to step 1035;
  • Step 1035 Move the sliding window by one byte, and return to step 1031 to continue to block the integrated large file by using a sliding window until the data partitioning of the integrated large file is completed.
  • the moving the sliding window by one byte is to slide a byte toward the tail of the data;
  • the satisfying the data blocking condition includes performing a hash value operation on the data covered by the sliding window, and determining the hash. Whether the value satisfies the condition for performing the blocking, or whether the length of the data sliding by the sliding window satisfies the blocking condition or the like, and there are many methods, and details are not described herein again.
  • the condition that satisfies the data partitioning does not include determining whether the end position of the sliding window is the tail of any small file, and determining whether the ending position of the previous block is from the end position of the previous block to the current sliding window. The data between the end positions is treated as a data block.
  • the integrated large file is subjected to data partitioning to obtain a plurality of partitions, wherein, in the process of blocking, if the data block currently being divided includes the tail of any small file
  • the tail of the small file needs to be the end position of the current data block, so that the obtained data can be combined and obtained to obtain a complete small file; for example, the two small files filel and file2 are integrated into one large file.
  • the file is divided into three blocks of data A, B, and A, where filel is divided into the first data block A, and file2 is divided into the second data block B and the third data segment.
  • Block A, A form filel, BA constitutes file2.
  • the main purpose of blocking is to find the same block in the file later.
  • Step 105 Determine, according to a preset data block metadata information library, a duplicate block and a new block in the obtained data block;
  • the duplicate block in the embodiment of the present invention refers to a certain data block obtained by splitting a large file, and determines whether the metadata information in the preset data block metadata information database already contains the data block.
  • the metadata information if yes, determines that the information of the data block has been included in the record file (storing the real valid data), then the data block is regarded as a duplicate block; otherwise, the judgment is obtained in the record file. If there is no information containing the data block, the data block is a new block.
  • the data obtained by splitting is divided into blocks, and how to judge whether it is a new block or a duplicate block, can be obtained as follows: According to the feature information of the data block obtained by splitting the integrated large file, querying in the metadata information base Whether the same feature information has been stored, if any, indicating that the data block has been stored in the record file corresponding to the metadata information base, and then the data block is determined to be a duplicate block; otherwise, the record file is not stored. The data is chunked, and the data is determined to be chunked into new chunks. The manner in which new blocks and duplicate blocks are judged may also depend on other prior art, and will not be described herein.
  • Step 107 Add metadata information of the determined new block to the metadata information base, and add data of the new block to the record file, and update the number of times of repeated block reference in the metadata information base.
  • the metadata information of the new block is added to the metadata information library, and the data of the new block is added to the record file;
  • the block can record the number of times it was referenced.
  • Step 109 Establish a correspondence between a data block address and a small file identifier of the small file that constitutes the read according to an address of the data block required to form the read small file in the record file.
  • the read small file that is, the N small files that are read in the foregoing for integration into a large file; wherein, in step 109, the embodiment of the present invention can be used in the following manner:
  • Step 1091 Store the obtained data in the address file in the record file into the index file.
  • the index file may be, but is not limited to, being named as an index file, and the index file is used to store the address information of each data block obtained by dividing the large files integrated by the N small files in the record file, therefore, All that is saved in the index file is the address that points to the corresponding block in the log file.
  • Step 1092 According to the address of the data block required to form the read small file in the index file, the correspondence between the data block address and the small file identifier that constitute the read small file is established.
  • the specific manner of establishing the correspondence between the data block address and the small file identifier of the small file to be read is the following manner, but is not limited to the following:
  • each link corresponds to a small file read.
  • the established link is respectively heavy. name.
  • the link established in this embodiment may be a hard link, so that only one copy of the different small files in the actual index file has only one copy of the physical space, but has multiple images. This saves disk space more efficiently.
  • step 109 in the embodiment of the present invention is merely illustrative, and is not limited thereto. According to the revelation of the manner provided by the embodiments of the present invention, other proposed manners are not described herein again.
  • the small file processing method provided by the embodiment of the present invention is directed to the process of deduplication of a large number of small files, and after the small files are integrated into one large file, the integrated large file is divided into blocks, and then the repeated data is searched. Such operations improve the efficiency of deduplication of small files.
  • an embodiment of the present invention further provides a small file processing method, which is different from the embodiment corresponding to FIG. 1 in that determining a duplicate block and a new block in the obtained data block may further include: 104. Compare the obtained data into blocks, and delete the same data block in the obtained data block to one copy;
  • step 104 the data blocks obtained by splitting the integrated large files are first compared with each other, the same data blocks in the N data blocks are determined, and the same data blocks are deleted. Thereby, the query efficiency of the duplicate data can be further improved.
  • the data blocks obtained by the splitting may be compared with each other before the step 105, or may be completed after the step 105.
  • the embodiment of the present invention takes the step 104 before the step 105 as an example. .
  • the embodiment of the present invention may further include:
  • Step 110 Receive a read request, where the read request includes a small file identifier to be read, and read a small file from the record file according to a correspondence between a data block address of the small file read and a small file identifier formed by the composition. Data block.
  • the small file processing method provided by the embodiment of the present invention, for the processing of deduplication of a large number of small files, after the small files are integrated into one large file, the integrated large file is divided into blocks, and then the repeated data query is performed.
  • the operations of deleting, deleting, etc. improve the efficiency of deduplication of small files, especially when performing repeated block queries, comparing the obtained blocks, and improving the query efficiency of the repeated blocks.
  • N is 5, that is, 5 small files, as shown in the first line of FIG. File2, file3, file4, and file5.
  • five small files are subjected to one-time block processing in units of small files, and a variable length block method is used, and five small files are divided into: A, B, A, 8 blocks of B, C, E, E, and D.
  • A is composed of filel
  • BA is composed of file2
  • BC is composed of file3
  • E is composed of file4
  • ED is composed of file5.
  • the new blocks E and D are written into the group with the highest similarity, and the number of references of A, B, and C is recorded.
  • Add the real data of the new block ED to the record file. Store the data block address of the small file before the integration into the index file, according to the data block address of the above five small files, that is, A is composed of filel, BA is composed of file2, BC is composed of file3, E is composed of file4, and ED is composed of file5.
  • the address information of A in the log file, the address information of B and A in the log file, the address information of B and C in the log file, the address information of E in the log file, the address of E and D in the log file Information records are stored in the header of an index file.
  • a unified hard link is established, so that N hard links are made from the index file, and the correspondence between each link and the identifier of the small file is respectively N links are renamed separately.
  • an embodiment of the present invention performs the operations of blocking, repeating block query, and deleting multiple small files as a whole, speeding up the small file deduplication rate and reducing the occupation of disk space.
  • a small file processing apparatus including:
  • the reading unit 41 is configured to read N small files, where the small file is a small file smaller than a preset size;
  • the splitting unit 42 is configured to integrate the read N small files into one large file, and perform data partitioning on the integrated large file;
  • a determining unit 43 configured to determine a duplicate block and a new block in the obtained data block according to the preset data block metadata information base;
  • the processing unit 44 adds the metadata information of the determined new block to the metadata information library, and adds the data of the new block to the record file, and updates the reference of the duplicate block in the metadata information library. Number of times
  • the device in the embodiment of the present invention corresponds to the features of the method embodiment corresponding to FIG. 1.
  • the specific block process reference may be made to the description in the corresponding embodiment of FIG.
  • FIG. 6 is a schematic diagram of another small file processing apparatus, where the splitting unit 42 may include: an integrating unit 420, configured to integrate the read small file into one large file;
  • the first determining unit 421 is configured to determine whether the end position of the sliding window is the tail of any small file, and if yes, send the determination result to the split processing unit; if not, send the determination result to the second Judging unit
  • the second determining unit 422 is configured to determine whether the data currently covered by the sliding window meets the data blocking condition, and if yes, send the determination result to the split processing unit, if not, move the sliding window by one byte, and then return to execute
  • the first determining unit functions to continue to block the integrated large file by using a sliding window until the data partitioning of the integrated large file is completed;
  • the split processing unit 423 is configured to: when it is determined that the end position of the sliding window is the tail of any small file or the data currently covered by the sliding window meets the data blocking condition, the end position of the previous block will be After the data between the end position of the current sliding window is divided into one data, and the sliding window is moved by one byte, the function of the first determining unit is returned to continue to use the sliding window to perform the integrated large file. Blocking until the data chunking of the integrated large file is completed.
  • the small file processing apparatus integrates small files into one large file for the processing of deduplication of a large number of small files, and then blocks the integrated large files and then sits on the repeated data search. Such operations effectively provide deduplication efficiency for small files.
  • an embodiment of the present invention further provides another small file processing apparatus, and the structure of the apparatus in the embodiment corresponding to FIG. 6 is substantially the same, and the same parts are not described herein. the difference lies in, Also includes:
  • the mapping unit 55 is configured to establish, according to the address of the data block required to form each small file read in the record file, a data block address and a file identifier of each d, the file that constitutes the reading. Correspondence between them.
  • the mapping unit 55 may include:
  • the indexing unit 551 is configured to store address information of the at least N data blocks in the record file, and the mapping subunit 552 is configured to record the file according to the data block required to form each of the read small files in the index file.
  • the address in the medium establishes a correspondence between the data block address and the small file identifier of each small file constituting the read.
  • the mapping sub-unit 552 may be specifically configured to establish a link according to the address of the different data block of each of the read small files in the record file, thereby obtaining N links and each link corresponding to a unified Small files, rename the N links according to the identifier of the small file corresponding to each link.
  • the request processing unit 56 is configured to receive a request for reading at least one small file of the N small files, where the read request includes a small file identifier to be read, according to the data block address and the small file identifier that constitute the unified small file Correspondence, read the data blocks that make up the small file from the log file.
  • the integrated large file is divided into blocks, and then repeated data search operations are performed to improve the operation.
  • the deduplication efficiency of small files is improved.
  • the aforementioned program can be stored in a computer readable storage medium.
  • the program when executed, performs the steps including the foregoing method embodiments; and the foregoing storage medium includes: a medium that can store program codes, such as a ROM, a RAM, a magnetic disk, or an optical disk.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明所提供的小文件处理方法,针对海量小文件的重复数据删除的处理,将小文件整合为一个大文件后,对整合后的大文件整体进行分块后,在分块的过程中,如果当前正在划分的数据块中,包括了任一个小文件的尾部时,需要以这个小文件的尾部作为当前数据分块的结束位置,对整合后的大文件分块完成后再作重复数据查找等操作,提高了小文件的重复数据删除效率。

Description

小文件处理方法及装置 本申请要求于 2012 年 06 月 28 日提交中国专利局、 申请号为 201210217046.X、发明名称为 "小文件处理方法及装置" 的中国专利申请的优 先权, 其全部内容通过引用结合在本申请中。
技术领域
本发明涉及文件处理技术, 尤其涉及小文件处理方法及装置。
背景技术 重复数据删除技术是存储系统中的一种新型应用。通过删除存储系统中重 复的数据, 只保留其中的一份, 从而消除冗余数据。 重删文件需要对文件进行 分块、 相似性分析、 查询重复块等操作, 那么, 在对一个小文件进行重删时, 都会耗费很多时间在消除小块冗余数据上, 不仅耗时, 而且占用系统资源。
现有技术中,在重删过程中,在对大量小文件的处理,通常釆用如下方式: 将多个小文件按照一定方式合并为一个大文件,这个大文件头中记录小文件信 息, 用于大量小文件的存放与读取。
由于上述方法只是将小文件整合在一个大文件中,不对大文件进行重复数 据删除, 增加文件头记录小文件信息, 增加了小文件的空间占用, 对大文件的 存放与读取操作速度较慢; 而且只是减少了小文件的占用空间,对大于最小读 写块的小文件没有作用。
发明内容 本发明实施例提供小文件处理方法,应用在重复数据删除操作中, 能够加 快大量小文件重复数据删除速度、 减少大量小文件占用空间。 本发明实施例所提供的一种小文件处理方法, 包括:
读取 N个小文件, 其中, 所述小文件为小于预置大小的小文件;
将所述读取的 N个小文件整合为一个大文件, 利用滑动窗口对所述整合后 的大文件进行分块;所述利用滑动窗口对所述整合后的大文件进行分块,包括: 判断所述滑动窗口的结束位置是否是所述任一小文件的尾部,如果是, 则 将从上一个分块的结束位置到当前滑动窗口的结束位置之间的数据作为一个 数据分块;如果否,则判断滑动窗口当前覆盖的数据,是否满足数据分块条件; 如果满足所述分块条件,则将从上一个分块的结束位置到当前滑动窗口的 结束位置之间的数据作为一个数据分块; 如果不满足所述分块条件, 则将所述 滑动窗口移动一个字节, 继续利用滑动窗口对所述整合后的大文件进行分块, 直到完成对所述整合后大文件的数据分块;
根据预先设置的数据块元据数信息库,在得到的数据分块中确定重复块和 新块; 将确定得到的新块的元数据信息添加到所述的元数据信息库中,并将新块 的数据添加到记录文件中, 在所述元数据信息库中更新重复块的引用次数。
本发明实施例还提供一种小文件处理装置, 包括:
读取单元, 用于读取 N个小文件, 其中, 所述小文件为小于预置大小的小 文件;
拆分单元, 用于将所述读取的 N个小文件整合为一个大文件, 对整合后的 大文件进行数据分块;
确定单元, 用于根据预先设置的数据块元数据信息库,在得到的数据分块 中确定重复块和新块;
处理单元, 将确定得到的新块的元数据信息添加到所述的元数据信息库 中, 并将新块的数据添加到记录文件中,在所述元数据信息库中更新重复块的 引用次数;
其中, 所述拆分单元, 包括:
整合单元, 用于将所述读取的小文件整合为一个大文件;
第一判断单元,用于判断所述滑动窗口的结束位置是否是所述任一小文件 的尾部, 如果是, 将判断结果发送给拆分处理单元; 如果否, 将判断结果发送 给第二判断单元;
第二判断单元, 用于判断滑动窗口当前覆盖的数据,是否满足数据分块条 件, 如果是, 将判断结果发送给拆分处理单元, 如果否, 将滑动窗口移动一个 字节后,返回执行所述第一判断单元功能以继续利用滑动窗口对所述整合后的 大文件进行分块, 直到完成对所述整合后大文件的数据分块;
拆分处理单元,用于当判断所述滑动窗口的结束位置是所述任一小文件的 尾部或者判断滑动窗口当前覆盖的数据满足数据分块条件时,将从上一个分块 的结束位置到当前滑动窗口的结束位置之间的数据作为一个数据分块,并将滑 动窗口移动一个字节后,返回执行所述第一判断单元功能以继续利用滑动窗口 对所述整合后的大文件进行分块, 直到完成对所述整合后大文件的数据分块。
本发明实施例提供小文件处理方法及装置,可针对海量小文件的重复数据 删除的处理,将小文件整合为一个大文件后,对整合后的大文件整体进行数据 分块后, 再作重复数据查找等操作, 提高了小文件的重复数据删除效率; 减少 磁盘空间的占用。
附图说明
图 1为本发明实施例提供的一种小文件处理方法的流程图;
图 2为本发明实施例提供的一种利用滑动窗口对整合得到的大文件进行分 块的流程图;
图 3为本发明实施例提供的另一种小文件处理方法的流程图;
图 4为本发明实施例所提供的小文件处理方法的应用示意图;
图 5为本发明实施例所提供的一种小文件处理装置的结构示意图; 图 6为本发明实施例提供的另一种小文件处理装置的结构示意图; 图 7为本发明实施例提供的另一种小文件处理装置的结构示意图。
具体实施方式
图 1为本发明实施例一提供的小文件处理方法流程图,如图 1所示, 该方法 包括:
步骤 101、 读取 N个小文件, 其中小文件为小于 MkB的文件。
步骤 101的动作可以由重删管理进程 ( Management, MGT )来执行, 可以 釆用的方式为: MGT读取磁盘的同一目录下的 N个文件, 这样做的优点在于读 取速度快并且管理方便。 而 M是一个可以根据需要人为定义的一个数值。 N表 示小文件的个数, 显然, N可以是大于 0的自然数。
步骤 103、 将 N个小文件整合为一个大文件, 利用滑动窗口对所述整合后 的大文件进行分块;
其中, 将所述读取的 N个小文件逻辑组合成一个大文件, 也就是将 N个小 文件看出是逻辑组合成大文件的 N部分, 而这 N个小文件物理上分散的, 只是 在虚拟上看成一个文件, 同时每个小文件的末尾是已知的。 显然, 整合后的大 文件也就是对小文件整合后得到的大文件。 其中, 参见图 2, 利用滑动窗口对所述整合后的大文件进行分块, 包括: 步骤 1031 , 判断所述滑动窗口的结束位置是否是所述任一小文件的尾部, 如果是, 则进入步骤 1034; 如果否, 则进入步骤 1033;
步骤 1033, 判断滑动窗口当前覆盖的数据, 是否满足数据分块条件; 如果 满足所述分块条件, 则进入步骤 1034; 如果不满足所述分块条件, 则进入步骤 1035;
步骤 1034,将从上一个分块的结束位置到当前滑动窗口的结束位置之间的 数据作为一个数据分块, 并进入步骤 1035;
步骤 1035, 将所述滑动窗口移动一个字节,返回步骤 1031继续利用滑动窗 口对所述整合后的大文件进行分块, 直到完成对所述整合后大文件的数据分 块。
其中, 所述的将滑动窗口移动一个字节,是向数据的尾部方向滑动一个字 节;所述的满足数据分块条件,包括对滑动窗口所覆盖的数据进行哈希值运算, 判断哈希值是否满足进行分块的条件, 或者是,通过判断滑动窗口所滑动的数 据长度是否满足分块条件等等, 方法很多, 在此不再赘述。 显然, 所述的满足 数据分块的条件中,不再包括判断所述滑动窗口的结束位置是否是所述任一小 文件的尾部,判断是否将从上一个分块的结束位置到当前滑动窗口的结束位置 之间的数据作为一个数据分块的情况。
本发明实施例中,对整合后的大文件进行数据分块,得到多个分块,其中, 在分块的过程中, 如果当前正在划分的数据块中, 包括了任一个小文件的尾部 时, 需要以这个小文件的尾部作为当前数据分块的结束位置, 以使可以对得到 的数据分块通过组合后得到完整的小文件; 例如, 对两个小文件 filel和 file2整 合为的一个大文件进行数据分块, 得到分块 A, B, A三个数据分块, 其中 filel 被划分为第一个数据分块 A, file2被划分为第二个数据分块 B和第三个数据分 块 A, A组成 filel , BA组成 file2。 不做限定, 分块的主要目的在于后续找到文件中相同的块。对于每个分块的大 小有上限和下限, 也即最大分块和最小分块。 其中, 最大分块为 MkB, 也即 不超过一个小文件的大小。分块可以是等长的也可以是不等长的, 此处不做限 定。 步骤 105、 根据预先设置的数据分块元数据信息库, 在得到的数据分块中 确定重复块和新块;
本发明实施例所述的重复块, 指对大文件进行拆分得到的某一个数据块, 判断预先设置的数据分块元数据信息库中的元数据信息,是否已经包含有该数 据分块的元数据信息, 若是, 则判断得到在记录文件(存储真实有效地数据) 中, 已经包含了该数据块的信息, 那么, 该数据块就被认为是重复块; 反之, 则判断得到记录文件中没有包含该数据块的信息, 则该数据块为新块。
其中, 对拆分得到的数据分块, 如何判断是新块还是重复块, 可通过如下 方式: 根据将整合后大文件进行拆分得到的数据分块的特征信息,在元数据信 息库中查询是否已经存储有相同的特征信息,如果有,说明与元数据信息库对 应的记录文件中已经存储了该数据分块, 则确定该数据分块为重复块; 反之, 则说明记录文件中没有存储该数据分块, 则确定该数据分块为新块。新块和重 复块的判断方式, 还可以依赖其他现有技术, 在此不再赘述。
步骤 107、将确定得到的新块的元数据信息添加到所述的元数据信息库中, 并将新块的数据添加到记录文件中,在所述元数据信息库中更新重复块的引用 次数。
本发明实施例中, 当判断得到 N个数据块中的新块后, 将新块的元数据信 息添加到元数据信息库中, 并将新块的数据添加到记录文件中; 另外, 对重复 块可以记录被引用的次数。 对新块和重复块的处理方式, 类似现有技术, 在此 不再赘述。
本发明实施例还可以包括:
步骤 109、根据组成所述读取的小文件所需的数据块在记录文件中的地址, 建立组成所述读取的小文件的数据块地址和小文件标识之间的对应关系。
这里, 所述读取的小文件, 也就是前面所读取的用于整合为大文件的 N个 小文件; 其中, 步骤 109 , 本发明实施例可以通过以下方式:
步骤 1091:将所述得到的数据分块在记录文件中的地址信息存储到索引文 件中。
其中, 索引文件可以但不限于被命名为索引文件, 该索引文件是用来保存 N个小文件整合后的大文件进行划分后得到的每个数据分块在记录文件中的 地址信息, 因此, 索引文件中保存的都是指向记录文件中相应块的地址。 步骤 1092、根据索引文件中组成所述读取的小文件所需的数据块在记录文 件中的地址,建立组成所读取的小文件的数据块地址和小文件标识之间的对应 关系。
建立组成所读取的小文件的数据块地址和小文件标识之间的对应关系的 具体方式, 本发明实施例釆用以下方式但并不限于此:
根据整合前一个小文件的不同数据块在记录文件中的地址, 建立一个链 接, 每个链接对应一个所读取的小文件, 按照每个链接对应的小文件的标识, 将建立的链接分别重命名。
本实施例中建立的链接, 可以是硬链接,使得实际存在的索引文件中的不 同小文件只有一份, 占用的物理空间也只有一份, 但是却具有多个镜像。 这样 可以更为有效地节约磁盘空间。
本发明实施例对步骤 109的实现方式, 仅举例说明, 并不限于此。 根据本 发明实施例所提供的方式的启示, 所提出的其他方式在此不再赘述。
本发明实施例所提供的小文件处理方法,针对海量小文件的重复数据删除 的处理, 将小文件整合为一个大文件后, 对整合后的大文件整体进行分块后, 再作重复数据查找等操作, 提高了小文件的重复数据删除效率。 参见附图 3 , 本发明实施例还提供一种小文件处理方法, 和附图 1对应的实 施例不同之处在于, 在得到的数据分块中确定重复块和新块, 还可以包括: 步骤 104、 将得到的数据分块进行相互比较, 将得到的数据分块中相同的 数据块删除至一份;
本实施例中,通过步骤 104 ,对整合后的大文件进行拆分得到的数据分块, 先进行相互比较, 确定 N个数据分块中的相同的数据块, 并将相同的数据块删 除。 由此, 可以进一步提高重复数据的查询效率。 当然, 将拆分得到的数据块 进行相互之间的比较, 可以在步骤 105之前完成, 也可以在步骤 105之后完成, 本发明实施例为了提高查询效率, 以在步骤 105之前完成步骤 104为例。
另外, 本发明实施例在步骤 109之后, 还可以包括:
步骤 110, 接收读请求, 读请求中包括欲读取的小文件标识, 根据组成所读 取的小文件的数据块地址和小文件标识之间的对应关系,从记录文件中读取组 成小文件的数据块。 本发明实施例所提供的小文件处理方法, 针对海量小文件的重复数据删除 的处理, 将小文件整合为一个大文件后, 对整合后的大文件整体进行分块后, 再作重复数据查询、 删除等操作, 提高了小文件的重复数据删除效率, 尤其是 在进行重复块查询时,在所得的分块之间进行比较,提高了重复块的查询效率。
下面结合一个实例对本发明提供的文件重删的方法进行说明, 如图 4所示 的方法示意图, 4叚设 N为 5 , 也即 5个小文件, 如图 5第一行所示的 filel、 file2、 file3、 file4以及 file5。本实施例中以每个小文件为单位对 5个小文件进行了一次 性的分块处理, 釆用的是变长分块的方法, 将 5个小文件分成为: A、 B、 A、 B、 C、 E、 E、 D这 8个分块。 其中, A组成 filel , BA组成 file2, BC组成 file3 , E组成 file4, ED组成 file5。 釆用随机方式对上述几个分块进行釆样, 得到釆样 分块 A、 B、 C、 E、 D, 根据釆样分块的元数据信息对釆样分块与预置的数据 分块元数据信息库中已知的数据块元数据信息分组进行相似性分析,得到相似 度最高的分组: groupi。 对上述 8个分块与相似度最高的分组之间进行重复块、 新块的查询。 得到重复块为 A、 B和 C, 新块为 £和0。 将新块 E和 D写入相似度 最高的分组中, 并记录 A、 B、 C的引用次数。 将新块 ED的真实数据添加到记 录文件中。将组成整合前小文件的数据块地址存放到索引文件中,按照组成上 述 5个小文件的数据块地址, 也即 A组成 filel , BA组成 file2, BC组成 file3 , E 组成 file4, ED组成 file5, 将 A在记录文件中的地址信息、 B和 A在记录文件中的 地址信息、 B和 C在记录文件中的地址信息, E在记录文件中的地址信息、 E和 D在记录文件中的地址信息记录存放在一个索引文件的文件头当中。 根据整合 前一个小文件不同数据块在记录文件中的地址, 建立一个统一硬链接,从而从 索引文件中做 N个硬链接, 分别按照每个链接和小文件的标识之间的对应关 系, 将 N个链接分别重命名。 用户读取小文件时, 由读写驱动读出相应的文件 数据即可。
本发明实施例提供的方案,将多个小文件作为一个整体进行分块、重复块 查询、 删除等动作, 加快了小文件重删速率的同时, 减少磁盘空间的占用。 参见图 5, 本发明实施例还提供一种小文件处理装置, 包括:
读取单元 41 , 用于读取 N个小文件, 其中, 所述小文件为小于预置大小小 文件; 拆分单元 42, 用于将所述读取的 N个小文件整合为一个大文件, 对整合后 的大文件进行数据分块;
确定单元 43 , 用于根据预先设置的数据块元数据信息库, 在得到的数据分 块中确定重复块和新块;
处理单元 44,将确定得到的新块的元数据信息添加到所述的元数据信息库 中, 并将新块的数据添加到记录文件中,在所述元数据信息库中更新重复块的 引用次数;
本发明实施例中的装置和图 1对应的方法实施例的特征相对应, 具体分块 过程可参见附图 1对应的实施例中的描述。
参见图 6为另一种小文件处理装置的示意图, 其中,拆分单元 42可以包括: 整合单元 420, 用于将所述读取小文件整合为一个大文件;
第一判断单元 421 , 用于判断所述滑动窗口的结束位置是否是所述任一小 文件的尾部, 如果是, 将判断结果发送给拆分处理单元; 如果否, 将判断结果 发送给第二判断单元;
第二判断单元 422 , 用于判断滑动窗口当前覆盖的数据, 是否满足数据分 块条件, 如果是, 将判断结果发送给拆分处理单元, 如果否, 将滑动窗口移动 一个字节后,返回执行所述第一判断单元功能以继续利用滑动窗口对所述整合 后的大文件进行分块, 直到完成对所述整合后大文件的数据分块;
拆分处理单元 423 , 用于当判断所述滑动窗口的结束位置是所述任一小文 件的尾部或者判断滑动窗口当前覆盖的数据满足数据分块条件时,将从上一个 分块的结束位置到当前滑动窗口的结束位置之间的数据作为一个数据分块,并 将滑动窗口移动一个字节后,返回执行所述第一判断单元功能以继续利用滑动 窗口对所述整合后的大文件进行分块,直到完成对所述整合后大文件的数据分 块。
本发明实施例所提供的小文件处理装置,针对海量小文件的重复数据删除 的处理, 将小文件整合为一个大文件后, 对整合后的大文件整体进行分块后, 再坐重复数据查找等操作, 有效提供了小文件的重复数据删除效率。 参见图 7 , 本发明实施例还提供另一种小文件处理装置, 其结构和图 6对应 的实施例中装置的结构大致相同, 与之相同的部分不再赘述。 不同之处在于, 还包括:
映射单元 55 ,用于根据组成所述读取的每个小文件所需的数据块在记录文 件中的地址 ,建立组成所述读取的每个 d、文件的数据块地址和 d、文件标识之间 的对应关系。
其中, 映射单元 55 , 可以包括:
索引单元 551 , 用于存储至少 N个数据分块在记录文件中的地址信息; 映射子单元 552 , 用于根据索引文件中组成所述读取的每个小文件所需的 数据块在记录文件中的地址,建立组成所述读取的每个小文件的数据块地址和 小文件标识之间的对应关系。
其中, 映射子单元 552 , 可具体用于根据所述读取的每个一个小文件的不 同数据块在记录文件中的地址, 建立一个的链接, 从而得到 N个链接且每个链 接对应一个统一的小文件, 按照每个链接对应的小文件的标识, 将 N个链接分 别重命名。
本发明实施例所提供的小文件处理装置, 还可以包括:
请求处理单元 56, 用于接收读取 N个小文件中至少一个小文件的请求, 读 取请求中包括欲读取的小文件标识,根据组成统一小文件的数据块地址和小文 件标识之间的对应关系, 从记录文件中读取组成小文件的数据块。
利用本发明实施例所提供的小文件处理方法和装置,对读取的小文件整合 为一个大文件后,对整合后的大文件进行整体进行分块后,再进行重复数据查 找等操作, 提高了小文件的重复数据删除效率。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤 可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取 存储介质中。 该程序在执行时, 执行包括上述各方法实施例的步骤; 而前述的 存储介质包括: ROM, RAM,磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是: 以上各实施例仅用以说明本发明的技术方案, 而非对其 限制; 尽管参照前述各实施例对本发明进行了详细的说明, 本领域的普通技术 人员应当理解: 其依然可以对前述各实施例所记载的技术方案进行修改, 或者 对其中部分或者全部技术特征进行等同替换; 而这些修改或者替换, 并不使相 应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

权 利 要 求
1、 一种小文件处理方法, 其特征在于:
读取 N个小文件, 其中, 所述小文件为小于预置大小的小文件;
将所述读取的 N个小文件整合为一个大文件, 利用滑动窗口对所述整合后 的大文件进行分块;所述利用滑动窗口对所述整合后的大文件进行分块,包括: 判断所述滑动窗口的结束位置是否是所述任一小文件的尾部,如果是, 则 将从上一个分块的结束位置到当前滑动窗口的结束位置之间的数据作为一个 数据分块;如果否,则判断滑动窗口当前覆盖的数据,是否满足数据分块条件; 如果满足所述分块条件,则将从上一个分块的结束位置到当前滑动窗口的 结束位置之间的数据作为一个数据分块; 如果不满足所述分块条件, 则将所述 滑动窗口移动一个字节, 继续利用滑动窗口对所述整合后的大文件进行分块, 直到完成对所述整合后大文件的数据分块;
根据预先设置的数据块元据数信息库 ,在得到的数据分块中确定重复块和 新块;
将确定得到的新块的元数据信息添加到所述的元数据信息库中,并将新块 的数据添加到记录文件中, 在所述元数据信息库中更新重复块的引用次数。
2、 根据权利要求 1所述的方法, 其特征在于, 还包括:
根据组成所述读取的每个小文件所需的数据块在所述记录文件中的地址, 建立组成所述读取的每个小文件的数据块地址和小文件标识之间的对应关系。
3、 根据权利要求 2所述的方法, 其特征在于, 所述根据组成所述读取的每 个小文件所需的数据块在记录文件中的地址,建立组成所述读取的每个小文件 的数据块地址和小文件标识之间的对应关系, 包括:
将所述得到的数据分块在记录文件中的地址信息存储到索引文件中; 根据索引文件中组成所述读取的小文件所需的数据块在所述记录文件中 的地址,建立组成所述读取的小文件的数据块地址和小文件标识之间的对应关 系。
4、 根据权利要求 2所述的方法, 其特征在于, 所述根据组成所述读取的每 个小文件所需的数据块在记录文件中的地址,建立组成所述读取的每个小文件 的数据块地址和小文件标识之间的对应关系, 包括:
根据组成所述读取的一个小文件的所有数据块在记录文件中的地址,建立 一个链接,每个链接对应一个所述读取的小文件,按照每个链接对应的小文件 的标识, 将建立的链接分别重命名。
5、 根据权利要求 1-4任一所述的方法, 其特征在于, 所述根据预先设置的 数据块元数据信息库, 在得到的数据分块中确定重复块和新块, 之前还包括: 将得到的数据分块, 进行相互比较,将得到的数据分块中相同的数据块删除至 一份。
6、 根据权利要求 1-4任一所述的方法, 其特征在于, 所述读取的 N个小文 件为存储器中同一目录下的 N个小文件。
7、 根据权利要求 2所述的方法, 其特征在于, 还包括:
接收读请求, 所述读请求中包括欲读取的小文件标识,根据组成所述读取 的小文件的数据块地址和小文件标识之间的所述对应关系 ,从记录文件中读取 组成小文件的数据块。
8、 一种小文件处理装置, 其特征在于, 包括:
读取单元, 用于读取 N个小文件, 其中, 所述小文件为小于预置大小的小 文件;
拆分单元, 用于将所述读取的 N个小文件整合为一个大文件, 对整合后的 大文件进行数据分块;
确定单元, 用于根据预先设置的数据块元数据信息库,在得到的数据分块 中确定重复块和新块;
处理单元, 将确定得到的新块的元数据信息添加到所述的元数据信息库 中, 并将新块的数据添加到记录文件中,在所述元数据信息库中更新重复块的 引用次数;
其中, 所述拆分单元, 包括:
整合单元, 用于将所述读取的小文件整合为一个大文件;
第一判断单元,用于判断所述滑动窗口的结束位置是否是所述任一小文件 的尾部, 如果是, 将判断结果发送给拆分处理单元; 如果否, 将判断结果发送 给第二判断单元;
第二判断单元, 用于判断滑动窗口当前覆盖的数据,是否满足数据分块条 件, 如果是, 将判断结果发送给拆分处理单元, 如果否, 将滑动窗口移动一个 字节后,返回执行所述第一判断单元功能以继续利用滑动窗口对所述整合后的 大文件进行分块, 直到完成对所述整合后大文件的数据分块;
拆分处理单元,用于当判断所述滑动窗口的结束位置是所述任一小文件的 尾部或者判断滑动窗口当前覆盖的数据满足数据分块条件时,将从上一个分块 的结束位置到当前滑动窗口的结束位置之间的数据作为一个数据分块,并将滑 动窗口移动一个字节后,返回执行所述第一判断单元功能以继续利用滑动窗口 对所述整合后的大文件进行分块, 直到完成对所述整合后大文件的数据分块。
9、 根据权利要求 8所述的装置, 其特征在于, 还包括:
映射单元,用于根据组成所述读取的每个小文件所需的数据块在所述记录 文件中的地址,建立组成所述读取的每个小文件的数据块地址和小文件标识之 间的对应关系。
10、 根据权利要求 9所述的装置, 其特征在于, 还包括:
请求处理单元, 用于接收读取所述 N个小文件中至少一个小文件的请求, 读取请求中包括欲读取的小文件标识,根据组成统一小文件的数据块地址和小 文件标识之间的对应关系, 从所述记录文件中读取组成小文件的数据块。
11、 根据权利要求 9所述的装置, 其特征在于, 所述映射单元, 包括: 索引单元,用于存储所述拆分得到的数据分块在所述记录文件中的地址信 息;
映射子单元,用于根据索引文件中组成所读取的小文件所需的数据块在所述记 录文件中的地址,建立组成所读取的小文件的数据块地址和小文件标识之间的 对应关系。
PCT/CN2013/072039 2012-06-28 2013-03-01 小文件处理方法及装置 WO2014000458A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201210217046.X 2012-06-28
CN201210217046.XA CN103514210B (zh) 2012-06-28 2012-06-28 小文件处理方法及装置

Publications (1)

Publication Number Publication Date
WO2014000458A1 true WO2014000458A1 (zh) 2014-01-03

Family

ID=49782176

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2013/072039 WO2014000458A1 (zh) 2012-06-28 2013-03-01 小文件处理方法及装置

Country Status (2)

Country Link
CN (1) CN103514210B (zh)
WO (1) WO2014000458A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104765876A (zh) * 2015-04-24 2015-07-08 中国人民解放军信息工程大学 海量gnss小文件云存储方法
CN111125034A (zh) * 2019-12-27 2020-05-08 深信服科技股份有限公司 一种聚合对象数据处理方法、系统及相关设备

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104965845B (zh) * 2014-12-30 2017-04-12 浙江大华技术股份有限公司 一种小文件的定位方法及系统
CN106911743B (zh) * 2015-12-23 2019-03-26 中兴通讯股份有限公司 小文件的写聚合、读聚合方法及系统和客户端
CN106021537A (zh) * 2016-05-27 2016-10-12 成都索贝数码科技股份有限公司 一种基于fics对象存储的数据剔除方法与系统
CN106960055B (zh) * 2017-04-01 2020-08-04 广东浪潮大数据研究有限公司 一种文件删除方法及装置
CN107341227B (zh) * 2017-07-01 2020-12-25 中国科学院计算机网络信息中心 文件处理方法、服务器及计算机可读存储介质
CN107357921A (zh) * 2017-07-21 2017-11-17 北京奇艺世纪科技有限公司 一种小文件存储定位方法及系统
CN107506447A (zh) * 2017-08-25 2017-12-22 郑州云海信息技术有限公司 一种基于本地文件系统的小文件读写方法及系统
CN107807989B (zh) * 2017-11-03 2020-03-24 绿湾网络科技有限公司 小文件处理方法及装置
CN109947721B (zh) * 2017-12-01 2021-08-17 北京安天网络安全技术有限公司 一种小文件处理方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070208786A1 (en) * 2006-03-03 2007-09-06 Samsung Electronics Co., Ltd. Method and apparatus for updating software
CN101706825A (zh) * 2009-12-10 2010-05-12 华中科技大学 一种基于文件内容类型的重复数据删除方法
CN101968796A (zh) * 2010-09-09 2011-02-09 北京邮电大学 一种双向并发执行的文件级可变长数据分块方法
US20110320493A1 (en) * 2006-01-20 2011-12-29 Thales Method and device for retrieving data and transforming same into qualitative data of a text-based document
CN102467571A (zh) * 2010-11-17 2012-05-23 英业达股份有限公司 重复数据删除的数据区块切分方法与新增方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2896603B1 (fr) * 2006-01-20 2008-05-02 Thales Sa Procede et dispositif pour extraire des informations et les transformer en donnees qualitatives d'un document textuel

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110320493A1 (en) * 2006-01-20 2011-12-29 Thales Method and device for retrieving data and transforming same into qualitative data of a text-based document
US20070208786A1 (en) * 2006-03-03 2007-09-06 Samsung Electronics Co., Ltd. Method and apparatus for updating software
CN101706825A (zh) * 2009-12-10 2010-05-12 华中科技大学 一种基于文件内容类型的重复数据删除方法
CN101968796A (zh) * 2010-09-09 2011-02-09 北京邮电大学 一种双向并发执行的文件级可变长数据分块方法
CN102467571A (zh) * 2010-11-17 2012-05-23 英业达股份有限公司 重复数据删除的数据区块切分方法与新增方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104765876A (zh) * 2015-04-24 2015-07-08 中国人民解放军信息工程大学 海量gnss小文件云存储方法
CN104765876B (zh) * 2015-04-24 2017-11-10 中国人民解放军信息工程大学 海量gnss小文件云存储方法
CN111125034A (zh) * 2019-12-27 2020-05-08 深信服科技股份有限公司 一种聚合对象数据处理方法、系统及相关设备

Also Published As

Publication number Publication date
CN103514210A (zh) 2014-01-15
CN103514210B (zh) 2017-06-27

Similar Documents

Publication Publication Date Title
WO2014000458A1 (zh) 小文件处理方法及装置
US10795578B2 (en) Deduplicating data based on boundary identification
US9043540B2 (en) Systems and methods for tracking block ownership
US9298726B1 (en) Techniques for using a bloom filter in a duplication operation
US9798728B2 (en) System performing data deduplication using a dense tree data structure
US9558073B2 (en) Incremental block level backup
US9047301B2 (en) Method for optimizing the memory usage and performance of data deduplication storage systems
CN102782643B (zh) 使用布隆过滤器的索引搜索
WO2013086969A1 (zh) 重复数据查找方法、装置及系统
WO2020186549A1 (zh) 一种元数据管理方法、系统及介质
CN108089816B (zh) 一种基于负载均衡的查询式重复数据删除方法及装置
CN103581331B (zh) 虚拟机在线迁移方法与系统
WO2014101000A1 (zh) 元数据管理方法及系统
JP6841024B2 (ja) データ処理装置,データ処理プログラムおよびデータ処理方法
WO2010099715A1 (zh) 数据操作方法、系统、客户端和数据服务器
CN106484820B (zh) 一种重命名方法、访问方法及装置
JP2015503777A (ja) ファイルクローンを利用したシングルインスタンス化方法及びそれを用いたファイルストレージ装置
WO2013163813A1 (zh) 重复数据删除方法及装置
US20180150485A1 (en) Multi-tiered data storage in a deduplication system
US12013814B2 (en) Managing snapshotting of a dataset using an ordered set of B+ trees
CN113535670B (zh) 一种虚拟化资源镜像存储系统及其实现方法
US20180107404A1 (en) Garbage collection system and process
CN106980680B (zh) 数据存储方法及存储设备
CN110908589A (zh) 数据文件的处理方法、装置、系统和存储介质
CN112685223A (zh) 基于文件类型的文件备份

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13810510

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 13810510

Country of ref document: EP

Kind code of ref document: A1