RU2015125830A - Способ (варианты) и система (варианты) управления данными, связанными с иерархической структурой - Google Patents

Способ (варианты) и система (варианты) управления данными, связанными с иерархической структурой Download PDF

Info

Publication number
RU2015125830A
RU2015125830A RU2015125830A RU2015125830A RU2015125830A RU 2015125830 A RU2015125830 A RU 2015125830A RU 2015125830 A RU2015125830 A RU 2015125830A RU 2015125830 A RU2015125830 A RU 2015125830A RU 2015125830 A RU2015125830 A RU 2015125830A
Authority
RU
Russia
Prior art keywords
path
hierarchical
file
identifier
elements
Prior art date
Application number
RU2015125830A
Other languages
English (en)
Other versions
RU2634223C2 (ru
Inventor
Михаил Владимирович Белов
Original Assignee
Общество С Ограниченной Ответственностью "Яндекс"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Общество С Ограниченной Ответственностью "Яндекс" filed Critical Общество С Ограниченной Ответственностью "Яндекс"
Priority to RU2015125830A priority Critical patent/RU2634223C2/ru
Priority to PCT/IB2015/058931 priority patent/WO2017001903A1/en
Priority to US15/531,451 priority patent/US10691649B2/en
Publication of RU2015125830A publication Critical patent/RU2015125830A/ru
Application granted granted Critical
Publication of RU2634223C2 publication Critical patent/RU2634223C2/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/185Hierarchical storage management [HSM] systems, e.g. file migration or policies thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • G06F16/137Hash-based

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Claims (63)

1. Исполняемый на компьютере способ хранения данных, связанных с путем и файлом, путь определяет связь между файлом и иерархической структурой данных, путь включает в себя последовательность элементов пути, и каждый из элементов пути определяет узел в иерархической структуре данных, способ выполняется процессором и включает в себя:
получение доступа к данным с постоянного машиночитаемого носителя;
по меньшей мере для одного из элементов пути, связанного с данными, сохранение в иерархической таблице, которая доступна на постоянном машиночитаемом носителе: иерархического идентификатора, связанного с отрезком пути, который ведет по меньшей мере к одному элементу пути в иерархической структуре данных; независимого идентификатора иерархической таблицы, который уникальным образом идентифицирует по меньшей мере один из элементов пути в иерархической таблице; и идентификатора родительского элемента в иерархической таблице, который связан с иерархическим идентификатором родительского элемента пути, от которого зависит по меньшей мере один элемент пути; и
по меньшей мере для одного из элементов пути и файла, связанного с данными, сохранение в файловой таблице, которая доступна на постоянном машиночитаемом носителе: независимого идентификатора файловой таблицы, который уникальным образом идентифицирует по меньшей мере один из элементов пути и файл в файловой таблице; и идентификатор родительского элемента в файловой таблице, который связан с независимым идентификатором файловой таблицы, относящегося к родительскому элементу пути, от которого зависит по меньшей мере один элемент пути и файл.
2. Способ по п. 1, в котором иерархический идентификатор создают путем применения хэш функции к отрезку пути.
3. Способ по п. 1, в котором отрезок пути является полным путем между корнем иерархической структуры данных и узлом, который определен по меньшей мере одним из элементов пути.
4. Способ по п. 1, в котором дополнительно выполняют по меньшей мере для одного из элементов пути и файла, связанного с данными, сохранение в файловой таблице, которая доступна на постоянном машиночитаемом носителе, независимого идентификатора родительского элемента файловой таблице, который связан с независимым идентификатором файловой таблицы, связанным с родительским элементом пути, от которого зависит по меньшей мере один элемент пути и файл.
5. Способ по п. 1, в котором по меньшей мере один из элементов пути представляет собой файл каталога.
6. Способ по п. 1, в котором иерархическая таблица и файловая таблица реализованы с помощью реляционной базы данных.
7. Способ по п. 4, в котором дополнительно выполняют по меньшей мере для одного из элементов пути и файла, связанного с данными, сохранение в файловой таблице, которая доступна на постоянном машиночитаемом носителе, текстового потока, который определяет имя, связанное по меньшей мере с одним из элементов пути и файлом.
8. Способ по п. 4, в котором идентификатор родительского элемента в файловой таблице создают на основе независимого идентификатора файловой таблицы, который связан с родительским элементом пути и имени, которое связано по меньшей мере с одним из элементов пути и файлом.
9. Способ по п. 5, в котором файл определяет лист в иерархической структуре и файл каталога определяет узел в иерархической структуре.
10. Исполняемый на компьютере способ извлечения данных, связанных с путем и файлом, путь определяет связь между файлом и иерархической структурой данных, путь включает в себя последовательность элементов пути, и каждый из элементов пути определяет узел в иерархической структуре данных, способ выполняется процессором и включает в себя:
получение доступа к иерархической таблице и файловой таблице с постоянного машиночитаемого носителя;
создание иерархического идентификатора на основе пути;
идентификация в иерархической таблице по меньшей мере одной записи, которая соответствует иерархическому идентификатору; и
идентификация в файловой таблице по меньшей мере одной записи, которая обладает идентификатором родительского элемента в файловой таблице, соответствующим идентификатору родительского элемента в иерархической таблице, который связан по меньшей мере с одной записью, соответствующей иерархическому идентификатору.
11. Способ по п. 10, в котором при создании иерархического идентификатора выполняют применение хэш функции к пути.
12. Способ по п. 10, в котором иерархическую таблицу структурируют следующим образом:
иерархический идентификатор связан с отрезком пути к одному из элементов пути в иерархической структуре данных;
независимый идентификатор иерархической таблицы уникальным образом идентифицирует один из элементов пути в иерархической таблице; и
идентификатор родительского элемента в иерархической таблице связан с иерархическим идентификатором родительского элемента пути, от которого зависит один из элементов пути.
13. Способ по п. 10, в котором файловую таблицу структурируют следующим образом:
независимый идентификатор файловой таблицы уникальным образом идентифицирует один из элементов пути и файл в файловой таблице; и
идентификатор родительского элемента в файловой таблице связан с независимым идентификатором файловой таблицы, который связан с родительским элементом пути, от которого зависит один из элементов пути и файл.
14. Исполняемый на компьютере способ обновления данных, связанных с путем и файлом, путь определяет связь между файлом и иерархической структурой данных, путь включает в себя последовательность элементов пути, и каждый из элементов пути
определяет узел в иерархической структуре данных, способ выполняется процессором и включает в себя:
определение модификации в последовательности элементов пути, модификация указывает на последовательность элементов пути до модификации и на последовательность элементов пути после модификации;
получение доступа на постоянном машиночитаемом носителе к иерархической таблице, которая содержит данные, относящиеся к пути, данные независимы от файловой таблицы, которая содержит данные, относящиеся к файлу;
создание первого иерархического идентификатора на основе последовательности элементов пути до модификации;
создание второго иерархического идентификатора на основе последовательности элементов пути после модификации;
идентификация в иерархической таблице по меньшей мере одной записи, которая соответствует первому иерархическому идентификатору; и
замена в иерархической таблице по меньшей мере одной записи на второй иерархический идентификатор.
15. Способ по п. 14, в котором обновление данных, связанных с путем и файлом выполняют без модификации содержимого файловой таблицы.
16. Способ по п. 14, в котором иерархическую таблицу структурируют следующим образом:
иерархический идентификатор связан с отрезком пути к одному из элементов пути в иерархической структуре данных;
независимый идентификатор иерархической таблицы уникальным образом идентифицирует один из элементов пути в иерархической таблице; и
идентификатор родительского элемента в иерархической таблице связан с иерархическим идентификатором родительского элемента пути, от которого зависит один из элементов пути.
17. Исполняемая на компьютере система хранения данных, связанных с путем и файлом, путь определяет связь между файлом и иерархической структурой данных, путь включает в себя последовательность элементов пути, и каждый из элементов пути определяет узел в иерархической структуре данных, система включает в себя:
постоянный машиночитаемый носитель;
процессор, выполненный с возможностью осуществлять:
получение доступа к данным с постоянного машиночитаемого носителя;
по меньшей мере для одного из элементов пути, связанного с данными, сохранение в иерархической таблице, которая доступна на постоянном машиночитаемом носителе: иерархического идентификатора, связанного с отрезком пути, который ведет по меньшей мере к одному элементу пути в иерархической структуре данных; независимого идентификатора иерархической таблицы, который уникальным образом идентифицирует по меньшей мере один из элементов пути в иерархической таблице; и идентификатора родительского элемента в иерархической таблице, который связан с иерархическим идентификатором родительского элемента пути, от которого зависит по меньшей мере один элемент пути; и
по меньшей мере для одного из элементов пути и файла, связанного с данными, сохранение в файловой таблице, которая доступна на постоянном машиночитаемом носителе, независимого идентификатора файловой таблицы, который уникальным образом идентифицирует по меньшей мере один из элементов пути и файл в файловой таблице; и идентификатора родительского элемента в файловой таблицы, который связан с независимым идентификатором файловой таблицы, относящегося к родительскому элементу пути, от которого зависит по меньшей мере один элемент пути и файл.
18. Система по п. 17, в которой процессор дополнительно выполнен с возможностью осуществлять по меньшей мере для одного из элементов пути и файла, связанного с данными, сохранение в файловой таблице, которая доступна на постоянном машиночитаемом носителе, независимого идентификатора родительского элемента в файловой таблице, который связан с независимым идентификатором
файловой таблицы, связанным с родительским элементом пути, от которого зависит по меньшей мере один элемент пути и файл.
19. Система по п. 18, в которой процессор дополнительно выполнен с возможностью осуществлять по меньшей мере для одного из элементов пути и файла, связанного с данными, сохранение в файловой таблице, которая доступна на постоянном машиночитаемом носителе, текстового потока, который определяет имя, связанное по меньшей мере с одним из элементов пути и файлом.
20. Исполняемая на компьютере система извлечения данных, связанных с путем и файлом, путь определяет связь между файлом и иерархической структурой данных, путь включает в себя последовательность элементов пути, и каждый из элементов пути определяет узел в иерархической структуре данных, система включает в себя:
постоянный машиночитаемый носитель;
процессор, выполненный с возможностью осуществлять:
получение доступа к иерархической таблице и файловой таблице с постоянного машиночитаемого носителя;
создание иерархического идентификатора на основе пути;
идентификацию в иерархической таблице по меньшей мере одной записи, которая соответствует иерархическому идентификатору; и
идентификацию в файловой таблице по меньшей мере одной записи, которая обладает идентификатором родительского элемента в файловой таблице, соответствующим идентификатору родительского элемента в иерархической таблице, который связан по меньшей мере с одной записью, соответствующей иерархическому идентификатору.
21. Исполняемая на компьютере система обновления данных, связанных с путем и файлом, путь определяет связь между файлом и иерархической структурой данных, путь включает в себя последовательность элементов пути, и каждый из элементов пути определяет узел в иерархической структуре данных, система включает в себя:
постоянный машиночитаемый носитель;
процессор, выполненный с возможностью осуществлять:
определение модификации в последовательности элементов пути, модификация указывает на последовательность элементов пути до модификации и на последовательность элементов пути после модификации;
получение доступа на постоянном машиночитаемом носителе к иерархической таблице, которая содержит данные, относящиеся к пути, данные независимы от файловой таблицы, которая содержит данные, относящиеся к файлу;
создание первого иерархического идентификатора на основе последовательности элементов пути до модификации;
создание второго иерархического идентификатора на основе последовательности элементов пути после модификации;
идентификацию в иерархической таблице по меньшей мере одной записи, которая соответствует первому иерархическому идентификатору; и
замену в иерархической таблице по меньшей мере одной записи на второй иерархический идентификатор.
RU2015125830A 2015-06-30 2015-06-30 Способ (варианты) и система (варианты) управления данными, связанными с иерархической структурой RU2634223C2 (ru)

Priority Applications (3)

Application Number Priority Date Filing Date Title
RU2015125830A RU2634223C2 (ru) 2015-06-30 2015-06-30 Способ (варианты) и система (варианты) управления данными, связанными с иерархической структурой
PCT/IB2015/058931 WO2017001903A1 (en) 2015-06-30 2015-11-18 Method and system for managing data associated with a hierarchical structure
US15/531,451 US10691649B2 (en) 2015-06-30 2015-11-18 Method and system for managing data associated with a hierarchical structure

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2015125830A RU2634223C2 (ru) 2015-06-30 2015-06-30 Способ (варианты) и система (варианты) управления данными, связанными с иерархической структурой

Publications (2)

Publication Number Publication Date
RU2015125830A true RU2015125830A (ru) 2017-01-10
RU2634223C2 RU2634223C2 (ru) 2017-10-24

Family

ID=57607932

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2015125830A RU2634223C2 (ru) 2015-06-30 2015-06-30 Способ (варианты) и система (варианты) управления данными, связанными с иерархической структурой

Country Status (3)

Country Link
US (1) US10691649B2 (ru)
RU (1) RU2634223C2 (ru)
WO (1) WO2017001903A1 (ru)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017151602A1 (en) * 2016-02-29 2017-09-08 Craxel, Inc. Efficient encrypted data management system and method
WO2021170228A1 (en) * 2020-02-26 2021-09-02 Huawei Technologies Co., Ltd. A device and a method for indexing snapshots of multiple file systems
CN113392068A (zh) * 2021-06-28 2021-09-14 上海商汤科技开发有限公司 数据处理方法、装置和系统
CN117891786B (zh) * 2024-03-15 2024-05-31 浙江研通信息科技有限公司 一种基于蒙特卡洛算法的档案路径挂接方法和系统

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5890147A (en) * 1997-03-07 1999-03-30 Microsoft Corporation Scope testing of documents in a search engine using document to folder mapping
US7366708B2 (en) 1999-02-18 2008-04-29 Oracle Corporation Mechanism to efficiently index structured data that provides hierarchical access in a relational database system
US6996658B2 (en) 2001-10-17 2006-02-07 Stargen Technologies, Inc. Multi-port system and method for routing a data element within an interconnection fabric
JP4154893B2 (ja) * 2002-01-23 2008-09-24 株式会社日立製作所 ネットワークストレージ仮想化方法
US6965903B1 (en) * 2002-05-07 2005-11-15 Oracle International Corporation Techniques for managing hierarchical data with link attributes in a relational database
US7191182B2 (en) 2002-07-20 2007-03-13 Microsoft Corporation Containment hierarchy in a database system
US20040220965A1 (en) 2003-04-30 2004-11-04 Michael Harville Indexed database structures and methods for searching path-enhanced multimedia
FR2860935B1 (fr) * 2003-10-09 2006-03-03 Canon Kk Procede et dispositif de traitement de donnees numeriques
US7925658B2 (en) 2004-09-17 2011-04-12 Actuate Corporation Methods and apparatus for mapping a hierarchical data structure to a flat data structure for use in generating a report
US7627547B2 (en) * 2004-11-29 2009-12-01 Oracle International Corporation Processing path-based database operations
US7478102B2 (en) * 2005-03-28 2009-01-13 Microsoft Corporation Mapping of a file system model to a database object
US8949455B2 (en) 2005-11-21 2015-02-03 Oracle International Corporation Path-caching mechanism to improve performance of path-related operations in a repository
US9229967B2 (en) * 2006-02-22 2016-01-05 Oracle International Corporation Efficient processing of path related operations on data organized hierarchically in an RDBMS
US7882071B2 (en) * 2006-08-18 2011-02-01 Isilon Systems, Inc. Systems and methods for a snapshot of data
US8117182B2 (en) * 2007-04-23 2012-02-14 International Business Machines Corporation Apparatus and method for optimizing descendant path evaluation in xpath/xquery
US9128954B2 (en) * 2007-05-09 2015-09-08 Illinois Institute Of Technology Hierarchical structured data organization system
IL187041A0 (en) 2007-10-30 2008-02-09 Sandisk Il Ltd Optimized hierarchical integrity protection for stored data
US9088591B2 (en) * 2008-04-28 2015-07-21 Vmware, Inc. Computer file system with path lookup tables
WO2009134772A2 (en) * 2008-04-29 2009-11-05 Maxiscale, Inc Peer-to-peer redundant file server system and methods
US10452716B2 (en) * 2008-06-07 2019-10-22 International Business Machines Corporation Optimizing complex path endpoint resolution

Also Published As

Publication number Publication date
RU2634223C2 (ru) 2017-10-24
US10691649B2 (en) 2020-06-23
US20170270138A1 (en) 2017-09-21
WO2017001903A1 (en) 2017-01-05

Similar Documents

Publication Publication Date Title
JP2017068861A5 (ru)
JP2017076417A5 (ru)
JP2019530068A5 (ru)
JP2014096164A5 (ru)
RU2015125830A (ru) Способ (варианты) и система (варианты) управления данными, связанными с иерархической структурой
CN107784026B (zh) 一种etl数据处理方法及装置
JP2016517051A5 (ru)
US9317518B2 (en) Data synchronization
JP2016189214A5 (ru)
JP2016531355A5 (ru)
JP2017530469A5 (ru)
BR112015023053A2 (pt) sistema para captura de conhecimento e descoberta
JP2016519810A5 (ru)
BR112016022388A8 (pt) Sistemas e métodos para otimizar suporte de várias versões em índices
JP2013517574A5 (ru)
WO2015195830A3 (en) Data query method and apparatus
JP2018503154A5 (ru)
US9619492B2 (en) Data migration
CN104346466B (zh) 数据库中添加新属性数据的方法和装置
JP2017518561A5 (ru)
JP2016534456A5 (ru)
JP2014526748A5 (ru)
US20150006587A1 (en) Two-phase construction of data graphs from disparate inputs
CN103902653A (zh) 一种构建数据仓库表血缘关系图的方法和装置
RU2018128787A (ru) Поисковые результаты для нативных приложений