RU2182360C2 - Способ обращения к данным, хранимым в компьютерной системе, способ архивирования данных и компьютерная система для осуществления способов - Google Patents

Способ обращения к данным, хранимым в компьютерной системе, способ архивирования данных и компьютерная система для осуществления способов Download PDF

Info

Publication number
RU2182360C2
RU2182360C2 RU97111812/09A RU97111812A RU2182360C2 RU 2182360 C2 RU2182360 C2 RU 2182360C2 RU 97111812/09 A RU97111812/09 A RU 97111812/09A RU 97111812 A RU97111812 A RU 97111812A RU 2182360 C2 RU2182360 C2 RU 2182360C2
Authority
RU
Russia
Prior art keywords
file
parts
accessed
archiving
computer system
Prior art date
Application number
RU97111812/09A
Other languages
English (en)
Other versions
RU97111812A (ru
Inventor
Питер Брайен МАЛЬКОЛЬМ
Original Assignee
Чейенн Эдванст Текнолоджи Лимитед
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Чейенн Эдванст Текнолоджи Лимитед filed Critical Чейенн Эдванст Текнолоджи Лимитед
Publication of RU97111812A publication Critical patent/RU97111812A/ru
Application granted granted Critical
Publication of RU2182360C2 publication Critical patent/RU2182360C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • G06F11/1451Management of the data involved in backup or backup restore by selection of backup contents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/80Database-specific techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users
    • Y10S707/99955Archiving or backup

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Debugging And Monitoring (AREA)
  • Memory System Of A Hierarchy Structure (AREA)
  • Photoreceptors In Electrophotography (AREA)
  • Time Recorders, Dirve Recorders, Access Control (AREA)

Abstract

Изобретение относится к организации иерархической памяти компьютерных файлов данных. Техническим результатом является автоматическое архивирование блоков данных, если к ним не было обращения в течение заданного промежутка времени. Система содержит память со случайным доступом, центральный процессор, средство массовой памяти, средство вторичной памяти, устройство для архивирования данных, средство для подачи команд, средство для идентификации частей файла в файле, средство для обращения к частям файла, средство для построения базы данных. Способы описывают функционирование указанной системы. 4 с. и 15 з.п. ф-лы, 8 ил., 3 табл.

Description

Настоящее изобретение относится к организации иерархической памяти компьютерных файлов данных.
Объем данных, хранимых на жестких дисках персональных компьютеров, работающих в качестве устройств массовой памяти, быстро увеличивался в течение последнего десятилетия. Это особенно верно для данных, хранимых на сетевых файл-серверах, где в настоящее время обычными являются подсистемы на жестких дисках емкостью 1 Гб (гигабайт) или выше, содержащие многие тысячи файлов.
В типовом случае многие из файлов на сетевом файл-сервере не будут доступны в течение некоторого времени. Это объясняется несколькими причинами: файл может быть старой версией, резервной копией или может храниться до тех пор, пока однажды не потребуется. Файл может быть фактически вообще избыточным, однако только собственник файла может идентифицировать его таковым, и в результате файл хранится по причинам резервирования или надежности. В соответствии с общепринятой компьютерной практикой считается, что в случае сомнения файлы должны храниться неограниченно долго. Естественным следствием этого является то, что жесткий диск заполняется старыми файлами. Это случается фактически в каждой микропроцессорной персональной компьютерной системе от самой маленькой до самой большой.
Организация иерархической памяти (HSM) является известным способом решения этой проблемы. Большинство операционных систем поддерживают запись последних даты и времени обновления файла (т.е. записи). Многие также поддерживают запись последних даты и времени обращения к файлу (т.е. считывания). Система HSM периодически просматривает список файлов на жестком диске, проверяя последние дату/время каждого. Если файл не использовался в течение заранее определенного промежутка времени (обычно от 1 до 6 месяцев), то файл архивируется, т. е. он переносится на вторичное устройство памяти, например магнитную ленту, и удаляется с жесткого диска.
HSM обычно объединяется с резервированием. Рассмотрим систему резервирования на магнитную ленту с возможностью HSM, в которой порог пассивного состояния установлен равным 3 месяцам. Процесс резервирования запускается периодически (обычно, по меньшей мере, еженедельно) и отмечается, когда последняя дата обращения для данного файла будет соответствовать дате более 3 месяцев назад. Система резервного копирования убеждается, что имеется, например, три резервные копии файла на различных лентах (или ожидает случая, когда будут иметься три копии) и затем удаляет файл. Если даже файл потребуется, то пользователь просто восстанавливает его с одной из трех резервных магнитных лент. Система резервного копирования должна гарантировать, что ленты, содержащие архивные копии файла, не будут перезаписаны. Этот способ обеспечивает долговременное решение проблемы, так как магнитные ленты являются сменными, легко заменяемыми и недорогими.
Когда файл удален системой HSM, его больше нельзя найти на исходном диске. Это может быть невыгодным в случае, если пользователь или прикладная задача примут решение о необходимости доступа к файлу, так как никакого следа файла при поиске на диске не обнаружится. Пользователь или прикладная задача в этом случае не имеют средств, чтобы определить, может ли файл быть восстановлен из резервной копии, и прикладная задача, следовательно, может исходить из неправильной информации, что приведет к неисправимой ошибке.
В идеале вместо бесследного удаления файл должен продолжать оставаться в каталоге на диске (предпочтительно с некоторыми средствами идентификации, что он удален в резервную или вторичную память), но без реального присутствия данных файла и занятия ими дискового пространства. Фактически эта возможность предоставляется во многих HSM системах и известна как перемещение (миграция). Системы HSM обычно оставляют ссылку на файл в каталоге и удаляют данные файла с малым "остатком", содержащим указание на местоположение, где может быть найден перемещенный файл, или удаляют данные полностью, оставляя файл нулевой длины.
Дальнейшее усовершенствование систем HSM, известное как деперемещение (демиграция, обратное перемещение), вынуждает HSM-систему автоматически восстанавливать перемещенный файл на исходный диск в случае, когда пользователь или прикладная задача пытаются обратиться к нему. Очевидно, что это возможно, только если среда вторичной памяти, содержащая перемещенные файлы, постоянно подсоединена к системе. Когда перемещенные данные хранятся на таком устройстве, работающем "почти в линию", например на оптическом диске с автоматической сменой дисков, запрос на обращение к файлу может быть даже временно приостановлен до тех пор, пока файл не будет восстановлен, после чего продолжается работа, как если бы файл никогда не был перемещен.
Способы HSM, описанные выше, эффективны, когда применяются к большому количеству относительно малых файлов, используемых только одним пользователем одновременно. Однако рассмотрим систему базы данных, в которой множество пользователей обращаются к одному большому файлу базы данных, содержащему имена потребителей (пользователей) и адресные записи или аналогичные данные предыстории. Так как новые записи пользователей постоянно добавляются и записи текущих пользователей исправляются, то файл никогда не будет кандидатом на перемещение, так как он должен быть всегда доступен. Тем не менее, такой файл обычно будет иметь много записей для старых неактивных пользователей, чьи данные должны быть сохранены для возможных будущих ссылок, но чьи записи могут быть в противном случае оставлены без обращения в течение значительных периодов времени. Дисковое пространство, занимаемое такими неактивными записями, может быть часто представлено большей частью пространства, занимаемого целым файлом.
Уже известно, как можно организовать файл со случайным доступом, в котором малые количества данных могут быть записаны в любую часть файла или считаны с любой части файла с помощью случайного доступа. Когда создается новый файл со случайным доступом, файл имеет нулевую длину до тех пор, пока данные не будут в него записаны. Так как файл имеет организацию со случайным доступом, то первая часть записываемых данных необязательно должна иметь смещение 0 (т.е. быть началом файла), она может быть записана в любое место. Например, 10 байт данных могут быть записаны со смешением 1000. Файл поэтому будет иметь логическую длину 1010 байт, хотя в действительности записано только 10 байт. Некоторые операционные системы в такой ситуации автоматически заполняют "отсутствующие" 1000 байт пустыми или случайными символами, посредством этого размещая 1010 байт, хотя в действительности было записано только 10 байт.
Усовершенствованные операционные системы, такие как используемые в сетевых файл-серверах, поддерживают концепцию разбросанных файлов, в которых дисковое пространство назначается только тем областям файла, на которые данные реально записываются. Обычно, это достигается расширением таблицы распределения файлов (карты, содержащей сведения о том, как файлы хранятся на диске) так, что каждая запись, указывающая следующее положение, в котором хранятся данные конкретного файла, сопровождается значением, указывающим логическое смещение, с которого начинаются данные. Таким образом, в вышеприведенном примере первая запись будет указывать, что данные начинаются с позиции х на диске и что первый байт расположен в файле с логическим смещением 1000 (в "нормальном" файле логическое смещение должной быть равно "0"). Области разбросанного файла, в которые данные никогда не записываются, известны как дырки.
Сущность изобретения
Изобретение в своих различных аспектах определяется в независимых пунктах приведенной ниже формулы изобретения. Признаки, характеризующие предпочтительное осуществление изобретения, приведены в зависимых пунктах.
В предпочтительном варианте воплощения изобретения, описанном ниже со ссылками на чертежи, поддерживается вспомогательная база данных, указывающая, к каким блокам данных было обращение и в какие даты. Блоки, к которым не было обращения, могут быть затем заархивированы и удалены из файла на диске для снижения требований к памяти. Удаление может быть достигнуто корректировкой FAT (таблицы распределения файлов) для обращения с файлом, как с разбросанным файлом.
Если осуществляется запрос на считывание для части файла, которая заархивирована или перемещена, то система перемещает обратно требуемую часть файла перед тем, как запрос на считывание удовлетворяется.
Однако записи, обращение к которым имело место недавно, уже должны быть на жестком диске и доступ к ним может быть обеспечен немедленно в последующее время. Таким образом, доступ к часто требуемым записям будет обеспечен с высоким быстродействием без необходимости сохранения всего файла на жестком диске.
Способ может быть расширен, в сущности, с помощью увеличения порога пассивности для срока службы вспомогательной базы данных. Если из большого файла базы данных только к малому количеству записей было обращение, то все записи, к которым было обращение, могут быть сохранены на жестком диске, независимо от даты последнего обращения. Записи, к которым не было обращения, могут быть, однако, удалены для освобождения дискового пространства. В этом случае не требуется, чтобы вспомогательная база данных хранила дату или дату/время последнего обращения. Через продолжительные промежутки времени, например, каждый "месяц, все области, к которым было обращение, могут быть перемещены, а вспомогательная база данных очищена.
Более конкретно, указанный выше технический результат достигается тем, что в соответствии с изобретением способ обращения к данным, хранимым в компьютерной системе, содержащей память со случайным доступом, центральный процессор, средство массовой памяти, средство вторичной памяти для архивирования и устройство для архивирования данных, хранимых в компьютерной системе, включает этапы подачи команд, хранимых в памяти со случайным доступом, в центральный процессор для обеспечения им поиска данных обращения, хранимых в средстве массовой памяти, путем генерирования по меньшей мере запроса на считывание, идентификации файла, к которому требуется обращение, причем файл состоит из частей файла, идентификации частей файла в файле, к которым необходимо обращение, обращения к частям файла, причем этап обращения включает проверку таблицы распределения файлов, которая определяет местоположения частей файла в средстве массовой памяти, для определения того, находятся ли части файла в средстве массовой памяти, и если это так, то определение местоположений таких частей файла и формирования базы данных, которая идентифицирует местоположения частей файла, к которым должно осуществляться обращение, причем база данных не включает самой части файла.
Предпочтительно, части файла являются блоками, соответствующими элементарным блокам, идентифицированным в таблице распределения файлов, а база данных определяет, является ли обращение обращением для записи или обращением для считывания.
При этом на этапе формирования предпочтительно идентифицируют части файла, к которым должно быть осуществлено обращение, и дату или дату и время осуществления обращения, а на этапе формирования осуществляют консолидирование базы данных для удаления избыточной информации.
Указанный выше результат достигается также тем, что способ обращения к данным, хранимым в компьютерной системе, содержащей память со случайным доступом, центральный процессор, средство массовой памяти, средство вторичной памяти для архивирования и устройство для архивирования данных, хранимых в компьютерной системе, в соответствии с изобретением, включает этапы подачи команд, хранимых в памяти со случайным доступом, в центральный процессор для обеспечения им архивирования выбранных данных, хранимых в средстве массовой памяти, в средстве вторичной памяти для архивирования для освобождения пространства в средстве массовой памяти, идентификации из базы данных местоположений частей файла, к которым осуществлено обращение, архивирование из средства массовой памяти в средстве вторичной памяти для архивирования по меньшей мере некоторых частей файла, к которым не было обращения, и освобождение в средстве массовой памяти пространства, занимаемого теми частями файла, к которым не было обращения, но которые были архивированы средством архивирования при сохранении в средстве массовой памяти частей файла, к которым было обращение.
Предпочтительно этап идентификации частей файла, к которым осуществлено обращение, включает идентификацию из базы данных частей файла, к которым осуществлялось обращение с заданной даты, и частей файла, к которым не осуществлялось обращение с заданной даты, этап архивирования включает архивирование в средстве вторичной памяти для архивирования по меньшей мере некоторых частей файла, к которым не осуществлялось обращение с заданной даты, а этап освобождения включает освобождение в средстве массовой памяти пространства, занятого теми частями файла, к которым не осуществлялось обращение с заданной даты, но которые были архивированы средством архивирования при сохранении в средстве массовой памяти частей файла, к которым осуществлялось обращение с заданной даты.
При этом этап архивирования и этап освобождения предпочтительно включают архивирование и удаление тех частей файла, к которым не осуществлялось обращение с заданной даты и которые уже являются резервированными заданное количество раз, причем этап освобождения предпочтительно включает изменение таблицы распределения файлов.
Кроме того, способ может дополнительно включать этап извлечения требуемых частей файла из средства вторичной памяти для архивирования в средство массовой памяти для обращения.
Указанный выше технический результат достигается в соответствии с изобретением в компьютерной системе, содержащей память со случайным доступом, центральный процессор, средство массовой памяти, средство вторичной памяти для архивирования и устройство для архивирования данных, хранимых в компьютерной системе, содержащее средство для подачи команд, хранимых в памяти со случайным доступом, в центральный процессор для обеспечения центральным процессором поиска для обращения к данным, хранимым в средстве массовой памяти, путем генерирования по меньшей мере запроса на считывание, первое средство идентификации для идентификации файла, к которому требуется обращение, причем файл состоит из частей файла, второе средство идентификации для идентификации частей файла в файле, к которым необходимо обращение, средство обращения для обращения к частям файла, включающее в себя средство для проверки таблицы распределения файлов, которая определяет местоположения частей файла в средстве массовой памяти, для определения того, находятся ли части файла в средстве массовой памяти, и если это так, то для определения местоположений таких частей файла, и средство формирования для формирования базы данных, которая идентифицирует местоположения частей файла, к которым должно осуществляться обращение, причем база данных не включает самой части файла.
Предпочтительно части файла являются блоками, соответствующими элементарным блокам, идентифицированным в таблице распределения файлов, база данных определяет, является ли обращение обращением для записи или обращением для считывания.
Кроме того, средство формирования предпочтительно идентифицирует части файла, к которым должно быть осуществлено обращение и дату или дату и время осуществления обращения, а также осуществляет консолидирование базы данных для удаления избыточной информации.
Кроме того, вышеуказанный технический результат в соответствии с изобретением достигается в компьютерной системе, содержащей память со случайным доступом, центральный процессор, средство массовой памяти, средство вторичной памяти для архивирования и устройство для архивирования данных, хранимых в компьютерной системе, содержащее средство для подачи команд, хранимых в памяти со случайным доступом, в центральный процессор для обеспечения центральным процессором архивирования выбранных данных, хранимых в средстве массовой памяти, в средстве вторичной памяти для архивирования для освобождения пространства в средстве массовой памяти, средство идентификации для идентификации из базы данных, местоположений частей файла, к которым осуществлено обращение, средство архивирования для архивирования из средства массовой памяти в средстве вторичной памяти для архивирования по меньшей мере некоторых частей файла, к которым не было обращения, и средство удаления для освобождения в средстве массовой памяти пространства, занимаемого теми частями файла, к которым не было обращения, но которые были архивированы средством архивирования при сохранении в средстве массовой памяти частей файла, к которым было обращение.
Предпочтительно средство идентификации содержит средство для идентификации из базы данных частей файла, к которым осуществлялось обращение с заданной даты, и частей файла, к которым не осуществлялось обращение с заданной даты, средство архивирования содержит средство для архивирования в средстве вторичной памяти для архивирования по меньшей мере некоторых частей файла, к которым не осуществлялось обращение с заданной даты, а средство удаления содержит средство для освобождения в средстве массовой памяти пространства, занятого теми частями файла, к которым не осуществлялось обращение с заданной даты, но которые были архивированы средством архивирования при сохранении в средстве массовой памяти частей файла, к которым осуществлялось обращение с заданной даты.
Кроме того, предпочтительно, что средство архивирования и средство удаления содержат средство для архивирования и удаления тех частей файла, к которым не осуществлялось обращение с заданной даты и которые уже являются резервированными заданное количество раз, а средство удаления содержит средство для изменения таблицы распределения файлов.
При этом компьютерная система может дополнительно содержать средство для извлечения требуемых частей файла из средства вторичной памяти для архивирования в средство массовой памяти для обращения.
Способ может быть использован вместе со способом сохранения части файла вышеприведенной заявки. Вспомогательная база данных затем требуется для дополнительной записи, было ли к файлу обращение для записи, в этом случае данные могли быть модифицированы или было к файлу обращение только для считывания. Способ резервного копирования части файла вышеприведенной заявки не предусматривает освобождения дискового пространства на жестком диске, в то же время оставляя доступными те записи, к которым, вероятно, должно быть повторное обращение.
Краткое описание чертежей
Изобретение описывается ниже более подробно с помощью примера со ссылками на сопроводительные чертежи, на которых приведено следующее:
фиг. 1 - блок-схема персональной компьютерной системы с накопителем на магнитной ленте,
фиг.2 - диаграмма, иллюстрирующая обращение к файлу,
фиг.3 - блок-схема последовательности операций, иллюстрирующая обращение к файлу в соответствии с изобретением,
фиг.4 - диаграмма, аналогичная показанной на фиг.2, иллюстрирующая части файла, которые должны быть оставлены на жестком диске,
фиг.5 - блок-схема последовательности операций, иллюстрирующая процедуру резервирования в соответствии с изобретением, которая реализуется системой иерархической организации памяти.
фиг.6 - блок-схема последовательности операций, иллюстрирующая процедуру обращения для считывания файла, который частично заархивирован,
фиг. 7 - диаграмма, иллюстрирующая карту распределения памяти на уровне операционной системы обычного персонального компьютера,
фиг. 8 - диаграмма, иллюстрирующая соответствующую часть карты распределения памяти в способе по изобретению.
Подробное описание предпочтительного варианта воплощения
На фиг.1 представлен персональный компьютер (PC) 10, содержащий центральный процессор (ЦП) 12, память (RAM) 14 со случайным доступом и устройство массовой памяти в виде жесткого диска 16. Персональный компьютер снабжен также устройством 18 памяти на магнитной ленте, представляющим собой вторичную память для целей резервирования и архивирования.
В процессе функционирования память 14 со случайным доступом запоминает команды, которые подаются на центральный процессор 12 для управления его работой. Некоторые из этих команд могут быть направлены от операционной системы, а некоторые могут быть инициированы прикладными программами, выполняющимися в компьютере.
Операционные системы обычно поддерживают таблицу распределения памяти (FAT), в которой записано физическое местоположение на жестком диске каждого блока данных. К тому же операционная система записывает по отношению к каждому файлу флаг архивирования, который устанавливается (в "1"), когда файл модифицируется, и может быть очищен (установлен в "0"), когда файл резервируется. Существующие системы резервного копирования используют флаг архивирования для определения, был ли файл модифицирован и, таким образом, требуется ли его резервирование.
Может использоваться система организации иерархической памяти, которая автоматически резервирует на магнитную ленту любой файл, к которому не было обращения в течение определенного периода времени.
В предпочтительном варианте воплощения данного изобретения поддерживается вспомогательная база данных, которая указывает для каждого файла, к каким блокам данных было обращение и когда, так что система организации иерархической памяти может периодически архивировать или перемещать те блоки, к которым не было обращения. Эти блоки затем могут быть удалены и требования к объему памяти таким образом снижены.
Рассмотрим файл с начальной длиной 125 байт, содержащий 5 записей длиной 25 байт каждая, от 1 января 1995 г, когда была открыта вспомогательная база данных для получения запросов на обращение к любой существующей записи в файле или добавления новой записи к файлу. Запросы в течение некоторого периода времени, например между 1 января и 10 апреля 1995 г, могут быть следующие:
21 января 1995 г добавлена новая запись, расположена со смещением 125, 25 байт длиной,
3 февраля 1995 г - обращение к старой записи (считывание), расположена со смещением 25, 25 байт длиной,
15 февраля 1995 г - обращение к старой записи (считывание), расположена со смещением 75, 25 байт длиной,
3 апреля 1995 г добавлена новая запись, расположена со смещением 150, 25 байт длиной.
Когда запрос получен, то дата, положение записи в файле и длина записи отмечаются во вспомогательной базе данных согласно табл.1 (см. в конце описания).
Конечно, должна обеспечиваться идентифицикация конкретного требуемого файла. Предполагается, что для каждого файла поддерживается отдельная вспомогательная база данных. На практике может быть предпочтительно поддерживать отдельную вспомогательную базу данных для каждого подкаталога, в этом случае файл также должен быть идентифицирован в базе данных. Это, однако, уменьшает количество вспомогательных баз данных и, таким образом, количество созданных дополнительных файлов. В принципе может быть создана единственная вспомогательная база данных для целого диска.
К некоторым областям файла, не включенным во вспомогательную базу данных, изображенную в таблице 1, не было обращения вообще. Порядковый номер дня является простым счетчиком, представляющим дни, которые прошли с произвольной начальной даты, в данном случае 1 января 1900 г. В более сложной системе могут быть включены дата и время (дата/время). Фиг.2 схематически изображает файл с затененными областями, представляющими собой данные файла, которые считываются или записываются, и не затененными областями, представляющими собой данные, к которым нет обращения.
Этапы, выполняемые при обращении, изображены на фиг.3. Этап 20 указывает, что требуется обращение. Это может быть обращение для считывания или обращение для записи. Сначала файл идентифицируется на этапе 22, а на этапе 24 идентифицируется начальное смещение и длина обращения. На этапе 26 эти данные сохраняются во вспомогательной базе данных вместе с датой, как изображено выше в таблице 1. Предпочтительно, этап 26 включает в себя операцию объединения, которая гарантирует, что вспомогательная база данных не содержит избыточной информации. Например, последовательные обращения могут дублироваться или перекрывать предыдущие обращения. Когда эти этапы завершены, то на этапе 28 осуществляется обращение к изначально требуемому файлу, после чего программа завершается на этапе 30.
Эти этапы выполняются для каждого обращения и поэтому к 10 апреля файл имеет длину 175 байт и содержит семь записей, в то время как вспомогательная база данных выглядит так, как в таблице 1 выше. Во время периода текущего контроля (семьдесят девять дней) записи, к которым вообще не было обращения, очевидно, являются кандидатами на архивирование. Однако предположим, что решено, что все записи, к которым не было обращения в течение последних 60 дней, должны быть заархивированы. Записи сортируются, причем сначала предполагается, что весь файл должен быть перемещен во вторичную память, а затем просматривается вспомогательная база данных для всех записей с номером дня, равным 34739 или более (34739 является шестидесятым днем до 10 апреля, который имеет номер 34799). Любые записи с номером дня, удовлетворяющим этому критерию, идентифицируются, а части файла, содержащие их, помечаются соответствующим образом, указывающим, что они не являются объектом перемещения. Любые части файла, оставшиеся неотмеченными, предназначаются таким образом для перемещения.
Из четырех записей, к которым было обращение между 1 января и 10 апреля 1995 г, только последние две - 15 февраля и 3 апреля 1995 соответственно имеют номер дня, превышающий по меньшей мере 34739. Поэтому только две наиболее поздние записи должны остаться, оставляя остаток файла - части, определенные как байты от 0 до 74 и байты от 100 до 149 - для перемещения. Это схематически изображено на фиг.4, где записи, которые должны быть оставлены, изображены затененными, а записи, которые должны были перемещены, - незатемненными. Области данных файла, определенные для перемещения, далее копируются в устройство вторичной памяти с использованием обычной процедуры HSM. Детальные данные местоположения и длина каждой записи поддерживаются системой HSM для облегчения последующего поиска. К тому же вспомогательная база данных может быть отредактирована для удаления любых следов записей, имеющих номер дня, меньший чем 34739, посредством этого предотвращая беспрепятственное расширение размера вспомогательной базы данных.
Для обеспечения преимуществ от перемещения неиспользуемых записей на устройство вторичной памяти необходимо освободить пространство на диске, занятое одними и теми же записями. Эффективным образом это достигается преобразованием файла в разбросанный файл. Другими словами, записи, которые подвержены перемещению, заменяются дырками. Дисковое пространство, ранее занятое избыточными записями, таким образом восстанавливается, так как дырки не занимают дискового пространства. Предполагая, что запись с наибольшим значением смещения не заархивирована, логическая длина файла остается неизменной при этой операции, но количество байтов реальных данных уменьшается, освобождая место для новых данных файла.
Разбросанный файл может быть создан следующим образом.
Предположим, что система имеет таблицу распределения файлов (FAT), в которой дисковое пространство последовательно распределено на блоки по 25 байтов. Поэтому требуется семь блоков для отсчета 175 байтов для файла, созданного 10 апреля 1995 г. Файл может быть распределен согласно табл.2 (см. в конце описания).
Отметим, что первая запись сохраняется в структуре каталога. Каждый блок на диске имеет запись в таблице, которая указывает блок, в котором может быть найдена следующая часть файла. Например, второй блок имеет запись, связывающую его с блоком 3, где может быть найдена часть файла со смещением 50 байт. Только седьмой блок имеет отрицательную запись (-1) для указания, что это последний блок, содержащий данные файла. В данном примере файл сохраняется удобным образом последовательно в блоках от 1 до 7, но на практике блоки с тем же успехом могут быть распределены случайным образом с промежутками между ними.
Таблица распределения должна быть откорректирована в соответствии со свободным дисковым пространством, используемым перемещенными данными, другими словами, чтобы байты с 0 до 74 и байты с 100 по 149 файла должны быть удалены. Первая область перекрывается блоками 1, 2 и 3, а вторая - блоками 5 и 6. Когда данные в этих блоках удалены, оставшиеся записи файла корректируются так, чтобы сохранялись цепочки записей. Модифицированная таблица распределения файла должна выглядеть согласно табл.3 (си. в конце описания).
Блоки 1, 2, 3, 5 и 6 каждый имеют нулевую запись (0) для указания на то, что они свободны от данных. Из модифицированной таблицы распределения файлов операционная система может легко определить, что первым распределенным блоком для файла является блок 4, который содержит данные, начинающиеся с блока с логическим смещением 75, и что следующий (и последний) блок данных файла хранится в блоке 7 и содержит данные, начинающиеся с логического смещения 150. Следует отметить, что некоторые операционные системы не сохраняют логического смещения для первого распределенного блока, который в таких системах поэтому не может быть освобожден.
Точный способ, каким осуществляется удаление, не имеет значения. Что важно, так это то, что пространство, занятое перемещенными блоками, делается доступным на жестком диске, т.е. нужно сказать, что они освобождаются для использования.
В приведенном выше примере для простоты объяснения предполагалось, что размер всех блоков и запросы на считывание/запись должны быть 25 байт, и поэтому предполагалось, что все запросы находятся точно в пределах одного блока. На практике размер распределенного блока кратен 512 байтам и положение и длина запросов на считывание/запись будут значительно меняться. Так как только целые блоки могут быть освобождены (удалены), то система должна быть организована так, чтобы только области данных, представляющие собой целое количество блоков, перемещались и удалялись. Так как большие файлы обычно занимают многие тысячи блоков, это уменьшение в действительности редко является значительным.
Указанные выше этапы изображены на блок-схеме на фиг.5. Этап 40 указывает начало операции резервирования. Сначала ни этапе 42 требуемый файл идентифицируется. Затем на этапе 44 вспомогательная база данных опрашивается для различения тех блоков, к которым было обращение с указанной даты, от тех, к которым обращения не было. На этапе 46 идентифицируются те блоки, к которым обращения не было с указанной даты. Теперь фактически может быть, что блоки, к которым обращения не было, уже резервированы как часть нормальной программной операции резервирования. Обычно они будут резервироваться более одного раза. Поэтому их не требуется перемещать или резервировать снова. Однако необходимо перемещать во вторичную память те блоки, для которых не существует достаточных резервных копий. Они могут быть идентифицированы посредством сопровождения тегом (признаком), независимо от того, являются ли блоки, которые должны быть перемещены, тэгированными или блоками, которые не являются несущественными, при условии, что они надлежащим образом различаются. Поэтому на этапе 48 принятия решения производится определение, существует ли достаточное количество (например, три) резервных копий. Если нет, то на этапе 50 тэгированные блоки резервируются или перемещаются. На этапе 52 пространство, занятое всеми блоками, к которым не было обращения, освобождается посредством исправления таблицы распределения файлов (FAT) для преобразования файла в разбросанный файл. Если файл уже является разбросанным, то добавляется большее количество дырок. Затем на этапе 54 программа завершается.
Последняя особенность заключается в получении последовательных запросов к файлу на считывание и определении того, направлен ли запрос на считывание перемещенных данных. Если не предусмотрена такая обработка получаемых запросов на считывание, то операционная система может возвратить пустые (неопределенные) данные или сообщить об ошибке, если была сделана попытка считать "дырку" разбросанного файла. При получении запроса на считывание перемещенных данных могут генерироваться соответствующие сигналы для автоматического обратного перемещения запрошенной информации. Если отдельные запросы на считывание малы, то время для обратного перемещения данных мало по сравнению с обратным перемещением целого файла, т.к. требуется восстановить только реально необходимые данные.
Эта операция изображена на фиг.6. Этап 60 указывает начало запроса на считывание файла. Файл идентифицируется на этапе 62 и выделяются на этапе 64 (как на фиг.3) начальное смещение и длина считывания. Далее работа продолжается на этапе 66 принятия решения, на котором проверяется таблица распределения файлов (FAT) для определения, является ли запрос на считывание запросом на считывание данных в каком-нибудь блоке или блоках, которые были перемешены с использованием программы, изображенной на фиг.5. Если ответ на этот вопрос "НЕТ", то работа продолжается в соответствии с этапами 70, 72 и 74, которые соответствуют этапам 26, 28 и 30 на фиг.3 соответственно. Однако, если ответ на этапе 66 на вопрос "ДА", то требуемые данные сначала на этапе 68 перемещаются обратно, прежде чем работа продолжится в соответствии с этапами 70, 72 и 74, как и раньше. Нет необходимости перемещать обратно целый блок, а вообще должны быть перемещены обратно только требуемая запись или записи. Они могут находиться в одном блоке или располагаться в двух или более блоках.
Процедуры, иллюстрируемые на фиг. 3 и 6, требуют приема обращений к диску. Каким образом это достигается, будет объяснено со ссылками на фиг.7 и 8. Когда программа желает обратиться к файлу, она вызывает стандартную программу, которая записывает данные на диск. Эта программа, которая в случае операционной системы DOS известна как программа обработки 21 прерывания (в шестнадцатеричной система счисления) (INT21h), является неотъемлемой частью операционной системы. Считывание с диска выполняется INT21h функцией 3Fh, а запись на диск выполняется INT21h функцией 40h. Действие, выполняемое программой, зависит от параметров, поступающих в программу через вход (обращение к ней). Эта программа изображена на фиг.7 как INT21h, образующая часть операционной системы в карте распределения памяти, точка входа INT21h изображена стрелкой. Для осуществления предпочтительного варианта способа согласно изобретению добавляется дополнительный программный код на уровне интерфейса операционной системы, как изображено на фиг.8. На практике в среде DOS он может быть загружен в компьютер как драйвер устройства с использованием файла CONFIG.SYS.
Добавленное программное обеспечение влияет на команды для записи данных посредством замены или подстановки альтернативного набора команд.
С другими операционными системами также необходимо прервать функцию записи файла аналогичным образом. Опытные программисты могут подготовить требуемые программы, следующие вышеуказанному описанию, касающемуся операционной системы DOS.
В более общем случае изобретение может быть реализовано многими модифицированными способами и иллюстрируются другие способы и системы, отличные от описанных.
В частности, способ и система могут быть объединены с системой резервирования части файла согласно вышеуказанной заявке 08/165 382 заявителя. Если это так, то может быть использована та же самая вспомогательная база данных для отметки модификаций данных, которая используется в соответствии с настоящим изобретением для отметки обращения к данным. Единственное различие заключается в том, что становится необходимым записывать во вспомогательную базу данных, было ли обращение по считыванию или обращение по записи. Система резервирования части файла согласно более ранней заявке заявителя затем реагирует на вводы данных, касающиеся обращений по записи к вспомогательной базе данных, в то время как система HSM резервирования части файла согласно настоящей заявке принимает во внимание обращения и по записи, и по считыванию.
В другой модификации система расширяется, в сущности, с помощью увеличения порога пассивности для срока службы вспомогательной базы данных. То есть на фиг.5 этап 44 модифицируется так, чтобы вместо различения блоков, к которым было или не было обращения с определенной даты, она различала блоки, к которым вообще не было обращения, т.е. с тех пор, когда вспомогательная база данных была изначально создана или заполнена. В этом случае вспомогательная база данных более не требует записывать дату или дату/время каждого обращения.
Могут иметься обстоятельства, при которых нежелательно перемещать некоторые части файла даже несмотря на то, что к ним не было обращения. Это может быть применимо, например, к первому и, возможно, к последнему блоку каждого файла.
Наконец, если изобретение должно быть воплощено в полностью новой операционной системе, то вспомогательная база данных может, в принципе, быть объединена с таблицей распределения файлов (FAT). Однако обычно предпочтительно сохранять их по отдельности.

Claims (19)

1. Способ обращения к данным, хранимым в компьютерной системе, с иерархической организацией памяти, причем компьютерная система включает в себя память со случайным доступом, центральный процессор, средство массовой памяти, средство вторичной памяти для архивирования и устройство для архивирования данных, хранимых в компьютерной системе, включающий этапы подачи команд, хранимых в памяти со случайным доступом, в центральный процессор для обеспечения им поиска данных обращения, хранимых в средстве массовой памяти, путем генерирования по меньшей мере запроса на считывание, идентификации файла, к которому требуется обращение, причем файл состоит из частей файла, идентификации частей файла в файле, к которым необходимо обращение, обращения к частям файла, причем этап обращения включает проверку таблицы распределения файлов, которая определяет местоположения частей файла в средстве массовой памяти, для определения того, находятся ли части файла в средстве массовой памяти, и если это так, то определение местоположений таких частей файла, и формирования базы данных, которая идентифицирует местоположения частей файла, к которым должно осуществляться обращение.
2. Способ по п. 1, отличающийся тем, что части файла являются блоками, соответствующими элементарным блокам, идентифицированным в таблице распределения файлов.
3. Способ по п. 1 или 2, отличающийся тем, что база данных определяет, является ли обращение обращением для записи или обращением для считывания.
4. Способ по любому из пп. 1-3, отличающийся тем, что на упомянутом этапе формирования базы данных идентифицируют части файла, к которым должно быть осуществлено обращение, и дату или дату и время осуществления обращения.
5. Способ по любому из пп. 1-4, отличающийся тем, что на упомянутом этапе формирования базы данных осуществляют объединение данных в базу данных, не допуская содержания в ней избыточной информации, т. е. не включая в нее данные, которые дублируют или перекрывают предыдущие сообщения.
6. Способ архивирования данных, хранимых в компьютерной системе с иерархической организацией памяти, причем компьютерная система включает в себя память со случайным доступом, центральный процессор, средство массовой памяти, средство вторичной памяти для архивирования и устройство для архивирования данных, хранимых в компьютерной системе, включающий этапы подачи команд, хранимых в памяти со случайным доступом, в центральный процессор для обеспечения им архивирования выбранных данных, хранимых в средстве массовой памяти, в средстве вторичной памяти для архивирования для освобождения пространства в средстве массовой памяти, идентификации из базы данных местоположений частей файла, к которым осуществлено обращение, архивирование из средства массовой памяти в средстве вторичной памяти для архивирования по меньшей мере некоторых частей файла, к которым не было обращения, и освобождение пространства в средстве массовой памяти путем удаления из средства массовой памяти частей файла, к которым не осуществлялось обращения, при сохранении в средстве массовой памяти частей файла, к которым осуществлялось обращение.
7. Способ по п. 6, отличающийся тем, что этап идентификации частей файла, к которым осуществлялось обращение, включает идентификацию из базы данных частей файла, к которым осуществлялось обращение с заданной даты, и частей файла, к которым не осуществлялось обращение с заданной даты, этап архивирования включает архивирование в средстве вторичной памяти для архивирования по меньшей мере некоторых частей файла, к которым не осуществлялось обращение с заданной даты, а этап освобождения включает освобождение в средстве массовой памяти пространства, занятого теми частями файла, к которым не осуществлялось обращения с заданной даты, но которые были архивированы средством архивирования, при сохранении в средстве массовой памяти частей файла, к которым осуществлялось обращение с заданной даты.
8. Способ по п. 7, отличающийся тем, что этап архивирования и этап освобождения включают архивирование и удаление тех частей файла, к которым не осуществлялось обращения с заданной даты и которые уже являются резервированными заданное количество раз.
9. Способ по любому из пп. 6-8, отличающийся тем, что этап освобождения включает изменение таблицы распределения файлов.
10. Способ по любому из пп. 6-9, отличающийся тем, что дополнительно включает этап извлечения требуемых частей файла из средства вторичной памяти для архивирования в средство массовой памяти для обращения.
11. Компьютерная система с иерархической организацией памяти, причем компьютерная система включает в себя память со случайным доступом, центральный процессор, средство массовой памяти, средство вторичной памяти для хранения архивированных данных и устройство для архивирования данных, хранимых в компьютерной системе, причем упомянутое устройство содержит средство для подачи команд, хранимых в памяти со случайным доступом, в центральный процессор для обеспечения центральным процессором поиска для обращения к данным, хранимым в средстве массовой памяти, путем генерирования по меньшей мере запроса на считывание, средство для идентификации файла, к которому требуется обращение, причем файл состоит из частей файла, средство для идентификации частей файла в файле, к которым необходимо обращение, средство для обращения к частям файла и средство для построения базы данных, которая идентифицирует части файла, к которым должно осуществляться обращение.
12. Компьютерная система по п. 11, отличающаяся тем, что части файла являются блоками, соответствующими элементарным блокам, идентифицированным в таблице распределения файлов.
13. Компьютерная система по п. 11 или 12, отличающаяся тем, что база данных определяет, является ли обращение обращением для записи или обращением для считывания.
14. Компьютерная система по любому из пп. 11-13, отличающаяся тем, что средство для построения базы данных идентифицирует части файла, к которым должно быть осуществлено обращение, и дату или дату и время осуществления обращения.
15. Компьютерная система по любому из пп. 11-14, отличающаяся тем, что средство для построения базы данных осуществляет объединение данных в базу данных, не допуская содержания в ней избыточной информации.
16. Компьютерная система с иерархической организацией памяти, причем компьютерная система включает в себя память со случайным доступом, центральный процессор, средство массовой памяти, средство вторичной памяти для архивирования и устройство для архивирования данных, хранимых в компьютерной системе, причем упомянутое устройство содержит средство для подачи команд, хранимых в памяти со случайным доступом, в центральный процессор для обеспечения центральным процессором архивирования выбранных данных, хранимых в средстве массовой памяти, в средстве вторичной памяти для архивирования для освобождения пространства в средстве массовой памяти, средство для идентификации из базы данных местоположений частей файла, к которым осуществлено обращение, средство для архивирования из средства массовой памяти в средстве вторичной памяти для архивирования по меньшей мере некоторых частей файла, к которым не было обращения, и средство для удаления из средства массовой памяти частей файла, к которым не осуществлялось обращения, при сохранении в средстве массовой памяти частей файла, к которым осуществлялось обращение.
17. Компьютерная система по п. 16, отличающаяся тем, что средство идентификации содержит средство для идентификации из базы данных частей файла, к которым осуществлялось обращение с заданной даты, и частей файла, к которым не осуществлялось обращения с заданной даты, средство архивирования содержит средство для архивирования в средстве вторичной памяти для архивирования по меньшей мере некоторых частей файла, к которым не осуществлялось обращения с заданной даты, а средство удаления содержит средство для удаления в средстве массовой памяти частей файла, к которым не осуществлялось обращения с заданной даты, при сохранении в средстве массовой памяти частей файла, к которым осуществлялось обращение с заданной даты.
18. Компьютерная система по п. 17, отличающаяся тем, что средство архивирования и средство удаления содержат средство для архивирования и удаления тех частей файла, к которым не осуществлялось обращения с заданной даты и которые уже являются резервированными заданное количество раз.
19. Компьютерная система по любому из пп. 16-18, отличающаяся тем, что средство удаления содержит средство для изменения таблицы распределения файлов.
RU97111812/09A 1994-12-15 1995-12-01 Способ обращения к данным, хранимым в компьютерной системе, способ архивирования данных и компьютерная система для осуществления способов RU2182360C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/356,478 1994-12-15
US08/356,478 US5617566A (en) 1993-12-10 1994-12-15 File portion logging and arching by means of an auxilary database

Publications (2)

Publication Number Publication Date
RU97111812A RU97111812A (ru) 1999-09-20
RU2182360C2 true RU2182360C2 (ru) 2002-05-10

Family

ID=23401599

Family Applications (1)

Application Number Title Priority Date Filing Date
RU97111812/09A RU2182360C2 (ru) 1994-12-15 1995-12-01 Способ обращения к данным, хранимым в компьютерной системе, способ архивирования данных и компьютерная система для осуществления способов

Country Status (24)

Country Link
US (1) US5617566A (ru)
EP (1) EP0797805B1 (ru)
JP (1) JPH10510642A (ru)
KR (1) KR100437199B1 (ru)
CN (1) CN1118035C (ru)
AT (1) ATE192249T1 (ru)
AU (1) AU710755B2 (ru)
BG (1) BG63096B1 (ru)
BR (1) BR9510506A (ru)
CA (1) CA2207735C (ru)
CZ (1) CZ294346B6 (ru)
DE (1) DE69516538T2 (ru)
DK (1) DK0797805T3 (ru)
ES (1) ES2145308T3 (ru)
FI (1) FI972544A (ru)
GR (1) GR3033775T3 (ru)
HU (1) HU221081B1 (ru)
IS (1) IS1890B (ru)
MX (1) MX9704419A (ru)
NO (1) NO312529B1 (ru)
NZ (1) NZ296165A (ru)
PL (1) PL182609B1 (ru)
RU (1) RU2182360C2 (ru)
WO (1) WO1996018960A1 (ru)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2457622C2 (ru) * 2007-11-29 2012-07-27 Эйрбас Оперейшнс Гмбх Система и способ архивирования данных
RU2460131C2 (ru) * 2003-07-28 2012-08-27 Гугл Инк. Оснащение пользовательского интерфейса расширением поисковых запросов
US8429312B2 (en) 2007-11-29 2013-04-23 Airbus Operations Gmbh System and method for archiving of data

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5619656A (en) * 1994-05-05 1997-04-08 Openservice, Inc. System for uninterruptively displaying only relevant and non-redundant alert message of the highest severity for specific condition associated with group of computers being managed
US5832525A (en) * 1996-06-24 1998-11-03 Sun Microsystems, Inc. Disk fragmentation reduction using file allocation tables
US5819298A (en) * 1996-06-24 1998-10-06 Sun Microsystems, Inc. File allocation tables with holes
US6158019A (en) * 1996-12-15 2000-12-05 Delta-Tek Research, Inc. System and apparatus for merging a write event journal and an original storage to produce an updated storage using an event map
US6366988B1 (en) 1997-07-18 2002-04-02 Storactive, Inc. Systems and methods for electronic data storage management
US5983368A (en) * 1997-08-26 1999-11-09 International Business Machines Corporation Method and system for facilitating hierarchical storage management (HSM) testing
US6173359B1 (en) 1997-08-27 2001-01-09 International Business Machines Corp. Storage and access to scratch mounts in VTS system
US6067541A (en) * 1997-09-17 2000-05-23 Microsoft Corporation Monitoring document changes in a file system of documents with the document change information stored in a persistent log
US5953729A (en) * 1997-12-23 1999-09-14 Microsoft Corporation Using sparse file technology to stage data that will then be stored in remote storage
US6378128B1 (en) * 1998-10-08 2002-04-23 Microsoft Corporation System and method for dynamically modifying an install-set
US6240427B1 (en) * 1999-01-05 2001-05-29 Advanced Micro Devices, Inc. Method and apparatus for archiving and deleting large data sets
US6415300B1 (en) 1999-07-06 2002-07-02 Syncsort Incorporated Method of performing a high-performance backup which gains efficiency by reading input file blocks sequentially
US6408314B1 (en) 1999-07-06 2002-06-18 Synscort Incorporated Method of performing a high-performance sort which gains efficiency by reading input file blocks sequentially
US6981005B1 (en) * 2000-08-24 2005-12-27 Microsoft Corporation Partial migration of an object to another storage location in a computer system
KR20020031509A (ko) * 2000-10-20 2002-05-02 김영돈, 정춘보 프로그램 제작툴에서 데이터 관리방법
US20050086231A1 (en) * 2001-10-31 2005-04-21 Alan Moore Information archiving software
US20030084071A1 (en) * 2001-11-01 2003-05-01 International Business Machines Corporation Method and system for managing computer performance
KR100468276B1 (ko) * 2001-12-13 2005-01-27 (주)아이디스 멀티미디어 데이터 저장 및 검색 방법
GB0207969D0 (en) * 2002-04-08 2002-05-15 Ibm Data processing arrangement and method
US20040015524A1 (en) * 2002-07-19 2004-01-22 Chalstrom Robert Eugene Method and apparatus for managing digitally-stored media files
US6889302B2 (en) * 2002-08-29 2005-05-03 International Business Machines Corporation Apparatus and method to maintain information in one or more virtual volume aggregates comprising a plurality of virtual volumes
US20040143609A1 (en) * 2003-01-17 2004-07-22 Gardner Daniel John System and method for data extraction in a non-native environment
US8065277B1 (en) 2003-01-17 2011-11-22 Daniel John Gardner System and method for a data extraction and backup database
US8943024B1 (en) 2003-01-17 2015-01-27 Daniel John Gardner System and method for data de-duplication
US8375008B1 (en) 2003-01-17 2013-02-12 Robert Gomes Method and system for enterprise-wide retention of digital or electronic data
US8630984B1 (en) 2003-01-17 2014-01-14 Renew Data Corp. System and method for data extraction from email files
US7107416B2 (en) 2003-09-08 2006-09-12 International Business Machines Corporation Method, system, and program for implementing retention policies to archive records
JP4189595B2 (ja) * 2004-08-25 2008-12-03 コニカミノルタビジネステクノロジーズ株式会社 ファイル管理装置
US8069151B1 (en) 2004-12-08 2011-11-29 Chris Crafford System and method for detecting incongruous or incorrect media in a data recovery process
US20060136525A1 (en) * 2004-12-21 2006-06-22 Jens-Peter Akelbein Method, computer program product and mass storage device for dynamically managing a mass storage device
US7831639B1 (en) * 2004-12-22 2010-11-09 Symantec Operating Corporation System and method for providing data protection by using sparse files to represent images of data stored in block devices
US8527468B1 (en) 2005-02-08 2013-09-03 Renew Data Corp. System and method for management of retention periods for content in a computing system
US8108579B2 (en) * 2005-03-31 2012-01-31 Qualcomm Incorporated Mechanism and method for managing data storage
JP2006338461A (ja) * 2005-06-03 2006-12-14 Hitachi Ltd 電子的なファイルの記憶を制御するシステム及び方法
US7853667B1 (en) * 2005-08-05 2010-12-14 Network Appliance, Inc. Emulation of transparent recall in a hierarchical storage management system
JP4563314B2 (ja) * 2005-12-14 2010-10-13 富士通株式会社 ストレージシステム制御装置、ストレージシステム制御プログラム、ストレージシステム制御方法
US8150827B2 (en) * 2006-06-07 2012-04-03 Renew Data Corp. Methods for enhancing efficiency and cost effectiveness of first pass review of documents
US8117234B2 (en) * 2008-01-24 2012-02-14 International Business Machines Corporation Method and apparatus for reducing storage requirements of electronic records
US8615490B1 (en) 2008-01-31 2013-12-24 Renew Data Corp. Method and system for restoring information from backup storage media
JP5248912B2 (ja) * 2008-05-12 2013-07-31 株式会社日立製作所 サーバ計算機、計算機システムおよびファイル管理方法
US20110145269A1 (en) * 2009-12-09 2011-06-16 Renew Data Corp. System and method for quickly determining a subset of irrelevant data from large data content
WO2011075610A1 (en) 2009-12-16 2011-06-23 Renew Data Corp. System and method for creating a de-duplicated data set
US8423727B2 (en) * 2010-03-16 2013-04-16 Hitachi, Ltd. I/O conversion method and apparatus for storage system
US8386421B2 (en) 2010-06-28 2013-02-26 Microsoft Corporation Concurrency control for confluent trees
US8412689B2 (en) * 2010-07-07 2013-04-02 Microsoft Corporation Shared log-structured multi-version transactional datastore with metadata to enable melding trees
US9848106B2 (en) 2010-12-21 2017-12-19 Microsoft Technology Licensing, Llc Intelligent gameplay photo capture
US10114844B2 (en) * 2015-11-30 2018-10-30 International Business Machines Corporation Readiness checker for content object movement
CN106227795A (zh) * 2016-07-20 2016-12-14 曙光信息产业(北京)有限公司 分级存储的检测方法和系统

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4507751A (en) * 1982-06-21 1985-03-26 International Business Machines Corporation Method and apparatus for logging journal data using a log write ahead data set
US4588991A (en) * 1983-03-07 1986-05-13 Atalla Corporation File access security method and means
US4686620A (en) * 1984-07-26 1987-08-11 American Telephone And Telegraph Company, At&T Bell Laboratories Database backup method
US5043871A (en) * 1986-03-26 1991-08-27 Hitachi, Ltd. Method and apparatus for database update/recovery
GB8915875D0 (en) * 1989-07-11 1989-08-31 Intelligence Quotient United K A method of operating a data processing system
CA2063379C (en) * 1989-07-11 1998-02-10 Peter Bryan Malcolm Method of operating a data processing system
US5454099A (en) * 1989-07-25 1995-09-26 International Business Machines Corporation CPU implemented method for backing up modified data sets in non-volatile store for recovery in the event of CPU failure
US5163148A (en) * 1989-08-11 1992-11-10 Digital Equipment Corporation File backup system for producing a backup copy of a file which may be updated during backup
US5214768A (en) * 1989-11-01 1993-05-25 E-Systems, Inc. Mass data storage library
US5276860A (en) * 1989-12-19 1994-01-04 Epoch Systems, Inc. Digital data processor with improved backup storage
US5363473A (en) * 1991-05-28 1994-11-08 The Trustees Of Columbia University In The City Of New York Incremental update process and apparatus for an inference system
JPH05250244A (ja) * 1992-03-04 1993-09-28 Nec Corp データベースシステム
US5263154A (en) * 1992-04-20 1993-11-16 International Business Machines Corporation Method and system for incremental time zero backup copying of data
US5455946A (en) * 1993-05-21 1995-10-03 International Business Machines Corporation Method and means for archiving modifiable pages in a log based transaction management system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2460131C2 (ru) * 2003-07-28 2012-08-27 Гугл Инк. Оснащение пользовательского интерфейса расширением поисковых запросов
RU2457622C2 (ru) * 2007-11-29 2012-07-27 Эйрбас Оперейшнс Гмбх Система и способ архивирования данных
US8429312B2 (en) 2007-11-29 2013-04-23 Airbus Operations Gmbh System and method for archiving of data

Also Published As

Publication number Publication date
KR980700613A (ko) 1998-03-30
PL321160A1 (en) 1997-11-24
US5617566A (en) 1997-04-01
DE69516538T2 (de) 2000-11-23
CZ9701859A3 (cs) 2002-06-12
KR100437199B1 (ko) 2004-11-03
IS1890B (is) 2003-09-19
CN1173231A (zh) 1998-02-11
WO1996018960A1 (en) 1996-06-20
CA2207735A1 (en) 1996-06-20
BG63096B1 (bg) 2001-03-30
PL182609B1 (pl) 2002-02-28
ES2145308T3 (es) 2000-07-01
JPH10510642A (ja) 1998-10-13
GR3033775T3 (en) 2000-10-31
AU710755B2 (en) 1999-09-30
IS4507A (is) 1997-06-13
FI972544A (fi) 1997-08-14
ATE192249T1 (de) 2000-05-15
BR9510506A (pt) 1999-06-01
NO972784D0 (no) 1997-06-16
DE69516538D1 (de) 2000-05-31
DK0797805T3 (da) 2000-09-25
EP0797805A1 (en) 1997-10-01
BG101622A (en) 1998-02-27
NZ296165A (en) 1997-11-24
EP0797805B1 (en) 2000-04-26
CN1118035C (zh) 2003-08-13
NO972784L (no) 1997-08-15
CZ294346B6 (cs) 2004-12-15
AU3988995A (en) 1996-07-03
NO312529B1 (no) 2002-05-21
HUT77154A (hu) 1998-03-02
FI972544A0 (fi) 1997-06-16
HU221081B1 (hu) 2002-07-29
MX9704419A (es) 1998-07-31
CA2207735C (en) 2004-08-31

Similar Documents

Publication Publication Date Title
RU2182360C2 (ru) Способ обращения к данным, хранимым в компьютерной системе, способ архивирования данных и компьютерная система для осуществления способов
US5684991A (en) Modification metadata set, abstracted from database write requests
US6557073B1 (en) Storage apparatus having a virtual storage area
US6397229B1 (en) Storage-controller-managed outboard incremental backup/restore of data
KR100962055B1 (ko) 컴퓨터 시스템들간의 객체 공유
JP4160933B2 (ja) 超大規模ファイル・システムでのファイル・システム使用のすばやい復元
US5475834A (en) Integration of migration level two and backup tape processing using multiple inventory entries
JP3545428B2 (ja) 動的ファイル移動方法及びシステム
US6883074B2 (en) System and method for efficient write operations for repeated snapshots by copying-on-write to most recent snapshot
US6092087A (en) Log file optimization in a client/server computing system
US6223269B1 (en) Stacked mapped storage system
CA2504322A1 (en) Apparatus and method for hardware-based file system
US20020103784A1 (en) Fast data retrieval based upon contiguous consolidation of records according to frequency of access
US7240172B2 (en) Snapshot by deferred propagation
JPH0823841B2 (ja) データ処理システム及びその方法
US6192376B1 (en) Method and apparatus for shadowing a hierarchical file system index structure to enable error recovery
KR100775141B1 (ko) 저널링이 적용된 fat 파일 시스템의 구현 방법
Gwatking An efficient application of disk storage at the DRCS data migration scheme.
Gwatking DEPARTMENT OF DEFENCE DEFENCE SCIENCE AND TECHNOLOGY ORGANISATION ELECTRONICS RESEARCH LABORATORY

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20061202