JP6005951B2 - Backup data storage and data backup system - Google Patents

Backup data storage and data backup system Download PDF

Info

Publication number
JP6005951B2
JP6005951B2 JP2012041100A JP2012041100A JP6005951B2 JP 6005951 B2 JP6005951 B2 JP 6005951B2 JP 2012041100 A JP2012041100 A JP 2012041100A JP 2012041100 A JP2012041100 A JP 2012041100A JP 6005951 B2 JP6005951 B2 JP 6005951B2
Authority
JP
Japan
Prior art keywords
data
backup data
backup
new
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012041100A
Other languages
Japanese (ja)
Other versions
JP2013178614A (en
Inventor
伊知朗 前田
伊知朗 前田
吉広 相沢
吉広 相沢
博文 野中
博文 野中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Medical Systems Corp
Original Assignee
Toshiba Medical Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Medical Systems Corp filed Critical Toshiba Medical Systems Corp
Priority to JP2012041100A priority Critical patent/JP6005951B2/en
Publication of JP2013178614A publication Critical patent/JP2013178614A/en
Application granted granted Critical
Publication of JP6005951B2 publication Critical patent/JP6005951B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明の実施の形態は、バックアップデータストレージ及びデータバックアップシステムに関する。   Embodiments described herein relate generally to a backup data storage and a data backup system.

近年デジタル技術の進展により、様々な情報がデータとして保存されることが多くなってきている。このような状況の下、例えば同一内容の情報が複数重複して保存されることもある。   In recent years, with the advancement of digital technology, various information is often stored as data. Under such circumstances, for example, a plurality of pieces of information having the same content may be stored redundantly.

但し、同一内容の情報を重複して保存することは、例えば、保存容量の問題や動作が重くなる等、動作環境の問題を招来することにもなる。   However, storing information with the same contents in duplicate also causes problems in the operating environment, such as a problem in storage capacity and an increase in operation.

そこで例えば、以下の特許文献1においては、重複排除が見込めるファイルのみが端末装置からサーバ装置(記憶装置)に送信されサーバ装置に格納されることとして、上記問題の解決を図っている。また、特許文献2においては、既に重複して保存されている情報が存在することを前提に、重複して保存されている情報をバックアップデータとして活用することとしている。   Therefore, for example, in the following Patent Document 1, only the files that can be expected to be de-duplicated are transmitted from the terminal device to the server device (storage device) and stored in the server device, thereby solving the above problem. Further, in Patent Document 2, on the premise that there is already redundantly stored information, the redundantly stored information is used as backup data.

特開2010−277374号公報JP 2010-277374 A 特開2009−110319号公報JP 2009-110319 A

しかしながら、上述した各特許文献に示されている発明では、以下の点に配慮がなされていない。   However, in the inventions shown in the above-mentioned patent documents, the following points are not considered.

すなわち、特許文献1の場合、「重複排除が見込めるファイルのみが保存される」ことを前提にしているが、要約情報を基に重複排除の可否を判断するにしても、特にデータの表現形式が異なる場合には、例えば、バイト単位でそれぞれ異なるファイル(データ)であると判断されてしまい、なかなか重複排除が適切に行われない。   That is, in the case of Patent Document 1, it is premised that “only files for which deduplication can be expected are saved”. If they are different, for example, it is determined that they are different files (data) in units of bytes, and deduplication is not performed properly.

また、特許文献2の場合、「重複して保存されている情報をバックアップデータとして活用する」とあるが、保存対象となる情報が膨大となる場合には重複して保存されている情報もそれこそ多数にのぼり、これら全てをバックアップデータとするには、例えば保存容量の問題からしても適当ではない。   Further, in the case of Patent Document 2, “use redundantly stored information as backup data” is described. However, when the information to be stored becomes enormous, the information stored redundantly is also the same. However, in order to make all these backup data, for example, it is not appropriate from the viewpoint of storage capacity.

本発明は上記課題を解決するためになされたものであり、本発明の目的は、同一規格に基づいて生成された撮影データのバックアップに当たって、バックアップされた後に再び復元することにまで配慮して高効率かつ確実に重複する撮影データを排除することができるバックアップデータストレージ及びデータバックアップシステムを提供することである。   The present invention has been made in order to solve the above-mentioned problems, and the object of the present invention is high in consideration of backup of shooting data generated based on the same standard and restoration again after being backed up. To provide a backup data storage and a data backup system capable of efficiently and reliably eliminating duplicate photographing data.

請求項1に記載の発明の特徴は、バックアップデータストレージにおいて、DICOM(Digital Imaging and Communication in Medicine)規格の下、生成されて送信された撮影データの中から当該撮影データを識別する情報であるデータ識別情報を抽出する抽出部と、バックアップデータとして保存している撮影データのデータ識別情報を記憶するデータ識別情報記憶部と、抽出部によって抽出されたデータ識別情報を基に、比較基となるバックアップデータを検索する検索部と、送信された撮影データが新たなバックアップデータとして初めて保存されるデータであるか否かを判別し、抽出部によって抽出されたデータ識別情報に基づいて新たなバックアップデータがシリーズとしてまとめられたデータであるか否かを判別する判断部と、判断部によって新たなバックアップデータがシリーズとしてまとめられたデータであると判別され、さらに初めてバックアップデータとして保存されるデータであると判別される場合に、新たなバックアップデータを保存する記憶部と、新たなバックアップデータのデータ識別情報と類似するデータ識別情報を備えるバックアップデータを比較基となるバックアップデータとして特定し、特定された比較基となるバックアップデータと比較対象となる新たなバックアップデータとを比較して、新たなバックアップデータにおいて比較基となるバックアップデータと重複する部分を排除し、重複する部分を排除した新たなバックアップデータを記憶部に保存する重複排除処理部とを備える。 According to a first aspect of the present invention, in backup data storage, data that is information for identifying imaging data from imaging data generated and transmitted under the DICOM (Digital Imaging and Communication in Medicine) standard An extraction unit that extracts identification information, a data identification information storage unit that stores data identification information of shooting data stored as backup data, and a backup that serves as a comparison basis based on the data identification information extracted by the extraction unit A search unit that searches for data and whether or not the transmitted shooting data is data stored for the first time as new backup data are determined, and new backup data is created based on the data identification information extracted by the extraction unit. A determination unit that determines whether the data is a series of data and a determination unit. New backup data is determined to be the data gathered as series, further when the first time is determined as the data stored as backup data, a storage unit for storing the new backup data, new backup data The backup data having the data identification information similar to the data identification information is identified as the backup data to be compared, and the backup data to be compared is compared with the new backup data to be compared. A deduplication processing unit that eliminates a part of the backup data that overlaps with the backup data serving as a comparison base and stores new backup data in which the duplicated part is eliminated in the storage unit .

請求項5に記載の発明の特徴は、データバックアップシステムにおいて、撮影データをDICOM規格の下、取得する医用画像診断装置と、医用画像診断装置からDICOM規格の下、送信される撮影データを保存する医用画像管理システムと、医用画像管理システムに保存される撮影データのバックアップデータを保存するバックアップデータストレージと、を備え、バックアップデータストレージは、DICOM規格の下、生成されて送信された撮影データの中から当該撮影データを識別する情報であるデータ識別情報を抽出する抽出部と、バックアップデータとして保存している撮影データのデータ識別情報を記憶するデータ識別情報記憶部と、抽出部によって抽出されたデータ識別情報を基に、比較基となるバックアップデータを検索する検索部と、送信された撮影データが新たなバックアップデータとして初めて保存されるデータであるか否かを判別し、抽出部によって抽出されたデータ識別情報に基づいて新たなバックアップデータがシリーズとしてまとめられたデータであるか否かを判別する判断部と、判断部によって新たなバックアップデータがシリーズとしてまとめられたデータであると判別され、さらに初めてバックアップデータとして保存されるデータであると判別される場合に、新たなバックアップデータを保存する記憶部と、新たなバックアップデータのデータ識別情報と類似するデータ識別情報を備えるバックアップデータを比較基となるバックアップデータとして特定し、特定された比較基となるバックアップデータと比較対象となる新たなバックアップデータとを比較して、新たなバックアップデータにおいて比較基となるバックアップデータと重複する部分を排除し、重複する部分を排除した新たなバックアップデータを記憶部に保存する重複排除処理部とを備える。 According to a fifth aspect of the present invention, in the data backup system, the medical image diagnostic apparatus that acquires the photographing data under the DICOM standard, and the photographing data transmitted from the medical image diagnostic apparatus under the DICOM standard are stored. A medical image management system; and a backup data storage for storing backup data of imaging data stored in the medical image management system. The backup data storage is generated in the imaging data generated and transmitted under the DICOM standard. An extraction unit that extracts data identification information that is information for identifying the shooting data from the data, a data identification information storage unit that stores data identification information of shooting data stored as backup data, and data extracted by the extraction unit Based on the identification information, backup data to be compared is detected. And a search unit that determines whether the transmitted shooting data is data stored for the first time as new backup data. Based on the data identification information extracted by the extraction unit, the new backup data is collected as a series. A determination unit that determines whether or not the data has been stored, and the determination unit determines that the new backup data is data that has been collected as a series, and further determines that the data is stored as backup data for the first time. In this case, the storage unit for storing the new backup data and the backup data including the data identification information similar to the data identification information of the new backup data are specified as the backup data to be the comparison base, and become the specified comparison base New backup to compare with backup data By comparing the Updater to eliminate overlapping with the backup data to be compared based on the new backup data, and a deduplication processing unit to be stored in the storage unit duplicates the new backup data exclude portions.

実施の形態におけるデータバックアップシステムの全体構成を示すブロック図である。It is a block diagram which shows the whole structure of the data backup system in embodiment. 第1の実施の形態におけるバックアップデータストレージの内部構成を示すブロック図である。It is a block diagram which shows the internal structure of the backup data storage in 1st Embodiment. 第1の実施の形態におけるデータバックアップの流れの基本を示すフローチャートである。It is a flowchart which shows the basics of the flow of the data backup in 1st Embodiment. 第1の実施の形態におけるデータバックアップの流れ(重複排除処理)の基本を示すフローチャートである。It is a flowchart which shows the basics of the flow of data backup (deduplication processing) in the first embodiment. 第1の実施の形態におけるバックアップの対象がシリーズに関するデータである場合のデータバックアップの流れを示すフローチャートである。It is a flowchart which shows the flow of a data backup when the object of the backup in 1st Embodiment is the data regarding a series. 第1の実施の形態におけるバックアップの対象がシリーズとしてまとめられるデータである場合のデータバックアップの流れを示すフローチャートである。It is a flowchart which shows the flow of data backup when the object of backup in 1st Embodiment is the data put together as a series. 第1の実施の形態におけるバックアップの対象がシリーズとしてまとめられるデータである場合のデータバックアップの別の流れを示すフローチャートである。It is a flowchart which shows another flow of the data backup in case the object of the backup in 1st Embodiment is the data put together as a series. 第2の実施の形態におけるバックアップデータストレージの内部構成を示すブロック図である。It is a block diagram which shows the internal structure of the backup data storage in 2nd Embodiment. 第2の実施の形態におけるバックアップされたデータの復元の流れを示すフローチャートである。It is a flowchart which shows the flow of restoration of the backed-up data in 2nd Embodiment.

以下、本発明の実施の形態について図面を参照して詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

(第1の実施の形態)
第1の実施の形態においては、保存の対象となるバックアップデータを重複排除の処理を行いつつバックアップデータストレージに保存する流れについて説明する。図1は、実施の形態におけるデータバックアップシステムの全体構成を示すブロック図である。
(First embodiment)
In the first embodiment, a flow of saving backup data to be saved in the backup data storage while performing deduplication processing will be described. FIG. 1 is a block diagram showing an overall configuration of a data backup system according to an embodiment.

実施の形態におけるデータバックアップシステムSは、大きく医用画像診断装置1と、医療機関内に構築されるシステム2と、データのバックアップを行うバックアップデータストレージ3といった3つの機器(システム)から構成されている。なお、このデータバックアップシステムSは、例えば、クラウドを利用して構築することも可能である。   The data backup system S in the embodiment is mainly composed of three devices (systems) such as a medical image diagnostic apparatus 1, a system 2 constructed in a medical institution, and a backup data storage 3 for backing up data. . The data backup system S can be constructed using, for example, a cloud.

医用画像診断装置1は、最終的にバックアップデータとしてバックアップデータストレージに格納されて保存される撮影データを取得する装置である。医用画像診断装置1としては、被検体の内部情報を画像として生成することが可能な装置、例えば、X線CT装置(computed tomography:コンピュータ断層撮影装置)や、磁気共鳴診断装置(MRI:magnetic resonance imaging)等を挙げることができる。この実施の形態においては、特に医用画像診断装置1の種類を特定するものではない。   The medical image diagnostic apparatus 1 is an apparatus that acquires imaging data that is finally stored and stored in a backup data storage as backup data. The medical image diagnostic apparatus 1 is an apparatus capable of generating internal information of a subject as an image, for example, an X-ray CT apparatus (computed tomography) or a magnetic resonance diagnostic apparatus (MRI). imaging). In this embodiment, the type of the medical image diagnostic apparatus 1 is not particularly specified.

なお、図1に示すデータバックアップシステムSにおいては、2つの医用画像診断装置1A及び1Bが設置されている。但し、データバックアップシステムSを構成する医用画像診断装置1(以下、2つの医用画像診断装置1A及び1Bをまとめて「医用画像診断装置1」と表わす)の数については、単数、複数のいずれであっても良く、2つに限定されるものではない。   In the data backup system S shown in FIG. 1, two medical image diagnostic apparatuses 1A and 1B are installed. However, the number of medical image diagnostic apparatuses 1 (hereinafter, the two medical image diagnostic apparatuses 1A and 1B are collectively referred to as “medical image diagnostic apparatus 1”) constituting the data backup system S is either singular or plural. There may be, and it is not limited to two.

医療機関内に構築されているシステムとしては、例えば医用画像管理システム(PACS:Picture Archiving Communication System)2が挙げられる。なお、この実施の形態においては、医療機関内に構築されるシステムとしてPACSを挙げて説明するが、例えば、病院情報管理システム(HIS:Hospital Information System)、放射線部門情報管理システム(RIS:Radiological Information System)、といった各種システムであっても良い。   An example of a system constructed in a medical institution is a medical image management system (PACS: Picture Archiving Communication System) 2. In this embodiment, PACS is described as a system built in a medical institution. For example, a hospital information management system (HIS), a radiation department information management system (RIS) System) may be used.

また、図1に示すデータバックアップシステムSにおいては、2つのPACS2A,2Bがその構成要素として示されている。但し、このPACS2についても、データバックアップシステムSの構成要素としては、単数、複数のいずれであっても良い。   In the data backup system S shown in FIG. 1, two PACS 2A and 2B are shown as components. However, this PACS 2 may be either a single component or a plurality of components of the data backup system S.

PACS2へは、医用画像診断装置1によって取得された撮影データが送信される。具体的には、PACS2を構成する主データストレージ2aへと保存される。また、PACS2には、例えば、主データストレージ2aに保存されている撮影データを参照する情報端末2bが接続されている。ここで情報端末2bは、例えば、ワークステーション(Work Station)、パソコン(Personal Computer)等である。この情報端末2bは、撮影データの他にも主データストレージ2aに保存されているその他のデータ、例えば、患者に関する情報を参照することができる。なお、ここでは情報端末2bの詳細な構成については特に言及しないが、例えば、CPU(Central Processing Unit)等を搭載する制御装置と、入力装置と、出力(表示)装置といった各部からなる。   Imaging data acquired by the medical image diagnostic apparatus 1 is transmitted to the PACS 2. Specifically, the data is stored in the main data storage 2a constituting the PACS2. In addition, for example, an information terminal 2b that refers to shooting data stored in the main data storage 2a is connected to the PACS2. Here, the information terminal 2b is, for example, a work station, a personal computer, or the like. The information terminal 2b can refer to other data stored in the main data storage 2a in addition to the imaging data, for example, information related to the patient. The detailed configuration of the information terminal 2b is not particularly mentioned here, but includes, for example, a control device including a CPU (Central Processing Unit), an input device, and an output (display) device.

PACS2は、医用画像診断装置1が撮影した撮影データのうち必要とする撮影データを受信する。従って、同一の撮影データを複数のPACS2が必要としている場合には、それぞれの主データストレージ2aにおいて撮影データを受信する。   The PACS 2 receives necessary imaging data among the imaging data captured by the medical image diagnostic apparatus 1. Accordingly, when a plurality of PACS 2 require the same shooting data, the shooting data is received in each main data storage 2a.

なおここでは、「主データストレージ2a」と表わしているが、PACS2Aを構成する主データストレージは「主データストレージ2Aa」であり、PACS2Bを構成する主データストレージは「主データストレージ2Ba」である。この点は、「情報端末2b」についても同様である。   Here, although represented as “main data storage 2a”, the main data storage constituting PACS 2A is “main data storage 2Aa”, and the main data storage constituting PACS 2B is “main data storage 2Ba”. This also applies to the “information terminal 2b”.

バックアップデータストレージ3は、PACS2の主データストレージ2aに保存されている撮影データをバックアップのデータとして保存する。また、データバックアップシステムS内に複数のPACS2が設けられていても、それぞれの主データストレージ2aに保存されている撮影データをバックアップデータとして受け入れて保存する。   The backup data storage 3 stores shooting data stored in the main data storage 2a of the PACS 2 as backup data. Even if a plurality of PACSs 2 are provided in the data backup system S, the imaging data stored in each main data storage 2a is received and stored as backup data.

通信ネットワークNは、医用画像診断装置1、PACS2及び、バックアップデータストレージ3をそれぞれつなぎ、互いの間で、例えば撮影データのやりとりを可能とする。通信ネットワークNの例としては、LAN(Local Area Network)やインターネット等のネットワークを挙げることができる。また、この通信ネットワークNで使用される規格は、DICOM(Digital Imaging and Communication in Medicine)等、いずれの規格であっても良い。   The communication network N connects the medical image diagnostic apparatus 1, the PACS 2, and the backup data storage 3, and enables, for example, exchange of imaging data between them. Examples of the communication network N include a network such as a LAN (Local Area Network) and the Internet. The standard used in the communication network N may be any standard such as DICOM (Digital Imaging and Communication in Medicine).

なお、以下の実施の形態においては、同一の規格の下、生成された撮影データを重複排除処理の後、バックアップデータとして保存することを前提に説明を行う。この「同一の規格」としては、例えば、DICOMを挙げることができる。また、比較基となるバックアップデータも新たに登録対象となるバックアップデータも同一の規格で生成されていることから、例えば、重複排除処理の際には、データを任意に区切って比較を行うのではなく、DICOMの規格に沿ったまとまりでデータ区切り比較していく。   In the following embodiments, the description will be made on the assumption that the generated shooting data is stored as backup data after the deduplication processing under the same standard. An example of the “same standard” is DICOM. In addition, since the backup data to be compared and the backup data to be newly registered are generated with the same standard, for example, in the deduplication process, the data is arbitrarily divided and compared. Rather, the data delimiters are compared according to the DICOM standard.

図2は、第1の実施の形態におけるバックアップデータストレージの内部構成を示すブロック図である。図2では第1の実施の形態における説明の際必要と思われる構成のみを示している。従って、バックアップデータストレージ3を構成するその他の構成も省略しているだけで、通常備えるであろう構成は備えている。   FIG. 2 is a block diagram illustrating an internal configuration of the backup data storage according to the first embodiment. FIG. 2 shows only a configuration that is considered necessary in the description of the first embodiment. Therefore, the configuration that would normally be provided is provided only by omitting the other configurations that constitute the backup data storage 3.

バックアップデータストレージ3は、受信部3aと、抽出部3bと、キャッシュ3cと、データ識別情報記憶部3dと、検索部3eと、データ形式変換部3fと、重複排除処理部3gと、判断部3hと、記憶部3iと、データ形式情報記憶部3jとから構成される。なお、各部の詳細な働きについては、撮影データをバックアップデータとしてバックアップデータストレージ3内に保存する流れを説明する際に、併せて説明する。   The backup data storage 3 includes a reception unit 3a, an extraction unit 3b, a cache 3c, a data identification information storage unit 3d, a search unit 3e, a data format conversion unit 3f, a deduplication processing unit 3g, and a determination unit 3h. And a storage unit 3i and a data format information storage unit 3j. The detailed operation of each unit will be described together with the description of the flow of storing the photographic data as backup data in the backup data storage 3.

図3は、第1の実施の形態におけるデータバックアップの流れの基本を示すフローチャートである。以下に説明するデータバックアップの流れにおいては、バックアップされるデータとして、単数、或いは複数枚からなる撮影データとシリーズ単位で撮影された撮影データとの2種類を考える。ここで「基本」としているのは、前者、単数、或いは複数枚からなる撮影データをバックアップ処理する際の流れである。   FIG. 3 is a flowchart showing the basics of the data backup flow in the first embodiment. In the data backup flow described below, two types of data to be backed up are considered: single or multiple pieces of photographing data and photographing data photographed in series units. Here, the “basic” is a flow when performing backup processing on the former, single or plural pieces of photographing data.

撮影データがバックアップデータストレージ3に保存される前提として、まず、医用画像診断装置1からPACS2へ撮影データが送信される(ST1)。ここで送信される対象となるPACS2は、単数、或いは、複数のいずれであっても良く、当該撮影データを必要とするPACS2へと通信ネットワークNを介して送信される。   As an assumption that the imaging data is stored in the backup data storage 3, first, imaging data is transmitted from the medical image diagnostic apparatus 1 to the PACS 2 (ST1). The PACS 2 to be transmitted here may be either a single PACS 2 or a plurality of PACS 2s, and is transmitted via the communication network N to the PACS 2 that requires the photographing data.

当該撮影データを受信したPACS2は、受信した撮影データを主データストレージ2aに保存する(ST2)。PACS2を構成する情報端末2bは、この主データストレージ2aに保存されている撮影データを適宜利用する。   The PACS 2 that has received the shooting data stores the received shooting data in the main data storage 2a (ST2). The information terminal 2b that constitutes the PACS 2 appropriately uses the shooting data stored in the main data storage 2a.

その後、PACS2は、主データストレージ2aに保存されている撮影データをバックアップデータとして保存するべく、バックアップデータストレージ3へと送信する(ST3)。なお、ここで撮影データをバックアップデータストレージ3へ送信するタイミングについては、任意に設定することができる。例えば、毎日決まった時間に定期的に送信する方法や、或いは、主データストレージ2aの空き容量にある閾値を設けておき、当該閾値を超えた場合にバックアップデータストレージ3は撮影データを送信する方法等が考えられる。   Thereafter, the PACS 2 transmits the captured data stored in the main data storage 2a to the backup data storage 3 in order to store it as backup data (ST3). Here, the timing at which the photographic data is transmitted to the backup data storage 3 can be arbitrarily set. For example, a method of periodically transmitting at a fixed time every day, or a method of providing a threshold value in the free capacity of the main data storage 2a, and the backup data storage 3 transmitting photographing data when the threshold value is exceeded Etc. are considered.

ここまでで、医用画像診断装置1において撮影された撮影データをバックアップデータとして保存する準備が整ったことになる。バックアップデータストレージ3に送信されたバックアップデータは、受信部3aにおいて受信される。   Up to this point, preparations for storing the photographing data photographed by the medical image diagnostic apparatus 1 as backup data are ready. The backup data transmitted to the backup data storage 3 is received by the receiving unit 3a.

なお、以下では、主データストレージ2aにおいて保存されていた撮影データは、バックアップデータストレージ3に送信された時点から「新たなバックアップデータ」と表わすこととする。但し、この新たなバックアップデータは、バックアップデータストレージ3に送信された時点において撮影データと何らその内容を異にするものではなく、その称呼が変わるだけである。   In the following description, the shooting data stored in the main data storage 2a is referred to as “new backup data” from the time it is transmitted to the backup data storage 3. However, the new backup data does not differ in content from the photographed data at the time when it is transmitted to the backup data storage 3, but only changes its name.

バックアップデータストレージ3では、受信したバックアップデータを、まずキャッシュ3c内に保存する(ST4)。これは、今後重複排除処理を行う上でのバックアップデータの利用を考えてキャッシュ3c内に保存するものであり、その意味では一時的な保存、或いは、仮保存ともいうべきものである。   The backup data storage 3 first stores the received backup data in the cache 3c (ST4). This is stored in the cache 3c in consideration of the use of backup data for future deduplication processing. In this sense, it should be referred to as temporary storage or temporary storage.

また、PACS2から送信された新たなバックアップデータは、同じく受信部3aを介して抽出部3bへと入力される。抽出部3bでは、受信した新たなバックアップデータの中から、当該新たなバックアップデータを一意に識別することのできる情報(以下、このような情報を「データ識別情報」と表わす)を抽出する。実施の形態の説明においては、上述したようにDICOM規格の医用情報を例に挙げて説明しているが、このDICOMの規格で表わせば、例えば、ユニークIDが該当する。   Also, new backup data transmitted from the PACS 2 is input to the extraction unit 3b via the reception unit 3a. The extraction unit 3b extracts information (hereinafter referred to as “data identification information”) that can uniquely identify the new backup data from the received new backup data. In the description of the embodiment, as described above, the medical information of the DICOM standard is described as an example. However, if expressed by the DICOM standard, for example, a unique ID corresponds.

抽出されたデータ識別情報は、抽出部3bからデータ識別情報記憶部3dに送られ記憶される(ST5)。従って、バックアップデータストレージ3に保存されているバックアップデータについては、その全てのバックアップデータに関するデータ識別情報がデータ識別情報記憶部3dに記憶されている。   The extracted data identification information is sent from the extraction unit 3b to the data identification information storage unit 3d and stored (ST5). Therefore, for the backup data stored in the backup data storage 3, data identification information regarding all the backup data is stored in the data identification information storage unit 3d.

また、抽出部3bでは、データ識別情報を抽出することで、保存の対象となる新たにバックアップデータが上述した単数、或いは複数枚からなる撮影データであるか、或いは、シリーズ単位で撮影された撮影データであるか把握することができる。   Further, the extraction unit 3b extracts the data identification information, so that the backup data to be stored is the above-described single or plural photographing data, or the photographing is performed in series. It is possible to grasp whether it is data.

なお、この第1の実施の形態においては、抽出部3bが直接バックアップデータを受信してデータ識別情報を抽出する方法を採用しているが、例えば、抽出部3bは、PACS2から直接バックアップデータを受信せず、キャッシュ3cに保存されるバックアップデータを基にデータ識別情報を抽出する方法を採用しても良い。   In the first embodiment, the extraction unit 3b directly receives the backup data and extracts the data identification information. For example, the extraction unit 3b receives the backup data directly from the PACS 2. A method of extracting data identification information based on backup data stored in the cache 3c without receiving the data may be adopted.

さらに、抽出部3bは、検索部3eに対してPACS2から新たなバックアップの対象となるデータが送信されてきた旨、知らせる。そこで次に検索部3eは、比較基として適切なデータ(バックアップデータ)を検索する(ST6)。   Furthermore, the extraction unit 3b informs the search unit 3e that new backup target data has been transmitted from the PACS 2. Therefore, next, the search unit 3e searches for appropriate data (backup data) as a comparison base (ST6).

ここで新たなバックアップデータをバックアップデータストレージ3内に保存するに当たっては、当該新たなバックアップデータと既に保存されているバックアップデータとの比較を行い、当該新たなバックアップデータのうち重複している部分を排除した上で保存することになる。「比較基となるバックアップデータ」とは、この重複排除処理の際、当該新たなバックアップデータの比較相手となるデータである。従ってこの比較基となるバックアップデータは、記憶部3i内に既に保存されている撮影データ(バックアップデータ)となる。そして比較基となるバックアップデータの検索に対しては、新たなバックアップデータのデータ識別情報が用いられる。そこで、検索部3eは、データ識別情報記憶部3dにアクセスし、該当するデータ識別情報を取得し検索を開始する。   Here, when storing the new backup data in the backup data storage 3, the new backup data is compared with the backup data already stored, and the duplicated portion of the new backup data is determined. It will be saved after being eliminated. “Backup data to be compared” is data to be compared with the new backup data in the deduplication processing. Therefore, the backup data serving as the comparison base is the shooting data (backup data) already stored in the storage unit 3i. Then, for the search of the backup data as the comparison base, the data identification information of the new backup data is used. Therefore, the search unit 3e accesses the data identification information storage unit 3d, acquires the corresponding data identification information, and starts the search.

新たなバックアップデータをバックアップデータストレージ3に保存するに当たって、いきなり既に保存されているバックアップデータとの間で重複排除処理を行うことは、負荷の大きな処理となる。そこで、既に保存されているバックアップデータの中から新たに保存の対象となる新たなバックアップデータに関するデータ識別情報を用いて予め検索処理を行うことで、重複排除処理に掛かる負荷を軽減することができる。   When new backup data is stored in the backup data storage 3, performing deduplication processing with the backup data that has already been stored is a processing with a heavy load. Therefore, by performing the search process in advance using the data identification information related to the new backup data to be newly saved from the backup data that has already been saved, the load on the deduplication process can be reduced. .

検索部3eは、新たなバックアップデータのデータ識別情報を基に、記憶部3i内に保存されているバックアップデータを検索して対象となる比較基となるバックアップデータを検索する。本発明の実施の形態においては、「新たな」バックアップデータのデータ識別情報を基に、比較基となるバックアップデータのデータ識別情報を検索する。バックアップデータストレージ3に新たなバックアップデータを保存するに当たっては、このデータに既に保存されているバックアップデータと重複する部分がないかを確認する処理(重複排除処理)が必要となる。そのためには、新たなバックアップデータと似たデータ識別情報を備えるバックアップデータを比較する相手として既に保存されているバックアップデータの中から検索しなければならない。そこで、効率よく比較する相手(比較基となるバックアップデータ)を検索するべく、検索部3eにおける検索は、新たなバックアップデータのデータ識別情報を利用する。   Based on the data identification information of the new backup data, the search unit 3e searches the backup data stored in the storage unit 3i to search for the backup data that is the target comparison basis. In the embodiment of the present invention, based on the data identification information of “new” backup data, the data identification information of backup data serving as a comparison base is searched. In order to store new backup data in the backup data storage 3, it is necessary to perform processing (deduplication processing) for confirming whether or not there is a portion overlapping with backup data already stored in this data. For this purpose, it is necessary to search from backup data already stored as a counterpart for comparing backup data having data identification information similar to new backup data. Therefore, in order to search for a partner (backup data serving as a comparison base) to be compared efficiently, the search in the search unit 3e uses data identification information of new backup data.

なお、撮影データ、及びバックアップデータとしての規格は、例えばDICOMといったいずれも同じ規格を利用している。そのため比較基となるバックアップデータ、或いは、新たに保存の対象となるバックアップデータのいずれも同じデータ構造となっている。従って、比較基となるバックアップデータを検索することは、データ構造が異なる場合に比べて容易である。   Note that the standard for shooting data and backup data uses the same standard, for example, DICOM. For this reason, both the backup data as the comparison base and the backup data to be newly saved have the same data structure. Therefore, it is easier to search for backup data serving as a comparison base than when data structures are different.

また、新たなバックアップデータも比較基となるバックアップデータも同一のデータ構造であることから、どの範囲まで一致すれば検索部3eによって比較基となるバックアップデータとして検索されるか、その類似範囲の設定は自由に行うことができる。但し、この類似範囲をあまり広く設定してしまうと、比較基となるバックアップデータとして検索される件数も増加し重複排除処理の負担が増大するだけである。そのためには、適切な検索範囲を設定することが必要となる。   In addition, since the new backup data and the backup data to be the comparison base have the same data structure, the search range 3e can be searched as the backup data to be the comparison base by matching to what range, or the similar range is set. Can be done freely. However, if this similarity range is set too wide, the number of cases searched as backup data as a comparison base also increases, and the burden of deduplication processing only increases. For this purpose, it is necessary to set an appropriate search range.

検索部3eによる検索の結果、新たなバックアップデータの保存の可否を決するに当たって用いられる比較基となるバックアップデータとしての適切なバックアップデータを検索することができなかった場合には(ST7のNO)、その旨の検索結果が判断部3hに送信される。すなわち、比較基となるバックアップデータを検索できなかったということは、PACS2から送られてきた新たなバックアップデータは初めてバックアップデータストレージ3に保存されるデータということになる。   As a result of the search by the search unit 3e, when it is not possible to search for appropriate backup data as backup data to be used as a reference for determining whether or not to store new backup data (NO in ST7), A search result to that effect is transmitted to the determination unit 3h. That is, the fact that backup data as a comparison basis could not be searched means that new backup data sent from the PACS 2 is data stored in the backup data storage 3 for the first time.

判断部3hでは、さらに、当該新たなバックアップデータがシリーズに関する撮影データ(バックアップデータ)であるか否か判断する(ST8)。これは新たなバックアップデータのデータ識別情報を基に判断される。その結果、新たなバックアップデータがシリーズに関するデータではない場合には(ST8のNO)、判断部3hは、キャッシュ3c内に仮保存されている新たなバックアップデータを記憶部3iに本保存する(ST9)。   The determination unit 3h further determines whether or not the new backup data is shooting data (backup data) related to the series (ST8). This is determined based on the data identification information of the new backup data. As a result, when the new backup data is not data related to the series (NO in ST8), the determining unit 3h stores the new backup data temporarily stored in the cache 3c in the storage unit 3i (ST9). ).

また、併せてデータ形式情報記憶部3jに当該新たなバックアップデータのデータ形式に関する情報を記憶させる。データ形式情報記憶部3jでは、例えば、新たなバックアップデータのデータ識別情報と紐づける形でデータ形式に関する情報を記憶する。   In addition, information related to the data format of the new backup data is stored in the data format information storage unit 3j. In the data format information storage unit 3j, for example, information related to the data format is stored in association with data identification information of new backup data.

また、キャッシュ3c内に仮保存されていた新たなバックアップデータは記憶部3iに保存されたので、判断部3hはキャッシュ3cに対してキャッシュ3c内に仮保存されているバックアップデータを削除する(ST10)。   Further, since the new backup data temporarily stored in the cache 3c is stored in the storage unit 3i, the determination unit 3h deletes the backup data temporarily stored in the cache 3c from the cache 3c (ST10). ).

以上で今までバックアップデータストレージ3内に保存されていない撮影データ(バックアップデータ)を新規に保存する流れが説明された。   The flow of newly saving shooting data (backup data) that has not been saved in the backup data storage 3 until now has been described.

次に、新たなバックアップデータを保存するに当たって、既に当該新たなバックアップデータに類似するバックアップデータが保存されている場合に行われる重複排除処理について説明する。   Next, a deduplication process performed when new backup data is stored and backup data similar to the new backup data is already stored will be described.

図4は、第1の実施の形態におけるデータバックアップの流れ(重複排除処理)の基本を示すフローチャートである。図3のステップST7において、検索部3eが記憶部3i内を検索した結果、新たなバックアップデータのデータ識別情報と類似する、比較基となるバックアップデータのデータ識別情報を検索した場合には(ST7のYES)、その旨の検索結果が判断部3hに送信される。そして次に、判断部3hが新たなバックアップデータがシリーズに関するバックアップデータであるか否かを判断する(図4のST21参照)。   FIG. 4 is a flowchart showing the basics of the data backup flow (deduplication processing) in the first embodiment. In step ST7 of FIG. 3, when the search unit 3e searches the storage unit 3i, when the data identification information of the backup data that is similar to the data identification information of the new backup data and is searched for (ST7) YES), a search result to that effect is transmitted to the determination unit 3h. Next, the determination unit 3h determines whether or not the new backup data is backup data related to the series (see ST21 in FIG. 4).

判断の結果、新たなバックアップデータがシリーズに関するバックアップデータではない場合には(ST21のNO)、検索部3eは、検索されたデータ識別情報を基に当該データ識別情報を持つ、比較基となるバックアップデータを記憶部3iから取得する(ST22)。   As a result of the determination, when the new backup data is not backup data related to the series (NO in ST21), the search unit 3e has the data identification information based on the searched data identification information and serves as a comparison basis backup. Data is acquired from the storage unit 3i (ST22).

ここでシリーズに関するバックアップデータであるか否かを判断するのは、シリーズに関するバックアップデータの重複排除処理と単数、或いは複数枚からなる撮影データに関するバックアップデータの重複排除処理とはその処理の方法が異なるからである。従って、新たなバックアップデータがシリーズに関するバックアップデータではないということは、新たにバックアップ処理の対象となるか否かの判断がなされるバックアップデータは、単数、或いは複数枚からなる撮影データに関するバックアップデータである。   Whether the backup data is related to the series or not is different from the backup data deduplication process related to the series and the backup data deduplication process related to single or multiple shot data. Because. Therefore, the fact that the new backup data is not the backup data related to the series means that the backup data for which it is determined whether or not to newly become the target of the backup processing is the backup data related to the shooting data consisting of one or a plurality of images. is there.

その上で検索部3eは、新たなバックアップデータ及び検索された比較基となるバックアップデータをデータ形式変換部3fに送信する。データ形式変換部3fでは、両者のデータ形式を揃える(ST23)。   After that, the search unit 3e transmits the new backup data and the searched backup data as a comparison basis to the data format conversion unit 3f. The data format conversion unit 3f aligns both data formats (ST23).

ここでデータ形式を揃える、という処理は、例えば、撮影データ(バックアップデータ)を構成する画像が圧縮されている場合に、当該圧縮画像を非圧縮データに展開することである。また、展開後にさらにそれぞれハッシュ値を求めておくことも考えられる。さらには、例えば、比較される両データにビッグエンディアンとリトルエンディアンといったバイトオーダの違いがある場合に、例えば比較基となるバックアップデータに統一する処理もここにいうデータ形式を揃える処理に含まれる。   Here, the process of aligning the data format is, for example, when the image constituting the photographic data (backup data) is compressed, the compressed image is expanded into uncompressed data. It is also conceivable that hash values are further obtained after expansion. Further, for example, when there is a difference in byte order such as big endian and little endian in both data to be compared, for example, processing for unifying backup data as a comparison base is included in the processing for aligning the data format.

データ形式が揃えられた新たなバックアップデータ、及び、比較基となるバックアップデータは、データ形式変更部3fから重複排除処理部3gに送信され、重複排除処理部3gにおいて両者が比較される(重複部分が把握される)(ST24)。   The new backup data in which the data format is aligned and the backup data serving as the comparison base are transmitted from the data format changing unit 3f to the deduplication processing unit 3g, and the deduplication processing unit 3g compares them (the duplication part). (ST24).

重複排除処理は、新たにPACS2から送信されてきた撮影データがバックアップデータストレージ3内に保存されるに当たって重複する部分がないか否かを判断する処理である。そして新たなバックアップデータ内に既にバックアップデータストレージ3内に保存されているバックアップデータと重複する部分が存在する場合には、当該重複する部分を排除して保存する。このように既に保存されているデータと重複する部分については保存しないとすることによって、バックアップデータストレージ3内の容量を無駄なく利用することができる。   The de-duplication processing is processing for determining whether or not there is an overlapping portion when shooting data newly transmitted from the PACS 2 is stored in the backup data storage 3. If there is a portion in the new backup data that overlaps with the backup data already stored in the backup data storage 3, the overlapping portion is excluded and stored. Thus, by not storing a portion that overlaps already stored data, the capacity in the backup data storage 3 can be used without waste.

重複排除処理の方法としては、例えば、比較の対象となる新たなバックアップデータが画像データである場合には、それぞれの画像データのハッシュ値を求めてこのハッシュ値で比較を行う。画像データは容量が大きいため、そのまま比較したのではその処理に多大な負荷がかかってしまうからである。一方、例えば、テキストデータのように小さなデータの場合には、データを加工せずそのままの状態で比較を行う。   As a deduplication processing method, for example, when new backup data to be compared is image data, a hash value of each image data is obtained and compared with this hash value. This is because the image data has a large capacity, and if the comparison is made as it is, a large load is applied to the processing. On the other hand, for example, in the case of small data such as text data, the comparison is performed without processing the data.

重複排除処理部3gにおいて重複排除処理が行われた結果、新たなバックアップデータに重複部分(差分)があった場合には(ST25のYES)、重複排除処理部3gでは当該差分を抽出し、新たなバックアップデータとして当該差分を記憶部3iに本保存する(ST26)。その際、併せて重複排除処理の際、比較基となったバックアップデータに関する情報も紐づけて保存する。このような情報も併せて保存するのは、後述するような重複排除処理が行われて保存された当該新たなバックアップデータに対する読み出し要求があった場合に、差分が保存されている新たなバックアップデータを完全な形に復元(再構成)して戻す必要があるからである。   As a result of the de-duplication processing performed by the de-duplication processing unit 3g, if there is an overlapping part (difference) in the new backup data (YES in ST25), the de-duplication processing unit 3g extracts the difference and The difference is fully stored in the storage unit 3i as backup data (ST26). At that time, information related to the backup data used as a comparison base is also stored in association with the deduplication process. Such information is also stored together with new backup data in which differences are stored when there is a read request for the new backup data stored after deduplication processing as described later. This is because it needs to be restored (reconstructed) back to a complete form.

さらに、比較対象とされた新たなバックアップデータの元々のデータ形式もデータ形式情報記憶部3jに保存する(ST27)。この新たなバックアップデータの元々のデータ形式を保存するのも、後述する当該新たなバックアップデータの読み出し要求があった場合に、このデータ形式を用いて当該新たなバックアップデータの再構成を行うためである。   Further, the original data format of the new backup data to be compared is also stored in the data format information storage unit 3j (ST27). The original data format of the new backup data is saved because the new backup data is reconfigured using this data format when there is a request to read out the new backup data, which will be described later. is there.

一方、重複排除処理部3gにおいて重複排除処理が行われた結果、新たなバックアップデータに重複部分(差分)がない場合には(ST25のNO)、新たなバックアップデータは、比較基となるバックアップデータと同一のデータであることになる。従ってこの場合には、新たなバックアップデータが記憶部3iに保存されることはない。但し、既に保存されているバックアップデータと同一内容のデータであったため、重複排除処理によって削除された旨の情報及び、比較基となったバックアップデータに関する情報が保存されることになる。   On the other hand, as a result of the deduplication processing being performed in the deduplication processing unit 3g, if there is no overlapping portion (difference) in the new backup data (NO in ST25), the new backup data is the backup data serving as a comparison basis. Will be the same data. Therefore, in this case, new backup data is not saved in the storage unit 3i. However, since the backup data has the same content as the already stored backup data, information indicating that the backup data has been deleted by deduplication processing and information related to the backup data as a comparison basis are stored.

新たなバックアップデータの元々のデータ形式がデータ形式情報記憶部3jに保存される(ST27)。比較基となるバックアップデータと同一であるためデータの主立った部分については重複排除のため保存されないが、データ形式を保存しておかなければ当該新たなバックアップデータの読み出し要求があった場合に、当該新たなバックアップデータを再構成することができないからである。   The original data format of the new backup data is stored in the data format information storage unit 3j (ST27). The main part of the data is not saved for deduplication because it is the same as the backup data used as the comparison base, but if the data format is not saved, the new backup data is requested to be read. This is because new backup data cannot be reconstructed.

その上で、キャッシュ3c内に仮保存されていた新たなバックアップデータは記憶部3iに保存されたので、判断部3hはキャッシュ3cに対してキャッシュ3c内に仮保存されているバックアップデータを削除する(ST28)。   In addition, since the new backup data temporarily stored in the cache 3c is stored in the storage unit 3i, the determination unit 3h deletes the backup data temporarily stored in the cache 3c from the cache 3c. (ST28).

以上の手順を経ることによって、バックアップデータとして保存の必要があるデータに関して、既に保存されているバックアップデータとの重複を避けて必要なデータのみを保存することができることになるため、バックアップデータストレージ3の保存(記憶)容量を無駄に減らすことを回避できる。   By performing the above procedure, the data that needs to be saved as the backup data can be saved only in the necessary data while avoiding duplication with the already saved backup data. It is possible to avoid wastefully reducing the storage (memory) capacity.

次に重複排除処理の対象となる新たなバックアップデータが、シリーズに関する撮影データ(バックアップデータ)である場合について説明する。すなわち、新たなバックアップデータも比較基となるバックアップデータもシリーズに関するバックアップデータである場合である。なお、以下においては、バックアップデータをシリーズ単位で重複排除処理することを前提に説明するが、例えば、バックアップデータがスタディ単位で保存されることとしても良く、この場合にはバックアップデータはスタディ単位で重複排除処理されることになる。   Next, a case where new backup data to be subjected to deduplication processing is shooting data (backup data) related to the series will be described. In other words, this is a case where new backup data and comparison backup data are backup data related to the series. In the following description, it is assumed that backup data is deduplicated in series. However, for example, backup data may be stored in studies. In this case, backup data is stored in studies. Deduplication processing will be performed.

シリーズに関するバックアップデータの保存に当たっては、シリーズ内に多数の撮影データ(画像データ及び、当該画像データに付随する各種データ)が含まれるという特質に配慮した重複排除処理が行われる。   When storing backup data related to a series, deduplication processing is performed in consideration of the characteristic that a large number of shooting data (image data and various data accompanying the image data) are included in the series.

図5は、第1の実施の形態におけるバックアップの対象がシリーズに関するデータである場合のデータバックアップの流れを示すフローチャートである。すなわち、図4に示すステップST21において新たなバックアップデータに類似する比較基となるバックアップデータが検索された場合であって、さらに判断部3hによって新たなバックアップデータがシリーズに関するデータであると判断された場合(ST21のYES参照)を前提とする。   FIG. 5 is a flowchart showing the flow of data backup when the backup target is data related to the series in the first embodiment. That is, in step ST21 shown in FIG. 4, backup data serving as a comparison base similar to the new backup data is searched, and the determination unit 3h further determines that the new backup data is data related to the series. The case (see YES in ST21) is assumed.

この場合検索部3eは、新たなバックアップデータのデータ識別情報を基に、当該データ識別情報に類似する比較基となるシリーズに関するバックアップデータを記憶部3iから取得する(ST41)。その上で検索部3eは、新たなバックアップデータ及び検索された比較基となるバックアップデータをデータ形式変換部3fに送信する。データ形式変換部3fでは、両者のデータ形式を揃える(ST42)。なお、データ形式を揃える処理に関しては、上述した通りである。   In this case, based on the data identification information of the new backup data, the search unit 3e acquires backup data related to a series that serves as a comparison base similar to the data identification information from the storage unit 3i (ST41). After that, the search unit 3e transmits the new backup data and the searched backup data as a comparison basis to the data format conversion unit 3f. The data format conversion unit 3f aligns both data formats (ST42). The processing for aligning the data format is as described above.

データ形式が揃えられた新たなバックアップデータ、及び、比較基となるバックアップデータは、データ形式変更部3fから重複排除処理部3gに送信され、重複排除処理部3gにおいて両者が比較される(重複部分が把握される)(ST43)。   The new backup data in which the data format is aligned and the backup data serving as the comparison base are transmitted from the data format changing unit 3f to the deduplication processing unit 3g, and the deduplication processing unit 3g compares them (the duplication part). (ST43).

シリーズに関するデータの重複排除処理については、比較されるバックアップデータの量が非常に多くなる点に配慮する必要がある。従って、例えば、以下のような方法が採用される。   Regarding the data deduplication processing related to the series, it is necessary to consider that the amount of backup data to be compared becomes very large. Therefore, for example, the following method is adopted.

まず、例えば、患者情報等の情報が記憶されているタグ、或いは、タググループ同士を比較する。ここで「タグ」とは、DICOM規格での撮影データの項目のことであり、例えば、「患者名」、「生年月日」、「撮影装置」等が該当する。また「タググループ」とは、「タグ」を共通する内容でまとめたものであり、例えば、「患者情報のグループ」といったものである。   First, for example, tags or tag groups storing information such as patient information are compared. Here, the “tag” is an item of imaging data in the DICOM standard, and corresponds to, for example, “patient name”, “date of birth”, “imaging device”, and the like. The “tag group” is a collection of “tags” with common contents, such as “a group of patient information”.

ここではこれら新たなバックアップデータ及び比較基となるバックアップデータの両者において共通するデータと考えられる領域をまず比較してしまう。これらのデータに関しては比較の時点で同じである可能性が高いため、同じデータであることが確認されれば、これらのタグ、或いは、タググループについては、今後比較する必要がなくその他の部分について重複排除処理を行えば足りる。   Here, first, the areas considered to be common data in both the new backup data and the backup data to be compared are first compared. Since these data are likely to be the same at the time of comparison, if it is confirmed that they are the same data, these tags or tag groups will not need to be compared in the future, and other parts Deduplication processing is sufficient.

一方、画像データ等については、むしろ何らかの差分がある可能性が高いため、これらのデータについては例えばハッシュ値を求めて比較していく。この場合、例えば、比較基となるバックアップデータの特定の1枚(例えば、シリーズの1枚目のデータ)を基本の1枚とし、この1枚を基に新たなバックアップデータ内に含まれるデータをそれぞれ比較していく。当該比較が終了したら、さらに特定の1枚として比較基となるバックアップデータにおける2枚目を基本の1枚とし、同じように新たなバックアップデータ内に含まれるデータをそれぞれ比較する。   On the other hand, since there is a high possibility that there is some difference in the image data and the like, for example, hash values are obtained and compared for these data. In this case, for example, a specific one piece of backup data as a comparison base (for example, the first piece of data in the series) is set as a basic one piece, and the data included in the new backup data is based on this one piece. Compare each. When the comparison is completed, the second data in the backup data serving as the comparison base is further specified as a specific data, and the data included in the new backup data are compared in the same manner.

重複排除処理部3gにおいて重複排除処理が行われた結果、新たなバックアップデータに重複部分(差分)があった場合には(ST44のYES)、重複排除処理部3gでは当該差分を抽出し、新たなバックアップデータとして当該差分を記憶部3iに本保存する(ST45)。この際、比較基となるバックアップデータに関する情報を併せて保存することはもちろんである。   As a result of the deduplication processing performed in the deduplication processing unit 3g, if there is an overlapping part (difference) in the new backup data (YES in ST44), the deduplication processing unit 3g extracts the difference and The difference is permanently stored in the storage unit 3i as backup data (ST45). In this case, it is a matter of course that information regarding backup data as a comparison base is also stored.

そして、比較対象とされた新たなバックアップデータの元々のデータ形式もデータ形式情報記憶部3jに保存する(ST46)。この新たなバックアップデータの元々のデータ形式を保存するのは、後述する当該新たなバックアップデータの読出要求があった場合に、このデータ形式を用いて当該新たなバックアップデータの再構成を行うためである。   Then, the original data format of the new backup data to be compared is also stored in the data format information storage unit 3j (ST46). The reason why the original data format of the new backup data is stored is that the new backup data is reconstructed using this data format when there is a request to read the new backup data, which will be described later. is there.

一方、重複排除処理部3gにおいて重複排除処理が行われた結果、新たなバックアップデータに重複部分(差分)がない場合には(ST44のNO)、新たなバックアップデータは、比較基となるバックアップデータと同一のデータであることになる。従ってこの場合には、新たなバックアップデータが記憶部3iに保存されることはない。但し、既に保存されているバックアップデータと同一内容のデータであったため、重複排除処理によって削除された旨の情報及び、比較基となったバックアップデータに関する情報が保存されることになる。   On the other hand, as a result of the deduplication processing being performed in the deduplication processing unit 3g, when there is no overlapping portion (difference) in the new backup data (NO in ST44), the new backup data is the backup data serving as a comparison basis. Will be the same data. Therefore, in this case, new backup data is not saved in the storage unit 3i. However, since the backup data has the same content as the already stored backup data, information indicating that the backup data has been deleted by deduplication processing and information related to the backup data as a comparison basis are stored.

その上で、キャッシュ3c内に仮保存されていた新たなバックアップデータは記憶部3iに保存されたので、判断部3hはキャッシュ3cに対してキャッシュ3c内に仮保存されているバックアップデータを削除する(ST47)。   In addition, since the new backup data temporarily stored in the cache 3c is stored in the storage unit 3i, the determination unit 3h deletes the backup data temporarily stored in the cache 3c from the cache 3c. (ST47).

以上の手順を経ることによって、バックアップデータとして保存の必要があるシリーズに関する新たなバックアップデータに関して、既に保存されているシリーズに関するバックアップデータとの重複を避けて必要なデータのみを保存することができることになるため、バックアップデータストレージ3の保存(記憶)容量を無駄に減らすことを回避できる。   By going through the above procedure, new backup data related to the series that needs to be saved as backup data can be saved only in necessary data while avoiding duplication with the backup data related to the series already saved. Therefore, it is possible to avoid reducing the storage (storage) capacity of the backup data storage 3 unnecessarily.

次に、バックアップデータとして保存対象となるか否かの判断が行われる新たなバックアップデータがシリーズに関するデータである場合について説明する。但し、ここでの判断、すなわち重複排除処理の対象となるデータは1つのシリーズに関するバックアップデータ内に含まれる複数のデータである。そのため、比較基となるバックアップデータとして類似するシリーズに関するバックアップデータが検索され比較の相手とされることはない。   Next, a case where new backup data for which it is determined whether or not to be stored as backup data is data related to the series will be described. However, the data to be subjected to the determination here, that is, the deduplication processing is a plurality of data included in the backup data related to one series. Therefore, backup data relating to a similar series as backup data serving as a comparison base is not retrieved and used as a comparison partner.

上述したように1つのシリーズに関するバックアップデータの中には、例えば、1回の検査業務で撮影された100枚程度の撮影データが含まれている。そこでこれらのシリーズ内のデータについて重複排除処理を行うには、例えば、以下に述べる方法を採用することができる。   As described above, the backup data related to one series includes, for example, about 100 pieces of photographing data photographed in one inspection operation. Therefore, in order to perform deduplication processing on data in these series, for example, a method described below can be adopted.

図6は、第1の実施の形態におけるバックアップの対象がシリーズとしてまとめられるデータである場合のデータバックアップの流れを示すフローチャートである。まず、シリーズ内のデータのうち、比較基となるバックアップデータを特定する(ST61)。すなわち例えば、シリーズに関するデータとして100枚のデータがそれぞれバックアップデータとして保存されるか否かの判断(重複排除処理)が行われるには、比較基となるバックアップデータが必要である。そこで、例えば1枚目のデータを比較基となるバックアップデータとして特定する。この特定されたデータを基準に、その他の99枚のデータについて比較を行う(ST62)。   FIG. 6 is a flowchart showing the flow of data backup when the backup target in the first embodiment is data collected as a series. First, backup data serving as a comparison base is specified from the data in the series (ST61). That is, for example, in order to determine whether or not 100 pieces of data relating to the series are stored as backup data (deduplication processing), backup data serving as a comparison basis is required. Therefore, for example, the first piece of data is specified as backup data to be a comparison basis. Based on the identified data, the other 99 data are compared (ST62).

但し、基本となる(比較基となる)1枚目のバックアップデータを基に残り99枚のデータの全てに対して重複排除処理を行うのは時間が掛かることになる。また、同一のシリーズに関するデータ相互の重複排除処理であることから、特定された1枚目のバックアップデータとその他のバックアップデータとは類似する可能性が高い。そこで、その他の99枚のデータの全てに対して比較を行うのではなく、予め定められた枚数まで特定された比較基となる1枚目のバックアップデータと比較を行う。   However, it takes time to perform deduplication processing on all the remaining 99 data based on the basic (comparison base) first backup data. In addition, since it is a deduplication process between data related to the same series, there is a high possibility that the identified first backup data and other backup data are similar. Therefore, instead of comparing all the other 99 sheets of data, the comparison is made with the first sheet of backup data that serves as a comparison basis specified up to a predetermined number.

予め定められた枚数(以下ではその枚数を「n」と表わす)まで比較が終了したら(ST63のYES)、これまでの比較によって把握できた同一内容を持つデータ領域を抜き出す(ST64)。これは、同一シリーズ内におけるバックアップデータ同士の比較なので、同一内容を持つデータ領域が多いと考えられる。そこで、まずこれらの領域を除いて残された領域についてのみ重複排除処理を行う(ST65)。このような方法を採用することによって多量のバックアップデータを一つずつ比較して重複排除処理を行う必要がなくなる。   When the comparison is completed up to a predetermined number (hereinafter, the number is represented as “n”) (YES in ST63), a data area having the same contents that can be grasped by the comparison so far is extracted (ST64). Since this is a comparison between backup data in the same series, it is considered that there are many data areas having the same contents. Therefore, deduplication processing is first performed only for the remaining areas except these areas (ST65). By adopting such a method, it becomes unnecessary to perform deduplication processing by comparing a large amount of backup data one by one.

重複排除処理の結果差分が抽出されると、重複排除処理部3gは、基本となる(比較基となる)1枚目のバックアップデータとともに、抽出された差分を記憶部3iに保存する(ST66)。さらにデータ形式情報については、データ形式情報記憶部3jに記憶する(ST67)。   When the difference is extracted as a result of the deduplication processing, the deduplication processing unit 3g stores the extracted difference in the storage unit 3i together with the basic backup data (which is a comparison base) (ST66). . Further, the data format information is stored in the data format information storage unit 3j (ST67).

一方、比較の結果、比較基となるバックアップデータ(1枚目のバックアップデータ)と同一内容を持つバックアップデータについては、差分が得られないことから記憶部3iへの保存はなく(ST65のNO)、比較基となる1枚目のバックアップデータに関する情報とともにデータ形式情報が記憶される。   On the other hand, as a result of the comparison, backup data having the same content as the backup data (first backup data) as a comparison base is not saved in the storage unit 3i because the difference cannot be obtained (NO in ST65). The data format information is stored together with the information related to the first backup data as a comparison base.

そして、比較基となるバックアップデータとの比較が全てのシリーズ内のデータに対して行われたか否かが判断部3hによって判断され(ST68)、全てが終了していない場合には、ステップST65に戻って重複排除処理が継続する。一方、全ての比較(重複排除処理)が終了したと判断できる場合には、判断部3hは、比較対象となるシリーズ内のその他のバックアップデータの削除を行う(ST69)。   Then, it is determined by the determination unit 3h whether or not the comparison with the backup data as the comparison base has been performed on the data in all the series (ST68). The deduplication process continues after returning. On the other hand, if it can be determined that all comparisons (duplication elimination processing) have been completed, the determination unit 3h deletes other backup data in the series to be compared (ST69).

一方、シリーズに関するデータについての重複排除処理について、上述した方法とは別の方法も採用し得る。図7は、第1の実施の形態におけるバックアップの対象がシリーズとしてまとめられるデータである場合のデータバックアップの別の流れを示すフローチャートである。   On the other hand, a method different from the above-described method can be adopted for the de-duplication processing for data related to the series. FIG. 7 is a flowchart showing another flow of data backup when the backup target in the first embodiment is data grouped as a series.

まずシリーズ内に含まれる全てのデータに関して共通するデータ項目を確認する(ST71)。ここで「データ項目」とは、例えば、DICOMの規格でいえば、上述した「タグ」に該当し、「患者名」等である。但し、シリーズ内の重複排除の場合には、多くの項目について一致することになるため、ある程度のデータの塊を1つの項目、タググループとしてまとめて対応することも可能である。   First, data items common to all data included in the series are confirmed (ST71). Here, the “data item” corresponds to the above-described “tag” in the DICOM standard, for example, “patient name” or the like. However, in the case of deduplication within a series, many items match, so a certain amount of data chunks can be handled together as one item, tag group.

確認された共通するデータ項目を抜き出して(ST72)、その上で当該抜き出されたデータ項目以外のデータについて、まず比較基となるバックアップデータを特定する(ST73)。これは記憶部3iに当該シリーズに関するデータをバックアップデータとして保存するに当たって基本となるバックアップデータを定めておくことが必要だからである。その上で、当該特定された比較基となるバックアップデータとシリーズ内に含まれる全てのバックアップデータとの比較を行う(ST74)。   The confirmed common data item is extracted (ST72), and then, for the data other than the extracted data item, first, backup data as a comparison base is specified (ST73). This is because it is necessary to determine basic backup data for storing the data related to the series as backup data in the storage unit 3i. Then, the backup data serving as the specified comparison basis is compared with all backup data included in the series (ST74).

重複排除処理部3gは以上のような方法によって比較(重複排除処理)を行い、特定された比較基となるバックアップデータと抽出されたそれぞれの差分を記憶部3iに保存する(ST75)。さらにシリーズに関するデータ形式情報をデータ形式情報記憶部3jに保存する(ST76)。その上で、キャッシュ3cに記憶されていた重複排除処理の対象となったシリーズに関するバックアップデータを削除する(ST77)。   The deduplication processing unit 3g performs comparison (deduplication processing) by the method as described above, and saves the specified backup data as the comparison basis and each extracted difference in the storage unit 3i (ST75). Further, data format information relating to the series is stored in the data format information storage unit 3j (ST76). After that, the backup data related to the series subjected to the de-duplication processing stored in the cache 3c is deleted (ST77).

以上説明したような方法を採用することによって、同一規格に基づいて生成された撮影データのバックアップに当たって、バックアップされた後に再び復元することにまで配慮して高効率かつ確実に重複する撮影データを排除することができるバックアップデータストレージ及びデータバックアップシステムを提供することができる。   By adopting the method described above, when taking backups of shooting data generated based on the same standard, high-efficiency and reliable duplication of shooting data is eliminated with consideration given to restoring again after backup. A backup data storage and a data backup system can be provided.

特に医療現場で撮影されて取得される医用画像情報は、医用画像診断装置1の性能の向上や医療機関内における電子化の進展によって、これまでも膨大な数に上っており、今後さらに増加するものと考えられる。このような状況の下では、限りあるデータ保存容量を如何に適切に運用していくかが懸案となっており、上述したような重複排除処理を行うことによって、医用画像情報をはじめとする様々な情報を保存するバックアップデータストレージの総容量を削減することにもつながる。   In particular, the number of medical image information captured and acquired at medical sites has been enormous and has increased in the future due to improvements in the performance of the medical image diagnostic apparatus 1 and the progress of computerization in medical institutions. It is thought to do. Under such circumstances, it is a concern how to properly operate the limited data storage capacity. By performing the above-described deduplication processing, various information including medical image information can be obtained. It also leads to a reduction in the total capacity of backup data storage for storing various information.

また、医用画像情報については、多くはその規格がDICOMといった単一の規格に沿って生成されていることから、このような同一の規格に基づく情報に限って重複排除処理を行うことによって、より効率よく医用画像情報を保存することができる。   In addition, for medical image information, many standards are generated in accordance with a single standard such as DICOM. Therefore, by performing deduplication processing only on information based on the same standard, Medical image information can be stored efficiently.

(第2の実施の形態)
次に本発明における第2の実施の形態について説明する。なお、第2の実施の形態において、上述の第1の実施の形態において説明した構成要素と同一の構成要素には同一の符号を付し、同一の構成要素の説明は重複するので省略する。
(Second Embodiment)
Next, a second embodiment of the present invention will be described. In the second embodiment, the same components as those described in the first embodiment are denoted by the same reference numerals, and the description of the same components is omitted because it is duplicated.

第2の実施の形態においては、第1の実施の形態とは異なり、既にバックアップデータストレージ3内に保存されているバックアップデータの読み出し処理について説明する。   In the second embodiment, unlike the first embodiment, a process of reading backup data already stored in the backup data storage 3 will be described.

図8は、第2の実施の形態におけるバックアップデータストレージ3の内部構成を示すブロック図である。図8に示すバックアップデータストレージ3では、第2の実施の形態におけるバックアップデータの読み出し処理(再構成処理)を行う上で必要な機能を備える構成要素のみを示している。また、第1の実施の形態において説明し図8にも示されている構成要素については、同じ機能を果たすことから詳細な説明は省略する。   FIG. 8 is a block diagram illustrating an internal configuration of the backup data storage 3 according to the second embodiment. In the backup data storage 3 shown in FIG. 8, only components having functions necessary for performing backup data read processing (reconfiguration processing) in the second embodiment are shown. Further, since the components described in the first embodiment and shown in FIG. 8 perform the same function, detailed description thereof is omitted.

また、バックアップデータストレージ3の各部の働きについては、読み出し処理(再構成処理)の流れを説明する際に併せて説明する。   The operation of each unit of the backup data storage 3 will be described together with the description of the flow of read processing (reconstruction processing).

図9は、第2の実施の形態におけるバックアップされたデータの復元(再構成)の流れを示すフローチャートである。まず、バックアップデータストレージ3がPACS2の情報端末2bからバックアップデータストレージ3内に保存されているバックアップデータの読み出し要求を受信する(ST81)。受信部3aにて受信された読み出し要求は、検索部3eに送信され、検索部3eにて当該読み出し要求の対象となるバックアップデータが確認される(ST82)。   FIG. 9 is a flowchart illustrating a flow of restoration (reconstruction) of backed up data according to the second embodiment. First, the backup data storage 3 receives a read request for backup data stored in the backup data storage 3 from the information terminal 2b of the PACS 2 (ST81). The read request received by the receiving unit 3a is transmitted to the search unit 3e, and the search unit 3e confirms the backup data that is the target of the read request (ST82).

また、検索部3eでは、併せて、当該読み出し要求の対象となるバックアップデータのデータ識別情報を確認する(ST83)。このデータ識別情報は、当該読み出し要求の対象となるバックアップデータを一意に特定することができる情報であることから、当該データ識別情報を基に記憶部3i内に検索を行う(ST84)。   Further, the search unit 3e also confirms the data identification information of the backup data that is the target of the read request (ST83). Since this data identification information is information that can uniquely identify the backup data to be read, the search is performed in the storage unit 3i based on the data identification information (ST84).

検索部3eが記憶部3iから検索するデータは、当該読み出し要求による読み出し対象となるバックアップデータを構成する、「比較基となるバックアップデータ」及び「差分のデータ」である。比較基となるバックアップデータが検索されるのは、バックアップデータを保存する上で重複排除処理を行っており、重複排除処理の対象となったバックアップデータは、比較基となるバックアップデータとの比較で、重複する部分については比較基となるバックアップデータが既に保存されていることから排除され、重複しない部分のみが保存されている。   The data searched by the search unit 3e from the storage unit 3i are “backup data to be compared” and “difference data” that constitute backup data to be read by the read request. The backup data that is the comparison base is searched because deduplication processing is performed when the backup data is saved, and the backup data that is the target of deduplication processing is compared with the backup data that is the comparison base. The overlapping part is excluded from the fact that the backup data as the comparison base is already stored, and only the non-overlapping part is stored.

従って、上述したように、「比較基となるバックアップデータ」及び「差分のデータ」を検索する。但し、最初に保存されたバックアップデータであって、その後当該バックアップデータが「比較基となるバックアップデータ」が読み出し要求の対象となるバックアップデータである場合には、差分のデータは存在しないことから、この「比較基となるバックアップデータ」のみが検索されることになる。   Therefore, as described above, “backup data to be compared” and “difference data” are searched. However, if the backup data is the first saved data, and then the backup data is the backup data that is the target of the read request, the difference data does not exist. Only this “backup data as a comparison base” is searched.

さらに検索部3eは、当該読み出し要求の対象となるバックアップデータの元々のデータ形式に関する情報をデータ形式情報記憶部3jから取得する(ST85)。上述したように、重複排除処理を行う過程で、重複排除処理を行い易くするために比較基となるバックアップデータと新たに保存の対象となるバックアップデータとはそのデータ形式を揃えている。そのため、当該読み出し要求の対象となるバックアップデータのデータ形式が変更されている可能性もある。   Further, the search unit 3e acquires information on the original data format of the backup data that is the target of the read request from the data format information storage unit 3j (ST85). As described above, in the process of performing the deduplication process, the backup data serving as the comparison base and the backup data to be newly stored have the same data format in order to facilitate the deduplication process. Therefore, there is a possibility that the data format of the backup data that is the target of the read request has been changed.

通常、バックアップデータの読み出し要求を行う情報端末2bでは、自身で表示させることのできるデータ形式を備えるバックアップデータの読み出し要求を行う。但し、上述したように当該読み出し要求の対象となるバックアップデータは、重複排除処理の過程でそのデータ形式が変更された可能性がある。そこで、バックアップデータストレージ3としては、当該読み出し要求に対応するべく、元々のデータ形式に沿ってバックアップデータの復元を行う必要がある。   Normally, the information terminal 2b that issues a backup data read request issues a backup data read request having a data format that can be displayed by itself. However, as described above, there is a possibility that the data format of the backup data that is the target of the read request has been changed during the deduplication process. Therefore, the backup data storage 3 needs to restore the backup data according to the original data format in order to respond to the read request.

そこで検索部3eでは、読み出し要求の対象となるバックアップデータに関する比較基となるバックアップデータ及び差分のデータの他に、元々当該読み出し要求の対象となるバックアップデータが備えているデータ形式も検索する。   Therefore, in the search unit 3e, in addition to the backup data and the difference data as the comparison base regarding the backup data that is the target of the read request, the search unit 3e also searches the data format that the backup data that is the target of the read request originally has.

検索部3eでは、記憶部3iから検索した「比較基となるバックアップデータ」及び「差分のデータ」、データ形式情報記憶部3jから検索した「データ形式に関する情報」をまとめてバックアップデータ再構成部3kに送信する(ST86)。   In the search unit 3e, the “backup data serving as a comparison base” and “difference data” searched from the storage unit 3i and the “information related to the data format” searched from the data format information storage unit 3j are collectively stored in the backup data reconstruction unit 3k. (ST86).

さらに検索部3eでは、計時部3lに読み出し要求があった旨の信号を送り、タイマをスタートさせる(ST87)。ここで計時部3lに時間を計測させるのは、再構成されたバックアップデータの保存期間をチェックするためである。バックアップデータストレージ3のデータ保存容量からすれば、読み出し要求のあったバックアップデータを再構成後いつまでも保存して読み出し可能としておくことはできない。そこで、予め読み出し要求があってから所定の期間のみ読み出し可能、ということにして、バックアップデータストレージ3の保存容量が読み出し要求の対象となるバックアップデータによって占められることがないようにしている。なお、読み出しが可能な所定の期間については、任意に設定することが可能であることは言うまでもない。   Further, the search unit 3e sends a signal to the time measuring unit 3l that there is a read request, and starts a timer (ST87). The reason why the time measuring unit 3l measures time is to check the storage period of the reconstructed backup data. Based on the data storage capacity of the backup data storage 3, the backup data requested to be read cannot be stored and read out indefinitely after reconfiguration. Therefore, the storage capacity of the backup data storage 3 is prevented from being occupied by the backup data that is the target of the read request, because it is possible to read only for a predetermined period after a read request is made in advance. Needless to say, the predetermined period during which reading can be performed can be arbitrarily set.

バックアップデータ再構成部3kにおいて再構成されたバックアップデータは、キャッシュ3cに一時的に保存される(ST88)。上述したように、読み出し要求に基づく再構成されたバックアップデータについては恒久的に保存されるものではなく、あくまでも一時的なものであると思われる。従って、再構成されたバックアップデータについては、記憶部3iではなくキャッシュ3cへと保存される。   The backup data reconfigured in the backup data reconfiguration unit 3k is temporarily stored in the cache 3c (ST88). As described above, it is considered that the reconstructed backup data based on the read request is not stored permanently, but is only temporary. Therefore, the reconstructed backup data is stored not in the storage unit 3i but in the cache 3c.

なお、このようにキャッシュ3cに保存された再構成されたバックアップデータについては、バックアップデータストレージ3から読み出し要求を出した情報端末2bへ送信部3mを介して送信するようにしても良いし、或いは、再構成処理が完了した旨を当該情報端末2bへ知らせることとし、知らせを受けた情報端末2bからバックアップデータストレージ3にアクセスし再構成されたバックアップデータを取得するようにしても良い。   The reconstructed backup data stored in the cache 3c as described above may be transmitted via the transmission unit 3m to the information terminal 2b that has issued a read request from the backup data storage 3, or The information terminal 2b may be notified of the completion of the reconfiguration processing, and the backup data storage 3 may be accessed from the notified information terminal 2b to acquire the reconfigured backup data.

バックアップデータストレージ3では、計時部3lがキャッシュ3c内への再構成されたバックアップデータの保存期間を計時しており、所定の期間が経過しない場合には(ST89のNO)、そのままキャッシュ3c内に再構成したバックアップデータを保存しておく。   In the backup data storage 3, the time measuring unit 3l measures the storage period of the reconstructed backup data in the cache 3c. If the predetermined period has not elapsed (NO in ST89), the timer 3l keeps it in the cache 3c. Save the reconstructed backup data.

一方所定の期間が経過した後は、計時部3lから検索部3eにその旨の信号が送信される(ST89のYES)。当該信号を受信した検索部3eでは、キャッシュ3c内に保存されている再構成されたバックアップデータを削除する処理を行う(ST90)。このように読み出し要求に基づいて再構成されたバックアップデータであってもその保存期間を一定期間に限ることで、バックアップデータストレージ3のデータ保存容量に掛かる負荷を最小限に抑えることができる。   On the other hand, after a predetermined period has elapsed, a signal to that effect is transmitted from time measuring unit 3l to search unit 3e (YES in ST89). The search unit 3e that has received the signal performs a process of deleting the reconstructed backup data stored in the cache 3c (ST90). Thus, even if the backup data is reconfigured based on the read request, the storage period of the backup data is limited to a certain period, so that the load on the data storage capacity of the backup data storage 3 can be minimized.

以上説明した方法で既に保存されているバックアップデータを再構成することで、同一規格に基づいて生成された撮影データのバックアップに当たって、バックアップされた後に再び復元することにまで配慮して高効率かつ確実に重複する撮影データを排除することができるバックアップデータストレージ及びデータバックアップシステムを提供することができる。   By reconstructing the backup data that has already been saved by the method described above, it is highly efficient and reliable, taking into account that the backup of the shooting data generated based on the same standard is restored after being backed up. Therefore, it is possible to provide a backup data storage and a data backup system that can eliminate photographing data overlapping with each other.

本発明の実施形態を説明したが、この実施形態は、例として提示したものであり、発明の範囲を限定することを意図していない。この実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。この実施形態やその変形は、発明の範囲や要旨に含まれると共に、特許請求の範囲に記載された発明とその均等の範囲に含まれる。   Although an embodiment of the present invention has been described, this embodiment is presented as an example and is not intended to limit the scope of the invention. This embodiment can be implemented in various other forms, and various omissions, replacements, and changes can be made without departing from the spirit of the invention. This embodiment and its modifications are included in the scope and gist of the invention, and are included in the invention described in the claims and the equivalents thereof.

1 医用画像診断装置
2 PACS
2a 主データストレージ
2b 情報端末
3 バックアップデータストレージ
3a 受信部
3b 抽出部
3c キャッシュ
3d データ識別情報記憶部
3e 検索部
3f データ形式変換部
3g 重複排除処理部
3h 判断部
3i 記憶部
3j データ形式情報記憶部
3k バックアップデータ再構成部
3l 計時部
3m 送信部
1 Medical diagnostic imaging equipment 2 PACS
2a Main data storage 2b Information terminal 3 Backup data storage 3a Reception unit 3b Extraction unit 3c Cache 3d Data identification information storage unit 3e Search unit 3f Data format conversion unit 3g Deduplication processing unit 3h Judgment unit 3i Storage unit 3j Data format information storage unit 3k Backup data reconstruction unit 3l Timekeeping unit 3m Transmitter

Claims (8)

DICOM(Digital Imaging and Communication in Medicine)規格の下、生成されて送信された撮影データの中から当該撮影データを識別する情報であるデータ識別情報を抽出する抽出部と、
バックアップデータとして保存している撮影データの前記データ識別情報を記憶するデータ識別情報記憶部と、
前記抽出部によって抽出された前記データ識別情報を基に、比較基となるバックアップデータを検索する検索部と、
前記送信された撮影データが新たなバックアップデータとして初めて保存されるデータであるか否かを判別し、前記抽出部によって抽出されたデータ識別情報に基づいて前記新たなバックアップデータがシリーズとしてまとめられたデータであるか否かを判別する判断部と、
前記判断部によって前記新たなバックアップデータがシリーズとしてまとめられたデータであると判別され、さらに初めてバックアップデータとして保存されるデータであると判別される場合に、前記新たなバックアップデータを保存する記憶部と、
前記新たなバックアップデータの前記データ識別情報と類似するデータ識別情報を備えるバックアップデータを比較基となるバックアップデータとして特定し、特定された前記比較基となるバックアップデータと比較対象となる前記新たなバックアップデータとを比較して、前記新たなバックアップデータにおいて前記比較基となるバックアップデータと重複する部分を排除し、前記重複する部分を排除した前記新たなバックアップデータを前記記憶部に保存する重複排除処理部と、
を備えることを特徴とするバックアップデータストレージ。
An extraction unit that extracts data identification information that is information for identifying the imaging data from the imaging data generated and transmitted under the DICOM (Digital Imaging and Communication in Medicine) standard;
A data identification information storage unit for storing the data identification information of photographing data stored as backup data;
Based on the data identification information extracted by the extraction unit, a search unit that searches for backup data serving as a comparison base,
It is determined whether or not the transmitted shooting data is data stored for the first time as new backup data, and the new backup data is collected as a series based on the data identification information extracted by the extraction unit. A determination unit for determining whether the data is data;
A storage unit for storing the new backup data when the determination unit determines that the new backup data is data collected as a series, and further determines that the data is stored as backup data for the first time. When,
The backup data having data identification information similar to the data identification information of the new backup data is specified as backup data to be compared, and the new backup data to be compared with the specified backup data to be compared Deduplication processing for comparing data with each other, eliminating a portion of the new backup data that overlaps with the backup data serving as the comparison basis, and storing the new backup data in which the duplicate portion is removed in the storage unit And
A backup data storage characterized by comprising:
前記新たなバックアップデータに係るデータ形式に関する情報を記憶するデータ形式情報記憶部をさらに備えることを特徴とする請求項1に記載のバックアップデータストレージ。 The backup data storage according to claim 1, further comprising a data format information storage unit that stores information on a data format related to the new backup data. 前記重複排除処理部が重複排除の処理を行う際に、前記比較基となるバックアップデータと比較対象となる前記新たなバックアップデータの形式を揃えるデータ形式変換部を備えていることを特徴とする請求項1または請求項2に記載のバックアップデータストレージ。 Claims the deduplication processing unit when executing the process of deduplication, characterized in that it includes a data format conversion section for aligning the form of new backup data to be compared with the backup data serving as the comparison group Item 3. The backup data storage according to item 1 or item 2 . バックアップデータを読み出す際に、前記記憶部から読み出し対象であるバックアップデータを構成する差分のデータ、及び、比較基となるバックアップデータ、データ形式情報記憶部から前記読み出し対象である新たなバックアップデータに関するデータ形式を読み出して、読み出し対象であるバックアップデータを再構成するデータ再構成部を備えていることを特徴とする請求項1ないし請求項3のいずれかに記載のバックアップデータストレージ。 When reading the backup data, the difference data constituting the backup data to be read from the storage unit, and the backup data to be compared group relates to new backup data is the read target from the data format information storage unit The backup data storage according to any one of claims 1 to 3, further comprising a data reconstruction unit that reads the data format and reconstructs the backup data to be read. 撮影データをDICOM規格の下、取得する医用画像診断装置と、
前記医用画像診断装置からDICOM規格の下、送信される前記撮影データを保存する医用画像管理システムと、
前記医用画像管理システムに保存される前記撮影データのバックアップデータを保存するバックアップデータストレージと、を備え、
前記バックアップデータストレージは、
DICOM規格の下、生成されて送信された撮影データの中から前記撮影データを識別する情報であるデータ識別情報を抽出する抽出部と、
バックアップデータとして保存している撮影データの前記データ識別情報を記憶するデータ識別情報記憶部と、
前記抽出部によって抽出された前記データ識別情報を基に、比較基となるバックアップデータを検索する検索部と、
前記送信された撮影データが新たなバックアップデータとして初めて保存されるデータであるか否かを判別し、前記抽出部によって抽出されたデータ識別情報に基づいて前記新たなバックアップデータがシリーズとしてまとめられたデータであるか否かを判別する判断部と、
前記判断部によって前記新たなバックアップデータがシリーズとしてまとめられたデータであると判別され、さらに初めてバックアップデータとして保存されるデータであると判別される場合に、前記新たなバックアップデータを保存する記憶部と、
前記新たなバックアップデータの前記データ識別情報と類似するデータ識別情報を備えるバックアップデータを比較基となるバックアップデータとして特定し、特定された前記比較基となるバックアップデータと比較対象となる前記新たなバックアップデータとを比較して、前記新たなバックアップデータにおいて前記比較基となるバックアップデータと重複する部分を排除し、前記重複する部分を排除した前記新たなバックアップデータを前記記憶部に保存する重複排除処理部と、
を備えることを特徴とするデータバックアップシステム。
A medical image diagnostic apparatus for acquiring imaging data under the DICOM standard;
A medical image management system for storing the imaging data transmitted under the DICOM standard from the medical image diagnostic apparatus;
A backup data storage for storing backup data of the imaging data stored in the medical image management system,
The backup data storage is
An extraction unit for extracting data identification information, which is information for identifying the shooting data, from the shooting data generated and transmitted under the DICOM standard;
A data identification information storage unit for storing the data identification information of photographing data stored as backup data;
Based on the data identification information extracted by the extraction unit, a search unit that searches for backup data serving as a comparison base,
It is determined whether or not the transmitted shooting data is data stored for the first time as new backup data, and the new backup data is collected as a series based on the data identification information extracted by the extraction unit. A determination unit for determining whether the data is data;
A storage unit for storing the new backup data when the determination unit determines that the new backup data is data collected as a series, and further determines that the data is stored as backup data for the first time. When,
The backup data having data identification information similar to the data identification information of the new backup data is specified as backup data to be compared, and the new backup data to be compared with the specified backup data to be compared Deduplication processing for comparing data with each other, eliminating a portion of the new backup data that overlaps with the backup data serving as the comparison basis, and storing the new backup data in which the duplicate portion is removed in the storage unit And
A data backup system comprising:
前記新たなバックアップデータに係るデータ形式に関する情報を記憶するデータ形式情報記憶部をさらに備えることを特徴とする請求項5に記載のデータバックアップシステム。 The data backup system according to claim 5, further comprising a data format information storage unit that stores information on a data format related to the new backup data. 前記バックアップデータストレージは、
前記重複排除処理部が重複排除の処理を行う際に、比較基となるバックアップデータと比較対象となる前記新たなバックアップデータの形式を揃えるデータ形式変換部を備えていることを特徴とする請求項5または請求項6に記載のデータバックアップシステム。
The backup data storage is
Claims wherein the deduplication processing unit when executing the process of deduplication, characterized in that it includes a data format conversion section for aligning the format of the new backup data to be compared with the backup data to be compared group The data backup system according to claim 5 or 6 .
前記バックアップデータストレージは、
バックアップデータを読み出す際に、前記記憶部から読み出し対象であるバックアップデータを構成する差分のデータ、及び、比較基となるバックアップデータ、データ形式情報記憶部から前記読み出し対象である新たなバックアップデータに関するデータ形式を読み出して、読み出し対象であるバックアップデータを再構成するデータ再構成部を備えていることを特徴とする請求項5ないし請求項7のいずれかに記載のデータバックアップシステム。
The backup data storage is
When reading the backup data, the difference data constituting the backup data to be read from the storage unit, and the backup data to be compared group relates to new backup data is the read target from the data format information storage unit The data backup system according to any one of claims 5 to 7 , further comprising a data reconstruction unit that reads the data format and reconstructs the backup data to be read.
JP2012041100A 2012-02-28 2012-02-28 Backup data storage and data backup system Active JP6005951B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012041100A JP6005951B2 (en) 2012-02-28 2012-02-28 Backup data storage and data backup system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012041100A JP6005951B2 (en) 2012-02-28 2012-02-28 Backup data storage and data backup system

Publications (2)

Publication Number Publication Date
JP2013178614A JP2013178614A (en) 2013-09-09
JP6005951B2 true JP6005951B2 (en) 2016-10-12

Family

ID=49270198

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012041100A Active JP6005951B2 (en) 2012-02-28 2012-02-28 Backup data storage and data backup system

Country Status (1)

Country Link
JP (1) JP6005951B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9658774B2 (en) 2014-07-09 2017-05-23 Hitachi, Ltd. Storage system and storage control method
EP3188019B1 (en) * 2015-12-30 2019-09-18 InterDigital CE Patent Holdings Method for selecting a content comprising audiovisual data and corresponding electronic device, system, computer readable program product and computer readable storage medium

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08315119A (en) * 1995-05-19 1996-11-29 Toshiba Corp Medical image storage and communication system
JP4140709B2 (en) * 2003-02-05 2008-08-27 松下電器産業株式会社 Image signal reproducing apparatus and image signal reproducing method
JP3713666B2 (en) * 2004-01-13 2005-11-09 理明 中川 File system image compression method and program
JP5121154B2 (en) * 2005-04-08 2013-01-16 キヤノン株式会社 Image management system, image management method, and program
JP2009136437A (en) * 2007-12-05 2009-06-25 Konica Minolta Medical & Graphic Inc Image processing apparatus, medical image system and image processing method
JP5414223B2 (en) * 2008-09-16 2014-02-12 株式会社日立ソリューションズ Transfer data management system for Internet backup
JP4714778B2 (en) * 2009-02-25 2011-06-29 富士通株式会社 Archive device, conversion device, and conversion program
US20110307457A1 (en) * 2009-03-05 2011-12-15 Hitachi Solutions, Ltd. Integrated duplicate elimination system, data storage device, and server device
WO2011033582A1 (en) * 2009-09-18 2011-03-24 Hitachi, Ltd. Storage system for eliminating duplicated data

Also Published As

Publication number Publication date
JP2013178614A (en) 2013-09-09

Similar Documents

Publication Publication Date Title
US9400717B2 (en) Synchronization of storage using comparisons of fingerprints of blocks
US9841898B2 (en) Subsegmenting for efficient storage, resemblance determination, and transmission
US9961158B2 (en) System and methods of managing content in one or more networked repositories during a network downtime condition
JP6573443B2 (en) Digital medical image data storage system
US8782003B1 (en) Synchronization of storage using log files and snapshots
JP2011036327A (en) Remote interpretation server device, remote interpretation system, and remote interpretation management device
US9826054B2 (en) System and methods of pre-fetching content in one or more repositories
US20140379635A1 (en) System and Methods of Data Migration Between Storage Devices
US20150032961A1 (en) System and Methods of Data Migration Between Storage Devices
JP2007323378A (en) Image storing method and image storage device
US20150302007A1 (en) System and Methods for Migrating Data
JP5464003B2 (en) Database management apparatus and database management program
JP6005951B2 (en) Backup data storage and data backup system
US20160004708A1 (en) File storage apparatus and data management method
JP4995230B2 (en) Remote interpretation system
JP4738043B2 (en) Image management system and image management apparatus
JP2009136437A (en) Image processing apparatus, medical image system and image processing method
JP6038450B2 (en) Report creation apparatus and medical information system
JP2009047873A (en) Image display method and device, and image display program
US20140379640A1 (en) Metadata Replication for Non-Dicom Content
US20140379651A1 (en) Multiple Subscriber Support for Metadata Replication
US20140379646A1 (en) Replication of Updates to DICOM Content
JP2018116487A (en) Data management system and data management method
JP5039217B2 (en) Image management system
WO2014202795A2 (en) System and methods of managing content in one or more repositories

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141222

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20150615

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20150703

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150924

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151006

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151207

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20160527

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160531

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160726

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160809

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160908

R150 Certificate of patent or registration of utility model

Ref document number: 6005951

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350