WO2014068749A1 - メタデータ管理システム、メタデータ管理方法及び記憶媒体 - Google Patents

メタデータ管理システム、メタデータ管理方法及び記憶媒体 Download PDF

Info

Publication number
WO2014068749A1
WO2014068749A1 PCT/JP2012/078336 JP2012078336W WO2014068749A1 WO 2014068749 A1 WO2014068749 A1 WO 2014068749A1 JP 2012078336 W JP2012078336 W JP 2012078336W WO 2014068749 A1 WO2014068749 A1 WO 2014068749A1
Authority
WO
WIPO (PCT)
Prior art keywords
file
metadata
content
computer
error
Prior art date
Application number
PCT/JP2012/078336
Other languages
English (en)
French (fr)
Inventor
志泰 高畠
児玉 昇司
陽介 石井
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Priority to PCT/JP2012/078336 priority Critical patent/WO2014068749A1/ja
Publication of WO2014068749A1 publication Critical patent/WO2014068749A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices

Definitions

  • the present invention relates to a computer system that manages metadata and content files in association with each other.
  • Non-Patent Document 1 a technique for managing metadata such as photograph data and shooting date as a file.
  • This Flickr file system is composed of a virtual file system, and data is uploaded to the Flickr server synchronously by writing to the file of the photo data on the Flickr file system and the file describing the metadata of the photo.
  • when reading a photo data file on the Flickr file system and a file describing photo metadata the data is downloaded synchronously from the Flickr server.
  • metadata is used as a tag as a keyword when searching for photo data.
  • the present invention has been made in view of the above-described problems, and its main object is to manage the correspondence between content and metadata when the content and metadata are transferred to a server asynchronously.
  • a metadata management system for managing content files and metadata, comprising: a first computer including a processor and a memory; and a management server including the processor, memory, and a storage device for storing the content file and metadata.
  • An input unit that is communicably connected and includes a network that connects the first computer and a management server, wherein the first computer receives a content file and a metadata file corresponding to the content file; And extracting the metadata from the metadata file, associating the metadata with the corresponding content file, and transmitting the metadata and the content file associated with the metadata to the management server asynchronously.
  • a file transfer processing unit for requesting registration and An error processing unit that generates an error file related to the metadata requested to be registered when an error notification is received from the management server, and the management server detects an error in the metadata requested to be registered And an analyzer for notifying the first computer when an error is detected.
  • FIG. 1 is a block diagram illustrating an example of a computer system according to a first embodiment of this invention.
  • FIG. It is a block diagram which shows the 1st Example of this invention and shows an example of a content ETL server.
  • It is a block diagram which shows a 1st Example of this invention and shows an example of a file server.
  • It is a figure which shows the 1st Example of this invention shows an example of an association rule, and shows an example of a file type and a file name.
  • 12 is a flowchart illustrating an example of a process performed in step 311 of FIG. 11 in the process performed in the file server according to the first embodiment of this invention.
  • It is a block diagram which shows the 2nd Example of this invention and shows an example of a computer system.
  • FIG. 1 is a block diagram showing an example of a computer system according to the first embodiment of this invention.
  • the computer system includes a content ETL (Extract, Transform, Load) server 103 that manages content files and metadata, and a file server that receives and associates the content file 106 and the metadata file 112 from the content ETL server 103.
  • a content / metadata management server 105 that stores the content file 106 and metadata 107 according to the association set by the file server 104, and a network 100 that connects the servers.
  • the content ETL server 103 acquires information from the content file 106 stored in the content file server 101 and the content management database 102 that manages the content file 106.
  • the content ETL server 103 reads the file name 1070 regarding the content file 106 stored in the content management database 102, the content information 1071, and the content file 106 stored in the content file server 101, and then performs the processing described later. A pair of the content file 106 and the metadata file 112 is generated.
  • the content management database 102 includes a file name 1070 and content information 1071.
  • the content ETL server 103 extracts the metadata 107 from the content information 1071 corresponding to the content file 106 and generates it as a metadata file 112 describing the contents of the metadata 107.
  • the content file server 101 and the content management database 102 may be provided by the same computer or by different computers.
  • the content file server 101 stores a content file 106 that includes content composed of unstructured data such as images, moving images, sounds, and documents.
  • the content management database 102 stores content information 1071 including a file name 1070 of the content file 106 and content attributes, and manages the content file 106 of the content file server 101.
  • the content ETL server 103 acquires a file name 1070 and content information 1071 from the content management database 102 at a preset timing, and generates a metadata 107, and a content file corresponding to the acquired file name 1070
  • the file access processing unit 108 that acquires the file 106 from the content file server 101 is included.
  • the content ETL server 103 generates metadata 107 from the content information 1071 acquired from the content management database 102, and generates a metadata file 112 with the contents of the metadata 107. Then, the content ETL server 103 transmits the content file 106 corresponding to the acquired file name 1070 and the metadata file 112 corresponding to the file name 1070 as a set to the file server 104.
  • the content information 1071 may be attribute information.
  • the file server 104 includes an input unit 117 that receives the content file 106 and the metadata file 112, a file transfer processing unit 111 that transmits the content file 106 and the metadata 107, and a content based on an association rule 115 set in advance.
  • An association processing unit 114 that associates the file 106 with the metadata file 112 and an error processing unit 116 that generates an error file 113 when the metadata file 112 has an error.
  • the file server 104 asynchronously registers the associated content file 106 and metadata 107 in the content / metadata management server 105.
  • the file server 104 extracts the content file 106 not registered in the content / metadata management server 105 from the content file 106 received from the content ETL server 103 by the input unit 117 as an unregistered file.
  • the file server 104 associates the content file 106 and the metadata file 112 with respect to the received set of the content file 106 and the metadata file 112 using a preset association rule 115. Then, the file server 104 extracts the metadata 107 from the metadata file 112 at the time of this association.
  • the file server 104 associates the extracted metadata 107 with the content file 106 and registers it asynchronously with the content / metadata management server 105. This association is performed, for example, by adding metadata 107 to the content file 106.
  • asynchronous writing of the file server 104 indicates that writing of the content file 106 to the file server 104 and writing from the file server 104 to the content / metadata management server 105 are asynchronous.
  • the meaning of asynchronous is the same.
  • the content / metadata management server 105 stores the content file 106 associated with the metadata 107 by the file server 104.
  • the content / metadata management server 105 includes a management unit 122 that stores the content file 106 and metadata 107 received from the file server 104 in the storage device 33, and a metadata analysis unit that analyzes the metadata 107 received from the file server 104. 121.
  • the metadata analysis unit 121 analyzes the received metadata 107 and notifies the error processing unit 116 of the file server 104 of the occurrence of an error when there is an error in the description or value of the metadata.
  • the error processing unit 116 of the file server 104 receives a notification that an error has occurred in the metadata 107 from the content / metadata management server 105, the error file corresponding to the metadata 107 (the metadata file 112 of the file server 104). 113 is generated as described below.
  • the error of the metadata 107 detected by the metadata analysis unit 121 is detected as an error if, for example, the metadata 107 is described in XML and the XML grammar or value is invalid.
  • FIG. 2 is a block diagram showing an example of the content ETL server 103.
  • the content ETL server 103 stores a processor 10 that executes an operation, a memory 11 that stores programs and data, a network adapter 12 that is connected to the network 100, the content file server 101, and the content management database 102, and programs and data. And a storage device 13.
  • the memory 11 is loaded with a file access processing unit 108 and a DB crawler processing unit 109 and executed by the processor 10.
  • the DB crawler processing unit 109 and the file access processing unit 108 can read the content file 106, the metadata 107, the metadata file 112, and the mapping rule 110 to be associated into the memory 11.
  • the processor 10 operates as a functional unit that realizes a predetermined function by operating according to a program of each functional unit.
  • the processor 10 functions as the DB crawler processing unit 109 by operating according to the DB crawler processing unit program. The same applies to other programs.
  • the processor 10 also operates as a functional unit that realizes each of a plurality of processes executed by each program.
  • a computer and a computer system are an apparatus and a system including these functional units.
  • Information such as programs and tables for realizing each function of the content ETL server 103 is stored in a storage device 13, a nonvolatile semiconductor memory, a hard disk drive, a storage device such as an SSD (Solid State Drive), or an IC card, SD card, DVD Etc., and can be stored in a computer readable non-transitory data storage medium.
  • a storage device 13 a nonvolatile semiconductor memory, a hard disk drive, a storage device such as an SSD (Solid State Drive), or an IC card, SD card, DVD Etc.
  • FIG. 3 is a block diagram illustrating an example of the file server 104.
  • the file server 104 is a computer that includes a processor 20 that executes operations, a memory 21 that stores programs and data, a network adapter 22 that is connected to the network 100, and a storage device 23 that stores programs and data.
  • an input unit 117 In the memory 21, an input unit 117, a file transfer processing unit 111, an association processing unit 114, and an error processing unit 116 are loaded and executed by the processor 20.
  • Each processing unit can read the content file 106 and the metadata (metadata file 112) to be associated, the association rule 115, and the error file 113 into the memory 11.
  • the error file 113 may be stored in the storage device 13.
  • the processor 20 operates as a functional unit that realizes a predetermined function by operating according to a program of each functional unit.
  • the processor 20 functions as the association processing unit 114 by operating according to the association processing program. The same applies to other programs.
  • the processor 20 also operates as a functional unit that realizes each of a plurality of processes executed by each program.
  • a computer and a computer system are an apparatus and a system including these functional units.
  • Information such as programs and tables for realizing each function of the file server 104 is stored in a storage device 23, a nonvolatile semiconductor memory, a hard disk drive, a storage device such as an SSD (Solid State Drive), an IC card, an SD card, a DVD, or the like. Can be stored in any computer-readable non-transitory data storage medium.
  • a storage device 23 a nonvolatile semiconductor memory, a hard disk drive, a storage device such as an SSD (Solid State Drive), an IC card, an SD card, a DVD, or the like.
  • FIG. 4 is a block diagram illustrating an example of the content / metadata management server 105.
  • the content / metadata management server 105 includes a processor 30 that executes operations, a memory 31 that stores programs and data, a network adapter 32 that is connected to the network 100, and a storage device 33 that stores programs and data. It is a calculator.
  • a management unit 122 and a metadata analysis unit 121 are loaded into the memory 31 and executed by the processor 30. Each functional unit can read the content file 106 and the metadata 107 to be associated into the memory 11.
  • the processor 30 operates as a functional unit that realizes a predetermined function by operating according to a program of each functional unit.
  • the processor 30 functions as the metadata analysis unit 121 by operating according to the metadata analysis program. The same applies to other programs.
  • the processor 30 also operates as a functional unit that implements each of a plurality of processes executed by each program.
  • a computer and a computer system are an apparatus and a system including these functional units.
  • Information such as programs and tables for realizing each function of the content / metadata management server 105 is stored in a storage device 33, a nonvolatile semiconductor memory, a hard disk drive, a storage device such as an SSD (Solid State Drive), an IC card, an SD card, or the like. It can be stored in a computer-readable non-transitory data storage medium such as a card or DVD.
  • the content / metadata management server 105 is not limited to a single computer, and can be configured by a cloud computer including a plurality of virtual computers.
  • FIG. 5A is a diagram illustrating an example of the association rule 115 of the file server 104 and an example of the association rule 115 of the file type and the file name.
  • the file name is applied as it is to the content file 106, and “.” Is added to the metadata file 112 before the file name, and “.meta” is added after the file name. . Further, in the error file 113, “.” Is added before the file name, and “.err” is added after the file name.
  • FIG. 5B is a diagram showing an example of the file name 115-B to which the association rule 115 is applied.
  • the file name of the content file 106 is “photo.jpg”
  • the file name of the metadata file is set to “.photo.jpg.meta”
  • the file name 115-B of the error file 113 is also “.photo.jpg”. .jpg.err ".
  • FIG. 6 is a diagram illustrating an example of a table stored in the content management database 102.
  • one record is composed mainly of the file name 1070 and the content information 1071.
  • the content information 1071 shows a name 1072 and an age 1073.
  • the content management database 102 includes one record including a file name 1070, a name 1072, and an age 1073.
  • the content ETL server 103 can generate the metadata 107 by extracting the content information 1071 based on the mapping rule 110.
  • the content ETL server 103 can generate a metadata file 112 that describes the contents of the metadata 107.
  • FIG. 7 is a diagram illustrating an example of the error file 113 generated by the file server 104.
  • the error file 113 includes a metadata description error 1131 and a metadata value error 1132 as examples of error contents of the metadata 107 registered in the content / metadata management server 105.
  • FIG. 8 is a diagram illustrating an example of the mapping rule 110 used in the content ETL server 103.
  • mapping rule 110 a correspondence relationship between the item 1101 of the content information 1071 (in the DB in the figure) 1101 of the content management database 102 and the item 1102 of the metadata 107 is set in advance.
  • the “PID” item 1101 of the content management database 102 corresponds to the “Patient ID” item 1102 of the metadata 107
  • the “Name” of the item 1101 is “Patient Name” of the item 1072 of the metadata 107.
  • "Age" of the item 1101 corresponds to "Age” of the item 1102 of the metadata 107.
  • the PID shown in FIG. 8 is not shown in the table of the content management database 102 in FIG.
  • the content ETL server 103 refers to the mapping rule 110 when generating the metadata 107 from the content information 1071 of the content management database 102.
  • FIG. 9 is a flowchart illustrating an example of processing performed by the content ETL server 103. This process is executed when a predetermined condition is satisfied, such as when the load on the file server 104 is reduced for a predetermined period.
  • the DB crawler processing unit 109 of the content ETL server 103 first acquires the file name 1070 and the content information 1071 of the content file 106 by referring to the content management database 102 in step 201.
  • step 202 the DB crawler processing unit 109 of the content ETL server 103 converts the content information 1071 of the content management database 102 into metadata 107 based on the mapping rule 110.
  • step 203 the DB crawler processing unit 109 notifies the file access processing unit 108 of the file name 1070 acquired from the content management database 102.
  • the file access processing unit 108 acquires the content file 106 having the received file name 1070 from the content file server 101.
  • step 204 the file access processing unit 108 generates a file name in order to convert the metadata 107 converted from the content management database 102 by the DB crawler processing unit 109 into the metadata file 112.
  • the file name of the metadata file 112 is "”. "+” File name "+”. Meta "”, as in the association rule 115 in FIG. 5A.
  • step 205 the content ETL server 103 transmits the content file 106 acquired by the file access processing unit 108 and the metadata file 112 generated by the DB crawler processing unit 109 to the file server 104.
  • the above processing is executed for the file name 1070 in the content management database 102.
  • the above process may be performed on a record in which the file name 1070 or the content information 1071 is added or updated after the previous process is completed.
  • the above processing may be repeated for the file name 1070 in the range specified by the administrator or the like.
  • FIG. 10 is a flowchart showing an example of processing performed in the file server 104. This process is executed when a predetermined condition is satisfied, such as when the load on the file server 104 is reduced for a predetermined period.
  • the file server 104 associates the metadata file 112 received from the content ETL server 103 with the processing of FIG. 9 and the content file 106 and registers them in the content / metadata management server 105 with the processing of FIG.
  • step 301 the file transfer processing unit 111 of the file server 104 extracts candidates to be transferred to the content / metadata management server 105 from the metadata file 112 and the content file 106 received from the content ETL server 103.
  • a list (not shown) is generated.
  • This file list includes the error file 113 generated by the error processing unit 116 of the file server 104 in addition to the content file 106 and the metadata file 112 received by the file server 104.
  • what is necessary is just to comprise a file list by the table which stored the file name, for example.
  • whether to transfer to the content / metadata management server 105 may be determined from the attribute information held in the file server 104. For example, if the time stamp of the content file 106 is newer than the attribute information 1601 (see FIG. 11), it is determined as a transfer candidate. If the time stamp of the metadata file 112 is newer than the attribute information 1602 (see FIG. 11), it is determined as a transfer candidate. To do. That is, an untransferred file may be a transfer candidate.
  • the file transfer processing unit 111 sorts the generated file list by file name in the order of the error file 113, the metadata file 112, and the content file 106.
  • the file list is sorted by file name for each file type.
  • the file transfer processing unit 111 extracts file names one by one in order from the top of the generated file list.
  • the file transfer processing unit 111 determines the file type for the extracted file name. The file type is determined from the extension of the file name. If the file name extension is “.meta”, the file transfer processing unit 111 determines that the file is the metadata file 112. If the file name extension is “.err”, the file transfer processing unit 111 determines that the file is the error file 113. If it is an extension, the content file 106 is determined.
  • step 305 the file transfer processing unit 111 determines whether or not the type of the file currently extracted is the metadata file 112. If the file type is the metadata file 112, the process proceeds to step 310; otherwise, the process proceeds to step 306.
  • step 306 the file transfer processing unit 111 determines whether or not the type of the file currently taken out is the error file 113. If the file type is the error file 113, the process proceeds to step 311; otherwise, the process proceeds to step 307.
  • step 307 since the type of the file being taken out is the content file 106, the file transfer processing unit 111 transmits the file to the content / metadata management server 105.
  • step 308 the content file 106 that has been transmitted is stubbed.
  • stubbing is performed by deleting the substance of the content file 106 registered in the content / metadata management server 105 from the file server 104, and only the attribute information 1601 of the content file 106 is stored in the file server 104. Indicates to leave.
  • the location of the file can be held in the attribute information 1601 while suppressing the capacity of the storage device 23 used by the file server 104.
  • FIG. 11 is a block diagram showing an example of stubbing.
  • step 310 when the file type is the metadata file 112, the metadata 107 of the metadata file 112 is extracted and associated with the content file 106 as described later. Then, the metadata 107 is transmitted to the content / metadata management server 105.
  • step 311 in the case where the file type is the error file 113, the error file 113 is deleted from the metadata 107 in which the error has been eliminated by performing the processing described later.
  • step 309 the file transfer processing unit 111 determines whether or not the file list is empty, that is, processing has been completed for all file names. If the above processing has not been completed for all file names, the process returns to step 303 and the above processing is repeated. On the other hand, if the above processing is completed for all the file names, the processing ends.
  • FIG. 12 is a flowchart showing an example of processing related to the metadata file performed in step 310 of FIG.
  • step 401 the association processing unit 114 of the file server 104 searches the received file for the content file 106 corresponding to the metadata file 112 currently extracted from the file list.
  • step 402 the association processing unit 114 of the file server 104 determines whether or not the content file 106 corresponding to the metadata file 112 exists, and if the content file 106 exists, the process proceeds to step 403. On the other hand, if the content file 106 does not exist, the process ends, and the process returns to the process of FIG.
  • step 403 the file transfer processing unit 111 of the file server 104 extracts the metadata 107 from the metadata file 112, and determines whether the metadata 107 can be registered (overwritten) in the content file 106 having a correspondence relationship. .
  • step 404 the file transfer processing unit 111 of the file server 104 determines whether or not the metadata 107 can be registered. If registration is possible, the process proceeds to step 405. If registration is not possible, the process proceeds to step 408.
  • step 408 if a plurality of metadata 107 can be added to the content file 106, a free area is acquired from the plurality of metadata storage areas. If there is no free space, the process of FIG. 12 may be terminated and the process may return to the process of FIG.
  • the file transfer processing unit 111 requests the content / metadata management server 105 to register the currently processed metadata 107 in the corresponding content file 106.
  • the file transfer processing unit 111 indicates that the content file 106 and the metadata 107 are transferred asynchronously.
  • the content / metadata management server 105 that has received the metadata 107 asynchronously with the content file 106 adds the received metadata 107 to the corresponding content file 106.
  • step 406 the file transfer processing unit 111 determines whether or not the registration of the metadata 107 has succeeded. If successful, the process proceeds to step 407. If unsuccessful, the process proceeds to step 409.
  • step 407 where the registration is successful the file transfer processing unit 111 stubs the metadata file 112.
  • the entity of the metadata file 112 registered in the content / metadata management server 105 is deleted from the file server 104, and only the attribute information 1602 of the metadata file 112 is left in the file server 104. It shows that.
  • the metadata attribute information 1602 can be held while suppressing the capacity of the storage device 23 used by the file server 104.
  • the association processing unit 114 generates a file name of the error file 113 from the file name of the metadata file 112 according to the association rule 115 in step 409. To do.
  • the file transfer processing unit 111 receives the content of the failed registration of the metadata 107 from the metadata analysis unit 121 of the content / metadata management server 105, and describes this content in the error file 113. Then, the error file 113 is generated with the generated file name.
  • the metadata 107 is extracted and the content / metadata management server 105 is requested to register. If the registration is successful, only the attribute information 1602 of the metadata file 112 is held in the file server 104, and the entity of the metadata file 112 is deleted. On the other hand, if registration fails, an error file 113 corresponding to the file name of the metadata file 112 is generated.
  • FIG. 13 is a flowchart showing an example of processing related to the error file 113 performed in step 311 of FIG.
  • step 501 the association processing unit 114 of the file server 104 searches the file received by the file server 104 for the metadata file 112 corresponding to the error file 113 currently extracted from the file list.
  • step 502 the association processing unit 114 of the file server 104 determines whether or not the metadata file 112 corresponding to the error file 113 exists, and if the metadata file 112 exists, the process proceeds to step 503. On the other hand, if the metadata file 112 does not exist, it is determined that the metadata file 112 has been deleted, and the process proceeds to step 505 where the error file 113 is also deleted. Thereafter, the process of FIG. 13 is terminated, and the process returns to the process of FIG.
  • step 502 the association processing unit 114 of the file server 104 compares the update time of the error file 113 with the update time of the metadata file 112, and sets the update time of the metadata file 112 higher than the update time of the error file 113. To determine if it is newer.
  • the error file 113 is the content of an error that has occurred in the past, so the process proceeds to step 505 and the error processing unit 116 deletes the error file 113.
  • the error file 113 is retained.
  • the error processing unit 116 deletes the past error file 113 and the other error files 113 are files. Held in the server 104. After the above process is completed, the process returns to the process of FIG.
  • the file server 104 can automatically register the content file 106 and the metadata 107 in association with the content / metadata management server 105. At this time, the file server 104 asynchronously transmits the content file 106 and the metadata 107 to the content / metadata management server 105.
  • the content ETL server 103 generates the metadata 107 from the content information 1071 corresponding to the file name 1070 of the content file 106. Then, the content ETL server 103 associates the metadata 107 and the content file 106 and transmits them to the file server 104. In the file server 104, registration of the file to the content / metadata management server 105 is executed at a predetermined timing.
  • the file server 104 extracts the metadata 107 in the metadata file 112 having a correspondence relationship with the content file 106, associates the metadata 107 with the content file 106, and registers it in the content / metadata management server 105. This association can be realized using a known or well-known method such as adding metadata 107 to the content file 106 or incorporating the metadata 107 into the content file 106.
  • the metadata 107 requested to be registered is inspected by the metadata analysis unit 121. If the metadata 107 has an invalid description or value, the content file 106 is not registered. The contents of the error are notified to the file server 104. The file server 104 generates and holds an error file 113 from the contents of the error.
  • the user of the content management database 102 can grasp that there is an error in the content of the metadata 107 registered in the content management database 102 by accessing the error file 113 of the file server 104 from a client (not shown).
  • FIG. 14 shows a second embodiment in which the content information 1071 is included in the content file 106A.
  • information such as the document creator and the corrector can be extracted as the content information 1071.
  • the character information can be extracted as the content information 1071.
  • the content management database 102 of the first embodiment and the DB crawler processing unit 109 of the content ETL server 103 are deleted, while the content ETL server 103 stores the metadata 107 and the metadata 107 and the content information 1071.
  • a metadata extraction unit 701 for generating the metadata file 112 is added.
  • Other configurations are the same as those of the first embodiment.
  • the content file server 101, the content ETL server 103, the file server 104, and the content / metadata management server 105 are connected via the network 100 of FIG. 1 as in the first embodiment.
  • the input unit 117 of the file server 104 reads the content file 106A, and the metadata extraction unit 701 of the content ETL server 103 extracts the metadata 107 from the content information 1071 at a predetermined timing.
  • a data file 112 is generated.
  • the content ETL server 103 transmits the content file 106A corresponding to the metadata file 112 to the file server 104.
  • the file server 104 associates the metadata 107 with the content file 106 and registers it in the content / metadata management server 105.
  • the content / metadata management server 105 notifies the file server 104 of an error if the metadata 107 is invalid.
  • the file server 104 generates an error file 113 based on the error notification.
  • the user of the content file server 101 can know the error included in the content information 1071 of the content file 106 ⁇ / b> A registered in the file server 104 by accessing the error file 113.
  • FIG. 15 is a flowchart illustrating an example of processing performed by the content ETL server 103. Similar to the first embodiment, this process is executed when a predetermined condition is met, such as when a predetermined period or the load on the file server 104 decreases.
  • the file access processing unit 108 of the content ETL server 103 first acquires the content file 106A from the file server 104 in step 801.
  • the metadata extraction unit 701 of the content ETL server 103 extracts the metadata 107 from the content information 1071 of the content file 106A.
  • the mapping rule 110 can be used if the content information 1071 of the content file 106A is typical.
  • the mapping rule 110 may not be used in the content file 106A in which the content information 1071 is indefinite, such as digital television broadcasting in which character information is added to the moving image.
  • step 803 in order to convert the metadata 107 into the metadata file 112, the file access processing unit 108 generates a file name for the metadata file based on the file name of the content file 106A.
  • the file name of the metadata file 112 is the same as that in the first embodiment, and is ““. ”+” File name ”+”. Meta ”” as in the association rule 115 in FIG. 5A.
  • step 804 the content ETL server 103 transmits the content file 106A acquired by the file access processing unit 108 and the metadata file 112 generated by the metadata extraction unit 701 to the file server 104.
  • the file server 104 and the content file 106 and the meta data are transmitted via the content ETL server 103.
  • Data 107 can be automatically registered in the content / metadata management server 105 in association with each other and asynchronously.
  • the metadata 107 requested to be registered is inspected by the metadata analysis unit 121. If the metadata 107 has an invalid description or value, the content file 106 is not registered. The contents of the error are notified to the file server 104. The file server 104 generates and holds an error file 113 from the contents of the error.
  • the user of the file server 104 can grasp that there is an error in the content of the metadata 107 registered in the content management database 102 by accessing the error file 113 of the file server 104 from a client (not shown).
  • FIG. 16 shows a third embodiment, in which the content file server 101, the content management database 102, and the content ETL server 103 are deleted from the computer system of the first embodiment, while the content file 106 is created in advance.
  • a computer 901 for storing the metadata file 112 is provided.
  • the computer 901 includes a notification unit 910 that notifies the file server 104 when an addition or update occurs in a file to be stored.
  • the notification unit 910 can be configured by a file system notification function, for example.
  • the input unit 117 of the file server 104 Upon receiving a file update notification from the computer 901, the input unit 117 of the file server 104 reads the updated or added content file 106 or metadata file 112.
  • the metadata file 112 is data created in advance by the user of the content file 106 or the like.
  • the file server 104 registers the content file 106 and the metadata file 112 read in response to the notification asynchronously with the content / metadata management server 105 in association with the content file 106 and the metadata 107.
  • 104 and the content / metadata management server 105 are configured in the same manner as in the first embodiment.
  • the file server 104, the content / metadata management server 105, and the computer 901 are assumed to be connected via the network 100 shown in FIG. 1 as in the first embodiment.
  • the computer 901 can be configured by a device having a file system such as NAS (Network Attached Storage).
  • the processing for the error file 113 shown in FIG. 13 in the processing performed by the file server 104 of the first embodiment is changed to the processing shown in FIG.
  • FIG. 17 is a flowchart showing an example of processing related to the error file 113 performed in step 311 shown in FIG. 10 of the first embodiment.
  • step 1001 the file access processing unit 108 of the file server 104 receives the notification from the computer 901, and detects that the file has been updated or added to the computer 901.
  • step 1002 the file server 104 acquires a file for which a notification is received from the computer 901. Then, it is determined whether or not the acquired file is the metadata file 112. In step 1003, if the metadata file 112, the process proceeds to step 1004. On the other hand, if it is not the metadata file 112, the process of FIG. 17 is complete
  • step 1004 the file server 104 determines whether or not there is an error file 113 for the acquired metadata file 112. In step 1005, if the error file 113 exists, the process proceeds to step 1006 and the error file 113 is deleted. On the other hand, if the error file 113 corresponding to the metadata file 112 does not exist, the process of FIG. 17 is terminated and the process returns to the process of FIG.
  • the file server 104 associates the content file 106 with the metadata 107 and asynchronously executes the content / It can be automatically registered in the metadata management server 105.
  • the metadata 107 requested to be registered is inspected by the metadata analysis unit 121. If the metadata 107 has an invalid description or value, the content file 106 is not registered. The contents of the error are notified to the file server 104. The file server 104 generates and holds an error file 113 from the contents of the error.
  • the user of the file server 104 can grasp that there is an error in the content of the metadata 107 registered in the content management database 102 by accessing the error file 113 of the file server 104 from the computer 901 or the like.
  • the file server 104 may have a notification part.
  • a notification function included in the file system of the file server 104 can be used as the notification unit. In this case, when the content file 106 and the metadata file 112 are written from the computer 901 to the input unit 117 of the file server 104, the file system of the file server 104 notifies the input unit 117 of the file writing.
  • FIG. 18 shows a fourth embodiment, and shows an example in which content information 1071 is included in the content file 106A, as in the second embodiment.
  • a content file 106A including content information 1071 is stored in the content file server 101 and transmitted to the content ETL server 103 at a predetermined timing.
  • the content file 106A is, for example, an image, and the content information 1071 includes a PID (patient identifier), name, age, and the like.
  • PID patient identifier
  • the content file server 101 transfers the content file to the content ETL server 103.
  • the content ETL server 103 When the content ETL server 103 receives the content file 106A from the content file server 101, the content ETL server 103 extracts the metadata 107 from the content file 106A to generate a metadata file 112, and sends the content file 106A and the metadata file 112 to the file server 104. Forward.
  • the file server 104 asynchronously registers the content file 106A and the metadata 107 in the content / metadata management server 105, as in the first embodiment.
  • the content ETL server 103 receives the content file 106A from a device that transmits the content file 106A in the push type, and transmits the metadata file 112 and the content file 106A extracted from the received content file 106A to the file server 104.
  • This is different from the second embodiment.
  • Other configurations are the same as those of the second embodiment.
  • PACS Picture Archiving and Communication Systems
  • CT Computer Tomography
  • MRI Magnetic Resonance Imaging
  • It can be configured by a device that outputs image data as a content file 106A, such as a server device.
  • the timing at which the content ETL server 103 accepts the content file 106A is different from that in the second embodiment. Therefore, instead of the flowchart of FIG. 15 shown in the second embodiment, FIG. Execute the flowchart.
  • FIG. 19 is a flowchart showing an example of processing performed in the content ETL server 103. This process is executed when the content file 106A is received.
  • the file access processing unit 108 of the content ETL server 103 first accepts the content file 106A received from the content file server 101 in step 1201.
  • the metadata extraction unit 701 of the content ETL server 103 extracts the metadata 107 from the content information 1071 in the content file 106A.
  • the mapping rule 110 can be used if the content information 1071 of the content file 106A is typical.
  • the mapping rule 110 may not be used in the content file 106A in which the content information 1071 is indefinite, such as digital television broadcasting in which character information is added to the moving image.
  • step 1203 in order to convert the metadata 107 into the metadata file 112 based on the file name of the content file 106A, the file access processing unit 108 generates a file name for the metadata file.
  • the file name of the metadata file 112 is the same as that in the first embodiment, and is ““. ”+” File name ”+”. Meta ”” as in the association rule 115 in FIG. 5A.
  • step 1204 the content ETL server 103 transmits the content file 106A acquired by the file access processing unit 108 and the metadata file 112 generated by the metadata extraction unit 701 to the file server 104.
  • the file server 104 and the content file 106 and the meta data are transmitted via the content ETL server 103.
  • Data 107 can be automatically registered in the content / metadata management server 105 in association with each other and asynchronously.
  • the metadata 107 requested to be registered is inspected by the metadata analysis unit 121. If the metadata 107 has an invalid description or value, the content file 106 is not registered. The contents of the error are notified to the file server 104. The file server 104 generates and holds an error file 113 from the contents of the error.
  • the user of the file server 104 can grasp that there is an error in the content of the metadata 107 registered in the content management database 102 by accessing the error file 113 of the file server 104 from a client (not shown).
  • the configuration of the computer, the processing unit, and the processing unit described in the present invention may be partially or entirely realized by dedicated hardware.
  • the various software illustrated in the above embodiments can be stored in various recording media (for example, non-transitory storage media) such as electromagnetic, electronic, and optical, and through a communication network such as the Internet. Can be downloaded to your computer.
  • recording media for example, non-transitory storage media
  • a communication network such as the Internet.
  • the present invention is not limited to the above-described embodiments, and includes various modifications.
  • the above-described embodiments have been described in detail for easy understanding of the present invention, and are not necessarily limited to those having all the configurations described.

Abstract

 コンテンツファイルとメタデータを管理するメタデータ管理システムであって、第1の計算機は、コンテンツファイルと、当該コンテンツファイルに対応するメタデータファイルを受信する入力部と、前記メタデータファイルからメタデータを抽出し、当該メタデータを前記対応するコンテンツファイルに関連付ける関連付け処理部と、前記メタデータと、当該メタデータを関連付けたコンテンツファイルとを非同期で管理サーバに送信して登録を要求するファイル転送処理部と、前記管理サーバからエラーの通知を受信したときには、前記登録を要求したメタデータに関するエラーファイルを生成するエラー処理部と、を有し、前記管理サーバは、前記登録を要求されたメタデータのエラーを検知し、エラーを検知したときには前記第1の計算機に通知する解析部を有する。

Description

メタデータ管理システム、メタデータ管理方法及び記憶媒体
 本発明は、メタデータとコンテンツファイルを対応付けて管理する計算機システムに関する。
 近年、動画データ、写真データや音声データなどのコンテンツが増大し、コンテンツの作成日、作成場所や作成者などのメタデータと関連付けて管理することが望まれている。写真データと撮影日などのメタデータをファイルで管理する技術としては、例えば、非特許文献1に記載されたFlickrファイルシステムが知られている。このFlickrファイルシステムは、仮想ファイルシステムで構成されており、Flickrファイルシステム上の写真データのファイルと、写真のメタデータが記述されたファイルへの書き込みにより、Flickrサーバへ同期的にデータがアップロードされる。また、Flickrファイルシステム上の写真データのファイルと、写真のメタデータが記述されたファイルの読み出しは、Flickrサーバから同期的にデータがダウンロードされる。そして、Flickrファイルシステムでは、メタデータをタグとして、写真データを検索する際のキーワードに利用している。
Manish Rai Jain、"flickrfs"、[online]、[平成24年9月27日検索]、インターネット(URL:https://sites.google.com/site/manishrjain/flickrfs)
 しかしながら、上記従来のFlickrファイルシステムでは、クライアントに格納された写真データやメタデータを、同期的にFlickrサーバへアップロードまたはダウンロードするため、データが多い場合には、応答時間が遅い、という問題があった。
 一方、同期的な書き込みに代わって、非同期でサーバへコンテンツとメタデータを転送することが考えられる。しかしながら、非同期の場合では、メタデータの記述に誤りがあっても、実際に転送が行われるまでは当該誤りをユーザに通知することができない、という問題があった。
 そこで本発明は、上記問題点等に鑑みてなされたもので、非同期でコンテンツとメタデータをサーバへ転送する際に、コンテンツとメタデータの対応関係を管理することを主な目的とする。
 上記の課題等を解決する為に、例えば請求項1に記載の発明を適用する。即ちコンテンツファイルとメタデータを管理するメタデータ管理システムであって、プロセッサとメモリを備えた第1の計算機と、プロセッサとメモリと記憶装置を備えて前記コンテンツファイル及びメタデータを格納する管理サーバが通信可能に接続され、前記第1の計算機と、管理サーバとを接続するネットワークと、を備え、前記第1の計算機は、コンテンツファイルと、当該コンテンツファイルに対応するメタデータファイルを受信する入力部と、前記メタデータファイルからメタデータを抽出し、当該メタデータを前記対応するコンテンツファイルに関連付ける関連付け処理部と、前記メタデータと、当該メタデータを関連付けたコンテンツファイルとを非同期で管理サーバに送信して登録を要求するファイル転送処理部と、前記管理サーバからエラーの通知を受信したときには、前記登録を要求したメタデータに関するエラーファイルを生成するエラー処理部と、を有し、前記管理サーバは、前記登録を要求されたメタデータのエラーを検知し、エラーを検知したときには前記第1の計算機に通知する解析部を有する。
 本発明によれば、コンテンツと、メタデータとを非同期で転送する際に、それらの対応関係を管理することができる。
本発明の第1の実施例を示し、計算機システムの一例を示すブロック図である。 本発明の第1の実施例を示し、コンテンツETLサーバの一例を示すブロック図である。 本発明の第1の実施例を示し、ファイルサーバの一例を示すブロック図である。 本発明の第1の実施例を示し、コンテンツ/メタデータ管理サーバの一例を示すブロック図である。 本発明の第1の実施例を示し、関連付けルールの一例を示し、ファイルの種類とファイル名の設定ルールを示す図である。 本発明の第1の実施例を示し、関連付けルールの一例を示し、ファイルの種類とファイル名の一例を示す図である。 本発明の第1の実施例を示し、コンテンツ管理データベースに格納されるメタデータの一例を示す図である。 本発明の第1の実施例を示し、エラーファイルに格納されるデータの一例を示す図である。 本発明の第1の実施例を示し、マッピングルールの一例を示す図である。 本発明の第1の実施例を示し、コンテンツETLサーバで行われる処理の一例を示すフローチャートである。 本発明の第1の実施例を示し、ファイルサーバで行われる処理の一例を示すフローチャートである。 本発明の第1の実施例を示し、スタブ化の一例を示すブロック図である。 本発明の第1の実施例を示し、ファイルサーバで行われる処理で、図11のステップ310で行われる処理の一例を示すフローチャートである。 本発明の第1の実施例を示し、ファイルサーバで行われる処理で、図11のステップ311で行われる処理の一例を示すフローチャートである。 本発明の第2の実施例を示し、計算機システムの一例を示すブロック図である。 本発明の第2の実施例を示し、コンテンツETLサーバで行われる処理の一例を示すフローチャートである。 本発明の第3の実施例を示し、計算機システムの一例を示すブロック図である。 本発明の第3の実施例を示し、ファイルサーバで行われる処理の一例を示すフローチャートである。 本発明の第4の実施例を示し、計算機システムの一例を示すブロック図である。 本発明の第4の実施例を示し、コンテンツETLサーバで行われる処理の一例を示すフローチャートである。
 以下、本発明の一実施形態について添付図面を用いて説明する。
 図1は、本発明の第1の実施例を示し、計算機システムの一例を示すブロック図である。
 図1において計算機システムは、コンテンツファイルとメタデータを管理するコンテンツETL(Extract、Transform、Load)サーバ103と、コンテンツETLサーバ103からコンテンツファイル106とメタデータファイル112を受信して関連付けを行うファイルサーバ104と、ファイルサーバ104が設定した関連付けに従ってコンテンツファイル106とメタデータ107を格納するコンテンツ/メタデータ管理サーバ105と、各サーバを接続するネットワーク100を含む。
 コンテンツETLサーバ103は、コンテンツファイルサーバ101に格納されたコンテンツファイル106と、コンテンツファイル106を管理するコンテンツ管理データベース102から情報を取得する。
 コンテンツETLサーバ103は、コンテンツ管理データベース102に格納されたコンテンツファイル106に関するファイル名1070とコンテンツ情報1071と、コンテンツファイルサーバ101に格納されたコンテンツファイル106と、を読み込んでから、後述する処理によって、コンテンツファイル106とメタデータファイル112のペアを生成する。なお、コンテンツ管理データベース102は、ファイル名1070とコンテンツ情報1071から構成される。
 コンテンツETLサーバ103は、コンテンツファイル106に対応するコンテンツ情報1071からメタデータ107を抽出し、メタデータ107の内容を記述したメタデータファイル112として生成する。
 なお、コンテンツファイルサーバ101とコンテンツ管理データベース102は、同一の計算機で提供しても良いし、異なる計算機で提供してもよい。
 コンテンツファイルサーバ101には、画像、動画、音声、書類などの非構造化データで構成されたコンテンツを含むコンテンツファイル106が格納されている。
 コンテンツ管理データベース102は、コンテンツファイル106のファイル名1070と、コンテンツの属性などを含むコンテンツ情報1071を格納し、コンテンツファイルサーバ101のコンテンツファイル106を管理する。
 コンテンツETLサーバ103は、予め設定したタイミングでコンテンツ管理データベース102からファイル名1070とコンテンツ情報1071を取得してメタデータ107を生成するDBクローラ処理部109と、取得したファイル名1070に対応するコンテンツファイル106をコンテンツファイルサーバ101から取得するファイルアクセス処理部108を有する。
 コンテンツETLサーバ103は、コンテンツ管理データベース102から取得したコンテンツ情報1071からメタデータ107を生成し、メタデータ107の内容でメタデータファイル112を生成する。そして、コンテンツETLサーバ103は、取得したファイル名1070に対応するコンテンツファイル106と、ファイル名1070に対応するメタデータファイル112を組にしてファイルサーバ104へ送信する。なお、コンテンツ情報1071は属性情報としてもよい。
 ファイルサーバ104は、コンテンツファイル106とメタデータファイル112の受信を行う入力部117と、コンテンツファイル106とメタデータ107の送信を行うファイル転送処理部111と、予め設定した関連付けルール115に基づいてコンテンツファイル106とメタデータファイル112の関連付けを行う関連付け処理部114と、メタデータファイル112に誤りのある場合にエラーファイル113を生成するエラー処理部116と、を有する。
 ファイルサーバ104は、関連付けの完了したコンテンツファイル106とメタデータ107を非同期でコンテンツ/メタデータ管理サーバ105に登録する。
 ファイルサーバ104は、入力部117でコンテンツETLサーバ103から受信したコンテンツファイル106のうち、コンテンツ/メタデータ管理サーバ105に登録されていないコンテンツファイル106を未登録ファイルとして抽出する。ファイルサーバ104は、受信したコンテンツファイル106とメタデータファイル112の組について、予め設定した関連付けルール115を用いてコンテンツファイル106とメタデータファイル112の関連付けを行う。そして、ファイルサーバ104は、この関連付けの際に、メタデータファイル112からメタデータ107を抽出する。ファイルサーバ104は、抽出したメタデータ107をコンテンツファイル106に関連付けてコンテンツ/メタデータ管理サーバ105に非同期で登録する。この関連付けは、例えば、コンテンツファイル106にメタデータ107を付加することで行われる。ここで、ファイルサーバ104の非同期の書き込みは、ファイルサーバ104へのコンテンツファイル106の書き込みと、ファイルサーバ104からコンテンツ/メタデータ管理サーバ105への書き込みが非同期であることを示す。なお、以下の説明でも、非同期の意味は同様である。
 コンテンツ/メタデータ管理サーバ105は、ファイルサーバ104によってメタデータ107が関連付けられたコンテンツファイル106を格納する。コンテンツ/メタデータ管理サーバ105は、ファイルサーバ104から受信したコンテンツファイル106とメタデータ107を記憶装置33に格納する管理部122と、ファイルサーバ104から受信したメタデータ107を解析するメタデータ解析部121とを有する。
 メタデータ解析部121は、受信したメタデータ107を解析し、メタデータの記述や値に誤りがあった場合、ファイルサーバ104のエラー処理部116にエラーの発生を通知する。
 ファイルサーバ104のエラー処理部116は、コンテンツ/メタデータ管理サーバ105からメタデータ107にエラーが発生した通知を受信すると、当該メタデータ107(ファイルサーバ104のメタデータファイル112)に対応するエラーファイル113を、後述するように生成する。
 ここで、メタデータ解析部121が検出するメタデータ107のエラーは、例えば、メタデータ107がXMLで記述される場合、XMLの文法や値が不正であればエラーとして検出する。
 図2は、コンテンツETLサーバ103の一例を示すブロック図である。コンテンツETLサーバ103は、演算を実行するプロセッサ10と、プログラムやデータを保持するメモリ11と、ネットワーク100やコンテンツファイルサーバ101、コンテンツ管理データベース102に接続するネットワークアダプタ12と、プログラムやデータを格納する記憶装置13と、を含む計算機である。
 メモリ11には、ファイルアクセス処理部108とDBクローラ処理部109がロードされプロセッサ10によって実行される。DBクローラ処理部109とファイルアクセス処理部108は、関連付けを行うコンテンツファイル106とメタデータ107及びメタデータファイル112、マッピングルール110をメモリ11に読み込むことができる。
 プロセッサ10は、各機能部のプログラムに従って動作することによって、所定の機能を実現する機能部として動作する。例えば、プロセッサ10は、DBクローラ処理部プログラムに従って動作することでDBクローラ処理部109として機能する。他のプログラムについても同様である。さらに、プロセッサ10は、各プログラムが実行する複数の処理のそれぞれを実現する機能部としても動作する。計算機及び計算機システムは、これらの機能部を含む装置及びシステムである。
 コンテンツETLサーバ103の各機能を実現するプログラム、テーブル等の情報は、記憶装置13や不揮発性半導体メモリ、ハードディスクドライブ、SSD(Solid State Drive)等の記憶デバイス、または、ICカード、SDカード、DVD等の計算機読み取り可能な非一時的データ記憶媒体に格納することができる。
 図3は、ファイルサーバ104の一例を示すブロック図である。ファイルサーバ104は、演算を実行するプロセッサ20と、プログラムやデータを保持するメモリ21と、ネットワーク100に接続するネットワークアダプタ22と、プログラムやデータを格納する記憶装置23と、を含む計算機である。
 メモリ21には、入力部117と、ファイル転送処理部111と、関連付け処理部114と、エラー処理部116がロードされプロセッサ20によって実行される。各処理部は、関連付けを行うコンテンツファイル106とメタデータ(メタデータファイル112)と、関連付けルール115、エラーファイル113をメモリ11に読み込むことができる。なお、エラーファイル113は、記憶装置13に格納するようにしても良い。
 プロセッサ20は、各機能部のプログラムに従って動作することによって、所定の機能を実現する機能部として動作する。例えば、プロセッサ20は、関連付け処理プログラムに従って動作することで関連付け処理部114として機能する。他のプログラムについても同様である。さらに、プロセッサ20は、各プログラムが実行する複数の処理のそれぞれを実現する機能部としても動作する。計算機及び計算機システムは、これらの機能部を含む装置及びシステムである。
 ファイルサーバ104の各機能を実現するプログラム、テーブル等の情報は、記憶装置23や不揮発性半導体メモリ、ハードディスクドライブ、SSD(Solid State Drive)等の記憶デバイス、または、ICカード、SDカード、DVD等の計算機読み取り可能な非一時的データ記憶媒体に格納することができる。
 図4は、コンテンツ/メタデータ管理サーバ105の一例を示すブロック図である。コンテンツ/メタデータ管理サーバ105は、演算を実行するプロセッサ30と、プログラムやデータを保持するメモリ31と、ネットワーク100に接続するネットワークアダプタ32と、プログラムやデータを格納する記憶装置33と、を含む計算機である。
 メモリ31には、管理部122と、メタデータ解析部121がロードされプロセッサ30によって実行される。各機能部は、関連付けを行うコンテンツファイル106とメタデータ107と、をメモリ11に読み込むことができる。
 プロセッサ30は、各機能部のプログラムに従って動作することによって、所定の機能を実現する機能部として動作する。例えば、プロセッサ30は、メタデータ解析プログラムに従って動作することでメタデータ解析部121として機能する。他のプログラムについても同様である。さらに、プロセッサ30は、各プログラムが実行する複数の処理のそれぞれを実現する機能部としても動作する。計算機及び計算機システムは、これらの機能部を含む装置及びシステムである。
 コンテンツ/メタデータ管理サーバ105の各機能を実現するプログラム、テーブル等の情報は、記憶装置33や不揮発性半導体メモリ、ハードディスクドライブ、SSD(Solid State Drive)等の記憶デバイス、または、ICカード、SDカード、DVD等の計算機読み取り可能な非一時的データ記憶媒体に格納することができる。
 なお、コンテンツ/メタデータ管理サーバ105は、一つの計算機に限定されるものではなく、複数の仮想計算機で構成されたクラウドコンピュータで構成することができる。
 図5Aは、ファイルサーバ104の関連付けルール115の一例を示し、ファイルの種類とファイル名の関連付けルール115の一例を示す図である。
 図示の関連付けルール115では、コンテンツファイル106は、そのままのファイル名を適用し、メタデータファイル112には、ファイル名の前に「.」を付加し、ファイル名の後に「.meta」を付加する。また、エラーファイル113には、ファイル名の前に「.」を付加し、ファイル名の後に「.err」を付加する。
 図5Bは、関連付けルール115を適用したファイル名115-Bの一例を示す図である。
 コンテンツファイル106のファイル名が「photo.jpg」の場合、メタデータファイルのファイル名は、「.photo.jpg.meta」に設定され、同じくエラーファイル113のファイル名115-Bは、「.photo.jpg.err」に設定される。
 図6は、コンテンツ管理データベース102に格納されるテーブルの一例を示す図である。
 コンテンツ管理データベース102では、ファイル名1070とコンテンツ情報1071を主体としてひとつのレコードが構成される。図示の例では、コンテンツ情報1071が氏名1072と、年齢1073から構成された例を示す。図6の例では、コンテンツ管理データベース102は、ファイル名1070と、氏名1072と、年齢1073からひとつのレコードが構成される。そして、コンテンツETLサーバ103は、コンテンツ情報1071をマッピングルール110に基づいて抽出することでメタデータ107を生成することができる。そして、コンテンツETLサーバ103は、メタデータ107の内容を記載したメタデータファイル112を生成することができる。
 図7は、ファイルサーバ104で生成されるエラーファイル113の一例を示す図である。
 エラーファイル113には、コンテンツ/メタデータ管理サーバ105に登録されたメタデータ107のエラーの内容の一例としては、メタデータの記述エラー1131と、メタデータの値不正1132が含まれる。
 図8は、コンテンツETLサーバ103で使用されるマッピングルール110の一例を示す図である。
 マッピングルール110は、コンテンツ管理データベース102のコンテンツ情報1071の項目(図中DB内)1101と、メタデータ107の項目1102との対応関係が予め設定されたものである。図示の例では、コンテンツ管理データベース102の「PID」の項目1101が、メタデータ107の「Patient  ID」の項目1102に対応し、項目1101の「Name」がメタデータ107の項目1102の「Patient  Name」に対応し、項目1101の「Age」がメタデータ107の項目1102の「Age」に対応することが定義されている。
 なお、図8に示すPIDは、図6のコンテンツ管理データベース102のテーブルでは図示を省略した。
 また、後述するように、コンテンツETLサーバ103が、コンテンツ管理データベース102のコンテンツ情報1071からメタデータ107を生成する際に、マッピングルール110を参照する。
 図9は、コンテンツETLサーバ103で行われる処理の一例を示すフローチャートである。この処理は、所定の周期あるいはファイルサーバ104の負荷が低下したときなど、予め設定した条件となったときに実行される。
 コンテンツETLサーバ103のDBクローラ処理部109は、まず、ステップ201でコンテンツ管理データベース102を参照し、コンテンツファイル106のファイル名1070とコンテンツ情報1071を取得する。
 ステップ202では、コンテンツETLサーバ103のDBクローラ処理部109は、マッピングルール110に基づいて、コンテンツ管理データベース102のコンテンツ情報1071をメタデータ107に変換する。
 ステップ203では、DBクローラ処理部109がコンテンツ管理データベース102から取得したファイル名1070をファイルアクセス処理部108へ通知する。ファイルアクセス処理部108は、受け付けたファイル名1070のコンテンツファイル106をコンテンツファイルサーバ101から取得する。
 ステップ204では、DBクローラ処理部109がコンテンツ管理データベース102から変換したメタデータ107をメタデータファイル112に変換するため、ファイルアクセス処理部108がファイル名を生成する。メタデータファイル112のファイル名は、図5Aの関連付けルール115と同様に、「”.”+”ファイル名”+”.meta”」とする。
 そして、ステップ205では、コンテンツETLサーバ103は、ファイルアクセス処理部108が取得したコンテンツファイル106と、DBクローラ処理部109が生成したメタデータファイル112をファイルサーバ104へ送信する。
 上記処理を、コンテンツ管理データベース102内のファイル名1070について実行する。あるいは、上記処理を所定の周期で実行する際には、前回の処理が完了した以降にファイル名1070またはコンテンツ情報1071が追加または更新されたレコードについて上記処理を行うようにしてもよい。または、管理者などが指定した範囲のファイル名1070について上記処理を繰り返して行ってもよい。
 図10は、ファイルサーバ104で行われる処理の一例を示すフローチャートである。この処理は、所定の周期あるいはファイルサーバ104の負荷が低下したときなど、予め設定した条件となったときに実行される。ファイルサーバ104は、上記図9の処理でコンテンツETLサーバ103から受信したメタデータファイル112とコンテンツファイル106を関連付けて、コンテンツ/メタデータ管理サーバ105に登録する処理を図10の処理で実行する。
 ステップ301では、ファイルサーバ104のファイル転送処理部111が、コンテンツETLサーバ103から受信したメタデータファイル112とコンテンツファイル106のうち、コンテンツ/メタデータ管理サーバ105に転送すべき候補を抽出し、ファイルリスト(図示省略)を生成する。このファイルリストには、ファイルサーバ104が受信したコンテンツファイル106とメタデータファイル112に加えて、ファイルサーバ104のエラー処理部116が生成したエラーファイル113を含める。なお、ファイルリストは、例えば、ファイル名を格納したテーブルで構成すればよい。
 また、コンテンツ/メタデータ管理サーバ105に転送するか否かは、ファイルサーバ104に保持された属性情報から判定しても良い。例えば、コンテンツファイル106のタイムスタンプが属性情報1601(図11参照)より新しければ転送候補とし、また、メタデータファイル112のタイムスタンプが属性情報1602(図11参照)より新しければ転送候補とする。すなわち、未転送のファイルを転送候補とすればよい。
 次に、ステップ302では、ファイル転送処理部111が、生成したファイルリストをエラーファイル113、メタデータファイル112、コンテンツファイル106の順にファイル名でソートする。ファイルリストは、ファイルの種類毎にファイル名でソートされる。
 次に、ステップ303では、ファイル転送処理部111が、生成したファイルリストの先頭から順に、一つずつファイル名を取り出す。ステップ304では、ファイル転送処理部111は、取り出したファイル名についてファイルの種類を判定する。ファイルの種類は、ファイル名の拡張子から判定する。ファイル転送処理部111は、ファイル名の拡張子が「.meta」であればメタデータファイル112と判定し、ファイル名の拡張子が「.err」であればエラーファイル113と判定し、その他の拡張子であればコンテンツファイル106であると判定する。
 ステップ305では、ファイル転送処理部111が、現在取り出しているファイルの種類がメタデータファイル112であるか否かを判定する。ファイルの種類がメタデータファイル112であれば、ステップ310へ進み、そうで無ければステップ306に進む。
 ステップ306では、ファイル転送処理部111が、現在取り出しているファイルの種類がエラーファイル113であるか否かを判定する。ファイルの種類がエラーファイル113であれば、ステップ311へ進み、そうで無ければステップ307に進む。
 ステップ307では、取り出しているファイルの種類は、コンテンツファイル106であるので、ファイル転送処理部111は、当該ファイルをコンテンツ/メタデータ管理サーバ105に送信する。
 そして、ステップ308では、送信が完了したコンテンツファイル106をスタブ化する。ここで、スタブ化は、図11で示すように、コンテンツ/メタデータ管理サーバ105に登録したコンテンツファイル106の実体をファイルサーバ104から削除し、コンテンツファイル106の属性情報1601のみをファイルサーバ104に残すことを示す。この処理により、ファイルサーバ104が使用する記憶装置23の容量を抑制しながら、ファイルの所在等を属性情報1601に保持することができる。なお、図11は、スタブ化の一例を示すブロック図である。
 ファイルの種類がメタデータファイル112の場合のステップ310では、後述するようにメタデータファイル112のメタデータ107を抽出して、コンテンツファイル106に対応付ける。そして、当該メタデータ107をコンテンツ/メタデータ管理サーバ105に送信する。
 ファイルの種類がエラーファイル113の場合のステップ311では、後述する処理を行ってエラーの解消したメタデータ107についてエラーファイル113を削除する。
 そして、ステップ309では、ファイル転送処理部111はファイルリストが空、すなわち、全てのファイル名について処理が完了したか否かを判定する。全ての、ファイル名について上記処理が完了していなければ、ステップ303に復帰して上記処理を繰り返す。一方、全ての、ファイル名について上記処理が完了していれば、処理を終了する。
 図12は、図10のステップ310で行われるメタデータファイルに関する処理の一例を示すフローチャートである。
 ステップ401では、ファイルサーバ104の関連付け処理部114が、現在、ファイルリストから取り出しているメタデータファイル112に対応するコンテンツファイル106を受信したファイルの中から検索する。
 ステップ402では、ファイルサーバ104の関連付け処理部114が、メタデータファイル112に対応するコンテンツファイル106の有無を判定し、コンテンツファイル106が存在すればステップ403へ進む。一方、コンテンツファイル106が存在しなければ処理を終了し、図10の処理に戻る。
 ステップ403では、ファイルサーバ104のファイル転送処理部111が、メタデータファイル112からメタデータ107を抽出し、対応関係にあるコンテンツファイル106にメタデータ107を登録(上書き)可能であるかを判定する。
 ステップ404では、ファイルサーバ104のファイル転送処理部111が、メタデータ107を登録可能か否かを判定し、登録可能であればステップ405へ進み、登録できない場合にはステップ408へ進む。
 ステップ408では、コンテンツファイル106に複数のメタデータ107を付加可能な場合では、複数のメタデータ格納領域から空き領域を取得する。なお、空き領域がない場合には図12の処理を終了し、図10の処理へ復帰するようにしても良い。
 次に、ステップ405では、ファイル転送処理部111が、現在処理中のメタデータ107を、対応するコンテンツファイル106に登録するようにコンテンツ/メタデータ管理サーバ105に要求する。ここでは、ファイル転送処理部111がコンテンツファイル106とメタデータ107を非同期で転送することを示す。なお、メタデータ107をコンテンツファイル106といは非同期で受信したコンテンツ/メタデータ管理サーバ105では、受信したメタデータ107を対応するコンテンツファイル106に付加する。
 ステップ406では、ファイル転送処理部111がメタデータ107の登録が成功したか否かを判定し、成功した場合にはステップ407へ進み、失敗した場合にはステップ409へ進む。
 登録に成功したステップ407では、ファイル転送処理部111がメタデータファイル112のスタブ化を実施する。この処理は、図11で示すように、コンテンツ/メタデータ管理サーバ105に登録したメタデータファイル112の実体をファイルサーバ104から削除し、メタデータファイル112の属性情報1602のみをファイルサーバ104に残すことを示す。この処理により、ファイルサーバ104が使用する記憶装置23の容量を抑制しながら、メタデータの属性情報1602を保持することができる。
 一方、メタデータ107をコンテンツ/メタデータ管理サーバ105に登録できなかった場合は、ステップ409で関連付け処理部114がメタデータファイル112のファイル名から、関連付けルール115に従ってエラーファイル113のファイル名を生成する。次に、ステップ410では、ファイル転送処理部111はメタデータ107の登録が失敗した内容をコンテンツ/メタデータ管理サーバ105のメタデータ解析部121から受信し、この内容をエラーファイル113に記述して、上記生成したファイル名でエラーファイル113を生成する。
 以上の処理により、ファイルの種類がメタデータファイル112の場合には、メタデータ107を抽出してコンテンツ/メタデータ管理サーバ105に登録を要求する。そして、登録に成功した場合には、メタデータファイル112の属性情報1602のみをファイルサーバ104に保持して、メタデータファイル112の実体を削除する。一方、登録に失敗した場合には、メタデータファイル112のファイル名に対応するエラーファイル113を生成する。
 図13は、図10のステップ311で行われるエラーファイル113に関する処理の一例を示すフローチャートである。
 ステップ501では、ファイルサーバ104の関連付け処理部114が、現在、ファイルリストから取り出しているエラーファイル113に対応するメタデータファイル112を、ファイルサーバ104で受信したファイルの中から検索する。
 ステップ502では、ファイルサーバ104の関連付け処理部114が、エラーファイル113に対応するメタデータファイル112の有無を判定し、メタデータファイル112が存在すればステップ503へ進む。一方、メタデータファイル112が存在しなければ削除されたと判定してステップ505へ進み、当該エラーファイル113も削除する。その後、図13の処理を終了し、図10の処理に戻る。
 ステップ502では、ファイルサーバ104の関連付け処理部114が、エラーファイル113の更新時刻と、メタデータファイル112の更新時刻を比較して、エラーファイル113の更新時刻よりもメタデータファイル112の更新時刻の方が新しいか否かを判定する。
 メタデータファイル112の更新時刻の方が新しい場合は、エラーファイル113は過去に発生したエラーの内容であるので、ステップ505に進んでエラー処理部116は当該エラーファイル113を削除する。
 メタデータファイル112の更新時刻がエラーファイル113よりも新しくない場合は、エラーファイル113を保持する。
 以上の処理により、メタデータファイル112が削除された場合や、新しいメタデータファイル112が書き込まれた場合には、エラー処理部116が過去のエラーファイル113を削除し、その他のエラーファイル113はファイルサーバ104に保持する。上記処理が完了した後は、図10の処理に復帰する。
 以上のように、第1の実施例では、計算機システムの利用者が、コンテンツファイル106をコンテンツファイルサーバ101に登録し、コンテンツファイル106の情報をコンテンツ管理データベース102に登録すると、コンテンツETLサーバ103を介してファイルサーバ104はコンテンツファイル106とメタデータ107を関連付けてコンテンツ/メタデータ管理サーバ105へ自動的に登録することができる。このとき、ファイルサーバ104は、コンテンツファイル106とメタデータ107を非同期でコンテンツ/メタデータ管理サーバ105に送信する。
 コンテンツETLサーバ103は、コンテンツファイル106のファイル名1070に対応するコンテンツ情報1071からメタデータ107を生成する。そして、コンテンツETLサーバ103は、メタデータ107とコンテンツファイル106を対応付けてファイルサーバ104に送信する。ファイルサーバ104では、所定のタイミングになるとコンテンツ/メタデータ管理サーバ105へのファイルの登録が実行される。ファイルサーバ104は、コンテンツファイル106と対応関係のあるメタデータファイル112内のメタデータ107を抽出し、コンテンツファイル106にメタデータ107を関連付けてコンテンツ/メタデータ管理サーバ105に登録する。この関連付けは、例えば、コンテンツファイル106にメタデータ107を付加したり、コンテンツファイル106にメタデータ107を組み込むこと等公知または周知の手法を用いて実現することができる。
 そして、コンテンツ/メタデータ管理サーバ105では、登録の要求のあったメタデータ107をメタデータ解析部121で検査し、メタデータ107に不正な記述や値があればコンテンツファイル106を登録せずにファイルサーバ104にエラーの内容を通知する。ファイルサーバ104では、エラーの内容からエラーファイル113を生成して保持する。
 コンテンツ管理データベース102の利用者は図示しないクライアントからファイルサーバ104のエラーファイル113にアクセスすることで、コンテンツ管理データベース102に登録したメタデータ107の内容に誤りがあったことを把握できる。
 図14は、第2の実施例を示し、コンテンツファイル106Aにコンテンツ情報1071が含まれる例を示す。コンテンツファイル106として文書ファイルを採用する場合、文書の作成者や添削者などの情報をコンテンツ情報1071として抽出することができる。また、デジタルテレビ放送など、動画と文字情報を含むファイルをコンテンツファイル106とする場合、文字情報をコンテンツ情報1071として抽出することができる。
 第2の実施例では、前記第1の実施例のコンテンツ管理データベース102と、コンテンツETLサーバ103のDBクローラ処理部109を削除する一方、コンテンツETLサーバ103には、コンテンツ情報1071からメタデータ107及びメタデータファイル112を生成するメタデータ抽出部701を加えた。その他の構成は前記第1の実施例と同様である。なお、コンテンツファイルサーバ101、コンテンツETLサーバ103、ファイルサーバ104及びコンテンツ/メタデータ管理サーバ105は、前記第1の実施例と同様に図1のネットワーク100を介して接続されている。
 本実施例2では、ファイルサーバ104の入力部117がコンテンツファイル106Aを読み込んでおき、所定のタイミングでコンテンツETLサーバ103のメタデータ抽出部701が、コンテンツ情報1071からメタデータ107を抽出し、メタデータファイル112を生成する。そして、コンテンツETLサーバ103は、メタデータファイル112に対応するコンテンツファイル106Aをファイルサーバ104へ送信する。以降は、第1の実施例と同様に、ファイルサーバ104が、コンテンツファイル106にメタデータ107を関連付けてコンテンツ/メタデータ管理サーバ105に登録する。そして、コンテンツ/メタデータ管理サーバ105は、不正なメタデータ107であればファイルサーバ104にエラーを通知する。ファイルサーバ104は、エラーの通知に基づいてエラーファイル113を生成する。コンテンツファイルサーバ101の利用者は、エラーファイル113にアクセスすることで、ファイルサーバ104へ登録したコンテンツファイル106Aのコンテンツ情報1071に含まれるエラーを知ることができる。
 図15は、コンテンツETLサーバ103で行われる処理の一例を示すフローチャートである。この処理は、前記第1の実施例と同様に、所定の周期あるいはファイルサーバ104の負荷が低下したときなど、予め設定した条件となったときに実行される。
 コンテンツETLサーバ103のファイルアクセス処理部108は、まず、ステップ801でファイルサーバ104からコンテンツファイル106Aを取得する。
 ステップ802では、コンテンツETLサーバ103のメタデータ抽出部701が、コンテンツファイル106Aのコンテンツ情報1071からメタデータ107を抽出する。なお、メタデータ107を抽出する際には、コンテンツファイル106Aのコンテンツ情報1071が定型的であれば、マッピングルール110を用いることができる。一方、動画に文字情報を加えたデジタルテレビ放送などコンテンツ情報1071が不定型なコンテンツファイル106Aでは、マッピングルール110は用いないでもよい。
 ステップ803では、メタデータ107をメタデータファイル112に変換するため、ファイルアクセス処理部108がコンテンツファイル106Aのファイル名に基づいて、メタデータファイル用のファイル名を生成する。メタデータファイル112のファイル名は、前記第1の実施例と同様であり、図5Aの関連付けルール115と同様に、「”.”+”ファイル名”+”.meta”」とする。
 そして、ステップ804では、コンテンツETLサーバ103は、ファイルアクセス処理部108が取得したコンテンツファイル106Aと、メタデータ抽出部701が生成したメタデータファイル112をファイルサーバ104へ送信する。
 その他のファイルサーバ104やコンテンツ/メタデータ管理サーバ105の処理は、前記第1の実施例と同様である。
 第2の実施例においても、計算機システムの利用者が、コンテンツファイル106Aをコンテンツファイルサーバ101に登録し、ファイルサーバ104へ送信すると、コンテンツETLサーバ103を介してファイルサーバ104はコンテンツファイル106とメタデータ107を関連付けて、かつ非同期でコンテンツ/メタデータ管理サーバ105へ自動的に登録することができる。
 そして、コンテンツ/メタデータ管理サーバ105では、登録の要求のあったメタデータ107をメタデータ解析部121で検査し、メタデータ107に不正な記述や値があればコンテンツファイル106を登録せずにファイルサーバ104にエラーの内容を通知する。ファイルサーバ104では、エラーの内容からエラーファイル113を生成して保持する。
 ファイルサーバ104の利用者は図示しないクライアントからファイルサーバ104のエラーファイル113にアクセスすることで、コンテンツ管理データベース102に登録したメタデータ107の内容に誤りがあったことを把握できる。
 図16は、第3の実施例を示し、前記第1の実施例の計算機システムからコンテンツファイルサーバ101、コンテンツ管理データベース102及びコンテンツETLサーバ103を削除する一方、コンテンツファイル106と、予め作成されたメタデータファイル112を格納する計算機901を設けたものである。そして、第3の実施例では、計算機901は、格納するファイルに追加や更新が発生するとファイルサーバ104に通知する通知部910を備える。通知部910は、例えば、ファイルシステムの通知機能で構成することができる。
 ファイルサーバ104の入力部117は、計算機901からファイルの更新の通知を受け付けると、更新または追加されたコンテンツファイル106またはメタデータファイル112を読み込む。なお、メタデータファイル112は、コンテンツファイル106のユーザ等が予め作成したデータである。
 ファイルサーバ104は、通知を受けて読み込んだコンテンツファイル106とメタデータファイル112を、コンテンツファイル106とメタデータ107を関連付けて、コンテンツ/メタデータ管理サーバ105に非同期で登録するものであり、ファイルサーバ104とコンテンツ/メタデータ管理サーバ105は、前記第1の実施例と同様に構成される。なお、ファイルサーバ104、コンテンツ/メタデータ管理サーバ105及び計算機901は、前記第1の実施例と同様に図1に示したネットワーク100を介して接続されるものとする。なお、計算機901は、NAS(Network Attached Storage)等のファイルシステムを備えた装置で構成することができる。
 第3の実施例では、前記第1の実施例のファイルサーバ104が実施する処理の内、図13に示したエラーファイル113に対する処理を、図17に示す処理に変更する。
 図17は、前記第1の実施例の図10に示したステップ311で行われるエラーファイル113に関する処理の一例を示すフローチャートである。
 ステップ1001では、ファイルサーバ104のファイルアクセス処理部108が、計算機901からの通知を受信し、計算機901にファイルの更新または追加が行われたことを検知する。
 ステップ1002では、ファイルサーバ104が計算機901から通知を受け付けたファイルを取得する。そして、取得したファイルがメタデータファイル112であるか否かを判定する。ステップ1003では、メタデータファイル112であればステップ1004へ進む。一方、メタデータファイル112でなければ図17の処理を終了して図10の処理に戻る。
 ステップ1004では、ファイルサーバ104が、取得したメタデータファイル112に対するエラーファイル113の有無を判定する。ステップ1005では、エラーファイル113が存在する場合、ステップ1006へ進んで当該エラーファイル113を削除する。一方、メタデータファイル112に対応するエラーファイル113が存在しない場合には、図17の処理を終了して図10の処理へ復帰する。
 第3の実施例においても、計算機システムの利用者が、コンテンツファイル106とメタデータファイル112を計算機901に登録すると、ファイルサーバ104はコンテンツファイル106とメタデータ107を関連付けて、かつ非同期でコンテンツ/メタデータ管理サーバ105へ自動的に登録することができる。
 そして、コンテンツ/メタデータ管理サーバ105では、登録の要求のあったメタデータ107をメタデータ解析部121で検査し、メタデータ107に不正な記述や値があればコンテンツファイル106を登録せずにファイルサーバ104にエラーの内容を通知する。ファイルサーバ104では、エラーの内容からエラーファイル113を生成して保持する。
 ファイルサーバ104の利用者は計算機901等からファイルサーバ104のエラーファイル113にアクセスすることで、コンテンツ管理データベース102に登録したメタデータ107の内容に誤りがあったことを把握できる。
 なお、上記では計算機901が通知部910を有する例を示したが、ファイルサーバ104が通知部を有してもよい。例えば、ファイルサーバ104のファイルシステムが有する通知機能を通知部とすることができる。この場合、ファイルサーバ104の入力部117は、計算機901からコンテンツファイル106とメタデータファイル112が書き込まれると、ファイルサーバ104のファイルシステムが、入力部117にファイルの書き込みを通知する。
 図18は、第4の実施例を示し、前記第2の実施例と同様に、コンテンツファイル106Aにコンテンツ情報1071が含まれる例を示す。コンテンツファイルサーバ101には、コンテンツ情報1071を含むコンテンツファイル106Aが格納され、所定のタイミングでコンテンツETLサーバ103に送信される。
 コンテンツファイル106Aは、例えば、画像であり、コンテンツ情報1071としては、PID(患者識別子)、氏名、年齢等が含まれる。コンテンツファイルサーバ101は、図示しない検査装置等からコンテンツファイル106Aが書き込まれると、コンテンツETLサーバ103に転送する。
 コンテンツETLサーバ103は、コンテンツファイルサーバ101からコンテンツファイル106Aを受信すると、コンテンツファイル106Aからメタデータ107を抽出してメタデータファイル112を生成し、コンテンツファイル106Aとメタデータファイル112をファイルサーバ104へ転送する。
 ファイルサーバ104は、前記第1の実施例と同様に、コンテンツ/メタデータ管理サーバ105にコンテンツファイル106Aとメタデータ107を非同期で登録する。
 本第4の実施例では、コンテンツファイル106AをPUSH型で送信する装置からコンテンツETLサーバ103が受信し、受信したコンテンツファイル106Aから抽出したメタデータファイル112とコンテンツファイル106Aをファイルサーバ104へ送信する点が前記第2の実施例と異なる。その他の構成については前記第2の実施例と同様である。
 なお、コンテンツファイル106AをPUSH型で送信する装置としては、コンテンツファイルサーバ101の他に、CT(Computed Tomography)、MRI(Magnetic Resonance Imaging)などの画像データを管理するPACS(Picture Archiving and Communication Systems)サーバ装置など、画像データをコンテンツファイル106Aとして出力する装置で構成することができる。
 本第4の実施例では、コンテンツETLサーバ103がコンテンツファイル106Aを受け付けるタイミングが前記第2の実施例と異なるため、前記第2の実施例に示した図15のフローチャートに代わって、図19のフローチャートを実行する。
 図19は、コンテンツETLサーバ103で行われる処理の一例を示すフローチャートである。この処理は、コンテンツファイル106Aを受信したときに実行される。
 コンテンツETLサーバ103のファイルアクセス処理部108は、まず、ステップ1201でコンテンツファイルサーバ101から受信したコンテンツファイル106Aを受け付ける。
 ステップ1202では、コンテンツETLサーバ103のメタデータ抽出部701が、コンテンツファイル106A内のコンテンツ情報1071からメタデータ107を抽出する。なお、メタデータ107を抽出する際には、コンテンツファイル106Aのコンテンツ情報1071が定型的であれば、マッピングルール110を用いることができる。一方、動画に文字情報を加えたデジタルテレビ放送などコンテンツ情報1071が不定型なコンテンツファイル106Aでは、マッピングルール110は用いないでもよい。
 ステップ1203では、コンテンツファイル106Aのファイル名に基づいて、メタデータ107をメタデータファイル112に変換するため、ファイルアクセス処理部108がメタデータファイル用のファイル名を生成する。メタデータファイル112のファイル名は、前記第1の実施例と同様であり、図5Aの関連付けルール115と同様に、「”.”+”ファイル名”+”.meta”」とする。
 そして、ステップ1204では、コンテンツETLサーバ103は、ファイルアクセス処理部108が取得したコンテンツファイル106Aと、メタデータ抽出部701が生成したメタデータファイル112をファイルサーバ104へ送信する。
 その他のファイルサーバ104やコンテンツ/メタデータ管理サーバ105の処理は、前記第1の実施例と同様である。
 第4の実施例においても、計算機システムの利用者が、コンテンツファイル106Aをコンテンツファイルサーバ101に登録し、ファイルサーバ104へ送信すると、コンテンツETLサーバ103を介してファイルサーバ104はコンテンツファイル106とメタデータ107を関連付けて、かつ非同期でコンテンツ/メタデータ管理サーバ105へ自動的に登録することができる。
 そして、コンテンツ/メタデータ管理サーバ105では、登録の要求のあったメタデータ107をメタデータ解析部121で検査し、メタデータ107に不正な記述や値があればコンテンツファイル106を登録せずにファイルサーバ104にエラーの内容を通知する。ファイルサーバ104では、エラーの内容からエラーファイル113を生成して保持する。
 ファイルサーバ104の利用者は図示しないクライアントからファイルサーバ104のエラーファイル113にアクセスすることで、コンテンツ管理データベース102に登録したメタデータ107の内容に誤りがあったことを把握できる。
 なお、本発明において説明した計算機等の構成、処理部及び処理手段等は、それらの一部又は全部を、専用のハードウェアによって実現してもよい。
 また、上記各実施例で例示した種々のソフトウェアは、電磁的、電子的及び光学式等の種々の記録媒体(例えば、非一時的な記憶媒体)に格納可能であり、インターネット等の通信網を通じて、コンピュータにダウンロード可能である。
 また、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明をわかりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。

Claims (15)

  1.  コンテンツファイルとメタデータを管理するメタデータ管理システムであって、
     プロセッサとメモリを備えた第1の計算機と、
     プロセッサとメモリと記憶装置を備えて前記コンテンツファイル及びメタデータを格納する管理サーバとが通信可能に接続され、

     前記第1の計算機は、
     コンテンツファイルと、当該コンテンツファイルに対応するメタデータファイルを受信する入力部と、
     前記メタデータファイルからメタデータを抽出し、当該メタデータを前記対応するコンテンツファイルに関連付ける関連付け処理部と、
     前記メタデータと、当該メタデータを関連付けたコンテンツファイルとを非同期で管理サーバに送信して登録を要求するファイル転送処理部と、
     前記管理サーバからエラーの通知を受信したときには、前記登録を要求したメタデータに関するエラーファイルを生成するエラー処理部と、を有し、
     前記管理サーバは、
     前記登録を要求されたメタデータのエラーを検知し、エラーを検知したときには前記第1の計算機に通知する解析部を有することを特徴とするメタデータ管理システム。
  2.  請求項1に記載のメタデータ管理システムであって、
     前記エラー処理部は、
     前記メタデータファイルが更新削除されるまでは、前記エラーファイルを保持することを特徴とするメタデータ管理システム。
  3.  請求項1に記載のメタデータ管理システムであって、
     前記コンテンツファイルと、当該コンテンツファイルに対応するコンテンツ情報を読み込む第2の計算機をさらに有し、
     前記第2の計算機は、
     前記コンテンツ情報からメタデータを抽出し、当該メタデータから前記メタデータファイルを生成して、当該メタデータファイルと前記コンテンツファイルとを前記第1の計算機に送信することを特徴とするメタデータ管理システム。
  4.  請求項1に記載のメタデータ管理システムであって、
     前記コンテンツファイルを読み込む第2の計算機をさらに有し、
     前記第2の計算機は、
     前記コンテンツファイルからメタデータを抽出し、当該メタデータから前記メタデータファイルを生成して、当該メタデータファイルと前記コンテンツファイルとを前記第1の計算機に送信することを特徴とするメタデータ管理システム。
  5.  請求項1に記載のメタデータ管理システムであって、
     前記コンテンツファイルと、前記メタデータファイルとを受け付ける第2の計算機をさらに有し、
     前記第2の計算機は、
     前記コンテンツファイルまたは前記メタデータファイルが更新または追加されたときに前記第1の計算機に通知を行い、
     前記第1の計算機は、
     前記入力部が、前記第2の計算機から通知を受けた前記コンテンツファイルまたは前記メタデータファイルを読み込み、
     前記エラー処理部は、前記通知を受けたファイルがメタデータファイルの場合、当該メタデータファイルに対応するエラーファイルを削除することを特徴とするメタデータ管理システム。
  6.  請求項1に記載のメタデータ管理システムであって、
     前記コンテンツファイルを受け付ける第2の計算機をさらに有し、
     前記第2の計算機は、
     前記コンテンツファイルを受け付ける度に、当該コンテンツファイルからメタデータを抽出し、当該メタデータから前記メタデータファイルを生成して、当該メタデータファイルと前記コンテンツファイルとを前記第1の計算機に送信することを特徴とするメタデータ管理システム。
  7.  請求項1に記載のメタデータ管理システムであって、
     前記エラー処理部は、
     前記メタデータファイルが更新または削除されるまでは、前記エラーファイルを保持することを特徴とするメタデータ管理システム。
  8.  プロセッサとメモリを備えた第1の計算機で、コンテンツファイルとメタデータを管理するメタデータ管理方法であって、
     前記第1の計算機が、コンテンツファイルと、当該コンテンツファイルに対応するメタデータファイルを取得する第1のステップと、
     前記第1の計算機が、前記メタデータファイルからメタデータを抽出し、当該メタデータを前記対応するコンテンツファイルに関連付ける第2のステップと、
     前記第1の計算機が、前記メタデータと、当該メタデータを関連付けたコンテンツファイルとを非同期で管理サーバに送信して登録を要求する第3のステップと、
     前記第1の計算機が、前記管理サーバからエラーの通知を受信したときには、前記登録を要求したメタデータに関するエラーファイルを生成する第4のステップと、
    を含む、ことを特徴とするメタデータ管理方法。
  9.  請求項8に記載のメタデータ管理方法であって、
     前記第4のステップは、
     前記メタデータファイルが更新削除されるまでは、前記エラーファイルを保持することを特徴とするメタデータ管理方法。
  10.  請求項8に記載のメタデータ管理方法であって、
     前記コンテンツファイルと、当該コンテンツファイルに対応するコンテンツ情報を読み込む第2の計算機をさらに有し、
     前記第1のステップは、
     前記第2の計算機が、前記コンテンツ情報からメタデータを抽出し、当該メタデータから前記メタデータファイルを生成して、当該メタデータファイルと前記コンテンツファイルとを前記第1の計算機に送信することを特徴とするメタデータ管理方法。
  11.  請求項8に記載のメタデータ管理方法であって、
     前記コンテンツファイルを読み込む第2の計算機をさらに有し、
     前記第1のステップは、
     前記第2の計算機が、前記コンテンツファイルからメタデータを抽出し、当該メタデータから前記メタデータファイルを生成して、当該メタデータファイルと前記コンテンツファイルとを前記第1の計算機に送信することを特徴とするメタデータ管理方法。
  12.  請求項8に記載のメタデータ管理方法であって、
     前記コンテンツファイルと、前記メタデータファイルとを受け付ける第2の計算機をさらに有し、
     前記第1のステップは、
     前記第2の計算機が、前記コンテンツファイルまたは前記メタデータファイルが更新または追加されたときに前記第1の計算機に通知を行い、前記第1の計算機は、前記第2の計算機から通知を受けた前記コンテンツファイルまたは前記メタデータファイルを読み込み、
     前記第4のステップは、
     前記通知を受けたファイルがメタデータファイルの場合、当該メタデータファイルに対応するエラーファイルを削除することを特徴とするメタデータ管理方法。
  13.  請求項8に記載のメタデータ管理方法であって、
     前記コンテンツファイルを受け付ける第2の計算機をさらに有し、
     前記第1のステップは、
     前記第2の計算機が、前記コンテンツファイルを受け付ける度に、当該コンテンツファイルからメタデータを抽出し、当該メタデータから前記メタデータファイルを生成して、当該メタデータファイルと前記コンテンツファイルとを前記第1の計算機に送信することを特徴とするメタデータ管理方法。
  14.  請求項8に記載のメタデータ管理方法であって、
     前記第4のステップは、
     前記メタデータファイルが更新または削除されるまでは、前記エラーファイルを保持することを特徴とするメタデータ管理方法。
  15.  プロセッサとメモリを備えた計算機を制御するプログラムを格納した記憶媒体であって、
     コンテンツファイルと、当該コンテンツファイルに対応するメタデータファイルを取得する第1の手順と、
     前記メタデータファイルからメタデータを抽出し、当該メタデータを前記対応するコンテンツファイルに関連付ける第2の手順と、
     前記メタデータと、当該メタデータを関連付けたコンテンツファイルとを非同期で送信して登録を要求する第3の手順と、
     エラーの通知を受信したときには、前記登録を要求したメタデータに関するエラーファイルを生成する第4の手順と、
    を前記計算機に実行させるプログラムを格納した非一時的な計算機読み取り可能な記憶媒体。
PCT/JP2012/078336 2012-11-01 2012-11-01 メタデータ管理システム、メタデータ管理方法及び記憶媒体 WO2014068749A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/JP2012/078336 WO2014068749A1 (ja) 2012-11-01 2012-11-01 メタデータ管理システム、メタデータ管理方法及び記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2012/078336 WO2014068749A1 (ja) 2012-11-01 2012-11-01 メタデータ管理システム、メタデータ管理方法及び記憶媒体

Publications (1)

Publication Number Publication Date
WO2014068749A1 true WO2014068749A1 (ja) 2014-05-08

Family

ID=50626715

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2012/078336 WO2014068749A1 (ja) 2012-11-01 2012-11-01 メタデータ管理システム、メタデータ管理方法及び記憶媒体

Country Status (1)

Country Link
WO (1) WO2014068749A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015173901A1 (ja) * 2014-05-14 2015-11-19 株式会社日立製作所 情報システム
CN110780950A (zh) * 2019-10-24 2020-02-11 深圳前海环融联易信息科技服务有限公司 接口元数据管理方法、装置、计算机设备及存储介质
CN111600949A (zh) * 2020-05-14 2020-08-28 上海鸿翼软件技术股份有限公司 一种数据传输方法、装置、设备及计算机可读存储介质
US20230023084A1 (en) * 2021-07-21 2023-01-26 Sap Se Transferring data to backup data repositories

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004129039A (ja) * 2002-10-04 2004-04-22 Nippon Telegr & Teleph Corp <Ntt> コンテンツ配信管理方法,装置およびプログラム
JP2010187217A (ja) * 2009-02-12 2010-08-26 Sony Corp 通信装置、サーバ、プログラム及び通信システム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004129039A (ja) * 2002-10-04 2004-04-22 Nippon Telegr & Teleph Corp <Ntt> コンテンツ配信管理方法,装置およびプログラム
JP2010187217A (ja) * 2009-02-12 2010-08-26 Sony Corp 通信装置、サーバ、プログラム及び通信システム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015173901A1 (ja) * 2014-05-14 2015-11-19 株式会社日立製作所 情報システム
US9489393B2 (en) 2014-05-14 2016-11-08 Hitachi, Ltd. Information system
CN110780950A (zh) * 2019-10-24 2020-02-11 深圳前海环融联易信息科技服务有限公司 接口元数据管理方法、装置、计算机设备及存储介质
CN110780950B (zh) * 2019-10-24 2024-02-20 深圳前海环融联易信息科技服务有限公司 接口元数据管理方法、装置、计算机设备及存储介质
CN111600949A (zh) * 2020-05-14 2020-08-28 上海鸿翼软件技术股份有限公司 一种数据传输方法、装置、设备及计算机可读存储介质
CN111600949B (zh) * 2020-05-14 2024-03-15 上海鸿翼软件技术股份有限公司 一种数据传输方法、装置、设备及计算机可读存储介质
US20230023084A1 (en) * 2021-07-21 2023-01-26 Sap Se Transferring data to backup data repositories

Similar Documents

Publication Publication Date Title
US10929419B2 (en) Object storage backed file system
JP6453881B2 (ja) 大きなファイルを保存するための改良されたウェブサーバ
US9152631B2 (en) Document management system, method for controlling the same, and storage medium
KR20200093596A (ko) 콘텐츠 관리 시스템의 메타데이터 재동기화
US11798208B2 (en) Computerized systems and methods for graph data modeling
US20140195516A1 (en) Systems and methods for presenting content items in a collections view
WO2014122732A1 (ja) 計算機システム、メタデータ管理方法及び記録媒体
US9864736B2 (en) Information processing apparatus, control method, and recording medium
JP5485997B2 (ja) 重複排除機能付きデータ格納装置及び当該データ格納装置の検索インデックスを作成する制御装置
US20100011032A1 (en) Document management apparatus, document management system, and document management method
US20100217750A1 (en) Archive apparatus, conversion apparatus and conversion program
KR20080102227A (ko) 자동 처리 디지털 정보에 대한 스마트 쉐어 기술을 위한 컴퓨팅 시스템 및 방법
US10048913B2 (en) Electronic content management workflow with document versioning
US10528678B2 (en) Digital content translation techniques and systems
WO2014068749A1 (ja) メタデータ管理システム、メタデータ管理方法及び記憶媒体
US11811851B2 (en) Method and system for enforcing governance across multiple content repositories using a content broker
US20150302007A1 (en) System and Methods for Migrating Data
TWI571754B (zh) 用來進行檔案同步控制之方法與裝置
US20140379646A1 (en) Replication of Updates to DICOM Content
TWI607325B (zh) 檢索索引產生方法及應用此方法之伺服器
US20140379651A1 (en) Multiple Subscriber Support for Metadata Replication
US20140379640A1 (en) Metadata Replication for Non-Dicom Content
Motie-Nasrabadi et al. IHE, Solution for integration of information systems and PACS

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12887408

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 12887408

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP