WO2016039238A1 - Information processing device, information processing method, and program - Google Patents

Information processing device, information processing method, and program Download PDF

Info

Publication number
WO2016039238A1
WO2016039238A1 PCT/JP2015/074972 JP2015074972W WO2016039238A1 WO 2016039238 A1 WO2016039238 A1 WO 2016039238A1 JP 2015074972 W JP2015074972 W JP 2015074972W WO 2016039238 A1 WO2016039238 A1 WO 2016039238A1
Authority
WO
WIPO (PCT)
Prior art keywords
header
data
information
configuration
identification information
Prior art date
Application number
PCT/JP2015/074972
Other languages
French (fr)
Japanese (ja)
Inventor
細川 晃
Original Assignee
株式会社 東芝
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社 東芝 filed Critical 株式会社 東芝
Publication of WO2016039238A1 publication Critical patent/WO2016039238A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units

Definitions

  • Embodiments described herein relate generally to an information processing apparatus, an information processing method, and a program.
  • IEC62656 is an international standard that defines a data exchange format using a spreadsheet.
  • This international standard spreadsheet consists of two parts: a header section and a data section.
  • the header section provides semantic and structural information for the description of the instance in the data section.
  • the header section is further composed of a class header section that describes information on the entire sheet and a schema header section that describes property information for describing instances in individual columns. In the data section, one instance is described in one row, and the value of the corresponding property is described in each cell.
  • data described using this spreadsheet as a format will be referred to as parcel data using the term “parcel”, which is a common name of IEC62656.
  • Parcel data can be identified from the structure of tabular form, by describing metadata once in each column of the header section, which property value each cell value has. This is one of the advantages compared to other data formats such as XML in which each value needs to be structured by delimiting with a tag from the viewpoint of data capacity.
  • the data capacity of the header described in the header section is larger than that of the data body. For example, if there are 20 properties for data consisting of 6 alphanumeric characters for the property ID, 120 characters are consumed only by the header. For this reason, there is a problem that not all data can be stored when there is a limit to the data capacity that can be stored, such as a two-dimensional code.
  • a problem to be solved by the embodiment of the present invention is to provide an information processing apparatus, an information processing method, and a program capable of reducing the capacity of text data including a header and an instance.
  • the information processing apparatus based on a header included in text format data, class identification information for identifying a class into which a target described by the data is classified, and an attribute characterizing the class
  • a data configuration encoding unit that assigns data configuration identification information for identifying the set to a set of the combination of the attribute and the attribute defining information that defines the order.
  • the information processing apparatus Based on the data, the information processing apparatus identifies the header configuration information for identifying the header configuration information with respect to the header configuration information that defines a combination of instructions and their order, which are headings described in individual rows of the header.
  • a header configuration encoding unit that assigns information is provided.
  • the information processing apparatus includes a compressed data generation unit that generates compressed data including the data configuration identification information, the header configuration identification information, and an instance included in the data.
  • the figure which illustrates the structure of structure table T1 memorize
  • FIG. 5 is a flowchart showing an example of a processing flow of a data configuration encoding unit 302 of the compressed data generation device 300.
  • the figure which illustrates the case where the process of the data structure encoding part 302 is applied to the parcel data of FIG. 5 is a flowchart showing an example of a process flow of a header configuration encoding unit 303 of the compressed data generation device 300.
  • FIG. 11 is a flowchart showing an example of a process flow of a class header section in step S702 of FIG.
  • FIG. 11 is a flowchart showing an example of a process flow of a schema header section in step S703 of FIG. It is a figure which illustrates the case where the process of the header structure encoding part 303 is applied to the parcel data of FIG. The figure showing the example at the time of processing another parcel data in the state which registered the header information of the parcel data of FIG. 2 in remote DB332 of the data management apparatus 330.
  • FIG. 5 is a flowchart illustrating an example of a processing flow of a compressed data generation unit 305 of the compressed data generation apparatus 300. The figure which shows the example of the compression parcel data output by the series of processes of the compression data generation apparatus 300 in this embodiment, using the parcel data of FIG.
  • FIG. 6 is a flowchart illustrating an example of a processing flow of a determination unit 362 of the data restoration device 360.
  • the flowchart which shows an example of the flow of a process of the header information acquisition part 363 of the data decompression
  • FIG. The flowchart which shows an example of the flow of a process of the decompression
  • the data handled in this embodiment is data in a text format that includes a header and instances, and the header can be represented by a spreadsheet configured in a matrix.
  • the header can be represented by a spreadsheet configured in a matrix.
  • parcel data data conforming to IEC 62656
  • FIG. 1 is a diagram illustrating a configuration of an information processing system 1 according to the present embodiment.
  • the information processing system 1 includes a compressed data generation device (information processing device) 300, a data management device 330, and a data restoration device (information processing device) 360.
  • the compressed data generation device 300, the data management device 330, and the data restoration device 360 are connected to each other via the network 150 and can communicate with each other.
  • the compressed data generation apparatus 300 acquires original data in text format (for example, original parcel data) and compresses the acquired original data to generate compressed data (for example, compressed parcel data).
  • the compressed data generation device 300 is, for example, a terminal device.
  • the data management device 330 stores header information for restoring the compressed data to the original data.
  • the data management device 330 is, for example, a server that stores header information.
  • the data restoration device 360 restores the original data (for example, the original parcel data) from the compressed data (for example, the compressed parcel data) using the header information stored in the data management device 330.
  • the data restoration device 360 is, for example, a terminal device.
  • FIG. 2 is a diagram illustrating a display form of parcel data and a text representation thereof.
  • parcel data is expanded in order from the head of the data in two parts, a header section and a data section, in the row direction.
  • the instruction column and the cell column are expanded in this order.
  • the header section is further composed of two parts: a class header section for describing information related to the entire parcel data, and a schema header section having a set of properties and values for describing instances in the data section.
  • a class header section for describing information related to the entire parcel data
  • a schema header section having a set of properties and values for describing instances in the data section.
  • one instance is described in one line of the data section.
  • a set of values included in an area surrounded by a thick frame indicates one instance.
  • the instruction column is the first column of parcel data, and in the header section, an instruction that indicates what the header of each row represents to the computer and the user is described.
  • an instruction word predefined in IEC62656 or an instruction word uniquely defined by the user is described following a # (pound) symbol.
  • This is a sheet for describing an instance of a class.
  • This AAX001 is an example of a class identifier for identifying a class corresponding to the classification of goods and services.
  • the upper class is an electrical product
  • there are individual classes such as a motor, a personal computer, and a flash memory in the lower class of the electrical product, and these individual classes are identified by a class identifier. .
  • Cell column is a column for describing properties and their values.
  • the parcel data has one or more cell columns, and the cell columns are developed in order from the second column onward after the instruction column.
  • the ID, name, data type, unit, etc. of the property assigned to each cell column are described based on the instruction word described in the instruction column of the same row.
  • #PROPERTY_ID indicating that the property ID for identifying the property is expanded in the cell column of this row is described, and the cell columns in the second and subsequent columns are described. Individual property IDs are displayed in order.
  • property information such as name, data type, and unit is displayed in the same order as the display order of property IDs according to the instruction word described in each instruction column.
  • one or more instances are displayed in the row direction in the data section.
  • an instance is represented by a set of a set of a property and its property value, and the value of each property included in one instance is displayed in one line. If a # symbol is written in the instruction column of the data section, the line is treated as a comment line and ignored by the system.
  • the instruction column is scanned in order from the first row, and the first row where the cell value does not start with the # symbol is displayed.
  • the specified line is the first line of the data section, and the previous line is the header section.
  • the lower text D2 in FIG. 2 is the CSV (Comma (Separated Values) format of the upper table D1 in FIG.
  • CSV Common Values
  • the specification of the CSV format is disclosed in non-patent document RFC4180, and it is implemented as one of the standard methods for exchanging spreadsheet data in many applications that can interpret spreadsheets.
  • the CSV format is taken as an example, but other formats that express spreadsheet data in a text format may be used.
  • TSB Trob Separated Values
  • FIG. 3 is a diagram illustrating a configuration of the compressed data generation device 300 according to the present embodiment.
  • the compressed data generation device 300 includes a CPU (Central Processing Unit) 101, a ROM 102, a RAM 103, a storage device 104, a medium reading device 106, a bus controller 107, a display device 108, an input device 109, and a communication unit. 304 is provided.
  • each component of the compressed data generation device 300 is connected via a bus controller 107 and can exchange data with each other.
  • CPU 101 controls the entire compressed data generating apparatus 300.
  • the ROM 102 stores various data and various programs read and executed by the CPU 101.
  • the RAM 103 is a storage device that primarily stores information, and temporarily stores various programs read by the CPU 101.
  • the storage device 104 stores various data and various programs that the CPU 101 reads and executes.
  • the storage device 104 is, for example, a hard disk drive (Hard Disk Drive: HDD).
  • the medium reading device 106 is a drive device for reading data recorded on a computer-readable storage medium (for example, a CD (Compact Disk) etc.) In order to execute each process of the CPU 101 according to the present embodiment. These programs may be recorded on a computer-readable recording medium.
  • a computer-readable storage medium for example, a CD (Compact Disk) etc.
  • the display device 108 displays information according to control by the CPU 101.
  • the input device 109 receives an instruction input or operation by the user.
  • the input device 109 is, for example, a keyboard or a mouse.
  • the communication unit 304 communicates with the data management device 330 having the storage device 114 described later via the network 150. This communication may be wired or wireless.
  • FIG. 4 is a functional block diagram of the compressed data generation apparatus 300 according to this embodiment.
  • the CPU 101 reads out a program from the ROM 102 or the storage device 104 to the RAM 103 and executes the program, or executes a program read from the computer-readable storage medium into the RAM 103 by the medium reading device 106.
  • a header acquisition unit 301, a data configuration encoding unit 302, a header configuration encoding unit 303, and a compressed data generation unit 305 are generated on the RAM 103.
  • the compressed data generation process in the compressed data generation device 300 is started when the user performs a compressed data generation operation for selecting the parcel data 308 via the input device 109 while viewing the screen displayed on the display device 108.
  • the header acquisition unit 301 Upon receiving a compressed data generation operation by the user from the input device 109, the header acquisition unit 301 reads the parcel data 308 selected by the user into the RAM 103, and extracts header section information (hereinafter referred to as a header) included in the parcel data. To do. As described above, the header acquisition unit 301 acquires the header included in the parcel data 308. Then, the header acquisition unit 301 converts the acquired header into text format data, and passes the text format data and parcel data 308 to the data configuration encoding unit 302.
  • the data configuration encoding unit 302 uses class identification information (for example, a class ID to be described later) that identifies a class into which an article or service to be described by the data is classified using a header included in the text format data.
  • class identification information for example, a class ID to be described later
  • Data configuration identification information for example, described later
  • attribute definition information for example, cell column text described later
  • different data configuration identification information is assigned to each set of class identification information and attribute defining information.
  • the data configuration identification information functions as information for identifying the data configuration.
  • the data configuration encoding unit 302 uses the class ID that is the value of the instruction #CLASS_ID and the value of the cell column in the row of the instruction #PROPERTY_ID (hereinafter, cell Column text). Then, the data configuration encoding unit 302 generates a structure ID by text encoding the set of the extracted class ID and cell column text. Thus, as an example, the data configuration encoding unit 302 generates data configuration identification information by performing text encoding on a set of class identification information and attribute defining information. This text encoding is, for example, calculation of a hash value using a hash function.
  • the data configuration encoding unit 302 registers the set of class ID, cell column text, and structure ID as a header.
  • the data is transmitted from the communication unit 304 to the data management device 330. That is, the data configuration encoding unit 302 transmits data to be stored in the storage device 114 from the communication unit 304 to the data management device 330 and causes the data management device 330 to store the data to be stored. Further, the data configuration encoding unit 302 passes a set of the class ID, cell column text, and structure ID to the header configuration encoding unit 303. Details of the operation of the data structure encoding unit 302 will be described later.
  • the header configuration encoding unit 303 uses the parcel data 308 to generate header configuration information (for example, header text to be described later) that defines the combination of instructions that are headings described in the individual rows of the header and the order of the combinations.
  • header configuration identification information for example, a header ID described later for identifying the header configuration information is assigned.
  • the header configuration encoding unit 303 performs processing on each of the class header section and the schema header section of the header section of the parcel data 308, and is a header that is text data representing the configuration of the header section of the parcel data. Generate text.
  • the header configuration encoding unit 303 then encodes the header text to generate a header ID.
  • the header structure encoding part 303 produces
  • This text encoding is, for example, calculation of a hash value using a hash function.
  • the header configuration encoding unit 303 registers the header text and header ID pair in the remote DB 332 of the data management device 330, so that the header text and header ID pair is sent via the communication unit 304 together with the header registration request.
  • the header configuration encoding unit 303 transmits data to be stored in the storage device 114 from the communication unit 304 to the data management device 330, and causes the data management device 330 to store the data to be stored. Further, the combination of the header text and the header ID is passed to the compressed data generation unit 305. Details of the operation of the header configuration encoding unit 303 will be described later.
  • the communication unit 304 transmits the data passed from the data configuration encoding unit 302 and the header configuration encoding unit 303 to the data management device 330 via the network 150.
  • the compressed data generation unit 305 generates compressed data including data configuration identification information (for example, structure ID), header configuration identification information (for example, header ID), and an instance included in the parcel data 308.
  • the compressed data generation unit 305 has the structure ID generated by the data configuration encoding unit 302 as the value of instruction #CLASS_ID, and further uses the header ID generated by the header configuration encoding unit 303 as a predetermined instruction ( For example, a header having a value of #HEADER) is generated.
  • the compressed data generation unit 305 generates compressed parcel data 309 obtained by combining the generated header and data of the data section of the parcel data 308 as an example of compressed data.
  • the compressed data generation unit 305 outputs the compressed parcel data 309 to the outside of the compressed data generation apparatus 300. Details of the operation of the compressed data generation unit 305 will be described later.
  • FIG. 5 is a diagram illustrating a configuration of the data management apparatus 330 according to the present embodiment.
  • the data management device 330 includes a CPU (Central Processing Unit) 111, a ROM 112, a RAM 113, a storage device 114, a medium reading device 116, a bus controller 117, a display device 118, an input device 119, and a communication unit 333. Is provided.
  • each component of the data management device 330 is connected via a bus controller 117 and can exchange data with each other.
  • CPU 111 controls the entire data management device 330.
  • the ROM 112 stores various data and various programs that the CPU 111 reads and executes.
  • the RAM 113 is a storage device that primarily stores information, and temporarily stores various programs read by the CPU 111.
  • the storage device 114 stores various data.
  • the storage device 114 is, for example, a hard disk drive (Hard Disk Drive: HDD).
  • the medium reading device 116 is a drive device for reading data recorded on a computer-readable storage medium (for example, CD (Compact Disk) etc.) In order to execute each process of the CPU 111 according to the present embodiment. These programs may be recorded on a computer-readable recording medium.
  • a computer-readable storage medium for example, CD (Compact Disk) etc.
  • Display device 118 displays information in accordance with control by CPU 111.
  • the input device 119 accepts an instruction input or operation by a user using the data management device 330.
  • the input device 119 is, for example, a keyboard or a mouse.
  • the communication unit 333 communicates with the compressed data generation apparatus 300 via the network 150. This communication may be wired or wireless.
  • FIG. 6 is a functional block diagram of the data management apparatus 330 according to the present embodiment.
  • the CPU 111 reads the program from the ROM 112 to the RAM 113 and executes the program, or executes the program read by the medium reading device 116 from the computer-readable storage medium to the RAM 113. By executing this program, a data management unit 331 is generated on the RAM 113. Further, the storage device 114 stores a remote DB 332.
  • the data management unit 331 interprets the header registration request received from the compressed data generation device 300 via the communication unit 333 and stores the data received from the compressed data generation device 300 via the communication unit 333 as header information in the remote DB 332. sign up.
  • the remote DB 332 stores header information generated as a result of the processing of the compressed data generation device 300. Further, it interprets the header information inquiry request received from the compressed data generation device 300 and the data decompression device 360 via the communication unit 333, extracts the header information from the remote DB 332, and transmits the header information via the communication unit 333. .
  • the remote DB 332 includes a structure table (structure table) T1, an alias table (alias table) T2, a cell column table (cell column) table T3 that stores data generated by the processing of the data structure encoding unit 302, and a header structure code.
  • the header table (header table) T4 that stores data generated by the processing of the conversion unit 303 is included.
  • FIG. 7A is a diagram illustrating the structure of the structure table T1 stored in the remote DB 332.
  • the structure table T1 includes a structure_id field that stores the structure ID generated by the processing of the data structure encoding unit 302, a class_id field that stores the class ID that is the value of the instruction #CLASS_ID in association with the structure ID, and an instruction # It has a cell_column_text field for storing text obtained by concatenating the contents described in the cell column of the PROPERTY row using a delimiter, and stores those sets as records.
  • FIG. 7B is a diagram illustrating the structure of the alias table T2 stored in the remote DB 332.
  • the alias table T2 is used when an instruction alias (hereinafter referred to as an alias) is created in the processing of the header configuration encoding unit 303, and stores a header_id field for storing a header ID that uses the alias, and an instruction alias. It has an alias field and an original field for storing the original instruction, and stores those sets as records.
  • an instruction alias hereinafter referred to as an alias
  • FIG. 7C is a diagram illustrating the structure of the cell column table T3 stored in the remote DB 332.
  • the cell column table T3 includes a structure_id field that externally references the structure_id field of the structure_table, an instruction field that stores an instruction associated with the structure ID, and an instruction_value field that stores a value associated with the instruction. Is stored as a record.
  • FIG. 7D is a diagram illustrating the structure of the header table T4 stored in the remote DB 332.
  • the header table T4 has a header_id field for storing the header ID generated by the processing of the header configuration encoding unit 303, and a header_text field for storing the header text associated with the header ID, and stores those sets as records. To do.
  • the instruction is in the schema header section, the instruction itself is stored in the instruction field, and the text created by combining the cell columns with a delimiter is stored in the instruction_value field.
  • FIG. 8 is a flowchart illustrating an example of a process flow of the data configuration encoding unit 302 of the compressed data generation device 300.
  • Step S501 First, the data configuration encoding unit 302 acquires the text data of the header section from the header acquisition unit 301.
  • Step S502 the data structure encoding unit 302 extracts the class ID from the value of the instruction #CLASS_ID of this text data.
  • Step S503 the data structure encoding unit 302 extracts cell column data, that is, cell column text, from the row of instruction #PROPERTY_ID of this text data.
  • Step S504 the data structure encoding unit 302 uses the extracted class ID and cell column text combination as a key, and has a record including the class ID and cell column text combination already registered in the structure table T1.
  • the data management apparatus 330 is inquired.
  • Step S505 the data structure encoding unit 302 uses the inquiry result in step S504 to determine whether or not a record including a set of class ID and cell column text has already been registered in the structure table T1 of the remote DB 332. To determine.
  • Step S506 When a record including a set of class ID and cell column text is already registered in the structure table T1 of the remote DB 332 (Step S505) YES), the data structure encoding unit 302 acquires the structure ID from the structure table T1 of the remote DB 332. Thereafter, the process proceeds to step S509.
  • Step S507 On the other hand, when the record including the set of the class ID and the cell column text is not yet registered in the structure table T1 of the remote DB 332 (NO in Step S5050), the data configuration encoding unit 302 selects the extracted class ID and A set of cell column text is text-encoded to generate a structure ID.
  • Step S508 The data configuration encoding unit 302 registers the set of the structure ID, the class ID, and the cell column text in the structure table T1 of the remote DB 332 of the data management device 330 via the communication unit 304. As described above, the data configuration encoding unit 302 extracts the class identification information from the parcel data 308, generates the attribute definition information from the parcel data 308, and determines the combination of the class identification information and the attribute definition information. Data configuration identification information is assigned, and the data configuration identification information, class identification information, and attribute defining information are associated with each other and stored in the storage device 114. Then, the process proceeds to step S509.
  • Step S509 Finally, the data configuration encoding unit 302 passes the structure ID, the header section text data, and the parcel data 308 to the header configuration encoding unit 303, and ends the processing.
  • FIG. 9 is a diagram illustrating a case where the processing of the data configuration encoding unit 302 is applied to the parcel data in FIG.
  • the value of the instruction #CLASS_ID and the cell column text of #PROPERTY_ID are extracted by the processing of the data configuration encoding unit 302, and the structure ID CCL001 is generated by text encoding.
  • the cell column text which is an example of the attribute defining information is information in which values associated with attribute identification information #PROPERTY_ID for identifying an attribute are arranged in the order of appearance in the header.
  • the structure ID may be generated by the data configuration encoding unit 302 using a text encoding function such as a hash function with a text obtained by concatenating the class ID and the cell column text as an input.
  • a text encoding function such as a hash function
  • the data configuration encoding unit 302 may use a character string designated by the user as the structure ID. As described above, the data configuration encoding unit 302 may assign the character string received from the user by the input device 109 to the data configuration information (for example, the structure ID).
  • the data configuration encoding unit 302 may manage sequential alphanumeric characters, and the data configuration encoding unit 302 may acquire the next sequential alphanumeric characters as the structure ID from the managed alphanumeric characters.
  • FIG. 10 is a flowchart illustrating an example of a processing flow of the header configuration encoding unit 303 of the compressed data generation device 300.
  • Step S701 the header configuration encoding unit 303 acquires the structure ID, the text data of the header section, and the parcel data 308 from the data configuration encoding unit 302.
  • Step S702 the header configuration encoding unit 303 performs processing on each line of the class header section included in the text data of the header section for header configuration encoding. Details of this processing will be described later with reference to FIG.
  • Step S703 when the header configuration encoding unit 303 finishes the processing of the class header section, the header configuration encoding unit 303 processes each row of the schema header section included in the text data of the header section. Details of this processing will be described later with reference to FIG.
  • the header configuration encoding unit 303 reads the instructions in order from the head of the instruction column of the header section, and uses the delimited characters as the read instructions. Generate concatenated header text.
  • the header text as an example of the header configuration information is information in which instructions included in the header are arranged in the order of appearance in the header.
  • Step S705 the header configuration encoding unit 303 inquires of the data management apparatus 330 whether the record including the header text generated in step S704 is registered in the header table T4 of the remote DB 332 of the data management apparatus 330.
  • Step S706 the header configuration encoding unit 303 determines whether or not a record including the header text generated in step S704 is registered in the header table T4 using the inquiry result.
  • Step S707 When a record including the header text generated in step S704 is registered in the header table T4 (YES in step S706), the header configuration encoding unit 303 transmits the header table of the remote DB 332 via the communication unit 304. From T4, the header ID corresponding to this header text is acquired. Thereafter, the process proceeds to step S712.
  • Step S708 On the other hand, when the record including the header text generated in Step S704 is not registered in the header table T4 (NO in Step S706), the header configuration encoding unit 303 converts the header text generated in Step S704 into a text code. To generate a header ID.
  • Step S709 the header configuration encoding unit 303 registers the set of the header ID generated in step S708 and the header text generated in step S704 in the header table T4 of the remote DB 332 via the communication unit 304. .
  • the header configuration encoding unit 303 generates header configuration information (for example, header text) from the data, assigns header configuration identification information (for example, header ID) to the generated header configuration information, and The configuration identification information and the header configuration information are associated with each other and stored in the storage device 114.
  • header configuration information for example, header text
  • header configuration identification information for example, header ID
  • Step S710 the header configuration encoding unit 303 determines whether or not an instruction alias has been created in the processing of the class header section in step S702 or the processing of the schema header section in step S703.
  • Step S711 If it is determined in step S710 that an instruction alias has been created (YES in step S710), the header configuration encoding unit 303 sets the header ID generated in step S708, the created alias, and the alias. The pair with the instruction is registered in the alias table T2 of the remote DB 332 via the communication unit 304. Thereafter, the process proceeds to step S712. On the other hand, if it is determined in step S710 that an instruction alias has not been created (NO in step S710), the process proceeds to step S712.
  • Step S712 When the structure ID and header ID are obtained by the above processing, the header configuration encoding unit 303 passes these structure ID and header ID and parcel data 308 to the compressed data generation unit 305, and ends the processing. .
  • FIG. 11 is a flowchart showing an example of the processing flow of the class header section in step S702 of FIG. 10
  • Step S801 First, the header configuration encoding unit 303 performs the following steps S802 and S900 on each row in order from the first row of the class header section (Step S802). Next, the header configuration encoding unit 303 obtains a set of the target instruction and its value (hereinafter referred to as an instruction value) from the instruction column for the processing target row.
  • an instruction value a set of the target instruction and its value
  • Step S900 The header configuration encoding unit 303 executes an instruction process of FIG. 12 to be described later on the group acquired in Step S802.
  • Step S803 When the next line exists in the class header section, the process returns to Step S801. If there is no next line in the class header section, the processing of the class header section is terminated.
  • FIG. 12 is a flowchart showing an example of the flow of instruction processing in step S900 of FIG. This process is performed not only in the process of the class header section but also in the process of the schema header section in FIG. 13 described later.
  • Step S901 the header configuration encoding unit 303 uses the combination of the structure ID and the instruction acquired by the data configuration encoding unit 302 as a key to change these combinations from the cell column table T3 of the remote DB 332 of the data management device 330. Get the associated instruction value.
  • Step S902 It is determined whether the target instruction value is the same as or different from the instruction value acquired in step S901, or a record including the target instruction value is not registered in the cell column table T3 of the remote DB 332.
  • the header configuration encoding unit 303 ends the instruction processing.
  • Step S903 On the other hand, when the target instruction value is different from the instruction value acquired in Step S901 (Step S902 DIFFERENT), the header configuration encoding unit 303 generates an alias of the target instruction.
  • Step S904 The header configuration encoding unit 303 replaces the target instruction of the header section with an alias. Then, the process proceeds to step S905.
  • Step S905 When the record including the target instruction value is not registered in the cell column table T3 of the remote DB 332 (S902: NO RECORD), the header configuration encoding unit 303 generates the structure ID generated by the data configuration encoding unit 302 The set of the target instruction and the target instruction value is registered in the cell column table T3 of the remote DB 332 of the data management device 330 via the communication unit 304, and the processing of the instruction is finished.
  • the header configuration encoding unit 303 reads out a combination of an instruction and an instruction value from the data, and stores the data configuration identification information, the instruction, and the instruction value in the storage device 114 in association with each other.
  • step S905 the header configuration encoding unit 303 communicates the set of the structure ID generated by the data configuration encoding unit 302, the alias replaced in step S904, and the target instruction value.
  • the data is registered in the cell column table T3 of the remote DB 332 of the data management device 330 via the unit 304, and the instruction process is terminated.
  • the header configuration encoding unit 302 acquires a combination of an instruction and an instruction value included in the header from the parcel data 308 (step S802), and identifies the acquired instruction value and the data configuration in the storage device 114.
  • the data structure identification information to be compared is compared with the instruction value associated with the instruction (step S902). If the values are different as a result of the comparison, the header configuration encoding unit 302 generates an alias for the instruction (step S903).
  • the header configuration encoding unit 302 stores the data configuration identification information, the alias, and the read instruction value in the storage device 114 in association with each other (step S905).
  • the header configuration encoding unit 302 associates the header configuration identification information (for example, header ID) and the header configuration information (for example, header text) in which the instruction included in the header configuration information is replaced with an alias in the storage device 114.
  • the header configuration encoding unit 302 stores the instruction configuration identification information (for example, header ID), the alias, and the instruction in which the alias is generated in association with each other in the storage device 114 (step S711).
  • FIG. 13 is a flowchart showing an example of the processing flow of the schema header section in step S703 of FIG. 10
  • Step S1011 First, the header configuration coding unit 303 performs the following steps S1012 and S900 on each row in order from the first row of the schema header section.
  • Step S1012 the header configuration encoding unit 303 acquires the target instruction and the target instruction value for the processing target row.
  • Step S900 Next, the header configuration encoding unit 303 performs the processing of the instructions in FIG.
  • Step S1013 When the instruction processing in step S900 is completed and the schema header section has the next line, the header configuration encoding unit 303 performs the processes in steps S1012 and S900 on the next line. If there is no next line in the schema header section, the header configuration encoding unit 303 ends the processing of the schema header section.
  • FIG. 14 is a diagram illustrating a case where the processing of the header configuration encoding unit 303 is applied to the parcel data of FIG.
  • the header configuration encoding unit 303 concatenates the instructions acquired in order from the first row of the instruction string using a delimiter, and generates a header text.
  • the header configuration encoding unit 303 text-encodes the header text to generate HDR001 that is the header ID of the header text.
  • header ID may be generated by the header configuration encoding unit 303 using a text encoding function such as a hash function with the header text as an input.
  • a character string specified by the user may be used as the header ID without using such a function.
  • the header configuration encoding unit 303 may assign the character string received from the user by the input device 109 to the header configuration information (for example, header text).
  • the header configuration encoding unit 303 may manage sequential alphanumeric characters and automatically generate alphanumeric characters as header IDs.
  • FIG. 15 is a diagram illustrating an example in which processing of another parcel data is performed in a state where the header information of the parcel data in FIG. 2 is registered in the remote DB 332 of the data management device 330.
  • the upper table of FIG. 15 shows parcel data, and the text data below the parcel data represents the parcel data in a text format.
  • the structure ID is not generated by the processing of the data configuration encoding unit 302, and the data
  • the structure ID CCL001 registered in the remote DB 332 of the management apparatus 330 is applied as the structure ID.
  • an alias # MEMO-001 for instruction #MEMO is created by the header configuration encoding unit 303. Since the instruction is replaced by this alias, # MEMO-001 appears instead of #MEMO in the header text generated by the header configuration encoding unit 303.
  • HDR002 is finally assigned as the header ID corresponding to the header text of the header section of the parcel data in FIG. Registered in the remote DB 332.
  • FIG. 16 is a flowchart illustrating an example of a process flow of the compressed data generation unit 305 of the compressed data generation apparatus 300.
  • Step S1301 First, the compressed data generation unit 305 acquires the structure ID, header ID, and parcel data 308 from the header configuration encoding unit 303.
  • Step S1302 the compressed data generation unit 305 creates an empty header section.
  • Step S1305) the compressed data generation unit 305 combines the data section of the parcel data 308 with the header section generated in this way.
  • FIG. 17 is a diagram illustrating an example of compressed parcel data output by a series of processes of the compressed data generation apparatus 300 according to the present embodiment using the parcel data of FIG. 2 as an input.
  • the header section of FIG. 17 includes the structure ID generated by the data configuration encoding unit 302 as the value of instruction #CLASS_ID, and includes the header ID generated by the header configuration encoding unit 303 as the value of instruction #HEADER. Yes. Thereby, it can be seen that compressed parcel data in which the data capacity of the header section is reduced as compared with the parcel data of FIG. 2 is generated.
  • the predetermined instruction describing the header ID is #HEADER, but other instructions may be set and used as long as the system can interpret them.
  • Step S1306 the compressed data generation unit 305 outputs the data generated in step S1305 as the compressed parcel data 309, and ends the processing.
  • the data configuration encoding unit 302 identifies the class in which the target article or service described by the data is classified, using the header included in the text format data.
  • the data configuration identification information (for example, structure ID) for identifying the combination is assigned to the combination of the class identification information to be performed, the combination of the property (attribute) that characterizes the class, and the attribute definition information that defines the order of the combination. .
  • the header configuration encoding unit 303 uses the data to perform header configuration information (for example, header text) that defines a combination of instructions that are headings described in the individual rows of the header and their order.
  • the header configuration identification information (for example, header ID) for identifying the header configuration information is assigned.
  • the compressed data generation unit 305 generates compressed data including the data configuration identification information (for example, structure ID), the header configuration identification information (for example, header ID), and the instance included in the data.
  • the capacity of the compressed data can be reduced compared to the original data because the capacity of the header is reduced by replacing the header with data including the data structure identification information and the header structure identification information.
  • a reversible compressed header with reduced data capacity is generated based on the configuration of the parcel data header expressed in text format, and the compressed header is replaced with the original parcel data header.
  • compressed parcel data with a reduced data capacity can be generated.
  • compressed parcel data with a reduced header capacity can be created in the text format, and compressed parcel data can be stored even in an environment where the data capacity that can be stored is limited.
  • the compressed parcel data created in this embodiment is expressed in a format compliant with the parcel standard, these applications can be used without adding special functions to applications that handle parcel data. Can read and write.
  • these compressed parcel data can be efficiently generated for parcel data that is a sheet for describing data of the same class and has the same property order.
  • the compressed data generation apparatus 300 stores the remote DB 332 in the storage device 114 included in the data management apparatus 330, but the present invention is not limited to this.
  • the compressed data generation device 300 may store the remote DB 332 in the storage device 104 within the device itself.
  • the compressed data generation apparatus 300 and the data management apparatus 330 may be configured as an integrated information processing apparatus.
  • FIG. 18 is a diagram showing the configuration of the data restoration device 360 according to the present embodiment.
  • the data restoration device 360 includes a CPU (Central Processing Unit) 121, a ROM 122, a RAM 123, a storage device 124, a medium reading device 126, a bus controller 127, a display device 128, an input device 129, and a communication unit 364. Is provided.
  • each component of the data restoration device 360 is connected via a bus controller 127 and can exchange data with each other.
  • CPU 121 controls the entire compressed data generating apparatus 300.
  • the ROM 122 stores various data and various programs that the CPU 121 reads and executes.
  • the RAM 123 is a storage device that primarily stores information, and temporarily stores various programs read by the CPU 121.
  • the storage device 124 stores various data and various programs that the CPU 121 reads and executes.
  • the storage device 124 is, for example, a hard disk drive (Hard Disk Drive: HDD).
  • the medium reading device 126 is a drive device for reading data recorded on a computer-readable storage medium (for example, a CD (Compact Disk) etc.) In order to execute each process of the CPU 121 according to the present embodiment. These programs may be recorded on a computer-readable recording medium.
  • a computer-readable storage medium for example, a CD (Compact Disk) etc.
  • the display device 128 displays information according to control by the CPU 121.
  • the input device 129 receives an instruction input or operation by the user.
  • the input device 129 is, for example, a keyboard or a mouse.
  • the communication unit 364 communicates with the data management device 330 via the network 150. This communication may be wired or wireless.
  • FIG. 19 is a functional block diagram of the data restoration device 360 according to the present embodiment.
  • the CPU 121 reads out the program from the ROM 122 or the storage device 124 to the RAM 123 and executes the program, or executes the program read from the computer-readable storage medium into the RAM 123 by the medium reading device 126.
  • an acquisition unit 361, a determination unit 362, a header information acquisition unit 363, a data registration unit 365, a restoration unit 367, a parcel data processing unit 368, and a prior acquisition unit 369 are generated on the RAM 123.
  • the storage device 124 stores a local DB 366.
  • the parcel data restoration process in the data restoration device 360 is started when the user performs a parcel data acquisition operation instructing the input device 129 to read the parcel data 372 while viewing the screen displayed on the display device 128. .
  • the acquisition unit 361 acquires data 372 when the input device 129 receives a parcel data acquisition operation.
  • the data 372 is either the parcel data 308 or the compressed parcel data 309 in which the header section is compressed.
  • the acquisition unit 361 loads the parcel data 372 into the memory and passes it to the determination unit 362.
  • the determination unit 362 determines whether or not the header of the data 372 is compressed based on the header included in the text format data 372. Specifically, for example, the determination unit 362 analyzes the header information of the data 372 and passes the data 372 to the header information acquisition unit 363 when the header needs to be restored. On the other hand, when restoration of the header is unnecessary or impossible, the data 372 is passed to the parcel data processing unit 368. Details of the operation of the determination unit 362 will be described later.
  • the storage device 124 of the data management device 330 characterizes the data configuration identification information and the class identification information and the class for identifying the class into which the goods or services to be described by the original data are classified. A combination of properties (attributes) and attribute defining information that defines their order are stored in association with each other. Further, the storage device 124 stores header configuration identification information and header configuration information that defines the configuration of the original header in association with each other.
  • the header information acquisition unit 363 determines the data configuration identification information (for example, structure ID) and the header configuration identification information (for example, the header) from the header of the data 372. ID) is extracted, and header information including information associated with either the extracted header configuration identification information or data configuration identification information is acquired from the storage device 124.
  • the header information acquisition unit 363 acquires the structure ID from the value of the instruction #CLASS_ID of the header section of the parcel data 372 received from the determination unit 362, and further extracts the header ID specified by the instruction #HEADER_ID. To do. Then, the header information acquisition unit 363 acquires header information associated with these from the data management device 330 via the local DB 366 or the communication unit 364. Here, when the header information is acquired from the data management device 330, the header information is transferred to the data registration unit 365 for storage in the local DB 366. Thereafter, the header information and the parcel data 372 are sent to the restoration unit 367. Details of the operation of the header information acquisition unit 363 will be described later.
  • the communication unit 364 communicates with the data management device 330 having the storage device 124. Specifically, the communication unit 364 transmits an inquiry from the header information acquisition unit 363 to the data management device 330 via the network 150. Then, the communication unit 364 receives the header information transmitted from the data management device 330 in response to this inquiry via the network 150 and passes the received header information to the header information acquisition unit 363.
  • the data registration unit 365 stores the header information acquired by the header information acquisition unit 363 in the storage device 124. Specifically, the data registration unit 365 stores the header information passed from the header information acquisition unit 363 in the local DB 366 in the storage device 124. In addition, the data registration unit 365 causes the storage device 366 to store the header information acquired by the advance acquisition unit 369.
  • the storage device (second storage device) 124 stores data including the local DB 366.
  • the local DB 366 stores the header information acquired by the header information acquisition unit 363 or the advance acquisition unit 369.
  • the configuration of information stored in the local DB 366 is the same as that of the remote DB 332 of the data management device 330, as shown in FIGS. 7A to 7D. That is, the local DB 366 stores part or all of the information of the remote DB 332 of the data management device 330.
  • the header information in the data decompression device 360 it is possible to reduce the amount of communication when restoring the original parcel data from the compressed parcel data, and to improve the processing speed.
  • the restoration unit 367 restores original data (for example, original parcel data) using the header information acquired by the header information acquisition unit 363. Alternatively, the restoration unit 367 restores the original data using the header information stored in the storage device 124.
  • the restoration unit 367 is described in each line of the header from header configuration information (for example, header text) associated with header configuration identification information (for example, header ID) included in the header information. Extracts a list of instructions that are headings. Then, for each extracted instruction, the restoration unit 367 acquires an instruction value associated with the instruction and data configuration identification information (for example, structure ID), and is included in the combination of the instruction and instruction value and the compressed data. Data including instances is generated as original data.
  • header configuration information for example, header text
  • header configuration identification information for example, header ID
  • the restoration unit 367 acquires an instruction value associated with the instruction and data configuration identification information (for example, structure ID), and is included in the combination of the instruction and instruction value and the compressed data. Data including instances is generated as original data.
  • the restoration unit 367 uses the header information passed from the header information acquisition unit 363 to convert the header section of the data 372 passed from the header information acquisition unit 363 into the header section of the original parcel data. By restoring, the original parcel data is restored.
  • the restoration unit 367 passes the restored original parcel data to the parcel data processing unit 368. Details of the operation of the restoration unit 367 will be described later.
  • the parcel data processing unit 368 performs various processes on the data 372 passed from the determination unit 362 or the original parcel data passed from the restoration unit 367.
  • the process in the pre-acquisition unit 369 is started when the user performs a pre-acquisition operation of header information via the input device 129 while viewing the screen displayed on the display device 128.
  • the pre-acquisition unit 369 acquires header information for restoring the header in the data 372 to the header before compression from the storage device 114 via the communication unit 364 in advance. Specifically, for example, the advance acquisition unit 369 acquires necessary header information from the data management device 330 in advance and registers it in the local DB 366. This is effective when the compressed parcel data to be processed by the data decompression apparatus is known in advance. By registering in advance, the data 372 can be restored to the original parcel data even in an offline environment. it can.
  • the pre-acquisition unit 369 acquires a list of header IDs used by the compressed parcel data allocated to the equipment in the building based on information from a sensor arranged at the entrance of the building, and automatically The header information may be acquired.
  • FIG. 20 is a flowchart illustrating an example of a process flow of the determination unit 362 of the data restoration device 360.
  • Step S1501 First, the determination unit 362 acquires data 372 from the acquisition unit 361.
  • Step S1502 Next, the determination unit 362 analyzes the header section of the data 372.
  • Step S1503 the determination unit 362 determines whether the header section of the data 372 is compressed. Specifically, for example, the determination unit 362 inquires the value of the instruction #CLASS_ID of the data 372 to the data management device 330, and if this is registered in the local DB 366 or the remote DB 332 of the data management device 330 as header information, this data It is determined that 372 header sections are compressed. On the other hand, in other cases, the determination unit 362 determines that the header section of the data 372 is not compressed.
  • Step S1504 When it is determined in step S1503 that the header section of the data 372 is compressed (YES in step S1503), the determination unit 362 passes this data 372 to the header information acquisition unit 363 and ends the processing. .
  • Step S1505 On the other hand, when it is determined in Step S1503 that the header section of the data 372 is not compressed (NO in Step S1503), it is not necessary to perform the restoration process, so the determination unit 362 sends the parcel data processing unit 368 to The data 372 is passed and the process is terminated.
  • FIG. 21 is a flowchart illustrating an example of the processing flow of the header information acquisition unit 363 of the data restoration device 360.
  • Step S1601 First, the header information acquisition unit 363 acquires data 372 from the determination unit 362.
  • the header information acquisition unit 363 extracts the structure ID associated with the instruction #CLASS_ID and the header ID associated with the instruction #HEADER from the header section of the acquired data 372.
  • Step S1603 the header information acquisition unit 363 uses the combination of the structure ID and the header ID extracted in step S1602 as a key to check whether there is a record including the structure ID and the header ID in the local DB 366. Inquire.
  • Step S1604 the header information acquisition unit 363 determines whether or not there is a corresponding record in the local DB 366 using the result inquired in Step S1603.
  • Step S1605 When it is determined in Step 1604 that there is a corresponding record in the local DB 366 (YES in Step S1604), the header information acquisition unit 363 acquires header information from the local DB 366.
  • Step S1606 On the other hand, if it is determined in Step 1604 that there is no corresponding record in the local DB 366 (NO in S1604), the header information acquisition unit 363 performs communication using the structure ID and header ID pair extracted in Step S1602 as a key. Header information is acquired from the remote DB 322 of the data management device 330 via the unit 364.
  • Step S1607 the header information acquisition unit 363 registers the header information acquired in Step S1606 in the local DB 366.
  • Step S1608 When the header information is acquired by the processing of step S1605 or S1607, the header information acquisition unit 363 passes the acquired header information, data 372, structure ID, and header ID to the restoration unit 367, and ends the processing.
  • FIG. 22 is a flowchart illustrating an example of a processing flow of the restoration unit 367 of the data restoration device 360.
  • Step S1701 First, the restoration unit 367 acquires header information, data 372, a structure ID, and a header ID from the header information acquisition unit 363.
  • Step S1702 Next, the restoration unit 367 generates an empty header section for restoring the header section before compression.
  • Step S1703 the restoration unit 367 acquires the header text associated with the header ID acquired in Step S1701 from the header table included in the header information acquired in Step S1701. Then, the restoration unit 367 acquires a list of instructions by extracting each instruction delimited by a delimiter from the header text. Hereinafter, restoration processing is performed in order from the first instruction in the instruction list thus obtained.
  • the restoration unit 367 acquires the instruction value associated with the set of the structure ID and the instruction to be processed from the cell column text included in the header information.
  • Step S1706 When the record including the structure ID acquired in step S1701 and the instruction to be processed is included in the alias table included in the header information, that is, when the instruction to be processed is an alias, the restoring unit 367 In the alias table included in the header information, the original value associated with the set of the structure ID and the instruction to be processed is acquired as the original instruction.
  • Step S1707 The restoration unit 367 generates text data of the class header section using the instructions and the instruction values obtained through the processing of Step S1705 and Step S1706, and adds the text data to the header section.
  • header information data structure identification information (for example, structure ID), the original instruction, and an alias of the original instruction are associated.
  • the restoration unit 367 includes the original data in the original data.
  • a combination of an instruction and an instruction value associated with the instruction to be processed is included in the header information.
  • Step S1708 When the next instruction in the instruction list is an instruction in the class header section, the processing from step S1705 to step S1707 is performed on the next instruction as a processing target.
  • the instruction to be processed next in the instruction list is an instruction in the schema header section.
  • Step S1709 If the instruction to be processed in the instruction list is an instruction in the schema header section, the following processing from Step S1710 to Step S1712 is executed.
  • Step S1710 The restoration unit 367 acquires the instruction value associated with the combination of the structure ID acquired in Step S1701 and the instruction to be processed from the cell column table included in the header information.
  • Step S1711 When the record including the structure ID acquired in step S1701 and the instruction to be processed is included in the alias table included in the header information, that is, when the instruction to be processed is an alias, the restoring unit 367 In the alias table included in the header information, the original value associated with the set of the structure ID and the instruction to be processed is acquired as an instruction, thereby restoring the instruction.
  • Step S1712 The restoration unit 367 generates text data of the schema header section from the instructions and instruction values obtained through the processing of steps S1710 and S1711, and adds the text data to the header section.
  • Step S1713 If there is a next instruction in the instruction list, the processing from step S1710 to step S1712 is performed on the next instruction as a processing target.
  • Step S1714 When the loop from Step S1709 to Step S1713 is exited, the restoration unit 367 combines the data section of the data 372 with the header section obtained by these processings, before compressing the header section. Restore parcel data.
  • Step S1715 Next, the restoration unit 367 passes the restored parcel data to the parcel data processing unit 368 and ends the processing.
  • the determination unit 362 determines whether the header of the data 372 is compressed based on the header included in the text format data 372.
  • the header information acquisition unit 363 determines the data configuration identification information (for example, structure ID) and the header configuration identification information (for example, the header) from the header of the data 372. ID) is extracted, and header information including information associated with either the extracted header configuration identification information or data configuration identification information is acquired from the storage device 114.
  • the restoration unit 367 restores the original data using the header information acquired by the header information acquisition unit 363.
  • the data restoration device 360 can restore the original data by restoring the header included in the data to the header before compression. Further, according to the present embodiment, the original parcel data can be completely restored even when the display order of the instructions is individually different.
  • the present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage.
  • various inventions can be formed by appropriately combining a plurality of components disclosed in the embodiment. For example, some components may be deleted from all the components shown in the embodiment.
  • constituent elements over different embodiments may be appropriately combined.
  • Information processing system 150 Network 300 Compressed data generation device (information processing device) 330 Data management device 360 Data restoration device (information processing device) 101, 111, 121 CPU (Central Processing Unit) 102, 112, 122 ROM 103, 113, 122 RAM 104, 114, 124 Storage device 106, 116, 126 Medium reader 107, 117, 127 Bus controller 108, 118, 128 Display device 109, 119, 129 Input device 304, 333, 364 Communication unit 301 Header acquisition unit 302 Data configuration Encoding unit 303 Header configuration encoding unit 305 Compressed data generation unit 331 Data management unit 361 Acquisition unit 362 Determination unit 363 Header information acquisition unit 365 Data registration unit 367 Restoration unit 368 Parcel data processing unit 369 Pre-acquisition unit

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

[Problem] To reduce the volume of text format data including headers and instances. [Solution] According to an embodiment, provided is an information processing device, comprising a data configuration coding unit which, on the basis of a header included in text format data, allocates data configuration identification information to a combination of class identification information which identifies a class into which a subject which the data describes is classified, and property definition information which defines combinations of properties which characterize the class and sequences thereof, said data configuration identification information identifying the said combination. The information processing device further comprises a header configuration coding unit which, on the basis of the data, allocates header configuration identification information to header configuration information which defines a combination and a sequence of instructions which are heads recited in each line of the header, said header configuration identification information identifying the said header configuration information. The information processing device further comprises a compressed data generating unit which generates compressed data which includes the data configuration identification information, the header configuration identification information, and an instance which is included in the data.

Description

情報処理装置、情報処理方法及びプログラムInformation processing apparatus, information processing method, and program
 本発明の実施形態は、情報処理装置、情報処理方法及びプログラムに関する。 Embodiments described herein relate generally to an information processing apparatus, an information processing method, and a program.
 近年、産業のグローバル化や自由化に伴い、異種システム間の相互運用性が重要になってきている。この異種システム間の相互運用性を実現する上で、各分野の機器の性能や特徴及びサービスを電子的に記述して交換し登録する際の標準仕様として、標準オントロジーの開発が進められている。この標準オントロジーの登録及び交換に関して、IEC62656(パーセル規格と呼ばれる)が知られている。 In recent years, with the globalization and liberalization of industry, interoperability between different systems has become important. In order to realize interoperability between heterogeneous systems, standard ontology is being developed as a standard specification for electronically describing, exchanging and registering the performance, features and services of devices in each field. . IEC 62656 (referred to as the parcel standard) is known for registration and exchange of this standard ontology.
 このIEC62656は、スプレッドシートによるデータ交換形式を定める国際規格である。この国際規格によるスプレッドシートは、ヘッダセクションとデータセクションの二つの部位で構成される。ヘッダセクションは、データセクションでのインスタンスの記述のための意味的及び構造的情報を与えるものである。ヘッダセクションは、更にシート全体の情報を記述するクラスヘッダセクションと、インスタンスを記述するためのプロパティの情報を個々の列に記述するスキーマヘッダセクションの二つで構成される。データセクションでは、一つのインスタンスは一つの行に記述され、個々のセルには対応するプロパティの値が記述される。以下では、このスプレッドシートを書式として記述されるデータを、IEC62656の通称である「パーセル」という語を用いてパーセルデータと呼ぶ。 IEC62656 is an international standard that defines a data exchange format using a spreadsheet. This international standard spreadsheet consists of two parts: a header section and a data section. The header section provides semantic and structural information for the description of the instance in the data section. The header section is further composed of a class header section that describes information on the entire sheet and a schema header section that describes property information for describing instances in individual columns. In the data section, one instance is described in one row, and the value of the corresponding property is described in each cell. Hereinafter, data described using this spreadsheet as a format will be referred to as parcel data using the term “parcel”, which is a common name of IEC62656.
 パーセルデータは、表形式という構造から、ヘッダセクションの各列でメタデータを一度記載すれば、それぞれのセルの値がどのプロパティの値かを識別することができる。これは、データ容量の観点から、一つ一つの値をタグで区切って構造化する必要があるXMLなどの他のデータ書式に比べた利点の一つである。 ∙ Parcel data can be identified from the structure of tabular form, by describing metadata once in each column of the header section, which property value each cell value has. This is one of the advantages compared to other data formats such as XML in which each value needs to be structured by delimiting with a tag from the viewpoint of data capacity.
特開2009-77141号公報JP 2009-77141 A 特開2007-214627号公報JP 2007-214627 A
 しかし、データセクションに記載されるインスタンスが1行又は数行程度の場合、データ本体に比べて、ヘッダセクションに記載されるヘッダのデータ容量が大きくなるという欠点がある。例えば、プロパティのIDが6文字の英数字で構成されるデータについて、20個のプロパティがある場合、ヘッダだけで120文字を消費する。このため、二次元コードのように、記憶できるデータ容量に制限がある場合には、全てのデータが収まらないという問題がある。 However, when the instance described in the data section is about one line or several lines, there is a disadvantage that the data capacity of the header described in the header section is larger than that of the data body. For example, if there are 20 properties for data consisting of 6 alphanumeric characters for the property ID, 120 characters are consumed only by the header. For this reason, there is a problem that not all data can be stored when there is a limit to the data capacity that can be stored, such as a two-dimensional code.
 そこで本発明の実施形態が解決しようとする課題は、ヘッダとインスタンスとを含むテキスト形式のデータの容量を減らすことが可能な情報処理装置、情報処理方法及びプログラムを提供することである。 Therefore, a problem to be solved by the embodiment of the present invention is to provide an information processing apparatus, an information processing method, and a program capable of reducing the capacity of text data including a header and an instance.
 一の実施形態によれば、情報処理装置は、テキスト形式のデータに含まれるヘッダに基づいて、前記データが記述する対象が分類されたクラスを識別するクラス識別情報と、前記クラスを特徴づける属性の組み合わせとその順番を規定する属性規定情報との組に対して、前記組を識別するデータ構成識別情報を割り当てるデータ構成符号化部を備える。情報処理装置は、前記データに基づいて、前記ヘッダの個々の行に記載された見出しであるインストラクションの組み合わせとその順番を規定するヘッダ構成情報に対して、前記ヘッダ構成情報を識別するヘッダ構成識別情報を割り当てるヘッダ構成符号化部を備える。情報処理装置は、前記データ構成識別情報と前記ヘッダ構成識別情報と前記データに含まれるインスタンスとを含む圧縮データを生成する圧縮データ生成部を備える。 According to one embodiment, the information processing apparatus, based on a header included in text format data, class identification information for identifying a class into which a target described by the data is classified, and an attribute characterizing the class A data configuration encoding unit that assigns data configuration identification information for identifying the set to a set of the combination of the attribute and the attribute defining information that defines the order. Based on the data, the information processing apparatus identifies the header configuration information for identifying the header configuration information with respect to the header configuration information that defines a combination of instructions and their order, which are headings described in individual rows of the header. A header configuration encoding unit that assigns information is provided. The information processing apparatus includes a compressed data generation unit that generates compressed data including the data configuration identification information, the header configuration identification information, and an instance included in the data.
本実施形態に係る情報処理システム1の構成を示す図。The figure which shows the structure of the information processing system 1 which concerns on this embodiment. パーセルデータの表示形態及びそのテキスト表現を例示する図。The figure which illustrates the display form of parcel data, and its text expression. 本実施形態に係る圧縮データ生成装置300の構成を示す図。The figure which shows the structure of the compressed data generation apparatus 300 which concerns on this embodiment. 本実施形態に係る圧縮データ生成装置300の機能ブロック図。The functional block diagram of the compressed data generation apparatus 300 which concerns on this embodiment. 本実施形態に係るデータ管理装置330の構成を示す図。The figure which shows the structure of the data management apparatus 330 which concerns on this embodiment. 本実施形態に係るデータ管理装置330の機能ブロック図。The functional block diagram of the data management apparatus 330 which concerns on this embodiment. リモートDB332で記憶されるストラクチャテーブルT1の構造を例示する図。The figure which illustrates the structure of structure table T1 memorize | stored in remote DB332. リモートDB332で記憶されるエイリアステーブルT2の構造を例示する図。The figure which illustrates the structure of alias table T2 memorize | stored in remote DB332. リモートDB332で記憶されるセルカラムテーブルT3の構造を例示する図。The figure which illustrates the structure of cell column table T3 memorize | stored in remote DB332. リモートDB332で記憶されるヘッダテーブルT4の構造を例示する図。The figure which illustrates the structure of header table T4 memorize | stored in remote DB332. 圧縮データ生成装置300のデータ構成符号化部302の処理の流れの一例を示すフローチャート。5 is a flowchart showing an example of a processing flow of a data configuration encoding unit 302 of the compressed data generation device 300. 図2のパーセルデータにデータ構成符号化部302の処理を適用した場合を例示する図。The figure which illustrates the case where the process of the data structure encoding part 302 is applied to the parcel data of FIG. 圧縮データ生成装置300のヘッダ構成符号化部303の処理の流れの一例を示すフローチャート。5 is a flowchart showing an example of a process flow of a header configuration encoding unit 303 of the compressed data generation device 300. 図10のステップS702におけるクラスヘッダセクションの処理の流れの一例を示すフローチャート。FIG. 11 is a flowchart showing an example of a process flow of a class header section in step S702 of FIG. 図11のステップS900におけるインストラクションの処理の流れの一例を示すフローチャート。The flowchart which shows an example of the flow of the process of the instruction | indication in step S900 of FIG. 図10のステップS703におけるスキーマヘッダセクションの処理の流れの一例を示すフローチャート。FIG. 11 is a flowchart showing an example of a process flow of a schema header section in step S703 of FIG. 図2のパーセルデータにヘッダ構成符号化部303の処理を適用した場合を例示する図である。It is a figure which illustrates the case where the process of the header structure encoding part 303 is applied to the parcel data of FIG. 図2のパーセルデータのヘッダ情報がデータ管理装置330のリモートDB332に登録された状態で、別のパーセルデータの処理を行った場合の例を表した図。The figure showing the example at the time of processing another parcel data in the state which registered the header information of the parcel data of FIG. 2 in remote DB332 of the data management apparatus 330. FIG. 圧縮データ生成装置300の圧縮データ生成部305の処理の流れの一例を示すフローチャート。5 is a flowchart illustrating an example of a processing flow of a compressed data generation unit 305 of the compressed data generation apparatus 300. 図2のパーセルデータを入力として、本実施形態における圧縮データ生成装置300の一連の処理で出力された圧縮パーセルデータの例を示す図。The figure which shows the example of the compression parcel data output by the series of processes of the compression data generation apparatus 300 in this embodiment, using the parcel data of FIG. 本実施形態に係る圧縮データ生成装置300の構成を示す図。The figure which shows the structure of the compressed data generation apparatus 300 which concerns on this embodiment. 本実施形態に係るデータ復元装置360の機能ブロック図。The functional block diagram of the data decompression | restoration apparatus 360 which concerns on this embodiment. データ復元装置360の判定部362の処理の流れの一例を示すフローチャート。6 is a flowchart illustrating an example of a processing flow of a determination unit 362 of the data restoration device 360. データ復元装置360のヘッダ情報取得部363の処理の流れの一例を示すフローチャート。The flowchart which shows an example of the flow of a process of the header information acquisition part 363 of the data decompression | restoration apparatus 360. FIG. データ復元装置360の復元部367の処理の流れの一例を示すフローチャート。The flowchart which shows an example of the flow of a process of the decompression | restoration part 367 of the data restoration apparatus 360. FIG.
 以下、図面を参照しながら、本発明の実施形態について説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
 本実施形態で扱うデータは、ヘッダとインスタンスとを含み、ヘッダがマトリックス状に構成されるスプレッドシートで表すことが可能なテキスト形式のデータである。本実施形態では、その一例として、IEC62656に準拠したデータ(以下、パーセルデータという)を用いて説明する。 The data handled in this embodiment is data in a text format that includes a header and instances, and the header can be represented by a spreadsheet configured in a matrix. In the present embodiment, an example will be described using data conforming to IEC 62656 (hereinafter referred to as parcel data).
 まず、本実施形態に係る情報処理システム1の構成について説明する。図1は、本実施形態に係る情報処理システム1の構成を示す図である。図1に示すように、情報処理システム1は、圧縮データ生成装置(情報処理装置)300、データ管理装置330、及びデータ復元装置(情報処理装置)360を備える。圧縮データ生成装置300、データ管理装置330、及びデータ復元装置360は、互いにネットワーク150を介して接続されており、互いに通信可能である。 First, the configuration of the information processing system 1 according to the present embodiment will be described. FIG. 1 is a diagram illustrating a configuration of an information processing system 1 according to the present embodiment. As illustrated in FIG. 1, the information processing system 1 includes a compressed data generation device (information processing device) 300, a data management device 330, and a data restoration device (information processing device) 360. The compressed data generation device 300, the data management device 330, and the data restoration device 360 are connected to each other via the network 150 and can communicate with each other.
 圧縮データ生成装置300は、テキスト形式の元データ(一例として、元のパーセルデータ)を取得し、取得した元データを圧縮することにより、圧縮データ(一例として、圧縮パーセルデータ)を生成する。圧縮データ生成装置300は、例えば、端末装置である。 The compressed data generation apparatus 300 acquires original data in text format (for example, original parcel data) and compresses the acquired original data to generate compressed data (for example, compressed parcel data). The compressed data generation device 300 is, for example, a terminal device.
 データ管理装置330は、圧縮データを元データに復元するためのヘッダ情報を記憶する。データ管理装置330は、例えば、ヘッダ情報を記憶するサーバである。 The data management device 330 stores header information for restoring the compressed data to the original data. The data management device 330 is, for example, a server that stores header information.
 データ復元装置360は、データ管理装置330が記憶するヘッダ情報を用いて、圧縮データ(一例として、圧縮パーセルデータ)から元データ(一例として、元のパーセルデータ)を復元する。データ復元装置360は、例えば、端末装置である。 The data restoration device 360 restores the original data (for example, the original parcel data) from the compressed data (for example, the compressed parcel data) using the header information stored in the data management device 330. The data restoration device 360 is, for example, a terminal device.
 続いて、図2を用いて本実施形態に係るパーセルデータの構造について説明する。本実施形態に係るパーセルデータはスプレッドシートによる製品オントロジーの登録と交換に関する国際規格IEC62656で規定される形式のスプレッドシートで表現される。図2は、パーセルデータの表示形態及びそのテキスト表現を例示する図である。 Subsequently, the parcel data structure according to the present embodiment will be described with reference to FIG. The parcel data according to the present embodiment is expressed by a spreadsheet in a format defined by the international standard IEC62656 relating to registration and exchange of product ontology using a spreadsheet. FIG. 2 is a diagram illustrating a display form of parcel data and a text representation thereof.
 図2の上側の表D1に示すように、パーセルデータは、行の方向にはヘッダセクションとデータセクションの二つの部位がデータの先頭から順に展開される。一方、列の方向にはインストラクションカラムとセルカラムの順で展開される。ヘッダセクションは更に、パーセルデータ全体に関する情報を記述するためのクラスヘッダセクションと、データセクション内のインスタンスを記述するためのプロパティとその値の組を有するスキーマヘッダセクションの二つの部位で構成される。ここで、一つのインスタンスは、データセクションの一つの行に記述される。図2の例では、一つのインスタンスのみが記述されているため、太枠で囲まれた領域に含まれる値の組が一つのインスタンスを示すが、二つ以上のインスタンスが記述される場合、その数に等しい行がデータセクションに展開され、個々の行に個々のインスタンスが記述される。 As shown in Table D1 on the upper side of FIG. 2, parcel data is expanded in order from the head of the data in two parts, a header section and a data section, in the row direction. On the other hand, in the column direction, the instruction column and the cell column are expanded in this order. The header section is further composed of two parts: a class header section for describing information related to the entire parcel data, and a schema header section having a set of properties and values for describing instances in the data section. Here, one instance is described in one line of the data section. In the example of FIG. 2, since only one instance is described, a set of values included in an area surrounded by a thick frame indicates one instance. When two or more instances are described, Lines equal to the number are expanded into data sections, and individual instances are described in individual lines.
 インストラクションカラムは、パーセルデータの1列目であり、ヘッダセクションに対しては、コンピュータ及びユーザに対して、各行のヘッダが何を表しているかを指示するインストラクションが記載される。ヘッダセクションのインストラクションは、#(パウンド)記号に続けてIEC62656の中で予め定義された命令語、又はユーザが独自に定義した命令語が記述される。 The instruction column is the first column of parcel data, and in the header section, an instruction that indicates what the header of each row represents to the computer and the user is described. In the instruction of the header section, an instruction word predefined in IEC62656 or an instruction word uniquely defined by the user is described following a # (pound) symbol.
 クラスヘッダセクションの各行はインストラクションカラムのみを持ち、#記号及び命令語に続けて、「:=」を挟んでその命令語に対応する値が記述される。たとえば、図2の表の1行目の先頭セルに記載されている#CLASS_ID:=AAX001のうち「#CLASS_ID」は、クラスヘッダセクションのインストラクションの一つであり、このパーセルデータがAAX001で指定されるクラスのインスタンスを記述するためのシートであることを示している。このAAX001は、物品やサービスの分類に相当するクラスを識別するクラス識別子の一例である。例えば、上位のクラスが電気製品である場合、この電気製品のクラスの下位に、例えば、モータ、パソコン、フラッシュメモリなどの個々のクラスがあって、これらの個々のクラスがクラス識別子によって識別される。 Each line of the class header section has only an instruction column, and a value corresponding to the instruction word is described after “: =” after the # symbol and the instruction word. For example, “#CLASS_ID” in #CLASS_ID: = AAX001 described in the first cell in the first row of the table in FIG. 2 is one of the instructions in the class header section, and this parcel data is specified by AAX001. This is a sheet for describing an instance of a class. This AAX001 is an example of a class identifier for identifying a class corresponding to the classification of goods and services. For example, when the upper class is an electrical product, there are individual classes such as a motor, a personal computer, and a flash memory in the lower class of the electrical product, and these individual classes are identified by a class identifier. .
 セルカラムは、プロパティとその値を記述するための列である。パーセルデータは一つ以上のセルカラムを持ち、セルカラムは、インストラクションカラムに続いて2列目以降に順に展開される。スキーマヘッダセクションの各行には、個々のセルカラムに割り当てられたプロパティのID、名称、データ型、単位などが、同じ行のインストラクションカラムに記載された命令語に基づいて記載される。 Cell column is a column for describing properties and their values. The parcel data has one or more cell columns, and the cell columns are developed in order from the second column onward after the instruction column. In each row of the schema header section, the ID, name, data type, unit, etc. of the property assigned to each cell column are described based on the instruction word described in the instruction column of the same row.
 例えば、図2の表の4行目の先頭セルには、この行のセルカラムにプロパティを識別するプロパティIDが展開されていることを示す#PROPERTY_IDが記載されており、2列目以降のセルカラムに個々のプロパティIDが順に表示されている。スキーマヘッダセクションの他の行には、それぞれのインストラクション列に記載された命令語に従って、プロパティのIDの表示順序と同じ順序で、名称やデータ型、単位などのプロパティの情報が表示されている。 For example, in the first cell of the fourth row in the table of FIG. 2, #PROPERTY_ID indicating that the property ID for identifying the property is expanded in the cell column of this row is described, and the cell columns in the second and subsequent columns are described. Individual property IDs are displayed in order. In the other rows of the schema header section, property information such as name, data type, and unit is displayed in the same order as the display order of property IDs according to the instruction word described in each instruction column.
 次に、データセクションには、一つ以上のインスタンスが行方向に表示される。ここで、インスタンスは、プロパティとそのプロパティの値の組の集合で表されるものであり、一つのインスタンスに含まれる各プロパティの値は一つの行に表示される。なお、データセクションのインストラクションカラムに#記号を書いた場合、その行はコメント行として扱われ、システムからは無視される。 Next, one or more instances are displayed in the row direction in the data section. Here, an instance is represented by a set of a set of a property and its property value, and the value of each property included in one instance is displayed in one line. If a # symbol is written in the instruction column of the data section, the line is treated as a comment line and ignored by the system.
 このような構造を持つパーセルデータにおいて、ヘッダセクションとデータセクションの境界をコンピュータ及びユーザが識別するには、インストラクションカラムを先頭行から順に走査し、セルの値が#記号で始まらない最初の行を特定することで、特定した行をデータセクションの最初の行とし、その一つ前の行までをヘッダセクションとする。 In the parcel data having such a structure, in order for the computer and the user to identify the boundary between the header section and the data section, the instruction column is scanned in order from the first row, and the first row where the cell value does not start with the # symbol is displayed. By specifying, the specified line is the first line of the data section, and the previous line is the header section.
 次に、図2の下側のテキストD2は、図2の上側の表D1をCSV(Comma Separated Values)形式で表したものである。ここで、CSV形式は非特許文献RFC4180で仕様が公開されているものであり、スプレッドシートを解釈可能な多くのアプリケーションで、スプレッドシートデータの交換の標準的な方法の一つとして実装されている。なお、本実施形態では、CSV形式を例としているが、テキスト形式でスプレッドシートデータを表現する他の形式であってもよい。例えば、カンマの代わりにタブをセルの区切り文字に使うTSB(Tab Separated Values)であってもよい。 Next, the lower text D2 in FIG. 2 is the CSV (Comma (Separated Values) format of the upper table D1 in FIG. Here, the specification of the CSV format is disclosed in non-patent document RFC4180, and it is implemented as one of the standard methods for exchanging spreadsheet data in many applications that can interpret spreadsheets. . In the present embodiment, the CSV format is taken as an example, but other formats that express spreadsheet data in a text format may be used. For example, TSB (Tab Separated Values) that uses tabs as cell delimiters instead of commas may be used.
 続いて、図3を用いて本実施形態に係る圧縮データ生成装置300の構成について説明する。図3は、本実施形態に係る圧縮データ生成装置300の構成を示す図である。図3に示すように、圧縮データ生成装置300は、CPU(Central Processing Unit)101、ROM102、RAM103、記憶装置104、媒体読取装置106、バスコントローラ107、表示装置108、入力装置109、及び通信部304を備える。図3に示すように、圧縮データ生成装置300の各構成要素は、バスコントローラ107を介して接続されており、互いにデータのやり取りが可能である。 Subsequently, the configuration of the compressed data generation apparatus 300 according to the present embodiment will be described with reference to FIG. FIG. 3 is a diagram illustrating a configuration of the compressed data generation device 300 according to the present embodiment. As illustrated in FIG. 3, the compressed data generation device 300 includes a CPU (Central Processing Unit) 101, a ROM 102, a RAM 103, a storage device 104, a medium reading device 106, a bus controller 107, a display device 108, an input device 109, and a communication unit. 304 is provided. As shown in FIG. 3, each component of the compressed data generation device 300 is connected via a bus controller 107 and can exchange data with each other.
 CPU101は、圧縮データ生成装置300全体を制御する。 CPU 101 controls the entire compressed data generating apparatus 300.
 ROM102は、各種データ、及びCPU101が読み出して実行する各種プログラムを記憶する。 The ROM 102 stores various data and various programs read and executed by the CPU 101.
 RAM103は、情報を一次記憶する記憶装置であり、CPU101が読み出した各種プログラムを一次記憶する。 The RAM 103 is a storage device that primarily stores information, and temporarily stores various programs read by the CPU 101.
 記憶装置104は、各種データ、及びCPU101が読み出して実行する各種プログラムを記憶する。記憶装置104は、例えば、ハードディスクドライブ(Hard Disk Drive:HDD)である。 The storage device 104 stores various data and various programs that the CPU 101 reads and executes. The storage device 104 is, for example, a hard disk drive (Hard Disk Drive: HDD).
 媒体読取装置106は、コンピュータ読み取り可能な記憶媒体(例えば、CD(Compact Diskなど)に記録されたデータを読み取るためのドライブ装置である。なお、本実施形態に係るCPU101の各処理を実行するためのプログラムがコンピュータ読み取り可能な記録媒体に記録されていてもよい。 The medium reading device 106 is a drive device for reading data recorded on a computer-readable storage medium (for example, a CD (Compact Disk) etc.) In order to execute each process of the CPU 101 according to the present embodiment. These programs may be recorded on a computer-readable recording medium.
 表示装置108は、CPU101による制御に従って情報を表示する。 The display device 108 displays information according to control by the CPU 101.
 入力装置109は、ユーザによる、指示入力または操作を受け付ける。入力装置109は、例えばキーボードやマウスである。 The input device 109 receives an instruction input or operation by the user. The input device 109 is, for example, a keyboard or a mouse.
 通信部304は、ネットワーク150を介して、後述する記憶装置114を有するデータ管理装置330と通信する。この通信は、有線であっても無線であってもよい。 The communication unit 304 communicates with the data management device 330 having the storage device 114 described later via the network 150. This communication may be wired or wireless.
 続いて、図4を用いて本実施形態に係る圧縮データ生成装置300の機能的構成について説明する。図4は、本実施形態に係る圧縮データ生成装置300の機能ブロック図である。CPU101は、ROM102、または記憶装置104からプログラムをRAM103に読み出して実行するか、または媒体読取装置106がコンピュータ読み取り可能な記憶媒体からRAM103に読み出したプログラムを実行する。このプログラムの実行により、RAM103上に、ヘッダ取得部301、データ構成符号化部302、ヘッダ構成符号化部303、圧縮データ生成部305が生成される。 Subsequently, a functional configuration of the compressed data generation apparatus 300 according to the present embodiment will be described with reference to FIG. FIG. 4 is a functional block diagram of the compressed data generation apparatus 300 according to this embodiment. The CPU 101 reads out a program from the ROM 102 or the storage device 104 to the RAM 103 and executes the program, or executes a program read from the computer-readable storage medium into the RAM 103 by the medium reading device 106. By executing this program, a header acquisition unit 301, a data configuration encoding unit 302, a header configuration encoding unit 303, and a compressed data generation unit 305 are generated on the RAM 103.
 圧縮データ生成装置300における圧縮データ生成処理は、ユーザが表示装置108に表示される画面を見ながら入力装置109を介してパーセルデータ308を選択する圧縮データ生成操作を行うことで開始される。 The compressed data generation process in the compressed data generation device 300 is started when the user performs a compressed data generation operation for selecting the parcel data 308 via the input device 109 while viewing the screen displayed on the display device 108.
 ヘッダ取得部301は、入力装置109から、ユーザによる圧縮データ生成操作を受け付けると、ユーザが選択したパーセルデータ308をRAM103に読み込み、パーセルデータに含まれるヘッダセクションの情報(以下、ヘッダという)を抽出する。このように、ヘッダ取得部301は、パーセルデータ308に含まれるヘッダを取得する。そして、ヘッダ取得部301は、この取得したヘッダをテキスト形式のデータに変換し、このテキスト形式のデータ及びパーセルデータ308をデータ構成符号化部302に渡す。 Upon receiving a compressed data generation operation by the user from the input device 109, the header acquisition unit 301 reads the parcel data 308 selected by the user into the RAM 103, and extracts header section information (hereinafter referred to as a header) included in the parcel data. To do. As described above, the header acquisition unit 301 acquires the header included in the parcel data 308. Then, the header acquisition unit 301 converts the acquired header into text format data, and passes the text format data and parcel data 308 to the data configuration encoding unit 302.
 データ構成符号化部302は、テキスト形式のデータに含まれるヘッダを用いて、このデータが記述する対象の物品やサービスが分類されたクラスを識別するクラス識別情報(例えば、後述するクラスID)と、このクラスを特徴づけるプロパティ(属性)の組み合わせとその順番を規定する属性規定情報(例えば、後述するセルカラムテキスト)との組に対して、この組を識別するデータ構成識別情報(例えば、後述するストラクチャID)を割り当てる。これにより、クラス識別情報と属性規定情報との組毎に、異なるデータ構成識別情報が割り当てられる。その結果、データ構成識別情報は、データの構成を識別する情報として機能する。 The data configuration encoding unit 302 uses class identification information (for example, a class ID to be described later) that identifies a class into which an article or service to be described by the data is classified using a header included in the text format data. Data configuration identification information (for example, described later) for a combination of a combination of properties (attributes) that characterize this class and attribute definition information (for example, cell column text described later) for defining the order Assigned structure ID). As a result, different data configuration identification information is assigned to each set of class identification information and attribute defining information. As a result, the data configuration identification information functions as information for identifying the data configuration.
 具体的には例えば、データ構成符号化部302は、データ構成符号化部302が取得したヘッダから、インストラクション#CLASS_IDの値であるクラスIDと、インストラクション#PROPERTY_IDの行のセルカラムの値(以下、セルカラムテキストという)を抽出する。そして、データ構成符号化部302は、抽出したクラスIDとセルカラムテキストとの組をテキスト符号化してストラクチャIDを生成する。このように、データ構成符号化部302は、一例として、クラス識別情報と属性規定情報との組に対してテキスト符号化を行うことにより、データ構成識別情報を生成する。このテキスト符号化は、例えば、ハッシュ関数を用いたハッシュ値の計算である。 Specifically, for example, the data configuration encoding unit 302 uses the class ID that is the value of the instruction #CLASS_ID and the value of the cell column in the row of the instruction #PROPERTY_ID (hereinafter, cell Column text). Then, the data configuration encoding unit 302 generates a structure ID by text encoding the set of the extracted class ID and cell column text. Thus, as an example, the data configuration encoding unit 302 generates data configuration identification information by performing text encoding on a set of class identification information and attribute defining information. This text encoding is, for example, calculation of a hash value using a hash function.
 そして、クラスIDとセルカラムテキストとストラクチャIDとの組をデータ管理装置330のリモートDB332に登録するため、データ構成符号化部302は、クラスIDとセルカラムテキストとストラクチャIDとの組をヘッダ登録要求とともに、通信部304からデータ管理装置330へ送信する。すなわち、データ構成符号化部302は、記憶装置114に記憶させるデータを通信部304からデータ管理装置330へ送信させ、当該記憶させるデータをデータ管理装置330に記憶させるようにする。更に、データ構成符号化部302は、クラスIDとセルカラムテキストとストラクチャIDとの組をヘッダ構成符号化部303に渡す。データ構成符号化部302の動作の詳細は後述する。 Then, in order to register the set of class ID, cell column text, and structure ID in the remote DB 332 of the data management device 330, the data configuration encoding unit 302 registers the set of class ID, cell column text, and structure ID as a header. Along with the request, the data is transmitted from the communication unit 304 to the data management device 330. That is, the data configuration encoding unit 302 transmits data to be stored in the storage device 114 from the communication unit 304 to the data management device 330 and causes the data management device 330 to store the data to be stored. Further, the data configuration encoding unit 302 passes a set of the class ID, cell column text, and structure ID to the header configuration encoding unit 303. Details of the operation of the data structure encoding unit 302 will be described later.
 ヘッダ構成符号化部303は、上記パーセルデータ308を用いて、上記ヘッダの個々の行に記載された見出しであるインストラクションの組み合わせとその順番を規定するヘッダ構成情報(例えば、後述するヘッダテキスト)に対して、ヘッダ構成情報を識別するヘッダ構成識別情報(例えば、後述するヘッダID)を割り当てる。 The header configuration encoding unit 303 uses the parcel data 308 to generate header configuration information (for example, header text to be described later) that defines the combination of instructions that are headings described in the individual rows of the header and the order of the combinations. On the other hand, header configuration identification information (for example, a header ID described later) for identifying the header configuration information is assigned.
 具体的には例えば、ヘッダ構成符号化部303は、パーセルデータ308のヘッダセクションのクラスヘッダセクション及びスキーマヘッダセクションのそれぞれに対し処理を行い、パーセルデータのヘッダセクションの構成を表すテキストデータであるヘッダテキストを生成する。そして、ヘッダ構成符号化部303は、このヘッダテキストをテキスト符号化してヘッダIDを生成する。このように、ヘッダ構成符号化部303は、一例として、ヘッダ構成情報に対してテキスト符号化を行うことにより、ヘッダ構成識別情報を生成する。このテキスト符号化は、例えば、ハッシュ関数を用いたハッシュ値の計算である。 Specifically, for example, the header configuration encoding unit 303 performs processing on each of the class header section and the schema header section of the header section of the parcel data 308, and is a header that is text data representing the configuration of the header section of the parcel data. Generate text. The header configuration encoding unit 303 then encodes the header text to generate a header ID. Thus, the header structure encoding part 303 produces | generates header structure identification information by performing text encoding with respect to header structure information as an example. This text encoding is, for example, calculation of a hash value using a hash function.
 そして、ヘッダ構成符号化部303は、このヘッダテキストとヘッダIDの組をデータ管理装置330のリモートDB332に登録するため、このヘッダテキストとヘッダIDの組をヘッダ登録要求とともに、通信部304を介してデータ管理装置330へ送信する。すなわち、ヘッダ構成符号化部303は、記憶装置114に記憶させるデータを通信部304からデータ管理装置330へ送信させ、当該記憶させるデータをデータ管理装置330に記憶させるようにする。更に、このヘッダテキストとヘッダIDの組を圧縮データ生成部305に渡す。ヘッダ構成符号化部303の動作の詳細は後述する。 Then, the header configuration encoding unit 303 registers the header text and header ID pair in the remote DB 332 of the data management device 330, so that the header text and header ID pair is sent via the communication unit 304 together with the header registration request. To the data management device 330. That is, the header configuration encoding unit 303 transmits data to be stored in the storage device 114 from the communication unit 304 to the data management device 330, and causes the data management device 330 to store the data to be stored. Further, the combination of the header text and the header ID is passed to the compressed data generation unit 305. Details of the operation of the header configuration encoding unit 303 will be described later.
 上述したように、通信部304は、データ構成符号化部302及びヘッダ構成符号化部303からそれぞれ渡されたデータを、ネットワーク150を介してデータ管理装置330へ送信する。 As described above, the communication unit 304 transmits the data passed from the data configuration encoding unit 302 and the header configuration encoding unit 303 to the data management device 330 via the network 150.
 圧縮データ生成部305は、データ構成識別情報(例えば、ストラクチャID)とヘッダ構成識別情報(例えば、ヘッダID)と上記パーセルデータ308に含まれるインスタンスとを含む圧縮データを生成する。具体的には例えば、圧縮データ生成部305は、データ構成符号化部302で生成したストラクチャIDをインストラクション#CLASS_IDの値として持ち、更にヘッダ構成符号化部303で生成したヘッダIDを所定のインストラクション(例えば、#HEADER)の値として持つヘッダを生成する。そして、圧縮データ生成部305は、生成したヘッダとパーセルデータ308のデータセクションのデータを結合した圧縮パーセルデータ309を圧縮データの一例として生成する。そして、圧縮データ生成部305は、この圧縮パーセルデータ309を当該圧縮データ生成装置300の外部へ出力する。圧縮データ生成部305の動作の詳細は後述する。 The compressed data generation unit 305 generates compressed data including data configuration identification information (for example, structure ID), header configuration identification information (for example, header ID), and an instance included in the parcel data 308. Specifically, for example, the compressed data generation unit 305 has the structure ID generated by the data configuration encoding unit 302 as the value of instruction #CLASS_ID, and further uses the header ID generated by the header configuration encoding unit 303 as a predetermined instruction ( For example, a header having a value of #HEADER) is generated. Then, the compressed data generation unit 305 generates compressed parcel data 309 obtained by combining the generated header and data of the data section of the parcel data 308 as an example of compressed data. Then, the compressed data generation unit 305 outputs the compressed parcel data 309 to the outside of the compressed data generation apparatus 300. Details of the operation of the compressed data generation unit 305 will be described later.
 続いて、図5を用いて本実施形態に係るデータ管理装置330の構成について説明する。図5は、本実施形態に係るデータ管理装置330の構成を示す図である。図5に示すように、データ管理装置330は、CPU(Central Processing Unit)111、ROM112、RAM113、記憶装置114、媒体読取装置116、バスコントローラ117、表示装置118、入力装置119、及び通信部333を備える。図5に示すように、データ管理装置330の各構成要素は、バスコントローラ117を介して接続しており、互いにデータのやり取りが可能である。 Subsequently, the configuration of the data management apparatus 330 according to the present embodiment will be described with reference to FIG. FIG. 5 is a diagram illustrating a configuration of the data management apparatus 330 according to the present embodiment. As shown in FIG. 5, the data management device 330 includes a CPU (Central Processing Unit) 111, a ROM 112, a RAM 113, a storage device 114, a medium reading device 116, a bus controller 117, a display device 118, an input device 119, and a communication unit 333. Is provided. As shown in FIG. 5, each component of the data management device 330 is connected via a bus controller 117 and can exchange data with each other.
 CPU111は、データ管理装置330全体を制御する。 CPU 111 controls the entire data management device 330.
 ROM112は、各種データ、及びCPU111が読み出して実行する各種プログラムを記憶する。 The ROM 112 stores various data and various programs that the CPU 111 reads and executes.
 RAM113は、情報を一次記憶する記憶装置であり、CPU111が読み出した各種プログラムを一次記憶する。 The RAM 113 is a storage device that primarily stores information, and temporarily stores various programs read by the CPU 111.
 記憶装置114は、各種のデータを記憶する。記憶装置114は、例えば、ハードディスクドライブ(Hard Disk Drive:HDD)である。 The storage device 114 stores various data. The storage device 114 is, for example, a hard disk drive (Hard Disk Drive: HDD).
 媒体読取装置116は、コンピュータ読み取り可能な記憶媒体(例えば、CD(Compact Diskなど)に記録されたデータを読み取るためのドライブ装置である。なお、本実施形態に係るCPU111の各処理を実行するためのプログラムがコンピュータ読み取り可能な記録媒体に記録されていてもよい。 The medium reading device 116 is a drive device for reading data recorded on a computer-readable storage medium (for example, CD (Compact Disk) etc.) In order to execute each process of the CPU 111 according to the present embodiment. These programs may be recorded on a computer-readable recording medium.
 表示装置118は、CPU111による制御に従って情報を表示する。 Display device 118 displays information in accordance with control by CPU 111.
 入力装置119は、データ管理装置330を使用するユーザによる、指示入力または操作を受け付ける。入力装置119は、例えばキーボードやマウスである。 The input device 119 accepts an instruction input or operation by a user using the data management device 330. The input device 119 is, for example, a keyboard or a mouse.
 通信部333は、ネットワーク150を介して、圧縮データ生成装置300と通信する。この通信は、有線であっても無線であってもよい。 The communication unit 333 communicates with the compressed data generation apparatus 300 via the network 150. This communication may be wired or wireless.
 続いて、図6を用いて本実施形態に係るデータ管理装置330の機能的構成について説明する。図6は、本実施形態に係るデータ管理装置330の機能ブロック図である。CPU111は、ROM112からプログラムをRAM113に読み出して実行するか、または媒体読取装置116がコンピュータ読み取り可能な記憶媒体からRAM113に読み出したプログラムを実行する。このプログラムの実行により、RAM113上に、データ管理部331が生成される。また、記憶装置114は、リモートDB332を記憶する。 Subsequently, a functional configuration of the data management apparatus 330 according to the present embodiment will be described with reference to FIG. FIG. 6 is a functional block diagram of the data management apparatus 330 according to the present embodiment. The CPU 111 reads the program from the ROM 112 to the RAM 113 and executes the program, or executes the program read by the medium reading device 116 from the computer-readable storage medium to the RAM 113. By executing this program, a data management unit 331 is generated on the RAM 113. Further, the storage device 114 stores a remote DB 332.
 データ管理部331は、圧縮データ生成装置300から通信部333を介して受け取ったヘッダ登録要求を解釈し、圧縮データ生成装置300から通信部333を介して受け取ったデータをヘッダ情報として、リモートDB332に登録する。このように、リモートDB332は、圧縮データ生成装置300の処理の結果生成されるヘッダ情報を記憶する。また、圧縮データ生成装置300及びデータ復元装置360から通信部333を介して受け取ったヘッダ情報の問合せ要求を解釈し、リモートDB332からヘッダ情報を抽出し、通信部333を介してヘッダ情報を送信する。 The data management unit 331 interprets the header registration request received from the compressed data generation device 300 via the communication unit 333 and stores the data received from the compressed data generation device 300 via the communication unit 333 as header information in the remote DB 332. sign up. As described above, the remote DB 332 stores header information generated as a result of the processing of the compressed data generation device 300. Further, it interprets the header information inquiry request received from the compressed data generation device 300 and the data decompression device 360 via the communication unit 333, extracts the header information from the remote DB 332, and transmits the header information via the communication unit 333. .
 リモートDB332は、データ構成符号化部302の処理で生成されるデータを記憶するストラクチャテーブル(structure table)T1、エイリアステーブル(alias table)T2及びセルカラムテーブル(cell columns table)T3と、ヘッダ構成符号化部303の処理で生成されるデータを記憶するヘッダテーブル(header table)T4の4つのテーブルを有する。 The remote DB 332 includes a structure table (structure table) T1, an alias table (alias table) T2, a cell column table (cell column) table T3 that stores data generated by the processing of the data structure encoding unit 302, and a header structure code. The header table (header table) T4 that stores data generated by the processing of the conversion unit 303 is included.
 図7Aは、リモートDB332で記憶されるストラクチャテーブルT1の構造を例示する図である。ストラクチャテーブルT1は、データ構成符号化部302の処理で生成したストラクチャIDを記憶するstructure_idフィールドと、インストラクション#CLASS_IDの値であるクラスIDを該ストラクチャIDに紐付けて記憶するclass_idフィールドと、インストラクション#PROPERTY行のセルカラムに記載された内容を区切り文字を用いて連結したテキストを記憶するcell_column_textフィールドを有し、それらの組をレコードとして記憶する。 FIG. 7A is a diagram illustrating the structure of the structure table T1 stored in the remote DB 332. The structure table T1 includes a structure_id field that stores the structure ID generated by the processing of the data structure encoding unit 302, a class_id field that stores the class ID that is the value of the instruction #CLASS_ID in association with the structure ID, and an instruction # It has a cell_column_text field for storing text obtained by concatenating the contents described in the cell column of the PROPERTY row using a delimiter, and stores those sets as records.
 図7Bは、リモートDB332で記憶されるエイリアステーブルT2の構造を例示する図である。エイリアステーブルT2は、ヘッダ構成符号化部303の処理でインストラクションの別名(以下、エイリアスという)を作成した場合に用いられ、エイリアスを利用するヘッダIDを記憶するheader_idフィールドと、インストラクションのエイリアスを記憶するaliasフィールドと、元のインストラクションを記憶するoriginalフィールドを有し、それらの組をレコードとして記憶する。 FIG. 7B is a diagram illustrating the structure of the alias table T2 stored in the remote DB 332. The alias table T2 is used when an instruction alias (hereinafter referred to as an alias) is created in the processing of the header configuration encoding unit 303, and stores a header_id field for storing a header ID that uses the alias, and an instruction alias. It has an alias field and an original field for storing the original instruction, and stores those sets as records.
 図7Cは、リモートDB332で記憶されるセルカラムテーブルT3の構造を例示する図である。セルカラムテーブルT3は、structure_tableのstructure_idフィールドを外部参照するstructure_idフィールドと、ストラクチャIDに関連づけられたインストラクションを記憶するinstructionフィールドと、インストラクションに関連づけられた値を記憶するinstruction_valueフィールドを有し、それらの組をレコードとして記憶する。 FIG. 7C is a diagram illustrating the structure of the cell column table T3 stored in the remote DB 332. The cell column table T3 includes a structure_id field that externally references the structure_id field of the structure_table, an instruction field that stores an instruction associated with the structure ID, and an instruction_value field that stores a value associated with the instruction. Is stored as a record.
 図7Dは、リモートDB332で記憶されるヘッダテーブルT4の構造を例示する図である。ヘッダテーブルT4は、ヘッダ構成符号化部303の処理で生成したヘッダIDを記憶するheader_idフィールドと、このヘッダIDに関連づけられたヘッダテキストを記憶するheader_textフィールドを有し、それらの組をレコードとして記憶する。 FIG. 7D is a diagram illustrating the structure of the header table T4 stored in the remote DB 332. The header table T4 has a header_id field for storing the header ID generated by the processing of the header configuration encoding unit 303, and a header_text field for storing the header text associated with the header ID, and stores those sets as records. To do.
 ここで、インストラクションがクラスヘッダセクションのものの場合、すなわち、ヘッダが1列で構成され、インストラクションとその値が文字列「:=」で区切られている場合、instructionフィールドにはインストラクションと文字列「:=」が記憶され、instruction_valueフィールドにはその値が記憶される。 Here, when the instruction is in the class header section, that is, when the header is composed of one column and the instruction and its value are separated by the string “: =”, the instruction and the string “:” are included in the instruction field. = ”Is stored, and the value is stored in the instruction_value field.
 一方、インストラクションがスキーマヘッダセクションのものの場合、instructionフィールドにはインストラクションそのものが記憶され、instruction_valueフィールドにはセルカラムを区切り文字で結合して作成したテキストが記憶される。 On the other hand, if the instruction is in the schema header section, the instruction itself is stored in the instruction field, and the text created by combining the cell columns with a delimiter is stored in the instruction_value field.
 なお、上記の説明では、リレーショナルデータベースによるデータの記憶を想定したが、同様の情報を記憶できさえすれば、XMLデータベースなど他の形式のデータベースを使用してもよい。また、同様の情報を記憶できればテーブル名やフィールド名、テーブルの構成は上記に限らない。例えば、他の処理のためにカラムを追加したり、他のテーブルを追加したりしてもよい。 In the above description, it is assumed that data is stored in a relational database, but other types of databases such as an XML database may be used as long as similar information can be stored. Further, the table name, field name, and table configuration are not limited to the above as long as similar information can be stored. For example, a column may be added for other processing, or another table may be added.
 続いて、圧縮データ生成装置300の各処理の詳細を、それぞれフローチャートを用いて説明する。まず、図8を用いて圧縮データ生成装置300のデータ構成符号化部302の動作について説明する。図8は、圧縮データ生成装置300のデータ構成符号化部302の処理の流れの一例を示すフローチャートである。 Subsequently, details of each process of the compressed data generation apparatus 300 will be described using respective flowcharts. First, the operation of the data configuration encoding unit 302 of the compressed data generation apparatus 300 will be described with reference to FIG. FIG. 8 is a flowchart illustrating an example of a process flow of the data configuration encoding unit 302 of the compressed data generation device 300.
 (ステップS501)まず、データ構成符号化部302は、ヘッダ取得部301からヘッダセクションのテキストデータを取得する。 (Step S501) First, the data configuration encoding unit 302 acquires the text data of the header section from the header acquisition unit 301.
 (ステップS502)次に、データ構成符号化部302は、このテキストデータのインストラクション#CLASS_IDの値からクラスIDを抽出する。 (Step S502) Next, the data structure encoding unit 302 extracts the class ID from the value of the instruction #CLASS_ID of this text data.
 (ステップS503)次に、データ構成符号化部302は、このテキストデータのインストラクション#PROPERTY_IDの行からセルカラムのデータ、すなわちセルカラムテキストを抽出する。 (Step S503) Next, the data structure encoding unit 302 extracts cell column data, that is, cell column text, from the row of instruction #PROPERTY_ID of this text data.
 (ステップS504)次に、データ構成符号化部302は、抽出したクラスID及びセルカラムテキストの組をキーとして、クラスID及びセルカラムテキストの組を含むレコードがストラクチャテーブルT1に既に登録されているか、データ管理装置330に問い合わせる。 (Step S504) Next, the data structure encoding unit 302 uses the extracted class ID and cell column text combination as a key, and has a record including the class ID and cell column text combination already registered in the structure table T1. The data management apparatus 330 is inquired.
 (ステップS505)次に、データ構成符号化部302は、ステップS504での問い合わせ結果を用いて、クラスID及びセルカラムテキストの組を含むレコードがリモートDB332のストラクチャテーブルT1に既に登録されているか否か判定する。 (Step S505) Next, the data structure encoding unit 302 uses the inquiry result in step S504 to determine whether or not a record including a set of class ID and cell column text has already been registered in the structure table T1 of the remote DB 332. To determine.
 (ステップS506)クラスID及びセルカラムテキストの組を含むレコードがリモートDB332のストラクチャテーブルT1に既に登録されている場合(ステップS505
 YES)、データ構成符号化部302は、リモートDB332のストラクチャテーブルT1からそのストラクチャIDを取得する。その後、処理がステップS509に進む。
(Step S506) When a record including a set of class ID and cell column text is already registered in the structure table T1 of the remote DB 332 (Step S505)
YES), the data structure encoding unit 302 acquires the structure ID from the structure table T1 of the remote DB 332. Thereafter, the process proceeds to step S509.
 (ステップS507)一方、クラスID及びセルカラムテキストの組を含むレコードがリモートDB332のストラクチャテーブルT1に未だ登録されていない場合(ステップS5050 NO)、データ構成符号化部302は、抽出したクラスID及びセルカラムテキストの組をテキスト符号化し、ストラクチャIDを生成する。 (Step S507) On the other hand, when the record including the set of the class ID and the cell column text is not yet registered in the structure table T1 of the remote DB 332 (NO in Step S5050), the data configuration encoding unit 302 selects the extracted class ID and A set of cell column text is text-encoded to generate a structure ID.
 (ステップS508)そして、データ構成符号化部302は、ストラクチャID、クラスID及びセルカラムテキストの組を、通信部304を介してデータ管理装置330のリモートDB332のストラクチャテーブルT1に登録する。このように、データ構成符号化部302は、パーセルデータ308からクラス識別情報を抽出し、このパーセルデータ308から属性規定情報を生成し、このクラス識別情報とこの属性規定情報との組に対してデータ構成識別情報を割り当て、データ構成識別情報とクラス識別情報と属性規定情報とを関連付けて記憶装置114に記憶させる。そして、処理がステップS509に進む。 (Step S508) The data configuration encoding unit 302 registers the set of the structure ID, the class ID, and the cell column text in the structure table T1 of the remote DB 332 of the data management device 330 via the communication unit 304. As described above, the data configuration encoding unit 302 extracts the class identification information from the parcel data 308, generates the attribute definition information from the parcel data 308, and determines the combination of the class identification information and the attribute definition information. Data configuration identification information is assigned, and the data configuration identification information, class identification information, and attribute defining information are associated with each other and stored in the storage device 114. Then, the process proceeds to step S509.
 (ステップS509)最後に、データ構成符号化部302は、ストラクチャID、ヘッダセクションのテキストデータ及びパーセルデータ308をヘッダ構成符号化部303に渡して、処理を終了する。 (Step S509) Finally, the data configuration encoding unit 302 passes the structure ID, the header section text data, and the parcel data 308 to the header configuration encoding unit 303, and ends the processing.
 図9は、図2のパーセルデータにデータ構成符号化部302の処理を適用した場合を例示する図である。図9に示すように、データ構成符号化部302の処理により、インストラクション#CLASS_IDの値と#PROPERTY_IDのセルカラムテキストが抽出され、テキスト符号化によってストラクチャIDであるCCL001が生成される。このように、属性規定情報の一例であるセルカラムテキストは、属性を識別する属性識別情報#PROPERTY_IDにヘッダ内で関連付けられた値を、前記ヘッダ内での出現順に並べた情報である。 FIG. 9 is a diagram illustrating a case where the processing of the data configuration encoding unit 302 is applied to the parcel data in FIG. As shown in FIG. 9, the value of the instruction #CLASS_ID and the cell column text of #PROPERTY_ID are extracted by the processing of the data configuration encoding unit 302, and the structure ID CCL001 is generated by text encoding. As described above, the cell column text which is an example of the attribute defining information is information in which values associated with attribute identification information #PROPERTY_ID for identifying an attribute are arranged in the order of appearance in the header.
 なお、ストラクチャIDは、クラスID及びセルカラムテキストを連結したテキストを入力としてハッシュ関数などのテキスト符号化関数を利用して、データ構成符号化部302により生成されてもよい。 Note that the structure ID may be generated by the data configuration encoding unit 302 using a text encoding function such as a hash function with a text obtained by concatenating the class ID and the cell column text as an input.
 あるいは、このような関数を利用せずに、データ構成符号化部302は、ユーザが指定した文字列をストラクチャIDとしてもよい。このように、データ構成符号化部302は、データ構成情報(例えば、ストラクチャID)に対して、入力装置109がユーザから受け付けた文字列を割り当ててもよい。 Alternatively, without using such a function, the data configuration encoding unit 302 may use a character string designated by the user as the structure ID. As described above, the data configuration encoding unit 302 may assign the character string received from the user by the input device 109 to the data configuration information (for example, the structure ID).
 あるいは、データ構成符号化部302がシーケンシャルな英数字を管理し、データ構成符号化部302が、管理している英数字から、次の順番の英数字をストラクチャIDとして取得してもよい。 Alternatively, the data configuration encoding unit 302 may manage sequential alphanumeric characters, and the data configuration encoding unit 302 may acquire the next sequential alphanumeric characters as the structure ID from the managed alphanumeric characters.
 続いて、図10を用いて圧縮データ生成装置300のヘッダ構成符号化部303の動作について説明する。図10は、圧縮データ生成装置300のヘッダ構成符号化部303の処理の流れの一例を示すフローチャートである。 Subsequently, the operation of the header configuration encoding unit 303 of the compressed data generation device 300 will be described with reference to FIG. FIG. 10 is a flowchart illustrating an example of a processing flow of the header configuration encoding unit 303 of the compressed data generation device 300.
 (ステップS701)まず、ヘッダ構成符号化部303は、データ構成符号化部302からストラクチャID、ヘッダセクションのテキストデータ及びパーセルデータ308を取得する。 (Step S701) First, the header configuration encoding unit 303 acquires the structure ID, the text data of the header section, and the parcel data 308 from the data configuration encoding unit 302.
 (ステップS702)次に、ヘッダ構成符号化部303は、ヘッダ構成符号化のため、ヘッダセクションのテキストデータに含まれるクラスヘッダセクションの各行について処理を行う。この処理の詳細は、後述する図11で説明する。 (Step S702) Next, the header configuration encoding unit 303 performs processing on each line of the class header section included in the text data of the header section for header configuration encoding. Details of this processing will be described later with reference to FIG.
 (ステップS703)次に、ヘッダ構成符号化部303はクラスヘッダセクションの処理を終了すると、ヘッダセクションのテキストデータに含まれるスキーマヘッダセクションの各行について処理を行う。この処理の詳細は、後述する図13で説明する。 (Step S703) Next, when the header configuration encoding unit 303 finishes the processing of the class header section, the header configuration encoding unit 303 processes each row of the schema header section included in the text data of the header section. Details of this processing will be described later with reference to FIG.
 (ステップS704)次に、ヘッダ構成符号化部303は、クラスヘッダセクション及びスキーマヘッダセクションのインストラクションの処理を終えると、ヘッダセクションのインストラクションカラムの先頭から順にインストラクションを読み出し、読み出したインストラクションを区切り文字で連結したヘッダテキストを生成する。このように、ヘッダ構成情報の一例であるヘッダテキストは、ヘッダに含まれるインストラクションを前記ヘッダ内における出現順に並べた情報である。 (Step S704) Next, after finishing the instruction processing of the class header section and the schema header section, the header configuration encoding unit 303 reads the instructions in order from the head of the instruction column of the header section, and uses the delimited characters as the read instructions. Generate concatenated header text. Thus, the header text as an example of the header configuration information is information in which instructions included in the header are arranged in the order of appearance in the header.
 (ステップS705)次に、ヘッダ構成符号化部303は、データ管理装置330のリモートDB332のヘッダテーブルT4に、ステップS704で生成したヘッダテキストを含むレコードが登録されているかデータ管理装置330に問い合わせる。 (Step S705) Next, the header configuration encoding unit 303 inquires of the data management apparatus 330 whether the record including the header text generated in step S704 is registered in the header table T4 of the remote DB 332 of the data management apparatus 330.
 (ステップS706)次に、ヘッダ構成符号化部303は、問い合わせ結果を用いて、ヘッダテーブルT4にステップS704で生成したヘッダテキストを含むレコードが登録されているか否か判定する。 (Step S706) Next, the header configuration encoding unit 303 determines whether or not a record including the header text generated in step S704 is registered in the header table T4 using the inquiry result.
 (ステップS707)ヘッダテーブルT4にステップS704で生成したヘッダテキストを含むレコードが登録されている場合(ステップS706 YES)、ヘッダ構成符号化部303は、通信部304を介して、リモートDB332のヘッダテーブルT4から、このヘッダテキストに対応するヘッダIDを取得する。その後、処理がステップS712に進む。 (Step S707) When a record including the header text generated in step S704 is registered in the header table T4 (YES in step S706), the header configuration encoding unit 303 transmits the header table of the remote DB 332 via the communication unit 304. From T4, the header ID corresponding to this header text is acquired. Thereafter, the process proceeds to step S712.
 (ステップS708)一方、ヘッダテーブルT4にステップS704で生成したヘッダテキストを含むレコードが登録されていない場合(ステップS706 NO)、ヘッダ構成符号化部303は、ステップS704で生成したヘッダテキストをテキスト符号化してヘッダIDを生成する。 (Step S708) On the other hand, when the record including the header text generated in Step S704 is not registered in the header table T4 (NO in Step S706), the header configuration encoding unit 303 converts the header text generated in Step S704 into a text code. To generate a header ID.
 (ステップS709)次に、ヘッダ構成符号化部303は、ステップS708で生成したヘッダID及びステップS704で生成したヘッダテキストの組を、通信部304を介して、リモートDB332のヘッダテーブルT4に登録する。 (Step S709) Next, the header configuration encoding unit 303 registers the set of the header ID generated in step S708 and the header text generated in step S704 in the header table T4 of the remote DB 332 via the communication unit 304. .
 このように、ヘッダ構成符号化部303は、データから、ヘッダ構成情報(例えば、ヘッダテキスト)を生成し、生成したヘッダ構成情報に対してヘッダ構成識別情報(例えば、ヘッダID)を割り当て、ヘッダ構成識別情報とヘッダ構成情報とを関連付けて記憶装置114に記憶させる。 In this way, the header configuration encoding unit 303 generates header configuration information (for example, header text) from the data, assigns header configuration identification information (for example, header ID) to the generated header configuration information, and The configuration identification information and the header configuration information are associated with each other and stored in the storage device 114.
 (ステップS710)次に、ヘッダ構成符号化部303は、ステップS702のクラスヘッダセクションの処理、またはステップS703のスキーマヘッダセクションの処理でインストラクションのエイリアスを作成したか否か判定する。 (Step S710) Next, the header configuration encoding unit 303 determines whether or not an instruction alias has been created in the processing of the class header section in step S702 or the processing of the schema header section in step S703.
 (ステップS711)ステップS710においてインストラクションのエイリアスを作成したと判定された場合(ステップS710 YES)、ヘッダ構成符号化部303は、ステップS708で生成したヘッダIDとその作成したエイリアスと当該エイリアスを設定したインストラクションとの組を、通信部304を介して、リモートDB332のエイリアステーブルT2に登録する。その後、処理がステップS712に進む。一方、ステップS710においてインストラクションのエイリアスを作成していないと判定された場合(ステップS710 NO)、処理がステップS712に進む。 (Step S711) If it is determined in step S710 that an instruction alias has been created (YES in step S710), the header configuration encoding unit 303 sets the header ID generated in step S708, the created alias, and the alias. The pair with the instruction is registered in the alias table T2 of the remote DB 332 via the communication unit 304. Thereafter, the process proceeds to step S712. On the other hand, if it is determined in step S710 that an instruction alias has not been created (NO in step S710), the process proceeds to step S712.
 (ステップS712)上記の処理でストラクチャID及びヘッダIDが得られると、ヘッダ構成符号化部303は、これらのストラクチャID及びヘッダIDとパーセルデータ308を圧縮データ生成部305に渡し、処理を終了する。 (Step S712) When the structure ID and header ID are obtained by the above processing, the header configuration encoding unit 303 passes these structure ID and header ID and parcel data 308 to the compressed data generation unit 305, and ends the processing. .
 続いて、図10のステップS702におけるクラスヘッダセクションの処理の詳細について、図11を用いて説明する。図11は、図10のステップS702におけるクラスヘッダセクションの処理の流れの一例を示すフローチャートである。 Subsequently, details of the processing of the class header section in step S702 of FIG. 10 will be described with reference to FIG. FIG. 11 is a flowchart showing an example of the processing flow of the class header section in step S702 of FIG.
 (ステップS801)まず、ヘッダ構成符号化部303は、クラスヘッダセクションの先頭行から順に、各行に対して以下のステップS802とステップS900の処理を行う
 (ステップS802)次に、ヘッダ構成符号化部303は、処理対象の行に対し、インストラクションカラムから、対象のインストラクションとその値(以下、インストラクション値という)の組を取得する。
(Step S801) First, the header configuration encoding unit 303 performs the following steps S802 and S900 on each row in order from the first row of the class header section (Step S802). Next, the header configuration encoding unit 303 obtains a set of the target instruction and its value (hereinafter referred to as an instruction value) from the instruction column for the processing target row.
 (ステップS900)ヘッダ構成符号化部303は、ステップS802で取得した組に対して、後述する図12のインストラクションの処理を実行する。 (Step S900) The header configuration encoding unit 303 executes an instruction process of FIG. 12 to be described later on the group acquired in Step S802.
 (ステップS803)クラスヘッダセクションに次の行が有る場合、処理がステップS801に戻る。クラスヘッダセクションに次の行がない場合、クラスヘッダセクションの処理を終了する。 (Step S803) When the next line exists in the class header section, the process returns to Step S801. If there is no next line in the class header section, the processing of the class header section is terminated.
 続いて、図11のステップS900におけるインストラクションの処理の詳細について、図12を用いて説明する。図12は、図11のステップS900におけるインストラクションの処理の流れの一例を示すフローチャートである。なお、この処理は、クラスヘッダセクションの処理内で行われるだけでなく、後述の図13のスキーマヘッダセクションの処理内でも行われる。 Next, details of the instruction processing in step S900 of FIG. 11 will be described with reference to FIG. FIG. 12 is a flowchart showing an example of the flow of instruction processing in step S900 of FIG. This process is performed not only in the process of the class header section but also in the process of the schema header section in FIG. 13 described later.
 (ステップS901)まず、ヘッダ構成符号化部303は、データ構成符号化部302で取得したストラクチャIDとインストラクションの組み合わせをキーとして、データ管理装置330のリモートDB332のセルカラムテーブルT3からこれらの組み合わせに関連づけられたインストラクション値を取得する。 (Step S901) First, the header configuration encoding unit 303 uses the combination of the structure ID and the instruction acquired by the data configuration encoding unit 302 as a key to change these combinations from the cell column table T3 of the remote DB 332 of the data management device 330. Get the associated instruction value.
 (ステップS902)対象のインストラクション値とステップS901で取得したインストラクション値が同じか、異なるか、あるいは対象のインストラクション値を含むレコードがリモートDB332のセルカラムテーブルT3に登録されてないか判定する。対象のインストラクション値とステップS901で取得したインストラクション値が同じ場合(ステップS902 SAME)、ヘッダ構成符号化部303は、インストラクションの処理を終了する。 (Step S902) It is determined whether the target instruction value is the same as or different from the instruction value acquired in step S901, or a record including the target instruction value is not registered in the cell column table T3 of the remote DB 332. When the target instruction value and the instruction value acquired in step S901 are the same (step S902 SAME), the header configuration encoding unit 303 ends the instruction processing.
 (ステップS903)一方、対象のインストラクション値とステップS901で取得したインストラクション値が異なる場合(ステップS902 DIFFERENT)、ヘッダ構成符号化部303は、対象のインストラクションのエイリアスを生成する。 (Step S903) On the other hand, when the target instruction value is different from the instruction value acquired in Step S901 (Step S902 DIFFERENT), the header configuration encoding unit 303 generates an alias of the target instruction.
 (ステップS904)そして、ヘッダ構成符号化部303は、ヘッダセクションの対象のインストラクションをエイリアスで置き換える。そして、処理がステップS905に進む。 (Step S904) The header configuration encoding unit 303 replaces the target instruction of the header section with an alias. Then, the process proceeds to step S905.
 (ステップS905)対象のインストラクション値を含むレコードがリモートDB332のセルカラムテーブルT3に登録されていない場合(S902 NO RECORD)、ヘッダ構成符号化部303は、データ構成符号化部302で生成したストラクチャID、対象のインストラクション及び対象のインストラクション値の組を、通信部304を介してデータ管理装置330のリモートDB332のセルカラムテーブルT3に登録して、インストラクションの処理を終了する。 (Step S905) When the record including the target instruction value is not registered in the cell column table T3 of the remote DB 332 (S902: NO RECORD), the header configuration encoding unit 303 generates the structure ID generated by the data configuration encoding unit 302 The set of the target instruction and the target instruction value is registered in the cell column table T3 of the remote DB 332 of the data management device 330 via the communication unit 304, and the processing of the instruction is finished.
 このように、ヘッダ構成符号化部303は、データから、インストラクションとインストラクション値の組を読み出し、データ構成識別情報とインストラクションとインストラクション値とを関連づけて記憶装置114に記憶させる。 As described above, the header configuration encoding unit 303 reads out a combination of an instruction and an instruction value from the data, and stores the data configuration identification information, the instruction, and the instruction value in the storage device 114 in association with each other.
 一方、処理がステップS904からステップS905に進んだ場合、ヘッダ構成符号化部303は、データ構成符号化部302で生成したストラクチャID、ステップS904で置き換えたエイリアス及び対象のインストラクション値の組を、通信部304を介してデータ管理装置330のリモートDB332のセルカラムテーブルT3に登録して、インストラクションの処理を終了する。 On the other hand, when the process proceeds from step S904 to step S905, the header configuration encoding unit 303 communicates the set of the structure ID generated by the data configuration encoding unit 302, the alias replaced in step S904, and the target instruction value. The data is registered in the cell column table T3 of the remote DB 332 of the data management device 330 via the unit 304, and the instruction process is terminated.
 このように、ヘッダ構成符号化部302は、パーセルデータ308から、ヘッダに含まれるインストラクションとインストラクション値の組を取得し(ステップS802)、取得したインストラクション値と、記憶装置114においてデータの構成を識別するデータ構成識別情報とインストションとに関連付けられたインストラクション値とを比較する(ステップS902)。ヘッダ構成符号化部302は、比較の結果、値が異なる場合、前記インストラクションに対して別名を生成する(ステップS903)。 As described above, the header configuration encoding unit 302 acquires a combination of an instruction and an instruction value included in the header from the parcel data 308 (step S802), and identifies the acquired instruction value and the data configuration in the storage device 114. The data structure identification information to be compared is compared with the instruction value associated with the instruction (step S902). If the values are different as a result of the comparison, the header configuration encoding unit 302 generates an alias for the instruction (step S903).
 そして、ヘッダ構成符号化部302は、データ構成識別情報と別名と読み出したインストラクション値とを関連付けて記憶装置114に記憶させる(ステップS905)。ヘッダ構成符号化部302は、ヘッダ構成識別情報(例えば、ヘッダID)と、ヘッダ構成情報に含まれるインストラクションが別名に置換されたヘッダ構成情報(例えば、ヘッダテキスト)とを関連付けて記憶装置114に記憶させる(ステップS709)。また、ヘッダ構成符号化部302は、インストラクション構成識別情報(例えば、ヘッダID)と別名とこの別名が生成されたインストクションとを関連づけて記憶装置114に記憶させる(ステップS711)。 Then, the header configuration encoding unit 302 stores the data configuration identification information, the alias, and the read instruction value in the storage device 114 in association with each other (step S905). The header configuration encoding unit 302 associates the header configuration identification information (for example, header ID) and the header configuration information (for example, header text) in which the instruction included in the header configuration information is replaced with an alias in the storage device 114. Store (step S709). In addition, the header configuration encoding unit 302 stores the instruction configuration identification information (for example, header ID), the alias, and the instruction in which the alias is generated in association with each other in the storage device 114 (step S711).
 続いて、図10のステップS703におけるスキーマヘッダセクションの処理の詳細について、図13を用いて説明する。図13は、図10のステップS703におけるスキーマヘッダセクションの処理の流れの一例を示すフローチャートである。 Next, details of the processing of the schema header section in step S703 in FIG. 10 will be described with reference to FIG. FIG. 13 is a flowchart showing an example of the processing flow of the schema header section in step S703 of FIG.
 (ステップS1011)まず、ヘッダ構成符号化部303は、スキーマヘッダセクションの先頭行から順に、各行に対して、以下のステップS1012とステップS900の処理を行う。 (Step S1011) First, the header configuration coding unit 303 performs the following steps S1012 and S900 on each row in order from the first row of the schema header section.
 (ステップS1012)次に、ヘッダ構成符号化部303は、処理対象の行に対し、対象のインストラクションと、対象のインストラクション値を取得する。 (Step S1012) Next, the header configuration encoding unit 303 acquires the target instruction and the target instruction value for the processing target row.
 (ステップS900)次に、ヘッダ構成符号化部303は、図12のインストラクションの処理を行う。 (Step S900) Next, the header configuration encoding unit 303 performs the processing of the instructions in FIG.
 (ステップS1013)ステップS900のインストラクションの処理が終わり、スキーマヘッダセクションに次の行がある場合、ヘッダ構成符号化部303は、次の行を対象としてステップS1012及びステップS900の処理を行う。スキーマヘッダセクションに次の行がない場合、ヘッダ構成符号化部303は、スキーマヘッダセクションの処理を終了する。 (Step S1013) When the instruction processing in step S900 is completed and the schema header section has the next line, the header configuration encoding unit 303 performs the processes in steps S1012 and S900 on the next line. If there is no next line in the schema header section, the header configuration encoding unit 303 ends the processing of the schema header section.
 (ヘッダ構成符号化部303の処理で生成されるヘッダIDの例)
 図14は、図2のパーセルデータにヘッダ構成符号化部303の処理を適用した場合を例示する図である。ヘッダ構成符号化部303により、インストラクション列の先頭行から順に取得したインストラクションを区切り文字を使用して連結し、ヘッダテキストが生成される。ヘッダ構成符号化部303により、このヘッダテキストがテキスト符号化されることで、このヘッダテキストのヘッダIDであるHDR001が生成される。
(Example of header ID generated by the process of the header configuration encoding unit 303)
FIG. 14 is a diagram illustrating a case where the processing of the header configuration encoding unit 303 is applied to the parcel data of FIG. The header configuration encoding unit 303 concatenates the instructions acquired in order from the first row of the instruction string using a delimiter, and generates a header text. The header configuration encoding unit 303 text-encodes the header text to generate HDR001 that is the header ID of the header text.
 なお、ヘッダIDは、ヘッダテキストを入力としてハッシュ関数などのテキスト符号化関数を利用して、ヘッダ構成符号化部303により生成されてもよい。 Note that the header ID may be generated by the header configuration encoding unit 303 using a text encoding function such as a hash function with the header text as an input.
 あるいは、このような関数を利用せずに、ユーザが指定した文字列をヘッダIDとしてもよい。このように、ヘッダ構成符号化部303は、ヘッダ構成情報(例えば、ヘッダテキスト)に対して、入力装置109がユーザから受け付けた文字列を割り当ててもよい。 Alternatively, a character string specified by the user may be used as the header ID without using such a function. As described above, the header configuration encoding unit 303 may assign the character string received from the user by the input device 109 to the header configuration information (for example, header text).
 あるいは、ヘッダ構成符号化部303がシーケンシャルな英数字を管理し、自動的に英数字を生成してヘッダIDとしてもよい。 Alternatively, the header configuration encoding unit 303 may manage sequential alphanumeric characters and automatically generate alphanumeric characters as header IDs.
 <ヘッダ構成符号化部303の処理で生成されるインストラクションのエイリアスの例>
 図15は、図2のパーセルデータのヘッダ情報がデータ管理装置330のリモートDB332に登録された状態で、別のパーセルデータの処理を行った場合の例を表した図である。図15の上段の表はパーセルデータであり、その下のテキストデータはこのパーセルデータをテキスト形式で表現したものである。
<Example of Instruction Alias Generated by Processing of Header Configuration Encoding Unit 303>
FIG. 15 is a diagram illustrating an example in which processing of another parcel data is performed in a state where the header information of the parcel data in FIG. 2 is registered in the remote DB 332 of the data management device 330. The upper table of FIG. 15 shows parcel data, and the text data below the parcel data represents the parcel data in a text format.
 図2のパーセルデータと比較すると、#CLASS_IDで指定されたクラスIDが等しく、更に#PROPERTY_IDの行のセルカラムの構成が等しいため、データ構成符号化部302の処理でストラクチャIDは生成されず、データ管理装置330のリモートDB332に登録されたストラクチャIDのCCL001がストラクチャIDとして適用される。 Compared with the parcel data in FIG. 2, since the class IDs specified by #CLASS_ID are equal and the cell column configuration of the row of #PROPERTY_ID is equal, the structure ID is not generated by the processing of the data configuration encoding unit 302, and the data The structure ID CCL001 registered in the remote DB 332 of the management apparatus 330 is applied as the structure ID.
 一方、図15のパーセルデータはインストラクション#DATABASE:=がなく、インストラクション#MEMOのセルカラムに記載された情報が異なり、更にインストラクション列のインストラクションの順序が異なる。したがって、ヘッダ構成符号化部303によりヘッダテキストが生成される。 On the other hand, the parcel data in FIG. 15 does not have instruction #DATABASE: =, the information described in the cell column of instruction #MEMO is different, and the order of instructions in the instruction row is different. Accordingly, header text is generated by the header configuration encoding unit 303.
 その際に、ヘッダ構成符号化部303により、インストラクション#MEMOに対するエイリアス#MEMO-001が作成される。このエイリアスでインストラクションが置き換えられるため、ヘッダ構成符号化部303で生成されるヘッダテキストには、#MEMOではなく#MEMO-001が現れる。ヘッダ構成符号化部303の処理により、最終的に図15のパーセルデータのヘッダセクションのヘッダテキストに対応するヘッダIDとしてHDR002が割り当てられ、図2のパーセルデータのものとは別に、データ管理装置330のリモートDB332に登録される。 At that time, an alias # MEMO-001 for instruction #MEMO is created by the header configuration encoding unit 303. Since the instruction is replaced by this alias, # MEMO-001 appears instead of #MEMO in the header text generated by the header configuration encoding unit 303. By the processing of the header configuration encoding unit 303, HDR002 is finally assigned as the header ID corresponding to the header text of the header section of the parcel data in FIG. Registered in the remote DB 332.
 <圧縮データ生成部305の処理のフローチャート>
 続いて、図16を用いて圧縮データ生成部305の処理について説明する。図16は、圧縮データ生成装置300の圧縮データ生成部305の処理の流れの一例を示すフローチャートである。
<Flowchart of Processing of Compressed Data Generation Unit 305>
Next, processing of the compressed data generation unit 305 will be described with reference to FIG. FIG. 16 is a flowchart illustrating an example of a process flow of the compressed data generation unit 305 of the compressed data generation apparatus 300.
 (ステップS1301)まず、圧縮データ生成部305は、ヘッダ構成符号化部303から、ストラクチャID、ヘッダID及びパーセルデータ308を取得する。 (Step S1301) First, the compressed data generation unit 305 acquires the structure ID, header ID, and parcel data 308 from the header configuration encoding unit 303.
 (ステップS1302)次に、圧縮データ生成部305は、空のヘッダセクションを作成する。 (Step S1302) Next, the compressed data generation unit 305 creates an empty header section.
 (ステップS1303)次に、圧縮データ生成部305は、インストラクション#CLASS_IDの値が、ステップS1301で取得したストラクチャIDであるという情報を、ステップS1302で作成されたヘッダセクションに出力する。例えば、ストラクチャIDが図17に示すようにCCL001の場合、圧縮データ生成部305は、#CLASS_ID:=CCL001を、ステップS1302で作成されたヘッダセクションに追記する。 (Step S1303) Next, the compressed data generation unit 305 outputs information that the value of the instruction #CLASS_ID is the structure ID acquired in Step S1301 to the header section created in Step S1302. For example, when the structure ID is CCL001 as shown in FIG. 17, the compressed data generation unit 305 adds #CLASS_ID: = CCL001 to the header section created in step S1302.
 (ステップS1304)次に、圧縮データ生成部305は、インストラクション#HEADERの値が、ステップS1301で取得したヘッダIDであるという情報を、ステップS1302で作成されたヘッダセクションに追記する。例えば、ストラクチャIDが図17に示すようにHDR001の場合、圧縮データ生成部305は、#HEADER:=HDR001を、ステップS1302で作成されたヘッダセクションに追記する。 (Step S1304) Next, the compressed data generation unit 305 adds information that the value of the instruction #HEADER is the header ID acquired in Step S1301 to the header section created in Step S1302. For example, when the structure ID is HDR001 as shown in FIG. 17, the compressed data generation unit 305 adds #HEADER: = HDR001 to the header section created in step S1302.
 (ステップS1305)次に、圧縮データ生成部305は、このように生成したヘッダセクションに、パーセルデータ308のデータセクションを結合させる。 (Step S1305) Next, the compressed data generation unit 305 combines the data section of the parcel data 308 with the header section generated in this way.
 <圧縮データ生成部305で生成される圧縮パーセルデータの例>
 図17は、図2のパーセルデータを入力として、本実施形態における圧縮データ生成装置300の一連の処理で出力された圧縮パーセルデータの例を示す図である。図17のヘッダセクションには、インストラクション#CLASS_IDの値としてデータ構成符号化部302で生成したストラクチャIDが含まれ、インストラクション#HEADERの値としてヘッダ構成符号化部303で生成したヘッダIDが含まれている。これにより、図2のパーセルデータと比較して、ヘッダセクションのデータ容量が削減された圧縮パーセルデータが生成されていることが分かる。
<Example of compressed parcel data generated by the compressed data generation unit 305>
FIG. 17 is a diagram illustrating an example of compressed parcel data output by a series of processes of the compressed data generation apparatus 300 according to the present embodiment using the parcel data of FIG. 2 as an input. The header section of FIG. 17 includes the structure ID generated by the data configuration encoding unit 302 as the value of instruction #CLASS_ID, and includes the header ID generated by the header configuration encoding unit 303 as the value of instruction #HEADER. Yes. Thereby, it can be seen that compressed parcel data in which the data capacity of the header section is reduced as compared with the parcel data of FIG. 2 is generated.
 なお、この図17の例では、ヘッダIDを記載する所定のインストラクションを#HEADERとしているが、システムが解釈できれば他のインストラクションを設定して利用しても良い。 In the example of FIG. 17, the predetermined instruction describing the header ID is #HEADER, but other instructions may be set and used as long as the system can interpret them.
 (ステップS1306)次に、圧縮データ生成部305は、ステップS1305で生成したデータを圧縮パーセルデータ309として出力し、処理を終了する。 (Step S1306) Next, the compressed data generation unit 305 outputs the data generated in step S1305 as the compressed parcel data 309, and ends the processing.
 以上、本実施形態における圧縮データ生成装置300において、データ構成符号化部302は、テキスト形式のデータに含まれるヘッダを用いて、前記データが記述する対象の物品やサービスが分類されたクラスを識別するクラス識別情報と、前記クラスを特徴づけるプロパティ(属性)の組み合わせとその順番を規定する属性規定情報との組に対して、この組を識別するデータ構成識別情報(例えば、ストラクチャID)を割り当てる。 As described above, in the compressed data generation apparatus 300 according to the present embodiment, the data configuration encoding unit 302 identifies the class in which the target article or service described by the data is classified, using the header included in the text format data. The data configuration identification information (for example, structure ID) for identifying the combination is assigned to the combination of the class identification information to be performed, the combination of the property (attribute) that characterizes the class, and the attribute definition information that defines the order of the combination. .
 そして、ヘッダ構成符号化部303は、前記データを用いて、前記ヘッダの個々の行に記載された見出しであるインストラクションの組み合わせとその順番を規定するヘッダ構成情報(例えば、ヘッダテキスト)に対して、前記ヘッダ構成情報を識別するヘッダ構成識別情報(例えば、ヘッダID)を割り当てる。そして、圧縮データ生成部305は、前記データ構成識別情報(例えば、ストラクチャID)と前記ヘッダ構成識別情報(例えば、ヘッダID)と前記データに含まれるインスタンスとを含む圧縮データを生成する。 Then, the header configuration encoding unit 303 uses the data to perform header configuration information (for example, header text) that defines a combination of instructions that are headings described in the individual rows of the header and their order. The header configuration identification information (for example, header ID) for identifying the header configuration information is assigned. Then, the compressed data generation unit 305 generates compressed data including the data configuration identification information (for example, structure ID), the header configuration identification information (for example, header ID), and the instance included in the data.
 これにより、ヘッダがデータ構成識別情報とヘッダ構成識別情報を含むデータに置き換わることによりヘッダの容量が減るので、元のデータに比べて圧縮データの容量を減らすことができる。 Thereby, the capacity of the compressed data can be reduced compared to the original data because the capacity of the header is reduced by replacing the header with data including the data structure identification information and the header structure identification information.
 本実施形態では、その一例として、テキスト形式で表現されたパーセルデータのヘッダの構成に基づいて、データ容量を削減した可逆の圧縮ヘッダを生成し、この圧縮ヘッダを元のパーセルデータのヘッダと置き換えることを説明した。これにより、データ容量が削減された圧縮パーセルデータを生成することができる。また、テキスト形式のまま、ヘッダの容量を削減した圧縮パーセルデータを作成でき、記憶できるデータ容量に制限がある環境下でも、圧縮パーセルデータの記憶が可能になる。 In this embodiment, as an example, a reversible compressed header with reduced data capacity is generated based on the configuration of the parcel data header expressed in text format, and the compressed header is replaced with the original parcel data header. I explained that. Thereby, compressed parcel data with a reduced data capacity can be generated. Further, compressed parcel data with a reduced header capacity can be created in the text format, and compressed parcel data can be stored even in an environment where the data capacity that can be stored is limited.
 また、本実施形態で作成される圧縮パーセルデータは、パーセル規格に準拠した書式で表現されることから、パーセルデータを扱うアプリケーションに対して特別な機能の追加実装をすることなく、これらのアプリケーションで読み書きができる。 In addition, since the compressed parcel data created in this embodiment is expressed in a format compliant with the parcel standard, these applications can be used without adding special functions to applications that handle parcel data. Can read and write.
 また、本実施形態によれば、同じクラスのデータを記述するためのシートでありプロパティの順序が同じパーセルデータに対して、これらの圧縮パーセルデータを効率よく生成することができる。 Further, according to the present embodiment, these compressed parcel data can be efficiently generated for parcel data that is a sheet for describing data of the same class and has the same property order.
 なお、本実施形態では、圧縮データ生成装置300は、データ管理装置330が有する記憶装置114にリモートDB332を記憶させたが、これに限ったものではない。圧縮データ生成装置300は、自装置内の記憶装置104にリモートDB332を記憶させてもよい。また、圧縮データ生成装置300とデータ管理装置330とが一体の情報処理装置として構成してもよい。 In this embodiment, the compressed data generation apparatus 300 stores the remote DB 332 in the storage device 114 included in the data management apparatus 330, but the present invention is not limited to this. The compressed data generation device 300 may store the remote DB 332 in the storage device 104 within the device itself. Further, the compressed data generation apparatus 300 and the data management apparatus 330 may be configured as an integrated information processing apparatus.
 続いて、図18を用いて本実施形態に係るデータ復元装置360の構成について説明する。図18は、本実施形態に係るデータ復元装置360の構成を示す図である。図18に示すように、データ復元装置360は、CPU(Central Processing Unit)121、ROM122、RAM123、記憶装置124、媒体読取装置126、バスコントローラ127、表示装置128、入力装置129、及び通信部364を備える。図18に示すように、データ復元装置360の各構成要素は、バスコントローラ127を介して接続されており、互いにデータのやり取りが可能である。 Subsequently, the configuration of the data restoration apparatus 360 according to the present embodiment will be described with reference to FIG. FIG. 18 is a diagram showing the configuration of the data restoration device 360 according to the present embodiment. As illustrated in FIG. 18, the data restoration device 360 includes a CPU (Central Processing Unit) 121, a ROM 122, a RAM 123, a storage device 124, a medium reading device 126, a bus controller 127, a display device 128, an input device 129, and a communication unit 364. Is provided. As shown in FIG. 18, each component of the data restoration device 360 is connected via a bus controller 127 and can exchange data with each other.
 CPU121は、圧縮データ生成装置300全体を制御する。 CPU 121 controls the entire compressed data generating apparatus 300.
 ROM122は、各種データ、及びCPU121が読み出して実行する各種プログラムを記憶する。 The ROM 122 stores various data and various programs that the CPU 121 reads and executes.
 RAM123は、情報を一次記憶する記憶装置であり、CPU121が読み出した各種プログラムを一次記憶する。 The RAM 123 is a storage device that primarily stores information, and temporarily stores various programs read by the CPU 121.
 記憶装置124は、各種データ、及びCPU121が読み出して実行する各種プログラムを記憶する。記憶装置124は、例えば、ハードディスクドライブ(Hard Disk Drive:HDD)である。 The storage device 124 stores various data and various programs that the CPU 121 reads and executes. The storage device 124 is, for example, a hard disk drive (Hard Disk Drive: HDD).
 媒体読取装置126は、コンピュータ読み取り可能な記憶媒体(例えば、CD(Compact Diskなど)に記録されたデータを読み取るためのドライブ装置である。なお、本実施形態に係るCPU121の各処理を実行するためのプログラムがコンピュータ読み取り可能な記録媒体に記録されていてもよい。 The medium reading device 126 is a drive device for reading data recorded on a computer-readable storage medium (for example, a CD (Compact Disk) etc.) In order to execute each process of the CPU 121 according to the present embodiment. These programs may be recorded on a computer-readable recording medium.
 表示装置128は、CPU121による制御に従って情報を表示する。 The display device 128 displays information according to control by the CPU 121.
 入力装置129は、ユーザによる、指示入力または操作を受け付ける。入力装置129は、例えばキーボードやマウスである。 The input device 129 receives an instruction input or operation by the user. The input device 129 is, for example, a keyboard or a mouse.
 通信部364は、ネットワーク150を介して、データ管理装置330と通信する。この通信は、有線であっても無線であってもよい。 The communication unit 364 communicates with the data management device 330 via the network 150. This communication may be wired or wireless.
 続いて、図19を用いて本実施形態に係るデータ復元装置360の機能的構成について説明する。図19は、本実施形態に係るデータ復元装置360の機能ブロック図である。CPU121は、ROM122、または記憶装置124からプログラムをRAM123に読み出して実行するか、または媒体読取装置126がコンピュータ読み取り可能な記憶媒体からRAM123に読み出したプログラムを実行する。このプログラムの実行により、RAM123上に、取得部361、判定部362、ヘッダ情報取得部363、データ登録部365、復元部367、パーセルデータ処理部368、事前取得部369が生成される。また、記憶装置124には、ローカルDB366が記憶されている。 Subsequently, a functional configuration of the data restoration apparatus 360 according to the present embodiment will be described with reference to FIG. FIG. 19 is a functional block diagram of the data restoration device 360 according to the present embodiment. The CPU 121 reads out the program from the ROM 122 or the storage device 124 to the RAM 123 and executes the program, or executes the program read from the computer-readable storage medium into the RAM 123 by the medium reading device 126. By executing this program, an acquisition unit 361, a determination unit 362, a header information acquisition unit 363, a data registration unit 365, a restoration unit 367, a parcel data processing unit 368, and a prior acquisition unit 369 are generated on the RAM 123. The storage device 124 stores a local DB 366.
 データ復元装置360におけるパーセルデータ復元処理は、ユーザが表示装置128に表示される画面を見ながら入力装置129に対して、パーセルデータ372を読み取るよう指示するパーセルデータ取得操作を行うことで開始される。 The parcel data restoration process in the data restoration device 360 is started when the user performs a parcel data acquisition operation instructing the input device 129 to read the parcel data 372 while viewing the screen displayed on the display device 128. .
 取得部361は、入力装置129がパーセルデータ取得操作を受け付けた場合、データ372を取得する。ここで、データ372は、パーセルデータ308またはヘッダセクションが圧縮された圧縮パーセルデータ309のいずれかである。取得部361は、パーセルデータ372をメモリにロードして、判定部362に渡す。 The acquisition unit 361 acquires data 372 when the input device 129 receives a parcel data acquisition operation. Here, the data 372 is either the parcel data 308 or the compressed parcel data 309 in which the header section is compressed. The acquisition unit 361 loads the parcel data 372 into the memory and passes it to the determination unit 362.
 判定部362は、テキスト形式のデータ372に含まれるヘッダに基づいて、データ372のヘッダが圧縮されているか否かを判定する。具体的には例えば、判定部362は、データ372のヘッダ情報を解析し、ヘッダの復元が必要な場合、ヘッダ情報取得部363にデータ372を渡す。一方、ヘッダの復元が不要又は不可の場合、パーセルデータ処理部368にデータ372を渡す。判定部362の動作の詳細は後述する。 The determination unit 362 determines whether or not the header of the data 372 is compressed based on the header included in the text format data 372. Specifically, for example, the determination unit 362 analyzes the header information of the data 372 and passes the data 372 to the header information acquisition unit 363 when the header needs to be restored. On the other hand, when restoration of the header is unnecessary or impossible, the data 372 is passed to the parcel data processing unit 368. Details of the operation of the determination unit 362 will be described later.
 ここで、上述したように、データ管理装置330の記憶装置124には、データ構成識別情報と元データが記述する対象の物品やサービスが分類されたクラスを識別するクラス識別情報とクラスを特徴づけるプロパティ(属性)の組み合わせとその順番を規定する属性規定情報とが関連付けて記憶されている。更に、記憶装置124には、ヘッダ構成識別情報と元のヘッダの構成を規定するヘッダ構成情報とが関連付けて記憶されている。 Here, as described above, the storage device 124 of the data management device 330 characterizes the data configuration identification information and the class identification information and the class for identifying the class into which the goods or services to be described by the original data are classified. A combination of properties (attributes) and attribute defining information that defines their order are stored in association with each other. Further, the storage device 124 stores header configuration identification information and header configuration information that defines the configuration of the original header in association with each other.
 ヘッダ情報取得部363は、判定部362によってデータ372のヘッダが圧縮されていると判定された場合、データ372のヘッダからデータ構成識別情報(例えば、ストラクチャID)とヘッダ構成識別情報(例えば、ヘッダID)とを抽出し、抽出したヘッダ構成識別情報とデータ構成識別情報のいずれかに関連づけられた情報を含むヘッダ情報を記憶装置124から取得する。 When the determination unit 362 determines that the header of the data 372 is compressed, the header information acquisition unit 363 determines the data configuration identification information (for example, structure ID) and the header configuration identification information (for example, the header) from the header of the data 372. ID) is extracted, and header information including information associated with either the extracted header configuration identification information or data configuration identification information is acquired from the storage device 124.
 具体的には例えば、ヘッダ情報取得部363は、判定部362から受け取ったパーセルデータ372のヘッダセクションのインストラクション#CLASS_IDの値からストラクチャIDを取得し、更にインストラクション#HEADER_IDで指定されたヘッダIDを抽出する。そして、ヘッダ情報取得部363は、ローカルDB366、または通信部364を介してデータ管理装置330から、これらに関連づけられたヘッダ情報を取得する。ここで、データ管理装置330からヘッダ情報を取得した場合、ローカルDB366で記憶するため、このヘッダ情報をデータ登録部365に渡す。その後、このヘッダ情報とパーセルデータ372を復元部367に送る。ヘッダ情報取得部363の動作の詳細は後述する。 Specifically, for example, the header information acquisition unit 363 acquires the structure ID from the value of the instruction #CLASS_ID of the header section of the parcel data 372 received from the determination unit 362, and further extracts the header ID specified by the instruction #HEADER_ID. To do. Then, the header information acquisition unit 363 acquires header information associated with these from the data management device 330 via the local DB 366 or the communication unit 364. Here, when the header information is acquired from the data management device 330, the header information is transferred to the data registration unit 365 for storage in the local DB 366. Thereafter, the header information and the parcel data 372 are sent to the restoration unit 367. Details of the operation of the header information acquisition unit 363 will be described later.
 通信部364は、記憶装置124を有するデータ管理装置330と通信する。具体的には、通信部364は、ヘッダ情報取得部363からの問い合わせをネットワーク150を介してデータ管理装置330へ送信する。そして、通信部364は、この問い合わせに応じてデータ管理装置330から送信されたヘッダ情報を、ネットワーク150を介して受信し、受信したヘッダ情報をヘッダ情報取得部363に渡す。 The communication unit 364 communicates with the data management device 330 having the storage device 124. Specifically, the communication unit 364 transmits an inquiry from the header information acquisition unit 363 to the data management device 330 via the network 150. Then, the communication unit 364 receives the header information transmitted from the data management device 330 in response to this inquiry via the network 150 and passes the received header information to the header information acquisition unit 363.
 データ登録部365は、ヘッダ情報取得部363が取得したヘッダ情報を記憶装置124に記憶させる。具体的には、データ登録部365は、ヘッダ情報取得部363から渡されたヘッダ情報を記憶装置124内のローカルDB366に記憶させる。また、データ登録部365は、事前取得部369が取得したヘッダ情報を記憶装置366に記憶させる。 The data registration unit 365 stores the header information acquired by the header information acquisition unit 363 in the storage device 124. Specifically, the data registration unit 365 stores the header information passed from the header information acquisition unit 363 in the local DB 366 in the storage device 124. In addition, the data registration unit 365 causes the storage device 366 to store the header information acquired by the advance acquisition unit 369.
 記憶装置(第2の記憶装置)124は、ローカルDB366を含むデータを記憶する。ローカルDB366は、ヘッダ情報取得部363または事前取得部369が取得したヘッダ情報を記憶する。ローカルDB366で記憶する情報の構成はデータ管理装置330のリモートDB332と同様であり、図7A~図7Dに示す通りである。すなわち、ローカルDB366には、データ管理装置330のリモートDB332の情報の一部又は全部が記憶される。このように、データ復元装置360内でヘッダ情報を記憶することで、圧縮パーセルデータから元のパーセルデータを復元する際の通信量を削減し、処理速度を向上させることができる。 The storage device (second storage device) 124 stores data including the local DB 366. The local DB 366 stores the header information acquired by the header information acquisition unit 363 or the advance acquisition unit 369. The configuration of information stored in the local DB 366 is the same as that of the remote DB 332 of the data management device 330, as shown in FIGS. 7A to 7D. That is, the local DB 366 stores part or all of the information of the remote DB 332 of the data management device 330. Thus, by storing the header information in the data decompression device 360, it is possible to reduce the amount of communication when restoring the original parcel data from the compressed parcel data, and to improve the processing speed.
 復元部367は、ヘッダ情報取得部363により取得されたヘッダ情報を用いて、元データ(例えば、元のパーセルデータ)を復元する。あるいは、復元部367は、記憶装置124に記憶されたヘッダ情報を用いて、元データを復元する。 The restoration unit 367 restores original data (for example, original parcel data) using the header information acquired by the header information acquisition unit 363. Alternatively, the restoration unit 367 restores the original data using the header information stored in the storage device 124.
 より詳細には、復元部367は、ヘッダ情報に含まれる、ヘッダ構成識別情報(例えば、ヘッダID)に関連付けられたヘッダ構成情報(例えば、ヘッダテキスト)から、ヘッダの個々の行に記載された見出しであるインストラクションの一覧を抽出する。そして、復元部367は、抽出したインストラクション毎に、当該インストラクションとデータ構成識別情報(例えば、ストラクチャID)とに関連付けられたインストラクション値を取得し、インストラクションとインストラクション値の組と、圧縮データに含まれるインスタンスとを含むデータを元データとして生成する。 More specifically, the restoration unit 367 is described in each line of the header from header configuration information (for example, header text) associated with header configuration identification information (for example, header ID) included in the header information. Extracts a list of instructions that are headings. Then, for each extracted instruction, the restoration unit 367 acquires an instruction value associated with the instruction and data configuration identification information (for example, structure ID), and is included in the combination of the instruction and instruction value and the compressed data. Data including instances is generated as original data.
 具体的には例えば、復元部367は、ヘッダ情報取得部363から渡されたヘッダ情報を用いて、ヘッダ情報取得部363から渡されたデータ372のヘッダセクションを、元のパーセルデータのヘッダセクションに復元することにより、元のパーセルデータを復元する。復元部367は、復元した元のパーセルデータを、パーセルデータ処理部368に渡す。復元部367の動作の詳細は後述する。 Specifically, for example, the restoration unit 367 uses the header information passed from the header information acquisition unit 363 to convert the header section of the data 372 passed from the header information acquisition unit 363 into the header section of the original parcel data. By restoring, the original parcel data is restored. The restoration unit 367 passes the restored original parcel data to the parcel data processing unit 368. Details of the operation of the restoration unit 367 will be described later.
 パーセルデータ処理部368は、判定部362から渡されたデータ372、または復元部367から渡された元のパーセルデータに対して、各種処理を行う。 The parcel data processing unit 368 performs various processes on the data 372 passed from the determination unit 362 or the original parcel data passed from the restoration unit 367.
 事前取得部369における処理は、ユーザが表示装置128に表示される画面を見ながら入力装置129を介してヘッダ情報の事前取得操作を行うことで開始される。 The process in the pre-acquisition unit 369 is started when the user performs a pre-acquisition operation of header information via the input device 129 while viewing the screen displayed on the display device 128.
 事前取得部369は、データ372内のヘッダを圧縮前のヘッダに復元するためのヘッダ情報を記憶装置114から通信部364を介して事前に取得する。具体的には例えば、事前取得部369は、データ管理装置330から事前に必要なヘッダ情報を取得し、ローカルDB366に登録する。これは、データ復元装置が処理する圧縮パーセルデータが予め明らかな場合に有効であり、事前に登録することで、データ復元装置がオフラインの環境でも、データ372を元のパーセルデータに復元することができる。 The pre-acquisition unit 369 acquires header information for restoring the header in the data 372 to the header before compression from the storage device 114 via the communication unit 364 in advance. Specifically, for example, the advance acquisition unit 369 acquires necessary header information from the data management device 330 in advance and registers it in the local DB 366. This is effective when the compressed parcel data to be processed by the data decompression apparatus is known in advance. By registering in advance, the data 372 can be restored to the original parcel data even in an offline environment. it can.
 なお、ヘッダ事前取得操作を契機に事前取得部369における処理を開始したが、これに限らず、事前取得部369が処理を自動的に実行しても良い。例えば、事前取得部369は、建物の入り口に配置されているセンサからの情報に基づいて、この建物内の機器等に割り当てられた圧縮パーセルデータが使用するヘッダIDの一覧を取得し、自動的にヘッダ情報を取得してもよい。 In addition, although the process in the pre-acquisition part 369 was started in response to header pre-acquisition operation, not only this but the prior acquisition part 369 may perform a process automatically. For example, the pre-acquisition unit 369 acquires a list of header IDs used by the compressed parcel data allocated to the equipment in the building based on information from a sensor arranged at the entrance of the building, and automatically The header information may be acquired.
 続いて、図20~図22を用いて、上述した構成を有するデータ復元装置360の各処理の詳細について、それぞれフローチャートを用いて説明する。 Subsequently, details of each process of the data restoration apparatus 360 having the above-described configuration will be described using flowcharts with reference to FIGS.
 <判定部362の処理のフローチャート>
 図20は、データ復元装置360の判定部362の処理の流れの一例を示すフローチャートである。
<Flowchart of processing of determination unit 362>
FIG. 20 is a flowchart illustrating an example of a process flow of the determination unit 362 of the data restoration device 360.
 (ステップS1501)まず、判定部362は、取得部361からデータ372を取得する。 (Step S1501) First, the determination unit 362 acquires data 372 from the acquisition unit 361.
 (ステップS1502)次に、判定部362は、データ372のヘッダセクションを解析する。 (Step S1502) Next, the determination unit 362 analyzes the header section of the data 372.
 (ステップS1503)次に、判定部362は、データ372のヘッダセクションが圧縮されているか判定する。具体的には例えば、判定部362は、データ372のインストラクション#CLASS_IDの値をデータ管理装置330に問い合わせ、これがヘッダ情報としてローカルDB366又はデータ管理装置330のリモートDB332に登録されている場合、このデータ372のヘッダセクションが圧縮されていると判定する。一方、それ以外の場合、判定部362は、このデータ372のヘッダセクションが圧縮されていないと判定する。 (Step S1503) Next, the determination unit 362 determines whether the header section of the data 372 is compressed. Specifically, for example, the determination unit 362 inquires the value of the instruction #CLASS_ID of the data 372 to the data management device 330, and if this is registered in the local DB 366 or the remote DB 332 of the data management device 330 as header information, this data It is determined that 372 header sections are compressed. On the other hand, in other cases, the determination unit 362 determines that the header section of the data 372 is not compressed.
 (ステップS1504)ステップS1503でデータ372のヘッダセクションが圧縮されていると判定された場合(ステップS1503 YES)、判定部362は、ヘッダ情報取得部363にこのデータ372を渡して、処理を終了する。 (Step S1504) When it is determined in step S1503 that the header section of the data 372 is compressed (YES in step S1503), the determination unit 362 passes this data 372 to the header information acquisition unit 363 and ends the processing. .
 (ステップS1505)一方、ステップS1503でデータ372のヘッダセクションが圧縮されていないと判定された場合(ステップS1503 NO)、復元処理を行う必要がないため、判定部362は、パーセルデータ処理部368にデータ372を渡して、処理を終了する。 (Step S1505) On the other hand, when it is determined in Step S1503 that the header section of the data 372 is not compressed (NO in Step S1503), it is not necessary to perform the restoration process, so the determination unit 362 sends the parcel data processing unit 368 to The data 372 is passed and the process is terminated.
 <ヘッダ情報取得部363の処理のフローチャート>
 続いて、図21を用いてヘッダ情報取得部363の処理について説明する。図21は、データ復元装置360のヘッダ情報取得部363の処理の流れの一例を示すフローチャートである。
<Flowchart of Processing of Header Information Acquisition Unit 363>
Next, processing of the header information acquisition unit 363 will be described with reference to FIG. FIG. 21 is a flowchart illustrating an example of the processing flow of the header information acquisition unit 363 of the data restoration device 360.
 (ステップS1601)まず、ヘッダ情報取得部363は、判定部362からデータ372を取得する。 (Step S1601) First, the header information acquisition unit 363 acquires data 372 from the determination unit 362.
 (ステップS1602)次に、ヘッダ情報取得部363は、取得したデータ372のヘッダセクションから、インストラクション#CLASS_IDに関連づけられたストラクチャID及びインストラクション#HEADERに関連づけられたヘッダIDを抽出する。 (Step S1602) Next, the header information acquisition unit 363 extracts the structure ID associated with the instruction #CLASS_ID and the header ID associated with the instruction #HEADER from the header section of the acquired data 372.
 (ステップS1603)次に、ヘッダ情報取得部363は、ステップS1602で抽出したストラクチャID及びヘッダIDの組をキーとして、このストラクチャID及びこのヘッダIDの組を含むレコードがあるか否かローカルDB366に問い合わせる。 (Step S1603) Next, the header information acquisition unit 363 uses the combination of the structure ID and the header ID extracted in step S1602 as a key to check whether there is a record including the structure ID and the header ID in the local DB 366. Inquire.
 (ステップS1604)次に、ヘッダ情報取得部363は、ステップS1603で問い合わせた結果を用いて、ローカルDB366に該当レコードがあるか否か判定する。 (Step S1604) Next, the header information acquisition unit 363 determines whether or not there is a corresponding record in the local DB 366 using the result inquired in Step S1603.
 (ステップS1605)ステップ1604でローカルDB366に該当レコードがあると判定された場合(ステップS1604 YES)、ヘッダ情報取得部363は、ローカルDB366からヘッダ情報を取得する。 (Step S1605) When it is determined in Step 1604 that there is a corresponding record in the local DB 366 (YES in Step S1604), the header information acquisition unit 363 acquires header information from the local DB 366.
 (ステップS1606)一方、ステップ1604でローカルDB366に該当レコードがないと判定された場合(S1604 NO)、ヘッダ情報取得部363は、ステップS1602で抽出したストラクチャID及びヘッダIDの組をキーとして、通信部364を介してデータ管理装置330のリモートDB322からヘッダ情報を取得する。 (Step S1606) On the other hand, if it is determined in Step 1604 that there is no corresponding record in the local DB 366 (NO in S1604), the header information acquisition unit 363 performs communication using the structure ID and header ID pair extracted in Step S1602 as a key. Header information is acquired from the remote DB 322 of the data management device 330 via the unit 364.
 (ステップS1607)次に、ヘッダ情報取得部363は、ステップS1606で取得したヘッダ情報をローカルDB366に登録する。 (Step S1607) Next, the header information acquisition unit 363 registers the header information acquired in Step S1606 in the local DB 366.
 (ステップS1608)ステップS1605またはS1607の処理によりヘッダ情報を取得すると、ヘッダ情報取得部363は、取得したヘッダ情報、データ372、ストラクチャID及びヘッダIDを復元部367に渡し、処理を終了する。 (Step S1608) When the header information is acquired by the processing of step S1605 or S1607, the header information acquisition unit 363 passes the acquired header information, data 372, structure ID, and header ID to the restoration unit 367, and ends the processing.
 <復元部367の処理のフローチャート>
 続いて、図22を用いて復元部367の処理について説明する。図22は、データ復元装置360の復元部367の処理の流れの一例を示すフローチャートである。
<Flowchart of processing of restoration unit 367>
Next, processing of the restoration unit 367 will be described with reference to FIG. FIG. 22 is a flowchart illustrating an example of a processing flow of the restoration unit 367 of the data restoration device 360.
 (ステップS1701)まず、復元部367は、ヘッダ情報取得部363からヘッダ情報、データ372、ストラクチャID及びヘッダIDを取得する。 (Step S1701) First, the restoration unit 367 acquires header information, data 372, a structure ID, and a header ID from the header information acquisition unit 363.
 (ステップS1702)次に、復元部367は、圧縮前のヘッダセクションを復元するための空のヘッダセクションを生成する。 (Step S1702) Next, the restoration unit 367 generates an empty header section for restoring the header section before compression.
 (ステップS1703)次に、復元部367は、ステップS1701で取得したヘッダ情報に含まれるヘッダテーブルから、ステップS1701で取得したヘッダIDに関連づけられたヘッダテキストを取得する。そして、復元部367は、ヘッダテキストから区切り文字で区切られた各インストラクションを抽出することにより、インストラクションのリストを取得する。以下、このようにして得られたインストラクションのリストの先頭のインストラクションから順に復元の処理を行う。 (Step S1703) Next, the restoration unit 367 acquires the header text associated with the header ID acquired in Step S1701 from the header table included in the header information acquired in Step S1701. Then, the restoration unit 367 acquires a list of instructions by extracting each instruction delimited by a delimiter from the header text. Hereinafter, restoration processing is performed in order from the first instruction in the instruction list thus obtained.
 (ステップS1704)まず、処理対象のインストラクションがクラスヘッダセクションのインストラクションの場合、すなわちインストラクションの末尾が「:=」で終わっている場合、以下に示すステップS1705~ステップS1707の処理を実行する。 (Step S1704) First, if the instruction to be processed is an instruction in the class header section, that is, if the end of the instruction ends with “: =”, the following processing from Step S1705 to Step S1707 is executed.
 (ステップS1705)復元部367は、ヘッダ情報に含まれるセルカラムテキストから、ストラクチャID及び処理対象のインストラクションの組に関連づけられたインストラクション値を取得する。 (Step S1705) The restoration unit 367 acquires the instruction value associated with the set of the structure ID and the instruction to be processed from the cell column text included in the header information.
 (ステップS1706)ステップS1701で取得したストラクチャIDと処理対象のインストラクションとを含むレコードが、ヘッダ情報に含まれるエイリアステーブルに含まれる場合、すなわち処理対象のインストラクションがエイリアスである場合、復元部367は、ヘッダ情報に含まれるエイリアステーブルにおいて、当該ストラクチャIDと処理対象のインストラクションとの組に関連づけられたオリジナルの値を元のインストラクションとして取得する。 (Step S1706) When the record including the structure ID acquired in step S1701 and the instruction to be processed is included in the alias table included in the header information, that is, when the instruction to be processed is an alias, the restoring unit 367 In the alias table included in the header information, the original value associated with the set of the structure ID and the instruction to be processed is acquired as the original instruction.
 (ステップS1707)復元部367は、ステップS1705及びステップS1706の処理を経て得られたインストラクション及びインストラクション値を用いて、クラスヘッダセクションのテキストデータを生成し、ヘッダセクションに追記する。 (Step S1707) The restoration unit 367 generates text data of the class header section using the instructions and the instruction values obtained through the processing of Step S1705 and Step S1706, and adds the text data to the header section.
 ヘッダ情報には、データ構成識別情報(例えば、ストラクチャID)と元のインストラクションと元のインストラクションの別名とが関連付けられている。そして、復元部367は、前記ヘッダ情報中に、データ構成識別情報(例えば、ストラクチャID)と処理対象のインストラクションとの組に関連付けられた元のインストションが含まれる場合、元データに、元のインストションと、ヘッダ情報で処理対象のインストラクションに関連付けられたインストラクション値との組を含ませる。 In the header information, data structure identification information (for example, structure ID), the original instruction, and an alias of the original instruction are associated. When the header information includes the original instruction associated with the combination of the data configuration identification information (for example, the structure ID) and the instruction to be processed, the restoration unit 367 includes the original data in the original data. A combination of an instruction and an instruction value associated with the instruction to be processed is included in the header information.
 (ステップS1708)インストラクションリストの次のインストラクションがクラスヘッダセクションのインストラクションの場合、次のインストラクションを処理対象としてステップS1705~ステップS1707の処理を行う。ステップS1704~ステップS1708のループを抜けた場合、当該インストラクションリストの次の処理対象のインストラクションはスキーマヘッダセクションのインストラクションになる。 (Step S1708) When the next instruction in the instruction list is an instruction in the class header section, the processing from step S1705 to step S1707 is performed on the next instruction as a processing target. When exiting the loop from step S1704 to step S1708, the instruction to be processed next in the instruction list is an instruction in the schema header section.
 (ステップS1709)当該インストラクションリストの処理対象のインストラクションがスキーマヘッダセクションのインストラクションの場合、以下に示すステップS1710~ステップS1712の処理を実行する。 (Step S1709) If the instruction to be processed in the instruction list is an instruction in the schema header section, the following processing from Step S1710 to Step S1712 is executed.
 (ステップS1710)復元部367は、ヘッダ情報に含まれるセルカラムテーブルから、ステップS1701で取得したストラクチャID及び処理対象のインストラクションの組に関連づけられたインストラクション値を取得する。 (Step S1710) The restoration unit 367 acquires the instruction value associated with the combination of the structure ID acquired in Step S1701 and the instruction to be processed from the cell column table included in the header information.
 (ステップS1711)ステップS1701で取得したストラクチャIDと処理対象のインストラクションとを含むレコードが、ヘッダ情報に含まれるエイリアステーブルに含まれる場合、すなわち処理対象のインストラクションがエイリアスである場合、復元部367は、ヘッダ情報に含まれるエイリアステーブルにおいて、当該ストラクチャIDと処理対象のインストラクションとの組に関連づけられたオリジナルの値をインストラクションとして取得することによって、インストラクションを復元する。 (Step S1711) When the record including the structure ID acquired in step S1701 and the instruction to be processed is included in the alias table included in the header information, that is, when the instruction to be processed is an alias, the restoring unit 367 In the alias table included in the header information, the original value associated with the set of the structure ID and the instruction to be processed is acquired as an instruction, thereby restoring the instruction.
 (ステップS1712)復元部367は、ステップS1710及びS1711の処理を経て得られたインストラクション及びインストラクション値からスキーマヘッダセクションのテキストデータを生成し、ヘッダセクションに追記する。 (Step S1712) The restoration unit 367 generates text data of the schema header section from the instructions and instruction values obtained through the processing of steps S1710 and S1711, and adds the text data to the header section.
 (ステップS1713)インストラクションリストの次のインストラクションがある場合、次のインストラクションを処理対象としてステップS1710~ステップS1712の処理を行う。 (Step S1713) If there is a next instruction in the instruction list, the processing from step S1710 to step S1712 is performed on the next instruction as a processing target.
 (ステップS1714)ステップS1709~ステップS1713のループを抜けた場合、復元部367は、これらの処理で得られたヘッダセクションに、データ372のデータセクションを結合することにより、ヘッダセクションを圧縮する前のパーセルデータを復元する。 (Step S1714) When the loop from Step S1709 to Step S1713 is exited, the restoration unit 367 combines the data section of the data 372 with the header section obtained by these processings, before compressing the header section. Restore parcel data.
 (ステップS1715)次に、復元部367は、復元したパーセルデータをパーセルデータ処理部368に渡して、処理を終了する。 (Step S1715) Next, the restoration unit 367 passes the restored parcel data to the parcel data processing unit 368 and ends the processing.
 以上、本実施形態に係るデータ復元装置360において、判定部362は、テキスト形式のデータ372に含まれるヘッダに基づいて、データ372のヘッダが圧縮されているか否かを判定する。ヘッダ情報取得部363は、判定部362によってデータ372のヘッダが圧縮されていると判定された場合、データ372のヘッダからデータ構成識別情報(例えば、ストラクチャID)とヘッダ構成識別情報(例えば、ヘッダID)とを抽出し、抽出したヘッダ構成識別情報とデータ構成識別情報のいずれかに関連づけられた情報を含むヘッダ情報を記憶装置114から取得する。復元部367は、ヘッダ情報取得部363により取得されたヘッダ情報を用いて、元データを復元する。 As described above, in the data restoration device 360 according to the present embodiment, the determination unit 362 determines whether the header of the data 372 is compressed based on the header included in the text format data 372. When the determination unit 362 determines that the header of the data 372 is compressed, the header information acquisition unit 363 determines the data configuration identification information (for example, structure ID) and the header configuration identification information (for example, the header) from the header of the data 372. ID) is extracted, and header information including information associated with either the extracted header configuration identification information or data configuration identification information is acquired from the storage device 114. The restoration unit 367 restores the original data using the header information acquired by the header information acquisition unit 363.
 このように、本実施形態に係るデータ復元装置360は、データに含まれるヘッダを圧縮する前のヘッダに復元することにより、元データを復元することができる。また、本実施形態によれば、インストラクションの表示順序が個々に異なる場合でも、完全に元のパーセルデータを復元できる。 Thus, the data restoration device 360 according to the present embodiment can restore the original data by restoring the header included in the data to the header before compression. Further, according to the present embodiment, the original parcel data can be completely restored even when the display order of the instructions is individually different.
 以上、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。 As described above, the present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. In addition, various inventions can be formed by appropriately combining a plurality of components disclosed in the embodiment. For example, some components may be deleted from all the components shown in the embodiment. Furthermore, constituent elements over different embodiments may be appropriately combined.
1 情報処理システム
150 ネットワーク
300 圧縮データ生成装置(情報処理装置)
330 データ管理装置
360 データ復元装置(情報処理装置)
101、111、121 CPU(Central Processing Unit)
102、112、122 ROM
103、113、122 RAM
104、114、124 記憶装置
106、116、126 媒体読取装置
107、117、127 バスコントローラ
108、118、128 表示装置
109、119、129 入力装置
304、333、364 通信部
301 ヘッダ取得部
302 データ構成符号化部
303 ヘッダ構成符号化部
305 圧縮データ生成部
331 データ管理部
361 取得部
362 判定部
363 ヘッダ情報取得部
365 データ登録部
367 復元部
368 パーセルデータ処理部
369 事前取得部
1 Information processing system 150 Network 300 Compressed data generation device (information processing device)
330 Data management device 360 Data restoration device (information processing device)
101, 111, 121 CPU (Central Processing Unit)
102, 112, 122 ROM
103, 113, 122 RAM
104, 114, 124 Storage device 106, 116, 126 Medium reader 107, 117, 127 Bus controller 108, 118, 128 Display device 109, 119, 129 Input device 304, 333, 364 Communication unit 301 Header acquisition unit 302 Data configuration Encoding unit 303 Header configuration encoding unit 305 Compressed data generation unit 331 Data management unit 361 Acquisition unit 362 Determination unit 363 Header information acquisition unit 365 Data registration unit 367 Restoration unit 368 Parcel data processing unit 369 Pre-acquisition unit

Claims (20)

  1.  テキスト形式のデータに含まれるヘッダに基づいて、前記データが記述する対象が分類されたクラスを識別するクラス識別情報と、前記クラスを特徴づける属性の組み合わせとその順番を規定する属性規定情報との組に対して、前記組を識別するデータ構成識別情報を割り当てるデータ構成符号化部と、
     前記データに基づいて、前記ヘッダの個々の行に記載された見出しであるインストラクションの組み合わせとその順番を規定するヘッダ構成情報に対して、前記ヘッダ構成情報を識別するヘッダ構成識別情報を割り当てるヘッダ構成符号化部と、
     前記データ構成識別情報と前記ヘッダ構成識別情報と前記データに含まれるインスタンスとを含む圧縮データを生成する圧縮データ生成部と、
     を備える情報処理装置。
    Based on the header included in the text data, the class identification information for identifying the class into which the object described by the data is classified, and the attribute defining information for defining the combination and order of the attributes characterizing the class A data configuration encoding unit that assigns data configuration identification information for identifying the set to the set;
    A header configuration in which header configuration identification information for identifying the header configuration information is assigned to header configuration information that defines a combination of instructions that are headings described in individual rows of the header and their order based on the data An encoding unit;
    A compressed data generation unit that generates compressed data including the data configuration identification information, the header configuration identification information, and an instance included in the data;
    An information processing apparatus comprising:
  2.  前記データ構成符号化部は、前記データから前記クラス識別情報を抽出し、前記データから前記属性規定情報を生成し、前記クラス識別情報と前記属性規定情報との組に対して前記データ構成識別情報を割り当て、前記データ構成識別情報と前記クラス識別情報と前記属性規定情報とを関連付けて記憶装置に記憶させ、
     前記ヘッダ構成符号化部は、前記データから、前記ヘッダ構成情報を生成し、前記生成したヘッダ構成情報に対して前記ヘッダ構成識別情報を割り当て、前記ヘッダ構成識別情報とヘッダ構成情報とを関連付けて前記記憶装置に記憶させ、前記データから、前記インストラクションと前記インストラクションの値の組を読み出し、前記データ構成識別情報とインストラクションと前記インストラクションの値とを関連づけて前記記憶装置に記憶させる
     請求項1に記載の情報処理装置。
    The data configuration encoding unit extracts the class identification information from the data, generates the attribute definition information from the data, and the data configuration identification information for a set of the class identification information and the attribute definition information And storing the data configuration identification information, the class identification information, and the attribute definition information in a storage device in association with each other,
    The header configuration encoding unit generates the header configuration information from the data, assigns the header configuration identification information to the generated header configuration information, and associates the header configuration identification information with the header configuration information. The storage device stores the instruction, the instruction value pair is read from the data, and the data configuration identification information, the instruction value, and the instruction value are associated with each other and stored in the storage device. Information processing device.
  3.  前記ヘッダ構成符号化部は、前記データから、前記ヘッダに含まれるインストラクションと前記インストラクションの値の組を取得し、前記取得したインストラクションの値と、前記記憶装置において前記データの構成を識別するデータ構成識別情報と前記インストションとに関連付けられたインストラクションの値とを比較し、比較の結果、値が異なる場合、前記インストラクションに対して別名を生成し、
     前記データ構成識別情報と前記別名と前記読み出したインストラクションの値とを関連付けて前記記憶装置に記憶させ、
     前記ヘッダ構成識別情報と、前記ヘッダ構成情報に含まれる前記インストラクションが前記別名に置換されたヘッダ構成情報とを関連付けて前記記憶装置に記憶させ、
     前記インストラクション構成識別情報と前記別名と前記インストクションとを関連づけて前記記憶装置に記憶させる
     請求項1または2に記載の情報処理装置。
    The header configuration encoding unit acquires a set of an instruction included in the header and a value of the instruction from the data, and a data configuration for identifying the acquired instruction value and the configuration of the data in the storage device Compare the identification information and the value of the instruction associated with the instruction, and if the comparison results in different values, generate an alias for the instruction,
    Associating the data configuration identification information, the alias, and the read instruction value in the storage device,
    The header configuration identification information and the header configuration information in which the instruction included in the header configuration information is replaced with the alias are associated with each other and stored in the storage device,
    The information processing apparatus according to claim 1, wherein the instruction configuration identification information, the alias, and the instruction are associated with each other and stored in the storage device.
  4.  前記記憶装置を有するデータ管理装置と通信する通信部を更に備え、
     前記データ構成符号化部は、前記記憶装置に記憶させるデータを前記通信部から前記データ管理装置へ送信させ、当該記憶させるデータを前記データ管理装置に記憶させるようにし、
     前記ヘッダ構成符号化部は、前記記憶装置に記憶させるデータを前記通信部から前記データ管理装置へ送信させ、当該記憶させるデータを前記データ管理装置に記憶させるようにする
     請求項2または3に記載の情報処理装置。
    A communication unit that communicates with a data management device having the storage device;
    The data configuration encoding unit transmits data to be stored in the storage device from the communication unit to the data management device, and stores the data to be stored in the data management device.
    The header configuration encoding unit causes the data to be stored in the storage device to be transmitted from the communication unit to the data management device, and the data to be stored is stored in the data management device. Information processing device.
  5.  前記データ構成符号化部は、前記クラス識別情報と前記属性規定情報との組に対してテキスト符号化を行うことにより、前記データ構成識別情報を生成する
     請求項1から4のいずれか一項に記載の情報処理装置。
    The said data structure encoding part produces | generates the said data structure identification information by performing text encoding with respect to the group of the said class identification information and the said attribute prescription | regulation information. The information processing apparatus described.
  6.  前記ヘッダ構成符号化部は、前記ヘッダ構成情報に対してテキスト符号化を行うことにより、前記ヘッダ構成識別情報を生成する
     請求項1から5のいずれか一項に記載の情報処理装置。
    The information processing apparatus according to claim 1, wherein the header configuration encoding unit generates the header configuration identification information by performing text encoding on the header configuration information.
  7.  前記テキスト符号化は、ハッシュ関数を用いたハッシュ値の計算である
     請求項5または6に記載の情報処理装置。
    The information processing apparatus according to claim 5, wherein the text encoding is calculation of a hash value using a hash function.
  8.  ユーザの入力を受付ける入力装置を更に備え、
     前記データ構成符号化部は、前記データ構成情報に対して、前記入力装置がユーザから受け付けた文字列を割り当て、
     前記ヘッダ構成符号化部は、前記ヘッダ構成情報に対して、前記入力装置がユーザから受け付けた文字列を割り当てる
     請求項1から4のいずれか一項に記載の情報処理装置。
    An input device for receiving user input;
    The data configuration encoding unit assigns a character string received from a user by the input device to the data configuration information,
    The information processing apparatus according to any one of claims 1 to 4, wherein the header configuration encoding unit allocates a character string received from a user by the input device to the header configuration information.
  9.  前記属性規定情報は、前記属性を識別する属性識別情報に前記ヘッダ内で関連付けられた値を、前記ヘッダ内での出現順に並べた情報である
     請求項1から8のいずれか一項に記載の情報処理装置。
    The said attribute prescription | regulation information is the information which arranged the value linked | related with the attribute identification information which identifies the said attribute in the said header in the order of appearance in the said header. Information processing device.
  10.  前記ヘッダ構成情報は、前記ヘッダに含まれるインストラクションを前記ヘッダ内における出現順に並べた情報である
     請求項1から9のいずれか一項に記載の情報処理装置。
    The information processing apparatus according to any one of claims 1 to 9, wherein the header configuration information is information in which instructions included in the header are arranged in the order of appearance in the header.
  11.  テキスト形式のデータに含まれるヘッダに基づいて、前記データのヘッダが圧縮されているか否かを判定する判定部と、
     前記判定部によって前記データのヘッダが圧縮されていると判定された場合、前記データのヘッダからデータ構成識別情報とヘッダ構成識別情報とを抽出し、抽出したヘッダ構成識別情報とデータ構成識別情報のいずれかに関連づけられた情報を含むヘッダ情報を記憶装置から取得するヘッダ情報取得部と、
     前記ヘッダ情報取得部により取得されたヘッダ情報に基づいて、元データを復元する復元部と、
     を備え、
     前記記憶装置には、前記データ構成識別情報と前記元データが記述する対象が分類されたクラスを識別するクラス識別情報と前記クラスを特徴づける属性の組み合わせとその順番を規定する前記属性規定情報とが関連付けて記憶され、前記ヘッダ構成識別情報と前記元のヘッダの構成を規定するヘッダ構成情報とが関連付けて記憶されている
     情報処理装置。
    A determination unit for determining whether or not the header of the data is compressed based on a header included in the data in the text format;
    When it is determined by the determination unit that the header of the data is compressed, the data configuration identification information and the header configuration identification information are extracted from the header of the data, and the extracted header configuration identification information and the data configuration identification information A header information acquisition unit for acquiring header information including information associated with any one from a storage device;
    Based on the header information acquired by the header information acquisition unit, a restoration unit that restores the original data;
    With
    In the storage device, the data configuration identification information, class identification information for identifying a class in which a target described by the original data is classified, and attribute definition information for defining a combination and order of attributes characterizing the class, Is stored in association with each other, and the header configuration identification information and the header configuration information that defines the configuration of the original header are stored in association with each other.
  12.  前記復元部は、前記ヘッダ情報に含まれる、ヘッダ構成識別情報に関連付けられたヘッダ構成情報から、ヘッダの個々の行に記載された見出しであるインストラクションの一覧を抽出し、抽出したインストラクション毎に、当該インストラクションと前記データ構成識別情報とに関連付けられたインストラクションの値を取得し、インストラクションとインストラクションの値の組と、圧縮データに含まれるインスタンスとを含むデータを前記元データとして生成する
     請求項11に記載の情報処理装置。
    The restoration unit extracts a list of instructions that are headings described in individual rows of the header from the header configuration information associated with the header configuration identification information included in the header information, and for each extracted instruction, 12. An instruction value associated with the instruction and the data configuration identification information is acquired, and data including a pair of the instruction and the instruction value and an instance included in the compressed data is generated as the original data. The information processing apparatus described.
  13.  前記ヘッダ情報には、前記データ構成識別情報と元のインストラクションと前記元のインストラクションの別名とが関連付けられており、
     前記復元部は、前記ヘッダ情報中に、前記データ構成識別情報と処理対象のインストラクションの組に関連付けられた元のインストションが含まれる場合、前記元データに、前記元のインストションと、前記ヘッダ情報で前記処理対象のインストラクションに関連付けられたインストラクションの値との組を含ませる
     請求項12に記載の情報処理装置。
    The header information is associated with the data structure identification information, the original instruction, and an alias of the original instruction,
    When the original information associated with the set of the data configuration identification information and the instruction to be processed is included in the header information, the restoration unit includes the original instruction and the header in the original data. The information processing apparatus according to claim 12, wherein the information includes a pair with an instruction value associated with the instruction to be processed.
  14.  データを記憶する第2の記憶装置と、
     前記ヘッダ情報取得部が取得したヘッダ情報を前記記憶装置に記憶させるデータ登録部と、
     を更に備える請求項11から13のいずれか一項に記載の情報処理装置。
    A second storage device for storing data;
    A data registration unit for storing the header information acquired by the header information acquisition unit in the storage device;
    The information processing apparatus according to any one of claims 11 to 13, further comprising:
  15.  前記復元部は、前記第2の記憶装置に記憶されたヘッダ情報に基づいて、前記元データを復元する請求項14に記載の情報処理装置。 The information processing apparatus according to claim 14, wherein the restoration unit restores the original data based on header information stored in the second storage device.
  16.  前記記憶装置を有するデータ管理装置と通信する通信部と、
     前記データ内のヘッダを圧縮前のヘッダに復元するためのヘッダ情報を前記通信部を介して前記記憶装置から事前に取得する事前取得部と、
     前記事前取得部が取得したヘッダ情報を前記第2の記憶装置に記憶させるデータ登録部と、
     を更に備える請求項14または15に記載の情報処理装置。
    A communication unit that communicates with a data management device having the storage device;
    A pre-acquisition unit for acquiring in advance header information for restoring the header in the data into a header before compression from the storage device via the communication unit;
    A data registration unit for storing the header information acquired by the pre-acquisition unit in the second storage device;
    The information processing apparatus according to claim 14 or 15, further comprising:
  17.  データ構成符号化部が、テキスト形式のデータに含まれるヘッダに基づいて、前記データが記述する対象が分類されたクラスを識別するクラス識別情報と、前記クラスを特徴づける属性の組み合わせとその順番を規定する属性規定情報との組に対して、前記組を識別するデータ構成識別情報を割り当てるステップと、
     ヘッダ構成符号化部が、前記データに基づいて、前記ヘッダの個々の行に記載された見出しであるインストラクションの組み合わせとその順番を規定するヘッダ構成情報に対して、前記ヘッダ構成情報を識別するヘッダ構成識別情報を割り当てるステップと、
     圧縮データ生成部が、前記データ構成識別情報と前記ヘッダ構成識別情報と前記データに含まれるインスタンスとを含む圧縮データを生成するステップと、
     を有する情報処理方法。
    Based on the header included in the data in the text format, the data structure encoding unit determines the class identification information for identifying the class into which the object to be described by the data is classified, the combination of attributes characterizing the class, and the order thereof. Assigning data configuration identification information for identifying the set to the set with the attribute specifying information to define;
    A header for identifying the header configuration information with respect to the header configuration information that defines a combination of instructions and their order as headings described in individual rows of the header, based on the data, by the header configuration encoding unit Assigning configuration identification information;
    A compressed data generation unit generating compressed data including the data configuration identification information, the header configuration identification information, and an instance included in the data;
    An information processing method comprising:
  18.  テキスト形式のデータに含まれるヘッダに基づいて、前記データが記述する対象が分類されたクラスを識別するクラス識別情報と、前記クラスを特徴づける属性の組み合わせとその順番を規定する属性規定情報との組に対して、前記組を識別するデータ構成識別情報を割り当てるデータ構成符号化部、
     前記データに基づいて、前記ヘッダの個々の行に記載された見出しであるインストラクションの組み合わせとその順番を規定するヘッダ構成情報に対して、前記ヘッダ構成情報を識別するヘッダ構成識別情報を割り当てるヘッダ構成符号化部、
     前記データ構成識別情報と前記ヘッダ構成識別情報と前記データに含まれるインスタンスとを含む圧縮データを生成する圧縮データ生成部、
     として機能させるためのプログラム。
    Based on the header included in the text data, the class identification information for identifying the class into which the object described by the data is classified, and the attribute defining information for defining the combination and order of the attributes characterizing the class A data configuration encoding unit that assigns data configuration identification information for identifying the set to the set,
    A header configuration in which header configuration identification information for identifying the header configuration information is assigned to header configuration information that defines a combination of instructions that are headings described in individual rows of the header and their order based on the data Encoding unit,
    A compressed data generation unit that generates compressed data including the data configuration identification information, the header configuration identification information, and an instance included in the data;
    Program to function as.
  19.  判定部が、テキスト形式のデータに含まれるヘッダに基づいて、前記データのヘッダが圧縮されているか否かを判定するステップと、
     ヘッダ情報取得部が、前記判定部によって前記データのヘッダが圧縮されていると判定された場合、前記データのヘッダからデータ構成識別情報とヘッダ構成識別情報とを抽出し、抽出したヘッダ構成識別情報とデータ構成識別情報のいずれかに関連づけられた情報を含むヘッダ情報を記憶装置から取得するステップと、
     復元部が、前記ヘッダ情報取得部により取得されたヘッダ情報に基づいて、元データを復元するステップと、
     を有し、
     前記記憶装置には、前記データ構成識別情報と前記元データが記述する対象が分類されたクラスを識別するクラス識別情報と前記クラスを特徴づける属性の組み合わせとその順番を規定する前記属性規定情報とが関連付けて記憶され、前記ヘッダ構成識別情報と前記元のヘッダの構成を規定するヘッダ構成情報とが関連付けて記憶されている情報処理方法。
    A step of determining whether the header of the data is compressed based on a header included in the text format data;
    When the header information acquisition unit determines that the header of the data is compressed by the determination unit, the data configuration identification information and the header configuration identification information are extracted from the header of the data, and the extracted header configuration identification information And obtaining from the storage device header information including information associated with any of the data configuration identification information;
    A restoring unit restoring the original data based on the header information acquired by the header information acquiring unit;
    Have
    In the storage device, the data configuration identification information, class identification information for identifying a class in which a target described by the original data is classified, and attribute definition information for defining a combination and order of attributes characterizing the class, Is stored in association with each other, and the header configuration identification information and the header configuration information that defines the configuration of the original header are stored in association with each other.
  20.  テキスト形式のデータに含まれるヘッダに基づいて、前記データのヘッダが圧縮されているか否かを判定する判定部、
     前記判定部によって前記データのヘッダが圧縮されていると判定された場合、前記データのヘッダからデータ構成識別情報とヘッダ構成識別情報とを抽出し、抽出したヘッダ構成識別情報とデータ構成識別情報のいずれかに関連づけられた情報を含むヘッダ情報を記憶装置から取得するヘッダ情報取得部、
     前記ヘッダ情報取得部により取得されたヘッダ情報に基づいて、元データを復元する復元部、
     として機能させるためのプログラムであって、
     前記記憶装置には、前記データ構成識別情報と前記元データが記述する対象が分類されたクラスを識別するクラス識別情報と前記クラスを特徴づける属性の組み合わせとその順番を規定する前記属性規定情報とが関連付けて記憶され、前記ヘッダ構成識別情報と前記元のヘッダの構成を規定するヘッダ構成情報とが関連付けて記憶されているプログラム。
    A determination unit that determines whether or not the header of the data is compressed based on a header included in the data in the text format;
    When it is determined by the determination unit that the header of the data is compressed, the data configuration identification information and the header configuration identification information are extracted from the header of the data, and the extracted header configuration identification information and the data configuration identification information A header information acquisition unit for acquiring header information including information associated with any one from a storage device;
    Based on the header information acquired by the header information acquisition unit, a restoration unit that restores the original data,
    Is a program for functioning as
    In the storage device, the data configuration identification information, class identification information for identifying a class in which a target described by the original data is classified, and attribute definition information for defining a combination and order of attributes characterizing the class, Is stored in association with each other, and the header configuration identification information and the header configuration information that defines the configuration of the original header are stored in association with each other.
PCT/JP2015/074972 2014-09-11 2015-09-02 Information processing device, information processing method, and program WO2016039238A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014-185330 2014-09-11
JP2014185330A JP2016057970A (en) 2014-09-11 2014-09-11 Information processing apparatus, information processing method, and program

Publications (1)

Publication Number Publication Date
WO2016039238A1 true WO2016039238A1 (en) 2016-03-17

Family

ID=55458987

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2015/074972 WO2016039238A1 (en) 2014-09-11 2015-09-02 Information processing device, information processing method, and program

Country Status (2)

Country Link
JP (1) JP2016057970A (en)
WO (1) WO2016039238A1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007114972A (en) * 2005-10-19 2007-05-10 Fujitsu Ltd Data processing method of structured document, data processing program and data processor
JP2009077141A (en) * 2007-09-20 2009-04-09 Nec Corp Data communication system, terminal, catalog server, data communication method and communication program

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007114972A (en) * 2005-10-19 2007-05-10 Fujitsu Ltd Data processing method of structured document, data processing program and data processor
JP2009077141A (en) * 2007-09-20 2009-04-09 Nec Corp Data communication system, terminal, catalog server, data communication method and communication program

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
AKIRA HOSOKAWA: "Development of IEC 62656 Series Standards and Their Applications", TOSHIBA REVIEW, vol. 68, no. 12, 1 December 2013 (2013-12-01), pages 46 - 49, ISSN: 0372-0462 *

Also Published As

Publication number Publication date
JP2016057970A (en) 2016-04-21

Similar Documents

Publication Publication Date Title
CN101288095B (en) Enterprise software system having multidimensional xbrl engine
US7167262B2 (en) Printing system and method
JP6229665B2 (en) Text mining device, text mining system, text mining method and program
JP5755823B1 (en) Similarity calculation system, similarity calculation method, and program
US20170277672A1 (en) Information processing device, information processing method, and computer program product
CN110135888B (en) Product information pushing method, device, computer equipment and storage medium
US7574446B2 (en) Converting arbitrary strings into numeric representations to facilitate complex comparisons
TWI619033B (en) Analysis system and method for performing analysis processing using at least part of time series data and analysis data as input data
JP2019040260A (en) Information processing apparatus and program
CN110602049A (en) Data transmission method, server and storage medium
JP5379372B2 (en) Data compression apparatus, data decompression apparatus, and data compression method
WO2016039238A1 (en) Information processing device, information processing method, and program
CN105450499A (en) Mail behavior feedback method and device
EP3561673B1 (en) Data processing system and method
JP5936892B2 (en) Test data creation system and test data creation device
CN105843812B (en) A kind of data presentation method, apparatus and system
JP2023501093A (en) Customizable delimited text compression framework
JP5718256B2 (en) System performance analysis apparatus, system performance analysis method, and system performance analysis program
US9870185B2 (en) Print manager server, print management method, and storage medium for predictive print preview of print jobs
US9501491B1 (en) File format article of manufacture
JP2005275929A (en) Csv data providing system
KR20220079057A (en) Method for building a resource database of a multimedia conversion content production service providing device
KR20160102843A (en) Webpage service system and method using image code
KR20220079060A (en) Resource database device for document-based video resource matching and multimedia conversion content production
US8840012B2 (en) System and method for acquiring and sharing scheduling data

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15839190

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 15839190

Country of ref document: EP

Kind code of ref document: A1