WO2019244671A1 - 情報処理装置、情報交換システム、情報処理方法および情報処理プログラム - Google Patents

情報処理装置、情報交換システム、情報処理方法および情報処理プログラム Download PDF

Info

Publication number
WO2019244671A1
WO2019244671A1 PCT/JP2019/022723 JP2019022723W WO2019244671A1 WO 2019244671 A1 WO2019244671 A1 WO 2019244671A1 JP 2019022723 W JP2019022723 W JP 2019022723W WO 2019244671 A1 WO2019244671 A1 WO 2019244671A1
Authority
WO
WIPO (PCT)
Prior art keywords
metadata
cluster
unit
tree
information processing
Prior art date
Application number
PCT/JP2019/022723
Other languages
English (en)
French (fr)
Inventor
晶玉 孫
神谷 正人
亨 竹内
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to US17/252,394 priority Critical patent/US20210263969A1/en
Publication of WO2019244671A1 publication Critical patent/WO2019244671A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9027Trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification

Definitions

  • the embodiments of the present invention relate to an information processing device, an information exchange system, an information processing method, and an information processing program.
  • Servers on the cloud collect various types of IoT data, which are transmitted in large quantities and continuously, in a time-series database as it is, while applications generally acquire and utilize the necessary data from them. It is.
  • An object of the present invention is to provide an information processing apparatus, an information exchange system, an information processing method, and an information processing program that enable data required by an application to be efficiently generated.
  • a first aspect of an information processing apparatus extracts a plurality of features from a data group supplied from a device and expresses the plurality of features by a vector.
  • a feature extraction unit that generates a vector group, and performs clustering according to a distance between feature vectors on the feature vector group generated by the feature extraction unit, and converts a cluster group generated by the clustering into a distance between clusters.
  • Layering shaping means for generating a cluster tree hierarchized in accordance with the cluster tree, and, based on the cluster tree generated by the layering shaping means, metadata annotated to a summary summarizing information under each cluster, and Metadata annotation means for generating a metadata tree provided for each
  • a metadata search unit that searches the generated metadata tree for metadata of a cluster that matches the requirements indicated by the application, and provides the metadata obtained by the search to the application. Things.
  • the metadata search unit determines the granularity of the data group from the metadata tree. This is to read out metadata of a cluster located in a corresponding hierarchy.
  • the metadata search means sets the metadata tree to a top level. Searching from the side to the bottom hierarchy side, narrowing down the range of physical quantity recorded in the metadata of each cluster sequentially, and finding and reading the metadata where the corresponding range is recorded It is.
  • the feature extracting unit, the hierarchical shaping unit, or the metadata annotation according to a task indicated by an application.
  • a shaping condition setting means for adjusting parameters used for processing by the means.
  • One aspect of an information processing system includes one or a plurality of first information processing apparatuses that store a data group supplied from a device and a second information processing apparatus that responds to a request from an application.
  • An information exchange system for exchanging information with an apparatus, wherein each of the one or more first information processing apparatuses extracts a plurality of features from a data group supplied from a device, and A feature extraction unit that generates a feature vector group in which the feature is represented by a vector, and performs clustering on the feature vector group generated by the feature extraction unit according to a distance between the feature vectors, and generates a cluster generated by the clustering.
  • Hierarchical shaping means for generating a cluster tree in which groups are hierarchized according to the distance between clusters, and said hierarchical shaping means
  • Metadata annotation means for generating a metadata tree comprising, for each cluster, metadata annotated to a summary summarizing information under each cluster based on the generated cluster tree, and The information processing device according to any one of the one or more first information processing devices, of a metadata tree generated by the metadata annotation unit, of a cluster matching a task indicated by an application.
  • a metadata search means for requesting a search for metadata and providing the metadata obtained by the search to the application is provided.
  • One aspect of an information processing method is to extract a plurality of features from a data group supplied from a device, generate a feature vector group expressing the plurality of features as a vector, and generate the generated feature vector group.
  • the feature vector group is classified into a plurality of clusters according to the distance between the feature vectors, a cluster tree in which the plurality of clusters are hierarchized according to the distance between the clusters is generated, and each cluster is generated based on the generated cluster tree.
  • One aspect of an information processing program according to an embodiment of the present invention is a program used for a computer that operates as a part of the information processing apparatus according to the first aspect, wherein the computer is provided with the feature extracting unit, It is an information processing program for functioning as a shaping unit, the metadata annotation unit, and the metadata search unit.
  • the information processing apparatus According to the first aspect of the information processing apparatus according to the embodiment of the present invention, it is possible to efficiently generate data required by an application.
  • information of each cluster in the corresponding layer can be easily specified from the granularity. There is no need to continue searching for cluster information, and desired information can be easily obtained in a short time.
  • the specified range can be easily found only by performing a search in order from the top hierarchy side based on the metadata tree having a hierarchical structure. After finding, there is no need to continue searching for information of each cluster on the lower floor side of the hierarchy, and desired information can be easily obtained in a short time.
  • the shaping condition setting unit is Since the parameters used for the processing by the feature extracting means, the hierarchical shaping means, or the metadata annotation means are adjusted, it is possible to appropriately cope with the requirements indicated by the application.
  • the feature extracting unit, the hierarchical shaping unit, and the metadata annotation unit are not arranged on the second information processing apparatus side, Since the second information processing device is disposed on the side of the first information processing device, it does not need to receive and process a huge amount of raw data, and only needs to transfer metadata. The load on the processing device can be greatly reduced.
  • FIG. 1 is a diagram illustrating an example of a functional configuration of the information processing apparatus according to the first embodiment of the present invention.
  • FIG. 2 shows the data structure of the raw data group stored in the raw data storage unit in the server, the data structure of the cluster tree stored in the cluster storage unit, and the metadata tree stored in the metadata storage unit.
  • FIG. 4 is a diagram for describing an example of a data structure.
  • FIG. 3A is a diagram illustrating an example of metadata search performed by a metadata search unit on a metadata tree.
  • FIG. 3B is a diagram illustrating an example of metadata search performed by the metadata search unit on the metadata tree.
  • FIG. 4 is a diagram showing various elements related to operations at the time of data shaping and annotation.
  • FIG. 5 is a diagram illustrating an example of a flow of information transmitted and received between various elements related to operations at the time of data shaping and annotation.
  • FIG. 6 is a flowchart illustrating an example of an operation at the time of data shaping and annotation by the feature extracting unit, the hierarchical shaping unit, and the metadata annotation unit.
  • FIG. 7 is a diagram showing various elements related to operations such as metadata search.
  • FIG. 8 is a diagram illustrating an example of a flow of information transmitted and received between various elements related to the operation at the time of metadata search (provided that there is a metadata tree to be searched in the metadata storage unit).
  • FIG. 9 is a diagram illustrating an example of a flow of information transmitted and received between various elements related to the operation at the time of metadata search (provided that there is no metadata tree to be searched in the metadata storage unit).
  • FIG. 10 is a flowchart illustrating an example of an operation at the time of metadata search by the metadata search unit and the like.
  • FIG. 11 is a flowchart showing a specific process of step S46 in FIG.
  • FIG. 12A is a diagram illustrating an example of information stored in a metadata storage unit.
  • FIG. 12B is a diagram illustrating an example of information stored in the metadata storage unit.
  • FIG. 13A is a diagram illustrating an example of a cluster tree in the embodiment (1).
  • FIG. 13B is a diagram illustrating an example of metadata in the embodiment (1).
  • FIG. 14A is a diagram illustrating an example of a histogram of various features according to the embodiment (1).
  • FIG. 14B is a diagram illustrating an example of a graph representing a cluster group in the example (1).
  • FIG. 15 is a diagram illustrating an example of an ontology representing metadata in the embodiment (1).
  • FIG. 16A is a diagram illustrating another example of the cluster tree in the embodiment (1).
  • FIG. 16B is a diagram illustrating another example of metadata in the embodiment (1).
  • FIG. 17A is a diagram illustrating another example of the histogram of various features in the embodiment (1).
  • FIG. 17B is a diagram illustrating another example of the graph representing the cluster group in the example (1).
  • FIG. 18A is a diagram illustrating an example of a cluster tree in the embodiment (2).
  • FIG. 18B is a diagram illustrating an example of metadata in the embodiment (2).
  • FIG. 19A is a diagram illustrating an example of a correlation between various features in the embodiment (2).
  • FIG. 19B is a diagram illustrating an example of a graph representing a cluster group in the example (2).
  • FIG. 20 is a diagram illustrating an example of an ontology representing metadata in the embodiment (2).
  • FIG. 21 is a diagram illustrating an example of a cluster tree in the embodiment (2).
  • FIG. 22A is a diagram illustrating another example of the correlation between various features in the embodiment (2).
  • FIG. 22B is a diagram illustrating another example of the graph indicating the cluster group in the example (2).
  • FIG. 23 is a diagram illustrating an example of a functional configuration of the information exchange system according to the second embodiment of the present invention.
  • FIG. 1 is a diagram illustrating an example of a functional configuration of the information processing apparatus according to the first embodiment of the present invention.
  • the information processing apparatus is implemented as, for example, a server 100 on a cloud that provides a service in response to a request from an application mounted on another information processing apparatus (not shown).
  • the server 100 stores, in a database, sensing data groups supplied from devices such as a plurality of external sensors D1 to Dm (for example, a wind speed sensor, a temperature sensor, a sunshine time sensor, etc.) and externally. Data requested from any of the client side application groups A1 to An can be transmitted to the requesting application.
  • devices such as a plurality of external sensors D1 to Dm (for example, a wind speed sensor, a temperature sensor, a sunshine time sensor, etc.) and externally.
  • Data requested from any of the client side application groups A1 to An can be transmitted to the requesting application.
  • the application groups A1 to An perform, for example, (i) data analysis for each particle size (for example, data analysis for changing the number of classifying wind speed data indicating the wind speed situation to 3, 12,%), (Ii) And (iii) performing compound condition analysis (for example, analyzing the influence on crops according to weather conditions in which wind speed, temperature, and sunshine time are combined), and (iii) searching for condition designation data (for example, "temperature> 34 degrees"). That perform specified data search).
  • data analysis for each particle size for example, data analysis for changing the number of classifying wind speed data indicating the wind speed situation to 3, 12,
  • compound condition analysis for example, analyzing the influence on crops according to weather conditions in which wind speed, temperature, and sunshine time are combined
  • condition designation data for example, "temperature> 34 degrees"
  • the server 100 includes, as various functions, a feature extraction unit 1, a hierarchical shaping unit 2, a metadata annotation unit 3, a metadata search unit 4, a shaping condition setting unit 5, a data storage unit 10, a raw data storage unit 11, It includes a feature vector storage unit 12, a cluster storage unit 13, and a metadata storage unit 14.
  • a processor such as a CPU (Central Processing Unit) that executes a program
  • a storage medium such as a RAM (Random Access Memory) and a ROM (Read Only Memory).
  • the functional configuration shown in FIG. 1 is not limited to this, and may be appropriately modified and implemented.
  • all of the various functions shown in FIG. 1 are not essential elements, and some of them can be omitted.
  • the shaping condition setting unit 5 may not be mounted in an environment where setting of shaping conditions described later is not required.
  • the data storage unit 10 temporarily buffers various sensing data groups (for example, data groups indicating physical quantities such as wind speed, temperature, and daylight hours at a certain location) supplied from the sensors D1 to Dm, and generates the data. It has a function of sending data to the data storage unit 11 side.
  • various sensing data groups for example, data groups indicating physical quantities such as wind speed, temperature, and daylight hours at a certain location
  • the raw data storage unit 11 has a function of sequentially inputting a sensing data group (raw data group) sent from the data storage unit 10, recording the data on a recording medium, and outputting the data to the feature extracting unit 1.
  • the feature extraction unit 1 extracts a plurality of features (for example, the maximum value or average of the wind speed per unit time) from the sensing data group (ie, the raw data group obtained from the raw data storage unit 11) supplied from the sensors D1 to Dm and the like. Values, maximum and average values of temperature per unit time, daylight hours per day, etc.), and a feature vector group (for example, maximum hourly wind speed and hourly wind speed) expressing the plurality of features as vectors. It has a function of generating a feature vector group including information on average values, a feature vector group including information on composite weather (wind speed, temperature, sunshine duration) of the day, a feature vector group including average temperature information on the day, and the like.
  • a plurality of features for example, the maximum value or average of the wind speed per unit time
  • the sensing data group ie, the raw data group obtained from the raw data storage unit 11
  • a feature vector group for example
  • the feature vector storage unit 12 has a function of inputting a feature vector group generated by the feature extraction unit 1, recording the feature vector group on a recording medium, and outputting it to the hierarchical shaping unit 2 side.
  • the hierarchical shaping unit 2 performs clustering according to the distance between the feature vectors on the feature vector group generated by the feature extraction unit 1 (that is, the feature vector group obtained from the feature vector storage unit 12), and performs the clustering.
  • the cluster storage unit 13 has a function of inputting the cluster tree generated by the hierarchical shaping unit 2, recording the cluster tree on a recording medium, and outputting it to the metadata annotation unit 3 side.
  • the metadata annotation unit 3 annotates a summary (synopsis) that summarizes information under each cluster based on the cluster tree generated by the hierarchical shaping unit 2 (that is, the cluster tree obtained from the cluster storage unit 13). It has a function of generating a metadata tree provided with metadata attached to each cluster (for example, createdBefore (comparison of data generation time), better, higher (comparison of data values), etc.).
  • the summary of each cluster includes, for example, information for identifying the cluster (cluster number and the like), characteristics such as maximum value and average value, generation time, number of data, storage location, relative semantics, and the like.
  • the information included in the summary differs depending on the hierarchy.
  • Relative semantics is information indicating a relative relationship with other clusters in the same hierarchy, and is obtained by inference with a predetermined algorithm using various types of information. This relative semantics corresponds to the annotation described above.
  • the metadata storage unit 14 receives the metadata tree generated by the metadata annotation unit 3, records the metadata tree on a recording medium, and, in response to a request from the metadata search unit 4, stores the cluster in the metadata tree. It has a function of outputting metadata to the metadata search unit 4 side.
  • the metadata search unit 4 selects, from the metadata tree generated by the metadata annotation unit 3 (that is, the metadata tree stored in the metadata storage unit 14), a cluster that matches the requirements indicated by the application. It has a function of searching for metadata and providing the metadata obtained by the search to the requesting application.
  • the metadata search unit 4 reads, from the metadata tree, the metadata of the cluster located in the hierarchy corresponding to the granularity.
  • the granularity may be specified in the form of the number of clusters, the hierarchy of clusters, or the distance between clusters.
  • the metadata search unit 4 searches the metadata tree from the uppermost layer to the lowermost layer, and records the metadata tree in the metadata of each cluster. By sequentially narrowing down the range of the physical quantity that exists, metadata in which the corresponding range is recorded is found and read.
  • the shaping condition setting unit 5 includes a feature extracting unit 1, a hierarchical shaping unit 2, or a metadata annotation unit according to the message indicated by the metadata search unit 4 (that is, the message indicated by the requesting application). It has a function to adjust and set the shaping condition of the data group by adjusting the parameter group used in the processing in step 3.
  • the shaping condition setting unit 5 when the shaping condition setting unit 5 needs to adjust the shaping condition of the data in the feature extracting unit 1, the shaping condition setting unit 5 sends the feature extracting parameters (the time interval (segment) of the target data, the span, (TimeSpan), a parameter that specifies an algorithm used for feature extraction, etc.).
  • the feature extracting parameters the time interval (segment) of the target data, the span, (TimeSpan), a parameter that specifies an algorithm used for feature extraction, etc.
  • the shaping condition setting unit 5 sends the hierarchical shaping parameters (the number of clusters, the number of cluster trees, the number of cluster trees, Instruct the setting of parameters such as the distance and the algorithm used for hierarchical shaping.
  • the shaping condition setting unit 5 sends a metadata annotation parameter (annotation category (object of metadata annotation) to the metadata annotation unit 3. ), And a parameter) that specifies an algorithm used for metadata annotation.
  • a metadata annotation parameter annotation category (object of metadata annotation)
  • the raw data storage unit 11, the feature vector storage unit 12, and the cluster storage unit 13 may each be configured to have a function of performing event notification.
  • the raw data storage unit 11, the feature vector storage unit 12, and the cluster storage unit 13 respectively perform An event to that effect is transmitted to the formatting unit 2 and the metadata annotation unit 3.
  • the feature extracting unit 1, the hierarchical shaping unit 2, and the metadata annotation unit 3 each receive information from the raw data storage unit 11, the feature vector storage unit 12, and the cluster storage unit 13 after receiving the event notification. go to.
  • the raw data storage unit 11 the feature vector storage unit 12, and the cluster storage unit 13 have a configuration that does not have an event notification function (for example, a configuration such as a simple RDB (Relational @ Database))
  • the raw data storage unit 11 the raw data storage unit 11
  • the feature vector storage unit 12, and the cluster storage unit 13 periodically retrieve information from the raw data storage unit 11, the feature vector storage unit 12, and the cluster storage unit 13, respectively.
  • FIG. 2 shows the data structure of the raw data group stored in the raw data storage unit 11 in the server 100, the data structure of the cluster tree stored in the cluster storage unit 13, and the metadata structure stored in the metadata storage unit 14.
  • FIG. 4 is a diagram for describing an example of a data structure of a metadata tree.
  • raw data groups are recorded in a chronological order on a predetermined data table.
  • “Device1,...” are arranged as items for identifying devices such as the sensors D1 to Dm. Under “Device1,. ⁇ timeSeries>,... ”is placed. Under each of the above-mentioned “Service1 ⁇ timeSeries>,...”, Individual raw data “Data ⁇ timeSeriesInstance>” acquired at each time is recorded together with time information indicating the acquisition time. These raw data with time information are recorded in the same hierarchy.
  • the cluster storage unit 13 or the metadata storage unit 14 the information of the cluster group hierarchized by shaping is stored in the ⁇ container> resource.
  • various types of information described below are recorded in the form of metadata.
  • an item “Device1,...” Similar to the above is arranged, and “Service1_hierarchy ⁇ Container>,...” Is provided under each of “Device1,. Under each of “Service1_hierarchy ⁇ Container>,...”, An item for identifying a cluster group is arranged in a hierarchical structure including, for example, an uppermost layer L1, an intermediate layer L2, and a lowermost layer L3. . Each item is provided with a container ⁇ container> for storing various information related to the cluster.
  • Cluster0 ⁇ container> For example, “Cluster0 ⁇ container>,...” Is arranged in the uppermost hierarchy L1. In the middle layer L2, for example, “Cluster0-1 ⁇ container>, @ Cluster0-1 ⁇ container>, ##, and “Cluster0-1-1 ⁇ container>, ## and "Cluster0-2-1 ⁇ container>,... ”. For example, “Cluster0-2-1-1 ⁇ container>, Cluster0-2-1-2 ⁇ container>,...” And the like are arranged in the lowest hierarchy L3.
  • ⁇ Statistical values (maximum value, minimum value, average value, etc.) of all data groups are recorded in the container ⁇ container> of the cluster at the top level L1.
  • the statistical value (maximum value, minimum value, average value, etc.) of the data group under the cluster is recorded, and the relative value obtained by inference by a predetermined algorithm is recorded. Semantics are recorded.
  • information on the link destination of the corresponding raw data for example, “Data ⁇ timeSeriesInstance> @ 19: 15” stored in the raw data storage unit 11) is recorded. Is done.
  • (retrieval method) 3A and 3B are diagrams illustrating an example of metadata search performed by the metadata search unit 4 on the metadata tree.
  • FIG. 3A shows an example of a search in a case where an application indicates data granularity or time granularity in an application.
  • a data granularity corresponding to the time granularity is determined, and then a tier corresponding to the data granularity is determined. Further, when the application indicates “data granularity” for performing “data management by granularity”, for example, the tier corresponding to the “data granularity” is determined. If the corresponding hierarchy is, for example, the third level, information such as statistical values stored in the container ⁇ container> of each cluster in the third level is read.
  • the information of each cluster in the corresponding hierarchy can be easily specified from the granularity. There is no need to continue searching for, and desired information can be easily obtained in a short time.
  • FIG. 3B shows an example of a search when the application indicates a temperature range in the business.
  • the metadata tree is searched from the top level to the lowest level and recorded in the container ⁇ container> of each cluster The range of the physical quantity is narrowed down sequentially. If the designated temperature range is “min: 34 (temperature> 34 degrees)”, the search is performed from the uppermost layer to the lowermost layer until “min: 34” is found. If “min: 34” is found, the information of the container ⁇ container> is read.
  • the specified range can be easily found only by performing the search in order from the top hierarchy side. It is not necessary to continue searching for information of a certain cluster, and desired information can be easily obtained in a short time.
  • FIG. 4 is a diagram showing various elements related to operations at the time of data shaping and annotation.
  • various elements related to the operation at the time of data shaping and annotation include sensors D1 to Dm, raw data storage unit 11, feature extraction unit 1, feature vector storage unit 12, hierarchical shaping unit 2, cluster The storage unit 13, the metadata annotation unit 3, and the metadata storage unit 14.
  • FIG. 5 is a diagram showing an example of the flow of information transmitted and received between various elements related to the operation at the time of data shaping and annotation.
  • the raw data storage unit 11 receives a sensing data group (raw data group) from the sensors D1 to Dm and the like.
  • the raw data storage unit 11 stores the transmitted raw data group and transmits the raw data group to the feature extraction unit 1 at regular intervals.
  • the feature extraction unit 1 extracts a feature vector group from the transmitted raw data group, and transmits the extracted feature vector group to the feature vector storage unit 12.
  • the feature vector storage unit 12 stores the transmitted feature vector group and transmits the feature vector group to the hierarchical shaping unit 2.
  • the hierarchical shaping unit 2 performs clustering or the like on the transmitted feature vector group, and transmits the generated cluster group (cluster tree) to the cluster storage unit 13.
  • the cluster storage unit 13 stores the transmitted cluster group and transmits the cluster group to the metadata annotation unit 3.
  • the metadata annotation unit 3 generates an annotation by inference for each cluster based on the transmitted cluster group, and transmits metadata (metadata tree) of the cluster group including the annotation to the metadata storage unit 14.
  • the metadata storage unit 14 stores the transmitted metadata.
  • FIG. 6 is a flowchart showing an example of an operation at the time of data shaping and annotation by the feature extracting unit 1, the hierarchical shaping unit 2, and the metadata annotation unit 3.
  • the feature extraction unit 1 acquires a raw data group (S11).
  • the feature extraction unit 1 divides the data group (time-series data) accumulated in the raw data storage unit 11 for a certain time (T) into n pieces at a specific time interval (Segment) (S12).
  • the feature extraction unit 1 the preset feature extraction algorithm (Algorithm 1), d 1, ..., to one by one extracts the feature value of d n (S13).
  • PAA Principal Aggregate Approximation
  • Statics Statics
  • SAX Symbolic Aggregate Approximation
  • the feature extraction algorithm Algorithm 1
  • SURF Speeded Up Robust Features
  • SIFT Scale-Invariant Feature Transform
  • the feature extraction unit 1 determines whether or not feature extraction has been performed on all of the preset m data types (e.g., corresponding to various features such as temperature, humidity, and daylight hours). (S14). If the feature extraction has not been performed for all (NO in S14), the processing from step S12 is repeated. On the other hand, if the feature extraction has been performed for all of them (YES in S14), a feature vector group is generated by combining the features of a plurality of data corresponding to each time interval (Segment) (S15). In this case, a feature vector group may be generated by adding a predetermined weight to the summary of the measurement time and storage location of the data group and the extracted features. The feature extraction unit 1 stores the generated feature vector group in the feature vector storage unit 12 (S16).
  • the feature vector storage unit 12 stores the generated feature vector group in the feature vector storage unit 12 (S16).
  • the hierarchical shaping unit 2 acquires a feature vector group from the feature vector storage unit 12 (S21).
  • the hierarchical shaping unit 2 performs shaping on the feature vector group (FT) using a shaping algorithm (Algorithm2) set in advance (S22), generates a cluster group (cluster tree), and It is stored in the storage unit 13 (S23).
  • the nearest neighbor method may be applied to the shaping algorithm (Algorithm2).
  • the Ward method may be applied to a distance function that defines the distance between clusters.
  • the metadata annotation unit 3 acquires a cluster group (cluster tree) from the cluster storage unit 13 (S31).
  • the metadata annotation unit 3 assigns a preset category (for example, items such as a maximum value, a minimum value, and an average value) to each node (each cluster of each hierarchy) of the cluster tree which is the shaping result.
  • a preset category for example, items such as a maximum value, a minimum value, and an average value
  • An annotation is made on the metadata “summary (synopsis)” (S32).
  • the metadata annotation unit 3 determines whether or not an annotation has been added to all of the preset X categories, for example (S33). If the annotation has not been made for all of them (NO in S33), the processing from step S32 is repeated. On the other hand, if annotations have been made for all (YES in S33), the annotated metadata group (metadata tree) is stored in the metadata storage unit 14 (S34).
  • FIG. 12A shows an example of a metadata group stored in the metadata storage unit 14.
  • “identification information” (Cluster1, Cluster2, Cluster11, Cluster12, etc Of each cluster and “metadata annotation category” corresponding to each cluster are recorded for each “metadata tree”. Is done.
  • the “metadata annotation category” includes statistical values such as a maximum value, a minimum value, and an average, and a relative concept (corresponding to “relative semantics”).
  • the information in each line is a summary (synopsis 1 , synopsis 2 ,%) Described later.
  • FIG. 7 is a diagram showing various elements related to operations such as metadata search.
  • various elements related to the operation at the time of metadata search are the application groups A1 to An, the metadata search unit 4, and the metadata storage unit 14.
  • the shaping condition setting unit 5 the feature extracting unit 1, the hierarchical shaping unit 2, and the metadata annotation unit 3 are also involved in the operation.
  • FIG. 8 is a diagram showing an example of a flow of information transmitted and received between various elements related to an operation at the time of metadata search (provided that there is a metadata tree to be searched in the metadata storage unit 14).
  • a request is sent to the metadata search unit 4 from one of the application groups A1 to An.
  • the metadata search unit 4 performs a predetermined conversion process on the transmitted request to extract parameters.
  • the metadata search unit 4 transmits the extracted parameters (cluster parameters) to the metadata storage unit 14.
  • the metadata storage unit 14 reads the metadata of the summary (with inferred annotations) of the cluster group corresponding to the cluster parameter.
  • FIG. 9 is a diagram showing an example of the flow of information transmitted and received between various elements related to the operation at the time of metadata search (provided that there is no metadata tree to be searched in the metadata storage unit 14).
  • a request is transmitted to the metadata search unit 4 from one of the application groups A1 to An.
  • the metadata search unit 4 performs a predetermined conversion process on the transmitted request and extracts a parameter.
  • the metadata search unit 4 transmits the extracted parameter to the metadata storage unit 14 but cannot read the metadata of the summary (with inferred annotations) of the cluster group corresponding to the extracted parameter.
  • the setting request for the parameter (the above-described feature extraction parameter, hierarchical shaping parameter, or annotation category parameter) is transmitted to the shaping condition setting unit 5.
  • the shaping condition setting unit 5 transmits the feature extraction parameter to the feature extraction unit 1 when the request for setting the feature extraction parameter is transmitted.
  • the feature extraction unit 1 sets the feature extraction parameter.
  • the shaping condition setting unit 5 transmits the hierarchical shaping parameter to the hierarchical shaping unit 2.
  • the hierarchical shaping unit 2 sets the hierarchical shaping parameter.
  • the shaping condition setting unit 5 transmits the annotation category parameter to the metadata annotation unit 3.
  • the metadata annotation unit 3 sets the metadata annotation parameter.
  • FIG. 10 is a flowchart showing an example of an operation at the time of metadata search by the metadata search unit 4 or the like.
  • the metadata search unit 4 when the metadata search unit 4 receives a message from any application, the metadata search unit 4 converts it into a predetermined parameter group Paras (S41). Thereby, a feature extraction parameter, a hierarchical shaping parameter, and a metadata annotation parameter are obtained.
  • a predetermined parameter group Paras S41
  • the metadata search unit 4 inquires of the metadata storage unit 14 whether there is a metadata tree corresponding to each of the feature extraction parameter, the hierarchical shaping parameter, and the metadata annotation parameter (S42).
  • the metadata search unit 4 stores the corresponding new tree storage unit and tree number in the metadata storage unit 14. Is requested (S43A), and the shaping condition setting unit 5 is requested to set a feature extraction parameter.
  • the shaping condition setting unit 5 instructs the feature extraction unit 1 to set the feature extraction parameter (S51).
  • step S43 even when a response indicating that there is a metadata tree corresponding to the feature extraction parameter is obtained (YES in S43), a response indicating that there is no metadata tree corresponding to the hierarchical shaping parameter is obtained ( (NO in S44), the metadata search unit 4 requests the metadata storage unit 14 to create a new storage unit and a new tree number for the corresponding new tree (S44A), and instructs the shaping condition setting unit 5 to create a hierarchy. Request setting of formatting parameters. When requested to set the hierarchical shaping parameter from the metadata search unit 4, the shaping condition setting unit 5 instructs the hierarchical shaping unit 2 to set the hierarchical shaping parameter (S52).
  • step S44 when a response indicating that there is a metadata tree corresponding to the hierarchical shaping parameter is obtained (YES in S44), a response indicating that there is no metadata tree corresponding to the metadata annotation parameter is obtained. (NO in S45), the metadata search unit 4 requests the shaping condition setting unit 5 to set the annotation category parameter. When requested to set the annotation category parameter from the metadata search unit 4, the shaping condition setting unit 5 instructs the metadata annotation unit 3 to set the annotation category parameter (S53).
  • step S45 if a response indicating that there is a metadata tree corresponding to the metadata annotation parameter is obtained in step S45 (YES in S45), the process proceeds to step S46.
  • step S46 the metadata search unit 4 acquires, from the metadata tree, metadata including a summary (synopsis) of the cluster that matches the requirement indicated by the requesting application, and acquires the metadata together with the set parameter information,
  • the data is written out on the RDF (Resource @ Description @ Framework) format diagram and transmitted to the requesting application. Specifically, the processing of steps S91 to S93 shown in FIG. 11 is performed, and the series of processing ends.
  • the feature extraction unit 1 When the feature extraction unit 1 is instructed by the shaping condition setting unit 5 to set a feature extraction parameter, the feature extraction unit 1 performs the same processing as in steps S11 to S16 (S61). After performing the process of step S61, the shaping condition setting unit 5 instructs the hierarchical shaping unit 2 to set a hierarchical shaping parameter (S52).
  • the hierarchical shaping section 2 When the hierarchical shaping section 2 is instructed to set the hierarchical shaping parameters by the shaping condition setting section 5, the hierarchical shaping section 2 performs the same processing as the above-described steps S21 to S23 (S71). After the processing of step S71 is performed, the shaping condition setting unit 5 instructs the metadata annotation unit 3 to set an annotation category parameter (S53).
  • the metadata annotation unit 3 When the setting of the annotation category parameter is instructed by the shaping condition setting unit 5, the metadata annotation unit 3 performs the same processing as the above-described steps S31 to S34 (S81), and finally passes the annotation result to the application, and Is completed.
  • FIG. 12B shows an example of information recorded in the metadata storage unit 14 when various parameters are set (shaping condition setting) through the metadata search unit 4 and the shaping condition setting unit 5.
  • the shaping record is stored in the metadata storage unit 14 each time a new tree is created.
  • This shaping record includes information for identifying the tree (such as a tree number), feature extraction parameters (such as TimeSpan, time interval (segment), and algorithm (Algorithm) information), and layering formation parameters (algorithm (Algorithm)). Algorithm) information).
  • step S46 in FIG. 10 will be described with reference to FIG.
  • the metadata search unit 4 specifies a parameter group Paras, and from the metadata storage unit 14, summarizes (h) cluster nodes (h) as shown in FIG. 12A (synopsis 1 , synopsis 2 ,..., Synopsis h ). Is acquired (S91).
  • the summary is referred to as RDF (1).
  • the metadata search unit 4 creates an RDF node (the summary is referred to as RDF (2)) for each synopsis, and furthermore, the RDF of the system-initialized portion (the summary is referred to as RDF (0)). (S92).
  • the metadata search unit 4 stores the RDF node of the parameter and the algorithm used at the time of generation of the acquired cluster (the summary is referred to as RDF (3)) by using, for example, a shaped record as shown in FIG. 12B. Create and connect this to RDF (0). Finally, the metadata search unit 4 transmits the metadata to which the RDF (0), RDF (1), RDF (2), and RDF (3) are linked to the requesting application (S93).
  • the shaping condition setting unit 5 determines whether the feature extraction unit 1, the hierarchical shaping unit 2, or the meta data Since the parameters used for the processing in the data annotation unit 3 are adjusted, it is possible to appropriately cope with the requirements indicated by the application.
  • Example (1) Next, an example (1) of the present embodiment will be described with reference to FIGS. 13A to 17B. In the embodiment (1), description will be made by taking “wind speed data” as an example.
  • Raw data is time-series sensing data.
  • one year's worth (about 15,800,000 pieces) of wind speed sensing data acquired every second is handled.
  • the feature extraction unit 1 combines the characteristics of the data of the same quality with “daily (maximum wind speed data in the east-west direction (Max)
  • the requirements of the application 1 are to divide the wind speed into three stages (in this case, for example, the cluster group is cluster1: high, cluster2: medium, cluster3: low) ").
  • the requirement of the application 2 is that the distance between clusters is specified to a predetermined value (the distance between clusters (Ward Distance) is set to, for example, “10”).
  • the cluster group is set to, for example, cluster1 to cluster6. It is necessary to divide into).
  • ⁇ Layer-shaping unit 2 performs hierarchical clustering on the feature vector group generated by feature extracting unit 1, and the result is shown in FIG. 13A. It becomes like a tree.
  • the horizontal axis represents a feature vector group (366 elements), and the vertical axis represents the distance between clusters. 13A, the tree is divided into three clusters (R1, R2, R3).
  • the metadata as shown in FIG. 13B is added by the metadata annotation unit 3 as information of each cluster.
  • Range1, Range2, Range3 indicate regions divided into three. For each area, the number of elements (Element / Count), total distance (Total / Distances), and summary vector (Synopsis / Vector) are recorded. With such information, an annotation may be created for each category in each node of the cluster tree.
  • the distribution of the cluster group divided according to the requirements of the application 1 can be represented as shown in FIGS. 14A and 14B.
  • FIG. 14A is a histogram of each of Average, Max, and Max2.
  • the horizontal axis represents the values of Average, Max, and Max2, respectively
  • the vertical axis represents the respective frequencies.
  • R1, R2, and R3 correspond to cluster groups of Range1, Range2, and Range3, respectively.
  • FIG. 14B is an example of a graph showing the distribution of the cluster group of the three divided regions Range1, 2Range2, 3Range3 on a three-dimensional coordinate system including three axes of Average, Max, and Max2.
  • the four types of graphs are obtained by changing the viewing direction.
  • the application 1 can reproduce graphs as shown in FIGS. 14A and 14B based on the received metadata.
  • the metadata is transmitted to the application 1 by the metadata search unit 4 in the form of RDF.
  • the metadata is transmitted to the application 1.
  • P0, P1, P2, and P3 correspond to the above-described RDF (0), RDF (1), RDF (2), and RDF (3), respectively.
  • $ P0 is the value that has been initialized in the system and stored in the metadata storage unit 14.
  • P1 is obtained from the metadata storage unit 14.
  • P2 is created by the metadata annotation unit 3.
  • P3 is set by the metadata search unit 4 and the shaping condition setting unit 5 and stored in the metadata storage unit 14.
  • the metadata as shown in FIG. 16B is added as information of each cluster by the metadata annotation unit 3.
  • Range1 to Range6 indicate six divided areas. The items to be recorded are the same as those in FIG. 13B.
  • FIG. 17A is a histogram of each of Average, Max, and Max2.
  • R1 to R6 correspond to the cluster group of Range1 to Range6, respectively.
  • FIG. 17B is an example of a graph in which the distribution of the cluster group of the six divided regions Range1 to Range6 is represented on a three-dimensional coordinate system including three axes of Average, Max, and Max2.
  • the four types of graphs are obtained by changing the viewing direction.
  • Example (2) Next, an example (2) of the present embodiment will be described with reference to FIGS. 18A to 22B. In this embodiment (2), an example will be described in which “wind speed data”, “temperature data”, and “sunshine time data” are mixed.
  • Raw data is time-series sensing data.
  • one year's worth of wind speed / temperature sensing data acquired every second and one year's worth of daily sunshine time data are handled.
  • the requirements of the application 3 are to divide the weather situation into two categories (in this case, it is necessary to divide the cluster group into, for example, cluster1 and cluster2).
  • FIG. 18A shows a tree.
  • the horizontal axis represents a feature vector group (360 elements), and the vertical axis represents the distance between clusters.
  • the tree is divided into two clusters (C1, C2) as shown by the broken line in FIG.
  • the metadata as shown in FIG. 18B is added by the metadata annotation unit 3 as information of each cluster.
  • Condition1, .DELTA.Condition2 indicate two divided areas. For each area, the number of elements (Element / Count), total distance (Total / Distances), and summary vector (Synopsis / Vector) are recorded. With such information, an annotation may be created for each category in each node of the cluster tree.
  • FIGS. 19A and 19B The distribution of the cluster group divided according to the requirements of the application 3 can be represented as shown in FIGS. 19A and 19B.
  • FIG. 19A is a correlation diagram of each of the temperature (Temperature), the wind speed (Wind), and the sunshine duration (Sunny).
  • C1 and C2 correspond to the cluster groups of Condition1 and Condition2, respectively.
  • FIG. 19B is an example of a graph in which the distribution of the clusters of the divided regions Condition1 and Condition2 is represented on a three-dimensional coordinate system including three axes of Temperature, Wind, and Sunny.
  • the metadata is transmitted to the application 3 by the metadata search unit 4 in the form of RDF.
  • the metadata is transmitted to the application 3.
  • Q0, Q1, Q2, and Q3 correspond to the above-described RDF (0), RDF (1), RDF (2), and RDF (3), respectively.
  • Q0 is a value that is initialized in the system and stored in the metadata storage unit 14.
  • Q1 is obtained from the metadata storage unit 14.
  • Q2 is created by the metadata annotation unit 3.
  • Q3 is set by the metadata search unit 4 and the shaping condition setting unit 5 and stored in the metadata storage unit 14.
  • FIGS. 22A and 22B The distribution of the cluster group divided according to the requirements of the application 4 can be represented as shown in FIGS. 22A and 22B.
  • FIG. 22A is a correlation diagram of each of the temperature (Temperature), the wind speed (Wind), and the sunshine duration (Sunny).
  • C1 to C12 correspond to the cluster groups of Condition1 to Condition12, respectively.
  • FIG. 22B is an example of a graph in which the distribution of the clusters of the 12 divided regions Condition1 to Condition12 is represented on a three-dimensional coordinate system including three axes of Temperature, Wind, and Sunny.
  • information required by an application is provided by hierarchical data shaping performed on the server side without performing calculations each time a request of various applications using IoT data is made. Will be able to do it. Therefore, the application does not need to receive and process all the IoT data, so that reduction of the processing can be expected. Also, since only data necessary for the application is provided from the server side to the application, communication costs and traffic volume can be significantly reduced. As a result, data can be efficiently and inexpensively provided even in an environment where applications using IoT data and a large number of devices exist in the future.
  • FIG. 23 is a diagram illustrating an example of a functional configuration of the information exchange system according to the second embodiment of the present invention. Note that, in FIG. 23, the same reference numerals are given to elements common to FIG.
  • the information exchange system includes, for example, a cloud server 100-0 on a cloud that provides a service in response to a request from an application mounted on another information processing device (not shown), and sensors D1 to Dm. , And 100 k, which are installed at various places where a group of sensing data supplied from a device group such as the above can be acquired.
  • the cloud server 100-0 and the edge servers 100-1,..., 100k are communicably connected to each other and can exchange information with each other.
  • the feature extraction unit 1, the hierarchical shaping unit 2, and the metadata annotation unit 3 are arranged on the edge servers 100-1,..., 100k, respectively.
  • the metadata search unit 4 and the shaping condition setting unit 5 are installed on the cloud server 100-0 side.
  • the functions and operations of the feature extracting unit 1, the hierarchical shaping unit 2, the metadata annotation unit 3, the metadata searching unit 4, and the shaping condition setting unit 5 are the same as those in the first embodiment.
  • the feature extracting unit 1, the hierarchical shaping unit 2, and the metadata annotation unit 3 are not arranged on the cloud server 100-0 side on the cloud, but are provided on the edge server 100-1. ,..., 100k, the cloud server 100-0 does not need to receive and process an enormous amount of raw data, and only needs to exchange metadata. Therefore, the burden on the cloud server 100-0 side can be significantly reduced, and the load on the cloud layer can be reduced, and the traffic amount (cost) between the edge and the cloud can be reduced.
  • the present invention is not limited to the above-described embodiment, and can be variously modified in an implementation stage without departing from the scope of the invention.
  • the embodiments may be appropriately combined and implemented, and in that case, the combined effects can be obtained.
  • the above-described embodiment includes various inventions, and various inventions can be extracted by combinations selected from a plurality of disclosed constituent elements. For example, even if some components are deleted from all the components shown in the embodiment, if the problem can be solved and an effect can be obtained, a configuration from which the components are deleted can be extracted as an invention.
  • each embodiment can be implemented by a computer (computer) as a program (software means) such as a magnetic disk (floppy (registered trademark) disk, hard disk, etc.), an optical disk (CD-ROM, DVD). , MO, etc.), and a recording medium such as a semiconductor memory (ROM, RAM, flash memory, etc.), and can also be transmitted and distributed via a communication medium.
  • the programs stored on the medium include a setting program for causing the computer to configure software means (including not only an execution program but also a table and a data structure) to be executed in the computer.
  • a computer that realizes the present apparatus reads a program recorded on a recording medium, and in some cases, constructs software means using a setting program, and executes the above-described processing by controlling the operation of the software means.
  • the recording medium referred to in this specification is not limited to a medium for distribution, but includes a storage medium such as a magnetic disk and a semiconductor memory provided in a computer or a device connected via a network.

Abstract

実施形態における情報処理装置は、デバイスから供給されるデータ群から複数の特徴を抽出し、当該複数の特徴をベクトルで表現した特徴ベクトル群を生成する特徴抽出手段と、前記特徴抽出手段により生成された特徴ベクトル群に対し、特徴ベクトル間の距離に応じたクラスタリングを行い、当該クラスタリングにより生成されるクラスター群をクラスター間の距離に応じて階層化したクラスターツリーを生成する階層化整形手段と、前記階層化整形手段により生成されたクラスターツリーに基づき、各クラスターの配下にある情報をまとめた要約に注釈を付したメタデータをクラスター毎に備えるメタデータツリーを生成するメタデータ注釈手段と、前記メタデータ注釈手段により生成されたメタデータツリーの中から、アプリケーションが示す用件に適合するクラスターのメタデータを検索し、当該検索により得られるメタデータを前記アプリケーションに提供するメタデータ検索手段と、を有する。

Description

情報処理装置、情報交換システム、情報処理方法および情報処理プログラム
 本発明の実施形態は、情報処理装置、情報交換システム、情報処理方法および情報処理プログラムに関する。
 近年、IoT(Internet of Things)のネットワーク環境において、様々なセンサ等のデバイスから生成される大量の生データをクラウド上のサーバに収集し、当該データを様々な用件を示すクライアント側のアプリケーションのために活用する技術の開発が進められている。
 クラウド上のサーバは大量かつ連続的に送信される様々な種類のIoTデータをそのまま時系列的にデータベースに収集し、一方、アプリケーションはその中から必要なデータを取得して活用するのが一般的である。
 サーバ側のデータベースに蓄積されるデータの量は膨大である一方で、アプリケーションが求めるデータに対する用件はリアルタイムかつ多様である場合が多い。また、一般にデータの意味(セマンティクス)の解析はアプリケーション側で行われる。
Payam Barnaghi, Friender Ganz, Cory Henson, and Amit Sheth, "Computing Perception from Sensor Data", KNO.E.SIS PUBLICATIONS, October 2012 Atif Alamri, Wasai Shadab Ansari, Mohammad Mehedi Hassan, M. Shamim Hossain, Abdulhameed Alelaiwi, and M. Anwar Hossain, "A Survey on Sensor-Cloud: Architecture, Applications, and Approaches", Hindawi Publishing Corporation, International Journal of Distributed Sensor Networks, Volume 2013 Wu He, Gongjun Yan, and Li Da Xu, "Developing Vehicular Data Cloud Services in the IoT Environment", IEEE Transactions on Industrial Informatics, Vol. 10, No. 2, pp. 1587-1595, May 2014
 各種のアプリケーションが様々なセンサ等のデバイスから生成される生データを利用するためには、大量の生データをサーバ側から取得する必要があり、大きな通信コストやネットワークリソースコストが発生する。例えば、様々なアプリケーションがサーバにアクセスし、それぞれの用件に応じて必要なデータを検索して大量のデータを取り出すと、ネットワークの通信コスト等が膨大になる。また、アプリケーション側では、受け取った生データを用件に合うように加工した後に解析を行うため、アプリケーション側の負荷が大きくなってしまう。
 一方、サーバ側で、生データをアプリケーションが示す用件に合うように加工・解析してからアプリケーションに渡そうとしても、個々のアプリケーションが示す用件がそれぞれ違うため、サーバ側で事前にそのような処理を行うことは現実的に難しい。
 本発明の目的は、アプリケーションが必要とするデータを効率的に生成することを可能にする情報処理装置、情報交換システム、情報処理方法および情報処理プログラムを提供することである。
 上記目的を達成するために、この発明の一実施形態における情報処理装置の第1の態様は、デバイスから供給されるデータ群から複数の特徴を抽出し、当該複数の特徴をベクトルで表現した特徴ベクトル群を生成する特徴抽出手段と、前記特徴抽出手段により生成された特徴ベクトル群に対し、特徴ベクトル間の距離に応じたクラスタリングを行い、当該クラスタリングにより生成されるクラスター群をクラスター間の距離に応じて階層化したクラスターツリーを生成する階層化整形手段と、前記階層化整形手段により生成されたクラスターツリーに基づき、各クラスターの配下にある情報をまとめた要約に注釈を付したメタデータをクラスター毎に備えるメタデータツリーを生成するメタデータ注釈手段と、前記メタデータ注釈手段により生成されたメタデータツリーの中から、アプリケーションが示す用件に適合するクラスターのメタデータを検索し、当該検索により得られるメタデータを前記アプリケーションに提供するメタデータ検索手段と、を備えるようにしたものである。
 この発明の情報処理装置の第2の態様は、第1の態様において、前記メタデータ検索手段は、アプリケーションが用件としてデータ群の粒度を示す場合、前記メタデータツリーの中から、当該粒度に応じた階層に位置するクラスターのメタデータを読み出すようにしたものである。
 この発明の情報処理装置の第3の態様は、第1の態様において、前記メタデータ検索手段は、アプリケーションが用件としてデータ群のある物理量の範囲を指定する場合、前記メタデータツリーを最上階層側から最下階層側へ向けて探索し、各クラスターのメタデータに記録されている物理量の範囲を順次絞り込んでいくことにより該当する範囲が記録されているメタデータを見つけて読み出すようにしたものである。
 この発明の情報処理装置の第4の態様は、第1乃至第3のいずれかの態様において、アプリケーションが示す用件に応じて、前記特徴抽出手段、前記階層化整形手段、または前記メタデータ注釈手段での処理に使用されるパラメータを調整する整形条件設定手段をさらに備えるようにしたものである。
 この発明の一実施形態における情報処理システムの一つの態様は、デバイスから供給されるデータ群を格納する1つまたは複数の第1の情報処理装置と、アプリケーションからの要求に応じる第2の情報処理装置との間で情報を交換する情報交換システムであって、前記1つまたは複数の第1の情報処理装置の各々は、デバイスから供給されるデータ群から複数の特徴を抽出し、当該複数の特徴をベクトルで表現した特徴ベクトル群を生成する特徴抽出手段と、前記特徴抽出手段により生成された特徴ベクトル群に対し、特徴ベクトル間の距離に応じたクラスタリングを行い、当該クラスタリングにより生成されるクラスター群をクラスター間の距離に応じて階層化したクラスターツリーを生成する階層化整形手段と、前記階層化整形手段により生成されたクラスターツリーに基づき、各クラスターの配下にある情報をまとめた要約に注釈を付したメタデータをクラスター毎に備えるメタデータツリーを生成するメタデータ注釈手段と、を備え、前記第2の情報処理装置は、前記1つまたは複数の第1の情報処理装置のいずれかに対し、前記メタデータ注釈手段により生成されたメタデータツリーの中から、アプリケーションが示す用件に適合するクラスターのメタデータを検索することを要求し、当該検索により得られるメタデータを前記アプリケーションに提供するメタデータ検索手段を備えるようにしたものである。
 この発明の一実施形態における情報処理方法の一つの態様は、デバイスから供給されるデータ群から複数の特徴を抽出し、当該複数の特徴をベクトルで表現した特徴ベクトル群を生成し、前記生成した特徴ベクトル群を特徴ベクトル間の距離に応じて複数のクラスターに分類し、当該複数のクラスターをクラスター間の距離に応じて階層化したクラスターツリーを生成し、前記生成したクラスターツリーに基づき、各クラスターの配下にある情報をまとめた要約に注釈を付したメタデータをクラスター毎に備えるメタデータツリーを生成し、前記生成したメタデータツリーの中から、アプリケーションが示す用件に適合するクラスターのメタデータを検索し、当該検索により得られるメタデータを前記アプリケーションに提供する、ことを含むようにしたものである。
 この発明の一実施形態における情報処理プログラムの一つの態様は、第1の態様における情報処理装置の一部分として動作するコンピュータに用いられるプログラムであって、前記コンピュータを、前記特徴抽出手段、前記階層化整形手段、前記メタデータ注釈手段、および前記メタデータ検索手段として機能させるための情報処理プログラムとしたものである。
 この発明の一実施形態における情報処理装置の第1の態様によれば、アプリケーションが必要とするデータを効率的に生成することを可能になる。
 この発明の一実施形態における情報処理装置の第2の態様によれば、粒度から対応する階層にある各クラスターの情報を簡単に特定することができるため、特定したあとにその他の階層にある各クラスターの情報について検索を続ける必要がなく、目的の情報を短時間で容易に得ることができる。
 この発明の一実施形態における情報処理装置の第3の態様によれば、階層構造を成すメタデータツリーに基づき、最上階層側から順に探索を行うだけで簡単に指定の範囲を見つけることができるため、見つけたあとに当該階層よりも下層階側にある各クラスターの情報について検索を続ける必要がなく、目的の情報を短時間で容易に得ることができる。
 この発明の一実施形態における情報処理装置の第4の態様によれば、アプリケーションの用件に示されるパラメータの設定に対応するメタデータがメタデータ格納部に無い場合には、整形条件設定手段が特徴抽出手段、階層化整形手段、もしくはメタデータ注釈手段での処理に使用されるパラメータを調整するので、アプリケーションが示す用件に適切に対応することができる。
 この発明の一実施形態における情報処理システムの一つの態様によれば、特徴抽出手段、階層化整形手段、およびメタデータ注釈手段が、第2の情報処理装置側に配置されるのではなく、第1の情報処理装置側に配置されるため、第2の情報処理装置は膨大な量の生データを受信して処理する必要がなく、メタデータの受け渡しを行う程度で済むため、第2の情報処理装置の負担を大幅に軽減することができる。
図1は、本発明の第1の実施形態に係る情報処理装置の機能構成の一例を示す図である。 図2は、サーバ内の生データ格納部に格納される生データ群のデータ構造、並びに、クラスター格納部に格納されるクラスターツリーのデータ構造、およびメタデータ格納部に格納されるメタデータツリーのデータ構造の例を説明するための図である。 図3Aは、メタデータ検索部がメタデータツリーに対して行うメタデータ検索の例を示す図である。 図3Bは、メタデータ検索部がメタデータツリーに対して行うメタデータ検索の例を示す図である。 図4は、データ整形・注釈時の動作に関わる各種要素を示す図である。 図5は、データ整形・注釈時の動作に関わる各種要素の間で送受される情報の流れの一例を示す図である。 図6は、特徴抽出部、階層化整形部、およびメタデータ注釈部によるデータ整形・注釈時の動作の一例を示すフローチャートである。 図7は、メタデータ検索等の動作に関わる各種要素を示す図である。 図8は、メタデータ検索時の動作に関わる各種要素の間で送受される情報の流れ(但し、メタデータ格納部に検索対象のメタデータツリーがある場合)の一例を示す図である。 図9は、メタデータ検索時の動作に関わる各種要素の間で送受される情報の流れ(但し、メタデータ格納部に検索対象のメタデータツリーが無い場合)の一例を示す図である。 図10は、メタデータ検索部等によるメタデータ検索時の動作の一例を示すフローチャートである。 図11は、図10のステップS46の具体的な処理を示すフローチャートである。 図12Aは、メタデータ格納部に格納される情報の例を示す図である。 図12Bは、メタデータ格納部に格納される情報の例を示す図である。 図13Aは、実施例(1)におけるクラスターツリーの一例を示す図である。 図13Bは、実施例(1)におけるメタデータの一例を示す図である。 図14Aは、実施例(1)における各種の特徴のヒストグラムの一例を示す図である。 図14Bは、実施例(1)におけるクラスター群を表すグラフの一例を示す図である。 図15は、実施例(1)におけるメタデータを表すオントロジーの一例を示す図である。 図16Aは、実施例(1)におけるクラスターツリーの別の例を示す図である。 図16Bは、実施例(1)におけるメタデータの別の例を示す図である。 図17Aは、実施例(1)における各種の特徴のヒストグラムの別の例を示す図である。 図17Bは、実施例(1)におけるクラスター群を表すグラフの別の例を示す図である。 図18Aは、実施例(2)におけるクラスターツリーの一例を示す図である。 図18Bは、実施例(2)におけるメタデータの一例を示す図である。 図19Aは、実施例(2)における各種特徴の相関関係の一例を示す図である。 図19Bは、実施例(2)におけるクラスター群を表すグラフの一例を示す図である。 図20は、実施例(2)におけるメタデータを表すオントロジーの一例を示す図である。 図21は、実施例(2)におけるクラスターツリーの一例を示す図である。 図22Aは、実施例(2)における各種特徴の相関関係の別の例を示す図である。 図22Bは、実施例(2)におけるクラスター群を表すグラフの別の例を示す図である。 図23は、本発明の第2の実施形態に係る情報交換システムの機能構成の一例を示す図である。
 以下、この発明に係わる実施形態を説明する。
 [第1の実施形態]
 まず、本発明の第1の実施形態について説明する。
 (構成)
 図1は、本発明の第1の実施形態に係る情報処理装置の機能構成の一例を示す図である。
 本実施形態に係る情報処理装置は、例えば他の情報処理装置(図示せず)に搭載されたアプリケーションからの要求に応じてサービスを提供するクラウド上のサーバ100として実現される。
 サーバ100は、例えば、外部にある複数のセンサD1~Dm等(例えば、風速センサ、気温センサ、日照時間センサ等)のデバイス群から供給されるセンシングデータ群をデータベースに格納すると共に、外部にあるクライアント側のアプリケーション群A1~Anのいずれかから要求されるデータを要求元のアプリケーションへ送信することができる。
 アプリケーション群A1~Anは、例えば、(i)粒度別のデータ分析(例えば、風速状況を示す風速データを分類する数を3、12、・・・と変化させるデータ分析)を行うもの、(ii)複合条件分析(例えば、風速、気温、日照時間を複合させた気象状況に応じた農作物への影響の分析)を行うもの、(iii)条件指定データ検索(例えば、「気温>34度」を指定するデータ検索)等を行うもの、等を含む。
 上記サーバ100は、各種の機能として、特徴抽出部1、階層化整形部2、メタデータ注釈部3、メタデータ検索部4、整形条件設定部5、データ保存部10、生データ格納部11、特徴ベクトル格納部12、クラスター格納部13、およびメタデータ格納部14を備える。これらの機能は、プログラムを実行するCPU(Central Processing Unit)等のプロセッサ、およびRAM(Random Access Memory)やROM(Read Only Memory)等の記憶媒体を用いて実現される。
 なお、図1に示される機能構成は、これに限定されるものではなく、適宜変形して実施してもよい。また、図1に示される各種の機能は、全部が必須の要素というわけではなく、その一部を省略することが可能である。例えば整形条件設定部5は、後述する整形条件の設定を必要としない環境においては搭載しなくてもよい。
 データ保存部10は、センサD1~Dm等から供給される各種のセンシングデータ群(例えば、ある場所における風速や気温、日照時間などの物理量を示すデータ群)を一時的にバッファリングしてから生データ格納部11側へ送り出す機能を有する。
 生データ格納部11は、データ保存部10から送られてくるセンシングデータ群(生データ群)を順次入力し、記録媒体に記録し、特徴抽出部1側へ出力する機能を有する。
 特徴抽出部1は、センサD1~Dm等から供給されたセンシングデータ群(即ち、生データ格納部11から得られる生データ群)から複数の特徴(例えば、単位時間ごとの風速の最大値や平均値、単位時間ごとの気温の最大値や平均値、1日ごとの日照時間など)を抽出し、当該複数の特徴をベクトルで表現した特徴ベクトル群(例えば、1時間毎の風速の最大値と平均値の情報を含む特徴ベクトル群、当日の複合気象(風速、気温、日照時間)の情報を含む特徴ベクトル群、当日の平均気温の情報を含む特徴ベクトル群など)を生成する機能を有する。
 特徴ベクトル格納部12は、特徴抽出部1が生成した特徴ベクトル群を入力し、記録媒体に記録し、階層化整形部2側へ出力する機能を有する。
 階層化整形部2は、特徴抽出部1により生成された特徴ベクトル群(即ち、特徴ベクトル格納部12から得られる特徴ベクトル群)に対し、特徴ベクトル間の距離に応じたクラスタリングを行い、当該クラスタリングにより生成されるクラスター群をクラスター間の距離に応じて階層化したクラスターツリーを生成する機能を有する。
 クラスター格納部13は、階層化整形部2により生成されたクラスターツリーを入力し、記録媒体に記録し、メタデータ注釈部3側へ出力する機能を有する。
 メタデータ注釈部3は、階層化整形部2により生成されたクラスターツリー(即ち、クラスター格納部13から得られるクラスターツリー)に基づき、各クラスターの配下にある情報をまとめた要約(synopsis)に注釈(例えば、createdBefore(データの生成時間の比較), better, higher(データの値の比較)等)を付したメタデータをクラスター毎に備えるメタデータツリーを生成する機能を有する。
 各クラスターの要約の中には、例えば、当該クラスターを識別する情報(クラスターの番号など)、最大値、平均値などの特徴、生成時間、データ個数、保存場所、相対セマンティクス等が含まれる。但し、要約に含まれる情報は、階層によって異なる。相対セマンティクスは、同じ階層にある他のクラスターとの相対的な関係を示す情報であり、各種の情報を用いて所定のアルゴリズムにより推論して得られる。この相対セマンティクスは、上述の注釈に相当する。
 メタデータ格納部14は、メタデータ注釈部3により生成されたメタデータツリーを入力し、記録媒体に記録すると共に、メタデータ検索部4からの要求に応じて当該メタデータツリーの中のクラスターのメタデータをメタデータ検索部4側へ出力する機能を有する。
 メタデータ検索部4は、メタデータ注釈部3により生成されたメタデータツリー(即ち、メタデータ格納部14に格納されているメタデータツリー)の中から、アプリケーションが示す用件に適合するクラスターのメタデータを検索し、当該検索により得られるメタデータを要求元のアプリケーションに提供する機能を有する。
 例えば、メタデータ検索部4は、アプリケーションがデータ群の粒度を指定する場合、メタデータツリーの中から、当該粒度に応じた階層に位置するクラスターのメタデータを読み出す。なお、粒度は、クラスターの個数、クラスターの階層、もしくはクラスター間の距離の形で指定される場合がある。
 また、メタデータ検索部4は、アプリケーションがデータ群のある物理量の範囲を指定する場合、メタデータツリーを最上階層側から最下階層側へ向けて探索し、各クラスターのメタデータに記録されている物理量の範囲を順次絞り込んでいくことにより該当する範囲が記録されているメタデータを見つけて読み出す。
 整形条件設定部5は、メタデータ検索部4から示される用件(即ち、要求元のアプリケーションが示した用件)に応じて、特徴抽出部1、階層化整形部2、もしくはメタデータ注釈部3での処理に使用されるパラメータ群を調整することで、データ群の整形条件を設定変更する機能を有する。
 例えば、整形条件設定部5は、特徴抽出部1におけるデータの整形条件を調整する必要がある場合に、特徴抽出部1に対し、特徴抽出パラメータ(対象となるデータの時間間隔(segment)、スパン(TimeSpan)、特徴抽出に使用するアルゴリズム等を指定するパラメータ)の設定を指示する。
 また、整形条件設定部5は、階層化整形部2におけるデータの整形条件を調整する必要がある場合に、階層化整形部2に対し、階層化整形パラメータ(クラスター数、クラスターツリー階数、クラスター間距離、階層化整形に使用するアルゴリズム等を指定するパラメータ)の設定を指示する。
 また、整形条件設定部5は、メタデータ注釈部3におけるデータの整形条件を調整する必要がある場合に、メタデータ注釈部3に対し、メタデータ注釈パラメータ(注釈カテゴリー(メタデータ注釈の対象となる項目)、メタデータ注釈に使用するアルゴリズム等を指定するパラメータ)の設定を指示する。
 なお、生データ格納部11、特徴ベクトル格納部12、クラスター格納部13は、それぞれ、イベント通知を行う機能を有するように構成してもよい。その場合、生データ格納部11、特徴ベクトル格納部12、クラスター格納部13は、それぞれ、新たな情報が届いた(新たな情報を入力して格納した)際には、特徴抽出部1、階層化整形部2、メタデータ注釈部3に対してその旨を示すイベントを送信する。また、特徴抽出部1、階層化整形部2、メタデータ注釈部3は、それぞれ、イベントの通知を受けてから、生データ格納部11、特徴ベクトル格納部12、クラスター格納部13から情報を取りにいく。
 一方、生データ格納部11、特徴ベクトル格納部12、クラスター格納部13が、イベント通知機能を有さない構成(例えば、単なるRDB(Relational Database)等の構成)の場合は、生データ格納部11、特徴ベクトル格納部12、クラスター格納部13は、それぞれ、定期的に、生データ格納部11、特徴ベクトル格納部12、クラスター格納部13から情報を取りにいく。
 (データ構造)
 図2は、サーバ100内の生データ格納部11に格納される生データ群のデータ構造、並びに、クラスター格納部13に格納されるクラスターツリーのデータ構造、およびメタデータ格納部14に格納されるメタデータツリーのデータ構造の例を説明するための図である。
 生データ格納部11においては、所定のデータテーブル上に、生データ群が時系列の順に記録される。
 例えばセンサD1~Dm等のデバイスをそれぞれ識別する項目として「Device1,…」が配置され、「Device1,…」のそれぞれの配下には、例えばデバイスに関わるサービスもしくはデータの種別を示す項目として「Service1<timeSeries>,…」が配置される。そして、上記「Service1<timeSeries>,…」のそれぞれの配下には、各時点で取得された個々の生データ「Data<timeSeriesInstance>」が取得時刻を示す時刻情報と共に記録される。これら時刻情報付きの生データは、同じ階層に記録される。
 一方、クラスター格納部13もしくはメタデータ格納部14においては、整形により階層化されたクラスター群の情報がそれぞれ<container>リソースに保存される。なお、メタデータ格納部14においては、後述する各種の情報がメタデータの形態で記録される。
 例えば、上記と同様の項目「Device1,…」が配置され、「Device1,…」のそれぞれの配下には、例えばデバイスに関わるサービスもしくはデータの種別を示す項目として「Service1_hierarchy<Container>,…」が配置され、「Service1_hierarchy<Container>,…」のそれぞれの配下には、クラスター群をそれぞれ識別する項目が、例えば最上階層L1、中間層L2、最下階層L3からなる階層構造の形で配置される。そして、各項目には、クラスターに関する各種の情報を保存するためのコンテナ<container>が設けられる。
 最上階層L1には、例えば「Cluster0<container>,…」が配置される。中間階層L2には、例えば「Cluster0-1<container>, Cluster0-1<container>,…」や、これらの下の「Cluster0-1-1<container>,…」や「Cluster0-2-1<container>,…」等が配置される。最下階層L3には、例えば「Cluster0-2-1-1<container>, Cluster0-2-1-2<container>,…」等が配置される。
 最上階層L1のクラスターのコンテナ<container>には、すべてのデータ群の統計値(最大値、最小値、平均値など)が記録される。中間階層L2のクラスターのコンテナ<container>には、当該クラスターの配下のデータ群の統計値(最大値、最小値、平均値など)が記録されると共に、所定のアルゴリズムにより推論して得られる相対セマンティクスが記録される。また、最下階層のクラスターのコンテナ<container>には、対応する生データ(例えば、生データ格納部11に格納されている「Data<timeSeriesInstance> 19:15」)のリンク先の情報などが記録される。
 (検索方法)
 図3A及び図3Bは、メタデータ検索部4がメタデータツリーに対して行うメタデータ検索の例を示す図である。
 図3Aは、アプリケーションが用件においてデータの粒度もしくは時間の粒度を示す場合の検索の例を示している。
 アプリケーションが例えば「統計グラフ作成」を行うために「時間の粒度」を示した場合は、当該時間粒度に相当するデータ粒度を決定した上で、このデータ粒度に対応する階層を決定する。また、アプリケーションが例えば「粒度別のデータ管理」を行うために「データの粒度」を示した場合は、その「データの粒度」に対応する階層を決定する。対応する階層が例えば3段目であれば、3段目の階層にある各クラスターのコンテナ<container>に保管されている統計値等の情報を読み取る。
 図3Aの例では、階層構造を成すメタデータツリーに基づき、粒度から対応する階層にある各クラスターの情報を簡単に特定することができるため、特定したあとにその他の階層にある各クラスターの情報について検索を続ける必要がなく、目的の情報を短時間で容易に得ることができる。
 図3Bは、アプリケーションが用件において温度範囲を示す場合の検索の一例を示している。
 アプリケーションが例えば「条件指定検索」を行うために「気温の範囲」を指定した場合は、メタデータツリーを最上階層側から最下階層側へ向けて探索し、各クラスターのコンテナ<container>に記録されている物理量の範囲を順次絞り込んでいく。指定された気温の範囲が「min:34(気温>34度)」であれば、最上階層側から最下階層側へ向けて「min:34」が見つかるまで探索する。「min:34」が見つかれば、当該コンテナ<container>の情報を読み取る。
 図3Bの例では、階層構造を成すメタデータツリーに基づき、最上階層側から順に探索を行うだけで簡単に指定の範囲を見つけることができるため、見つけたあとに当該階層よりも下層階側にある各クラスターの情報について検索を続ける必要がなく、目的の情報を短時間で容易に得ることができる。
 (動作)
 次に、図4乃至図11を参照して、サーバ100の動作について説明する。また、動作の説明に際し、図12A及び図12Bも適宜参照し、メタデータ格納部14に格納される情報の例についても併せて説明する。
 (データ整形・注釈時の動作)
 最初に、図4乃至図6を参照して、データ整形・注釈時の動作の一例について説明する。
 図4は、データ整形・注釈時の動作に関わる各種要素を示す図である。
 図4に示されるように、データ整形・注釈時の動作に関わる各種要素は、センサD1~Dm、生データ格納部11、特徴抽出部1、特徴ベクトル格納部12、階層化整形部2、クラスター格納部13、メタデータ注釈部3、およびメタデータ格納部14である。
 図5は、データ整形・注釈時の動作に関わる各種要素の間で送受される情報の流れの一例を示す図である。
 図5に示されるように、生データ格納部11には、センサD1~Dm等からセンシングデータ群(生データ群)が送信されてくる。
 生データ格納部11は、送信されてきた生データ群を格納すると共に、一定時間ごとに生データ群を特徴抽出部1へ送信する。
 特徴抽出部1は、送信されてきた生データ群から特徴ベクトル群を抽出し、特徴ベクトル格納部12へ送信する。特徴ベクトル格納部12は、送信されてきた特徴ベクトル群を格納すると共に、特徴ベクトル群を階層化整形部2へ送信する。階層化整形部2は、送信されてきた特徴ベクトル群に対してクラスタリング等を行い、生成されるクラスター群(クラスターツリー)をクラスター格納部13へ送信する。クラスター格納部13は、送信されてきたクラスター群を格納すると共に、当該クラスター群をメタデータ注釈部3へ送信する。メタデータ注釈部3は、送信されてきたクラスター群に基づき、クラスターごとに推論による注釈を生成し、注釈を含むクラスター群のメタデータ(メタデータツリー)をメタデータ格納部14へ送信する。メタデータ格納部14は、送信されてきたメタデータを格納する。
 図6は、特徴抽出部1、階層化整形部2、およびメタデータ注釈部3によるデータ整形・注釈時の動作の一例を示すフローチャートである。
 図6に示されるように、特徴抽出部1は、生データ群を取得する(S11)。
 ここで、特徴抽出部1は、生データ格納部11で一定時間(T)溜まったデータ群(時系列データ)を、特定の時間間隔(Segment)でn個に分割する(S12)。
 次に、特徴抽出部1は、予め設定された特徴抽出アルゴリズム(Algorithm1)により、d,…,dの特徴値を逐一抽出する(S13)。
 特徴抽出アルゴリズム(Algorithm1)には、例えばPAA(Piecewise Aggregate Approximation)、Statics、SAX(Symbolic Aggregate Approximation)等を適用してもよい。また、特徴抽出対象が画像(例えばイメージセンサー等から送られてきた画像)である場合には、SURF(Speeded Up Robust Features)やSIFT(Scale-Invariant Feature Transform)等を用いるアルゴリズムを適用してもよい。
 次に、特徴抽出部1は、予め設定された例えばm個のデータ種類(例えば、温度、湿度、日照時間などの各種特徴に相当)の全部に対して特徴抽出を行ったか否かを判定する(S14)。全部に対して特徴抽出を行っていなければ(S14のNO)、ステップS12からの処理を繰り返す。一方、全部に対して特徴抽出を行っていれば(S14のYES)、各時間間隔(Segment)に対応する複数のデータの特徴を組み合わせて特徴ベクトル群を生成する(S15)。なお、その際にはデータ群の計測時間、保存場所等の要約と抽出した特徴に所定の重みを付けて特徴ベクトル群を生成するようにしてもよい。特徴抽出部1は、生成した特徴ベクトル群を特徴ベクトル格納部12に格納する(S16)。
 階層化整形部2は、特徴ベクトル格納部12から特徴ベクトル群を取得する(S21)。
 ここで、階層化整形部2は、予め設定された整形アルゴリズム(Algorithm2)を用いて、特徴ベクトル群(FT)に対して整形を行い(S22)、クラスター群(クラスターツリー)を生成し、クラスター格納部13に格納する(S23)。
 整形アルゴリズム(Algorithm2)には、例えば、最近傍法(Nearest Neighbor Chain)を適用してもよい。その際、ウォード法(Ward method)をクラスター間の距離を定義する距離関数に適用してもよい。
 メタデータ注釈部3は、クラスター格納部13からクラスター群(クラスターツリー)を取得する(S31)。
 ここで、メタデータ注釈部3は、整形結果であるクラスターツリーの各ノード(各階層の各クラスター)に対し、予め設定されているカテゴリー(例えば、最大値、最小値、平均値などの項目)のメタデータ「要約(synopsis)」に対して注釈を行う(S32)。
 次に、メタデータ注釈部3は、予め設定されている例えばX個のカテゴリーの全部について注釈を付したか否かを判定する(S33)。全部について注釈を行っていなければ(S33のNO)、ステップS32からの処理を繰り返す。一方、全部について注釈を行っていれば(S33のYES)、注釈したメタデータ群(メタデータツリー)をメタデータ格納部14に格納する(S34)。
 ここで、図12Aに、メタデータ格納部14に格納されるメタデータ群の一例を示す。
 メタデータ格納部14には、「メタデータツリー」ごとに、各クラスターの「識別情報」(Cluster1, Cluster2, Cluster11, Cluster12,…)と、各クラスターに対応する「メタデータ注釈カテゴリー」とが記録される。「メタデータ注釈カテゴリー」には、最大値、最小値、平均などの統計値や、相対Concept(「相対セマンティクス」に相当)などが含まれる。各行の情報は、それぞれ、後述する要約(synopsis, synopsis,…)となる。
 (メタデータ検索時の動作)
 次に、図7乃至図11を参照して、メタデータ検索時の動作の一例について説明する。
 図7は、メタデータ検索等の動作に関わる各種要素を示す図である。
 図7に示されるように、メタデータ検索時の動作に関わる各種要素は、アプリケーション群A1~An、メタデータ検索部4、およびメタデータ格納部14である。なお、整形条件設定を要する場合は、さらに、整形条件設定部5、特徴抽出部1、階層化整形部2、メタデータ注釈部3も当該動作に関わる。
 図8は、メタデータ検索時の動作に関わる各種要素の間で送受される情報の流れ(但し、メタデータ格納部14に検索対象のメタデータツリーがある場合)の一例を示す図である。
 図8に示されるように、メタデータ検索部4には、アプリケーション群A1~Anのいずれかから要求(リクエスト)が送信されてくる。
 メタデータ検索部4は、送信されてきたリクエストに対して所定の変換処理を施し、パラメータを抽出する。
 次に、メタデータ検索部4は、抽出したパラメータ(クラスターパラメータ)をメタデータ格納部14へ送信する。
 これにより、メタデータ格納部14は、当該クラスターパラメータに対応するクラスター群の要約(推論した注釈あり)のメタデータを読み出す。
 メタデータ検索部4から読み出されたクラスター群の要約(推論した注釈あり)のメタデータを取得し、要求元のアプリケーションに送信する。
 図9は、メタデータ検索時の動作に関わる各種要素の間で送受される情報の流れ(但し、メタデータ格納部14に検索対象のメタデータツリーが無い場合)の一例を示す図である。
 図9に示されるように、メタデータ検索部4には、アプリケーション群A1~Anのいずれかから要求(リクエスト)が送信されてくる。
 メタデータ検索部4は、送信されてきたリクエストに対して所定の変換処理を施し、パラメータを抽出する。
 次に、メタデータ検索部4は、抽出したパラメータをメタデータ格納部14へ送信しても、当該パラメータに対応するクラスター群の要約(推論した注釈あり)のメタデータを読み出せない場合には、当該パラメータ(前述の特徴抽出パラメータ、階層化整形パラメータ、もしくは注釈カテゴリーパラメータ)の設定要求を整形条件設定部5へ送信する。
 整形条件設定部5は、特徴抽出パラメータの設定要求が送信されてきた場合、特徴抽出部1へ特徴抽出パラメータを送信する。
 特徴抽出部1は、特徴抽出パラメータが送信されてきた場合、当該特徴抽出パラメータの設定を実施する。
 また、整形条件設定部5は、階層化整形パラメータの設定要求が送信されてきた場合、階層化整形部2へ階層化整形パラメータを送信する。
 階層化整形部2は、階層化整形パラメータが送信されてきた場合、当該階層化整形パラメータの設定を実施する。
 また、整形条件設定部5は、注釈カテゴリーパラメータの設定要求が送信されてきた場合、メタデータ注釈部3へ注釈カテゴリーパラメータを送信する。
 メタデータ注釈部3は、メタデータ注釈パラメータが送信されてきた場合、当該メタデータ注釈パラメータの設定を実施する。
 図10は、メタデータ検索部4等によるメタデータ検索時の動作の一例を示すフローチャートである。
 図10に示されるように、メタデータ検索部4は、いずれかのアプリケーションからの用件を受け取ると、所定のパラメータ群Parasへの変換を行う(S41)。これにより、特徴抽出パラメータ、階層化整形パラメータ、メタデータ注釈パラメータが得られる。
 次に、メタデータ検索部4は、メタデータ格納部14に対し、特徴抽出パラメータ、階層化整形パラメータ、メタデータ注釈パラメータのそれぞれに対応するメタデータツリーがあるか否かを問い合わせる(S42)。
 特徴抽出パラメータに対応するメタデータツリーが無いとの応答を得た場合(S43のNO)、メタデータ検索部4は、メタデータ格納部14に対し、対応する新たなツリーの収納部およびツリー番号の新規作成を要求し(S43A)、整形条件設定部5に対し、特徴抽出パラメータの設定を要求する。整形条件設定部5は、メタデータ検索部4から特徴抽出パラメータの設定を要求されると、特徴抽出部1に特徴抽出パラメータの設定を指示する(S51)。
 一方、ステップS43において、特徴抽出パラメータに対応するメタデータツリーがあるとの応答を得ても(S43のYES)、階層化整形パラメータに対応するメタデータツリーが無いとの応答を得た場合(S44のNO)、メタデータ検索部4は、メタデータ格納部14に対し、対応する新たなツリーの収納部およびツリー番号の新規作成を要求し(S44A)、整形条件設定部5に対し、階層化整形パラメータの設定を要求する。整形条件設定部5は、メタデータ検索部4から階層化整形パラメータの設定を要求されると、階層化整形部2に階層化整形パラメータの設定を指示する(S52)。
 一方、ステップS44において、階層化整形パラメータに対応するメタデータツリーがあるとの応答を得ても(S44のYES)、メタデータ注釈パラメータに対応するメタデータツリーが無いとの応答を得た場合(S45のNO)、メタデータ検索部4は、整形条件設定部5に対し、注釈カテゴリーパラメータの設定を要求する。整形条件設定部5は、メタデータ検索部4から注釈カテゴリーパラメータの設定を要求されると、メタデータ注釈部3に注釈カテゴリーパラメータの設定を指示する(S53)。
 一方、ステップS45において、メタデータ注釈パラメータに対応するメタデータツリーがあるとの応答を得た場合(S45のYES)、ステップS46へ進む。
 ステップS46において、メタデータ検索部4は、メタデータツリーから、要求元のアプリケーションが示す用件に適合するクラスターの要約(synopsis)を含むメタデータを取得し、設定したパラメータの情報と一緒に、RDF(Resource Description Framework)フォーマットの図式上に書き出し、それを要求元のアプリケーションへ送信する。具体的には、図11に示されるステップS91~S93の処理を行い、一連の処理を終了する。
 特徴抽出部1は、整形条件設定部5から特徴抽出パラメータの設定を指示されると、前述のステップS11~S16と同じ処理を行う(S61)。整形条件設定部5は、ステップS61の処理が行われた後に、階層化整形部2に階層化整形パラメータの設定を指示する(S52)。
 階層化整形部2は、整形条件設定部5から階層化整形パラメータの設定を指示されると、前述のステップS21~S23と同じ処理を行う(S71)。整形条件設定部5は、ステップS71の処理が行われた後に、メタデータ注釈部3に注釈カテゴリーパラメータの設定を指示する(S53)。
 メタデータ注釈部3は、整形条件設定部5から注釈カテゴリーパラメータの設定を指示されると、前述のステップS31~S34と同じ処理を行い(S81)、最後に注釈結果をアプリケーションに渡して、一連の処理を終了する。
 ここで、図12Bに、メタデータ検索部4および整形条件設定部5を通じて各種パラメータの設定(整形条件設定)が実施された場合にメタデータ格納部14に記録される情報の一例を示す。
 整形記録は、毎回新たなツリーが作成されるごとにメタデータ格納部14に保管される。この整形記録には、ツリーを識別する情報(ツリーの番号など)、特徴抽出用パラメータ(スパン(TimeSpan)時間間隔(segment)、アルゴリズム(Algorithm)の情報など)、階層化形成用パラメータ(アルゴリズム(Algorithm)の情報など)が含まれる。
 次に、図11を参照して、図10のステップS46の具体的な処理について説明する。
 まず、メタデータ検索部4は、パラメータ群Parasを指定し、メタデータ格納部14から、図12Aに示されるようなクラスターノード(h個)の要約(synopsis, synopsis,…, synopsis)を取得する(S91)。ここでは、当該要約をRDF(1)と称す。
 次に、メタデータ検索部4は、synopsisごとに、RDFノード(当該要約をRDF(2)と称す。)を作成し、さらに、システム初期設定した部分のRDF(当該要約をRDF(0)と称す。)と連結させる(S92)。
 次に、メタデータ検索部4は、取得したクラスターの生成時に使用したパラメータとアルゴリズムのRDFノード(当該要約をRDF(3)と称す。)を例えば図12Bに示されるような整形記録を用いて作成し、これとRDF(0)とを連結させる。最後に、メタデータ検索部4は、RDF(0), RDF(1), RDF(2), RDF(3)が連結されたメタデータを要求元のアプリケーションに送信する(S93)。
 このように、アプリケーションの用件に示されるパラメータの設定に対応するメタデータがメタデータ格納部14に無い場合には、整形条件設定部5が特徴抽出部1、階層化整形部2、もしくはメタデータ注釈部3での処理に使用されるパラメータを調整するので、アプリケーションが示す用件に適切に対応することができる。
 (実施例(1))
 次に、図13A乃至図17Bを参照して、本実施形態における実施例(1)について説明する。この実施例(1)では、「風速データ」を例にとって説明する。
 ・センシングデータの入力と特徴ベクトル群の生成について
 生データは、時系列のセンシングデータである。本例では、秒ごとに取得した風速センシングデータの1年分(約15,800,000個)を扱う。
 また、本例では、特徴抽出部1において、同質のデータの特徴「毎日の(風速データ東西方向最大(Max)|風速南北方向最大(Max2)|平均(Average)」を組み合わせて、クラスタリング用の特徴ベクトル群(366個)を生成する。これにより、データ量を大幅に低減させる。
 ・アプリケーションの用件について
 アプリケーション1の用件:風速状況を3段階に分けることであるものとする(この場合、例えば、クラスター群をcluster1:「高」、cluster2:「中」、cluster3:「低」に分ける必要があるものとする)。
 アプリケーション2の用件:クラスター間の距離を所定値に指定すること(クラスター間距離(Ward Distance)を例えば「10」にすること)であるものとする(この場合、クラスター群を例えばcluster1~cluster6に分ける必要があるものとする)。
 ・クラスタリングとメタデータの付与について(アプリケーション1の用件に対応) 特徴抽出部1により生成された特徴ベクトル群に対し、階層化整形部2により階層化クラスタリングを行うと、その結果は図13Aのようにツリー状になる。なお、図13Aにおいて、横軸は特徴ベクトル群(366個のエレメント)を表し、縦軸はクラスター間の距離を表す。アプリケーション1の用件に対し、図13Aの破線の位置のようにツリーを3つのクラスター(R1, R2, R3)に分ける。
 この場合、メタデータ注釈部3により、図13Bのようなメタデータを各クラスターの情報として付与する。なお、図13Bにおいて、Range1, Range2, Range3は、3つに分けられた領域を示す。各領域に対し、エレメント数(Element Count)、全距離(Total Distances)、要約ベクトル(Synopsis Vector)を記録する。このような情報により、クラスターツリーの各ノードに注釈をカテゴリーごとに作成してもよい。
 アプリケーション1の用件に応じて分けられたクラスター群の分布は、図14Aおよび図14Bのように表すことができる。
 図14Aは、Average、Max、Max2のそれぞれのヒストグラムである。なお、図14Aにおいて、横軸はそれぞれAverage、Max、Max2の値を表し、縦軸はそれぞれの度数を表している。R1, R2, R3は、それぞれ、Range1, Range2, Range3のクラスター群に相当する。
 図14Bは、3つに分けられた領域Range1, Range2, Range3のクラスター群の分布を、Average、Max、Max2の3軸からなる3次元座標系上に表したグラフの例である。なお、図14Bにおいて、4種類のグラフは、それぞれ見る方向を変えたものである。
 アプリケーション1側では、受信するメタデータの基づき、図14Aおよび図14Bのようなグラフを再現することが可能である。
 ・メタデータの構成について(アプリケーション1の用件に対応)
 最後に、メタデータ検索部4により、メタデータをRDFの形でアプリケーション1に送信する。例えば図15のようなオントロジーを作成した上で、メタデータをアプリケーション1に送信する。なお、図15において、P0, P1, P2, P3は、それぞれ、前述したRDF(0), RDF(1), RDF(2), RDF(3)に相当する。
 P0は、システム初期設定して、メタデータ格納部14に保管したものである。P1は、メタデータ格納部14から取得したものである。P2は、メタデータ注釈部3で作成したものである。P3は、メタデータ検索部4および整形条件設定部5で設定し、メタデータ格納部14に保管したものである。
 ・クラスタリングとメタデータの付与について(アプリケーション2の用件に対応) アプリケーション2に対しても、図16Aの通り、アプリケーション1の場合と同じクラスタリングを利用する。但し、図16Aの破線の位置のように、6つのクラスター群(R1~R6)に分ける。
 この場合、メタデータ注釈部3により、図16Bのようなメタデータを各クラスターの情報として付与する。なお、図16Bにおいて、Range1~Range6は、6つに分けられた領域を示す。記録する項目は図13Bと同じである。
 アプリケーション2の用件に応じて分けられたクラスター群の分布は、図17Aおよび図17Bのように表すことができる。
 図17Aは、Average、Max、Max2のそれぞれのヒストグラムである。R1~R6は、それぞれ、Range1~Range6のクラスター群に相当する。
 図17Bは、6つに分けられた領域Range1~Range6のクラスター群の分布を、Average、Max、Max2の3軸からなる3次元座標系上に表したグラフの例である。なお、図17Bにおいて、4種類のグラフは、それぞれ見る方向を変えたものである。
 アプリケーション2側では、受信するメタデータの基づき、図17Aおよび図17Bのようなグラフを再現することが可能である。
 (実施例(2))
 次に、図18A乃至図22Bを参照して、本実施形態における実施例(2)について説明する。この実施例(2)では、「風速データ」、「気温データ」、「日照時間データ」を混合させた例について説明する。
 ・センシングデータの入力と特徴ベクトル群の生成について
 生データは、時系列のセンシングデータである。本例では、秒ごとに取得した風速・気温センシングデータの1年分、および毎日の日照時間データの1年分を扱う。
 実施例(1)と違い、本例では、上記の3種類の異質データの特徴「毎日の風速平均、気温平均、日照時間」を組み合わせて、1年の中の毎日の気象状況を表す特徴ベクトル群を生成する。これにより、データ量を大幅に低減させる。
 ・アプリケーションの用件について
 アプリケーション3の用件:気象状況を2部類に分けることであるものとする(この場合、クラスター群を例えば、cluster1、cluster2に分ける必要があるものとする)。
 アプリケーション4の用件:特定の2つの日(例えば、5月1日と6月2日)が1つの部類に入っているものとする(この場合、クラスター群を例えばcluster1~cluster12に分ける必要があるものとする)。
 ・クラスタリングとメタデータの付与について(アプリケーション3の用件に対応) 特徴抽出部1により生成された特徴ベクトル群に対し、階層化整形部2により階層化クラスタリングを行うと、その結果は図18Aのようにツリー状になる。なお、図18Aにおいて、横軸は特徴ベクトル群(360個のエレメント)を表し、縦軸はクラスター間の距離を表す。アプリケーション3の用件に対し、図18Aの破線の位置のようにツリーを2つのクラスター(C1, C2)に分ける。
 この場合、メタデータ注釈部3により、図18Bのようなメタデータを各クラスターの情報として付与する。なお、図18Bにおいて、Condition1, Condition2は、2つに分けられた領域を示す。各領域に対し、エレメント数(Element Count)、全距離(Total Distances)、要約ベクトル(Synopsis Vector)を記録する。このような情報により、クラスターツリーの各ノードに注釈をカテゴリーごとに作成してもよい。
 アプリケーション3の用件に応じて分けられたクラスター群の分布は、図19Aおよび図19Bのように表すことができる。
 図19Aは、気温(Temperature)、風速(Wind)、日照時間(Sunny)のそれぞれの相関図である。なお、図19Aにおいて、C1, C2は、それぞれ、Condition1, Condition2のクラスター群に相当する。
 図19Bは、2つに分けられた領域Condition1, Condition2のクラスター群の分布を、Temperature, Wind, Sunnyの3軸からなる3次元座標系上に表したグラフの例である。
 アプリケーション3側では、受信するメタデータの基づき、図19Aおよび図19Bのようなグラフを再現することが可能である。
 ・メタデータの構成について(アプリケーション1の用件に対応)
 最後に、メタデータ検索部4により、メタデータをRDFの形でアプリケーション3に送信する。例えば図20のようなオントロジーを作成した上で、メタデータをアプリケーション3に送信する。なお、図20において、Q0, Q1, Q2, Q3は、それぞれ、前述したRDF(0), RDF(1), RDF(2), RDF(3)に相当する。
 Q0は、システム初期設定して、メタデータ格納部14に保管したものである。Q1は、メタデータ格納部14から取得したものである。Q2は、メタデータ注釈部3で作成したものである。Q3は、メタデータ検索部4および整形条件設定部5で設定し、メタデータ格納部14に保管したものである。
 ・クラスタリングとメタデータの付与について(アプリケーション4の用件に対応) アプリケーション4に対しても、図21の通り、アプリケーション3の場合と同じクラスタリングを利用する。但し、図21の破線の位置のように、12個のクラスター群(C1~C12)に分ける。
 アプリケーション4の用件に応じて分けられたクラスター群の分布は、図22Aおよび図22Bのように表すことができる。
 図22Aは、気温(Temperature)、風速(Wind)、日照時間(Sunny)のそれぞれの相関図である。なお、図22Aにおいて、C1~C12は、それぞれ、Condition1~Condition12のクラスター群に相当する。
 図22Bは、12個に分けられた領域Condition1~Condition12のクラスター群の分布を、Temperature, Wind, Sunnyの3軸からなる3次元座標系上に表したグラフの例である。
 アプリケーション4側では、受信するメタデータの基づき、図22Aおよび図22Bのようなグラフを再現することが可能である。
 第1の実施形態によれば、サーバ側で実行される階層化データ整形により、IoTデータを利用する多様なアプリケーションの要求に対して都度計算を行うことなく、アプリケーションが必要とする情報を提供することができるようになる。したがって、アプリケーション側では全てのIoTデータを受信して処理をする必要がなくなるため、処理の軽減が期待できる。また、アプリケーションに必要なデータのみをサーバ側からアプリケーションに提供するため、通信コストやトラヒック量を大幅に抑えることができる。これにより、今後さらにIoTデータを利用するアプリケーションや大量なデバイスが存在する環境においても、効率的かつ安価にデータを提供できるようになる。
 (第2の実施形態)
 次に、本発明の第2の実施形態について説明する。以下では、第1の実施形態と共通する部分の説明を省略し、異なる部分を中心に説明する。
 (構成)
 図23は、本発明の第2の実施形態に係る情報交換システムの機能構成の一例を示す図である。なお、図23では、図1と共通する要素に同一の符号を付している。
 本実施形態に係る情報交換システムは、例えば他の情報処理装置(図示せず)に搭載されたアプリケーションからの要求に応じてサービスを提供するクラウド上のクラウドサーバ100-0と、センサD1~Dm等のデバイス群から供給されるセンシングデータ群を取得可能な各所に設置される1台のエッジサーバ100-1もしくは複数のエッジサーバ100-1,…,100kとの組み合わせで成る。クラウドサーバ100-0と、エッジサーバ100-1,…,100kとは、相互に通信可能に接続され、相互に情報交換することが可能である。
 図23に示されるように、特徴抽出部1、階層化整形部2、およびメタデータ注釈部3は、エッジサーバ100-1,…,100k側にそれぞれ配置される。一方、メタデータ検索部4および整形条件設定部5は、クラウドサーバ100-0側に設置される。特徴抽出部1、階層化整形部2、メタデータ注釈部3、メタデータ検索部4、および整形条件設定部5のそれぞれの機能や動作は、第1の実施形態の場合と同様である。
 第2の実施形態によれば、特徴抽出部1、階層化整形部2、およびメタデータ注釈部3が、クラウド上のクラウドサーバ100-0側に配置されるのではなく、エッジサーバ100-1,…,100k側に配置されるため、クラウドサーバ100-0は膨大な量の生データを受信して処理する必要がなく、メタデータの受け渡しを行う程度で済む。そのため、クラウドサーバ100-0側の負担を大幅に軽減し、クラウド層の負荷の軽減に寄与することと、エッジとクラウド間のトラヒック量(コスト)の削減ができる。
 以上詳述したように、本発明の各実施形態によれば、アプリケーションが必要とするデータを効率的に生成することを可能になる。
 なお、本発明は、上記実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。また、各実施形態は適宜組み合わせて実施してもよく、その場合組み合わせた効果が得られる。更に、上記実施形態には種々の発明が含まれており、開示される複数の構成要件から選択された組み合わせにより種々の発明が抽出され得る。例えば、実施形態に示される全構成要件からいくつかの構成要件が削除されても、課題が解決でき、効果が得られる場合には、この構成要件が削除された構成が発明として抽出され得る。
 また、各実施形態に記載した手法は、計算機(コンピュータ)に実行させることができるプログラム(ソフトウェア手段)として、例えば磁気ディスク(フロッピー(登録商標)ディスク、ハードディスク等)、光ディスク(CD-ROM、DVD、MO等)、半導体メモリ(ROM、RAM、フラッシュメモリ等)等の記録媒体に格納し、また通信媒体により伝送して頒布することもできる。なお、媒体側に格納されるプログラムには、計算機に実行させるソフトウェア手段(実行プログラムのみならずテーブルやデータ構造も含む)を計算機内に構成させる設定プログラムをも含む。本装置を実現する計算機は、記録媒体に記録されたプログラムを読み込み、また場合により設定プログラムによりソフトウェア手段を構築し、このソフトウェア手段によって動作が制御されることにより上述した処理を実行する。なお、本明細書でいう記録媒体は、頒布用に限らず、計算機内部あるいはネットワークを介して接続される機器に設けられた磁気ディスクや半導体メモリ等の記憶媒体を含むものである。
  1…特徴抽出部
  2…階層化整形部
  3…メタデータ注釈部
  4…メタデータ検索部
  5…整形条件設定部
  10…データ保存部
  11…生データ格納部
  12…特徴ベクトル格納部
  13…クラスター格納部
  14…メタデータ格納部
  100…サーバ
  100-0…クラウドサーバ
  100-1~100-k…エッジサーバ
  A1~An…アプリケーション群
  D1~Dm…センサ

Claims (7)

  1.  デバイスから供給されるデータ群から複数の特徴を抽出し、当該複数の特徴をベクトルで表現した特徴ベクトル群を生成する特徴抽出手段と、
     前記特徴抽出手段により生成された特徴ベクトル群に対し、特徴ベクトル間の距離に応じたクラスタリングを行い、当該クラスタリングにより生成されるクラスター群をクラスター間の距離に応じて階層化したクラスターツリーを生成する階層化整形手段と、
     前記階層化整形手段により生成されたクラスターツリーに基づき、各クラスターの配下にある情報をまとめた要約に注釈を付したメタデータをクラスター毎に備えるメタデータツリーを生成するメタデータ注釈手段と、
     前記メタデータ注釈手段により生成されたメタデータツリーの中から、アプリケーションが示す用件に適合するクラスターのメタデータを検索し、当該検索により得られるメタデータを前記アプリケーションに提供するメタデータ検索手段と、
     を具備する情報処理装置。
  2.  前記メタデータ検索手段は、
     アプリケーションが用件としてデータ群の粒度を示す場合、前記メタデータツリーの中から、当該粒度に応じた階層に位置するクラスターのメタデータを読み出す、
     請求項1に記載の情報処理装置。
  3.  前記メタデータ検索手段は、
     アプリケーションが用件としてデータ群のある物理量の範囲を指定する場合、前記メタデータツリーを最上階層側から最下階層側へ向けて探索し、各クラスターのメタデータに記録されている物理量の範囲を順次絞り込んでいくことにより該当する範囲が記録されているメタデータを見つけて読み出す、
     請求項1に記載の情報処理装置。
  4.  アプリケーションが示す用件に応じて、前記特徴抽出手段、前記階層化整形手段、または前記メタデータ注釈手段での処理に使用されるパラメータを調整する整形条件設定手段をさらに具備する、
     請求項1乃至3のいずれか1項に記載の情報処理装置。
  5.  デバイスから供給されるデータ群を格納する1つまたは複数の第1の情報処理装置と、アプリケーションからの要求に応じる第2の情報処理装置との間で情報を交換する情報交換システムであって、
     前記1つまたは複数の第1の情報処理装置の各々は、
      デバイスから供給されるデータ群から複数の特徴を抽出し、当該複数の特徴をベクトルで表現した特徴ベクトル群を生成する特徴抽出手段と、
      前記特徴抽出手段により生成された特徴ベクトル群に対し、特徴ベクトル間の距離に応じたクラスタリングを行い、当該クラスタリングにより生成されるクラスター群をクラスター間の距離に応じて階層化したクラスターツリーを生成する階層化整形手段と、
      前記階層化整形手段により生成されたクラスターツリーに基づき、各クラスターの配下にある情報をまとめた要約に注釈を付したメタデータをクラスター毎に備えるメタデータツリーを生成するメタデータ注釈手段と、
    を備え、
     前記第2の情報処理装置は、
      前記1つまたは複数の第1の情報処理装置のいずれかに対し、前記メタデータ注釈手段により生成されたメタデータツリーの中から、アプリケーションが示す用件に適合するクラスターのメタデータを検索することを要求し、当該検索により得られるメタデータを前記アプリケーションに提供するメタデータ検索手段を備える、
     情報交換システム。
  6.  デバイスから供給されるデータ群から複数の特徴を抽出し、当該複数の特徴をベクトルで表現した特徴ベクトル群を生成し、
     前記生成した特徴ベクトル群を特徴ベクトル間の距離に応じて複数のクラスターに分類し、当該複数のクラスターをクラスター間の距離に応じて階層化したクラスターツリーを生成し、
     前記生成したクラスターツリーに基づき、各クラスターの配下にある情報をまとめた要約に注釈を付したメタデータをクラスター毎に備えるメタデータツリーを生成し、
     前記生成したメタデータツリーの中から、アプリケーションが示す用件に適合するクラスターのメタデータを検索し、当該検索により得られるメタデータを前記アプリケーションに提供する、
     ことを含む情報処理方法。
  7.  請求項1に記載の情報処理装置の一部分として動作するコンピュータに用いられるプログラムであって、
     前記コンピュータを、
     前記特徴抽出手段、前記階層化整形手段、前記メタデータ注釈手段、および前記メタデータ検索手段
     として機能させるための情報処理プログラム。
PCT/JP2019/022723 2018-06-20 2019-06-07 情報処理装置、情報交換システム、情報処理方法および情報処理プログラム WO2019244671A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US17/252,394 US20210263969A1 (en) 2018-06-20 2019-06-07 Information processing apparatus, information exchange system, information processing method, and information processing program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018-116727 2018-06-20
JP2018116727A JP7119630B2 (ja) 2018-06-20 2018-06-20 情報処理装置、情報交換システム、情報処理方法および情報処理プログラム

Publications (1)

Publication Number Publication Date
WO2019244671A1 true WO2019244671A1 (ja) 2019-12-26

Family

ID=68983951

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/022723 WO2019244671A1 (ja) 2018-06-20 2019-06-07 情報処理装置、情報交換システム、情報処理方法および情報処理プログラム

Country Status (3)

Country Link
US (1) US20210263969A1 (ja)
JP (1) JP7119630B2 (ja)
WO (1) WO2019244671A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11036807B2 (en) 2018-07-31 2021-06-15 Marvell Asia Pte Ltd Metadata generation at the storage edge
EP4073665A1 (en) * 2019-12-13 2022-10-19 Marvell Asia Pte, Ltd. Automotive data processing system with efficient generation and exporting of metadata
US11762956B2 (en) * 2021-02-05 2023-09-19 Oracle International Corporation Adaptive pattern recognition for a sensor network
CN113127058B (zh) * 2021-04-28 2024-01-16 北京百度网讯科技有限公司 数据标注方法、相关装置及计算机程序产品
CN116257657B (zh) * 2022-12-30 2024-02-06 北京瑞莱智慧科技有限公司 数据处理方法、数据查询方法、相关装置及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008250605A (ja) * 2007-03-30 2008-10-16 Sony Corp コンテンツ管理装置、画像表示装置、撮像装置、および、これらにおける処理方法ならびに当該方法をコンピュータに実行させるプログラム
JP2009277136A (ja) * 2008-05-16 2009-11-26 Mitsubishi Electric Corp 類似度分析評価システム
JP2013003597A (ja) * 2011-06-10 2013-01-07 Sony Corp 情報処理装置、情報処理方法及びプログラム
JP2015197741A (ja) * 2014-03-31 2015-11-09 Kddi株式会社 消費電力量に基づいて生活パターンを推定する装置、プログラム及び方法
WO2017094377A1 (ja) * 2015-11-30 2017-06-08 日本電信電話株式会社 分類方法、分類装置および分類プログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5137339B2 (ja) 2006-06-12 2013-02-06 株式会社日立製作所 クラスタリングされたベクトルデータを検索するサーバ、システム及び方法
US8560531B2 (en) * 2011-07-01 2013-10-15 International Business Machines Corporation Search tool that utilizes scientific metadata matched against user-entered parameters
JP2013073256A (ja) 2011-09-26 2013-04-22 Osaka Prefecture Univ 近似最近傍探索方法、最近傍探索プログラムおよび装置
US9442929B2 (en) 2013-02-12 2016-09-13 Microsoft Technology Licensing, Llc Determining documents that match a query
KR101484186B1 (ko) * 2013-08-30 2015-01-21 한국전자통신연구원 보안 관제 데이터의 검색을 위한 인덱싱 장치 및 방법
US9507847B2 (en) * 2013-09-27 2016-11-29 International Business Machines Corporation Automatic log sensor tuning
US10635724B2 (en) * 2015-01-30 2020-04-28 International Business Machines Corporation Analysis of data utilization
US11315198B2 (en) * 2016-07-29 2022-04-26 The Bureau Of National Affairs, Inc. Data analysis engine

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008250605A (ja) * 2007-03-30 2008-10-16 Sony Corp コンテンツ管理装置、画像表示装置、撮像装置、および、これらにおける処理方法ならびに当該方法をコンピュータに実行させるプログラム
JP2009277136A (ja) * 2008-05-16 2009-11-26 Mitsubishi Electric Corp 類似度分析評価システム
JP2013003597A (ja) * 2011-06-10 2013-01-07 Sony Corp 情報処理装置、情報処理方法及びプログラム
JP2015197741A (ja) * 2014-03-31 2015-11-09 Kddi株式会社 消費電力量に基づいて生活パターンを推定する装置、プログラム及び方法
WO2017094377A1 (ja) * 2015-11-30 2017-06-08 日本電信電話株式会社 分類方法、分類装置および分類プログラム

Also Published As

Publication number Publication date
US20210263969A1 (en) 2021-08-26
JP2019219906A (ja) 2019-12-26
JP7119630B2 (ja) 2022-08-17

Similar Documents

Publication Publication Date Title
WO2019244671A1 (ja) 情報処理装置、情報交換システム、情報処理方法および情報処理プログラム
US11888702B2 (en) Intelligent analytic cloud provisioning
Khare et al. Big data in IoT
US9280381B1 (en) Execution framework for a distributed file system
Mishra et al. A cognitive adopted framework for IoT big-data management and knowledge discovery prospective
US9020802B1 (en) Worldwide distributed architecture model and management
US9880881B1 (en) Multi-tier resource and load orchestration
CN104966006A (zh) 基于云变平台的智能人脸识别系统
CN103678520A (zh) 一种基于云计算的多维区间查询方法及其系统
Lujic et al. Efficient edge storage management based on near real-time forecasts
US20200110602A1 (en) Scalable cloud-based time series analysis
Nguyen et al. Design of a platform for collecting and analyzing agricultural big data
CN103631922A (zh) 基于Hadoop集群的大规模Web信息提取方法及系统
Li et al. Parallelizing skyline queries over uncertain data streams with sliding window partitioning and grid index
KR20180077839A (ko) 대용량 비정형 데이터를 처리하는 rest api 서비스 제공 방법
CN105007314A (zh) 面向海量读者阅读数据的大数据处理系统
CN109218366A (zh) 基于k均值的监控视频热度云存储方法
US20130346381A1 (en) Multimedia Real-Time Searching Platform (SKOOP)
Lin et al. A bottom-up tree based storage approach for efficient iot data analytics in cloud systems
Choi et al. Intelligent reconfigurable method of cloud computing resources for multimedia data delivery
Roy et al. A proposal for optimization of horizontal scaling in big data environment
Ahmed et al. FedOPT: federated learning-based heterogeneous resource recommendation and optimization for edge computing
Sen et al. Facility location models to locate data in information networks: a literature review
US10567469B1 (en) Embedding hypermedia resources in data interchange format documents
Dinesh et al. An efficient hybrid optimization of ETL process in data warehouse of cloud architecture

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19822978

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19822978

Country of ref document: EP

Kind code of ref document: A1