WO2018070405A1 - 情報処理装置、方法およびプログラム記録媒体 - Google Patents

情報処理装置、方法およびプログラム記録媒体 Download PDF

Info

Publication number
WO2018070405A1
WO2018070405A1 PCT/JP2017/036765 JP2017036765W WO2018070405A1 WO 2018070405 A1 WO2018070405 A1 WO 2018070405A1 JP 2017036765 W JP2017036765 W JP 2017036765W WO 2018070405 A1 WO2018070405 A1 WO 2018070405A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
tree structure
structure data
subtree
node
Prior art date
Application number
PCT/JP2017/036765
Other languages
English (en)
French (fr)
Inventor
健一郎 石川
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to JP2018545013A priority Critical patent/JP7040455B2/ja
Priority to US16/339,020 priority patent/US11016953B2/en
Publication of WO2018070405A1 publication Critical patent/WO2018070405A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9027Trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees

Definitions

  • the present invention relates to a technique for processing an information group represented by a tree structure.
  • the information group may be represented by a tree structure. This makes it possible to search for information at high speed and to extract an information group having certain characteristics at high speed. For example, when there is an evaluation function that evaluates the closeness of the distance between two pieces of information, the information group can be represented by a tree structure by connecting pieces of information whose distance is less than the threshold with branches.
  • the information group can be represented by a tree structure by connecting pieces of information whose distance is less than the threshold with branches.
  • nodes information groups included in the same hierarchy are called nodes.
  • a root (root) that is, a node in the highest hierarchy is called a root node.
  • the root node of the tree structure includes a group of information that represents the tree structure. These information groups satisfy a condition indicating that the distance is long.
  • a child node may be connected to each piece of information included in the root node.
  • child nodes are in a hierarchy below the root node. The hierarchy above the child node is called the parent node.
  • a child node is a group of information that satisfies a condition indicating that the distance to the connected information (parent node) is short.
  • a child node may be further connected to the information included in the child node.
  • a child node connected to a child node may be called a grandchild node.
  • Patent Document 1 An example of a related technique for processing an information group represented by such a tree structure is described in Patent Document 1. This related technique realizes a high-speed search by representing an information group in a tree structure based on the similarity between information.
  • multiple tree structures there is a need to merge these multiple tree structures. For example, if there is a tree structure consisting of information groups obtained on one day, in order to obtain one tree structure consisting of information groups obtained over several days, multiple trees consisting of information groups obtained on one day There is a demand to organize the structure. In addition, there is a demand to combine a plurality of tree structures generated by different organizations into one tree structure. In addition, there is a demand to combine a plurality of tree structures individually generated in a plurality of environments in which communication with each other is difficult into one tree structure.
  • Patent Document 1 does not describe a technique related to such a fusion of tree structures.
  • each piece of information in the tree structure with the smaller number of information is inserted into the tree structure with the larger number of information.
  • the order of the processing cost is about [number of information in the tree structure with the smaller number of information] ⁇ log [number of information in the tree structure with the larger number of information].
  • an object of the present invention is to provide a technique for fusing a plurality of tree structures in which information groups are represented based on the distance between information into one tree structure at a higher speed.
  • the information processing apparatus is a plurality of tree structure data representing an information group in a tree structure based on a distance between information, and each of the tree structure data is a child connected to information included in a parent node
  • the distance between the information contained in the node is closer to the distance between the information contained in the parent node, and the closer to the end of the tree structure data, the closer the distance between the information contained in the node is.
  • each of the nodes selected in the plurality of tree structure data in order to generate the tree structure data after fusing the plurality of tree structure data obtained by acquiring the plurality of tree structure data configured For each piece of information that satisfies the condition indicating that the distance from each other information is far apart in the plurality of pieces of information consisting of the information, the information originally included in the information
  • the sub-tree below the information in the structure data is included in the merged tree structure data as it is, and for a plurality of pieces of information that satisfy the condition indicating that the distance between the information is close to each other, each information was originally included.
  • the computer device is a plurality of tree structure data in which an information group is represented by a tree structure based on a distance between the information, and the information included in the parent node in each of the tree structure data.
  • the distance between the information included in the connected child nodes is closer to the distance between the information included in the parent node and closer to the end of the tree structure data, the distance between the information included in the node is smaller.
  • each node selected in the plurality of tree structure data In each of a plurality of pieces of information that are included, information that satisfies the condition indicating that the distance from each other information is far away is originally included in the information. Sub-trees below the information in the tree structure data are included in the merged tree structure data as they are, and a plurality of pieces of information that satisfy the condition indicating that the distance between the information is close to each other originally include each information. In addition, a subtree that is reorganized so that subtrees below the information in the tree structure data are merged and represented by the tree structure is included in the tree structure data after the fusion.
  • the program recording medium of the present invention is a plurality of tree structure data in which an information group is represented by a tree structure based on a distance between information, and is connected to information included in a parent node in each of the tree structure data.
  • the distance between the information contained in the child node is closer to the distance between the information contained in the parent node, and the closer to the end of the tree structure data, the closer the distance between the information contained in the node is
  • a node selected in each of the plurality of tree structure data configured to be and to generate a tree structure data after merging a plurality of the tree structure data, a node selected in each of the plurality of tree structure data In each of a plurality of pieces of information that are included, the information is originally included for each piece of information that satisfies the condition indicating that the distance from each other information is long
  • a sub-tree below the information in the tree structure data is included in the tree structure data after the fusion as it is, and a plurality of pieces of information satisfying a
  • the present invention can provide a technique for fusing a plurality of tree structures in which information groups are represented based on the distance between information into a single tree structure at a higher speed.
  • FIG. 1 It is a figure which shows two tree structure data used as the object merged in the specific example of the 2nd Embodiment of this invention. It is a figure which shows an example of the screen which acquires the information showing the characteristic applied to the tree structure data after fusion in the specific example of the 2nd Embodiment of this invention. It is a figure which shows the fusion subtree produced
  • FIG. 1 It is a figure which shows two tree structure data used as the object merged in the specific example of the 3rd Embodiment of this invention. It is a figure which shows the screen which acquires the information showing the characteristic applied to the tree structure data after fusion in the specific example of the 3rd Embodiment of this invention. It is a figure which shows the fusion subtree produced
  • FIG. 1 shows a functional block configuration of the information processing apparatus 10 as the first embodiment of the present invention.
  • the information processing apparatus 10 includes an acquisition unit 101 and a fusion unit 102.
  • the information processing apparatus 10 can be configured by hardware elements as shown in FIG.
  • the information processing apparatus 10 includes a CPU (Central Processing Unit) 1001, a memory 1002, an output device 1003, and an input device 1004.
  • a CPU Central Processing Unit
  • the memory 1002 includes a RAM (Random Access Memory), a ROM (Read Only Memory), an auxiliary storage device (such as a hard disk), and the like.
  • the output device 1003 is configured by a device that outputs information, such as a display device or a printer.
  • the input device 1004 is configured by a device that receives an input of a user operation, such as a keyboard or a mouse.
  • each functional block of the information processing apparatus 10 is configured by a CPU 1001 that reads and executes a computer program stored in the memory 1002 and controls other units.
  • the hardware configuration of the information processing apparatus 10 and each functional block thereof is not limited to the above-described configuration.
  • the tree structure data is data representing an information group in a tree structure based on the distance between information.
  • the distance between information can be represented by the output value of the evaluation function which evaluates the distance between information, for example.
  • child nodes are connected to information included in the parent node.
  • the distance between the information contained in the child node is closer than the distance between the information contained in the parent node. That is, the tree structure data is configured such that the closer the end of the tree structure data is, the closer the distance between information included in the node is.
  • the acquisition unit 101 acquires a plurality of tree structure data.
  • the acquisition unit 101 may acquire a plurality of tree structure data via the input device 1004.
  • the acquisition unit 101 may acquire a plurality of tree structure data from the memory 1002.
  • the acquisition unit 101 may acquire a plurality of tree structure data via a network interface or a portable storage medium (not shown).
  • Fusion unit 102 fuses a plurality of tree structure data.
  • the fusion unit 102 selects a node from each of a plurality of tree structure data, acquires information included in the selected node, and obtains a node of the merged tree structure data by combining the acquired information. .
  • the node that the fusion unit 102 selects from a plurality of tree structure data may be, for example, a root node or a root node of a partial tree.
  • the selected nodes are not limited to these.
  • the fusion unit 102 satisfies one condition that represents that the distance from each other information is separated in the plurality of pieces of information obtained as described above from the nodes selected from the plurality of tree structure data. The above information is specified.
  • the fusion unit 102 includes the subtree below the information in the tree structure data that originally contained the information as it is in the tree structure data after the fusion.
  • “subtree below certain information” means a subtree having the information as a root, that is, a child node branched from the information, and a hierarchy below those child nodes. It is a tree structure composed of all nodes in
  • the fusion unit 102 identifies a plurality of pieces of information that satisfy a condition indicating that the distance between the information is close among a plurality of pieces of information obtained as described above from the nodes respectively selected from the plurality of tree structure data. To do. Then, the fusion unit 102 reorganizes the plurality of pieces of information specified in this way into a single tree structure by fusing the subtrees below the information in the tree structure data in which each information was originally included. Then, the fusion unit 102 includes the reorganized tree structure as a partial tree in the tree structure data after the fusion.
  • the acquisition unit 101 acquires a plurality of (original) tree structure data to be merged (step S11).
  • the fusion unit 102 obtains one or more pieces of information satisfying a condition indicating that the distance from each of the other pieces of information is separated from the pieces of information included in the nodes selected from the plurality of tree structure data. Specify (step S12).
  • the fusion unit 102 includes a subtree below the information in the original tree structure data that originally contained the information in the tree structure data after the fusion (step S13). ).
  • the fusion unit 102 may include these pieces of information in the same node in the tree structure data after the fusion. And the fusion
  • the fusion unit 102 obtains a plurality of pieces of information that satisfy the condition indicating that the distance between the information is close to each other. Specify (step S14).
  • the merging unit 102 merges the subtrees below the information in the original tree structure data in which the information was originally included for each piece of information specified in step S14, and reorganizes it into one tree structure. (Step S15).
  • the fusion unit 102 inserts the reorganized tree structure into the tree structure data after the fusion as a partial tree (step S16).
  • the fusion unit 102 may integrate the reorganized tree structure root node with the node in which the information specified in step S12 is arranged in the tree structure data after the fusion.
  • the information processing apparatus 10 ends the operation.
  • a plurality of tree structures in which information groups are represented based on the distance between information can be fused to one tree structure at a higher speed.
  • the acquisition unit 101 acquires a plurality of tree structure data in which an information group is represented by a tree structure.
  • the distance between the information included in the child node is closer than the distance between the information included in the parent node. Accordingly, the closer to the end of the tree structure data, the closer the distance between the information contained in the node.
  • the fusion unit 102 represents a condition (for example, an evaluation function) indicating that the distance from the other pieces of information is long. Information that satisfies an output value equal to or greater than a threshold) is specified. For the information specified in this way by the fusion unit 102, the subtree below the information in the tree structure data that originally contained the information is included in the tree structure data after the fusion as it is.
  • the fusion unit 102 indicates that the distance between the information is close (for example, the output value of the evaluation function is less than the threshold value) ) Is specified.
  • the fusion unit 102 merges the subtrees below the information in the tree structure data that originally contained each information, and generates a reorganized subtree to represent the tree structure. To do. Then, the fusion unit 102 includes the reorganized partial tree in the tree structure data after the fusion.
  • a subtree having a certain information as a root is composed of information that is close (that is, similar) to the information.
  • information included in a subtree rooted at two pieces of information that are separated (that is, not similar) is expected to have a long distance.
  • subtrees below information that are close to each other are reorganized into a single tree structure by merging them.
  • subtrees below information that are far apart are not reorganized into a single tree structure. Therefore, the processing cost required for evaluating the distance between information and reorganizing the tree structure can be greatly reduced.
  • FIG. 4 shows a functional block configuration of an information processing apparatus 20 as a second embodiment of the present invention.
  • the information processing apparatus 20 is different from the information processing apparatus 10 according to the first exemplary embodiment of the present invention in that a fusion unit 202 is provided instead of the fusion unit 102.
  • the fusion unit 202 includes a reorganization unit 203, a restoration unit 204, and a selection unit 205.
  • the information processing apparatus 20 and each functional block thereof can be configured by hardware elements similar to those of the first embodiment of the present invention described with reference to FIG.
  • the hardware configuration of the information processing apparatus 20 and each functional block thereof is not limited to the above-described configuration.
  • the tree structure data targeted in the present embodiment will be described.
  • the closeness of the distance between information in the tree structure data is evaluated using an evaluation function.
  • the evaluation function is a function that evaluates the proximity of the distance between two pieces of information. Assume that the evaluation results have a correlation. For example, the evaluation result (that is, the output value of the evaluation function) indicating the closeness of the distance between the information A and the information B is equal to or greater than a predetermined threshold, and the closeness of the distance between the information A and the information C Assume that the evaluation result indicating is also a predetermined threshold value or more. In this case, the evaluation result indicating the proximity of the distance between the information B and the information C is also equal to or greater than the threshold value.
  • the output value of the evaluation function satisfies a predetermined condition (for example, is equal to or higher than a threshold value). Also, it is described that the evaluation is low that the output value of the evaluation function does not satisfy the predetermined condition (for example, it is less than the threshold value).
  • the output value of the evaluation function is also described as the evaluation result or the height of the evaluation.
  • the evaluation function may output the similarity between the styles of the two sentences as an evaluation result.
  • the similarity may be a numerical value indicating how much the feature amounts of the styles of two sentences match, for example.
  • the evaluation function may output, as an evaluation result, the degree of similarity of an impression received by a person from two images.
  • the information constituting the tree structure is a face image.
  • the evaluation function may output the similarity indicating the possibility that the two face images are the same person as the evaluation result.
  • the types of information constituting the tree structure and the evaluation function are not limited to the above example.
  • the tree structure data in the present embodiment is configured according to the following rule. 1.
  • a plurality of pieces of information whose evaluation is low (the output value of the evaluation function does not satisfy the predetermined condition described above) is placed.
  • an information group having a high evaluation that is, a distance from the information is short
  • the height of evaluation of the information group included in the child node is equal to or higher than the height of evaluation of the information group included in the parent node. 4).
  • the evaluation of the information group included in the child node becomes higher as the end of the tree structure is approached.
  • the tree structure data configured according to this rule includes, for example, different information A and information B in a certain node.
  • the closeness of the distance between the information included in the child node of information A and the information included in the child node of information B is the closeness of the distance between the information included in the child node of information A, and Compared to the closeness of the distance between the information contained in the child nodes of information B, it is expected that there is no closer. This tendency becomes stronger as the child node is closer to the root node.
  • the root node includes information 0, information 1 and information 2.
  • Information 0, information 1 and information 2 may be less than R1 in evaluation height between each other.
  • the child nodes connected to the information 0 include information 00, information 01, and information 02.
  • the height of each evaluation between information 0 and information 00, information 01, and information 02 is R1 or more.
  • the information 00, the information 01, and the information 02 are evaluated with a height of less than R2.
  • child nodes connected to information 00 include information 001 and information 002.
  • the height of evaluation between information 00 and information 001 and information 002 is R2 or more, respectively.
  • R2 is a value larger than R1.
  • the reorganization unit 203 evaluates each piece of information included in the node of interest by using an evaluation function, and based on the evaluation result between the information (output value of the evaluation function, indicating the closeness of the distance between the information) Generates a fused subtree consisting of information contained in.
  • the fused subtree is constructed according to the above-described rules 1 to 4 for a plurality of pieces of information.
  • information having child nodes in the fusion subtree is described as first information.
  • information having no child node is described as second information. Details of the node of interest will be described later.
  • the reorganization unit 203 inserts the fused subtree at the “position based on the node of interest” in the fused tree structure data.
  • the position based on the node of interest will be described.
  • the node of interest is the root node of the original tree structure data.
  • the position based on the node of interest is the position of the root node in the tree structure data after the fusion.
  • one of the nodes of interest is a child node of the first information in the fusion subtree generated by the previous iteration process described later.
  • the fusion subtree generated by the previous iteration is also simply referred to as the previous fusion subtree.
  • the position based on the node of interest is the position of the child node that is one of the nodes of interest in the previous fusion subtree inserted into the tree structure data after the fusion.
  • the restoration unit 204 connects the subtree below the child node connected to the second information in the original tree structure data including the second information to the second information in the fusion subtree.
  • the tree structure below the second information is restored in the tree structure data after the fusion.
  • the selection unit 205 first selects a root node of a plurality of tree structure data as a node of interest. After that, the selection unit 205 was connected to the first information in the child node connected to the first information in the previous fusion subtree and the tree structure data originally including the first information. The child node is selected as a new node of interest.
  • the selection unit 205 selects a new node of interest, and the reorganization unit 203 and the restoration unit 204 repeat reorganization and restoration of the original tree structure data based on the selected node of interest. This process is hereinafter referred to as an iterative process.
  • the fusion unit 202 may acquire information representing characteristics applied to the tree structure data after the fusion before causing each of these functional blocks to function.
  • information representing the characteristics for example, there is an upper limit number of information that one node can have, but the present invention is not limited to this.
  • the fusion unit 202 may acquire information indicating characteristics via the input device 1004. Further, the fusion unit 202 may acquire information representing characteristics from the memory 1002. Further, the fusion unit 202 may acquire information representing characteristics of a plurality of tree structure data acquired by the acquisition unit 101 as information indicating characteristics applied to the tree structure data after the fusion.
  • the fusion unit 202 acquires a plurality of tree structure data (step S21).
  • the fusion unit 202 acquires information representing the characteristics applied to the tree structure data after the fusion (step S22).
  • the selection unit 205 selects each root node of the plurality of tree structure data as a node of interest (step S23).
  • the reorganization unit 203 generates a fused subtree for a plurality of pieces of information included in the node of interest based on the evaluation result between the information (step S24).
  • information having child nodes is described as first information, and information having no child nodes is described as second information.
  • the configuration of the generated fusion subtree may differ depending on the order in which a plurality of pieces of target information are inserted into the fusion subtree.
  • the order of inserting a plurality of pieces of information into the fusion subtree is random.
  • the order of inserting a plurality of information into the fusion subtree may be an order based on other criteria.
  • the reorganization unit 203 inserts the fused subtree at a position based on the node of interest in the fused tree structure data (step S25).
  • the restoration unit 204 connects the second information in the fused subtree below the child nodes that were connected to the second information in the tree structure data that originally included the second information. Restoration is performed (step S26).
  • the restoration unit 204 is the second information in the fusion subtree, the second information does not have a child node in the tree structure data that originally included the second information. Then, the restoration below the child node is not performed for the second information.
  • the selection unit 205 determines whether or not there is first information that has child nodes in the tree structure data that originally included the first information in the fused subtree. Is determined (step S27).
  • step S27 a case where there is such first information will be described (Yes in step S27).
  • the selection unit 205 was connected to the first information in the child node connected to the first information in the fused subtree and the tree structure data originally including the first information.
  • the child node is selected as a new node of interest (step S28).
  • the information processing apparatus 20 repeats the processing from step S24 for the new node of interest selected in step S28.
  • step S27 when there exists a some 1st information applicable by step S27, the information processing apparatus 20 performs the process from step S28 and step S24 repeatedly about each 1st information.
  • step S27 If there is no corresponding first information in step S27, the information processing apparatus 20 ends the operation.
  • the operation of the information processing apparatus 20 will be shown as a specific example.
  • the information processing apparatus 20 merges two tree structure data a and tree structure data b to generate merged tree structure data c.
  • the acquisition unit 101 acquires the tree structure data a and the tree structure data b shown in FIG. 7 (step S21).
  • the information included in each node of the tree structure data a is represented by a solid rectangle.
  • Information included in each node of the tree structure data b is represented by a dotted rectangle.
  • information 0, information 1 and information 2 are included in the root node.
  • the root node includes information A, information B, and information C.
  • information having an identifier “X” is represented as information X.
  • “X” is a number or alphabet.
  • the identifier of information included in the child node of information X is represented as “XY”.
  • Information included in child nodes of information X is represented as information XY. “Y” is a number or alphabet.
  • information 00, information 01, and information 02 are included in child nodes of information 0 included in the root node of the tree structure data a.
  • child nodes of information A included in the root node of the tree structure data b include information AA, information AB, and information AC.
  • the fusion unit 202 acquires the upper limit number of information included in the node as information representing characteristics applied to the tree structure data after the fusion.
  • the fusion unit 202 outputs a user interface screen as shown in FIG. 8 to the output device 1003 and acquires information representing the upper limit number 5 via the input device 1004 (step S22).
  • the selection unit 205 selects the root node of the tree structure data “a” and the root node of the tree structure data “b” as nodes of interest (step S23).
  • the reorganization unit 203 generates a fused subtree c1 for a plurality of pieces of information including information included in the node of interest based on the evaluation result between the information (step S24).
  • information 0, information 1, information 2, information A, information B, and information C are included in the root node of the tree structure data a and the root node of the tree structure data b, which are nodes of interest. Therefore, the reorganization unit 203 inserts these pieces of information into the new fusion subtree c1 in a random order. For example, the first selected information is placed in the root node of the fused subtree c1.
  • the information selected next is information that has a high evaluation (for example, the output value of the evaluation function is equal to or greater than a threshold value) among the information already placed in the root node of the fusion subtree c1, Placed in the child node of the information.
  • the selected information is placed in the root node when the evaluation of any information already placed in the root node of the fused subtree c1 is low (for example, the output value of the evaluation function is less than the threshold value).
  • the fused subtree c1 shown in FIG. 9 is generated in this way.
  • information 0, information 1, information 2, information B, and information C are arranged at the root node of the fused subtree c1, and information A is arranged at a child node of information 1.
  • information 1 is first information having child nodes.
  • Information 0, information 2, information A, information B, and information C are second information having no child nodes.
  • the reorganization unit 203 inserts the fused subtree c1 shown in FIG. 9 at a position based on the node of interest in the tree structure data c (step S25).
  • the position based on the node of interest is the position of the root node of the tree structure data c.
  • the fused subtree c1 shown in FIG. 9 becomes the tree structure data c as it is.
  • the restoration unit 204 connects each of the second information in FIG. 9 below the child node connected to the second information in the tree structure data a or the tree structure data b (step S26).
  • the second information having no child node is information 0, information 2, information A, information B, and information C.
  • the child node connected to the information 0 includes the information 00, the information 01, and the information 02. Therefore, the restoration unit 204 connects child nodes including information 00, information 01, and information 02 to information 0 and below in FIG.
  • the restoration unit 204 connects the information below the information 2, the information A, the information B, and the information C below the child nodes connected to each piece of information in the original tree structure data a or the tree structure data b. .
  • the tree structure data c with the child nodes restored is as shown in FIG.
  • the selection unit 205 determines that the child node is connected to the information 1 that is the first information in the fused subtree c1 even in the tree structure data a originally included (Yes in step S27). .
  • the selection unit 205 selects the child node of information 1 in the fused subtree c1 as one of new nodes of interest.
  • This node contains information A.
  • the selection unit 205 selects the child node connected to the information 1 in the tree structure data a as another new node of interest.
  • This node includes information 10, information 11, and information 12 (step S28).
  • the information processing apparatus 20 repeats the operation from step S24 for the new node of interest selected in step S28.
  • the reorganization unit 203 generates a new fused subtree c2 based on the evaluation result between the information A, information 10, information 11, and information 12 included in the node of interest (step S24).
  • the reorganization unit 203 inserts the plurality of pieces of information into the fusion subtree c2 in the same order as before. Assume that the fused subtree c2 shown in FIG. 12 is generated. In FIG. 12, information A, information 10, information 11, and information 12 are all arranged in the root node of the fused subtree c2. In the fused subtree c2, information A, information 10, information 11 and information 12 are all second information having no child nodes.
  • the reorganization unit 203 inserts the fused subtree c2 shown in FIG. 12 at a position based on the node of interest in the tree structure data c (step S25).
  • information A which is one of the nodes of interest, is a child node of information 1 in the tree structure data c. Therefore, the reorganization unit 203 inserts the fused subtree c2 shown in FIG. 12 at the position of the child node of the information 1 in the tree structure data c. As a result, the tree structure data c is as shown in FIG.
  • the restoration unit 204 uses the second information of the fused subtree c2 in FIG. 13 as the subtree below the child node connected to the second information in the original tree structure data a or the tree structure data b. Are connected (step S26).
  • the restoration unit 204 connects child nodes including the information AA, the information AB, and the information AC below the information A in FIG. Further, in the other second information of the fused subtree c2 in FIG. 13, there is no child node connected in the original tree structure data a or the tree structure data b. Therefore, the restoration unit 204 does not restore the child information below the second information. As a result, the tree structure data c is as shown in FIG.
  • the selection unit 205 determines that there is no first information in the fused subtree c2 in FIG. 14 (No in step S27).
  • the information processing apparatus 20 ends the operation.
  • the information processing apparatus 20 fuses a plurality of tree structures in which information groups are represented based on the evaluation result of an evaluation function that evaluates the distance between information into a single tree structure more efficiently and accurately. can do.
  • the present embodiment has the following configuration in addition to the same configuration as that of the first embodiment of the present invention.
  • the fusion unit 202 includes a reorganization unit 203, a restoration unit 204, and a selection unit 205.
  • the reorganization unit 203 generates a fused subtree based on the evaluation result of the evaluation function for evaluating the distance between the information for a plurality of pieces of information respectively included in the plurality of nodes of interest.
  • information having child nodes in the fusion subtree is first information
  • information not having child nodes in the fusion subtree is second information.
  • the reorganization unit 203 inserts the fused subtree at a position based on the node of interest in the fused tree structure data.
  • the restoration unit 204 connects the second information in the fused subtree below the child node connected to the second information in the tree structure data originally including the second information. Restore.
  • the selection unit 205 selects the root node of the plurality of tree structure data as a node of interest, and causes the reorganization unit 203 and the restoration unit 204 to function.
  • the selection unit 205 has a child node connected to the first information in the fusion subtree and a child node connected to the first information in the tree structure data originally including the first information. Are selected as new attention nodes, and the reorganization unit 203 and the restoration unit 204 are caused to function. This is because the selection unit 205 repeatedly selects a new node of interest and causes the reorganization unit 203 and the restoration unit 204 to function.
  • the second information that does not have child nodes in the fusion subtree has a low evaluation with each other. Therefore, the original tree structure data is connected to the second information. Information contained in the child nodes is also regarded as having a low evaluation.
  • the information included in the child node connected to the second information is not subjected to the tree structure reorganization process based on the evaluation result between the information. , Streamlining the reorganization process.
  • the present embodiment evaluates the information included in the child node of the first information in the fusion subtree and the information included in the child node in the tree structure in which the first information was originally included. Is considered high.
  • This embodiment recursively performs the process of generating a fused subtree for a plurality of pieces of information that are highly evaluated. As a result, in the present embodiment, the tree structure data is accurately fused while the processing efficiency is improved.
  • information 0, information 1, information 2, information B, and information C are arranged at the same node when inserted into the fused subtree c1, and are low in evaluation. Since the evaluation results have correlation, it is expected that the information included in the child nodes of these information (or nodes in lower layers) also has a low evaluation.
  • the information included in the subtree below these pieces of information is used as it is without performing an evaluation process for comparing with other information. Inserted into the data. Therefore, the fusion process for generating the tree structure data c can be made efficient.
  • information A is arranged as a child node of information 1 in the fused subtree c1
  • information A and information 1 are highly evaluated. Since the evaluation results have a correlation, it is expected that the information A and the information included in the child nodes of the information 1 in the original tree structure data a (that is, the information 10 to 12) are highly evaluated. . Therefore, the information A and the information 10 to 12 are merged and reorganized in the hierarchy below the information 1 in the tree structure data c.
  • this embodiment can efficiently and accurately fuse tree structure data.
  • FIG. 15 shows a functional block configuration of an information processing apparatus 30 as a third embodiment of the present invention.
  • the information processing apparatus 30 is different from the information processing apparatus 20 according to the second embodiment of the present invention in that a fusion unit 302 is provided instead of the fusion unit 202.
  • the fusion unit 302 differs from the fusion unit 202 according to the second embodiment of the present invention in that it includes a selection unit 305 instead of the selection unit 205 and further includes an adjustment unit 306.
  • the information processing apparatus 30 and each functional block thereof can be configured by hardware elements similar to those of the first embodiment of the present invention described with reference to FIG.
  • the hardware configuration of the information processing apparatus 30 and each functional block thereof is not limited to the above-described configuration.
  • the adjustment unit 306 is closer to the reference for the evaluation result of the first information in the fused subtree and each information included below the grandchild node of the first information to be included below the child node of the first information. Adjust the fused subtree to be
  • the adjustment unit 306 includes an evaluation result with the first information among the information included below the grandchild node of the first information in the fusion subtree, and is included below the child node of the first information.
  • Information lower than the standard for detecting For example, a threshold based on an evaluation result between the first information and other information in the node including the first information is applied as a criterion for being included below the child node of the first information. Good.
  • the adjustment unit 306 deletes the detected information from the fusion subtree. At this time, the adjustment unit 306 stores the deleted information in the save area. The adjustment unit 306 then inserts each piece of information in the save area into the post-fusion tree structure data after completion of the repetitive processing by the selection unit 205.
  • the adjustment unit 306 may determine the position where the information of the save area is inserted as follows. For example, the adjustment unit 306 calculates an evaluation result based on an evaluation function between each piece of information included in the root node of the tree structure data after merging and information to be inserted. Then, the adjustment unit 306 calculates the evaluation result based on the evaluation function of the information included in the child node of the information having the highest evaluation and the information to be inserted, so that the information having the highest evaluation does not have the child node. Repeat until.
  • the adjustment unit 306 It may be inserted into a node.
  • the selecting unit 305 is configured as follows in addition to the same configuration as the selecting unit 205 in the second embodiment of the present invention. Specifically, even if there is no first information having a child node in the tree structure data originally included in the fused subtree, the selection unit 305 has such a node as follows. Are also selected as nodes of interest.
  • Such a node is a node that has included information contained in the save area in the original tree structure data, and has never been selected as a node of interest.
  • the selection unit 305 causes the reorganization unit 203 and the restoration unit 204 to function also for the node of interest selected in this way, as with the selection unit 205 in the second embodiment of the present invention.
  • the information processing apparatus 30 operates in the same manner as in the second embodiment of the present invention from step S21 to S26. Thereby, a fusion subtree is generated for a plurality of pieces of information included in the node of interest, and child nodes below the second information in the fusion subtree are restored.
  • the adjustment unit 306 includes an evaluation result with the first information among the information included below the grandchild node of the first information in the fusion subtree so that the evaluation result is included below the child node of the first information. Detect information that does not meet the criteria. Then, the adjustment unit 306 deletes the detected information from the fusion subtree and stores it in the save area (step S31).
  • step S28 executes step S28 if Yes in step S27. That is, if there is corresponding first information, a new node of interest is selected, and the processing from step S24 is repeated.
  • step S27 determines whether there is a node that includes information saved in the save area in the original tree structure data and has never been selected as a node of interest. (Step S32).
  • the selection unit 305 selects a node below the corresponding node in the original tree structure data as a new node of interest (step S33).
  • the information processing apparatus 30 repeats the processing from step S24 for the new node of interest selected in step S33.
  • step S32 If there are a plurality of corresponding nodes in step S32, the information processing apparatus 30 repeats the processes from step S33 and step S24 for each node.
  • step S32 if there is no corresponding node in step S32 (No in step S32), the adjustment unit 306 inserts the information stored in the save area in step S31 into the tree structure data after the fusion (step S34). ).
  • the information processing apparatus 30 ends the operation.
  • the operation of the information processing apparatus 30 will be shown as a specific example.
  • the information processing apparatus 30 merges two tree structure data d and tree structure data e to generate merged tree structure data f.
  • the information constituting the tree structure is a face image.
  • the evaluation function for evaluating the distance between the face images outputs a numerical value indicating the similarity between the face images.
  • the acquiring unit 101 acquires the tree structure data d and the tree structure data e shown in FIG. 17 (step S21).
  • the face image included in each node of the tree structure data d is represented by a solid rectangle.
  • the face image included in each node of the tree structure data e is represented by a dotted rectangle.
  • the root node includes face image 0, face image 1, and face image 2.
  • the root image includes a face image A, a face image B, and a face image C.
  • the face image with the identifier “X” is represented as a face image X.
  • a numeral or alphabet is applied to “X”.
  • the identifier of the face image included in the child node of the face image X is expressed as “XY”. Therefore, the face image included in the child node of the face image X is represented as the face image XY.
  • numerals or alphabets are applied to “Y”.
  • the identifier of the face image included in the child node of the face image XY is represented as “XYZ”. Therefore, the face image included in the child node of the face image XY is represented as the face image XYZ.
  • numerals or alphabets are applied to “Z”.
  • the face image 0, the face image 01, and the face image 02 are included in the child nodes of the face image 0 included in the root node of the tree structure data d.
  • child images of face image A included in the root node of tree structure data e include face image AA, face image AB, and face image AC.
  • the child nodes of the face image AA of the tree structure data e include the face image AAA and the face image AAB.
  • the fusion unit 302 acquires the upper limit number of face images included in the node as information representing characteristics applied to the tree structure data after the fusion.
  • the fusion unit 302 outputs the user interface screen shown in FIG. 18 to the output device 1003 and acquires information representing the upper limit number 4 via the input device 1004 (step S22).
  • the selection unit 305 selects the root node of the tree structure data d and the root node of the tree structure data e as nodes of interest (step S23).
  • the reorganization unit 203 generates a fused subtree f1 based on the similarity between the face images for a plurality of face images including the face images included in the node of interest (step S24).
  • face image 0, face image 1, face image 2, face image A, face image B, and face image C are included in the root node of tree structure data d and the root node of tree structure data e, which are nodes of interest. include.
  • the reorganization unit 203 inserts the plurality of face images into the fused subtree f1 in a random order.
  • the first selected face image is placed at the root node of the fused subtree f1.
  • the next selected face image is a face image that is already placed in the root node of the fused subtree f1 and has a face image whose similarity to the selected face image is greater than or equal to a threshold value. It is placed at the child node of the face image.
  • the selected face image is placed in the root node when the similarity with any face image already placed in the root node of the fused subtree f1 is less than the threshold value.
  • FIG. 19 Suppose that the fused subtree f1 shown in FIG. 19 is generated in this way.
  • face image 0, face image 1, face image 2, and face image B are arranged at the root node of the fused subtree f1.
  • a face image A is arranged at a child node of the face image 1.
  • a face image C is arranged at a child node of the face image B.
  • face image 1 and face image B are first information having child nodes. Further, the face image 0, the face image 2, the face image A, and the face image C are second information having no child nodes.
  • the reorganization unit 203 inserts the fused subtree f1 shown in FIG. 19 at a position based on the node of interest in the tree structure data f (step S25).
  • the position based on the node of interest is the position of the root node of the tree structure data f. Therefore, similarly to the specific example in the second embodiment of the present invention, the fused subtree f1 shown in FIG. 19 becomes the tree structure data f as it is.
  • the restoration unit 204 connects each of the second information in FIG. 19 below the child node connected to the second information in the tree structure data d or the tree structure data f (step S26).
  • the second information having no child node is the face image 0, the face image 2, the face image A, and the face image C.
  • the child nodes connected to the face image 0 include the face image 00, the face image 01, and the face image 02. Therefore, the restoration unit 204 restores by connecting child nodes including the face image 00, the face image 01, and the face image 02 to the face image 0 or lower in FIG.
  • the restoration unit 204 connects the face image 2, the face image A, and the face image C below the child nodes that are connected to each face image in the original tree structure data d or the tree structure data e. To do.
  • the tree structure data f in which the child nodes and below are restored is as shown in FIG.
  • the adjustment unit 306 includes the face image 1 that is one of the first information in the fusion subtree f1 in FIG. 20 and the face image AA, face image AB, face image AC, face included below the grandchild node. Similarities between the image AAA and the face image AAB are respectively calculated. Then, it is assumed that the adjustment unit 306 detects the face image AA as a face image whose similarity with the face image 1 is lower than a reference for inclusion below the child node of the face image 1. The adjustment unit 306 deletes the face image AA from the tree structure data f in FIG. 20 and stores it in the save area (step S31).
  • the adjustment unit 306 includes the face image B, which is another piece of the first information in the fusion subtree f1 in FIG. 20, and the face image CA, the face image CB, and the face image CC included below the grandchild node. Are calculated respectively. Then, it is assumed that the adjustment unit 306 detects the face image CB as a face image whose similarity with the face image B is lower than a reference for inclusion below the child node of the face image B. The adjustment unit 306 deletes the face image CB from the tree structure data f in FIG. 20 and stores it in the save area (step S31).
  • step S31 the tree structure data f from which the face image AA and the face image CB are deleted for adjustment is as shown in FIG. Further, the face image AA and the face image CB are stored in the save area.
  • the selection unit 305 determines that a child node is connected even in the tree structure data d originally included in the face image 1 which is one of the first information in the fusion subtree f1 in FIG. . In addition, the selection unit 305 determines that a child node is connected in the tree structure data e originally included in the face image B, which is another piece of the first information in the fusion subtree f1. (Yes in step S27).
  • the selection unit 305 further merges each of the first node of the face image 1 that is one of the first information and the second child node of the face image B that is the first information. Generate a subtree.
  • the selection unit 305 selects a child node of the face image 1 in the fusion subtree f1 as one of new nodes of interest.
  • This node includes a face image A.
  • the selection unit 305 selects the child node connected to the face image 1 in the tree structure data d as another new node of interest.
  • This node includes the face image 10, the face image 11, and the face image 12 (step S28).
  • the information processing apparatus 30 repeats the operation from step S24 for the new node of interest selected in step S28.
  • the reorganization unit 203 generates a new fusion subtree f2 based on the similarity between face images for the face image A, the face image 10, the face image 11, and the face image 12 included in the node of interest (step S24).
  • the reorganization unit 203 inserts the plurality of face images into the fused subtree f2 in the same manner as described above in a random order. Then, a fused subtree f2 shown in FIG. 23 is generated.
  • the face image A, the face image 10, the face image 11, and the face image 12 are all arranged at the root node of the fused subtree f2.
  • all of the face image A, the face image 10, the face image 11, and the face image 12 are second information having no child nodes.
  • the reorganization unit 203 inserts the fused subtree f2 shown in FIG. 23 at a position based on the node of interest in the tree structure data f (step S25).
  • the face image A that is one of the nodes of interest is a child node of the face image 1 in the tree structure data f. Therefore, the reorganization unit 203 inserts the fused subtree f2 at the position of the child node of the face image 1 in the tree structure data f. As a result, the tree structure data f becomes as shown in FIG.
  • the restoration unit 204 connects to the second information of the fused subtree f2 in FIG. 24 below the child node connected to the second information in the original tree structure data d or the tree structure data e. (Step S26).
  • the restoration unit 204 restores the child image including the face image AB and the face image AC other than the face image AA after the face image A in FIG.
  • the face image 10, the face image 11, and the face image 12, which are other second information of the fused subtree f2 in FIG. 24, are child nodes connected in the original tree structure data d or the tree structure data f. There is no. Therefore, the restoration unit 204 does not restore the child information below the second information. As a result, the tree structure data f with the child nodes restored is as shown in FIG.
  • the adjustment unit 306 does not adjust the fusion subtree f2 (step S31). Further, since there is no first information in the fused subtree f2 (No in step S27), the process proceeds to the next step S32. Step S32 will be described later.
  • the selection unit 305 selects a child node of the face image B in the fusion subtree f1 as one of new nodes of interest.
  • This node includes a face image C.
  • the selection unit 305 selects the child node connected to the face image B in the tree structure data e as another new node of interest.
  • This node includes a face image BA, a face image BB, and a face image BC (step S28).
  • the information processing apparatus 30 repeats the operation from step S24 for the new node of interest selected in step S28.
  • the reorganization unit 203 generates a new fusion subtree f3 for the face image C, face image BA, face image BB, and face image BC included in the node of interest based on the similarity between the face images (step S3). S24).
  • the reorganization unit 203 inserts the plurality of face images into the fusion subtree f3 in the same manner as described above in a random order. Then, a fused subtree f3 shown in FIG. 27 is generated.
  • the face image BA, the face image BC, and the face image C are arranged at the root node of the fused subtree f3. Further, the face image BB is arranged at a child node of the face image C. In this fused subtree f3, the face image C is first information having child nodes. Further, the face image BA, the face image BB, and the face image BC are the second information having no child nodes.
  • the reorganization unit 203 inserts the fused subtree f3 shown in FIG. 27 at a position based on the node of interest in the tree structure data f (step S25).
  • one of the nodes of interest is a child node of the face image B in the tree structure data f. Therefore, the reorganization unit 203 inserts the fused subtree f3 shown in FIG. 27 at the position of the child node of the face image B in the tree structure data f. As a result, the tree structure data f becomes as shown in FIG.
  • the restoration unit 204 does not restore the subtree below the child node for the second information in the fused subtree f3 (step S26).
  • the adjustment unit 306 does not adjust the fusion subtree f3 (step S31).
  • the selection unit 305 determines that a child node is connected to the face image C, which is the first information in the fused subtree f3, in the tree structure data e originally included (Yes in step S27). .
  • the selection unit 305 selects a child node of the face image C, which is the first information of the fused subtree f3 in FIG. 28, as one of the next nodes of interest.
  • This node includes a face image BB.
  • the selection unit 305 selects a child node of the face image C in the tree structure data e that originally included the face image C as another next node of interest.
  • This node included a face image CA, a face image CB, and a face image CC. However, since the face image CB is in the retreat area, the face image CA and the face image CC are included in this node (step S28).
  • the information processing apparatus 30 repeats the operation from step S24 for the new node of interest selected in step S28.
  • the reorganization unit 203 generates a new fusion subtree f4 for the face image BB, the face image CA, and the face image CC included in the node of interest based on the similarity between the face images (step S24). ).
  • the reorganization unit 203 inserts the plurality of face images into the fused subtree f4 in the same manner as described above in a random order. Then, it is assumed that the fused subtree f4 shown in FIG. 29 is generated. In FIG. 29, all of the face image BB, the face image CA, and the face image CC are arranged at the root node of the fused subtree f4. In the fused subtree f4, there is no first information having child nodes, and the face image BB, the face image CA, and the face image CC are second information having no child nodes.
  • the reorganization unit 203 inserts the fused subtree f4 shown in FIG. 29 at a position based on the node of interest in the tree structure data f (step S25).
  • one of the nodes of interest is a child node of the face image C in the tree structure data f. Therefore, the reorganization unit 203 inserts the fused subtree f4 shown in FIG. 29 at the position of the child node of the face image C in the tree structure data f. Thereby, the tree structure data f becomes as shown in FIG.
  • the restoration unit 204 does not restore the subtree below the child node for the second information (step S26).
  • the adjustment unit 306 does not make adjustments in the fused subtree f4 (step S31).
  • Step S27 since there is no 1st information in fusion subtree f4 (it is No at Step S27), it shifts to the following Step S32.
  • the node that included the face image CB saved in the save area in the tree structure data e has already been selected as the node of interest.
  • the node that included the face image AA saved in the save area in the tree structure data e has never been selected as the node of interest (Yes in step S32).
  • the selection unit 305 selects the node in which the saved face image AA was included in the tree structure data e and the nodes below the node as new attention nodes. These nodes include a face image AB, a face image AC, a face image AAA, and a face image AAB, excluding the saved face image AA (step S33).
  • the information processing apparatus 30 repeats the operation from step S24 for the new node of interest selected in step S33.
  • the reorganization unit 203 generates a new fused subtree f5 based on the similarity between face images for the face image AB, face image AC, face image AAA, and face image AAB included in the node of interest (step). S24).
  • the reorganization unit 203 inserts the plurality of face images into the fusion subtree f5 in the same manner as described above in a random order. Then, a fused subtree f5 shown in FIG. 32 is generated.
  • all of the face image AB, the face image AC, the face image AAA, and the face image AAB are arranged at the root node of the fused subtree f5.
  • the fused subtree f5 there is no first information having child nodes, and the face image AB, face image AC, face image AAA, and face image AAB are second information having no child nodes.
  • the reorganization unit 203 inserts the fused subtree f5 shown in FIG. 32 at a position based on the node of interest in the tree structure data f (step S25).
  • the node of interest is a child node of the face image A in the tree structure data e. Therefore, the reorganization unit 203 inserts the fused subtree f5 shown in FIG. 32 at the position of the child node of the face image A in the tree structure data f. Thereby, the tree structure data f becomes as shown in FIG.
  • the restoration unit 204 does not restore the subtree below the child node for the second information (step S26).
  • the adjustment unit 306 does not make adjustments in the fused subtree f5 (step S31).
  • step S34 the adjustment unit 306 executes step S34.
  • the adjustment unit 306 inserts the face image AA and the face image CB saved in the save area into the tree structure data f shown in FIG.
  • the face image AA has the highest similarity with the face image 0 in the root node, and the similarity satisfies the criteria for being included below the child node of the face image 0. Furthermore, the face image AA has the highest similarity with the face image 01 in the child node of the face image 0, and the similarity satisfies the criteria for being included below the child node of the face image 01. To do.
  • the face image 01 has no child nodes.
  • the adjustment unit 306 newly connects a child node to the face image 01 and arranges the face image AA (step S32).
  • the face image CB has the highest similarity with the face image 2 in the root node, and the similarity satisfies the criteria for being included below the child nodes of the face image 2. Furthermore, the face image CB has the highest similarity with the face image 22 in the child nodes of the face image 2, and the similarity satisfies the criteria for being included below the child nodes of the face image 22. To do. Further, the face image 22 has no child nodes.
  • the adjustment unit 306 newly connects a child node to the face image 22 and arranges the face image CB (step S32).
  • the information processing apparatus 30 converts a plurality of tree structures in which information groups are represented based on the evaluation result of an evaluation function that evaluates the distance between information into a single tree structure more efficiently and accurately. Can be merged.
  • This embodiment is configured as follows in addition to the same configuration as that of the second embodiment of the present invention.
  • the adjustment unit 306 determines the distance between the first information in the fused subtree and each piece of information included below the grandchild node of the first information from the criterion for including below the child node of the first information. Adjust the fused subtree to be close.
  • the adjustment unit 306 determines the distance from the first information among the information included below the grandchild node of the first information in the fusion subtree based on the criterion for being included below the child node of the first information. Remove distant information from the fused subtree. Then, the adjustment unit 306 inserts the deleted information into the fused tree structure data after completion of the iterative process.
  • the reorganization processing of the tree structure is not required between the second information and the following information having no child nodes in the fusion subtree. To improve efficiency.
  • the first subordinate information having a child node in the fused subtree and the second subordinate information contained in the child node are represented by the fused subtree.
  • the tree structure data is fused with high accuracy.
  • the evaluation between the first information and the information included below the grandchild node of the first information is included below the child node of the first information. Exclude those that do not meet the criteria.
  • information that does not satisfy the criteria is not included below the child nodes of certain information.
  • the excluded information is inserted into an appropriate position after the recursive processing for generating the tree structure data after the fusion is completed.
  • the present embodiment improves the accuracy of the structure of the tree structure data after the fusion while improving the processing efficiency.
  • the face image AA is arranged at the grandchild node of the face image 1 when the face image AA is restored to the fused subtree f1.
  • the face image AA is finally inserted into the child node of the face image 01 of the child node of the face image 0, and the accuracy of the composition of the tree structure data after the fusion is improved.
  • the face image CB is arranged at the grandchild node of the face image B when the face image CB is restored to the fused subtree f1.
  • the face image CB is finally inserted into the child node of the face image 22 of the child node of the face image 2, and the accuracy of the structure of the tree structure data after the fusion is improved.
  • the present embodiment improves the accuracy of the structure of the tree structure data after the fusion while improving the processing efficiency.
  • FIG. 35 shows a functional block configuration of an information processing apparatus 40 as the fourth embodiment of the present invention.
  • the information processing apparatus 40 is different from the information processing apparatus 20 according to the second embodiment of the present invention in that an acquisition unit 401 is replaced with the acquisition unit 101 and a fusion unit 402 is replaced with the fusion unit 202.
  • the storage unit 407 is different.
  • the information processing apparatus 40 and each functional block thereof can be configured by hardware elements similar to those of the first embodiment of the present invention described with reference to FIG.
  • the hardware configuration of the information processing apparatus 40 and each functional block thereof is not limited to the above-described configuration.
  • the storage unit 407 stores tree structure data constructed for each time or space range in which target information can be obtained.
  • the storage unit 407 may store tree structure data constructed according to the rules 1 to 4 described in the second embodiment of the present invention for information obtained in units of one day. Further, for example, the storage unit 407 may store tree structure data constructed according to the above-described rules 1 to 4 for information obtained in units of bases.
  • the acquisition unit 401 acquires information representing a specified time or space range as an input. Then, the acquisition unit 401 acquires, from the storage unit 407, a plurality of tree structure data constructed for a range having a portion that overlaps the designated time or space range.
  • the acquisition unit 401 acquires information representing a time range of the latest seven days as an input.
  • the acquisition unit 401 may acquire seven tree structure data constructed on a daily basis for the latest seven days.
  • the acquisition unit 401 acquires information representing a space range of a certain area as an input.
  • the acquisition unit 401 may acquire the tree structure data constructed for each base included in a certain area.
  • the fusion unit 402 generates fused tree structure data for an information group within a specified time or space range.
  • a plurality of tree-structured data constituting a range that does not exceed the specified time or space range is not necessarily stored in the storage unit 407.
  • the tree structure data constructed for the information group obtained in units of one day is stored in the storage unit 407.
  • the acquisition unit 401 has obtained information specifying a time range of “from yesterday's noon to today's noon”.
  • the acquisition unit 401 acquires yesterday's tree structure data and today's tree structure data, which are constructed for a range having a portion that overlaps the designated range “from yesterday's noon to today's noon”. It will be.
  • the fusion unit 402 excludes information that is not included in the specified time or space range from the information included in the acquired plurality of tree structure data, and then performs the present invention. It is comprised so that it may operate
  • the fusion unit 402 may perform such processing of excluding information outside the specified time or space before starting the fusion operation, or operate the reorganization unit 203 and the restoration unit 204. You may go when you do. Alternatively, the fusion unit 402 may perform the process of excluding information outside the range of the designated time or space after the fusion operation is finished.
  • the operation of the information processing apparatus 40 configured as described above is shown in FIG. Here, it is assumed that the process of excluding information outside the specified time or space is performed before the fusion operation is started.
  • the acquisition unit 401 acquires information representing a designated time or space range as an input (step S41).
  • the acquisition unit 401 acquires, from the storage unit 407, a plurality of tree structure data constructed for a range having a portion that overlaps the specified time or space range (step S42).
  • the fusion unit 402 excludes information included in the acquired plurality of tree structure data if there is information outside the specified time or space (step S43).
  • the information processing apparatus 40 executes steps S21 to S28 as in the second embodiment of the present invention.
  • the fusion unit 402 outputs the tree structure data after the fusion as the tree structure data in the designated time or space range (step S44).
  • the information processing apparatus 40 ends its operation.
  • the information processing apparatus 40 can efficiently and accurately generate tree structure data for a specified time or space range.
  • This embodiment is configured as follows in addition to the same configuration as that of the second embodiment of the present invention. That is, the storage unit 407 stores tree structure data constructed for each time or space range in which target information is obtained. Then, the acquisition unit 401 acquires, from the storage unit 407, a plurality of tree structure data constructed for a range having a portion that overlaps the designated time or space range. Then, the fusing unit 402 fuses the acquired tree structure data to generate the tree structure data after merging for the designated time or space range.
  • This embodiment improves the processing efficiency especially when the required time and space of the information group are small compared to the total amount of information group to be obtained.
  • the type of information included in the tree structure data is not limited thereto.
  • the output of the evaluation function for evaluating the distance between information is a numerical value indicating the similarity.
  • the output of the evaluation function for evaluating the distance between information is not limited to the similarity.
  • each of the above-described embodiments of the present invention the description has focused on an example in which there are two tree structure data to be merged.
  • each embodiment has the same effect by operating in the same way even when three or more tree structure data are merged.
  • each functional block of the information processing apparatuses 10 to 40 is realized by a CPU that executes a computer program stored in a memory.
  • the present invention is not limited to this, and some, all, or a combination of each functional block may be realized by dedicated hardware.
  • the function blocks of the information processing apparatuses 10 to 40 may be realized by being distributed among a plurality of apparatuses.
  • the operations of the information processing apparatuses 10 to 40 described with reference to the flowcharts are stored in a storage device (storage medium) of the computer apparatus as a computer program of the present invention. Keep it. Then, the computer program may be read and executed by the CPU. In such a case, the present invention is constituted by the code of the computer program or a storage medium.
  • a plurality of tree structure data representing an information group in a tree structure based on a distance between information, and in each of the tree structure data, a distance between information included in a child node connected to information included in a parent node Is a plurality of the tree structures configured such that the closer to the end of the tree structure data, the closer the distance between the information included in the nodes is closer to the end of the tree structure data.
  • An acquisition means for acquiring data In order to generate fused tree structure data obtained by fusing a plurality of the tree structure data, in a plurality of information composed of information included in nodes selected in the plurality of tree structure data, distances from other information For each piece of information that satisfies the condition indicating that the information is separated, the subtree below the information in the tree structure data that originally contained the information is included in the merged tree structure data as it is.
  • An information processing apparatus comprising:
  • the fusion means includes A fusion subtree is generated by fusing information included in each of a plurality of nodes of interest and reorganized to represent the tree structure, and the generated fusion subtree is based on the node of interest in the tree structure data after the fusion.
  • Reorganization means to insert into the position; When the information having child nodes in the fusion subtree is the first information and the information having no child nodes is the second information, the second information was originally included in the second information.
  • Restoration means for connecting and restoring the child nodes connected to the second information in the tree structure data; and After selecting a plurality of root nodes of the tree structure data as the node of interest and causing the reorganization means and the restoration means to function, child nodes connected to the first information in the fusion subtree, and Selecting the child node connected to the first information in the tree structure data originally including the first information as a new node of interest and causing the reorganization means and the restoration means to function.
  • the information processing apparatus according to appendix 1, characterized by comprising:
  • the fusion means includes The distance between the first information in the fusion subtree and each information included below the grandchild node of the first information is closer to a reference for inclusion below the child node of the first information.
  • the information processing apparatus according to appendix 1 or appendix 2, further comprising adjustment means for adjusting the fused subtree.
  • the adjustment means deletes information that is far from the first information from the fusion subtree and deletes the information included in the fusion subtree below the first node of the first information.
  • the information processing apparatus according to appendix 3, wherein the information is inserted into the fused tree structure data after the repetition processing by the selection unit is completed.
  • Storage means for storing the tree structure data constructed for each time or space range in which the target information is obtained;
  • the acquisition means acquires a plurality of the tree structure data each constructed for a range having a portion overlapping with a designated time or space range, from the storage means,
  • the fusion unit generates the post-fusion tree structure data for a specified time or space range by fusing a plurality of the tree structure data.
  • a plurality of tree structure data representing an information group in a tree structure based on a distance between information, and in each of the tree structure data, a distance between information included in a child node connected to information included in a parent node Is a plurality of the tree structures configured such that the closer to the end of the tree structure data, the closer the distance between the information included in the nodes is closer to the end of the tree structure data.
  • Get the data In order to generate fused tree structure data obtained by fusing a plurality of the tree structure data, in a plurality of information composed of information included in nodes selected in the plurality of tree structure data, distances from other information For each piece of information that satisfies the condition indicating that the information is separated, the subtree below the information in the tree structure data that originally included the information is included in the tree structure data after the fusion as it is, For a plurality of pieces of information satisfying the condition indicating that the distance between the information is close to each other, reorganization is performed so that subtrees below the information in the tree structure data originally including each information are merged and represented by the tree structure. A method of including the obtained subtree in the tree structure data after the fusion.
  • a child node connected to the first information in the fusion subtree and a child node connected to the first information in the tree structure data originally including the first information are newly set.
  • a plurality of tree structure data representing an information group in a tree structure based on a distance between information, and in each of the tree structure data, a distance between information included in a child node connected to information included in a parent node Is a plurality of the tree structures configured such that the closer to the end of the tree structure data, the closer the distance between the information included in the nodes is closer to the end of the tree structure data.
  • Getting data In order to generate fused tree structure data obtained by fusing a plurality of the tree structure data, in a plurality of information composed of information included in nodes selected in the plurality of tree structure data, distances from other information For each piece of information that satisfies the condition indicating that the information is separated, the subtree below the information in the tree structure data that originally contained the information is included in the merged tree structure data as it is.
  • the program recording medium which recorded the program for making a computer apparatus perform.
  • (Appendix 12) Selecting a plurality of tree structure data root nodes as the node of interest; A fused subtree is generated by reorganizing a plurality of pieces of information each included in the noted node to represent the tree structure, and the generated fused subtree is added to the focused node in the fused tree structure data. Inserting at a position based on When the information having child nodes in the fusion subtree is the first information and the information having no child nodes is the second information, the second information was originally included in the second information.
  • (Appendix 15) Storing the tree structure data constructed for each time or space range in which the target information is obtained in a storage means; Obtaining from the storage means a plurality of the tree structure data each constructed for a range having a portion overlapping with a designated time or space range; Generating the merged tree structure data for a specified time or space range by fusing a plurality of the tree structure data; 15.
  • a program recording medium according to any one of appendix 11 to appendix 14, wherein a program for causing the computer device to execute the program is recorded.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

情報処理装置(10)は、情報群を情報間の距離に基づく木構造で表した複数の木構造データを取得する取得部(101)と、複数の木構造データを融合した融合後の木構造データを生成するため、複数の木構造データにおいてそれぞれ選択されたノードに含まれる情報からなる複数の情報において、他の各情報との距離が離れていることを表す条件を満たす情報のそれぞれについては、該情報が元々含まれていた木構造データにおける該情報以下の部分木をそのまま融合後の木構造データに含め、情報間の距離が近いことを表す条件を互いに満たす複数の情報については、各情報が元々含まれていた前記木構造データにおける該情報以下の部分木を融合して前記木構造で表すよう再編した部分木を前記融合後の木構造データに含める融合部(102)と、を備える。

Description

情報処理装置、方法およびプログラム記録媒体
 本発明は、木構造で表された情報群を処理する技術に関する。
 情報群を木構造で表すことがある。これにより、高速に情報を検索することや、一定の特徴を持った情報群を高速に抽出することなどが可能になる。例えば、2つの情報間の距離の近さを評価する評価関数がある場合、距離が閾値未満である情報同士を枝で接続することによって、情報群を木構造で表すことができる。木構造において、同じ階層に含まれる情報群をノードと呼ぶ。特に、木構造において、根本(ルート)、つまり最上位の階層にあるノードを、ルートノードと呼ぶ。
 木構造のルートノードには、その木構造の代表となる情報群が含まれる。これらの情報群は、距離が離れていることを表す条件を互いに満たす。ルートノードに含まれた各情報には、子ノードが接続されてもよい。木構造において、子ノードは、ルートノードの下の階層にある。子ノードの上の階層を、親ノードと呼ぶ。
 子ノードは、接続している情報(親ノード)との距離が近いことを表す条件を満たす情報群である。子ノードに含まれる情報には、さらに子ノードが接続されてもよい。子ノードに接続された子ノードを、孫ノードと呼ぶ場合がある。
 木構造の末端に近づくほど、同一のノード内に含まれる情報間の距離がより近くなる。したがって、木構造のルートノードから順に、検索したい情報を含む子ノードを辿っていくことにより、検索したい情報との距離が近い(つまり類似する)情報を高速に検索することができる。
 このような木構造で表された情報群を処理する関連技術の一例が、特許文献1に記載されている。この関連技術は、情報間の類似度に基づき情報群を木構造で表し、高速な検索を実現している。
国際公開第2014/109127号
 複数の木構造がある場合、これら複数の木構造を融合する需要がある。例えば、1日に得られた情報群からなる木構造がある場合、数日間で得られた情報群からなる1つの木構造を得るために、1日に得られた情報群からなる複数の木構造をまとめる需要がある。また、異なる組織により生成された複数の木構造を1つの木構造にまとめる需要がある。また、互いに通信が困難な複数の環境において個別に生成された複数の木構造を、1つの木構造にまとめる需要がある。
 しかしながら、このような木構造の融合に関する技術は、特許文献1には記載されていない。
 複数の木構造を融合する手法として、一般的には、情報の数が少ない方の木構造の情報1つ1つを、情報の数が多い方の木構造に挿入していく手法が考えられる。しかしながら、この手法では、処理コストのオーダーが[情報の数が少ない方の木構造の情報の数]×log[情報の数が多い方の木構造の情報の数]程度になるので、処理に時間がかかるという問題がある。
 本発明は、上述の課題を解決するためになされたものである。すなわち、本発明は、情報間の距離に基づき情報群が表された複数の木構造を、より高速に1つの木構造に融合する技術を提供することを目的とする。
 本発明の情報処理装置は、情報群を情報間の距離に基づく木構造で表した複数の木構造データであって、それぞれの前記木構造データにおいて、親ノードに含まれる情報に接続される子ノードに含まれる情報間の距離は、前記親ノードに含まれる情報間の距離より近く、かつ、前記木構造データの末端により近いノードほど、該ノードに含まれる情報間の距離がより近くなるよう構成される複数の前記木構造データを取得する取得手段と、複数の前記木構造データを融合した融合後の木構造データを生成するため、複数の前記木構造データにおいてそれぞれ選択されたノードに含まれる情報からなる複数の情報において、他の各情報との距離が離れていることを表す条件を満たす情報のそれぞれについては、該情報が元々含まれていた前記木構造データにおける該情報以下の部分木をそのまま前記融合後の木構造データに含め、前記情報間の距離が近いことを表す条件を互いに満たす複数の情報については、各情報が元々含まれていた前記木構造データにおける該情報以下の部分木を融合して前記木構造で表すよう再編した部分木を前記融合後の木構造データに含める融合手段と、を備える。
 また、本発明の方法は、コンピュータ装置が、情報群を情報間の距離に基づく木構造で表した複数の木構造データであって、それぞれの前記木構造データにおいて、親ノードに含まれる情報に接続される子ノードに含まれる情報間の距離は、前記親ノードに含まれる情報間の距離より近く、かつ、前記木構造データの末端により近いノードほど、該ノードに含まれる情報間の距離がより近くなるよう構成される複数の前記木構造データを取得し、複数の前記木構造データを融合した融合後の木構造データを生成するため、複数の前記木構造データにおいてそれぞれ選択されたノードに含まれる情報からなる複数の情報において、他の各情報との距離が離れていることを表す条件を満たす情報のそれぞれについては、該情報が元々含まれていた前記木構造データにおける該情報以下の部分木をそのまま前記融合後の木構造データに含め、前記情報間の距離が近いことを表す条件を互いに満たす複数の情報については、各情報が元々含まれていた前記木構造データにおける該情報以下の部分木を融合して前記木構造で表すよう再編した部分木を前記融合後の木構造データに含める。
 また、本発明のプログラム記録媒体は、情報群を情報間の距離に基づく木構造で表した複数の木構造データであって、それぞれの前記木構造データにおいて、親ノードに含まれる情報に接続される子ノードに含まれる情報間の距離は、前記親ノードに含まれる情報間の距離より近く、かつ、前記木構造データの末端により近いノードほど、該ノードに含まれる情報間の距離がより近くなるよう構成される複数の前記木構造データを取得することと、複数の前記木構造データを融合した融合後の木構造データを生成するため、複数の前記木構造データにおいてそれぞれ選択されたノードに含まれる情報からなる複数の情報において、他の各情報との距離が離れていることを表す条件を満たす情報のそれぞれについては、該情報が元々含まれていた前記木構造データにおける該情報以下の部分木をそのまま前記融合後の木構造データに含め、前記情報間の距離が近いことを表す条件を互いに満たす複数の情報については、各情報が元々含まれていた前記木構造データにおける該情報以下の部分木を融合して前記木構造で表すよう再編した部分木を前記融合後の木構造データに含めることと、をコンピュータ装置に実行させる。
 本発明は、情報間の距離に基づき情報群が表された複数の木構造を、より高速に1つの木構造に融合する技術を提供することができる。
本発明の第1の実施の形態としての情報処理装置の機能ブロック構成を示す図である。 本発明の第1の実施の形態としての情報処理装置のハードウェア構成の一例を示す図である。 本発明の第1の実施の形態としての情報処理装置の動作を説明するフローチャートである。 本発明の第2の実施の形態としての情報処理装置の機能ブロック構成を示す図である。 本発明の第2の実施の形態において対象とする木構造データの一例を示す図である。 本発明の第2の実施の形態としての情報処理装置の動作を説明するフローチャートである。 本発明の第2の実施の形態の具体例において融合する対象となる2つの木構造データを示す図である。 本発明の第2の実施の形態の具体例において融合後の木構造データに適用する特性を表す情報を取得する画面の一例を示す図である。 本発明の第2の実施の形態の具体例において生成される融合部分木を示す図である。 本発明の第2の実施の形態の具体例において子ノードが復元された融合後の木構造データを示す図である。 本発明の第2の実施の形態の具体例において次に注目されるノードを示す図である。 本発明の第2の実施の形態の具体例において次に生成される融合部分木を示す図である。 本発明の第2の実施の形態の具体例において融合部分木が挿入された融合後の木構造データを示す図である。 本発明の第2の実施の形態の具体例において子ノードが復元された融合後の木構造データを示す図である。 本発明の第3の実施の形態としての情報処理装置の機能ブロック構成を示す図である。 本発明の第3の実施の形態としての情報処理装置の動作を説明するフローチャートである。 本発明の第3の実施の形態の具体例において融合する対象となる2つの木構造データを示す図である。 本発明の第3の実施の形態の具体例において融合後の木構造データに適用する特性を表す情報を取得する画面を示す図である。 本発明の第3の実施の形態の具体例において生成される融合部分木を示す図である。 本発明の第3の実施の形態の具体例において子ノードが復元された融合後の木構造データを示す図である。 本発明の第3の実施の形態の具体例において調整された融合後の木構造データを示す図である。 本発明の第3の実施の形態の具体例において次に注目されるノードを示す図である。 本発明の第3の実施の形態の具体例において次に生成される融合部分木を示す図である。 本発明の第3の実施の形態の具体例において融合部分木が挿入された融合後の木構造データを示す図である。 本発明の第3の実施の形態の具体例において子ノードが復元された融合後の木構造データを示す図である。 本発明の第3の実施の形態の具体例において次に注目されるノードを示す図である。 本発明の第3の実施の形態の具体例において次に生成される融合部分木を示す図である。 本発明の第3の実施の形態の具体例において次に注目されるノードを示す図である。 本発明の第3の実施の形態の具体例において次に生成される融合部分木を示す図である。 本発明の第3の実施の形態の具体例において融合部分木が挿入された融合後の木構造データを示す図である。 本発明の第3の実施の形態の具体例において次に注目されるノードを示す図である。 本発明の第3の実施の形態の具体例において次に生成される融合部分木を示す図である。 本発明の第3の実施の形態の具体例において融合部分木が挿入された融合後の木構造データを示す図である。 本発明の第3の実施の形態の具体例において退避した情報が挿入された融合後の木構造データを示す図である。 本発明の第4の実施の形態としての情報処理装置の機能ブロック構成を示す図である。 本発明の第4の実施の形態としての情報処理装置の動作を説明するフローチャートである。
 以下、本発明の実施の形態について、図面を参照して詳細に説明する。
 (第1の実施の形態)
 本発明の第1の実施の形態としての情報処理装置10の機能ブロック構成を図1に示す。図1において、情報処理装置10は、取得部101と、融合部102とを備える。
 ここで、情報処理装置10は、図2に示すようなハードウェア要素によって構成可能である。図2において、情報処理装置10は、CPU(Central Processing Unit)1001、メモリ1002、出力装置1003、および、入力装置1004を含む。
 メモリ1002は、RAM(Random Access Memory)、ROM(Read Only Memory)、補助記憶装置(ハードディスク等)等によって構成される。出力装置1003は、ディスプレイ装置やプリンタ等のように、情報を出力する装置によって構成される。入力装置1004は、キーボードやマウス等のように、ユーザ操作の入力を受け付ける装置によって構成される。
 この場合、情報処理装置10の各機能ブロックは、メモリ1002に格納されるコンピュータ・プログラムを読み込んで実行するとともに他の各部を制御するCPU1001によって構成される。なお、情報処理装置10およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
 次に、本実施の形態で対象とする木構造データについて説明する。木構造データは、情報群を情報間の距離に基づく木構造で表したデータである。情報間の距離は、例えば、情報間の距離を評価する評価関数の出力値によって表されることが可能である。
 木構造データでは、親ノードに含まれる情報に子ノードが接続されている。子ノードに含まれている情報間の距離は、親ノードに含まれる情報間の距離よりも近い。すなわち、木構造データは、該木構造データの末端により近いノードほど、該ノードに含まれる情報間の距離がより近くなるよう構成される。
 次に、各機能ブロックの詳細について説明する。
 取得部101は、複数の木構造データを取得する。例えば、取得部101は、入力装置1004を介して複数の木構造データを取得してもよい。また、取得部101は、メモリ1002から複数の木構造データを取得してもよい。また、取得部101は、ネットワークインタフェースや可搬型記憶媒体(図示せず)を介して、複数の木構造データを取得してもよい。
 融合部102は、複数の木構造データを融合する。
 詳細には、融合部102は、複数の木構造データからそれぞれノードを選択して、選択したノードに含まれる情報を取得し、取得した情報を合わせることによって、融合した木構造データのノードを得る。
 ここで、融合部102が複数の木構造データから選択するノードは、例えば、ルートノードであってもよいし、あるいは、部分木のルートノードであってもよい。ただし、選択されるノードは、これらに限らない。
 また、融合部102は、複数の木構造データからそれぞれ選択したノードから上述のようにして得られた複数の情報において、他の各情報との距離が離れていることを表す条件を満たす1つ以上の情報を特定する。
 そして、融合部102は、このように特定した1つ以上の情報については、該情報が元々含まれていた木構造データにおける該情報以下の部分木を、そのまま融合後の木構造データに含める。ここで、木構造において、「ある情報以下の部分木」とは、該情報を根とする部分木、つまり、その情報から分岐している子ノード、および、それらの子ノードよりも下の階層にある全てのノードによって構成される木構造のことである。
 また、融合部102は、複数の木構造データでそれぞれ選択されたノードから上述のようにして得られた複数の情報において、情報間の距離が近いことを表す条件を互いに満たす複数の情報を特定する。そして、融合部102は、このように特定した複数の情報については、各情報が元々含まれていた木構造データにおける該情報以下の部分木を融合することによって、1つの木構造に再編する。そして、融合部102は、再編した木構造を、部分木として、融合後の木構造データに含める。
 以上のように構成された情報処理装置10の動作を、図3を参照して説明する。
 まず、取得部101は、融合の対象となる(オリジナルの)複数の木構造データを取得する(ステップS11)。
 次に、融合部102は、複数の木構造データからそれぞれ選択されたノードに含まれる複数の情報において、他の各情報との距離が離れていることを表す条件を満たす1つ以上の情報を特定する(ステップS12)。
 次に、融合部102は、ステップS12で特定した各情報について、該情報が元々含まれていたオリジナルの木構造データにおける該情報以下の部分木を、融合後の木構造データに含める(ステップS13)。
 例えば、融合部102は、ステップS12で特定した情報が複数ある場合、それらの情報を、融合後の木構造データにおける同一のノードに含めてもよい。そして、融合部102は、それらの情報より下の階層に、それぞれ、オリジナルの木構造データにおける部分木を接続すればよい。
 次に、融合部102は、複数の木構造データにおいてそれぞれ選択されたノードから上述のようにして得られた複数の情報において、情報間の距離が近いことを表す条件を互いに満たす複数の情報を特定する(ステップS14)。
 その後、融合部102は、ステップS14で特定した複数の各情報について、該情報が元々含まれていたオリジナルの木構造データにおける該情報以下の部分木同士を融合して、一つの木構造に再編する(ステップS15)。
 そして、融合部102は、再編した木構造を融合後の木構造データに部分木として挿入する(ステップS16)。
 例えば、融合部102は、再編した木構造のルートノードを、融合後の木構造データにおいてステップS12で特定した情報を配置したノードと統合してもよい。
 以上で、情報処理装置10は、動作を終了する。
 次に、本発明の第1の実施の形態の効果について述べる。
 本発明の第1の実施の形態は、情報間の距離に基づき情報群が表された複数の木構造を、より高速に1つの木構造に融合することができる。
 その理由について説明する。本実施の形態では、取得部101が、情報群が木構造で表された複数の木構造データを取得する。それぞれの木構造データでは、子ノードに含まれる情報間の距離は、親ノードに含まれる情報間の距離より近い。したがって、木構造データの末端に近づくほど、ノードに含まれる情報間の距離がより近くなる。
 そして、融合部102が、複数の木構造データにおいてそれぞれ選択されたノードに含まれる情報からなる複数の情報において、他の各情報との距離が離れていることを表す条件(例えば、評価関数の出力値が閾値以上)を満たす情報を特定する。そして、融合部102が、このように特定した情報については、該情報が元々含まれていた木構造データにおける該情報以下の部分木を、そのまま融合後の木構造データに含める。また、融合部102が、複数の木構造データにおいてそれぞれ選択されたノードに含まれる情報からなる複数の情報において、情報間の距離が近いことを表す条件(例えば、評価関数の出力値が閾値未満)を互いに満たす複数の情報を特定する。
 そして、融合部102が、このように特定した情報については、各情報が元々含まれていた木構造データにおける該情報以下の部分木を融合して、木構造で表すよう再編した部分木を生成する。そして、融合部102が、再編した部分木を、融合後の木構造データに含める。
 ここで、木構造データでは、ある情報を根とする部分木は、その情報との距離が近い(つまり類似している)情報で構成されている。逆に、距離が離れている(つまり類似していない)2つの情報を根とする部分木に含まれる情報同士は、距離が遠いことが期待される。
 そのため、オリジナルの木構造データにおいて、距離が離れている情報以下の部分木同士は、一本の部分木に融合されなくても、つまり、別々の部分木としてそのまま融合後の木構造データに適用されても、融合後の木構造データの構成に与える影響は少ないと考えられる。
 本実施の形態では、互いに距離が近い情報以下の部分木同士については、それらを融合することによって、一つの木構造に再編する。一方、距離が離れている情報以下の部分木については、一つの木構造に再編しない。そのため、情報間の距離の評価および木構造の再編に要する処理コストを大幅に削減することができる。
 (第2の実施の形態)
 次に、本発明の第2の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第1の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
 まず、本発明の第2の実施の形態としての情報処理装置20の機能ブロック構成を図4に示す。図4において、情報処理装置20は、本発明の第1の実施の形態としての情報処理装置10に対して、融合部102に替えて融合部202を備える点が異なる。融合部202は、再編部203と、復元部204と、選択部205とを有する。
 なお、情報処理装置20およびその各機能ブロックは、図2を参照して説明した本発明の第1の実施の形態と同様のハードウェア要素によって構成可能である。ただし、情報処理装置20およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
 ここで、本実施の形態で対象とする木構造データについて説明する。本実施の形態では、木構造データにおける情報間の距離の近さを、評価関数により評価する。
 評価関数は、2つの情報間の距離の近さを評価する関数である。評価結果は相関性を有するものとする。例えば、情報Aと情報Bとの間の距離の近さを表す評価結果(すなわち評価関数の出力値)が所定の閾値以上であり、かつ、情報Aと情報Cとの間の距離の近さを表す評価結果も所定の閾値以上であるとする。この場合、情報Bと情報Cとの間の距離の近さを表す評価結果も閾値以上である。
 以降、評価関数の出力値が所定条件を満たす(例えば、閾値以上である)ことを、評価が高いとも記載する。また、評価関数の出力値が所定条件を満たさない(例えば、閾値未満である)ことを、評価が低いとも記載する。また、評価関数の出力値を、評価結果または評価の高さとも記載する。
 例えば、木構造データを構成する情報が文章であるとする。この場合、評価関数は、2つの文章の文体の類似度を、評価結果として出力してもよい。ここで、類似度は、例えば、2つの文章の文体の特徴量がどれぐらい一致するかを表す数値であってよい。
 また、例えば、木構造データを構成する情報が画像であるとする。この場合、評価関数は、2つの画像から人間が受ける印象の類似度を、評価結果として出力してもよい。また、例えば、木構造を構成する情報が顔画像であるとする。この場合、評価関数は、2つの顔画像が同一人物である可能性を示す類似度を、評価結果として出力してもよい。なお、木構造を構成する情報の種類および評価関数は、上述の例に限定されない。
 このような評価関数を用いて、本実施の形態における木構造データは、次の法則に従って構成される。
1.ルートノードには、互いに評価が低い(評価関数の出力値が前述した所定条件を満たさない)複数の情報が置かれる。
2.ルートノードに含まれる情報には、評価が高い(つまり該情報との距離が近い)情報群が、子ノードとして接続される。
3.子ノードに含まれる情報群の評価の高さは、親ノードに含まれる情報群の評価の高さ以上である。
4.子ノードに含まれる情報群の評価は、木構造の末端に近づくほど高くなる。
 この法則に従って構成された木構造データには、例えば、あるノードに異なる情報Aおよび情報Bが含まれるとする。このとき、情報Aの子ノードに含まれる情報と、情報Bの子ノードに含まれる情報との間の距離の近さは、情報Aの子ノードに含まれる情報間の距離の近さ、および、情報Bの子ノードに含まれる情報間の距離の近さと比較して、より近くはないことが予想される。この傾向は、子ノードがルートノードに近いほど強くなる。
 このような木構造データの一例を図5に示す。図5において、ルートノードには、情報0、情報1および情報2が含まれる。情報0、情報1および情報2は、互いの間の評価の高さがR1未満であってもよい。
 また、情報0に接続される子ノードには、情報00、情報01および情報02が含まれる。情報0と、情報00、情報01および情報02との間のそれぞれの評価の高さは、R1以上である。また、情報00、情報01および情報02は、互いに評価の高さがR2未満である。
 また、情報00に接続される子ノードには、情報001および情報002が含まれる。情報00と、情報001および情報002との間の評価の高さは、それぞれR2以上である。なお、R2は、R1より大きい値である。
 次に、融合部202が有する各機能ブロックについて説明する。
 再編部203は、注目するノードに含まれる情報について、評価関数によってそれぞれ評価し、情報間の評価結果(評価関数の出力値。情報間の距離の近さを表す)に基づいて、注目するノードに含まれる情報からなる融合部分木を生成する。融合部分木は、該当する複数の情報について上述した法則1~4に従って構築される。ここで、融合部分木において、子ノードを持つ情報を第1の情報と記載する。また、子ノードを持たない情報を第2の情報と記載する。なお、注目するノードの詳細については後述する。
 また、再編部203は、融合後の木構造データにおいて、「注目するノードに基づく位置」に、融合部分木を挿入する。以下で、注目するノードに基づく位置について説明する。
 例えば、注目するノードが、オリジナルの木構造データのルートノードであったとする。この場合、注目するノードに基づく位置とは、融合後の木構造データにおけるルートノードの位置である。
 また、例えば、注目するノードの1つが、後述する前回の繰り返し処理で生成された融合部分木における第1の情報の子ノードであったとする。以降、前回の繰り返し処理で生成された融合部分木を、単に前回の融合部分木とも記載する。この場合、注目するノードに基づく位置とは、融合後の木構造データに挿入された前回の融合部分木において注目するノードの1つとされた子ノードの位置である。
 復元部204は、融合部分木における第2の情報に、その第2の情報が含まれていたオリジナルの木構造データにおいてその第2の情報に接続されていた子ノード以下の部分木を接続することによって、その第2の情報以下の木構造を、融合後の木構造データにおいて復元する。
 選択部205は、初めに、複数の木構造データのルートノードを注目するノードとして選択する。その後、選択部205は、前回の融合部分木における第1の情報に接続された子ノードと、その第1の情報が元々含まれていた木構造データにおいてその第1の情報に接続されていた子ノードとを、新たな注目するノードとして選択する。
 以降、選択部205は、新たな注目するノードを選択して、再編部203および復元部204は、選択された注目するノードに基づいて、オリジナルの木構造データの再編および復元を繰り返す。この処理のことを、以下では繰り返し処理と呼ぶ。
 なお、融合部202は、これらの各機能ブロックを機能させる前に、融合後の木構造データに適用される特性を表す情報を取得してもよい。特性を表す情報としては、例えば、1つのノードが持つことができる情報の上限数があるが、これに限らない。
 融合部202は、特性を表す情報を、入力装置1004を介して取得してもよい。また、融合部202は、特性を表す情報を、メモリ1002から取得してもよい。また、融合部202は、取得部101によって取得される複数の木構造データの特性を表す情報を、融合後の木構造データに適用される特性を表す情報として取得してもよい。
 以上のように構成された情報処理装置20の動作について、図6を参照して説明する。
 図6では、まず、融合部202は、複数の木構造データを取得する(ステップS21)。
 次に、融合部202は、融合後の木構造データに適用される特性を表す情報を取得する(ステップS22)。
 次に、選択部205は、複数の木構造データのそれぞれのルートノードを、注目するノードとして選択する(ステップS23)。
 次に、再編部203は、注目するノードに含まれる複数の情報について、情報間の評価結果に基づいて融合部分木を生成する(ステップS24)。
 前述のように、子ノードを持つ情報を第1の情報と記載し、子ノードを持たない情報を第2の情報と記載する。
 なお、対象となる複数の情報を融合部分木に挿入していく順序によって、生成される融合部分木の構成は異なることもあると考えられる。ここでは、複数の情報を融合部分木に挿入する順序は、ランダムであるとする。ただし、複数の情報を融合部分木に挿入する順序は、その他の基準による順序であってもよい。
 次に、再編部203は、融合後の木構造データにおいて注目するノードに基づく位置に、融合部分木を挿入する(ステップS25)。
 次に、復元部204は、融合部分木における第2の情報に、その第2の情報が元々含まれていた木構造データにおいてその第2の情報に接続されていた子ノード以下を接続して復元する(ステップS26)。
 このとき、復元部204は、融合部分木における第2の情報であっても、その第2の情報が元々含まれていた木構造データにおいてその第2の情報が子ノードを持っていなかった場合、その第2の情報に対する子ノード以下の復元を行わない。
 次に、選択部205は、融合部分木における第1の情報であって、その第1の情報が元々含まれていた木構造データにおいて子ノードを持っていた第1の情報があるか否かを判断する(ステップS27)。
 ここで、そのような第1の情報がある場合について説明する(ステップS27でYes)。この場合、選択部205は、融合部分木における第1の情報に接続された該子ノードと、その第1の情報が元々含まれていた木構造データにおいてその第1の情報に接続されていた子ノードとを、新たな注目するノードとして選択する(ステップS28)。
 そして、情報処理装置20は、ステップS28で選択した新たな注目するノードについて、ステップS24からの処理を繰り返す。
 なお、ステップS27で該当する複数の第1の情報がある場合、情報処理装置20は、それぞれの第1の情報について、ステップS28およびステップS24からの処理の繰り返しを実行する。
 また、ステップS27で該当する第1の情報がない場合、情報処理装置20は、動作を終了する。
 次に、情報処理装置20の動作を具体例で示す。この具体例では、情報処理装置20は、2本の木構造データaおよび木構造データbを融合して、融合後の木構造データcを生成するものとする。
 まず、取得部101は、図7に示す木構造データaおよび木構造データbを取得したとする(ステップS21)。
 図7において、木構造データaの各ノードに含まれる情報は、実線の矩形で表される。また、木構造データbの各ノードに含まれる情報は、点線の矩形で表される。木構造データaでは、ルートノードに、情報0、情報1および情報2が含まれる。また、木構造データbでは、ルートノードに、情報A、情報Bおよび情報Cが含まれる。なお、図7では、識別子が「X」の情報を、情報Xと表している。「X」には、数字またはアルファベットが適用される。また、情報Xの子ノードに含まれる情報の識別子を、「XY」と表している。情報Xの子ノードに含まれる情報は、情報XYと表される。「Y」には、数字またはアルファベットが適用される。
 例えば、図7では、木構造データaのルートノードに含まれる情報0の子ノードには、情報00、情報01および情報02が含まれている。また、木構造データbのルートノードに含まれる情報Aの子ノードには、情報AA、情報ABおよび情報ACが含まれている。
 次に、融合部202は、融合後の木構造データに適用される特性を表す情報として、ノードに含まれる情報の上限数を取得する。この具体例では、融合部202は、図8に示すようなユーザインタフェース画面を出力装置1003に出力し、入力装置1004を介して、上限数5を表す情報を取得したとする(ステップS22)。
 次に、選択部205は、木構造データaのルートノードと木構造データbのルートノードとを、注目するノードとして選択する(ステップS23)。
 次に、再編部203は、注目するノードに含まれる情報からなる複数の情報について、情報間の評価結果に基づいて融合部分木c1を生成する(ステップS24)。
 ここでは、注目するノードである木構造データaのルートノードおよび木構造データbのルートノードには、情報0、情報1、情報2、情報A、情報Bおよび情報Cが含まれている。そこで、再編部203は、これらの複数の情報をランダムな順序で、新しい融合部分木c1に挿入していく。例えば、最初に選択された情報は、融合部分木c1のルートノードに置かれる。
 また、次に選択された情報は、融合部分木c1のルートノードに既に置かれた情報のうちで、評価が高い(例えば、評価関数の出力値が閾値以上である)情報があれば、その情報の子ノードに置かれる。また、選択された情報は、融合部分木c1のルートノードに既に置かれたいずれの情報とも評価が低い(例えば、評価関数の出力値が閾値未満である)場合、そのルートノードに置かれる。
 このようにして、図9に示す融合部分木c1が生成されたとする。図9では、情報0、情報1、情報2、情報Bおよび情報Cが融合部分木c1のルートノードに配置され、情報1の子ノードに情報Aが配置されている。ここで、図9において、情報1は、子ノードを持つ第1の情報である。また、情報0、情報2、情報A、情報Bおよび情報Cは、子ノードを持たない第2の情報である。
 そして、再編部203は、図9に示した融合部分木c1を、木構造データcにおける注目するノードに基づく位置に挿入する(ステップS25)。
 ここでは、注目するノードが木構造データaおよび木構造データbのルートノードであったため、注目するノードに基づく位置は、木構造データcのルートノードの位置である。換言すると、図9に示した融合部分木c1が、そのまま木構造データcとなる。
 次に、復元部204は、図9における第2の情報のそれぞれに、木構造データaまたは木構造データbにおいてその第2の情報に接続されていた子ノード以下を接続する(ステップS26)。
 ここで、図9において、前述したように、子ノードを持たない第2の情報は、情報0、情報2、情報A、情報Bおよび情報Cである。また、例えば、情報0が元々含まれていた木構造データaにおいて、情報0に接続されていた子ノードには、情報00、情報01および情報02が含まれている。そこで、復元部204は、図9の情報0以下に、情報00、情報01および情報02を含む子ノードを接続する。
 同様に、復元部204は、情報2、情報A、情報Bおよび情報C以下にも、オリジナルの木構造データaまたは木構造データbにおいてこれらの各情報に接続されていた子ノード以下を接続する。これにより、子ノードが復元された木構造データcは、図10に示す通りとなる。
 次に、選択部205は、融合部分木c1における第1の情報である情報1には、元々含まれていた木構造データaにおいても子ノードが接続されていたと判断する(ステップS27でYes)。
 そこで、選択部205は、図11に示すように、融合部分木c1における情報1の子ノードを、新たな注目するノードの1つとして選択する。このノードには、情報Aが含まれている。また、選択部205は、木構造データaにおいて情報1に接続されていた子ノードを、新たな注目するノードのもう1つとして選択する。このノードには、情報10、情報11および情報12が含まれている(ステップS28)。
 そこで、次に、情報処理装置20は、ステップS28で選択した新たな注目するノードについて、ステップS24からの動作を繰り返す。
 すなわち、再編部203は、注目するノードに含まれる情報A、情報10、情報11および情報12について、情報間の評価結果に基づいて新たな融合部分木c2を生成する(ステップS24)。
 具体的には、再編部203は、これらの複数の情報をランダムな順序で、先ほどと同様に融合部分木c2に挿入していく。そして、図12に示す融合部分木c2が生成されたとする。図12では、情報A、情報10、情報11および情報12の全てが、融合部分木c2のルートノードに配置されている。また、この融合部分木c2では、情報A、情報10、情報11および情報12の全てが、子ノードを持たない第2の情報である。
 次に、再編部203は、図12に示した融合部分木c2を、木構造データcにおける注目するノードに基づく位置に挿入する(ステップS25)。
 ここでは、注目するノードの1つである情報Aは、木構造データcにおける情報1の子ノードである。そこで、再編部203は、木構造データcにおける情報1の子ノードの位置に、図12に示した融合部分木c2を挿入する。これにより、木構造データcは、図13に示す通りとなる。
 次に、復元部204は、図13における融合部分木c2の第2の情報に、オリジナルの木構造データaまたは木構造データbにおいてその第2の情報に接続されていた子ノード以下の部分木を接続する(ステップS26)。
 ここで、図13における融合部分木c2の第2の情報のうち、情報Aだけが、元々含まれていた木構造データbにおいて子ノードを持つ。この子ノードには、情報AA、情報ABおよび情報ACが含まれている。そこで、復元部204は、図13における情報A以下に、情報AA、情報ABおよび情報ACを含む子ノードを接続する。また、図13における融合部分木c2の他の第2の情報には、オリジナルの木構造データaまたは木構造データbにおいて接続されていた子ノードがない。そこで、復元部204は、これらの第2の情報については、子ノード以下の復元を行わない。これにより、木構造データcは、図14に示した通りとなる。
 次に、選択部205は、図14における融合部分木c2には第1の情報がないと判断する(ステップS27でNo)。
 そこで、情報処理装置20は、動作を終了する。
 このようにして、木構造データaおよび木構造データbが融合されて、図14に示した木構造データcが生成される。
 次に、本発明の第2の実施の形態の効果について述べる。
 本実施の形態としての情報処理装置20は、情報間の距離を評価する評価関数の評価結果に基づき情報群が表された複数の木構造を、より効率的により精度よく1つの木構造に融合することができる。
 その理由について説明する。本実施の形態では、本発明の第1の実施の形態と同様の構成に加えて、次の構成を有する。
 すなわち、融合部202が、再編部203と、復元部204と、選択部205とを有する。再編部203が、注目する複数のノードにそれぞれ含まれる複数の情報について、情報間の距離を評価する評価関数の評価結果に基づいて融合部分木を生成する。ここで、融合部分木において子ノードを持つ情報が第1の情報とされ、融合部分木において子ノードを持たない情報が第2の情報とされる。
 そして、再編部203が、融合後の木構造データにおいて注目するノードに基づく位置に、融合部分木を挿入する。また、復元部204が、融合部分木における第2の情報には、その第2の情報が元々含まれていた木構造データにおいてその第2の情報に接続されていた子ノード以下を接続して復元する。そして、選択部205が、複数の木構造データのルートノードを注目するノードとして選択して再編部203および復元部204を機能させる。
 その後、選択部205が、融合部分木における第1の情報に接続された子ノードと、その第1の情報が元々含まれていた木構造データにおいてその第1の情報に接続されていた子ノードとを新たな注目するノードとして選択して再編部203および復元部204を機能させる。そして、選択部205が、新たな注目するノードを選択して再編部203および復元部204を機能させることを繰り返すからである。
 このように、本実施の形態は、融合部分木において子ノードを持たない第2の情報間については、互いに評価が低いため、オリジナルの木構造データにおいて、それらの第2の情報に接続していた子ノードに含まれる情報同士も、互いに評価が低いとみなしている。
 そのため、本実施の形態は、オリジナルの木構造データにおいて、第2の情報に接続していた子ノードに含まれる情報については、情報間の評価結果に基づく木構造の再編処理を行わないことによって、再編処理を効率化している。
 また、融合部分木において子ノードを持つ第1の情報とその子ノードに含まれる情報とについては、評価が高い。このため、本実施の形態は、融合部分木における第1の情報の子ノードに含まれる情報と、第1の情報が元々含まれていた木構造における子ノードに含まれる情報とについては、評価が高いとみなしている。
 本実施の形態は、それらの評価が高い複数の情報については、融合部分木を生成する処理を再帰的に行っている。これにより、本実施の形態は、処理を効率化しながらも、精度よく木構造データを融合している。
 例えば、上述の具体例では、情報0、情報1、情報2、情報Bおよび情報Cは、融合部分木c1に挿入された際に同じノードに配置されており、互いに評価が低い。評価結果が相関性を有するため、これらの情報の子ノード(あるいはさらに下の階層のノード)に含まれる情報同士も、互いに評価が低いことが予想される。
 そこで、本実施の形態では、オリジナルの木構造データにおいて、これらの情報以下の部分木に含まれていた情報を、他の情報と比較する評価処理を行うことなく、そのまま、融合後の木構造データに挿入している。したがって、木構造データcを生成する融合処理を、効率化することができる。
 また、本実施の形態では、情報Aは、融合部分木c1において、情報1の子ノードとして配置されているので、情報Aと情報1とは互いに評価が高い。評価結果が相関性を有するため、情報Aと、オリジナルの木構造データaにおける情報1の子ノードに含まれていた情報(すなわち情報10~12)とは、互いに評価が高いことが予想される。そこで、情報Aおよび情報10~12は、木構造データcでは、情報1の下の階層で融合されて再編されている。
 こうして生成された木構造データcの全体を見たとき、互いに評価が高い情報ほど末端に近い同じノードに配置されていることがわかる。つまり、オリジナルの木構造データの特徴が保たれたまま、融合後の木構造データcが効率よく生成されている。
 このように、本実施の形態は、効率的に精度よく木構造データを融合することができる。
 (第3の実施の形態)
 次に、本発明の第3の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第2の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
 まず、本発明の第3の実施の形態としての情報処理装置30の機能ブロック構成を図15に示す。図15において、情報処理装置30は、本発明の第2の実施の形態としての情報処理装置20に対して、融合部202に替えて融合部302を備える点が異なる。融合部302は、本発明の第2の実施の形態における融合部202に対して、選択部205に替えて選択部305を備え、さらに調整部306を有する点が異なる。
 なお、情報処理装置30およびその各機能ブロックは、図2を参照して説明した本発明の第1の実施の形態と同様のハードウェア要素によって構成可能である。ただし、情報処理装置30およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
 調整部306は、融合部分木における第1の情報と、第1の情報の孫ノード以下に含まれる各情報との評価結果が、第1の情報の子ノード以下に含まれるための基準より近くなるよう、融合部分木を調整する。
 具体的には、調整部306は、融合部分木における第1の情報の孫ノード以下に含まれる情報のうち、第1の情報との評価結果が、第1の情報の子ノード以下に含まれるための基準より低い情報を検出する。第1の情報の子ノード以下に含まれるための基準としては、例えば、第1の情報が含まれるノードにおける第1の情報と他の情報との間の評価結果に基づく閾値が適用されてもよい。
 そして、調整部306は、検出した情報を、融合部分木から削除する。このとき、調整部306は、削除した情報を退避領域に記憶しておく。そして、調整部306は、選択部205による繰り返し処理の完了後、退避領域の各情報を、融合後の木構造データに挿入する。
 このとき、調整部306は、退避領域の情報を挿入する位置を、次のようにして決定すればよい。例えば、調整部306は、融合後の木構造データのルートノードに含まれる各情報と、挿入対象の情報との評価関数による評価結果を算出する。そして、調整部306は、評価が最も高い情報の子ノードに含まれる各情報と、挿入対象の情報との評価関数による評価結果を算出することを、評価が最も高い情報が子ノードを持たなくなるまで繰り返せばよい。
 ただし、調整部306は、あるノードにおいて、挿入対象の情報との評価が最も高い情報との評価が、そのノードの子ノード以下に含まれるための基準より低い場合、挿入対象の情報を、そのノードに挿入してもよい。
 選択部305は、本発明の第2の実施の形態における選択部205と同様に構成されることに加えて、次のように構成される。具体的には、選択部305は、融合部分木において、元々含まれていた木構造データにおいて子ノードを持つ第1の情報がない場合でも、次のようなノードがあれば、そのようなノードも、注目するノードとして選択する。
 そのようなノードとは、退避領域に含まれる情報をオリジナルの木構造データにおいて含んでいたノードであって、注目するノードとして一度も選択されたことがないノードである。選択部305は、このようにして選択した注目するノードについても、本発明の第2の実施の形態における選択部205と同様に、再編部203および復元部204を機能させる。
 以上のように構成された情報処理装置30の動作を、図16を参照して説明する。
 図16において、情報処理装置30は、ステップS21~S26まで、本発明の第2の実施の形態と同様に動作する。これにより、注目するノードに含まれる複数の情報について融合部分木が生成され、融合部分木における第2の情報以下の子ノードが復元される。
 次に、調整部306は、融合部分木における第1の情報の孫ノード以下に含まれる情報のうち、第1の情報との評価結果が、第1の情報の子ノード以下に含まれるための基準を満たさない情報を検出する。そして、調整部306は、検出した情報を融合部分木から削除し、退避領域に記憶する(ステップS31)。
 次に、情報処理装置30は、本発明の第2の実施の形態と同様に、ステップS27でYesの場合にはステップS28を実行する。つまり、該当する第1の情報がある場合には、新たな注目するノードが選択され、ステップS24からの処理が繰り返される。
 一方、ステップS27で該当する第1の情報が無かった場合について説明する。この場合、選択部305は、退避領域に退避した情報をオリジナルの木構造データにおいて含んでいたノードであって、注目するノードとして一度も選択されたことがないノードがあるか否かを判断する(ステップS32)。
 ここで、該当するノードがある場合について説明する(ステップS32でYes)。この場合、選択部305は、オリジナルの木構造データにおける該当するノード以下のノードを、新たな注目するノードとして選択する(ステップS33)。
 そして、情報処理装置30は、ステップS33で選択した新たな注目するノードについて、ステップS24からの処理を繰り返す。
 なお、ステップS32で該当する複数のノードがある場合、情報処理装置30は、それぞれのノードについて、ステップS33およびステップS24からの処理の繰り返しを実行する。
 一方、ステップS32で該当するノードが無かった場合(ステップS32でNo)、調整部306は、ステップS31で退避領域に記憶しておいた情報を、融合後の木構造データに挿入する(ステップS34)。
 そして、情報処理装置30は、動作を終了する。
 次に、情報処理装置30の動作を具体例で示す。この具体例では、情報処理装置30は、2本の木構造データdおよび木構造データeを融合して、融合後の木構造データfを生成するものとする。また、この具体例では、木構造を構成する情報は、顔画像であるものとする。また、顔画像間の距離を評価する評価関数は、顔画像間の類似度を表す数値を出力するものとする。
 まず、取得部101は、図17に示す木構造データdおよび木構造データeを取得したとする(ステップS21)。
 図17において、木構造データdの各ノードに含まれる顔画像は、実線の矩形で表される。木構造データeの各ノードに含まれる顔画像は、点線の矩形で表される。木構造データdでは、ルートノードに、顔画像0、顔画像1および顔画像2が含まれる。また、木構造データeでは、ルートノードに、顔画像A、顔画像Bおよび顔画像Cが含まれる。なお、図17では、識別子が「X」の顔画像を、顔画像Xと表している。ここでは、「X」には、数字またはアルファベットが適用される。
 また、顔画像Xの子ノードに含まれる顔画像の識別子を、「XY」と表している。したがって、顔画像Xの子ノードに含まれる顔画像は、顔画像XYと表される。なお、ここでは、「Y」には、数字またはアルファベットが適用される。また、顔画像XYの子ノードに含まれる顔画像の識別子を、「XYZ」と表している。したがって、顔画像XYの子ノードに含まれる顔画像は、顔画像XYZと表される。なお、ここでは、「Z」には、数字またはアルファベットが適用される。
 例えば、図17では、木構造データdのルートノードに含まれる顔画像0の子ノードには、顔画像00、顔画像01および顔画像02が含まれている。また、木構造データeのルートノードに含まれる顔画像Aの子ノードには、顔画像AA、顔画像ABおよび顔画像ACが含まれている。また、木構造データeの顔画像AAの子ノードには、顔画像AAAおよび顔画像AABが含まれている。
 次に、融合部302は、融合後の木構造データに適用される特性を表す情報として、ノードに含まれる顔画像の上限数を取得する。この具体例では、融合部302は、図18に示したユーザインタフェース画面を出力装置1003に出力し、入力装置1004を介して、上限数4を表す情報を取得したとする(ステップS22)。
 次に、選択部305は、木構造データdのルートノードと木構造データeのルートノードとを、注目するノードとして選択する(ステップS23)。
 次に、再編部203は、注目するノードに含まれる顔画像からなる複数の顔画像について、顔画像間の類似度に基づいて融合部分木f1を生成する(ステップS24)。
 ここでは、注目するノードである木構造データdのルートノードおよび木構造データeのルートノードには、顔画像0、顔画像1、顔画像2、顔画像A、顔画像Bおよび顔画像Cが含まれている。
 そこで、再編部203は、これらの複数の顔画像をランダムな順序で、融合部分木f1に挿入していく。例えば、最初に選択された顔画像は、融合部分木f1のルートノードに置かれる。また、次に選択された顔画像は、融合部分木f1のルートノードに既に置かれた顔画像のうちで、選択された顔画像との類似度が閾値以上である顔画像があれば、その顔画像の子ノードに置かれる。
 選択された顔画像は、融合部分木f1のルートノードに既に置かれたいずれの顔画像とも類似度が閾値未満である場合、そのルートノードに置かれる。
 このようにして、図19に示す融合部分木f1が生成されたとする。図19では、顔画像0、顔画像1、顔画像2および顔画像Bが融合部分木f1のルートノードに配置されている。また、顔画像1の子ノードに顔画像Aが配置されている。また、顔画像Bの子ノードに顔画像Cが配置されている。
 図19において、顔画像1および顔画像Bは、それぞれ子ノードを持つ第1の情報である。また、顔画像0、顔画像2、顔画像Aおよび顔画像Cは、それぞれ子ノードを持たない第2の情報である。
 再編部203は、図19に示した融合部分木f1を、木構造データfにおける注目するノードに基づく位置に挿入する(ステップS25)。
 ここでは、注目するノードが木構造データdおよび木構造データeのルートノードであるため、注目するノードに基づく位置は、木構造データfのルートノードの位置である。したがって、本発明の第2の実施の形態における具体例と同様に、図19に示した融合部分木f1が、そのまま木構造データfとなる。
 次に、復元部204は、図19における第2の情報のそれぞれに、木構造データdまたは木構造データfにおいてその第2の情報に接続されていた子ノード以下を接続する(ステップS26)。
 ここで、図19において、前述したように、子ノードを持たない第2の情報は、顔画像0、顔画像2、顔画像Aおよび顔画像Cである。また、例えば、顔画像0が元々含まれていた木構造データdにおいて、顔画像0に接続されていた子ノードには、顔画像00、顔画像01および顔画像02が含まれている。そこで、復元部204は、図19の顔画像0以下に、顔画像00、顔画像01および顔画像02を含む子ノードを接続して復元する。
 同様に、復元部204は、顔画像2、顔画像Aおよび顔画像C以下にも、オリジナルの木構造データdまたは木構造データeにおいてこれらの各顔画像に接続されていた子ノード以下を接続する。これにより、子ノード以下が復元された木構造データfは、図20に示す通りとなる。
 次に、調整部306は、図20の融合部分木f1における第1の情報の1つである顔画像1と、その孫ノード以下に含まれる顔画像AA、顔画像AB、顔画像AC、顔画像AAAおよび顔画像AABとの類似度を、それぞれ算出する。そして、調整部306は、顔画像1との類似度が、顔画像1の子ノード以下に含まれるための基準より低い顔画像として、顔画像AAを検出したとする。調整部306は、顔画像AAを図20の木構造データfから削除し、退避領域に記憶する(ステップS31)。
 同様に、調整部306は、図20の融合部分木f1における第1の情報のもう1つである顔画像Bと、その孫ノード以下に含まれる顔画像CA、顔画像CBおよび顔画像CCとの類似度を、それぞれ算出する。そして、調整部306は、顔画像Bとの類似度が、顔画像Bの子ノード以下に含まれるための基準より低い顔画像として、顔画像CBを検出したとする。調整部306は、顔画像CBを図20の木構造データfから削除し、退避領域に記憶する(ステップS31)。
 ステップS31において、顔画像AAおよび顔画像CBが調整のために削除された木構造データfは、図21に示す通りとなる。また、退避領域には、顔画像AAおよび顔画像CBが記憶される。
 次に、選択部305は、図21の融合部分木f1における第1の情報の1つである顔画像1に、元々含まれていた木構造データdにおいても子ノードが接続されていたと判断する。また、選択部305は、融合部分木f1における第1の情報のもう1つである顔画像Bに、元々含まれていた木構造データeにおいても子ノードが接続されていたと判断する。(ステップS27でYes)。
 この場合、選択部305は、第1の情報の1つである顔画像1の子ノード以下と、第1の情報のもう1つである顔画像Bの子ノード以下とについて、それぞれ、さらなる融合部分木の生成を行う。
 顔画像1の子ノード以下の融合部分木f2の生成について、以下で説明する。
 まず、選択部305は、図22に示すように、融合部分木f1における顔画像1の子ノードを、新たな注目するノードの1つとして選択する。このノードには、顔画像Aが含まれている。また、選択部305は、木構造データdにおいて顔画像1に接続されていた子ノードを、新たな注目するノードのもう1つとして選択する。このノードには、顔画像10、顔画像11および顔画像12が含まれている(ステップS28)。
 そこで、次に、情報処理装置30は、ステップS28で選択した新たな注目するノードについて、ステップS24からの動作を繰り返す。
 すなわち、再編部203は、注目するノードに含まれる顔画像A、顔画像10、顔画像11および顔画像12について、顔画像間の類似度に基づいて新たな融合部分木f2を生成する(ステップS24)。
 具体的には、再編部203は、これらの複数の顔画像をランダムな順序で、先ほどと同様に融合部分木f2に挿入していく。そして、図23に示す融合部分木f2が生成される。
 図23では、顔画像A、顔画像10、顔画像11および顔画像12の全てが、融合部分木f2のルートノードに配置されている。また、この融合部分木f2では、顔画像A、顔画像10、顔画像11および顔画像12の全てが、子ノードを持たない第2の情報である。
 次に、再編部203は、図23に示した融合部分木f2を、木構造データfにおける注目するノードに基づく位置に挿入する(ステップS25)。
 注目するノードの1つである顔画像Aは、木構造データfにおける顔画像1の子ノードである。そこで、再編部203は、木構造データfにおける顔画像1の子ノードの位置に、融合部分木f2を挿入する。これにより、木構造データfは、図24に示す通りとなる。
 次に、復元部204は、図24における融合部分木f2の第2の情報に、オリジナルの木構造データdまたは木構造データeにおいてその第2の情報に接続されていた子ノード以下を接続する(ステップS26)。
 図24における融合部分木f2の第2の情報のうち、顔画像Aだけが、元々含まれていた木構造データeにおいて子ノードを持つ。この子ノードには、顔画像AA、顔画像ABおよび顔画像ACが含まれているが、顔画像AAは、退避領域に記憶されている。そこで、復元部204は、図24における顔画像A以下に、顔画像AA以外の顔画像ABおよび顔画像ACを含む子ノードを接続して復元する。
 また、図24における融合部分木f2の他の第2の情報である顔画像10、顔画像11および顔画像12には、オリジナルの木構造データdまたは木構造データfにおいて接続されていた子ノードがない。そこで、復元部204は、これらの第2の情報については、子ノード以下の復元を行わない。これにより、子ノードが復元された木構造データfは、図25に示した通りとなる。
 また、融合部分木f2には、第1の情報が無い。したがって、調整部306は、融合部分木f2において調整しない(ステップS31)。また、融合部分木f2に第1の情報がないため(ステップS27でNo)、次のステップS32に移行する。ステップS32については、後述する。
 次に、融合部分木f1において、もう1つの第1の情報であった顔画像B以下について、さらなる融合部分木の生成について説明する。
 まず、選択部305は、図26に示すように、融合部分木f1における顔画像Bの子ノードを、新たな注目するノードの1つとして選択する。このノードには、顔画像Cが含まれている。また、選択部305は、木構造データeにおいて顔画像Bに接続されていた子ノードを、新たな注目するノードのもう1つとして選択する。このノードには、顔画像BA、顔画像BBおよび顔画像BCが含まれている(ステップS28)。
 そこで、情報処理装置30は、ステップS28で選択した新たな注目するノードについて、ステップS24からの動作を繰り返す。
 まず、再編部203は、注目するノードに含まれる顔画像C、顔画像BA、顔画像BBおよび顔画像BCについて、顔画像間の類似度に基づいて新たな融合部分木f3を生成する(ステップS24)。
 具体的には、再編部203は、これらの複数の顔画像をランダムな順序で、先ほどと同様に融合部分木f3に挿入していく。そして、図27に示す融合部分木f3が生成される。
 図27では、顔画像BA、顔画像BCおよび顔画像Cが、融合部分木f3のルートノードに配置されている。また、顔画像BBが、顔画像Cの子ノードに配置されている。この融合部分木f3では、顔画像Cが、子ノードを持つ第1の情報である。また、顔画像BA、顔画像BBおよび顔画像BCが、子ノードを持たない第2の情報である。
 次に、再編部203は、図27に示した融合部分木f3を、木構造データfにおける注目するノードに基づく位置に挿入する(ステップS25)。
 ここでは、注目するノードの1つは、木構造データfにおける顔画像Bの子ノードである。そこで、再編部203は、木構造データfにおける顔画像Bの子ノードの位置に、図27に示した融合部分木f3を挿入する。これにより、木構造データfは、図28に示す通りとなる。
 融合部分木f3の第2の情報である顔画像BA、顔画像BBおよび顔画像BCのうち、オリジナルの木構造データeにおいて子ノードを持っていた顔画像は無い。そのため、復元部204は、融合部分木f3において、これらの第2の情報に対する子ノード以下の部分木を復元しない(ステップS26)。
 また、融合部分木f3における第1の情報である顔画像Cには、孫ノード以下が無い。したがって、調整部306は、融合部分木f3において調整しない(ステップS31)。
 次に、選択部305は、融合部分木f3における第1の情報である顔画像Cには、元々含まれていた木構造データeにおいて子ノードが接続されていたと判断する(ステップS27でYes)。
 そこで、選択部305は、図28における融合部分木f3の第1の情報である顔画像Cの子ノードを、次の注目するノードの1つとして選択する。このノードには、顔画像BBが含まれている。また、選択部305は、顔画像Cが元々含まれていた木構造データeにおける顔画像Cの子ノードを、次の注目するノードのもう1つとして選択する。このノードには、顔画像CA、顔画像CBおよび顔画像CCが含まれていた。ただし、そのうち顔画像CBは退避領域にあるため、このノードには、顔画像CAおよび顔画像CCが含まれている(ステップS28)。
 そこで、次に、情報処理装置30は、ステップS28で選択した新たな注目するノードについて、ステップS24からの動作を繰り返す。
 ここでは、まず、再編部203は、注目するノードに含まれる顔画像BB、顔画像CAおよび顔画像CCについて、顔画像間の類似度に基づいて新たな融合部分木f4を生成する(ステップS24)。
 具体的には、再編部203は、これらの複数の顔画像をランダムな順序で、先ほどと同様に融合部分木f4に挿入していく。そして、図29に示す融合部分木f4が生成されたとする。図29では、顔画像BB、顔画像CAおよび顔画像CCの全てが、融合部分木f4のルートノードに配置されている。また、この融合部分木f4では、子ノードを持つ第1の情報は無く、顔画像BB、顔画像CAおよび顔画像CCが、子ノードを持たない第2の情報である。
 次に、再編部203は、図29に示した融合部分木f4を、木構造データfにおける注目するノードに基づく位置に挿入する(ステップS25)。
 ここでは、注目するノードの1つは、木構造データfにおける顔画像Cの子ノードであった。そこで、再編部203は、木構造データfにおける顔画像Cの子ノードの位置に、図29に示した融合部分木f4を挿入する。これにより、木構造データfは、図30に示す通りとなる。
 ここで、融合部分木f4の第2の情報である顔画像BB、顔画像CAおよび顔画像CCのうち、オリジナルの木構造データeにおいて子ノードを持っていた顔画像は無い。そこで、復元部204は、これらの第2の情報に対して子ノード以下の部分木を復元しない(ステップS26)。
 また、融合部分木f4には第1の情報が無いので、調整部306は、融合部分木f4において調整を行わない(ステップS31)。
 そして、融合部分木f4には第1の情報がないため(ステップS27でNo)、次のステップS32に移行する。
 ここで、退避領域に退避されている顔画像CBを木構造データeにおいて含んでいたノードは、注目するノードとして既に選択されたことがある。しかしながら、退避領域に退避されている顔画像AAを木構造データeにおいて含んでいたノードは、注目するノードとして一度も選択されたことがない(ステップS32でYes)。
 そこで、選択部305は、図31に示すように、木構造データeにおいて、退避された顔画像AAが含まれていたノードと、そのノード以下とを、新たな注目するノードとして選択する。これらのノードには、退避された顔画像AAを除くと、顔画像AB、顔画像AC、顔画像AAAおよび顔画像AABが含まれている(ステップS33)。
 次に、情報処理装置30は、ステップS33で選択した新たな注目するノードについて、ステップS24からの動作を繰り返す。
 すなわち、再編部203は、注目するノードに含まれる顔画像AB、顔画像AC、顔画像AAAおよび顔画像AABについて、顔画像間の類似度に基づいて新たな融合部分木f5を生成する(ステップS24)。
 具体的には、再編部203は、これらの複数の顔画像をランダムな順序で、先ほどと同様に融合部分木f5に挿入していく。そして、図32に示す融合部分木f5が生成される。
 図32では、顔画像AB、顔画像AC、顔画像AAAおよび顔画像AABの全てが、融合部分木f5のルートノードに配置されている。また、この融合部分木f5では、子ノードを持つ第1の情報は無く、顔画像AB、顔画像AC、顔画像AAAおよび顔画像AABが、子ノードを持たない第2の情報である。
 次に、再編部203は、図32に示した融合部分木f5を、木構造データfにおける注目するノードに基づく位置に挿入する(ステップS25)。
 ここでは、注目するノードは、木構造データeにおいて顔画像Aの子ノードである。そこで、再編部203は、木構造データfにおける顔画像Aの子ノードの位置に、図32に示した融合部分木f5を挿入する。これにより、木構造データfは、図33に示す通りとなる。
 ここで、融合部分木f5の第2の情報である顔画像AB、顔画像AC、顔画像AAAおよび顔画像AABのうち、オリジナルの木構造データeにおいて子ノードを持っていた顔画像は無い。そこで、復元部204は、これらの第2の情報に対して子ノード以下の部分木を復元しない(ステップS26)。
 また、融合部分木f5には第1の情報が無いので、調整部306は、融合部分木f5において調整を行わない(ステップS31)。
 そして、融合部分木f5には、前述したように第1の情報がない(ステップS27でNo)。
 さらに、退避領域に退避されている顔画像をオリジナルの木構造データにおいて含んでいたノードで、注目するノードとして一度も選択されたことがないノードは無くなった(ステップS32でNo)。
 そこで、次に、調整部306は、ステップS34を実行する。
 具体的には、調整部306は、退避領域に退避しておいた顔画像AAおよび顔画像CBを、それぞれ、図33に示した木構造データfに挿入する。
 顔画像AAは、ルートノードにおいては顔画像0との類似度が最も高く、かつ、その類似度は、顔画像0の子ノード以下に含まれるための基準を満たしていたとする。さらに、顔画像AAは、顔画像0の子ノードにおいては顔画像01との類似度が最も高く、かつ、その類似度は、顔画像01の子ノード以下に含まれるための基準を満たしていたとする。また、顔画像01は、子ノードを持っていない。
 そこで、調整部306は、顔画像01に新たに子ノードを接続し、顔画像AAを配置する(ステップS32)。
 また、顔画像CBは、ルートノードにおいては顔画像2との類似度が最も高く、かつ、その類似度は、顔画像2の子ノード以下に含まれるための基準を満たしていたとする。さらに、顔画像CBは、顔画像2の子ノードにおいては顔画像22との類似度が最も高く、かつ、その類似度は、顔画像22の子ノード以下に含まれるための基準を満たしていたとする。また、顔画像22は、子ノードを持っていない。
 そこで、調整部306は、顔画像22に新たに子ノードを接続し、顔画像CBを配置する(ステップS32)。
 これにより、木構造データfは、図34に示す通りとなった。
 以上で、具体例の説明を終了する。
 次に、本発明の第3の実施の形態の効果について述べる。
 本実施の形態としての情報処理装置30は、情報間の距離を評価する評価関数の評価結果に基づき情報群が表された複数の木構造を、より効率的にさらに精度よく1つの木構造に融合することができる。
 その理由について説明する。本実施の形態は、本発明の第2の実施の形態と同様の構成に加えて、次のように構成される。
 すなわち、調整部306が、融合部分木における第1の情報と、第1の情報の孫ノード以下に含まれる各情報との距離が、第1の情報の子ノード以下に含まれるための基準より近くなるよう融合部分木を調整する。
 例えば、調整部306は、融合部分木における第1の情報の孫ノード以下に含まれる情報のうち、第1の情報との距離が、第1の情報の子ノード以下に含まれるための基準より遠い情報を融合部分木から削除する。そして、調整部306は、削除した情報を、繰り返し処理の完了後の融合後の木構造データに挿入する。
 このように、本実施の形態は、本発明の第2の実施の形態と同様に、融合部分木において子ノードを持たない第2の情報以下の間については、木構造の再編処理を不要にして効率化を図っている。
 また、本実施の形態は、本発明の第2の実施の形態と同様に、融合部分木において子ノードを持つ第1の情報以下とその子ノードに含まれる情報以下とについては、融合部分木を生成する処理を再帰的に行うことにより、精度よく木構造データを融合している。
 融合部分木において、第1の情報とその子ノードに含まれる情報との間は、再編時に評価が高いことが確かめられている。しかしながら、第1の情報と、再編後に復元された孫ノード以下に含まれる情報との間は、評価が高いか否かが確かめられていない。
 そこで、本実施の形態は、融合部分木において、第1の情報の孫ノード以下に含まれる情報から、第1の情報との間の評価が、第1の情報の子ノード以下に含まれるための基準を満たさないものを除外する。これにより、融合後の木構造データにおいて、再編された部分において、ある情報の子ノード以下に、基準を満たさない情報が含まれることが無くなる。
 そして、本実施の形態は、除外した情報を、融合後の木構造データを生成するための再帰処理が完了した後に、適切な位置に挿入する。その結果、本実施の形態は、処理を効率化しながらも、融合後の木構造データの構成の精度を向上させている。
 例えば、上述の具体例では、顔画像AAは、融合部分木f1に復元された時点では、顔画像1の孫ノードに配置されていた。しかしながら、本実施の形態は、顔画像AAが顔画像1の子ノード以下に含まれる基準を満たしていないことを検出し、融合後の木構造データから一旦削除している。
 これにより、顔画像AAは、顔画像0の子ノードの顔画像01の子ノードに最終的に挿入されることになり、融合後の木構造データの構成の精度が向上している。
 また、上述の具体例では、顔画像CBは、融合部分木f1に復元された時点では、顔画像Bの孫ノードに配置されていた。しかしながら、本実施の形態は、顔画像CBが顔画像Bの子ノード以下に含まれる基準を満たしていないことを検出し、融合後の木構造データから一旦削除している。
 これにより、顔画像CBは、顔画像2の子ノードの顔画像22の子ノードに最終的に挿入されることになり、融合後の木構造データの構成の精度が向上している。
 このように、本実施の形態は、処理を効率化しながら、融合後の木構造データの構成の精度を向上させている。
 (第4の実施の形態)
 次に、本発明の第4の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第2の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
 まず、本発明の第4の実施の形態としての情報処理装置40の機能ブロック構成を図35に示す。図35において、情報処理装置40は、本発明の第2の実施の形態としての情報処理装置20に対して、取得部101に替えて取得部401と、融合部202に替えて融合部402とを備え、さらに、記憶部407を備える点が異なる。
 なお、情報処理装置40およびその各機能ブロックは、図2を参照して説明した本発明の第1の実施の形態と同様のハードウェア要素によって構成可能である。ただし、情報処理装置40およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
 記憶部407は、対象となる情報が得られる時間または空間の範囲毎に構築された木構造データを記憶している。
 例えば、記憶部407には、1日単位で得られる情報について、本発明の第2の実施の形態で説明した法則1~4に従って構築された木構造データが記憶されていてもよい。また、例えば、記憶部407には、拠点単位で得られる情報について、上述の法則1~4に従って構築された木構造データが記憶されていてもよい。
 取得部401は、指定された時間または空間の範囲を表す情報を入力として取得する。そして、取得部401は、指定された時間または空間の範囲と重なる部分を有する範囲について構築された複数の木構造データを、記憶部407から取得する。
 例えば、取得部401が、直近の7日間という時間の範囲を表す情報を入力として取得したとする。この場合、取得部401は、直近の7日間について、日単位で構築された7つの木構造データを取得すればよい。
 また、例えば、取得部401は、ある地域という空間の範囲を表す情報を入力として取得したとする。この場合、取得部401は、ある地域に含まれる拠点についてそれぞれ構築された木構造データを取得すればよい。
 融合部402は、指定された時間または空間の範囲の情報群について、融合された木構造データを生成する。
 ここで、指定された時間または空間の範囲に対して過不足のない範囲を構成する複数の木構造データが、記憶部407に記憶されているとは限らない。例えば、記憶部407に、1日単位で得られる情報群について構築された木構造データが記憶されているとする。
 取得部401により、「昨日の正午から本日の正午まで」という時間の範囲を指定する情報が得られたとする。この場合、取得部401は、指定された範囲である「昨日の正午から本日の正午まで」と重なる部分を有する範囲について構築された、昨日の木構造データと本日の木構造データとを取得することになる。
 このようなケースを考慮して、融合部402は、取得された複数の木構造データに含まれる情報のうち、指定された時間または空間の範囲に含まれない情報を除外した上で、本発明の第2の実施の形態と同様に動作するよう構成される。
 なお、融合部402は、このような指定された時間または空間の範囲外の情報を除外する処理を、融合の動作を開始する前に行ってもよいし、再編部203や復元部204を動作させる際に行ってもよい。あるいは、融合部402は、このような指定された時間または空間の範囲外の情報を除外する処理を、融合の動作を終了後に行ってもよい。
 以上のように構成された情報処理装置40の動作を図36に示す。ここでは、指定された時間または空間の範囲外の情報を除外する処理を、融合の動作を開始する前に行うものとする。
 図36では、まず、取得部401は、指定された時間または空間の範囲を表す情報を入力として取得する(ステップS41)。
 次に、取得部401は、指定された時間または空間の範囲と重なる部分を有する範囲について構築された複数の木構造データを、記憶部407から取得する(ステップS42)。
 次に、融合部402は、取得された複数の木構造データに含まれる情報のうち、指定された時間または空間の範囲外の情報があれば、除外する(ステップS43)。
 以降、情報処理装置40は、本発明の第2の実施の形態と同様に、ステップS21~S28を実行する。
 そして、融合部402は、指定された時間または空間の範囲の木構造データとして、融合後の木構造データを出力する(ステップS44)。
 以上で、情報処理装置40は動作を終了する。
 次に、本発明の第4の実施の形態の効果について述べる。
 本発明の第4の実施の形態としての情報処理装置40は、指定された時間または空間の範囲についての木構造データを、効率的に精度よく生成することができる。
 その理由について以下で説明する。
 本実施の形態では、本発明の第2の実施の形態と同様の構成に加えて、次のように構成される。すなわち、記憶部407が、対象となる情報が得られる時間または空間の範囲毎に構築された木構造データを記憶する。そして、取得部401が、指定された時間または空間の範囲と重なる部分を有する範囲について構築された複数の木構造データを、記憶部407から取得する。そして、融合部402が、取得された複数の木構造データを融合することにより、指定された時間または空間の範囲について融合後の木構造データを生成する。
 本実施の形態は、得られる情報群の全体量と比較して、必要となる情報群の時間や空間の範囲が小さいときに、特に処理効率を向上させる。
 なお、上述した本発明の各実施の形態において、木構造データに含まれる情報が、顔画像や文章である例について説明したが、木構造データに含まれる情報の種類は、これらに限定されない。
 また、上述した本発明の各実施の形態において、情報間の距離を評価する評価関数の出力が、類似度を表す数値である例について説明した。ただし、情報間の距離を評価する評価関数の出力は、類似度に限定されない。
 また、上述した本発明の各実施の形態において、融合の対象となる木構造データが2つである例を中心に説明した。ただし、各実施の形態は、3つ以上の木構造データを融合する場合にも、同様に動作することにより同様の効果を奏する。
 また、上述した本発明の各実施の形態において、情報処理装置10~40の各機能ブロックが、メモリに記憶されたコンピュータ・プログラムを実行するCPUによって実現される例を中心に説明した。これに限らず、各機能ブロックの一部、全部、または、それらの組み合わせが専用のハードウェアにより実現されていてもよい。
 また、上述した本発明の各実施の形態において、情報処理装置10~40の機能ブロックは、複数の装置に分散されて実現されてもよい。
 また、上述した本発明の各実施の形態において、各フローチャートを参照して説明した情報処理装置10~40の動作を、本発明のコンピュータ・プログラムとしてコンピュータ装置の記憶装置(記憶媒体)に格納しておく。そして、係るコンピュータ・プログラムを当該CPUが読み出して実行するようにしてもよい。そして、このような場合において、本発明は、係るコンピュータ・プログラムのコードあるいは記憶媒体によって構成される。
 また、上述した各実施の形態は、適宜組み合わせて実施されることが可能である。
 また、本発明は、上述した各実施の形態に限定されず、様々な態様で実施されることが可能である。
 〔本発明の様態の例〕
 本発明の実施形態の一部または全部は、以下の付記のように記載しうる。しかしながら、本発明は、以下の付記に限定されない。
 (付記1)
 情報群を情報間の距離に基づく木構造で表した複数の木構造データであって、それぞれの前記木構造データにおいて、親ノードに含まれる情報に接続される子ノードに含まれる情報間の距離は、前記親ノードに含まれる情報間の距離より近く、かつ、前記木構造データの末端により近いノードほど、該ノードに含まれる情報間の距離がより近くなるよう構成される複数の前記木構造データを取得する取得手段と、
 複数の前記木構造データを融合した融合後の木構造データを生成するため、複数の前記木構造データにおいてそれぞれ選択されたノードに含まれる情報からなる複数の情報において、他の各情報との距離が離れていることを表す条件を満たす情報のそれぞれについては、該情報が元々含まれていた前記木構造データにおける該情報以下の部分木をそのまま前記融合後の木構造データに含め、前記情報間の距離が近いことを表す条件を互いに満たす複数の情報については、各情報が元々含まれていた前記木構造データにおける該情報以下の部分木を融合して前記木構造で表すよう再編した部分木を前記融合後の木構造データに含める融合手段と、
 を備えた情報処理装置。
 (付記2)
 前記融合手段は、
 複数の注目するノードにそれぞれ含まれる情報を融合して前記木構造で表すよう再編した融合部分木を生成し、生成した融合部分木を、前記融合後の木構造データにおいて前記注目するノードに基づく位置に挿入する再編手段と、
 前記融合部分木において子ノードを持つ情報を第1の情報とし、子ノードを持たない情報を第2の情報とするとき、前記第2の情報に、前記第2の情報が元々含まれていた前記木構造データにおいて前記第2の情報に接続されていた子ノード以下を接続して復元する復元手段と、
 複数の前記木構造データのルートノードを前記注目するノードとして選択して前記再編手段および前記復元手段を機能させた後、前記融合部分木における前記第1の情報に接続された子ノードと、前記第1の情報が元々含まれていた前記木構造データにおいて前記第1の情報に接続されていた子ノードとを新たな注目するノードとして選択して前記再編手段および前記復元手段を機能させることを繰り返す選択手段と、
 を有することを特徴とする付記1に記載の情報処理装置。
 (付記3)
 前記融合手段は、
 前記融合部分木における前記第1の情報と、前記第1の情報の孫ノード以下に含まれる各情報との距離が、前記第1の情報の子ノード以下に含まれるための基準より近くなるよう前記融合部分木を調整する調整手段をさらに備えたことを特徴とする付記1または付記2に記載の情報処理装置。
 (付記4)
 前記調整手段は、前記融合部分木における前記第1の情報の孫ノード以下に含まれる情報のうち、前記第1の情報との距離が前記基準より遠い情報を前記融合部分木から削除し、削除した情報を、前記選択手段による前記繰り返し処理が完了した前記融合後の木構造データに挿入することを特徴とする付記3に記載の情報処理装置。
 (付記5)
 対象となる情報が得られる時間または空間の範囲毎に構築された前記木構造データを記憶する記憶手段をさらに備え、
 前記取得手段は、指定された時間または空間の範囲と重なる部分を有する範囲についてそれぞれ構築された複数の前記木構造データを、前記記憶手段から取得し、
 前記融合手段は、複数の前記木構造データを融合することにより、指定された時間または空間の範囲について前記融合後の木構造データを生成することを特徴とする付記1から付記4のいずれかに記載の情報処理装置。
 (付記6)
 コンピュータ装置が、
 情報群を情報間の距離に基づく木構造で表した複数の木構造データであって、それぞれの前記木構造データにおいて、親ノードに含まれる情報に接続される子ノードに含まれる情報間の距離は、前記親ノードに含まれる情報間の距離より近く、かつ、前記木構造データの末端により近いノードほど、該ノードに含まれる情報間の距離がより近くなるよう構成される複数の前記木構造データを取得し、
 複数の前記木構造データを融合した融合後の木構造データを生成するため、複数の前記木構造データにおいてそれぞれ選択されたノードに含まれる情報からなる複数の情報において、他の各情報との距離が離れていることを表す条件を満たす情報のそれぞれについては、該情報が元々含まれていた前記木構造データにおける該情報以下の部分木をそのまま前記融合後の木構造データに含め、
 前記情報間の距離が近いことを表す条件を互いに満たす複数の情報については、各情報が元々含まれていた前記木構造データにおける該情報以下の部分木を融合して前記木構造で表すよう再編した部分木を前記融合後の木構造データに含める方法。
 (付記7)
 前記コンピュータ装置が前記融合を行う際に、
 複数の前記木構造データのルートノードを注目するノードとして選択し、
 前記注目するノードにそれぞれ含まれる情報からなる複数の情報を、前記木構造で表すよう再編した融合部分木を生成し、生成した融合部分木を、前記融合後の木構造データにおいて前記注目するノードに基づく位置に挿入し、
 前記融合部分木において子ノードを持つ情報を第1の情報とし、子ノードを持たない情報を第2の情報とするとき、
 前記第2の情報に、前記第2の情報が元々含まれていた前記木構造データにおいて前記第2の情報に接続されていた子ノード以下を接続して復元し、
 前記融合部分木における前記第1の情報に接続された子ノードと、前記第1の情報が元々含まれていた前記木構造データにおいて前記第1の情報に接続されていた子ノードとを新たな注目するノードとして選択して新たな前記融合部分木の前記再編、前記挿入および前記子ノードの復元を繰り返すことを特徴とする付記6に記載の方法。
 (付記8)
 前記コンピュータ装置が前記融合を行う際に、
 前記融合部分木における前記第1の情報と、前記第1の情報の孫ノード以下に含まれる各情報との距離が、前記第1の情報の子ノード以下に含まれるための基準より近くなるよう前記融合部分木を調整することを特徴とする付記6または付記7に記載の方法。
 (付記9)
 前記融合部分木を調整する際に、
 前記融合部分木における前記第1の情報の孫ノード以下に含まれる情報のうち、前記第1の情報との距離が前記基準より遠い情報を前記融合部分木から削除し、削除した情報を、前記選択手段による前記繰り返し処理が完了した前記融合後の木構造データに挿入することを特徴とする付記8に記載の方法。
 (付記10)
 対象となる情報が得られる時間または空間の範囲毎に構築された前記木構造データを記憶手段に記憶しており、
 指定された時間または空間の範囲と重なる部分を有する範囲についてそれぞれ構築された複数の前記木構造データを、前記記憶手段から取得し、
 前記コンピュータ装置が前記融合を行う際に、
 複数の前記木構造データを融合することにより、指定された時間または空間の範囲について前記融合後の木構造データを生成することを特徴とする付記6から付記9のいずれかに記載の方法。
 (付記11)
 情報群を情報間の距離に基づく木構造で表した複数の木構造データであって、それぞれの前記木構造データにおいて、親ノードに含まれる情報に接続される子ノードに含まれる情報間の距離は、前記親ノードに含まれる情報間の距離より近く、かつ、前記木構造データの末端により近いノードほど、該ノードに含まれる情報間の距離がより近くなるよう構成される複数の前記木構造データを取得することと、
 複数の前記木構造データを融合した融合後の木構造データを生成するため、複数の前記木構造データにおいてそれぞれ選択されたノードに含まれる情報からなる複数の情報において、他の各情報との距離が離れていることを表す条件を満たす情報のそれぞれについては、該情報が元々含まれていた前記木構造データにおける該情報以下の部分木をそのまま前記融合後の木構造データに含め、前記情報間の距離が近いことを表す条件を互いに満たす複数の情報については、各情報が元々含まれていた前記木構造データにおける該情報以下の部分木を融合して前記木構造で表すよう再編した部分木を前記融合後の木構造データに含めることと、
 をコンピュータ装置に実行させるためのプログラムを記録したプログラム記録媒体。
 (付記12)
 複数の前記木構造データのルートノードを前記注目するノードとして選択することと、
 前記注目するノードにそれぞれ含まれる情報からなる複数の情報を、前記木構造で表すよう再編した融合部分木を生成し、生成した融合部分木を、前記融合後の木構造データにおいて前記注目するノードに基づく位置に挿入することと、
 前記融合部分木において子ノードを持つ情報を第1の情報とし、子ノードを持たない情報を第2の情報とするとき、前記第2の情報に、前記第2の情報が元々含まれていた前記木構造データにおいて前記第2の情報に接続されていた子ノード以下を接続して復元することと、
 前記融合部分木における前記第1の情報に接続された子ノードと、前記第1の情報が元々含まれていた前記木構造データにおいて前記第1の情報に接続されていた子ノードとを新たな注目するノードとして選択することを繰り返すことと、
 をコンピュータ装置に実行させるためのプログラムを記録したことを特徴とする付記11に記載のプログラム記録媒体。
 (付記13)
 前記融合部分木における前記第1の情報と、前記第1の情報の孫ノード以下に含まれる各情報との距離が、前記第1の情報の子ノード以下に含まれるための基準より近くなるよう前記融合部分木を調整することをコンピュータ装置に実行させるためのプログラムを記録したことを特徴とする付記11または付記12に記載のプログラム記録媒体。
 (付記14)
 前記融合部分木における前記第1の情報の孫ノード以下に含まれる情報のうち、前記第1の情報との距離が前記基準より遠い情報を前記融合部分木から削除し、削除した情報を、前記繰り返し処理が完了した前記融合後の木構造データに挿入することをコンピュータ装置に実行させるためのプログラムを記録したことを特徴とする付記13に記載のプログラム記録媒体。
 (付記15)
 対象となる情報が得られる時間または空間の範囲毎に構築された前記木構造データを記憶手段に記憶することと、
 指定された時間または空間の範囲と重なる部分を有する範囲についてそれぞれ構築された複数の前記木構造データを、前記記憶手段から取得することと、
 複数の前記木構造データを融合することにより、指定された時間または空間の範囲について前記融合後の木構造データを生成することと、
 をコンピュータ装置に実行させるためのプログラムを記録したことを特徴とする付記11から付記14のいずれかに記載のプログラム記録媒体。
 以上、上述した実施形態を模範的な例として本発明を説明した。しかしながら、本発明は、上述した実施形態には限定されない。即ち、本発明は、本発明のスコープ内において、当業者が理解し得る様々な態様を適用することができる。
 この出願は、2016年10月12日に出願された日本出願特願2016-201023を基礎とする優先権を主張し、その開示の全てをここに取り込む。
 10、20、30、40  情報処理装置
 101、401  取得部
 102、202、302、402  融合部
 203  再編部
 204  復元部
 205、305  選択部
 306  調整部
 407  記憶部
 1001  CPU
 1002  メモリ
 1003  出力装置
 1004  入力装置

Claims (15)

  1.  情報群を情報間の距離に基づく木構造で表した複数の木構造データであって、それぞれの前記木構造データにおいて、親ノードに含まれる情報に接続される子ノードに含まれる情報間の距離は、前記親ノードに含まれる情報間の距離より近く、かつ、前記木構造データの末端により近いノードほど、該ノードに含まれる情報間の距離がより近くなるよう構成される複数の前記木構造データを取得する取得手段と、
     複数の前記木構造データを融合した融合後の木構造データを生成するため、複数の前記木構造データにおいてそれぞれ選択されたノードに含まれる情報からなる複数の情報において、他の各情報との距離が離れていることを表す条件を満たす情報のそれぞれについては、該情報が元々含まれていた前記木構造データにおける該情報以下の部分木をそのまま前記融合後の木構造データに含め、前記情報間の距離が近いことを表す条件を互いに満たす複数の情報については、各情報が元々含まれていた前記木構造データにおける該情報以下の部分木を融合して前記木構造で表すよう再編した部分木を前記融合後の木構造データに含める融合手段と、
     を備えた情報処理装置。
  2.  前記融合手段は、
     複数の注目するノードにそれぞれ含まれる情報を融合して前記木構造で表すよう再編した融合部分木を生成し、生成した融合部分木を、前記融合後の木構造データにおいて前記注目するノードに基づく位置に挿入する再編手段と、
     前記融合部分木において子ノードを持つ情報を第1の情報とし、子ノードを持たない情報を第2の情報とするとき、前記第2の情報に、前記第2の情報が元々含まれていた前記木構造データにおいて前記第2の情報に接続されていた子ノード以下を接続して復元する復元手段と、
     複数の前記木構造データのルートノードを前記注目するノードとして選択して前記再編手段および前記復元手段を機能させた後、前記融合部分木における前記第1の情報に接続された子ノードと、前記第1の情報が元々含まれていた前記木構造データにおいて前記第1の情報に接続されていた子ノードとを新たな注目するノードとして選択して前記再編手段および前記復元手段を機能させることを繰り返す選択手段と、
     を有することを特徴とする請求項1に記載の情報処理装置。
  3.  前記融合手段は、
     前記融合部分木における前記第1の情報と、前記第1の情報の孫ノード以下に含まれる各情報との距離が、前記第1の情報の子ノード以下に含まれるための基準より近くなるよう前記融合部分木を調整する調整手段をさらに備えたことを特徴とする請求項1または請求項2に記載の情報処理装置。
  4.  前記調整手段は、前記融合部分木における前記第1の情報の孫ノード以下に含まれる情報のうち、前記第1の情報との距離が前記基準より遠い情報を前記融合部分木から削除し、削除した情報を、前記選択手段による前記繰り返し処理が完了した前記融合後の木構造データに挿入することを特徴とする請求項3に記載の情報処理装置。
  5.  対象となる情報が得られる時間または空間の範囲毎に構築された前記木構造データを記憶する記憶手段をさらに備え、
     前記取得手段は、指定された時間または空間の範囲と重なる部分を有する範囲についてそれぞれ構築された複数の前記木構造データを、前記記憶手段から取得し、
     前記融合手段は、複数の前記木構造データを融合することにより、指定された時間または空間の範囲について前記融合後の木構造データを生成することを特徴とする請求項1から請求項4のいずれか1項に記載の情報処理装置。
  6.  コンピュータ装置が、
     情報群を情報間の距離に基づく木構造で表した複数の木構造データであって、それぞれの前記木構造データにおいて、親ノードに含まれる情報に接続される子ノードに含まれる情報間の距離は、前記親ノードに含まれる情報間の距離より近く、かつ、前記木構造データの末端により近いノードほど、該ノードに含まれる情報間の距離がより近くなるよう構成される複数の前記木構造データを取得し、
     複数の前記木構造データを融合した融合後の木構造データを生成するため、複数の前記木構造データにおいてそれぞれ選択されたノードに含まれる情報からなる複数の情報において、他の各情報との距離が離れていることを表す条件を満たす情報のそれぞれについては、該情報が元々含まれていた前記木構造データにおける該情報以下の部分木をそのまま前記融合後の木構造データに含め、
     前記情報間の距離が近いことを表す条件を互いに満たす複数の情報については、各情報が元々含まれていた前記木構造データにおける該情報以下の部分木を融合して前記木構造で表すよう再編した部分木を前記融合後の木構造データに含める方法。
  7.  前記コンピュータ装置が前記融合を行う際に、
     複数の前記木構造データのルートノードを注目するノードとして選択し、
     前記注目するノードにそれぞれ含まれる情報からなる複数の情報を、前記木構造で表すよう再編した融合部分木を生成し、生成した融合部分木を、前記融合後の木構造データにおいて前記注目するノードに基づく位置に挿入し、
     前記融合部分木において子ノードを持つ情報を第1の情報とし、子ノードを持たない情報を第2の情報とするとき、
     前記第2の情報に、前記第2の情報が元々含まれていた前記木構造データにおいて前記第2の情報に接続されていた子ノード以下を接続して復元し、
     前記融合部分木における前記第1の情報に接続された子ノードと、前記第1の情報が元々含まれていた前記木構造データにおいて前記第1の情報に接続されていた子ノードとを新たな注目するノードとして選択して新たな前記融合部分木の前記再編、前記挿入および前記子ノードの復元を繰り返すことを特徴とする請求項6に記載の方法。
  8.  前記コンピュータ装置が前記融合を行う際に、
     前記融合部分木における前記第1の情報と、前記第1の情報の孫ノード以下に含まれる各情報との距離が、前記第1の情報の子ノード以下に含まれるための基準より近くなるよう前記融合部分木を調整することを特徴とする請求項6または請求項7に記載の方法。
  9.  前記融合部分木を調整する際に、
     前記融合部分木における前記第1の情報の孫ノード以下に含まれる情報のうち、前記第1の情報との距離が前記基準より遠い情報を前記融合部分木から削除し、削除した情報を、前記選択手段による前記繰り返し処理が完了した前記融合後の木構造データに挿入することを特徴とする請求項8に記載の方法。
  10.  対象となる情報が得られる時間または空間の範囲毎に構築された前記木構造データを記憶手段に記憶しており、
     指定された時間または空間の範囲と重なる部分を有する範囲についてそれぞれ構築された複数の前記木構造データを、前記記憶手段から取得し、
     前記コンピュータ装置が前記融合を行う際に、
     複数の前記木構造データを融合することにより、指定された時間または空間の範囲について前記融合後の木構造データを生成することを特徴とする請求項6から請求項9のいずれか1項に記載の方法。
  11.  情報群を情報間の距離に基づく木構造で表した複数の木構造データであって、それぞれの前記木構造データにおいて、親ノードに含まれる情報に接続される子ノードに含まれる情報間の距離は、前記親ノードに含まれる情報間の距離より近く、かつ、前記木構造データの末端により近いノードほど、該ノードに含まれる情報間の距離がより近くなるよう構成される複数の前記木構造データを取得することと、
     複数の前記木構造データを融合した融合後の木構造データを生成するため、複数の前記木構造データにおいてそれぞれ選択されたノードに含まれる情報からなる複数の情報において、他の各情報との距離が離れていることを表す条件を満たす情報のそれぞれについては、該情報が元々含まれていた前記木構造データにおける該情報以下の部分木をそのまま前記融合後の木構造データに含め、前記情報間の距離が近いことを表す条件を互いに満たす複数の情報については、各情報が元々含まれていた前記木構造データにおける該情報以下の部分木を融合して前記木構造で表すよう再編した部分木を前記融合後の木構造データに含めることと、
     をコンピュータ装置に実行させるためのプログラムを記録したプログラム記録媒体。
  12.  複数の前記木構造データのルートノードを前記注目するノードとして選択することと、
     前記注目するノードにそれぞれ含まれる情報からなる複数の情報を、前記木構造で表すよう再編した融合部分木を生成し、生成した融合部分木を、前記融合後の木構造データにおいて前記注目するノードに基づく位置に挿入することと、
     前記融合部分木において子ノードを持つ情報を第1の情報とし、子ノードを持たない情報を第2の情報とするとき、前記第2の情報に、前記第2の情報が元々含まれていた前記木構造データにおいて前記第2の情報に接続されていた子ノード以下を接続して復元することと、
     前記融合部分木における前記第1の情報に接続された子ノードと、前記第1の情報が元々含まれていた前記木構造データにおいて前記第1の情報に接続されていた子ノードとを新たな注目するノードとして選択することを繰り返すことと、
     をコンピュータ装置に実行させるためのプログラムを記録したことを特徴とする請求項11に記載のプログラム記録媒体。
  13.  前記融合部分木における前記第1の情報と、前記第1の情報の孫ノード以下に含まれる各情報との距離が、前記第1の情報の子ノード以下に含まれるための基準より近くなるよう前記融合部分木を調整することをコンピュータ装置に実行させるためのプログラムを記録したことを特徴とする請求項11または請求項12に記載のプログラム記録媒体。
  14.  前記融合部分木における前記第1の情報の孫ノード以下に含まれる情報のうち、前記第1の情報との距離が前記基準より遠い情報を前記融合部分木から削除し、削除した情報を、前記繰り返し処理が完了した前記融合後の木構造データに挿入することをコンピュータ装置に実行させるためのプログラムを記録したことを特徴とする請求項13に記載のプログラム記録媒体。
  15.  対象となる情報が得られる時間または空間の範囲毎に構築された前記木構造データを記憶手段に記憶することと、
     指定された時間または空間の範囲と重なる部分を有する範囲についてそれぞれ構築された複数の前記木構造データを、前記記憶手段から取得することと、
     複数の前記木構造データを融合することにより、指定された時間または空間の範囲について前記融合後の木構造データを生成することと、
     をコンピュータ装置に実行させるためのプログラムを記録したことを特徴とする請求項11から請求項14のいずれか1項に記載のプログラム記録媒体。
PCT/JP2017/036765 2016-10-12 2017-10-11 情報処理装置、方法およびプログラム記録媒体 WO2018070405A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018545013A JP7040455B2 (ja) 2016-10-12 2017-10-11 情報処理装置、方法およびプログラム
US16/339,020 US11016953B2 (en) 2016-10-12 2017-10-11 Information processing device, method, and program recording medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2016201023 2016-10-12
JP2016-201023 2016-10-12

Publications (1)

Publication Number Publication Date
WO2018070405A1 true WO2018070405A1 (ja) 2018-04-19

Family

ID=61906340

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/036765 WO2018070405A1 (ja) 2016-10-12 2017-10-11 情報処理装置、方法およびプログラム記録媒体

Country Status (3)

Country Link
US (1) US11016953B2 (ja)
JP (1) JP7040455B2 (ja)
WO (1) WO2018070405A1 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002108850A (ja) * 2000-09-28 2002-04-12 Fujitsu Ltd 階層構造の構造化文書を変換する装置
JP2005157859A (ja) * 2003-11-27 2005-06-16 Fuji Xerox Co Ltd 木構造データ作成装置及び方法
JP2007052556A (ja) * 2005-08-16 2007-03-01 Tokyo Institute Of Technology 複数のxml文書の類似度検出方法および類似性検出システム、ならびに複数のxml文書の統合方法
US20080215520A1 (en) * 2007-03-02 2008-09-04 Xiaohui Gu Method and system for indexing and serializing data
WO2014109127A1 (ja) * 2013-01-11 2014-07-17 日本電気株式会社 インデックス生成装置及び方法並びに検索装置及び検索方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5168334B2 (ja) * 2010-09-29 2013-03-21 ブラザー工業株式会社 情報生成装置、情報生成方法及び情報生成プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002108850A (ja) * 2000-09-28 2002-04-12 Fujitsu Ltd 階層構造の構造化文書を変換する装置
JP2005157859A (ja) * 2003-11-27 2005-06-16 Fuji Xerox Co Ltd 木構造データ作成装置及び方法
JP2007052556A (ja) * 2005-08-16 2007-03-01 Tokyo Institute Of Technology 複数のxml文書の類似度検出方法および類似性検出システム、ならびに複数のxml文書の統合方法
US20080215520A1 (en) * 2007-03-02 2008-09-04 Xiaohui Gu Method and system for indexing and serializing data
WO2014109127A1 (ja) * 2013-01-11 2014-07-17 日本電気株式会社 インデックス生成装置及び方法並びに検索装置及び検索方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TERAJIMA SHINTARO ET AL.: "Integrating XML Trees in similarity join based on tree serialization", THE FIRST FORUM REGARDING DATA ENGINEERING & INFORMATION MANAGEMENT- DEIM FORUM- LECTURE NOTE, 9 May 2009 (2009-05-09) *

Also Published As

Publication number Publication date
JPWO2018070405A1 (ja) 2019-08-08
US20190236055A1 (en) 2019-08-01
JP7040455B2 (ja) 2022-03-23
US11016953B2 (en) 2021-05-25

Similar Documents

Publication Publication Date Title
EP2945071B1 (en) Index generating device and method, and search device and search method
US7818303B2 (en) Web graph compression through scalable pattern mining
JP2008299867A (ja) データ構造によるコンピュータ表現及びそれに関連する符号化/復号化方法
JP2005025763A (ja) 構造化文書の分割プログラム、分割装置、及び分割方法
WO2016006276A1 (ja) インデックス生成装置及びインデックス生成方法
Chin et al. A fast algorithm for computing longest common subsequences of small alphabet size
JP2019139576A (ja) 最短経路行列生成プログラム、装置、及び方法
US20030208495A1 (en) User selectable editing protocol for fast flexible search engine
US9524354B2 (en) Device, method, and program for processing data with tree structure
KR101376444B1 (ko) 데이터 스트림에서 가중치를 고려하여 하향식으로 트리를 탐색하는 패턴 마이닝 방법
CN109254962B (zh) 一种基于t-树的索引优化方法、装置及存储介质
KR101761177B1 (ko) 상위 k 중요 패턴 마이닝 방법, 이를 수행하는 장치 및 이를 저장하는 기록매체
CN109597913A (zh) 对齐文档图片的方法,装置,存储介质和电子设备
WO2018070405A1 (ja) 情報処理装置、方法およびプログラム記録媒体
CN106569986B (zh) 字符串替换方法和装置
US11113314B2 (en) Similarity calculating device and method, and recording medium
CN107463676B (zh) 文本数据存储方法及装置
CN110362669B (zh) 一种适用于关键字快速检索的方法
JP4394964B2 (ja) データ圧縮装置、データ復元装置、テンプレート生成装置およびデータ圧縮システム
JP3708809B2 (ja) 多次元空間データ構造を記録した記録媒体、多次元空間データ更新方法、多次元空間データ探索方法および前記方法を実施するプログラムを記録した記録媒体
JP5628365B2 (ja) 検索装置
JP5696132B2 (ja) 部分的木構造に応じた適応型再構成装置及び方法及びプログラム
KR101499842B1 (ko) 데이터 객체 검색 방법 및 그 장치
KR100792307B1 (ko) 최빈 검색 경로 패턴 추출 시스템
JP3810575B2 (ja) 相関ルール抽出装置、および記録媒体

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17859605

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2018545013

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17859605

Country of ref document: EP

Kind code of ref document: A1