WO2016166983A1 - 制御装置、機器、情報処理システム、制御方法、および、記憶媒体 - Google Patents

制御装置、機器、情報処理システム、制御方法、および、記憶媒体 Download PDF

Info

Publication number
WO2016166983A1
WO2016166983A1 PCT/JP2016/002020 JP2016002020W WO2016166983A1 WO 2016166983 A1 WO2016166983 A1 WO 2016166983A1 JP 2016002020 W JP2016002020 W JP 2016002020W WO 2016166983 A1 WO2016166983 A1 WO 2016166983A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
control
node
nodes
movement
Prior art date
Application number
PCT/JP2016/002020
Other languages
English (en)
French (fr)
Inventor
小川 雅嗣
雅文 矢野
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to US15/565,688 priority Critical patent/US11188096B2/en
Priority to JP2017512203A priority patent/JP6750615B2/ja
Publication of WO2016166983A1 publication Critical patent/WO2016166983A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/0011Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots associated with a remote control arrangement
    • G05D1/0027Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots associated with a remote control arrangement involving a plurality of vehicles, e.g. fleet or convoy travelling
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • G05D1/0287Control of position or course in two dimensions specially adapted to land vehicles involving a plurality of land vehicles, e.g. fleet or convoy travelling
    • G05D1/0291Fleet control
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/0094Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots involving pointing a payload, e.g. camera, weapon, sensor, towards a fixed or moving target
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management

Definitions

  • the present invention relates to a technique for controlling the arrangement of a plurality of moving nodes.
  • Patent Document 1 describes a technique for quickly collecting products ordered by customers in a factory for e-commerce using a plurality of luggage-carrying robots.
  • Patent Document 2 describes a technique for performing a weeding operation using a plurality of weeding robots in a field where a plurality of weed groups exist.
  • Patent Document 3 describes a technique for searching for a search target using a plurality of unmanned aircraft.
  • UxV Unmanned x Vehicle
  • x is a phrase representing the operation space.
  • UAV Unmanned Air Vehicle
  • USV Unmanned Surface Vehicle
  • UUV Unmanned Undersea Vehicle
  • drone There are two types of drone as described above: one that is operated by a human from a remote location, and one that acts autonomously by an installed program.
  • the direction of technology is to be as autonomous as possible by the installed program.
  • an unmanned aircraft or a group of unmanned aircraft that wants to take over various actions and labors in the absence of humans is desired.
  • Patent No. 4617293 JP 2009-199359 A Patent No. 4926958
  • a central management system can be considered.
  • the drone may not be able to communicate with the central management system.
  • Patent Document 1 aims to reduce the operation cost of the operator.
  • this related technology does not consider improving the overall value (for example, high product collection efficiency) by a plurality of luggage carrying robots.
  • Patent Document 2 determines a weed group to perform the next weeding work so as to improve the work efficiency of each of the plurality of weeding robots.
  • this related technology does not consider improving the overall work efficiency of all weeding robots.
  • Patent Document 3 the related technology described in Patent Document 3 is that each robot updates a dynamic particle cluster that represents the existence probability of an object using the same algorithm, and models each other's behavior. Reduce data communication. However, this related technique is insufficiently considered for improving the overall search probability by a plurality of robots.
  • Such a problem is not limited to the cooperative operation of the drone.
  • a plurality of persons operate in a distributed manner for one purpose, such as searching for a suspicious person by a plurality of guards or police officers.
  • a technique for instructing who and how to operate in order to increase a certain overall value without centrally managing location information of all persons has not yet been proposed.
  • these related technologies do not centrally manage information related to multiple nodes (such as unmanned aircraft and humans), and the purpose is to increase a certain value for the entire node through the coordinated operation of multiple nodes. Is difficult to achieve.
  • the present invention has been made to solve the above-described problems. That is, the present invention aims to provide a technique for controlling the operations of a plurality of nodes so as to further increase a desired overall value without centrally managing information on each of the plurality of nodes operating in cooperation. And
  • control device of the present invention represents a state related to a predetermined value according to the position of each node including at least one node among a plurality of movable nodes including the responsible node.
  • control information generation means for generating control information for controlling movement of the responsible node based on the state information of at least some of the nodes, and on the basis of the control information Control means for controlling movement of the responsible node.
  • the device of the present invention is equipped with the above-described control device as a device for controlling its own movement.
  • the information processing system of the present invention includes a plurality of the above-described control devices to change the spatial arrangement of the plurality of nodes according to the change in the state of each of the plurality of nodes.
  • control method of the present invention provides state information representing a state related to a predetermined value according to the position of each node including at least one node in charge among a plurality of movable nodes. And generating control information for controlling movement of the responsible node based on the status information of at least some of the nodes, and controlling the movement of the responsible node based on the control information.
  • control method of the present invention acquires state information representing a state related to a predetermined value according to the position of each node including at least a part in charge among a plurality of movable nodes. Generating control information for controlling movement of the responsible node based on state information of at least some of the nodes, and controlling movement of the responsible node based on the control information; When executed by the computer device each serving as the responsible node, the spatial arrangement of the plurality of nodes is changed in accordance with the change in the state of each of the plurality of nodes.
  • the storage medium of the present invention obtains state information representing a state relating to a predetermined value according to the position of each node including at least one node among a plurality of movable nodes.
  • a control program for causing the computer device to execute control steps for control is stored.
  • the present invention can provide a technique for controlling the operations of a plurality of nodes so as to further increase the desired overall value without centrally managing information on each of the plurality of nodes that operate in a coordinated manner.
  • FIG. 1 shows the configuration of an information processing system 1 as a first embodiment of the present invention.
  • the information processing system 1 includes a plurality of control devices 10 that control each of a plurality of nodes 90.
  • the node 90 may be, for example, a drone or a person, but is not limited thereto.
  • Various mobile objects can be applied as the node 90.
  • Each control device 10 controls the movement of the node 90 that it is in charge of.
  • the node 90 that each control device 10 is in charge of is also referred to as a responsible node 90.
  • each control device 10 is connected to be able to communicate with another control device 10.
  • each control device 10 does not necessarily need to be able to communicate with all the other control devices 10. Further, each control device 10 need not always be able to communicate with other control devices 10.
  • the information processing system 1 causes a plurality of nodes 90 to operate cooperatively for a predetermined purpose.
  • the predetermined purpose include, but are not limited to, search for a target and formation of a suitable formation.
  • the information processing system 1 has an overall predetermined value that is targeted for improvement in a cooperative operation using a plurality of nodes 90 in advance.
  • the predetermined value include, but are not limited to, battery consumption in the entire node 90 and high search probability in the whole.
  • the control device 10 includes a state information acquisition unit 11, a control information generation unit 12, and a control unit 13.
  • the direction of the arrow connecting the rectangles indicating the components is an example, and the direction of the signal between the components is not limited.
  • the control device 10 can be configured by hardware elements as shown in FIG.
  • the control device 10 includes a computer device including a CPU (Central Processing Unit) 1001, a memory 1002, and a network interface 1003.
  • the memory 1002 includes a RAM (Random Access Memory), a ROM (Read Only Memory), an auxiliary storage device (such as a hard disk), and the like.
  • the network interface 1003 is an interface connected to a network constituted by the Internet, a LAN (Local Area Network), a public line network, a wireless communication network, or a combination thereof.
  • each functional block of the control device 10 is constituted by a CPU 1001 that reads and executes a computer program stored in the memory 1002 and controls each unit.
  • the plurality of control devices 10 included in the information processing system 1 may be configured by different computer devices, or some of the plurality of control devices 10 may be configured by the same computer device. Good. Or all the control apparatuses 10 may be comprised by the same computer apparatus. In addition, each control device 10 may be realized at a location away from the responsible node 90 or may be realized on the responsible node 90. Note that the hardware configuration of the control device 10 and each functional block thereof is not limited to the above-described configuration.
  • the status information acquisition unit 11 acquires status information for at least some of the nodes 90 including the responsible node 90 among the plurality of nodes 90.
  • the state information represents a state related to a predetermined value according to the position of the node 90.
  • the state information may include information representing the current position of the node 90 itself.
  • the state information may include information related to a predetermined value when the node 90 moves from the current position to an arbitrary position.
  • the state information may include information based on the capability level at the current position of the function of the node 90.
  • the state information acquisition unit 11 may acquire position information regarding the assigned node 90 and obtain the state information of the assigned node 90 based on the acquired position information. If the responsible node 90 is configured by a communicable device, the state information acquisition unit 11 may acquire the position information by communicating with the responsible node 90 to obtain the state information. In addition, if the responsible node 90 is configured by a mobile body such as a person who cannot communicate, the state information acquisition unit 11 is a terminal carried by the responsible node 90, a device that monitors the responsible node 90, or the like. The position information may be obtained by communicating with the information to obtain the state information.
  • the state information acquisition unit 11 may acquire the position information of the own device and obtain the state information. Further, the state information acquisition unit 11 may receive state information about the assigned node 90 from another control device 10 that is responsible for the other node 90.
  • the control device 10 in charge of each of the plurality of nodes 90 does not need to acquire the state information of the responsible node 90 in synchronization with the other control devices 10. Therefore, the status information acquisition unit 11 may acquire the status information from the control device 10 that has been able to acquire the status information of the node in charge 90 within a predetermined period including the current time among the other control devices 10. Further, when the information processing system 1 is configured by a plurality of computer devices, the control device 10 on a certain computer device necessarily communicates with other control devices 10 on other computer devices due to network conditions and other factors. It is not always possible. In this case, the state information acquisition unit 11 may acquire the state information of the node in charge 90 from the control device 10 that can communicate at the present time. Thus, the state information acquisition unit 11 does not have to acquire the state information for all the nodes 90. The status information acquisition unit 11 may acquire status information for at least some of the nodes 90 including the responsible node 90.
  • the control information generation unit 12 generates control information for controlling the movement of the responsible node 90 based on at least some of the state information of each node 90. Specifically, the control information generation unit 12 controls the responsible node 90 using an algorithm that increases a predetermined value (increases the value) in at least some of the nodes 90 for which the state information is obtained. Generate information. For example, the control information generation unit 12 may generate information indicating the movement direction and the movement control amount as the control information. The movement control amount may be a movement distance, for example. Alternatively, the movement control amount may be an energy amount used for moving the node in charge 90. Further, if there is a restriction on the movement of each node 90, the control information generation unit 12 may generate the control information in consideration of the restriction.
  • the control unit 13 controls the movement of the responsible node 90 based on the control information.
  • the control information represents a movement direction and a movement control amount.
  • the control unit 13 outputs information (instruction information) for instructing the movement direction and the movement control amount to the responsible node 90, so that the responsible node 90 is divided into the movement control amount corresponding to the corresponding movement direction.
  • the control unit 13 may transmit instruction information based on the control information to a moving mechanism mounted on the unmanned aircraft.
  • the control unit 13 may display the instruction information based on the control information on the display device of the portable information terminal possessed by the person.
  • control device 10 in the information processing system 1 configured as described above will be described with reference to FIG.
  • the state information acquisition unit 11 acquires, for at least some of the nodes 90 including the responsible node 90, state information related to a predetermined value according to the position of the node 90 (step S1).
  • the state information acquisition unit 11 may obtain the state information based on the position information obtained for the responsible node 90. Further, the state information acquisition unit 11 may acquire the state information of the responsible node 90 from another control device 10 capable of communication.
  • control information generation unit 12 generates control information for controlling the movement of the responsible node 90 based on the state information acquired in step S1 (step S2).
  • control information generation unit 12 generates the control information of the responsible node 90 using an algorithm that increases the predetermined value within the range of at least some of the nodes 90 for which the state information is obtained. May be. Further, the control information generation unit 12 may generate information indicating the movement direction and the movement control amount.
  • control unit 13 controls the movement of the responsible node 90 based on the control information determined in step S2 (step S3).
  • the control unit 13 may transmit instruction information based on the control information to the moving mechanism mounted on the unmanned aircraft.
  • the control unit 13 may display the instruction information based on the control information on the display device of the portable information terminal possessed by the person.
  • the control device 10 repeats the above operations. Note that the control device 10 does not necessarily perform the operations of steps S1 to S3 in this order.
  • the state information acquisition unit 11, the control information generation unit 12, and the control unit 13 may each operate asynchronously at predetermined timings.
  • the control information generation unit 12 may operate using the state information acquired most recently by the state information acquisition unit 11.
  • the control part 13 should just operate
  • the information processing system 1 can spatially arrange the plurality of nodes 90 according to a change in state related to a predetermined value according to the position of each of the plurality of nodes 90. Adjust.
  • the information processing system does not need to centrally manage information related to each of a plurality of nodes that operate in a coordinated manner, and performs the operations of the plurality of nodes so as to further increase the desired overall value. Each can be controlled.
  • the state information acquisition unit determines at least a part of each of the nodes including the responsible node among the plurality of movable nodes according to the position of the node. State information representing a state related to the predetermined value is acquired. And a control information generation part produces
  • each control device controls the movement of the responsible node using the status information of at least some of the nodes including the responsible node, so there is no need to centrally manage the status of all nodes.
  • each control device controls the movement of the responsible node based on the state information of some nodes so as to improve a predetermined value in those nodes, so that it is realized based on the spatial arrangement of a plurality of nodes.
  • the overall predetermined value can be further increased.
  • the information processing system of the present invention is applied to a purpose of searching for a target to be searched by cooperative operation of a plurality of nodes.
  • the target shall move.
  • the high target search probability is applied as the overall predetermined value aimed at improving the target search by a plurality of nodes.
  • the presence probability density of the target is expressed by the following equation (1).
  • x, y, and z represent coordinates (positions).
  • X t , y t , and z t represent the x coordinate, y coordinate, and z coordinate (position) of the target.
  • Equation (1) may be defined to indicate a mountain shape in which the existence probability density decreases as the target position (x t , y t , z t ) peaks and the distance from the position decreases. .
  • the position where the target was most recently discovered may be applied to the target position (x t , y t , z t ) in Expression (1).
  • the current target predicted position calculated based on the position where the target was most recently found may be applied to the target position (x t , y t , z t ).
  • the discovery probability that each node discovers the search target is expressed by the following equation (2).
  • ⁇ i is a search effort given to the i-th node i among a plurality of nodes (i is a positive integer).
  • the search effort may be considered as a movement control amount.
  • Discovery means recognizing a target by a recognition function (for example, eyes or sonar) of a node.
  • the discovery probability refers to the probability (high ability) that a target in a peripheral area centering on the own node can be recognized. The discovery probability often varies depending on the environment in which each node exists.
  • ⁇ i is an amount that depends on radio wave propagation.
  • ⁇ i is an amount that varies depending on the sea area where the node exists, and a coefficient suitable for the environment is determined.
  • the target search probability at each node can be represented by the product of the existence probability density of the search target and the discovery probability of the node as in the following equation (4).
  • x i , y i , and z i represent the x coordinate, y coordinate, and z coordinate (position) of the node i.
  • the search probability in the whole plurality of nodes is expressed by the following equation (5).
  • the search effort should be considered finite considering the energy of the node. Thus, the overall search probability is maximized for a given search effort put into the whole. In other words, for a limited search effort, the search probability must be increased as much as possible.
  • an upper limit ⁇ of search effort that is put into the entire unit per unit time is set as a constraint, and then the search probability is maximized.
  • the above optimization problem can be easily solved if the status information of all nodes can be acquired synchronously.
  • the information processing system in cases where the state information of each node cannot be collected synchronously, or in a case where a system for centrally managing a plurality of nodes cannot be provided, allows a plurality of nodes to target The search probability is further improved while searching. Details of the information processing system according to the present embodiment will be described below.
  • FIG. 5 shows the configuration of an information processing system 2 as a second embodiment of the present invention.
  • the information processing system 2 includes a plurality of control devices 20 that control each of the plurality of nodes 90.
  • the control device 20 includes a state information acquisition unit 21, a control information generation unit 22, a control unit 23, and a target position acquisition unit 24. Further, the state information acquisition unit 21 includes an evaluation function setting unit 211. In addition, the control information generation unit 22 includes a constraint acquisition unit 221, a movement direction determination unit 222, and a movement control amount determination unit 223.
  • the direction of the arrow connecting the rectangles indicating the components is an example, and the direction of the signal between the components is not limited.
  • control device 20 and each functional block thereof can be configured by the same hardware elements as those of the first embodiment of the present invention described with reference to FIG.
  • the hardware configuration of the control device 20 and each functional block thereof is not limited to the above-described configuration.
  • the target position acquisition unit 24 acquires position information related to the target.
  • the target is a target to be searched by the plurality of nodes 90.
  • the target position acquisition unit 24 acquires the position information from the node 90 in charge of the device.
  • the target position acquisition unit 24 may receive the target position information transmitted by the node 90.
  • the node 90 is a mobile object such as a person who cannot communicate
  • the target position acquisition unit 24 may receive target position information transmitted by a portable information terminal or the like possessed by the node 90.
  • the target position acquisition unit 24 may acquire target position information by using a target position specifying function or an input provided in the responsible node 90. .
  • the target position acquisition unit 24 transmits the position information of the target to the other control device 20.
  • the target position acquisition unit 24 may acquire the position information by receiving the target position information from another control device 20. Further, the target position acquisition unit 24 may acquire the position information by predicting the current position of the target using the position information of the target most recently received from the responsible node 90 or another control device 20. Good. It should be noted that a known technique that takes into account the characteristics and environment of the target can be employed for the target position prediction process.
  • the state information acquisition unit 21 acquires the state information of at least some of the nodes 90 including the responsible node 90 using the evaluation function set by the evaluation function setting unit 211.
  • the evaluation function setting unit 211 sets an evaluation function related to the responsible node 90.
  • the evaluation function is a function that evaluates the degree to which a certain node 90 contributes at an arbitrary position with respect to the improvement of the overall predetermined value realized by the spatial arrangement of the plurality of nodes 90.
  • a search at an arbitrary position of the node 90 is performed based on the high discovery capability (discovery probability) according to the environment at the position of the corresponding node 90 and the presence probability density of the target.
  • a function representing probability is applicable. It is assumed that the discovery probability according to the environment at the position of the node 90 is determined in advance.
  • the evaluation function setting unit 211 may use the search probability represented by Expression (4) as the evaluation function.
  • Such an evaluation function is determined according to the update of the position of the corresponding node 90 or the position of the target. Therefore, the evaluation function setting unit 211 updates the evaluation function according to the acquisition of the state information of the responsible node 90 or the acquisition of the target position information.
  • the state information acquisition unit 21 acquires information based on the evaluation function set by the evaluation function setting unit 211 as the state information for the responsible node 90. Further, the state information acquisition unit 21 further stores information on the other node 90 based on the evaluation function set for the node 90 by the state information acquisition unit 21 of the control device 20 in charge of the other node 90. Obtained as status information. That is, the state information acquisition unit 21 may transmit / receive information based on the evaluation function set by the evaluation function setting unit 211 to / from the state information acquisition unit 21 of another control device 20 that can communicate.
  • the state information acquisition unit 21 does not need to acquire the state information for all the nodes 90, like the state information acquisition unit 11 in the first embodiment of the present invention.
  • the status information acquisition unit 21 may acquire status information for at least some of the nodes 90 including the responsible node 90.
  • the control information generation unit 22 generates control information (movement direction and movement control amount) related to the responsible node 90 based on at least some state information of each node 90 and target position information. Specifically, the control information generation unit 22 uses the constraint acquisition unit 221, the movement direction determination unit 222, and the movement control amount determination unit 223 to generate control information regarding the assigned node 90.
  • the constraint acquisition unit 221 acquires information representing constraints related to movement of the plurality of nodes 90. As restrictions on movement, there are restrictions on the arrangement of a plurality of nodes 90 and restrictions on the amount of movement control, for example.
  • the constraint acquisition unit 221 may acquire information representing a constraint that the distance between the nodes 90 is greater than or equal to a threshold value as a constraint related to arrangement.
  • the constraint acquisition unit 221 may acquire information representing a constraint that the overlapping state of the searchable range of each node 90 satisfies a predetermined condition.
  • the searchable range is a predetermined peripheral area centered on the position of the node 90.
  • the predetermined condition may be that a searchable range of a certain node 90 does not overlap with a searchable range of another node 90.
  • the predetermined condition may be that a size of an area overlapping a searchable range of another node 90 in a searchable range of a certain node 90 is equal to or less than a threshold value. Such a restriction on the arrangement is provided in order to prevent a range that can be searched as a whole from becoming narrow when a plurality of nodes 90 are crowded.
  • the restriction acquisition unit 221 may acquire information representing a restriction that defines an upper limit of the total movement control amount that can be input to all the nodes 90 per unit time.
  • the moving direction determination unit 222 determines the moving direction of the responsible node 90 in consideration of the position information of the responsible node 90, the position information of the target, and any restrictions related to the arrangement.
  • the movement direction determination unit 222 creates a vector that extends from the position of the responsible node 90 to the target position as the starting point, indicating the movement direction.
  • the movement direction determination unit 222 adjusts the direction of this vector in consideration of the restriction.
  • a vector indicating the movement direction is also referred to as a movement vector.
  • the movement control amount determination unit 223 considers the state information of at least some of the nodes 90 including the responsible node 90, target position information, and restrictions on the movement control amount, if any, while considering the restrictions. Determine the amount of movement control.
  • the movement control amount include a movement distance and an energy amount (for example, a motor torque amount) input to move the node 90, but are not limited thereto.
  • the movement control amount determination unit 223 uses an algorithm for increasing the search probability of all the nodes 90 when unit search efforts are made for at least some of the nodes 90 including the responsible node 90.
  • the movement control amount of the responsible node 90 may be determined.
  • At least some of the nodes 90 may be all nodes 90 from which state information is obtained, or may be nodes 90 that satisfy a predetermined condition.
  • the predetermined condition may be, for example, a condition that the distance from the responsible node 90 is within a threshold (neighboring).
  • the movement control amount determination unit 223 compares the information obtained using the evaluation function for the assigned node 90 with the information obtained using the evaluation function for the other nodes 90. Then, based on the comparison result, the movement control amount determination unit 223 moves to increase the total search probability when the unit search effort is input to at least some of the nodes 90 including the responsible node 90. A control amount can be determined.
  • the movement control amount determination unit 223 currently sets the increment of the search probability from the current time when the unit search effort is input in the direction determined by the movement direction determination unit 222 for the responsible node 90. It is obtained using the evaluation function. In addition, the movement control amount determination unit 223 obtains an increment from the present time of the search probability when the unit search effort is input in the direction determined for the other node 90 for which the state information is obtained. . In this case, as an increase in the search probability for the other node 90, the increase in the search probability per unit search effort calculated by the movement control amount determination unit 223 of the control device 20 in charge of the other node 90 is the state information. Is acquired by the state information acquisition unit 21.
  • the movement control amount determination unit 223 uses the unit of movement control amount of the responsible node 90 in the next control step as the unit of the movement control amount. Search efforts may be determined.
  • the movement control amount determination unit 223 sets the movement control amount of the assigned node 90 in the next control step as zero. May be determined. In other words, in this case, the movement control amount determination unit 223 may determine that the search effort is not put into the assigned node 90 in the next control step, and that it does not operate.
  • the movement control amount determination unit 223 compares the increment between the responsible node 90 and each of the other nodes 90 as described above, and integrates the comparison results, thereby obtaining the movement control amount of the responsible node 90. Can be determined.
  • the search probability per unit search effort is equivalent to the differentiation of the evaluation function. Therefore, as described above, when the operation for determining the movement control amount is repeated so as to increase the search probability per unit search effort in at least some of the nodes 90 including the responsible node 90, the derivatives of the evaluation functions are changed. It becomes equal in each node 90. Therefore, the movement control amount determination unit 223 may determine the movement control amount so that the differentiation of the evaluation function set in at least some of the nodes 90 including the assigned node 90 is equal.
  • the movement control amount determination unit 223 substantially omits information (differentiation) obtained from the evaluation function set for the assigned node 90 and information (differentiation) obtained from the evaluation functions set for the other nodes 90.
  • the movement control amount of the responsible node 90 may be determined so as to be the same.
  • the movement control amount determination unit 223 further considers the restriction on the movement control amount. For example, it is assumed that the upper limit of the total amount of movement control is set. In this case, if the movement control amount determination unit 223 can acquire the determined movement control amount from all of the control devices 20 in charge of each of the plurality of nodes 90, the movement control amount determination unit 223 sets the movement control amount so that the total does not exceed the upper limit. adjust. Further, when there is a control device 20 that cannot acquire the movement control amount, the movement control amount determination unit 223 obtains an estimated value of the movement control amount determined for the node 90 that the control device 20 is responsible for. As the estimation method, a predetermined assumed value may be used, or other known estimation techniques may be used.
  • control information generation unit 22 provides control information for moving the responsible node 90 in the movement direction determined by the movement direction determination unit 222 by the movement control amount determined by the movement control amount determination unit 223. Generate.
  • the control unit 23 controls the movement of the responsible node 90 according to the control information generated by the control information generation unit 22. Specifically, the control unit 23 outputs the instruction information based on the control information generated by the movement control amount determination unit 223 to the node 90, thereby causing the node 90 to move in the movement direction. Move by the amount of.
  • each control device 20 in the information processing system 2 configured as described above will be described with reference to FIG. In the following description, it is assumed that the constraint acquisition unit 221 has already acquired the constraint on the arrangement and the constraint on the movement control amount.
  • the target position acquisition unit 24 acquires target position information (step S11).
  • the target position acquisition unit 24 acquires the position information of the target discovered by the responsible node 90 or other control responsible for the node 90 with the position information of the target discovered by the other node 90. You may acquire from the apparatus 20. FIG. As described above, the target position acquisition unit 24 may acquire the target position by predicting the current target position based on the target position information acquired in the past.
  • the state information acquisition unit 21 acquires position information of the responsible node 90 (step S12).
  • the state information acquisition unit 21 uses the evaluation function setting unit 211 to set an evaluation function that reflects the position of the target and the position of the responsible node 90. And the status information acquisition part 21 calculates
  • the state information acquisition unit 21 acquires information based on the evaluation function set for the node 90 from the control device 20 that controls the node 90 as the state information of at least some other nodes 90. (Step S14).
  • control information generation unit 22 uses the movement direction determination unit 222 to determine the movement direction of the responsible node 90 in consideration of the restrictions on the arrangement (step S15).
  • the movement direction determination unit 222 generates a movement vector that extends in the direction of the target position starting from the position of the responsible node 90 and then determines the direction in consideration of restrictions on the arrangement. You may adjust.
  • control information generation unit 22 uses the movement control amount determination unit 223 to determine the movement control amount to be input to the assigned node 90 (step S16).
  • the movement control amount determination unit 223 includes information obtained from the evaluation function represented by the state information of the node in charge 90, and information obtained from the evaluation function represented by the state information of the other node 90. Based on the comparison result, the movement control amount of the responsible node 90 may be determined.
  • control information generation unit 22 generates control information for controlling the responsible node 90 to move in the direction determined in step S14 by the movement control amount determined in step S15 (step S17). .
  • control unit 23 controls the movement by outputting the instruction information based on the control information generated in step S17 to the responsible node 90 (step S18).
  • control unit 23 may transmit instruction information based on the control information to the moving mechanism mounted on the unmanned aircraft as the responsible node 90. Further, for example, the control unit 23 may display the instruction information based on the control information on the display device of the portable information terminal possessed by the person as the responsible node 90.
  • the control device 20 repeats the above operation. Note that the control device 20 does not necessarily perform the operations of steps S11 to S18 in this order.
  • the state information acquisition unit 21, the control information generation unit 22, the control unit 23, and the target position acquisition unit 24 may operate asynchronously at predetermined timings.
  • the control information generation unit 22 includes the state information based on the evaluation function most recently set by the state information acquisition unit 21 (evaluation function setting unit 211) and the target acquired most recently by the target position acquisition unit 24. It is sufficient to operate using the position information.
  • the control unit 23 may operate using the control information generated most recently by the control information generation unit 22.
  • the information processing system 2 changes the spatial arrangement of the plurality of nodes 90 according to a change in the state related to the search probability according to the position of each of the plurality of nodes 90. adjust.
  • UUV Unmanned Undersea Vehicle
  • the UUV is an unmanned aerial vehicle that autonomously operates underwater and searches for a target with sonar.
  • the UUV can move according to control information received from the outside.
  • UUV as the node 90 is also referred to as UUV90.
  • the information processing system 2 is realized on the cloud in cloud computing as shown in FIG. That is, each control device 20 remotely controls the UUV 90 in charge from the cloud. Thereby, the information processing system 2 searches for a target using the plurality of UUVs 90.
  • each control device 20 moves its state with respect to the UUV 90 that it is in charge of, while transmitting and receiving state information to and from the control device 20 that is in charge of the neighboring UUV 90, as if the UUV 90 exchanges information with the neighboring UUV 90 Will be controlled.
  • the evaluation function setting unit 211 applies the above-described formula (4) as the evaluation function.
  • the existence probability density g of the target in the equation (4) is a Gaussian type in which the position (x t , y t , z t ) where the target was most recently discovered is peaked, and the existence probability density decreases with increasing distance from the position. Is used.
  • the detection probability p i for each UUV90 in equation (4) applying equation (3).
  • ⁇ i in equation (3) varies depending on the sea area where UUV90 exists. Therefore, in this specific example 1, ⁇ i for each sea area is stored in a database in advance.
  • the state information acquisition unit 21 changes ⁇ i based on the position information of the UUV 90.
  • each UUV 90 has an upload function for transmitting various information to the control device 20 or the like.
  • the UUV 90 finds a target by itself, it acquires its position information. Then, the UUV 90 transmits the position information of the target discovered by the own device to the control device 20 on the cloud in charge of the other UUV 90 and the own device.
  • the UUV 90 transmits the position information to the control apparatus 20 on the cloud in charge of the own apparatus. Thereby, the target position acquisition part 24 of each control apparatus 20 acquires the positional information on a target.
  • the UUV 90 transmits the position information of the own device to the control device 20 on the cloud in charge of the own device.
  • the state information acquisition unit 21 of each control device 20 acquires the position information of the UUV 90 that the device itself is in charge of, and sets the evaluation function based on the position information of the UUV 90 that is in charge and the target position information. .
  • Each UUV 90 asynchronously executes such information transmission operation. That is, uploading of various position information to the control device 20 is executed asynchronously. Therefore, in the information processing system 2 realized on the cloud, even if the control devices 20 can communicate with each other, information on all UUVs 90 is not collected synchronously. Therefore, a general optimization technique cannot be applied in order to improve the search probability in the entire UUV90. However, even in an environment where information on each UUV 90 is collected only asynchronously using a general optimization technique, it is possible to perform optimization calculation by forcibly interlacing old information. However, since old information has a bad influence on the whole, a suitable optimization is not actually performed. Thus, an environment is assumed in which uploading of various position information to the control device 20 is executed asynchronously.
  • FIG. 9 shows how the spatial arrangement of the UUV 90 group whose movement is controlled by the operation of the information processing system 2 changes over time.
  • the formation of the UUV90 group was formed as shown in the “initial state” of FIG.
  • the target moves in the space where such UUV90 group exists.
  • a triangle indicates a target. Circles indicate UUV90.
  • FIG. 9 shows that time has passed from the top to the bottom. From FIG. 9, it can be seen that the UUV 90 group approaches to wrap around the target as the target moves, and the target can be tracked. Further, from FIG. 9, it can be seen that the UUV 90 located far from the target (for example, the two UUVs 90 at the right end surrounded by the dotted circle) has not moved, and no unnecessary movement has been performed.
  • the search probability has a characteristic that, in principle, the search effort increases as the search effort is input, a comparison was made with a value per input search effort (per unit search effort).
  • the simulation of the specific example 1 of the information processing system 2 has an overall search probability (per unit search effort) that is about 30% higher on average than the simulation to be compared.
  • the overall search probability is increased while the target is tracked by the plurality of UUV 90 groups. was found to be possible.
  • each UUV 90 transmits / receives information to / from a control device 20 mounted in another nearby UUV 90 capable of communication using the control device 20 mounted on the own device. It moves autonomously and decentralized under the control.
  • a UUV 90 constitutes an embodiment of the device of the present invention.
  • Specific Example 2 assumes a case where it is difficult to transmit information to a remote place from the field in which the UUV 90 group moves, and each UUV 90 must expect autonomous movement. Such cases are very common in actual application.
  • the second specific example is effective for a case where it is difficult to install the information processing system 2 in a remote place like the first specific example.
  • the second specific example is also effective in a case where the remote information processing system 2 like the first specific example does not function.
  • Specific example 2 differs from specific example 1 in that UUV 90 does not need to have an upload function.
  • the target position acquisition unit 24 of the control device 20 mounted on the UUV 90 finds a target by itself, the position information is acquired and transmitted to the other UUV 90.
  • the target position acquisition part 24 acquires by receiving the positional information on a target from other UUV90, when not finding a target with an own machine.
  • the target position acquisition unit 24 determines the current location based on the past position information. You may acquire the positional information on a target by prediction.
  • the state information acquisition unit 21 and the control information generation unit 22 acquire the position information of the own device as necessary.
  • Other assumptions regarding the evaluation function, target existence probability density g, discovery probability p i , ⁇ i for each sea area, and the like are the same as in the first specific example.
  • a person is assumed as the node 90.
  • a target area is guarded by a plurality of guards, and if a suspicious person is found, the suspicious person is tracked and captured by an appropriate number of persons.
  • the guard as the node 90 is also referred to as the guard 90.
  • the control apparatus 20 was implement
  • FIG. 11 it assumes that the control apparatus 20 was implement
  • the control unit 23 of each control device 20 displays instruction information based on the control information on the display device of the tablet terminal. For example, the control unit 23 displays information indicating the movement destination determined by the movement direction determination unit 222 and the destination point moved by the movement control amount determined by the movement control amount determination unit 223 on the display device. May be. As a result, the guard 90 moves toward the destination point displayed on the display device. Thereby, the control apparatus 20 controls the movement of the guard 90.
  • the control device 20 displays a user interface (for example, a button-type graphic that can be pressed) on the display device to notify the suspicious person discovery. Also good. Thereby, the guard 90 who found the suspicious person operates the user interface.
  • the target position acquisition unit 24 that has received the operation may transmit the position information of the own device at that time as position information of the suspicious person to the control device 20 on the tablet terminal carried by another guard 90. .
  • Specific example 3 is similarly described in the description of specific example 2 by replacing the target with a suspicious person and replacing UUV with a guard.
  • the evaluation function and the target existence density g it is possible to assume the same assumptions as in specific examples 1 and 2.
  • the detection probability p i may be set the function associated with the field of view of the guards 90. That is, a function set to an amount proportional to the field of view may be applied as ⁇ i according to the environment.
  • Specific Example 3 of the information processing system 2 uses the control device 20 on the tablet terminal carried by each of the plurality of guards 90 to increase the overall search probability while tracking the suspicious person. can do.
  • the specific example 3 of the information processing system 2 enables efficient guarding, tracking and capturing of suspicious persons.
  • the node 90 is not limited to a guard, but can be applied to other people such as a police officer and a running police.
  • the suspicious person was assumed as a target, it is not restricted to this.
  • a group such as “crowded” where problems are likely to occur may be applied as a target.
  • the specific example 3 of the information processing system 2 can be applied to efficient security for crowds.
  • each control apparatus 20 demonstrated the example implement
  • each control device 20 may be realized on a wearable terminal or a glasses-type terminal.
  • each control apparatus 20 may be implement
  • the information processing system 2 can be realized on the cloud as in the first specific example.
  • each control device 20 on the cloud receives various types of information from a terminal that moves with a person serving as the node 90 in charge, and transmits instruction information based on the control information so as to be displayed on the display device of the terminal. Good.
  • the information processing system as the second exemplary embodiment of the present invention does not need to centrally manage information regarding all of the nodes that search for a target by cooperative operation, and can improve the overall search probability while tracking the target well. Can be increased.
  • the target position acquisition unit acquires target position information.
  • the state information acquisition unit uses the evaluation function to generate state information for at least some of the nodes including the responsible node.
  • the evaluation function is a function that evaluates the degree to which a node contributes at an arbitrary position with respect to the improvement of the overall predetermined value realized by the spatial arrangement of a plurality of nodes.
  • the state information acquisition unit uses the evaluation function setting unit to update the evaluation function related to the assigned node in accordance with the update of the target position information and the update of the assigned node position information.
  • the control information generation unit uses the movement direction determination unit to determine the direction from the current position of the node in charge toward the target position as the movement direction while considering restrictions on arrangement.
  • control information generation unit uses the movement control amount determination unit to consider the information obtained from the evaluation function of the responsible node and the information obtained from the evaluation function of the other node while considering restrictions on the movement control amount. Based on the comparison result, the movement control amount of the node in charge is determined. This is because the control unit controls the responsible node to move in the determined direction by the determined movement control amount.
  • the information processing system may, for example, set up a computer device on which the information processing system is mounted on the beach and remotely control the movement of a plurality of UUVs.
  • the information processing system may be realized on a computer device mounted on a mother ship that collects a plurality of UUVs.
  • UUV has been described as an example of the unmanned machine applied as a node, but other unmanned machines may be applied as a node.
  • unmanned machines such as an airplane-type unmanned aircraft flying in the sky and an unmanned aircraft running on land can be applied as nodes.
  • control is performed by applying the improvement of the overall search probability as a predetermined value in the use of searching and tracking a moving target using a plurality of nodes.
  • the present embodiment is not limited to this.
  • the present embodiment applies a search for better energy efficiency and more search objects as a predetermined value, and performs control. May be performed.
  • a formation that can transmit / receive information to / from each other at a desired transfer rate in a wider range as a predetermined value The control may be performed by applying the above.
  • the present embodiment can be applied to an application that uses a plurality of nodes to achieve a predetermined purpose while further increasing the overall predetermined value.
  • the target existence probability density, the node discovery probability, and the search probability are described as being expressed by the equations (1) to (4), but these are expressed by other equations. It may be.
  • the constraint condition and the predetermined value are described as being expressed by the equations (5) to (6), but these may be expressed by other equations.
  • the constraint acquisition unit does not necessarily acquire these constraints, and may acquire many other constraints.
  • each functional block of the control device is realized by a CPU that executes a computer program stored in a storage device or ROM.
  • the present invention is not limited to this, and some, all, or a combination of each functional block may be realized by dedicated hardware.
  • the functional block of the control device may be realized by being distributed among a plurality of devices.
  • the operation of the control device described with reference to each flowchart is stored in a storage device (storage medium) of the computer device as a computer program of the present invention. Then, the computer program may be read and executed by the CPU.
  • the present invention is constituted by the code of the computer program or a storage medium.
  • a state information acquisition unit that acquires state information representing a state related to a predetermined value according to the position of each node including at least a part in charge of a plurality of movable nodes;
  • a control information generating unit that generates control information for controlling movement of the responsible node, based on state information of each of the at least some of the nodes;
  • a control unit that controls movement of the responsible node based on the control information;
  • a control device comprising:
  • the state information acquisition unit uses an evaluation function that evaluates the degree of contribution of the node at an arbitrary position to the overall improvement in the predetermined value realized by the spatial arrangement of the plurality of nodes.
  • the control apparatus according to claim 1, wherein the state information is generated for at least some of the nodes including the responsible node.
  • the control information generation unit generates the control information based on a comparison result between information obtained using the evaluation function for the responsible node and information obtained using the evaluation function for the other nodes.
  • the control apparatus according to appendix 2, characterized in that: (Appendix 4) The control information generation unit generates the control information so that information obtained using the evaluation function for the assigned node is substantially the same as information obtained using the evaluation function for the other nodes. 4.
  • the control device according to appendix 3, wherein (Appendix 5) A target position acquisition unit that acquires position information related to a search target (target) by the plurality of nodes; Any one of appendix 1 to appendix 4, wherein the control information generation unit generates the control information related to the node based on the position information related to the target in addition to the state information of the at least some of the nodes.
  • the control device according to one. (Appendix 6) 6.
  • the control device according to appendix 5, wherein the state information acquisition unit uses a function based on information indicating the existence probability at an arbitrary position of the target as the evaluation function.
  • Appendix 7 The control apparatus according to appendix 5 or appendix 6, wherein the state information acquisition unit uses a function based on a high discovery capability of the node with respect to the target as the evaluation function.
  • Appendix 8 The control device according to any one of appendix 1 to appendix 7, wherein the control information generation unit generates information indicating a movement direction and a movement control amount of the node as the control information.
  • Appendix 9) 9. The control device according to any one of appendix 1 to appendix 8, wherein the control information generation unit generates the control information based on restrictions on movement of the plurality of nodes.
  • the control information generation unit adjusts the movement control amount of the responsible node in consideration of the upper limit of the movement control amount assigned as a total to the plurality of nodes as the restriction on the movement.
  • the control device according to appendix 9. The control information generation unit considers a predetermined condition determined to satisfy an overlapping situation between the searchable range of the responsible node and the searchable range of another node as a restriction on the movement, and The control apparatus according to appendix 9 or appendix 10, wherein the moving direction is adjusted.
  • An information processing system that includes the control device according to any one of a plurality of supplementary notes 1 to 11 and changes a spatial arrangement of the plurality of nodes according to a change in the state of each of the plurality of nodes. .
  • (Appendix 14) For at least some of the nodes including the responsible node among a plurality of movable nodes, obtain state information representing a state relating to a predetermined value according to the position of the node, Based on the status information of each of the at least some of the nodes, generating control information for controlling the movement of the responsible node, A control method for controlling movement of the responsible node based on the control information.
  • each node including the responsible node among a plurality of movable nodes For at least a part of each node including the responsible node among a plurality of movable nodes, obtain state information indicating a state related to a predetermined value according to the position of the node, and the state of each of the at least some nodes Generating control information for controlling movement of the responsible node based on the information, and controlling movement of the responsible node based on the control information, executing each of the plurality of nodes as the responsible node
  • a control program for causing a computer device to execute.

Landscapes

  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本発明は、協調動作する複数のノードのそれぞれに関する情報を集中管理する必要なく、所望の全体的な価値をより高めるよう、複数のノードの動作をそれぞれ制御する技術を提供する。 状態情報取得部11は、移動可能な複数のノード90のうち担当ノード90を含む少なくとも一部の各ノード90について、そのノード90の位置に応じた所定の価値に関わる状態を表す状態情報を取得する。また、制御情報生成部12は、少なくとも一部の各ノード90の状態情報に基づいて、担当ノード90の移動を制御する制御情報を生成する。また、制御部13は、制御情報に基づいて担当ノードの移動を制御する。状態情報取得部11、制御情報生成部12および制御部13を有する制御装置10を、複数のノード90のそれぞれについて備える。

Description

制御装置、機器、情報処理システム、制御方法、および、記憶媒体
 本発明は、移動する複数のノードの配置を制御する技術に関する。
 近年、無人機を使った応用が多く提案されている。例えば、自動的に部屋の掃除を行ってくれる円盤型ロボットや、空を飛ぶ無人機(ドローンと呼ぶ)による宅配などがある。また、原子力発電所などの危険な環境で活動するロボットなどもその一例である。これらは、通常1体の無人機を使用しているが、複数の無人機を使用した応用例も提案されている。
 例えば、特許文献1には、Eコマース用の工場にて、複数の荷物運び用のロボットを使用し、顧客のオーダーした商品をいち早く集める技術が記載されている。また、特許文献2には、複数の雑草群が存在する圃場において、複数の除草ロボットを使用して除草作業を行う技術が記載されている。また、特許文献3には、複数の無人機を使用して探索対象を探索する技術が記載されている。
 ここで、探索対象を複数の無人機で探索するという応用は、防衛関連技術として近年盛んに研究されている。一般的に、無人機は、その動作空間を表す語句がxであるとすると、UxV(Unmanned x Vehicle)と呼ばれる。例えば、無人飛行機はUAV(Unmanned Air Vehicle)、無人船はUSV(Unmanned Surface Vehicle)、無人水中船はUUV(Unmanned Undersea Vehicle)等と呼ばれている。
 上述したような無人機には、遠隔から人間が操作するものと、搭載されたプログラムにより自律的に行動するものがある。技術の方向は、できるだけ、搭載されたプログラムにより自律的に行動するものを目指している。つまり、人間不在でも、人間に変わり様々な行動や労働を肩代わりする無人機あるいは無人機群が望まれている。
特許第4617293号 特開2009-199359号公報 特許第4926958号
 上述のように、無人機の検討は広くおこなわれているが、複数の無人機の協調動作により、ある価値を無人機全体で最大化するのは難しい。ある価値としては、例えば、無人機全体でのバッテリーの消費効率の良さや、探索対象の探索確率の高さ等が挙げられる。これらの価値の最大化は、無人機全体の最適化問題を解くことと等価である。
 このような価値を最大化する方法の1つとして、全ての無人機からアップロードされる情報を取得し、取得した情報を用いて最適化問題を解き、その結果に基づき各無人機に指示を出す中央管理システムが考えられる。しかしながら、全ての無人機の情報を同期的に(ある時間間隔で)取得することは、困難であることが多い。例えば、無人機が中央管理システムと通信できない場合がある。また、例えば、無人機が多数ある場合は、それぞれの無人機の情報を全て取得するのには膨大な時間がかかる場合がある。
 また、上記の中央管理システムをあきらめ、個々の無人機が近隣の無人機とのみ通信し、分散的に動作するという手法も考えられる。しかしながら、分散的な動作環境で、無人機全体に関する、ある価値を最大化するのは難しく、有効な手法はまだ提案されていない。
 例えば、特許文献1に記載された関連技術は、作業者の操作コストを低減することを目的としている。しかしながら、この関連技術は、複数の荷物運びロボットによる全体的なある価値(例えば商品収集効率の高さなど)を向上させることについては考慮していない。
 また、特許文献2に記載された関連技術は、複数の除草ロボットについて、それぞれの作業効率を向上させるよう、次に除草作業を実施する雑草群を決定する。しかしながら、この関連技術は、全ての除草ロボットによる全体的な作業効率を向上させることについては考慮していない。
 また、特許文献3に記載された関連技術は、各ロボットが、同一のアルゴリズムを用いて物体の存在確率を表す動的な粒子クラスタを更新し、互いの挙動をモデル化することで、ロボット間のデータ通信を低減する。しかしながら、この関連技術は、複数のロボットによる全体的な探索確率を向上することについては、考慮が不十分である。
 このように、これらの関連技術は、複数の無人機を協調動作させているように見えるが、全体で何らかの価値を向上させることについては、充分に考慮していない。無人機の群れがある目的で動くことと、群れ全体の価値を最大化しながら動くこととの間には、大きなギャップがある。
 このような課題は、無人機の協調動作に留まらない。例えば、複数の警備員や警官で不審者を探索するなど、複数の人が1つの目的に対してそれぞれ分散的に動作する事例がある。このような事例において、全ての人の位置情報等を集中管理することなく、ある全体的な価値を高めるために誰がどのように動作すればよいかを指示する技術は、まだ提案されていない。
 以上述べた通り、これらの関連技術では、複数のノード(無人機や人等)に関する情報を集中管理することなく、複数のノードの協調動作により、ある価値をノード全体でより大きくしながらその目的を達成することは困難である。
 本発明は、上述の課題を解決するためになされたものである。すなわち、本発明は、協調動作する複数のノードのそれぞれに関する情報を集中管理する必要なく、所望の全体的な価値をより高めるよう、複数のノードの動作をそれぞれ制御する技術を提供することを目的とする。
 上記目的を達成するために、本発明の制御装置は、移動可能な複数のノードのうち担当ノードを含む少なくとも一部の各ノードについて、そのノードの位置に応じた所定の価値に関わる状態を表す状態情報を取得する状態情報取得手段と、前記少なくとも一部の各ノードの状態情報に基づいて、前記担当ノードの移動を制御する制御情報を生成する制御情報生成手段と、前記制御情報に基づいて前記担当ノードの移動を制御する制御手段と、を備える。
 また、本発明の機器は、自らの移動を制御する装置として、上述の制御装置を搭載する。
 また、本発明の情報処理システムは、複数の上述の制御装置を備えることにより、前記複数のノードのそれぞれの前記状態の変化に応じて前記複数のノードの空間的配置を変化させる。
 また、本発明の制御方法は、コンピュータ装置が、移動可能な複数のノードのうち担当ノードを含む少なくとも一部の各ノードについて、そのノードの位置に応じた所定の価値に関わる状態を表す状態情報を取得し、前記少なくとも一部の各ノードの状態情報に基づいて、前記担当ノードの移動を制御する制御情報を生成し、前記制御情報に基づいて前記担当ノードの移動を制御する。
 また、本発明の制御方法は、移動可能な複数のノードのうち担当ノードを含む少なくとも一部の各ノードについて、そのノードの位置に応じた所定の価値に関わる状態を表す状態情報を取得し、前記少なくとも一部の各ノードの状態情報に基づいて、前記担当ノードの移動を制御する制御情報を生成し、前記制御情報に基づいて前記担当ノードの移動を制御することを、前記複数のノードのそれぞれを前記担当ノードとするコンピュータ装置が実行することにより、前記複数のノードのそれぞれの前記状態の変化に応じて前記複数のノードの空間的配置を変化させる。
 また、本発明の記憶媒体は、移動可能な複数のノードのうち担当ノードを含む少なくとも一部の各ノードについて、そのノードの位置に応じた所定の価値に関わる状態を表す状態情報を取得する状態情報取得ステップと、前記少なくとも一部の各ノードの状態情報に基づいて、前記担当ノードの移動を制御する制御情報を生成する制御情報生成ステップと、前記制御情報に基づいて前記担当ノードの移動を制御する制御ステップと、をコンピュータ装置に実行させる制御プログラムを記憶している。
 本発明は、協調動作する複数のノードのそれぞれに関する情報を集中管理する必要なく、所望の全体的な価値をより高めるよう、複数のノードの動作をそれぞれ制御する技術を提供することができる。
本発明の第1の実施の形態としての情報処理システムの構成を示すブロック図である。 本発明の第1の実施の形態としての制御装置の機能ブロック図である。 本発明の第1の実施の形態としての制御装置のハードウェア構成の一例を示す図である。 本発明の第1の実施の形態としての制御装置の動作を説明するフローチャートである。 本発明の第2の実施の形態としての情報処理システムの構成を示すブロック図である。 本発明の第2の実施の形態としての制御装置の機能ブロック図である。 本発明の第2の実施の形態としての制御装置の動作を説明するフローチャートである。 本発明の第2の実施の形態の具体例を模式的に説明する図である。 本発明の第2の実施の形態の具体例のシミュレーション結果を模式的に説明する図である。 本発明の第2の実施の形態の他の具体例を模式的に説明する図である。 本発明の第2の実施の形態のさらに他の具体例を模式的に説明する図である。
 以下、本発明の実施の形態について、図面を参照して詳細に説明する。
 (第1の実施の形態)
 本発明の第1の実施の形態としての情報処理システム1の構成を図1に示す。図1において、情報処理システム1は、複数のノード90のそれぞれを制御する複数の制御装置10を備えている。ノード90は、例えば、無人機であってもよいし人であってもよいが、これらに限らない。ノード90としては、様々な移動体を適用可能である。各制御装置10は、それぞれが担当するノード90の移動を制御する。以降、各制御装置10が担当するノード90を、担当ノード90とも記載する。
 また、各制御装置10は、他の制御装置10と通信可能に接続される。ただし、各制御装置10は、他の制御装置10の全てと必ずしも通信可能である必要はない。また、各制御装置10は、他の制御装置10と、常に通信可能である必要はない。
 情報処理システム1は、複数のノード90を所定の目的のために協調動作させる。所定の目的の一例としては、例えば、ターゲットの探索や、好適なフォーメーションの形成等が挙げられるが、これらに限らない。また、情報処理システム1には、複数のノード90を用いた協調動作において向上させることを目標とする全体的な所定の価値があらかじめ定められているものとする。所定の価値の一例としては、例えば、ノード90全体でのバッテリー消費量や、全体での探索確率の高さ等が挙げられるが、これらに限らない。
 次に、制御装置10の機能ブロック構成を図2に示す。図2において、制御装置10は、状態情報取得部11と、制御情報生成部12と、制御部13とを備える。なお、図2において、構成要素を示す矩形間を結ぶ矢印の向きは、一例を示すものであり、構成要素間の信号の向きは、限定されない。
 ここで、制御装置10は、図3に示すようなハードウェア要素によって構成可能である。図3において、制御装置10は、CPU(Central Processing Unit)1001、メモリ1002、および、ネットワークインタフェース1003を含むコンピュータ装置によって構成される。メモリ1002は、RAM(Random Access Memory)、ROM(Read Only Memory)、補助記憶装置(ハードディスク等)等によって構成される。ネットワークインタフェース1003は、インターネット、LAN(Local Area Network)、公衆回線網、無線通信網またはこれらの組合せ等によって構成されるネットワークに接続するインタフェースである。この場合、制御装置10の各機能ブロックは、メモリ1002に格納されるコンピュータ・プログラムを読み込んで実行するとともに各部を制御するCPU1001によって構成される。
 なお、情報処理システム1に含まれる複数の制御装置10は、それぞれが異なるコンピュータ装置によって構成されていてもよいし、一部の複数の制御装置10が、同一のコンピュータ装置によって構成されていてもよい。あるいは、全ての制御装置10が、同一のコンピュータ装置によって構成されていてもよい。また、各制御装置10は、担当ノード90と離れた場所に実現されていてもよいし、担当ノード90上に実現されていてもよい。なお、制御装置10およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
 次に、各機能ブロックの詳細について述べる。
 状態情報取得部11は、複数のノード90のうち担当ノード90を含む少なくとも一部の各ノード90について状態情報を取得する。ここで、状態情報は、そのノード90の位置に応じた所定の価値に関わる状態を表す。例えば、状態情報は、そのノード90の現在の位置そのものを表す情報を含んでいてもよい。また、状態情報は、そのノード90が現在の位置から任意の位置に移動した場合の所定の価値に関わる情報を含んでいてもよい。また、例えば、そのノード90が有する機能であって、所定の価値に関わる機能の能力の高さが、そのノード90の位置に応じて変化する場合がある。そのような場合、状態情報は、そのノード90の機能の現在の位置における能力の高さに基づく情報を含んでいてもよい。
 さらに、例えば、状態情報取得部11は、担当ノード90に関する位置情報を取得し、取得した位置情報に基づいて、担当ノード90の状態情報を求めてもよい。もし、担当ノード90が通信可能な装置によって構成されていれば、状態情報取得部11は、担当ノード90と通信することによりその位置情報を取得し、状態情報を求めてもよい。また、もし、担当ノード90が人等のように通信不可能な移動体によって構成されていれば、状態情報取得部11は、担当ノード90に携帯される端末や担当ノード90を監視する装置等と通信することによりその位置情報を取得し、状態情報を求めてもよい。また、もし、制御装置90が担当ノード90において実現されている場合、状態情報取得部11は、自装置の位置情報を取得し、状態情報を求めてもよい。また、状態情報取得部11は、他のノード90を担当する他の制御装置10から、その担当ノード90についての状態情報を受信してもよい。
 ここで、複数のノード90をそれぞれ担当する制御装置10は、他の制御装置10と同期して担当ノード90の状態情報を取得する必要はない。したがって、状態情報取得部11は、他の制御装置10のうち、現時点を含む所定期間内に担当ノード90の状態情報を取得できた制御装置10から、その状態情報を取得してもよい。また、情報処理システム1が複数のコンピュータ装置によって構成されている場合、あるコンピュータ装置上の制御装置10は、ネットワーク状況やその他の要因により、他のコンピュータ装置上の他の制御装置10と必ずしも通信可能であるとは限らない。その場合、状態情報取得部11は、現時点で通信可能な制御装置10から、その担当ノード90の状態情報を取得してもよい。このように、状態情報取得部11は、全てのノード90についてその状態情報を取得する必要はない。状態情報取得部11は、担当ノード90を含む少なくとも一部のノード90について状態情報を取得すればよい。
 制御情報生成部12は、少なくとも一部の各ノード90の状態情報に基づいて、担当ノード90の移動を制御する制御情報を生成する。具体的には、制御情報生成部12は、状態情報が得られている少なくとも一部のノード90において所定の価値をより大きくする(価値をより向上する)アルゴリズムを用いて、担当ノード90の制御情報を生成する。例えば、制御情報生成部12は、制御情報として、移動方向および移動制御量を表す情報を生成してもよい。移動制御量とは、例えば、移動距離であってもよい。あるいは、移動制御量とは、その担当ノード90を移動させるために用いるエネルギー量であってもよい。また、制御情報生成部12は、各ノード90の移動に関する制約があれば、さらにその制約を考慮して、制御情報を生成してもよい。
 制御部13は、制御情報に基づいて担当ノード90の移動を制御する。例えば、制御情報が移動方向および移動制御量を表すとする。この場合、制御部13は、担当ノード90に対して移動方向および移動制御量を指示する情報(指示情報)を出力することにより、担当ノード90を該当する移動方向に該当する移動制御量の分だけ移動させる。例えば、担当ノード90が無人機である場合、制御部13は、無人機に搭載された移動機構に対して、制御情報に基づく指示情報を送信してもよい。また、担当ノード90が人である場合、制御部13は、その人に所持される携帯情報端末の表示装置に、制御情報に基づく指示情報を表示してもよい。
 以上のように構成された情報処理システム1における制御装置10の動作について、図4を参照して説明する。
 まず、状態情報取得部11は、担当ノード90を含む少なくとも一部の各ノード90について、そのノード90の位置に応じた所定の価値に関わる状態情報を取得する(ステップS1)。
 前述のように、状態情報取得部11は、担当ノード90について得られる位置情報に基づいて、その状態情報を求めてもよい。また、状態情報取得部11は、通信可能な他の制御装置10からその担当ノード90の状態情報を取得してもよい。
 次に、制御情報生成部12は、ステップS1で取得された状態情報に基づいて、担当ノード90の移動を制御する制御情報を生成する(ステップS2)。
 前述のように、制御情報生成部12は、状態情報が得られている少なくとも一部のノード90の範囲内で、所定の価値をより大きくするアルゴリズムを用いて担当ノード90の制御情報を生成してもよい。また、制御情報生成部12は、移動方向および移動制御量を表す情報を生成してもよい。
 次に、制御部13は、ステップS2で決定された制御情報に基づいて、担当ノード90の移動を制御する(ステップS3)。
 前述のように、制御部13は、担当ノード90が無人機である場合、無人機に搭載された移動機構に対して、制御情報に基づく指示情報を送信してもよい。また、担当ノード90が人である場合、制御部13は、その人に所持される携帯情報端末の表示装置に、制御情報に基づく指示情報を表示してもよい。
 以上の動作を、制御装置10は繰り返す。なお、制御装置10は、ステップS1~S3の動作を、必ずしもこの順で行わなくてもよい。例えば、状態情報取得部11、制御情報生成部12、および、制御部13は、それぞれ非同期に、所定のタイミング毎に動作してもよい。そして、この場合、制御情報生成部12は、状態情報取得部11によって直近に取得された状態情報を用いて動作すればよい。また、制御部13は、制御情報生成部12によって直近に生成された制御情報を用いて動作すればよい。
 このように各制御装置10が動作することにより、情報処理システム1は、複数のノード90のそれぞれの位置に応じた所定の価値に関わる状態の変化に応じて、複数のノード90の空間的配置を調整する。
 次に、本発明の第1の実施の形態の効果について述べる。
 本発明の第1の実施の形態としての情報処理システムは、協調動作する複数のノードのそれぞれに関する情報を集中管理する必要なく、所望の全体的な価値をより高めるよう、複数のノードの動作をそれぞれ制御することができる。
 その理由について述べる。本実施の形態では、複数のノードのそれぞれを担当する制御装置において、状態情報取得部が、移動可能な複数のノードのうち担当ノードを含む少なくとも一部の各ノードについて、そのノードの位置に応じた所定の価値に関わる状態を表す状態情報を取得する。そして、制御情報生成部が、これらの少なくとも一部のノードの状態情報に基づいて、担当ノードの移動を制御する制御情報を生成する。そして、制御部が、制御情報に基づいて、担当ノードの移動を制御するからである。
 これにより、本実施の形態では、各制御装置が、担当ノードを含む少なくとも一部のノードの状態情報を用いて担当ノードの移動を制御するので、全てのノードの状態を集中管理する必要がない。また、各制御装置が、担当ノードの移動を、一部のノードの状態情報に基づいてそれらのノードにおける所定の価値を向上させるよう制御するので、複数のノードの空間的配置に基づいて実現される全体的な所定の価値を、より高めることができる。
 (第2の実施の形態)
 次に、本発明の第2の実施の形態について図面を参照して詳細に説明する。なお、本実施の形態の説明において参照する各図面において、本発明の第1の実施の形態と同一の構成および同様に動作するステップには同一の符号を付して本実施の形態における詳細な説明を省略する。
 本実施の形態では、本発明の情報処理システムを、複数のノードの協調動作により、探索対象であるターゲットを探索する用途に適用する例について説明する。ターゲットは移動するものとする。また、本実施の形態では、複数のノードによるターゲットの探索において向上させることを目標とする全体的な所定の価値として、ターゲットの探索確率の高さを適用する。
 ここで、ターゲットの存在確率密度は、次式(1)で表される。
Figure JPOXMLDOC01-appb-I000001
ここで、x、y、zは、座標(位置)を表す。また、x、y、zは、ターゲットのx座標、y座標、z座標(位置)を表す。
 例えば、式(1)は、ターゲットの位置(x、y、z)をピークにしてその位置から離れるほど存在確率密度が減っていく山型の形状を示すよう定義されていてもよい。また、式(1)におけるターゲットの位置(x、y、z)には、ターゲットが直近に発見された位置が適用されてもよい。あるいは、ターゲットの位置(x、y、z)には、ターゲットが直近に発見された位置に基づき算出される現時点でのターゲットの予測位置が適用されてもよい。
 また、各ノードが探索対象を発見する発見確率は、次式(2)で表される。
Figure JPOXMLDOC01-appb-I000002
ここで、ψは、複数のノードのうちi番目のノードiに与えられた探索努力である(iは正の整数)。探索努力とは、移動制御量と考えても良い。また、発見とは、ノードが有する認識機能(例えば、目やソナー等)により、ターゲットを認識することをいう。また、発見確率とは、自ノードを中心とした周辺領域におけるターゲットを認識できる確率(能力の高さ)をいう。発見確率は、各ノードが存在する環境によって変わってくることが多い。
 例えば、ノードが海中でソナーにより探索物を発見する無人機であるような場合、発見確率は、次式(3)で表されることが知られている。
Figure JPOXMLDOC01-appb-I000003
ここで、γは、電波伝搬に依存する量である。例えば、ノードが前述の海中で動作する無人機の場合、γは、ノードが存在する海域によって変わる量であり、その環境に適した係数が定められる。このように、ノードが海域でターゲットを探索する場合に限らず、ノードによるターゲットの発見確率は、ノードの存在する環境に応じて変化する。
 また、各ノードにおけるターゲットの探索確率は、次式(4)のように、探索対象の存在確率密度とノードの発見確率との積で表すことができる。
Figure JPOXMLDOC01-appb-I000004
ここで、x、y、zは、ノードiのx座標、y座標、z座標(位置)を表す。
 従って、複数のノード全体での探索確率は、次式(5)で表される。
Figure JPOXMLDOC01-appb-I000005
 ノードのエネルギーを考えれば、探索努力は有限と考えるべきである。従って、全体の探索確率は、全体に投入される、ある既定の探索努力に対して最大化することになる。つまり、有限の探索努力に対して、できるだけ探索確率を上げなくてはならない。本実施の形態は、ある単位時間当たりに全体に投入される探索努力の上限Ψを制約として設定し、その上で探索確率を最大化する。
 数学的に言えば、式(5)を以下の探索努力に対する制約条件のもと最大化する最適化問題を解かなければならない。
Figure JPOXMLDOC01-appb-I000006
 上述の最適化問題は、全てのノードの状態情報を同期的に取得することができれば、容易に解くことが可能である。しかしながら、実際の環境では、各ノードの状態情報を同期的に収集することは難しいケースが多い。また、実際の環境では、複数のノードを集中管理するシステムを設けることは難しいケースが多い。
 本実施の形態の情報処理システムは、このような各ノードの状態情報を同期的に収集できないケースや、複数のノードを集中管理するシステムを設けることができないケースにおいて、複数のノードにより、ターゲットを探索しながら探索確率をより向上させる。以下、本実施の形態の情報処理システムの詳細について説明する。
 まず、本発明の第2の実施の形態としての情報処理システム2の構成を図5に示す。図5において、情報処理システム2は、複数のノード90のそれぞれを制御する複数の制御装置20を備えている。
 次に、制御装置20の機能ブロック構成を図6に示す。図6において、制御装置20は、状態情報取得部21と、制御情報生成部22と、制御部23と、ターゲット位置取得部24とを備える。また、状態情報取得部21は、評価関数設定部211を含む。また、制御情報生成部22は、制約取得部221と、移動方向決定部222と、移動制御量決定部223とを含む。
 なお、図6において、構成要素を示す矩形間を結ぶ矢印の向きは、一例を示すものであり、構成要素間の信号の向きは、限定されない。
 また、制御装置20およびその各機能ブロックは、図3を参照して説明した本発明の第1の実施の形態と同一のハードウェア要素によって構成可能である。ただし、制御装置20およびその各機能ブロックのハードウェア構成は、上述の構成に限定されない。
 ターゲット位置取得部24は、ターゲットに関する位置情報を取得する。ターゲットは、前述したように、複数のノード90により探索する対象である。ターゲット位置取得部24は、自装置の担当ノード90によってターゲットが発見された場合には、自装置の担当ノード90からその位置情報を取得する。もし、ノード90が通信可能な装置であれば、ターゲット位置取得部24は、ノード90によって送信されるターゲットの位置情報を受信すればよい。また、もし、ノード90が通信不可能な人等の移動体であれば、ターゲット位置取得部24は、ノード90に所持される携帯情報端末等によって送信されるターゲットの位置情報を受信すればよい。また、もし、自装置が担当ノード90上に実現されている場合、ターゲット位置取得部24は、担当ノード90に備えられたターゲット位置特定機能または入力等により、ターゲットの位置情報を取得すればよい。
 このように、担当ノード90からその位置情報を取得した場合、ターゲット位置取得部24は、他の制御装置20に対して、ターゲットの位置情報を送信する。また、担当ノード90からその位置情報が取得されない場合には、ターゲット位置取得部24は、他の制御装置20からターゲットの位置情報を受信することにより取得してもよい。また、ターゲット位置取得部24は、担当ノード90または他の制御装置20から直近に受信したターゲットの位置情報を用いて、現時点でのターゲットの位置を予測することによりその位置情報を取得してもよい。なお、ターゲットの位置の予測処理には、ターゲットの特性や環境等を考慮した公知の技術を採用可能である。
 状態情報取得部21は、担当ノード90を含む少なくとも一部のノード90について、評価関数設定部211により設定される評価関数を用いて、その状態情報を取得する。
 評価関数設定部211は、担当ノード90に関する評価関数を設定する。評価関数とは、複数のノード90の空間的配置により実現される全体的な所定の価値の向上に対して、あるノード90が任意の位置において寄与する度合いを評価する関数である。具体的には、評価関数としては、該当するノード90の位置での環境に応じた発見能力の高さ(発見確率)と、ターゲットの存在確率密度とに基づき、ノード90の任意の位置における探索確率を表す関数が適用可能である。ノード90の位置での環境に応じた発見確率は、あらかじめ定められているものとする。例えば、評価関数設定部211は、式(4)で表される探索確率を、評価関数として用いてもよい。このような評価関数は、該当するノード90の位置またはターゲットの位置の更新に応じて定まる。したがって、評価関数設定部211は、担当ノード90の状態情報の取得またはターゲットの位置情報の取得に応じて、評価関数を更新する。
 このようにして、状態情報取得部21は、担当ノード90については、評価関数設定部211によって設定された評価関数に基づく情報を、状態情報として取得する。また、状態情報取得部21は、さらに、他のノード90については、他のノード90を担当する制御装置20の状態情報取得部21によってそのノード90について設定された評価関数に基づく情報を、その状態情報として取得する。つまり、状態情報取得部21は、通信可能な他の制御装置20の状態情報取得部21との間で、互いの評価関数設定部211によって設定された評価関数に基づく情報を送受信すればよい。
 なお、状態情報取得部21は、本発明の第1の実施の形態における状態情報取得部11と同様に、全てのノード90についてその状態情報を取得する必要はない。状態情報取得部21は、担当ノード90を含む少なくとも一部のノード90について状態情報を取得すればよい。
 制御情報生成部22は、少なくとも一部の各ノード90の状態情報およびターゲットの位置情報に基づいて、担当ノード90に関する制御情報(移動方向および移動制御量)を生成する。詳細には、制御情報生成部22は、制約取得部221と、移動方向決定部222と、移動制御量決定部223とを用いて、担当ノード90に関する制御情報を生成する。
 制約取得部221は、複数のノード90の移動に関する制約を表す情報を取得する。移動に関する制約としては、例えば、複数のノード90の配置に関する制約や、移動制御量に関する制約がある。
 配置に関する制約として、例えば、制約取得部221は、各ノード90間の距離が閾値以上であるという制約を表す情報を取得してもよい。また、制約取得部221は、各ノード90の探索可能範囲の重複状況が所定条件を満たすという制約を表す情報を取得してもよい。探索可能範囲とは、ノード90の位置を中心とした所定の周辺領域である。また、所定条件とは、あるノード90の探索可能範囲が、他のノード90の探索可能範囲と重複しないことであってもよい。また、所定条件とは、あるノード90の索可能範囲のうち、他のノード90の探索可能範囲と重複する領域の大きさが閾値以下であることであってもよい。このような配置に関する制約は、複数のノード90が密集してしまうと、全体として探索できる範囲が狭くなることを防止するために設けられる。
 また、移動制御量に関する制約として、例えば、制約取得部221は、全てのノード90に単位時間あたりに投入可能な合計の移動制御量の上限を定めた制約を表す情報を取得してもよい。
 移動方向決定部222は、担当ノード90の位置情報と、ターゲットの位置情報と、配置に関する制約があればその制約とを考慮しながら、担当ノード90の移動方向を決定する。
 例えば、移動方向決定部222は、担当ノード90の位置を始点としてターゲットの位置に伸びるベクトルを、移動方向を示すものとして作成する。また、移動方向決定部222は、配置に関する制約が取得されている場合は、その制約を考慮して、このベクトルの方向を調整する。以降、移動方向を示すベクトルを、移動ベクトルとも記載する。
 移動制御量決定部223は、担当ノード90を含む少なくとも一部の各ノード90の状態情報と、ターゲットの位置情報と、移動制御量に関する制約があればその制約とを考慮しながら、担当ノード90の移動制御量を決定する。なお、移動制御量の一例としては、移動距離や、ノード90を移動させるために投入するエネルギー量(例えば、モータのトルク量等)が挙げられるが、これらに限らない。
 例えば、移動制御量決定部223は、担当ノード90を含む少なくとも一部のノード90全体に対して単位探索努力を投入した場合に、それらのノード90全体の探索確率をより大きくするアルゴリズムを用いて、担当ノード90の移動制御量を決定してもよい。少なくとも一部のノード90とは、状態情報が得られた全てのノード90であってもよいし、そのうち所定条件を満たすノード90であってもよい。所定条件とは、例えば、担当ノード90からの距離が閾値以内である(近隣である)という条件であってもよい。
 例えば、移動制御量決定部223は、担当ノード90について評価関数を用いて得られる情報と、他のノード90について評価関数を用いて得られる情報とを比較する。そして、移動制御量決定部223は、その比較結果に基づくことにより、担当ノード90を含む少なくとも一部のノード90に対して単位探索努力を投入した場合の探索確率の合計をより大きくするよう移動制御量を決定することができる。
 具体的には、移動制御量決定部223は、担当ノード90について、移動方向決定部222によって決定された方向に単位探索努力を投入した場合の探索確率の現時点からの増分を、現在設定されている評価関数を用いて求める。また、移動制御量決定部223は、状態情報が得られている他のノード90について、そのノード90について決定された方向に単位探索努力を投入した場合の探索確率の現時点からの増分を取得する。この場合、他のノード90についての探索確率の増分としては、他のノード90を担当する制御装置20の移動制御量決定部223によって算出された単位探索努力あたりの探索確率の増分が、状態情報として状態情報取得部21によって取得されているものとする。そして、移動制御量決定部223は、他のノード90の探索確率の増分よりも担当ノード90の探索確率の増分が大きいならば、次の制御ステップでの担当ノード90の移動制御量として、単位探索努力を決定してもよい。また、移動制御量決定部223は、他のノード90の探索確率の増分よりも担当ノード90の探索確率の増分が小さいならば、次の制御ステップでの担当ノード90の移動制御量として、ゼロを決定してもよい。すなわち、この場合、移動制御量決定部223は、次の制御ステップでは担当ノード90に探索努力を投入せず、動作しないことを決定してもよい。なお、担当ノード90を含む少なくとも一部のノード90のうち担当ノード90以外の他のノード90が複数ある場合について説明する。この場合、移動制御量決定部223は、担当ノード90および他のノード90のそれぞれとの間で前述のように増分を比較し、その比較結果を統合することにより、担当ノード90の移動制御量を決定すればよい。
 ここで、単位探索努力あたりの探索確率とは、評価関数の微分と等価である。したがって、上述のように、担当ノード90を含む少なくとも一部のノード90における単位探索努力あたりの探索確率をより大きくするように移動制御量を決める操作が繰り返されると、評価関数の微分が、それらの各ノード90で等しくなってくる。そこで、移動制御量決定部223は、担当ノード90を含む少なくとも一部の各ノード90に設定される評価関数の微分を等しくするように、移動制御量を決定してもよい。
 このように、移動制御量決定部223は、担当ノード90について設定された評価関数から得られる情報(微分)と、他のノード90について設定された評価関数から得られる情報(微分)とが略同一になるよう、担当ノード90の移動制御量を決定してもよい。
 また、移動制御量決定部223は、移動制御量を決定する際に、さらに、移動制御量に関する制約があればその制約を考慮する。例えば、移動制御量の合計の上限が定められていることを想定する。この場合、移動制御量決定部223は、複数のノード90のそれぞれを担当する制御装置20の全てから、決定された移動制御量を取得できれば、その合計が上限を超えないよう、移動制御量を調整する。また、移動制御量決定部223は、移動制御量を取得できない制御装置20がある場合は、その制御装置20が担当するノード90について決定される移動制御量の推定値を求める。推定の手法には、あらかじめ定められた想定値を用いてもよいし、その他公知の推定技術を用いてもよい。
 また、制御情報生成部22は、移動方向決定部222によって決定された移動方向に、移動制御量決定部223によって決定された移動制御量の分だけ、担当ノード90を移動させるための制御情報を生成する。
 制御部23は、制御情報生成部22によって生成された制御情報にしたがって、担当ノード90の移動を制御する。具体的には、制御部23は、移動制御量決定部223によって生成された制御情報に基づく指示情報を、担当ノード90に対して出力することにより、担当ノード90を、移動方向に移動制御量の分だけ移動させる。
 以上のように構成された情報処理システム2における各制御装置20の動作について、図7を参照して説明する。なお、以下では、既に制約取得部221により、配置に関する制約と、移動制御量に関する制約とが取得されているものとする。
 図7において、まず、ターゲット位置取得部24は、ターゲットの位置情報を取得する(ステップS11)。
 前述したように、ターゲット位置取得部24は、担当ノード90によって発見されたターゲットの位置情報を取得するか、他のノード90によって発見されたターゲットの位置情報をそのノード90を担当する他の制御装置20から取得してもよい。また、前述したように、ターゲット位置取得部24は、過去に取得されたターゲットの位置情報に基づいて、現在のターゲットの位置を予測することにより取得してもよい。
 次に、状態情報取得部21は、担当ノード90の位置情報を取得する(ステップS12)。
 次に、状態情報取得部21は、評価関数設定部211を用いて、ターゲットの位置と担当ノード90の位置とを反映させた評価関数を設定する。そして、状態情報取得部21は、担当ノード90の状態情報として、設定した評価関数に基づく情報を求める(ステップS13)。
 次に、状態情報取得部21は、少なくとも一部の他の各ノード90の状態情報として、そのノード90を制御する制御装置20から、そのノード90について設定された評価関数に基づく情報を取得する(ステップS14)。
 次に、制御情報生成部22は、移動方向決定部222を用いて、配置に関する制約を考慮しながら、担当ノード90の移動方向を決定する(ステップS15)。
 具体的には、前述のように、移動方向決定部222は、担当ノード90の位置を始点としてターゲットの位置の方向に伸びる移動ベクトルを生成した上で、配置に関する制約を考慮してその方向を調整してもよい。
 次に、制御情報生成部22は、移動制御量決定部223を用いて、担当ノード90に投入する移動制御量を決定する(ステップS16)。
 具体的には、前述のように、移動制御量決定部223は、担当ノード90の状態情報が表す評価関数から得られる情報と、他のノード90の状態情報が表す評価関数から得られる情報との比較結果に基づいて、担当ノード90の移動制御量を決定してもよい。
 次に、制御情報生成部22は、ステップS14で決定された方向に、ステップS15で決定された移動制御量の分だけ、担当ノード90を移動させるよう制御する制御情報を生成する(ステップS17)。
 次に、制御部23は、ステップS17で生成された制御情報に基づく指示情報を、担当ノード90に対して出力することにより、その移動を制御する(ステップS18)。
 例えば、制御部23は、担当ノード90としての無人機に搭載された移動機構に対して、制御情報に基づく指示情報を送信してもよい。また、例えば、制御部23は、担当ノード90としての人に所持される携帯情報端末の表示装置に、制御情報に基づく指示情報を表示させてもよい。
 以上の動作を、制御装置20は繰り返す。なお、制御装置20は、ステップS11~S18の動作を、必ずしもこの順で行わなくてもよい。例えば、状態情報取得部21、制御情報生成部22、制御部23、および、ターゲット位置取得部24は、それぞれ非同期に、所定のタイミング毎に動作してもよい。そして、この場合、制御情報生成部22は、状態情報取得部21(評価関数設定部211)によって直近に設定された評価関数に基づく状態情報と、ターゲット位置取得部24によって直近に取得されたターゲットの位置情報とを用いて動作すればよい。また、制御部23は、制御情報生成部22によって直近に生成された制御情報を用いて動作すればよい。
 このように各制御装置20が動作することにより、情報処理システム2は、複数のノード90のそれぞれの位置に応じた探索確率に関わる状態の変化に応じて、複数のノード90の空間的配置を調整する。
 次に、情報処理システム2の具体例について説明する。
 <具体例1>
 具体例1では、ノード90として、UUV(Unmanned Undersea Vehicle)と呼ばれる無人機を想定する。UUVは、水中を自律動作し、ソナーでターゲットを探索する無人機である。UUVは、外部から受信する制御情報に応じて移動可能である。以降、ノード90としてのUUVを、UUV90とも記載する。また、この具体例1では、情報処理システム2を、図8に示すように、クラウドコンピューティングにおけるクラウド上に実現したことを想定する。つまり、各制御装置20は、担当するUUV90を、クラウド上から遠隔制御する。これにより、情報処理システム2は、複数のUUV90を用いてターゲットを探索する。
 この場合、各制御装置20は、あたかもUUV90が近隣のUUV90と情報交換するように、近隣のUUV90を担当する制御装置20と状態情報等を送受信しながら、自らが担当するUUV90に対してその移動を制御することになる。
 また、評価関数設定部211は、評価関数として、上述の式(4)を適用する。式(4)におけるターゲットの存在確率密度gとしては、ターゲットが直近に発見された位置(x、y、z)をピークにし、その位置から離れるほど存在確率密度が減っていくガウシアン型の関数を用いる。また、式(4)における各UUV90の発見確率pとしては、式(3)を適用する。UUV90が存在する海域によって、式(3)におけるγは異なる。従って、この具体例1では、海域ごとのγを予めデータベース化しておく。状態情報取得部21は、UUV90の位置情報に基づきγを変更する。
 また、この具体例1では、各UUV90は、各種情報を制御装置20等に送信するアップロード機能を有する。UUV90は、自機でターゲットを発見した場合、その位置情報を取得する。そして、UUV90は、自機で発見したターゲットの位置情報を、他のUUV90および自機を担当するクラウド上の制御装置20に対して送信する。また、UUV90は、他のUUV90からターゲットの位置情報を受信した場合も、その位置情報を、自機を担当するクラウド上の制御装置20に対して送信する。これにより、各制御装置20のターゲット位置取得部24は、ターゲットの位置情報を取得する。
 また、UUV90は、自機の位置情報を、自機を担当するクラウド上の制御装置20に対して送信する。これにより、各制御装置20の状態情報取得部21は、自装置が担当するUUV90の位置情報を取得し、担当するUUV90の位置情報およびターゲット位置情報に基づいて、評価関数を設定することになる。
 なお、各UUV90は、このような情報の送信動作を非同期に実行している。つまり、制御装置20に対する各種位置情報のアップロードは、非同期に実行される。そのため、クラウド上に実現された情報処理システム2において、各制御装置20が互いに通信可能であったとしても、全てのUUV90に関する情報は、同期的に集まらない。したがって、UUV90全体での探索確率を向上させるために一般的な最適化技術を適用することができない。もっとも、一般的な最適化技術を用いて、各UUV90に関する情報が非同期にしか集まらない環境であっても、強引に古い情報を織り交ぜて最適化計算をすることは可能である。しかしながら、古い情報が全体に悪影響を与えるため、実際には好適な最適化が行われない。このように、制御装置20に対する各種位置情報のアップロードが非同期に実行される環境を想定する。
 以上説明した具体例1の想定に基づいて、情報処理システム2における各制御装置20の動作を計算機シミュレーションした結果を、図面を参照して説明する。図9は、情報処理システム2の動作により移動制御されるUUV90群の空間的配置が、時間の経過にしたがって変化する様子を示している。
 まず、UUV90群のフォーメーションは、図9の「初期状態」に示すように形成されているものとした。このようなUUV90群が存在する空間内において、ターゲットが移動する。図9において、三角形は、ターゲットを示す。また、丸は、UUV90を示す。図9は、上段から下段に行くにつれ、時間が経過していることを表している。図9からは、ターゲットの移動に合わせて、ターゲットを包み込むようにUUV90群が接近し、ターゲットを追跡できていることがわかる。また、図9からは、ターゲットから遠方に位置するUUV90(例えば、点線の丸で囲んだ右端の2つのUUV90)は移動しておらず、無駄な移動が行われていないことがわかる。
 上述のシミュレーション中に、全体の探索確率がどの程度高いかを評価した。ここで、探索確率を上昇させる役割は、主に、評価関数設定部211および移動制御量決定部223が担っている。そこで、図9に示した具体例1のシミュレーションに対する比較対象として、その2つの機能ブロック要素を動作させないシミュレーションを行い、単位探索努力あたりの全体の探索確率を比較した。比較対象のシミュレーションでは、移動制御量として固定の値を用いた。なお、固定の移動制御量としては、できるだけ良い全探索確率を出すようチューニングした値を用いた。その結果、比較対象のシミュレーションでは、全てのUUV90は、ターゲットに対して徐々に近づいていくよう制御される。
 なお、探索確率は、原理上、探索努力を投入すればするほど上がっていく特性を持っているので、投入した探索努力あたり(単位探索努力あたり)の値で比較を行った。比較の結果、情報処理システム2の具体例1のシミュレーションは、比較対象のシミュレーションに対して、平均30%程度高い全体探索確率(単位探索努力あたり)が得られた。
 このように、情報処理システム2の具体例1では、各UUV90の情報が同期的に得られない環境においても、複数のUUV90群によりターゲットを追跡しながら、全体での探索確率をより大きくする制御が可能であることがわかった。
 <具体例2>
 具体例2では、具体例1と同様に、ノード90として、UUV90を適用する。ただし、この具体例2では、図10に示すように、複数のUUV90のそれぞれに、本実施の形態における制御装置20を搭載した例について説明する。つまり、この具体例2では、各UUV90は、自機に搭載された制御装置20を用いて、近隣の通信可能な他のUUV90に搭載された制御装置20と情報を送受信し、制御装置20の制御の元に自律分散的に移動することになる。このようなUUV90は、本発明の機器の一実施形態を構成する。
 このような具体例2は、UUV90群が移動するフィールドから遠隔地に対する情報送信が難しく、各UUV90に自律分散的な移動を期待しなくてはならないケースを想定している。このようなケースは、実際の応用局面では非常に多い。このように、具体例2は、具体例1のように遠隔地に情報処理システム2を設置するのが難しいケースに有効である。あるいは、具体例2は、具体例1のような遠隔地の情報処理システム2が機能しなくなってしまったケース等にも有効である。
 具体例2は、具体例1に対して、UUV90がアップロード機能を備える必要がない点が相違する。この具体例2では、UUV90に搭載された制御装置20のターゲット位置取得部24が、自機でターゲットを発見した場合、その位置情報を取得し、他のUUV90に対して送信する。また、ターゲット位置取得部24は、自機でターゲットを発見しない場合、他のUUV90からターゲットの位置情報を受信することにより取得する。また、ターゲット位置取得部24は、自機でターゲットを発見できず、他のUUV90からも新たなターゲットの位置情報を取得できない状態が所定期間続いた場合には、過去の位置情報に基づく現在地の予測によりターゲットの位置情報を取得してもよい。また、状態情報取得部21および制御情報生成部22は、必要に応じて、自機の位置情報を取得する。その他、評価関数、ターゲットの存在確率密度g、発見確率p、海域ごとのγ等についての想定については、具体例1と同様である。
 このような具体例2の想定に基づいて、情報処理システム2における各制御装置20の動作の計算機シミュレーションを行った。その結果、情報処理システム2の具体例2のシミュレーションは、具体例1と同様に、ターゲットを良好に追跡できた。また、具体例2のシミュレーションと、具体例1で説明した比較対象のシミュレーションとで、単位探索努力あたりの全体の探索確率を比較した。その結果、情報処理システム2の具体例2のシミュレーションは、具体例1と同様に、比較対象のシミュレーションに対して、平均30%程度高い全体探索確率(単位探索努力あたり)が得られた。
 このように、情報処理システム2の具体例2では、複数のUUV90のそれぞれに制御装置20を搭載した場合も、複数のUUV90群によりターゲットを追跡しながらその全体での探索確率をより大きくする制御が可能であることがわかった。
 <具体例3>
 具体例3では、ノード90として、人(警備員)を想定する。これは、例えば、複数の警備員で対象地域を警備し、不審者を発見したら、しかるべき人数で不審者を追跡・捕獲するというような応用例を想定している。以降、ノード90としての警備員を、警備員90とも記載する。また、具体例3では、図11に示すように、警備員90に携帯されるタブレット端末上に、制御装置20を実現したことを想定する。
 各制御装置20の制御部23は、タブレット端末の表示装置に、制御情報に基づく指示情報を表示する。例えば、制御部23は、移動方向決定部222によって決定された移動方向および移動制御量決定部223によって決定された移動制御量の分だけ移動した移動先の地点を表す情報を、表示装置に表示してもよい。その結果、警備員90は、表示装置に表示された移動先の地点に向かって移動することになる。これにより、制御装置20は、警備員90の移動を制御する。
 また、制御装置20は、ターゲット位置取得部24の一部の一実施例として、表示装置に、不審者発見を通知するユーザインタフェース(例えば、押下操作可能なボタン型の図形等)を表示してもよい。これにより、不審者を見つけた警備員90は、そのユーザインタフェースを操作する。操作を受けたターゲット位置取得部24は、その時点での自装置の位置情報を、不審者の位置情報として、他の警備員90に携帯されるタブレット端末上の制御装置20に送信すればよい。
 具体例3は、具体例2の説明において、ターゲットを不審者と読み替え、UUVを警備員と読み替えることにより、同様に説明される。評価関数およびターゲットの存在確率密度gについては、具体例1および2と同様の想定が可能である。また、発見確率pについては、各警備員90の視界に関連した関数を設定すればよい。つまり、環境に応じたγとして、視界に比例した量に設定した関数を適用すればよい。
 これにより、情報処理システム2の具体例3は、複数の警備員90のそれぞれに携帯されるタブレット端末上の制御装置20を用いて、不審者を追跡しながらその全体での探索確率をより大きくすることができる。その結果、情報処理システム2の具体例3は、効率的な警備および不審者の追尾、捕獲を可能とする。
 なお、具体例3において、ノード90として、警備員に限らず、警察官、ランニングポリスなど、他の人に適用することが可能である。また、ターゲットして不審者を想定したが、これに限らない。例えば、ターゲットとして、「人混み」のように問題が発生しやすい集団を適用してもよい。これにより、情報処理システム2の具体例3は、人混みの効率的な警備に応用できる。また、具体例3では、各制御装置20が、タブレット端末上に実現される例を説明したが、これに限らない。例えば、各制御装置20は、ウェアラブル端末や眼鏡型端末上に実現されてもよい。また、各制御装置20は、警備員や警察官等が移動手段として用いる小型のビークルや車に設置された情報端末上に実現されてもよい。また、情報処理システム2は、具体例1と同様にクラウド上に実現されることも可能である。この場合、クラウド上の各制御装置20は、担当するノード90としての人と共に移動する端末から各種情報を受信するとともに、端末の表示装置に表示させるよう、制御情報に基づく指示情報を送信すればよい。
 以上で、具体例の説明を終了する。
 次に、本発明の第2の実施の形態の効果について述べる。
 本発明の第2の実施の形態としての情報処理システムは、協調動作によりターゲットを探索する複数のノード全てに関する情報を集中管理する必要なく、良好にターゲットを追跡しながら、全体的な探索確率を高めることができる。
 その理由について述べる。本実施の形態では、ターゲット位置取得部が、ターゲットの位置情報を取得する。また、状態情報取得部が、評価関数を用いて、担当ノードを含む少なくとも一部の各ノードについてその状態情報を生成する。評価関数は、複数のノードの空間的配置により実現される全体的な所定の価値の向上に対してノードが任意の位置において寄与する度合いを評価する関数である。状態情報取得部は、評価関数設定部を用いて、ターゲットの位置情報の更新や担当ノードの位置情報の更新に応じて、担当ノードに関する評価関数を更新する。そして、制御情報生成部は、移動方向決定部を用いて、配置に関する制約を考慮しながら、担当ノードの現在の位置からターゲットの位置に向かう方向を、移動方向として決定する。また、制御情報生成部は、移動制御量決定部を用いて、移動制御量に関する制約を考慮しながら、担当ノードの評価関数から得られる情報と、他のノードの評価関数から得られる情報との比較結果に基づいて、担当ノードの移動制御量を決定する。そして、制御部が、担当ノードを、決定された方向に決定された移動制御量の分だけ移動させるよう制御するからである。
 なお、本実施の形態において、情報処理システムをクラウド上に実現するケース(具体例1)、制御対象の機器上にそれぞれの制御装置を実現するケース(具体例2)、人に携帯される端末上にそれぞれの制御装置を実現するケース(具体例3)を説明した。その他、情報処理システムは、例えば、情報処理システムを実装したコンピュータ装置を海岸に設営し、複数のUUVの移動を遠隔制御してもよい。また、情報処理システムは、複数のUUVをとりまとめる母船に搭載されたコンピュータ装置上に実現してもよい。
 また、本実施の形態において、ノードとして適用する無人機として、UUVを一例として説明したが、その他の無人機をノードとして適用してもよい。例えば、本実施の形態は、ノードとして、空を飛ぶ飛行機型の無人機や、陸上を走る無人機など、様々な種類の無人機を適用可能である。
 また、本実施の形態では、複数のノードを用いて、移動するターゲットを探索・追跡する用途において、所定の価値として、全体の探索確率を向上させることを適用し、制御を行った。これに限らず、本実施の形態は、例えば、固定的に散らばっている探索対象を発見する用途において、所定の価値として、より良いエネルギー効率かつより沢山の探索対象を見つけることを適用し、制御を行ってもよい。また、本実施の形態は、それぞれ無線機を搭載した複数の無人機を、互いに情報を送受信可能に配置する用途において、所定の価値として、より広範囲に所望の転送レートで互いに情報を送受信できるフォーメーションを組むことを適用して、制御を行ってもよい。このように、本実施の形態は、複数のノードを用いて、全体的な所定の価値をより高めながら、所定の目的を達成する用途について、適用することが可能である。
 また、本実施の形態において、ノードとして無人機または人(警備員)を適用する具体例について説明したが、その他の移動体をノードとして適用してもよい。
 また、本実施の形態において、ターゲットの存在確率密度、ノードの発見確率、探索確率が、式(1)~(4)により表されるものとして説明したが、これらは、他の式により表されていてもよい。また、本実施の形態において、制約条件および所定の価値が式(5)~(6)により表されるものとして説明したが、これらは、他の式により表されていてもよい。
 また、本実施の形態において、制約取得部は、配置に関する制約および移動制御量に関する制約を取得するものとして説明した。ただし、制約取得部は、必ずしもこれらの制約を取得しなくてもよいし、さらに多くの他の制約を取得してもよい。
 また、上述した本発明の各実施の形態において、制御装置の各機能ブロックが、記憶装置またはROMに記憶されたコンピュータ・プログラムを実行するCPUによって実現される例を中心に説明した。これに限らず、各機能ブロックの一部、全部、または、それらの組み合わせが専用のハードウェアにより実現されていてもよい。
 また、上述した本発明の各実施の形態において、制御装置の機能ブロックは、複数の装置に分散されて実現されてもよい。
 また、上述した本発明の各実施の形態において、各フローチャートを参照して説明した制御装置の動作を、本発明のコンピュータ・プログラムとしてコンピュータ装置の記憶装置(記憶媒体)に格納しておく。そして、係るコンピュータ・プログラムを当該CPUが読み出して実行するようにしてもよい。そして、このような場合において、本発明は、係るコンピュータ・プログラムのコードあるいは記憶媒体によって構成される。
 また、上述した各実施の形態は、適宜組み合わせて実施されることが可能である。
 また、上述した各実施の形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
 移動可能な複数のノードのうち担当ノードを含む少なくとも一部の各ノードについて、そのノードの位置に応じた所定の価値に関わる状態を表す状態情報を取得する状態情報取得部と、
 前記少なくとも一部の各ノードの状態情報に基づいて、前記担当ノードの移動を制御する制御情報を生成する制御情報生成部と、
 前記制御情報に基づいて前記担当ノードの移動を制御する制御部と、
 を備えた制御装置。
(付記2)
 前記状態情報取得部は、前記複数のノードの空間的配置により実現される全体的な前記所定の価値の向上に対して前記ノードが任意の位置において寄与する度合いを評価する評価関数を用いて、前記担当ノードを含む少なくとも一部の各ノードについてその状態情報を生成することを特徴とする付記1に記載の制御装置。
(付記3)
 前記制御情報生成部は、前記担当ノードについて前記評価関数を用いて得られる情報と、他の前記ノードについて前記評価関数を用いて得られる情報との比較結果に基づいて、前記制御情報を生成することを特徴とする付記2に記載の制御装置。
(付記4)
 前記制御情報生成部は、前記担当ノードについて前記評価関数を用いて得られる情報と、他の前記ノードについて前記評価関数を用いて得られる情報とが略同一になるよう、前記制御情報を生成することを特徴とする付記3に記載の制御装置。
(付記5)
 前記複数のノードによる探索対象(ターゲット)に関する位置情報を取得するターゲット位置取得部をさらに有し、
 前記制御情報生成部は、前記少なくとも一部の各ノードの状態情報に加えて前記ターゲットに関する位置情報に基づいて、前記ノードに関する制御情報を生成することを特徴とする付記1から付記4のいずれか1つに記載の制御装置。
(付記6)
 前記状態情報取得部は、前記評価関数として、前記ターゲットの任意の位置における存在確率を表す情報に基づく関数を用いることを特徴とする付記5に記載の制御装置。
(付記7)
 前記状態情報取得部は、前記評価関数として、前記ノードによる前記ターゲットに対する発見能力の高さに基づく関数を用いることを特徴とする付記5または付記6に記載の制御装置。
(付記8)
 前記制御情報生成部は、前記制御情報として、前記ノードの移動方向および移動制御量を表す情報を生成することを特徴とする付記1から付記7のいずれか1つに記載の制御装置。
(付記9)
 前記制御情報生成部は、前記複数のノードの移動に関する制約に基づいて、前記制御情報を生成することを特徴とする付記1から付記8のいずれか1項に記載の制御装置。
(付記10)
 前記制御情報生成部は、前記移動に関する制約として、前記複数のノードに対して合計として割り当てられた移動制御量の上限を考慮して、前記担当ノードの移動制御量を調整することを特徴とする付記9に記載の制御装置。
(付記11)
 前記制御情報生成部は、前記移動に関する制約として、前記担当ノードの探索可能範囲と他の前記ノードの探索可能範囲との重複状況が満たすよう定められた所定条件を考慮して、前記担当ノードの移動方向を調整することを特徴とする付記9または付記10に記載の制御装置。
(付記12)
 自らの移動を制御する装置として、付記1から付記11のいずれか1つに記載の制御装置を搭載した機器。
(付記13)
 複数の付記1から付記11のいずれか1つに記載の制御装置を備えることにより、前記複数のノードのそれぞれの前記状態の変化に応じて前記複数のノードの空間的配置を変化させる情報処理システム。
(付記14)
 移動可能な複数のノードのうち担当ノードを含む少なくとも一部の各ノードについて、そのノードの位置に応じた所定の価値に関わる状態を表す状態情報を取得し、
 前記少なくとも一部の各ノードの状態情報に基づいて、前記担当ノードの移動を制御する制御情報を生成し、
 前記制御情報に基づいて前記担当ノードの移動を制御する制御方法。
(付記15)
 移動可能な複数のノードのうち担当ノードを含む少なくとも一部の各ノードについて、そのノードの位置に応じた所定の価値に関わる状態を表す状態情報を取得し、前記少なくとも一部の各ノードの状態情報に基づいて、前記担当ノードの移動を制御する制御情報を生成し、前記制御情報に基づいて前記担当ノードの移動を制御することを、前記複数のノードのそれぞれを前記担当ノードとして実行することにより、前記複数のノードのそれぞれの前記状態の変化に応じて前記複数のノードの空間的配置を変化させる制御方法。
(付記16)
 移動可能な複数のノードのうち担当ノードを含む少なくとも一部の各ノードについて、そのノードの位置に応じた所定の価値に関わる状態を表す状態情報を取得する状態情報取得ステップと、
 前記少なくとも一部の各ノードの状態情報に基づいて、前記担当ノードの移動を制御する制御情報を生成する制御情報生成ステップと、
 前記制御情報に基づいて前記担当ノードの移動を制御する制御ステップと、
 をコンピュータ装置に実行させる制御プログラム。
 以上、上述した実施形態を模範的な例として本発明を説明した。しかしながら、本発明は、上述した実施形態には限定されない。即ち、本発明は、本発明のスコープ内において、当業者が理解し得る様々な態様を適用することができる。
 この出願は、2015年4月16日に出願された日本出願特願2015-083960を基礎とする優先権を主張し、その開示の全てをここに取り込む。
 1、2  情報処理システム
 10、20  制御装置
 11、21  状態情報取得部
 12、22  制御情報生成部
 13、23  制御部
 24  ターゲット位置取得部
 211  評価関数設定部
 221  制約取得部
 222  移動方向決定部
 223  移動制御量決定部
 90  ノード、UUV、警備員
 1001  CPU
 1002  メモリ
 1003  ネットワークインタフェース

Claims (16)

  1.  移動可能な複数のノードのうち担当ノードを含む少なくとも一部の各ノードについて、そのノードの位置に応じた所定の価値に関わる状態を表す状態情報を取得する状態情報取得手段と、
     前記少なくとも一部の各ノードの状態情報に基づいて、前記担当ノードの移動を制御する制御情報を生成する制御情報生成手段と、
     前記制御情報に基づいて前記担当ノードの移動を制御する制御手段と、
     を備えた制御装置。
  2.  前記状態情報取得手段は、前記複数のノードの空間的配置により実現される全体的な前記所定の価値の向上に対して前記ノードが任意の位置において寄与する度合いを評価する評価関数を用いて、前記担当ノードを含む少なくとも一部の各ノードについてその状態情報を生成することを特徴とする請求項1に記載の制御装置。
  3.  前記制御情報生成手段は、前記担当ノードについて前記評価関数を用いて得られる情報と、他の前記ノードについて前記評価関数を用いて得られる情報との比較結果に基づいて、前記制御情報を生成することを特徴とする請求項2に記載の制御装置。
  4.  前記制御情報生成手段は、前記担当ノードについて前記評価関数を用いて得られる情報と、他の前記ノードについて前記評価関数を用いて得られる情報とが略同一になるよう、前記制御情報を生成することを特徴とする請求項3に記載の制御装置。
  5.  前記複数のノードによる探索対象であるターゲットに関する位置情報を取得するターゲット位置取得手段をさらに有し、
     前記制御情報生成手段は、前記少なくとも一部の各ノードの状態情報に加えて前記ターゲットに関する位置情報に基づいて、前記ノードに関する制御情報を生成することを特徴とする請求項1から請求項4のいずれか1項に記載の制御装置。
  6.  前記状態情報取得手段は、前記評価関数として、前記ターゲットの任意の位置における存在確率を表す情報に基づく関数を用いることを特徴とする請求項5に記載の制御装置。
  7.  前記状態情報取得手段は、前記評価関数として、前記ノードによる前記ターゲットに対する発見能力の高さに基づく関数を用いることを特徴とする請求項5または請求項6に記載の制御装置。
  8.  前記制御情報生成手段は、前記制御情報として、前記ノードの移動方向および移動制御量を表す情報を生成することを特徴とする請求項1から請求項7のいずれか1項に記載の制御装置。
  9.  前記制御情報生成手段は、前記複数のノードの移動に関する制約に基づいて、前記制御情報を生成することを特徴とする請求項1から請求項8のいずれか1項に記載の制御装置。
  10.  前記制御情報生成手段は、前記移動に関する制約として、前記複数のノードに対して合計として割り当てられた移動制御量の上限を考慮して、前記担当ノードの移動制御量を調整することを特徴とする請求項9に記載の制御装置。
  11.  前記制御情報生成手段は、前記移動に関する制約として、前記担当ノードの探索可能範囲と他の前記ノードの探索可能範囲との重複状況が満たすよう定められた所定条件を考慮して、前記担当ノードの移動方向を調整することを特徴とする請求項9または請求項10に記載の制御装置。
  12.  自らの移動を制御する装置として、請求項1から請求項11のいずれか1項に記載の制御装置を搭載した機器。
  13.  複数の請求項1から請求項11のいずれか1項に記載の制御装置を備えることにより、前記複数のノードのそれぞれの前記状態の変化に応じて前記複数のノードの空間的配置を変化させる情報処理システム。
  14.  コンピュータ装置が、
     移動可能な複数のノードのうち担当ノードを含む少なくとも一部の各ノードについて、そのノードの位置に応じた所定の価値に関わる状態を表す状態情報を取得し、
     前記少なくとも一部の各ノードの状態情報に基づいて、前記担当ノードの移動を制御する制御情報を生成し、
     前記制御情報に基づいて前記担当ノードの移動を制御する制御方法。
  15.  移動可能な複数のノードのうち担当ノードを含む少なくとも一部の各ノードについて、そのノードの位置に応じた所定の価値に関わる状態を表す状態情報を取得し、前記少なくとも一部の各ノードの状態情報に基づいて、前記担当ノードの移動を制御する制御情報を生成し、前記制御情報に基づいて前記担当ノードの移動を制御することを、前記複数のノードのそれぞれを前記担当ノードとするコンピュータ装置が実行することにより、前記複数のノードのそれぞれの前記状態の変化に応じて前記複数のノードの空間的配置を変化させる制御方法。
  16.  移動可能な複数のノードのうち担当ノードを含む少なくとも一部の各ノードについて、そのノードの位置に応じた所定の価値に関わる状態を表す状態情報を取得する状態情報取得ステップと、
     前記少なくとも一部の各ノードの状態情報に基づいて、前記担当ノードの移動を制御する制御情報を生成する制御情報生成ステップと、
     前記制御情報に基づいて前記担当ノードの移動を制御する制御ステップと、
     をコンピュータ装置に実行させる制御プログラムを記憶した記憶媒体。
PCT/JP2016/002020 2015-04-16 2016-04-14 制御装置、機器、情報処理システム、制御方法、および、記憶媒体 WO2016166983A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US15/565,688 US11188096B2 (en) 2015-04-16 2016-04-14 Control apparatus, control method, and storage medium
JP2017512203A JP6750615B2 (ja) 2015-04-16 2016-04-14 制御装置、機器、情報処理システム、制御方法、および、制御プログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2015-083960 2015-04-16
JP2015083960 2015-04-16

Publications (1)

Publication Number Publication Date
WO2016166983A1 true WO2016166983A1 (ja) 2016-10-20

Family

ID=57126154

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2016/002020 WO2016166983A1 (ja) 2015-04-16 2016-04-14 制御装置、機器、情報処理システム、制御方法、および、記憶媒体

Country Status (3)

Country Link
US (1) US11188096B2 (ja)
JP (1) JP6750615B2 (ja)
WO (1) WO2016166983A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018067314A (ja) * 2016-10-21 2018-04-26 ネイバー コーポレーションNAVER Corporation 室内自律走行ロボットのための制御方法及びシステム
WO2018116919A1 (ja) * 2016-12-20 2018-06-28 日本電気株式会社 航走体制御装置、航走体の制御方法、及び航走体制御装置の制御プログラム
WO2019215838A1 (ja) * 2018-05-09 2019-11-14 日本電気株式会社 自律動作機の制御装置、自律動作機の制御方法、及び、自律動作機の制御プログラムが格納された記録媒体
WO2021095189A1 (ja) * 2019-11-14 2021-05-20 日本電気株式会社 無人機制御装置、無人機制御システム、無人機制御方法及び記録媒体

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018105599A1 (ja) * 2016-12-07 2018-06-14 日本電気株式会社 制御装置、制御方法およびプログラム記録媒体
US11092973B2 (en) * 2018-09-28 2021-08-17 Invia Robotics, Inc. Coordinated operation of autonomous robots
CN109884901A (zh) * 2019-04-04 2019-06-14 中国人民解放军海军工程大学 一种船舶综合操控系统的滑模滤波器设计方法
CN111240212B (zh) * 2020-03-25 2021-05-04 北京航空航天大学 一种基于优化预测的倾转旋翼无人机控制分配方法
CN112612212B (zh) * 2020-12-30 2021-11-23 上海大学 一种异构多无人系统编队与协同目标驱离方法
CN117250996B (zh) * 2023-11-20 2024-02-09 中国人民解放军海军工程大学 一种无人集群对可移动目标的搜索方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05189035A (ja) * 1992-01-14 1993-07-30 Sony Corp 配置制御方法
JPH0793028A (ja) * 1993-09-21 1995-04-07 Agency Of Ind Science & Technol 自律型移動ロボット群システムの制御方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6748292B2 (en) 2002-07-15 2004-06-08 Distrobot Systems, Inc. Material handling method using autonomous mobile drive units and movable inventory trays
DE602004028701D1 (de) 2003-02-03 2010-09-30 Kiva Sys Inc Materialhandhabungssystem und verfahren mit selbständigen mobilen antriebseinheiten und beweglichen lagerbehältern
US7908040B2 (en) * 2004-07-15 2011-03-15 Raytheon Company System and method for automated search by distributed elements
JP4792823B2 (ja) 2005-06-09 2011-10-12 ソニー株式会社 ネットワーク・システム、移動体装置及びその制御方法、並びにコンピュータ・プログラム
JP2009199359A (ja) 2008-02-21 2009-09-03 Yanmar Co Ltd 自律型ロボット及び自律型ロボットを複数用いる協調作業システム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05189035A (ja) * 1992-01-14 1993-07-30 Sony Corp 配置制御方法
JPH0793028A (ja) * 1993-09-21 1995-04-07 Agency Of Ind Science & Technol 自律型移動ロボット群システムの制御方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018067314A (ja) * 2016-10-21 2018-04-26 ネイバー コーポレーションNAVER Corporation 室内自律走行ロボットのための制御方法及びシステム
US10974395B2 (en) 2016-10-21 2021-04-13 Naver Labs Corporation Method and system for controlling indoor autonomous robot
JP7014180B2 (ja) 2016-12-20 2022-02-01 日本電気株式会社 航走体制御装置、航走体の制御方法、及び航走体制御装置の制御プログラム
WO2018116919A1 (ja) * 2016-12-20 2018-06-28 日本電気株式会社 航走体制御装置、航走体の制御方法、及び航走体制御装置の制御プログラム
JPWO2018116919A1 (ja) * 2016-12-20 2019-10-24 日本電気株式会社 航走体制御装置、航走体の制御方法、及び航走体制御装置の制御プログラム
US11270592B2 (en) 2016-12-20 2022-03-08 Nec Corporation Vehicle control device, method for control of vehicle, and program for control of vehicle control device
WO2019215838A1 (ja) * 2018-05-09 2019-11-14 日本電気株式会社 自律動作機の制御装置、自律動作機の制御方法、及び、自律動作機の制御プログラムが格納された記録媒体
JPWO2019215838A1 (ja) * 2018-05-09 2021-04-22 日本電気株式会社 自律動作機の制御装置、自律動作機の制御方法、及び、自律動作機の制御プログラム
JP7070673B2 (ja) 2018-05-09 2022-05-18 日本電気株式会社 自律動作機の制御装置、自律動作機の制御方法、及び、自律動作機の制御プログラム
US11740629B2 (en) 2018-05-09 2023-08-29 Nec Corporation Control device for autonomous operating machines, control method for autonomous operating machines, and recording medium having control program for autonomous operating machines stored thereon
JPWO2021095189A1 (ja) * 2019-11-14 2021-05-20
WO2021095189A1 (ja) * 2019-11-14 2021-05-20 日本電気株式会社 無人機制御装置、無人機制御システム、無人機制御方法及び記録媒体
JP7435620B2 (ja) 2019-11-14 2024-02-21 日本電気株式会社 無人機、無人機制御システム、制御方法、プログラム及び制御装置

Also Published As

Publication number Publication date
JPWO2016166983A1 (ja) 2018-02-15
JP6750615B2 (ja) 2020-09-02
US11188096B2 (en) 2021-11-30
US20180074516A1 (en) 2018-03-15

Similar Documents

Publication Publication Date Title
WO2016166983A1 (ja) 制御装置、機器、情報処理システム、制御方法、および、記憶媒体
Alsamhi et al. Survey on artificial intelligence based techniques for emerging robotic communication
Batth et al. Internet of robotic things: driving intelligent robotics of future-concept, architecture, applications and technologies
Khan et al. Cooperative robots to observe moving targets
Brust et al. A networked swarm model for UAV deployment in the assessment of forest environments
Kim et al. Coordinated trajectory planning for efficient communication relay using multiple UAVs
US11755882B2 (en) Method, apparatus and system for recommending location of robot charging station
Savkin et al. Navigation of a UAV network for optimal surveillance of a group of ground targets moving along a road
Tang et al. A joint global and local path planning optimization for UAV task scheduling towards crowd air monitoring
Do et al. Energy‐Efficient Unmanned Aerial Vehicle (UAV) Surveillance Utilizing Artificial Intelligence (AI)
Varotto et al. Active sensing for search and tracking: A review
Zhicai et al. A cooperative search algorithm based on improved particle swarm optimization decision for UAV swarm
Hu et al. Visual camouflage and online trajectory planning for unmanned aerial vehicle-based disguised video surveillance: Recent advances and a case study
US11740629B2 (en) Control device for autonomous operating machines, control method for autonomous operating machines, and recording medium having control program for autonomous operating machines stored thereon
JP2019074918A (ja) 制御装置、移動体、及び移動体の分散制御プログラム
Bautin et al. Cart-O-matic project: autonomous and collaborative multi-robot localization, exploration and mapping
Zhang et al. Edge-assisted learning for real-time UAV imagery via predictive offloading
Jaiswal et al. Toward a smart multi-unmanned aerial vehicle system
US10742306B1 (en) Systems and methods for controlling a node device
Sharifi et al. Coverage control in multi-vehicle systems subject to health degradation
US11853066B2 (en) Control device, formation determination device, control method, and program
Priya et al. Surveillance Using 5G based drone swarm system for forest area
Liu Optimized Algorithm for Communication Coverage in UAVs Using Virtual Force Principles
Wang et al. Autonomous Route Planning of Unmanned Underwater Cluster Based on Reinforcement Learning
Xiong et al. A resilient and scalable flocking scheme in autonomous vehicular networks

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16779777

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2017512203

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 15565688

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 16779777

Country of ref document: EP

Kind code of ref document: A1