WO2023157510A1 - 経路計画装置、その適用設備、並びに経路計画方法 - Google Patents

経路計画装置、その適用設備、並びに経路計画方法 Download PDF

Info

Publication number
WO2023157510A1
WO2023157510A1 PCT/JP2023/000381 JP2023000381W WO2023157510A1 WO 2023157510 A1 WO2023157510 A1 WO 2023157510A1 JP 2023000381 W JP2023000381 W JP 2023000381W WO 2023157510 A1 WO2023157510 A1 WO 2023157510A1
Authority
WO
WIPO (PCT)
Prior art keywords
agent
evaluation
unit
route
agents
Prior art date
Application number
PCT/JP2023/000381
Other languages
English (en)
French (fr)
Inventor
新士 石原
理優 成川
政樹 金井
佑里 永崎
敏之 大塚
Original Assignee
株式会社日立製作所
国立大学法人京都大学
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所, 国立大学法人京都大学 filed Critical 株式会社日立製作所
Publication of WO2023157510A1 publication Critical patent/WO2023157510A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/005Traffic control systems for road vehicles including pedestrian guidance indicator
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/09Arrangements for giving variable traffic instructions
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/14Traffic control systems for road vehicles indicating individual free spaces in parking areas

Definitions

  • the present invention relates to a route planning device, equipment to which it is applied, and a route planning method in an area where a plurality of agents exist.
  • AAV Automated Guided Vehicle
  • AMR Autonomous Mobile Robot , etc.
  • Patent Document 1 presents a method of calculating the paths along which multiple robots (vehicles in the patent document) travel without designing detailed passages.
  • model predictive control is applied so that each robot does not come into contact with obstacles (such as pillars and walls in the building, robots other than itself), and the current position and target position of each robot are as small as possible.
  • Control inputs velocity, angular velocity
  • the movement path is calculated by integrating the calculated control input.
  • Patent Document 1 it is possible to calculate the route for the robot to reach the target value without designing detailed passage information in the warehouse or factory in advance.
  • Model predictive control is a method of calculating a control input to minimize a specific evaluation function. Minimization (or maximization) of the evaluation function uses a numerical optimization method such as the gradient method. There is a high possibility that the calculated optimum solution will not be a global optimum, but a local optimum.
  • the present invention has been made to solve the above problems, and provides a route planning device, equipment to which it is applied, and a route planning method that do not require setting detailed route information in advance and that do not cause deadlocks. intended to
  • a business management unit that determines the destinations of a plurality of agents, a map information management unit that manages map information of areas where agents exist, and an agent information management unit that manages the individual information of agents.
  • a management unit a route plan calculation unit that generates a route plan for moving each agent to a destination determined by the business management unit based on information from the map information management unit and the agent information management unit;
  • a main purpose achievement evaluation unit that performs a higher evaluation as the position approaches the target position, and a main purpose achievement auxiliary unit that performs a lower evaluation for each agent if the position continues to be separated from the target position by a predetermined distance or more.
  • an agent-to-agent distance evaluation unit that evaluates each agent lower as the agent-to-agent distance approaches a predetermined value set according to each agent in the agent information management unit; , at each time, the route plan is generated so that the overall result of the evaluation values calculated by the main goal achievement evaluation section, the main goal achievement assistance section, and the inter-agent distance evaluation section improves from the previous evaluation value. and a route planning device further comprising an action plan transmission unit for transmitting the route plan calculated by the route plan calculation unit to all agents.”
  • a route plan for moving each agent to the destination is generated based on the destinations of a plurality of agents, the map information of the area where the agents are present, and the individual information of the agents, and A first evaluation in which the agent is evaluated higher as the position approaches the target position, and a second evaluation in which each agent is evaluated lower when the position continues to be separated from the target position by a predetermined distance or more. Then, for each agent, a third evaluation is obtained in which the evaluation becomes lower as the distance between the agents approaches a predetermined value set according to each agent, and the first evaluation and the second evaluation are obtained at each time. , and a route planning method characterized by generating a route plan so that the overall result of the third evaluation is better than the previous evaluation value, and transmitting it to all agents by means of a computer.” .
  • a logistics site where a route planning device is applied agent information is obtained by beacons and/or surveillance cameras, and an action plan is transmitted to the agent.
  • a parking lot where a route planning device is applied agent information is obtained by a surveillance camera, and an action plan is transmitted to a digital signage.
  • each agent can generate a movement route that does not cause deadlocks after considering safety and operational restrictions.
  • the engineering cost of agent route planning can be greatly reduced.
  • the movement routes of all agents are simultaneously generated, so overall optimization can be achieved.
  • FIG. 1 is a functional block diagram showing an example of the overall configuration of a route planning system according to Embodiment 1 of the present invention
  • FIG. 1 is a block diagram showing an example of functions of a route planning device 1 according to Embodiment 1 of the present invention
  • FIG. A diagram showing the coordinates of an agent A diagram showing the coordinates of an agent.
  • FIG. 4 is a diagram showing an example of the position of an area plane
  • FIG. 10 is a diagram showing a case where the evaluation function has a local optimum other than the global optimum; The figure which shows the case where the circumference
  • FIG 4 is a diagram showing a situation in which two robots move to a target point q on the rear side of a partner robot; The figure which shows the operation
  • FIG. 4 is a diagram showing an example of update timing of the route planning device 1; The figure which showed the stuck state as an initial state. The figure which shows the state at the time of a speed fall. The figure which shows the shape of comprehensive evaluation. A diagram showing a shift from a local optimum. The figure which shows the search of a global optimal solution. The figure which shows the evaluation of the main objective achievement evaluation part 43 at the time of FIG.6b. The figure which shows the evaluation function of the shape which does not have a local solution. The figure which shows the situation of stack avoidance. The figure which shows the state where the agent approached the deviation eb1 which a stack generate
  • FIG. 4 illustrates that the automated machine has been rerouted in an anti-collision direction;
  • FIG. 3 illustrates an automated machine stop for collision avoidance;
  • Fig. 2 shows a situation in which two automated machines are given target positions behind each other;
  • FIG. 4 is a diagram showing an example of route planning that can occur when applying the conventional technology to a parking lot;
  • FIG. 4 is a diagram showing an example of a route plan generated when the present invention is applied;
  • Example 1 An example of the overall configuration of a route planning system will be described in Example 1, a processing flow of route planning in Example 2, a mechanism for escaping from a stuck state in Example 3, and an application to a physical distribution site in Example 4. An example of application to a parking lot will be described in Example 5.
  • FIG. 1 is a functional block diagram showing an example of the overall configuration of a route planning system according to Embodiment 1 of the present invention.
  • a route planning device 1 obtains position information S1 and S2 from a monitoring device 2 and an agent 3, and gives the agent 3 action plan information S3.
  • agent 3 including all moving objects such as robots, vehicles, and people
  • the basic configuration remains the same.
  • the agent 3 includes a communication unit 31 , a self-position acquisition unit 32 , another person's position acquisition unit 33 , and a route follower 34 . All agents have these functions. However, when the agent 3 is a person, it is sufficient that the position of the person can be grasped by some means (for example, the monitoring device 2) and the action plan can be transmitted to the person.
  • the agent 3 is a mobile robot, and the mobile robot is equipped with sensors for acquiring environmental information such as LiDAR ( Light Detection and Ranging ).
  • the position information of other agents 3 can also be obtained as the point group information.
  • the self-location acquiring section 32 and the other-person's location acquiring section 33 can be executed at the same time.
  • agent 3 is a worker
  • the agent itself cannot have a specific function.
  • the worker has a tablet having a wireless communication function such as Wifi or Bluetooth
  • the functions of the communication unit 31 and the self-position acquisition unit 32 can be substituted.
  • the function of the route follower 34 is replaced when the worker follows the movement instruction indicated on the tablet.
  • the tablet does not have a function to acquire the position information of other agents 3, the worker is treated as an agent 3 that does not have the other person's position acquisition unit 33.
  • the command value S3 for the action plan (route plan) delivered from the action plan transmission unit 15 in the route planning device 1 is received by the communication unit 31, and the route is routed according to the received route plan.
  • a follower 34 controls each actuator (motor, etc.).
  • the position information (self position and other position) S2 acquired by LiDAR-SLAM is transmitted from the communication unit 31 to the agent information management unit 13 in the route planning device 1.
  • FIG. Note that when LiDAR-SLAM is used, map information of the management area can also be obtained. Therefore, when there is a change in the map information such as a change in the layout of the warehouse, this information may be sent to the map information management unit 12 .
  • the position information S1 of the agent 3 in the area is acquired by the agent position acquiring unit 22 (monitoring camera, beacon, etc.) in the monitoring device 2 provided in the area, and the communication unit 21 provided in the monitoring device 2 may be passed to the agent information management unit 13 in the route planning device 1 via.
  • the agent position acquiring unit 22 monitoring camera, beacon, etc.
  • FIG. 2 is a block diagram showing a functional example of the route planning device 1 according to Embodiment 1 of the present invention.
  • the route planning device 1 manages the positions and IDs of all agents 3 (including all moving objects such as robots, vehicles, and people) within a managed area (for example, a warehouse or a parking lot).
  • Agent information S6 obtained from the agent information management unit 13
  • business information S4 obtained from the business management unit 11 that manages the agent's business content (destination) in the management target area
  • map information management that manages map information of the management target area
  • the route planning unit 14 uses the map information S5 obtained from the unit 12 as input information, the route planning unit 14 calculates a moving route for each agent 3 .
  • the route plan S3 calculated by the route planning unit 14 is transmitted by the action plan transmission unit 15 to the agent 3 in the area to be managed.
  • each agent 3 is presently located in the area to be managed, Where they go and what they do is grasped in chronological order as actions in the past and in the future.
  • the route planning unit 14 is composed of a main goal achievement evaluation unit 43, an inter-agent distance evaluation unit 41, a main goal achievement assistance unit 42, and a route plan calculation unit 44.
  • the output of the route plan calculation unit 44 is used as action plan information S3. do.
  • the main objective achievement evaluation unit 43, the inter-agent distance evaluation unit 41, and the route plan calculation unit 44 are conventionally provided functions. It can be said that the function of the main objective achievement assisting section 42 is added. Basically, the functions of the main objective achievement evaluation unit 43, the inter-agent distance evaluation unit 41, and the route plan calculation unit 44, which are conventionally configured, enable route planning. In the event of a stuck state (stuck, deadlock), the function of the main objective achievement assisting part 42 is to escape from the stuck state.
  • the main purpose achievement evaluation unit 43 obtains work information S4 from the work management unit 11 that manages the agent's work content (destination) in the management target area, and the map information management unit 12 that manages the map information of the management target area.
  • the obtained map information S5 is used as input information. Based on these pieces of information, the main purpose achievement evaluation unit 43 calculates an evaluation value used for accomplishing the work that each agent 3 should accomplish, that is, movement to a specific position (target point).
  • FIGS. 3a and 3b represent the current position of the agent 3 within the managed area indicated by the XY coordinates.
  • the target position r i For movement to (rx i , ry i , r ⁇ i ), the goal of route planning is to bring the deviation ei between its own position vector pi and the target position ri closer to 0 using, for example, equation (1). .
  • Equation (2) The equation of motion of the mobile robot in Fig. 3a can be given by equation (2).
  • vi is the moving speed of the agent i
  • ⁇ i is the angular speed of the agent i
  • the control input can be given by two inputs (v, ⁇ ).
  • the agent 3 is a robot or worker (human) driven by an omni-wheel, it can move freely in the X and Y directions, so the equation of motion follows equation (3).
  • the control inputs are three inputs (vx, vy, ⁇ ).
  • k means time
  • k0 is the evaluation start time
  • kN is the evaluation end time
  • is the weight for the deviation
  • is the weight for the energy consumption.
  • the action of agent 3 can be adjusted by adjusting the balance between ⁇ and ⁇ . For example, if ⁇ is made larger than ⁇ , it is possible to realize an energy-saving mode operation in which energy consumption is suppressed. On the other hand, if ⁇ is set to 0, the fastest moving route is calculated without considering energy consumption.
  • the function of the main objective achievement evaluation unit 43 is to evaluate the expression (6), which takes the expression (5) into account for all N agents 3 .
  • the agent-to-agent distance evaluation unit 41 manages agent information S6 obtained from the agent information management unit 13 that manages the positions and IDs of all agents 3 within the management target area, and map information management that manages the map information of the management target area.
  • the map information S5 obtained from the unit 12 is used as input information.
  • the inter-agent distance evaluation unit 41 determines the main purpose achievement evaluation unit 43 so that the distance between each agent received from the agent information management unit 13 is equal to or greater than a predetermined distance, in order to prevent the agents from contacting each other. It has a function to correct the evaluation value of
  • the distance dij between the agent i of the position vector Pi and the agent j of the position vector Pj can be calculated by equation (7). Route planning is executed so that this distance dij is equal to or greater than the marginal distance da given to each agent, that is, the equation (8) is satisfied.
  • equation (9) is a minute coefficient for avoiding division by zero.
  • FIG. 4 is a diagram showing the evaluation function of formula (9a), in which the horizontal axis indicates the distance dij between agents, and the vertical axis indicates the magnitude of the evaluation function.
  • the evaluation function of formula (9a) since the evaluation function of formula (9a) has a shape as shown in FIG. 4, it takes a larger value as the distance dij between agents approaches the allowance distance da. In other words, contact between the agents 3 can be prevented by giving a greater penalty as the distance between the agents decreases.
  • the inter-agent distance evaluation unit 41 it is desirable to change the marginal distance da according to the agent information S6 held by the agent information management unit 13 .
  • Table 1 is an example of the margin distance da designed with a focus on contact safety. It assumes contact for each agent type (worker, low-speed machine, high-speed machine). Workers move slowly and there is a low possibility of an accident even if workers come into contact with each other. On the other hand, if a high-speed machine (such as a forklift) comes into contact with a person, it may cause a serious accident, so the allowance distance da is set to 100 cm. Other combinations are designed with similar guidelines.
  • Table 2 is a design example of the margin distance da with the viewpoint of preventing infectious diseases.
  • contact is assumed for each agent type (worker, low-speed machine, high-speed machine). Since there is little possibility of droplet infection between humans and machines, the allowance distance da is the same as in Table 1. On the other hand, since the possibility of droplet infection increases when people pass each other, it is desirable to secure a social distance by setting a large allowance distance da.
  • the marginal distance da is determined not only by the characteristics of the agent, but also depends on the passage width of the area and the like.
  • Obstacles (walls, pillars, etc.) in the map information S5 received from the map information management unit 13 are treated as virtual agents, and the distance di between each agent and the obstacle is evaluated in the same format as equation (9). It is also possible to avoid contact with obstacles. Alternatively, obstacle information may be saved in the cost map C, and equation (10) may be used to evaluate the position pi of each agent in the cost map.
  • Route planning is possible by the functions of the main purpose achievement evaluation unit 43, the inter-agent distance evaluation unit 41, and the route plan calculation unit 44.
  • This route planning allows the robot to operate. When falling into an impossible state (fixed state: stuck, deadlock), it was impossible to escape from the stuck state. The inability to escape from the stuck state will be explained with reference to FIGS.
  • the evaluation function has the shape shown in Fig. 5a (horizontal axis: deviation, vertical axis: evaluation function). Therefore, if the control input is calculated so as to minimize the evaluation function, the state where the deviation e becomes 0 (the robot reaches the target value) can be achieved.
  • a similar situation occurs whenever the target point q1 is on the opposite side of the obstacle (passage).
  • the local optimal solution is on the circumference where the deviation e1 from the target point q1 is a specific distance.
  • the evaluation function increases unless a circular motion accompanied by movement in the negative direction of the Y-axis is performed. Even if the robot moves in an arc and reaches point B, there is an obstacle, so the robot cannot move any further.
  • the present invention proposes countermeasures corresponding to each pattern.
  • the main objective achievement assisting unit 42 of the present invention is introduced to resolve such a situation and assist each agent to reach the target point r.
  • a situation in which each agent is deadlocked can be rephrased as an agent's moving speed becoming 0 (zero). This is the first pattern assumed by the present invention.
  • the main objective achievement assisting unit 42 introduces the evaluation function of formula (12).
  • Equation (12a) has a shape as shown in FIG. 7a (horizontal axis: v i 2 , vertical axis: magnitude of evaluation function). will give. By adding such a function to the evaluation function, an action is generated for the agent to resolve the stalled state.
  • the agent can implement detour behavior. Similarly, the situation in FIG. 5d can also be resolved.
  • each agent is deadlocked can be rephrased as a state in which the agent remains at a specific position pa. This is the second pattern envisioned by the present invention.
  • the main objective achievement assisting unit 42 introduces the evaluation function of formula (13).
  • the formula (13) includes the formulas (13a) and (13b).
  • Equation (13a) is the evaluation only for a specific time
  • Equation (13a) has a shape as shown in FIG. 8 (horizontal axis: (Pa ⁇ Pi) 2 , vertical axis: magnitude of evaluation function), so that the closer the position pi of each agent is to pa, the greater the penalty given. It will be. By adding such a function to the evaluation function, an action is generated for the agent to resolve the stalled state.
  • each agent is not in a stopped state but cannot reach the target point.
  • a situation corresponds to a situation in which the agent 3 travels in a circular motion at a constant speed while being separated from the target point by a certain distance or more. This is the third pattern assumed by the present invention.
  • FIG. 9a shows the position Pi of the i-th agent on a two-dimensional plane, the travel trajectory and the target point r
  • FIG. 9b shows the time variation of the deviation between the position Pi of the i-th agent and the target point.
  • the agent 3 is moving at a constant speed on the circumference (minimum deviation min ei, maximum deviation max ei) while remaining at a constant distance from the target point ri.
  • the main objective achievement assisting unit 42 can realize an escape function by providing a plurality of countermeasures corresponding to the patterns shown above.
  • the main objective achievement assisting section 42 may be provided with at least one of the above methods. Naturally, it is also possible to have all the above three techniques.
  • the route plan calculation unit 44 integrates the evaluation functions set by the main purpose achievement evaluation unit 43, the inter-agent distance evaluation unit 41, and the main purpose achievement auxiliary unit 42, and calculates the value of the evaluation function as Calculate the control input u so as to minimize it.
  • control input u is calculated so as to minimize the evaluation function (equation (15)) obtained by integrating the evaluation function JI set for each element using the weighting factor ⁇ I.
  • the method of calculating the control input u itself follows the well-known idea of model predictive control, and since there is no particular ingenuity, the explanation is omitted.
  • the time-series data of position (x, y) and orientation ( ⁇ ) can be easily obtained using the corresponding equations of motion (equations (2) and (3)). can be generated.
  • This time-series data becomes a route plan for each agent.
  • This route planning itself is the same as that of Patent Document 1, and is a widely known method, so a detailed description will be omitted.
  • the route plan calculation unit 44 may determine a pattern and execute a specific countermeasure method, or may sequentially execute a plurality of countermeasure methods and wait for one of them to solve the problem.
  • the calculated route plan is delivered to each agent via the action plan transmission unit 15.
  • Example 1 an example of the overall configuration of the route planning system was explained.
  • Example 2 the processing flow in the route planning system will be explained.
  • the processing function FC1 acquires the position information S6 of the agents in the area. This function corresponds to the agent information management unit 13 .
  • the processing function FC2 acquires the job content S4 (target point ri to be moved) given to each agent in the area. This function corresponds to the business management unit 11 .
  • the processing function FC3 acquires the map information S5 in the area. This function corresponds to the map information management section 12 . Note that the map information S5 does not need to be updated at every step because the map information S5 is updated less frequently than the business content and the agent's location information. Note that the processing order of the processing functions FC1 to FC3 may be any order, and it is important that all the information is complete before transitioning to the processing functions FC4 and thereafter.
  • the processing function FC4 evaluates each agent for moving to the target point according to the position S6 of each agent and the work content S4 obtained by the processing functions FC1 and FC2. This function corresponds to the main purpose achievement evaluation section 43 .
  • the processing function FC5 utilizes the position S6 of each agent obtained by the processing functions FC1 and FC3 and the map information S5 to provide information for each agent to avoid contact with obstacles and other agents. make an assessment.
  • This function corresponds to the inter-agent distance evaluation unit 41 .
  • the processing function FC6 uses the pieces of information S4, S5, and S6 acquired by the processing functions FC1 to FC3 to perform evaluations to eliminate the situation in which each agent stops in the process of moving to the target point. .
  • This function corresponds to the main objective achievement assistance section 42 .
  • the processing order of the processing functions FC4 to FC6 may be any order, and it is important that all the information is complete before transitioning to the processing functions FC7 and beyond. As described above, when using the concept of model predictive control, processing functions FC4 to FC6 evaluate values from initial time k0 to prediction steps (kN-k0) ahead.
  • the processing function FC7 calculates the control input of each agent so as to minimize the evaluation function calculated by the processing functions FC4 to FC6, and calculates the movement route by integrating the input. This function corresponds to the action plan calculator 44 .
  • the processing function FC8 distributes the route plan generated by the processing function FC7 to each agent. This function corresponds to the action plan transmission unit 15 .
  • Whether or not to enable the first implementation means may be switched by the user (area administrator) setting. Furthermore, even if the user decides to enable the first implementation means, this function is disabled if the agent 3 is near the target point.
  • Whether or not to enable the second implementation means may be switched by the user's settings. Furthermore, even if the user decides to enable the second implementation means, if the agent is not stopped, this function may be disabled.
  • the processing function FC64 gives the position pi where the i-th agent is stopped as the specific position pa for penalty calculation. If it is possible to predict in advance that the agent will stop from the shape of the map, it may be substituted by a process of setting the position as pa in advance.
  • the penalty value for stopping at a specific position pa other than the destination point is calculated according to the formula (13).
  • the processing function FC66 it is determined whether or not to enable the function of giving a penalty using the integral of the deviation between the agent position and the target point, which is the third means for realizing pattern 3 in the main objective achievement auxiliary evaluation unit 42. If this function is valid (YES), the transition is made to the processing function FC67, and if it is invalid (NO), the transition is made to the processing function FC60.
  • Whether or not to enable the third implementation means may be switched by user settings, but if the user disables the first and second implementation means, it is desirable to enable them automatically. As shown in a specific embodiment to be described later, when the agent is a worker, the worker can solve a deadlock (stuck) situation by himself/herself. You may disable all the implementation means of
  • the processing function FC67 When transitioning to the processing function FC67, the amount of change in the deviation between the agent position and the target point at a specific time is analyzed. If the minimum value of the deviation acquired by the processing function FC67 has changed (YES), the processing function FC68 transitions to the processing function FC69b. On the other hand, if the minimum value of the deviation acquired by the processing function FC67 has not changed (NO), the process transitions to the processing function FC69a.
  • the FC69a calculates a penalty using the integrated value of the deviation ei according to the formula (14).
  • the processing function FC69b performs an operation of resetting the integrated value of the deviation ei. If the process of calculating the integral value is performed only when transitioning to the processing function FC69a, the process of the processing function FC69b need not be performed.
  • the processing function FC60 integrates the penalties by adding the respective penalties calculated by the processing functions FC62, FC65, and FC69a. Values of processing functions FC62, FC65, and FC69a for which calculation has not been performed are replaced with 0 (zero).
  • the route planning device 1 receives the position information of each agent 3 as an input, it calculates a route plan and distributes the route plan to each agent 3 sequentially.
  • each agent When the first route is delivered at time t1, each agent starts moving to the target point. Since the moving distance and moving speed to the target point r differ for each agent 3, the moving times often do not match.
  • agent 3A reaches the target point at time t2, and the route planning device 1 that has detected the arrival assigns a new target point to agent 1 and plans the route again.
  • the reroute planning is executed in the order of input, calculation, and output, and at time t3, the reroute planning for agent 3A can be transmitted.
  • each agent is given a new route plan at time t3. Thereafter, similar processing is executed each time each agent reaches the target point.
  • Interrupt processing may be performed.
  • Example 3 the mechanism for escaping from the stuck state by the method of the above example will be explained in chronological order.
  • FIG. 13a is a diagram showing FIG. 5b and FIG. 5c together, showing the stack state as an initial state. With this characteristic, it falls into a local optimum when it should shift to the global optimum. At this time, the value of the evaluation function decreases from f1 to f2 (the overall evaluation improves), as shown in FIG. 13a. After that, the agent cannot move any further because there is a wall between the agent and the target position. When the agent turns back from this state (moves in the negative direction of the y-axis), the deviation e increases, so the value of the evaluation function increases more than f2, that is, the overall evaluation decreases. Since the route plan calculator 44 has a function of calculating a route that improves the overall evaluation, it cannot calculate such an action that lowers the overall evaluation. Therefore, the agent will continue to stop.
  • the agent adopts the main goal achievement assisting unit 42 (formula (12), FIG. 7a) that focuses on the moving speed.
  • the main goal attainment aid 42 when the agent begins to decelerate as it approaches the wall, as in Figure 13a, the penalty increases rapidly according to the function shown in Figure 7a. That is, as the speed decreases, the output of the primary goal-achieving aid 42 increases, as shown in Figure 13b.
  • the overall evaluation which is the sum of the main goal achievement evaluation part 43 and the main goal achievement auxiliary part 42, has a shape as shown in FIG. 13c. That is, as the agent moves to reduce the deviation e and decelerates due to approaching the wall, the total evaluation value increases (evaluation decreases) from f1 to f3.
  • the route plan calculator 44 can search for a solution that improves the comprehensive evaluation value while reducing the deviation e.
  • the speed of the agent exceeds a certain level, the effect of the penalty by the main target achievement assisting unit 42 disappears, but if the deviation e falls below ea2 as shown in FIG.
  • the route plan calculator 44 can search for the global optimal solution that makes the deviation e zero.
  • FIG. 14a shows the evaluation of the primary goal achievement evaluator 43 for each agent in the situation shown in FIG. 6b.
  • the agent 3 at the position p1 moves to the destination point by detouring, so the evaluation function has a shape having a local solution as shown in FIG. 14a.
  • the agent 3 at the position p2 is in a situation where it moves to the target point only by going straight, so as shown in FIG.
  • the route plan calculation unit 44 does not optimize the behavior of individual agents, but optimizes the behavior of all agents, the total evaluation value is the total evaluation value of FIG. Optimization of the evaluation function having such a shape will be performed.
  • the evaluation function in FIG. 14c has a local solution where the total deviation e is eb1. The situation in which the agents fall into this local optimum corresponds to the situation shown in FIG.
  • FIG. 16 is a diagram simply showing a warehouse 100 in which a worker 3B who is an agent 3 and an automated machine (forklift) 3A coexist. In the figure, only one worker 3B and one automated machine 3A are shown for the sake of clarity. Also good.
  • Worker 3B wears or holds a smart device (not shown).
  • the smart device may be a tablet terminal or a wearable item such as goggles.
  • the smart device can notify and guide the worker 3B of the destination by displaying the route to the target point on the monitor of the tablet terminal or in the goggles.
  • the smart device can measure the position of the worker 3B wearing or holding the smart device.
  • the smart device also has a communication function and can communicate with the control server 104 .
  • a monitoring camera 101 arranged in the warehouse area 100 keeps track of the situation in the area.
  • the control server 104 corresponds to the route planning device 1 of the present invention. Note that the functions of the route planning device 1 do not have to be performed by the same server. For example, only the route planning section 44, which has a high processing load, may be executed by a specific server. Also, the control server 104 does not necessarily have to be installed in the warehouse 100 .
  • the automated machine 3A is equipped with a LiDAR (not shown). By processing the point cloud data collected by LiDAR, the automated machine implements the SLAM function that simultaneously performs warehouse map creation and self-localization. Furthermore, the automated machine 3A is equipped with a controller (not shown), which performs various calculations related to automatic operation.
  • the controller of the automated machine 3A has a communication function, transmits the self-position acquired by SLAM and map information to the control server 104, and receives a route plan from the control server 104.
  • the controller controls the actuators (steering motor, traction motor, etc.) of automated machine 3A to follow the movement plan.
  • the worker 3B and the automated machine 3A correspond to the agent 3 in the present invention.
  • the monitoring camera 101 placed in the warehouse corresponds to the monitoring device 2 of FIG. 1 in the present invention.
  • the work is set so that the worker 3B collects the article at the position r1 of the shelf 102B and the automated machine 3A collects the article at the position r2 of the shelf 102A. Assuming a situation.
  • the route planning device 1 calculates routes to be followed by each of the worker 3B as the agent 1 and the automated machine 3A as the agent 2.
  • control server 104 receives the current positions p1 and p2 from the smart device provided by the worker 3B and the controller of the automated machine 3A. This function corresponds to the agent information management unit 13 of the present invention. Also, the target points of the worker 3B and the automated machine 3A determined by the work management section 11 are r1 and r2.
  • the route planning unit 14 plans a route to guide the worker 3B from the current position p1 to the target point r1 and the automated machine 3A from the current position p2 to the target point r2. First, when the positions of both agents are sufficiently far apart, the evaluation value of the main objective achievement evaluation unit 43 is dominant, so routes are gradually generated so that each becomes the shortest route.
  • the automated machine 3A generates a path that moves in the negative X-axis direction to prevent collisions, instead of the shortest path (movement in the negative Y-axis direction). Since there is no possibility of contact after that, routes are generated sequentially so that each follows the shortest route.
  • FIG. 17c cannot be realized due to the influence of the penalty (formula (12)) by the first realization means of the main objective achievement assisting section 42. Therefore, when it is important to reduce the amount of energy consumption, it is possible to disable the first implementation means of the main objective achievement assisting section 42 and prevent the occurrence of deadlock by the second and third implementation means. desirable.
  • Patent Document 1 two automated machines 3D (agent 1) and 3C (agent 2) are positioned behind each other's initial positions p1 and p2 as a situation in which a deadlock can occur. , r2 are given.
  • each of the automated machines 3C and 3D stops at a position advanced to some extent (a distance at which they do not collide). This is a unique problem that occurs in a situation where only the main purpose achievement evaluation unit 43 and the inter-agent distance evaluation unit 41 are effective.
  • the situation shown in Fig. 18b will be the first, and the vehicle will start decelerating so as not to make contact.
  • the penalty by the first realization means of the main purpose achievement auxiliary unit 42 is When increased, a path is generated that travels even if the deviation e is increased. In other words, as shown in FIG. 18c, a route is generated that avoids contact by utilizing the intersecting passages.
  • the worker 3B can freely move around at his/her own will, so it is expected that the worker 3B will not follow the route instructions given to the smart device.
  • the route planning device 1 does not treat the worker 3B as a controllable agent, but as an obstacle that should not be touched.
  • the route planning device 1 executes the route planning for the agents excluding the worker 3B through interrupt processing (time t4 in FIG. 12).
  • the route planning device 1 similarly executes route planning for all agents including the worker 3B by interrupt processing.
  • Example 5 a case where the present invention is applied to route planning in a parking lot will be described.
  • FIG. 19 is a diagram simply showing a parking lot 200 where non-automated vehicles 3E and automated vehicles 3F coexist. Although only one non-automated vehicle 3E and one automated vehicle 3F are shown in the figure for the sake of clarity, an environment where there are multiple non-automated vehicles and automated vehicles, or a situation where there are no non-automated vehicles is also acceptable.
  • the non-automated vehicle 3E Since the non-automated vehicle 3E is equipped with a car navigation system, it may be equipped with a self-position acquisition function using GNSS ( Global Navigation Satellite System ) and a communication function. It is not always possible to cooperate with the route planning system of the invention. Therefore, the non-automated vehicle 3E in the parking lot environment does not have the functions that the agent 3 should have. However, it is possible to replace the functions that the non-automated vehicle 3E should have with the configuration described later.
  • GNSS Global Navigation Satellite System
  • the automated vehicle 3F can acquire its own position using GNSS and LiDAR.
  • the automated vehicle 3F is equipped with a controller (not shown), which performs various calculations related to automated driving.
  • the controller has a communication function, and can communicate with the control server 104 that manages the operation of the parking lot, and travel in the parking lot according to the route plan transmitted by the control server 104 .
  • the parking lot 200 is equipped with monitoring cameras 101 at various locations to monitor the positions of vehicles in the parking lot and empty spaces.
  • the surveillance camera 101 corresponds to the surveillance device 2 of the present invention. Therefore, the monitoring camera 101 serves as an alternative function of the self-position acquisition unit 22 of the non-automated vehicle 3E.
  • Digital signage 105 is installed in various places in the parking lot 200, and route guidance to empty areas can be displayed. By displaying the route plan distributed by the control server 104 on the digital signage 105, the non-automated vehicle 3E can be guided. Note that the control server 104 does not necessarily have to be installed in the parking lot 200, as in the distribution warehouse example described above.
  • the route planning device 1 calculates a route plan for moving the current positions p1 and p2 of each agent to the destination points r1 and r2 calculated by the business management unit 11 .
  • Fig. 20a shows an example of route planning that can occur when the conventional technology (Patent Document 1) is applied to a parking lot. Similar to the situation shown in FIGS. 5b and 5d, each agent has the shortest distance positions (p1(6) and p2(2)) to the target point ri across obstacles (walls and other parked vehicles). will deadlock.
  • FIG. 20b shows an example of a route plan generated when applying the invention in the same situation.
  • the penalty value calculated by the main objective achievement assisting unit 42 increases. Therefore, it is possible to generate a route that gradually approaches the target points r1 and r2 after leaving the shortest distance positions (p1(6) and p2(2)) once.
  • the non-automated vehicle 3E can move freely according to the driver's will, as in the example of the distribution warehouse, so it is expected that it will not follow the route instructions given to the digital signage 105.
  • the route planning device 1 does not treat the non-automated vehicle 3E as a controllable agent, but as an obstacle that should not be contacted. As soon as it is confirmed that the route instruction is not followed, the route planning device 1 performs route planning for the agent excluding the non-automated vehicle 3E by interrupt processing (time t4 in FIG. 12).
  • route planning device 1: route planning device, 2: monitoring device, 3: agent, 10: route planning system, 11: business management unit, 12: map information management unit, 13: agent information management unit, 14: route planning unit, 15: action Plan transmission unit, 21: communication unit, 22: agent location acquisition unit, 31: communication unit, 32: self location acquisition unit, 33: other location acquisition unit, 34: route follower, 41: inter-agent distance evaluation unit, 42: main goal achievement auxiliary part, 43: main goal achievement evaluation part, 44: route plan calculation part

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Automation & Control Theory (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
  • Navigation (AREA)
  • Traffic Control Systems (AREA)

Abstract

地図情報管理部とエージェント情報管理部の情報に基づいて、各エージェントを業務管理部が決定した移動先に移動させるための経路計画を生成する経路計画計算部と、各エージェントについて、位置が目標位置に近づくほど高い評価を行う主目的達成評価部と、各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れている状態が継続すると低い評価を行う主目的達成補助部と、各エージェントについて、エージェント間の距離が、エージェント情報管理部にて各エージェントに応じて設定される所定の値に近づくほど低い評価を行うエージェント間距離評価部と、を備え、経路計画計算部は、各時刻において、主目的達成評価部、主目的達成補助部、およびエージェント間距離評価部で算出される評価値の総合結果が、以前の評価値よりも向上するように前記経路計画を生成し、さらに、経路計画計算部で算出した経路計画を、全エージェントに伝達する行動計画伝達部を備える、経路計画装置。

Description

経路計画装置、その適用設備、並びに経路計画方法
 本発明は、多種、複数のエージェントが存在するエリアにおける経路計画装置、その適用設備、並びに経路計画方法に関する。
 物流倉庫の物品搬送や工場の工程間搬送の人手不足を解消するために、移動ロボット(AGV:utomated uided ehicle、AMR:utonomous obile obotなど)の導入が進んでいる。
 このような移動ロボットを導入するには、倉庫や工場内にロボットが移動可能な通路を設定(ノードとエッジからなるグラフなどの作成)が必要になる。この設定が細かいほど、ロボットが選択可能な通路の自由度は高くなるため、より効率的な搬送が可能になるが、その反面、設定作業に多くの工数が必要になる。さらに、前記の通路の設定作業は、倉庫や工場のレイアウトが変更するたびに必要になるため、詳細な通路を設定する作業は、倉庫や工場を管理する事業者に大きな負担(エンジニアリングコスト)を求めることになる。
 このような課題に対して、特許文献1には、詳細な通路を設計することなく、複数のロボット(特許文献中ではビークル)が移動する経路を算出する方法が提示されている。
 より具体的には、各ロボットが障害物(建物内の柱や壁、自身以外のロボットなど)に接触せず、各ロボットの現在位置と各ロボットの目標位置をできるだけ小さくするようにモデル予測制御の考えに従って、各ロボットに対する制御入力(速度、角速度)を算出する。そして算出された制御入力を積分することで移動経路(位置、姿勢)を算出する。
特開2021-77090号公報
 特許文献1によれば、事前に倉庫や工場内に詳細な通路情報を設計せずに、ロボットが目標値にたどり着く経路を算出することができる。
 然しながら、特許文献1はモデル予測制御の考え方に従っているため、モデル予測制御自体が抱える課題をそのまま受け継いでしまう。モデル予測制御は特定の評価関数を最小化するように制御入力を算出する手法であるが、評価関数の最小化(もしくは最大化)には、例えば勾配法など数値最適化手法を利用するため、算出される最適解が大域的最適(グローバル最適)にならず、局所最適(ローカル最適)になる可能性が高い。
 このように、特許文献1の手法によれば、局所最適の状態に陥り、ロボットが動作できなくなる状態(スタック、デッドロック)が非常に多く存在する恐れがある。
 本発明は以上の課題を解決するためになされたものであり、事前に詳細な通路情報を設定することなく、かつ、デッドロックを生じない経路計画装置、その適用設備、並びに経路計画方法を提供することを目的とする。
 以上のことから本発明においては、「複数のエージェントの移動先を決定する業務管理部と、エージェントが存在するエリアの地図情報を管理する地図情報管理部と、エージェントの個体情報を管理するエージェント情報管理部と、地図情報管理部とエージェント情報管理部の情報に基づいて、各エージェントを業務管理部が決定した移動先に移動させるための経路計画を生成する経路計画計算部と、各エージェントについて、位置が目標位置に近づくほど高い評価を行う主目的達成評価部と、各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れている状態が継続すると低い評価を行う主目的達成補助部と、各エージェントについて、エージェント間の距離が、エージェント情報管理部にて各エージェントに応じて設定される所定の値に近づくほど低い評価を行うエージェント間距離評価部と、を備え、経路計画計算部は、各時刻において、主目的達成評価部、主目的達成補助部、およびエージェント間距離評価部で算出される評価値の総合結果が、以前の評価値よりも向上するように前記経路計画を生成し、さらに、経路計画計算部で算出した経路計画を、全エージェントに伝達する行動計画伝達部を備えることを特徴とする経路計画装置。」とする。
 また本発明においては、「複数のエージェントの移動先と、エージェントが存在するエリアの地図情報と、エージェントの個体情報に基づいて、各エージェントを移動先に移動させるための経路計画を生成し、各エージェントについて、位置が目標位置に近づくほど高い評価を行う第1の評価と、各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れている状態が継続すると低い評価を行う第2の評価と、各エージェントについて、エージェント間の距離が、各エージェントに応じて設定される所定の値に近づくほど低い評価を行う第3の評価を求め、各時刻において、第1の評価、第2の評価、および第3の評価による総合結果が、以前の評価値よりも向上するように経路計画を生成し、全エージェントに伝達することを計算機により実現することを特徴とする経路計画方法。」とする。
 また本発明においては、「経路計画装置が適用され、ビーコン及び、あるいは監視カメラによりエージェントの情報が入手されて、行動計画が前記エージェントに伝達される物流現場。」とする。
 また本発明においては、「経路計画装置が適用され、監視カメラによりエージェントの情報が入手されて、行動計画がデジタルサイネージに伝達される駐車場。」とする。
 本発明によれば、事前に精緻な地図情報を用意せずに、各エージェントが安全性や動作制約を考慮したうえで、デッドロックを生じない移動経路を生成できる。
 よって本発明の実施例によれば、エージェントの経路計画のエンジニアリングコストを大幅に抑制できる。また、個々のエージェントに対して移動計画をそれぞれ実行するのではなく、全エージェントの移動経路を同時に生成するため、全体最適化を実現できる。
本発明の実施例1に係る経路計画システムの全体構成例を示す機能ブロック図。 本発明の実施例1に係る経路計画装置1の機能例を示すブロック図。 エージェントの座標を示す図。 エージェントの座標を示す図。 エージェント間距離に関する評価関数の一例を示す図。 従来における評価関数の特性例を示す図。 エリア平面の位置例を示す図。 評価関数が大域最適以外の局所最適を持つ特性の場合を示す図。 円周上が局所最適解になる事例を示す図。 2台のロボットが相手ロボットの後側の目標地点qに移動する状況を示す図。 互いの偏差が一定になる円弧上に固定される動作を示す図。 (12)式の評価関数の特性例を示す図。 γiの与え方の一例を示す図。 (13)式の評価関数の特性例を示す図。 2次元平面におけるエージェント位置、走行軌道と目標地点rを示す図。 2次元平面におけるエージェント位置と目標地点の偏差の時間変化を示す図。 本発明の実施例2に係る制御システムの全体的な処理手順を示す図。 処理機能FC6に示した主目的達成補助評価部42の詳細なフローを示す図。 経路計画装置1の更新タイミングの一例を示す図。 スタック状態を初期状態として示した図。 速度低下時の状態を示す図。 総合評価の形状を示す図。 局所最適からの移動を示す図。 大域最適解の探索を示す図。 図6bのときの主目的達成評価部43の評価を示す図。 局所解を持たない形状の評価関数を示す図。 スタック回避の状況を示す図。 スタックが発生する偏差eb1にエージェントが接近した状態を示す図。 ペナルティが増加したときの総合評価値の形状を示す図。 スタック回避の状況を示す図。 作業員と自動化機械が混在する倉庫の例を示す図。 予測ステップk=5までに生成されるエージェントの経路の例を示す図。 自動化機械が衝突防止方向に経路変更されたことを示す図。 自動化機械が衝突防止のために停止することを示す図。 2台の自動化機械が互いの後方に目標位置を与えられた状況示す図。 2台の自動化機械が停止してしまう状況を示す図。 交差する通路を活用して接触を回避する経路が生成された状況示す図。 非自動化車両と自動化車両が混在する駐車場を示す図。 駐車場に従来技術を適用したときに発生し得る経路計画の例を示す図。 本発明を適用した場合に生成される経路計画の例を示す図。
 以下、本発明の実施例について、図面を参照して説明する。
 なお以下においては、実施例1で経路計画システムの全体構成例を、実施例2で経路計画の処理フローを、実施例3でスタック状態から脱出できる仕組みを、実施例4で物流現場への適用事例を、実施例5で駐車場への適用事例を説明する。
 図1は、本発明の実施例1に係る経路計画システムの全体構成例を示す機能ブロック図である。図1において、経路計画システム10は、経路計画装置1が、監視装置2及びエージェント3からの位置情報S1、S2を得て、エージェント3に行動計画情報S3を与えるものである。ここでは、説明を簡略化するために、エージェント3(ロボット、車両、人など移動するすべての対象を含む)が1台(1人)しかいない場合を示すが、エージェントの数が増えたとしても基本的な構成は変わらない。
 このうちエージェント3は、通信部31、自己位置取得部32、他者位置取得部33、経路追従部34を備える。なお、すべてのエージェントは、これらの機能を備えている。
ただしエージェント3が人である場合には、人の位置が何らかの手段(例えば監視装置2)により把握され、人に対して行動計画を伝達できることが満たされていればよい。
 つまり、エージェント3が移動ロボットであり、かつ、移動ロボットがLiDAR(Light etection nd anging)などの環境情報を取得するセンサを備えており、さらに、これらのセンサ情報を利用したSLAM(imultaneous ocalization nd apping)によって自己位置を算出する場合、点群情報として他のエージェント3の位置情報を取得することもできる。このような場合は、自己位置取得部32と他者位置取得部33を同時に実行することができる。
 一方、エージェント3が作業員の場合、エージェント自身は特定の機能を備えることはできない。ただし、作業員がWifiやBluetoohなどの無線通信機能を有するタブレットを保有していれば、通信部31、自己位置取得部32の機能を代替できる。また、作業員がタブレットに示された移動指示に従えば、経路追従部34の機能が代替されていると言える。ただし、タブレットには他のエージェント3の位置情報を取得する機能がないため、作業員は他者位置取得部33を有さないエージェント3として扱われる。
 エージェント3が移動ロボットの場合、経路計画装置1内の行動計画伝達部15から配信された行動計画(経路計画)についての指令値S3を通信部31で受信し、受信した経路計画に従うように経路追従部34で各アクチュエータ(モータなど)を制御する。また、LiDAR-SLAMによって取得した位置情報(自己位置や他者位置)S2を通信部31から経路計画装置1内のエージェント情報管理部13へと送信する。なお、LiDAR-SLAMを利用する場合、管理エリアの地図情報も取得できるため、倉庫のレイアウト変更など地図情報に変更があった場合、この情報を地図情報管理部12へ送信してもよい。
 なお、エリア内のエージェント3の位置情報S1は、エリア内に備えられた監視装置2内のエージェント位置取得部22(監視カメラやビーコンなど)で取得し、監視装置2に備えられた通信部21を介して、経路計画装置1内のエージェント情報管理部13に渡してもよい。
 図2は、本発明の実施例1に係る経路計画装置1の機能例を示すブロック図である。図2において、経路計画装置1は、管理対象エリア(例えば、倉庫や駐車場)内のすべてのエージェント3(ロボット、車両、人など移動するすべての対象を含む)の位置やIDなどを管理するエージェント情報管理部13から得られるエージェント情報S6、管理対象エリアにおけるエージェントの業務内容(移動先)を管理する業務管理部11から得られる業務情報S4、管理対象エリアの地図情報を管理する地図情報管理部12から得られる地図情報S5を入力情報として、各エージェント3に対する移動経路を経路計画部14で算出する。経路計画部14で算出した経路計画S3は行動計画伝達部15により、管理対象エリアにいるエージェント3に送信される。
 なおエージェント情報管理部13、業務管理部11、地図情報管理部12から得られる情報S6、S4、S5によれば、各エージェント3が、現時点で管理対象エリア内のどの位置に存在していて、どこの場所に行って、何をするのかが過去及び将来における行動として、時系列的に把握されていることになる。
 経路計画部14は、主目的達成評価部43、エージェント間距離評価部41、主目的達成補助部42、経路計画計算部44から構成されて、経路計画計算部44の出力を行動計画情報S3とする。
 なお図2における経路計画部14の構成に関して、主目的達成評価部43、エージェント間距離評価部41、経路計画計算部44は、従来から備えられている機能であるが、本発明ではこれに対して主目的達成補助部42の機能を追加したものということができる。
基本的には、従来構成である主目的達成評価部43とエージェント間距離評価部41と経路計画計算部44の機能により経路計画が可能であるが、この経路計画によりロボットが動作できなくなる状態(固着状態:スタック、デッドロック)に陥った場合に、主目的達成補助部42の機能により固着状態から脱出するものである。
 まず、従来部分の機能について説明する。主目的達成評価部43は、管理対象エリアにおけるエージェントの業務内容(移動先)を管理する業務管理部11から得られる業務情報S4と、管理対象エリアの地図情報を管理する地図情報管理部12から得られる地図情報S5を入力情報としている。これらの情報により、主目的達成評価部43では、各エージェント3が達成すべき業務、つまり、特定位置(目標地点)への移動を達成するために利用される評価値の算出を行う。
 主目的達成評価部43の処理の考え方について図3aと図3bを用いて説明する。これらの図は、X-Y座標で示される管理対象エリア内におけるエージェント3の現在位置を表している。
 i番目のエージェント3が移動ロボットであるときに、図3aのように自身の位置(x,y)及び姿勢θから構成される位置ベクトルをpで定義すると、目標位置r=(rx,ry,rθ)への移動は自身の位置ベクトルpと目標位置rの偏差eを、例えば(1)式を用いて0に近づけることが経路計画の目標になる。
Figure JPOXMLDOC01-appb-M000001
 なお、図3aの移動ロボットの運動方程式は(2)式で与えることができる。ここで、viはエージェントiの移動速度、ωiはエージェントiの角速度であり、制御入力は(v,ω)の2入力で与えることができる。
Figure JPOXMLDOC01-appb-M000002
 一方、図3bのように、エージェント3がオムニホイールで駆動されるロボットや作業員(人間)の場合、X、Y方向に自在に移動できるため、運動方程式は(3)式に従うことになる。この場合、制御入力が(vx,vy,ω)の3入力になる。
Figure JPOXMLDOC01-appb-M000003
 なおエージェント3を早く動かす方が移動効率は良いが、一方でエネルギ消費量も増加してしまう。各時刻のエネルギ消費は、エージェントの速度や角速度の関数として(4)式で与えることができる。
Figure JPOXMLDOC01-appb-M000004
 よって、エネルギ消費量を抑制しながら、エージェント3が目標値に到達するには、(5)式のように、自身の位置pと目標地点rの偏差eとエネルギ消費量Eから構成される評価値を利用することが望ましい。
Figure JPOXMLDOC01-appb-M000005
 ここで、kは時刻を意味し、k0は評価開始時刻、kNは評価終了時刻である。αは偏差に関する重みであり、βは消費エネルギに関する重みである。αとβのバランスを調整することでエージェント3の行動を調整できる。例えば、αに比べてβを大きくすると消費エネルギを抑制する、省エネモードの動作を実現できる。一方、βを0にすると、消費エネルギを考慮しないで最も早く移動する経路を計算することになる。
 (5)式をN台の全エージェント3について、考慮した(6)式を評価することが主目的達成評価部43の機能となる。
Figure JPOXMLDOC01-appb-M000006
 次に、同じく従来部分の機能である図2のエージェント間距離評価部41について説明する。エージェント間距離評価部41は、管理対象エリア内のすべてのエージェント3の位置やIDなどを管理するエージェント情報管理部13から得られるエージェント情報S6と、管理対象エリアの地図情報を管理する地図情報管理部12から得られる地図情報S5を入力情報としている。これらの情報により、エージェント間距離評価部41は、各エージェントが接触すること防止するために、エージェント情報管理部13から受け取った各エージェント間の距離が所定以上になるように主目的達成評価部43の評価値を補正する機能を有する。
 位置ベクトルPiのエージェントiと位置ベクトルPjのエージェントjの距離dijは(7)式で算出することができる。この距離dijがエージェントごとに与えられる余裕距離da以上になる、つまり、(8)式を満足するように経路計画を実行する。
Figure JPOXMLDOC01-appb-M000007
Figure JPOXMLDOC01-appb-M000008
 (8)式を実現するには、後述の経路計画計算部44の最適化計算における拘束条件として組み込んでもよい。また、(9)式のような評価関数を導入してもよい。(9)式のεはゼロ割を回避するための微小係数である。
Figure JPOXMLDOC01-appb-M000009
 なお、(9)式は(9a)式と(9b)式を含んでいる。(9a)式は特定の時刻のみの評価であり、(9b)式はモデル予測制御の考えに従って評価時刻の予測期間k=k0からkNまでの全ての評価を示す。
 説明の簡略化のため、特定の一時刻の評価である(9a)式に注目する。図4は、(9a)式の評価関数を示す図であり、横軸にエージェント間の距離dij、縦軸に評価関数の大きさを示している。ここでは、(9a)式の評価関数は図4のような形状になるため、エージェント間の距離dijが余裕距離daに近づくほど、大きな値をとる。つまり、エージェント間の距離が近づくほどに大きな罰則(ペナルティ)を与えることによって、各エージェント3の接触を防止することができる。
 次にエージェント間距離評価部41の特徴点について説明する。ここで、余裕距離daはエージェント情報管理部13が保有しているエージェント情報S6に従って変更することが望ましい。
Figure JPOXMLDOC01-appb-T000010
 表1は接触安全性に注目して設計された余裕距離daの一例である。エージェント種別(作業員、低速機械、高速機械)ごとの接触を想定している。作業員は移動速度も遅く、作業員同士であれば接触しても事故になる可能性が低いため、エージェントの余裕距離daは30cmになる。一方、高速機械(フォークリフトなど)が人と接触すると重大な事故になりえるため、余裕距離daは100cmとする。ほかの組み合わせも同様の指針で設計される。
Figure JPOXMLDOC01-appb-T000011
 表2は表1に加えて、感染症予防の観点を追加した余裕距離daの設計例である。ここでもエージェント種別(作業員、低速機械、高速機械)ごとの接触を想定している。人と機械であれば、飛沫感染の可能性は少ないため、余裕距離daは表1と同様である。一方で、人同士がすれ違うと飛沫感染の可能性が高まるため、余裕距離daを大きくとることでソーシャルディスタンスを確保することが望ましい。表1、表2ともに余裕距離daはエージェントの特性のみで決まるのではなく、エリアの通路幅などにも依存することになる。
 なお、地図情報管理部13から受け取った地図情報S5における障害物(壁や柱など)を仮想的なエージェントとして扱い、各エージェントと障害物の距離diを(9)式と同様の形式で評価すれば障害物との接触回避も実現できる。もしくは、障害物情報をコストマップCに保存しておき、コストマップにおける各エージェントの位置piを評価するように(10)式を利用してもよい。
Figure JPOXMLDOC01-appb-M000012
 以上が、従来の経路計画装置における制御であり、主目的達成評価部43とエージェント間距離評価部41と経路計画計算部44の機能により経路計画が可能であるが、この経路計画によりロボットが動作できなくなる状態(固着状態:スタック、デッドロック)に陥った場合に、固着状態から脱出することができないものであった。固着状態から脱出できないことについて、図5a,図5b,図5c,図5d,図6a,図6bを用いて説明する。
 たとえば、特許文献1では、m台目のロボットの現在位置をpm、目標位置をqmとして、その偏差をem=pm-qmで与え、(11)式のような評価関数を設計している。
Figure JPOXMLDOC01-appb-M000013
 ここで、ロボットが1台しか存在せず(m=1の場合)、かつ、障害物が存在しない場合、評価関数は図5aのような形状(横軸:偏差、縦軸:評価関数)になるため、評価関数を最小化するように制御入力を算出すれば、偏差eが0になる(ロボットが目標値に到達する)状態を達成できる。
 ただし、図5bのエリア平面に示すように、ロボットの現在位置p1と目標地点q1の間に障害物が存在する場合には、前述のような動作を実現することができなくなる。図5bの場合、(11)式を小さくするには、Y軸を正方向に移動する動作が選択されることになる。しかし、Y軸正方向に移動すると障害物があり、それ以上、目標地点q1に接近することができなくなってしまう。
 このような状態から抜け出すには、Y軸負方向に移動する必要があるが、自身の位置p1と目標地点q1との偏差e1が増加するため、評価関数の値が増加してしまう。よって、制御入力は特許文献1の手法では算出できない。このような状況は図5cに示すように、評価関数が大域最適以外の局所最適を持つ場合に発生する。
 同じような状況は障害物(通路)の反対側に目標地点q1がある場合には必ず発生する。例えば、図5dのような状況でロボットがX軸正方向に移動していると、目標地点q1との偏差e1が特定の距離になる円周上が局所最適解になる。この地点よりもX軸正方向に移動するにはY軸負方向への移動を伴う円弧運動をとらない限り評価関数が増加する。
円弧運動を行ってB地点にたどり着いても障害物があるため、ロボットはそれ以上進むことができなくなってしまう。
 前述のとおり、特許文献1の手法では、ロボットが1台しかいない環境でもロボットが目標地点に到達できない可能性がある。ロボットが複数台になると、さらにロボットが目標地点に到達することが困難になる。
 例えば、図6aのように2台のロボットがそれぞれ相手ロボットの後ろ側にある目標地点qに移動する状況を考える。仮に、丸いロボット(m=1)がY軸負方向に移動して、四角いロボット(m=2)が通過するのを待つ、もしくは迂回する動作(図中、迂回ルートを生成)を実現できれば、2台のロボットはそれぞれ目標地点qに到達できる。
 しかし、そのような動作は丸いロボットの偏差e1を増加させない限り生成されない。
偏差emを減少するようにして実現される動作は図6bに示すように互いのロボットが前進し、衝突回避のために設定された距離d離れた状態で、互いの偏差emが一定になる円弧上に固定される動作である。
 このように、従来においては(6)式でβ=0とした評価関数((11)式)を最小化するように制御入力(vi,ωi)を算出し、その結果を利用すると経路を算出しようとすると、局所最適に陥り、エージェントが移動できなくなってしまう状況がある。
 ここで、局所最適に陥り、エージェントが移動できなくなってしまう状況について、さらに検討すると、いくつかのパターンに整理することができる。このことから本発明では、各パターンに対応した対応策を提案する。
 本発明の主目的達成補助部42は、このような状況を解消し、各エージェントが目標地点rに到達することを補助するために導入される。まず、各エージェントがデッドロックになってしまうという状況は、エージェントの移動速度が0(ゼロ)になる、と言い換えることができる。本発明が想定する第1のパターンがこれである。
 主目的達成補助部42では、この第1のパターンの状況を回避するために、(12)式の評価関数を導入する。なお(12)式は(12a)式と(12b)式を含んでいる。(12a)式は特定の時刻のみの評価であり、(12b)式はモデル予測制御の考えに従って評価時刻の予測期間k=k0からkNまでの全ての評価を示す。以降の説明は、(12a)式を使用して行うものとする。
Figure JPOXMLDOC01-appb-M000014
 (12a)式は図7aのような形状(横軸:v ,縦軸:評価関数の大きさ)になるため、各エージェントの移動速度viが0(ゼロ)に近づくほど、大きな罰則を与えることになる。このような関数を評価関数に加えることによって、エージェントが停止状態を解消するような動作が生成される。
 より具体的には、自己位置pと目標地点rとの偏差eが増えても、移動速度viが0(ゼロ)になるよりは合計の評価関数が低くなる。結果、図5b、図6a,図6bのような状況で、エージェントは迂回するような挙動を実現することができる。同様に、図5dのような状況も解消することができる。
 なお、速度viが0(ゼロ)になるときにペナルティを与えると、エージェントが目標地点rに到達しても停止することができなくなってしまう。これを回避するために図7b(横軸:e,縦軸: γi)に示すように、エージェント位置qと目標地点rの偏差eiが所定値eth以下になったらγi=0とするように変更する。γi=0であれば、速度viが0(ゼロ)になってもペナルティは与えられないので、エージェントは目標地点に到達することができる。
 なお、図7bはγiの与え方の一例であり、偏差eiが0のときに、γi=0を満足していれば、どのような方法で設計してもよい。
 さらに、各エージェントがデッドロックになってしまうという状況は、エージェントが特定の位置paにとどまっている状態、と言い換えることができる。本発明が想定する第2のパターンがこれである。
 主目的達成補助部42では、この第2のパターンの状況を回避するために、(13)式の評価関数を導入する。なお(13)式は(13a)式と(13b)式を含んでいる。(13a)式は特定の時刻のみの評価であり、(13b)式はモデル予測制御の考えに従って評価時刻の予測期間k=k0からkNまでの全ての評価を示す。以降の説明は、(13a)式を使用して行うものとする。
 (13a)式は図8のような形状(横軸:(Pa-Pi),縦軸:評価関数の大きさ)になるため、各エージェントの位置piがpaに近づくほど、大きな罰則を与えることになる。このような関数を評価関数に加えることによって、エージェントが停止状態を解消するような動作が生成される。
Figure JPOXMLDOC01-appb-M000015
 なお特定の位置paは、事前にデッドロックを生じることが予測できる地図形状であれば、地図情報管理部12に記録しておくことが望ましい。
 また、エージェント情報管理部13で取得した各エージェントの位置piが一定時間変化しない場合、そのエージェントの位置piを前述の特定位置paとして設定してもよい。このような方法を採用すると、pa=piが設定されたタイミングで大きなペナルティが課されるため、i番目のエージェントがすぐに動き出すことが期待される。エージェントが移動し始めたら、設定したpaを解除することが望ましい。
 また、各エージェントが停止状態になっていないが、目標地点に到達できない状況も考えられる。例えば、図9aに示すように、エージェント3が目標地点と一定距離以上離れたまま円周上動作を一定速度で走行する状況がこのような状況に相当する。本発明が想定する第3のパターンがこれである。
 図9aは、2次元平面におけるi番目のエージェントの位置Pi、および走行軌道と目標地点rを示しており、図9bはi番目のエージェントの位置Piと目標地点の偏差の時間変化を示している。このとき、、エージェント3は、目標地点riと一定距離以上離れたまま,円周上(偏差の最小値min ei、偏差の最大値max ei)で、動作を一定速度で走行している。
 図9aの状況では、エージェントが一定速度で動作しているため、(12)式でペナルティを与えることは難しい。また、エージェントが特定位置に留まっているわけではないので、(13)式でペナルティを与えることも難しい。
 各エージェントが停止状態、もしくは、図9aのような状況は、所定時間内に確認された偏差eiの最小値min eiが更新されない状況と言い換えることができる。このような状況を解消するために、(14)式に示すように、各エージェントの偏差eiの積分値を評価するペナルティを導入する。図7のように円軌道で走行していると、時間が経過するほど偏差の積分値が大きくなるため、円軌道を逸脱する動作が選択されやすくなる。
Figure JPOXMLDOC01-appb-M000016
 (14)式は、偏差eiを評価するという点では、(6)式において、β=0とした評価関数に類似するが、(6)式は「kN-k0」分の時間の偏差の累積値しか評価しないことに違いがある。たとえば、図9bの時刻taから時刻tbが「kN-k0」に相当すると(6)式の評価値は減少しているため、適切な動作が生成されていると判断される。
一方、(14)式は偏差eiが0でない限り増加するため、より長期的に評価が実現できる。
 なお、(14)式を利用すると過去の偏差eiがすべて影響するため、最小値min eiが更新されるたびに積分をリセットすることと、重みηiをゼロにする操作を加えることが望ましい。
 以上のように、主目的達成補助部42は、上記に示したパターンに対応する複数の対策手法を備えることで、脱出機能を実現することができる。主目的達成補助部42は以上のいずれの方法の少なくとも1つ備えていれば良い。当然、前述の3つの手法すべてを備えていても良い。
 図2に戻り、経路計画計算部44は、主目的達成評価部43、エージェント間距離評価部41、主目的達成補助部42の、それぞれで設定した評価関数を統合し、その評価関数の値を最小化するように制御入力uを算出する。
 具体的には、各要素で設定した評価関数JIを、重み係数αIを利用して統合した評価関数((15)式)を最小化するように制御入力uを算出する。なお、主目的達成補助部42のうち、特定の手法を無効化する場合は、対応する重み係数αI(I=4、5、6)を0(ゼロ)にすればよい。
Figure JPOXMLDOC01-appb-M000017
 制御入力uの算出方法自体は、よく知られたモデル予測制御の考えに従っており、特段の工夫はないため、説明は省略する。
 各時刻で最適な制御入力uが求まれば、対応する運動方程式((2)式、(3)式)を利用して位置(x、y)と方位(θ)の時系列データを容易に生成できる。この時系列データが各エージェントに対する経路計画になる。この経路計画自体は特許文献1と同様であり、広く知られた手法であるため、具体的な説明は省略する。
 また経路計画計算部44は、パターンを判別して特定の対策手法を実行するものとしてもよく、或は複数の対策手法を順次実行していずれかにより解消するのを待つことにしてもよい。
 算出された経路計画は行動計画伝達部15を介して、各エージェントに配信される。
 実施例1では、経路計画システムの全体構成例を説明した。実施例2では、経路計画システムにおける処理フローについて説明する。
 本発明の実施例2に係る制御システムの全体的な処理手順を図10のフローチャートを用いて説明する。
 まず、処理機能FC1からFC3で経路計画装置1の計算に必要な情報を取得する。処理機能FC1では、エリア内のエージェントの位置情報S6を取得する。この機能は、エージェント情報管理部13に相当する。処理機能FC2では、エリア内の各エージェントに与える業務内容S4(移動すべき目標地点ri)を取得する。この機能は、業務管理部11に相当する。処理機能FC3では、エリア内の地図情報S5を取得する。この機能は、地図情報管理部12に相当する。なお地図情報S5は業務内容やエージェントの位置情報に比べて、更新頻度が遅いため、必ず毎ステップで更新する必要はない。なお、処理機能FC1から処理機能FC3の処理順番はどのような順番でも良く、処理機能FC4以降に遷移する前にすべての情報がそろっていることが重要である。
 処理機能FC4では、処理機能FC1と処理機能FC2で取得した各エージェントの位置S6、業務内容S4に従って、各エージェントが目標地点に移動するための評価を行う。この機能は、主目的達成評価部43に相当する。
 処理機能FC5では、処理機能FC1と処理機能FC3で取得した各エージェントの位置S6、および、地図情報S5を利用して、各エージェントが障害物や他のエージェントにも接触しないように行動するための評価を行う。この機能は、エージェント間距離評価部41に該当する。
 処理機能FC6では、処理機能FC1から処理機能FC3で取得した各情報S4,S5,S6を利用して、各エージェントが目標地点に移動する過程で停止してしまう状況を解消するための評価を行う。この機能は主目的達成補助部42に該当する。
 処理機能FC4から処理機能FC6も処理順番はどのような順番でも良く、処理機能FC7以降に遷移する前にすべての情報がそろっていることが重要である。上述のとおり、モデル予測制御の考えを利用する場合、処理機能FC4から処理機能FC6は初期時刻k0から予測ステップ分(kN-k0)先までの値を評価することになる。
 処理機能FC7では、処理機能FC4から処理機能FC6で算出した評価関数を最小化するように各エージェントの制御入力を算出し、その入力を積分することで移動経路を算出する。この機能は、行動計画計算部44に相当する。
 処理機能FC7で経路計画が生成されたら、処理機能FC8に遷移する。
 処理機能FC8では、処理機能FC7で生成された経路計画を各エージェントに配信する。この機能は行動計画伝達部15に相当する。
 処理機能FC6に示した主目的達成補助評価部42の実施例に関して、より詳細なフローチャートを、図11を用いて説明する。
 図11の主目的達成補助評価部42の最初の処理機能FC61では、主目的達成補助評価部42におけるパターン1に対する第1の実現手段である目標地点以外の箇所での減速にペナルティを与える機能を有効にするかを判断する。本機能が有効である場合(YES)は処理機能FC62に遷移し、無効である場合(NO)は処理機能FC63に遷移する。
 第1の実現手段を有効にするか否かは、ユーザ(エリア管理者)の設定で切り替えても良い。さらに、ユーザが第1の実現手段を有効にすると判断した状態でも、エージェント3が目標地点の近くにいるのであれば、本機能は無効になる。
 処理機能FC62に遷移したとき、ここでは(12)式に従って、目的地点以外での停止(減速)に対するペナルティ値を算出する。
 処理機能FC63に遷移したとき、ここでは主目的達成補助評価部42におけるパターン2に対する第2の実現手段である目標地点以外の特定位置paに留まることにペナルティを与える機能を有効にするかを判断する。本機能が有効である場合(YES)は処理機能FC64に遷移し、無効である場合(NO)は処理機能FC67に遷移する。
 第2の実現手段を有効にするか否かは、ユーザの設定で切り替えても良い。さらに、ユーザが第2の実現手段を有効にすると判断した状態でも、エージェントが停止していないのあれば、本機能を無効にしても良い。
 処理機能FC64では、i番目のエージェントが停止している位置piをペナルティ計算のための特定位置paとして与える。なお、地図形状からエージェントが停止することが事前に予測できる場合は、その位置をpaとして事前に設定する処理で代替しても良い。
 処理機能FC65に遷移すると、(13)式に従って、目的地点以外の特定位置paでの停止に対するペナルティ値を算出する。
 処理機能FC66では、主目的達成補助評価部42におけるパターン3に対する第3の実現手段であるエージェント位置と目標地点の偏差の積分を利用してペナルティを与える機能を有効にするかを判断する。本機能が有効である場合(YES)は処理機能FC67に遷移し、無効である場合(NO)は処理機能FC60に遷移する。
 第3の実現手段を有効にするか否かは、ユーザの設定で切り替えても良いが、第1、2の実現手段をユーザが無効にした場合は、自動的に有効にすることが望ましい。なお、後述の具体的な実施形態に示す通り、エージェントが作業員の場合、デッドロック(立ち往生)するような状況は作業員自身で解消できるため、そのような場合に限り、第1から第3の実現手段をすべて無効にしても良い。
 処理機能FC67に遷移すると、特定時間のエージェント位置と目標地点の偏差の変化量を分析する。処理機能FC68では、処理機能FC67で取得した偏差の最小値が変化していれば(YES)、処理機能FC69bに遷移する。一方、処理機能FC67で取得した偏差の最小値が変化していない場合(NO)は処理機能FC69aに遷移する。
 FC69aでは、(14)式に従って、偏差eiの積分値を利用したペナルティを算出する。処理機能FC69bでは、偏差eiの積分値をリセットする操作を行う。処理機能FC69aに遷移した時のみに、積分値を計算する処理を実施している場合は、処理機能FC69bの処理は行わなくても良い。
 処理機能FC60では、処理機能FC62、FC65、FC69aで計算したそれぞれのペナルティを加算することでペナルティを統合する。処理機能FC62、FC65、FC69aのうち計算が実施されなかった値は0(ゼロ)で代替する。
 次に、経路計画装置1の更新タイミングの一例を、図12を用いて説明する。本例は、エージェント数がN=3の時(3A,3B,3C)を考えているが、エージェント数が増えた場合であっても同様の処理を行うことができる。
 まず、経路計画装置1が動き出す時刻t0では、すべてのエージェントが停止していることを想定する。経路計画装置1は、各エージェント3の位置情報などを入力として受け付けると、経路計画の計算を行い、各エージェント3に対する経路計画を順次配信する。
 最初の経路が時刻t1に配信されると、各エージェントが目標地点に移動を開始する。
エージェント3ごとに目標地点rまでの移動距離も移動速度も異なるため、移動時間は一致していないことが多い。
 このうちエージェント3Aについてみると、時刻t2で目標地点に到達し、到達を検知した経路計画装置1はエージェント1に対して、新しい目標地点を付与して再度経路計画を行う。再度の経路計画は、入力、計算、出力の順序で実行され、時刻t3においてエージェント3Aに対する再経路計画が送信可能となる。
 この経路計画の計算時点(t2-t3間)では、エージェント3B、エージェント3Cは既に経路を与えられているため、エージェント3Aのみの経路計画としても良い。ただし、全エージェントの経路計画を行う方が、全体最適化になるため、エリア全体としてはより良い行動計画が実現できる。
 経路計画の計算が完了すると、時刻t3で各エージェントに新しい経路計画が与えられる。以降、各エージェントが目標地点に到達するごとに同様の処理が実行される。
 ただし、例えば、倉庫内で荷崩れが起きて特定の通路が通行不可になったなど、経路計画の再実施が必要になった場合には、どのエージェントも目標地点に到達していない時刻t4に割り込み処理を行っても良い。
 実施例3では、上記した実施例の手法によりスタック状態から脱出できる仕組みについて時系列をもって説明する。
 まず、エージェント3が1台でスタックが発生する図5bのケースを想定する。なお、説明を簡単にするため、エージェント間距離評価部41、主目標達成補助部42がなく、主目的達成評価部43のみであるとする。このときは評価関数の形状が、図5cのようになる。このため、経路計画計算部44は総合評価を向上する(評価関数の値を小さくする)ために、偏差eを小さくするようにエージェントをy軸正方向に移動させる。
 図13aは、図5bと図5cを併記して、スタック状態を初期状態として示した図である。この特性では、大域最適に移行すべきところ、局所最適に陥っている。この時、図13aに示すように、評価関数の値はf1からf2へと減少する(総合評価は向上する)。
その後、エージェントと目標位置の間には壁があるため、それ以上エージェントは移動できなくなる。この状態からエージェントが引き返す動作(y軸負方向への移動)をとると偏差eが増加するため、評価関数の値はf2よりも増加、つまり、総合評価が低下することになる。経路計画計算部44は総合評価を向上する経路を算出する機能であるため、このような総合評価が低下する行動は算出できない。よって、エージェントは停止し続けることになる。
 つぎに、主目標達成補助部42を追加した場合の動作を説明する。ここでは、エージェントは移動速度に注目した主目標達成補助部42((12)式、図7a)が採用された場合について説明する。主目標達成補助部42を追加した場合、図13aのようにエージェントが壁に近づこうとして減速を開始すると、図7aに示した関数によって急速にペナルティ(罰則)が増加する。つまり、速度が低下するにつれて図13bに示すように、主目標達成補助部42の出力が増加する。結果として、主目標達成評価部43と主目標達成補助部42の和である総合評価が図13cに示すような形状になる。つまり、エージェントが偏差eを小さくするための移動、および、壁への接近による減速に伴って、総合評価値がf1からf3へと増加(評価が低下)する結果になる。
 主目的達成評価部43のみの場合、偏差eがea1のときの図13aのように局所最適解に陥っていたのに対して、主目標達成補助部42を追加すると、偏差がea1のときは図13cに示す通り、局所最適解でなくなる。これによって、図13dに示すように、経路計画計算部44は偏差eを小さくしながら、総合評価値を改善する解を探索することができるようになる。エージェントの速度が一定以上になると、主目標達成補助部42によるペナルティの影響はなくなるが、図13dのように偏差eがea2を下回る状況になれば、局所解に陥ることなく、図13eに示すように、経路計画計算部44は偏差eが0になる大域最適解を探索することができる。
 次に、エージェント3が2台でスタックが発生する図6bのケースを想定する。図6bに示す状況の各エージェントの主目的達成評価部43の評価を図14aに示す。図6bの状態では、位置p1のエージェント3が迂回して目的地点へ移動する状況なので、図14aのように局所解を有する形状の評価関数になる。
 一方、位置p2のエージェント3は直進のみで目標地点へ移動する状況なので図14bのように、エージェント単独では局所解を持たない形状の評価関数になる。ただし、経路計画計算部44は個別のエージェントの挙動を最適化するものではなく、全エージェントの行動を最適化するものであるため、総合評価値は図14aと図14bを足し合した図14cのような形状の評価関数の最適化を実施することになる。図14cの評価関数は、合計の偏差eがeb1に局所解が存在する。この局所解に陥った状況が図6bに示すお互いのエージェントが所定距離d離れた状況から移動できない状況に相当する。
 これに対し、図15aに示すように、スタックが発生する偏差eb1に各エージェントが接近すると、各エージェントの速度が低下するため、主目標達成補助部42により、ペナルティが増加する。ペナルティが増加することにより、経路計画計算部44で利用する総合評価値の形状は図15bのように変化し、偏差eb1の値は局所解でなくなる。よって、図15cに示すように、もともとの局所解(eb1)で全エージェントがスタックしてしまう状況を回避することができる。
 実施例4では、本発明を工場、物流現場に適用することについて説明する。図16は、エージェント3である作業員3Bと自動化機械(フォークリフト)3Aが混在する倉庫100を簡易的に表記した図である。図はわかりやすさを優先して作業員3Bも自動化機械3Aも1台しか表記していないが、作業員、自動化機械ともに複数台いる環境でもよいし、自動化させていない通常の機械が混在していても良い。
 作業員3Bは図示しないスマートデバイスを装着、もしくは、保持している。スマートデバイスは、タブレット端末でも良いし、ゴーグルのように装着可能なモノであっても良い。スマートデバイスは、タブレット端末のモニタもしくはゴーグル内に目標地点への経路を表示することで作業員3Bに移動先を通知、誘導することができる。
 スマートデバイスは倉庫エリア100内に配置されたビーコン103と無線通信を行うことで、スマートデバイスを装着、もしくは保有している作業員3Bの位置を計測することができる。また、スマートデバイスは通信機能を有しており、管制サーバ104と通信することができる。また倉庫エリア100内に配置された監視カメラ101により、エリア内の様子が把握されている。
 管制サーバ104が本発明の経路計画装置1に相当する。なお、経路計画装置1の機能が同一のサーバで実施されなくても良い。例えば、処理負荷の高い経路計画計画部44のみを特定のサーバで実行する形態にしても良い。また、管制サーバ104は必ずしも倉庫100内に設置されている必要はない。
 自動化機械3Aには図示しないLiDARが搭載されている。LiDARで収集した点群データを処理することで自動化機械は倉庫地図の作成と自己位置推定を同時に実行するSLAMの機能が実装されている。さらに、自動化機械3Aには図示しないコントローラが搭載されており、自動運転に関する各種演算が実行される。
 自動化機械3Aのコントローラは通信機能を備えており、SLAMで取得した自己位置、および、地図情報を管制サーバ104に送信するとともに、管制サーバ104から経路計画を受信する。コントローラは移動計画に従うように自動化機械3Aのアクチュエータ(ステアリングモータ、走行モータなど)を制御する。作業員3Bや自動化機械3Aが本発明におけるエージェント3に相当する。
 また、倉庫内に配置された監視カメラ101が本発明における図1の監視装置2に相当する。
 以下、図1の業務管理部11において作業員3Bに棚102Bの位置r1に物品を回収するように、また、自動化機械3Aに棚102Aの位置r2の物品を回収するように作業が設定された状況を想定する。
 経路計画装置1は、作業員3Bをエージェント1、自動化機械3Aをエージェント2として、それぞれが従うべき経路を算出する。
 まず、管制サーバ104は、作業員3Bが備えたスマートデバイスと自動化機械3Aのコントローラからそれぞれの現在位置p1、p2を受信する。この機能は本発明のエージェント情報管理部13に相当する。また、業務管理部11が定めた作業員3B、自動化機械3Aの目標地点をr1、r2とする。
 経路計画部14は作業員3Bを現在位置p1から目標地点r1に、自動化機械3Aを現在位置p2から目標地点r2に導くように経路計画を行う。まず、両エージェントの位置が十分に離れているときは主目的達成評価部43の評価値が支配的であるため、それぞれが最短ルートになるように経路が徐々に生成される。
 予測ステップk=5までに生成される各エージェントの経路の例を図17aに示す。図17aの経路の時点(k-5)から自動化機械3AがY軸負方向に移動する経路を引くと、時刻k=6で自動化機械3Aと作業員3Bが接触する可能性がある。
 このような状況になると、エージェント間距離評価部41によるペナルティが支配的になる。よって、図17bに示すように、自動化機械3Aは最短経路(Y軸負方向への移動)ではなく、衝突を防止するX軸負方向に移動する経路を生成するようになる。以降は接触の可能性がなくなるため、それぞれが最短ルートをたどるように経路を順次生成する。
 なお、主目的達成評価部43において(6)式のエネルギ消費量に関する重みβが大きく設定されている場合は、図17bのように自動化機械3Aを迂回させるルートを生成せず、図17cのように、時刻k=4でたどり着いた位置p2(4)で自動化機械3Aを待機させる動作も実現し得る。図17cでは、予測ステップk=4からk=7の間は、位置P2(4)に停止して移動しないことを表している。
 本発明を利用すれば、詳細な地図(ノード、エッジ情報)を事前に準備せずとも、評価関数の設計次第でさまざまな経路計画が自動的に実現されるため、エンジニアリングコストを大幅に抑制することができる。
 なお、図17cの動作は主目的達成補助部42の第1の実現手段によるペナルティ((12)式)の影響によっては実現することができない。ゆえに、エネルギ消費量を抑えることを重視する場合は、主目的達成補助部42の第1の実現手段を無効にして、第2、第3の実現手段によって、デッドロックの発生を防止することが望ましい。
 次に、従来技術(特許文献1)ではデッドロックが生じ得るような状況として2台の自動化機械3D(エージェント1)、3C(エージェント2)が互いの初期位置p1、p2の後方に目標位置r1、r2が与えられた図18aの状況を考える。
 従来技術では、前述の図6bと同様の図18bに示したようにそれぞれの自動化機械3C,3Dがある程度前進した位置(衝突しない距離)で停止してしまう。これは主目的達成評価部43とエージェント間距離評価部41しか有効でない状況で発生する固有の問題である。
 本発明を利用した場合も、最初は図18bのような状況になり、車両が接触しないように減速を始める。その後、主目的達成評価部43における偏差eを最小化しようとする評価指標(rをqと読み替えた(11)式)に比べて、主目的達成補助部42の第1の実現手段によるペナルティが増加すると、偏差eを増加させてでも移動する経路が生成される。つまり、図18cのように、交差する通路を活用して接触を回避する経路が生成される。
 以上のように、本発明を利用すれば、従来技術でデッドロックを生じる可能性がある状況でも、デッドロックを生じない経路を自動的に生成できる。ゆえに、デッドロック発生時のサービス員による遠隔操作も不要になるため、運用コストの抑制も期待できる。
 なお、作業員3Bは、自動化機械3Aと異なり、自身の意思で自由に動き回ることができるため、スマートデバイスに与えた経路指示に従わないことも予想される。
 作業員3Bが経路指示に従ない場合は、経路計画装置1は、その作業員3Bを制御可能なエージェントとして扱わず、接触してはいけない障害物として扱うことになる。
 経路指示に従わないことが確認され次第、経路計画装置1は割り込み処理(図12の時刻t4)によって、その作業員3Bを除外したエージェントの経路計画を実施する。
 なお、作業員3Bが再び経路指示に従う意思をスマートデバイスから送信した場合は、同様に、経路計画装置1は割り込み処理によって、その作業員3Bを含めた全エージェントの経路計画を実施する。
 実施例5では、本発明を駐車場における経路計画に適用した場合を説明する。
 図19は非自動化車両3Eと自動化車両3Fが混在する駐車場200を簡易的に表記した図である。図はわかりやすさを優先して非自動化車両3Eも自動化車両3Fも1台しか表記していないが、非自動化車両、自動化車両ともに複数台いる環境でもよいし、非自動化車両が存在しない状況でも良い。
 非自動化車両3Eはカーナビゲーションシステムを備えているため、GNSS(lobal avigation atellite ystem)を利用した自己位置取得機能や、通信機能を備えていることがあるが、これらの情報が本発明の経路計画システムと連携できるとは限らない。このため、駐車場環境における、非自動化車両3Eはエージェント3が備えるべき機能を自身で有していない状況になる。ただし、後述の構成により、非自動化車両3Eが備えるべき機能を代替することは可能である。
 自動化車両3FはGNSSやLiDARを利用した自己位置取得が可能である。また、自動化車両3Fには図示しないコントローラが搭載されており、自動運転に関する各種演算が実行される。さらに、コントローラには通信機能が備わっており、駐車場の運用を管理する管制サーバ104と通信を行い、管制サーバ104が伝達した経路計画に従って駐車場内を走行することが可能である。
 駐車場200には、監視カメラ101が各所に備えられており、駐車場内の車両の位置、および、空きスペースを監視している。監視カメラ101は本発明の監視装置2に相当する。よって、監視カメラ101が非自動化車両3Eの自己位置取得部22の代替機能となる。
 駐車場200には、デジタルサイネージ105が各所に備えられており、空きエリアへのルート案内を表示することができる。管制サーバ104が配信した経路計画をデジタルサイネージ105に表示することで、非自動化車両3Eを誘導することができる。なお前述の物流倉庫の例と同様に、管制サーバ104は必ずしも駐車場200内に設置されている必要はない。
 駐車場200では、各エージェントに割り付ける業務は空きスペースへの移動になる。
よって、業務管理部11は監視カメラ101で取得した空きスペースのうち、各エージェントの現在地から最も近い空きスペース、もしくは、施設入り口に最も近い空きスペースのいずれかを目的地点ri(i=1、…、N)として割り当てる機能を備える。
 経路計画装置1は各エージェントの現在位置p1、p2に対して、業務管理部11が算出した目的地点r1、r2へと移動させるための経路計画を算出する。
 図20aは駐車場に従来技術(特許文献1)を適用したときに発生し得る経路計画の例を示している。図5b、図5dに示した状況と同様に、各エージェントは障害物(壁や駐車している他車両)を挟んだ目標地点riへの最短距離位置(p1(6)とp2(2))でデッドロックしてしまう。
 図20bは同じ状況で本発明を適用した場合に生成される経路計画の例を示している。
図20aでデッドロックが発生する状況になると主目的達成補助部42が算出するペナルティの値が大きくなるため、最短距離位置(p1(6)とp2(2))から離れる制御入力を算出する このため、最短距離位置(p1(6)とp2(2))を一度離れた後に、徐々に目標地点r1、r2へと接近する経路を生成することが可能になる。
 物流倉庫の例と同様に、非自動化車両3Eは、自動化車両3Fと異なり、ドライバーの意思で自由に動き回ることができるため、デジタルサイネージ105に与えた経路指示に従わないことも予想される。
 非自動化車両3Eが経路指示に従ない場合は、経路計画装置1は、その非自動化車両3Eを制御可能なエージェントとして扱わず、接触してはいけない障害物として扱うことになる。経路指示に従わないことが確認され次第、経路計画装置1は割り込み処理(図12の時刻t4)によって、その非自動化車両3Eを除外したエージェントの経路計画を実施する。
 以上、物流倉庫と駐車場を例に本発明の実施形態を詳細に述べたが、本発明の適用先がこれらの場合に限定されないことは言うまでもない。たとえば、港湾における搬送車両の移動経路生成、テーマパーク内を移動するロボットの経路生成などにも活用できる。
1:経路計画装置、2:監視装置、3:エージェント、10:経路計画システム、11:業務管理部、12:地図情報管理部、13:エージェント情報管理部、14:経路計画部、15:行動計画伝達部、21:通信部、22:エージェント位置取得部、31:通信部、32:自己位置取得部、33:他者位置取得部、34:経路追従部、41:エージェント間距離評価部、42:主目的達成補助部、43:主目的達成評価部、44:経路計画計算部

Claims (9)

  1.  複数のエージェントの移動先を決定する業務管理部と、
     前記エージェントが存在するエリアの地図情報を管理する地図情報管理部と、
     前記エージェントの個体情報を管理するエージェント情報管理部と、
     前記地図情報管理部と前記エージェント情報管理部の情報に基づいて、各エージェントを前記業務管理部が決定した移動先に移動させるための経路計画を生成する経路計画計算部と、
     前記各エージェントについて、位置が目標位置に近づくほど高い評価を行う主目的達成評価部と、
     前記各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れている状態が継続すると低い評価を行う主目的達成補助部と、
     前記各エージェントについて、エージェント間の距離が、前記エージェント情報管理部にて各エージェントに応じて設定される所定の値に近づくほど低い評価を行うエージェント間距離評価部と、を備え、
     前記経路計画計算部は、各時刻において、前記主目的達成評価部、前記主目的達成補助部、および前記エージェント間距離評価部で算出される評価値の総合結果が、以前の評価値よりも向上するように前記経路計画を生成し、
     さらに、前記経路計画計算部で算出した経路計画を、全エージェントに伝達する行動計画伝達部を備えることを特徴とする経路計画装置。
  2.  請求項1に記載の経路計画装置であって、
     前記主目的達成補助部は、前記各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れているときに、移動速度が低くなるほど低い評価を行うことを特徴とする経路計画装置。
  3.  請求項1に記載の経路計画装置であって、
     前記主目的達成補助部は、前記各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れているときに、移動速度が低くなるほど低い評価を行い、かつ、または、各エージェントが地図情報管理部で設定された所定の位置に近づくほど低い評価を行うことを特徴とする経路計画装置。
  4.  請求項1に記載の経路計画装置であって、
     前記主目的達成補助部は、前記各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れているときに、移動速度が低くなるほど低い評価を行い、かつ、または、各エージェントが地図情報管理部で設定された所定の位置に近づくほど低い評価を行い、さらに、各エージェントの位置とそれぞれの目標値との偏差が所定時間の間に減少しない場合に低い評価を行うことを特徴とする経路計画装置。
  5.  複数、かつ、形状の異なるエージェントの移動先を決定する業務管理部と、
     前記エージェントが存在するエリアの地図情報を管理する地図情報管理部と、
     前記エージェントの個体情報を管理するエージェント情報管理部と、
     前記地図情報管理部と前記エージェント情報管理部の情報に基づいて、各エージェントを前記業務管理部が決定した移動先に移動させるための経路計画を生成する経路計画計算部と、
     前記各エージェントについて、位置が目標位置に近づくほど高い評価を行う主目的達成評価部と、
     前記各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れている状態が継続すると低い評価を行う主目的達成補助部と、
     前記各エージェントについて、エージェント間の距離が、前記エージェント情報管理部にて各エージェントの形態に応じて設定された所定の値に近づくほど低い評価を行うエージェント間距離評価部と、を備え、
     前記経路計画計算部は、各時刻において、前記主目的達成評価部、主目的達成補助部、および前記エージェント間距離評価部で算出される評価値の総合結果が、以前の評価値よりも向上するように前記経路計画を生成し、
     さらに、前記経路計画計算部で算出した経路計画を、全エージェントに伝達する行動計画伝達部を備えることを特徴とする経路計画装置。
  6.  人を含む異種、かつ、複数のエージェントの移動先を決定する業務管理部と、
     前記エージェントが存在するエリアの地図情報を管理する地図情報管理部と、
     前記エージェントの個体情報を管理するエージェント情報管理部と、
     前記地図情報管理部と前記エージェント情報管理部の情報に基づいて、各エージェントを前記業務管理部が決定した移動先に移動させるための経路計画を生成する経路計画計算部と、
     前記各エージェントについて、位置が目標位置に近づくほど高い評価を行う主目的達成評価部と、
     前記各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れている状態が継続すると低い評価を行う主目的達成補助部と、
     前記各エージェントについて、エージェント間の距離が、前記エージェント情報管理部にて各エージェントの形態に応じて設定された所定の値に近づくほど低い評価を行うエージェント間距離評価部と、を備え、
     前記経路計画計算部は、各時刻において、前記主目的達成評価部、主目的達成補助部、および前記エージェント間距離評価部で算出される評価値の総合結果が、以前の評価値よりも向上するように前記経路計画を生成し、
     さらに、前記経路計画計算部で算出した経路計画を、自律体には制御指令値として、人には推奨経路として伝達する行動計画伝達部を備えることを特徴とする経路計画装置。
  7.  複数のエージェントの移動先と、前記エージェントが存在するエリアの地図情報と、前記エージェントの個体情報に基づいて、各エージェントを移動先に移動させるための経路計画を生成し、
     前記各エージェントについて、位置が目標位置に近づくほど高い評価を行う第1の評価と、前記各エージェントについて、位置がそれぞれの目標位置から所定の距離以上離れている状態が継続すると低い評価を行う第2の評価と、前記各エージェントについて、エージェント間の距離が、各エージェントに応じて設定される所定の値に近づくほど低い評価を行う第3の評価を求め、
     各時刻において、前記第1の評価、前記第2の評価、および前記第3の評価による総合結果が、以前の評価値よりも向上するように前記経路計画を生成し、全エージェントに伝達することを計算機により実現することを特徴とする経路計画方法。
  8.  請求項1に記載の経路計画装置が適用され、ビーコン及び、あるいは監視カメラにより前記エージェントの情報が入手されて、行動計画が前記エージェントに伝達される物流現場。
  9.  請求項1に記載の経路計画装置が適用され、監視カメラにより前記エージェントの情報が入手されて、行動計画がデジタルサイネージに伝達される駐車場。
PCT/JP2023/000381 2022-02-18 2023-01-11 経路計画装置、その適用設備、並びに経路計画方法 WO2023157510A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2022023612A JP2023120649A (ja) 2022-02-18 2022-02-18 経路計画装置、その適用設備、並びに経路計画方法
JP2022-023612 2022-02-18

Publications (1)

Publication Number Publication Date
WO2023157510A1 true WO2023157510A1 (ja) 2023-08-24

Family

ID=87578080

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2023/000381 WO2023157510A1 (ja) 2022-02-18 2023-01-11 経路計画装置、その適用設備、並びに経路計画方法

Country Status (2)

Country Link
JP (1) JP2023120649A (ja)
WO (1) WO2023157510A1 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09133537A (ja) * 1995-11-08 1997-05-20 Toyota Motor Corp 交通情報表示装置
JP2007192562A (ja) * 2006-01-17 2007-08-02 Nissan Motor Co Ltd 車両用情報提供装置、車両用情報提供システム、および、車両用情報提供方法
WO2020144970A1 (ja) * 2019-01-11 2020-07-16 ソニー株式会社 行動計画装置、行動計画方法、及びプログラム
CN111665844A (zh) * 2020-06-23 2020-09-15 北京三快在线科技有限公司 一种路径规划方法及装置
JP2021077090A (ja) * 2019-11-08 2021-05-20 三菱重工業株式会社 複数のビークルの移動制御方法、移動制御装置、移動制御システム、プログラム及び記録媒体
JP2021081758A (ja) * 2018-03-15 2021-05-27 ソニーグループ株式会社 制御装置、制御方法及びプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09133537A (ja) * 1995-11-08 1997-05-20 Toyota Motor Corp 交通情報表示装置
JP2007192562A (ja) * 2006-01-17 2007-08-02 Nissan Motor Co Ltd 車両用情報提供装置、車両用情報提供システム、および、車両用情報提供方法
JP2021081758A (ja) * 2018-03-15 2021-05-27 ソニーグループ株式会社 制御装置、制御方法及びプログラム
WO2020144970A1 (ja) * 2019-01-11 2020-07-16 ソニー株式会社 行動計画装置、行動計画方法、及びプログラム
JP2021077090A (ja) * 2019-11-08 2021-05-20 三菱重工業株式会社 複数のビークルの移動制御方法、移動制御装置、移動制御システム、プログラム及び記録媒体
CN111665844A (zh) * 2020-06-23 2020-09-15 北京三快在线科技有限公司 一种路径规划方法及装置

Also Published As

Publication number Publication date
JP2023120649A (ja) 2023-08-30

Similar Documents

Publication Publication Date Title
De Ryck et al. Automated guided vehicle systems, state-of-the-art control algorithms and techniques
US20200233435A1 (en) Roadmap Annotation for Deadlock-Free Multi-Agent Navigation
Thrun Toward robotic cars
JP2020149370A (ja) 運行計画システム、運行計画方法及びコンピュータプログラム
CN110867095B (zh) 用于协调和监控对象的方法
WO2018039337A1 (en) Autonomous cart for manufacturing and warehouse applications
JP2021071891A (ja) 走行制御装置、走行制御方法、及びコンピュータプログラム
Barberá et al. I-Fork: a flexible AGV system using topological and grid maps
Walenta et al. A decentralised system approach for controlling AGVs with ROS
CN111655105A (zh) 借助自主式移动机器人进行的地板处理
JP2006113687A (ja) 自律移動システム
US20210125493A1 (en) Travel control apparatus, travel control method, and computer program
WO2019219490A1 (en) System for evacuating one or more mobile robots
Herrero-Perez et al. Decentralized coordination of autonomous agvs in flexible manufacturing systems
WO2023157510A1 (ja) 経路計画装置、その適用設備、並びに経路計画方法
Yang et al. Decoupled real-time trajectory planning for multiple autonomous mining trucks in unloading areas
Sharma Control classification of automated guided vehicle systems
CN114137960A (zh) 一种封闭区域智能运输系统的无人驾驶车辆协作方法
Nguyen et al. A time-dependent motion planning system for mobile service robots in dynamic social environments
Hamilton et al. Semantic-based approach for route determination and ontologyupdating
US20240152148A1 (en) System and method for optimized traffic flow through intersections with conditional convoying based on path network analysis
WO2022113548A1 (ja) 移動制御支援装置および方法
WO2023136047A1 (ja) 情報処理装置、情報処理方法およびプログラム
WO2022004444A1 (ja) 経路策定システム、移動ロボット、経路策定プログラムおよび移動ロボットの制御プログラム
WO2022244393A1 (ja) 人機械協調制御システム並びに人機械協調制御方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23756038

Country of ref document: EP

Kind code of ref document: A1