WO2023058382A1 - 情報処理装置、情報処理方法、及びプログラム - Google Patents

情報処理装置、情報処理方法、及びプログラム Download PDF

Info

Publication number
WO2023058382A1
WO2023058382A1 PCT/JP2022/033339 JP2022033339W WO2023058382A1 WO 2023058382 A1 WO2023058382 A1 WO 2023058382A1 JP 2022033339 W JP2022033339 W JP 2022033339W WO 2023058382 A1 WO2023058382 A1 WO 2023058382A1
Authority
WO
WIPO (PCT)
Prior art keywords
control command
command data
unit
mobile device
state information
Prior art date
Application number
PCT/JP2022/033339
Other languages
English (en)
French (fr)
Inventor
遼 高橋
陸也 江副
Original Assignee
ソニーグループ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニーグループ株式会社 filed Critical ソニーグループ株式会社
Publication of WO2023058382A1 publication Critical patent/WO2023058382A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions

Definitions

  • the present disclosure relates to an information processing device, an information processing method, and a program.
  • Autonomous mobile bodies that can move autonomously can be realized in various driving modes such as wheel running, leg running, and flying. controlled.
  • the actuator is driven based on the control command value regardless of the driving mode actually adopted, and the state of the autonomous mobile body as a result of the driving is obtained as an observation value by the sensor.
  • Patent Document 1 discloses a device that controls the movement of a mobile robot based on the detection result of a distance sensor.
  • the autonomous mobile body is driven to change its own state according to the control command value output from the control unit.
  • information about the actual state of the autonomous mobile body is acquired by a sensor (observation system) and sent to the control unit.
  • the "drive to change the state of the autonomous mobile body” is strictly based on the "information obtained by the sensor", which is past information from the point of time when the actual drive is performed. Therefore, there may be a discrepancy between the "information obtained by the sensor” and the “state at the time the autonomous mobile body is driven", and the discrepancy may lead to the optimal state for the drive control of the autonomous mobile body. is not done in
  • the present disclosure has been made in view of the circumstances described above, and provides a technique that is advantageous in optimizing the drive control of the actuation unit provided in a mobile device.
  • predicted state information representing a future state of a mobile device is generated based on one or more pieces of control command data in a history of control command data used to control an actuation unit included in the mobile device.
  • the present invention relates to an information processing apparatus including a future state prediction unit for deriving and a planning unit for generating control command data based on predicted state information.
  • the planning unit may generate the next control command data from predicted state information derived based on one or more control command data including the control command data generated immediately before.
  • the planning section At an initial stage, the planning section generates control command data based on state information representing the state of the mobile device output from the sensing section, and at a later stage than the initial stage, the planning section generates control command data based on the state information. Instead, the control command data may be generated based on the predicted state information.
  • the information processing device may include a state verification unit that verifies the consistency between the state information representing the state of the mobile device output from the sensing unit and the predicted state information.
  • the state verification unit generates correction information based on the result of verification of consistency between the state information and the predicted state information, and the future state prediction unit predicts based on the one or more control command data and the correction information State information may be derived.
  • the planning unit may output control command data to drive the actuation unit in a safe mode when the difference between the state information and the predicted state information is greater than the allowable standard.
  • the mobile device may include an actuation unit and a sensing unit, and the actuation unit may be controlled based on state information representing the state of the mobile device output from the sensing unit to move autonomously.
  • the mobile device may be a vehicle.
  • Another aspect of the present disclosure is predictive state information representing a future state of the mobile device based on one or more pieces of control command data in a history of control command data used for controlling an actuation unit provided in the mobile device. and generating control command data based on predicted state information.
  • the computer expresses the future state of the mobile device based on one or more pieces of control command data in the history of control command data used to control the actuation unit of the mobile device.
  • the present invention relates to a program for executing a procedure for deriving predicted state information and a procedure for generating control command data based on the predicted state information.
  • FIG. 1 is a block diagram showing an example of the functional configuration of a mobile device.
  • FIG. 2 is a diagram showing an example of a time series of "advantageous rotation direction" and "actual rotation state” that can occur in the mobile device shown in FIG.
  • FIG. 3A is a simplified diagram illustrating an example state of a mobile device at time “T1" shown in FIG.
  • FIG. 3B is a simplified diagram illustrating an example state of the mobile device at time "T2" shown in FIG.
  • FIG. 3C is a simplified diagram illustrating an example state of the mobile device at time "T3" shown in FIG.
  • FIG. 3D is a simplified diagram illustrating an example state of the mobile device at time "T4" shown in FIG.
  • FIG. 4 is a block diagram illustrating an example of the functional configuration of the mobile device according to the first embodiment
  • FIG. 6 is a block diagram showing an example of the functional configuration of the mobile device shown in FIG. 4 after the initial stage.
  • FIG. 7 shows an example of the processing flow performed after the initial stage in the mobile device according to the first embodiment.
  • FIG. 8 shows an example of a processing flow performed in the planning department according to the first embodiment.
  • FIG. 9 is a block diagram showing an example of a functional configuration of a mobile device according to the second embodiment;
  • FIG. 10 is a block diagram showing an example of the functional configuration of the mobile device shown in FIG.
  • FIG. 9 is a block diagram showing an example of the functional configuration of the mobile device shown in FIG. 9 after the initial stage;
  • FIG. FIG. 12 shows an example of the processing flow performed after the initial stage in the mobile device according to the second embodiment.
  • FIG. 1 is a block diagram showing an example of the functional configuration of the mobile device 10.
  • FIG. 2 is a diagram showing an example of a time series of "advantageous rotation direction" and "actual rotation state” that can occur in the mobile device 10 shown in FIG. 3A-3D are simplified diagrams illustrating example states of mobile device 10 at times "T1"-"T4" shown in FIG.
  • the driving instruction of the mobile device 10 is based on the sensing result of the current state of the mobile device 10 (which may include the current state of the mobile device 10 and the current state of the surrounding environment). planned based on
  • the state information S(t) at the control cycle t acquired by the sensing unit 21 is sent to the planning unit 25, and the control command data C(t) derived based on the state information S(t) ) is sent from the planning section 25 to the actuation section 22 .
  • the actuation section 22 is driven based on the control command data C(t).
  • the state information S(t) sent from the sensing section 21 to the planning section 25 is delayed by the first delay element 23 .
  • the control command data C(t) sent from the planning section 25 to the actuation section 22 is delayed by the second delay element 24 .
  • the first delay element 23 collects overall delay factors existing between "acquisition of state information S(t) by the sensing unit 21" and “derivation of control command data C(t) by the planning unit 25". It is a function block that is typically represented.
  • the second delay element 24 is a delay factor existing between "acquisition of the control command data C(t) by the planning unit 25" and “driving of the actuation unit 22 based on the control command data C(t)”. It is a functional block that collectively represents the whole.
  • the planning unit 25 When the planning unit 25 generates control command data without considering such system delays, "information acquired by the sensor” and “the mobile device 10 at the time when the mobile device 10 is driven based on the sensor information” There may be a gap between the 10 states. A discrepancy between the “sensor information” and the “driving state of the mobile device 10 ” can cause problems such as vibration phenomena and overshoots in the mobile device 10 .
  • the "vibration phenomenon” referred to here means that under conditions where the details of the drive required for the actuation unit 22 are switched based on slight differences in the sensing results, the details of the drive are continuously switched in a short period of time, This is a phenomenon in which the state of 10 becomes unstable.
  • the mobile device for example, a vehicle
  • the front portion 10F of the device is directed toward the target Tg. Describe the case.
  • the position of the target Tg with respect to the moving device 10 changed while the moving device 10 was rotating to the right (FIG. 3C: time T3), and the front part 10F of the device was the shortest target for the left rotation rather than the right rotation. It may be directed to the Tg.
  • the sensing unit 21 when the sensing unit 21 detects its own position on the map based on the self-localization technology, the detection result of the sensing unit 21 has a certain degree of uncertainty, and the sensing unit 21 can eliminate the error without warning. You may get your own location information. In this case, the sensing result of the sensing unit 21 may indicate that the position of the target Tg with respect to the mobile device 10 has suddenly changed.
  • the subsequent control command is to turn to the left. It can be switched to a command that instructs rotation.
  • the moving device 10 operates to switch the direction of rotation from right to left, and at time T4, the moving device 10 starts rotating to the left.
  • the actual situation of the mobile device 10 at time T4 may be that the front part 10F of the device can be directed to the target Tg in the shortest direction by right rotation rather than by left rotation (Fig. 3D). That is, the preceding right rotation drive continues until the moving device 10 is actually switched to the left rotation. may be in an advantageous position.
  • the control command data is switched to a command for instructing right rotation.
  • the mobile device 10 exhibits an oscillating behavior that repeats clockwise and counterclockwise rotations in a short period of time in the situations shown in FIGS. 2 and 3A to 3D.
  • the vibration phenomenon described above can not only damage the mobile device 10 due to the switching of the drive, but also make people around the mobile device 10 feel threatened by the unnatural behavior of the mobile device 10 , and reduce the drive efficiency of the mobile device 10 . also cause a decline.
  • the above-mentioned “overshoot” is caused by the divergence between the "sensor information” and the “driving state of the mobile device 10" even though the mobile device 10 has actually reached the target state. This is a phenomenon in which the mobile device 10 is driven to a state exceeding the target state.
  • Overshoot is a delay in the actual driving of the actuation unit 22 based on the difference between the sensor information and the target state in response to the request for the mobile device 10 to reach the target state from the timing at which the sensing unit 21 acquires information. Due to what is done. That is, the control command data sent to the actuation unit 22 when the real-world actuation unit 22 reaches the target state reduces the difference between the past state of the actuation unit 22 and the target state. Overshoot occurs due to being a command.
  • control command data for instructing the driving of the actuation unit 22 should be changed to the state of the moving device 10 at the time when the driving based on the control command data is actually performed. It is effective to generate based on
  • control command data for driving the actuation unit 22 at a certain point in time can be generated based on the "state of the mobile device 10 at a certain point in time" obtained without using information detected by the sensing unit 21. is valid.
  • the apparatus and method according to the embodiments described below are advantageous in optimizing the drive control of the actuation unit 22 and suppressing the above-described problems such as the vibration phenomenon and overshoot caused by delays in the system. .
  • FIG. 4 is a block diagram showing an example of the functional configuration of the mobile device 10 according to the first embodiment.
  • the mobile device 10 shown in FIG. 4 includes a sensing unit 21, an actuation unit 22, a first delay element 23, a second delay element 24, a planning unit 25, and a future state prediction unit 26.
  • the sensing unit 21 includes one or more sensors that acquire various types of information that serve as basic information for drive control of the actuation unit 22 .
  • a sensor that detects the status of the mobile device 10 a sensor that detects the status of the surrounding environment, and any devices that can acquire other information are included in the sensing unit 21 that acquires the status information of the mobile device 10. sell.
  • the sensing section 21 can include an encoder mounted on the motor of the actuation section 22 and an inertial measurement unit (IMU) mounted on the moving device 10 .
  • the sensing unit 21 can also include an integrated subsystem such as SLAM (Simultaneous Localization and Mapping) using a ToF (Time-of-Flight) sensor.
  • SLAM Simultaneous Localization and Mapping
  • ToF Time-of-Flight
  • the sensing unit 21 transmits the acquisition result of various information to the planning unit 25 as state information.
  • the actuation section 22 is driven to behave according to the control command data output from the planning section 25 .
  • the actuation unit 22 can include any actuator that can be driven based on control command data.
  • the actuation unit 22 includes a movement mechanism having wheels, propellers, and the like.
  • the control instruction data generated by the planning unit 25 based on the state information (for example, position information and/or map information) output from the sensing unit 21 is activated.
  • the tuning unit 22 is autonomously driven and controlled. As a result, the mobile device 10 moves autonomously.
  • the first delay element 23 collectively represents all delay factors existing between "acquisition of state information by the sensing unit 21" and “derivation of control command data by the planning unit 25", and communication delay factors, physical delay factors and other delay factors.
  • the first delay element 23 shown in FIG. 4 is shown as a separate block from the sensing unit 21 and the planning unit 25 for convenience, it actually includes a delay factor caused by the sensing unit 21 and a delay factor caused by the planning unit 25. .
  • the first delay element 23 includes a delay factor accompanying information conversion in the sensing unit 21 and/or the planning unit 25 .
  • the sensing unit 21 and the planning unit 25 are provided separately (for example, when the planning unit 25 is configured as a cloud system), information from the sensing unit 21 to the planning unit 25 A delay factor associated with transmission is also included in the first delay element 23 .
  • the second delay element 24 collectively represents all delay factors that exist between "acquisition of control command data by the planning unit 25" and “driving of the actuation unit 22 based on the control command data", and communicates Including delay factors, physical delay factors and other delay factors.
  • the second delay element 24 shown in FIG. 4 is shown as a separate block from the planning section 25 and the actuation section 22 for the sake of convenience, the delay factor caused by the planning section 25 and the delay factor caused by the actuation section 22 are actually shown. Also includes Typically, the second delay element 24 includes a delay associated with information conversion in the planning section 25 and/or the actuation section 22 . Further, when the planning section 25 and the actuation section 22 are provided separately, the second delay element 24 also includes the delay associated with the transmission of information from the planning section 25 to the actuation section 22 .
  • the planning section 25 generates control command data for driving the actuation section 22 and sends the control command data to the actuation section 22 .
  • the planning section 25 is a section that calculates control command data for realizing optimal driving of the actuation section 22, and can have any configuration.
  • the planning unit 25 may comprise, for example, a simple PID controller (Proportional-Integral-Differential Controller), or it may comprise a more complex system.
  • the planning unit 25 of the present embodiment implements different generation methods between generation of control command data in the initial stage and generation of control command data in a later stage than the initial stage.
  • the planning unit 25 generates control command data for driving the actuation unit 22 based on state information representing the state of the mobile device 10 output from the sensing unit 21 .
  • the planning section 25 drives the actuation section 22 based on the predicted state information output from the future state prediction section 26, not based on the state information from the sensing section 21.
  • the planning unit 25 has a storage holding unit (not shown) that holds the predicted state information provided from the future state prediction unit 26, and appropriately reads out one or more pieces of predicted state information held in the storage holding unit. It can be used to generate control command data.
  • the future state prediction unit 26 predicts the future state (that is, the predicted state) of the mobile device 10 based on one or more pieces of control command data in the history of control command data used to control the actuation unit 22. It is the part that derives the information and can have any configuration.
  • the future state prediction unit 26 may be configured with a simple integrator. That is, when the control command data includes data indicating the moving speed of the mobile device 10, the future state prediction unit 26 predicts the state of the moving speed of the mobile device 10 at the time of actual driving (that is, when the delay time has elapsed) from the past It can be derived from control command data (for example, integral value of acceleration).
  • the future state prediction unit 26 may have a more complicated system (for example, a system that solves the equation of motion based on a highly accurate model that takes into account dynamics such as friction and inertia).
  • the future state prediction unit 26 predicts the state of the mobile device 10 in the next control cycle based on the control command data without using state information output from the sensing unit 21, and derives predicted state information. do.
  • the future state prediction unit 26 has a storage unit (not shown) that stores the control command data provided by the planning unit 25, and appropriately stores one or more control command data (history information) stored in the storage unit. It can be read out and used to derive predicted state information.
  • the future state prediction unit 26 typically refers only to the most recent past control command data to derive the next control command data. can be derived.
  • the sensing section 21 and the actuation section 22 are connected to the information processing device 15 including the planning section 25 and the future state prediction section 26 .
  • a specific configuration of the information processing device 15 is not limited, and the information processing device 15 can be realized by arbitrary hardware and/or software.
  • the information processing device 15 is provided as part of the mobile device 10, but the information processing device 15 (the planning unit 25 and/or the future state prediction unit 26) is provided separately from the mobile device 10.
  • state information may be transmitted from the sensing unit 21 included in the mobile device 10 to the information processing device 15 (planning unit 25) configured as a cloud system.
  • control command data may be transmitted from the information processing device 15 (planning unit 25 ) configured as a cloud system to the actuation unit 22 provided in the mobile device 10 .
  • FIG. 6 is a block diagram showing an example functional configuration of the mobile device 10 shown in FIG. 4 after the initial stage.
  • FIG. 7 shows an example of the processing flow performed after the initial stage in the mobile device 10 according to the first embodiment.
  • FIG. 8 shows an example of the processing flow performed in the planning section 25 according to the first embodiment.
  • the planning unit 25 derives the control command data C(0) based on the state information S(0), and the control command data C(0) is sent to the actuation unit 22 via the second delay element 24. It is sent to the future state prediction unit 26 as well.
  • the actuation section 22 is driven according to the control command data C(0) sent from the planning section 25 .
  • the mobile device 10 interacts with the real world (surrounding environment) to change the state of the mobile device 10 relative to the surrounding environment.
  • the influence of the delay caused by the first delay element 23 and the second delay element 24 is reflected in the control command data C(0).
  • the actuation unit 22 is driven by the first delay element 23 and the second delay element 23 . It is substantially immune to the delay through element 24 .
  • control command data C(t) generated by the planning unit 25 is sent to the actuation unit 22 via the second delay element 24, and the control command data C(t) ), the actuation unit 22 is driven.
  • the control command data C(t) is generated based on the predicted state information F(t) output from the future state prediction unit 26, and the influence of the delay by the second delay element 24 is eliminated or reduced. . That is, the predicted state information F(t) is derived in consideration of the delay caused by the second delay element 24, and is based on the state of the mobile device 10 at the time when the delay time caused by the second delay element 24 has passed. derived.
  • control command data C(t) calculated by the planning unit 25 based on the predicted state information F(t) is the time when the actuation unit 22 is actually driven based on the control command data C(t). based on the expected state of the mobile device 10 at .
  • the future state prediction unit 26 derives predicted state information F(t+1) representing the future state of the mobile device 10 based on the control command data C(t) output from the planning unit 25 (see FIG. 7). S11).
  • Predicted state information F(t+1) is derived based on the command data). Further, the future state prediction unit 26 predicts the mobile device 10 in the next control cycle based on the control command data C(t) and the delay time by the second delay element 24 without using the state information output from the sensing unit 21 . and outputs predicted state information F(t+1).
  • the planning unit 25 After that, the planning unit 25 generates control command data C(t+1) for the next control cycle based on the predicted state information F(t+1) (S12).
  • the actuation unit 22 is driven based on the control command data C(t+1) in the next control period (that is, "t+1") (S13).
  • the planning unit 25 shown in FIG. good too.
  • the sensing unit 21 may stop outputting the state information S(t), and the planning unit 25 may receive and/or store the state information S(t) from the sensing unit 21. It doesn't have to be.
  • the planning unit 25 performs, for example, the processing flow shown in FIG.
  • the planning unit 25 first determines whether or not a stop instruction signal has been received (S21 in FIG. 8).
  • the stop instruction signal is a signal for stopping the mobile device 10, and may be voluntarily issued by any device, or may be issued by an operator via an interface device (not shown).
  • the planning unit 25 When the planning unit 25 receives the stop instruction signal (Y of S21), it ends the drive control of the actuation unit 22.
  • the information "whether or not the current state is the initial stage of control of the actuation unit 22" is acquired by the planning unit 25 by any method. may be derived based on the state information of
  • the planning unit 25 If the current state is determined to be the initial stage of control (Y in S22), the planning unit 25 generates control command data C(0) based on the state information S(0) from the sensing unit 21. (S23), the control command data C(0) is output (S24).
  • the planning unit 25 then receives the predicted state information F(1) generated by the future state prediction unit 26 based on the control command data C(0) (S25), and returns to step S21 to perform the processing. .
  • the planning unit 25 issues a control command based on the predicted state information F(t) sent from the future state prediction unit 26.
  • Data C(t) is generated (S26).
  • the planning unit 25 then outputs the control command data C(t) to the actuation unit 22 and the future state prediction unit 26 (S27).
  • the planning unit 25 then receives the predicted state information F(t+1) derived by the future state prediction unit 26 based on the control command data C(t) (S28), and returns to step S21 to perform the processing.
  • the planning unit 25 continuously outputs control command data to the actuation unit 22 by repeating steps S21 to S28 described above. controlled based on
  • the driving of the actuation section 22 after the initial stage is controlled according to the control command data generated based on the predicted state information output from the future state prediction section 26. be.
  • the planner 25 of this example since the planner 25 of this example generates the control command data without using the state information from the sensing unit 21, it is possible to generate the control command data without being affected by the delay caused by the first delay element 23. can.
  • the future state prediction unit 26 can derive predicted state information regarding the control cycle timing after being affected by the delay by the second delay element 24 from the control command data. Since the control command data generated based on such predicted state information can reflect a more accurate state of the mobile device 10 in the target control cycle, the optimum actuation corresponding to the state of the mobile device 10 can be performed. Drive control of the unit 22 can be realized.
  • the mobile device 10 can operate smoothly and stably, effectively avoiding the occurrence of problems such as the above-described vibration phenomenon and overshoot, and achieving the target state with high accuracy.
  • the future state prediction unit 26 derives the predicted state information without using the state information from the sensing unit 21, the predicted state information can be derived without being affected by the delay caused by the first delay element 23, and the predicted state information can be quickly provided to the planning department 25. Therefore, it is possible to shorten the interval (that is, the generation cycle) of control command data generation in the planning section 25, and to drive the actuation section 22 precisely.
  • the information processing device 15 and the information processing method of the present embodiment can control the driving of the actuation unit 22 without depending on how the planning algorithm is implemented, and prevent deterioration of the operation quality of the mobile device 10 caused by delay factors. effectively suppressed.
  • general planning algorithms may not be easily extended to deal with latency in some systems, the information processing method of this embodiment can be easily applied to various algorithms.
  • the drive control of the actuation unit 22 after the initial stage is performed by control command data generated based on the predicted state information without using the state information acquired by the sensing unit 21. .
  • the predicted state information used in the first embodiment is data of the future predicted state of the mobile device 10 and does not reflect feedback information regarding the actual state of the mobile device 10 .
  • Examples of influences that may destabilize the behavior of the mobile device 10 include braking by a hardware brake, a headwind against the mobile device 10, and a case where an unexpected weight acts on the mobile device 10 and the actuation unit 22 cannot operate properly. etc.
  • the mobile device 10 may suddenly start or the driving accuracy of the actuation unit 22 may be lowered, and the behavior of the mobile device 10 may become unstable. .
  • the predicted state information derived by the future state prediction unit 26 is verified based on the state information acquired by the sensing unit 21, and the predicted state information is verified as necessary. is corrected and the actuation unit 22 is stopped. Therefore, highly accurate control adapted to the actual state of the mobile device 10 can be performed for driving the actuation unit 22 .
  • FIG. 9 is a block diagram showing an example of the functional configuration of the mobile device 10 according to the second embodiment.
  • the mobile device 10 shown in FIG. 9 includes a sensing unit 21, an actuation unit 22, a first delay element 23, a second delay element 24, a planning unit 25, a future state prediction unit 26, and a state verification unit 27. That is, the information processing apparatus 15 of this embodiment further includes a state verification section 27 in addition to the planning section 25 and the future state prediction section 26 .
  • the state verification unit 27 verifies the consistency between the state information output from the sensing unit 21 and the predicted state information output from the future state prediction unit 26.
  • the state verification unit 27 has a storage unit (not shown) for storing predicted state information sent from the future state prediction unit 26 and state information sent from the sensing unit 21 .
  • the state verification unit 27 can read necessary state information and predicted state information from the storage unit and use them for verification.
  • the state verification unit 27 generates correction information based on the verification result of consistency between the state information and the predicted state information, and sends the correction information to the future state prediction unit 26 .
  • the state verification unit 27 outputs control command data for driving the actuation unit 22 in the safe mode.
  • the details of driving the actuation unit 22 in the safety mode are not limited, and are determined according to the characteristics and circumstances of the mobile device 10 .
  • the state verification unit 27 of this example transmits a stop instruction signal for stopping the driving of the actuation unit 22 to the planning unit 25 as "control instruction data for driving the actuation unit 22 in the safe mode".
  • the state verification unit 27 compares the predicted state information from the future state prediction unit 26 with the state information from the sensing unit 21 to obtain the predicted state (predicted state) of the actual state (state information) of the mobile device 10 . Information) is verified for accuracy.
  • the future state prediction unit 26 derives predicted state information based on the control command data output from the planning unit 25 and sends the predicted state information to the planning unit 25 .
  • the future state prediction unit 26 of this embodiment derives predicted state information based on not only one or more control command data from the planning unit 25 but also correction information from the state verification unit 27 .
  • the predicted state information is derived by the future state prediction unit 26 as corrected information based on the correction information reflecting the verification result of the state verification unit 27.
  • the planning unit 25 generates control command data in the same manner as in the first embodiment, transmits the control command data to the actuation unit 22 via the second delay element 24, and sends the data to the future state prediction unit 26. Send.
  • the actuation unit 22 When the planning unit 25 of the present embodiment receives a stop instruction signal from the state verification unit 27 (that is, when the difference between the state information and the predicted state information is greater than the allowable standard), the actuation unit 22 Generate control command data to stop. Then, the planning section 25 outputs the control command data to the actuation section 22, and the actuation section 22 is stopped.
  • FIG. 11 is a block diagram showing an example functional configuration of the mobile device 10 shown in FIG. 9 after the initial stage.
  • FIG. 12 shows an example of the processing flow performed after the initial stage in the mobile device 10 according to the second embodiment.
  • the state information S(0) acquired by the sensing unit 21 is sent to the planning unit 25 via the first delay element 23, and the planning unit 25 is generated based on the control command data C(0).
  • the control command data C(0) is sent from the planning section 25 to the actuation section 22 via the second delay element 24, and the actuation section 22 is driven according to the control command data C(0).
  • the control command data C(0) is also sent from the planning unit 25 to the future state prediction unit 26, and the future state prediction unit 26 generates predicted state information regarding the next control cycle based on the control command data C(0). Generate F(1).
  • the predicted state information F(1) is sent to the planning unit 25 and to the state verification unit 27.
  • the predicted state information F(1) sent to the planning unit 25 is used as basic information for generating control command data C(1), as in the first embodiment described above.
  • the predicted state information F(1) sent to the state verification unit 27 is used for comparison with the state information S(1) sent from the sensing unit 21 to the state verification unit 27 for verification.
  • the state information S(0) in the initial stage (that is, the state information S(0) regarding the first control cycle) is sent from the sensing unit 21 to the state verification unit 27 via the first delay element 23. However, it does not have to be sent to the state verification unit 27 .
  • the actuation section 22 is driven based on the command data C(t).
  • the control command data C(t) of this embodiment is also generated based on the predicted state information F(t) in the same manner as in the first embodiment, and the influence of the delay caused by the second delay element 24 is eliminated or reduced. It is
  • the state information S(t) is acquired by the sensing unit 21 (S31 in FIG. 12), and the state information S(t) is sent from the sensing unit 21 to the state verification unit 27 via the first delay element 23.
  • the state information S(t) is also sent to the planning section 25 and stored in a storage holding section (not shown) of the planning section 25.
  • the state information S(t) is stored in the planning section 25 does not have to be sent.
  • the state verification unit 27 generates correction information G(t) based on the state information S(t) and the predicted state information F(t) (S32), and the correction information G(t) is used by the future state prediction unit 26 sent to Then, the future state prediction unit 26 derives the predicted state information F(t+1) based on the control command data C(t) and the correction information G(t) (S33), and the predicted state information F(t+1) is the future state. It is sent from the prediction section 26 to the planning section 25 .
  • the correction information G(t) is information derived based on the difference between the state information S(t) and the predicted state information F(t), and is necessary to correct the predicted state information to bring it closer to the corresponding state information. correction amount. Therefore, the predicted state information F(t+1) derived based on the correction information G(t) is information corrected based on the actual state of the mobile device 10 .
  • the state verification unit 27 determines that correction of the predicted state information F(t+1) is unnecessary. good too. In this case, the correction information G(t) does not have to be sent from the state verification unit 27 to the future state prediction unit 26, and the correction information G(t) substantially indicating that correction of the predicted state information is not necessary. may be sent from the state verification unit 27 to the future state prediction unit 26 .
  • the future state prediction unit 26 derives the prediction state information F(t+1) based on the control command data C(t).
  • the correction information G(t) indicating that correction is unnecessary is sent from the state verification unit 27 to the future state prediction unit 26
  • the future state prediction unit 26 substantially receives the correction based on the correction information G(t).
  • the predicted state information F(t+1) is derived.
  • the planning unit 25 generates control command data C(t+1) based on the predicted state information F(t+1) (S34), and the control command data C(t+1) is transmitted from the planning unit 25 through the second delay element 24. It is sent to the actuation section 22 .
  • the actuation unit 22 is driven based on the control command data C(t+1) (S35).
  • the above-described steps S31 to S35 are repeated to continuously control the driving of the actuation unit 22 based on the control command data generated from the predicted state information and the correction information. be done.
  • the predicted state information generated by the future state prediction unit 26 is corrected based on the state information from the sensing unit 21 indicating the actual state of the mobile device 10, and the control command data generated by the planning unit 25 is corrected based on such state information. It is derived based on the predicted state information after correction.
  • control command data suitable for the actual state of the mobile device 10 can be generated by the planner 25, and the actuation optimized for the actual state of the mobile device 10 can be performed based on such control command data.
  • Drive control of the unit 22 can be performed.
  • the state verification unit 27 if the difference between the state information S(t) and the predicted state information F(t) is larger than the allowable standard as a result of verification by the state verification unit 27, the state verification unit 27 outputs the stop instruction signal E to the planning unit 25.
  • the planning unit 25 receives the stop instruction signal E, the planning unit 25 sends control command data for ending drive control of the actuation unit 22 to the actuation unit 22 to stop driving the actuation unit 22 .
  • the accuracy of the predicted state information derived by the future state prediction unit 26 is verified based on the sensing result (state information) of the sensing unit 21. Then, the predicted state information is corrected based on the correction information generated from the result of the verification, the control command data is generated based on the corrected predicted state information, and the actuation unit 22 is operated based on the control command data. drive is controlled.
  • the prediction accuracy of the predicted state information in the future state prediction unit 26 is improved, the control command data corresponding to the actual state of the mobile device 10 is generated by the planning unit 25, and optimized to the actual state of the mobile device 10.
  • the actuation unit 22 is driven by this control.
  • the actuation unit 22 is driven in the safe mode, and the mobile device 10 takes a crisis avoidance operation such as an emergency stop to ensure safety. can ensure the integrity.
  • the state information from the sensing section 21 that is affected by the delay by the first delay element 23 is controlled in such a manner that the driving of the actuation section 22 is not substantially affected by such delay, and the driving accuracy is improved. Used to help improve. Therefore, according to the present embodiment, even in an environment where the mobile device 10 may be affected by unpredictable influences, it is possible to optimally control the driving of the actuation unit 22 according to the actual state of the mobile device 10 .
  • the application target of the information processing apparatus 15 and the information processing method described above is not limited. Not only for mobile devices (e.g., vehicles) 10 where the position of the entire device may change over time, but also for devices where the position of parts of the device may change over time, or where the posture or other state of the device may change over time.
  • the information processing device 15 and the information processing method described above can also be applied to devices that can be changed.
  • the technical categories that embody the above technical ideas are not limited.
  • the above technical ideas may be embodied by a computer program for causing a computer to execute one or more procedures (steps) included in the method of manufacturing or using the above apparatus.
  • the above technical idea may be embodied by a computer-readable non-transitory recording medium in which such a computer program is recorded.
  • a future state prediction unit that derives predicted state information representing a future state of the mobile device based on one or more pieces of control command data in a history of control command data used to control an actuation unit of the mobile device. and, a planning unit that generates the control command data based on the predicted state information; Information processing device.
  • the planning unit In an initial stage, the planning unit generates the control command data based on state information representing the state of the mobile device output from the sensing unit, 3.
  • state information representing the state of the mobile device output from the sensing unit, 3.
  • the information processing apparatus according to item 1 or 2, wherein in a stage subsequent to the initial stage, the planning unit generates the control command data based on the predicted state information, not based on the state information.
  • the state verification unit generates correction information based on a verification result of consistency between the state information and the predicted state information, 5.
  • the information processing apparatus according to item 4, wherein the future state prediction unit derives the predicted state information based on the one or more control command data and the correction information.
  • Item 1 The mobile device includes the actuation unit and the sensing unit, and autonomously moves by controlling the actuation unit based on state information representing the state of the mobile device output from the sensing unit. 7. The information processing device according to any one of 1 to 6.
  • [Item 9] a step of deriving predicted state information representing a future state of the mobile device based on one or more pieces of control command data in a history of control command data used for controlling an actuation unit included in the mobile device; generating the control command data based on the predicted state information; Information processing method including.

Landscapes

  • Engineering & Computer Science (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

[課題]移動装置が具備するアクチュエーション部の駆動制御の最適化に有利な技術を提供する。 [解決手段]情報処理装置は、移動装置が具備するアクチュエーション部の制御に用いられる制御指令データの履歴のうちの1以上の制御指令データに基づいて、移動装置の未来の状態を表す予測状態情報を導出する未来状態予測部と、予測状態情報に基づいて制御指令データを生成する計画部と、を備える。

Description

情報処理装置、情報処理方法、及びプログラム
 本開示は、情報処理装置、情報処理方法、及びプログラムに関する。
 自律的に移動可能な自律移動体は、車輪走行、脚部走行及び飛行などの多様な駆動形態で実現可能であるが、いずれの形態においても通常はセンサーの検出結果に応じてアクチュエータの駆動が制御される。
 すなわち自律移動体では、実際に採用される駆動形態にかかわらず、制御指令値に基づいてアクチュエータが駆動され、当該駆動の結果としての自律移動体の状態がセンサーにより観測値として取得される。
 例えば特許文献1は、距離センサーの検知結果に基づいて移動ロボットの移動を制御する装置を開示する。
国際公開第2019/069524号
 上述のように自律移動体は、制御部から出力される制御指令値に応じて、自らの状態を変えるように駆動する。一方、自律移動体の実際の状態に関する情報は、センサー(観測系)により取得されて、制御部に送られる。
 実世界において、自律移動体の状態の変化は、アクチュエータ(駆動系)を構成する様々なデバイスの動作が連続的に相関して行われることで生じる。そのため「アクチュエータへの駆動信号の入力」から「自律移動体の状態変化の開始」までには、相応の時間を要する。また、制御部からアクチュエータに駆動信号を伝える際にも、レイテンシのため、相応の時間を要する。さらに、センサーから制御部に情報を伝える際のレイテンシや制御部における信号処理に関しても、相応の時間を要する。
 このように「センサーによる情報取得」から「自律移動体の状態変化の開始」までには相応の時間がかかるため、タイムラグが生じる。当該タイムラグに起因し、厳密な意味で「センサーが取得する情報に応じた自律移動体の駆動のリアルタイム制御」を行うことは難しい。
 すなわち「自律移動体の状態を変えるための駆動」は、実際に駆動が行われる時点から見て厳密には過去の情報である「センサーが取得した情報」に基づいて行われる。そのため「センサーが取得した情報」と「自律移動体が駆動される時点での状態」との間には乖離が生じていることがあり、当該乖離によって自律移動体の駆動制御が必ずしも最適な状態では行われない。
 なお「センサーによる情報取得」から「自律移動体の状態変化の開始」までの時間は、状況(例えばシステムの負荷状態や周辺環境の状態)によらずにほぼ一定であったり、状況に応じて大きく変わったりする。
 本開示は上述の事情に鑑みてなされたものであり、移動装置が具備するアクチュエーション部の駆動制御の最適化に有利な技術を提供する。
 本開示の一態様は、移動装置が具備するアクチュエーション部の制御に用いられる制御指令データの履歴のうちの1以上の制御指令データに基づいて、移動装置の未来の状態を表す予測状態情報を導出する未来状態予測部と、予測状態情報に基づいて制御指令データを生成する計画部と、を備える情報処理装置に関する。
 計画部は、直前に生成した制御指令データを含む1以上の制御指令データに基づいて導出される予測状態情報から、次の制御指令データを生成してもよい。
 初期段階において、計画部は、センシング部から出力される移動装置の状態を表す状態情報に基づいて制御指令データを生成し、初期段階よりも後の段階において、計画部は、状態情報に基づくことなく、予測状態情報に基づいて制御指令データを生成してもよい。
 情報処理装置は、センシング部から出力される移動装置の状態を表す状態情報と、予測状態情報との間の整合性を検証する状態検証部を備えてもよい。
 状態検証部は、状態情報と予測状態情報との間の整合性の検証の結果に基づいて補正情報を生成し、未来状態予測部は、1以上の制御指令データ及び補正情報に基づいて、予測状態情報を導出してもよい。
 計画部は、状態情報と予測状態情報との間の相違が許容基準よりも大きい場合、アクチュエーション部を安全モードで駆動させる制御指令データを出力してもよい。
 移動装置は、アクチュエーション部及びセンシング部を具備し、センシング部から出力される移動装置の状態を表す状態情報に基づいてアクチュエーション部が制御されて自律的に移動してもよい。
 移動装置は、車両であってもよい。
 本開示の他の態様は、移動装置が具備するアクチュエーション部の制御に用いられる制御指令データの履歴のうちの1以上の制御指令データに基づいて、移動装置の未来の状態を表す予測状態情報を導出する工程と、予測状態情報に基づいて制御指令データを生成する工程と、を含む情報処理方法に関する。
 本開示の他の態様は、コンピュータに、移動装置が具備するアクチュエーション部の制御に用いられる制御指令データの履歴のうちの1以上の制御指令データに基づいて、移動装置の未来の状態を表す予測状態情報を導出する手順と、予測状態情報に基づいて制御指令データを生成する手順と、を実行させるためのプログラムに関する。
図1は、移動装置の機能構成の一例を示すブロック図である。 図2は、図1に示す移動装置において生じうる「有利な回転方向」及び「実際の回転状態」の時系列の一例を示す図である。 図3Aは、図2に示す時間「T1」における移動装置の状態例を示す簡略図である。 図3Bは、図2に示す時間「T2」における移動装置の状態例を示す簡略図である。 図3Cは、図2に示す時間「T3」における移動装置の状態例を示す簡略図である。 図3Dは、図2に示す時間「T4」における移動装置の状態例を示す簡略図である。 図4は、第1実施形態に係る移動装置の機能構成の一例を示すブロック図である。 図5は、初期段階(特に「制御周期t=0」)における図4に示す移動装置の機能構成の一例を示すブロック図である。 図6は、初期段階の後における図4に示す移動装置の機能構成の一例を示すブロック図である。 図7は、第1実施形態に係る移動装置において、初期段階の後に行われる処理フローの一例を示す。 図8は、第1実施形態に係る計画部において行われる処理フローの一例を示す。 図9は、第2実施形態に係る移動装置の機能構成の一例を示すブロック図である。 図10は、初期段階(特に「制御周期t=0」)における図9に示す移動装置の機能構成の一例を示すブロック図である。 図11は、初期段階の後における図9に示す移動装置の機能構成の一例を示すブロック図である。 図12は、第2実施形態に係る移動装置において、初期段階の後に行われる処理フローの一例を示す。
 図1は、移動装置10の機能構成の一例を示すブロック図である。図2は、図1に示す移動装置10において生じうる「有利な回転方向」及び「実際の回転状態」の時系列の一例を示す図である。図3A~図3Dは、図2に示す時間「T1」~「T4」における移動装置10の状態例を示す簡略図である。
 自律移動体等の移動装置10の全般において、移動装置10の駆動指示は、移動装置10の現在の状態(移動装置10の現在の状況及び周辺環境の現在の状況を含みうる)のセンシング結果に基づいて計画される。
 ただし、指示が駆動に対して実際に反映されるタイミングは、センシング結果の取得及び駆動指示の計画完成の時点から見て厳密には未来となる。
 図1に示す例では、センシング部21が取得した制御周期tでの状態情報S(t)が計画部25に送られ、状態情報S(t)に基づいて導出される制御指令データC(t)が計画部25からアクチュエーション部22に送られる。その後、制御指令データC(t)に基づいてアクチュエーション部22が駆動される。
 当該駆動制御において、センシング部21から計画部25に送られる状態情報S(t)は第1遅延素子23により遅延される。また計画部25からアクチュエーション部22に送られる制御指令データC(t)は第2遅延素子24により遅延される。
 ここで第1遅延素子23は、「センシング部21による状態情報S(t)の取得」から「計画部25による制御指令データC(t)の導出」までの間に存在する遅延要因全般を集合的に表す機能ブロックである。同様に第2遅延素子24は、「計画部25による制御指令データC(t)の取得」から「制御指令データC(t)に基づくアクチュエーション部22の駆動」までの間に存在する遅延要因全般を集合的に表す機能ブロックである。
 このように「センシング部21による状態情報S(t)の取得」と「制御指令データC(t)に基づくアクチュエーション部22の駆動」との間には相応の時間がかかり、アクチュエーション部22の駆動は状態情報の取得から遅延して行われる。
 計画部25がそのようなシステム上の遅延を考慮せずに制御指令データを生成する場合、「センサーが取得した情報」と「センサー情報に基づく移動装置10の駆動が行われる時点での移動装置10の状態」との間に乖離が生じることがある。「センサー情報」と「移動装置10の駆動時の状態」との間の乖離は、振動現象やオーバーシュートなどの不具合を移動装置10にもたらしうる。
 ここで言う「振動現象」は、センシング結果のわずかな差に基づいてアクチュエーション部22に求められる駆動内容が切り換わる状況下で、当該駆動内容が短時間で連続的に切り換わって、移動装置10の状態が不安定になる現象である。
 一例として、図3A~図3Dに示すように、移動装置(例えば車両)10が目標Tgに向けて移動しつつ、装置前部10Fが目標Tgに向けられるように移動装置10が回転駆動されるケースについて説明する。
 移動装置10の回転駆動が停止している図3A(図2の時間「T1」参照)に示す状態では、移動装置10を左回転させるよりも右回転させる方が、装置前部10Fを最短で目標Tgに向けることができ有利である。そのため時間T1においてセンシング部21により取得された状態情報に基づいて、時間T2において移動装置10が右回転駆動を開始する(図3B)。
 その後、移動装置10が右回転している間に移動装置10に対する目標Tgの位置が変わって(図3C:時間T3)、右回転よりも左回転の方が、装置前部10Fを最短で目標Tgに向けられることになる場合がある。
 ここで言う「移動装置10に対する目標Tgの位置が変わる場合」には、目標Tg自体の位置が変わる場合だけではなく、センシング部21の検出結果の誤差が解消することで移動装置10の検出位置が変わる場合も該当しうる。
 例えば、センシング部21が自己位置同定技術に基づいて地図上の自らの位置を検出する場合、センシング部21の検出結果はある程度の不確かさを有し、センシング部21は、前触れなく、誤差が解消された自己位置情報を取得することがある。この場合、センシング部21のセンシング結果は、移動装置10に対する目標Tgの位置が突然変わったことを示しうる。
 上述のように、移動装置10が右回転している状態で、時間T3においてセンシング部21により取得される状態情報に基づき左回転が有利であることが導出されると、その後の制御指令は左回転を指示する指令に切り替えられる。その結果、移動装置10は、回転方向を右回転から左回転に切り替えるように動作し、時間T4において移動装置10は左回転駆動を開始する。
 しかしながら時間T4における移動装置10の実際の状況は、左回転よりも右回転の方が、装置前部10Fを最短で目標Tgに向けられることがある(図3D)。すなわち、移動装置10の左回転への切り替えが実際に行われるまでは、先行する右回転駆動が行われ続けるため、移動装置10の左回転駆動を開始する時点(時間T4)では右回転の方が有利な状態になることがある。
 この場合、センシング部21が取得する状態情報に基づいて、制御指令データは右回転を指示する指令に切り替えられる。
 したがって移動装置10は、上述の図2及び図3A~図3Dに示す状況において、右回転及び左回転を短時間に繰り返し行う振動的な挙動を示す。
 このように回転により移動装置10の姿勢を変更する場合、右回転及び左回転のうちのどちらが有利かは、目標Tgの位置と移動装置10の状態(回転姿勢)との間の相対関係の微妙な変化によって変わりうる。そのため、移動装置10は右回転駆動及び左回転駆動を振動的に繰り返し、結果的に移動装置10の回転挙動が不安定になることがある。
 上述の振動現象は、駆動の切り替えに伴う損傷を移動装置10にもたらしうるだけではなく、移動装置10の不自然な挙動が周辺の人間に脅威を感じさせうるとともに、移動装置10の駆動効率の低下も招く。
 一方、上述の「オーバーシュート」は、移動装置10が実際には目標状態に達しているにもかかわらず、「センサー情報」と「移動装置10の駆動時の状態」との間の乖離に起因し、目標状態を超えた状態まで移動装置10が駆動される現象である。
 オーバーシュートは、移動装置10を目標状態に到達させるという要求に対し、センサー情報と目標状態との間の差分に基づくアクチュエーション部22の実際の駆動が、センシング部21による情報取得タイミングから遅れて行われることに起因する。つまり、実世界のアクチュエーション部22が目標状態に達した時点でアクチュエーション部22に送られてくる制御指令データは、アクチュエーション部22の過去の状態と目標状態との間の差分を低減する指令であることに起因して、オーバーシュートが起きる。
 上述の振動現象やオーバーシュートなどの不具合を防ぐには、アクチュエーション部22の駆動を指示する制御指令データを、当該制御指令データに基づく駆動が実際に行われる時点での移動装置10の状態に基づいて生成することが、有効である。
 その一方で「センシング部21による情報取得」から「アクチュエーション部22による駆動開始」までに遅延が全くない装置は存在せず、「センシング部21による情報取得」と「アクチュエーション部22による駆動開始」との間のタイムラグは不可避である。
 そのため、センシング部21により検出される情報を用いずに得られる「ある時点における移動装置10の状態」に基づいて、当該ある時点におけるアクチュエーション部22の駆動のための制御指令データを生成することが有効である。
 以下に示す実施形態に係る装置及び方法は、アクチュエーション部22の駆動制御を最適化して、システム上の遅延に起因する上述の振動現象やオーバーシュート等の不具合の発生を抑えるのに有利である。
[第1実施形態]
 図4は、第1実施形態に係る移動装置10の機能構成の一例を示すブロック図である。
 図4に示す移動装置10は、センシング部21、アクチュエーション部22、第1遅延素子23、第2遅延素子24及び計画部25に加え、未来状態予測部26を備える。
 センシング部21は、アクチュエーション部22の駆動制御のための基礎情報となる各種情報を取得する1以上のセンサー類を含む。例えば、移動装置10の状況を検出するセンサー、周辺環境の状況を検出するセンサー、及び他の情報を取得可能な任意の機器類が、移動装置10の状態情報を取得するセンシング部21に含まれうる。
 典型的には、センシング部21は、アクチュエーション部22が有するモータに装着されたエンコーダや移動装置10に搭載される慣性計測ユニット(IMU: Inertial Measurement Unit)を含みうる。またセンシング部21は、ToF(Time-of-Flight)センサーを用いたSLAM(Simultaneous Localization and Mapping)などの統合的なサブシステムを含みうる。センシング部21により取得可能な環境の状態は、実世界における環境の状態であってもよいし、シミュレーション上の環境の状態であってもよい。
 センシング部21は、各種情報の取得結果を、状態情報として計画部25に向けて送信する。
 アクチュエーション部22は、計画部25から出力される制御指令データに応じた挙動をとるように駆動される。
 アクチュエーション部22は、制御指令データに基づいて駆動可能な任意のアクチュエータを含みうる。典型的には、車輪やプロペラなどを具備する移動機構が、アクチュエーション部22に含まれる。
 例えば移動装置10が自律駆動システムとして構成される場合、センシング部21から出力される状態情報(例えば位置情報及び/又はマップ情報)に基づき計画部25で生成される制御指令データに応じて、アクチュエーション部22は自律的に駆動制御される。その結果、移動装置10は自律的に移動する。
 第1遅延素子23は、上述のように「センシング部21による状態情報の取得」から「計画部25による制御指令データの導出」までの間に存在する遅延要因全般を集合的に表し、通信遅延要因、物理的遅延要因及びその他の遅延要因を含みうる。
 図4に示す第1遅延素子23は、便宜的にセンシング部21及び計画部25とは別ブロックとして表されているが、実際はセンシング部21で生じる遅延要因及び計画部25で生じる遅延要因も含む。
 典型的には、センシング部21及び/又は計画部25における情報変換に伴う遅延要因が第1遅延素子23に含まれる。また光速を超えた情報伝達は難しいので、センシング部21及び計画部25が離れて設けられる場合(例えば計画部25がクラウドシステムとして構成される場合)、センシング部21から計画部25への情報の伝達に伴う遅延要因も第1遅延素子23に含まれる。
 同様に第2遅延素子24は、「計画部25による制御指令データの取得」から「制御指令データに基づくアクチュエーション部22の駆動」までの間に存在する遅延要因全般を集合的に表し、通信遅延要因、物理的遅延要因及びその他の遅延要因を含む。図4に示す第2遅延素子24は、便宜的に計画部25及びアクチュエーション部22とは別ブロックとして表されているが、実際は計画部25で生じる遅延要因及びアクチュエーション部22で生じる遅延要因も含む。典型的には、計画部25及び/又はアクチュエーション部22における情報変換に伴う遅延が第2遅延素子24に含まれる。また計画部25及びアクチュエーション部22が離れて設けられる場合には、計画部25からアクチュエーション部22への情報の伝達に伴う遅延も第2遅延素子24に含まれる。
 計画部25は、アクチュエーション部22を駆動するための制御指令データを生成し、当該制御指令データをアクチュエーション部22に向けて送る。
 すなわち計画部25は、アクチュエーション部22の最適な駆動を実現するための制御指令データを算出する部分であり、任意の構成を有しうる。計画部25は、例えば単純なPID制御器(Proportional-Integral-Differential Controller)を有してもよいし、より複雑なシステムを有していてもよい。
 本実施形態の計画部25は、初期段階における制御指令データの生成と、初期段階よりも後の段階における制御指令データの生成との間で、異なる生成方法を実施する。
 すなわち初期段階では、計画部25は、センシング部21から出力される移動装置10の状態を表す状態情報に基づいて、アクチュエーション部22を駆動するための制御指令データを生成する。
 一方、初期段階よりも後の段階では、計画部25は、センシング部21からの状態情報に基づくことなく、未来状態予測部26から出力される予測状態情報に基づいて、アクチュエーション部22を駆動するための制御指令データを生成する。特に、本例の計画部25は、直前に生成した制御指令データを含む1以上の過去の制御指令データに基づいて導出される1以上の予測状態情報から、次の制御指令データを生成する。
 そのため計画部25は、未来状態予測部26から提供される予測状態情報を保持する記憶保持部(図示省略)を有し、当該記憶保持部に保持される1以上の予測状態情報を適宜読み出して制御指令データの生成に用いることができる。
 未来状態予測部26は、アクチュエーション部22の制御に用いられる制御指令データの履歴のうちの1以上の制御指令データに基づいて、移動装置10の未来の状態(すなわち予測状態)を表す予測状態情報を導出する部分であり、任意の構成を有しうる。
 例えば制御指令データが移動装置10の移動速度に関する場合、単純な積分器によって未来状態予測部26が構成されてもよい。すなわち制御指令データが移動装置10の移動速度を指示するデータを含む場合、未来状態予測部26は、実際の駆動時点(すなわち遅延時間経過時)の移動装置10の移動速度の状態を、過去の制御指令データ(例えば加速度の積分値)から導出できる。
 ただし未来状態予測部26は、より複雑なシステム(例えば摩擦及び慣性などのダイナミクスが考慮された高精度なモデルに基づく運動方程式を解くシステム)を有していてもよい。
 このように未来状態予測部26は、センシング部21から出力される状態情報を用いることなく、制御指令データに基づいて、次の制御周期における移動装置10の状態を予測して予測状態情報を導出する。
 そのため未来状態予測部26は、計画部25から提供される制御指令データを保存する保存部(図示省略)を有し、当該保存部に保存される1以上の制御指令データ(履歴情報)を適宜読み出して予測状態情報の導出に用いることができる。
 未来状態予測部26は、典型的には、直近の過去の制御指令データのみを参照して次の制御指令データを導出するが、複数の過去の制御指令データを参照して次の制御指令データを導出してもよい。
 上述のように図4に示す移動装置10では、計画部25及び未来状態予測部26を含む情報処理装置15に対し、センシング部21及びアクチュエーション部22が接続される。情報処理装置15の具体的な構成は限定されず、任意のハードウエア及び/又はソフトウエアによって情報処理装置15を実現することが可能である。
 なお図4に示す例では情報処理装置15が移動装置10の一部として設けられるが、情報処理装置15(計画部25及び/又は未来状態予測部26)は移動装置10とは別体として設けられてもよい。例えば、移動装置10が具備するセンシング部21から、クラウドシステムとして構成される情報処理装置15(計画部25)に状態情報が送信されてもよい。またクラウドシステムとして構成される情報処理装置15(計画部25)から、移動装置10が具備するアクチュエーション部22に制御指令データが送信されてもよい。
 次に、上述の移動装置10を使った情報処理方法の一例について説明する。
 図5は、初期段階(特に「制御周期t=0」)における図4に示す移動装置10の機能構成の一例を示すブロック図である。図6は、初期段階の後における図4に示す移動装置10の機能構成の一例を示すブロック図である。図7は、第1実施形態に係る移動装置10において、初期段階の後に行われる処理フローの一例を示す。図8は、第1実施形態に係る計画部25において行われる処理フローの一例を示す。
 まず、アクチュエーション部22の駆動制御の初期段階における情報処理方法の一例について説明する。
 初期段階(特に最初の制御周期(t=0))では、図5に示すように、センシング部21により取得された状態情報S(0)が第1遅延素子23を介して計画部25に送られる。
 そして計画部25により、状態情報S(0)に基づいて制御指令データC(0)が導出され、当該制御指令データC(0)が、第2遅延素子24を介してアクチュエーション部22に送られるとともに、未来状態予測部26に送られる。
 アクチュエーション部22は、計画部25から送られてくる制御指令データC(0)に応じて駆動される。その結果、移動装置10は、実世界(周辺環境)とインタラクション(相互作用)して、周辺環境に対する移動装置10の状態を変化させる。
 一方、未来状態予測部26は、計画部25から送られてくる制御指令データC(0)を保存部(図示省略)に保存するとともに、制御指令データC(0)に基づいて、次の制御周期(すなわち「t=1」)のための予測状態情報F(1)を導出する。
 このように初期段階では、第1遅延素子23及び第2遅延素子24によりもたらされる遅延の影響が制御指令データC(0)に反映される。ただし初期段階において移動装置10の状態が経時的に変化しない状態(例えばアクチュエーション部22が静止している状態)であれば、アクチュエーション部22の駆動は、第1遅延素子23及び第2遅延素子24による遅延の影響を実質的には受けない。
 次に、上記初期段階の後における情報処理方法の一例について説明する。
 初期段階の後は、図6に示すように、計画部25が生成した制御指令データC(t)が第2遅延素子24を介してアクチュエーション部22に送られ、当該制御指令データC(t)に基づいてアクチュエーション部22が駆動される。
 当該制御指令データC(t)は、未来状態予測部26から出力される予測状態情報F(t)に基づいて生成されており、第2遅延素子24による遅延の影響が解消又は低減されている。すなわち予測状態情報F(t)は、第2遅延素子24に起因する遅延を考慮して導出されており、第2遅延素子24に起因する遅延時間の経過時点における移動装置10の状態に基づいて導出される。
 このように計画部25が予測状態情報F(t)に基づいて算出する制御指令データC(t)は、当該制御指令データC(t)に基づいてアクチュエーション部22が実際に駆動される時点での移動装置10の予測状態に基づいている。
 一方、未来状態予測部26が、計画部25から出力される制御指令データC(t)に基づいて、移動装置10の未来の状態を表す予測状態情報F(t+1)を導出する(図7のS11)。
 上述のように本例では、アクチュエーション部22の制御に用いられる制御指令データの履歴のうちの1以上の制御指令データ(特に直前に生成した制御指令データC(t)を含む1以上の制御指令データ)に基づいて、予測状態情報F(t+1)が導出される。また未来状態予測部26は、センシング部21から出力される状態情報を用いることなく、制御指令データC(t)及び第2遅延素子24による遅延時間に基づいて、次の制御周期の移動装置10の状態を予測して、予測状態情報F(t+1)を出力する。
 その後、計画部25が、予測状態情報F(t+1)に基づいて、次の制御周期の制御指令データC(t+1)を生成する(S12)。
 その後、アクチュエーション部22が、次の制御周期(すなわち「t+1」)において、制御指令データC(t+1)に基づき駆動される(S13)。
 このように、上記初期段階の後では、上述のステップS11~S13が繰り返されることにより、未来状態予測部26が導出した予測状態情報から生成される制御指令データに基づいて、アクチュエーション部22の駆動が継続的に制御される。
 なお図6に示す計画部25は、初期段階の後も、センシング部21から第1遅延素子23を介して送られてくる状態情報S(t)を受信して、記憶保持部に記憶してもよい。ただし上述のように、初期段階の後は、計画部25における制御指令データの生成に、センシング部21が取得する状態情報は用いられない。したがって初期段階の後において、センシング部21は状態情報S(t)の出力を停止してもよいし、計画部25はセンシング部21からの状態情報S(t)を受信及び/又は記憶保持しなくてもよい。
 上述の情報処理方法を実施するため、計画部25では、例えば図8に示す処理フローが行われる。
 すなわち計画部25は、まず停止指示信号を受信したか否かを判定する(図8のS21)。
 停止指示信号は、移動装置10を停止させるための信号であり、任意の装置によって自発的に発せられてもよいし、図示しないインターフェース装置を介してオペレータにより発せられてもよい。
 計画部25は、停止指示信号を受信した場合(S21のY)、アクチュエーション部22の駆動制御を終了する。
 一方、計画部25は、停止指示信号を受信しない場合(S21のN)、現在の状態が、アクチュエーション部22の制御の初期段階か否か(本例では「t=0」か否か)を判定する(S22)。「現在の状態がアクチュエーション部22の制御の初期段階か否か」の情報は、任意の方法で計画部25により取得され、例えば計画部25自身により導出されてもよいし、センシング部21からの状態情報に基づいて導出されてもよい。
 現在の状態が制御の初期段階であると判定される場合(S22のY)、計画部25は、センシング部21からの状態情報S(0)に基づいて制御指令データC(0)を生成し(S23)、当該制御指令データC(0)を出力する(S24)。
 そして計画部25は、当該制御指令データC(0)に基づいて未来状態予測部26により生成される予測状態情報F(1)を受信し(S25)、上述のステップS21に戻って処理を行う。
 一方、現在の状態が制御の初期段階ではないと判定される場合(S22のN)、計画部25は、未来状態予測部26から送られてくる予測状態情報F(t)に基づいて制御指令データC(t)を生成する(S26)。
 そして計画部25は、当該制御指令データC(t)を、アクチュエーション部22及び未来状態予測部26に出力する(S27)。
 そして計画部25は、当該制御指令データC(t)に基づいて未来状態予測部26が導出する予測状態情報F(t+1)を受信し(S28)、上述のステップS21に戻って処理を行う。
 計画部25は、上述のステップS21~S28を繰り返し行うことで、アクチュエーション部22に向けて制御指令データを継続的に出力し、アクチュエーション部22の駆動は、計画部25からの制御指令データに基づいて制御される。
 なお上述の図8に示す例では、最初の制御周期(すなわち「t=0」)のみを初期段階に分類しているが、最初の2以上の任意の数の制御周期を初期段階に分類してもよい。
 以上説明したように本実施形態によれば、初期段階後のアクチュエーション部22の駆動は、未来状態予測部26から出力される予測状態情報に基づき生成される制御指令データに応じて、制御される。
 特に、本例の計画部25は、センシング部21からの状態情報を用いずに制御指令データを生成するため、第1遅延素子23による遅延の影響を受けることなく制御指令データを生成することができる。
 また未来状態予測部26は、第2遅延素子24による遅延の影響を受けた後の制御周期タイミングに関する予測状態情報を、制御指令データから導出することができる。そのような予測状態情報に基づいて生成される制御指令データには、対象の制御周期における移動装置10のより正確な状態を反映可能であるため、移動装置10の状態に応じた最適なアクチュエーション部22の駆動制御を実現できる。
 その結果、移動装置10は滑らか且つ安定的に動作し、上述の振動現象やオーバーシュートなどの不具合の発生を効果的に回避しつつ、目標状態を精度良く達成することができる。
 また未来状態予測部26は、センシング部21からの状態情報を用いずに予測状態情報を導出するため、第1遅延素子23による遅延の影響を受けることなく予測状態情報を導出でき、予測状態情報を迅速に計画部25に提供できる。そのため、計画部25における制御指令データの生成の間隔(すなわち生成周期)を短縮化でき、アクチュエーション部22を緻密に駆動することも可能である。
 また本実施形態の情報処理装置15及び情報処理方法は、計画アルゴリズムの実装の仕方に依存することなくアクチュエーション部22の駆動を制御でき、遅延要因に起因する移動装置10の動作品質の低下を効果的に抑えられる。また一般的な計画アルゴリズムではレイテンシを取り扱うような拡張を容易にはシステムに適用できない場合もあるが、本実施形態の情報処理方法は様々なアルゴリズムに対して容易に適用可能である。
[第2実施形態]
 本実施形態において、上述の第1実施形態と同一又は対応の要素には同一の符号を付し、その詳細な説明は省略する。
 上述の第1実施形態において、初期段階の後のアクチュエーション部22の駆動制御は、センシング部21が取得する状態情報を用いることなく、予測状態情報に基づいて生成される制御指令データによって行われる。
 このようにして第1実施形態で用いられる予測状態情報は、移動装置10の未来の予測状態のデータであって、移動装置10の実際の状態に関するフィードバック情報が反映されていない。
 そのため初期段階の後に何らかの影響が移動装置10に作用した場合、移動装置10の実際の状態には適合しないアクチュエーション部22の駆動制御が行われ、移動装置10の挙動が不安定になりうることが想定される。
 移動装置10の挙動を不安定にしうる影響の例として、ハードウェアブレーキによる制動、移動装置10に対する向かい風、及び移動装置10に想定外の重量が作用してアクチュエーション部22が適切に動作できない場合などが挙げられる。
 このような予測不能な影響が移動装置10に作用する場合、例えば移動装置10の急発進やアクチュエーション部22の駆動精度の低下などが生じ、移動装置10の挙動が不安定になることがある。
 以下に説明する情報処理装置15及び情報処理方法によれば、センシング部21が取得する状態情報に基づき、未来状態予測部26により導出される予測状態情報が検証され、必要に応じて予測状態情報の補正やアクチュエーション部22の駆動停止が行われる。そのため、移動装置10の実際の状態に適合した高精度な制御を、アクチュエーション部22の駆動に対して行うことができる。
 図9は、第2実施形態に係る移動装置10の機能構成の一例を示すブロック図である。
 図9に示す移動装置10は、センシング部21、アクチュエーション部22、第1遅延素子23、第2遅延素子24、計画部25及び未来状態予測部26に加え、状態検証部27を備える。すなわち本実施形態の情報処理装置15は、計画部25及び未来状態予測部26に加え、状態検証部27を更に含む。
 状態検証部27は、センシング部21から出力される状態情報と、未来状態予測部26から出力される予測状態情報との間の整合性を検証する。
 状態検証部27は、未来状態予測部26から送られてくる予測状態情報と、センシング部21から送られてくる状態情報とを記憶するための記憶部(図示省略)を有する。状態検証部27は、必要な状態情報及び予測状態情報を当該記憶部から読み出して検証に用いることができる。
 状態検証部27は、状態情報と予測状態情報との間の整合性の検証の結果に基づいて補正情報を生成し、当該補正情報を未来状態予測部26に送る。
 また状態検証部27は、当該検証の結果、状態情報と予測状態情報との間の相違が許容基準よりも大きい場合、アクチュエーション部22を安全モードで駆動させる制御指令データを出力する。
 安全モードでのアクチュエーション部22の駆動の内容は限定されず、移動装置10の特性や状況に応じて決められる。本例の状態検証部27は、アクチュエーション部22の駆動を停止させるための停止指示信号を、「アクチュエーション部22を安全モードで駆動させる制御指令データ」として計画部25に送信する。
 このように状態検証部27は、未来状態予測部26からの予測状態情報を、センシング部21からの状態情報に照らし合わせることで、移動装置10の実際状態(状態情報)に対する予測状態(予測状態情報)の正確さを検証する。
 未来状態予測部26は、計画部25から出力される制御指令データに基づいて予測状態情報を導出し、当該予測状態情報を計画部25に送る。ただし本実施形態の未来状態予測部26は、計画部25からの1以上の制御指令データだけではなく、状態検証部27からの補正情報にも基づいて、予測状態情報を導出する。
 これにより予測状態情報は、状態検証部27の検証結果を反映した補正情報に基づいて補正された情報として、未来状態予測部26により導出される。
 計画部25は、上述の第1実施形態と同様にして制御指令データを生成し、当該制御指令データを第2遅延素子24を介してアクチュエーション部22に送信するとともに、未来状態予測部26に送信する。
 ただし本実施形態の計画部25は、状態検証部27からの停止指示信号を受信した場合(すなわち状態情報と予測状態情報との間の相違が許容基準よりも大きい場合)、アクチュエーション部22を停止させる制御指令データを生成する。そして計画部25は当該制御指令データをアクチュエーション部22に向けて出力し、アクチュエーション部22の駆動が停止される。
 移動装置10の他の構成は、上述の第1実施形態に係る移動装置10の構成と同様である。
 次に、上述の移動装置10を使った情報処理方法の一例について説明する。
 図10は、初期段階(特に「制御周期t=0」)における図9に示す移動装置10の機能構成の一例を示すブロック図である。図11は、初期段階の後における図9に示す移動装置10の機能構成の一例を示すブロック図である。図12は、第2実施形態に係る移動装置10において、初期段階の後に行われる処理フローの一例を示す。
 まずアクチュエーション部22の制御の初期段階における情報処理方法の一例について説明する。
 初期段階では、図10に示すように、センシング部21により取得された状態情報S(0)が第1遅延素子23を介して計画部25に送られ、計画部25により状態情報S(0)に基づいて制御指令データC(0)が生成される。制御指令データC(0)は、計画部25から第2遅延素子24を介してアクチュエーション部22に送られ、アクチュエーション部22は制御指令データC(0)に応じて駆動される。また制御指令データC(0)は、計画部25から未来状態予測部26にも送られ、未来状態予測部26は、制御指令データC(0)に基づいて、次の制御周期に関する予測状態情報F(1)を生成する。
 予測状態情報F(1)は、計画部25に送られるとともに、状態検証部27に送られる。
 計画部25に送られる予測状態情報F(1)は、上述の第1実施形態と同様に、制御指令データC(1)の生成のための基礎情報として用いられる。
 一方、状態検証部27に送られる予測状態情報F(1)は、検証のために、センシング部21から状態検証部27に送られる状態情報S(1)との比較に用いられる。
 なお初期段階における状態情報S(0)(すなわち最初の制御周期に関する状態情報S(0))は、図10に示す例ではセンシング部21から第1遅延素子23を介して状態検証部27に送られるが、状態検証部27に送られなくてもよい。
 次に、初期段階の後における情報処理方法の一例について説明する。
 初期段階の後に行われる情報処理方法では、図11に示すように、計画部25が生成した制御指令データC(t)が第2遅延素子24を介してアクチュエーション部22に送られ、当該制御指令データC(t)に基づいてアクチュエーション部22が駆動される。
 本実施形態の制御指令データC(t)も、上述の第1実施形態と同様のやり方で予測状態情報F(t)に基づいて生成され、第2遅延素子24による遅延の影響が解消又は低減されている。
 一方、センシング部21によって状態情報S(t)が取得され(図12のS31)、当該状態情報S(t)がセンシング部21から第1遅延素子23を介して状態検証部27に送られる。
 なお図11に示す例では、状態情報S(t)は計画部25にも送られて計画部25の記憶保持部(図示省略)に記憶保持されるが、状態情報S(t)は計画部25に送られなくてもよい。
 そして状態検証部27により、状態情報S(t)及び予測状態情報F(t)に基づいて補正情報G(t)が生成され(S32)、当該補正情報G(t)が未来状態予測部26に送られる。そして、未来状態予測部26により制御指令データC(t)及び補正情報G(t)に基づいて予測状態情報F(t+1)が導出され(S33)、当該予測状態情報F(t+1)が未来状態予測部26から計画部25に送られる。
 補正情報G(t)は、状態情報S(t)及び予測状態情報F(t)の差に基づいて導出される情報であり、予測状態情報を補正して対応の状態情報に近づけるのに必要な補正量を示す。したがって補正情報G(t)に基づいて導出される予測状態情報F(t+1)は、移動装置10の実際の状態に基づいて補正された情報となる。
 なお状態情報S(t)及び予測状態情報F(t)の差が全くない場合又は十分に小さい場合、状態検証部27は、予測状態情報F(t+1)の補正が不要であると判定してもよい。この場合、状態検証部27から未来状態予測部26に補正情報G(t)が送られなくてもよいし、予測状態情報の補正が不要であることを実質的に示す補正情報G(t)が状態検証部27から未来状態予測部26に送られてもよい。
 状態検証部27から未来状態予測部26に補正情報G(t)が送られない場合、未来状態予測部26は制御指令データC(t)に基づいて予測状態情報F(t+1)を導出する。補正が不要であることを示す補正情報G(t)が状態検証部27から未来状態予測部26に送られる場合、未来状態予測部26は、補正情報G(t)による補正を実質的に受けていない予測状態情報F(t+1)を、制御指令データC(t)に基づいて導出する。
 そして計画部25では予測状態情報F(t+1)に基づいて制御指令データC(t+1)が生成され(S34)、当該制御指令データC(t+1)が計画部25から第2遅延素子24を介してアクチュエーション部22に送られる。
 そして、アクチュエーション部22は制御指令データC(t+1)に基づいて駆動される(S35)。
 このように上記初期段階の後では、上述のステップS31~S35が繰り返されることにより、予測状態情報及び補正情報から生成される制御指令データに基づいて、アクチュエーション部22の駆動が継続的に制御される。
 特に、未来状態予測部26が生成する予測状態情報は、移動装置10の現実の状態を示すセンシング部21からの状態情報に基づいて補正され、計画部25が生成する制御指令データはそのような補正後の予測状態情報に基づいて導出される。
 そのため、移動装置10の現実の状態に適合した制御指令データを計画部25で生成することができ、そのような制御指令データに基づいて、移動装置10の現実の状態に最適化されたアクチュエーション部22の駆動制御を行うことができる。
 なお本例では、状態検証部27における検証の結果、状態情報S(t)と予測状態情報F(t)との間の相違が許容基準よりも大きい場合、状態検証部27は停止指示信号Eを計画部25に送信する。計画部25は、停止指示信号Eを受信した場合、アクチュエーション部22の駆動制御を終了する制御指令データをアクチュエーション部22に送り、アクチュエーション部22の駆動が停止される。
 以上説明したように本実施形態によれば、未来状態予測部26が導出する予測状態情報の正確さが、センシング部21のセンシング結果(状態情報)に基づいて検証される。そして当該検証の結果から生成される補正情報に基づいて予測状態情報は補正され、当該補正後の予測状態情報に基づいて制御指令データが生成され、当該制御指令データに基づいてアクチュエーション部22の駆動が制御される。
 これにより未来状態予測部26における予測状態情報の予測精度が向上し、移動装置10の実際の状態に応じた制御指令データが計画部25で生成され、移動装置10の実際の状態に最適化された制御によってアクチュエーション部22が駆動される。
 また検証の結果、予測状態情報と状態情報との間に許容できない乖離があった場合、アクチュエーション部22が安全モードで駆動され、移動装置10は緊急停止などの危機回避動作をとって、安全性を確保できる。
 また第1遅延素子23による遅延の影響を受けるセンシング部21からの状態情報は、そのような遅延の影響がアクチュエーション部22の駆動に対して実質的に影響を及ぼさない態様で、駆動精度の向上に役立つように利用される。そのため本実施形態によれば、予測不能な影響が移動装置10に作用しうる環境下においても、実際の移動装置10の状態に応じた最適なアクチュエーション部22の駆動制御を行うことができる。
[変形例]
 本開示の技術は、上述の実施形態には限定されない。
 例えば、上述の情報処理装置15及び情報処理方法の適用対象は限定されない。装置全体の位置が経時的に変わりうる移動装置(例えば車両)10に対してだけではなく、装置の一部の位置が経時的に変わりうる装置や、装置の姿勢や他の状態が経時的に変わりうる装置に対しても、上述の情報処理装置15及び情報処理方法は適用可能である。
 本明細書で開示されている実施形態及び変形例はすべての点で例示に過ぎず限定的には解釈されないことに留意されるべきである。上述の実施形態及び変形例は、添付の特許請求の範囲及びその趣旨を逸脱することなく、様々な形態での省略、置換及び変更が可能である。例えば上述の実施形態及び変形例が全体的に又は部分的に組み合わされてもよく、また上述以外の実施形態が上述の実施形態又は変形例と組み合わされてもよい。また、本明細書に記載された本開示の効果は例示に過ぎず、その他の効果がもたらされてもよい。
 上述の技術的思想を具現化する技術的カテゴリーは限定されない。例えば上述の装置を製造する方法或いは使用する方法に含まれる1又は複数の手順(ステップ)をコンピュータに実行させるためのコンピュータプログラムによって、上述の技術的思想が具現化されてもよい。またそのようなコンピュータプログラムが記録されたコンピュータが読み取り可能な非一時的(non-transitory)な記録媒体によって、上述の技術的思想が具現化されてもよい。
[付記]
 本開示は以下の構成をとることもできる。
[項目1]
 移動装置が具備するアクチュエーション部の制御に用いられる制御指令データの履歴のうちの1以上の制御指令データに基づいて、前記移動装置の未来の状態を表す予測状態情報を導出する未来状態予測部と、
 前記予測状態情報に基づいて前記制御指令データを生成する計画部と、
 を備える情報処理装置。
[項目2]
 前記計画部は、直前に生成した前記制御指令データを含む前記1以上の制御指令データに基づいて導出される前記予測状態情報から、次の前記制御指令データを生成する項目1に記載の情報処理装置。
[項目3]
 初期段階において、前記計画部は、センシング部から出力される前記移動装置の状態を表す状態情報に基づいて前記制御指令データを生成し、
 前記初期段階よりも後の段階において、前記計画部は、前記状態情報に基づくことなく、前記予測状態情報に基づいて前記制御指令データを生成する項目1又は2に記載の情報処理装置。
[項目4]
 センシング部から出力される前記移動装置の状態を表す状態情報と、前記予測状態情報との間の整合性を検証する状態検証部を備える項目1~3のいずれかに記載の情報処理装置。
[項目5]
 前記状態検証部は、前記状態情報と前記予測状態情報との間の整合性の検証の結果に基づいて補正情報を生成し、
 前記未来状態予測部は、前記1以上の制御指令データ及び前記補正情報に基づいて、前記予測状態情報を導出する項目4に記載の情報処理装置。
[項目6]
 前記計画部は、前記状態情報と前記予測状態情報との間の相違が許容基準よりも大きい場合、前記アクチュエーション部を安全モードで駆動させる前記制御指令データを出力する項目4又は5に記載の情報処理装置。
[項目7]
 前記移動装置は、前記アクチュエーション部及びセンシング部を具備し、前記センシング部から出力される前記移動装置の状態を表す状態情報に基づいて前記アクチュエーション部が制御されて自律的に移動する項目1~6のいずれかに記載の情報処理装置。
[項目8]
 前記移動装置は、車両である項目1~7のいずれかに記載の情報処理装置。
[項目9]
 移動装置が具備するアクチュエーション部の制御に用いられる制御指令データの履歴のうちの1以上の制御指令データに基づいて、前記移動装置の未来の状態を表す予測状態情報を導出する工程と、
 前記予測状態情報に基づいて前記制御指令データを生成する工程と、
 を含む情報処理方法。
[項目10]
 コンピュータに、
 移動装置が具備するアクチュエーション部の制御に用いられる制御指令データの履歴のうちの1以上の制御指令データに基づいて、前記移動装置の未来の状態を表す予測状態情報を導出する手順と、
 前記予測状態情報に基づいて前記制御指令データを生成する手順と、
 を実行させるためのプログラム。
10 移動装置
10F 装置前部
15 情報処理装置
21 センシング部
22 アクチュエーション部
23 第1遅延素子
24 第2遅延素子
25 計画部
26 未来状態予測部
27 状態検証部
C 制御指令データ
E 停止指示信号
F 予測状態情報
G 補正情報
S 状態情報
Tg 目標

Claims (10)

  1.  移動装置が具備するアクチュエーション部の制御に用いられる制御指令データの履歴のうちの1以上の制御指令データに基づいて、前記移動装置の未来の状態を表す予測状態情報を導出する未来状態予測部と、
     前記予測状態情報に基づいて前記制御指令データを生成する計画部と、
     を備える情報処理装置。
  2.  前記計画部は、直前に生成した前記制御指令データを含む前記1以上の制御指令データに基づいて導出される前記予測状態情報から、次の前記制御指令データを生成する請求項1に記載の情報処理装置。
  3.  初期段階において、前記計画部は、センシング部から出力される前記移動装置の状態を表す状態情報に基づいて前記制御指令データを生成し、
     前記初期段階よりも後の段階において、前記計画部は、前記状態情報に基づくことなく、前記予測状態情報に基づいて前記制御指令データを生成する請求項1に記載の情報処理装置。
  4.  センシング部から出力される前記移動装置の状態を表す状態情報と、前記予測状態情報との間の整合性を検証する状態検証部を備える請求項1に記載の情報処理装置。
  5.  前記状態検証部は、前記状態情報と前記予測状態情報との間の整合性の検証の結果に基づいて補正情報を生成し、
     前記未来状態予測部は、前記1以上の制御指令データ及び前記補正情報に基づいて、前記予測状態情報を導出する請求項4に記載の情報処理装置。
  6.  前記計画部は、前記状態情報と前記予測状態情報との間の相違が許容基準よりも大きい場合、前記アクチュエーション部を安全モードで駆動させる前記制御指令データを出力する請求項4に記載の情報処理装置。
  7.  前記移動装置は、前記アクチュエーション部及びセンシング部を具備し、前記センシング部から出力される前記移動装置の状態を表す状態情報に基づいて前記アクチュエーション部が制御されて自律的に移動する請求項1に記載の情報処理装置。
  8.  前記移動装置は、車両である請求項1に記載の情報処理装置。
  9.  移動装置が具備するアクチュエーション部の制御に用いられる制御指令データの履歴のうちの1以上の制御指令データに基づいて、前記移動装置の未来の状態を表す予測状態情報を導出する工程と、
     前記予測状態情報に基づいて前記制御指令データを生成する工程と、
     を含む情報処理方法。
  10.  コンピュータに、
     移動装置が具備するアクチュエーション部の制御に用いられる制御指令データの履歴のうちの1以上の制御指令データに基づいて、前記移動装置の未来の状態を表す予測状態情報を導出する手順と、
     前記予測状態情報に基づいて前記制御指令データを生成する手順と、
     を実行させるためのプログラム。
PCT/JP2022/033339 2021-10-04 2022-09-06 情報処理装置、情報処理方法、及びプログラム WO2023058382A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2021163748 2021-10-04
JP2021-163748 2021-10-04

Publications (1)

Publication Number Publication Date
WO2023058382A1 true WO2023058382A1 (ja) 2023-04-13

Family

ID=85803386

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2022/033339 WO2023058382A1 (ja) 2021-10-04 2022-09-06 情報処理装置、情報処理方法、及びプログラム

Country Status (1)

Country Link
WO (1) WO2023058382A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010173616A (ja) * 2009-02-02 2010-08-12 Nissan Motor Co Ltd 車両走行支援装置及び車両走行支援方法
JP2018106504A (ja) * 2016-12-27 2018-07-05 株式会社豊田中央研究所 情報管理制御装置、情報管理制御プログラム
WO2019069524A1 (ja) * 2017-10-02 2019-04-11 ソニー株式会社 環境情報更新装置、環境情報更新方法及びプログラム
JP2019185366A (ja) * 2018-04-10 2019-10-24 住友電気工業株式会社 情報処理装置、システム、方法、及びコンピュータプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010173616A (ja) * 2009-02-02 2010-08-12 Nissan Motor Co Ltd 車両走行支援装置及び車両走行支援方法
JP2018106504A (ja) * 2016-12-27 2018-07-05 株式会社豊田中央研究所 情報管理制御装置、情報管理制御プログラム
WO2019069524A1 (ja) * 2017-10-02 2019-04-11 ソニー株式会社 環境情報更新装置、環境情報更新方法及びプログラム
JP2019185366A (ja) * 2018-04-10 2019-10-24 住友電気工業株式会社 情報処理装置、システム、方法、及びコンピュータプログラム

Similar Documents

Publication Publication Date Title
JP5064524B2 (ja) 予測不可能で動的な複雑な環境において計画することを伴う自律型ロボット
CN109531565B (zh) 一种机械臂的控制方法、装置、服务机器人及存储介质
US9421687B2 (en) Robot control apparatus and robot control method
KR102118278B1 (ko) 희소 네트워킹 하의 다중 에이전트 조정
JP2018514403A (ja) ロボット操作を制御するシステムおよび方法
JP3907649B2 (ja) ロボット間の干渉防止制御装置
JP5768828B2 (ja) ロボットシステム、及び、ロボットシステムの制御方法
KR102370879B1 (ko) 협동로봇제어장치 및 협동로봇을 제어하는 방법
KR102528317B1 (ko) 차량 제어용 컨트롤러, 시스템 및 방법
US20180207798A1 (en) Robot control apparatus, robot system, robot control method and assembly manufacturing method
US11141861B2 (en) Method for operating a robot and robotic arm
JP6992719B2 (ja) 制御装置
US10507581B2 (en) Robot system
WO2023058382A1 (ja) 情報処理装置、情報処理方法、及びプログラム
US20200094410A1 (en) Control apparatus, and processing method and program therefor
JP2019021087A (ja) 制御装置、制御装置の制御方法、情報処理プログラム、および記録媒体
JP7003623B2 (ja) 制御システム
KR102289968B1 (ko) 로봇 매니퓰레이터를 제어하기 위한 장치 및 이를 위한 방법
Jeong et al. Control strategies for a humanoid robot to drive and then egress a utility vehicle for remote approach
KR102355021B1 (ko) 가상 환경에서 학습된 지능형 에이전트를 이용하여 실제 사물의 움직임을 제어하는 방법 및 장치
JP6476635B2 (ja) ロボットの制御装置及び制御方法
WO2014016989A1 (ja) 協調制御装置、協調制御方法および協調制御プログラムが格納された記録媒体
Lange et al. Classification and prediction for accurate sensor-based assembly to moving objects
JPH08282598A (ja) 人工衛星の姿勢制御装置
JP4206194B2 (ja) 液圧駆動装置の制御装置及び制御方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22878253

Country of ref document: EP

Kind code of ref document: A1