WO2014141351A1 - 自律制御装置 - Google Patents

自律制御装置 Download PDF

Info

Publication number
WO2014141351A1
WO2014141351A1 PCT/JP2013/056559 JP2013056559W WO2014141351A1 WO 2014141351 A1 WO2014141351 A1 WO 2014141351A1 JP 2013056559 W JP2013056559 W JP 2013056559W WO 2014141351 A1 WO2014141351 A1 WO 2014141351A1
Authority
WO
WIPO (PCT)
Prior art keywords
constraint
control logic
autonomous
control device
expected
Prior art date
Application number
PCT/JP2013/056559
Other languages
English (en)
French (fr)
Inventor
昌能 西
Original Assignee
株式会社 日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社 日立製作所 filed Critical 株式会社 日立製作所
Priority to JP2015505094A priority Critical patent/JP6141964B2/ja
Priority to EP13878317.0A priority patent/EP2975481A4/en
Priority to PCT/JP2013/056559 priority patent/WO2014141351A1/ja
Priority to US14/650,111 priority patent/US9983553B2/en
Publication of WO2014141351A1 publication Critical patent/WO2014141351A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0205Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system
    • G05B13/026Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system using a predictor
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W30/00Purposes of road vehicle drive control systems not related to the control of a particular sub-unit, e.g. of systems using conjoint control of vehicle sub-units
    • B60W30/08Active safety systems predicting or avoiding probable or impending collision or attempting to minimise its consequences
    • B60W30/09Taking automatic action to avoid collision, e.g. braking and steering
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/0088Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots characterized by the autonomous decision making process, e.g. artificial intelligence, predefined behaviours
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/196Recognition using electronic means using sequential comparisons of the image signals with a plurality of references
    • G06V30/1983Syntactic or structural pattern recognition, e.g. symbolic string recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads

Definitions

  • the present invention relates to an autonomous system operating in an open environment and an autonomous operation control device that determines the operation of the autonomous system.
  • an autonomous mobile robot heading for a destination while satisfying the condition of a sound operation to avoid a collision with a person moving around indefinitely as shown in Patent Document 1 or
  • an autonomous work system that executes a predetermined work
  • a totally autonomous traveling type vehicle that uses a route generation function to a remote destination in combination.
  • Patent Document 2 a robot having an autonomous movement function in a closed environment is presented.
  • Patent Document 3 includes an autonomous work system in which a user steers remotely via a communication path.
  • the remote pilot can be configured to be able to select between the remote control function and the autonomous operation function in real time, and the remote pilot can pre-program the expected operation or instruct the operation on a low frequency as needed.
  • An example is described where the work system implements the indicated expected behavior.
  • Patent Document 4 as a semi-autonomous system in which the pilot rides the system and directs an expected operation directly, an intervention control is performed to detect a distance between vehicles and avoid a collision between adjacent vehicles.
  • an autonomous system specialized for driving assistance which has a function.
  • the operation mode and the corresponding control logic are incorporated in the form of a program etc., and it is difficult for a third party to directly refer to or evaluate at the time of operation.
  • the information obtained through observation is ultimately limited to the behavior realized through the control logic.
  • the operation mode in which the soundness of the operation is not verified is that the control logic designed corresponding to the operation mode assumed in the design stage satisfies the soundness of the operation. In other words, it corresponds to the operation in the state that does not satisfy the premise assumed implicitly.
  • Such an operating condition is not assumed at the time of design, and thus will be corrected one by one if it is discovered through real machine testing.
  • the coverage of the operating environment actually encountered and the soundness of the corresponding control logic are considered. Hard to guarantee.
  • there is a problem that the number of operation modes to be assumed and the number of control logics to be designed are combined and explosively increased according to the variety of external factors accompanied by setting or changing of the non-intrusion area.
  • an operation control logic for realizing an operation adapted to an internal factor of the own system and an external factor in the open external environment acquired by the external world measurement means based on the operation control logic stored in the storage device.
  • the autonomous control device that generates and instructs the drive device to operate in the open external environment includes the operation control logic and the restriction condition corresponding to the external factor and the internal state of the own system, which the autonomous control device has acquired from the external world measurement means.
  • the operation control logic and the control logic are generated from the constraints related to the expected operation and the soundness of the operation required for the own system each time the system is sequentially rebuilt, and the generated operation control logic and the external world measuring means
  • An autonomous operation control device that writes information acquired from the device to the recording device and instructs the operation of the own system based on the control logic, and the autonomous operation control Based on the determination result of the soundness of the expected operation and operation by the device, comprising the expected operation determining unit for instructing the expected behavior that is required of the local system.
  • a sound operation is realized by sequentially generating control logic whose operation soundness is verified by an operation mode adapted to a changing external factor, and at the same time, the generated control logic is recorded and presented to operate.
  • a third party can confirm the soundness of the operation by referring to the decision process.
  • Configuration of autonomous system Processing flow of autonomous operation control device Definition of closed area Representation of constraints and formulas Control logic L definition Representation of motion by constraint form Representation of behavioral rules and expected behavior by relaxed conditional constraint form Processing flow of construction of data structure indicating connection relationship between partial areas 2 Classification and judgment method of connection relation of closed area Example of division into partially closed regions Functional block diagram of constraint form conversion means A Conversion rules used by the constraint form conversion means A Processing flow of constraint format conversion means A Functional block diagram of constraint format conversion means B Example of a program that indicates expected behavior Control structure of program that indicates expected behavior decision logic Processing flow of constraint format conversion means B Processing flow of expected behavior determination logic Generation of operation control logic T and control logic L Analysis of connection between closed regions List of action control logic that can be executed Movement operation between two closed areas instructed by the operation control logic exemplified in FIG.
  • Control of autonomous system by remote pilot Internal configuration diagram of autonomous traveling system Autonomous traveling system that operates to enter an intersection Contents of the autonomous traveling control program used in the third embodiment Conversion rules used by the constraint form conversion means A in the third embodiment Relaxed conditional constraint form K output by the constraint form conversion means A in the third embodiment Operation control logic generated when the signal value is not red in the third embodiment
  • FIG. 1 shows a block diagram of an autonomous system.
  • the autonomous system 01 operating in an open external environment includes an autonomous control device 010, an external measurement unit 011, an internal state measurement unit 012, a presentation device 013, and a drive device 014.
  • the autonomous control device 010 includes an autonomous operation control device 0101, a recording device 0102, an expected operation determination logic 0103, a constraint type conversion unit A (0104), and a constraint type conversion unit B (0105).
  • Constraint type conversion means A (0104) converts information of the open external environment obtained through the external world measurement means 011 into a restriction form and passes it to the autonomous operation control device 0101.
  • the recording device 0102 stores the generated record 0102 of the operation control logic generated by the autonomous operation control device 0101.
  • the autonomous operation control device 0101 presents the generated record 0102 of the operation control logic to the presentation device 013 as necessary.
  • the expected operation determination logic 0103 operates based on the expected operation instruction program 01031, and the constraint format conversion means B 0105 converts the expected operation determination logic 0103 into a constraint format and passes it to the autonomous operation control device 0101.
  • the autonomous operation control device 0101 determines the satisfiability of the expected behavior converted to the constraint format, and returns the result as satisfiable, satisfiable, or processing complete.
  • the autonomous operation control device 0101 outputs a control command to the drive device 014 after the process shown in FIG.
  • FIG. 2 shows a process flow performed by the autonomous control device 010.
  • step 021 a list of constraint types output from the constraint type conversion means A (0104) and the constraint type conversion means B (0105) is received and a constraint type to be processed is set.
  • the list of constraint types received in step 021 is stored in the recording device 0102.
  • step 023 operation control logic T of the entire autonomous system 01 that satisfies the list of constraint types set in step 021, and control logic L for calculating control commands to be output to the drive device 014 are generated. Then, in step 024, it is verified that the operation control logic T and the control logic L which satisfy all the constraint types set in step 021 can be realized. If it is determined that the verification result is feasible, the process proceeds to step 026. In step 026, the operation control logic T and the control logic L are stored in the recording device 0102. On the other hand, if it is determined that the method can not be realized, the process proceeds to step 025. The list of constraint types recorded in step 022 is read out, and at least a part of the constraint types set in step 021 is relaxed. For example, if the constraint that can not be satisfied in step 024 can be relaxed, it is replaced with a relaxed constraint type. Subsequently, the process proceeds to step 021 to repeat the process.
  • step 026 After recording the operation control logic T and the control logic L in step 026, the process proceeds to step 027, and a control command is output to the drive device 014 based on the control logic L. Then, in step 028, it is checked whether the constraint type set in step 021 is not updated. If the constraint type is not updated, the process returns to step 027 to continue the operation based on the same control logic L, and when updated, the process returns to step 021.
  • FIG. 3 shows the definition of a constraint that represents a closed region REGION (Y) by combining a plurality of constraints (COND_0 (Y) to COND_3 (Y)).
  • This constraint is constructed as a conjunction of individual constraints which determine the inside of the half plane group which gives the face of the closed region in the parameter space Y representing the internal state.
  • FIG. 4 shows operators and their notations for combining complex constraints by combining the constraints.
  • a method of expressing the operation output by the control logic L will be described with reference to FIG. 5 using the constraints indicating the closed region and the conditional constraints.
  • the point P0 in the closed region R0 & (! R1) passes through the point P1 in the closed region R0 & R1 and then the closed region!
  • the action of moving to point P2 in R0 & R1 is represented as Action.
  • FIG. 6 shows the definition of a constraint form (operator) having the constraint condition Ci as an argument.
  • the operator X [C0] for the constraint C0 is a constraint form that expresses conditional behavior. This is a constraint form that expresses an operation that satisfies the constraint condition C0 serving as an argument (the evaluation value of the constraint condition C0 is TRUE) in the following order with respect to the appropriately set sequence.
  • the operator [C0] R [C1] for the constraints C0 and C1 is a constraint form that represents conditional operations.
  • the operator [C0] W [C1] for the constraints C0 and C1 is a form of constraint that expresses conditional operations.
  • FIG. 7 shows the definition and expected behavior of the relaxed conditional constraint form having the constraint form Ci as an argument.
  • Each relaxed conditional constraint type is given by the logical sum of one or more constraint types, and is classified based on the relaxability of the constraint on the ordered sequence. Then, the presentation content to the presentation device 013 corresponding to the case of applying the relaxation condition is defined for each relaxation condition-bound type.
  • the autonomous operation control device 0101 receives, from the constraint type conversion means A (0104) and the constraint type conversion means B (0105), data of a constraint type represented by these operators and expression forms.
  • binary coding is performed by setting the inside including the outer edge of the closed region to 1 and the outside to 0. Then, according to the processing flow shown in FIG. 8, in the situation where the closed region group X has already been defined in S901, when a single closed region Y is newly added in S902, the closed region group X is added as shown in FIG.
  • the two closed regions of Case 1 coincide, the two closed regions of Case 3 are separated if the two closed regions of Case 2 partially overlap and are in contact with each other, based on the connection relationship between If the two closed regions of Case 4 are in the inclusion relationship, if the two closed regions of Case 5 are in the covering relationship, if one closed region of Case 6 divides the other closed region, It is classified into either.
  • the constraint condition [C0 & C1] is set using the constraint condition C0 for expressing the closed region X and the constraint condition C1 for expressing the closed region Y.
  • SAT a solution that satisfies
  • UNSAT UNSAT
  • the constraint condition [! There is no solution that satisfies C0 & C1]
  • constraints [! C0 &! It corresponds to the case where there is a solution that satisfies C1].
  • the criteria for satisfying solution shown in FIG. 9 may be applied to each combination of constraints.
  • connection relationship of the partially closed regions divided by the closed regions is updated, and in S905, the region is added based on the update result.
  • FIG. 10 shows an example of sequentially adding the constraint condition C1 indicating the closed region R1 and the constraint condition C2 indicating the closed region R2 to the constraint condition C0 indicating the closed region R0 in the process illustrated in FIG. .
  • R1 is newly set as the closed region ID.
  • S903 it is determined that the closed regions R0 and R1 are classified into the case 2 shown in FIG. 9, and the closed region R0 is divided into R0-0 and R0-1 in S904, and the closed region R1 is R1.
  • R0-0 and R0-1 and R1-0 and R1-1 are originally continuous, these connections are added to update the connection relationship, and R0-1 and R1-1 are case 1 (2 Since the closed regions correspond to one another), the connection relationships are updated by adding the connection relationships of R0-1 to R1-0 and R1-1 to R0-1. The process is similarly performed when the closed region R2 is added.
  • FIG. 11 shows functional blocks of the constraint format conversion means A (0104).
  • the constraint type conversion means A (0104) As shown in FIG. 12, the classification of the recognition object, the list of constraints defined in relation to each object, the state value of the recognition object, and the recognition object A template of a relaxation conditional constraint type that indicates the corresponding operation rule is provided in advance as a conversion rule.
  • a relaxation conditional constraint form is generated for each individual recognition object, and the logical product K (01045) is added to the autonomous operation control device 0101 together with the constraint form list. Output.
  • the external recognition unit 01041 receives the information M (0111) of the recognition target acquired by the external measurement unit 011, and the external recognition unit 01401 classifies the recognition target according to the conversion rule template ( S1701). Then, a restriction condition list is set for each classification of the recognition target (S1702), and the state value for each classification of the recognition target is obtained and set (S1703), and the restriction generation unit 0104 is used to recognize the recognition target. In each case, a relaxation conditional constraint form is specified that indicates the operation rule specified by the template (S1704). Then, the logical product K of the set relaxation conditional constraints is generated and output to the autonomous operation control device 0101 (S1705).
  • the state value of the recognition target object set through the external world recognition unit 01041 is combined with the internal state value of the autonomous system 01 acquired through the internal state measurement unit 012 to make the autonomous operation control device 0101 as an observation point of the current state. Output.
  • the external world measurement means 011 is a means for acquiring information necessary when the autonomous system 01 acts in an open external environment, and is not limited to a passive device represented by an imaging device or a measure sensor.
  • the input data to the external world recognition unit 01041 may be received from the system in the open external environment through some communication path.
  • the expected operation determination logic 0103 outputs the relaxation conditional constraint type E to the autonomous operation control device 0101 to the autonomous operation control device 0101 through the constraint type conversion means B (0105), The process until the expected operation control logic 0103 resets the output value will be described based on the response (SAT: saturable, UNSAT: non-satisfied, COMP: completed).
  • the expected operation determination logic 0103 internally includes an expected operation instruction program 01031 for generating an expected operation as shown in the example of description shown in FIG. 15, and the operation control shown in FIG. In accordance with the logic, a list of relaxation conditional constraints is instructed to the constraint format conversion means B. The expected operation determination logic 0103 continues the operation from the operation start to the operation stop condition according to the process flow shown in FIG. 17 with reference to the operation ID shown in FIG.
  • the minimum unit of the program that instructs the expected operation is defined for each operation ID, and an operation described in the relaxation conditional constraint form 010311, an operation completion determination condition described as a constraint condition 010312,
  • the transition destination designated for each of the three types of responses (SAT, UNSAT, COMP) returned from the autonomous operation control device 0101 to the expected operation determination logic 0103 The operation is performed based on the control logic composed of the operation IDs (in order of 010313, 010314, and 010315).
  • the initial value of the action ID is described as IDS
  • the final state is described as IDE.
  • FIG. 17 shows the process flow of the constraint type conversion means B (0105).
  • the expected operation E (010311) of the relaxed conditional constraint format corresponding to this operation ID, the judgment condition of operation completion 010312, and the branch after obtaining the response
  • the transition destination operation ID (010314) after completion of the operation is acquired from the conditions (S2202, S2203, S2204).
  • an operation 010311 of a relaxation conditional constraint format corresponding to the acquired transition destination operation ID after operation completion is acquired (S2205), and a relaxation conditional constraint format E instructing the expected operation and the constraint format E are configured.
  • a list of constraint conditions and the operation completion condition 010312 are output to the autonomous operation control device 0101 (S2206, S2207, S2208).
  • FIG. 18 shows the process of responding to the autonomous operation control device 0101 in the specified operation ID.
  • the operation ID is set to the initial value IDS, and the processing flow of the constraint format conversion means B shown in FIG. 17 is executed (S2302), and a response from the autonomous operation control device is awaited (S2303).
  • SAT satisfiable
  • the process when satisfiable is executed, and then the process returns to S2303 to continue to wait for a response.
  • the response value is complete (COMP)
  • processing S2306 is executed.
  • the response value is unsatisfiable (UNSAT)
  • processing S2305 is performed when the response value is unsatisfiable.
  • FIG. 19 shows a flow of processing for generating the operation control logic T and the control logic L. This corresponds to the process of step 023 in FIG.
  • an initial process is performed to analyze the connection relationship between partially closed areas and closed areas divided by overlapping of the closed areas.
  • the relaxed conditional constraint form K passed to the autonomous operation control device 0101 in FIG. 11 and the constraint condition list as an argument
  • the relaxed conditional constraint form E passed to the autonomous operation control device 0101 in FIG. Get the constraint list that becomes
  • step 02301 the correspondence between the partially closed area and the constraint condition and the connection relation between the partially closed areas are generated along the processing flow shown in FIG. 8 (step 02301), and the logical state value is generated.
  • an operation rule A which is a relaxation conditional constraint form is newly set as a logical product of the relaxation conditional constraint forms K and E (step 02305).
  • FIG. 21 is a list for recording what can be realized by the operation control logic T generated in step 023.
  • the first is an empty set, and the RINIT is added to the list of operation control logic IDs.
  • the list of motion control logics shown in FIG. 21 is not an empty set, the processing that follows is continued.
  • step 02390 one operation control logic is selected by giving priority to those to which the "relaxation condition given to the expected operation" is not applied. As an example, one having a small value of the operation execution order ID required to complete the operation may be selected.
  • Each operation control logic T_i is specified as a chain of closed area IDs to be transitioned for each operation execution order ID, and as long as the definition of closed areas shown in FIG. The truth value of the condition is to be inverted. Using this characteristic, in accordance with the procedure shown in FIG. 19, in step 02391, a control logic L corresponding to each transition between closed regions is determined as a constraint condition.
  • the autonomous operation control device 0101 returns a response of satisfiable (SAT) to the expected operation control logic 0103 (step 02307), and ends the operation.
  • SAT satisfiable
  • step 02304: No If operation control logic that does not satisfy the operation completion determination condition (010312) remains in the list shown in FIG. 21 (step 02304: No), the process of generating the operation control logic T is continued.
  • one operation control logic that does not satisfy the operation completion determination condition (010312) is selected from the list of FIG. 21 and is referred to as TTMP.
  • the closed region ID corresponding to the maximum operation execution order ID shown in FIG. 21 is obtained for TTMP, the true / false value of each constraint condition constituting the closed region is evaluated, and binary coding is performed.
  • the transition destination closed regions having a connection relationship from the region ID it is evaluated whether there is any one satisfying the operation rule A set in step 02305.
  • step 02303 when the list of operation control logic T shown in FIG. 21 becomes an empty set, the autonomous operation control device 0101 returns a response of unsatisfiable (UNSAT) to the expected operation control logic 0103 (step 02308), end the operation.
  • UNSAT unsatisfiable
  • step 02306 the transition destination closed regions are updated to the operation control logic added to the operation control logic TTMP.
  • the relaxation condition V is shown in FIG. It records in the corresponding part corresponding to operation control logic TTMP.
  • step 02307 or 02308 is reached and terminated.
  • the autonomous operation control device 0101 ends the processing step 023.
  • FIG. 22 shows a problem of generating an operation in which the closed region ID becomes R2-2 within the range where the region ID does not become EXTERIOR from the state of the closed region ID being R0-0 shown in FIG.
  • operations for R0-0 to R0-1, R1-0, R1-1, R1-2, R2-1, and finally R2-2 are generated, and the final operation is performed.
  • the operation control logic shown in FIG. 21 is obtained.
  • step 02307 is reached in FIG. 19, it is regarded as verification success in step 024, and the process proceeds to step 026.
  • the list of the operation control logic T (02392) generated according to the processing flow shown in FIG. 19 and all the control logic L_i associated with each operation control logic T_i are stored in the recording device 0102. Then, in step 027, the control logic L is executed to output a control command to the drive unit 014.
  • a dynamic model of the autonomous system 01 to be controlled is acquired. This may be obtained in advance by system identification or may be generated during operation.
  • step 02310 the control logic L generated at step 02391 is obtained.
  • step 02311 the true / false value of the constraint condition list shown in FIG. 12 is evaluated using the observed value 01044 in the current state, and the closed region ID to which the state value belongs is calculated.
  • step 02312 of the control logic L_i acquired in step 02310, the control logic L [k] to be immediately executed from the current state is selected.
  • the purpose of use of the presentation device is to present the unsatisfiable constraint form generated in the process of executing the expected operation to the outside of the autonomous system, and is not limited to the form represented by the visual display device.
  • the presentation content may be transmitted to other systems existing in the open external environment through the communication path.
  • steps 02313 and 02314 logical state values corresponding to the individual constraint conditions giving the transition source closed region and the transition destination closed region are acquired, and in step 02315, the constraint condition Cp whose true / false value is inverted is specified.
  • This restriction condition defines a closed region which enters or exits in the process of moving from the transition source closed region to the transition destination closed region according to the control logic L [k].
  • step 02316 The true / false value of the constraint condition described in step 02316 is evaluated, and the process transitions to step 02317 or step 02318.
  • Step 02317 corresponds to the movement from the outside to the inside of the closed region Cp.
  • the condition described in step 02317 that is, the expanded closed region Cp becomes expanded so as to include the observed value Y (t) of the current state for the first time
  • Y (t) the observed value of the current state for the first time
  • step 02319 it is determined whether or not there is a control input sequence such that the observed value 01044 in the current state approaches the inside of the closed region Cp. If it exists, the calculated control input value is output to the drive device 014, and in step 02322, the judgment condition 010312 of the operation completion which should be satisfied at the end of execution of the control logic L [k] is evaluated. If the operation completion condition is not satisfied, the process returns to step 02317. If the operation completion condition is satisfied, the process proceeds to step 02323, the operation completion (COMP) is transmitted to the expected operation determination logic 0103, and step 027 is ended. Conversely, if there is no control input sequence in step 02319, the control logic L can not be executed, and it corresponds to the operation control logic L selected in step 02310 from the list of operation control logics registered in FIG. Delete the operation control logic T_i.
  • step 02325 operation control logic not including the control logic L [k] determined to be unexecutable in step 02319 is searched from FIG. If there is, the process goes to step 02327 to reset the operation control logic and the control logic, and returns to step 02311. If not, the process proceeds to step 02326, returns unsatisfiable (UNSAT) to the expected operation control logic 0103, and ends the processing.
  • UNSAT unsatisfiable
  • step 02318 corresponds to an operation of coming out from the inside of the closed region Cp.
  • the condition described in step 02318, that is, the reduced closed region Cp is the maximum of the reduction parameter s including the observed value Y (t) in the current state.
  • the integer value By calculating the integer value, an operation of leaving the transition source closed region while realizing the transition destination closed region is realized.
  • step 02320 it is determined whether or not there is a control input sequence such that the observed value 01044 in the current state approaches the inside of the closed region Cp.
  • the calculated control input value is output to the drive device 014, and in step 02328, the judgment condition 010312 of operation completion which should be satisfied at the end of execution of the control logic L [k] is evaluated.
  • step 02318 If the operation completion condition is not satisfied, the process returns to step 02318. If the condition is satisfied, the process proceeds to step 02323, the operation completion (COMP) is transmitted to the expected operation determination logic 0103, and step 027 is ended.
  • COMP operation completion
  • control logic L can not be executed, and the operation corresponding to the control logic L selected in step 02310 from the list of operation control logics registered in FIG. Delete control logic T_i.
  • step 02325 operation control logic not including the control logic L [k] determined to be unexecutable in step 02319 is searched from FIG. If there is, the process goes to step 02327 to reset the operation control logic and the control logic, and returns to step 02311. If not, the process proceeds to step 02326, and the expected operation control logic 0103 is returned with the response that it can not be satisfied (UNSAT), and the processing is terminated.
  • FIG. 26 shows the operation record that the autonomous operation control device 0101 outputs to the presentation device 013 at step 02329 and the generation record 0102 of the operation control logic stored in the recording device 0102 in the whole process of FIG.
  • At least the generation record 0102 of the operation control logic includes external measurement information M (0111), time-series data of the observed value 0104 in the current state, and the relaxation condition restriction form K (01045) indicating the operation rule shown in FIG. And a constraint condition list serving as an argument, a program 01031 instructing an expected operation, a relaxation conditional constraint form E (01032) instructing an expected operation, a constraint condition list serving as an argument, and the list shown in FIG.
  • Operation 010311 corresponding to expected operation E determined to be unrealizable (UNSAT) in step 02308 or 02326, control logic L associated with each list of operation control logic T (02392) and each operation control logic Control logic L selected and executed at step 02310 in 027, step during operation Infeasibility determined to be deleted operation control logic T_i in 2324, and a control logic L_i associated with the operation control logic T_i.
  • UNSAT unrealizable
  • the healthy operation is defined.
  • the operation mode is reconfigured during operation (step 02327) using a function (steps 023 and 024) that derives a combination that can satisfy both the required requirements and the expected operation, and the control logic for realizing the expected operation is concurrently processed.
  • the autonomous operation control device 0101 to be generated the external factor dynamically changing in the open environment, the requirement for defining the soundness of the operation (01045 realized in the form of a relaxation conditional constraint), the expected operation (in a relaxed conditional constraint form) And a function to record the realized 0103) and the generated control logic (02392) on the recording device 0102 in a form that can be viewed by a third party, It has achieved an autonomous system 01 to operate while presenting to a third party in response.
  • step 02308 If the autonomous operation control device 0101 inside the autonomous system 01 reaches the unsatisfiable (UNSAT) in step 02308 or step 02326, all the operations indicated by the expected operation determination logic 0103 become unsatisfiable as well.
  • the operation ID inside the expected operation determination logic reaches [Stop (IDE)] and stops operation.
  • the third party who evaluates the operation soundness of the autonomous system in particular the individual operations 010311 that the expected operation determination logic 0103 sequentially instructed are It is possible to know the process finally determined to be unrealizable (UNSAT) by the processing inside the autonomous operation control device 0101 (step 02324) and the factor that became unsatisfiable.
  • UNSAT unrealizable
  • the designer of the autonomous system 01 corrects the program 01031 instructing an expected operation to generate the constraint type E (01032) determined to be unsatisfiable, or the operation rule set in the constraint type setting unit 0104
  • the problem is solved by means such as adding a new file in the setting unit 01043.
  • FIG. 27 shows an aspect of an autonomous system having a function to be steered by the remote pilot 02 via a communication path.
  • the autonomous system 01 configured as in the first embodiment is disposed at a remote place, and the operation instruction 0201 is issued as needed with reference to the external world measurement information and the internal state measurement information acquired through the communication path 0202, and the expected operation
  • the decision logic is configured to convert to the expected operation (01032). If the operation control logic T can not be generated, the remote pilot substitutes the process executed in step 025 so that a sufficient solution for achieving the sound operation exists.
  • Patent Document 3 shows a method of combining the case of operating in the fully autonomous mode and the case of operating by remote control in real time.
  • the soundness of operation depends on factors such as the quality of the communication path, that is, the bandwidth and response delay time, and the blocking of the communication path.
  • Such a configuration makes it possible to easily issue and update various expected operations without depending on the quality of the communication path, and ensure the operation soundness of an autonomous system operating at a remote location while remote control is performed.
  • the availability at the time of operation can be greatly improved.
  • the increased availability appears in particular in that the number of autonomous systems that can be manipulated by the remote pilot per person can be significantly increased beyond one.
  • the autonomous system itself can execute functions related to the determination and solution of the operation soundness. Therefore, the remote pilot needs to perform remote control operation on the autonomous system only when the expected motion generated from the motion command is not satisfied. As a result, one remote pilot can transmit operation commands to a plurality of autonomous systems and be operated in parallel. (Example 3)
  • Example 3 an example of a traveling control function of an autonomous traveling system in an open city environment to which the present invention is applied will be shown.
  • FIG. 1 The block diagram of the autonomous traveling system 03 is shown in FIG.
  • the autonomous traveling system 03 operating in the open external environment is composed of an autonomous traveling control device 030, an external measuring means 031, an internal state measuring means 032, a presentation device 033, and a driving device 034.
  • the autonomous control device 030 is an autonomous traveling control The apparatus 0301, the recording apparatus 0302, the expected operation determination logic 0303, the restriction form conversion means A (0304), and the restriction form conversion means B (0305).
  • FIG. 29 shows the appearance of the operating environment in the case where the autonomous traveling system 03 shown in FIG. 28 executes an operation for crossing the intersection with a signal toward the target point SGOAL.
  • FIG. 30 shows the operation command described in the autonomous traveling control program 03031 in this case.
  • the operation ID is ID 0
  • an operation to go into the SGOAL is instructed from the initial state (030311 and 030312).
  • the autonomous operation control device 0301 determines that the expected operation can be satisfied (030313)
  • the expected operation is continued and the operation ID is maintained at ID0.
  • the autonomous operation control device 0301 determines that the expected operation can not be satisfied (030315)
  • the expected operation is cleared and the operation ID is set to IDE. Thereafter, from the operating environment shown in FIG. 29, the mode is shifted to a mode for generating an operation from the relaxed conditional constraint type K indicating the operation rule specified by the constraint type conversion unit A0304 through the external world measuring unit.
  • FIG. 31 corresponds to the conversion rule used by the constraint type conversion means A shown in FIG. 12 in this embodiment. Take roads, traffic lights, intersections, pedestrians and vehicles as objects to be recognized.
  • the output content to the display device 033 is set corresponding to the satisfiability of each relaxation conditional constraint type K.
  • the autonomous motion control device (0301) in the autonomous traveling system in the operating environment shown in FIG. 29 corresponds to the processing flow (step 02301) in which the connection relationship between closed regions shown in FIG. 20 is analyzed.
  • the connection relationship of the closed region set for each recognition object is analyzed by the processing described above.
  • the external world recognition unit 03041 inside the restriction format conversion means A0304 for example, the road 0 in the straight direction, the road 1 in the cross direction, the signal 0 for traffic control, and As shown in FIG. 32, according to the format shown in FIG. 12, registration is performed as shown in FIG.
  • the constraint condition generation unit 03042 sets a constraint condition group according to the contents defined in FIG. 31 for each recognition target.
  • the restriction format setting unit 0304 sets the relaxation condition restriction format K in accordance with the contents defined in FIG. 31 for each recognition object.
  • FIG. 26 shows operation control logic T corresponding to FIG. 21 in the operating environment shown in the present embodiment.
  • FIG. 28 shows operation control logic for realizing the expected operation shown in FIG. 30 obtained through the process flow shown in FIG. 19.
  • the control operation is started from the case where the initial state is inside the closed region R0-0-1, and the closed region R0-1-1 and the closed region R0-2-0-1, and finally the closed region R0-2 -1-1 represents the logic of an operation for transition to the inside.
  • This operation satisfies the judgment condition of operation completion in the case where the operation ID is ID 0 shown in FIG. 30, that is, the condition that the constraint condition C3 becomes 1, and realizes the expected operation.
  • control logic L [0] shown in FIG. 23 is used to generate the processing flow of control logic shown in FIG. 26, which corresponds to the process of transitioning from 0 to 1 in the operation order ID.
  • the operation execution order ID shown in FIG. 30 corresponds to 3 as a process of entering the area with the intersection while staying in the area of road 0 while the operation is realized through The operation is continuously continued according to the processing flow shown in FIG. 23 until the determination condition (030312) of is satisfied. After that, as shown in FIG. 30, the operation ID is transited to IDE to stop the operation.
  • the present invention can be used for a fully autonomous vehicle operating in an open environment including a public road, and an unmanned taxi and an unmanned car rental service to a passenger's waiting position. Further, it can be used for an automobile having an auto cruise function and a collision avoidance function which travel at a constant speed without contacting surrounding traveling vehicles. In addition, it is a working machine that controls through a communication path in a remote place typified by mine, deep underground, and seabed, and can be used for autonomously judging and operating so as to satisfy constraints on operational safety.

Landscapes

  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Transportation (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Business, Economics & Management (AREA)
  • Mechanical Engineering (AREA)
  • Game Theory and Decision Science (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
  • Stored Programmes (AREA)

Abstract

 動的に変化する外部要因に適応して、第三者に対して動作の健全性を証明出来る形で期待動作を実現する自律システムを提供すること、および自律動作時の稼働率を向上すること。 外界計測手段を通じて得た動作環境の情報を元に、動作健全性の要件と期待動作とを共に充足可能な組み合わせを動的に導出する機能、前記期待動作を実現する制御論理を生成する機能、前記制御論理、前記健全動作の要件、前記期待動作とを記録する機能、および前記記録を第三者による閲覧が可能な形で提示する機能を備える自律システム。

Description

[規則37.2に基づきISAが決定した発明の名称] 自律制御装置
 本発明は、開放環境で動作する自律システム及びその自律システムの動作を決定する自律動作制御装置に関する。
 従来から、操縦者の介在を必要とせず、動作環境の状況の計測手段を搭載し、内蔵のプログラムに従って自己動作を判断及び調整する自律機能を有するシステムに関する研究が行われてきた。
 具体的な自律システムの事例として、特許文献1に示されるような、不確定的に移動する周辺の人との衝突を回避するという健全動作の条件を充足しながら目的地に向かう自律移動ロボットや、当該移動機能に加え、所定の作業を実行する自律作業システム、遠隔目的地までの経路生成機能を併用した全自律走行型の自動車が挙げられる。
 特許文献2では、閉鎖環境において自律移動機能を有するロボットが提示されている。
 特許文献3では、通信経路を介して遠隔で操縦する自律作業システムが挙げられる。この事例では、リアルタイムでの遠隔操縦機能と自律的動作機能とを選択出来るように構成して、遠隔操縦者が期待動作を事前にプログラムするか又は低頻度で必要に応じて指示し、前記自律作業システムが指示された期待動作を実現する例が言及されている。
 特許文献4では、操縦者がシステムに同乗し、直接に期待動作を指示することを常態とする半自律システムとして、車間距離を検知して近隣走行車間の衝突を回避するように介入制御をする機能を有する、走行補助に特化した自律システムが挙げられる。
特開2009-157735号公報 特開2009-80804号公報 特開2012-51560号公報 特開2012―30665号公報
 開放環境で動作する自律システムは、動的かつ不確定に変化する外部要因に適応して動作を決定する必要がある。しかし、設計段階で具体的な動作モードを想定し、個別に制御論理を網羅設計する既存手法では、変化する外部環境に応じて動作の健全性を充足しながら期待動作を実現出来る保証は無く、短時間で実現性を網羅検証することが困難である。
 また、人を介さずに動作するという自律システム特性にも関わらず、その振る舞いを決定する動作決定過程の健全性に対する対外的な立証責任、及びこれを裏付けるための透明性、つまり動作決定過程の観察可能性が考慮されておらず、動作モード及び対応する制御論理はプログラム等の形で内蔵されていて、第三者からは直接参照することも動作時に評価することも困難であって、実際に観察を通じて得られる情報は、最終的に制御論理を通じて実現される振る舞いに制限されてしまう。
 特許文献1で提示された手法では、自律システムの周辺環境に歩行者という移動障害物が存在する状況を想定し、動的に侵入不可領域を設定、拡大又は縮小する等して侵入不可領域を自律的に調整し、これを回避する経路を生成、追従するという期待動作を追求するという動作モードを実装した制御論理を設計時に組み込む方法が提案されている。
 しかし、外部要因の変化を起点として自律システムの現在位置を含む領域が突然に侵入不可領域の内部に属してしまうような場合の動作は想定されておらず、このような場合に予め実装されたプログラムに従って動作し続けてしまうと、この様な状況に陥った際の動作は検証されていないことから、健全性も保証されないことになる。
 このため、制御論理設計時の異常処理の一環として、自律システム周辺の安全性の観点から停止するように動作を記述するのが自然である。しかし、突然には停止できないような動作環境にある場合には、停止時点から動作の健全性は失われることになってしまう。
 また、異常終了時には人を介した再設定等の手段で解決を図ることにすると、動作の健全性が検証されていない動作モードに遭遇する度に動作が停止してしまい、人を介さずに動作するという自律システム特性にも関わらず、自律動作時の稼働率が著しく低下してしまう恐れがある。
 このため、動作の健全性が検証された動作モードの網羅性を改善することが重要となる。
 特許文献1で提示された手法では、動作の健全性が検証されていない動作モードとは、設計段階で想定された動作モードに対応して設計された制御論理が、動作の健全性を満たすために、暗黙の内に仮定していた前提を満たさない状態での動作に相当する。このような動作状況は設計時に想定されていないため、実機テストを通じて発見された場合に逐次修正をすることになる。しかし、このように当初想定していた動作モードを元に、逐次修正して自律システムの制御論理を設計する手法では、実際に遭遇する動作環境の網羅性、及び対応する制御論理の健全性を保証することは難しい。また、想定するべき動作モードの数及び設計するべき制御論理の数が、侵入不可領域の設定又は変更を伴う外部要因の多様性に応じて組合せ爆発的に増加してしまうという課題がある。
 前記課題を解決するため、記憶装置に格納された動作制御論理に基づき、自システムの内部状態と、外界計測手段により取得される開放外部環境における外部要因に適応した動作を実現する動作制御論理を生成して駆動装置に対する開放外部環境における動作を指示する自律制御装置は、前記自律制御装置が、前記外界計測手段から取得した外部要因と自システムの内部状態に対応した制約条件と、動作制御論理を逐次再構築する度に、自システムに求められている期待動作及び動作の健全性に関わる制約条件から、前記動作制御論理と制御論理を生成し、生成した当該動作制御論理と前記外界計測手段から取得した情報を前記記録装置に書き出し、前記制御論理に基づき自システムの動作を指示する自律動作制御装置と、前記自律動作制御装置により前記期待動作及び動作の健全性の判断結果を元に、自システムに求められている期待動作を指示する期待動作決定部を備える。
 変化する外部要因に適応した動作モードにより動作の健全性を検証された制御論理を逐次生成することで健全な動作を実現すると共に、生成された制御論理を記録及び提示して動作するため、動作決定過程を参照することで第三者が動作の健全性を確認出来るようになる。
自律システムの構成図 自律動作制御装置の処理フロー 閉領域の定義 制約条件及び論理式の表記 制御論理Lの定義 制約形式による動作の表現 緩和条件付き制約形式による動作規則及び期待動作の表現 部分領域間の接続関係を示すデータ構造の構築処理フロー 2閉領域の接続関係の分類及び判定方法 部分閉領域への分割の例 制約形式変換手段Aの機能ブロック図 制約形式変換手段Aが用いる変換規則 制約形式変換手段Aの処理フロー 制約形式変換手段Bの機能ブロック図 期待動作を指示するプログラムの記述例 期待動作決定論理を指示するプログラムの制御構造 制約形式変換手段Bの処理フロー 期待動作決定論理の処理フロー 動作制御論理T及び制御論理Lの生成 閉領域間の接続関係の解析 実行可能な動作制御論理のリスト 図21で例示した動作制御論理が指示する2閉領域間の移動動作 制御論理の実行処理フロー 制御論理の実行処理フロー 制御論理の実行処理フロー 記録装置への格納情報及び提示装置の利用方法 遠隔操縦者による自律システムの制御 自律走行システムの内部構成図 交差点に進入する動作をする自律走行システム 実施例3において用いる自律走行制御プログラムの内容 実施例3において制約形式変換手段Aが用いる変換規則 実施例3において制約形式変換手段Aが出力した緩和条件付き制約形式K 実施例3において信号値が赤ではない場合に生成された動作制御論理
(実施例1)
 以下、本発明を用いた自律システムの第一実施例について説明する。図1に、自律システムの構成図を示す。開放外部環境で動作する自律システム01は、自律制御装置010、外部計測手段011、内部状態計測手段012、提示装置013、及び駆動装置014を備えている。自律制御装置010は、自律動作制御装置0101、記録装置0102、期待動作決定論理0103、制約形式変換手段A(0104)、及び制約形式変換手段B(0105)で構成される。
 制約形式変換手段A(0104)は、外界計測手段011を通じて得た開放外部環境の情報を、制約形式に変換して自律動作制御装置0101に渡す。
 記録装置0102には、自律動作制御装置0101が生成した動作制御論理の生成記録01021を格納する。自律動作制御装置0101は、必要に応じてこの動作制御論理の生成記録01021を提示装置013に提示する。
 期待動作決定論理0103は、期待動作指示プログラム01031に基づいて動作し、制約形式変換手段B0105は、この期待動作決定論理0103を制約形式に変換して、自律動作制御装置0101に渡す。自律動作制御装置0101は、制約形式に変換された期待動作の充足可能性を判定して、その結果を、充足可能、充足不能、又は処理完了として返信する。自律動作制御装置0101は、図2に示す処理を経た後に、駆動装置014に制御コマンドを出力する。
 図2に、自律制御装置010で行われる処理フローを示す。
 はじめに、ステップ021により、制約形式変換手段A(0104)、及び制約形式変換手段B(0105)が出力した制約形式のリストを受け取り、処理する制約形式を設定する。続くステップ022では、ステップ021で受け取った制約形式のリストを記録装置0102に格納する。
 ステップ023において、ステップ021で設定した制約形式のリストを充足するような自律システム01全体の動作制御論理T、及び駆動装置014に出力する制御コマンドを算出する制御論理Lを生成する。そしてステップ024において、ステップ021で設定した全ての制約形式を充足する動作制御論理T及び制御論理Lが実現可能であることを検証する。この検証結果が実現可能であると判定された場合にはステップ026に進み、ステップ026では、動作制御論理T及び制御論理Lを記録装置0102に格納する。一方、実現不能であると判定された場合にはステップ025に進み、ステップ022で記録した制約形式の一覧を読み出して、ステップ021で設定した制約形式の少なくとも一部を緩和する。例えば、ステップ024において充足不能となった制約を緩和出来る場合には、緩和した制約形式に置換する。続いてステップ021に移って処理を繰り返す。
 ステップ026で動作制御論理T及び制御論理Lを記録した後はステップ027に進み、制御論理Lに基づき駆動装置014に制御コマンドを出力する。そして、ステップ028において、ステップ021で設定した制約形式が更新されていなかを確認する。制約形式が更新されていない場合には、ステップ027に戻って、同じ制御論理Lに基づき動作を継続し、更新された場合にはステップ021に戻る。
 次に、自律動作制御装置0101内部で用いられるデータ構造の詳細な実現手法を説明する。以下では、制約条件を、設定された内部状態Xに対して真偽値TRUE(1)又はFALSE(0)を返す関数COND(X)であると定義する。図3は、複数の制約条件(COND_0(Y)~COND_3(Y))を組み合わせて閉領域REGION(Y)を表現する制約条件の定義を示している。この制約条件は、内部状態を表すパラメータ空間Yにおける閉領域の面を与える半平面群の内側を判定する個々の制約条件の論理積として組み立てられている。また、個々の制約条件の論理積AND、論理積和OR、否定NOT、条件付き制約を組み合わせることで、より複雑な制約条件を表現することができる。図4には、制約条件を組み合わせて複雑な制約条件を組み立てるための演算子とその記号表記を示している。
 図5を用いて、閉領域を示す制約条件と条件付き制約を用いて、制御論理Lが出力する動作を表現する手法を示す。この例では、定義された2つの閉領域R0,R1に対して、閉領域R0&(!R1)内の点P0から、閉領域R0&R1内の点P1を経由し,続いて閉領域!R0&R1内の点P2に移動する動作をActionとして表している。
 図6に、制約条件Ciを引数とする制約形式(演算子)の定義を示す。
 制約条件C0に対する演算子X[C0]は、条件付き動作を表現する制約形式である。適当に設定した順序列について、次の順序において、引数となる制約条件C0を充足する(制約条件C0の評価値がTRUEとなる)動作を表現する制約形式である。
 制約条件C0及びC1に対する演算子[C0]U[C1]は、条件付き動作を表現する制約形式である。制約条件C1=1となる時点までは少なくとも制約条件C0=1を維持し続ける動作を表現する。
 制約条件C0及びC1に対する演算子[C0]R[C1]は、条件付き動作を表現する制約形式である。現時点から初めて制約条件C0=1となる時点までは制約条件C1=1を維持し続ける。
 制約条件C0に対する演算子G[C0]は条件付き動作を表現する制約形式である。任意の時点で制約条件C0=1を維持し続ける動作を表現する。
 制約条件C0に対する演算子F[C0]は条件付き動作を表現する制約形式である。現時点から未来のどこかの時点で制約条件C0=1を一度以上満たす動作を表現する。
 制約条件C0及びC1に対する演算子[C0]W[C1]は、条件付き動作を表現する制約形式である。制約条件C0=1を常に維持し続けるか、又は少なくとも現時点から制約条件C1=1となる時点までは制約条件C0=1を維持し続ける動作を表現する。
 図7には、制約形式Ciを引数とする緩和条件付き制約形式の定義と期待動作を示す。各緩和条件付き制約形式は、一つ以上の制約形式の論理和で与えられ、順序列に関する制約の緩和可能性に基づき分類される。そして各緩和条件付き制約形式について、緩和条件を適用した場合に対応する提示装置013への提示内容が定められている。
 自律動作制御装置0101は、制約形式変換手段A(0104)及び制約形式変換手段B(0105)より、これらの演算子及び表現形式で表現される制約形式のデータを受け取る。
 図8及び図9により、内部状態空間において定義された閉領域に相当する制約条件群を用いて、内部状態空間を2値符号化することで、部分閉領域間の接続関係を表現するデータ構造とその処理方法を示す。ここでは、閉領域の外縁を含む内側を1、外側を0とすることで2値符号化する。そして、図8に示す処理フローに従い、S901により既に閉領域群Xが定義されている状況において、S902において新たに単体の閉領域Yを追加する場合は、図9に示す通り、閉領域群Xと閉領域Yの接続関係に基づいて、ケース1の二つの閉領域が一致する場合、ケース2の二つの閉領域が部分的に重なる場合及び接する場合、ケース3の二つの閉領域が分離している場合、ケース4の二つの閉領域が包含関係にある場合、ケース5の二つの閉領域が被覆関係にある場合、ケース6の一方の閉領域が他方の閉領域を分割する場合、のいずれかに分類される。
 そしてS903では、例えばケース1の分類に該当することを判定するためには、閉領域Xを表現する制約条件C0,及び閉領域Yを表現する制約条件C1を用いて、制約条件[C0&C1]を満たす解が存在し(これをSATと表現する)、かつ制約条件[C0&!C1]を満たす解が存在せず(UNSATと表現)、かつ制約条件[!C0&C1]を満たす解が存在せず、かつ制約条件[!C0&!C1]を満たす解が存在する場合に相当する。他の5つのケースについても同様に、各制約条件の組み合わせに対して図9に示す充足解の判定基準を適用すればよい。
 このようにして判定された閉領域の接続関係に基づき、S904では互いの閉領域により分割された部分閉領域の接続関係を更新し、S905では更新結果に基づいて領域を追加する。
 図10は、図8に示した処理において、閉領域R0を示す制約条件C0に、閉領域R1を示す制約条件C1、閉領域R2を示す制約条件C2を逐次追加していく例を示している。
 閉領域R0は、制約条件C0=1を満たす領域として定義され、制約条件C0は、最小の制約条件C0-0、C0-1、C0-2、C0-3の論理積として定義される。制約条件C0は、閉領域内部(閉領域ID=R0)及び外部(閉領域ID=EXTERIOR)に分割するので、S905では、これらの分割領域を追加する。
 このため、S902で、制約条件C1=1を満たす領域として定義される閉領域R1を追加すると、閉領域IDにR1が新規に設定される。次にS903によって閉領域R0とR1は、図9に示したケース2に分類されることが判定し、S904によって閉領域R0をR0-0とR0-1に分割し、閉領域R1をR1-0とR1-1に分割する。そして、R0-0とR0-1及びR1-0とR1-1は元々連続しているため、これらの接続を追加して接続関係を更新し、R0-1とR1-1はケース1(2つの閉領域が一致する)に該当するため、R0-1からR1-0、及びR1-1からR0-1の接続関係を追加して接続関係の更新をする。さらに閉領域R2が追加された場合も同様にして処理が行われる。
 図11に、制約形式変換手段A(0104)の機能ブロックを示す。制約形式変換手段A(0104)では、図12に示すような、認識対象物の分類、各対象物に関連して規定された制約条件の一覧及び認識対象物の状態値、そして認識対象物に対応する動作規則を指示する緩和条件付き制約形式のテンプレートを変換規則として予め有している。この変換規則を用いて、図13に示す処理フローに従い、個々の認識対象物毎に緩和条件付き制約形式を生成し、この論理積K(01045)を制約形式のリストとともに自律動作制御装置0101に出力する。
 具体的には、外部計測手段011が取得した認識対象物の情報M(0111)を外界認識部01041が受け取り、外界認識部01041は、変換規則のテンプレートに則って認識対象物毎に分類する(S1701)。そして認識対象物の分類毎に、制約条件のリストを設定して(S1702)、その認識対象物の分類毎状態値を取得して設定し(S1703)、制約条件生成部01042は、認識対象物毎に、前記テンプレートで指定される動作規則を指示する緩和条件付き制約形式を設定する(S1704)。そして、設定した緩和条件付き制約形式の論理積Kを生成し、自律動作制御装置0101に出力する(S1705)。
 また、外界認識部01041を通じて設定した認識対象物の状態値は、内部状態計測手段012を通じて取得した、自律システム01の内部の状態値と併せて、現状態の観測地として自律動作制御装置0101に出力する。
 なお、外界計測手段011とは、自律システム01が開放外部環境において行動する際に必要な情報を取得する手段であり、撮像装置や測度センサに代表される受動的装置に限定されない。一例として、何らかの通信経路を通じて開放外部環境内のシステムから外界認識部01041への入力データを受信するといった形態であっても良い。
 図14から図18を用いて、期待動作決定論理0103が、制約形式変換手段B(0105)を通じて、自律動作制御装置0101に対して緩和条件付き制約形式Eを自律動作制御装置0101に出力し、その応答(SAT:充足可能、UNSAT:充足不能、COMP:完了)に基づいて期待動作制御論理0103が出力値を再設定するまでの過程を説明する。
 図14に示される通り、期待動作決定論理0103は、図15に示す記述例に示すような、期待動作を生成するための期待動作指示プログラム01031を内部に備えており、図16に示す動作制御論理に従って、緩和条件付き制約形式の一覧を制約形式変換手段Bに指示する。期待動作決定論理0103では、この図16に示す動作IDを参照して、図17に示す処理フローに沿って、動作開始から動作停止条件を満たすまで動作し続ける。
 図16に示す通り、期待動作を指示するプログラムの最小単位は個々の動作ID毎に規定され、緩和条件付き制約形式で記述された動作010311、制約条件として記述された動作完了の判定条件010312、図2のステップ024に相当する動作の充足可能性を判定した結果、自律動作制御装置0101から期待動作決定論理0103へ返される3種類の応答(SAT,UNSAT,COMP)毎に指定された遷移先の動作ID(順に010313,010314,010315)で構成される制御論理に基づいて動作する。ここでは、動作IDの初期値をIDSと記述し、終状態はIDEと記述している。
 図17に、制約形式変換手段B(0105)の処理フローを示す。期待動作決定論理0103が指示した動作IDを参照し(S2201)、この動作IDに対応する、緩和条件付き制約形式の期待動作E(010311)と、動作完了の判定条件010312、応答取得後の分岐条件から動作完了後の遷移先動作ID(010314)を取得する(S2202,S2203,S2204)。そして取得した、動作完了後の遷移先動作IDに対応する、緩和条件付き制約形式の動作010311を取得し(S2205)、期待動作を指示する緩和条件付き制約形式E、前記制約形式Eを構成する制約条件の一覧、及び動作完了条件010312を自律動作制御装置0101に出力する(S2206,S2207,S2208)。
 図18は、指定された動作IDにおける自律動作制御装置0101への応答処理を示す。ステップS2301で、動作IDを初期値IDSに設定し、図17に示す制約形式変換手段Bの処理フローを実行して(S2302)、自律動作制御装置からの応答を待つ(S2303)。応答値が充足可能(SAT)である場合には、充足可能時の処理を実行してから、S2303に戻って引き続いて応答を待つ。応答値が完了(COMP)を受け取れば、処理S2306を実行する。逆に応答値が充足不能(UNSAT)である場合には、充足不能時の処理S2305を実行する。そしてS2307の判定処理により、S2306で更新した遷移先の動作IDが、最終的に動作ID=IDE(終状態)に到達するまで、期待動作決定論理0103が継続動作する。
 図19に、動作制御論理T及び制御論理Lの生成処理フローを示す。これは、図2におけるステップ023の処理に相当する。
 はじめに、図20に示す処理フローに従い、閉領域の重なりで分割された部分閉領域、及び閉領域間の接続関係を解析する初期処理を実行する。まず最初に、図11で自律動作制御装置0101に渡された緩和条件付き制約形式K及び引数となる制約条件一覧、図14で自律動作制御装置0101に渡された緩和条件付き制約形式E及び引数となる制約条件一覧を取得する。
 そして両方の制約条件一覧を基に、図8で示した処理フローに沿って部分閉領域と制約条件の対応、及び部分閉領域間の接続関係を生成し(ステップ02301)、論理状態値を生成する。また、緩和条件付き制約形式K,Eの論理積として新たに緩和条件付き制約形式である動作規則Aを設定する(ステップ02305)。
 次に、図11で示した認識対象物の状態値、及び内部計測手段012から取得した、自律システム01の内部状態群を併せて、現状態の観測情報Y(t=0)を設定する。そして、個々の制約条件を、現状態の観測情報Yを用いて真偽値を評価し、2値符号化した自律システム01の状態が属する、閉領域IDの初期値RINITを特定する(ステップ02302)。
 図21は、ステップ023で生成する動作制御論理Tで実現可能なものを記録するリストである。はじめは空集合であり、この動作制御論理IDのリストに前記RINITを追加する。図21に示す動作制御論理のリストが空集合でない限り、以下に続く処理を継続する。
 図19のフローに戻り、図21に示す動作制御論理Tのリストに登録された全ての動作制御論理T_iが、図21に示した動作完了の判定条件(010312)を満たすか判定する(ステップ02304)。満たす場合には、動作制御論理Tの生成プロセスを終了し、ステップ02390において[期待動作に付与された緩和条件]を適用していないものを優先して動作制御論理を一つ選択する。一例として、動作完了までに要する動作実行順序IDの値が少ないものを選択してもよい。
 個々の動作制御論理T_iは、動作実行順序ID毎に遷移するべき閉領域IDの連鎖として指定され、図3に示した閉領域の定義に従う限り、閉領域間の遷移に際して必ず一つ以上の制約条件の真偽値が反転するようになっている。この特性を利用して、図19に示す手順に従い、ステップ02391では、閉領域間の遷移各々に対応する制御論理Lを制約条件として定める。
 続いて、自律動作制御装置0101は期待動作制御論理0103に対して充足可能(SAT)との応答を返し(ステップ02307)、動作を終了する。
 逆に、動作完了の判定条件(010312)を満たさない動作制御論理が図21に示すリストに残っている場合(ステップ02304:No)には、動作制御論理Tの生成処理を継続する。
 そこで、動作完了の判定条件(010312)を満たさない動作制御論理を図21のリストから一つ選択し、TTMPと呼称する。TTMPについて図21に示される最大の動作実行順序IDに対応する閉領域IDを取得し、閉領域を構成する各制約条件の真偽値を評価して2値符号化した上で、それぞれの閉領域IDから接続関係を有する遷移先閉領域の中で、ステップ02305で設定した動作規則Aを満たすものがあるか評価する。
 一つもなければ、この動作制御論理TTMPを削除し、ステップ02303に進む。ステップ02303において、図21に示す動作制御論理Tのリストが空集合となった場合には、自律動作制御装置0101は期待動作制御論理0103に対して充足不能(UNSAT)との応答を返し(ステップ02308)、動作を終了する。
 逆に、一つ以上の遷移先閉領域がある場合には、ステップ02306に進み、その遷移先閉領域を動作制御論理TTMPに付加した動作制御論理に更新する。併せて、その遷移先閉領域への遷移が、ステップ02305で設定した動作規則Aのいずれかの緩和条件を適用することで実現されている場合には、その緩和条件Vを図21に示される動作制御論理TTMPに対応する該当箇所に記録する。
 以上の処理を、最終的にステップ02307,又は02308に到達して、終了するまで継続する。終了時点で、自律動作制御装置0101が処理ステップ023を終了する。
 図22は、図10で示した閉領域IDがR0-0の状態から、領域IDがEXTERIORにならない範囲で閉領域IDがR2-2になる動作を生成する問題を示す。この場合、図19に示した処理フローに従い、R0-0からR0-1、R1-0、R1-1,R1-2,R2-1,最終的にR2-2に向かう動作が生成され、最終的に、図21に示される動作制御論理を得る。
 図19においてステップ02307に到達した場合には、ステップ024において検証成功とみなし、ステップ026に進む。ここで、図19で示した処理フローにより生成した動作制御論理T(02392)のリスト、及び個々の動作制御論理T_iに対応付けられた制御論理L_iを全て記録装置0102に格納する。そしてステップ027に進み、制御論理Lを実行し、駆動装置014に制御コマンドを出力する。
 図23から図25を用いて、図19で生成した動作制御論理Tおよび制御論理Lを制御コマンドに変換する処理フローを示す。
 ステップ02309において、制御対象である自律システム01の動的モデルを取得する。これは、予めシステム同定して得たものであっても、動作中に生成したものであってもよい。
 ステップ02310において、ステップ02391で生成した制御論理Lを取得する。
 ステップ02311において、現状態の観測値01044を用いて図12に示した制約条件一覧の真偽値を評価し、当該状態値が属する閉領域IDを算出する。
 ステップ02312において、ステップ02310で取得した制御論理L_iの内、現状態から即時で実行する制御論理L[k]を選択する。
 図20における制御論理L[k]に対応する緩和条件群V[k]があれば、ステップ02329において、適用された個々の緩和条件毎に図7で示したメッセージを提示装置013に提示する。
 なお、提示装置の利用目的は、自律システムが期待動作を実行する過程で発生する充足不能な制約形式を外部に提示することであり、視覚的表示装置に代表される形態に限定されない。一例として、通信経路を通じて、開放外部環境に存在する他システムに対して提示内容を送信するという形態をとっても良い。
 ステップ02313、02314では、遷移元閉領域、遷移先閉領域を与える個々の制約条件に対応する論理状態値を取得し、ステップ02315で真偽値が反転している制約条件Cpを特定する。この制約条件は、制御論理L[k]に従って遷移元閉領域から遷移先閉領域に向かう過程で侵入又は退出する閉領域を定めるものである。
 ステップ02316で記載している制約条件の真偽値を評価し、ステップ02317又はステップ02318に遷移する。
 ステップ02317は、閉領域Cpの外側から内側に入る動作に相当する。
この時、閉領域Cpを適当な比率γで拡大することで、ステップ02317にて記載の条件、つまり拡大した閉領域Cpが、現状態の観測値Y(t)を初めて包含するようになる拡大パラメータsの最小整数値を算出することで、遷移元閉領域に留まりながら、遷移先閉領域に侵入する動作を実現する。
 ステップ02319において、現状態の観測値01044が閉領域Cp内部に漸近するような制御入力列が存在するか否か判定する。存在すれば、算出した制御入力値を駆動装置014に出力していき、ステップ02322において、逐次、制御論理L[k]を実行した末に充足するはずの動作完了の判定条件010312を評価する。動作完了条件を満たさない場合にはステップ02317に戻り、満たす場合にはステップ02323に進み、期待動作の決定論理0103に動作完了(COMP)を伝達して、ステップ027を終了する。逆にステップ02319において、制御入力列が存在しない場合には、当該制御論理Lが実行できないとして、図21に登録された動作制御論理の一覧から、ステップ02310で選択した動作制御論理Lに対応する動作制御論理T_iを削除する。
 ステップ02325に進み、ステップ02319で実行不可能であると判定された制御論理L[k]を含まない動作制御論理を、図21の中から探す。あればステップ02327に進み、当該動作制御論理、及び制御論理を再設定して、ステップ02311に戻る。無ければステップ02326に進み、期待動作制御論理0103に充足不能(UNSAT)を返して処理を終了する。
 他方、ステップ02318は、閉領域Cpの内側から外側に出る動作に相当する。この場合、閉領域Cpを適当な比率γで縮小することで、ステップ02318にて記載の条件、つまり縮小した閉領域Cpが、現状態の観測値Y(t)を内包する縮小パラメータsの最大整数値を算出することで、遷移先閉領域に留まりながら、遷移元閉領域から出ていく動作を実現する。ステップ02320において、現状態の観測値01044が閉領域Cp内部に漸近するような制御入力列が存在するか否か判定する。
 存在すれば、算出した制御入力値を駆動装置014に出力していき、ステップ02328において、逐次、制御論理L[k]を実行した末に充足するはずの動作完了の判定条件010312を評価する。
 動作完了条件を満たさない場合にはステップ02318に戻り、満たす場合にはステップ02323に進み、期待動作の決定論理0103に動作完了(COMP)を伝達して、ステップ027を終了する。
 逆にステップ02320において、制御入力列が存在しない場合には、当該制御論理Lが実行できないとして、図21に登録された動作制御論理の一覧から、ステップ02310で選択した制御論理Lに対応する動作制御論理T_iを削除する。
 ステップ02325に進み、ステップ02319で実行不可能であると判定された制御論理L[k]を含まない動作制御論理を、図21の中から探す。あればステップ02327に進み、当該動作制御論理、及び制御論理を再設定して、ステップ02311に戻る。無ければステップ02326に進み、期待動作制御論理0103に充足不能(UNSAT)という応答を返して処理を終了する。
 図26は、図2の全過程で記録装置0102に格納される動作制御論理の生成記録01021、及びステップ02329において自律動作制御装置0101が提示装置013に出力する動作の態様を示す。
 少なくとも動作制御論理の生成記録01021は、外界の計測情報M(0111)、現状態の観測値01044の時系列データ、図11で示した、動作規則を指示する緩和条件付き制約形式K(01045)及び引数となる制約条件一覧、期待動作を指示するプログラム01031、期待動作を指示する緩和条件付き制約形式E(01032)及び引数となる制約条件一覧、ステップ02390の時点で確定した、図20に示された動作制御論理Tのリスト(02392)及び各々の動作制御論理に対応付けられた制御論理L、ステップ02308又は02326で実現不能(UNSAT)と判定された期待動作Eに対応する動作010311、ステップ027内のステップ02310で選択し、実行された制御論理L、動作中にステップ02324で実行不能と判定され削除された動作制御論理T_i、及び当該動作制御論理T_iに対応付けられた制御論理L_iを含む。
 以上の実施例を通じて、動作の健全性を規定する要件が充足不能になる(02326)か、又は期待動作が実現不可能(ステップ02308)か否かを稼働中に判定して、健全動作を規定する要件と期待動作とを共に充足可能な組み合わせを導出する機能(ステップ023および024)を用いて動作モードを稼働中に再構築(ステップ02327)し、期待動作を実現する制御論理を並行して生成する自律動作制御装置0101と、開放環境において動的に変化する外部要因、動作の健全性を規定する要件(緩和条件付き制約形式で実現された01045)、期待動作(緩和条件付き制約形式で実現された01032)、及び生成された制御論理(02392)を、第三者が閲覧可能な形で記録装置0102に記録する機能を備え、必要に応じて第三者に対して提示しながら動作する自律システム01を実現している。
 自律システム01内部の自律動作制御装置0101が、ステップ02308又はステップ02326において充足不能(UNSAT)に到達してしまった場合には、期待動作決定論理0103が指示する全ての動作が同様に充足不能に陥り、期待動作決定論理内部の動作IDは[停止(IDE)]に到達して動作停止している。
 自律システムの動作健全性を評価する第三者は、以上の状態に陥った自律システム01が記録装置に0102に格納した記録の内、特に期待動作決定論理0103が逐次指示した個々の動作010311が、自律動作制御装置0101内部の処理により最終的に実現不能(UNSAT)と判定された過程(ステップ02324)及び充足不能に陥った要因を知ることが出来る。
 充足不能に陥る場合とは、本実施例の場合、外界の計測情報Mから生成した、動作規則を指示する緩和条件付き制約形式K,及び制約形式Eを共に充足することが出来なくなる場合に相当する。
 自律システム01の設計者は、一例として、充足不能と判定された制約形式E(01032)を生成する期待動作を指示するプログラム01031を修正するか、制約形式設定部01043内で設定される動作規則を指示する緩和条件付き制約形式Kを修正するか、又は充足不能と判定された状況に陥った制約形式K(01045)に関わる開放動作環境に立ち入らないようにするための制約形式を、制約形式設定部01043内に新規追加する等の手段により解決する。
 最後に、自律システム01に対して、記録装置0101に格納されていた外界の計測情報M(0111)を仮想的に外界認識部01041に送信し、格納されていた期待動作を指示するプログラム01031を期待動作決定論理0103に渡して、図2に示した処理フローを再度実行して、ステップ02308及びステップ02326において充足不能に陥らないことを第三者が評価をする。
 このプロセスを経ることで初めて、設計者の修正内容が適切に実行されたことを第三者が容易に評価することが出来るようになる。
(実施例2)
 図27は、通信経路を介して遠隔操縦者02が操縦する機能を有する自律システムの一態様を示す。
 実施例1のように構成した自律システム01を遠隔地に配置し、通信経路0202を通じて取得した外界計測情報及び内部状態計測情報を参照の上、必要に応じて動作命令0201を発行し、期待動作決定論理内部で期待動作に変換(01032)する構成とする。動作制御論理Tを生成出来ない状況に陥った場合には、遠隔操縦者が、健全動作を実現する充足解が存在するように、ステップ025で実行する処理を代行する。
 特許文献3には、完全自律モードで動作させる場合と、リアルタイムでの遠隔操縦により動作させる場合を併用させる手法が示されている。しかし、リアルタイムで遠隔操縦する場合には、動作の健全性が通信経路の品質、つまり帯域及び応答遅延時間、通信経路の遮断といった要因に左右されてしまう。
 実際、遠隔地で動作する場合、通信に要する遅延時間は一定でも無く、かつ通信データの到達が保証されていない。この欠点は、本実施例2に開示される通り、期待動作の実現可能性を判定できるよう構築された自律動作モードを基本とし、必要に応じて遠隔操縦者02が期待動作を送信することで解決すれば良い。
 このような構成とすることにより、通信経路の品質に左右されずに、容易に多様な期待動作を発行、更新できるようになり、遠隔地で動作する自律システムの動作健全性を保証しながら遠隔操縦時の可用性を大幅に向上できる。
 可用性の向上は、特に、一人当たりの遠隔操縦者が操作できる自律システムの数を1よりも大幅に増加させられるようになる点に現れる。
 動作健全性の観点から、一人の遠隔操縦者が通信周期毎に一台の遠隔自律システムを制御する必要があり、これが従来の構成における可用性の限界を定めていた。
 本実施例を適用することで、動作健全性の判定及び解決に関わる機能を自律システム自身が実行するようになる。よって、遠隔操縦者は、動作命令から生成した期待動作が充足不能に陥った場合のみ、自律システムに対して遠隔制御操作を実施すればよい。結果として、一人の遠隔操縦者が複数の自律システムに動作命令を送信し、並行動作させられるようになる。
(実施例3)
 以下、第3の実施形態として、本発明を適用した開放都市環境における自律走行システムの走行制御機能の例を示す。
 図28に、自律走行システム03の構成図を示す。
 開放外部環境で動作する自律走行システム03は、自律走行制御装置030、外部計測手段031、内部状態計測手段032、提示装置033、及び駆動装置034で構成され、自律制御装置030は、自律走行制御装置0301、記録装置0302、期待動作決定論理0303、制約形式変換手段A(0304)、及び制約形式変換手段B(0305)で構成される。
 図29は、図28に示した自律走行システム03が、信号付き交差点を渡り、目標地点SGOALに向かう動作を実行する場合の動作環境の外観を示す。
 図30は、本事例において自律走行制御プログラム03031に記載された動作命令を示す。この図では、図16で説明した通り、動作IDがID0である間は、初期状態から、SGOAL内に向かう動作を指示している(030311、及び030312)。自律動作制御装置0301が、当該期待動作が充足可能であると判定した場合(030313)には、期待動作を継続して動作IDをID0に維持する。自律動作制御装置0301が、当該期待動作が充足不能であると判定した場合(030315)には、期待動作をクリアして動作IDをIDEに設定する。以後、図29に示された動作環境から外界計測手段を通じて制約形式変換手段A0304が指定する、動作規則を示す緩和条件付き制約形式Kより動作を生成するモードに移行する。
 本実施例では特に動作IDがID0である期間を取り上げる。
 図31は、本実施例において、図12に示した、制約形式変換手段Aが用いる変換規則に相当するものである。認識対象物として道路、信号、交差点、歩行者、車両を取り上げる。
 各認識対象物を定義する制約条件の一覧、信号に代表されるように認識対象物が指示する内容が時間的に変化する場合にはその状態値を導入し、それぞれの認識対象物毎に動作規則を指示する緩和条件付き制約形式Kが示されている。
 併せて、各緩和条件付き制約形式Kの充足可能性に対応して、表示装置033への出力内容を設定する。
 ここではまず、図29で示した動作環境にある自律走行システム内の自律動作制御装置(0301)が、図20に示した閉領域間の接続関係の解析を行う処理フロー(ステップ02301)に相当する処理によって、認識対象物毎に設定される閉領域の接続関係を分析する。
 まず、制約形式変換手段A0304内部の外界認識部03041は、撮像装置031を通じて認識された対象物毎に、例えば、直進方向の道路0、横断方向の道路1、交通整理をする信号0、及び整理対象の交差点0のように、図12に示されるフォーマットに従って、図32に示されるように登録する。制約条件生成部03042は、それぞれの認識対象物毎に、図31で規定された内容に従い、制約条件群を設定する。制約形式設定部03043は、それぞれの認識対象物毎に、図31で規定された内容に従い、緩和条件付き制約形式Kを設定する。
 図26は、本実施例で示した動作環境における、図21に相当する動作制御論理Tである。図19に示される処理フローを経て得られる図30で示される期待動作を実現する動作制御論理を示す。簡単のために、図32で認識対象物として登録した信号の状態値は赤ではなく、制約条件C5=0である場合を例示している。
 この時、初期状態が閉領域R0-0-1内部にいる場合から制御動作を開始して、閉領域R0-1-1、閉領域R0-2-0-1、最後に閉領域R0-2-1-1内部に遷移する動作の論理を表している。そしてこの動作は、図30で示した、動作IDがID0の場合における動作完了の判定条件、つまり制約条件C3が1になる条件を満たしており、期待動作を実現する。
 本実施例で示した動作環境では、図26で示した動作順序IDが0から1に遷移する過程に相当する制御論理L[0]を用いて、図23に示される制御論理の生成処理フローを経て実現される動作により、道路0の領域に留まりながら、交差点のある領域に侵入するまでの過程として、図26に示される動作実行順序IDが3に相当する図30に示された動作完了の判定条件(030312)を満たすまで、図23に示す処理フローに従って継続的に動作を続ける。そして以降は、図30に示される通り、動作IDをIDEに遷移し、動作を停止する。
 本発明は、公道を含む開放環境において動作する完全自律走行車、及び搭乗者の待機位置に向かう無人タクシーや無人レンタカーサービスに利用できる。また、周囲の走行車に接触せずに一定速度で走行するオートクルーズ機能や衝突回避機能を有する自動車に利用できる。また、鉱山、深地下、海底に代表される遠隔地において通信経路を通じて制御する作業機械であって、作業上の安全性に関する制約を満たすように自律的に判断して動作するものに利用できる。
01      自律システム
010      自律制御装置
011      外界計測手段
012      内部状態計測手段
013      提示装置
014      駆動装置
0101     自律動作制御装置
0102     記録装置
01021    動作制御論理の生成記録
0103     期待動作決定論理
01031    期待動作指示プログラム
0104     制約形式変換手段A
01041    外界認識部
01042    制約形式生成部
01043    制約形式設定部
01044    現状態の観測値
01045    緩和条件付き制約形式K
0105     制約形式変換手段B
02      遠隔操縦者
0201     動作命令
0202     通信経路
03      自律走行システム
030      自律走行制御装置
0301     自律動作制御装置
0302     記録装置
03021    動作制御論理の生成記録
0303     期待動作決定論理
0304     制約形式変換手段A
0305     制約形式変換手段B
031      撮像装置
032      車載センサ群
033      交通指示器・表示装置
034      駆動装置

Claims (6)

  1.  記憶装置に格納された動作制御論理に基づき、自システムの内部状態と、外界計測手段により取得される開放外部環境における外部要因に適応した動作を実現する動作制御論理を生成して駆動装置に対する開放外部環境における動作を指示する自律制御装置であって、
     前記自律制御装置は、
     前記外界計測手段から取得した外部要因と自システムの内部状態に対応した制約条件と、動作制御論理を逐次再構築する度に、自システムに求められている期待動作及び動作の健全性に関わる制約条件から、前記動作制御論理と制御論理を生成し、生成した当該動作制御論理と前記外界計測手段から取得した情報を前記記録装置に書き出し、前記制御論理に基づき自システムの動作を指示する自律動作制御装置と、
     前記自律動作制御装置により前記期待動作及び動作の健全性の判断結果を元に、自システムに求められている期待動作を指示する期待動作決定部を備えること
    を特徴とする自律制御装置。
  2.  請求項1に記載の自律制御装置において、
     前記制約条件は、各制約条件の充足状態に応じて制約が緩和される緩和条件付きの制約条件であり、
     前記自律動作制御装置は、前記期待動作の充足可能性を判定して、充足可能時及び充足不能時それぞれの場合の動作指示に対応した制御論理を生成する
    ことを特徴とする自律制御装置。
  3.  請求項2に記載の自律制御装置において、
     前記自律動作制御装置は、論理式又は前記論理式を含む時相論理の形式とした制約条件と許容緩和限界を含む制約形式を入力とし、
     前記自律制御装置は、前記自システムの内部状態と開放外部環境における外部要因を前記制約形式に変換し、当該変換された制約形式のリストを生成する第1の変換手段と、
    前記期待動作、及び前記健全動作を制約形式に変換し、当該変換された制約形式のリストを生成する第2の変換手段を備えることを特徴とする自律制御装置。
  4.  請求項3に記載の自律制御装置において、前記自律動作制御装置が前記健全動作に関する要件及び前記期待動作を共に実現する動作制御論理の存在を判定し、動作制御論理が存在する場合には、前記制御論理を逐次生成して前記期待動作を実現し、
     前記動作制御論理が存在しない場合には、前記制約形式のリストの内、充足不能となった阻害要因を特定して、前記緩和条件の許容緩和限界を充足しながら、健全動作を回復するように制約形式のリストを選択して動作制御論理を生成することを特徴とする自律制御装置。
  5.  請求項2に記載の自律制御装置であって、
     前記自律制御装置は、前記健全な期待動作を実現出来る場合には動作制御論理の内容を提示装置に提示し、前記健全な期待動作を実現できない場合には、阻害要因を提示装置に提示することを特徴とする自律制御装置。
  6.  請求項3に記載の自律制御装置を備えた移動体であって、前記期待動作は指定速度による走行指示であり、前記健全動作は前記移動体周囲の他の移動体又は障害物との接触を回避する動作であり、当該期待動作と健全動作を両立するように前記移動体の移動速度及び軌道を制御する機能を有することを特徴する移動体。
PCT/JP2013/056559 2013-03-11 2013-03-11 自律制御装置 WO2014141351A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2015505094A JP6141964B2 (ja) 2013-03-11 2013-03-11 自律制御装置
EP13878317.0A EP2975481A4 (en) 2013-03-11 2013-03-11 Autonomous control device
PCT/JP2013/056559 WO2014141351A1 (ja) 2013-03-11 2013-03-11 自律制御装置
US14/650,111 US9983553B2 (en) 2013-03-11 2013-03-11 Autonomous control device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2013/056559 WO2014141351A1 (ja) 2013-03-11 2013-03-11 自律制御装置

Publications (1)

Publication Number Publication Date
WO2014141351A1 true WO2014141351A1 (ja) 2014-09-18

Family

ID=51536054

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2013/056559 WO2014141351A1 (ja) 2013-03-11 2013-03-11 自律制御装置

Country Status (4)

Country Link
US (1) US9983553B2 (ja)
EP (1) EP2975481A4 (ja)
JP (1) JP6141964B2 (ja)
WO (1) WO2014141351A1 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016129067A1 (ja) * 2015-02-12 2016-08-18 株式会社日立製作所 自律動作検証装置および自律システム
CN106873596A (zh) * 2017-03-22 2017-06-20 北京图森未来科技有限公司 一种车辆控制方法及装置
JP2017174208A (ja) * 2016-03-24 2017-09-28 トヨタ自動車株式会社 自動運転車両を用いたタクシーサービスシステム
WO2021038826A1 (ja) * 2019-08-30 2021-03-04 株式会社日立製作所 状態遷移モデル構築装置及び自律システム
WO2022180788A1 (ja) 2021-02-26 2022-09-01 日本電気株式会社 制約条件学習装置、制約条件学習方法及び記憶媒体
WO2022244143A1 (ja) * 2021-05-19 2022-11-24 株式会社やまびこ ロボット作業装置
WO2024034579A1 (ja) * 2022-08-08 2024-02-15 川崎重工業株式会社 制御装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160349754A1 (en) * 2015-05-29 2016-12-01 Clearpath Robotics, Inc. Method, system and apparatus for controlling self-driving vehicles
WO2018213931A1 (en) 2017-05-25 2018-11-29 Clearpath Robotics Inc. Systems and methods for process tending with a robot arm
US11191005B2 (en) 2019-05-29 2021-11-30 At&T Intellectual Property I, L.P. Cyber control plane for universal physical space

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08221126A (ja) * 1995-02-10 1996-08-30 Yaskawa Electric Corp 移動ロボット
JP2008142841A (ja) * 2006-12-11 2008-06-26 Toyota Motor Corp 移動ロボット
JP2009080804A (ja) 2007-09-03 2009-04-16 Hitachi Industrial Equipment Systems Co Ltd 自律移動ロボットシステム
JP2009157735A (ja) 2007-12-27 2009-07-16 Toyota Motor Corp 移動体、及び車両用警告装置
JP2012030665A (ja) 2010-07-29 2012-02-16 Toyota Motor Corp 車両制御システム
JP2012051560A (ja) 2010-08-31 2012-03-15 Atlas Elektronik Gmbh 無人の水中航走体および無人の水中航走体を運転するための方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63196944A (ja) * 1987-02-12 1988-08-15 Hitachi Ltd ル−ル検証方式
JP4107605B2 (ja) 2005-02-01 2008-06-25 シャープ株式会社 移動体周辺監視装置、移動体周辺監視方法、制御プログラムおよび可読記録媒体
JP4670807B2 (ja) 2006-12-19 2011-04-13 トヨタ自動車株式会社 移動経路作成方法、自律移動体および自律移動体制御システム
US8428843B2 (en) * 2008-06-20 2013-04-23 GM Global Technology Operations LLC Method to adaptively control vehicle operation using an autonomic vehicle control system
US8254670B2 (en) * 2009-02-25 2012-08-28 Toyota Motor Engineering & Manufacturing North America, Inc. Self-learning object detection and classification systems and methods
US8352112B2 (en) * 2009-04-06 2013-01-08 GM Global Technology Operations LLC Autonomous vehicle management
US8150621B1 (en) 2009-04-07 2012-04-03 The United States of America as represeneted by the Secretary of the Navy Command and control of autonomous surface vehicle
US8595321B2 (en) 2010-07-02 2013-11-26 Nguyen Xuan Hoang Supporting system for remote control

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08221126A (ja) * 1995-02-10 1996-08-30 Yaskawa Electric Corp 移動ロボット
JP2008142841A (ja) * 2006-12-11 2008-06-26 Toyota Motor Corp 移動ロボット
JP2009080804A (ja) 2007-09-03 2009-04-16 Hitachi Industrial Equipment Systems Co Ltd 自律移動ロボットシステム
JP2009157735A (ja) 2007-12-27 2009-07-16 Toyota Motor Corp 移動体、及び車両用警告装置
JP2012030665A (ja) 2010-07-29 2012-02-16 Toyota Motor Corp 車両制御システム
JP2012051560A (ja) 2010-08-31 2012-03-15 Atlas Elektronik Gmbh 無人の水中航走体および無人の水中航走体を運転するための方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP2975481A4

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016129067A1 (ja) * 2015-02-12 2016-08-18 株式会社日立製作所 自律動作検証装置および自律システム
JPWO2016129067A1 (ja) * 2015-02-12 2017-10-26 株式会社日立製作所 自律動作検証装置および自律システム
JP2017174208A (ja) * 2016-03-24 2017-09-28 トヨタ自動車株式会社 自動運転車両を用いたタクシーサービスシステム
CN106873596A (zh) * 2017-03-22 2017-06-20 北京图森未来科技有限公司 一种车辆控制方法及装置
US11500375B2 (en) 2017-03-22 2022-11-15 Beijing Tusen Weilai Technology Co., Ltd. Method and apparatus for vehicle control
WO2021038826A1 (ja) * 2019-08-30 2021-03-04 株式会社日立製作所 状態遷移モデル構築装置及び自律システム
WO2022180788A1 (ja) 2021-02-26 2022-09-01 日本電気株式会社 制約条件学習装置、制約条件学習方法及び記憶媒体
WO2022244143A1 (ja) * 2021-05-19 2022-11-24 株式会社やまびこ ロボット作業装置
WO2024034579A1 (ja) * 2022-08-08 2024-02-15 川崎重工業株式会社 制御装置

Also Published As

Publication number Publication date
EP2975481A4 (en) 2017-01-18
US9983553B2 (en) 2018-05-29
JPWO2014141351A1 (ja) 2017-02-16
JP6141964B2 (ja) 2017-06-07
EP2975481A1 (en) 2016-01-20
US20150309485A1 (en) 2015-10-29

Similar Documents

Publication Publication Date Title
WO2014141351A1 (ja) 自律制御装置
CN104108395B (zh) 用于修改机动车辆的驾驶辅助系统的配置的方法和装置
US11288963B2 (en) Autonomous vehicles featuring vehicle intention system
US10255168B2 (en) Method and device for generating test cases for autonomous vehicles
CN108700876B (zh) 用于自主车辆轨迹修改的远程操作系统和方法
US20220179418A1 (en) Depart constraints implementation in autonomous vehicle routing
US10571916B2 (en) Control method for autonomous vehicles
WO2019236790A1 (en) Gridlock solver for motion planning system of an autonomous vehicle
US20210173401A1 (en) Human Supervision of an Automated Driving System
US20230234613A1 (en) Testing and simulation in autonomous driving
CN111258217A (zh) 实时对象行为预测
Maierhofer et al. Formalization of intersection traffic rules in temporal logic
US11628865B2 (en) Method and system for behavioral cloning of autonomous driving policies for safe autonomous agents
Beglerovic et al. Model-based safety validation of the automated driving functio highway pilot
CN113665593A (zh) 一种车辆智能驾驶纵向控制方法、系统及存储介质
KR20230160807A (ko) 모바일 로봇 궤적 계획기들에 대한 성능 테스트
CN116880462A (zh) 自动驾驶模型、训练方法和自动驾驶方法和车辆
WO2023076343A1 (en) Autonomous vehicle trajectory determination based on state transition model
WO2022072764A1 (en) Metrics for evaluating autonomous vehicle performance
EP3920070A1 (en) Testing and simulation in autonomous driving
Tong et al. A search-based motion planner utilizing a monitoring functionality for initiating minimal risk maneuvers
KR20110046291A (ko) 로봇 주행 방법 및 장치
CN113485300B (zh) 一种基于强化学习的自动驾驶车辆碰撞测试方法
EP4332824A1 (en) System and method for translating natural language traffic rules into formal logic for autonomous moving vehicles
EP4030408A1 (en) Autonomous junction crossing of automated vehicle

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13878317

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2015505094

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 14650111

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2013878317

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE