WO2021176592A1 - 情報処理装置、生成方法、及び生成プログラム - Google Patents

情報処理装置、生成方法、及び生成プログラム Download PDF

Info

Publication number
WO2021176592A1
WO2021176592A1 PCT/JP2020/009138 JP2020009138W WO2021176592A1 WO 2021176592 A1 WO2021176592 A1 WO 2021176592A1 JP 2020009138 W JP2020009138 W JP 2020009138W WO 2021176592 A1 WO2021176592 A1 WO 2021176592A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
guidance
providing
provision
situation
Prior art date
Application number
PCT/JP2020/009138
Other languages
English (en)
French (fr)
Inventor
雅樹 濱田
泰範 椿
建瑠 鈴木
Original Assignee
三菱電機株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 三菱電機株式会社 filed Critical 三菱電機株式会社
Priority to JP2020564277A priority Critical patent/JPWO2021176592A1/ja
Priority to PCT/JP2020/009138 priority patent/WO2021176592A1/ja
Publication of WO2021176592A1 publication Critical patent/WO2021176592A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network

Definitions

  • This disclosure relates to an information processing device, a generation method, and a generation program.
  • Patent Document 1 For example, the display control system of Patent Document 1 predicts the behavior of a target person based on the behavior pattern learned from the behavior history information, generates a guidance image according to the prediction result, and displays the guidance image on the display unit.
  • the behavior pattern of the target person is learned. Therefore, in the above technique, guidance according to the predicted behavior of the target person is displayed. By the way, there are cases where it is desired to infer guidance or the like according to a situation in which a plurality of people exist.
  • the above technique is a technique for learning the behavior pattern of one target person. Therefore, the trained model generated by the above technique cannot infer guidance according to the situation.
  • the purpose of this disclosure is to generate a trained model that infers guidance etc. according to the situation.
  • the information processing device includes an acquisition unit that acquires guidance providing information, which is information related to the provision of guidance, and first surrounding situation information, which is information indicating the surrounding situation of the information providing device that provides the guidance, and the guidance.
  • guidance providing information which is information related to the provision of guidance
  • first surrounding situation information which is information indicating the surrounding situation of the information providing device that provides the guidance
  • the guidance information which is information indicating the guidance of the provision target according to the situation
  • the timing of providing the guidance information and the method of providing the guidance information based on the provided information and the first surrounding situation information.
  • It has a generator that generates a trained model that infers at least one of the above.
  • FIG. (A) and (B) are diagrams showing specific examples of the guidance information of the first embodiment.
  • FIG. 1 is a diagram showing a hardware configuration of the information processing apparatus according to the first embodiment.
  • the information processing device 100 is a device that executes the generation method.
  • the information processing device 100 may be called a learning device.
  • the information processing device 100 includes a processor 101, a volatile storage device 102, and a non-volatile storage device 103.
  • the processor 101 controls the entire information processing device 100.
  • the processor 101 is a CPU (Central Processing Unit), an FPGA (Field Programmable Gate Array), or the like.
  • the processor 101 may be a multiprocessor.
  • the information processing apparatus 100 may be realized by a processing circuit, or may be realized by software, firmware, or a combination thereof.
  • the processing circuit may be a single circuit or a composite circuit.
  • the volatile storage device 102 is the main storage device of the information processing device 100.
  • the volatile storage device 102 is a RAM (Random Access Memory).
  • the non-volatile storage device 103 is an auxiliary storage device of the information processing device 100.
  • the non-volatile storage device 103 is an HDD (Hard Disk Drive) or an SSD (Solid State Drive).
  • FIG. 2 is a diagram showing a functional block included in the information processing apparatus in the learning phase of the first embodiment.
  • the information processing device 100 has a storage unit 110, an acquisition unit 120, and a generation unit 130.
  • the storage unit 110 may be realized as a storage area reserved in the volatile storage device 102 or the non-volatile storage device 103.
  • a part or all of the acquisition unit 120 and the generation unit 130 may be realized by the processor 101.
  • a part or all of the acquisition unit 120 and the generation unit 130 may be realized as a module of a program executed by the processor 101.
  • the program executed by the processor 101 is also called a generation program.
  • the generation program is recorded on a recording medium.
  • the acquisition unit 120 acquires the learning data 10. Specifically, the acquisition unit 120 acquires the guidance providing information which is the information regarding the provision of the guidance and the surrounding situation information which is the information indicating the surrounding situation of the information providing device which provides the guidance. In other words, the acquisition unit 120 acquires the surrounding situation information which is the information indicating the surrounding situation of the information providing device for providing the information and the guidance providing information which is the information regarding the provision of the guidance performed by the information providing device in the situation. do.
  • the surrounding situation information is also referred to as a first surrounding situation information.
  • the surrounding situation information may be expressed as information indicating a situation in a preset range from the position where the information providing device exists.
  • the information providing device is a digital signage, a projector, a smartphone, etc. installed in a facility such as a station. Further, the information providing device may be called an information presenting device or an information output device.
  • the guidance providing information includes at least one of guidance information (for example, content) which is information indicating guidance, timing for providing guidance information, and a method for providing guidance information.
  • guidance information for example, content
  • the guidance indicated by the guidance information includes transfer guidance, route guidance, mobility support for vulnerable people, guidance on trouble occurrence, alerting, etiquette enlightenment, and the like.
  • the method of providing the guidance information is a method of displaying the guidance information on the display of the information providing device, a method of providing the guidance information by voice from the speaker of the information providing device, and providing information that the guidance information is received. This is a method of transmitting by vibration by the tactile presentation device of the device.
  • the surrounding situation information includes the degree of congestion, the degree of danger, the weather, the time zone, and the like.
  • the degree of congestion is obtained based on an image obtained from a surveillance camera, information on a group passing through an automatic ticket gate, information obtained from a sensor, and the like.
  • the risk level is set to a value based on the probability of accident occurrence.
  • the probability of an accident is calculated based on information such as the area around the platform when the train arrives, stairs, escalators, places with poor visibility, and places where accidents have occurred in the past.
  • the generation unit 130 may calculate the degree of congestion, the degree of risk, and the like by using the surrounding situation information of the learning data.
  • the weather is the weather of the place where the information providing device is located.
  • the time zone includes commuting rush hour, weekday time zone, holiday time zone, long vacation time zone, and the like.
  • the surrounding situation information may include the attributes of the customers who use the facility.
  • the attributes of the user are age, gender, wheelchair, stroller, white cane, and the like.
  • the attributes of the user can be obtained by analyzing the image obtained from the surveillance camera.
  • the guidance provision information and the surrounding situation information may be learning data created by the device by the user's operation. That is, the guidance provision information and the surrounding situation information may be fictitious data created by the user. Further, the guidance provision information may be information when the guidance is actually provided.
  • the surrounding situation information may be information on the surrounding situation of the past information providing device. That is, the guidance providing information and the surrounding situation information may be actual information.
  • the generation unit 130 generates a trained model based on the training data. Specifically, the generation unit 130 performs the learning process so that the guidance method or the like according to the surrounding situation of the information providing device is appropriate.
  • the learning process (that is, learning algorithm) includes supervised learning, unsupervised learning, reinforcement learning, semi-supervised learning, and the like. As an example, the case where reinforcement learning is used will be described.
  • an agent that is, an action subject
  • observes the current state that is, an environmental parameter
  • the agent is then rewarded as the environment changes.
  • the agent repeats the above process, and learns the action policy in which the most reward is obtained through a series of actions.
  • Q-learning and TD-learning are known.
  • the general update formula of the action value function Q (s, a) is expressed by the following formula (1).
  • s t represents the state of the environment at time t.
  • a t represents an action at time t.
  • the state is changed to s t + 1.
  • rt + 1 represents the reward obtained by changing the state.
  • represents the discount rate.
  • represents a learning coefficient.
  • the range of ⁇ is “0 ⁇ ⁇ 1”.
  • the range of ⁇ is “0 ⁇ ⁇ 1”. If the reinforcement learning is used, the guide provides information corresponding to the action a t, the surrounding status information corresponding to the state s t. And, best of the action a t in state s t at time t is learned.
  • equation (1) when the action value of the action a having the highest Q value at time t + 1 is larger than the action value of the action a at time t, the action value becomes large.
  • the action value of the action a having the highest Q value at time t + 1 when the action value of the action a having the highest Q value at time t + 1 is smaller than the action value of the action a at time t, the action value becomes small.
  • the action value function Q (s, a) is updated so that the action value of the action a at the time t approaches the best action value at the time t + 1. Then, the best action value in a certain environment is sequentially propagated to the action value in the previous environment.
  • the generation unit 130 has a reward calculation unit 131 and a function update unit 132.
  • the reward calculation unit 131 increases the reward r when the surrounding conditions improve. For example, the reward calculation unit 131 gives a reward of "1" when the degree of congestion is low or the degree of risk is low.
  • the reward calculation unit 131 reduces the reward r when the surrounding situation deteriorates. For example, the reward calculation unit 131 gives a reward of "-1" when the degree of congestion becomes high or the degree of risk becomes high.
  • the function update unit 132 updates the function for inferring the guidance method or the like according to the reward r.
  • action value function Q (s t, a t) represented by the formula (1) is, as a function for inferring such guidance method used.
  • Generator 130 Repeating the above learning, action value function Q (s t, a t) as trained model generates.
  • the generation unit 130 stores the trained model in the storage unit 110.
  • FIG. 3 is a flowchart showing an example of processing based on the reinforcement learning of the first embodiment.
  • the acquisition unit 120 acquires the learning data 10. That is, the acquisition unit 120 acquires the guidance provision information and the surrounding situation information.
  • the guidance providing information shall include the guidance information, the timing of providing the guidance information, and the method of providing the guidance information.
  • Step S12 The reward calculation unit 131 determines whether or not the surrounding situation indicated by the surrounding situation information is improved by the guidance method or the like indicated by the guidance providing information. Specifically, the reward calculation unit 131 determines whether or not the surrounding situation improves based on a preset standard. For example, the reward calculation unit 131 determines that the surrounding situation will improve when the degree of congestion becomes lower than the preset standard due to the guidance method indicated by the guidance provision information. If the surrounding conditions improve, the process proceeds to step S13. If the surrounding conditions worsen, the process proceeds to step S14.
  • Step S13 The reward calculation unit 131 increases the reward r. Then, the process proceeds to step S15.
  • Step S14 The reward calculation unit 131 reduces the reward r.
  • Step S15 function update unit 132, according to the reward r, action-value function Q (s t, a t) to update.
  • the generation unit 130 repeats steps S11 to S15. That is, the generation unit 130 executes the processes after step S12 every time the learning data 10 is acquired. Step S11 ⁇ 15 generated by repeats the action-value function Q (s t, a t) is, as a learned model, are stored in the storage unit 110. Further, the generation unit 130 may store the trained model in an external device that can be connected to the information processing device 100.
  • the generation unit 130 generates the trained model based on the guidance provision information and the surrounding situation information.
  • the information processing device uses the trained model to provide guidance information, which is information indicating guidance of the provision target, timing for providing the guidance information, and the guidance information according to the situation. At least one of the methods can be inferred. That is, the information processing device can infer what kind of guidance information is provided at what timing and by what method according to the situation by using the trained model.
  • FIG. 4 is a diagram showing a functional block included in the information processing apparatus in the utilization phase of the first embodiment.
  • the configuration of FIG. 4, which is the same as the configuration shown in FIG. 2, has the same reference numerals as those shown in FIG.
  • the information processing device 100a may be called an inference device.
  • the information processing device 100a is connected to the information providing devices 20_1 to 20_3.
  • the information providing device 20_1 is a digital signage.
  • the information processing device 100a includes a storage unit 110, an acquisition unit 120a, an inference unit 140, and a provision control unit 150.
  • the information processing device 100 and the information processing device 100a may be the same device or different devices.
  • the information processing device 100a has a generation unit 130.
  • a part or all of the acquisition unit 120a, the inference unit 140, and the provision control unit 150 may be realized by the processor included in the information processing device 100a.
  • a part or all of the acquisition unit 120a, the inference unit 140, and the provision control unit 150 may be realized as a module of a program executed by a processor included in the information processing device 100a.
  • the program is recorded on a recording medium.
  • the acquisition unit 120a acquires the surrounding situation information 11.
  • the surrounding situation information 11 is information indicating the surrounding situation of the information providing device 20_1.
  • the acquisition unit 120a acquires the surrounding situation information 11 from the surveillance camera installed above the information providing device 20_1.
  • the surrounding situation information 11 is also referred to as a second surrounding situation information.
  • the inference unit 140 may calculate the degree of congestion, the degree of risk, and the like by using the surrounding situation information 11.
  • the acquisition unit 120a acquires the trained model.
  • the acquisition unit 120a acquires the trained model from the storage unit 110.
  • the acquisition unit 120a acquires the trained model from the external device.
  • the inference unit 140 infers a guidance method or the like according to the situation indicated by the surrounding situation information 11 by using the surrounding situation information 11 and the learned model. That is, the inference unit 140 provides guidance information to be provided, timing for providing the guidance information, and the guidance information according to the situation indicated by the surrounding situation information 11 based on the surrounding situation information 11 and the learned model. Infer how to provide.
  • the guidance information is also referred to as the first guidance information.
  • the provision control unit 150 controls the information providing device regarding the provision of guidance based on the result of the inference.
  • FIG. 5 is a flowchart showing an example of processing executed by the information processing apparatus in the utilization phase of the first embodiment.
  • the acquisition unit 120a acquires the surrounding situation information 11. Further, the acquisition unit 120a acquires the trained model.
  • the inference unit 140 infers a guidance method according to the surrounding situation indicated by the surrounding situation information 11 based on the surrounding situation information 11 and the learned model.
  • the provided control unit 150 executes control based on the result of inference. Specifically, the provision control unit 150 provides information on the provision instruction of the guidance information to be provided, the information indicating the timing of providing the guidance information, and the information indicating the method of providing the guidance information based on the result of the inference. Send to the provider. For example, when the surrounding situation information 11 indicates the surrounding situation of the information providing device 20_1, the provision control unit 150 indicates the provision instruction of the guidance information to be provided and the timing of providing the guidance information based on the inference result. , And information indicating a method of providing the guidance information is transmitted to the information providing device 20_1.
  • the provision control unit 150 shall transmit the information to the information providing device 20_1.
  • the provision control unit 150 may transmit the guidance information of the provision target.
  • the information providing device 20_1 provides the guidance information to be provided by the method at the timing.
  • the information providing device 20_1 displays transfer guidance, route guidance, movement support for vulnerable people, guidance when a trouble occurs, alerting, etiquette enlightenment, etc. on the display of the information providing device 20_1.
  • the congestion is alleviated. By reducing congestion, the travel time of passengers within the facility will be shortened. Further, for example, the information providing device 20_1 displays the guidance information to prevent a fall accident.
  • FIG. 6 is a diagram showing an example in the facility of the station of the first embodiment.
  • FIG. 6 shows the home 200 and the concourse 201. Further, FIG. 6 shows digital signage 202_1 to 202_5 and speakers 203_1 and 203_2. Digital signage 202_1 to 202_5 and speakers 203_1 and 203_2 are information providing devices.
  • the information processing device 100a acquires the surrounding condition information 11 indicating that the periphery of the escalator existing near the digital signage 202_1 or the speaker 203_1 is congested.
  • the information processing device 100a infers a guidance method and the like by using the surrounding situation information 11 and the learned model. Based on the result of inference, the information processing device 100a transmits information prompting the user to use the stairs to the digital signage 202_1 or the speaker 203_1.
  • the digital signage 202_1 displays information prompting the use of the stairs.
  • the speaker 203_1 provides information prompting the use of the stairs by voice.
  • the information processing device 100a acquires the surrounding situation information 11 indicating that a wheelchair user exists around the digital signage 202_1 or the speaker 203_1.
  • the information processing device 100a infers a guidance method and the like by using the surrounding situation information 11 and the learned model. Based on the result of the inference, the information processing device 100a transmits information to the digital signage 202_1 or the speaker 203_1 to urge users other than the wheelchair user not to use the elevator.
  • the digital signage 202_1 displays information urging passengers other than wheelchair passengers not to use the elevator.
  • the speaker 203_1 audibly provides information prompting the passengers other than the wheelchair passengers not to use the elevator. This allows wheelchair users to use the elevator.
  • the information processing device 100a indicates that a user walking while using a smartphone or a user who violates the manners of carry-back exists around the digital signage 202_1 or the speaker 203_1. Get 11 The information processing device 100a infers a guidance method and the like by using the surrounding situation information 11 and the learned model. The information processing device 100a transmits the alert information to the digital signage 202_1 or the speaker 203_1 based on the result of the inference. Digital signage 202_1 displays alert information. Alternatively, the speaker 203_1 provides the alert information by voice.
  • the information processing device 100a acquires the surrounding situation information 11 indicating that the surroundings of the speaker 203_1 are congested.
  • the information processing apparatus 100a acquires the surrounding situation information 11 indicating that the surroundings of the digital signage 202_2 are congested.
  • the information processing device 100a infers a guidance method and the like by using the surrounding situation information 11 and the learned model.
  • the information processing device 100a transmits guidance information to the speaker 203_1 based on the result of inference.
  • the speaker 203_1 provides guidance information by voice. As a result, since the surroundings of the digital signage 202_2 are congested, even if the user cannot see the digital signage 202_2, the user can hear the guidance by voice.
  • the information processing device 100a acquires the surrounding situation information 11 indicating that a user who may fall from the home 200 exists around the digital signage 202_1 or the speaker 203_1.
  • the information processing device 100a infers a guidance method and the like by using the surrounding situation information 11 and the learned model.
  • the information processing device 100a transmits information calling attention to the digital signage 202_1 or the speaker 203_1 based on the result of the inference.
  • Digital signage 202_1 displays information that calls attention.
  • the speaker 203_1 provides information calling attention by voice.
  • the information processing device 100a displays information for guiding users during the commuting rush hour on the digital signage, and provides guidance at a time other than the commuting rush hour (for example, guidance for an event held in the facility). It may be displayed on digital signage.
  • 7 (A) and 7 (B) are diagrams showing specific examples of the guidance information of the first embodiment.
  • 7 (A) and 7 (B) are examples of guidance information displayed by digital signage.
  • the information processing device 100 can generate a trained model that infers guidance or the like according to a situation. Further, the information processing device 100a can provide appropriate guidance according to the situation via the information providing device by using the trained model.
  • the information processing device 100 and the information processing device 100a may be considered as cloud servers. Further, at least one of the information processing device 100 and the information processing device 100a may be included in the information providing device.
  • the information processing device 100 may learn actual information as learning data.
  • the guidance providing information is information regarding the provision of guidance provided by the information providing device when the situation around the information providing device is the first situation.
  • the surrounding situation information is information indicating the first situation.
  • the information processing device 100 can generate a learned model that infers a guidance method or the like according to the actual situation by using the actual information as the learning data.
  • the information processing device 100 may use information acquired from a plurality of information providing devices existing in the same area as learning data, or information acquired from a plurality of information providing devices existing in different areas. May be used as training data.
  • an information presentation device for which learning data is collected may be added in the middle.
  • the information presentation device for which the learning data is collected may be removed in the middle.
  • the information processing device 100 may be included in the information providing device.
  • the information processing device 100 executes a learning process using the learning data acquired from the information providing device, and the information providing device is different from the information providing device.
  • the learning process may be executed using the learning data acquired from the different information providing device.
  • Embodiment 2. ⁇ Utilization phase> Next, the second embodiment will be described. In the second embodiment, matters different from the first embodiment will be mainly described. Then, in the second embodiment, the description of the matters common to the first embodiment will be omitted. In the description of the second embodiment, FIGS. 1 to 7 are referred to.
  • FIG. 8 is a diagram showing a functional block included in the information processing device in the utilization phase of the second embodiment.
  • the information processing device 100a further includes a specific unit 160. Further, the information processing device 100a has a provision control unit 150a.
  • the storage unit 110 further stores the movement history of the group. In other words, the movement history of the group is the movement history of a plurality of users. Further, the storage unit 110 stores the route information.
  • the acquisition unit 120a acquires the movement history of the group existing around the information providing device from the storage unit 110. For example, when the surrounding situation information 11 indicates the surrounding situation of the information providing device 20_1, the acquisition unit 120a acquires the movement history of the group existing around the information providing device 20_1 from the storage unit 110.
  • the movement history of the group may be stored in an external device.
  • the acquisition unit 120a acquires the movement history of the group from the external device.
  • the movement history of the group is information indicating where the group has moved in the past.
  • the identification unit 160 identifies the destination to which the group moves based on the movement history of the group. For example, the identification unit 160 identifies a destination that is a destination of the movement of the group existing around the information providing device 20_1 based on the movement history of the group.
  • the acquisition unit 120a acquires route information indicating a route to the destination from the storage unit 110.
  • the route information may be stored in an external device.
  • the acquisition unit 120a acquires the route information from the external device. It is desirable that the route information is information indicating the route having the shortest distance to the destination.
  • the provision control unit 150a acquires route information via the acquisition unit 120a.
  • the provision control unit 150a identifies a plurality of information providing devices existing on the route indicated by the route information based on the route information.
  • the plurality of information providing devices include the information providing device 20_1.
  • the provision control unit 150a changes the guidance information based on the inference result into guidance that guides the group to the destination.
  • the provision control unit 150a controls a plurality of information providing devices based on the changed guidance information.
  • the providing control unit 150a controls the information providing device 20_1 so as to provide the guidance information at the timing and the providing method based on the inference result. do.
  • FIG. 9 is a flowchart showing an example of processing executed by the information processing apparatus in the utilization phase of the second embodiment.
  • the acquisition unit 120a acquires the surrounding situation information 11. Further, the acquisition unit 120a acquires the trained model.
  • the inference unit 140 infers a guidance method according to the surrounding situation indicated by the surrounding situation information 11 based on the surrounding situation information 11 and the learned model.
  • Step S33 The acquisition unit 120a acquires the movement history of the group existing around the information providing device of the surrounding situation information 11 indicating the surrounding situation of the information providing device from the storage unit 110. In other words, the acquisition unit 120a acquires from the storage unit 110 the movement history of the group existing in the preset range from the position where the information providing device exists in the surrounding situation information 11 indicating the surrounding situation of the information providing device. .. (Step S34) The identification unit 160 identifies a destination to which the group moves based on the movement history.
  • Step S35 The acquisition unit 120a acquires route information indicating a route to the destination from the storage unit 110.
  • Step S36 The provision control unit 150a identifies a plurality of information providing devices existing on the route indicated by the route information based on the route information.
  • steps S33 to 36 may be executed in parallel with steps 31 and 32.
  • the provision control unit 150a changes the guidance information based on the result of the inference to the guidance for guiding the group to the destination.
  • the provision control unit 150a performs control based on the changed guidance information on the plurality of information providing devices. Specifically, the provision control unit 150a transmits an instruction to a plurality of information providing devices so that the provision of guidance for guiding the group to the destination is synchronized. In other words, the provision control unit 150a transmits an instruction to a plurality of information providing devices so that the provision of the guidance for guiding the group to the destination is linked.
  • the plurality of information providing devices can provide guidance in synchronization with each other. In other words, the plurality of information providing devices provide guidance for guiding the group to the destination in an interlocking manner. The group is guided to the destination by the guidance of a plurality of information providing devices.
  • the information processing device 100a may display a colored alert on the information providing device existing at the branch point so that the user does not follow the wrong route at the branch point on the route. Further, the information processing device 100a may transmit an instruction to a plurality of information providing devices so that the user does not follow the wrong route at the branch point on the route and repeatedly displays the alert. The information processing device 100a may transmit an instruction to a plurality of information providing devices so that the user does not follow an erroneous route at a branch point on the route and displays a warning for a long period of time.
  • the information processing device 100a does not have to specify all the plurality of information providing devices existing on the route indicated by the route information.
  • the information processing device 100a may specify a plurality of information providing devices selected every other one from all the information providing devices existing on the route indicated by the route information.
  • FIG. 10 is a diagram showing a specific example in the case where the plurality of information providing devices of the second embodiment are synchronized.
  • FIG. 10 shows the home 300.
  • the frame 301 shows the periphery of the stairs.
  • the frame 302 shows the periphery of the elevator.
  • the frame 303 shows the periphery of the escalator.
  • FIG. 10 shows digital signage.
  • FIG. 10 shows digital signage 304a, 304b.
  • FIG. 10 shows that train 305 has arrived at the station.
  • the information processing device 100a acquires the surrounding situation information 11 indicating the surrounding situation of the digital signage 304a.
  • the information processing device 100a infers a guidance method according to the surrounding situation indicated by the surrounding situation information 11 based on the surrounding situation information 11 and the learned model.
  • the information processing device 100a acquires the movement history of the group existing around the digital signage 304a from the storage unit 110.
  • the information processing device 100a identifies a destination to which the group moves, based on the movement history.
  • the information processing device 100a acquires route information indicating a route to the destination from the storage unit 110.
  • the information processing device 100a identifies the digital signage 304a and 304b existing on the route indicated by the route information.
  • the information processing device 100a changes the guidance information based on the inference result into guidance that guides the group to the destination.
  • the information processing device 100a transmits an instruction to the digital signage 304a and 304b so that the provision of guidance for guiding the group to the destination is synchronized. That is, the information processing apparatus 100a transmits a command to the digital signage 304a and 304b so that the provision of the guidance for guiding the group to the destination is synchronized. Further, the information processing apparatus 100a controls the digital signage 304a so as to provide the changed guidance information at the timing and the providing method based on the inference result.
  • the digital signage 304a displays information for guiding the population in the direction of the digital signage 304b at a timing and providing method based on the result of inference. Then, the digital signage 304b displays information for guiding the group in the direction of the escalator. As a result, the information processing device 100a can smoothly move the group to the destination. In addition, the degree of congestion is alleviated by the smooth movement of the group.
  • the acquisition unit 120a acquires the position information of the portable device and the identification information of the portable device. For example, the acquisition unit 120a acquires the position information of the portable device and the identification information of the portable device from the portable device.
  • the acquisition unit 120a determines whether or not the position indicated by the position information exists in the periphery of the information providing device. In other words, the acquisition unit 120a determines whether or not the position indicated by the position information exists within a preset range from the position where the information providing device exists. For example, when the surrounding situation information 11 indicates the surrounding situation of the information providing device 20_1, the acquisition unit 120a determines whether or not the position indicated by the position information exists in the surroundings of the information providing device 20_1. When the position indicated by the position information exists in the periphery of the information providing device, the acquisition unit 120a acquires the movement history of the user who uses the portable device specified by the identification information. In other words, the acquisition unit 120a acquires the movement history of the user from the movement history, with the movement of the mobile device specified by the identification information as the movement of the user.
  • the user is also referred to as a user.
  • the identification unit 160 identifies the destination to which the user is moving based on the movement history.
  • the acquisition unit 120a acquires route information indicating a route to the destination.
  • the provision control unit 150a identifies a plurality of information providing devices existing on the route indicated by the route information based on the route information.
  • the surrounding situation information 11 indicates the surrounding situation of the information providing device 20_1, the plurality of information providing devices include the information providing device 20_1.
  • the provision control unit 150a changes the guidance information into a guidance that guides the user to the destination.
  • the provision control unit 150a controls a plurality of information providing devices based on the changed guidance information. Specifically, the provision control unit 150a transmits an instruction to a plurality of information providing devices so that the provision of the guidance for guiding the user to the destination is synchronized. In other words, the provision control unit 150a transmits an instruction to a plurality of information providing devices so that the provision of the guidance for guiding the user to the destination is linked. As a result, the plurality of information providing devices can provide guidance in synchronization with each other. Therefore, the information processing device 100a can smoothly move the user to the destination.
  • the information processing device 100a may cause the information providing device to provide the input information (for example, a character string, an image, etc.) by the operation of the staff of the facility. As a result, the information providing device provides the guidance that the facility staff wants to provide.

Landscapes

  • Engineering & Computer Science (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Automation & Control Theory (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

情報処理装置(100)は、案内の提供に関する情報である案内提供情報と、案内を提供する情報提供装置の周囲の状況を示す情報である第1の周囲状況情報とを取得する取得部(120)と、案内提供情報と第1の周囲状況情報とに基づいて、状況に応じた、提供対象の案内を示す情報である案内情報、案内情報を提供するタイミング、及び案内情報を提供する方法のうちの少なくとも1つを推論する学習済モデルを生成する生成部(130)と、を有する。

Description

情報処理装置、生成方法、及び生成プログラム
 本開示は、情報処理装置、生成方法、及び生成プログラムに関する。
 施設では、案内が利用客に提供されている。例えば、案内は、デジタルサイネージに表示される。利用客は、デジタルサイネージを見ることで、案内を知ることができる。ここで、案内の表示に関する技術が提案されている(特許文献1を参照)。例えば、特許文献1の表示制御システムは、行動履歴情報から学習した行動パターンに基づいて対象人物の行動を予測し、予測結果に応じて案内画像を生成し、案内画像を表示部に表示させる。
特開2014-123277号公報
 上記の技術では、対象人物の行動パターンが学習される。そのため、上記の技術では、予測された対象人物の行動に応じた案内が表示される。
 ところで、複数の人が存在するような状況に応じた案内などを推論したい場合がある。上記の技術は、1人の対象人物の行動パターンを学習する技術である。そのため、上記の技術によって生成させた学習済モデルは、当該状況に応じた案内を推論できない。
 本開示の目的は、状況に応じた案内などを推論する学習済モデルを生成することである。
 本開示の一態様に係る情報処理装置が提供される。情報処理装置は、案内の提供に関する情報である案内提供情報と、前記案内を提供する情報提供装置の周囲の状況を示す情報である第1の周囲状況情報とを取得する取得部と、前記案内提供情報と前記第1の周囲状況情報とに基づいて、状況に応じた、提供対象の案内を示す情報である案内情報、前記案内情報を提供するタイミング、及び前記案内情報を提供する方法のうちの少なくとも1つを推論する学習済モデルを生成する生成部と、を有する。
 本開示によれば、状況に応じた案内などを推論する学習済モデルを生成できる。
実施の形態1の情報処理装置が有するハードウェアの構成を示す図である。 実施の形態1の学習フェーズにおける情報処理装置が有する機能ブロックを示す図である。 実施の形態1の強化学習に基づく処理の例を示すフローチャートである。 実施の形態1の活用フェーズにおける情報処理装置が有する機能ブロックを示す図である。 実施の形態1の活用フェーズにおける情報処理装置が実行する処理の例を示すフローチャートである。 実施の形態1の駅の施設内の例を示す図である。 (A),(B)は、実施の形態1の案内情報の具体例を示す図である。 実施の形態2の活用フェーズにおける情報処理装置が有する機能ブロックを示す図である。 実施の形態2の活用フェーズにおける情報処理装置が実行する処理の例を示すフローチャートである。 実施の形態2の複数の情報提供装置が同調する場合の具体例を示す図である。
 以下、図面を参照しながら実施の形態を説明する。以下の実施の形態は、例にすぎず、本開示の範囲内で種々の変更が可能である。
実施の形態1.
<学習フェーズ>
 図1は、実施の形態1の情報処理装置が有するハードウェアの構成を示す図である。情報処理装置100は、生成方法を実行する装置である。情報処理装置100は、学習装置と呼んでもよい。情報処理装置100は、プロセッサ101、揮発性記憶装置102、及び不揮発性記憶装置103を有する。
 プロセッサ101は、情報処理装置100全体を制御する。例えば、プロセッサ101は、CPU(Central Processing Unit)、FPGA(Field Programmable Gate Array)などである。プロセッサ101は、マルチプロセッサでもよい。情報処理装置100は、処理回路によって実現されてもよく、又は、ソフトウェア、ファームウェア若しくはそれらの組み合わせによって実現されてもよい。なお、処理回路は、単一回路又は複合回路でもよい。
 揮発性記憶装置102は、情報処理装置100の主記憶装置である。例えば、揮発性記憶装置102は、RAM(Random Access Memory)である。不揮発性記憶装置103は、情報処理装置100の補助記憶装置である。例えば、不揮発性記憶装置103は、HDD(Hard Disk Drive)又はSSD(Solid State Drive)である。
 次に、情報処理装置100が有する機能を説明する。
 図2は、実施の形態1の学習フェーズにおける情報処理装置が有する機能ブロックを示す図である。情報処理装置100は、記憶部110、取得部120、及び生成部130を有する。
 記憶部110は、揮発性記憶装置102又は不揮発性記憶装置103に確保した記憶領域として実現してもよい。
 取得部120及び生成部130の一部又は全部は、プロセッサ101によって実現してもよい。取得部120及び生成部130の一部又は全部は、プロセッサ101が実行するプログラムのモジュールとして実現してもよい。例えば、プロセッサ101が実行するプログラムは、生成プログラムとも言う。例えば、生成プログラムは、記録媒体に記録されている。
 取得部120は、学習用データ10を取得する。詳細には、取得部120は、案内の提供に関する情報である案内提供情報と、案内を提供する情報提供装置の周囲の状況を示す情報である周囲状況情報とを取得する。言い換えれば、取得部120は、情報を提供する情報提供装置の周囲の状況を示す情報である周囲状況情報と、情報提供装置が当該状況で行う案内の提供に関する情報である案内提供情報とを取得する。ここで、当該周囲状況情報は、第1の周囲状況情報とも言う。当該周囲状況情報は、情報提供装置が存在する位置から予め設定された範囲の状況を示す情報と表現してもよい。
 まず、情報提供装置を説明する。例えば、情報提供装置は、駅などの施設内に設置されているデジタルサイネージ、プロジェクタ、スマートフォンなどである。また、情報提供装置は、情報提示装置又は情報出力装置と呼んでもよい。
 次に、案内提供情報を説明する。案内提供情報には、案内を示す情報である案内情報(例えば、コンテンツ)、案内情報を提供するタイミング、及び案内情報を提供する方法のうちの少なくとも1つが含まれる。
 例えば、案内情報が示す案内とは、乗換案内、道案内、交通弱者の移動支援、トラブル発生の案内、注意喚起、マナー啓発などである。
 また、例えば、案内情報を提供する方法とは、情報提供装置のディスプレイに案内情報を表示する方法、情報提供装置のスピーカから案内情報を音声で提供する方法、案内情報を受信したことを情報提供装置の触覚提示デバイスによる振動で伝える方法である。
 次に、周囲状況情報を説明する。例えば、周囲状況情報とは、混雑度、危険度、天候、時間帯などである。
 例えば、混雑度は、監視カメラから得られた画像、自動改札機を通過する集団の情報、センサから得られた情報などに基づいて得られる。
 例えば、危険度には、事故の発生確率に基づく値が設定される。例えば、事故の発生確率は、列車が到着する時のホームの周辺、階段、エスカレータ、見通しが悪い場所、過去に事故が発生した場所などの情報に基づいて、計算される。なお、生成部130は、学習用データの周囲状況情報を用いて、混雑度、危険度などを計算してもよい。
 天候は、情報提供装置が存在する場所の天候である。時間帯は、通勤ラッシュの時間帯、平日の時間帯、休日の時間帯、長期休暇時期の時間帯などである。
 周囲状況情報には、施設を利用する利用客の属性が含まれてもよい。例えば、利用客の属性とは、年齢、性別、車椅子、ベビーカー、白杖などである。例えば、利用客の属性は、監視カメラから得られた画像を解析することで得られる。
 ここで、案内提供情報と周囲状況情報とは、ユーザの操作により装置が作成した学習用データでもよい。すなわち、案内提供情報と周囲状況情報とは、ユーザによって作成された架空のデータでもよい。また、案内提供情報は、実際に案内の提供が行われたときの情報でもよい。周囲状況情報は、過去の情報提供装置の周囲の状況の情報でもよい。すなわち、案内提供情報と周囲状況情報とは、現実の情報でもよい。
 生成部130は、学習データに基づいて、学習済モデルを生成する。詳細には、生成部130は、情報提供装置の周囲の状況に応じた案内方法などが適切になるように、学習処理を行う。
 また、学習処理(すなわち、学習アルゴリズム)は、教師あり学習、教師なし学習、強化学習、半教師あり学習などである。一例として、強化学習が用いられる場合を説明する。
 強化学習では、ある環境内におけるエージェント(すなわち、行動主体)が、現在の状態(すなわち、環境のパラメータ)を観測し、エージェントが取るべき行動が決定される。エージェントの行動により環境が、動的に変化する。そして、エージェントには、環境の変化に応じて報酬が与えられる。エージェントは、上記の処理を繰り返し、一連の行動を通じて報酬が最も多く得られる行動方針が、学習される。代表的な強化学習として、Q学習(Q-learning)、及びTD学習(TD-learning)が知られている。例えば、Q学習の場合、行動価値関数Q(s,a)の一般的な更新式は、次の式(1)で表される。
Figure JPOXMLDOC01-appb-M000001
 なお、sは、時刻tにおける環境の状態を表す。aは、時刻tにおける行動を表す。行動aにより、状態は、st+1に変わる。rt+1は、状態の変化によって得られる報酬を表す。γは、割引率を表す。αは、学習係数を表す。また、γの範囲は、“0<γ≦1”とする。αの範囲は、“0<α≦1”とする。
 強化学習が用いられる場合、案内提供情報が行動aに対応し、周囲状況情報が状態sに対応する。そして、時刻tの状態sにおける最良の行動aが学習される。
 式(1)では、時刻t+1における最もQ値の高い行動aの行動価値が、時刻tにおける行動aの行動価値よりも大きい場合、行動価値が大きくなる。式(1)では、時刻t+1における最もQ値の高い行動aの行動価値が、時刻tにおける行動aの行動価値よりも小さい場合、行動価値が小さくなる。このように、行動価値関数Q(s,a)は、時刻tにおける行動aの行動価値を、時刻t+1における最良の行動価値に近づくように、更新される。そして、ある環境における最良の行動価値が、以前の環境における行動価値に順次伝播していく。
 上記のように、生成部130が強化学習を用いる場合、生成部130は、報酬計算部131と関数更新部132を有する。
 報酬計算部131は、周囲の状況が良くなる場合、報酬rを増大する。例えば、報酬計算部131は、混雑度が低くなる場合又は危険度が低くなる場合、“1”の報酬を与える。一方、報酬計算部131は、周囲の状況が悪くなる場合、報酬rを低減する。例えば、報酬計算部131は、混雑度が高くなる場合又は危険度が高くなる場合、“-1”の報酬を与える。
 関数更新部132は、報酬rに従って、案内方法などを推論するための関数を更新する。なお、例えば、Q学習の場合、式(1)で表される行動価値関数Q(s,a)が、案内方法などを推論するための関数として、用いられる。
 生成部130は、上記の学習を繰り返すことで、行動価値関数Q(s,a)を学習済モデルとして、生成する。
 生成部130は、学習済モデルを記憶部110に格納する。
 次に、強化学習を用いる情報処理装置100の処理を、フローチャートを用いて説明する。
 図3は、実施の形態1の強化学習に基づく処理の例を示すフローチャートである。
 (ステップS11)取得部120は、学習用データ10を取得する。すなわち、取得部120は、案内提供情報と周囲状況情報を取得する。なお、以下の説明では、案内提供情報には、案内情報、案内情報を提供するタイミング、及び案内情報を提供する方法が含まれるものとする。
 (ステップS12)報酬計算部131は、案内提供情報が示す案内方法などによって、周囲状況情報が示す周囲の状況がよくなるか否かを判定する。詳細には、報酬計算部131は、予め設定された基準に基づいて、周囲の状況がよくなるか否かを判定する。例えば、報酬計算部131は、案内提供情報が示す案内方法などによって、混雑度が予め設定された基準より低くなった場合、周囲の状況がよくなると判定する。
 周囲の状況がよくなる場合、処理は、ステップS13に進む。周囲の状況が悪くなる場合、処理は、ステップS14に進む。
 (ステップS13)報酬計算部131は、報酬rを増大する。そして、処理は、ステップS15に進む。
 (ステップS14)報酬計算部131は、報酬rを低減する。
 (ステップS15)関数更新部132は、報酬rに従って、行動価値関数Q(s,a)を更新する。
 生成部130は、ステップS11~15を繰り返す。すなわち、生成部130は、学習用データ10を取得する度にステップS12以降の処理を実行する。ステップS11~15が繰り返されることで生成された行動価値関数Q(s,a)が、学習済モデルとして、記憶部110に格納される。また、生成部130は、情報処理装置100に接続可能な外部装置に学習済モデルを格納してもよい。
 このように、生成部130は、案内提供情報と周囲状況情報とに基づいて、学習済モデルを生成する。活用フェーズで説明するが、情報処理装置は、学習済モデルを用いて、状況に応じた、提供対象の案内を示す情報である案内情報、当該案内情報を提供するタイミング、及び当該案内情報を提供する方法のうちの少なくとも1つを推論することができる。すなわち、情報処理装置は、学習済モデルを用いて、状況に応じて、どのタイミングで、どんな案内情報をどんな方法で提供するかを推論することができる。
<活用フェーズ>
 図4は、実施の形態1の活用フェーズにおける情報処理装置が有する機能ブロックを示す図である。図2に示される構成と同じ図4の構成は、図2に示される符号と同じ符号を付している。情報処理装置100aは、推論装置と呼んでもよい。情報処理装置100aは、情報提供装置20_1~20_3と接続する。例えば、情報提供装置20_1は、デジタルサイネージである。
 情報処理装置100aは、記憶部110、取得部120a、推論部140、及び提供制御部150を有する。
 ここで、情報処理装置100と情報処理装置100aは、同じ装置でもよいし、異なる装置でもよい。例えば、情報処理装置100と情報処理装置100aが同じ装置である場合、情報処理装置100aは、生成部130を有する。
 取得部120a、推論部140、及び提供制御部150の一部又は全部は、情報処理装置100aが有するプロセッサによって実現してもよい。取得部120a、推論部140、及び提供制御部150の一部又は全部は、情報処理装置100aが有するプロセッサが実行するプログラムのモジュールとして実現してもよい。例えば、当該プログラムは、記録媒体に記録されている。
 取得部120aは、周囲状況情報11を取得する。例えば、周囲状況情報11は、情報提供装置20_1の周囲の状況を示す情報である。例えば、取得部120aは、情報提供装置20_1の上方に設置されている監視カメラから周囲状況情報11を取得する。また、周囲状況情報11は、第2の周囲状況情報とも言う。ここで、推論部140は、周囲状況情報11を用いて、混雑度、危険度などを計算してもよい。
 また、取得部120aは、学習済モデルを取得する。例えば、取得部120aは、学習済モデルを記憶部110から取得する。また、例えば、学習済モデルが外部装置に格納されている場合、取得部120aは、学習済モデルを外部装置から取得する。
 推論部140は、周囲状況情報11と学習済モデルとを用いて、周囲状況情報11が示す状況に応じた案内方法などを推論する。すなわち、推論部140は、周囲状況情報11と学習済モデルとに基づいて、周囲状況情報11が示す状況に応じた、提供対象の案内情報、当該案内情報を提供するタイミング、及び当該案内情報を提供する方法を推論する。ここで、当該案内情報は、第1の案内情報とも言う。
 提供制御部150は、推論の結果に基づいて、案内の提供に関する制御を情報提供装置に対して行う。
 図5は、実施の形態1の活用フェーズにおける情報処理装置が実行する処理の例を示すフローチャートである。
 (ステップS21)取得部120aは、周囲状況情報11を取得する。また、取得部120aは、学習済モデルを取得する。
 (ステップS22)推論部140は、周囲状況情報11と学習済モデルとに基づいて、周囲状況情報11が示す周囲の状況に応じた案内方法などを推論する。
 (ステップS23)提供制御部150は、推論の結果に基づく制御を実行する。詳細には、提供制御部150は、推論の結果に基づく、提供対象の案内情報の提供指示、当該案内情報を提供するタイミングを示す情報、及び当該案内情報を提供する方法を示す情報を、情報提供装置に送信する。例えば、周囲状況情報11が情報提供装置20_1の周囲の状況を示す場合、提供制御部150は、推論の結果に基づく、提供対象の案内情報の提供指示、当該案内情報を提供するタイミングを示す情報、及び当該案内情報を提供する方法を示す情報を、情報提供装置20_1に送信する。
 ここで、以下の説明では、提供制御部150は、当該情報を情報提供装置20_1に送信するものとする。情報提供装置20_1が提供対象の案内情報を記憶していない場合、提供制御部150は、提供対象の案内情報を送信してもよい。
 これにより、情報提供装置20_1は、当該タイミングに、提供対象の案内情報を当該方法で提供する。例えば、情報提供装置20_1は、情報提供装置20_1が有するディスプレイに、乗換案内、道案内、交通弱者の移動支援、トラブル発生時の案内、注意喚起、マナー啓発などを表示する。このように、例えば、情報提供装置20_1が案内情報を表示することで、混雑が緩和される。混雑が緩和されることで、施設内の利用客の移動時間が短縮される。また、例えば、情報提供装置20_1が案内情報を表示することで、転落事故が防止される。
 次に、具体例を用いて、情報提供装置の提供処理を説明する。
 図6は、実施の形態1の駅の施設内の例を示す図である。図6は、ホーム200とコンコース201を示している。また、図6は、デジタルサイネージ202_1~202_5、及びスピーカ203_1,203_2を示している。デジタルサイネージ202_1~202_5、及びスピーカ203_1,203_2が、情報提供装置である。
 例えば、情報処理装置100aは、デジタルサイネージ202_1又はスピーカ203_1の近くに存在するエスカレータの周辺が混雑していることを示す周囲状況情報11を取得する。情報処理装置100aは、周囲状況情報11と学習済モデルと用いて、案内方法などを推論する。情報処理装置100aは、推論の結果に基づいて、階段の利用を利用客に促す情報を、デジタルサイネージ202_1又はスピーカ203_1に送信する。これにより、デジタルサイネージ202_1は、階段の利用を促す情報を表示する。または、スピーカ203_1は、階段の利用を促す情報を音声で提供する。
 また、例えば、情報処理装置100aは、デジタルサイネージ202_1又はスピーカ203_1の周囲に車椅子の利用客が存在することを示す周囲状況情報11を取得する。情報処理装置100aは、周囲状況情報11と学習済モデルと用いて、案内方法などを推論する。情報処理装置100aは、推論の結果に基づいて、車椅子の利用客以外の利用客にエレベータを使用しないことを促す情報を、デジタルサイネージ202_1又はスピーカ203_1に送信する。デジタルサイネージ202_1は、車椅子の利用客以外の利用客にエレベータを使用しないことを促す情報を表示する。または、スピーカ203_1は、車椅子の利用客以外の利用客にエレベータを使用しないことを促す情報を音声で提供する。これにより、車椅子の利用客は、エレベータを使用することができる。
 また、例えば、情報処理装置100aは、スマートフォンを使用しながら歩いている利用客又はキャリーバックのマナー違反を行っている利用客がデジタルサイネージ202_1又はスピーカ203_1の周囲に存在することを示す周囲状況情報11を取得する。情報処理装置100aは、周囲状況情報11と学習済モデルと用いて、案内方法などを推論する。情報処理装置100aは、推論の結果に基づいて、デジタルサイネージ202_1又はスピーカ203_1に注意喚起の情報を送信する。デジタルサイネージ202_1は、注意喚起の情報を表示する。または、スピーカ203_1は、注意喚起の情報を音声で提供する。
 また、例えば、情報処理装置100aは、スピーカ203_1の周囲が混雑していることを示す周囲状況情報11を取得する。言い換えれば、情報処理装置100aは、デジタルサイネージ202_2の周囲が混雑していることを示す周囲状況情報11を取得する。情報処理装置100aは、周囲状況情報11と学習済モデルと用いて、案内方法などを推論する。情報処理装置100aは、推論の結果に基づいて、案内情報をスピーカ203_1に送信する。スピーカ203_1は、案内情報を音声で提供する。これにより、デジタルサイネージ202_2の周囲が混雑しているため、利用客がデジタルサイネージ202_2を見ることができない場合でも、利用客は、音声によって案内を聞くことができる。
 また、例えば、情報処理装置100aは、ホーム200から転落する可能性のある利用客がデジタルサイネージ202_1又はスピーカ203_1の周囲に存在することを示す周囲状況情報11を取得する。情報処理装置100aは、周囲状況情報11と学習済モデルと用いて、案内方法などを推論する。情報処理装置100aは、推論の結果に基づいて、デジタルサイネージ202_1又はスピーカ203_1に注意を促す情報を送信する。デジタルサイネージ202_1は、注意を促す情報を表示する。または、スピーカ203_1は、注意を促す情報を音声で提供する。
 また、例えば、情報処理装置100aは、通勤ラッシュ時に利用客を誘導するための情報をデジタルサイネージに表示させ、通勤ラッシュ時以外の時間帯に案内(例えば、施設内で行われるイベントの案内)をデジタルサイネージに表示させてもよい。
 次に、デジタルサイネージが表示する案内情報の例を示す。
 図7(A),(B)は、実施の形態1の案内情報の具体例を示す図である。図7(A),(B)は、デジタルサイネージが表示する案内情報の例である。
 実施の形態1によれば、情報処理装置100は、状況に応じた案内などを推論する学習済モデルを生成できる。また、情報処理装置100aは、学習済モデルを用いることで、状況に応じた適切な案内などを、情報提供装置を介して、提供できる。
 また、情報処理装置100と情報処理装置100aは、クラウドサーバと考えてもよい。さらに、情報処理装置100と情報処理装置100aとのうちの少なくとも1つは、情報提供装置に含まれてもよい。
 上記でも説明したように、情報処理装置100は、現実の情報を学習用データとして、学習してもよい。例えば、案内提供情報は、情報提供装置の周囲の状況が第1の状況のときに当該情報提供装置が行った案内の提供に関する情報である。周囲状況情報は、当該第1の状況を示す情報である。情報処理装置100は、現実の情報を学習用データとして用いることで、現実の状況に応じた案内方法などを推論する学習済モデルを生成することができる。
 また、情報処理装置100は、同一のエリアに存在する複数の情報提供装置から取得された情報を学習用データとして用いてもよいし、異なるエリアに存在する複数の情報提供装置から取得された情報を学習用データとして用いてもよい。また、学習用データが収集される対象の情報提示装置が、途中で追加されてもよい。学習用データが収集される対象の情報提示装置が、途中で除かれてもよい。また、情報処理装置100は、情報提供装置に含まれてもよい。情報処理装置100が情報提供装置に含まれている場合、情報処理装置100は、当該情報提供装置から取得された学習用データを用いて学習処理を実行し、当該情報提供装置と異なる情報提供装置に移動され、当該異なる情報提供装置から取得された学習用データを用いて学習処理を実行してもよい。
実施の形態2.
<活用フェーズ>
 次に、実施の形態2を説明する。実施の形態2では、実施の形態1と相違する事項を主に説明する。そして、実施の形態2では、実施の形態1と共通する事項の説明を省略する。実施の形態2の説明では、図1~7を参照する。
 図8は、実施の形態2の活用フェーズにおける情報処理装置が有する機能ブロックを示す図である。図4に示される構成と同じ図8の構成は、図4に示される符号と同じ符号を付している。
 情報処理装置100aは、特定部160をさらに有する。また、情報処理装置100aは、提供制御部150aを有する。
 記憶部110は、さらに、集団の移動履歴を記憶する。言い換えれば、集団の移動履歴は、複数のユーザの移動履歴である。また、記憶部110は、経路情報を記憶する。
 取得部120aは、情報提供装置の周囲に存在する集団の移動履歴を記憶部110から取得する。例えば、周囲状況情報11が、情報提供装置20_1の周囲の状況を示す場合、取得部120aは、情報提供装置20_1の周囲に存在する集団の移動履歴を記憶部110から取得する。ここで、集団の移動履歴は、外部装置に格納されていてもよい。集団の移動履歴が外部装置に格納されている場合、取得部120aは、集団の移動履歴を外部装置から取得する。
 集団の移動履歴は、過去に集団がどこに移動したかを示す情報である。特定部160は、集団の移動履歴に基づいて、集団の移動先である目的地を特定する。例えば、特定部160は、集団の移動履歴に基づいて、情報提供装置20_1の周囲に存在する集団の移動先である目的地を特定する。
 取得部120aは、目的地までの経路を示す経路情報を記憶部110から取得する。ここで、当該経路情報は、外部装置に格納されていてもよい。当該経路情報が外部装置に格納されている場合、取得部120aは、当該経路情報を外部装置から取得する。なお、当該経路情報は、目的地までの距離が最短である経路を示す情報であることが望ましい。
 提供制御部150aは、取得部120aを介して、経路情報を取得する。提供制御部150aは、経路情報に基づいて、経路情報が示す経路上に存在する複数の情報提供装置を特定する。なお、周囲状況情報11が、情報提供装置20_1の周囲の状況を示す場合、複数の情報提供装置には、情報提供装置20_1が含まれる。提供制御部150aは、推論の結果に基づく案内情報を、集団を目的地に誘導する案内に変更する。提供制御部150aは、変更された案内情報に基づいた制御を複数の情報提供装置に対して行う。なお、周囲状況情報11が、情報提供装置20_1の周囲の状況を示す場合、提供制御部150aは、推論の結果に基づくタイミング及び提供方法で案内情報を提供するように、情報提供装置20_1を制御する。
 図9は、実施の形態2の活用フェーズにおける情報処理装置が実行する処理の例を示すフローチャートである。
 (ステップS31)取得部120aは、周囲状況情報11を取得する。また、取得部120aは、学習済モデルを取得する。
 (ステップS32)推論部140は、周囲状況情報11と学習済モデルとに基づいて、周囲状況情報11が示す周囲の状況に応じた案内方法などを推論する。
 (ステップS33)取得部120aは、情報提供装置の周囲の状況を示す周囲状況情報11の当該情報提供装置の周囲に存在する集団の移動履歴を記憶部110から取得する。言い換えれば、取得部120aは、情報提供装置の周囲の状況を示す周囲状況情報11の当該情報提供装置が存在する位置から予め設定された範囲に存在する集団の移動履歴を記憶部110から取得する。
 (ステップS34)特定部160は、移動履歴に基づいて、集団の移動先である目的地を特定する。
 (ステップS35)取得部120aは、目的地までの経路を示す経路情報を記憶部110から取得する。
 (ステップS36)提供制御部150aは、経路情報に基づいて、経路情報が示す経路上に存在する複数の情報提供装置を特定する。
 ここで、ステップS33~36は、ステップ31,32と並行に実行されてもよい。
 (ステップS37)提供制御部150aは、推論の結果に基づく案内情報を、集団を目的地に誘導する案内に変更する。
 (ステップS38)提供制御部150aは、変更された案内情報に基づいた制御を複数の情報提供装置に対して行う。詳細には、提供制御部150aは、集団を目的地に誘導するための案内の提供が同調するように、複数の情報提供装置に指示を送信する。言い換えれば、提供制御部150aは、集団を目的地に誘導するための案内の提供が連動するように、複数の情報提供装置に指示を送信する。
 これにより、複数の情報提供装置は、案内を同調して提供することができる。言い換えれば、複数の情報提供装置は、集団を目的地に誘導するための案内を連動して提供する。複数の情報提供装置の案内により、集団は、目的地に誘導される。
 情報処理装置100aは、利用客が経路上の分岐点で誤った経路を進まないように、色の付いた注意喚起を、分岐点に存在する情報提供装置に表示させてもよい。また、情報処理装置100aは、利用客が経路上の分岐点で誤った経路を進まないように、注意喚起を繰り返し表示するように、複数の情報提供装置に指示を送信してもよい。情報処理装置100aは、利用客が経路上の分岐点で誤った経路を進まないように、注意喚起を長期間表示するように、複数の情報提供装置に指示を送信してもよい。
 情報処理装置100aは、経路情報が示す経路上に存在する全ての複数の情報提供装置を特定しなくてもよい。例えば、情報処理装置100aは、経路情報が示す経路上に存在する全て情報提供装置の中から1つ置きに選択した複数の情報提供装置を特定してもよい。
 次に、複数の情報提供装置が同調する場合を説明する。
 図10は、実施の形態2の複数の情報提供装置が同調する場合の具体例を示す図である。図10は、ホーム300を示している。枠301は、階段の周辺を示している。枠302は、エレベータの周辺を示している。枠303は、エスカレータの周辺を示している。
 図10は、デジタルサイネージを示している。例えば、図10は、デジタルサイネージ304a,304bを示している。
 図10は、列車305が駅に到着したことを示している。情報処理装置100aは、デジタルサイネージ304aの周囲の状況を示す周囲状況情報11を取得する。情報処理装置100aは、周囲状況情報11と学習済モデルとに基づいて、周囲状況情報11が示す周囲の状況に応じた案内方法などを推論する。
 情報処理装置100aは、デジタルサイネージ304aの周囲に存在する集団の移動履歴を記憶部110から取得する。情報処理装置100aは、移動履歴に基づいて、当該集団の移動先である目的地を特定する。情報処理装置100aは、目的地までの経路を示す経路情報を記憶部110から取得する。
 情報処理装置100aは、経路情報が示す経路上に存在するデジタルサイネージ304a,304bを特定する。情報処理装置100aは、推論の結果に基づく案内情報を、当該集団を目的地に誘導する案内に変更する。
 情報処理装置100aは、当該集団を目的地に誘導するための案内の提供が同調するように、デジタルサイネージ304a,304bに指示を送信する。すなわち、情報処理装置100aは、当該集団を目的地に誘導するための案内の提供が同調するように、デジタルサイネージ304a,304bにコマンドを送信する。また、情報処理装置100aは、推論の結果に基づくタイミング及び提供方法で、変更された案内情報を提供するように、デジタルサイネージ304aを制御する。
 デジタルサイネージ304aは、推論の結果に基づくタイミング及び提供方法で、デジタルサイネージ304bの方向に当該集団を誘導するための情報を表示する。そして、デジタルサイネージ304bは、エスカレータの方向に当該集団を誘導するための情報を表示する。
 これにより、情報処理装置100aは、当該集団をスムーズに目的地へ移動させることができる。また、当該集団がスムーズに移動することで、混雑度は、緩和される。
 上記では、集団を誘導する場合を説明した。次に、1人の利用客を誘導する場合を説明する。なお、推論処理は、同じなので説明を省略する。
 取得部120aは、携帯装置の位置情報と当該携帯装置の識別情報とを取得する。例えば、取得部120aは、携帯装置の位置情報と当該携帯装置の識別情報とを当該携帯装置から取得する。
 取得部120aは、当該位置情報が示す位置が情報提供装置の周囲内に存在しているか否かを判定する。言い換えれば、取得部120aは、情報提供装置が存在する位置から予め設定された範囲内に、当該位置情報が示す位置が存在しているか否かを判定する。例えば、周囲状況情報11が、情報提供装置20_1の周囲の状況を示す場合、取得部120aは、当該位置情報が示す位置が情報提供装置20_1の周囲内に存在しているか否かを判定する。当該位置情報が示す位置が情報提供装置の周囲内に存在している場合、取得部120aは、識別情報によって特定される携帯装置を利用する利用客の移動履歴を取得する。言い換えれば、取得部120aは、移動履歴の中から、識別情報よって特定される携帯装置の移動を利用客の移動として、利用客の移動履歴を取得する。ここで、利用客は、ユーザとも言う。
 特定部160は、移動履歴に基づいて、利用客の移動先である目的地を特定する。取得部120aは、目的地までの経路を示す経路情報を取得する。
 提供制御部150aは、経路情報に基づいて、経路情報が示す経路上に存在する複数の情報提供装置を特定する。なお、周囲状況情報11が、情報提供装置20_1の周囲の状況を示す場合、複数の情報提供装置には、情報提供装置20_1が含まれる。
 提供制御部150aは、利用客を目的地に誘導する案内に案内情報を変更する。提供制御部150aは、変更された案内情報に基づいた制御を複数の情報提供装置に対して行う。詳細には、提供制御部150aは、利用客を目的地に誘導するための案内の提供が同調するように、複数の情報提供装置に指示を送信する。言い換えれば、提供制御部150aは、利用客を目的地に誘導するための案内の提供が連動するように、複数の情報提供装置に指示を送信する。
 これにより、複数の情報提供装置は、案内を同調して提供することができる。よって、情報処理装置100aは、利用客をスムーズに目的地へ移動させることができる。
 ここで、施設の係員は、即時に案内を行いたい場合がある。情報処理装置100aは、施設の係員の操作により、入力された情報(例えば、文字列、画像など)を情報提供装置に提供させてもよい。これにより、施設の係員が行いたい案内が、情報提供装置から提供される。
 以上に説明した各実施の形態における特徴は、互いに適宜組み合わせることができる。
 10 学習用データ、 11 周囲状況情報、 20_1~20_3 情報提供装置、 100、100a 情報処理装置、 101 プロセッサ、 102 揮発性記憶装置、 103 不揮発性記憶装置、 110 記憶部、 120、120a 取得部、 130 生成部、 131 報酬計算部、 132 関数更新部、 140 推論部、 150,150a 提供制御部、 160 特定部、 200 ホーム、 201 コンコース、 202_1~202_5 デジタルサイネージ、 203_1,203_2 スピーカ、 300 ホーム、 301,302,303 枠、 304a,304b デジタルサイネージ、 305 列車。

Claims (10)

  1.  案内の提供に関する情報である案内提供情報と、前記案内を提供する情報提供装置の周囲の状況を示す情報である第1の周囲状況情報とを取得する取得部と、
     前記案内提供情報と前記第1の周囲状況情報とに基づいて、状況に応じた、提供対象の案内を示す情報である案内情報、前記案内情報を提供するタイミング、及び前記案内情報を提供する方法のうちの少なくとも1つを推論する学習済モデルを生成する生成部と、
     を有する情報処理装置。
  2.  前記生成部は、強化学習を用いて、前記学習済モデルを生成する、
     請求項1に記載の情報処理装置。
  3.  前記案内提供情報は、前記情報提供装置の周囲の状況が第1の状況のときに前記情報提供装置が行った案内の提供に関する情報であり、
     前記第1の周囲状況情報は、前記第1の状況を示す情報である、
     請求項1又は2に記載の情報処理装置。
  4.  推論部と、
     提供制御部と、
     をさらに有し、
     前記取得部は、前記情報提供装置の周囲の状況を示す情報である第2の周囲状況情報を取得し、
     前記推論部は、前記第2の周囲状況情報と前記学習済モデルとを用いて、前記第2の周囲状況情報が示す状況に応じた、提供対象の案内を示す情報である第1の案内情報、前記第1の案内情報を提供するタイミング、及び前記第1の案内情報を提供する方法のうちの少なくとも1つを推論し、
     前記提供制御部は、推論の結果に基づいて、案内の提供に関する制御を前記情報提供装置に対して行う、
     請求項1から3のいずれか1項に記載の情報処理装置。
  5.  前記生成部は、前記案内提供情報と前記第1の周囲状況情報とに基づいて、状況に応じた、前記案内情報、前記案内情報を提供するタイミング、及び前記案内情報を提供する方法を推論する前記学習済モデルを生成する、
     請求項1から3のいずれか1項に記載の情報処理装置。
  6.  推論部と、
     提供制御部と、
     をさらに有し、
     前記取得部は、前記情報提供装置の周囲の状況を示す情報である第2の周囲状況情報を取得し、
     前記推論部は、前記第2の周囲状況情報と前記学習済モデルとを用いて、前記第2の周囲状況情報が示す状況に応じた、提供対象の案内を示す情報である第1の案内情報、前記第1の案内情報を提供するタイミング、及び前記第1の案内情報を提供する方法を推論し、
     前記提供制御部は、推論の結果に基づいて、案内の提供に関する制御を前記情報提供装置に対して行う、
     請求項5に記載の情報処理装置。
  7.  特定部をさらに有し、
     前記取得部は、前記情報提供装置の周囲に存在する集団の移動履歴を取得し、
     前記特定部は、前記移動履歴に基づいて、前記集団の移動先である目的地を特定し、
     前記取得部は、前記目的地までの経路を示す経路情報を取得し、
     前記提供制御部は、前記経路情報に基づいて、前記経路情報が示す経路上に存在する、前記情報提供装置を含む複数の情報提供装置を特定し、前記集団を前記目的地に誘導する案内に前記第1の案内情報を変更し、変更された前記第1の案内情報に基づいた制御を前記複数の情報提供装置に対して行う、
     請求項6に記載の情報処理装置。
  8.  特定部をさらに有し、
     前記取得部は、携帯装置の位置情報と前記携帯装置の識別情報とを取得し、前記位置情報が示す位置が前記情報提供装置の周囲内に存在している場合、前記識別情報によって特定される前記携帯装置を利用するユーザの移動履歴を取得し、
     前記特定部は、前記移動履歴に基づいて、前記ユーザの移動先である目的地を特定し、
     前記取得部は、前記目的地までの経路を示す経路情報を取得し、
     前記提供制御部は、前記経路情報に基づいて、前記経路情報が示す経路上に存在する、前記情報提供装置を含む複数の情報提供装置を特定し、前記ユーザを前記目的地に誘導する案内に前記第1の案内情報を変更し、変更された前記第1の案内情報に基づいた制御を前記複数の情報提供装置に対して行う、
     請求項6に記載の情報処理装置。
  9.  情報処理装置が、
     案内の提供に関する情報である案内提供情報と、前記案内を提供する情報提供装置の周囲の状況を示す情報である第1の周囲状況情報とを取得し、
     前記案内提供情報と前記第1の周囲状況情報とに基づいて、状況に応じた、提供対象の案内を示す情報である案内情報、前記案内情報を提供するタイミング、及び前記案内情報を提供する方法のうちの少なくとも1つを推論する学習済モデルを生成する、
     生成方法。
  10.  情報処理装置に、
     案内の提供に関する情報である案内提供情報と、前記案内を提供する情報提供装置の周囲の状況を示す情報である第1の周囲状況情報とを取得し、
     前記案内提供情報と前記第1の周囲状況情報とに基づいて、状況に応じた、提供対象の案内を示す情報である案内情報、前記案内情報を提供するタイミング、及び前記案内情報を提供する方法のうちの少なくとも1つを推論する学習済モデルを生成する、
     処理を実行させる生成プログラム。
PCT/JP2020/009138 2020-03-04 2020-03-04 情報処理装置、生成方法、及び生成プログラム WO2021176592A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020564277A JPWO2021176592A1 (ja) 2020-03-04 2020-03-04
PCT/JP2020/009138 WO2021176592A1 (ja) 2020-03-04 2020-03-04 情報処理装置、生成方法、及び生成プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/009138 WO2021176592A1 (ja) 2020-03-04 2020-03-04 情報処理装置、生成方法、及び生成プログラム

Publications (1)

Publication Number Publication Date
WO2021176592A1 true WO2021176592A1 (ja) 2021-09-10

Family

ID=77613171

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/009138 WO2021176592A1 (ja) 2020-03-04 2020-03-04 情報処理装置、生成方法、及び生成プログラム

Country Status (2)

Country Link
JP (1) JPWO2021176592A1 (ja)
WO (1) WO2021176592A1 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009230334A (ja) * 2008-03-21 2009-10-08 Denso It Laboratory Inc コンテンツ提示装置、コンテンツ提示方法、およびプログラム
JP2010176228A (ja) * 2009-01-27 2010-08-12 Softbank Telecom Corp ユーザ動線生成サーバ、ユーザ動線生成方法、及びユーザ動線生成プログラム
JP2014123277A (ja) * 2012-12-21 2014-07-03 Sony Corp 表示制御システム及び記録媒体
JP2016136344A (ja) * 2015-01-23 2016-07-28 株式会社インテック 移動方面予測装置、移動方面予測方法及び移動方面予測プログラム
JP2017116440A (ja) * 2015-12-25 2017-06-29 株式会社日立製作所 経路案内システムおよび経路案内方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002286491A (ja) * 2001-03-22 2002-10-03 Kokusai Kogyo Co Ltd 携帯用ナビゲーションシステム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009230334A (ja) * 2008-03-21 2009-10-08 Denso It Laboratory Inc コンテンツ提示装置、コンテンツ提示方法、およびプログラム
JP2010176228A (ja) * 2009-01-27 2010-08-12 Softbank Telecom Corp ユーザ動線生成サーバ、ユーザ動線生成方法、及びユーザ動線生成プログラム
JP2014123277A (ja) * 2012-12-21 2014-07-03 Sony Corp 表示制御システム及び記録媒体
JP2016136344A (ja) * 2015-01-23 2016-07-28 株式会社インテック 移動方面予測装置、移動方面予測方法及び移動方面予測プログラム
JP2017116440A (ja) * 2015-12-25 2017-06-29 株式会社日立製作所 経路案内システムおよび経路案内方法

Also Published As

Publication number Publication date
JPWO2021176592A1 (ja) 2021-09-10

Similar Documents

Publication Publication Date Title
JP6979521B2 (ja) 自動監視システムのための方法および装置
US10184803B2 (en) Methods for automated and semiautomated composition of visual sequences, flows, and flyovers based on content and context
US9674290B1 (en) Platform for enabling remote services
CN104750768B (zh) 用于从社交媒体中识别、监控和排名事件的方法和系统
EP2946305B1 (en) A system and method for smart public alerts and notifications
US20170178013A1 (en) Augmented reality recommendations in emergency situations
US20180273346A1 (en) Risk-aware management of elevator operations
KR20190100085A (ko) 인공 지능을 이용하여, 위험 상황을 감지할 수 있는 로봇 및 그의 동작 방법
EP3553710A1 (en) Artificial intelligence optimized telecommunications systems
US20170351833A1 (en) Personal travel health vulnerability navigator
KR20200050373A (ko) 전자 장치 및 그의 제어 방법
US20200159777A1 (en) Simplifying electronic communication based on dynamically structured contact entries
WO2021176592A1 (ja) 情報処理装置、生成方法、及び生成プログラム
KR20190096854A (ko) 인공 지능을 이용하여, 복수의 로봇들을 제어하는 인공 지능 서버
JP2023040789A (ja) 危険検知装置及び危険検知方法
CN114582119A (zh) 交通信息推送方法、电子设备和存储介质
JP2017203878A (ja) 画像処理システム、画像処理方法およびプログラム
JP5592300B2 (ja) 情報提供システム
McCaffrey The Oklahoma City bombing: institutional practices by journalists covering the biggest story of their lives
JP2021071967A (ja) 対応支援システム、方法及びプログラム
CN114827353B (zh) 通信网络通话预测方法、装置、设备及存储介质
JP7321397B1 (ja) 提示制御装置、情報提示システム、提示制御方法、及び提示制御プログラム
KR102628540B1 (ko) 사용자단말의 이동패턴에 기초한 긴급재난문자 전송 방법 및 장치
JP7192994B2 (ja) 情報提示装置、情報提示システム、情報提示方法、及び情報提示プログラム
JP7047174B1 (ja) 予測システム、予測装置、予測方法および予測プログラム

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2020564277

Country of ref document: JP

Kind code of ref document: A

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20923364

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20923364

Country of ref document: EP

Kind code of ref document: A1