WO2023188808A1 - レコメンドシステム - Google Patents

レコメンドシステム Download PDF

Info

Publication number
WO2023188808A1
WO2023188808A1 PCT/JP2023/003473 JP2023003473W WO2023188808A1 WO 2023188808 A1 WO2023188808 A1 WO 2023188808A1 JP 2023003473 W JP2023003473 W JP 2023003473W WO 2023188808 A1 WO2023188808 A1 WO 2023188808A1
Authority
WO
WIPO (PCT)
Prior art keywords
user
recommendation
information
content
difficulty level
Prior art date
Application number
PCT/JP2023/003473
Other languages
English (en)
French (fr)
Inventor
裕木子 吉川
優樹 勝間田
喬 鈴木
Original Assignee
株式会社Nttドコモ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社Nttドコモ filed Critical 株式会社Nttドコモ
Publication of WO2023188808A1 publication Critical patent/WO2023188808A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements

Definitions

  • the present invention relates to a recommendation system.
  • Patent Document 1 describes a system that recommends content according to a customer's taste by reflecting it on a screen with a design according to the customer's taste.
  • This system displays content information, which is information about content to be recommended to a customer, and information included in the content information, based on customer attribute information indicating customer attributes and customer behavior history information indicating customer behavior history.
  • Template information indicating a template including the area for is generated by learning artificial intelligence.
  • the effectiveness of the recommendation can be increased by determining the expression of the recommendation (in Patent Document 1, the design of the recommendation screen) when making a recommendation.
  • the effectiveness of the recommendation can be further enhanced.
  • the expression of the recommendation can be determined more appropriately.
  • a user's reaction to a recommendation depends not only on the expression of the recommendation but also on what is being recommended. Therefore, simply using the user's reaction may not necessarily result in appropriate learning. For example, when content that matches a user's hobbies and tastes is recommended, the user is likely to use the content regardless of the expression of the recommendation.
  • An embodiment of the present invention has been made in view of the above, and aims to provide a recommendation system that can more appropriately learn how to determine the expression of a recommendation.
  • a recommendation system includes a user information acquisition unit that acquires user information related to a user who is a recommendation target, and a user information acquisition unit that acquires user information related to a user who is a recommendation target. a content determining unit that determines content to be recommended to a user based on at least a part of the user information; and a content determining unit that determines content to be recommended to a user based on at least a part of the user information acquired by the user information acquiring unit.
  • an expression determining unit that determines an expression when making a recommendation; a difficulty level information acquisition unit that acquires difficulty level information indicating the difficulty level for a user to act on the content determined by the content determining unit; and a content determining unit and an expression.
  • a behavior information acquisition unit that acquires behavior information indicating the user's behavior in response to a recommendation made to the user in response to a decision made by the determination unit, and difficulty level information acquired by the difficulty level information acquisition unit and acquired by the behavior information acquisition unit.
  • a learning unit that learns a determination method by the expression determination unit based on the behavior information obtained by the expression determination unit, taking into consideration the difficulty level of the behavior of the user who is the target of the recommendation.
  • a recommendation system when learning a method for determining recommendation expressions, the difficulty level of a user's action on recommended content is taken into consideration. Therefore, for example, it is possible to learn how to determine the expression of a recommendation by excluding the influence of the user's hobbies and preferences from the user's behavior regarding the recommendation. Thereby, according to the recommendation system according to an embodiment of the present invention, it is possible to more appropriately learn how to determine the expression of a recommendation.
  • FIG. 1 is a diagram showing the configuration of a recommendation system according to an embodiment of the present invention.
  • FIG. 2 is a diagram schematically showing an overview of recommendations. It is a table showing an example of user information used to determine a store to recommend to a user. It is a table showing an example of information used to determine a store to recommend to a user. It is a table showing an example of information used to determine the content of a recommendation to a user. 3 is a table showing an example of information used to determine the expression of a recommendation to a user.
  • FIG. 3 is a diagram showing an example of calculating an evaluation value using a psychological bias estimation model. It is a table showing an example of calculated evaluation values for each psychological bias.
  • FIG. 3 is a table showing an example of information used to determine the expression of a recommendation to a user. It is a table showing an example of information used for learning a psychological bias estimation model.
  • FIG. 3 is a diagram illustrating an example of learning a psychological bias estimation model. It is a flow chart showing processing performed by a recommendation system concerning an embodiment of the present invention.
  • 1 is a diagram showing a hardware configuration of a recommendation system according to an embodiment of the present invention.
  • FIG. 1 shows a recommendation system 10 according to this embodiment.
  • the recommendation system 10 is a system (device) that recommends content to a user.
  • the content recommended to the user is a restaurant.
  • the content recommended to the user may be any content as long as it can be recommended.
  • the content recommended to the user may be products from an online store or an EC (electronic commerce) site.
  • the recommendation system 10 makes a recommendation by, for example, transmitting information related to the recommendation to the terminal 20 used by the user.
  • the terminal 20 is a device that can exchange information with the recommendation system 10 via a network such as a mobile communication network, and can also perform information processing related to recommendations.
  • the terminal 20 is a device such as a mobile phone, a smartphone, or a PC (personal computer). Transmission/reception of information related to recommendations with the recommendation system 10 and input/output of the information in the terminal 20 may be performed by a dedicated application installed in the terminal 20. A part of the information used by the recommendation system 10 may be acquired by the terminal 20 and transmitted to the recommendation system 10.
  • the recommendation system 10 is configured by a computer such as a PC (personal computer) or a server device having a communication function.
  • the recommendation system 10 may be configured by multiple computers.
  • the recommendation system 10 can exchange information with the terminal 20 via a network such as a mobile communication network.
  • the recommendation system 10 determines content (restaurants) to be recommended for each user.
  • the recommendation system 10 also determines the expression of the recommendation for each recommendation, and makes a recommendation using the determined expression.
  • the recommendation expression is, for example, a nudge wording that is used when recommending content.
  • the expression of the recommendation is based on the user's psychological bias (hereinafter referred to as psychological bias) (cognitive bias).
  • psychological bias is a psychological tendency that users have when deciding what to do in response to a recommendation. Examples of psychological biases include ⁇ loss aversion,'' which is not wanting to lose, and ⁇ conformity,'' which is not wanting to lose.
  • the recommendation system 10 stores a content selection model in advance, and determines content to recommend based on the content selection model. Further, the recommendation system 10 stores a psychological bias estimation model in advance, estimates a psychological bias based on the psychological bias estimation model, and determines an expression according to the estimated psychological bias. The recommendation system 10 recommends the determined content to the user U using the determined expression. This makes it possible to increase the effectiveness of recommendations for individual users. For example, content tailored to the user's hobbies and tastes can be recommended using expressions that make the user want to use the content (for example, the user wants to visit a restaurant).
  • the expression of the recommendation does not necessarily have to be in accordance with psychological bias, but may be anything that influences the recommendation. Further, the expression of the recommendation may be other than the wording used when making the recommendation.
  • the recommendation system 10 performs learning of a psychological bias estimation model based on the reaction of the user U, which is the behavior of the user U in response to a recommendation. That is, the recommendation system 10 performs reinforcement learning regarding the recommendation determination method.
  • the recommendation system 10 may also learn a content selection model based on the user U's reaction to the recommendation. Through this learning, the accuracy of recommendations can be improved.
  • the recommendation system 10 includes a user information acquisition section 11, a content determination section 12, an expression determination section 13, a difficulty level information acquisition section 14, a behavior information acquisition section 15, and a learning section 16. Prepared and configured.
  • the user information acquisition unit 11 is a functional unit that acquires user information regarding a user who is a recommendation target.
  • the user information acquired by the user information acquisition unit 11 is used in the process related to recommendations described below. What kind of information is user information, how it is acquired, and how it is used will be described later. Note that the user information described below is just an example, and any information that can be used for processing related to recommendations may be used.
  • Recommendations to users by the recommendation system 10 may be made in a push format.
  • a recommendation may be made using the user's being in a specific state (Push firing) as a trigger.
  • a recommendation may be made when the user's position enters a specific area for which a recommendation is made.
  • a recommendation may be made when a user uses a specific means of transportation (for example, a train or a taxi).
  • the user information acquisition unit 11 may acquire information for determining these from the terminal 20 carried by the user.
  • the user information acquisition unit 11 may acquire information indicating the location of the terminal 20, such as latitude and longitude, and determine whether to make a recommendation to the user based on the information.
  • the recommendation system 10 may make a recommendation to the user at a timing other than the above.
  • the recommendation may be made at a preset time, or may be made by some other trigger.
  • recommendations may be made in response to a request from the terminal 20.
  • the following functional units related to recommendations to users may function at the timing when recommendations to users are made.
  • the content determining unit 12 is a functional unit that determines content to be recommended to the user based on at least part of the user information acquired by the user information acquiring unit 11. In this embodiment, the content determining unit 12 determines a restaurant as the content to be recommended to the user. The content determining unit 12 determines the recommended content according to the content selection model shown below.
  • the user information acquiring unit 11 acquires information indicating the POI (Point of Interest) visit history of the user who is the recommendation target.
  • the POI in this embodiment is a recommended restaurant.
  • the POI visit record is the number of times the user visited each store (restaurant) in the past.
  • FIG. 3(a) shows a user/POI visit record database that is included in the recommendation system 10 and stores information indicating the user's POI visit record.
  • the user/POI visit record database stores in advance a user ID and the number of past visits to each store by the user indicated by the user ID in association with each other.
  • the user ID is an identifier preset for a user who is a recommendation target.
  • the information stored in the user/POI visit record database is generated by conventional technology or the like. For example, the information stored in the user/POI visit record database is generated based on information about the user's payment at a store or the user's location information. Generation of the information may be performed based on geofence.
  • the user information acquisition unit 11 reads out and acquires information on a user who is a recommendation target from the user/POI visit record database.
  • the user information acquiring unit 11 acquires information indicating the degree of interest in the category of the user who is the recommendation target.
  • the category is the category of the restaurant to be recommended. For example, the categories are "Yakiniku” and "Ramen.”
  • FIG. 3(b) shows a user/category interest level information database provided in the recommendation system 10 and storing information indicating a user's level of interest in a category.
  • the user/category interest level information database stores in advance a user ID and a numerical value indicating the user's level of interest in each category indicated by the user ID in association with each other. As for the numerical value indicating the degree of interest, the larger the value, the more interested the user is in the category.
  • the user/category interest level information database is generated by conventional technology or the like. For example, the user/category interest level information database is generated based on the number of past visits to stores of each category by the user, a questionnaire survey of the user, and the like.
  • the user information acquisition unit 11 reads out and acquires information on a user who is a recommendation target from the user category interest information database.
  • the user information acquisition unit 11 acquires information indicating the status of the user to be recommended at the time of the recommendation, that is, information indicating the current status of the user.
  • the information indicating the user's current situation is information indicating whether the user had lunch that day and the user's location information.
  • FIG. 3(c) shows a user current situation database that is included in the recommendation system 10 and is used by the content determining unit 12 and stores information indicating the current situation of the user.
  • the user current situation database stores a user ID and information indicating the current situation of the user indicated by the user ID in association with each other.
  • the lunch information has a value of 1, indicating that the user has had lunch that day, and a value of 0, indicating that the user has not had lunch that day. ing. This information is generated in real time using conventional technology or the like.
  • the current location information is information indicating the user's current location.
  • the current location information is latitude and longitude information.
  • this information is generated (obtained) in real time by obtaining information indicating the current location of the terminal 20 from the terminal 20 carried by the user.
  • the user information acquisition unit 11 reads and acquires information on users who are recommendation targets from the user current situation database.
  • the user information acquisition unit 11 outputs the acquired information to the content determination unit 12.
  • the user information acquisition unit 11 may acquire user information other than the above as the user information used by the content determination unit 12. Further, the user information acquisition unit 11 may acquire user information by a method other than the above. For example, the user information acquisition unit 11 may acquire user information by receiving it from the terminal 20.
  • the content determination unit 12 inputs user information from the user information acquisition unit 11.
  • the content determining unit 12 also acquires information regarding each store that is a candidate to be recommended to the user.
  • FIG. 4(a) shows a store database included in the recommendation system 10 and storing information regarding each restaurant.
  • a store ID and information related to the store indicated by the store ID are stored in association with each other.
  • the store ID is an identifier preset for a store recommended to the user.
  • the information regarding the store includes location information, congestion information, store name, recommended time, and category information.
  • the location information is information indicating the location of the store.
  • the location information is latitude and longitude information.
  • the location information is stored in the store database in advance.
  • the congestion information is information indicating the degree of crowding of the store. The larger the value of the congestion information, the more crowded the store is.
  • the congestion information is generated in real time using conventional technology and stored in the store database.
  • the store name is the name of the store.
  • the store name is stored in the store database in advance.
  • the recommended time is the time in a day when it is recommended to visit the store.
  • the recommended time is stored in the store database in advance.
  • the category is the category of the store.
  • the category is any of the categories in the user category interest information database shown in FIG. 3(b).
  • the categories are stored in the store database in advance.
  • the content determining unit 12 acquires information regarding each restaurant from the store database.
  • the stores recommended to the user may be some of the stores whose information is stored in the store database. For example, only stores based on the user's current location may be recommended stores to the user. Specifically, stores within a certain range from the user's current location, or stores in the same area as the user's current location (for example, stores in the same district, town, or village) may be candidates to be recommended to the user. . In this case, the content determination unit 12 selects candidates to be recommended to the user based on the user's current location indicated by the user information input from the user information acquisition unit 11 and the location of the store indicated by the acquired restaurant information. You can also judge the store.
  • the content determining unit 12 determines stores to be recommended to the user from the acquired information as follows.
  • the content determining unit 12 first calculates the behavioral difficulty level for each recommended store.
  • the action difficulty level is the difficulty level for the user to take action toward the store.
  • the user's behavior toward the store is, for example, the behavior of visiting the store, that is, using the content.
  • the user's behavior toward the store is not limited to the above, but includes opening and referring to information recommended about the store (that is, showing interest in the store (content); this will be described in detail later), etc. Any action may be taken for the store.
  • the calculated behavioral difficulty level is stored in a user/POI behavioral difficulty level database provided by the recommendation system 10.
  • the numerical value indicating the difficulty of action the smaller the value, the greater the difficulty (i.e., there is a tendency not to take action against the corresponding store), and the larger the value, the lower the difficulty (i.e., the tendency to take action against the corresponding store). (a tendency to take action).
  • f1 number of visits
  • the number of visits is the number of times the user has visited the store in the past for which the behavioral difficulty level is to be calculated.
  • the interest level is a numerical value indicating the user's level of interest in the store category for which the behavioral difficulty level is to be calculated.
  • f2 distance to the store
  • s mean presence/absence
  • s is a value indicating whether the user has a meal. For example, when making a recommendation for lunch time, if the user is having lunch, s (presence of meal) is set to 0, and if the user is not having lunch, s (presence of meal) is set to 0. 1.
  • the value of the action difficulty level becomes higher for a store that is visited more often by the user, a store that belongs to a category in which the user is more interested, and a store that is closer to the user's current location.
  • a store is considered to be a store where the user is more likely to take action toward the store.
  • the action difficulty level value becomes high, and it is assumed that the user is likely to take action toward the store.
  • the calculation of the behavioral difficulty level does not necessarily need to be performed using the above formula. Moreover, all of the above-mentioned elements do not need to be used for calculating the action difficulty level, and only some of the elements may be used for calculating the action difficulty level. Furthermore, factors other than those described above may be used to calculate the action difficulty level. For example, in the above equation, among the store-related information, congestion information and recommended time are not used, but these pieces of information may be used. For example, the less crowded the store is, the higher the action difficulty level may be. Alternatively, the closer the current time and the recommended time are, the higher the action difficulty value may be.
  • the content determining unit 12 determines a store to recommend to the user based on the calculated behavioral difficulty level. For example, the content determining unit 12 determines the store with the highest behavioral difficulty value as the store to be recommended to the user. Note that stores that have already been recommended to the user who is the recommendation target within a certain period of time may be excluded from the stores to be recommended. However, the content determining unit 12 may determine stores to be recommended to the user using determination criteria other than those described above. Further, the content determining unit 12 may determine not to recommend a store to the user if there is no store with an action difficulty level equal to or higher than a certain value.
  • the content determining unit 12 may determine how to recommend a store, that is, the type of recommendation.
  • FIG. 5 shows a recommendation content database that is included in the recommendation system 10 and stores the content of recommendations.
  • the recommendation content database includes recommendation IDs, store IDs, types, and coupon information.
  • the recommendation ID is an identifier preset to the content of the recommendation.
  • the content of the recommendation is specified by the following information.
  • the store ID is the store ID of the recommended store.
  • the type is the type of recommendation.
  • Types of recommendations include, for example, "Customer Referral” and "Peak Shift" shown in FIG. 5.
  • Customer referral is to recommend a visit to a store to a user using a coupon or other method.
  • Peak shift recommends that a user visit a store to avoid congestion when facilities (for example, a station) around the store are crowded.
  • Coupon information is coupon information that is presented to the user at the time of recommendation.
  • the coupon information includes, for example, information indicating the presence or absence of a coupon and information indicating the content of the coupon.
  • the coupon information is in the format ⁇ A:B ⁇ .
  • A is information indicating the presence or absence of a coupon; a value of 1 indicates that a coupon is present, and a value of 0 indicates that there is no coupon.
  • B indicates the amount of discount from the charge as a coupon (for example, the data in the first row of FIG. 5 is a 100 yen discount coupon). Note that if the value of A is 0, there is no information about B.
  • the content determination unit 12 After determining the store to be recommended, the content determination unit 12 refers to the recommendation content database and determines the content of the recommendation.
  • the content determining unit 12 stores in advance a determination criterion for determining the content of the recommendation, and determines the content of the recommendation based on the determination criterion. For example, the content determining unit 12 acquires information indicating the degree of congestion of facilities (for example, stations) surrounding the store recommended to the user. This information may be acquired using conventional techniques or the like. If the degree of congestion is equal to or greater than a preset threshold, the content determining unit 12 determines to recommend the peak shift type. If the degree of congestion is less than or equal to a preset value, the content determining unit 12 determines to recommend the type of customer referral.
  • the content determining unit 12 may determine the content of the recommendation other than the above. Further, recommendations may be made regardless of the type of customer referral, peak shift, etc. Note that the content selection model defines the process of the content determination unit 12 for determining the above-mentioned recommendation content.
  • the expression determining unit 13 is a functional unit that determines the expression used when recommending the content determined by the content determining unit 12 to the user, based on at least part of the user information acquired by the user information acquiring unit 11.
  • the expression determining unit 13 may determine an expression according to the psychological bias of the user who is the target of the recommendation, as an expression when making a recommendation.
  • the expression determining unit 13 determines the expression of the recommendation according to the psychological bias estimation model shown below.
  • the user information acquisition unit 11 acquires information indicating the attributes of the user who is the recommendation target.
  • FIG. 6A shows a user attribute database that is included in the recommendation system 10 and stores information indicating user attributes.
  • the user attribute database stores in advance a user ID and information indicating attributes of the user indicated by the user ID in association with each other.
  • the user's attributes include, for example, gender, residential area, occupation, family composition, and hobbies.
  • the information indicating each attribute may be an ID indicating the attribute.
  • the user information acquisition unit 11 reads and acquires information on a user who is a recommendation target from a user attribute database.
  • the user information acquisition unit 11 acquires information indicating the status of the user to be recommended at the time of the recommendation, that is, information indicating the current status of the user.
  • the information indicating the user's current situation is information indicating whether the user is at home, the number of past receptions, and today's visit history.
  • the number of past receptions is the number of times the user received recommendations in the past.
  • Today's visit history is information indicating whether the user has visited a store that is a candidate to be recommended to the user.
  • FIG. 6(b) shows a user current situation database that is included in the recommendation system 10 and is used by the expression determining unit 13 and stores information indicating the user's current situation.
  • the user current situation database stores a user ID and information indicating the current situation of the user indicated by the user ID in association with each other.
  • the home information indicates that the user is at home at the time if the value is 1, and if the value is 0 it indicates that the user is not at home at the time. This information is generated in real time using conventional technology or the like.
  • the number of past receptions and today's visit history are appropriate information indicating these, and are generated in real time using conventional technology or the like.
  • the user information acquisition unit 11 reads and acquires information on users who are recommendation targets from the user current situation database.
  • the user information acquisition unit 11 outputs the acquired information to the expression determination unit 13.
  • the user information acquisition unit 11 may acquire user information other than the above as the user information used by the expression determination unit 13. Further, the user information acquisition unit 11 may acquire user information by a method other than the above. For example, the user information acquisition unit 11 may acquire user information by receiving it from the terminal 20.
  • the expression determination unit 13 inputs user information from the user information acquisition unit 11.
  • the expression determining unit 13 determines an expression for recommendation as follows from the input information.
  • the expression determining unit 13 converts the input user information into feature amounts.
  • the feature amount is a vector with a preset number of dimensions. An example of the feature amount to be converted is shown in FIG. 6(c). Each of feature 1, feature 2, feature 3, etc. is an element of a vector of feature amounts. Conversion from user information to feature amounts can be performed using conventional techniques or the like.
  • the feature amount may include information on external factors other than user information that may affect recommendations. For example, information indicating the weather and time at that point may be reflected in the feature amount. Further, information regarding the content of the recommendation determined by the content determining unit 12 may be reflected in the feature amount. That is, the expression determining unit 13 may determine the expression used when making a recommendation based also on the content determined by the content determining unit 12. For example, among the contents of the determined recommendation, the store category (for example, the category "restaurant") and the type of recommendation (for example, the type "customer referral”) may be included in the feature amount. Information other than the user information described above may be a feature amount in a different dimension from the user information, or may be converted into a feature amount together with the user information.
  • the expression determining unit 13 estimates the user's psychological bias from the obtained feature amount and the psychological bias estimation model. Specifically, the expression determining unit 13 calculates an evaluation value for each (type of) psychological bias (for example, for each “loss aversion” and “conformity”).
  • a psychological bias estimation model is used to calculate the evaluation value.
  • the psychological bias estimation model includes parameters for each psychological bias.
  • the parameter is a vector with the same number of dimensions as the feature amount.
  • Each element of the parameter of the psychological bias estimation model corresponds to each element of the feature amount.
  • the psychological bias estimation model is common among users. However, the psychological bias estimation model may be for each user or for each type of user.
  • the expression determination unit 13 calculates an evaluation value by multiplying the mutually corresponding elements of the feature amount and elements of the parameters of the psychological bias estimation model, and calculating the sum. That is, the expression determining unit 13 calculates the inner product of the vector of the feature amount and the vector of the parameters of the psychological bias estimation model as an evaluation value.
  • the expression determining unit 13 calculates an evaluation value for each type of psychological bias using parameters for each type of psychological bias.
  • FIG. 7 shows an example of parameters for one psychological bias (psychological bias 1) and an example of calculating an evaluation value.
  • FIG. 8 shows psychological bias evaluation values calculated for each user. The larger the calculated evaluation value, the stronger the user's psychological bias.
  • the parameters of the psychological bias estimation model are updated by learning by the learning unit 16, which will be described later. Learning by the learning unit 16 is performed based on the user's reaction to recommendations. Therefore, each time a recommendation is made, psychological bias is determined more appropriately, and as a result, recommendations are made more appropriately.
  • the expression determining unit 13 determines the nudge wording that is the expression of the recommendation based on the estimated psychological bias.
  • the expression determining unit 13 may refer to information related to the content of the recommendation determined by the content determining unit 12, and determine the expression of the recommendation based on the information. .
  • FIG. 9 shows a nudge wording database that is included in the recommendation system 10 and stores information on the association.
  • a nudge ID is an identifier preset to the nudge wording.
  • the type is the type of recommendation (the above-mentioned "customer referral", "peak shift", etc.).
  • the presence or absence of a coupon is the presence or absence of a coupon presented to the user at the time of recommendation.
  • coupon presence/absence If the value of coupon presence/absence is 1, it indicates that there is a coupon, and if the value is 0, it indicates that there is no coupon.
  • Information for example, store name
  • Information indicating a store to be recommended determined by the content determining unit 12 is input into the part ⁇ in the nudge wording.
  • the expression determining unit 13 probabilistically determines (selects) a psychological bias to be used in the recommendation based on the calculated evaluation value ratio.
  • the expression determining unit 13 refers to the nudge wording database shown in FIG.
  • the nudge wording is determined (selected) as the expression to be recommended to the user.
  • the nudge wording may include wording depending on the presence or absence of a recommended coupon. For example, if there is a coupon in the recommendation, in addition to the nudge wording shown in FIG. 9, the recommendation may include a wording such as "We have a great coupon.” Furthermore, if there is no coupon in the recommendation, in addition to the nudge wording shown in FIG. 9, a wording such as "recommended for you" may be included.
  • the expression determining unit 13 generates information to be recommended to the user using the content of the recommendation determined by the content determining unit 12 and the determined expression, and transmits it to the terminal 20.
  • the recommendation itself, such as sending information to the terminal 20 based on the decisions of the content determining unit 12 and the expression determining unit 13, does not need to be performed by the recommendation system 10 and may be performed by a system or device other than the recommendation system 10. It's okay.
  • the recommendation information sent to the terminal 20 is referenced by the user of the terminal 20.
  • the recommendation application notifies the user.
  • the user is notified, for example, by displaying a recommendation on the screen of the terminal 20.
  • the display at the time of notification is performed so that the content determined by the content determining unit 12 and the expression determining unit 13 can be recognized by the user.
  • the nudge wording determined by the expression determining section 13, including information indicating the recommended store determined by the content determining section 12, is displayed.
  • the user operates the application on the terminal 20 to refer to the details of the recommendation (for example, store information, etc.). In this embodiment, this operation is called unsealing. As mentioned above, opening a package is also one of the user's actions regarding a recommended store.
  • the difficulty level information acquisition unit 14 is a functional unit that acquires difficulty level information indicating the difficulty level for the user to act on the content determined by the content determination unit 12.
  • the difficulty level information acquisition unit 14 obtains difficulty level information indicating a level of difficulty that reflects at least one of the user's past usage status of the content, the user's interests, the user's status at the time of recommendation, and the status of the content at the time of recommendation. You may obtain it.
  • the user's reaction to a recommendation depends on the recommended content (in this embodiment, a restaurant) itself and the expression of the recommendation, such as nudge wording. Therefore, when a user takes action in response to a recommendation, such as opening a recommendation or visiting a recommended restaurant, the nudge wording does not necessarily have a large effect, but the recommended content itself has a large effect. It is thought that this may have an impact. For example, since the user originally liked the recommended restaurant, it is conceivable that the user may take action toward the recommended restaurant.
  • the user's reaction to the recommendation contains a large amount of noise from the perspective of learning the psychological bias estimation model. If learning is performed using data containing noise, the learning will not necessarily be appropriate, and there is a risk that the learning of the psychological bias estimation model will not progress.
  • the difficulty level is used to exclude the influence (bias) of the recommended content, that is, the influence of the user's hobbies and preferences, when training a psychological bias estimation model based on the user's reaction to the recommendation. .
  • By performing learning using difficulty levels it is possible to speed up the convergence of learning of the psychological bias estimation model.
  • the difficulty level information acquisition unit 14 acquires, as difficulty level information, information indicating the behavioral difficulty level calculated by the content determination unit 12 for the recommended store.
  • the behavioral difficulty level calculated by the content determining unit 12 reflects at least one of the user's past use of the content, the user's interests, the user's situation at the time of the recommendation, and the content situation at the time of the recommendation. This is what I did.
  • the difficulty level information acquired by the difficulty level information acquisition unit 14 does not need to be information indicating the behavioral difficulty level calculated by the content determining unit 12, and may be calculated using a calculation method different from the calculation method by the content determining unit 12. Then, the difficulty level information acquisition unit 14 may calculate the difficulty level and acquire the difficulty level information.
  • the difficulty level information acquisition unit 14 outputs the acquired difficulty level information to the learning unit 16.
  • the behavior information acquisition unit 15 is a functional unit that acquires behavior information indicating the user's behavior in response to the recommendation to the user made in accordance with the decisions made by the content determination unit 12 and the expression determination unit 13.
  • the user's actions regarding the recommendation include, for example, opening and referring to the recommended information, visiting a store, and using a coupon included in the recommended information at the store.
  • the user's action in response to a recommendation may be any action other than the above as long as the action is performed in response to a recommendation.
  • visiting a store and using a coupon may be the user's actions regarding a recommendation only when the recommended information is opened.
  • the behavior information acquisition unit 15 obtains, as behavior information, the time at which the recommendation was made to the user, whether or not the recommended information was opened, the time at which it was opened, and information indicating whether or not a coupon was used at the recommended store. get.
  • Information indicating the time when the recommendation was made to the user, whether or not the recommendation information was opened, and the time when the recommendation was opened can be obtained, for example, via a recommendation application on the terminal 20.
  • Information indicating whether a coupon is used or not can be obtained by obtaining information related to a user's payment at a recommended store.
  • the behavior information acquisition unit 15 outputs the acquired behavior information to the learning unit 16.
  • the learning unit 16 Based on the difficulty level information acquired by the difficulty level information acquisition unit 14 and the behavior information acquired by the behavior information acquisition unit 15, the learning unit 16 generates expressions in consideration of the difficulty of the behavior of the user who is the target of the recommendation. This is a functional unit that learns the determination method by the determination unit 13.
  • the learning unit 16 may weight the evaluation value according to the behavior information based on the difficulty level information, and use the weighted evaluation value to learn the determination method by the expression determination unit 13.
  • the learning unit 16 performs learning of the psychological bias estimation model based on the difficulty level information acquired by the difficulty level information acquisition unit 14 and the behavior information acquired by the behavior information acquisition unit 15. Learning of the psychological bias estimation model by the learning unit 16 is performed such that if the user takes action in response to a recommendation, the psychological bias will be strongly estimated. At this time, as described above, learning is performed based on the difficulty level information so that the influence of the recommended content is excluded. For example, the learning unit 16 performs learning of the psychological bias estimation model as follows.
  • the learning unit 16 inputs difficulty level information from the difficulty level information acquisition unit 14.
  • the learning section 16 receives behavior information from the behavior information acquisition section 15 . Further, the learning unit 16 acquires information related to recommendations corresponding to difficulty level information and behavior information from the content determining unit 12 and the expression determining unit 13.
  • FIG. 10 shows information acquired by the learning section 16.
  • the information used for learning the psychological bias estimation model is each information of action difficulty level, psychological bias, push time, opening, opening time, and coupon usage, which are associated with each other. The evaluation information shown in FIG. 10 will be described later.
  • the behavioral difficulty level is the behavioral difficulty level for the recommended store, which is indicated by the difficulty level information acquired by the difficulty level information acquisition unit 14.
  • the psychological bias is a psychological bias used in the recommendation determined by the expression determining unit 13.
  • the learning unit 16 updates the parameters of the psychological bias estimation model regarding this psychological bias.
  • the push time, opening, opening time, and coupon use are behavior information acquired by the behavior information acquisition unit 15.
  • Push time is the time when a recommendation is made to the user.
  • Opening is information indicating whether or not the recommendation information has been opened by the user. A numerical value of 1 indicates that the recommended information has been opened, and a numerical value of 0 indicates that the recommended information has not been opened.
  • the opening time is the time when the recommendation information was opened by the user.
  • Coupon usage is information indicating whether the coupon was used by the user. A value of 1 indicates that the coupon has been used, and a value of 0 indicates that the coupon has not been used.
  • the behavior information acquisition unit 15 may acquire information related to opening of recommended information and information related to coupon usage in real time, or may be obtained at a preset time from the time when the recommendation to the user is made (for example, This may be carried out after several minutes to several hours have passed. When information is acquired after a preset time has elapsed, the information is obtained at that time.
  • the learning unit 16 calculates a behavioral change evaluation value, which is an evaluation value according to the behavioral information, from the behavioral information. For each user action, a behavior change evaluation value is set in advance when the user takes that action. For example, opening the package has a value of 0.2, and using a coupon has a value of 0.8.
  • the behavioral change evaluation value is an index value indicating the degree of behavior taken in response to the recommendation, and the larger the value, the more the user is taking the behavior expected by the side making the recommendation.
  • the learning unit 16 weights the calculated behavioral change evaluation value based on the difficulty level information. For example, the learning unit 16 weights the behavior change evaluation value with a value of (1-behavior difficulty).
  • the evaluation shown in FIG. 10 is the behavioral change evaluation value after weighting.
  • the weighting value based on the difficulty level information uses a value obtained by subtracting the value of the action difficulty level, so that the larger the value, the less the user tends to take the action.
  • the weighted behavioral change evaluation value is a value indicating the user's reaction to the recommendation, excluding the influence (bias) of the recommended content, that is, the influence of the user's hobbies and preferences. Furthermore, if the difficulty level information includes the status of the content (store), that influence is also excluded.
  • the learning unit 16 calculates the gradient between the user's feature amount used to calculate the psychological bias evaluation value and the parameter of the psychological bias estimation model to be updated.
  • a gradient it is usually necessary to normalize the user's feature amount so that the gradient can be calculated appropriately.
  • the value of each element of the user's feature amount may be multiplied by a preset value (n shown in FIG. 11).
  • the normalization may use a preset function f that inputs the user's feature amount and outputs the normalized feature amount.
  • the function f performs general normalization. Calculation of the gradient is performed by finding a cross entropy error from two vectors. Alternatively, the gradient may be calculated using a method other than cross-entropy error.
  • the calculated gradient is a vector with the same number of dimensions as the feature quantity and the parameters of the psychological bias estimation model.
  • the learning unit 16 multiplies each element of the gradient by the weighted behavioral change evaluation value to obtain an update parameter.
  • the learning unit 16 adds up the parameters of the psychological bias estimation model to be updated and the updated parameters for each element to obtain updated parameters (post-learning parameters).
  • the psychological bias estimation model learned by the learning unit 16 is used for subsequent recommendations. Moreover, the learning by the learning unit 16 is repeatedly performed every time a recommendation is made. Through repeated learning, the accuracy of the psychological bias estimation model improves, making it possible to determine more appropriate recommendation expressions.
  • the learning by the learning unit 16 does not necessarily need to be performed as described above, and may be performed based on the difficulty level information and behavior information, taking into consideration the difficulty level of the behavior of the user who is the target of the recommendation. Bye.
  • Learning by the learning unit 16 may be performed at a timing when a preset time has elapsed from the time when the recommendation was made to the user, or at a preset time (for example, a specific time of the day). May be done.
  • the learning by the learning unit 16 may be performed at the timing when the user takes action regarding the recommendation within a time limit (for example, a preset time from the time when the recommendation is made to the user).
  • the behavior information acquisition unit 15 acquires behavior information indicating that the user has taken an action in response to a recommendation in real time and inputs it to the learning unit 16. After inputting the behavior information from step 15, learning is performed.
  • the learning unit 16 also learns a content selection model (a method for determining content to be recommended by the content determining unit 12) in addition to a psychological bias estimation model (a method for determining recommended expressions by the expression determining unit 13). good. Learning of the content selection model may be performed using conventional techniques or the like. The above are the functions of the recommendation system 10 according to this embodiment.
  • the process executed by the recommendation system 10 according to this embodiment (the operation method performed by the recommendation system 10) will be explained using the flowchart of FIG. 12.
  • This process is performed when a recommendation is made to the user (for example, when the Push firing described above is triggered).
  • the user information acquisition unit 11 acquires user information regarding a user who is a recommendation target (S01).
  • the content determining unit 12 calculates the behavioral difficulty level for each recommended store (S02). This calculation is performed based on user information and store information.
  • the content determining unit 12 determines the store to be recommended to the user, that is, the content of the recommendation, based on the behavioral difficulty level (S03).
  • the type of recommendation such as "customer referral" or "peak shift” may be determined as described above.
  • the expression determination unit 13 uses the psychological bias estimation model to estimate the user's psychological bias (S04). This estimation is performed based on user information.
  • the expression determining unit 13 determines a nudge wording that is an expression of the recommendation based on the estimated psychological bias (S05). Note that the determination of the store to be recommended (S03) and the determination of the nudge wording (S05) may be performed in parallel. Subsequently, recommendation information is generated from the determined store and nudge wording and is recommended to the user (S06). Recommendations to users are performed, for example, by transmitting recommendation information to the terminal 20.
  • the subsequent processing is processing related to learning of the psychological bias estimation model. Since this process depends on the user's behavior regarding the recommendation, it is usually performed after a predetermined time from the recommendation.
  • the difficulty level information acquisition unit 14 acquires difficulty level information indicating the difficulty level for the user to act on the content determined by the content determination unit 12 (S07).
  • the behavior information acquisition unit 15 acquires behavior information indicating the user's behavior regarding the recommendation to the user (S08).
  • the learning unit 16 performs learning of a psychological bias estimation model that takes into consideration the difficulty level of the behavior of the user who is the target of the recommendation, based on the difficulty level information and the behavior information (S09).
  • the psychological bias estimation model after learning is used for subsequent recommendations to users.
  • the above is the process executed by the recommendation system 10 according to this embodiment.
  • the difficulty level of a user's action on the recommended content is taken into consideration. Therefore, for example, it is possible to learn a psychological bias estimation model by excluding the influence of the user's hobbies and preferences from the user's behavior regarding recommendations. As a result, according to the present embodiment, it is possible to more appropriately learn how to determine the expression of a recommendation.
  • learning of the psychological bias estimation model is performed by weighting evaluation values according to behavioral information (for example, the behavioral change evaluation value described above) based on difficulty level information, and calculating the weighted evaluation value. It may also be done using According to this configuration, it is possible to more appropriately and reliably learn how to determine the expression of a recommendation. For example, it is possible to learn a psychological bias estimation model by reliably excluding the influence of the user's hobbies and preferences from the user's behavior regarding recommendations.
  • the learning of the psychological bias estimation model does not necessarily have to be performed as described above, but it can be performed based on the difficulty level information and behavior information, taking into account the difficulty of the behavior of the user who is the target of the recommendation. Good to have. Further, learning of the psychological bias estimation model may be performed by the bandit algorithm as described above, or may be performed by other methods.
  • the expression used when making a recommendation may be an expression that corresponds to the psychological bias of the user who is the target of the recommendation. According to this configuration, a reminder can be given using an appropriate expression according to the user's psychological bias, and the effectiveness of the recommendation can be increased.
  • the expression used when making a recommendation does not necessarily have to be in accordance with psychological bias.
  • the difficulty level indicated by the difficulty level information depends on at least one of the past usage status of the user's content, the user's interests, the user's status at the time of the recommendation, and the status of the content at the time of the recommendation. It may also reflect the According to this configuration, difficulty level information can be made appropriate and reliable. As a result, it is possible to learn how to determine the expression of a recommendation more appropriately and reliably.
  • the difficulty level indicated by the difficulty level information does not necessarily have to be the above-mentioned level, and may be any level of difficulty at which the user can act on the content.
  • the method for determining the expression of a recommendation is performed using a psychological bias estimation model, but the psychological bias estimation model does not necessarily have to be used. Any method for determining the recommendation expression can be used as long as it can be learned within the framework described above. Also, when using a psychological bias estimation model, it is not necessarily the one described above, and any psychological bias estimation model can be used as long as it can be learned in the framework described above.
  • each functional block may be realized using one physically or logically coupled device, or may be realized using two or more physically or logically separated devices directly or indirectly (e.g. , wired, wireless, etc.) and may be realized using a plurality of these devices.
  • the functional block may be realized by combining software with the one device or the plurality of devices.
  • Functions include judgment, decision, judgment, calculation, calculation, processing, derivation, investigation, exploration, confirmation, reception, transmission, output, access, resolution, selection, selection, establishment, comparison, assumption, expectation, consideration, These include, but are not limited to, broadcasting, notifying, communicating, forwarding, configuring, reconfiguring, allocating, mapping, and assigning. I can't do it.
  • a functional block (configuration unit) that performs transmission is called a transmitting unit or transmitter. In either case, as described above, the implementation method is not particularly limited.
  • the recommendation system 10 in one embodiment of the present disclosure may function as a computer that performs the information processing of the present disclosure.
  • FIG. 13 is a diagram illustrating an example of the hardware configuration of the recommendation system 10 according to an embodiment of the present disclosure.
  • the recommendation system 10 described above may be physically configured as a computer device including a processor 1001, a memory 1002, a storage 1003, a communication device 1004, an input device 1005, an output device 1006, a bus 1007, and the like.
  • the hardware configuration of the terminal 20 may also be as described here.
  • the word “apparatus” can be read as a circuit, a device, a unit, etc.
  • the hardware configuration of the recommendation system 10 may be configured to include one or more of each device shown in the figure, or may be configured not to include some of the devices.
  • Each function in the recommendation system 10 is performed by loading predetermined software (programs) onto hardware such as the processor 1001 and memory 1002, so that the processor 1001 performs calculations, controls communication by the communication device 1004, and controls communication by the communication device 1004. This is realized by controlling at least one of data reading and writing in the storage 1003.
  • the processor 1001 for example, operates an operating system to control the entire computer.
  • the processor 1001 may be configured by a central processing unit (CPU) including an interface with peripheral devices, a control device, an arithmetic unit, registers, and the like.
  • CPU central processing unit
  • each function in the recommendation system 10 described above may be realized by the processor 1001.
  • the processor 1001 reads programs (program codes), software modules, data, etc. from at least one of the storage 1003 and the communication device 1004 to the memory 1002, and executes various processes in accordance with these.
  • programs program codes
  • software modules software modules
  • data etc.
  • the program a program that causes a computer to execute at least part of the operations described in the above embodiments is used.
  • each function in the recommendation system 10 may be realized by a control program stored in the memory 1002 and operated on the processor 1001.
  • Processor 1001 may be implemented by one or more chips. Note that the program may be transmitted from a network via a telecommunications line.
  • the memory 1002 is a computer-readable recording medium, and includes at least one of ROM (Read Only Memory), EPROM (Erasable Programmable ROM), EEPROM (Electrically Erasable Programmable ROM), RAM (Random Access Memory), etc. may be done.
  • Memory 1002 may be called a register, cache, main memory, or the like.
  • the memory 1002 can store executable programs (program codes), software modules, and the like to implement information processing according to an embodiment of the present disclosure.
  • the storage 1003 is a computer-readable recording medium, such as an optical disk such as a CD-ROM (Compact Disc ROM), a hard disk drive, a flexible disk, or a magneto-optical disk (for example, a compact disk, a digital versatile disk, or a Blu-ray disk). (registered trademark disk), smart card, flash memory (eg, card, stick, key drive), floppy disk, magnetic strip, etc.
  • Storage 1003 may also be called an auxiliary storage device.
  • the storage medium included in the recommendation system 10 may be, for example, a database including at least one of the memory 1002 and the storage 1003, a server, or other appropriate medium.
  • the communication device 1004 is hardware (transmission/reception device) for communicating between computers via at least one of a wired network and a wireless network, and is also referred to as a network device, network controller, network card, communication module, etc., for example.
  • the input device 1005 is an input device (eg, keyboard, mouse, microphone, switch, button, sensor, etc.) that accepts input from the outside.
  • the output device 1006 is an output device (for example, a display, a speaker, an LED lamp, etc.) that performs output to the outside. Note that the input device 1005 and the output device 1006 may have an integrated configuration (for example, a touch panel).
  • each device such as the processor 1001 and the memory 1002 is connected by a bus 1007 for communicating information.
  • the bus 1007 may be configured using a single bus, or may be configured using different buses for each device.
  • the recommendation system 10 also includes hardware such as a microprocessor, a digital signal processor (DSP), an application specific integrated circuit (ASIC), a programmable logic device (PLD), and a field programmable gate array (FPGA).
  • DSP digital signal processor
  • ASIC application specific integrated circuit
  • PLD programmable logic device
  • FPGA field programmable gate array
  • the input/output information may be stored in a specific location (for example, memory) or may be managed using a management table. Information etc. to be input/output may be overwritten, updated, or additionally written. The output information etc. may be deleted. The input information etc. may be transmitted to other devices.
  • Judgment may be made using a value expressed by 1 bit (0 or 1), a truth value (Boolean: true or false), or a comparison of numerical values (for example, a predetermined value). (comparison with a value).
  • notification of prescribed information is not limited to being done explicitly, but may also be done implicitly (for example, not notifying the prescribed information). Good too.
  • Software includes instructions, instruction sets, code, code segments, program code, programs, subprograms, software modules, whether referred to as software, firmware, middleware, microcode, hardware description language, or by any other name. , should be broadly construed to mean an application, software application, software package, routine, subroutine, object, executable, thread of execution, procedure, function, etc.
  • software, instructions, information, etc. may be sent and received via a transmission medium.
  • a transmission medium For example, if the software uses wired technology (coaxial cable, fiber optic cable, twisted pair, digital subscriber line (DSL), etc.) and/or wireless technology (infrared, microwave, etc.) to create a website, When transmitted from a server or other remote source, these wired and/or wireless technologies are included within the definition of transmission medium.
  • wired technology coaxial cable, fiber optic cable, twisted pair, digital subscriber line (DSL), etc.
  • wireless technology infrared, microwave, etc.
  • system and “network” are used interchangeably.
  • information, parameters, etc. described in this disclosure may be expressed using absolute values, relative values from a predetermined value, or using other corresponding information. may be expressed.
  • determining may encompass a wide variety of operations.
  • “Judgment” and “decision” include, for example, judging, calculating, computing, processing, deriving, investigating, looking up, search, and inquiry. (e.g., searching in a table, database, or other data structure), and regarding an ascertaining as a “judgment” or “decision.”
  • judgment and “decision” refer to receiving (e.g., receiving information), transmitting (e.g., sending information), input, output, and access.
  • (accessing) may include considering something as a “judgment” or “decision.”
  • judgment and “decision” refer to resolving, selecting, choosing, establishing, comparing, etc. as “judgment” and “decision”. may be included.
  • judgment and “decision” may include regarding some action as having been “judged” or “determined.”
  • judgment (decision) may be read as “assuming", “expecting", “considering”, etc.
  • connection refers to any connection or coupling, direct or indirect, between two or more elements and to each other. It may include the presence of one or more intermediate elements between two elements that are “connected” or “coupled.”
  • the bonds or connections between elements may be physical, logical, or a combination thereof. For example, "connection” may be replaced with "access.”
  • two elements may include one or more electrical wires, cables, and/or printed electrical connections, as well as in the radio frequency domain, as some non-limiting and non-inclusive examples. , electromagnetic energy having wavelengths in the microwave and optical (both visible and non-visible) ranges.
  • the phrase “based on” does not mean “based solely on” unless explicitly stated otherwise. In other words, the phrase “based on” means both “based only on” and “based at least on.”
  • any reference to elements using the designations "first,” “second,” etc. does not generally limit the amount or order of those elements. These designations may be used in this disclosure as a convenient way to distinguish between two or more elements. Thus, reference to a first and second element does not imply that only two elements may be employed or that the first element must precede the second element in any way.
  • a and B are different may mean “A and B are different from each other.” Note that the term may also mean that "A and B are each different from C”. Terms such as “separate” and “coupled” may also be interpreted similarly to “different.”

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

レコメンドの表現の決定方法の学習をより適切に行う。 レコメンドシステム10は、レコメンドの対象であるユーザに係るユーザ情報を取得するユーザ情報取得部11と、ユーザ情報に基づいて、ユーザにレコメンドするコンテンツを決定するコンテンツ決定部12と、ユーザ情報に基づいて、決定されたコンテンツをユーザにレコメンドする際の表現を決定する表現決定部13と、決定されたコンテンツに対してユーザが行動する難易度を示す難易度情報を取得する難易度情報取得部14と、ユーザへのレコメンドに対するユーザの行動を示す行動情報を取得する行動情報取得部15と、難易度情報及び行動情報に基づいて、レコメンドの対象であるユーザが行動する難易度を考慮してレコメンドの表現の決定方法を学習する学習部16とを備える。

Description

レコメンドシステム
 本発明は、レコメンドシステムに関する。
 特許文献1には、顧客の嗜好に応じたコンテンツを、顧客の嗜好に応じたデザインの画面に反映させてレコメンドするシステムが記載されている。このシステムは、顧客の属性を示す顧客属性情報と顧客の行動履歴を示す顧客行動履歴情報とに基づいて、顧客にレコメンドするコンテンツに関する情報であるコンテンツ情報と、コンテンツ情報に含まれる情報を表示するための領域を含むテンプレートを示すテンプレート情報とを学習型人工知能により生成する。
特開2019-61525号公報
 特許文献1に示されるように、レコメンドを行う際にレコメンドの表現(特許文献1ではレコメンドする画面のデザイン)を決定することでレコメンドの効果を高めることができる。特に、レコメンドの表現を、レコメンドの対象者であるユーザの心理的なバイアス(心理バイアス)を考慮したものとすることで、更にレコメンドの効果を高めることができる。レコメンドの表現の決定方法をレコメンドに対するユーザの反応に応じて学習させることで、より適切にレコメンドの表現を決定することができる。
 しかしながら、レコメンドに対するユーザの反応は、レコメンドの表現だけでなく、レコメンドされるものにも応じたものとなる。そのため、単純にユーザの反応を用いると、必ずしも適切な学習とならないおそれがある。例えば、ユーザの趣味趣向にあったコンテンツがレコメンドされる場合、レコメンドの表現にかかわらず、ユーザはコンテンツを利用することが考えられる。
 本発明の一実施形態は、上記に鑑みてなされたものであり、レコメンドの表現の決定方法の学習をより適切に行うことができるレコメンドシステムを提供することを目的とする。
 上記の目的を達成するために、本発明の一実施形態に係るレコメンドシステムは、レコメンドの対象であるユーザに係るユーザ情報を取得するユーザ情報取得部と、ユーザ情報取得部によって取得されたユーザ情報の少なくとも一部に基づいて、ユーザにレコメンドするコンテンツを決定するコンテンツ決定部と、ユーザ情報取得部によって取得されたユーザ情報の少なくとも一部に基づいて、コンテンツ決定部によって決定されたコンテンツをユーザにレコメンドする際の表現を決定する表現決定部と、コンテンツ決定部によって決定されたコンテンツに対してユーザが行動する難易度を示す難易度情報を取得する難易度情報取得部と、コンテンツ決定部及び表現決定部による決定に応じて行われたユーザへのレコメンドに対するユーザの行動を示す行動情報を取得する行動情報取得部と、難易度情報取得部によって取得された難易度情報及び行動情報取得部によって取得された行動情報に基づいて、レコメンドの対象であるユーザが行動する難易度を考慮して表現決定部による決定方法を学習する学習部と、を備える。
 本発明の一実施形態に係るレコメンドシステムでは、レコメンドの表現の決定方法を学習する際に、レコメンドされるコンテンツに対してユーザが行動する難易度が考慮される。このため、例えば、レコメンドに対するユーザの行動から、ユーザの趣味趣向の影響を除外して、レコメンドの表現の決定方法を学習することができる。これにより、本発明の一実施形態に係るレコメンドシステムによれば、レコメンドの表現の決定方法の学習をより適切に行うことができる。
 本発明の一実施形態によれば、レコメンドの表現の決定方法の学習をより適切に行うことができる。
本発明の実施形態に係るレコメンドシステムの構成を示す図である。 レコメンドの概要を模式的に示す図である。 ユーザにレコメンドする店舗の決定に用いられるユーザ情報の例を示すテーブルである。 ユーザにレコメンドする店舗の決定に用いられる情報の例を示すテーブルである。 ユーザへのレコメンドの内容の決定に用いられる情報の例を示すテーブルである。 ユーザへのレコメンドの表現の決定に用いられる情報の例を示すテーブルである。 心理バイアス推定モデルを用いた評価値の算出の例を示す図である。 算出される心理バイアス毎の評価値の例を示すテーブルである。 ユーザへのレコメンドの表現の決定に用いられる情報の例を示すテーブルである。 心理バイアス推定モデルの学習に用いられる情報の例を示すテーブルである。 心理バイアス推定モデルの学習の例を示す図である。 本発明の実施形態に係るレコメンドシステムで実行される処理を示すフローチャートである。 本発明の実施形態に係るレコメンドシステムのハードウェア構成を示す図である。
 以下、図面と共に本発明に係るレコメンドシステムの実施形態について詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。
 図1に本実施形態に係るレコメンドシステム10を示す。レコメンドシステム10は、ユーザにコンテンツをレコメンドするシステム(装置)である。本実施形態では、ユーザにレコメンドされるコンテンツは、飲食店とする。ユーザにレコメンドされるコンテンツは、レコメンド対象となり得るものであればどのようなものであってもよい。例えば、ユーザにレコメンドされるコンテンツは、オンライン店舗又はEC(電子商取引)サイトの商品であってもよい。
 レコメンドシステム10は、例えば、ユーザによって用いられる端末20にレコメンドに係る情報を送信することでレコメンドを行う。端末20は、レコメンドシステム10との間で移動体通信網等のネットワークを介して互いに情報の送受信を行うことができると共にレコメンドに係る情報処理を行うことが可能な装置である。端末20は、携帯電話機、スマートフォン又はPC(パーソナルコンピュータ)等の装置である。端末20における、レコメンドシステム10とのレコメンドに係る情報の送受信及び当該情報の入出力は、端末20にインストールされる専用のアプリケーションによって行われてもよい。レコメンドシステム10で用いられる情報の一部は、端末20によって取得されてレコメンドシステム10に送信されてもよい。
 レコメンドシステム10は、通信機能を有するPC(パーソナルコンピュータ)又はサーバ装置等のコンピュータによって構成されている。レコメンドシステム10は、複数のコンピュータによって構成されていてもよい。レコメンドシステム10は、端末20との間で移動体通信網等のネットワークを介して互いに情報の送受信を行うことができる。
 レコメンドシステム10は、ユーザ毎にレコメンドするコンテンツ(飲食店)を決定する。また、レコメンドシステム10は、レコメンド毎にレコメンドの表現を決定して、決定した表現でレコメンドを行う。レコメンドの表現は、例えば、コンテンツをレコメンドする際の文言であるナッジ文言である。また、レコメンドの表現は、ユーザの心理的なバイアス(以降、心理バイアスと呼ぶ)(認知バイアス)に応じたものである。心理バイアスは、ユーザがレコメンドに対して行動を決める際の心理的な傾向である。心理バイアスの例としては、損をしたくないという「損失回避」、及び他人にあわせるという「同調」等がある。
 図2に示すように、例えば、レコメンドシステム10は、コンテンツ内容選定モデルを予め記憶しており、コンテンツ内容選定モデルに基づいてレコメンドするコンテンツを決定する。また、レコメンドシステム10は、心理バイアス推定モデルを予め記憶しており、心理バイアス推定モデルに基づいて心理バイアスを推定して、推定した心理バイアスに応じた表現を決定する。レコメンドシステム10は、決定したコンテンツを決定した表現でユーザUにレコメンドする。これにより、個々のユーザに対するレコメンドの効果を高めることができる。例えば、ユーザの趣味趣向にあわせたコンテンツを、ユーザがコンテンツを利用したい(例えば、ユーザが飲食店を訪れたい)と思うような表現でレコメンドすることができる。
 なお、レコメンドの表現は、必ずしも、心理バイアスに応じたものである必要はなく、レコメンドに影響を与えるものであればよい。また、レコメンドの表現は、レコメンドする際の文言以外であってもよい。
 本実施形態では、レコメンドシステム10は、レコメンドに対するユーザUの行動であるユーザUの反応に基づいて、心理バイアス推定モデルの学習を行う。即ち、レコメンドシステム10は、レコメンドの決定方法について強化学習を行う。また、レコメンドシステム10は、レコメンドに対するユーザUの反応に基づいて、コンテンツ内容選定モデルの学習も行ってもよい。これらの学習によって、レコメンドの精度を高めることができる。
 引き続いて、本実施形態に係るレコメンドシステム10の機能を説明する。図1に示すようにレコメンドシステム10は、ユーザ情報取得部11と、コンテンツ決定部12と、表現決定部13と、難易度情報取得部14と、行動情報取得部15と、学習部16とを備えて構成される。
 ユーザ情報取得部11は、レコメンドの対象であるユーザに係るユーザ情報を取得する機能部である。ユーザ情報取得部11によって取得されるユーザ情報は、以下に示すレコメンドに係る処理に用いられる。ユーザ情報は、どのような情報であり、どのように取得されてどのように用いられるかは後述する。なお、後述するユーザ情報は一例であり、レコメンドに係る処理に用いることができるものであればよい。
 レコメンドシステム10によるユーザへのレコメンドは、プッシュ型で行われてもよい。例えば、ユーザが特定の状態となったこと(Push発火)をトリガとして、レコメンドを行ってもよい。例えば、ユーザの位置が、レコメンドを行う特定の領域に入った際にレコメンドを行ってもよい。あるいは、ユーザが、特定の交通手段(例えば、電車、タクシー)を利用した際にレコメンドを行ってもよい。ユーザ情報取得部11は、これらを判断するための情報をユーザに携帯される端末20から取得してもよい。例えば、ユーザ情報取得部11は、緯度及び経度等の端末20の位置を示す情報を取得して、当該情報に基づいてユーザへのレコメンドを行うかどうかを判断してもよい。
 なお、レコメンドシステム10によるユーザへのレコメンドは、上記以外のタイミングで行われてもよい。例えば、予め設定された時刻でレコメンドが行われるようにしてもよいし、その他のトリガによってレコメンドが行われるようにしてもよい。あるいは、端末20からの要求に応じてレコメンドが行われるようにしてもよい。ユーザへのレコメンドに係る以下に示す機能部は、ユーザへのレコメンドが行われるタイミングで機能すればよい。
 コンテンツ決定部12は、ユーザ情報取得部11によって取得されたユーザ情報の少なくとも一部に基づいて、ユーザにレコメンドするコンテンツを決定する機能部である。本実施形態では、コンテンツ決定部12は、ユーザにレコメンドするコンテンツとして、飲食店を決定する。コンテンツ決定部12は、以下に示すコンテンツ内容選定モデルに従ってレコメンド内容を決定する。
 コンテンツ決定部12によって用いられるユーザ情報として、ユーザ情報取得部11は、レコメンド対象となるユーザのPOI(Point of Interest)訪問実績を示す情報を取得する。本実施形態におけるPOIは、レコメンドされる飲食店である。POI訪問実績は、ユーザが過去に各店舗(飲食店)に訪問した回数である。
 図3(a)に、レコメンドシステム10が備える、ユーザのPOI訪問実績を示す情報を格納するユーザ・POI訪問実績データベースを示す。ユーザ・POI訪問実績データベースには、予め、ユーザIDと、ユーザIDによって示されるユーザの各店舗への過去の訪問回数とが対応付けて記憶されている。ユーザIDは、レコメンド対象となるユーザに予め設定された識別子である。ユーザ・POI訪問実績データベースに記憶される情報は、従来技術等によって生成される。例えば、ユーザ・POI訪問実績データベースに記憶される情報は、ユーザが店舗で決済した情報又はユーザの位置情報に基づいて生成される。当該情報の生成は、ジオフェンスに基づいて行われてもよい。ユーザ情報取得部11は、ユーザ・POI訪問実績データベースから、レコメンド対象となるユーザの情報を読み出して取得する。
 コンテンツ決定部12によって用いられるユーザ情報として、ユーザ情報取得部11は、レコメンド対象となるユーザのカテゴリに対する興味度を示す情報を取得する。カテゴリは、レコメンド対象となる飲食店のカテゴリである。例えば、カテゴリは、「焼肉」、「ラーメン」といったものである。
 図3(b)に、レコメンドシステム10が備える、ユーザのカテゴリに対する興味度を示す情報を格納するユーザ・カテゴリ興味度情報データベースを示す。ユーザ・カテゴリ興味度情報データベースには、予め、ユーザIDと、ユーザIDによって示されるユーザの各カテゴリに対する興味度を示す数値とが対応付けて記憶されている。興味度を示す数値は、値が大きいほどユーザがそのカテゴリに興味を持っていることを示している。ユーザ・カテゴリ興味度情報データベースは、従来技術等によって生成される。例えば、ユーザ・カテゴリ興味度情報データベースは、ユーザの各カテゴリの店舗への過去の訪問回数及びユーザへのアンケート等に基づいて生成される。ユーザ情報取得部11は、ユーザ・カテゴリ興味度情報データベースから、レコメンド対象となるユーザの情報を読み出して取得する。
 コンテンツ決定部12によって用いられるユーザ情報として、ユーザ情報取得部11は、レコメンド対象となるユーザのレコメンド時の状況を示す情報、即ち、ユーザの現在状況を示す情報を取得する。例えば、ユーザの現在状況を示す情報は、ユーザがその日に昼食をとったかを示す情報及びユーザの位置情報である。
 図3(c)に、レコメンドシステム10が備える、コンテンツ決定部12によって用いられる、ユーザの現在状況を示す情報を格納するユーザ現在状況データベースを示す。ユーザ現在状況データベースには、ユーザIDと、ユーザIDによって示されるユーザの現在状況を示す情報とが対応付けて記憶されている。現在状況を示す情報のうちの昼ごはんの情報は、数値が1であればユーザがその日に昼食をとったことを示し、数値が0であればユーザがその日に昼食をとっていないことを示している。この情報は、従来技術等によってリアルタイムに生成される。
 現在状況を示す情報のうちの現在地の情報は、ユーザの現在位置を示す情報である。例えば、現在地の情報は、緯度及び経度の情報である。例えば、この情報は、ユーザによって携帯される端末20から、端末20の現在位置を示す情報を取得することでリアルタイムに生成(取得)される。ユーザ情報取得部11は、ユーザ現在状況データベースから、レコメンド対象となるユーザの情報を読み出して取得する。
 ユーザ情報取得部11は、取得した情報をコンテンツ決定部12に出力する。なお、ユーザ情報取得部11は、コンテンツ決定部12によって用いられるユーザ情報として、上記以外のユーザ情報を取得してもよい。また、ユーザ情報取得部11は、上記以外の方法でユーザ情報を取得してもよい。例えば、ユーザ情報取得部11は、端末20から受信することによってユーザ情報を取得してもよい。
 コンテンツ決定部12は、ユーザ情報取得部11からユーザ情報を入力する。また、コンテンツ決定部12は、ユーザにレコメンドする候補となる各店舗に係る情報を取得する。
 図4(a)に、レコメンドシステム10が備える、各飲食店に係る情報を格納する店舗データベースを示す。店舗データベースには、店舗IDと、店舗IDによって示される店舗に係る情報とが対応付けて記憶されている。店舗IDは、ユーザにレコメンドする店舗に予め設定された識別子である。図4(a)に示すように店舗に係る情報は、位置情報、混雑情報、店舗名、推奨時間及びカテゴリの各情報を含む。
 位置情報は、店舗の位置を示す情報である。例えば、位置情報は、緯度及び経度の情報である。位置情報は、予め、店舗データベースに記憶されている。混雑情報は、店舗の混雑度を示す情報である。混雑情報の数値は、値が大きいほど店舗が混雑していることを示している。混雑情報は、従来技術等によってリアルタイムに生成され、店舗データベースに記憶される。店舗名は、店舗の名称である。店舗名は、予め、店舗データベースに記憶されている。推奨時間は、当該店舗への訪問が推奨される1日における時刻である。推奨時刻は、予め、店舗データベースに記憶されている。カテゴリは、当該店舗のカテゴリである。カテゴリは、図3(b)に示すユーザ・カテゴリ興味度情報データベースのカテゴリの何れかである。カテゴリは、予め、店舗データベースに記憶されている。
 コンテンツ決定部12は、店舗データベースから各飲食店に係る情報を取得する。ユーザにレコメンドする候補となる店舗は、店舗データベースに情報が記憶された店舗のうち一部の店舗であってもよい。例えば、ユーザの現在地に基づく店舗のみが、ユーザにレコメンドする候補となる店舗とされてもよい。具体的には、ユーザの現在地から一定の範囲の店舗、又はユーザの現在地と同一の地域の店舗(例えば、同一の地区町村の店舗)が、ユーザにレコメンドする候補となる店舗とされてもよい。この場合、コンテンツ決定部12は、ユーザ情報取得部11から入力したユーザ情報によって示されるユーザの現在地と、取得した飲食店に係る情報によって示される店舗の位置とから、ユーザにレコメンドする候補となる店舗を判断してもよい。
 コンテンツ決定部12は、取得した情報から以下のようにユーザにレコメンドする店舗を決定する。コンテンツ決定部12は、まず、レコメンドする候補の店舗毎に行動難易度を算出する。行動難易度は、店舗に対してユーザが行動を取る難易度である。店舗に対するユーザの行動は、例えば、店舗を訪問する、即ち、コンテンツを利用するという行動である。また、店舗に対するユーザの行動は、上記に限られず、当該店舗についてレコメンドする情報を開封して参照した(即ち、店舗(コンテンツ)に対して興味を示した。これについては詳細に後述する)等の店舗に対する行動であればどのようなものであってもよい。
 算出される行動難易度の例を図4(b)に示す。算出される行動難易度は、レコメンドシステム10が備える、ユーザ・POI行動難易度データベースに格納される。行動難易度を示す数値は、値が小さいほど難易度が大きく(即ち、対応する店舗に対して行動を取らない傾向がある)、値が大きいほど難易度が小さい(即ち、対応する店舗に対して行動を取る傾向がある)ことを示している。
 例えば、コンテンツ決定部12は、以下の式によって店舗毎の行動難易度を算出する。
 行動難易度=(f1(訪問回数)+興味度+f2(店舗との距離))×s(食事の有無)
 上記の式において、f1(訪問回数)は、入力された訪問回数が大きいほど大きな値を関数値とする関数である。訪問回数は、行動難易度の算出対象となっている店舗へのユーザの過去の訪問回数である。興味度は、行動難易度の算出対象となっている店舗のカテゴリについてのユーザの興味度を示す数値である。f2(店舗との距離)は、入力された距離が大きいほど小さな値を関数値とする関数である。店舗との距離は、行動難易度の算出対象となっている店舗とユーザの現在地との距離である。s(食事の有無)は、ユーザの食事の有無を示す値である。例えば、昼食の時間帯のレコメンドを行う際には、ユーザが昼食をとっている場合、s(食事の有無)は0とされ、ユーザが昼食をとっていない場合、s(食事の有無)は1とされる。
 上記の式によれば、ユーザの訪問回数が多い店舗、ユーザの興味が高いカテゴリの店舗、及びユーザの現在地に近い店舗ほど、行動難易度の値が高くなる。即ち、そのような店舗ほど、ユーザが店舗に対する行動を取りやすい店舗であるとされる。また、ユーザが食事をとっていなければ、行動難易度の値が高くなり、ユーザが店舗に対する行動を取りやすいとされる。
 なお、行動難易度の算出は、必ずしも上記の式で行われる必要はない。また、上記の各要素の全てが行動難易度の算出に用いられる必要はなく、一部の要素のみが行動難易度の算出に用いられてもよい。また、上記以外の要素が行動難易度の算出に用いられてもよい。例えば、上記の式では、店舗に係る情報のうち、混雑情報及び推奨時間が用いられていないがこれらの情報が用いられてもよい。例えば、店舗が混雑していないほど、行動難易度の値を高くしてもよい。あるいは、現時点と推奨時間とが近いほど、行動難易度の値を高くしてもよい。
 コンテンツ決定部12は、算出した行動難易度に基づいて、ユーザにレコメンドする店舗を決定する。例えば、コンテンツ決定部12は、行動難易度の値が最も高い店舗をユーザにレコメンドする店舗として決定する。なお、レコメンド対象となるユーザに対して一定期間内に既にレコメンドされている店舗は、レコメンドする店舗から除外してもよい。但し、コンテンツ決定部12は、上記以外の決定基準でユーザにレコメンドする店舗を決定してもよい。また、コンテンツ決定部12は、一定の値以上の行動難易度となった店舗がない場合、ユーザに店舗をレコメンドしないと決定してもよい。
 更に、コンテンツ決定部12は、どのように店舗をレコメンドするか、即ち、レコメンドの種別を決定してもよい。図5に、レコメンドシステム10が備える、レコメンドの内容を格納するレコメンド内容データベースを示す。レコメンド内容データベースには、予め、レコメンドIDと、店舗IDと、種別と、クーポン情報とが対応付けて記憶されている。レコメンドIDは、レコメンドの内容に予め設定された識別子である。レコメンドの内容は、以降の情報によって特定される。店舗IDは、レコメンドされる店舗の店舗IDである。
 種別は、レコメンドの種別である。レコメンドの種別としては、例えば、図5に示す「送客」、「ピークシフト」等がある。送客は、クーポン又はその他の方法によってユーザに店舗への訪問をレコメンドするものである。ピークシフトは、店舗の周辺の施設(例えば、駅)が混雑している場合、当該混雑を避けるようにユーザに店舗への訪問をレコメンドするものである。
 クーポン情報は、レコメンドの際にユーザに提示されるクーポンの情報である。クーポン情報は、例えば、クーポンの有無を示す情報及びクーポンの内容を示す情報を含む。図5に示す例では、クーポン情報は、{A:B}の形式である。Aは、クーポンの有無を示す情報であり、数値が1であればクーポンがあることを示し、数値が0であればクーポンがないことを示している。Bは、クーポンとしての料金からの割引の金額(例えば、図5の1行目のデータであれば100円引きのクーポン)を示している。なお、Aの数値が0であれば、Bの情報はない。
 コンテンツ決定部12は、レコメンドする店舗を決定した後、レコメンド内容データベースを参照して、レコメンドの内容を決定する。コンテンツ決定部12は、予めレコメンド内容を決定するための決定基準を記憶しており、その決定基準に基づいてレコメンドの内容を決定する。例えば、コンテンツ決定部12は、ユーザにレコメンドする店舗の周囲の施設(例えば、駅)の混雑度を示す情報を取得する。この情報の取得は、従来技術等によって行われればよい。混雑度が予め設定した閾値以上であれば、コンテンツ決定部12は、ピークシフトの種別のレコメンドを行うと決定する。混雑度が予め設定した未満以上であれば、コンテンツ決定部12は、送客の種別のレコメンドを行うと決定する。なお、コンテンツ決定部12は、上記以外にレコメンドの内容を決定してもよい。また、送客、ピークシフト等の種別なしにレコメンドが行われてもよい。なお、コンテンツ内容選定モデルは、コンテンツ決定部12の上記のレコメンド内容の決定のための処理を規定するものである。
 表現決定部13は、ユーザ情報取得部11によって取得されたユーザ情報の少なくとも一部に基づいて、コンテンツ決定部12によって決定されたコンテンツをユーザにレコメンドする際の表現を決定する機能部である。表現決定部13は、レコメンドする際の表現として、レコメンドの対象であるユーザの心理的なバイアスに応じた表現を決定してもよい。表現決定部13は、以下に示す心理バイアス推定モデルに従ってレコメンドの表現を決定する。
 表現決定部13によって用いられるユーザ情報として、ユーザ情報取得部11は、レコメンド対象となるユーザの属性を示す情報を取得する。図6(a)に、レコメンドシステム10が備える、ユーザの属性を示す情報を格納するユーザ属性データベースを示す。ユーザ属性データベースには、予め、ユーザIDと、ユーザIDによって示されるユーザの属性を示す情報とが対応付けて記憶されている。図6(a)に示すように、ユーザの属性は、例えば、性別、居住エリア、職業、家族構成及び趣味趣向等を含む。図6(a)に示すように各属性を示す情報は、属性を示すIDであってもよい。ユーザ情報取得部11は、ユーザ属性データベースから、レコメンド対象となるユーザの情報を読み出して取得する。
 表現決定部13によって用いられるユーザ情報として、ユーザ情報取得部11は、レコメンド対象となるユーザのレコメンド時の状況を示す情報、即ち、ユーザの現在状況を示す情報を取得する。例えば、ユーザの現在状況を示す情報は、ユーザが在宅であるかを示す情報、過去の受信回数及び本日の訪問歴である。過去の受信回数は、ユーザが過去にレコメンドを受信した回数である。本日の訪問歴は、ユーザにレコメンドする候補となる店舗にユーザが訪問しているか否かを示す情報である。
 図6(b)に、レコメンドシステム10が備える、表現決定部13によって用いられる、ユーザの現在状況を示す情報を格納するユーザ現在状況データベースを示す。ユーザ現在状況データベースには、ユーザIDと、ユーザIDによって示されるユーザの現在状況を示す情報とが対応付けて記憶されている。現在状況を示す情報のうちの在宅の情報は、数値が1であればユーザがその時点で在宅であることを示し、数値が0であればユーザがその時点で在宅でないことを示している。この情報は、従来技術等によってリアルタイムに生成される。過去の受信回数及び本日の訪問歴は、これらを示す適宜の情報であり、従来技術等によってリアルタイムに生成される。ユーザ情報取得部11は、ユーザ現在状況データベースから、レコメンド対象となるユーザの情報を読み出して取得する。
 ユーザ情報取得部11は、取得した情報を表現決定部13に出力する。なお、ユーザ情報取得部11は、表現決定部13によって用いられるユーザ情報として、上記以外のユーザ情報を取得してもよい。また、ユーザ情報取得部11は、上記以外の方法でユーザ情報を取得してもよい。例えば、ユーザ情報取得部11は、端末20から受信することによってユーザ情報を取得してもよい。
 表現決定部13は、ユーザ情報取得部11からユーザ情報を入力する。表現決定部13は、入力した情報から以下のようにレコメンドの際の表現を決定する。表現決定部13は、入力したユーザ情報を特徴量に変換する。特徴量は、予め設定された次元数のベクトルである。変換される特徴量の例を図6(c)に示す。特徴1、特徴2、特徴3…のそれぞれが、特徴量のベクトルの要素である。ユーザ情報から特徴量への変換は、従来技術等によって行うことができる。
 特徴量には、レコメンドに影響を及ぼし得るユーザ情報以外の外的要因の情報が含まれていてもよい。例えば、その時点の天気及び時刻を示す情報が、特徴量に反映されてもよい。また、コンテンツ決定部12によって決定されたレコメンドの内容に係る情報が、特徴量に反映されてもよい。即ち、表現決定部13は、コンテンツ決定部12によって決定されたコンテンツにも基づいてレコメンドする際の表現を決定してもよい。例えば、決定されたレコメンドの内容のうち、店舗のカテゴリ(例えば、「レストラン」とのカテゴリ)及びレコメンドの種別(例えば、「送客」との種別)が、特徴量に含まれてもよい。上記のユーザ情報以外の情報は、ユーザ情報と別次元の特徴量とするか、ユーザ情報とあわせて特徴量に変換されればよい。
 表現決定部13は、得られた特徴量と、心理バイアス推定モデルとから、ユーザの心理バイアスを推定する。具体的には、表現決定部13は、心理バイアス(の種別)毎(例えば、「損失回避」、「同調」毎)の評価値を算出する。評価値を算出するために、心理バイアス推定モデルを用いる。心理バイアス推定モデルには、心理バイアス毎のパラメータを含む。パラメータは、特徴量の次元数と同じ次元数のベクトルである。心理バイアス推定モデルのパラメータの各要素は、特徴量の各要素と対応している。心理バイアス推定モデルは、ユーザ間で共通のものである。但し、心理バイアス推定モデルは、ユーザ毎、あるいはユーザの種別毎のものとしてもよい。
 表現決定部13は、互いに対応する、特徴量の要素と心理バイアス推定モデルのパラメータの要素とを掛け合わせて和を取って評価値を算出する。即ち、表現決定部13は、特徴量のベクトルと、心理バイアス推定モデルのパラメータのベクトルとの内積を評価値として算出する。表現決定部13は、心理バイアスの種別毎のパラメータを用いて、心理バイアスの種別毎に評価値を算出する。図7に1つの心理バイアス(心理バイアス1)のパラメータの例と、評価値の算出の例とを示す。図8にユーザ毎に算出される心理バイアスの評価値を示す。算出される評価値は、値が大きいほどユーザがその心理バイアスを強く有していることを示している。
 心理バイアス推定モデルのパラメータは、後述する学習部16による学習によって更新される。学習部16による学習は、レコメンドに対するユーザの反応に基づいて行われる。従って、レコメンドが行われる毎により適切に心理バイアスの決定が行われるようになり、その結果、より適切にレコメンドが行われるようになる。
 表現決定部13は、推定された心理バイアスに基づいてレコメンドの表現であるナッジ文言を決定する。また、表現決定部13は、推定された心理バイアスに加えて、コンテンツ決定部12によって決定されたレコメンドの内容に係る情報を参照して、当該情報に基づいてレコメンドの表現を決定してもよい。
 レコメンドの表現の決定は、予め設定された、心理バイアスとナッジ文言との対応付けに基づいて行われる。図9に、レコメンドシステム10が備える、当該対応付けの情報を格納するナッジ文言データベースを示す。ナッジ文言データベースには、予め、ナッジIDと、心理バイアスと、種別と、クーポン有無と、ナッジ文言とが対応付けて記憶されている。ナッジIDは、ナッジ文言に予め設定された識別子である。種別は、レコメンドの種別(上述した「送客」、「ピークシフト」等)である。クーポン有無は、レコメンドの際にユーザに提示されるクーポンの有無である。クーポン有無の数値が1であればクーポンがあることを示し、数値が0であればクーポンがないことを示している。ナッジ文言中の{}の部分は、コンテンツ決定部12によって決定されたレコメンドされる店舗を示す情報(例えば、店舗名)が入力される。
 表現決定部13は、算出した評価値の割合で、確率的にレコメンドに用いる心理バイアスを決定(選択)する。このように確率的にレコメンドに用いる心理バイアスを決定することで、常に同様のナッジ文言が用いられることを防ぐことができる。但し、上記以外の方法でレコメンドに用いる心理バイアスを決定してもよい。
 表現決定部13は、図9に示すナッジ文言データベースを参照して、ナッジ文言データベースにおいて、決定した心理バイアスと、コンテンツ決定部12によって決定されたレコメンドの種別及びクーポン有無との組み合わせに対応付けられているナッジ文言を、ユーザにレコメンドする際の表現として決定(選択)する。
 なお、図9に示すナッジ文言データベースでは含まれていないが、ナッジ文言は、レコメンドのクーポンの有無に応じた文言が含まれていてもよい。例えば、レコメンドにクーポンがある場合、図9に示すナッジ文言に加えて、「お得なクーポンがあります」といった文言が含まれていてもよい。また、レコメンドにクーポンがない場合、図9に示すナッジ文言に加えて、「あなたにお勧めです」といった文言が含まれていてもよい。
 表現決定部13は、コンテンツ決定部12によって決定されたレコメンドの内容と決定した表現とを用いて、ユーザにレコメンドする情報を生成し、端末20に送信する。なお、コンテンツ決定部12及び表現決定部13の決定に基づく、端末20への情報の送信等のレコメンド自体は、レコメンドシステム10で行われる必要はなく、レコメンドシステム10以外のシステム又は装置によって行われてもよい。
 端末20に送信されたレコメンドの情報は、端末20のユーザによって参照される。例えば、レコメンドの情報が端末20に受信されると、レコメンド用のアプリケーションによってユーザへの通知が行われる。ユーザへの通知は、例えば、端末20の画面にレコメンドに係る表示が行われる。通知の際の表示は、コンテンツ決定部12及び表現決定部13によって決定された内容がユーザに認識できるように行われる。具体的には、コンテンツ決定部12によって決定されたレコメンドする店舗を示す情報を含む、表現決定部13によって決定されたナッジ文言が表示される。
 ユーザは、端末20の当該アプリケーションに対する操作を行って、レコメンドの詳細(例えば、店舗の情報等)を参照する。本実施形態では、この操作を開封と呼ぶ。上述したように開封も、レコメンドされた店舗に対するユーザの行動の一つである。
 難易度情報取得部14は、コンテンツ決定部12によって決定されたコンテンツに対してユーザが行動する難易度を示す難易度情報を取得する機能部である。難易度情報取得部14は、ユーザのコンテンツの過去の利用状況、ユーザの興味、レコメンド時のユーザの状況、及びレコメンド時のコンテンツの状況に少なくとも何れかを反映した難易度を示す難易度情報を取得してもよい。
 レコメンドに対するユーザの反応は、レコメンドされたコンテンツ(本実施形態の場合、飲食店)自体と、ナッジ文言等のレコメンドの表現とに応じたものとなる。従って、レコメンドに対して、レコメンドを開封したり、レコメンドされた飲食店を訪問したりというユーザが行動を起こした場合、必ずしもナッジ文言が大きな影響を及ぼしたわけではなく、レコメンドされたコンテンツ自体が大きな影響を及ぼすことが考えられる。例えば、ユーザが元々レコメンドされた飲食店を好きだったから、レコメンドされた店舗に対する行動を起こすことが考えられる。
 即ち、レコメンドに対するユーザの反応は、心理バイアス推定モデルの学習の観点からは、大きなノイズを含んだものである。ノイズを含むデータを用いて学習を行うと、必ずしも適切な学習とはならず、心理バイアス推定モデルの学習が進まないおそれがある。
 難易度は、レコメンドに対するユーザの反応に基づいて、心理バイアス推定モデルの学習を行う際に、レコメンドされたコンテンツの影響(バイアス)、即ち、ユーザの趣味趣向の影響を除外するためのものである。難易度を用いた学習を行うことで、心理バイアス推定モデルの学習の収束を早くすることができる。
 難易度情報取得部14は、レコメンドされた店舗について、コンテンツ決定部12によって算出された行動難易度を示す情報を難易度情報として取得する。上述したようにコンテンツ決定部12によって算出される行動難易度は、ユーザのコンテンツの過去の利用状況、ユーザの興味、レコメンド時のユーザの状況、及びレコメンド時のコンテンツの状況に少なくとも何れかを反映したものである。但し、難易度情報取得部14によって取得される難易度情報は、コンテンツ決定部12によって算出された行動難易度を示す情報である必要はなく、コンテンツ決定部12による算出方法とは別の算出方法で、難易度情報取得部14が難易度を算出して難易度情報を取得してもよい。難易度情報取得部14は、取得した難易度情報を学習部16に出力する。
 行動情報取得部15は、コンテンツ決定部12及び表現決定部13による決定に応じて行われたユーザへのレコメンドに対するユーザの行動を示す行動情報を取得する機能部である。レコメンドに対するユーザの行動は、例えば、レコメンドの情報を開封して参照した、店舗を訪問した及び店舗においてレコメンドの情報に含まれるクーポンを利用したというものである。また、レコメンドに対するユーザの行動は、上記以外でも、レコメンドによって行った行動であればよい。また、店舗への訪問及びクーポンの利用は、レコメンドの情報が開封された場合のみレコメンドに対するユーザの行動とすることとしてもよい。
 具体的には、行動情報取得部15は、行動情報として、ユーザへのレコメンドが行われた時刻、レコメンドの情報の開封の有無、開封時刻及びレコメンドされた店舗におけるクーポンの利用の有無を示す情報を取得する。ユーザへのレコメンドが行われた時刻、レコメンドの情報の開封の有無、及び開封時刻を示す情報は、例えば、端末20でのレコメンド用のアプリケーションを介して取得することができる。クーポンの利用の有無を示す情報は、レコメンドされた店舗におけるユーザの決済に係る情報の取得によって取得することができる。行動情報取得部15は、取得した行動情報を学習部16に出力する。
 学習部16は、難易度情報取得部14によって取得された難易度情報及び行動情報取得部15によって取得された行動情報に基づいて、レコメンドの対象であるユーザが行動する難易度を考慮して表現決定部13による決定方法を学習する機能部である。学習部16は、行動情報に応じた評価値を、難易度情報に基づいて重み付けし、重み付けされた評価値を用いて、表現決定部13による決定方法を学習してもよい。
 学習部16は、難易度情報取得部14によって取得された難易度情報及び行動情報取得部15によって取得された行動情報に基づいて、心理バイアス推定モデルの学習を行う。学習部16による心理バイアス推定モデルの学習は、レコメンドに対してユーザが行動を取っていたら、その心理バイアスが強く推定されるように行われる。その際、上述したように難易度情報に基づいて、レコメンドされたコンテンツの影響が除外されるように学習が行われる。例えば、学習部16は、以下のように心理バイアス推定モデルの学習を行う。
 学習部16は、難易度情報取得部14から難易度情報を入力する。学習部16は、行動情報取得部15から行動情報を入力する。また、学習部16は、難易度情報及び行動情報に対応するレコメンドに係る情報をコンテンツ決定部12及び表現決定部13から取得する。図10に学習部16によって取得される情報を示す。図10に示す情報のうち、心理バイアス推定モデルの学習に用いられる情報は、互いに対応付けられた、行動難易度、心理バイアス、Push時間、開封、開封時間及びクーポン利用の各情報である。図10に示す評価の情報は後述する。
 行動難易度は、難易度情報取得部14によって取得された難易度情報によって示される、レコメンドされた店舗についての行動難易度である。心理バイアスは、表現決定部13によって決定されたレコメンドに用いられた心理バイアスである。学習部16は、この心理バイアスについての、心理バイアス推定モデルのパラメータを更新する。Push時間、開封、開封時間及びクーポン利用は、行動情報取得部15によって取得された行動情報である。Push時間は、ユーザへのレコメンドが行われた時刻である。開封は、ユーザによってレコメンドの情報の開封が行われたか否かを示す情報である。数値が1であればレコメンドの情報の開封が行われていることを示し、数値が0であればレコメンドの情報の開封が行われていないことを示している。開封時間は、ユーザによってレコメンドの情報の開封が行われた時刻である。
 クーポン利用は、ユーザによってクーポンの利用が行われたか否かを示す情報である。数値が1であればクーポンが利用されていることを示し、数値が0であればクーポンが利用されていないことを示している。行動情報取得部15によるレコメンド情報の開封に係る情報及びクーポンの利用に係る情報の取得はリアルタイムで行われてもよいし、ユーザへのレコメンドが行われた時刻から予め設定された時間(例えば、数分~数時間)が経過した時点で行われてもよい。予め設定された時間が経過した時点で情報が取得される場合には、その時点での情報となる。
 学習部16は、行動情報から、行動情報に応じた評価値である行動変容評価値を算出する。ユーザの行動毎に、その行動を取った場合の予め行動変容評価値が設定されている。例えば、開封は0.2、クーポンの利用は0.8といった値である。行動変容評価値は、レコメンドに対して、どの程度の行動を取ったかを示す指標値であり、値が大きいほど、レコメンドを行う側が期待する行動をユーザが取っていることを示す。学習部16は、行動情報を参照して、ユーザが取った行動について行動変容評価値を算出する。ユーザが複数の行動を取っている場合には、各行動に対応する値の和を行動変容評価値とする。図10に示す例の場合、ユーザは、開封とクーポン利用とを行っているので、0.2(開封)+0.8(クーポン利用)=1.0となる。
 学習部16は、算出した行動変容評価値を、難易度情報に基づいて重み付けする。例えば、学習部16は、行動変容評価値に(1-行動難易度)の値を重み付けする。図10に示す例の場合、重み付け後の行動変容評価値は、(0.2(開封)+0.8(クーポン利用))×(1-0.8(行動難易度))=0.2となる。図10に示す評価は、重み付け後の行動変容評価値である。難易度情報に基づく重み付けの値は、行動難易度の値をマイナスした値を用いているため、値が大きいほどユーザが行動を取らない傾向を示している。
 従って、重み付け後の行動変容評価値は、レコメンドされたコンテンツの影響(バイアス)、即ち、ユーザの趣味趣向の影響を除外した、レコメンドに対するユーザの反応を示す値である。また、難易度情報が、コンテンツ(店舗)の状況を含んだものである場合には、その影響も除外している。
 図11に示すように、続いて、学習部16は、心理バイアスの評価値の算出に用いたユーザの特徴量と、更新対象となる心理バイアス推定モデルのパラメータとの勾配を算出する。勾配を算出する際には、適切に勾配を算出できるように、通常、ユーザの特徴量に対する正規化が必要となる。そのような正規化として、例えば、ユーザの特徴量の各要素の値に予め設定された値(図11に示すn)を掛けてもよい。正規化は、上記以外にも、ユーザの特徴量を入力とし、正規化された特徴量を出力する予め設定した関数fを用いてもよい。関数fは、一般的な正規化を行うものである。勾配の算出は、2つのベクトルから交差エントロピー誤差を求めることで行われる。あるいは、勾配の算出は、交差エントロピー誤差以外の手法で行われてもよい。算出される勾配は、特徴量及び心理バイアス推定モデルのパラメータの次元数と同じ次元数のベクトルである。
 学習部16は、勾配の各要素に重み付け後の行動変容評価値を掛けて更新パラメータとする。学習部16は、更新対象となる心理バイアス推定モデルのパラメータと、更新パラメータとを要素毎に足し合わせて、更新後のパラメータ(学習後のパラメータ)とする。
 学習部16によって学習された心理バイアス推定モデルは、それ以降のレコメンドに用いられる。また、レコメンドが行われる度に学習部16による学習は、繰り返し行われる。繰り返しの学習が行われることで、心理バイアス推定モデルの精度が向上し、より適切なレコメンドの表現の決定を行えるようになる。
 なお、学習部16による学習は、必ずしも上記のように行われる必要はなく、難易度情報及び行動情報に基づいて、レコメンドの対象であるユーザが行動する難易度を考慮して行われるものであればよい。
 学習部16による学習は、ユーザにレコメンドが行われた時刻から予め設定した時間が経過したタイミングで行われてもよいし、予め設定された時刻(例えば、1日のうちの特定の時刻)に行われてもよい。あるいは、学習部16による学習は、制限時間(例えば、ユーザにレコメンドが行われた時刻から予め設定した時間)内に、レコメンドに対してユーザが行動を起こしたタイミングで行われてもよい。例えば、行動情報取得部15が、レコメンドに対してユーザが行動を起こしたことを示す行動情報をリアルタイムに取得して学習部16に入力するようにしておき、学習部16は、行動情報取得部15から行動情報を入力したら学習を行う。レコメンドに対してユーザが行動を起こしたことを示す行動情報が取得できたタイミングで学習は行える状況にあるためである。また、学習部16は、心理バイアス推定モデル(表現決定部13によるレコメンドの表現の決定方法)に加えて、コンテンツ内容選定モデル(コンテンツ決定部12によるレコメンドするコンテンツの決定方法)も学習してもよい。コンテンツ内容選定モデルの学習は、従来技術等によって行われればよい。以上が、本実施形態に係るレコメンドシステム10の機能である。
 引き続いて、図12のフローチャートを用いて、本実施形態に係るレコメンドシステム10で実行される処理(レコメンドシステム10が行う動作方法)を説明する。本処理は、ユーザに対するレコメンドが行われる際(例えば、上述したPush発火をトリガ)に行われる。まず、ユーザ情報取得部11によって、レコメンドの対象であるユーザに係るユーザ情報が取得される(S01)。続いて、コンテンツ決定部12によって、レコメンドする候補の店舗毎に行動難易度が算出される(S02)。この算出は、ユーザ情報及び店舗の情報に基づいて行われる。続いて、コンテンツ決定部12によって、行動難易度に基づいて、ユーザにレコメンドする店舗、即ち、レコメンド内容が決定される(S03)。この際、上述したように「送客」、「ピークシフト」等のレコメンドの種別が決定されてもよい。
 続いて、表現決定部13によって、心理バイアス推定モデルが用いられて、ユーザの心理バイアスが推定される(S04)。この推定は、ユーザ情報に基づいて行われる。続いて、表現決定部13によって、推定された心理バイアスに基づいてレコメンドの表現であるナッジ文言が決定される(S05)。なお、レコメンドする店舗の決定(S03)及びナッジ文言の決定(S05)は、並行して行われてもよい。続いて、決定された店舗及びナッジ文言からレコメンドの情報が生成されてユーザへのレコメンドが行われる(S06)。ユーザへのレコメンドは、例えば、レコメンドの情報が端末20に送信されることで行われる。
 以降の処理は、心理バイアス推定モデルの学習に係る処理である。この処理は、レコメンドに対するユーザの行動に応じたものとなるため、通常、レコメンドから所定の時間をあけて行われる。本処理では、難易度情報取得部14によって、コンテンツ決定部12によって決定されたコンテンツに対してユーザが行動する難易度を示す難易度情報が取得される(S07)。また、行動情報取得部15によって、ユーザへのレコメンドに対するユーザの行動を示す行動情報が取得される(S08)。続いて、学習部16によって、難易度情報及び行動情報に基づいて、レコメンドの対象であるユーザが行動する難易度が考慮された心理バイアス推定モデルの学習が行われる(S09)。学習後の心理バイアス推定モデルは、それ以降のユーザへのレコメンドに用いられる。以上が、本実施形態に係るレコメンドシステム10で実行される処理である。
 本実施形態では、レコメンドの表現の決定方法を示す心理バイアス推定モデルを学習する際に、レコメンドされるコンテンツに対してユーザが行動する難易度が考慮される。このため、例えば、レコメンドに対するユーザの行動から、ユーザの趣味趣向の影響を除外して、心理バイアス推定モデルを学習することができる。これにより、本実施形態によれば、レコメンドの表現の決定方法の学習をより適切に行うことができる。
 また、本実施形態にように、心理バイアス推定モデルの学習は、行動情報に応じた評価値(例えば、上述した行動変容評価値)を、難易度情報に基づいて重み付けし、重み付けされた評価値を用いて行ってもよい。この構成によれば、レコメンドの表現の決定方法の学習をより適切かつ確実に行うことができる。例えば、レコメンドに対するユーザの行動から、ユーザの趣味趣向の影響を確実に除外して、心理バイアス推定モデルを学習することができる。但し、心理バイアス推定モデルの学習は、必ずしも上記のように行われる必要はなく、難易度情報及び行動情報に基づいて、レコメンドの対象であるユーザが行動する難易度を考慮して行われるものであればよい。また、心理バイアス推定モデルの学習は、上述したようなバンディットアルゴリズムによって行われてもよいし、それ以外の方法で行われてもよい。
 また、本実施形態のように、レコメンドする際の表現は、レコメンドの対象であるユーザの心理バイアスに応じた表現としてもよい。この構成によれば、ユーザの心理バイアスに応じた適切な表現でリマインダを行うことができ、レコメンドの効果を高めることができる。但し、レコメンドする際の表現は、必ずしも心理バイアスに応じたものとする必要はない。
 また、本実施形態にように、難易度情報によって示される難易度は、ユーザのコンテンツの過去の利用状況、ユーザの興味、レコメンド時のユーザの状況、及びレコメンド時のコンテンツの状況に少なくとも何れかを反映したものとしてもよい。この構成によれば、難易度情報を適切かつ確実なものとすることができる。その結果、レコメンドの表現の決定方法の学習をより適切かつ確実に行うことができる。但し、難易度情報によって示される難易度は、必ずしも上記のものである必要はなく、コンテンツに対してユーザが行動する難易度であればよい。
 なお、本実施形態では、レコメンドの表現の決定方法は、心理バイアス推定モデルを用いて行うものとしたが、必ずしも心理バイアス推定モデルを用いるものでなくてもよい。レコメンドの表現の決定方法は、上述した枠組みで学習可能なものであれば任意のものを用いることができる。また、心理バイアス推定モデルを用いる場合も、必ずしも上述したものである必要はなく、上述した枠組みで学習可能なものであれば任意の心理バイアス推定モデルを用いることができる。
 なお、上記実施形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック(構成部)は、ハードウェア及びソフトウェアの少なくとも一方の任意の組み合わせによって実現される。また、各機能ブロックの実現方法は特に限定されない。すなわち、各機能ブロックは、物理的又は論理的に結合した1つの装置を用いて実現されてもよいし、物理的又は論理的に分離した2つ以上の装置を直接的又は間接的に(例えば、有線、無線などを用いて)接続し、これら複数の装置を用いて実現されてもよい。機能ブロックは、上記1つの装置又は上記複数の装置にソフトウェアを組み合わせて実現されてもよい。
 機能には、判断、決定、判定、計算、算出、処理、導出、調査、探索、確認、受信、送信、出力、アクセス、解決、選択、選定、確立、比較、想定、期待、見做し、報知(broadcasting)、通知(notifying)、通信(communicating)、転送(forwarding)、構成(configuring)、再構成(reconfiguring)、割り当て(allocating、mapping)、割り振り(assigning)などがあるが、これらに限られない。たとえば、送信を機能させる機能ブロック(構成部)は、送信部(transmitting unit)又は送信機(transmitter)と呼称される。いずれも、上述したとおり、実現方法は特に限定されない。
 例えば、本開示の一実施の形態におけるレコメンドシステム10は、本開示の情報処理を行うコンピュータとして機能してもよい。図13は、本開示の一実施の形態に係るレコメンドシステム10のハードウェア構成の一例を示す図である。上述のレコメンドシステム10は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006、バス1007などを含むコンピュータ装置として構成されてもよい。端末20のハードウェア構成も、ここで説明するものであってもよい。
 なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。レコメンドシステム10のハードウェア構成は、図に示した各装置を1つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。
 レコメンドシステム10における各機能は、プロセッサ1001、メモリ1002などのハードウェア上に所定のソフトウェア(プログラム)を読み込ませることによって、プロセッサ1001が演算を行い、通信装置1004による通信を制御したり、メモリ1002及びストレージ1003におけるデータの読み出し及び書き込みの少なくとも一方を制御したりすることによって実現される。
 プロセッサ1001は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ1001は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置(CPU:Central Processing Unit)によって構成されてもよい。例えば、上述のレコメンドシステム10における各機能は、プロセッサ1001によって実現されてもよい。
 また、プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュール、データなどを、ストレージ1003及び通信装置1004の少なくとも一方からメモリ1002に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態において説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、レコメンドシステム10における各機能は、メモリ1002に格納され、プロセッサ1001において動作する制御プログラムによって実現されてもよい。上述の各種処理は、1つのプロセッサ1001によって実行される旨を説明してきたが、2以上のプロセッサ1001により同時又は逐次に実行されてもよい。プロセッサ1001は、1以上のチップによって実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。
 メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)などの少なくとも1つによって構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)などと呼ばれてもよい。メモリ1002は、本開示の一実施の形態に係る情報処理を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュールなどを保存することができる。
 ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、CD-ROM(Compact Disc ROM)などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu-ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップなどの少なくとも1つによって構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。レコメンドシステム10が備える記憶媒体は、例えば、メモリ1002及びストレージ1003の少なくとも一方を含むデータベース、サーバその他の適切な媒体であってもよい。
 通信装置1004は、有線ネットワーク及び無線ネットワークの少なくとも一方を介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。
 入力装置1005は、外部からの入力を受け付ける入力デバイス(例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど)である。出力装置1006は、外部への出力を実施する出力デバイス(例えば、ディスプレイ、スピーカー、LEDランプなど)である。なお、入力装置1005及び出力装置1006は、一体となった構成(例えば、タッチパネル)であってもよい。
 また、プロセッサ1001、メモリ1002などの各装置は、情報を通信するためのバス1007によって接続される。バス1007は、単一のバスを用いて構成されてもよいし、装置間ごとに異なるバスを用いて構成されてもよい。
 また、レコメンドシステム10は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ1001は、これらのハードウェアの少なくとも1つを用いて実装されてもよい。
 本開示において説明した各態様/実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本開示において説明した方法については、例示的な順序を用いて様々なステップの要素を提示しており、提示した特定の順序に限定されない。
 入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルを用いて管理してもよい。入出力される情報等は、上書き、更新、又は追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。
 判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:true又はfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。
 本開示において説明した各態様/実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)ことによって行われてもよい。
 以上、本開示について詳細に説明したが、当業者にとっては、本開示が本開示中に説明した実施形態に限定されるものではないということは明らかである。本開示は、請求の範囲の記載により定まる本開示の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本開示の記載は、例示説明を目的とするものであり、本開示に対して何ら制限的な意味を有するものではない。
 ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。
 また、ソフトウェア、命令、情報などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、有線技術(同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線(DSL:Digital Subscriber Line)など)及び無線技術(赤外線、マイクロ波など)の少なくとも一方を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び無線技術の少なくとも一方は、伝送媒体の定義内に含まれる。
 本開示において使用する「システム」及び「ネットワーク」という用語は、互換的に使用される。
 また、本開示において説明した情報、パラメータなどは、絶対値を用いて表されてもよいし、所定の値からの相対値を用いて表されてもよいし、対応する別の情報を用いて表されてもよい。
 本開示で使用する「判断(determining)」、「決定(determining)」という用語は、多種多様な動作を包含する場合がある。「判断」、「決定」は、例えば、判定(judging)、計算(calculating)、算出(computing)、処理(processing)、導出(deriving)、調査(investigating)、探索(looking up、search、inquiry)(例えば、テーブル、データベース又は別のデータ構造での探索)、確認(ascertaining)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、受信(receiving)(例えば、情報を受信すること)、送信(transmitting)(例えば、情報を送信すること)、入力(input)、出力(output)、アクセス(accessing)(例えば、メモリ中のデータにアクセスすること)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、解決(resolving)、選択(selecting)、選定(choosing)、確立(establishing)、比較(comparing)などした事を「判断」「決定」したとみなす事を含み得る。つまり、「判断」「決定」は、何らかの動作を「判断」「決定」したとみなす事を含み得る。また、「判断(決定)」は、「想定する(assuming)」、「期待する(expecting)」、「みなす(considering)」などで読み替えられてもよい。
 「接続された(connected)」、「結合された(coupled)」という用語、又はこれらのあらゆる変形は、2又はそれ以上の要素間の直接的又は間接的なあらゆる接続又は結合を意味し、互いに「接続」又は「結合」された2つの要素間に1又はそれ以上の中間要素が存在することを含むことができる。要素間の結合又は接続は、物理的なものであっても、論理的なものであっても、或いはこれらの組み合わせであってもよい。例えば、「接続」は「アクセス」で読み替えられてもよい。本開示で使用する場合、2つの要素は、1又はそれ以上の電線、ケーブル及びプリント電気接続の少なくとも一つを用いて、並びにいくつかの非限定的かつ非包括的な例として、無線周波数領域、マイクロ波領域及び光(可視及び不可視の両方)領域の波長を有する電磁エネルギーなどを用いて、互いに「接続」又は「結合」されると考えることができる。
 本開示において使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。
 本開示において使用する「第1の」、「第2の」などの呼称を使用した要素へのいかなる参照も、それらの要素の量又は順序を全般的に限定しない。これらの呼称は、2つ以上の要素間を区別する便利な方法として本開示において使用され得る。したがって、第1及び第2の要素への参照は、2つの要素のみが採用され得ること、又は何らかの形で第1の要素が第2の要素に先行しなければならないことを意味しない。
 本開示において、「含む(include)」、「含んでいる(including)」及びそれらの変形が使用されている場合、これらの用語は、用語「備える(comprising)」と同様に、包括的であることが意図される。さらに、本開示において使用されている用語「又は(or)」は、排他的論理和ではないことが意図される。
 本開示において、例えば、英語でのa, an及びtheのように、翻訳により冠詞が追加された場合、本開示は、これらの冠詞の後に続く名詞が複数形であることを含んでもよい。
 本開示において、「AとBが異なる」という用語は、「AとBが互いに異なる」ことを意味してもよい。なお、当該用語は、「AとBがそれぞれCと異なる」ことを意味してもよい。「離れる」、「結合される」などの用語も、「異なる」と同様に解釈されてもよい。
 10…レコメンドシステム、11…ユーザ情報取得部、12…コンテンツ決定部、13…表現決定部、14…難易度情報取得部、15…行動情報取得部、16…学習部、20…端末、1001…プロセッサ、1002…メモリ、1003…ストレージ、1004…通信装置、1005…入力装置、1006…出力装置、1007…バス。

Claims (4)

  1.  レコメンドの対象であるユーザに係るユーザ情報を取得するユーザ情報取得部と、
     前記ユーザ情報取得部によって取得されたユーザ情報の少なくとも一部に基づいて、ユーザにレコメンドするコンテンツを決定するコンテンツ決定部と、
     前記ユーザ情報取得部によって取得されたユーザ情報の少なくとも一部に基づいて、前記コンテンツ決定部によって決定されたコンテンツをユーザにレコメンドする際の表現を決定する表現決定部と、
     前記コンテンツ決定部によって決定されたコンテンツに対してユーザが行動する難易度を示す難易度情報を取得する難易度情報取得部と、
     前記コンテンツ決定部及び前記表現決定部による決定に応じて行われたユーザへのレコメンドに対するユーザの行動を示す行動情報を取得する行動情報取得部と、
     前記難易度情報取得部によって取得された難易度情報及び前記行動情報取得部によって取得された行動情報に基づいて、レコメンドの対象であるユーザが行動する難易度を考慮して前記表現決定部による決定方法を学習する学習部と、
    を備えるレコメンドシステム。
  2.  前記学習部は、前記行動情報に応じた評価値を、前記難易度情報に基づいて重み付けし、重み付けされた評価値を用いて、前記表現決定部による決定方法を学習する請求項1に記載のレコメンドシステム。
  3.  前記表現決定部は、レコメンドする際の表現として、レコメンドの対象であるユーザの心理的なバイアスに応じた表現を決定する請求項1又は2に記載のレコメンドシステム。
  4.  前記難易度情報取得部は、ユーザのコンテンツの過去の利用状況、ユーザの興味、レコメンド時のユーザの状況、及びレコメンド時のコンテンツの状況に少なくとも何れかを反映した前記難易度を示す難易度情報を取得する請求項1~3の何れか一項に記載のレコメンドシステム。
PCT/JP2023/003473 2022-03-30 2023-02-02 レコメンドシステム WO2023188808A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2022-055641 2022-03-30
JP2022055641 2022-03-30

Publications (1)

Publication Number Publication Date
WO2023188808A1 true WO2023188808A1 (ja) 2023-10-05

Family

ID=88200866

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2023/003473 WO2023188808A1 (ja) 2022-03-30 2023-02-02 レコメンドシステム

Country Status (1)

Country Link
WO (1) WO2023188808A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019073668A1 (ja) * 2017-10-11 2019-04-18 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
JP2021149929A (ja) * 2020-03-17 2021-09-27 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド コンテンツ推奨方法、装置、電子機器、プログラム及び記憶媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019073668A1 (ja) * 2017-10-11 2019-04-18 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
JP2021149929A (ja) * 2020-03-17 2021-09-27 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド コンテンツ推奨方法、装置、電子機器、プログラム及び記憶媒体

Similar Documents

Publication Publication Date Title
US10650005B2 (en) Predicting user needs for a particular context
US20120239590A1 (en) Managing customer communications among a plurality of channels
WO2020238951A1 (zh) 网络内容处理方法、装置、设备及计算机存储介质
US20180293643A1 (en) Location aware shopping list
WO2023188808A1 (ja) レコメンドシステム
US20220301004A1 (en) Click rate prediction model construction device
WO2021039916A1 (ja) 価格予測装置
WO2022009876A1 (ja) レコメンドシステム
JP2022026687A (ja) 情報提供装置
JP7489255B2 (ja) 情報提供装置
WO2019202791A1 (ja) 趣味嗜好推定装置および趣味嗜好推定方法
WO2020230736A1 (ja) 需要分散装置
US10176457B2 (en) System and method automatically learning and optimizing sequence order
JP6944594B2 (ja) 対話装置
JP7495842B2 (ja) レコメンド装置
JP2022027092A (ja) 行動特性決定装置
WO2023214484A1 (ja) 興味推定装置
WO2024105982A1 (ja) 店舗導出装置
WO2024048036A1 (ja) 店舗判定装置
WO2024105981A1 (ja) レコメンド評価装置
JP7370292B2 (ja) 提案装置
WO2024053187A1 (ja) メッセージ送信装置
JP7449933B2 (ja) 推論装置
JP7337017B2 (ja) 還元値設定システム及び還元値設定方法
WO2023195264A1 (ja) ユーザ状態判断装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23778844

Country of ref document: EP

Kind code of ref document: A1