WO2019159288A1 - 情報処理システム、情報処理方法、及びプログラム - Google Patents

情報処理システム、情報処理方法、及びプログラム Download PDF

Info

Publication number
WO2019159288A1
WO2019159288A1 PCT/JP2018/005315 JP2018005315W WO2019159288A1 WO 2019159288 A1 WO2019159288 A1 WO 2019159288A1 JP 2018005315 W JP2018005315 W JP 2018005315W WO 2019159288 A1 WO2019159288 A1 WO 2019159288A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
data item
user
product
cluster
Prior art date
Application number
PCT/JP2018/005315
Other languages
English (en)
French (fr)
Inventor
ドンフン シン
Original Assignee
楽天株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 楽天株式会社 filed Critical 楽天株式会社
Priority to JP2019519354A priority Critical patent/JP6805340B2/ja
Priority to PCT/JP2018/005315 priority patent/WO2019159288A1/ja
Publication of WO2019159288A1 publication Critical patent/WO2019159288A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification

Definitions

  • the present invention relates to an information processing system, an information processing method, and a program.
  • each user is assigned to a cluster that is a group of users having similar preferences based on the content history of each of a plurality of users, the content history characteristics of the representative user of each cluster, and the new user's
  • a system is described in which a new user is assigned to any cluster based on content history characteristics to provide content that meets the taste of the new user.
  • Patent Document 1 the content history characteristics of Patent Document 1 are calculated from action histories in various fields with different characteristics, and do not indicate detailed preferences for each field. For example, when content history characteristics are calculated, a preference in one field and a preference in another field are offset, and information indicating a preference unique to the field is not obtained. For this reason, even if the technique of patent document 1 allocates a new user to a cluster using a content history characteristic, the precision of the information shown to a user cannot fully be raised.
  • the present invention has been made in view of the above problems, and an object thereof is to provide an information processing system, an information processing method, and a program capable of improving the accuracy of information presented to a user.
  • an information processing system includes a first acquisition unit that acquires data item feature information related to each feature of a plurality of data items, and an action history related to a user's action history for each data item.
  • a second acquisition unit that acquires information, a clustering unit that clusters each data item based on the data item feature information of each data item indicated by the action history information, and a processing result of the clustering unit, Presenting means for presenting data item information relating to at least one of the plurality of data items to the user.
  • An information processing method includes a first acquisition step of acquiring data item feature information relating to each feature of a plurality of data items, and a second acquisition step of acquiring action history information relating to a user's action history for each data item. And a clustering step for clustering each data item based on the data item feature information of each data item indicated by the action history information, and based on a processing result of the clustering step, among the plurality of data items A presentation step of presenting at least one data item information to the user.
  • the program according to the present invention includes: a first acquisition unit that acquires data item feature information related to each feature of a plurality of data items; a second acquisition unit that acquires behavior history information related to a user's behavior history for each data item; Clustering means for clustering each data item based on the data item feature information of each data item indicated by history information, and data relating to at least one of the plurality of data items based on a processing result of the clustering means
  • a computer is caused to function as a presentation means for presenting item information to the user.
  • the information storage medium according to the present invention is a computer-readable information storage medium storing the above program.
  • the clustering means acquires user feature information for each cluster based on the data item feature information of each data item belonging to the cluster, and the presenting means The data item information is presented based on the user feature information and the data item feature information of each data item.
  • the user feature information of each cluster and the data item feature information of each data item are each represented by a vector
  • the presenting means includes the user feature information of each cluster.
  • the data item information is presented based on a comparison result between the vector indicated by and the vector indicated by the data item feature information of each data item.
  • the clustering means obtains an average value of vectors indicated by the data item feature information of each data item belonging to each cluster as the user feature information of the cluster. To do.
  • the presenting means uses the data item feature information of a data item in each cluster among the plurality of data items as a comparison target with the user feature information of the cluster. It is characterized by that.
  • the first acquisition unit acquires the data item feature information of each data item based on the action history information of each of a plurality of users.
  • the data item feature information of each data item includes preset classification information of the data item.
  • the clustering means changes the cluster size based on the action history information.
  • the behavior history information includes behavior type information regarding a type of the user's behavior with respect to each data item
  • the presentation unit further includes the data item information based on the behavior type information. It is characterized by presenting.
  • the behavior history information includes behavior time information regarding the behavior time of the user for each data item
  • the presenting means further includes the data item information based on the behavior time information. It is characterized by presenting.
  • the data item information is coupon information or recommendation information related to at least one of the plurality of data items.
  • each data item is a data item related to a product
  • the first acquisition unit acquires the data item feature information regarding each feature of a plurality of products
  • the second acquisition unit Acquires the behavior history information related to the user's behavior history for each product
  • the clustering means performs clustering of each product based on the data item feature information of each product indicated by the behavior history information
  • the presenting means presents the data item information related to at least one of the plurality of products to the user.
  • the accuracy of information presented to the user can be improved.
  • FIG. 1 is a diagram illustrating an overall configuration of an information processing system. It is a functional block diagram which shows an example of the function implement
  • FIG. 1 is a diagram illustrating an overall configuration of an information processing system.
  • the information processing system 1 includes a server 10 and a user terminal 20, which are connected via a network so that data can be transmitted and received.
  • the information processing system 1 may include a computer other than the server 10 and the user terminal 20.
  • the server 10 is a server computer and includes, for example, a control unit 11, a storage unit 12, and a communication unit 13.
  • the control unit 11 includes at least one processor.
  • the control unit 11 executes processing according to programs and data stored in the storage unit 12.
  • the storage unit 12 includes a main storage unit and an auxiliary storage unit.
  • the main storage unit is a volatile memory such as a RAM
  • the auxiliary storage unit is a non-volatile memory such as a hard disk or a flash memory.
  • the communication unit 13 includes a communication interface for wired communication or wireless communication, and performs data communication via a network, for example.
  • the user terminal 20 is a computer operated by the user, and is, for example, a personal computer, a portable information terminal (including a tablet computer), a mobile phone (including a smartphone), or the like.
  • the user terminal 20 includes a control unit 21, a storage unit 22, a communication unit 23, an operation unit 24, and a display unit 25.
  • the hardware configurations of the control unit 21, the storage unit 22, and the communication unit 23 may be the same as those of the control unit 11, the storage unit 12, and the communication unit 13, respectively.
  • the operation unit 24 is an input device for a user to perform an operation, and is, for example, a pointing device such as a touch panel or a mouse, a keyboard, or the like.
  • the operation unit 24 transmits the user's operation content to the control unit 21.
  • the display unit 25 is, for example, a liquid crystal display unit or an organic EL display unit.
  • the programs and data described as being stored in the storage units 12 and 22 may be supplied to these via a network.
  • the hardware configurations of the server 10 and the user terminal 20 are not limited to the above example, and various hardware can be applied.
  • the server 10 and the user terminal 20 each have a reading unit (for example, an optical disk drive or a memory card slot) that reads a computer-readable information storage medium or an input / output unit (eg, a USB) for directly connecting to an external device. Terminal).
  • the program and data stored in the information storage medium may be supplied to the server 10 or the user terminal 20 via the reading unit or the input / output unit.
  • the data item is data for providing predetermined information to the user.
  • the content of the data item may be arbitrary, and may be content related to a product, a service, or content, for example.
  • the product only needs to be an object to be traded.
  • the product may be a tangible object such as food, clothing, furniture, home appliance, or electronic device, or an intangible object such as content described later.
  • the data item is data for causing the user terminal 20 to display a product page.
  • the data item may be HTML of the product page, or may be an image or text to be inserted into the frame of the product page.
  • the frame is data defining a screen layout when a screen is displayed in an application.
  • the service may be any service, such as travel reservation, insurance application, restaurant reservation, lottery purchase, or financial service.
  • the data item is data for causing the user terminal 20 to display a service use application page.
  • the data item may be HTML of the use application page, or may be an image or text to be inserted into the frame of the use application page.
  • the content may be any content, for example, a website, a coupon, an advertisement, an electronic book, a moving image, an image, a song, or an application.
  • a product page and a service use application page can also be regarded as examples of content.
  • the data item may be the content data itself, or data for causing the user terminal 20 to display a content download page.
  • the data item may be HTML of the download page, or may be an image or text to be inserted into the frame of the download page.
  • each data item is a data item related to a product
  • data item is simply described as “product” for the sake of simplicity. For this reason, the location described as “product” in this embodiment can be read as “data item”.
  • the user operates the user terminal 20 to access the server 10 and browses or purchases products handled by virtual stores on the Internet.
  • the user's browsing history and purchase history are recorded as an action history.
  • the information processing system 1 analyzes a user's behavior history for each product, and executes product clustering for each user.
  • Clustering is a process for grouping (classifying) observation data.
  • each product corresponds to observation data.
  • a cluster is an individual group and a unit of classification.
  • a cluster is conceptually similar to a category in terms of product classification. However, while the category is information common to all users, the cluster is different for each user and reflects user-specific preferences.
  • the information processing system 1 calculates, for each cluster, user feature information related to user preference based on product feature information of products belonging to the cluster. Then, the information processing system 1 analyzes the user-specific preference for each cluster by presenting the coupon information of the product based on the user characteristic information of each cluster, and increases the accuracy of the coupon information presented to the user. I have to. Hereinafter, details of the configuration will be described.
  • FIG. 2 is a functional block diagram illustrating an example of functions realized by the information processing system 1.
  • the data storage unit 100, the first acquisition unit 101, the second acquisition unit 102, the clustering unit 103, and the presentation unit 104 are realized by the server 10.
  • the data storage unit 100 is realized mainly by the storage unit 12, and each of the first acquisition unit 101, the second acquisition unit 102, the clustering unit 103, and the presentation unit 104 is realized mainly by the control unit 11.
  • the data storage unit 100 stores data necessary for executing the processing according to the present embodiment.
  • data stored in the data storage unit 100 a product database DB1, a user database DB2, and a coupon database DB3 will be described.
  • FIG. 3 is a diagram showing an example of the product database DB1.
  • the product database DB1 is a database in which various information related to products is stored.
  • the store database DB1 stores a store ID, a product ID, basic product information, and product feature information.
  • the store ID is information that uniquely identifies a store on the Internet.
  • the product ID is information for uniquely identifying a product handled by the store.
  • the basic information of the product is basic information regarding the content of the product, and includes, for example, a product name (product title), a category (genre), an attribute, a unit price, an inventory quantity, a keyword, and a product description.
  • the attribute is the property of the product, for example, information such as the color, size, material, state, production area, or manufacturer of the product.
  • the keyword is a word for searching for a product, and may be, for example, a word extracted from a product name or product description, or may be a word input by a person in charge of the store as a keyword.
  • the product description is a detailed description of the product, and is indicated by, for example, at least one of text, a table, and an image.
  • the basic information on products is input by the person in charge at the store.
  • the basic information of the product may include other information, and may include various information such as a URL of the product page, HTML data of the product page, a frame, or image data.
  • the product page may be a screen for purchasing a product.
  • the product page includes basic information about the product such as a product name, product image, product description, and unit price, and a button for putting the product into the shopping cart. Including.
  • the product page may be displayed in the web browser of the user terminal 20 or may be displayed in an application installed in the user terminal 20.
  • the product feature information is information related to the features of the product, and includes, for example, feature amounts of a plurality of items.
  • the item may be any item for evaluating the characteristics of the product.
  • the item may be an item related to the basic information of the product, or an item related to the basic information of the user who browsed or purchased the product.
  • the feature amount is information obtained by quantifying the feature of the product of each item.
  • the feature amount may be indicated by a character instead of a numerical value, or may be indicated by a combination of a numerical value and a character.
  • a word included in a product name / keyword / product description may be an item, and a category, attribute, or price range may be an item.
  • the feature amount of the item may be a feature vector of the word.
  • a neural network such as Word2vec may be used.
  • the product feature information may include the age, sex, or region of the user who browses or purchases the product.
  • the product feature information is represented by an n-dimensional vector (n is a natural number)
  • the product feature information includes feature values of n items, and the feature values of each item are indicated as values of elements of a vector.
  • the product feature information may be in a format other than a vector, and can be expressed in an arbitrary format.
  • the product feature information may be information in an arbitrary format such as an array format, an image format, a text format, or a table format.
  • the product feature information of each product includes classification information of the product set in advance.
  • the kth element (k is an integer between 1 and n) is a value indicating the product classification information.
  • the classification information is at least one preset from a plurality of classification information, and is information such as a category (genre), an attribute, or a price range, for example.
  • the price range is a price range to which the unit price belongs from a plurality of price ranges.
  • the classification information As an example of the classification information, a category (that is, a category input by a store person in charge) stored in the basic product information will be described. For this reason, the part described as a category in this embodiment can be read as classification information.
  • the kth element is a feature amount indicating a category. Which numerical value indicates which category may be determined in the data storage unit 100 in advance.
  • the case where both the information input by the person in charge of the store and the information generated by the server 10 are included in the product feature information will be described. Only the information input by the person may be included, or only the information generated by the server 10 may be included.
  • the items included in the product feature information are not limited to the above example, and any item can be applied. For example, it may be an item related to the date and time when the product is viewed or purchased, or may be an item related to the search formula used when the product is viewed or purchased.
  • the search expression is a search condition, and is, for example, at least one of a keyword, a category, an attribute, a price range, and stock availability.
  • FIG. 4 is a diagram illustrating an example of the user database DB2.
  • the user database DB2 is a database in which various information related to users is stored.
  • the user database DB2 stores a user ID, basic user information, action history information, and cluster information.
  • the user ID is information that uniquely identifies the user.
  • User basic information is user registration information, and stores information such as user name, age, gender, and region, for example.
  • the basic information of the user may include other information, for example, information such as the user's favorite category may be included.
  • the action history information is information related to a user's action history for each product. For example, information such as identification information (here, a combination of a store ID and a product ID), action type information, and action time information of an action target product. Stored in time series.
  • the action target is a target of action by the user, for example, a target of browsing, purchasing, or downloading.
  • the action type information is information regarding the type of action, for example, information indicating the type of action taken by the user among a plurality of types such as browsing / purchasing / downloading.
  • the action time information is information indicating the date and time when the user acted, for example, information such as a browsing date, a purchase date, or a download date.
  • the server 10 updates the action history information based on the content of communication with the user terminal 20. For example, when receiving a request for viewing a product page from the user, the server 10 transmits display data of the product page to the user terminal 20. Then, the server 10 stores the store ID and the product ID of the product indicated by the product page in the action history information of the record in which the user ID of the user is stored, sets “browsing” in the action type information, Set the current date and time in the time information.
  • the server 10 when the server 10 receives a purchase request for a product from the user, the server 10 executes a purchase process for the product.
  • a purchase process for the product Various known processes can be applied to the purchase process itself. For example, a payment process using a credit card is executed. Then, the server 10 stores the store ID and the product ID of the product indicated by the product page in the behavior history information of the record in which the user ID of the user is stored, sets “purchase” in the behavior type information, Set the current date and time in the time information.
  • the cluster information is information related to the cluster specified by the clustering unit 103, and includes, for example, a cluster number, user feature information, weight coefficient, action type information, and action time information.
  • the cluster number is information for uniquely identifying a cluster. Since a cluster is acquired for each user, the cluster number can be said to be information for uniquely identifying a cluster among a plurality of clusters acquired for a certain user.
  • User feature information is information that comprehensively shows the features of products in the cluster.
  • the user feature information is generated for each cluster, and is a value obtained by, for example, substituting the product feature information of the action target product belonging to the cluster into a predetermined mathematical expression.
  • This mathematical formula may be an arbitrary mathematical formula, for example, a formula for obtaining a simple average or a weighted average.
  • the product feature information is indicated by a vector, a case where the user feature information is also indicated by a vector will be described as an example.
  • the weight coefficient is the importance (probability) of the cluster. For example, the higher the weight coefficient, the more important the cluster, and the lower the weight coefficient, the less important the cluster.
  • the action type information is information regarding the type of action for the product belonging to the cluster.
  • the action type information takes a value of “purchased” or “viewing only”. If at least one action target product belonging to a cluster has been purchased, the action type information of the cluster is “purchased”; otherwise, the action type information of the cluster is “viewing only”.
  • the type of action is not limited to purchase and browsing, and may be, for example, an action of putting a product into a shopping basket.
  • the action time information is information related to the action time for the product belonging to the cluster.
  • the action time information stores an action time for a “purchased” product.
  • the action history information may include a search formula used when a product is viewed or purchased.
  • the user database DB2 may include information such as coupon information acquired by the user.
  • FIG. 5 is a diagram illustrating an example of the coupon database DB3.
  • the coupon database DB3 is a database in which various information related to coupons is stored.
  • the coupon database DB3 stores the coupon ID, the identification information of the store or the product that is the target of the coupon (here, the combination of the store ID and the product ID), the coupon content, and the product feature information.
  • the coupon ID is information for uniquely identifying a coupon.
  • the coupon content is an effect at the time of using the coupon, and for example, information such as a discount amount, a discount percentage (ratio), and an extra product is stored.
  • the product feature information is product feature information of a product to be coupond.
  • the coupon target is a store, it may be product feature information of a specific product handled by the store, or may be calculated from product feature information of each of a plurality of products of the store.
  • the coupon database DB3 may store information such as the coupon validity period.
  • the coupon database DB3 is updated by a person in charge at each store.
  • the person in charge of the store that issues the coupon transmits to the server 10 a store ID of the store, the product ID of the product that is the target of the coupon, and a registration request for the content of the coupon.
  • the server 10 issues a coupon ID and stores it in the coupon database DB3 in association with the store ID, the product ID, and the content of the coupon.
  • the server 10 refers to the product database DB1, acquires the product ID information associated with the store ID and the product ID, and stores the product feature information in the coupon database DB3 in association with the issued coupon ID.
  • the data stored in the data storage unit 100 is not limited to the above example.
  • the data storage unit 100 may store data necessary for the processing according to the embodiment.
  • the data storage unit 100 may store a relationship (details will be described later) between the action history information and the product feature information.
  • the first acquisition unit 101 acquires product feature information regarding each feature of a plurality of products.
  • the product feature information since the product feature information is stored in the product database DB1, the first acquisition unit 101 acquires the product feature information of each product stored in the data storage unit 100.
  • the first acquisition unit 101 may acquire the product feature information of each product from the computer.
  • the first acquisition unit 101 may acquire product feature information of each product based on the action history information of each of a plurality of users.
  • the first acquisition unit 101 may acquire the product feature information of each product based on the behavior history information of all users of the information processing system 1, or the behavior of some users of the information processing system 1 Based on the history information, product feature information of each product may be acquired.
  • the first acquisition unit may acquire the feature amounts of all items of the product feature information based on the behavior history information of each user, or acquire the feature amounts of some items of the product feature information. May be.
  • the first acquisition unit 101 acquires product feature information of each product associated with each user's action history information. In other words, the first acquisition unit 101 uses the action history information of each user as an input of the relationship, and acquires the product feature information of each product as an output of the relationship.
  • the first acquisition unit 101 acquires the product feature information of each product so that the product feature information of products viewed or purchased from a search result obtained by a certain search expression is similar.
  • the 1st acquisition part 101 may refer to the keyword used when goods were browsed or purchased, and may acquire the goods feature information on the goods based on the word contained in the keywords. In this case, the 1st acquisition part 101 is good also considering the feature vector of the word contained in a keyword as the feature-value of the one part item of goods feature information.
  • the first acquisition unit 101 may acquire the product feature information of each product based on the basic information of each user. For example, when the item of product characteristic information includes at least one of the age, sex, and region of the user who browses or purchases the product, the first acquisition unit 101 refers to the user database DB2 and You may acquire the feature-value of the said item of goods feature information based on the age, sex, and area of the user who made the goods the action object.
  • the product feature information of each product is not acquired based on the action history information, but the information input by the person in charge of the store may be used as the product feature information as it is, or is input by the person in charge of the store Information generated based on the information may be used as product feature information.
  • the 2nd acquisition part 102 acquires action history information about a user's action history to each product.
  • the second acquisition unit 102 acquires action history information stored in the data storage unit 100.
  • the second acquisition unit 102 acquires the action history information of each user stored in the user database DB2.
  • action history information is memorize
  • the 2nd acquisition part 102 should just acquire the action history information of each user from the said computer.
  • the clustering unit 103 clusters each product based on the product feature information of each product indicated by the action history information.
  • clustering is a process for grouping products having similar product feature information. Clustering is sometimes referred to as data clustering, unsupervised learning, or data mining.
  • the clustering unit 103 performs clustering for each user based on the action history information of the user. In other words, the clustering unit 103 performs clustering for the user based on the action history information of each user. For example, the clustering unit 103 identifies a product to be acted on by the user based on each user's behavior history information, and executes clustering for the user based on the product feature information of each identified product. For this reason, when performing clustering of a certain user, the clustering unit 103 refers to the behavior history information of the user but does not refer to the behavior history information of other users.
  • an algorithm using a hierarchical method such as the shortest distance method, the longest distance method, the group average method, or the Ward method may be used.
  • An algorithm using a non-hierarchical method such as a K-average method may be used.
  • DBSCAN Density-based spatial clustering of applications with noise
  • FIG. 6 is a diagram showing the processing contents of the clustering unit 103.
  • the clustering unit 103 uses the n-dimensional vector indicated by the product feature information of the action target product in the n-dimensional space SP. Mapping is performed, and clustering of each product is performed based on a hierarchical or non-hierarchical algorithm.
  • the clustering unit 103 maps the vectors V1 to V40 indicated by the product feature information of 40 products to the n-dimensional space SP, and sets three clusters CL1 to CL3.
  • Products corresponding to the vectors V1 to V13 belong to the cluster CL1.
  • Products corresponding to the vectors V14 to V26 belong to the cluster CL2.
  • Products corresponding to the vectors V27 to V39 belong to the cluster CL3.
  • the clustering unit 103 issues a cluster number of each of the clusters CL1 to CL3 based on a predetermined rule, and associates the cluster number with the product based on the product feature information of each product to be acted, thereby Update information.
  • the clustering unit 103 may remove as a noise a product that is far from any of the clusters CL1 to CL3 (a product corresponding to the vector V40 in the example of FIG. 6). In the following description, when it is not particularly necessary to refer to FIG.
  • the clustering unit 103 may acquire user feature information for each cluster based on the product feature information of each product belonging to the cluster. For each cluster, the clustering unit 103 acquires user feature information by substituting product feature information of each product belonging to the cluster into a predetermined mathematical expression. As described above, this mathematical expression may have an arbitrary content, and may be an expression for obtaining a simple average or a weighted average, for example.
  • the clustering unit 103 acquires an average value of vectors indicated by the product feature information of each product belonging to each cluster as user feature information of the cluster. Also good.
  • the average value is a joint vector of vectors indicated by the product feature information of each product belonging to the cluster.
  • the clustering unit 103 acquires a joint vector, which is an average value of the vectors V1 to V13, as user feature information of the cluster CL1, and stores it in the cluster information.
  • the clustering unit 103 acquires a joint vector, which is an average value of the vectors V14 to V26, as user feature information of the cluster CL2, and stores it in the cluster information.
  • the clustering unit 103 acquires a joint vector, which is an average value of the vectors V27 to V39, as user feature information of the cluster CL3, and stores it in the cluster information.
  • the clustering unit 103 calculates the weighting coefficient stored in the cluster information of the user based on the action history information of each user. You may decide.
  • the clustering unit 103 increases the weighting factor and increases the number of products included in the cluster, so the user may be more interested in the products in the cluster. The smaller the number is, the less likely the user is interested in the products in the cluster, so the weighting factor may be reduced.
  • the clustering unit 103 increases the weighting factor and increases the cluster cluster size because the larger the cluster size of the cluster, the larger the number of products included in the cluster and the user may be more interested. The smaller the size, the less the product is included in the cluster and the less likely the user is interested, so the weighting factor may be reduced.
  • the clustering unit 103 is stored in the cluster information of the user based on the action history information of each user. Action type information may be determined.
  • the clustering unit 103 may determine the action type information of the cluster based on the action type information of the products included in the cluster. For example, if the behavior type information of the products included in the cluster is only browsing, the clustering unit 103 only browses the behavior type information of the cluster, and a predetermined number of purchased products (for example, one or two or more) If it is included, the action type information of the cluster may be purchased.
  • the clustering unit 103 refers to the action type information of the products included in the cluster, and if the cluster includes only the products that are viewed, the product has not yet been purchased and there is a possibility that the user is highly interested. If the weight coefficient is increased and the cluster includes purchased products, there is a possibility that the product has already been purchased and the user's interest may be low, so the weight coefficient may be reduced.
  • the clustering unit 103 is a cluster including purchased products, if the products in the same cluster are viewed again after the products in the cluster are purchased, the user is interested again. Therefore, the weighting factor may be increased.
  • the clustering unit 103 is stored in the cluster information of the user based on the action history information of each user. Action time information may be determined.
  • the clustering unit 103 may determine the action time information of the cluster based on the action time information of the products included in the cluster. For example, the clustering unit 103 may use an average value of the behavior time information of the products included in the cluster as the behavior time information of the cluster, and the behavior time information of the purchased products among the products included in the cluster It is good also as action time information.
  • the clustering unit 103 refers to the action time information of the products included in the cluster, and as the elapsed time from the date and time when the user browses is shorter, the user's interest may not be reduced. As the elapsed time from the date and time when the user browses is longer, the user's interest may have faded, so the weighting factor may be reduced.
  • the clustering unit 103 refers to the action time information of the products included in the cluster, and the longer the elapsed time from the date and time when the user purchased, the more likely the user will purchase the product.
  • the weighting coefficient may be decreased because the user may not purchase the product as the elapsed time from the date and time when the user purchased is shorter.
  • the clustering unit 103 may change the cluster size based on the action history information.
  • the cluster size is the size of the cluster (the breadth of the range) and is also called the granularity.
  • the clustering unit 103 may decrease the cluster size as the number of products belonging to the cluster increases, and increase the cluster size as the number of products belonging to the cluster decreases.
  • the clustering unit 103 may refer to the mapping result of the product feature information of each product to be acted, and may decrease the cluster size as the product density is higher and increase the cluster size as the product density is lower. .
  • the presentation unit 104 presents product information regarding at least one of the plurality of products to the user based on the processing result of the clustering unit 103.
  • the presentation unit 104 selects at least one product from a plurality of products based on the processing result of the clustering unit 103, and presents product information regarding the at least one product to the user.
  • the product information only needs to be information related to the product.
  • the product information may be coupon information or recommendation information related to at least one of a plurality of products, the product page itself, or content different from the product page. Or a product image.
  • the coupon information may be information for giving a predetermined privilege to the user.
  • the coupon information may be information for purchasing a product at a discount price, or information for acquiring a bonus other than the product. May be.
  • the recommendation information only needs to be information for proposing a product to the user.
  • the recommendation information may be a link to a product page or an image in which the link is embedded.
  • coupon information will be described as an example of product information. For this reason, the location described as coupon information in this embodiment can be read as product information.
  • Presentation is visual presentation and is a process for displaying product information.
  • An arbitrary method can be applied as a presentation method by the presentation unit 104, and for example, display of an image in a page, transmission of an email, transmission of a message using a message application, or push notification may be used.
  • the presentation unit 104 displays coupon information on an arbitrary page such as a virtual market top page, a store top page, or a product page will be described as an example.
  • the presentation unit 104 presents coupon information based on the user feature information of each cluster and the product feature information of each product.
  • the user feature information of each cluster is information obtained by averaging the features of the products belonging to the cluster
  • the presentation unit 104 can select the user of each cluster from a plurality of products registered in the coupon database DB3. A product having product feature information similar to the feature information is specified, and coupon information of the specified product is presented.
  • the presentation unit 104 since the user feature information of each cluster and the product feature information of each product are indicated by vectors, the presentation unit 104 includes a vector indicated by the user feature information of each cluster, Coupon information is presented based on the comparison result with the vector indicated by the product feature information of the product. For example, the presentation unit 104 presents coupon information based on the distance between the vector indicated by the user feature information of each cluster and the vector indicated by the product feature information of each product.
  • the presenting unit 104 identifies a predetermined number of products in the order of short distance and presents coupon information of the products.
  • This number may be a fixed value regardless of the cluster, but in the present embodiment, it is assumed that it changes depending on the weighting coefficient of each cluster. For example, the larger the weighting coefficient, the larger the number, and the smaller the weighting coefficient, the smaller the number.
  • the relationship between the weighting coefficient and the number may be stored in the data storage unit 100 in advance. This relationship may be defined in mathematical expression format or table format, or may be defined as part of the program code. For example, for each cluster, the presentation unit 104 acquires and presents coupon information in ascending order of the distance by the number determined by the weighting coefficient of the cluster.
  • the cluster information of “user X” has the cluster weight “2” as the cluster coefficient “2” and the cluster weight “2”.
  • the coefficient is “5”
  • the weight coefficient of the cluster having the cluster number “3” is “3”.
  • the presentation unit 104 acquires two coupon information in the order of distance from the user feature information having the cluster number “1”, and the cluster number is “2”. 5 coupon information is acquired in the order of distance from the user feature information of “3”, and three coupon information is acquired in the order of distance from the user feature information of the cluster number “3”.
  • the presentation unit 104 presents the acquired 10 pieces of coupe information by including them in a product page or the like.
  • the product feature information of all the products may be compared with the user feature information of each cluster, but the presentation unit 104 displays the product feature information of the products in each cluster among the plurality of products. It is good also as a comparison object with user characteristic information.
  • the presentation unit 104 identifies a product belonging to the cluster based on the product feature information of each product for each cluster.
  • the presenting unit 104 sets the identified product as a comparison target. In other words, the presentation unit 104 sets a product in the cluster as a comparison target among a plurality of products registered in the coupon database DB3, and excludes a product outside the cluster from the comparison target.
  • the presenting unit 104 may present coupon information further based on the action type information. For example, the presentation unit 104 may not present coupon information for a product whose behavior type information indicates a predetermined type.
  • the predetermined type is an action with a high probability that the user is not interested in the product, for example, purchase.
  • the presentation unit 104 may exclude a cluster including a product whose action type information indicates purchase from the coupon information presentation target. Note that even if the action type information is a cluster that includes a product indicating purchase, the presentation unit 104 may make the cluster again a coupon information presentation target when the user browses after purchase. In addition, when determining the weighting coefficient of each cluster based on the action type information, the presentation unit 104 determines the product to be presented with the coupon information based on the weighting coefficient, thereby determining the product based on the action type information. Coupon information is presented.
  • the presentation unit 104 since the action history information includes action time information related to the action time of the user for each product, the presentation unit 104 presents coupon information based further on the action time information. For example, the presentation unit 104 does not present coupon information if the elapsed time from the behavior time indicated by the behavior time information is less than the threshold, and presents coupon information if the elapsed time is equal to or greater than the threshold. May be. Moreover, when determining the weighting coefficient of each cluster based on action time information, the presentation part 104 determines the goods used as the coupon information presentation object based on the weighting coefficient, and thus based on the action time information. Coupon information is presented.
  • FIG. 7 is a flowchart showing the advance preparation process.
  • the advance preparation process is executed by the control unit 11 operating according to a program stored in the storage unit 12.
  • the advance preparation process may be executed at a predetermined timing.
  • the advance preparation process may be executed according to an instruction from the system administrator, or may be executed at a predetermined date and time.
  • the control unit 11 generates product feature information of each product based on the action history information of each of a plurality of users stored in the user database DB2 (S1).
  • the control unit 11 refers to the behavior history information of all users or some users, and generates product feature information of the product based on the product that is the action target of each user.
  • the process for generating the product feature information from the action history information is as described above.
  • the control unit 11 generates user feature information of each cluster for each user (S2).
  • FIG. 8 is a diagram showing details of the processing of S2. As illustrated in FIG. 8, the control unit 11 determines a user to be processed based on the user database DB2 (S21). In S21, the control unit 11 may determine the user with the youngest user ID as the processing target user, or may determine the user corresponding to the first record in the user database DB2 as the processing target user. .
  • the control unit 11 refers to the user database DB2 and acquires the action history information of the processing target user determined in S21 (S22). In S22, the control unit 11 acquires action history information of a record in which the user ID of the user to be processed is stored in the user database DB2.
  • the control unit 11 may refer to all the action history information of the processing target user, or may refer to only the action history information for the most recent predetermined number of days (for example, about 30 to 120 days). You may refer only to.
  • the control unit 11 maps the product feature information of each product that is the action target of the processing target user in the n-dimensional space based on the action history information acquired in S22 (S23).
  • the control unit 11 refers to the product database DB ⁇ b> 1, acquires the product feature information of the product in which the store ID and the product ID are stored in the action history information, and sets it as observation data for clustering.
  • the control unit 11 performs clustering of each product based on the mapping result in S23 (S24).
  • S24 the control unit 11 performs clustering of the product feature information mapped in the n-dimensional space based on the above-described clustering algorithm.
  • the control unit 11 issues a cluster number for each cluster, and stores the cluster number in the cluster information of the user to be processed. Then, the control unit 11 associates any cluster number with each product whose product feature information is mapped in the n-dimensional space.
  • the control unit 11 determines the cluster to be processed based on the cluster information of the user to be processed (S25). In S25, the control unit 11 may determine the cluster with the smallest cluster number as the cluster to be processed, or may determine the cluster corresponding to the first record in the cluster information as the cluster to be processed.
  • the control unit 11 acquires user feature information of the cluster to be processed based on the product feature information of each product belonging to the cluster to be processed (S26). In S26, the control unit 11 acquires the average value of the product feature information of each product belonging to the cluster to be processed as user feature information of the cluster to be processed.
  • the control unit 11 determines whether or not user feature information has been acquired for all clusters (S27). In S27, the control unit 11 determines whether or not the process of S26 has been executed for all of the plurality of clusters for which the cluster numbers have been generated in the clustering of S24.
  • control unit 11 determines whether clustering has been executed for all users (S28).
  • the control unit 11 associates the coupon with the product feature information based on the product database DB1 and the coupon database DB3 (S3), and the process ends.
  • the control part 11 specifies the coupon currently registered with reference to coupon database DB3.
  • the control unit 11 refers to the store ID and the product ID of the identified coupon, acquires the product feature information stored in the product database DB1, and stores it in the coupon database DB3.
  • FIG. 9 is a flowchart showing the coupon presentation process.
  • the coupon presenting process is executed by the control unit 11 operating according to the program stored in the storage unit 12 and the control unit 21 operating according to the program stored in the storage unit 22.
  • the control unit 21 transmits an access request together with the user ID to the server 10 (S31).
  • the access request may be a request in a predetermined format, for example, a display request for a top page or a product page of the virtual market.
  • the access request may include the URL of the page.
  • the access request may include an ID for identifying the page.
  • the user ID may be stored in advance in the storage unit 22 or may be input from the operation unit 24.
  • the control unit 11 when receiving the user ID and the access request, the control unit 11 refers to the user database DB2 and acquires the cluster information of the user who requested the access (S32). In S32, the control unit 11 acquires cluster information of a record in which the user ID received together with the access request is stored.
  • the control unit 11 determines coupon information to be presented to the user based on the cluster information acquired in S32 and the coupon database DB3 (S33). In S33, the control part 11 determines the number of coupon information of each cluster based on a weighting coefficient, action type information, and action time information. And the control part 11 acquires a predetermined number of coupons for every cluster in order with the short distance of the user characteristic information and merchandise characteristic information of the said cluster.
  • the control part 11 produces
  • the control unit 11 embeds the coupon information determined in S ⁇ b> 33 in the top page or product page of the virtual market.
  • the control unit 21 displays a page including coupon information on the display unit 25 based on the received display data (S35), and this process ends.
  • FIG. 10 is a diagram illustrating a screen example of a page including coupon information.
  • the example shown in FIG. 10 shows a case where coupon information CP1 and CP2 are embedded in the top page P of the virtual market.
  • Each of the coupon information CP1 and CP2 includes information such as an image of a coupon target product, a coupon application period, a coupon content, and a coupon target store. For example, coupon information selected by the user from the top page P can be acquired.
  • coupon information is presented after further analyzing the user's preferences based on the clustering result of each product that is the user's action target. Can improve the accuracy. For example, in the conventional technology, since information indicating the user's preference is calculated regardless of the field, when the preference in one field and the preference in another field are averaged, the characteristics of each other are offset, Although there was a possibility that the feature amount indicates a product that has nothing to do with it, setting a cluster for each user makes it possible to analyze the user's preferences in detail and improve the accuracy of the coupon information .
  • a user's favorite product may exist across multiple categories, but clustering that crosses these multiple categories can be set by clustering, and the user's preference is not leaked by the cluster. Can be identified.
  • the category is too wide to express the user's preference as a pinpoint.
  • the cluster can pinpoint the user's preference even in such a case. For this reason, since a cluster expresses a user-specific preference, the accuracy of coupon information presented to the user can be increased.
  • the information processing system 1 can present coupon information based on the user characteristic information acquired for each cluster and can improve the accuracy of the coupon information through simpler processing, the processing load on the information processing system 1 is reduced. can do.
  • each of the user feature information and the product feature information is represented by a vector
  • coupon information is presented based on a comparison result between the vector represented by the user feature information of each cluster and the product feature information of each product Since the accuracy of the coupon information can be increased by simpler processing, the processing load of the information processing system 1 can be effectively reduced. Moreover, the memory consumption in the information processing system 1 can also be suppressed by using each of the user feature information and the product feature information in a simple format called a vector.
  • the accuracy of the user feature information is improved by setting the user feature information of each cluster to the average value of the product feature information of the products in the cluster, the accuracy of the coupon information presented to the user is effectively increased be able to.
  • the user characteristic information can be acquired by simpler processing, the processing load of the information processing system 1 for acquiring the user characteristic information can be reduced.
  • the processing load of the information processing system 1 can be reduced. it can.
  • the process which presents coupon information can also be sped up because the goods used as comparison object decrease.
  • the accuracy of the product feature information is improved by including the product category in the product feature information, the accuracy of the coupon information presented to the user can be effectively increased.
  • the accuracy of the coupon information presented to the user can be effectively increased by presenting the coupon information based on the type of user behavior.
  • the accuracy of the coupon information presented to the user can be effectively increased.
  • coupon information of each product as information to be presented to the user, information useful for the user can be presented.
  • useful information can be presented to the user who purchases a product by making it a data item regarding a product as a data item.
  • the presentation unit 104 may determine a product for which coupon information is to be presented based on arbitrary product feature information among products included in each cluster. Further, for example, the presentation unit 104 may set at least one product among products included in each cluster as a coupon information presentation target.
  • the product information may be recommendation information instead of coupon information.
  • the presentation unit 104 may display an image of the recommended product on the top page or the product page. Further, for example, the presentation unit 104 may transmit an email including the URL of the recommended product, or may display a message or push notification including the URL of the recommended product on the display unit 25.
  • the data item may not be a data item related to the product.
  • the part described as “product” in the embodiment can be read as “service”.
  • the data item feature information is service feature information related to service features, and is information related to a user's behavior history for each service.
  • the clustering unit 103 performs clustering of each service based on the service feature information of each service indicated by the action history information.
  • the presentation unit 104 presents service information regarding at least one of the plurality of services to the user. For example, the presentation unit 104 embeds and presents service coupon information or recommendation information in a predetermined page.
  • the processing according to the present invention may be applied to data items related to content.
  • the location described as “product” in the embodiment can be read as “content”.
  • the data item feature information is service feature information related to content features, and is information related to a user's behavior history for each content.
  • the clustering unit 103 performs clustering of each content based on the content feature information of each content indicated by the action history information.
  • the presentation unit 104 presents service information regarding at least one of the plurality of contents to the user. For example, the presentation unit 104 embeds content coupon information or recommendation information in a predetermined page and presents the information.
  • the first acquisition unit 101, the second acquisition unit 102, the clustering unit 103, and the presentation unit 104 may be realized by the user terminal 20, respectively. In this case, these functions are realized mainly by the control unit 11.
  • the 1st acquisition part 101 should just acquire merchandise feature information from the server 10 via a network.
  • the 2nd acquisition part 102 should just acquire action history information from server 10 via a network.
  • the clustering unit 103 may perform clustering based on the acquired product feature information and action history information.
  • the presentation unit 104 may present product information based on information received from the server 10 via the network.

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

ユーザに提示する情報の精度を高める。情報処理システム(1)の第1取得手段(101)は、複数のデータ項目の各々の特徴に関するデータ項目特徴情報を取得する。第2取得手段(102)は、各データ項目に対するユーザの行動履歴に関する行動履歴情報を取得する。クラスタリング手段(103)は、行動履歴情報が示す各データ項目のデータ項目特徴情報に基づいて、各データ項目のクラスタリングを行う。提示手段(104)は、クラスタリング手段(103)の処理結果に基づいて、複数のデータ項目のうちの少なくとも1つに関するデータ項目情報を、ユーザに提示する。

Description

情報処理システム、情報処理方法、及びプログラム
 本発明は、情報処理システム、情報処理方法、及びプログラムに関する。
 従来、ユーザによるウェブサイトの閲覧や商品の購入などの行動履歴を解析する技術が知られている。例えば、特許文献1には、複数のユーザの各々のコンテンツ履歴に基づいて、嗜好が似たユーザのグループであるクラスタに各ユーザを割り当て、各クラスタの代表ユーザのコンテンツ履歴特性と、新規ユーザのコンテンツ履歴特性と、に基づいて新規ユーザを何れかのクラスタに割り当てることで、新規ユーザの嗜好に合ったコンテンツを提供するシステムが記載されている。
特開2013-200612号公報
 しかしながら、特許文献1のコンテンツ履歴特性は、互いに特性の異なる種々の分野全体における行動履歴から算出されるものであり、分野ごとの細かな嗜好を示すものではない。例えば、コンテンツ履歴特性を算出する際に、ある分野における嗜好と、他の分野における嗜好と、が相殺されてしまい、分野特有の嗜好を示す情報とはならない。このため、特許文献1の技術では、コンテンツ履歴特性を利用して新規ユーザをクラスタに割り当てたとしても、ユーザに提示する情報の精度を十分に高めることができない。
 本発明は上記課題に鑑みてなされたものであって、その目的は、ユーザに提示する情報の精度を高めることが可能な情報処理システム、情報処理方法、及びプログラムを提供することである。
 上記課題を解決するために、本発明に係る情報処理システムは、複数のデータ項目の各々の特徴に関するデータ項目特徴情報を取得する第1取得手段と、各データ項目に対するユーザの行動履歴に関する行動履歴情報を取得する第2取得手段と、前記行動履歴情報が示す各データ項目の前記データ項目特徴情報に基づいて、各データ項目のクラスタリングを行うクラスタリング手段と、前記クラスタリング手段の処理結果に基づいて、前記複数のデータ項目のうちの少なくとも1つに関するデータ項目情報を、前記ユーザに提示する提示手段と、を含むことを特徴とする。
 本発明に係る情報処理方法は、複数のデータ項目の各々の特徴に関するデータ項目特徴情報を取得する第1取得ステップと、各データ項目に対するユーザの行動履歴に関する行動履歴情報を取得する第2取得ステップと、前記行動履歴情報が示す各データ項目の前記データ項目特徴情報に基づいて、各データ項目のクラスタリングを行うクラスタリングステップと、前記クラスタリングステップの処理結果に基づいて、前記複数のデータ項目のうちの少なくとも1つに関するデータ項目情報を、前記ユーザに提示する提示ステップと、を含むことを特徴とする。
 本発明に係るプログラムは、複数のデータ項目の各々の特徴に関するデータ項目特徴情報を取得する第1取得手段、各データ項目に対するユーザの行動履歴に関する行動履歴情報を取得する第2取得手段、前記行動履歴情報が示す各データ項目の前記データ項目特徴情報に基づいて、各データ項目のクラスタリングを行うクラスタリング手段、前記クラスタリング手段の処理結果に基づいて、前記複数のデータ項目のうちの少なくとも1つに関するデータ項目情報を、前記ユーザに提示する提示手段、としてコンピュータを機能させる。
 また、本発明に係る情報記憶媒体は、上記のプログラムが記憶されたコンピュータ読み取り可能な情報記憶媒体である。
 また、本発明の一態様では、前記クラスタリング手段は、クラスタごとに、当該クラスタに属する各データ項目の前記データ項目特徴情報に基づいて、ユーザ特徴情報を取得し、前記提示手段は、各クラスタの前記ユーザ特徴情報と、各データ項目の前記データ項目特徴情報と、に基づいて、前記データ項目情報を提示する、ことを特徴とする。
 また、本発明の一態様では、各クラスタの前記ユーザ特徴情報と、各データ項目の前記データ項目特徴情報と、はそれぞれベクトルで示されており、前記提示手段は、各クラスタの前記ユーザ特徴情報が示すベクトルと、各データ項目の前記データ項目特徴情報が示すベクトルと、の比較結果に基づいて、前記データ項目情報を提示する、ことを特徴とする。
 また、本発明の一態様では、前記クラスタリング手段は、各クラスタに属する各データ項目の前記データ項目特徴情報が示すベクトルの平均値を、当該クラスタの前記ユーザ特徴情報として取得する、ことを特徴とする。
 また、本発明の一態様では、前記提示手段は、前記複数のデータ項目のうち、各クラスタ内のデータ項目の前記データ項目特徴情報を、当該クラスタの前記ユーザ特徴情報との比較対象とする、ことを特徴とする。
 また、本発明の一態様では、前記第1取得手段は、複数のユーザの各々の前記行動履歴情報に基づいて、各データ項目の前記データ項目特徴情報を取得する、ことを特徴とする。
 また、本発明の一態様では、各データ項目の前記データ項目特徴情報は、予め設定された当該データ項目の分類情報を含む、ことを特徴とする。
 また、本発明の一態様では、前記クラスタリング手段は、前記行動履歴情報に基づいて、クラスタサイズを変化させる、ことを特徴とする。
 また、本発明の一態様では、前記行動履歴情報は、各データ項目に対する前記ユーザの行動の種類に関する行動種類情報を含み、前記提示手段は、前記行動種類情報に更に基づいて、前記データ項目情報を提示する、ことを特徴とする。
 また、本発明の一態様では、前記行動履歴情報は、各データ項目に対する前記ユーザの行動時間に関する行動時間情報を含み、前記提示手段は、前記行動時間情報に更に基づいて、前記データ項目情報を提示する、ことを特徴とする。
 また、本発明の一態様では、前記データ項目情報は、前記複数のデータ項目の少なくとも1つに関するクーポン情報又はリコメンド情報である、ことを特徴とする。
 また、本発明の一態様では、各データ項目は、商品に関するデータ項目であり、前記第1取得手段は、複数の商品の各々の特徴に関する前記データ項目特徴情報を取得し、前記第2取得手段は、各商品に対する前記ユーザの行動履歴に関する前記行動履歴情報を取得し、前記クラスタリング手段は、前記行動履歴情報が示す各商品の前記データ項目特徴情報に基づいて、各商品のクラスタリングを行い、前記提示手段は、前記複数の商品のうちの少なくとも1つに関する前記データ項目情報を前記ユーザに提示する、ことを特徴とする。
 本発明によれば、ユーザに提示する情報の精度を高めることができる。
情報処理システムの全体構成を示す図である。 情報処理システムで実現される機能の一例を示す機能ブロック図である。 商品データベースの一例を示す図である。 ユーザデータベースの一例を示す図である。 クーポンデータベースの一例を示す図である。 クラスタリング部の処理内容を示す図である。 事前準備処理を示すフロー図である。 S2の処理の詳細を示す図である。 クーポン提示処理を示すフロー図である。 商品ページの画面例を示す図である。
[1.情報処理システムの全体構成]
 以下、本発明に関わる情報処理システムの実施形態の例を説明する。図1は、情報処理システムの全体構成を示す図である。図1に示すように、情報処理システム1は、サーバ10及びユーザ端末20を含み、これらはネットワークを介してデータ送受信可能に接続される。なお、図1では、サーバ10及びユーザ端末20を1台ずつ示しているが、これらは複数台あってもよい。また、情報処理システム1は、サーバ10及びユーザ端末20以外のコンピュータを含んでいてもよい。
 サーバ10は、サーバコンピュータであり、例えば、制御部11、記憶部12、及び通信部13を含む。制御部11は、少なくとも1つのプロセッサを含む。制御部11は、記憶部12に記憶されたプログラムやデータに従って処理を実行する。記憶部12は、主記憶部及び補助記憶部を含む。例えば、主記憶部はRAMなどの揮発性メモリであり、補助記憶部は、ハードディスクやフラッシュメモリなどの不揮発性メモリである。通信部13は、有線通信又は無線通信用の通信インタフェースを含み、例えば、ネットワークを介してデータ通信を行う。
 ユーザ端末20は、ユーザが操作するコンピュータであり、例えば、パーソナルコンピュータ、携帯情報端末(タブレット型コンピュータを含む)、又は携帯電話機(スマートフォンを含む)等である。ユーザ端末20は、制御部21、記憶部22、通信部23、操作部24、及び表示部25を含む。制御部21、記憶部22、及び通信部23のハードウェア構成は、それぞれ制御部11、記憶部12、及び通信部13と同様であってよい。操作部24は、ユーザが操作を行うための入力デバイスであり、例えば、タッチパネルやマウス等のポインティングデバイスやキーボード等である。操作部24は、ユーザの操作内容を制御部21に伝達する。表示部25は、例えば、液晶表示部又は有機EL表示部等である。
 なお、記憶部12,22に記憶されるものとして説明するプログラム及びデータは、ネットワークを介してこれらに供給されるようにしてもよい。また、サーバ10及びユーザ端末20のハードウェア構成は、上記の例に限られず、種々のハードウェアを適用可能である。例えば、サーバ10及びユーザ端末20は、それぞれコンピュータ読み取り可能な情報記憶媒体を読み取る読取部(例えば、光ディスクドライブやメモリカードスロット)や外部機器と直接的に接続するための入出力部(例えば、USB端子)を含んでもよい。この場合、情報記憶媒体に記憶されたプログラムやデータが読取部又は入出力部を介して、サーバ10又はユーザ端末20に供給されるようにしてもよい。
[2.情報処理システムの概要]
 情報処理システム1では、複数のデータ項目がサーバ10に記憶されており、任意のデータ項目がユーザに提供される。データ項目は、ユーザに所定の情報を提供するためのデータである。データ項目の内容は、任意であってよく、例えば、商品、サービス、又はコンテンツに関する内容であってもよい。
 商品は、取引の対象となる物であればよく、例えば、食料品、衣料品、家具、家電、又は電子機器などの有体物であってもよいし、後述するコンテンツのような無体物であってもよい。例えば、データ項目は、商品ページをユーザ端末20に表示させるためのデータである。データ項目は、商品ページのHTMLであってもよいし、商品ページのフレームに挿入する画像やテキストであってもよい。なお、フレームは、アプリケーション内で画面を表示させる場合の画面レイアウトを定義したデータである。
 サービスは、任意の内容のサービスであってよく、例えば、旅行予約、保険の申し込み、レストラン予約、宝くじの購入、又は金融サービスなどである。例えば、データ項目は、サービスの利用申込ページをユーザ端末20に表示させるためのデータである。データ項目は、利用申込ページのHTMLであってもよいし、利用申込ページのフレームに挿入する画像やテキストであってもよい。
 コンテンツは、任意の内容のコンテンツであってよく、例えば、ウェブサイト、クーポン、広告、電子書籍、動画、画像、楽曲、又はアプリケーションなどである。例えば、商品ページ及びサービスの利用申込ページも、コンテンツの一例ということもできる。例えば、データ項目は、コンテンツデータそのものであってもよいし、コンテンツのダウンロードページをユーザ端末20に表示させるためのデータであってもよい。データ項目は、ダウンロードページのHTMLであってもよいし、ダウンロードページのフレームに挿入する画像やテキストであってもよい。
 本実施形態では、各データ項目が商品に関するデータ項目である場合を一例として説明する。以降の説明では、記載の簡略化のために「データ項目」を単に「商品」と記載する。このため、本実施形態で「商品」と記載した箇所は、「データ項目」と読み替えることができる。
 本実施形態では、ユーザは、ユーザ端末20を操作してサーバ10にアクセスし、インターネット上の仮想的な店舗が取り扱う商品を閲覧したり購入したりする。ユーザの閲覧履歴及び購入履歴は、行動履歴として記録される。情報処理システム1は、各商品に対するユーザの行動履歴を解析し、ユーザごとに、商品のクラスタリングを実行する。
 クラスタリングは、観測データをグループ分け(分類)するための処理である。本実施形態では、個々の商品が観測データに相当する。クラスタは、個々のグループであり、分類の単位である。クラスタは、商品の分類という意味では、カテゴリと概念的に少し似ている。ただし、カテゴリが全ユーザで共通の情報である一方で、クラスタは、ユーザごとに異なり、ユーザ特有の好みが反映されている。
 本実施形態の情報処理システム1は、クラスタごとに、当該クラスタに属する商品の商品特徴情報に基づいて、ユーザの嗜好に関するユーザ特徴情報を計算する。そして、情報処理システム1は、各クラスタのユーザ特徴情報に基づいて、商品のクーポン情報を提示することによって、ユーザ特有の嗜好をクラスタごとに分析し、ユーザに提示するクーポン情報の精度を高めるようにしている。以降、当該構成の詳細を説明する。
[3.本実施形態において実現される機能]
 図2は、情報処理システム1で実現される機能の一例を示す機能ブロック図である。図2に示すように、本実施形態では、データ記憶部100、第1取得部101、第2取得部102、クラスタリング部103、及び提示部104がサーバ10で実現される。データ記憶部100は、記憶部12を主として実現され、第1取得部101、第2取得部102、クラスタリング部103、及び提示部104の各々は、制御部11を主として実現される。
[3-1.データ記憶部]
 データ記憶部100は、本実施形態に係る処理を実行するために必要なデータを記憶する。ここでは、データ記憶部100が記憶するデータの一例として、商品データベースDB1、ユーザデータベースDB2、及びクーポンデータベースDB3を説明する。
 図3は、商品データベースDB1の一例を示す図である。図3に示すように、商品データベースDB1は、商品に関する種々の情報が格納されるデータベースである。例えば、商品データベースDB1には、店舗ID、商品ID、商品の基本情報、及び商品特徴情報が格納される。店舗IDは、インターネット上の店舗を一意に識別する情報である。商品IDは、当該店舗が取り扱う商品を一意に識別する情報である。
 商品の基本情報は、商品の内容に関する基本的な情報であり、例えば、商品名(商品タイトル)、カテゴリ(ジャンル)、属性、単価、在庫数、キーワード、及び商品説明を含む。属性は、商品の性質であり、例えば、商品の色、サイズ、素材、状態、産地、又はメーカといった情報である。キーワードは、商品の検索用の単語であり、例えば、商品名又は商品説明の中から抽出された単語であってもよいし、店舗の担当者がキーワードとして入力した単語であってもよい。商品説明は、商品の詳細な説明であり、例えば、テキスト、表、及び画像の少なくとも1つによって示される。
 例えば、商品の基本情報は、店舗の担当者により入力される。なお、商品の基本情報は、他の情報が含まれていてもよく、例えば、商品ページのURL、商品ページのHTMLデータ、フレーム、又は画像データなどの種々の情報が含まれていてもよい。なお、商品ページは、商品を購入するための画面であればよく、例えば、商品名、商品画像、商品説明、及び単価といった商品の基本情報と、商品を買い物かごに入れるためのボタンと、を含む。商品ページは、ユーザ端末20のウェブブラウザ内で表示されてもよいし、ユーザ端末20にインストールされたアプリケーション内で表示されてもよい。
 商品特徴情報は、商品の特徴に関する情報であり、例えば、複数の項目の各々の特徴量を含む。項目は、商品の特徴を評価するための任意の項目であればよく、例えば、商品の基本情報に関する項目であってもよいし、商品を閲覧したり購入したりしたユーザの基本情報に関する項目であってもよい。例えば、特徴量は、各項目の商品の特徴を数値化した情報である。なお、特徴量は、数値ではなく、文字によって示されてもよいし、数値と文字の組み合わせで示されてもよい。
 例えば、商品特徴情報は、商品名・キーワード・商品説明に含まれる単語が項目となってもよいし、カテゴリ、属性、又は価格帯が項目となってもよい。単語が商品特徴情報の項目となる場合には、当該項目の特徴量は、単語の特徴ベクトルであってもよい。単語の特徴ベクトルの取得方法自体は、公知の種々の手法を適用可能であり、例えば、Word2vecなどのニューラルネットワークを利用してもよい。また例えば、商品特徴情報は、商品を閲覧又は購入したユーザの年齢、性別、又は地域が項目になってもよい。
 本実施形態では、商品特徴情報がn(nは自然数)次元のベクトルで示される場合を例に挙げて説明する。即ち、商品特徴情報は、n個の項目の特徴量を含んでおり、各項目の特徴量は、ベクトルの各要素の値として示される。なお、商品特徴情報は、ベクトル以外の形式であってもよく、任意の形式で表現可能である。例えば、商品特徴情報は、配列形式、画像形式、テキスト形式、又は表形式といった任意の形式の情報であってもよい。
 また、本実施形態では、各商品の商品特徴情報は、予め設定された当該商品の分類情報を含む場合を説明する。例えば、商品特徴情報が示すn次元のベクトルのうち、k(kは1以上n以下の整数)個目の要素は、商品の分類情報を示す値となる。分類情報は、複数の分類情報の中から予め設定された少なくとも1つであり、例えば、カテゴリ(ジャンル)、属性、又は価格帯などの情報である。価格帯は、複数の価格帯の中から単価が属する価格帯である。
 本実施形態では、分類情報の一例として、商品の基本情報に格納されたカテゴリ(即ち、店舗の担当者が入力したカテゴリ)を説明する。このため、本実施形態でカテゴリと記載した箇所については、分類情報と読み替えることができる。商品特徴情報のうち、k個目の要素は、カテゴリを示す特徴量となる。どの数値がどのカテゴリを示すかは、予めデータ記憶部100に定めておけばよい。
 なお、本実施形態では、店舗の担当者により入力された情報と、サーバ10により生成された情報と、の両方が商品特徴情報に含まれる場合を説明するが、商品特徴情報は、店舗の担当者により入力された情報だけを含んでもよいし、サーバ10により生成された情報だけを含んでもよい。また、商品特徴情報に含まれる項目は、上記の例に限られず、任意の項目を適用可能である。例えば、商品が閲覧又は購入された日時に関する項目であってもよいし、商品が閲覧又は購入された場合に使用された検索式に関する項目であってもよい。検索式とは、検索条件であり、例えば、キーワード、カテゴリ、属性、価格帯、及び在庫の有無のうちの少なくとも1つである。
 図4は、ユーザデータベースDB2の一例を示す図である。図4に示すように、ユーザデータベースDB2は、ユーザに関する種々の情報が格納されるデータベースである。例えば、ユーザデータベースDB2には、ユーザID、ユーザの基本情報、行動履歴情報、及び、クラスタ情報が格納される。ユーザIDは、ユーザを一意に識別する情報である。
 ユーザの基本情報は、ユーザの登録情報であり、例えば、ユーザ名、年齢、性別、及び地域などの情報が格納される。なお、ユーザの基本情報は、他の情報が含まれていてもよく、例えば、ユーザのお気に入りのカテゴリなどの情報が含まれていてもよい。
 行動履歴情報は、各商品に対するユーザの行動履歴に関する情報であり、例えば、行動対象の商品の識別情報(ここでは、店舗IDと商品IDの組み合わせ)、行動種類情報、及び行動時間情報といった情報が時系列的に格納される。
 行動対象とは、ユーザによる行動の対象になることであり、例えば、閲覧、購入、又はダウンロードなどの対象になることである。行動種類情報は、行動の種類に関する情報であり、例えば、閲覧・購入・ダウンロードといった複数の種類のうち、ユーザが取った行動の種類を示す情報である。行動時間情報は、ユーザが行動した日時を示す情報であり、例えば、閲覧日時、購入日時、又はダウンロード日時といった情報である。
 サーバ10は、ユーザ端末20との通信内容に基づいて、行動履歴情報を更新する。例えば、サーバ10は、ユーザから商品ページの閲覧要求を受け付けると、当該商品ページの表示データをユーザ端末20に送信する。そして、サーバ10は、当該ユーザのユーザIDが格納されたレコードの行動履歴情報に、当該商品ページが示す商品の店舗ID及び商品IDを格納し、行動種類情報に「閲覧」を設定し、行動時間情報に現在日時を設定する。
 また例えば、サーバ10は、ユーザから商品の購入要求を受け付けると、当該商品の購入処理を実行する。購入処理自体は、公知の種々の処理を適用可能であり、例えば、クレジットカードによる決済処理が実行される。そして、サーバ10は、当該ユーザのユーザIDが格納されたレコードの行動履歴情報に、当該商品ページが示す商品の店舗ID及び商品IDを格納し、行動種類情報に「購入」を設定し、行動時間情報に現在日時を設定する。
 クラスタ情報は、クラスタリング部103が特定したクラスタに関する情報であり、例えば、クラスタ番号、ユーザ特徴情報、重み係数、行動種類情報、及び行動時間情報を含む。クラスタ番号は、クラスタを一意に識別する情報である。クラスタは、ユーザごとに取得されるので、クラスタ番号は、あるユーザに対して取得された複数のクラスタの中で、クラスタを一意に識別する情報といえる。
 ユーザ特徴情報は、クラスタ内の商品の特徴を総合的に示す情報である。ユーザ特徴情報は、クラスタごとに生成され、例えば、クラスタに属する行動対象の商品の商品特徴情報を所定の数式に代入することで得られた値となる。この数式は、任意の数式であってよく、例えば、単純平均又は加重平均を求める式である。本実施形態では、商品特徴情報がベクトルで示されるので、ユーザ特徴情報もベクトルで示される場合を一例として説明する。
 重み係数は、クラスタの重要度(蓋然性)であり、例えば、重み係数が高いほどクラスタが重要であり、重み係数が低いほどクラスタが重要ではないことを示す。
 行動種類情報は、クラスタに属する商品に対する行動の種類に関する情報である。ここでは、行動種類情報は、「購入済み」又は「閲覧のみ」の何れかの値を取るものとする。クラスタに属する行動対象の商品が1つでも購入されていれば、当該クラスタの行動種類情報は「購入済み」となり、そうでなければ、当該クラスタの行動種類情報は「閲覧のみ」となる。なお、行動の種類は、購入と閲覧に限られず、例えば、商品を買い物かごに入れるといった行動であってもよい。
 行動時間情報は、クラスタに属する商品に対する行動時間に関する情報である。ここでは、行動時間情報は、「購入済み」の商品に対する行動時間が格納される。
 なお、行動履歴情報に含まれる項目は、上記の例に限られず、任意の項目を適用可能である。例えば、行動履歴情報は、商品が閲覧又は購入された際に使用された検索式を含んでいてもよい。また、ユーザデータベースDB2には、ユーザが獲得したクーポン情報などの情報を含んでいてもよい。
 図5は、クーポンデータベースDB3の一例を示す図である。図5に示すように、クーポンデータベースDB3は、クーポンに関する種々の情報が格納されるデータベースである。例えば、クーポンデータベースDB3には、クーポンID、クーポンの対象となる店舗又は商品の識別情報(ここでは、店舗IDと商品IDの組み合わせ)、クーポン内容、及び商品特徴情報が格納される。クーポンIDは、クーポンを一意に識別する情報である。
 クーポン内容は、クーポン使用時の効果であり、例えば、値引き額、値引きパーセント(割合)、おまけの商品といった情報が格納される。商品特徴情報は、クーポンの対象となる商品の商品特徴情報である。クーポン対象が店舗となる場合には、当該店舗が取り扱う特定の商品の商品特徴情報であってもよいし、当該店舗の複数の商品の各々の商品特徴情報から算出されるようにしてもよい。なお、クーポンデータベースDB3には、クーポンの有効期間などの情報が格納されていてもよい。
 例えば、クーポンデータベースDB3は、各店舗の担当者によって更新される。例えば、クーポンを発行する店舗の担当者は、サーバ10に対し、自身の店舗の店舗ID、クーポンの対象となる商品の商品ID、及びクーポンの内容の登録要求を送信する。サーバ10は、店舗の担当者からの登録要求を受信すると、クーポンIDを発行し、店舗ID、商品ID、及びクーポンの内容と関連付けてクーポンデータベースDB3に格納する。そして、サーバ10は、商品データベースDB1を参照し、当該店舗ID及び当該商品IDに関連付けられた商品特徴情報を取得し、上記発行したクーポンIDと関連付けてクーポンデータベースDB3に格納する。
 なお、データ記憶部100に記憶されるデータは、上記の例に限られない。データ記憶部100は、実施形態に係る処理のために必要なデータを記憶すればよい。例えば、データ記憶部100は、行動履歴情報と商品特徴情報との関係(詳細後述)を記憶してもよい。
[3-2.第1取得部]
 第1取得部101は、複数の商品の各々の特徴に関する商品特徴情報を取得する。本実施形態では、商品データベースDB1に商品特徴情報が格納されているので、第1取得部101は、データ記憶部100に記憶された各商品の商品特徴情報を取得する。なお、サーバ10以外のコンピュータ(例えば、外部のデータベースサーバ)に商品特徴情報が記憶されている場合には、第1取得部101は、当該コンピュータから各商品の商品特徴情報を取得すればよい。
 例えば、第1取得部101は、複数のユーザの各々の行動履歴情報に基づいて、各商品の商品特徴情報を取得してもよい。この場合、第1取得部101は、情報処理システム1の全ユーザの行動履歴情報に基づいて、各商品の商品特徴情報を取得してもよいし、情報処理システム1の一部のユーザの行動履歴情報に基づいて、各商品の商品特徴情報を取得してもよい。また例えば、第1取得部は、各ユーザの行動履歴情報に基づいて、商品特徴情報の全項目の特徴量を取得してもよいし、商品特徴情報の一部の項目の特徴量を取得してもよい。
 各ユーザの行動履歴情報と、各商品の商品特徴情報と、の関係は、予めデータ記憶部100に記憶されているものとする。この関係は、数式形式又はテーブル形式で定義されていてもよいし、プログラムコードの一部として定義されていてもよい。第1取得部101は、各ユーザの行動履歴情報に関連付けられた各商品の商品特徴情報を取得する。即ち、第1取得部101は、各ユーザの行動履歴情報を上記関係の入力とし、上記関係の出力として各商品の商品特徴情報を取得する。
 例えば、第1取得部101は、ある検索式で得られた検索結果から閲覧又は購入された商品同士の商品特徴情報が似るように、各商品の商品特徴情報を取得する。また例えば、第1取得部101は、商品が閲覧又は購入された場合に使用されたキーワードを参照し、当該キーワードに含まれる単語に基づいて、当該商品の商品特徴情報を取得してもよい。この場合、第1取得部101は、キーワードに含まれる単語の特徴ベクトルを、商品特徴情報の一部の項目の特徴量としてもよい。
 また例えば、商品特徴情報が、ユーザに関する情報を含む場合には、第1取得部101は、各ユーザの基本情報に基づいて、各商品の商品特徴情報を取得してもよい。例えば、商品特徴情報の項目として、商品を閲覧又は購入するユーザの年齢、性別、及び地域の少なくとも1つを含む場合には、第1取得部101は、ユーザデータベースDB2を参照し、各商品の商品特徴情報の当該項目の特徴量を、当該商品を行動対象にしたユーザの年齢、性別、及び地域に基づいて取得してもよい。
 なお、各商品の商品特徴情報は、行動履歴情報に基づいて取得されるのではなく、店舗の担当者によって入力された情報をそのまま商品特徴情報としてもよいし、店舗の担当者によって入力された情報をもとに生成された情報を商品特徴情報としてもよい。
[3-3.第2取得部]
 第2取得部102は、各商品に対するユーザの行動履歴に関する行動履歴情報を取得する。本実施形態では、ユーザデータベースDB2に行動履歴情報が格納されているので、第2取得部102は、データ記憶部100に記憶された行動履歴情報を取得する。例えば、第2取得部102は、ユーザデータベースDB2に格納された各ユーザの行動履歴情報を取得する。なお、サーバ10以外のコンピュータ(例えば、外部のデータベースサーバ)に行動履歴情報が記憶されている場合には、第2取得部102は、当該コンピュータから各ユーザの行動履歴情報を取得すればよい。
[3-4.クラスタリング部]
 クラスタリング部103は、行動履歴情報が示す各商品の商品特徴情報に基づいて、各商品のクラスタリングを行う。本実施形態では、クラスタリングは、商品特徴情報が似た商品をグループ化するための処理となる。クラスタリングは、データ・クラスタリング、教師なし学習、又はデータマイニングと呼ばれることもある。
 クラスタリング部103は、ユーザごとに、当該ユーザの行動履歴情報に基づいて、クラスタリングを行う。別の言い方をすれば、クラスタリング部103は、各ユーザの行動履歴情報に基づいて、当該ユーザのためのクラスタリングを行う。例えば、クラスタリング部103は、各ユーザの行動履歴情報に基づいて、当該ユーザによる行動対象の商品を特定し、特定した各商品の商品特徴情報に基づいて、当該ユーザのためのクラスタリングを実行する。このため、クラスタリング部103は、あるユーザのクラスタリングを実行する場合、当該ユーザの行動履歴情報は参照するが、他のユーザの行動履歴情報は参照しない。
 なお、クラスタリングのアルゴリズム自体は、公知の種々の手法を適用可能であり、例えば、最短距離法・最長距離法・群平均法・ウォード法などの階層型手法を利用したアルゴリズムであってもよいし、K平均法などの非階層的手法を利用したアルゴリズムであってもよい。例えば、DBSCAN (Density-based spatial clustering of applications with noise )が用いられてもよい。
 図6は、クラスタリング部103の処理内容を示す図である。図6に示すように、本実施形態では、商品特徴情報がn次元のベクトルで示されるので、クラスタリング部103は、行動対象の商品の商品特徴情報が示すn次元のベクトルをn次元空間SPにマッピングし、階層的手法又は非階層的手法のアルゴリズムに基づいて、各商品のクラスタリングを実行する。
 図6の例では、クラスタリング部103は、40個の商品の商品特徴情報が示すベクトルV1~V40をn次元空間SPにマッピングし、3つのクラスタCL1~CL3を設定している。クラスタCL1には、ベクトルV1~V13に対応する商品が属する。クラスタCL2には、ベクトルV14~V26に対応する商品が属する。クラスタCL3には、ベクトルV27~V39に対応する商品が属する。
 例えば、クラスタリング部103は、所定のルールに基づいて、各クラスタCL1~CL3のクラスタ番号を発行し、行動対象の各商品の商品特徴情報に基づいて、当該商品にクラスタ番号を関連付けることによって、クラスタ情報を更新する。なお、クラスタリング部103は、何れのクラスタCL1~CL3からも距離が遠い商品(図6の例では、ベクトルV40に対応する商品)については、ノイズとして除去してもよい。なお、以降の説明では、特に図6を参照する必要のないときは、クラスタとベクトルの符号を省略する。
 例えば、クラスタリング部103は、クラスタごとに、当該クラスタに属する各商品の商品特徴情報に基づいて、ユーザ特徴情報を取得してもよい。クラスタリング部103は、クラスタごとに、当該クラスタに属する各商品の商品特徴情報を所定の数式に代入することによって、ユーザ特徴情報を取得する。先述したように、この数式は、任意の内容であってよく、例えば、単純平均又は加重平均を求める式であってもよい。
 本実施形態では、商品特徴情報がベクトルで示されるので、例えば、クラスタリング部103は、各クラスタに属する各商品の商品特徴情報が示すベクトルの平均値を、当該クラスタのユーザ特徴情報として取得してもよい。当該平均値は、別の言い方をすれば、クラスタに属する各商品の商品特徴情報が示すベクトルのジョイントベクトルである。
 図6の例では、クラスタリング部103は、ベクトルV1~V13の平均値であるジョイントベクトルを、クラスタCL1のユーザ特徴情報として取得し、クラスタ情報に格納する。クラスタリング部103は、ベクトルV14~V26の平均値であるジョイントベクトルを、クラスタCL2のユーザ特徴情報として取得し、クラスタ情報に格納する。クラスタリング部103は、ベクトルV27~V39の平均値であるジョイントベクトルを、クラスタCL3のユーザ特徴情報として取得し、クラスタ情報に格納する。
 本実施形態では、クラスタ情報に、ユーザ特徴情報だけではなく、重み係数も含まれるので、クラスタリング部103は、各ユーザの行動履歴情報に基づいて、当該ユーザのクラスタ情報に格納される重み係数を決定してもよい。
 また例えば、クラスタリング部103は、クラスタに含まれる商品の数が多いほど、当該クラスタ内の商品にユーザが強く関心を持っている可能性があるので、重み係数を大きくし、クラスタに含まれる商品の数が少ないほど、当該クラスタ内の商品にユーザがさほど関心を持っていない可能性があるので、重み係数を小さくしてもよい。
 また例えば、クラスタリング部103は、クラスタのクラスタサイズが大きいほど、当該クラスタに多数の商品が含まれておりユーザが強く関心を持っている可能性があるので、重み係数を大きくし、クラスタのクラスタサイズが小さいほど、当該クラスタに商品があまり含まれておらずユーザがさほど関心を持っていない可能性があるので、重み係数を小さくしてもよい。
 また、本実施形態では、クラスタ情報に、ユーザ特徴情報だけではなく、行動種類情報も含まれるので、クラスタリング部103は、各ユーザの行動履歴情報に基づいて、当該ユーザのクラスタ情報に格納される行動種類情報を決定してもよい。
 例えば、クラスタリング部103は、クラスタに含まれる商品の行動種類情報に基づいて、当該クラスタの行動種類情報を決定してもよい。例えば、クラスタリング部103は、クラスタに含まれる商品の行動種類情報が閲覧のみであれば、当該クラスタの行動種類情報を閲覧のみとし、購入済みの商品を所定個数(例えば、1つ又は2つ以上の任意の数)含むのであれば、当該クラスタの行動種類情報を購入済みとしてもよい。
 例えば、クラスタリング部103は、クラスタに含まれる商品の行動種類情報を参照し、閲覧の商品のみを含むクラスタであれば、まだ商品が購入されておらずユーザの関心が高い可能性があるので、重み係数を大きくし、購入済みの商品を含むクラスタであれば、既に商品が購入されておりユーザの関心が低い可能性があるので、重み係数を小さくしてもよい。
 また例えば、クラスタリング部103は、購入済みの商品を含むクラスタであったとしても、当該クラスタ内の商品が購入された後に、同じクラスタ内の商品が再度閲覧された場合には、ユーザが再び関心を示した可能性があるので、重み係数を大きくしてもよい。
 また、本実施形態では、クラスタ情報に、ユーザ特徴情報だけではなく、行動時間情報も含まれるので、クラスタリング部103は、各ユーザの行動履歴情報に基づいて、当該ユーザのクラスタ情報に格納される行動時間情報を決定してもよい。
 例えば、クラスタリング部103は、クラスタに含まれる商品の行動時間情報に基づいて、当該クラスタの行動時間情報を決定してもよい。例えば、クラスタリング部103は、クラスタに含まれる商品の行動時間情報の平均値を当該クラスタの行動時間情報としてもよいし、クラスタに含まれる商品のうち、購入済みの商品の行動時間情報を当該クラスタの行動時間情報としてもよい。
 また例えば、クラスタリング部103は、クラスタに含まれる商品の行動時間情報を参照し、ユーザが閲覧した日時からの経過時間が短いほど、ユーザの関心がまだ薄れていない可能性があるので、重み係数を大きくし、ユーザが閲覧した日時からの経過時間が長いほど、ユーザの関心が薄れてしまった可能性があるので、重み係数を小さくしてもよい。
 また例えば、クラスタリング部103は、クラスタに含まれる商品の行動時間情報を参照し、ユーザが購入した日時からの経過時間が長いほど、ユーザが再び商品を購入する可能性があるので、重み係数を大きくし、ユーザが購入した日時からの経過時間が短いほど、ユーザがまだ商品を購入しない可能性があるので、重み係数を小さくしてもよい。
 また例えば、クラスタリング部103は、行動履歴情報に基づいて、クラスタサイズを変化させてもよい。クラスタサイズは、クラスタの大きさ(範囲の広さ)であり、粒度とも呼ばれる。例えば、クラスタリング部103は、クラスタに属する商品の数が多いほどクラスタサイズを小さくし、クラスタに属する商品の数が少ないほどクラスタサイズを大きくしてもよい。また例えば、クラスタリング部103は、行動対象の各商品の商品特徴情報のマッピング結果を参照し、商品の密度が高いほどクラスタサイズを小さくし、商品の密度が低いほどクラスタサイズを大きくしてもよい。
[3-5.提示部]
 提示部104は、クラスタリング部103の処理結果に基づいて、複数の商品のうちの少なくとも1つに関する商品情報を、ユーザに提示する。提示部104は、クラスタリング部103の処理結果に基づいて、複数の商品の中から少なくとも1つを選出し、当該少なくとも1つの商品に関する商品情報を、ユーザに提示する。
 商品情報は、商品に関する情報であればよく、例えば、複数の商品の少なくとも1つに関するクーポン情報又はリコメンド情報であってもよいし、商品ページそのものであってもよいし、商品ページとは異なる内容の説明文又は商品画像であってもよい。
 クーポン情報は、所定の特典をユーザに与えるための情報であればよく、例えば、商品を割引価格で購入するための情報であってもよいし、商品以外のおまけを獲得するための情報であってもよい。リコメンド情報は、商品をユーザに提案するための情報であればよく、例えば、商品ページへのリンクであってもよいし、当該リンクが埋め込まれた画像であってもよい。本実施形態では、商品情報の一例としてクーポン情報を説明する。このため、本実施形態でクーポン情報と記載した箇所は、商品情報と読み替えることができる。
 提示とは、視覚的な提示であり、商品情報を表示させるための処理である。提示部104による提示方法は、任意の方法を適用可能であり、例えば、ページ内における画像の表示、電子メールの送信、メッセージアプリを利用したメッセージの送信、又はプッシュ通知であってもよい。本実施形態では、提示部104が、仮想市場のトップページ、店舗のトップページ、又は商品ページなどの任意のページにおいて、クーポン情報を表示させる場合を一例として説明する。
 例えば、提示部104は、各クラスタのユーザ特徴情報と、各商品の商品特徴情報と、に基づいて、クーポン情報を提示する。本実施形態では、各クラスタのユーザ特徴情報は、当該クラスタに属する商品の特徴を平均化した情報なので、提示部104は、クーポンデータベースDB3に登録された複数の商品の中から、各クラスタのユーザ特徴情報と似た商品特徴情報を有する商品を特定し、当該特定した商品のクーポン情報を提示することになる。
 また、本実施形態では、各クラスタのユーザ特徴情報と、各商品の商品特徴情報と、はそれぞれベクトルで示されているので、提示部104は、各クラスタのユーザ特徴情報が示すベクトルと、各商品の商品特徴情報が示すベクトルと、の比較結果に基づいて、クーポン情報を提示する。例えば、提示部104は、各クラスタのユーザ特徴情報が示すベクトルと、各商品の商品特徴情報が示すベクトルと、の距離に基づいて、クーポン情報を提示する。
 例えば、提示部104は、距離が短い順に所定の個数だけ商品を特定し、当該商品のクーポン情報を提示する。この個数は、クラスタに関係なく固定値であってもよいが、本実施形態では、各クラスタの重み付け係数によって変化するものとする。例えば、重み付け係数が大きいほど個数が多くなり、重み付け係数が小さいほど個数が少なくなる。重み付け係数と個数との関係は、予めデータ記憶部100に記憶させておけばよい。この関係は、数式形式又はテーブル形式で定義されていてもよいし、プログラムコードの一部として定義されていてもよい。例えば、提示部104は、クラスタごとに、当該クラスタの重み付け係数によって定まる個数だけ、上記距離が短い順番にクーポン情報を取得して提示する。
 例えば、図4のようなデータ格納例の場合、「ユーザX」のクラスタ情報は、クラスタ番号が「1」のクラスタの重み係数は「2」であり、クラスタ番号が「2」のクラスタの重み係数は「5」であり、クラスタ番号が「3」のクラスタの重み係数は「3」である。このため、ユーザに提示するクーポン情報の総数を10個とすると、提示部104は、クラスタ番号が「1」のユーザ特徴情報と距離が近い順に2つのクーポン情報を取得し、クラスタ番号が「2」のユーザ特徴情報と距離が近い順に5つのクーポン情報を取得し、クラスタ番号が「3」のユーザ特徴情報と距離が近い順に3つのクーポン情報を取得する。提示部104は、これら取得した10個のクーポイン情報を商品ページなどに含ませることによって提示する。
 例えば、全商品の商品特徴情報が各クラスタのユーザ特徴情報との比較対象になってもよいが、提示部104は、複数の商品のうち、各クラスタ内の商品の商品特徴情報を、当該クラスタのユーザ特徴情報との比較対象としてもよい。例えば、提示部104は、クラスタごとに、各商品の商品特徴情報に基づいて、当該クラスタに属する商品を特定する。提示部104は、特定した当該商品を比較対象とする。別の言い方をすれば、提示部104は、クーポンデータベースDB3に登録された複数の商品のうち、クラスタ内の商品は比較対象とし、クラスタ外の商品は比較対象から除外する。
 本実施形態では、行動履歴情報は、各商品に対するユーザの行動の種類に関する行動種類情報を含むので、提示部104は、行動種類情報に更に基づいて、クーポン情報を提示してもよい。例えば、提示部104は、行動種類情報が所定の種類を示す商品については、クーポン情報を提示しないようにしてもよい。所定の種類は、ユーザが商品に対する興味がなくなる蓋然性の高い行動であり、例えば、購入である。
 提示部104は、行動種類情報が購入を示す商品を含むクラスタについては、クーポン情報の提示対象から除外してもよい。なお、提示部104は、行動種類情報が購入を示す商品を含むクラスタであったとしても、購入後にユーザが閲覧した場合には、当該クラスタを再びクーポン情報の提示対象としてもよい。また、各クラスタの重み係数を行動種類情報に基づいて決定する場合には、提示部104は、重み係数に基づいてクーポン情報の提示対象となる商品を決定することによって、行動種類情報に基づいてクーポン情報を提示していることになる。
 本実施形態では、行動履歴情報は、各商品に対するユーザの行動時間に関する行動時間情報を含むので、提示部104は、行動時間情報に更に基づいて、クーポン情報を提示する。例えば、提示部104は、行動時間情報が示す行動時間からの経過時間が閾値未満であれば、クーポン情報を提示しないようにして、経過時間が閾値以上であれば、クーポン情報を提示するようにしてもよい。また、各クラスタの重み係数を行動時間情報に基づいて決定する場合には、提示部104は、重み係数に基づいてクーポン情報の提示対象となる商品を決定することによって、行動時間情報に基づいてクーポン情報を提示していることになる。
[4.本実施形態において実行される処理]
 次に、情報処理システム1で実行される処理の流れを説明する。ここでは、クーポン提示の事前準備をするための事前準備処理と、ユーザにクーポンを提示するためのクーポン提示処理と、を説明する。事前準備処理及びクーポン提示処理は、図2に示す機能ブロックにより実行される処理の一例である。
[4-1.事前準備処理]
 図7は、事前準備処理を示すフロー図である。事前準備処理は、制御部11が、記憶部12に記憶されたプログラムに従って動作することによって実行される。事前準備処理は、所定のタイミングで実行されるようにすればよく、例えば、システム管理者の指示に応じて実行されてもよいし、予め定められた日時に実行されてもよい。
 図7に示すように、まず、制御部11は、ユーザデータベースDB2に格納された複数のユーザの各々の行動履歴情報に基づいて、各商品の商品特徴情報を生成する(S1)。S1においては、制御部11は、全ユーザ又は一部のユーザの行動履歴情報を参照し、各ユーザの行動対象となった商品に基づいて、当該商品の商品特徴情報を生成する。行動履歴情報から商品特徴情報を生成する処理は先述した通りである。
 制御部11は、ユーザごとに、各クラスタのユーザ特徴情報を生成する(S2)。図8は、S2の処理の詳細を示す図である。図8に示すように、制御部11は、ユーザデータベースDB2に基づいて、処理対象のユーザを決定する(S21)。S21においては、制御部11は、ユーザIDが最も若いユーザを処理対象のユーザとして決定してもよいし、ユーザデータベースDB2の最初のレコードに対応するユーザを処理対象のユーザとして決定してもよい。
 制御部11は、ユーザデータベースDB2を参照し、S21で決定した処理対象のユーザの行動履歴情報を取得する(S22)。S22においては、制御部11は、ユーザデータベースDB2のうち、処理対象のユーザのユーザIDが格納されたレコードの行動履歴情報を取得する。なお、制御部11は、処理対象のユーザの全ての行動履歴情報を参照してもよいし、直近の所定日数(例えば、30日~120日程度)の行動履歴情報だけを参照するといった一部のみを参照してもよい。
 制御部11は、S22で取得した行動履歴情報に基づいて、処理対象のユーザの行動対象となった各商品の商品特徴情報を、n次元空間にマッピングする(S23)。S23においては、制御部11は、商品データベースDB1を参照し、行動履歴情報に店舗ID及び商品IDが格納された商品の商品特徴情報を取得し、クラスタリングの観測データとして設定することになる。
 制御部11は、S23におけるマッピング結果に基づいて、各商品のクラスタリングを実行する(S24)。S24においては、制御部11は、先述したクラスタリングのアルゴリズムに基づいて、n次元空間にマッピングされた商品特徴情報のクラスタリングを実行する。制御部11は、各クラスタのクラスタ番号を発行し、処理対象のユーザのクラスタ情報にクラスタ番号を格納する。そして、制御部11は、n次元空間に商品特徴情報がマッピングされた各商品に対し、何れかのクラスタ番号を関連付ける。
 制御部11は、処理対象のユーザのクラスタ情報に基づいて、処理対象のクラスタを決定する(S25)。S25においては、制御部11は、クラスタ番号が最も若いクラスタを処理対象のクラスタとして決定してもよいし、クラスタ情報における最初のレコードに対応するクラスタを処理対象のクラスタとして決定してもよい。
 制御部11は、処理対象のクラスタに属する各商品の商品特徴情報に基づいて、処理対象のクラスタのユーザ特徴情報を取得する(S26)。S26においては、制御部11は、処理対象のクラスタに属する各商品の商品特徴情報の平均値を、処理対象のクラスタのユーザ特徴情報として取得する。
 制御部11は、全てのクラスタについてユーザ特徴情報を取得したか否かを判定する(S27)。S27においては、制御部11は、S24のクラスタリングでクラスタ番号が生成された複数のクラスタの全てに対し、S26の処理を実行したか否かを判定することになる。
 ユーザ特徴情報を取得していないクラスタがあると判定された場合(S27;N)、S26の処理に戻り、次のクラスタのユーザ特徴情報が取得される。以降、制御部11は、処理対象のユーザに対して取得された全てのクラスタのユーザ特徴情報を取得するまで、S26の処理を繰り返す。
 一方、全てのクラスタについてユーザ特徴情報を取得したと判定された場合(S27;Y)、制御部11は、全てのユーザに対し、クラスタリングを実行したか否かを判定する(S28)。
 クラスタリングを実行していないユーザがいると判定された場合(S28;N)、S21の処理に戻り、次の処理対象のユーザに対し、クラスタリングが実行される。以降、制御部11は、次の処理対象のユーザに対して取得された全てのクラスタのユーザ特徴情報を取得する。一方、全てのユーザについてクラスタリングを実行したと判定された場合(S28;Y)、S2の処理は終了してS3の処理に移行する。
 制御部11は、商品データベースDB1とクーポンデータベースDB3とに基づいて、クーポンと商品特徴情報とを関連付けて(S3)、本処理は終了する。S3においては、制御部11は、クーポンデータベースDB3を参照し、現時点で登録されているクーポンを特定する。制御部11は、特定したクーポンの店舗IDと商品IDを参照し、商品データベースDB1に格納された商品特徴情報を取得し、クーポンデータベースDB3に格納する。
[4-2.クーポン提示処理]
 図9は、クーポン提示処理を示すフロー図である。クーポン提示処理は、制御部11が、記憶部12に記憶されたプログラムに従って動作し、制御部21が、記憶部22に記憶されたプログラムに従って動作することによって実行される。
 図9に示すように、まず、ユーザ端末20において、ユーザが操作部24から所定の操作を行うと、制御部21は、サーバ10に対し、ユーザIDとともにアクセス要求を送信する(S31)。アクセス要求は、所定形式の要求であればよく、例えば、仮想市場のトップページや商品ページなどの表示要求である。ウェブブラウザ内でページを表示させる場合には、アクセス要求はページのURLを含んでもよいし、アプリケーション内でページを表示させる場合には、アクセス要求はページを識別するIDを含んでもよい。なお、ユーザIDは、予め記憶部22に記憶されていてもよいし、操作部24から入力されてもよい。
 サーバ10においては、ユーザIDとアクセス要求を受信すると、制御部11は、ユーザデータベースDB2を参照し、アクセス要求をしたユーザのクラスタ情報を取得する(S32)。S32においては、制御部11は、アクセス要求とともに受信したユーザIDが格納されたレコードのクラスタ情報を取得する。
 制御部11は、S32で取得したクラスタ情報と、クーポンデータベースDB3と、に基づいて、ユーザに提示すべきクーポン情報を決定する(S33)。S33においては、制御部11は、重み係数、行動種類情報、及び行動時間情報に基づいて、各クラスタのクーポン情報の数を決定する。そして、制御部11は、クラスタごとに、当該クラスタのユーザ特徴情報と商品特徴情報との距離が近い順に所定個数だけクーポンを取得する。
 制御部11は、S33で決定したクーポン情報を含むページの表示データを生成し、ユーザ端末20に送信する(S34)。S34においては、制御部11は、S33で決定したクーポン情報を、仮想市場のトップページや商品ページなどに埋め込む。
 ユーザ端末20においては、表示データを受信すると、制御部21は、受信した表示データに基づいて、クーポン情報を含むページを表示部25に表示させ(S35)、本処理は終了する。
 図10は、クーポン情報を含むページの画面例を示す図である。図10に示す例では、仮想市場のトップページPにクーポン情報CP1~CP2が埋め込まれた場合を示している。クーポン情報CP1~CP2は、それぞれ、クーポン対象の商品の画像、クーポンの適用期間、クーポンの内容、クーポン対象の店舗といった情報を含む。例えば、トップページPからユーザが選択したクーポン情報を獲得することができる。
 以上説明した情報処理システム1によれば、ユーザの行動対象になった各商品のクラスタリング結果に基づいて、ユーザの嗜好をより細かく分析したうえでクーポン情報を提示するので、ユーザに提示するクーポン情報の精度を高めることができる。例えば、従来の技術では、分野に関係なくユーザの嗜好を示す情報を算出していたため、ある分野における嗜好と、他の分野における嗜好と、を平均化すると、互いの特徴が相殺されてしまい、全く関係のない商品を示す特徴量となってしまう可能性があったが、ユーザごとにクラスタを設定することで、ユーザの嗜好をより細かく分析し、クーポン情報の精度を高めることが可能となる。また例えば、ユーザの好みの商品が複数のカテゴリにまたがって存在することがあるが、クラスタリングによって、これら複数のカテゴリをまたぐようなクラスタを設定することができ、クラスタによって、ユーザの好みを漏れなく特定することができる。これとは逆に、ユーザが、あるカテゴリ内の商品全部を好むのではなく、このカテゴリ内の特定分野の商品のみを好む場合には、カテゴリは広すぎてユーザの嗜好をピンポイントで表すものとはならないが、クラスタは、このような場合であっても、ユーザの嗜好をピンポイントで表すことができる。このため、クラスタは、ユーザ固有の嗜好を表現したものとなるので、ユーザに提示するクーポン情報の精度を高めることができる。
 また、情報処理システム1は、クラスタごとに取得したユーザ特徴情報に基づいてクーポン情報を提示し、より簡易な処理によってクーポン情報の精度を高めることができるので、情報処理システム1の処理負荷を軽減することができる。
 また、ユーザ特徴情報と商品特徴情報とをそれぞれベクトルで示し、各クラスタのユーザ特徴情報が示すベクトルと、各商品の商品特徴情報が示すベクトルと、の比較結果に基づいてクーポン情報を提示し、より簡易な処理によってクーポン情報の精度を高めることができるので、情報処理システム1の処理負荷を効果的に軽減することができる。また、ユーザ特徴情報と商品特徴情報の各々を、ベクトルという簡易な形式を利用することで、情報処理システム1内のメモリ消費量を抑制することもできる。
 また、各クラスタのユーザ特徴情報を、当該クラスタ内の商品の商品特徴情報の平均値とすることで、ユーザ特徴情報の精度が向上するので、ユーザに提示するクーポン情報の精度を効果的に高めることができる。また、より簡易な処理によってユーザ特徴情報を取得することができるので、ユーザ特徴情報を取得するための情報処理システム1の処理負荷を軽減することができる。
 また、各クラスタのユーザ特徴情報との比較対象として、当該クラスタ内の商品の商品特徴情報とすることによって、比較対象となる商品が少なくなるので、情報処理システム1の処理負荷を軽減することができる。また、比較対象となる商品が少なくなることで、クーポン情報を提示する処理を高速化することもできる。
 また、各ユーザの行動履歴情報から各商品の商品特徴情報を取得することで、ユーザの行動を踏まえた商品特徴情報とすることができ、商品特徴情報の精度が向上するので、ユーザに提示するクーポン情報の精度を効果的に高めることができる。
 また、商品特徴情報に商品のカテゴリを含めておくことで、商品特徴情報の精度が向上するので、ユーザに提示するクーポン情報の精度を効果的に高めることができる。
 また、各ユーザの行動履歴情報に基づいてクラスタサイズを変化させることで、商品特徴情報が密集している部分については、より細かなクラスタを設定するといったことが可能となり、クラスタの精度が向上するので、ユーザに提示するクーポン情報の精度を効果的に高めることができる。
 また、ユーザの行動の種類に基づいてクーポン情報を提示することで、ユーザに提示するクーポン情報の精度を効果的に高めることができる。
 また、各商品に対するユーザの行動時間に基づいてクーポン情報を提示することで、ユーザに提示するクーポン情報の精度を効果的に高めることができる。
 また、ユーザに提示する情報として、各商品のクーポン情報を提示することによって、ユーザにとって有益な情報を提示することができる。
 また、データ項目として、商品に関するデータ項目とすることで、商品を購入するユーザに有益な情報を提示することができる。
[5.変形例]
 なお、本発明は、以上に説明した実施の形態に限定されるものではない。本発明の趣旨を逸脱しない範囲で、適宜変更可能である。
 例えば、クラスタごとにユーザ特徴情報が取得される場合を説明したが、特にユーザ特徴情報が取得されなくてもよい。この場合、提示部104は、各クラスタに含まれる商品のうちの任意の商品特徴情報に基づいて、クーポン情報を提示すべき商品を決定してもよい。また例えば、提示部104は、各クラスタに含まれる商品のうちの少なくとも1つの商品を、クーポン情報の提示対象としてもよい。
 また例えば、商品情報は、クーポン情報ではなく、リコメンド情報であってもよい。例えば、提示部104は、ユーザがサーバ10にアクセスした場合に、トップページ又は商品ページ内にリコメンド対象の商品の画像を表示させてもよい。また例えば、提示部104は、リコメンド対象の商品のURLを含む電子メールを送信してもよいし、リコメンド対象の商品のURLを含むメッセージ又はプッシュ通知を表示部25に表示させてもよい。
 また例えば、データ項目は、商品に関するデータ項目でなくてもよい。例えば、本発明に係る処理を、サービスに関するデータ項目に適用してもよい。この場合、実施形態で「商品」と記載した箇所は「サービス」と読み替えることができる。例えば、データ項目特徴情報は、サービスの特徴に関するサービス特徴情報となり、各サービスに対するユーザの行動履歴に関する情報となる。クラスタリング部103は、行動履歴情報が示す各サービスのサービス特徴情報に基づいて、各サービスのクラスタリングを行う。提示部104は、複数のサービスのうちの少なくとも1つに関するサービス情報を、ユーザに提示する。例えば、提示部104は、サービスのクーポン情報又はリコメンド情報を所定のページに埋め込んで提示する。
 また例えば、本発明に係る処理を、コンテンツに関するデータ項目に適用してもよい。この場合、実施形態で「商品」と記載した箇所は「コンテンツ」と読み替えることができる。例えば、データ項目特徴情報は、コンテンツの特徴に関するサービス特徴情報となり、各コンテンツに対するユーザの行動履歴に関する情報となる。クラスタリング部103は、行動履歴情報が示す各コンテンツのコンテンツ特徴情報に基づいて、各コンテンツのクラスタリングを行う。提示部104は、複数のコンテンツのうちの少なくとも1つに関するサービス情報を、ユーザに提示することになる。例えば、提示部104は、コンテンツのクーポン情報又はリコメンド情報を所定のページに埋め込んで提示する。
 また例えば、第1取得部101、第2取得部102、クラスタリング部103、及び提示部104は、それぞれユーザ端末20で実現されるようにしてもよい。この場合、これら各機能は、制御部11を主として実現される。例えば、第1取得部101は、ネットワークを介してサーバ10から商品特徴情報を取得すればよい。また例えば、第2取得部102は、ネットワークを介してサーバ10から行動履歴情報を取得すればよい。また例えば、クラスタリング部103は、これら取得された商品特徴情報と行動履歴情報とに基づいて、クラスタリングを実行すればよい。また例えば、提示部104は、ネットワークを介してサーバ10から受信した情報に基づいて、商品情報を提示すればよい。

Claims (14)

  1.  複数のデータ項目の各々の特徴に関するデータ項目特徴情報を取得する第1取得手段と、
     各データ項目に対するユーザの行動履歴に関する行動履歴情報を取得する第2取得手段と、
     前記行動履歴情報が示す各データ項目の前記データ項目特徴情報に基づいて、各データ項目のクラスタリングを行うクラスタリング手段と、
     前記クラスタリング手段の処理結果に基づいて、前記複数のデータ項目のうちの少なくとも1つに関するデータ項目情報を、前記ユーザに提示する提示手段と、
     を含むことを特徴とする情報処理システム。
  2.  前記クラスタリング手段は、クラスタごとに、当該クラスタに属する各データ項目の前記データ項目特徴情報に基づいて、ユーザ特徴情報を取得し、
     前記提示手段は、各クラスタの前記ユーザ特徴情報と、各データ項目の前記データ項目特徴情報と、に基づいて、前記データ項目情報を提示する、
     ことを特徴とする請求項1に記載の情報処理システム。
  3.  各クラスタの前記ユーザ特徴情報と、各データ項目の前記データ項目特徴情報と、はそれぞれベクトルで示されており、
     前記提示手段は、各クラスタの前記ユーザ特徴情報が示すベクトルと、各データ項目の前記データ項目特徴情報が示すベクトルと、の比較結果に基づいて、前記データ項目情報を提示する、
     ことを特徴とする請求項2に記載の情報処理システム。
  4.  前記クラスタリング手段は、各クラスタに属する各データ項目の前記データ項目特徴情報が示すベクトルの平均値を、当該クラスタの前記ユーザ特徴情報として取得する、
     ことを特徴とする請求項3に記載の情報処理システム。
  5.  前記提示手段は、前記複数のデータ項目のうち、各クラスタ内のデータ項目の前記データ項目特徴情報を、当該クラスタの前記ユーザ特徴情報との比較対象とする、
     ことを特徴とする請求項3又は4の何れかに記載の情報処理システム。
  6.  前記第1取得手段は、複数のユーザの各々の前記行動履歴情報に基づいて、各データ項目の前記データ項目特徴情報を取得する、
     ことを特徴とする請求項1~5の何れかに記載の情報処理システム。
  7.  各データ項目の前記データ項目特徴情報は、予め設定された当該データ項目の分類情報を含む、
     ことを特徴とする請求項1~6の何れかに記載の情報処理システム。
  8.  前記クラスタリング手段は、前記行動履歴情報に基づいて、クラスタサイズを変化させる、
     ことを特徴とする請求項1~7の何れかに記載の情報処理システム。
  9.  前記行動履歴情報は、各データ項目に対する前記ユーザの行動の種類に関する行動種類情報を含み、
     前記提示手段は、前記行動種類情報に更に基づいて、前記データ項目情報を提示する、
     ことを特徴とする請求項1~8の何れかに記載の情報処理システム。
  10.  前記行動履歴情報は、各データ項目に対する前記ユーザの行動時間に関する行動時間情報を含み、
     前記提示手段は、前記行動時間情報に更に基づいて、前記データ項目情報を提示する、
     ことを特徴とする請求項1~9の何れかに記載の情報処理システム。
  11.  前記データ項目情報は、前記複数のデータ項目の少なくとも1つに関するクーポン情報又はリコメンド情報である、
     ことを特徴とする請求項1~10の何れかに記載の情報処理システム。
  12.  各データ項目は、商品に関するデータ項目であり、
     前記第1取得手段は、複数の商品の各々の特徴に関する前記データ項目特徴情報を取得し、
     前記第2取得手段は、各商品に対する前記ユーザの行動履歴に関する前記行動履歴情報を取得し、
     前記クラスタリング手段は、前記行動履歴情報が示す各商品の前記データ項目特徴情報に基づいて、各商品のクラスタリングを行い、
     前記提示手段は、前記複数の商品のうちの少なくとも1つに関する前記データ項目情報を前記ユーザに提示する、
     ことを特徴とする請求項1~11の何れかに記載の情報処理システム。
  13.  複数のデータ項目の各々の特徴に関するデータ項目特徴情報を取得する第1取得ステップと、
     各データ項目に対するユーザの行動履歴に関する行動履歴情報を取得する第2取得ステップと、
     前記行動履歴情報が示す各データ項目の前記データ項目特徴情報に基づいて、各データ項目のクラスタリングを行うクラスタリングステップと、
     前記クラスタリングステップの処理結果に基づいて、前記複数のデータ項目のうちの少なくとも1つに関するデータ項目情報を、前記ユーザに提示する提示ステップと、
     を含むことを特徴とする情報処理方法。
  14.  複数のデータ項目の各々の特徴に関するデータ項目特徴情報を取得する第1取得手段、
     各データ項目に対するユーザの行動履歴に関する行動履歴情報を取得する第2取得手段、
     前記行動履歴情報が示す各データ項目の前記データ項目特徴情報に基づいて、各データ項目のクラスタリングを行うクラスタリング手段、
     前記クラスタリング手段の処理結果に基づいて、前記複数のデータ項目のうちの少なくとも1つに関するデータ項目情報を、前記ユーザに提示する提示手段、
     としてコンピュータを機能させるためのプログラム。
PCT/JP2018/005315 2018-02-15 2018-02-15 情報処理システム、情報処理方法、及びプログラム WO2019159288A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019519354A JP6805340B2 (ja) 2018-02-15 2018-02-15 情報処理システム、情報処理方法、及びプログラム
PCT/JP2018/005315 WO2019159288A1 (ja) 2018-02-15 2018-02-15 情報処理システム、情報処理方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/005315 WO2019159288A1 (ja) 2018-02-15 2018-02-15 情報処理システム、情報処理方法、及びプログラム

Publications (1)

Publication Number Publication Date
WO2019159288A1 true WO2019159288A1 (ja) 2019-08-22

Family

ID=67619798

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2018/005315 WO2019159288A1 (ja) 2018-02-15 2018-02-15 情報処理システム、情報処理方法、及びプログラム

Country Status (2)

Country Link
JP (1) JP6805340B2 (ja)
WO (1) WO2019159288A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110909222A (zh) * 2019-10-12 2020-03-24 中国平安人寿保险股份有限公司 基于聚类的用户画像建立方法、装置、介质及电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014502392A (ja) * 2010-11-25 2014-01-30 サムスン エレクトロニクス カンパニー リミテッド コンテンツ提供方法及びそのシステム
JP2016103107A (ja) * 2014-11-27 2016-06-02 株式会社豊田中央研究所 クラスタリング装置、情報端末、情報提示システム、及びプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011060182A (ja) * 2009-09-14 2011-03-24 Aim Co Ltd コンテンツ選択システム
JP5358395B2 (ja) * 2009-10-27 2013-12-04 株式会社日立ソリューションズ ユーザ嗜好適合アイテム推薦装置
JP2015088089A (ja) * 2013-11-01 2015-05-07 株式会社Nttドコモ レコメンドサーバ及びレコメンド方法
US20150293925A1 (en) * 2014-04-09 2015-10-15 Apple Inc. Automatic generation of online media stations customized to individual users

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014502392A (ja) * 2010-11-25 2014-01-30 サムスン エレクトロニクス カンパニー リミテッド コンテンツ提供方法及びそのシステム
JP2016103107A (ja) * 2014-11-27 2016-06-02 株式会社豊田中央研究所 クラスタリング装置、情報端末、情報提示システム、及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110909222A (zh) * 2019-10-12 2020-03-24 中国平安人寿保险股份有限公司 基于聚类的用户画像建立方法、装置、介质及电子设备
CN110909222B (zh) * 2019-10-12 2023-07-25 中国平安人寿保险股份有限公司 基于聚类的用户画像建立方法、装置、介质及电子设备

Also Published As

Publication number Publication date
JP6805340B2 (ja) 2020-12-23
JPWO2019159288A1 (ja) 2020-04-02

Similar Documents

Publication Publication Date Title
US10769702B2 (en) Recommendations based upon explicit user similarity
US9904949B1 (en) Product recommendations
US10198520B2 (en) Search with more like this refinements
WO2015034850A2 (en) Feature selection for recommender systems
US9817846B1 (en) Content selection algorithms
WO2012003580A1 (en) Consumer, retailer and supplier computing systems and methods
JP2005135071A (ja) 商品購入における信頼値の算出方法及び装置
WO2017158798A1 (ja) 情報処理装置、情報配信システム、情報処理方法、および情報処理プログラム
US20090024489A1 (en) Reputation based display
JP6805340B2 (ja) 情報処理システム、情報処理方法、及びプログラム
JP5293970B2 (ja) 商品推奨方法及び商品推奨システム
JP6655223B1 (ja) 情報処理システム、情報処理方法、及びプログラム
KR20140056307A (ko) 사용자 맞춤형 광고 제공 기법
JP6585998B2 (ja) コンテンツ決定装置
KR101983704B1 (ko) 개인화 알고리즘을 이용한 사이트 추천 방법 및 개인화 알고리즘 서버
JP7318071B1 (ja) 情報処理装置、情報処理方法、および情報処理プログラム
Ramampiaro et al. New ideas in ranking for personalized fashion recommender systems
JP7167370B1 (ja) 情報処理装置、情報処理方法、および情報処理プログラム
JP7249446B1 (ja) 情報処理装置、情報処理方法、および情報処理プログラム
JP7183465B1 (ja) 情報処理プログラム、情報処理方法、および端末装置
JP2019204208A (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
KR102545366B1 (ko) 빅데이터를 처리하여 구매자에게 수면용품을 자동으로 추천하는 오픈마켓 플랫폼의 운영방법
JP7489255B2 (ja) 情報提供装置
JP6269864B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
US20220301013A1 (en) Systems and methods for establishing data linkages

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2019519354

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18906139

Country of ref document: EP

Kind code of ref document: A1