WO2023119499A1 - 情報処理システム、情報処理方法及びプログラム - Google Patents

情報処理システム、情報処理方法及びプログラム Download PDF

Info

Publication number
WO2023119499A1
WO2023119499A1 PCT/JP2021/047625 JP2021047625W WO2023119499A1 WO 2023119499 A1 WO2023119499 A1 WO 2023119499A1 JP 2021047625 W JP2021047625 W JP 2021047625W WO 2023119499 A1 WO2023119499 A1 WO 2023119499A1
Authority
WO
WIPO (PCT)
Prior art keywords
person
interest
relationship
data
introduction
Prior art date
Application number
PCT/JP2021/047625
Other languages
English (en)
French (fr)
Inventor
サティアン アブロール
勇宇 平手
絢一郎 山田
智彦 山下
マノゥチ コンダパカ
Original Assignee
楽天グループ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 楽天グループ株式会社 filed Critical 楽天グループ株式会社
Priority to JP2022573527A priority Critical patent/JP7312923B1/ja
Priority to PCT/JP2021/047625 priority patent/WO2023119499A1/ja
Priority to TW111145817A priority patent/TWI839978B/zh
Publication of WO2023119499A1 publication Critical patent/WO2023119499A1/ja
Priority to JP2023112881A priority patent/JP2023126971A/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Definitions

  • the present invention relates to an information processing system, an information processing method, and a program.
  • referral campaigns are sometimes held that give benefits to certain users when they introduce other users.
  • Japanese National Publication of International Patent Application No. 2014-529110 discloses a coupon system that includes a promoter module that determines promoter candidates for electronic coupons and a user module that determines electronic coupon use candidates.
  • the Promoter Module may also identify a Candidate Promoter based on whether the Candidate Promoter has friends who may be influenced and thus easily induced to use the product or service via an electronic coupon shared by the Candidate Promoter. Determining a person (see paragraph 0019) is disclosed.
  • the present invention has been made in view of the above problems, and its object is to provide a technique for improving the success rate when requesting a user to introduce another user.
  • An information processing system determines a relationship specifying means for specifying the type of relationship between a person of interest and a reference person, and a criterion corresponding to the type of relationship between the person of interest and the reference person.
  • a criterion determining means for determining a closeness score indicating the closeness between the person of interest and the reference person based on an index indicating the strength of the relationship between the person of interest and the reference person according to the determined criteria
  • input data including proximity score determination means for determining; attributes of said person of interest; attributes of said reference person; and said relationship type and said proximity score for pairs of said person of interest and said reference person
  • introduction success/failure estimation means for estimating the probability that the reference person will accept the introduction when the person of interest introduces a product or service to the reference person based on the result of estimation by the introduction success/failure estimation means
  • introduction request means for transmitting information requesting an introduction to the person of interest based on the above.
  • An information processing method includes a step of identifying a type of relationship between a person of interest and a reference person; a step of determining a criterion corresponding to the type of relationship between the person of interest and the reference person; Determining a proximity score indicating the proximity between the person of interest and the reference person based on an index indicating the strength of the relationship between the person of interest and the reference person according to the determined criterion; Based on input data including attributes of the person of interest, attributes of the reference person, and the relationship type and the proximity score for pairs of the person of interest and the reference person, the person of interest a step of estimating the probability that the reference person will accept the introduction when a product or service is introduced to the reference person; and sending.
  • a program includes relationship specifying means for specifying the type of relationship between a person of interest and a reference person, and criteria determination means for determining criteria corresponding to the type of relationship between the person of interest and the reference person. , determining a closeness score indicating the closeness between the person of interest and the reference person based on an index indicating the strength of the relationship between the person of interest and the reference person according to the determined criteria; score determining means, based on input data including attributes of the person of interest, attributes of the reference person, and the relationship type and the proximity score for pairs of the person of interest and the reference person; introduction success/failure estimation means for estimating the probability that the reference person will accept the introduction when the person of interest introduces a product or service to the reference person; and based on the result of estimation by the introduction success/failure estimation means,
  • the computer is caused to function as introduction requesting means for transmitting information requesting an introduction to the person of interest.
  • the relationship identifying means includes any of candidates including at least some of parent and child, spouse, sibling, colleague, neighbor, and friend as the type of relationship. can be selected.
  • the introduction success/failure estimation means includes attributes of an introduction requesting person, attributes of an introduced person, the type of relationship and the closeness of a pair of the introduction requesting person and the introduced person.
  • the reference person accepts the referral by inputting the input data into a referral success/failure estimation model, which is a machine learning model trained using learning data including a score and correct data indicating whether the referral was successful. Probability may be estimated.
  • the index indicating the strength of the relationship between the person of interest and the reference person includes the number of friends in common between the person of interest and the reference person, the number of common friends between the person of interest and the reference person, or the frequency of sending gifts between the person of interest and the reference person.
  • the criterion determination means determines a proximity score determination model, which is a machine learning model, according to the type of relationship between the person of interest and the reference person, and the proximity score evaluation means , the proximity score may be determined based on an output when a proximity score determination model is input with an index indicating the strength of the relationship between the person of interest and the reference person.
  • the relationship identifying means includes attribute data of the person of interest registered in a first computer system, attribute data of the reference person registered in a second computer system, The type of relationship between the person-of-interest and the reference person may be identified based on.
  • the relationship identifying means determines the attention based on at least part of surname identity, IP address identity, address similarity, age difference, and gender identity. A type of relationship between a person and said reference person may be identified.
  • FIG. 1 is a diagram showing an example of the overall configuration of an information processing system according to one embodiment of the present invention
  • FIG. 1 is a functional block diagram showing an example of functions of an information processing system according to an embodiment of the present invention
  • FIG. 4 is a diagram schematically showing an example of common IP address data values; It is a figure which shows an example of graph data.
  • FIG. 4 is a diagram schematically showing an example of common address data values; It is a figure which shows an example of graph data.
  • FIG. 4 is a diagram schematically showing an example of common credit card number data values; It is a figure which shows an example of graph data. It is a figure which shows an example of graph data. It is a figure which shows an example of a cluster.
  • FIG. 10 is a diagram showing an example of classification visualization
  • FIG. 3 illustrates an example of proximity score determination using a machine learning model. It is a figure which shows an example of learning of a machine-learning model.
  • FIG. 4 is a flowchart showing an example of processing related to creating a social graph, which is performed in the information processing system according to one embodiment of the present invention;
  • FIG. 4 is a flow diagram showing an example of processing of a learning unit performed in the information processing system according to one embodiment of the present invention;
  • FIG. 4 is a flow chart showing an example of processing of an estimation unit and an introduction request unit performed in the information processing system according to one embodiment of the present invention;
  • FIG. 1 is a diagram showing an example of the overall configuration of an information processing system 1 according to one embodiment of the present invention.
  • an information processing system 1 is a computer such as a server computer or a personal computer, and includes a processor 10, a storage unit 12, a communication unit 14, an operation unit 16, and an output unit. 18 included.
  • the information processing system 1 according to this embodiment may include a plurality of computers.
  • the processor 10 is, for example, a program-controlled device such as a microprocessor that operates according to a program installed in the information processing system 1.
  • Information processing system 1 may include one or more processors 10 .
  • the storage unit 12 is, for example, a storage element such as ROM or RAM, a hard disk drive (HDD), a solid state drive (SSD) including flash memory, or the like.
  • the storage unit 12 stores programs and the like executed by the processor 10 .
  • the communication unit 14 is a communication interface for wired communication or wireless communication, such as a network interface card, and exchanges data with other computers or terminals via a computer network such as the Internet.
  • the operation unit 16 is an input device, and includes, for example, a touch panel, a pointing device such as a mouse, a keyboard, and the like.
  • the operation unit 16 transmits operation contents to the processor 10 .
  • the output unit 18 is, for example, a display such as a liquid crystal display unit or an organic EL display unit, or an output device such as an audio output device such as a speaker.
  • the programs and data described as being stored in the storage unit 12 may be supplied from another computer via a network.
  • the hardware configuration of the information processing system 1 is not limited to the above example, and various hardware can be applied.
  • the information processing system 1 includes a reading unit (for example, an optical disk drive or a memory card slot) for reading a computer-readable information storage medium, and an input/output unit (for example, a USB port) for inputting/outputting data with an external device. may be included.
  • programs and data stored in an information storage medium may be supplied to the information processing system 1 via a reading section or an input/output section.
  • a campaign or the like in which the introduced person (also referred to as a reference person) is the target of the introduction is determined, and based on the probability, a request for an introduction, such as a campaign, is sent to the person of interest.
  • the acceptance by the introduced person may mean that the introducer sends an introduction to a campaign or the like and the introduced person receives the introduction. It may be performing a predetermined action such as purchasing a service or product or joining a membership.
  • the magnitude of probability is a kind of information indicating the success or failure of the introduction.
  • FIG. 2 is a functional block diagram showing an example of functions implemented in the information processing system 1 according to this embodiment. Note that the information processing system 1 according to the present embodiment does not need to implement all the functions shown in FIG. 2, and functions other than the functions shown in FIG. 2 may be installed.
  • the information processing system 1 functionally includes a person attribute data acquisition unit 20, a graph data generation unit 22, a reference person identification unit 24, a relationship identification unit 26, a method determination unit, 30 , a closeness score determining unit 28 , a learning unit 32 , an estimating unit 34 , an introduction requesting unit 36 , and a related storage unit 39 .
  • the personal attribute data acquisition unit 20, the graph data generation unit 22, the reference person identification unit 24, the relationship identification unit 26, and the closeness score determination unit 28 mainly perform social analysis including user pairs and relationships between users in the pairs. This is a function for creating graphs.
  • the estimating unit 34 has a function of estimating the degree of probability that the introduced person will accept the campaign or the like that is the target of the introduction when a certain person becomes the introducer. This is a function for learning a learning model (referral success/failure estimation model).
  • the personal attribute data acquisition unit 20 and the introduction request unit 36 are mainly implemented by the processor 10, the storage unit 12 and the communication unit 14.
  • the graph data generation unit 22 , reference person identification unit 24 , relationship identification unit 26 , technique determination unit 30 , proximity score determination unit 28 , and estimation unit 34 are mainly implemented by processor 10 and storage unit 12 .
  • the association storage unit 39 is mainly implemented by the storage unit 12 .
  • the functions described above may be implemented by causing the processor 10 to execute a program installed in the information processing system 1, which is a computer, and including execution instructions corresponding to the functions described above. Also, this program may be supplied to the information processing system 1 via a computer-readable information storage medium such as an optical disk, a magnetic disk, or a flash memory, or via the Internet or the like.
  • a computer-readable information storage medium such as an optical disk, a magnetic disk, or a flash memory, or via the Internet or the like.
  • the information processing system 1 can communicate with a plurality of computer systems such as, for example, an electronic commerce system 40, a golf course reservation system 42, a travel reservation system 44, a card management system 46 (FIG. 3). , FIGS. 5 and 7). Each of these computer systems is registered with account data, which is information about users who use the computer system. The information processing system 1 can access these computer systems and acquire account data registered in the computer systems.
  • a plurality of computer systems such as, for example, an electronic commerce system 40, a golf course reservation system 42, a travel reservation system 44, a card management system 46 (FIG. 3). , FIGS. 5 and 7).
  • Each of these computer systems is registered with account data, which is information about users who use the computer system.
  • the information processing system 1 can access these computer systems and acquire account data registered in the computer systems.
  • Account data includes, for example, user ID, name data, address data, age data, gender data, phone number data, mobile phone number data, credit card number data, IP address data, and the like.
  • the user ID is, for example, identification information of the user in the computer system.
  • the name data is, for example, data indicating the user's name (surname (surname) and given name).
  • the address data is, for example, data indicating the address of the user. When the computer system is the electronic commerce system 40, the address data may indicate the address of the delivery destination of the product purchased by the user.
  • Age data is, for example, data indicating the age of the user.
  • Gender data is, for example, data indicating the gender of the user.
  • the telephone number data is, for example, data indicating the telephone number of the user.
  • the mobile phone number data is, for example, data indicating the mobile phone number of the user.
  • the credit card number data is, for example, data indicating the card number of the credit card used by the user for payment in the computer system.
  • the IP address data is, for example, data indicating the IP address of the computer used by the user (for example, the IP address of the sender).
  • the person attribute data acquisition unit 20 acquires person attribute data indicating attributes of a plurality of persons including a person of interest.
  • An example of the personal attribute data is the account data described above.
  • the person attribute data acquisition unit 20 acquires account data of the person, for example, from each of the plurality of systems described above.
  • the graph data generation unit 22 identifies pairs of persons who are related to each other, for example, based on the attributes of each of the plurality of persons.
  • the graph data generator 22 may identify pairs of persons who are related to each other based on the person attribute data of a plurality of persons.
  • the graph data generation unit 22 according to the present embodiment corresponds to an example of pair identification means for identifying a pair of persons who are related to each other based on the attributes of each of a plurality of persons described in the claims. .
  • the graph data generation unit 22 generates, for example, graph data including node data 50 associated with a plurality of persons including a person of interest, and link data 52 associated with a pair of mutually related persons ( 4, 6, 8 and 9).
  • the graph data generation unit 22 also stores the generated graph data in the association storage unit 39 .
  • user A's account data is registered in the electronic commerce system 40, as shown in FIG. It is also assumed that user B's account data is registered in the golf course reservation system 42 . It is also assumed that user C's account data is registered in the travel reservation system 44 .
  • IP address data value of user A registered in the electronic commerce system 40 the IP address data value of user B registered in the golf course reservation system 42, and the IP address data value registered in the travel reservation system 44. Assume that the IP address data values of user C are the same.
  • the graph data generating unit 22 generates node data 50a associated with user A, node data 50b associated with user B, node data 50c associated with user C, and Graph data including link data 52a indicating a relationship with user B, link data 52b indicating a relationship between user A and user C, and link data 52c indicating a relationship between user B and user C. Generate.
  • the graph data generation unit 22 generates node data 50d associated with user D, node data 50e associated with user E, node data 50f associated with user F, and Graph data including link data 52d indicating a relationship with user E, link data 52e indicating a relationship between user D and user F, and link data 52f indicating a relationship between user E and user F. Generate.
  • user G's account data is registered in the electronic commerce system 40 . It is also assumed that user H's account data is registered in the golf course reservation system 42 . It is also assumed that user I's account data is registered in the travel reservation system 44 .
  • the graph data generation unit 22 generates node data 50g associated with user G, node data 50h associated with user H, node data 50i associated with user I, and user G Graph data including link data 52g indicating a relationship with user H, link data 52h indicating a relationship between user G and user I, and link data 52i indicating a relationship between user H and user I Generate.
  • link indicated by the link data 52 that associates the persons identified as being related to each other, as described above, will be referred to as an explicit link.
  • a person connected to the first person by an explicit link and a person connected to the second person by an explicit link are a predetermined number or more (for example, three or more) in common.
  • the graph data generator 22 generates link data 52 indicating that the first person is related to the second person.
  • a link indicated by the link data 52 generated in this way is called an implicit link.
  • node data 50j associated with user J and node data 50k associated with user K are connected by link data 52j indicating an explicit link. It is also assumed that node data 50j associated with user J and node data 50l associated with user L are connected by link data 52k indicating an explicit link. It is also assumed that node data 50j associated with user J and node data 50m associated with user M are connected by link data 52l indicating an explicit link.
  • node data 50k associated with user K and node data 50n associated with user N are connected by link data 52m indicating an explicit link. It is also assumed that node data 50l associated with user L and node data 50n associated with user N are connected by link data 52n indicating an explicit link. It is also assumed that node data 50m associated with user M and node data 50n associated with user N are connected by link data 52o indicating an explicit link.
  • the graph data generator 22 generates link data 52p indicating that user J is related to user N (link data 52p indicating an implicit link). In this manner, user N is identified as a person who has a relationship with user J.
  • the graph data generator 22 may generate link data 52 (link data 52 indicating an implied link) indicating that the first person is related to the second person.
  • the graph data generation unit 22 may generate graph data based on personal attribute data different from account data.
  • the reference person identification unit 24 identifies a reference person who is related to the person to be processed (including the person of interest, for example).
  • the reference person identifying unit 24 identifies a person who is related to the person to be processed (for example, a person registered as a friend in the electronic commerce system 40 or the like), and a person who is identified as a person who is related to the person to be processed.
  • a person who has more than a predetermined number of (for example, registered friends) in common with the person to be processed may be specified as the reference person.
  • the reference person specifying unit 24 may specify the reference person from among the plurality of persons based on the attributes of the person to be processed and the attributes of the plurality of persons.
  • the reference person identification unit 24 identifies a person associated with the node data 50 connected by the link data 52 indicating an explicit link or an implicit link with the node data 50 associated with the person to be processed, as the person to be processed. It may be specified as a reference person for a person.
  • the relationship identifying unit 26 identifies the relationship between the person to be processed (including the person of interest, for example) and the reference person.
  • the relationship identifying unit 26 may identify the relationship between the person to be processed and the reference person based on the account data of the person to be processed and the account data of the reference person.
  • the computer system in which the account data of the person to be processed is registered may be different from the computer system in which the account data of the reference person is registered.
  • the person to be processed and the reference person A relationship (more specifically, a relationship type) may be specified.
  • the relationship specifying unit 26 may store the specified relationship in the relationship storage unit 39 in association with the pair of the person to be processed and the reference person.
  • the relationship identifying unit 26 may identify the family relationship between the person to be processed and the reference person (for example, parent and child, spouse, sibling). Further, the relationship identifying unit 26 may select one of candidates including at least part of parent and child, spouse, sibling, colleague, neighbor, and friend as the type of relationship to be identified.
  • the relationship identifying unit 26 identifies pairs of node data 50 connected by link data 52, for example. Then, the relationship identifying unit 26 generates pair attribute data associated with the pair based on the person attribute data of the two persons associated with the pair.
  • the pair attribute data includes, for example, IP common flag, address common flag, credit card number common flag, surname same flag, age difference data, pair gender data, and the like.
  • the pair attribute data relating to the person to be processed and the reference person may include information indicating the type of relationship specified by the relationship specifying unit 26 for the pair of the person to be processed and the reference person.
  • the common IP flag is, for example, a flag indicating whether or not the value of the IP address data included in one account data of the pair is the same as the value of the IP address data included in the other account data. . For example, if the IP address data values are the same on a given day, the IP common flag value is set to 1, and if the IP address data values are different, the IP common flag value is set to 0. good.
  • the common address flag is, for example, a flag that indicates whether or not the value of the address data included in one account data of the pair is the same as the value of the address data included in the other account data. For example, if the address data values are the same, the common address flag value may be set to 1, and if the address data values are different, the common address flag value may be set to 0.
  • the common credit card number flag indicates, for example, whether or not the value of credit card number data included in one account data of the pair is the same as the value of credit card number data included in the other account data. flag to indicate For example, if the credit card number data values are the same, the credit card number common flag value is set to 1, and if the credit card number data values are different, the credit card number common flag value is set to 0. good too.
  • the same surname flag is a flag that indicates, for example, whether the surname indicated by the name data included in one of the account data of the pair is the same as the surname indicated by the name data included in the other account data. . For example, if the surnames indicated by the name data are the same, the value of the same last name flag may be set to 1, and if the surnames indicated by the name data are different, the value of the same last name flag may be set to 0.
  • Age difference data is, for example, data that indicates the difference between the value of age data included in one account data of the pair and the value of age data included in the other account data.
  • Paired gender data is, for example, data that indicates a combination of a gender data value included in one account data of the pair and a gender data value included in the other account data.
  • the relationship identifying unit 26 performs clustering using a general clustering method based on the values of the pair attribute data associated with each of the plurality of pairs, thereby classifying the plurality of pairs as shown in FIG. are classified into a plurality of clusters 54 as shown in FIG.
  • FIG. 10 is a diagram schematically showing an example of how a plurality of pairs are classified into five clusters 54 (54a, 54b, 54c, 54d, and 54e).
  • the crosses shown in FIG. 10 correspond to pairs.
  • Each of the plurality of cross marks is arranged at a position associated with the value of the paired attribute data of the pair corresponding to the cross mark.
  • multiple pairs are classified into five clusters 54, but the number of clusters 54 into which multiple pairs are classified is not limited to five. 54 may be classified.
  • FIG. 11 is a diagram showing an example of visualization of the classification when multiple pairs are classified into four clusters 54 .
  • pairs having the same address, the same gender, an age difference greater than X years, and the same surname may be classified into the first cluster. Also, pairs having the same address, the same gender, an age difference of X years or less, and the same surname may be classified into the second cluster. Also, a pair having the same address, different gender, an age difference larger than Y years, and the same surname may be classified into the third cluster. Also, a pair having the same address, different gender, an age difference of Y years or less, and the same surname may be classified into the fourth cluster.
  • the first cluster is presumed to be, for example, the cluster 54 associated with the same-sex parent and child.
  • the second cluster is presumed to be the cluster 54 associated with siblings of the same sex, for example.
  • the third cluster is presumed to be the cluster 54 associated with the parent and child of the opposite sex, for example.
  • the fourth cluster is presumed to be the cluster 54 associated with married couples or opposite-sex siblings, for example.
  • the relationship identifying unit 26 may identify the relationship between the person to be processed and the reference person based on the clustering results based on the values associated with the relationship between the persons. In addition, the relationship identifying unit 26 determines the relationship between the person to be processed and the reference person based on the clustering result based on at least one of the surname, IP address, address, credit card number, age difference, and gender. Gender may be specified.
  • the closeness score determination unit 28 is based on criteria corresponding to the relationship between the person to be processed and the reference person and an index indicating the strength of the relationship between the person to be processed (including the person of interest, for example) and the reference person. , determine a proximity score that indicates the proximity of the person to be processed and the reference person.
  • the method determination unit 30 determines a criterion corresponding to the type selected as the relationship between the person to be processed and the reference person. More specifically, the technique determination unit 30 may determine a machine learning model for proximity score determination (closeness score determination model) to be used in the proximity score determination unit 28 as a criterion.
  • the closeness score determination unit 28 calculates the proximity score indicating the closeness between the processing target person and the reference person based on the index indicating the strength of the relationship between the processing target person and the reference person according to the determined criteria. determine the score.
  • the closeness score determination unit 28 also stores the determined closeness score in the association storage unit 39 in association with the pair of the person to be processed and the reference person.
  • the proximity score determination unit 28 may include trained machine learning models (closeness score determination models) associated with the clusters 54 described above. For example, if multiple pairs are classified into five clusters 54, the proximity score determiner 28 may include five machine learning models.
  • the closeness score determination unit 28 adds the strength of the relationship between the processing target person and the reference person to the learned machine learning model (closeness score determination model) corresponding to the relationship between the processing target person and the reference person.
  • a proximity score indicating the proximity between the person to be processed and the reference person may be determined based on the output when the data representing the index indicating the closeness is input.
  • the closeness score determination unit 28 assigns an input corresponding to the pair classified into the cluster 54 associated with the n-th machine learning model to the n-th machine learning model, which is the n-th machine learning model. You may enter data. For example, if the proximity score determination unit 28 includes five machine learning models, the above value n will be any integer between 1 and 5 inclusive. Then, the closeness score determination unit 28 may determine the value of the output data output from the n-th machine learning model in response to the input of the input data as the value of the closeness score for the pair. .
  • the input data associated with the pair may include, for example, part or all of the pair attribute data associated with the pair. Also, the input data may include data that is not included in the pair attribute data.
  • the input data may include data indicating the usage history of the electronic commerce system 40, data obtained by the proximity score determination unit 28 from other information sources such as SNS, and the like. More specifically, for example, the input data includes the number of calls (call frequency) per unit period between pairs, the number of messages exchanged, the number of gifts sent by one to the other, and the common (registered) Data indicating the number of friends, etc. may be included.
  • the types of data included in the input data associated with the pair may be the same or different depending on the cluster 54 to which the pair belongs. For example, the type of data included in the input data input to the first machine learning model and the type of data included in the input data input to the second machine learning model may be different.
  • the n-th machine learning model using a plurality of given training data associated with the n-th machine learning model in advance. Learning is performed.
  • This training data is, for example, prepared in advance so that the determination of the closeness score in the cluster 54 associated with the n-th machine learning model is valid.
  • weakly supervised learning may be performed on the n-th machine learning model.
  • the training data as shown in FIG. 13, learning input data containing the same type of data as the input data input to the n-th machine learning model, and teacher data (correct data) to be compared with the output data output from the learning model.
  • closeness score takes a value of either 0 or 1. For example, if the pair is closely related, then a closeness score value of 1 is determined for the pair; otherwise, a closeness score value of 0 is determined for the pair.
  • the teacher data may include data indicating a valid closeness score value in the corresponding learning input data and the probability that this value is valid.
  • the n-th Weakly supervised learning may be performed to update the values of the parameters of the machine learning model.
  • the closeness score described above does not have to be binary data that takes a value of either 0 or 1.
  • the above-mentioned closeness score is a real number (for example, a real number of 0 or more and 10 or less) that becomes a larger value as the pair has a closer relationship, or a multi-step integer value (for example, an integer of 1 or more and 10 or less). numerical value).
  • the learning method of the machine learning model is not limited to weakly supervised learning.
  • the input data associated with the pair is input to the trained machine learning model corresponding to the sibling relationship.
  • the value Learning may be performed such that output data in which is 1 is output.
  • the values of the address data are different for this pair, the number of gifts sent by one of the pair to the other is 2, and the number of calls made so far by this pair is 30, then the value Learning may be performed such that output data in which is 0 is output.
  • the criterion for example, threshold value
  • the machine learning model closeness score determination model
  • the estimating unit 34 determines whether the person of interest is the reference person based on the input data including the attributes of the person of interest, the attributes of the reference person, and the type of relationship and the similarity score for the pair of the person of interest and the reference person. Estimate the probability that the reference person will accept the referral if a product or service is introduced to the referral. Accepting a referral may mean, for example, that the referring person sends a referral email and the referring person receives it, or accesses the link described in the referral email received by the referring person. or establishment of a service contract triggered by the access.
  • the estimating unit 34 acquires the type of relationship specified by the relationship specifying unit 26 and the closeness score determined by the closeness score determining unit 28 for the pair of the person of interest and the reference person from the relationship storage unit 39. good. Note that the estimation unit 34 may estimate the probability based on at least part of the pair attribute data instead of the type of pair relationship.
  • the estimation unit 34 may estimate the probability using a machine learning model (referral success/failure estimation model). More specifically, the estimation unit 34 may estimate the probability that the reference person will accept the introduction based on the output when the input data is input to the introduction success/failure estimation model.
  • the referral success/failure estimation model may be, for example, a machine learning model such as Adaboost, random forest, neural network, support vector machine (SVM), nearest neighbor discriminator, or the like. Also, a machine learning model using so-called Deep Learning may be constructed as a referral success/failure estimation model.
  • the learning unit 32 acquires the attributes of the introduction requesting person, the attributes of the introduced person, the relationship type and closeness score obtained for the pair of the introduction requesting person and the introduced person, and whether or not the introduction was successful.
  • a referral success/failure estimation model is learned using training data including correct data indicating . Details of the processing of the learning unit 32 will be described later.
  • the introduction requesting unit 36 transmits information requesting an introduction to the person of interest based on the result of the estimation by the estimation unit 34 . For example, when the probability estimated by the estimation unit 34 is equal to or greater than a predetermined threshold, the introduction request unit 36 may send a message to the attention person's e-mail or messenger address as a request.
  • This message includes text requesting introduction to the person of interest, and may include, for example, a message that the person of interest can transfer to any other party, or the person of interest instructs the information processing system 1 to introduce the person to be introduced.
  • FIG. 14 mainly explains the processing of the reference person identification unit 24, the relationship identification unit 26, and the closeness score determination unit 28.
  • the processing described in FIG. 14 is repeatedly executed for each person for whom graph data has been generated.
  • a person for whom graph data is generated includes a person of interest, and a person to be processed in FIG. 14 is hereinafter referred to as a person to be processed.
  • graph data for a plurality of persons including a person of interest has already been generated, and for a plurality of pairs, clusters 54 associated with the pairs have been specified.
  • machine learning model closeness score determination model
  • the reference person identification unit 24 identifies, as a reference person, the person corresponding to the node data 50 connected to the node data 50 corresponding to the person to be processed by an explicit link or an implicit link (S101).
  • an explicit link or an implicit link S101
  • the relationship identifying unit 26 selects one reference person for whom the processes shown in S104 to S108 have not yet been executed from among the reference persons identified in the process shown in S101 (S103).
  • the relationship identifying unit 26 identifies the cluster 54 corresponding to the pair of the person to be processed and the reference person selected in the process shown in S102 as the relationship type of the pair (S104).
  • the method determination unit 30 determines a machine learning model (closeness score determination model) to be used for determining the closeness score based on the identified type of relationship (step S105).
  • the closeness score determination unit 28 generates input data corresponding to the pair of the person to be processed and the reference person selected in the process shown in S104 (S106).
  • the proximity score determination unit 28 converts the input data generated in the process shown in S106 into a learned machine learning model (closeness score determination model) associated with the cluster 54 identified in the process shown in S104. Input (S107). Then, the closeness score determination unit 28 determines a closeness score associated with the pair of the attention person and the reference person based on the output data output from the machine learning model in response to the input (S107). ). Further, the relationship specifying unit 26 stores the relationship between the person to be processed and the reference person in the relationship storage unit 39, and the closeness score determination unit 28 stores the closeness score between the person to be processed and the reference person in the relationship storage unit 39. Store (S108).
  • the relationship identifying unit 26 confirms whether or not the processes shown in S104 to S108 have been performed for all of the reference persons identified in the process shown in S101 (S110).
  • the learning unit 32 is stored in the storage unit 12 of the information processing system 1, and the introduction request unit 36 has requested an introduction to the introducer in the past, and the introduced person has accepted the introduction and succeeded in the introduction. From the record, a pair of the introducer and the introduced person who succeeded in the introduction is acquired as a positive example (S201).
  • the learning unit 32 randomly selects pairs of persons from the graph data stored in the association storage unit 39, and acquires the selected pairs as negative examples (S202).
  • the learning unit 32 may acquire, as a pair of persons, a pair of a person and a reference person who has some relationship with the person. It should be noted that the possibility that the introduced person will accept the introduction is not high, so even a pair of randomly selected persons can be used as a negative example without any problem.
  • the negative example may be information indicating that the referral was not accepted (introduction failed), information indicating that the success or failure of the referral has not yet been verified, or information indicating that the referral was successful. It may be information indicating that the case is not recorded.
  • the information indicating a positive example or a negative example may be binary information in which 1 indicates a positive example, and 0 indicates a negative example corresponding to a case in which introduction fails. It's okay.
  • the mode of expression of information indicating positive or negative examples There is no restriction on the mode of expression of information indicating positive or negative examples, and it is not limited to binary information.
  • Negative examples corresponding to cases whose referral success or failure has not yet been verified may correspond to a predetermined value within the range of 0-1.
  • the learning unit 32 may attach information indicating a positive example or a negative example to the pair according to the record.
  • the information indicating positive or negative examples may be based on records of past referral success probabilities (for example, the number of successful referrals/the number of attempted referral requests) for a given pair.
  • the learning unit 32 acquires, as part of the input data, attributes of persons included in each pair of positive and negative examples (S203). For positive cases, the learning unit 32 sets the introducer as the first person and the introduced person as the second person, and for the negative cases, one of the pair is the first person and the other is the second person. , to obtain information about each of the first person and the second person.
  • the attributes of a person include the person's age, point usage status, usage pattern of each service, and the like.
  • the learning unit 32 also acquires the type of relationship and the closeness score in each pair of positive and negative examples as part of the input data (S204).
  • the learning unit 32 obtains input data including the attributes of the first person, the attributes of the second person, and the type and closeness score of the relationship between the first person and the second person;
  • a referral success/failure estimation model is learned using correct data including information indicating negative examples (S205).
  • correct data containing information indicating positive or negative examples are labeled in the input data.
  • the introduction success/failure estimation model is learned so as not to necessarily output the same result when the first person and the second person are replaced.
  • the introduction success/failure estimation model will calculate whether the person of interest is the product or service to the reference person.
  • information (acceptance score) indicating the probability that the reference person will accept the introduction.
  • FIG. 16 An example of the process of estimating the probability by the estimating unit 34 and requesting by the introduction requesting unit 36, which is performed after the introduction success/failure estimation model is learned, will be described with reference to the flow chart illustrated in FIG. .
  • the processing shown in FIG. 16 is executed for the person of interest whose probability is to be determined.
  • the process shown in FIG. 16 is executed for each person of interest.
  • the estimation unit 34 acquires a reference person who can be paired with the person of interest (S301). Specifically, the estimating unit 34 may acquire, as the reference person, the person corresponding to the node data 50 connected to the node data 50 corresponding to the person to be processed by an explicit link or an implicit link. Also, at least one reference person may be obtained.
  • the estimating unit 34 selects one reference person for whom the processes shown in S303 and S304 have not yet been executed from among the reference persons specified in the process shown in S301 (S302).
  • the estimation unit 34 acquires input data for the pair of the person of interest and the selected reference person (S303).
  • the input data includes the attributes of the person of interest, the attributes of the reference person, and the type and proximity score of the relationship between the person of interest and the reference person.
  • the estimating unit 34 determines the acceptance score by acquiring the output when the acquired input data is input to the referral success/failure estimation model (S304).
  • the estimation unit 34 may directly use the output of the referral success/failure estimation model as the acceptance score, or may determine the acceptance score by performing a predetermined calculation on the output. Note that the estimation unit 34 stores the determined acceptance score in the storage unit 12 in association with the pair of the person of interest and the reference person.
  • the estimation unit 34 confirms whether or not the processes shown in S303 and S304 have been performed for all the reference persons identified in the process shown in S301 (S305).
  • the estimation unit 34 performs the A maximum value of the determined acceptance scores is obtained (S306).
  • the introduction requesting unit 36 transmits information requesting an introduction to the person of interest (S308), and the process shown in FIG. finish.
  • the maximum acceptance score is lower than the threshold (S307: N)
  • the process shown in FIG. 16 ends.
  • the estimating unit 34 uses, for a pair of a person of interest and a reference person, a similarity score indicating not only the type of relationship between the persons but also the closeness between the persons to determine whether the person of interest is the reference person. It seeks the probability that the reference person will accept the introduction if introduced. Also, for the pair of the person of interest and the reference person, the type of relationship, such as whether they are spouses or siblings, is determined, and a closeness score is determined according to the type of relationship. These make it possible to estimate the probability more accurately. Then, by using the estimation, it is possible to improve the success rate when asking a person to introduce another person. In addition, in S308 of FIG.
  • the introduction requesting unit 36 may transmit, to the person of interest, request information for introducing the reference person whose acceptance score is the maximum value, or the introduction requesting unit 36 may For each of the plurality of reference persons whose acceptance scores have been determined, introduction request information may be sent to the person of interest.
  • interaction between users such as the frequency of calls between the person of interest and the reference person, or the frequency of sending gifts between the person of interest and the reference person, is also used in determining the closeness score. This allows for a more accurate determination of the proximity score and a more accurate probability estimate.
  • the present invention is not limited to the above-described embodiments, and various modifications may be made.
  • the data in the relation storage unit 39 used by the learning unit 32 for learning the referral success/failure estimation model may be different from the data in the relation storage unit 39 used by the estimation unit 34 in estimating the probability.
  • the personal attribute data acquisition unit 20, the graph data generation unit 22, the reference person identification unit 24, the relationship identification unit 26, the near The processing of the score determination unit 28 may be executed.

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

ユーザに対して他のユーザの紹介を依頼する際の成功率を向上させる。 関係性特定手段(26)は注目人物と参照人物との関係性の種類を特定し、基準決定手段(30)は注目人物と参照人物との関係性の種類に対応する判断基準を決定し、近さスコア決定手段(31)は判断基準と、関係の強さを示す指標とに基づいて、注目人物と参照人物との近さを示す近さスコアを決定し、紹介成否推定手段(34)は注目人物および参照人物の属性と、関係性の種類と近さスコアとを含む入力データに基づいて、注目人物が参照人物に対して商品またはサービスを紹介した場合に、参照人物が紹介を受け入れる蓋然性を推定し、紹介依頼手段(36)は推定の結果に基づいて、注目人物に向けて紹介を依頼する情報を送信する。

Description

情報処理システム、情報処理方法及びプログラム
 本発明は、情報処理システム、情報処理方法及びプログラムに関する。
 様々なサービスなどにおいて、あるユーザに対して、他のユーザを紹介すると特典を与える紹介キャンペーンを行うことがある。
 特表2014-529110号公報には、電子クーポンのプロモーター候補者を決定するプロモーターモジュールと、電子クーポンの使用候補者を決定する使用者モジュールとを含むクーポンシステムが開示されている。またプロモーターモジュールは、プロモーター候補者によって影響され、よってプロモーター候補者によって共有される電子クーポンを介して製品またはサービスを使用するよう簡単に誘導されると推定されうる友人をもっているかどうかに基づいてプロモーター候補者を決定すること(第0019段落参照)が開示されている。
 紹介キャンペーンを多数のユーザに知らせても、それによって他のユーザの紹介に結び付くことは必ずしも多くなかった。
 本発明は上記課題を鑑みてなされたものであって、その目的は、ユーザに対して他のユーザの紹介を依頼する際の成功率を向上させる技術を提供することにある。
 本発明にかかる情報処理システムは、注目人物と参照人物との関係性の種類を特定する関係性特定手段と、前記注目人物と前記参照人物との関係性の種類に対応する判断基準を決定する基準決定手段と、前記決定された判断基準に従って、前記注目人物と前記参照人物との関係の強さを示す指標に基づいて、当該注目人物と当該参照人物との近さを示す近さスコアを決定する近さスコア決定手段と、前記注目人物の属性と、前記参照人物の属性と、前記注目人物と前記参照人物とのペアについての前記関係性の種類および前記近さスコアとを含む入力データに基づいて、前記注目人物が前記参照人物に対して商品またはサービスを紹介した場合に、前記参照人物が前記紹介を受け入れる蓋然性を推定する紹介成否推定手段と、前記紹介成否推定手段による推定の結果に基づいて、前記注目人物に向けて紹介を依頼する情報を送信する紹介依頼手段と、を含む。
 本発明にかかる情報処理方法は、注目人物と参照人物との関係性の種類を特定するステップと、前記注目人物と前記参照人物との関係性の種類に対応する判断基準を決定するステップと、前記決定された判断基準に従って、当該注目人物と当該参照人物との関係の強さを示す指標に基づいて、当該注目人物と当該参照人物との近さを示す近さスコアを決定するステップと、前記注目人物の属性と、前記参照人物の属性と、前記注目人物と前記参照人物とのペアについての前記関係性の種類および前記近さスコアとを含む入力データに基づいて、前記注目人物が前記参照人物に対して商品またはサービスを紹介した場合に、前記参照人物が前記紹介を受け入れる蓋然性を推定するステップと、前記蓋然性の推定結果に基づいて、前記注目人物に向けて紹介を依頼する情報を送信するステップと、を含む。
 本発明にかかるプログラムは、注目人物と参照人物との関係性の種類を特定する関係性特定手段、前記注目人物と前記参照人物との関係性の種類に対応する判断基準を決定する基準決定手段、前記決定された判断基準に従って、当該注目人物と当該参照人物との関係の強さを示す指標に基づいて、当該注目人物と当該参照人物との近さを示す近さスコアを決定する近さスコア決定手段、前記注目人物の属性と、前記参照人物の属性と、前記注目人物と前記参照人物とのペアについての前記関係性の種類および前記近さスコアとを含む入力データに基づいて、前記注目人物が前記参照人物に対して商品またはサービスを紹介した場合に、前記参照人物が前記紹介を受け入れる蓋然性を推定する紹介成否推定手段、および、前記紹介成否推定手段による推定の結果に基づいて、前記注目人物に向けて紹介を依頼する情報を送信する紹介依頼手段、としてコンピュータを機能させる。
 本発明の一態様では、前記関係性特定手段は、前記関係性の種類として、親子、配偶者、きょうだい(sibling)、同僚、隣人、および友人のうち少なくとも一部を含む候補のうちいずれかを選択してよい。
 本発明の一態様では、前記紹介成否推定手段は、紹介依頼人物の属性と、被紹介人物の属性と、前記紹介依頼人物と被紹介人物とのペアについての前記関係性の種類および前記近さスコアと、紹介に成功したか否かを示す正解データとを含む学習データにより学習された機械学習モデルである紹介成否推定モデルに前記入力データを入力することにより、前記参照人物が前記紹介を受け入れる蓋然性を推定してよい。
 本発明の一態様では、前記注目人物と前記参照人物との関係の強さを示す指標は、前記注目人物と当該参照人物との間での共通の友人の数、前記注目人物と当該参照人物との間の通話の頻度、または、前記注目人物と前記参照人物との間のギフト送付の頻度を含んでよい。
 本発明の一態様では、前記基準決定手段は、前記注目人物と前記参照人物との関係性の種類に応じて機械学習モデルである近さスコア決定モデルを決定し、前記近さスコア評価手段は、近さスコア決定モデルに前記注目人物と前記参照人物との関係の強さを示す指標を入力した際の出力に基づいて、前記近さスコアを決定してよい。
 本発明の一態様では、前記関係性特定手段は、第1のコンピュータシステムに登録されている前記注目人物の属性データと、第2のコンピュータシステムに登録されている前記参照人物の属性データと、に基づいて、前記注目人物と前記参照人物との関係性の種類を特定してよい。
 本発明の一態様では、前記関係性特定手段は、名字の同一性、IPアドレスの同一性、住所の類似性、年齢差、および性別の同一性のうちの少なくとも一部に基づいて、前記注目人物と前記参照人物との関係性の種類を特定してよい。
 本発明によれば、ユーザに対して他のユーザの紹介を依頼する際の成功率を向上させることができる。
本発明の一実施形態に係る情報処理システムの全体構成の一例を示す図である。 本発明の一実施形態に係る情報処理システムの機能の一例を示す機能ブロック図である。 IPアドレスデータの値が共通していることの一例を模式的に示す図である。 グラフデータの一例を示す図である。 住所データの値が共通していることの一例を模式的に示す図である。 グラフデータの一例を示す図である。 クレジットカード番号データの値が共通していることの一例を模式的に示す図である。 グラフデータの一例を示す図である。 グラフデータの一例を示す図である。 クラスタの一例を示す図である。 分類の可視化の一例を示す図である。 機械学習モデルを用いた近さスコアの決定の一例を示す図である。 機械学習モデルの学習の一例を示す図である。 本発明の一実施形態に係る情報処理システムで行われる、ソーシャルグラフの作成にかかる処理の一例を示すフロー図である。 本発明の一実施形態に係る情報処理システムで行われる、学習部の処理の一例を示すフロー図である。 本発明の一実施形態に係る情報処理システムで行われる、推定部および紹介依頼部の処理の一例を示すフロー図である。
 以下、本発明の一実施形態について図面に基づき詳細に説明する。この実施形態では、例えばreferralと呼ばれるキャンペーンにおいて、あるユーザに対して他のユーザに商品またはサービスを紹介するよう依頼する情報処理システム1について説明する。
 図1は、本発明の一実施形態に係る情報処理システム1の全体構成の一例を示す図である。図1に示すように、本実施形態に係る情報処理システム1は、例えば、サーバコンピュータやパーソナルコンピュータなどのコンピュータであり、プロセッサ10、記憶部12、通信部14、操作部16、及び、出力部18を含む。なお、本実施形態に係る情報処理システム1に、複数台のコンピュータが含まれていてもよい。
 プロセッサ10は、例えば、情報処理システム1にインストールされるプログラムに従って動作するマイクロプロセッサ等のプログラム制御デバイスである。情報処理システム1は、1または複数のプロセッサ10を含んでよい。記憶部12は、例えばROMやRAM等の記憶素子や、ハードディスクドライブ(HDD)、フラッシュメモリを含むソリッドステートドライブ(SSD)などである。記憶部12には、プロセッサ10によって実行されるプログラムなどが記憶される。通信部14は、例えばネットワークインタフェースカードのような、有線通信又は無線通信用の通信インタフェースであり、インターネット等のコンピュータネットワークを介して、他のコンピュータや端末との間でデータを授受する。
 操作部16は、入力デバイスであり、例えば、タッチパネルやマウス等のポインティングデバイスやキーボード等を含む。操作部16は、操作内容をプロセッサ10に伝達する。出力部18は、例えば、液晶表示部又は有機EL表示部等のディスプレイや、スピーカ等の音声出力デバイス等の出力デバイスである。
 なお、記憶部12に記憶されるものとして説明するプログラム及びデータは、ネットワークを介して他のコンピュータから供給されるようにしてもよい。また、情報処理システム1のハードウェア構成は、上記の例に限られず、種々のハードウェアを適用可能である。例えば、情報処理システム1に、コンピュータ読み取り可能な情報記憶媒体を読み取る読取部(例えば、光ディスクドライブやメモリカードスロット)や外部機器とデータの入出力をするための入出力部(例えば、USBポート)が含まれていてもよい。例えば、情報記憶媒体に記憶されたプログラムやデータが読取部や入出力部を介して情報処理システム1に供給されるようにしてもよい。
 本実施形態に係る情報処理システム1では、例えば、ある人物(注目人物とも記載する)が紹介者となった場合に、被紹介者(参照人物とも記載する)がその紹介の対象となるキャンペーン等を受け入れる蓋然性の大きさが判定され、さらにその蓋然性の大きさに基づいて、その注目人物に例えばキャンペーンなどの紹介の依頼を送信する。なお、被紹介者が受け入れるとは、紹介者がキャンペーンなどの紹介を送信することにより被紹介者がその紹介を受信することであってもよいし、その受信された紹介の内容に応じて、サービスまたは商品の購入や何らかの会員に入会するなどの予め定められた行為をすることであってもよい。蓋然性の大きさは、その紹介の成否を示す情報の一種である。
 以下、本実施形態に係る情報処理システム1の機能、及び、情報処理システム1で実行される処理についてさらに説明する。
 図2は、本実施形態に係る情報処理システム1で実装される機能の一例を示す機能ブロック図である。なお、本実施形態に係る情報処理システム1に、図2に示す機能のすべてが実装される必要はなく、また、図2に示す機能以外の機能が実装されていても構わない。
 図2に示すように、本実施形態に係る情報処理システム1は、機能的に、人物属性データ取得部20、グラフデータ生成部22、参照人物特定部24、関係性特定部26、手法決定部30、近さスコア決定部28、学習部32、推定部34、紹介依頼部36、関連格納部39を含む。
 人物属性データ取得部20、グラフデータ生成部22、参照人物特定部24、関係性特定部26、近さスコア決定部28は、主に、ユーザのペアおよびそのペアにおけるユーザ間の関係を含むソーシャルグラフを作成するための機能である。推定部34はある人物が紹介者となった場合に、被紹介者がその紹介の対象となるキャンペーン等を受け入れる蓋然性の大きさを推定する機能であり、学習部32は推定部34で用いる機械学習モデル(紹介成否推定モデル)を学習させる機能である。
 人物属性データ取得部20、紹介依頼部36は、主にプロセッサ10、記憶部12および通信部14により実装される。グラフデータ生成部22、参照人物特定部24、関係性特定部26、手法決定部30、近さスコア決定部28、推定部34は、主にプロセッサ10及び記憶部12により実装される。関連格納部39は主に記憶部12により実装される。
 以上の機能は、コンピュータである情報処理システム1にインストールされた、以上の機能に対応する実行命令を含むプログラムをプロセッサ10で実行することにより実装されてよい。また、このプログラムは、例えば、光学的ディスク、磁気ディスク、フラッシュメモリ等のコンピュータ読み取り可能な情報記憶媒体を介して、あるいは、インターネットなどを介して情報処理システム1に供給されてもよい。
 本実施形態に係る情報処理システム1は、例えば、電子商取引システム40、ゴルフ場予約システム42、旅行予約システム44、カード管理システム46、などといった複数のコンピュータシステムと通信可能になっている(図3、図5、及び、図7参照)。これらのコンピュータシステムのそれぞれには、当該コンピュータシステムを利用するユーザに関する情報であるアカウントデータが登録されている。そして、情報処理システム1は、これらのコンピュータシステムにアクセスして、当該コンピュータシステムに登録されているアカウントデータを取得できるようになっている。
 アカウントデータには、例えば、ユーザID、氏名データ、住所データ、年齢データ、性別データ、電話番号データ、携帯電話番号データ、クレジットカード番号データ、IPアドレスデータ、などが含まれる。
 ユーザIDは、例えば、当該コンピュータシステムにおける当該ユーザの識別情報である。氏名データは、例えば、当該ユーザの氏名(姓(名字)及び名)を示すデータである。住所データは、例えば、当該ユーザの住所を示すデータである。当該コンピュータシステムが電子商取引システム40である場合に、住所データが、当該ユーザが購入した商品の送付先の住所を示していてもよい。年齢データは、例えば、当該ユーザの年齢を示すデータである。性別データは、例えば、当該ユーザの性別を示すデータである。電話番号データは、例えば、当該ユーザの電話番号を示すデータである。携帯電話番号データは、例えば、当該ユーザの携帯電話番号を示すデータである。クレジットカード番号データは、例えば、当該ユーザが当該コンピュータシステムでの決済において利用するクレジットカードのカード番号を示すデータである。IPアドレスデータは、例えば、当該ユーザが使用するコンピュータのIPアドレス(例えば、送信元のIPアドレス)を示すデータである。
 人物属性データ取得部20は、本実施形態では例えば、注目人物を含む複数の人物についての、当該人物の属性を示す人物属性データを取得する。ここで人物属性データの一例としては、上述のアカウントデータが挙げられる。人物属性データ取得部20は、例えば、上述の複数のシステムのそれぞれから、当該人物のアカウントデータを取得する。
 グラフデータ生成部22は、本実施形態では例えば、複数の人物のそれぞれの属性に基づいて、互いに関係がある人物のペアを特定する。グラフデータ生成部22は、複数の人物の人物属性データに基づいて、互いに関係がある人物のペアを特定してもよい。なお、本実施形態に係るグラフデータ生成部22は、請求の範囲に記載の、複数の人物のそれぞれの属性に基づいて、互いに関係がある人物のペアを特定するペア特定手段の一例に相当する。
 グラフデータ生成部22は、例えば、注目人物を含む複数の人物にそれぞれ対応付けられるノードデータ50と、互いに関係がある人物のペアに対応付けられるリンクデータ52と、を含むグラフデータを生成する(図4、図6、図8、及び、図9参照)。またグラフデータ生成部22は、生成されたグラフデータを関連格納部39に格納する。
 例えば、図3に示すように、電子商取引システム40に、ユーザAのアカウントデータが登録されていることとする。また、ゴルフ場予約システム42に、ユーザBのアカウントデータが登録されていることとする。また、旅行予約システム44に、ユーザCのアカウントデータが登録されていることとする。
 そして、電子商取引システム40に登録されているユーザAのIPアドレスデータの値、ゴルフ場予約システム42に登録されているユーザBのIPアドレスデータの値、及び、旅行予約システム44に登録されているユーザCのIPアドレスデータの値が同じであるとする。
 この場合、グラフデータ生成部22は、図4に示すように、ユーザAに対応付けられるノードデータ50a、ユーザBに対応付けられるノードデータ50b、ユーザCに対応付けられるノードデータ50c、ユーザAがユーザBと関係があることを示すリンクデータ52a、ユーザAがユーザCと関係があることを示すリンクデータ52b、ユーザBがユーザCと関係があることを示すリンクデータ52c、を含むグラフデータを生成する。
 IPアドレスが同じであるユーザは同じコンピュータを利用しているものと推察される。そのため、本実施形態ではこのようなユーザは互いに関連付けられるようになっている。
 また、例えば、図5に示すように、電子商取引システム40に、ユーザD、ユーザE、及び、ユーザFのアカウントデータが登録されていることとする。
 そして、電子商取引システム40に登録されているユーザDの住所データの値、ユーザEの住所データの値、及び、ユーザFの住所データの値が同じであるとする。
 この場合、グラフデータ生成部22は、図6に示すように、ユーザDに対応付けられるノードデータ50d、ユーザEに対応付けられるノードデータ50e、ユーザFに対応付けられるノードデータ50f、ユーザDがユーザEと関係があることを示すリンクデータ52d、ユーザDがユーザFと関係があることを示すリンクデータ52e、ユーザEがユーザFと関係があることを示すリンクデータ52f、を含むグラフデータを生成する。
 住所が同じであるユーザは同居しているものと推察される。そのため、本実施形態ではこのようなユーザは互いに関連付けられるようになっている。
 また、例えば、図7に示すように、電子商取引システム40に、ユーザGのアカウントデータが登録されていることとする。また、ゴルフ場予約システム42に、ユーザHのアカウントデータが登録されていることとする。また、旅行予約システム44に、ユーザIのアカウントデータが登録されていることとする。
 そして、電子商取引システム40に登録されているユーザGのクレジットカード番号データの値、ゴルフ場予約システム42に登録されているユーザHのクレジットカード番号データの値、及び、旅行予約システム44に登録されているユーザIのクレジットカード番号データの値が同じであるとする。
 この場合、グラフデータ生成部22は、図8に示すように、ユーザGに対応付けられるノードデータ50g、ユーザHに対応付けられるノードデータ50h、ユーザIに対応付けられるノードデータ50i、ユーザGがユーザHと関係があることを示すリンクデータ52g、ユーザGがユーザIと関係があることを示すリンクデータ52h、ユーザHがユーザIと関係があることを示すリンクデータ52i、を含むグラフデータを生成する。
 クレジットカード番号が同じであるユーザは親子等の家族であるものと推察される。そのため、本実施形態ではこのようなユーザは互いに関連付けられるようになっている。
 なお、互いに関係がある人物のペアに該当するか否かの判断基準は、以上で説明したものには限定されない。
 また、以上で説明した、互いに関係があると特定された人物を関連付けるリンクデータ52が示すリンクを明示的リンクと呼ぶこととする。
 ここで例えば、第1の人物と明示的リンクで接続されている人物と、第2の人物と明示的リンクで接続されている人物と、が所定数以上(例えば、3人以上)共通しているとする。この場合、本実施形態では例えば、グラフデータ生成部22は、当該第1の人物が当該第2の人物と関係があることを示すリンクデータ52を生成する。このようにして生成されるリンクデータ52が示すリンクを黙示的リンクと呼ぶこととする。
 例えば、図9に示すように、明示的リンクを示すリンクデータ52jによって、ユーザJに対応付けられるノードデータ50jとユーザKに対応付けられるノードデータ50kとが接続されていることとする。また、明示的リンクを示すリンクデータ52kによって、ユーザJに対応付けられるノードデータ50jとユーザLに対応付けられるノードデータ50lとが接続されていることとする。また、明示的リンクを示すリンクデータ52lによって、ユーザJに対応付けられるノードデータ50jとユーザMに対応付けられるノードデータ50mとが接続されていることとする。
 また、明示的リンクを示すリンクデータ52mによって、ユーザKに対応付けられるノードデータ50kとユーザNに対応付けられるノードデータ50nとが接続されていることとする。また、明示的リンクを示すリンクデータ52nによって、ユーザLに対応付けられるノードデータ50lとユーザNに対応付けられるノードデータ50nとが接続されていることとする。また、明示的リンクを示すリンクデータ52oによって、ユーザMに対応付けられるノードデータ50mとユーザNに対応付けられるノードデータ50nとが接続されていることとする。
 この場合、グラフデータ生成部22は、ユーザJがユーザNと関係があることを示すリンクデータ52p(黙示的リンクを示すリンクデータ52p)を生成する。このようにして、ユーザNが、ユーザJと関係がある人物として特定されることとなる。
 また、例えば、第1の人物と明示的リンク又は黙示的リンクで接続されている人物と、第2の人物と明示的リンク又は黙示的リンクで接続されている人物と、が所定数以上(例えば、3人以上)共通しているとする。この場合、グラフデータ生成部22が、当該第1の人物が当該第2の人物と関係があることを示すリンクデータ52(黙示的リンクを示すリンクデータ52)を生成してもよい。
 なお、グラフデータ生成部22は、アカウントデータとは異なる人物属性データに基づいて、グラフデータを生成してもよい。
 参照人物特定部24は、処理対象人物(例えば注目人物を含む)と関係がある人物である参照人物を特定する。ここで、参照人物特定部24は、処理対象人物と関係がある人物として特定される人物(例えば友人として電子商取引システム40等に登録される人物)、及び、関係がある人物として特定される人物(例えば登録された友人)が所定数以上、処理対象人物と共通する人物を、参照人物として特定してもよい。また、参照人物特定部24は、処理対象人物の属性と、複数の人物の属性と、に基づいて、当該複数の人物のうちから、参照人物を特定してもよい。
 参照人物特定部24は、例えば、処理対象人物に対応付けられるノードデータ50と、明示的リンク又は黙示的リンクを示すリンクデータ52によって接続されるノードデータ50に対応付けられる人物を、当該処理対象人物に対する参照人物として特定してもよい。
 関係性特定部26は、処理対象人物(例えば注目人物を含む)と参照人物との関係性を特定する。ここで、関係性特定部26が、処理対象人物のアカウントデータと、参照人物のアカウントデータと、に基づいて、処理対象人物と参照人物との関係性を特定してもよい。ここで、処理対象人物のアカウントデータが登録されているコンピュータシステムと参照人物のアカウントデータが登録されているコンピュータシステムとは異なっていてもよい。例えば、電子商取引システム40に登録されている、処理対象人物のアカウントデータと、ゴルフ場予約システム42に登録されている、参照人物のアカウントデータと、に基づいて、処理対象人物と参照人物との関係性(より具体的には関係性の種類)を特定してもよい。関係性特定部26は、特定された関係性を、処理対象人物および参照人物のペアと関連付けて関連格納部39に格納してよい。
 また、関係性特定部26は、処理対象人物と参照人物との家族としての関係(例えば親子、配偶者、きょうだい)を特定してよい。さらに、関係性特定部26は、特定される関係性の種類として、親子、配偶者、きょうだい、同僚、隣人、友人のうち少なくとも一部を含む候補のうちいずれかを選択してよい。
 次に関係性特定部26の処理についてより詳細に説明する。関係性特定部26は、例えば、リンクデータ52で接続されているノードデータ50のペアを特定する。そして、関係性特定部26は、当該ペアに対応付けられる2人の人物の人物属性データに基づいて、当該ペアに対応付けられるペア属性データを生成する。
 ペア属性データには、例えば、IP共通フラグ、住所共通フラグ、クレジットカード番号共通フラグ、名字同一フラグ、年齢差データ、ペア性別データ、などが含まれる。なお、処理対象人物および参照人物にかかるペア属性データは、関係性特定部26により特定された、処理対象人物および参照人物のペアにかかる関係性の種類を示す情報を含んでよい。
 IP共通フラグは、例えば、当該ペアのうちの一方のアカウントデータに含まれるIPアドレスデータの値と他方のアカウントデータに含まれるIPアドレスデータの値とが同じであるか否かを示すフラグである。例えば、所与の日においてIPアドレスデータの値が同じである場合はIP共通フラグの値に1が設定され、IPアドレスデータの値が異なる場合はIP共通フラグの値に0が設定されてもよい。
 住所共通フラグは、例えば、当該ペアのうちの一方のアカウントデータに含まれる住所データの値と他方のアカウントデータに含まれる住所データの値とが同じであるか否かを示すフラグである。例えば、住所データの値が同じである場合は住所共通フラグの値に1が設定され、住所データの値が異なる場合は住所共通フラグの値に0が設定されてもよい。
 クレジットカード番号共通フラグは、例えば、当該ペアのうちの一方のアカウントデータに含まれるクレジットカード番号データの値と他方のアカウントデータに含まれるクレジットカード番号データの値とが同じであるか否かを示すフラグである。例えば、クレジットカード番号データの値が同じである場合はクレジットカード番号共通フラグの値に1が設定され、クレジットカード番号データの値が異なる場合はクレジットカード番号共通フラグの値に0が設定されてもよい。
 名字同一フラグは、例えば、当該ペアのうちの一方のアカウントデータに含まれる氏名データが示す名字と他方のアカウントデータに含まれる氏名データが示す名字とが同じであるか否かを示すフラグである。例えば、氏名データが示す名字が同じである場合は名字同一フラグの値に1が設定され、氏名データが示す名字が異なる場合は名字同一フラグの値に0が設定されてもよい。
 年齢差データは、例えば、当該ペアのうちの一方のアカウントデータに含まれる年齢データの値と他方のアカウントデータに含まれる年齢データの値との差を示すデータである。
 ペア性別データは、例えば、当該ペアのうちの一方のアカウントデータに含まれる性別データの値と他方のアカウントデータに含まれる性別データの値との組合せを示すデータである。
 そして、関係性特定部26は、複数のペアのそれぞれに対応付けられるペア属性データの値に基づいて、一般的なクラスタリング手法を用いたクラスタリングを実行することで、当該複数のペアを、図10に示すような複数のクラスタ54に分類する。
 図10は、複数のペアが、5つのクラスタ54(54a、54b、54c、54d、及び、54e)に分類された様子の一例を模式的に示す図である。図10に示されているバツ印は、ペアに対応付けられる。そして、複数のバツ印のそれぞれは、当該バツ印に対応するペアのペア属性データの値に対応付けられる位置に配置されている。
 図10の例では、複数のペアが5つのクラスタ54に分類されているが、複数のペアが分類されるクラスタ54の数は5つには限定されず、例えば、複数のペアが4つのクラスタ54に分類されてもよい。
 図11は、複数のペアが4つのクラスタ54に分類された場合における、当該分類の可視化の一例を示す図である。
 図11に示すように、住所が同じであり、性別が同じであり、年齢差がX歳より大きく、名字が同じペアは、第1クラスタに分類されてもよい。また、住所が同じであり、性別が同じであり、年齢差がX歳以下であり、名字が同じペアは、第2クラスタに分類されてもよい。また、住所が同じであり、性別が異なり、年齢差がY歳より大きく、名字が同じペアは、第3クラスタに分類されてもよい。また、住所が同じであり、性別が異なり、年齢差がY歳以下であり、名字が同じペアは、第4クラスタに分類されてもよい。
 この場合、第1クラスタは、例えば同性の親子に対応付けられるクラスタ54であるものと推察される。また、第2クラスタは、例えば同性の兄弟に対応付けられるクラスタ54であるものと推察される。また、第3クラスタは、例えば異性の親子に対応付けられるクラスタ54であるものと推察される。また、第4クラスタは、例えば夫婦、または異性の兄弟に対応付けられるクラスタ54であるものと推察される。
 以上で説明したようにして、関係性特定部26が、人物間の関係に対応付けられる値に基づくクラスタリングの結果に基づいて、処理対象人物と参照人物との関係性を特定してもよい。また、関係性特定部26が、名字、IPアドレス、住所、クレジットカード番号、年齢差、又は、性別のうちの少なくとも1つに基づくクラスタリングの結果に基づいて、処理対象人物と参照人物との関係性を特定してもよい。
 近さスコア決定部28は、処理対象人物と参照人物との関係性に対応する判断基準と、処理対象人物(例えば注目人物を含む)と参照人物との関係の強さを示す指標に基づいて、処理対象人物と当該参照人物との近さを示す近さスコアを決定する。
 手法決定部30は、処理対象人物と参照人物との関係性として選択された種類に対応する判断基準を決定する。より具体的には、手法決定部30は判断基準として、近さスコア決定部28において利用する近さスコア決定用の機械学習モデル(近さスコア決定モデル)を決定してよい。
 そして近さスコア決定部28は、決定された判断基準に従って、処理対象人物と参照人物との関係の強さを示す指標に基づいて、その処理対象人物とその参照人物との近さを示す近さスコアを決定する。また近さスコア決定部28は、決定された近さスコアを処理対象人物および参照人物のペアに関連付けて関連格納部39に格納する。
 ここで、近さスコア決定部28は、それぞれ上述のクラスタ54に対応付けられる学習済の機械学習モデル(近さスコア決定モデル)を含んでいてもよい。例えば、複数のペアが5つのクラスタ54に分類される場合には、近さスコア決定部28が、5つの機械学習モデルを含んでいてもよい。
 そして、近さスコア決定部28は、処理対象人物と参照人物との関係性に対応する学習済の機械学習モデル(近さスコア決定モデル)に、処理対象人物と当該参照人物との関係の強さを示す指標を表すデータを入力した際の出力に基づいて、処理対象人物と参照人物との近さを示す近さスコアを決定してよい。
 図12に示すように、近さスコア決定部28が、n番目の機械学習モデルである第n機械学習モデルに、第n機械学習モデルに対応付けられるクラスタ54に分類されたペアに対応する入力データを入力してもよい。例えば、近さスコア決定部28が5つの機械学習モデルを含む場合は、上述の値nは、1以上5以下の整数のうちのいずれかとなる。そして、近さスコア決定部28が、当該入力データの入力に応じて第n機械学習モデルから出力される出力データの値を、当該ペアについての近さスコアの値として決定するようにしてもよい。
 ペアに対応付けられる入力データには、例えば、当該ペアに対応付けられるペア属性データの一部又は全部が含まれるようにしてもよい。また、入力データに、ペア属性データに含まれていないデータが含まれるようにしてもよい。例えば、入力データに、電子商取引システム40の利用履歴を示すデータや、近さスコア決定部28によってSNS等の他の情報源から取得されるデータなどが含まれていてもよい。より具体的には例えば、入力データに、ペア間の単位期間あたりの通話回数(通話頻度)やメッセージのやり取りの回数、一方が他方に送ったギフトの数、ペアにおける共通の(登録された)友人の数、などを示すデータが含まれるようにしてもよい。
 また、ペアに対応付けられる入力データに含まれるデータの種類は、当該ペアが属するクラスタ54によって同じであってもよいし異なっていてもよい。例えば、第1機械学習モデルに入力される入力データに含まれるデータの種類と、第2機械学習モデルに入力される入力データに含まれるデータの種類と、が異なっていてもよい。
 本実施形態では例えば、近さスコア決定部28による近さスコアの決定に先立って、予め、第n機械学習モデルに対応付けられる所与の複数の訓練データを用いた、第n機械学習モデルの学習が実行される。この訓練データは、例えば、当該第n機械学習モデルに対応付けられるクラスタ54における近さスコアの決定が妥当なものとなるよう予め準備されたものである。
 ここで、第n機械学習モデルに対して、弱教師あり学習による学習が行われてもよい。例えば、訓練データに、図13に示すような、第n機械学習モデルに入力される入力データと同じ種類のデータが含まれている学習入力データと、学習入力データの入力に応じて第n機械学習モデルから出力される出力データと比較される教師データ(正解のデータ)と、が含まれていてもよい。
 ここで例えば、上述の近さスコアが、0又は1のいずれかの値をとるとする。例えば、ペアが近い関係にある場合には、当該ペアの近さスコアの値として1が決定され、そうでない場合に、当該ペアの近さスコアの値として0が決定されるとする。
 この場合、教師データが、対応する学習入力データにおける妥当な近さスコアの値、及び、この値が妥当である確率を示すデータを含んでいてもよい。
 そして、例えば、訓練データに含まれる学習入力データの入力に応じて第n機械学習モデルから出力される出力データの値と、当該訓練データに含まれる教師データの値と、に基づいて、第n機械学習モデルのパラメータの値を更新する弱教師あり学習が実行されてもよい。
 なお、上述の近さスコアは、0又は1のいずれかの値をとるバイナリデータである必要はない。例えば、上述の近さスコアが、当該ペアが近い関係にあるほど大きな値となる実数値(例えば、0以上10以下の実数値)や、多段階の整数値(例えば、1以上10以下の整数値)であっても構わない。
 また、機械学習モデル(近さスコア決定モデル)の学習手法は、弱教師あり学習には限定されない。
 一具体例として、兄弟の関係があるペアについて考察する。この場合、当該ペアに対応付けられる入力データが、兄弟という関係に対応する学習済の機械学習モデルに入力される。そして例えば、このペアについて住所データの値が同じであり、このペアの一方が他方に送ったギフトの数が50であり、このペアの今までの通話回数が1200回である場合には、値が1である出力データが出力されるような学習が実行されてもよい。また例えば、このペアについて住所データの値が異なっており、このペアの一方が他方に送ったギフトの数が2であり、このペアの今までの通話回数が30回である場合には、値が0である出力データが出力されるような学習が実行されてもよい。
 そして、近さスコアに対応する出力データの値が1となるか0となるかの判断基準(例えば閾値)が、機械学習モデル(近さスコア決定モデル)によって異なっていてもよい。
 推定部34は、注目人物の属性と、参照人物の属性と、注目人物と参照人物とのペアについての関係性の種類および近さスコアとを含む入力データに基づいて、注目人物が参照人物に対して商品またはサービスを紹介した場合に、その参照人物が紹介を受け入れる蓋然性を推定する。紹介を受け入れるとは、例えば、参照人物がreferralメールなどを送信し、参照人物がそれを受信することであってもよいし、参照人物が受信したreferralメールに記載されたリンク先へアクセスすることであってもよいし、そのアクセスをトリガーとしたサービス契約の成立であってもよい。推定部34は、注目人物と参照人物とのペアについて、関係性特定部26が特定した関係性の種類と近さスコア決定部28が決定した近さスコアとを関連格納部39から取得してよい。なお、推定部34は、ペアの関係性の種類に代えてそのペア属性データの少なくとも一部に基づいて、当該蓋然性を推定してもよい。
 推定部34は、機械学習モデル(紹介成否推定モデル)を用いてその蓋然性を推定してよい。より具体的には、推定部34は、紹介成否推定モデルに入力データを入力した際の出力により、参照人物が紹介を受け入れる蓋然性を推定してよい。紹介成否推定モデルは、例えば、アダブースト、ランダムフォレスト、ニューラルネットワーク、サポートベクタマシン(SVM)、最近傍識別器、などの機械学習が実装された機械学習モデルであってよい。また、紹介成否推定モデルとして、いわゆるDeep Learningを用いた機械学習モデルが構築されてもよい。
 学習部32は、紹介依頼人物の属性と、被紹介人物の属性と、紹介依頼人物と被紹介人物とのペアについて求められた関係性の種類および近さスコアと、紹介に成功したか否かを示す正解データとを含む訓練データにより紹介成否推定モデルを学習させる。学習部32の処理の詳細については後述する。
 紹介依頼部36は、推定部34による推定の結果に基づいて、その注目人物に向けて紹介を依頼する情報を送信する。例えば、推定部34により推定された蓋然性が所定の閾値以上である場合に、紹介依頼部36は依頼として、注目人物の電子メールまたはメッセンジャーのアドレスに対してメッセージを送信してよい。このメッセージは、注目人物に紹介を依頼する文面を含み、例えば注目人物が任意の相手に転送できるメッセージを含んでもよいし、注目人物が情報処理システム1に対して被紹介人物への紹介を指示するWebページへのリンクを含んでもよい。そのWebページにおいて注目人物が紹介可能な人物は、参照人物のみであってもよいし、任意の人物であってもよい。
 ここで、本実施形態に係る情報処理システム1で行われる、ソーシャルグラフにかかる情報の作成についての処理の一例を、図14に例示するフロー図を参照しながら説明する。図14は、主に参照人物特定部24、関係性特定部26、近さスコア決定部28の処理について説明する。
 図14に記載される処理は、グラフデータが生成された人物のそれぞれについて繰り返し実行される。グラフデータが生成された人物は注目人物を含み、図14の処理の対象となる人物を以下では処理対象人物と記載する。図14の処理例では、注目人物を含む複数の人物についてのグラフデータが既に生成されており、複数のペアについて、当該ペアに対応付けられるクラスタ54が特定されていることとする。また、各クラスタ54に対応付けられる機械学習モデル(近さスコア決定モデル)が既に学習済であることとする。
 まず、参照人物特定部24は、処理対象人物に対応するノードデータ50と明示的リンク又は黙示的リンクで接続されているノードデータ50に対応する人物を、参照人物として特定する(S101)。ここでは例えば、少なくとも1人の参照人物が特定されるとする。
 そして、関係性特定部26が、S101に示す処理で特定された参照人物のうちから、S104~S108に示す処理がまだ実行されていない参照人物を1人選択する(S103)。
 そして、関係性特定部26が、処理対象人物とS102に示す処理で選択された参照人物とのペアに対応するクラスタ54をそのペアの関係性の種類として特定する(S104)。
 手法決定部30は、特定された関係性の種類に基づいて、近さスコアの決定に用いる機械学習モデル(近さスコア決定モデル)を決定する(ステップS105)。
 そして、近さスコア決定部28が、処理対象人物とS104に示す処理で選択された参照人物とのペアに対応する入力データを生成する(S106)。
 そして、近さスコア決定部28が、S106に示す処理で生成された入力データを、S104に示す処理で特定されたクラスタ54に対応付けられる学習済の機械学習モデル(近さスコア決定モデル)に入力する(S107)。そして、近さスコア決定部28が、その入力に応じて機械学習モデルから出力される出力データに基づいて、当該注目人物と当該参照人物とのペアに対応付けられる近さスコアを決定する(S107)。また関係性特定部26は処理対象人物と参照人物との関係性を関連格納部39に格納し、近さスコア決定部28は処理対象人物と参照人物との近さスコアを関連格納部39に格納する(S108)。
 そして、関係性特定部26が、S101に示す処理で特定された参照人物のすべてについてS104~S108に示す処理が実行されたか否かを確認する(S110)。
 S101に示す処理で特定された参照人物のすべてについてS104~S108に示す処理が実行されていない場合は(S110:N)、S103に示す処理に戻る。
 S101に示す処理で特定された参照人物のすべてについてS104~S108に示す処理が実行された場合は(S110:Y)、図14に示される処理は終了する。
 次に、ソーシャルグラフにかかる情報が作成されたのちに行われる、学習部32による機械学習モデル(紹介成否推定モデル)の学習についての処理の一例を、図15に例示するフロー図を参照しながら説明する。
 はじめに、学習部32は、情報処理システム1の記憶部12に格納される、紹介依頼部36が過去に紹介者に紹介を依頼し、さらに被紹介者が紹介を受け入れて紹介に成功したケースの記録から、その紹介に成功した紹介者と被紹介者とのペアを正例として取得する(S201)。
 次に、学習部32は、関連格納部39に格納されるグラフデータから、人物のペアをランダムに選択し、選択されたペアを負例として取得する(S202)。学習部32は、人物のペアとして、人物と、その人物と何らかの関係のある参照人物とのペアを取得してよい。なお、紹介を被紹介者が受け入れる可能性は高くないため、ランダムに選択された人物のペアであっても負例として問題なく利用できる。当該負例は、紹介が受け入れられなかった(紹介に失敗した)ことを示す情報であってよいし、紹介成否が未だ検証されていないことを示す情報であってよいし、紹介に成功したというケースが記録されていないことを示す情報であってよい。ここで、正例または負例を示す情報は、1が正例を示す二値的な情報であってよく、0が例えば紹介に失敗したケースと対応する負例を示す二値的な情報であってよい。正例または負例を示す情報の表現態様に制限はなく、二値的な情報に限られない。紹介成否が未だ検証されていないケースと対応する負例は、0~1の範囲内の所定の値と対応してもよい。なお、学習部32は、属性が類似する人物及びペアについて紹介成否の記録がある場合、記録に応じペアに正例または負例を示す情報を付してよい。また、正例または負例を示す情報は、所定のペアの過去の紹介成功確率(例えば紹介成功数/紹介依頼の試行数)の記録に基づいてよい。
 正例および負例が取得されると、学習部32は、正例および負例のそれぞれのペアに含まれる人物についての属性を入力データの一部として取得する(S203)。学習部32は、正例については、紹介者を第1の人物、被紹介者を第2の人物とし、負例については、ペアの一方を第1の人物、ペアの他方を第2の人物として、第1の人物および第2の人物のそれぞれについての情報を取得する。ここで、人物についての属性は、その人物の年齢、ポイント利用状況、各サービスの利用パターン等を含む。
 また学習部32は、正例および負例のそれぞれのペアにおける関係性の種類および近さスコアを入力データの一部として取得する(S204)。
 学習部32は、第1の人物の属性、第2の人物の属性、および、第1の人物と第2の人物との関係性の種類および近さスコア、を含む入力データと、正例または負例を示す情報を含む正解データとにより、紹介成否推定モデルを学習させる(S205)。ここで、正例または負例を示す情報を含む正解データは、入力データにラベル付けされている。なお紹介成否推定モデルは、第1の人物と第2の人物とが取り換えられた場合に必ずしも同じ結果を出力しないように学習される。学習済の紹介成否推定モデルに対して、注目人物を第1人物とし、参照人物を第2人物とした入力データを入力すると、紹介成否推定モデルは、注目人物が参照人物に対して商品またはサービスを紹介した場合に、その参照人物が紹介を受け入れる蓋然性を示す情報(受入スコア)を出力する。
 次に、紹介成否推定モデルが学習されたのちに行われる、推定部34による蓋然性の推定および紹介依頼部36による依頼についての処理の一例を、図16に例示するフロー図を参照しながら説明する。図16に示される処理は、その蓋然性の判断対象となる注目人物について実行される。蓋然性の判断対象として複数の注目人物が存在する場合には、図16に示される処理は注目人物ごとに実行される。
 はじめに推定部34は、その注目人物とペアとなりうる参照人物を取得する(S301)。具体的には、推定部34は、処理対象人物に対応するノードデータ50と明示的リンク又は黙示的リンクで接続されているノードデータ50に対応する人物を、参照人物として取得してよい。また、少なくとも1人の参照人物が取得されてよい。
 そして、推定部34は、S301に示す処理で特定された参照人物のうちから、S303~S304に示す処理がまだ実行されていない参照人物を1人選択する(S302)。
 参照人物が選択されると、推定部34は注目人物と選択された参照人物とのペアについて入力データを取得する(S303)。入力データは、注目人物の属性、参照人物の属性、および、注目人物と参照人物との関係性の種類および近さスコアを含む。
 推定部34は、取得された入力データを紹介成否推定モデルに入力した際の出力を取得することにより、受入スコアを決定する(S304)。推定部34は紹介成否推定モデルの出力をそのまま受入スコアとしてもよいし、その出力に所定の演算をすることにより受入スコアを決定してもよい。なお、推定部34は決定された受入スコアを注目人物および参照人物のペアと関連付けて記憶部12に格納する。
 そして、推定部34は、S301に示す処理で特定された参照人物のすべてについてS303~S304に示す処理が実行されたか否かを確認する(S305)。
 S301に示す処理で特定された参照人物のすべてについてS303~S304に示す処理が実行されていない場合は(S305:N)、S302に示す処理に戻る。
 S301に示す処理で特定された参照人物のすべてについてS303~S304に示す処理が実行された場合は(S305:Y)、推定部34は、注目人物と少なくとも1以上の参照人物とを含むペアについて決定された受入スコアの最大値を求める(S306)。
 そして受入スコアの最大値が閾値以上の場合には(S307:Y)、紹介依頼部36は、その注目人物に対して紹介を依頼する情報を送信し(S308)、図16に示される処理は終了する。一方、受入スコアの最大値が閾値より低い場合には(S307:N)、図16に示される処理は終了する。
 本実施形態では、推定部34が、注目人物と参照人物とのペアについて、人物どうしの関係性の種類だけでなく人物どうしの親密性を示す近さスコアを用いて、注目人物が参照人物に紹介した場合に参照人物が紹介を受け入れる蓋然性を求めている。また、注目人物と参照人物とのペアについて、配偶者か、きょうだいであるか、などの関係性の種類を決定し、その関係性の種類に応じて近さスコアが決定されている。これらにより、より精度よく蓋然性を推定することが可能になる。そして、その推定を用いることで、ある人物に対して他の人物の紹介を依頼する際の成功率を向上させることができる。なお、図16のS308において、紹介依頼部36は、受入スコアが最大値となる参照人物に対する紹介の依頼情報を注目人物へ送信してもよいし、紹介依頼部36は、所定の閾値を超過する受入スコアが決定された複数の参照人物のそれぞれに対する紹介の依頼情報を注目人物へ送信してもよい。
 また、近さスコアの決定においては、注目人物と参照人物との間の通話の頻度、または、注目人物と参照人物との間のギフト送付の頻度といった、ユーザ間のやりとりも用いられている。これにより、近さスコアをより精度よく決定し、蓋然性の推定の精度を上げることができる。
 なお、本発明は上述の実施形態に限定されるものではなく、様々な変形が行われてよい。例えば、学習部32が紹介成否推定モデルの学習に用いる関連格納部39のデータと、推定部34が蓋然性の推定の際に用いる関連格納部39のデータとは異なっていてもよい。紹介成否推定モデルの学習と推定部34の処理との間に、最新の情報を用いて、人物属性データ取得部20、グラフデータ生成部22、参照人物特定部24、関係性特定部26、近さスコア決定部28の処理が実行されてよい。
 特許請求の範囲の記載は、本発明の要旨および範囲内にあるようなすべての変更を網羅することが意図されている。また、上記の具体的な文字列や数値及び図面中の具体的な文字列や数値は例示であり、これらの文字列や数値には限定されない。

 

Claims (9)

  1.  注目人物と参照人物との関係性の種類を特定する関係性特定手段と、
     前記注目人物と前記参照人物との関係性の種類に対応する判断基準を決定する基準決定手段と、
     前記決定された判断基準に従って、前記注目人物と前記参照人物との関係の強さを示す指標に基づいて、当該注目人物と当該参照人物との近さを示す近さスコアを決定する近さスコア決定手段と、
     前記注目人物の属性と、前記参照人物の属性と、前記注目人物と前記参照人物とのペアについての前記関係性の種類および前記近さスコアとを含む入力データに基づいて、前記注目人物が前記参照人物に対して商品またはサービスを紹介した場合に、前記参照人物が前記紹介を受け入れる蓋然性を推定する紹介成否推定手段と、
     前記紹介成否推定手段による推定の結果に基づいて、前記注目人物に向けて紹介を依頼する情報を送信する紹介依頼手段と、
     を含むことを特徴とする情報処理システム。
  2.  請求項1に記載の情報処理システムにおいて、
     前記関係性特定手段は、前記関係性の種類として、親子、配偶者、きょうだい、同僚、隣人、および友人のうち少なくとも一部を含む候補のうちいずれかを選択する、
     情報処理システム。
  3.  請求項1または2に記載の情報処理システムにおいて、
     前記紹介成否推定手段は、紹介依頼人物の属性と、被紹介人物の属性と、前記紹介依頼人物と被紹介人物とのペアについての前記関係性の種類および前記近さスコアと、紹介に成功したか否かを示す正解データとを含む学習データにより学習された機械学習モデルである紹介成否推定モデルに前記入力データを入力することにより、前記参照人物が前記紹介を受け入れる蓋然性を推定する、
     情報処理システム。
  4.  請求項1から3のいずれかに記載の情報処理システムにおいて、
     前記注目人物と前記参照人物との関係の強さを示す指標は、前記注目人物と当該参照人物との間での共通の友人の数、前記注目人物と当該参照人物との間の通話の頻度、または、前記注目人物と前記参照人物との間のギフト送付の頻度を含む、
     情報処理システム。
  5.  請求項1から4のいずれかに記載の情報処理システムにおいて、
     前記基準決定手段は、前記注目人物と前記参照人物との関係性の種類に応じて機械学習モデルである近さスコア決定モデルを決定し、
     前記近さスコア評価手段は、近さスコア決定モデルに前記注目人物と前記参照人物との関係の強さを示す指標を入力した際の出力に基づいて、前記近さスコアを決定する、
     情報処理システム。
  6.  請求項1から5のいずれかに記載の情報処理システムにおいて、
     前記関係性特定手段は、第1のコンピュータシステムに登録されている前記注目人物の属性データと、第2のコンピュータシステムに登録されている前記参照人物の属性データと、に基づいて、前記注目人物と前記参照人物との関係性の種類を特定する、
     情報処理システム。
  7.  請求項1から6のいずれかに記載の情報処理システムにおいて、
     前記関係性特定手段は、名字の同一性、IPアドレスの同一性、住所の類似性、年齢差、および性別の同一性のうちの少なくとも一部に基づいて、前記注目人物と前記参照人物との関係性の種類を特定する、
     情報処理システム。
  8.  注目人物と参照人物との関係性の種類を特定するステップと、
     前記注目人物と前記参照人物との関係性の種類に対応する判断基準を決定するステップと、
     前記決定された判断基準に従って、当該注目人物と当該参照人物との関係の強さを示す指標に基づいて、当該注目人物と当該参照人物との近さを示す近さスコアを決定するステップと、
     前記注目人物の属性と、前記参照人物の属性と、前記注目人物と前記参照人物とのペアについての前記関係性の種類および前記近さスコアとを含む入力データに基づいて、前記注目人物が前記参照人物に対して商品またはサービスを紹介した場合に、前記参照人物が前記紹介を受け入れる蓋然性を推定するステップと、
     前記蓋然性の推定結果に基づいて、前記注目人物に向けて紹介を依頼する情報を送信するステップと、
     を含むことを特徴とする情報処理方法。
  9.  注目人物と参照人物との関係性の種類を特定する関係性特定手段、
     前記注目人物と前記参照人物との関係性の種類に対応する判断基準を決定する基準決定手段、
     前記決定された判断基準に従って、当該注目人物と当該参照人物との関係の強さを示す指標に基づいて、当該注目人物と当該参照人物との近さを示す近さスコアを決定する近さスコア決定手段、
     前記注目人物の属性と、前記参照人物の属性と、前記注目人物と前記参照人物とのペアについての前記関係性の種類および前記近さスコアとを含む入力データに基づいて、前記注目人物が前記参照人物に対して商品またはサービスを紹介した場合に、前記参照人物が前記紹介を受け入れる蓋然性を推定する紹介成否推定手段、および、
     前記紹介成否推定手段による推定の結果に基づいて、前記注目人物に向けて紹介を依頼する情報を送信する紹介依頼手段、
     としてコンピュータを機能させるためのプログラム。

     
PCT/JP2021/047625 2021-12-22 2021-12-22 情報処理システム、情報処理方法及びプログラム WO2023119499A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2022573527A JP7312923B1 (ja) 2021-12-22 2021-12-22 情報処理システム、情報処理方法及びプログラム
PCT/JP2021/047625 WO2023119499A1 (ja) 2021-12-22 2021-12-22 情報処理システム、情報処理方法及びプログラム
TW111145817A TWI839978B (zh) 2021-12-22 2022-11-30 資訊處理系統、資訊處理方法及程式產品
JP2023112881A JP2023126971A (ja) 2021-12-22 2023-07-10 情報処理システム、情報処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/047625 WO2023119499A1 (ja) 2021-12-22 2021-12-22 情報処理システム、情報処理方法及びプログラム

Publications (1)

Publication Number Publication Date
WO2023119499A1 true WO2023119499A1 (ja) 2023-06-29

Family

ID=86901728

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/047625 WO2023119499A1 (ja) 2021-12-22 2021-12-22 情報処理システム、情報処理方法及びプログラム

Country Status (2)

Country Link
JP (2) JP7312923B1 (ja)
WO (1) WO2023119499A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018097400A (ja) * 2016-12-07 2018-06-21 トヨタ自動車株式会社 情報提供装置及び情報提供プログラム
JP2018097584A (ja) * 2016-12-13 2018-06-21 株式会社Nttドコモ 情報処理装置
JP2020091869A (ja) * 2018-12-06 2020-06-11 株式会社ビジネスインテリジェンス Snsシステム、コンピュータプログラム、snsを用いたマーケティングオートメーション方法及び表示方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018097400A (ja) * 2016-12-07 2018-06-21 トヨタ自動車株式会社 情報提供装置及び情報提供プログラム
JP2018097584A (ja) * 2016-12-13 2018-06-21 株式会社Nttドコモ 情報処理装置
JP2020091869A (ja) * 2018-12-06 2020-06-11 株式会社ビジネスインテリジェンス Snsシステム、コンピュータプログラム、snsを用いたマーケティングオートメーション方法及び表示方法

Also Published As

Publication number Publication date
JP2023126971A (ja) 2023-09-12
JP7312923B1 (ja) 2023-07-21
TW202334881A (zh) 2023-09-01
JPWO2023119499A1 (ja) 2023-06-29

Similar Documents

Publication Publication Date Title
Adikari et al. Identifying fake profiles in linkedin
WO2022142006A1 (zh) 基于语义识别的话术推荐方法、装置、设备及存储介质
Kurve et al. Multicategory crowdsourcing accounting for variable task difficulty, worker skill, and worker intention
Kültür et al. Hybrid approaches for detecting credit card fraud
WO2016140697A1 (en) Increasing interaction between clusters with low connectivity in a network
US11531987B2 (en) User profiling based on transaction data associated with a user
CN111008335B (zh) 一种信息处理方法、装置、设备及存储介质
US10026037B2 (en) Systems and methods for configuring knowledge sets and AI algorithms for automated message exchanges
JP7350206B1 (ja) 求人データ管理システム及び求人データ管理方法
US20230020864A1 (en) Social network for merchants
JP7206761B2 (ja) 情報処理装置
CN111737584B (zh) 行为预测系统的更新方法及装置
WO2023119499A1 (ja) 情報処理システム、情報処理方法及びプログラム
CN111382254A (zh) 电子名片推荐方法、装置、设备及计算机可读存储介质
TWI839978B (zh) 資訊處理系統、資訊處理方法及程式產品
CN110347928A (zh) 一种个性化信息推荐方法与系统
JP7302106B1 (ja) 情報処理システム、情報処理方法及びプログラム
JP7130314B1 (ja) 信用度判定システム、信用度判定方法及びプログラム
CN111316259A (zh) 用于反馈和裁定的语义属性的动态合成和瞬时聚簇的系统和方法
JP2024069608A (ja) グラフデータ生成システム、グラフデータ生成方法及びプログラム
WO2023119577A1 (ja) 情報処理システム、情報処理方法及びプログラム
WO2023119578A1 (ja) 情報処理システム、情報処理方法及びプログラム
Sarker et al. An effective call prediction model based on noisy mobile phone data
TWI835439B (zh) 資訊處理系統、資訊處理方法及程式產品
US11880847B2 (en) Visual representation generation for bias correction

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 2022573527

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 17999864

Country of ref document: US

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21968936

Country of ref document: EP

Kind code of ref document: A1