WO2018041168A1 - 信息推送方法、存储介质和服务器 - Google Patents

信息推送方法、存储介质和服务器 Download PDF

Info

Publication number
WO2018041168A1
WO2018041168A1 PCT/CN2017/099790 CN2017099790W WO2018041168A1 WO 2018041168 A1 WO2018041168 A1 WO 2018041168A1 CN 2017099790 W CN2017099790 W CN 2017099790W WO 2018041168 A1 WO2018041168 A1 WO 2018041168A1
Authority
WO
WIPO (PCT)
Prior art keywords
vector
information
category
user
feature
Prior art date
Application number
PCT/CN2017/099790
Other languages
English (en)
French (fr)
Inventor
章志青
吴佳明
Original Assignee
腾讯科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 腾讯科技(深圳)有限公司 filed Critical 腾讯科技(深圳)有限公司
Publication of WO2018041168A1 publication Critical patent/WO2018041168A1/zh
Priority to US16/208,226 priority Critical patent/US11574139B2/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • G06Q30/0256User search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2113Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/40Software arrangements specially adapted for pattern recognition, e.g. user interfaces or toolboxes therefor
    • G06F18/41Interactive pattern learning with a human teacher
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Definitions

  • the present application relates to the field of information processing technologies, and in particular, to an information push method, a storage medium, and a server.
  • instant messaging and social application platforms store a large amount of user information, such as user preferences, age, occupation, and needs, etc., and such user information can be pushed for information, such as product advertisements.
  • user information such as user preferences, age, occupation, and needs, etc.
  • information such as product advertisements.
  • the push of information, etc. has important reference value.
  • an information push method a storage medium, and a server are provided.
  • An information push method includes:
  • a server comprising a memory and a processor, the memory storing computer readable instructions, the computer readable instructions being executed by the processor such that the processor performs the following steps:
  • One or more computer readable non-volatile storage media storing computer readable instructions, when executed by one or more processors, cause the one or more processors to perform the steps of:
  • FIG. 1 is an application environment diagram of an information push method in an embodiment
  • FIG. 2 is an internal structural diagram of a server for implementing an information push method in an embodiment
  • FIG. 3 is a schematic flow chart of an information pushing method in an embodiment
  • FIG. 5 is a flowchart of a step of forming a preset first number of clusters according to feature tag vectors of all seed users, and calculating a center vector of a corresponding cluster according to a feature tag vector of a seed user in each cluster in one embodiment.
  • FIG. 6 is a schematic flowchart of a step of acquiring a feature weight vector corresponding to information of each category in an embodiment
  • FIG. 7 is a schematic flowchart of a process of updating a center vector and a feature weight vector corresponding to information of each category according to feedback information in an embodiment
  • FIG. 8 is a flow chart showing the steps of updating a center vector and a feature weight vector corresponding to each category of information according to feedback information in an embodiment
  • FIG. 9 is a structural block diagram of a server in an embodiment
  • Figure 10 is a block diagram showing the structure of a server in another embodiment
  • FIG. 11 is a structural block diagram of a central vector calculation module in an embodiment
  • FIG. 12 is a structural block diagram of a feature weight vector acquisition module in an embodiment.
  • the information pushing method provided by the embodiment of the present application can be applied to the application scenario shown in FIG. 1 .
  • the client terminal 110 can interact with the server 120 through a pre-set network.
  • the client terminal 110 is a terminal of a service provider that needs to send push information to the user, including but not limited to a device having a communication function such as a smart phone, a tablet computer, a palmtop computer, or the like.
  • the server 120 is a server of a platform for social, instant communication, or shopping that stores a large amount of user information, and the large number of users constitute a potential user group.
  • Each potential user in the server 120 has a plurality of feature information, and the feature tag vector can be constructed according to the plurality of feature information, and the feature tag vector can reflect the feature of the user.
  • Client terminal 110 may send a selection request to server 120 for selecting a suitable user to facilitate transmitting relevant push information to the selected user.
  • the server 120 may obtain a feature tag vector of each seed user according to the request, where the seed user is generally a user who has purchased or collected the related product of the service provider; and calculates a preset first quantity according to the feature tag vector of all the seed users.
  • the center vector corresponding to each category of information. The first quantity matches the number of categories included in the information that the service provider prepares to recommend, and each category of information has a center vector correspondingly.
  • the server 120 further includes a feature weight vector corresponding to the feature tag vector, and calculates a first distance between the potential user and the center vector of each category according to the feature tag vector of the potential user, the feature weight vector, and the center vector; The second number of potential users whose distance is the shortest is selected as the target user for pushing information, thereby realizing the selection of the user.
  • the internal structure of server 120 in FIG. 1 is as shown in FIG. 2, which includes a processor coupled through a system bus, a non-volatile storage medium, an internal memory, and a network interface.
  • the non-volatile storage medium of the server stores an operating system, a database, and computer readable instructions.
  • the database is used to store data, such as a feature tag vector for each potential user, a center vector for each category of information, and a feature weight vector.
  • the processor can be implemented to implement an information push method provided in various embodiments of the present application.
  • the server's processor is used to provide computing and control capabilities that support the operation of the entire server.
  • the internal memory of the server provides a cached operating environment for operating systems, databases, and computer readable instructions in a non-volatile storage medium.
  • the network interface of the server may be an Ethernet card or a wireless network card, etc., for communicating with an external terminal or server through a network connection, such as receiving a selection request sent by the terminal 110 or sending push information to a terminal corresponding to the selected user.
  • the server can be implemented with a stand-alone server or a server cluster consisting of multiple servers. It will be understood by those skilled in the art that the structure shown in FIG. 2 is only a block diagram of a part of the structure related to the solution of the present application, and does not constitute a limitation on the server to which the solution of the present application is applied.
  • the specific server may include a ratio. More or fewer components are shown in the figures, or some components are combined, or have different component arrangements.
  • an information pushing method is provided, which can be applied to the server shown in FIG. 1, and specifically includes the following steps:
  • Step 302 Acquire a feature tag vector of each seed user.
  • the server may receive a user selection request sent by the client terminal of the service provider, where the user selection request includes a specific classification of the push information required by the service provider, and a certain number of seed user feature information, and according to the service.
  • the feature information of the seed user provided by the quotient constructs a corresponding feature tag vector.
  • the push information may be any information, and the number of categories classified by the push information is the first quantity. Taking the push information as the clothing information as an example, when the specific classification is divided into three categories: men's clothing, women's clothing, and children's clothing, the corresponding first quantity is 3. Taking the push information as a sporting goods as an example, when the specific classification is divided into four categories: basketball, soccer, volleyball and tennis, the corresponding first quantity is 4.
  • the sample user provided by the seed user for the server is the research object of the user for determining the subsequent recommendation information.
  • high-impact, highly active users can be selected as seed users, such as users who have purchased or collected related products of the service provider, or may have tried and added to the relevant products of the service provider. Users such as cars and so on.
  • the number of seed users can be any number of 10,000, 50,000, etc., and all the number of seed users constitute a seed user group.
  • the feature information is information for embodying characteristics of one or more dimensions of the user.
  • the feature information may include one or more personal basic information of the user's age, gender, occupation, income, education, city, and the like, and may also include behavior information for reflecting the user's behavior and habits.
  • the behavior information may include recording information of one or more behaviors of the user for searching, collecting, browsing, purchasing, etc. of the corresponding product; when the information to be pushed is video and audio
  • the behavior information may include the record information of one or more of the user's video, audio, live broadcast, anchor recommendation, and the like, search, collection, and access.
  • the server may perform corresponding quantization on the feature information of each seed user according to a preset quantization rule, and construct a feature tag vector corresponding to the seed user according to the preset feature tag of the required type.
  • the feature tag vector is a dimension having a certain length, and the parameters in each dimension correspond to a feature information representing the seed user, that is, the feature tag vector is composed of a plurality of feature information of the selected seed user.
  • the type of the feature information selected is n, and the feature tag vector of the i-th seed user may be represented by (y i1 , y i2 , ... y in ), wherein the parameter y im is used to represent the
  • the mth feature information of the i seed users for example, the types of the selected feature information include six basic information of age, gender, occupation, income, education, and city, and also include behaviors for reflecting the user. Customized search, collection, browsing, and purchase of four kinds of behavioral information, then n is 6.
  • the corresponding feature tag vectors are sequentially constructed according to the order of the categories, and y i1 to y i10 respectively represent the specific age, gender, occupation, income, education, city, search, collection, browsing and purchase records of the i-th seed user. Feature information.
  • Step 304 Form a preset first quantity of aggregation according to the feature tag vector of all seed users.
  • the class calculates the center vector of the corresponding cluster according to the feature tag vector of the seed user in each cluster.
  • the number of clusters formed (ie, the first number) is the preset number of classifications of information to be pushed.
  • the server may classify each seed user according to a specific information category to be classified according to the information to be pushed, so that each seed user is divided into one or more clusters corresponding to the category of the information to be pushed.
  • a first number of clusters are formed, each cluster corresponding to a type of information to be pushed.
  • the feature tag vector is reflected in the space coordinate system as a specific point, and the feature tag vectors of the seed users classified into the same category are in the same cluster.
  • the server may calculate a center point of each cluster according to a first number of clusters formed by feature tags vectors of all seed users, and the center point is used as a center vector of information of the category, and the center vector is corresponding The clustering center of the cluster.
  • Each cluster has a one-to-one correspondence with the type of information.
  • a feature tag vector of the seed user in the cluster may be extracted, and a center vector corresponding to the information of the corresponding category is calculated according to a preset clustering algorithm, and the clustering algorithm is used. It can be any clustering algorithm such as K-means, K-medoids or Clara.
  • the calculated center vector is feature information common to the seed user corresponding to the information of a certain category, and the center vector has the same form as the feature tag vector, and has the same length dimension as the feature tag vector, and each dimension thereof
  • the parameters correspond to a feature information common to the seed user. Reflected in the space coordinate system is a specific point.
  • the representation may be (x k1 , x k2 , ... x kn ), where the parameter x km is used to characterize the seed user corresponding to the k-th information.
  • the mth feature information is feature information common to the seed user corresponding to the information of a certain category, and the center vector has the same form as the feature tag vector, and has the same length dimension as the feature tag vector, and each dimension thereof
  • the parameters correspond to a feature information common to the seed user. Reflected in the space coordinate system is a specific point.
  • the representation may be (x k1 , x k2 , ... x kn ), where the
  • FIG. 4 a schematic diagram of clustering feature tag vectors in one embodiment.
  • Each point in the figure represents a feature tag vector corresponding to a seed user.
  • Points in the same circle constitute a cluster. Through all the points in the circle, the corresponding center point can be calculated, and the center point is corresponding.
  • the center vector of the category information is shown in FIG. 4, a schematic diagram of clustering feature tag vectors in one embodiment.
  • the push information is clothing information
  • the information classification is divided into three categories: men's clothing information, women's clothing information, and children's clothing information
  • the server may be formed according to a preset clustering algorithm as shown in FIG. 4 above and below.
  • the clusters at the bottom and bottom right are respectively related to men's clothing information and women's clothing information.
  • the calculated three center vectors are respectively center vectors corresponding to men's clothing information, women's clothing information, and children's clothing information.
  • Step 306 Acquire a feature weight vector corresponding to the information of each category.
  • the server further sets a corresponding first number of feature weight vectors according to a specific classification of the required push information, and each feature weight vector has a one-to-one correspondence with the information of the corresponding category.
  • the feature weight vectors corresponding to different categories of information may be the same or different.
  • the dimension of the feature weight vector is the same as the dimension of the feature tag vector.
  • Each parameter of the feature weight vector is the weight of the parameter of the corresponding feature tag vector in the feature tag vector.
  • the representation may be (w k1 , w k2 , ... w kn ), where w ki is used to reflect the weight of the i-th parameter y i of the feature tag vector corresponding to the k-th information.
  • the weights of the different parameters in the feature tag vector may be the same or different. For the feature information with a greater degree of relevance to the information to be pushed, a larger weight may be set correspondingly. For example, when the information category is three categories of men's clothing information, women's clothing information, and children's clothing information, and the feature vector label indicates age, gender, and occupation parameters, the characteristics corresponding to the men's clothing information and the women's clothing information may be respectively respectively.
  • the parameter reflecting the gender in the weight vector sets a relatively large weight, and the parameter reflecting the gender in the feature weight vector corresponding to the child clothing information is set to a relatively small weight.
  • Step 308 Acquire a feature tag vector of each potential user in the potential user group.
  • a large number of users are stored in the server, and the user is a potential user that can be applied to push information, and the users stored in the server constitute a corresponding potential user group.
  • potential users also have characteristic information including one or more of age, gender, occupation, income, education, city, and shopping habits.
  • the server can construct the feature tag vector of the potential user according to the construction manner of the feature tag vector of the seed user.
  • the feature tag vector of the potential user is the same as the feature tag vector and the center vector of the seed user, and the parameters in the three are represented by the parameters. The meaning is the same.
  • the execution order between the foregoing steps 302-304, 306, and 308 may not be limited, that is, the calculation of the center vector, the feature weight vector, and the order of acquiring the feature tag vector of the potential user are not limited. .
  • Step 310 according to the feature tag vector of the potential user, the feature weight vector, and the center vector, Calculate the first distance of the potential user and the center vector of each category.
  • the server can calculate the distance from each of the central vectors to potential users in the potential user group.
  • Each parameter in a specific potential user's feature tag vector may be subtracted from a corresponding parameter in a center vector of a cluster corresponding to a category information to obtain a difference, and then the difference is squared, and The square value is multiplied by a corresponding parameter in the feature weight vector corresponding to the category information to obtain a corresponding product. Then the product of each parameter is summed, and the obtained value is the first distance of the center vector of the corresponding category.
  • the formula can be To calculate the first distance.
  • d kj represents the first distance of the central vector of the jth potential user corresponding to the kth type information
  • n the feature label vector
  • w kj represents the n corresponding to the kth type information.
  • the jth parameter in the dimension feature weight vector, z ij represents the jth parameter in the n-dimensional feature tag vector of the i-th potential user, and y kj represents the j-th parameter of the n-dimensional center vector of the k-th class information.
  • Step 312 Select a second number of potential users with the shortest distance from the first distance as the target user.
  • the size of the first distance may reflect whether it is suitable to send the matching degree of the corresponding category information to the potential user. That is, if the calculated distance is smaller, the closer the potential user is to the center vector of the corresponding category information, the higher the degree of matching with the corresponding category information, and thus the more suitable to send the corresponding category information to the user.
  • the first distance of the center vector of the clothing information the first distance from the center vector of the child clothing information.
  • the first distance of the three first distances and the center distance of the women's clothing information is the smallest, it is determined that the user is most suitable for pushing the women's clothing among the three types of information. information.
  • the first distance of each class may be ranked by size, and a preset number of potential users with the smallest first distance in the corresponding type are selected as the push information for pushing and matching the type.
  • the second number may be a preset amount, that is, the number of target users to be acquired is set in advance.
  • the server may rank all the calculated first distances, select a corresponding minimum number of first distances according to the ranking, and use the corresponding user as the target user, so that the corresponding push information can be sent to the target user.
  • the second number may not be set in the server, and instead the distance threshold is set, and the potential user corresponding to the first distance less than the distance threshold is set as the target user. Count the number of target users set, which is the second quantity.
  • Step 314 Send the push information that matches the corresponding category to the terminal of the target user.
  • the server may set a corresponding category identifier for the target user, and select information of the category matching the category identifier from the information for preparing the recommendation, and send the information as the push information to the target. user.
  • the server may send the push information matching the corresponding category to the terminal of the target user by using one or more push modes such as a short message or an email. Since the selected target user has high precision, and the corresponding push information is sent to the target user, the probability of being accepted by the target user is relatively high.
  • the information of the target user can be sent to the client terminal to cause the client terminal to push information to the target user's terminal.
  • the server may send the information of the selected target user to the client terminal of the service provider, and the information of the target user includes the contact phone number of the target user, the email address, and the usage account of the application corresponding to the server (such as an instant messaging account). And one or more of the following, further including a corresponding category identifier, so that after receiving the information of the target user, the client terminal can obtain recommendation information matching the corresponding target user according to the category identifier, and then The matching recommendation information is sent to the target user.
  • the client terminal may also send the push information matching the corresponding category to the target user's terminal by one or more push methods such as short message or email, and the selected target user is sent to the target user because of the high precision of the selected target user. After the corresponding push information, the target user The probability of acceptance is also relatively high.
  • the information pushing method calculates a center vector corresponding to each category information according to the obtained feature vector of each seed user and a preset first quantity information category, and then according to the potential user
  • the feature tag vector, the feature weight vector, and the calculated center vector calculate the first distance of the potential user and the center vector of each category; and select the shortest distance from the calculated first distances of all potential users Two number of potential users, as target users who can send corresponding push information to the target user. Because the method pre-classifies the information, and the calculated first distance can reflect the matching degree of the corresponding potential user and the corresponding category information, the smaller the distance, the more suitable to send the corresponding category information to the user, thereby making the The selected target users are more precise.
  • step 304 includes: when the information of the seed user includes the category identifier, determining, according to the category identifier, a category to which the feature tag vector of the corresponding seed user belongs, forming a cluster of the first number of categories; calculating each The center point of the cluster, which is the center vector of the information of the corresponding category.
  • the server may detect whether the information of the seed user includes a category identifier, where the category identifier is used to identify a related product that the corresponding seed user collects or purchases the service provider or a category of the product. .
  • the related product of the service provider that is collected or purchased by the corresponding seed user or the category of the product may be known according to the category identifier, so that the category of the product or the product may be determined to be matched.
  • the type of push information The seed user's feature tag vector is then divided into clusters of information for the determined category.
  • the server may classify the feature tag vectors of each seed user into categories, thereby forming a cluster of the first number of categories.
  • a corresponding center point can be calculated according to the feature label vectors included in each cluster, and the center point is the center vector of the information of the corresponding category.
  • the feature label vectors in each cluster can be arithmetically averaged, which will result The average value is taken as the corresponding center vector.
  • the corresponding seed user can be accurately clustered according to the category identifier, thereby improving the accuracy of the calculated center vector.
  • the accuracy of the subsequent calculation of the first distance can be improved, thereby improving the accuracy of selecting the target user.
  • step 304 includes:
  • Step 502 When the seed user does not include the category identifier, select a first quantity of feature label vectors from the seed user group, and select each feature label vector selected as the initial center vector of the information of one category. So that each category of information has an initial center vector.
  • the server may select a feature label vector of the seed user that is equal to the number of information categories from the seed user group, and respectively select each selected feature label vector as a corresponding one.
  • the initial center vector of the information of the category such that the information for each category has an initial center vector.
  • the server may adopt a preset random function to select the first number of feature tag vectors, and randomly select each selected feature tag vector as a corresponding initial center vector.
  • the first number is n
  • the n clusters to be formed are respectively cluster 1, cluster 2, ... cluster n.
  • the server may select n different feature tag vectors from the seed user group, and record the selected n feature tag vectors as vector 1, vector 2...vector n.
  • the vector 1, the vector 2, and the vector n can be respectively used as the initial center vector of the cluster 1, the cluster 2, and the cluster n, so that the information of each category has an initial center vector.
  • Step 504 Calculate a second distance between each feature tag vector of the seed user group and the last center vector of the information of each category, and determine a category to which the corresponding feature tag vector belongs according to the second distance, to form a first quantity category. Clustering.
  • the server may classify the feature tag vectors of each seed user into categories, thereby forming a cluster of the first number of categories.
  • the first center vector is the initial center vector.
  • the last center vector of each category is the center point of the corresponding cluster calculated in step 506.
  • step 506 a center point of each cluster is calculated.
  • a corresponding center point may be calculated according to the feature label vector included in each cluster, and the center point is a new information of the corresponding category. Center vector.
  • the feature label vectors in each cluster may be arithmetically averaged, with the resulting average being the corresponding new center vector.
  • step 508 it is determined whether the center point of the cluster has converged. If yes, go to step 510. Otherwise, continue to steps 504-508 until the result of the determination is yes.
  • a corresponding distance value is preset in the server, and the preset distance value is used as a criterion for judging whether the corresponding center point converges.
  • step 504 may be continued to re-cluster the information of each category.
  • the center point of each cluster is the last center vector of the information of the corresponding category. If the calculated difference between the new center point and the previous time is less than the preset distance value, it indicates that the calculated new center point converges, and can be used as the final center vector of the information of the category.
  • the center point of each cluster that is currently calculated may be used as the last center vector of the information of the corresponding category, and the process returns to the above step 504, and the steps 504 to 508 are continued to calculate the seed user group.
  • step 510 the center point is taken as the center vector of the information of the corresponding category.
  • the center point can be used as a correspondence The final center vector of the category information.
  • the center point can be used as the final center vector of the information of the corresponding category, thereby improving the accuracy of the calculated center vector, thereby improving the accuracy of selecting the target user.
  • step 306 includes:
  • Step 602 The feature tag vector in the seed user group is used as a positive sample feature tag vector.
  • all the seed users in the seed user group or the feature tag vector of the partial seed user may be selected as the positive sample feature tag vector as a positive sample to form a positive sample vector set.
  • Step 604 Obtain a feature tag vector with the same number of seed users from the potential user group as the negative sample feature tag vector.
  • a negative sample feature label vector equal to the number of positive sample feature label vectors may be selected by using a preset random function, and a negative sample vector set is formed as a negative sample.
  • steps 602 and 604 may not be limited.
  • Step 606 Perform training learning according to the preset classification model according to the positive sample feature tag vector and the negative sample feature tag vector, and generate a feature weight vector.
  • the preset classification model may be any two-category model, and specifically, may be a logistic regression classification model.
  • the server can perform the two-class model training based on the positive sample vector set and the negative sample vector set, and then the feature weight vector under each cluster can be obtained. That is, the feature weight vector is obtained after training the two-class model, and is a parameter obtained after the training of the two-class model.
  • the accuracy of the acquired feature weight vector can be improved by using the preset model described above, thereby correspondingly improving the accuracy of the calculation of the first distance, and improving the accuracy of selecting the target user.
  • step 310 includes: screening feature tag vectors in the potential user group according to the classification model; calculating each of the potential users and the center vector of each category a distance.
  • the classification model is the same as the classification model in the above step 606, and may be any two-category model.
  • the server can input the feature tag vector of the potential user in the potential user group into the classification model and calculate the output result. If the output result is 1, it indicates that the corresponding potential user has a certain degree of matching with the push information, and is a user who can push the push information. If the output result is 0, it indicates that the corresponding potential user does not match the push information, and can be culled, not as a user who delivers push information. Among them, the potential user whose calculation result is 1 is the filtered potential user.
  • the server may calculate a first distance corresponding to the potential user and the center vector of each category only for the feature tag vector, the feature weight vector, and the center vector of each potential user that is filtered out.
  • the server may perform screening on the stored potential users before the first distance is obtained, so as to remove a part of the potential users that do not match the push information, so that the part of the potential users does not need to be first.
  • the calculation of the distance thereby reducing the amount of calculation, reducing the occupation of resources, and improving the efficiency of selection of target users.
  • step 312 includes: performing a total ranking of the first distance; selecting a corresponding number of potential users in the top ranking from the total ranking as the target user.
  • the total ranking is a mixed ranking that does not consider classification.
  • the selected target user may be one or more of all potential users and the information to be pushed.
  • the type of matching is the highest, which improves the accuracy of the target user selection.
  • step 312 includes: separately ranking the first distance corresponding to each category separately; and selecting a corresponding number of potential users in the top of each category as the target user.
  • the server may directly extract the first distance corresponding to the potential users in each category, perform separate ranking for each category, and select the corresponding number of potential users in the top ranking from each category. As the target user.
  • the server may select the minimum first distance in the first distance of the center vector of each category, As the third distance. And setting the potential user to a category identifier of the category information corresponding to the minimum first distance. Through the category identification, it can be known that the corresponding potential user best matches the information of that category.
  • the server may respectively rank the third distances of all potential users having the same category identifier, and select the corresponding number of potential users with the smallest distance from the potential users corresponding to each category identifier as the target for pushing information. user.
  • the corresponding quantity can be configured according to the requirements of different types of information. It is also possible to set a distance threshold corresponding to each category information, and select a potential user corresponding to the third distance in the corresponding category that is smaller than the distance threshold, and select the selected potential user as the target user. The number of target users selected for removal is the second quantity.
  • the first distance corresponding to each category is separately ranked, and the corresponding number of potential users in the top of each category are selected as the target users, so that the number of selected target users is made.
  • a reasonable configuration can be made according to the type of information to be pushed.
  • the method further includes: acquiring feedback information of the target user; and updating a center vector and a feature weight vector corresponding to the information of each category according to the feedback information.
  • the feedback information of the target user includes information corresponding to whether the target user is interested in the recommended information.
  • the terminal of the target user may send feedback information to the server that is interested or not interested in the recommendation information, and the server may receive feedback information sent by the terminal of the target user, and the feedback information may be obtained according to the feedback information. Whether the target user is interested in the recommendation information.
  • the server may detect whether the acquired quantity of the feedback information of the target user reaches a preset number, and when the quantity of the feedback information reaches a preset quantity, perform a center vector and a feature corresponding to updating the information of each category according to the feedback information.
  • Weight vector
  • the clusters divided for the target user can be obtained. If the feedback information indicates that the target user is interested in the recommendation information, the target user is classified into the seed user group of the corresponding category, and the corresponding seed center is updated according to the feature tag vector of the corresponding user in the classified seed user group. . If the feedback information indicates that the target user is not interested in the recommendation information, The feature tag vector of the target user is divided into a negative sample vector set, and according to the positive sample vector set formed by the feature tag vector in the newly formed seed user group, the training is performed according to the preset classification model, and a new feature right is generated. Value vector. Thereby, the update of the center vector and the feature weight vector is realized, and the obtained center vector and the feature weight vector are more accurate, so that the selected target user can be more accurate when the target user is selected again.
  • the step of updating the center vector and the feature weight vector corresponding to the information of each category according to the feedback information includes:
  • Step 702 Determine, according to the feedback information, whether the target user is a seed user.
  • the target user when the feedback information indicates that the target user is interested in the recommendation information, the target user may be used as a seed user and classified into the seed user group; when the feedback information indicates that the target user is not interested in the recommendation information. At this time, the target user is not classified into the seed user group.
  • Step 704 When the target user is a seed user, add the feature tag vector of the target user to the cluster of the corresponding category.
  • the category of the corresponding information may be obtained according to the category identifier of the target user, and the feature label vector of the target user is added to the cluster of the corresponding category, and the cluster is served by the service provider.
  • Step 706 Update the center point of the cluster, and use the updated center point as the center vector of the corresponding category information.
  • the corresponding center point can be calculated according to the calculation method of step 510 described above, and the center point is used as the center vector of the information of the corresponding category.
  • the accuracy of the determined center vector can be made higher, so that the target user selected according to the center vector is more accurate.
  • the step of updating the center vector and the feature weight vector corresponding to the information of each category according to the feedback information includes:
  • Step 802 the target user is divided into a sample vector set according to the feedback information.
  • the server may separately filter out the target information that the feedback information indicates that the user is interested in the recommendation information and is not interested, and uses the selected feature label vector of the target user of interest as the The positive sample is added to the positive sample vector set, and the filtered feature label vector of the target user that is not interested is added as a negative sample to the negative sample vector set.
  • the samples in the positive sample vector set or the negative sample vector set may be added or deleted so that the positive sample quantity is the same as the negative sample quantity.
  • the excess number of samples may be deleted from the negative sample vector set, wherein the previous potential user group may be preferentially deleted.
  • the negative sample feature label vector obtained in .
  • the feature tag vector of a certain number of potential users may be continuously selected from the potential user group, and added as a negative sample to the negative sample vector set to maintain The number of positive samples is the same as the number of negative samples.
  • Step 804 Perform training learning according to the preset classification model according to the divided sample vector set, and update the feature weight vector.
  • the classification model is the same as the classification model in the above step 606, and may be an arbitrary two-class model.
  • the server may perform the two-class model training based on the new positive sample vector set and the negative sample vector set, recalculate the feature weight vector under each cluster, and use the re-calculated feature weight vector as the feature weight of the corresponding category information. vector.
  • the division of the positive and negative sample vector sets is performed on the corresponding target user according to the feedback information, and the feature weight vector is recalculated according to the divided sample vector set, so that the calculated feature weight vector is further The proportion of the corresponding feature tag can be reflected, so that the target user selected according to the feature weight vector is more accurate.
  • a server comprising:
  • the feature tag vector obtaining module 902 is configured to acquire a feature tag vector of each seed user.
  • the central vector calculation module 904 is configured to form a preset first number of clusters according to the feature tag vectors of all seed users, and calculate a center vector of the corresponding cluster according to the feature tag vector of the seed user in each cluster.
  • the feature weight vector obtaining module 906 is configured to acquire the feature weight corresponding to the information of each category. vector.
  • the feature tag vector obtaining module 902 is further configured to acquire a feature tag vector of each potential user in the potential user group.
  • the first distance calculation module 908 is configured to calculate a first distance of the potential user and the center vector of each category according to the feature tag vector of the potential user, the feature weight vector, and the center vector.
  • the target user selection module 910 is configured to select a second number of potential users with the shortest distance from the first distance as the target user.
  • the information pushing module 912 is configured to send the push information that matches the corresponding category to the terminal of the target user.
  • the central vector calculation module 904 is further configured to: when the information of the seed user includes the category identifier, determine, according to the category identifier, a category to which the feature label vector of the corresponding seed user belongs, to form a first quantity of categories. Clustering; calculating the center point of each cluster as the center vector of the information of the corresponding category.
  • the central vector calculation module 904 is further configured to: when the information of the seed user does not include the category identifier, select a first number of feature label vectors from the seed user group, and select each feature label vector selected The initial center vector of the information as one of the categories, respectively, such that the information of each category has an initial center vector; calculating the second distance of each feature label vector of the seed user group from the last center vector of the information of each category Determining, according to the second distance, a category to which the corresponding feature tag vector belongs, forming a cluster of the first number of categories; calculating a center point of each cluster; determining whether the center point of the cluster has converged, and if so, The center point is used as the center vector of the information of the corresponding category; otherwise, the center point of each cluster currently calculated is used as the last center vector of the information of the corresponding category, and each feature label vector of the calculated seed user group is returned.
  • the second distance of the last center vector of each category of information until the center point of the calculated cluster is determined to
  • the feature tag vector obtaining module 902 is further configured to use the feature tag vector in the seed user group as a positive sample feature tag vector; and obtain the same feature tag vector from the potential user group as the negative sample.
  • Feature tag vector; according to the positive sample feature tag The quantity and negative sample feature label vectors are trained and learned according to the preset classification model to generate a feature weight vector.
  • the first distance calculation module 908 is further configured to filter the feature tag vectors in the potential user group according to the classification model; calculate a first distance of each potential user and the center vector of each category.
  • the target user selection module 910 is further configured to separately rank the first distance corresponding to each category separately; and select a corresponding number of potential users in the top of each category as the target user.
  • another server is provided, the server further comprising:
  • the feedback information obtaining module 914 is configured to obtain feedback information of the target user.
  • the central vector calculation module 904 is further configured to update the center vector corresponding to the information of each category according to the feedback information.
  • the feature weight vector acquisition module 906 is further configured to update the feature weight vector corresponding to the information of each category according to the feedback information.
  • the center vector calculation module 904 further includes:
  • the seed user determining unit 1102 is configured to determine, according to the feedback information, whether the target user is a seed user.
  • the cluster updating unit 1104 is configured to add the feature tag vector of the target user to the cluster of the corresponding category when the target user is a seed user.
  • the center vector updating unit 1206 is configured to update a center point of the cluster, and use the updated center point as a center vector of the corresponding category information.
  • the feature weight vector acquisition module 906 further includes:
  • the sample vector set dividing unit 1202 is configured to divide the belonging sample vector set to the target user according to the feedback information.
  • the feature weight vector updating unit 1204 is configured to perform training learning according to the preset model according to the divided sample vector set, and update the feature weight vector.
  • the information pushing module 912 is further configured to send the information of the target user to the guest.
  • the terminal is such that the client terminal pushes information to the target user's terminal.
  • Each of the above modules may be implemented in whole or in part by software, hardware, and combinations thereof.
  • the above modules may be embedded in the hardware in the processor or in the memory in the server, or may be stored in the memory in the server, so that the processor calls the corresponding operations of the above modules.
  • the processor can be a central processing unit (CPU), a microprocessor, a microcontroller, or the like.
  • the storage medium may be a non-volatile storage medium such as a magnetic disk, an optical disk, a read-only memory (ROM), or a random access memory (RAM).

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • Databases & Information Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Computer Interaction (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种信息推送方法,该信息推送方法包括:服务器获取每个种子用户的特征标签向量;根据所有种子用户的特征标签向量形成预设的第一数量的聚类,根据每个聚类中的种子用户的特征标签向量计算相应聚类的中心向量;获取所述每个类别的信息对应的特征权值向量;获取潜在用户群中的每个潜在用户的特征标签向量;根据所述潜在用户的特征标签向量、特征权值向量以及中心向量,计算潜在用户和每个类别的中心向量的第一距离;从所述第一距离中选取距离最短的第二数量的潜在用户,作为目标用户;及向所述目标用户的终端发送与对应类别相匹配的推送信息。

Description

信息推送方法、存储介质和服务器
本申请要求于2016年8月31日提交中国专利局、申请号为2016107974583、发明名称为“用户选取方法和装置”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及信息处理技术领域,特别是涉及一种信息推送方法、存储介质和服务器。
背景技术
随着大数据应用的发展,即时通信和社交应用平台中存储了大量的用户信息,比如用户的喜好、年龄、职业和需求等等,而这些用户信息对于是否可进行信息的推送,比如商品广告等信息的推送,有着重要的参考价值。
传统的技术方案中,通常都是对所获取的海量用户进行简单的筛选,比如筛选出浏览过与服务商准备推送的信息相同或相似的用户,作为目标用户,并向其投放相关服务商的推送信息。而现实中,由于每个用户都是一个独立的存在,具有多样化的特性,仅通过这种简单的筛选所确定的用于投放信息的目标用户不够精准。
发明内容
根据本申请的各种实施例,提供一种信息推送方法、存储介质和服务器。
一种信息推送方法,包括:
获取每个种子用户的特征标签向量;
根据所有种子用户的特征标签向量形成预设的第一数量的聚类,根据每个聚类中的种子用户的特征标签向量计算相应聚类的中心向量;
获取所述每个类别的信息对应的特征权值向量;
获取潜在用户群中的每个潜在用户的特征标签向量;
根据所述潜在用户的特征标签向量、特征权值向量以及中心向量,计算潜在用户和每个类别的中心向量的第一距离;
从所述第一距离中选取距离最短的第二数量的潜在用户,作为目标用户;及
向所述目标用户的终端发送与对应类别相匹配的推送信息。
一种服务器,包括存储器和处理器,所述存储器中储存有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行以下步骤:
获取每个种子用户的特征标签向量;
根据所有种子用户的特征标签向量形成预设的第一数量的聚类,根据每个聚类中的种子用户的特征标签向量计算相应聚类的中心向量;
获取所述每个类别的信息对应的特征权值向量;
获取潜在用户群中的每个潜在用户的特征标签向量;
根据所述潜在用户的特征标签向量、特征权值向量以及中心向量,计算潜在用户和每个类别的中心向量的第一距离;
从所述第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户;及
向所述目标用户的终端发送与对应类别相匹配的推送信息。
一个或多个存储有计算机可读指令的计算机可读非易失性存储介质,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行以下步骤:
获取每个种子用户的特征标签向量;
根据所有种子用户的特征标签向量计算预设的第一数量的信息类别中,每个类别的信息对应的中心向量;
获取所述每个类别的信息对应的特征权值向量;
获取潜在用户群中的每个潜在用户的特征标签向量;
根据所述潜在用户的特征标签向量、特征权值向量以及中心向量,计算潜在用户和每个类别的中心向量的第一距离;
从所述第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户;及
向所述目标用户的终端发送与对应类别相匹配的推送信息。
本申请的一个或多个实施例的细节在下面的附图和描述中提出。本申请的其它特征、目的和优点将从说明书、附图以及权利要求书变得明显。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中信息推送方法的应用环境图;
图2为一个实施例中用于实现信息推送方法的服务器的内部结构图;
图3为一个实施例中信息推送方法的流程示意图;
图4为一个实施例中聚类的示意图;
图5为一个实施例中根据所有种子用户的特征标签向量形成预设的第一数量的聚类,根据每个聚类中的种子用户的特征标签向量计算相应聚类的中心向量的步骤的流程示意图;
图6为一个实施例中获取每个类别的信息对应的特征权值向量的步骤的流程示意图;
图7为一个实施例中根据反馈信息更新每个类别的信息对应的中心向量和特征权值向量的步骤的流程示意图;
图8为一个实施例中根据反馈信息更新每个类别的信息对应的中心向量和特征权值向量的步骤的流程示意图;
图9为一个实施例中服务器的结构框图;
图10为另一个实施例中服务器的结构框图;
图11为一个实施例中中心向量计算模块的结构框图;
图12为一个实施例中特征权值向量获取模块的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例所提供的信息推送方法可应用于如图1所示的应用场景中。参考图1所示,客户终端110可通过预先设置的网络与服务器120进行交互。客户终端110为需要向用户发送推送信息的服务商的终端,包括但不限于具有通信功能的智能手机、平板电脑、掌上电脑等设备。服务器120为存储有大量的用户信息的社交、即时通信或购物等平台的服务器,该大量的用户即构成一个潜在用户群。服务器120中的每个潜在用户均具有多个特征信息,根据该多个特征信息可构成特征标签向量,通过该特征标签向量可反映用户的特征。客户终端110可向服务器120发送用于选取合适的用户的选取请求,以便于向所选取的用户发送相关的推送信息。服务器120可根据该请求来获取每个种子用户的特征标签向量,种子用户一般为购买过或收藏过服务商的相关产品的用户;根据所有种子用户的特征标签向量计算预设的第一数量的信息类别中,每个类别的信息对应的中心向量。其中,第一数量与该服务商准备推荐的信息所包含的种类数量相匹配,每种类别的信息均对应具有一个中心向量。服务器120中还设有与特征标签向量对应的特征权值向量,根据潜在用户的特征标签向量、特征权值向量以及中心向量,计算潜在用户和每个类别的中心向量的第一距离;然后从第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户,从而实现了对用户的选取。
在一个实施例中,图1中的服务器120的内部结构如图2所示,该服务器包括通过系统总线连接的处理器、非易失性存储介质、内存储器和网络接口。其中,该服务器的非易失性存储介质存储有操作系统、数据库和计算机可读指令。数据库用于存储数据,如存储每个潜在用户的特征标签向量、每个类别的信息的中心向量以及特征权值向量等。该计算机可读指令被处理器执行时,可使得处理器实现本申请各实施例中提供的一种信息推送方法。该服务器的处理器用于提供计算和控制能力,支撑整个服务器的运行。该服务器的内存储器为非易失性存储介质中的操作系统、数据库和计算机可读指令提供高速缓存的运行环境。该服务器的网络接口可以是以太网卡或无线网卡等,用于与外部的终端或服务器通过网络连接通信,比如接收终端110发送的选取请求或向所选取的用户对应的终端发送推送信息等。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。本领域技术人员可以理解,图2中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的服务器的限定,具体的服务器可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,如图3所示,提供了一种信息推送方法,该方法可应用于如图1所示的服务器中,具体包括以下步骤:
步骤302,获取每个种子用户的特征标签向量。
本实施例中,服务器可预先接收服务商的客户终端所发送的用户选取请求,该用户选取请求中包含服务商所需推送信息的具体分类、以及一定数量的种子用户的特征信息,并根据服务商所提供的种子用户的特征信息构建对应的特征标签向量。其中,该推送信息可为任意信息,对推送信息所分的类别的数量即为第一数量。以推送信息为服装信息为例,当该具体分类被分为男士服装、女士服装和儿童服装三类时,则相应的第一数量即为3。以推送信息为体育用品为例,当该具体分类被分为篮球、足球、排球和网球四类时,则相应的第一数量即为4。
种子用户为服务器所提供的样本用户,是用于确定后续推荐信息的用户的研究对象。通常可选择影响力高的、活跃度高的用户作为种子用户,比如可为购买过或收藏过服务商的相关产品的用户,或者还可以是对服务商的相关产品进行过试用、加入到购物车等操作的用户等等。种子用户的数量可为10000、50000等任意数量,所有数量的种子用户则构成一个种子用户群。特征信息为用于体现用户的某一种或多种维度的特性的信息。比如该特征信息可包括用户的年龄、性别、职业、收入、学历、所在城市等其中的一种或多种个人基本信息,还可以包含用于反映用户的行为习惯等方面的行为信息。比如当待推送信息为推送购物信息时,该行为信息可包含用户的对相应产品的搜索、收藏、浏览、购买等其中的一种或多种行为的记录信息;当待推送信息为视频、音频、直播间、主播推荐信息等情况下,该行为信息可包含用户的视频、音频、直播间、主播推荐等信息的搜索、收藏、访问等其中的一种或多种行为的记录信息。
服务器可按照预设量化规则对每个种子用户的特征信息进行相应的量化,根据预设的所需类型的特征标签构建对应种子用户的特征标签向量。特征标签向量是具有一定长度的维度,其每个维度上的参数均对应表征种子用户的一种特征信息,即该特征标签向量由所选取种子用户的多个特征信息构成。
设所选取的特征信息的种类为n,对于第i个种子用户的特征标签向量,其表示方式可为(yi1,yi2,...yin),其中,参数yim用于表征第i个种子用户的第m个特征信息,举例来说,所选取的特征信息的种类分别包括年龄、性别、职业、收入、学历、所在城市这6种基本信息,还包括用于反映用户的行为习惯的搜索、收藏、浏览和购买记录的4种行为信息,则n为6。依次按照该种类顺序构建相应的特征标签向量,则yi1至yi10分别表征第i个种子用户的年龄、性别、职业、收入、学历、所在城市、搜索、收藏、浏览和购买记录这些具体的特征信息。
步骤304,根据所有种子用户的特征标签向量形成预设的第一数量的聚 类,根据每个聚类中的种子用户的特征标签向量计算相应聚类的中心向量。
本实施例中,形成的聚类的数量(即第一数量)即为预设的待推送信息的分类的数量。服务器可根据对待推送信息所分类的具体的信息类别,将每个种子用户也进行相应的分类,使得每个种子用户被划分至其中一个或多个与待推送信息的类别对应的聚类中,形成第一数量的聚类,每个聚类对应一种待推送信息的种类。
特征标签向量反映在空间坐标系中则为一个具体的点,被划分为相同类别的种子用户的特征标签向量则处于同一聚类中。服务器可根据由所有种子用户的特征标签向量所形成的第一数量的聚类,计算出每个聚类的中心点,将该中心点作为该类别的信息的中心向量,该中心向量即为相应聚类的聚类中心。其中,每个聚类分别与信息的种类一一对应。在一个实施例中,针对每种形成的聚类,可提取该聚类中的种子用户的特征标签向量,根据预设的聚类算法计算出相应类别的信息对应的中心向量,该聚类算法可为K-means、K-medoids或Clara等任意一种聚类算法。
所计算出的中心向量是用于表征某一类别的信息对应的种子用户所共有的特征信息,中心向量的形式与特征标签向量相同,具有与特征标签向量相同长度的维度,其每个维度上的参数均对应表征种子用户所共有的一种特征信息。反映在空间坐标系中则为一个具体的点。对于第k类的信息的n维中心向量,其表示方式可为(xk1,xk2,...xkn),其中,参数xkm用于表征第k类的信息对应的种子用户所共有的第m个特征信息。
如图4所示,为一个实施例中对特征标签向量进行聚类的示意图。图中的每一个点表示对应一个种子用户的特征标签向量,处于同一圆圈中的点构成了一个聚类,通过该圆圈中的所有点,可计算出对应的中心点,该中心点即为相应类别信息的中心向量。
举例来说,推送信息为服装信息,该信息分类被分为男士服装信息、女士服装信息和儿童服装信息三类时,服务器可按照预设的聚类算法将形成的如图4中上方、左下方、右下方的聚类分别与男士服装信息、女士服装信息 和儿童服装信息对应。所计算出的三个中心向量分别为与男士服装信息、女士服装信息和儿童服装信息对应的中心向量。
步骤306,获取每个类别的信息对应的特征权值向量。
本实施例中,服务器还根据所需推送信息的具体分类设置了对应第一数量的特征权值向量,每个特征权值向量与相应的类别的信息一一对应。其中,不同类别的信息对应的特征权值向量可相同或者不同。同样的,特征权值向量的维数与特征标签向量的维数相同。特征权值向量的每个参数为特征标签向量中对应特征标签向量的参数的权值。其表示方式可为(wk1,wk2,...wkn),其中,wki用于反映对应于第k类信息的特征标签向量第i个参数yi所占的权重。特征标签向量中不同参数对应的权值可相同或不同,对于与待推送的类型的信息关联度较大的特征信息,可对应设置较大的权值。举例来说,当信息类别为男士服装信息、女士服装信息和儿童服装信息三类,且特征向量标签中表示年龄、性别和职业等参数,可分别将与男士服装信息、女士服装信息对应的特征权值向量中反映性别的参数设置一个相对较大的权值,而将与儿童服装信息对应的特征权值向量中反映性别的参数设置一个相对较小的权值。
步骤308,获取潜在用户群中的每个潜在用户的特征标签向量。
本实施例中,服务器中存储有大量的用户,该用户即为可被适用于推送信息的潜在用户,服务器中所存储的用户即构成相应的潜在用户群。同样的,潜在用户也同样具有包括年龄、性别、职业、收入、学历、所在城市以及购物习惯等其中的一种或多种的特征信息。服务器可按照种子用户的特征标签向量的构建方式,构建潜在用户的特征标签向量,潜在用户的特征标签向量与种子用户的特征标签向量以及中心向量的形式均相同,且三者中的参数所表示的含义也相同。
在一个实施例中,上述的步骤302~304、306以及308之间的执行顺序可不做限定,即对于中心向量的计算、特征权值向量以及潜在用户的特征标签向量的获取的顺序不做限定。
步骤310,根据潜在用户的特征标签向量、特征权值向量以及中心向量, 计算潜在用户和每个类别的中心向量的第一距离。
本实施例中,服务器可对潜在用户群中的潜在用户,计算其与每个中心向量的距离。可将某一具体的潜在用户的特征标签向量中的每个参数,与一个类别信息对应的聚类的中心向量中的对应参数相减,得到差值,然后将该差值进行平方运算,将该平方值与该类别信息所对应的特征权值向量中对应的参数相乘,得到相应的乘积。再对每个参数的乘积进行求和,所得到的数值即为相应类别的中心向量的第一距离。
在一个实施例中,可通过公式
Figure PCTCN2017099790-appb-000001
来计算第一距离。其中,dkj表示第j个潜在用户与第k类信息对应的中心向量的第一距离,n表示特征标签向量、特征权值向量以及中心向量的维度,wkj表示第k类信息对应的n维特征权值向量中的第j个参数,zij表示第i可潜在用户的n维特征标签向量中第j个参数,ykj表示第k类信息的n维中心向量的第j个参数。通过上述的计算公式,分别可计算出每个潜在用户和每个类别的中心向量的第一距离。
步骤312,从第一距离中选取距离最短的第二数量的潜在用户,作为目标用户。
本实施例中,第一距离的大小可反映出是否适合向该潜在用户发送对应类别信息的匹配程度。即若所计算出的距离越小,则说明该潜在用户与对应类别信息的中心向量越接近,则与对应类别信息的匹配程度越高,从而也就越适合向该用户发送相应类别的信息。
继续以信息分类为男士服装信息、女士服装信息和儿童服装信息三类为例来说明,则可分别计算出每个用户的特征标签向量分别与男士服装信息的中心向量的第一距离、与女士服装信息的中心向量的第一距离、与儿童服装信息的中心向量的第一距离。针对一个具体的潜在用户,若这三个第一距离中,与女士服装信息的中心向量的第一距离的数值最小,则判断该用户在此三类的信息中,最适合向其推送女士服装信息。针对处于潜在用户群中的所 有潜在用户,可对每一类的第一距离进行大小排名,从其中选取预设数量的在对应类型中的第一距离最小的潜在用户,作为用于推送与该类型相匹配的推送信息。
在一个实施例中,第二数量可为预先设置的数量,即预先设置了要获取的目标用户的数量。服务器可对所计算出所有第一距离进行排名,根据该排名选取出对应数量的最小的第一距离,将其对应的用户作为目标用户,从而可向该目标用户发送相应的推送信息。
在另一个实施例中,服务器中还可不设置第二数量,转而设置距离阈值,将小于距离阈值的第一距离对应的潜在用户设置为目标用户。统计所设置的目标用户的数量,该数量即作为第二数量。
步骤314,向目标用户的终端发送与对应类别相匹配的推送信息。
本实施例中,服务器在选取出目标用户后,可对该目标用户设置相应的类别标识,并从准备推荐的信息中,选取与该类别标识相匹配的类别的信息,作为推送信息发送给目标用户。其中,服务器可采用短信或邮件等一种或多种推送方式向目标用户的终端发送与对应类别相匹配的推送信息。由于所选取的目标用户的精准度高,从而向目标用户发送对应的推送信息后,被目标用户所接受的概率也相对较高。
在一个实施例中,可将目标用户的信息发送给客户终端,以使客户终端推送信息至目标用户的终端。
本实施例中,服务器可将所选取出的目标用户的信息发送给服务商的客户终端,目标用户的信息包括目标用户的联系电话、邮箱以及与服务器对应的应用的使用账号(比如即时通讯账号)等其中的一种或多种,还包括对应的类别标识,使得客户终端在接收到该目标用户的信息后,可根据该类别标识获知与对应目标用户相匹配的推荐信息,进而可自己将相匹配的推荐信息发送给目标用户。同样的,客户终端也可采用短信或邮件等一种或多种推送方式向目标用户的终端发送与对应类别相匹配的推送信息,由于所选取的目标用户的精准度高,从而向目标用户发送对应的推送信息后,被目标用户所 接受的概率也相对较高。
本实施例所提供的信息推送方法,通过根据所获取的每个种子用户的特征向量以及预设的第一数量的信息类别,计算出每个类别的信息对应的中心向量,然后根据潜在用户的特征标签向量、特征权值向量以及所计算出的中心向量,计算潜在用户和每个类别的中心向量的第一距离;再从所计算出的所有潜在用户的第一距离中选取距离最短的第二数量的潜在用户,作为可向该目标用户发送相应的推送信息的目标用户。由于该方法预先信息进行了分类,且计算出的第一距离可反映出对应潜在用户与相应类别信息的匹配程度,距离越小,则说明越适合向该用户发送相应类别的信息,从而使得所选取出的目标用户更加精准。
在一个实施例中,步骤304包括:当种子用户的信息中包含类别标识时,根据类别标识确定对应种子用户的特征标签向量所归属的类别,形成第一数量的类别的聚类;计算每个聚类的中心点,将该中心点作为对应类别的信息的中心向量。
本实施例中,服务器在接收到用户选取请求后,可检测种子用户的信息中是否包含类别标识,该类别标识用于标识对应种子用户所收藏或购买服务商的相关产品或者该产品的所属类别。
当种子用户的信息中包含类别标识时,可根据该类别标识获知对应种子用户所收藏或购买的服务商的相关产品或者该产品的所属类别,从而可确定与该产品或者产品的所属类别相匹配的推送信息的类别。然后将该种子用户的特征标签向量划分到所确定的类别的信息的聚类之中。服务器可对每个种子用户的特征标签向量的进行类别的划分,从而形成了第一数量的类别的聚类。
在形成了第一数量的类别的聚类之后,可根据每个聚类中所包含的特征标签向量,计算出相应的中心点,该中心点即为对应类别的信息的中心向量。在一个实施例中,可对每个聚类中的特征标签向量进行算术平均,将所得到 的平均值作为相应的中心向量。
由于种子用户的信息中包含了类别标识,因而根据该类别标识可准确对相应的种子用户进行聚类,从而可提高所计算出的中心向量的准确度。且由于第一距离与中心向量相关,因而还可提高后续对第一距离的计算的准确度,进而提高了对目标用户选取的精准度。
在一个实施例中,如图5所示,步骤304包括:
步骤502,当种子用户的信息中不包含类别标识时,从种子用户群中选取第一数量的特征标签向量,将所选取出的每个特征标签向量分别作为其中一个类别的信息的初始中心向量,使得每个类别的信息均具有一个初始中心向量。
当种子用户的信息中不包含类别标识时,服务器可从种子用户群中选取出与信息类别的数量等同的种子用户的特征标签向量,并分别将所选取的每个特征标签向量作为对应一种类别的信息的初始中心向量,使得每个类别的信息均具有一个初始中心向量。其中,服务器可采取预设的随机函数来选取第一数量的特征标签向量,并随机地将每个选取出的特征标签向量作为对应的一个初始中心向量。
比如第一数量为n,记待形成的n个聚类分别为聚类1、聚类2...聚类n。服务器可从种子用户群中选取n个不同的特征标签向量,记选取的n个特征标签向量为向量1、向量2...向量n。则可将该向量1、向量2...向量n分别作为聚类1、聚类2...聚类n的初始中心向量,使得每个类别的信息均具有一个初始中心向量。
步骤504,计算种子用户群的每个特征标签向量与每个类别的信息的上一次中心向量的第二距离,根据第二距离确定对应的特征标签向量所归属的类别,形成第一数量的类别的聚类。
在每个类别的信息均具有了中心向量之后,则分别计算剩下的种子用户的特征标签向量与每个初始中心向量的第二距离,根据第二距离确定与种子用户最近的一个初始中心向量,然后将该种子用户的特征标签向量划分到该 初始中心向量所对应类别之中。服务器可对每个种子用户的特征标签向量的进行类别的划分,从而形成了第一数量的类别的聚类。
其中,第一次的中心向量即为初始中心向量,对于后续需再次执行步骤504的时候,每个类别的上一次的中心向量即为在步骤506中所计算出的对应聚类的中心点。
步骤506,计算每个聚类的中心点。
本实施例中,在形成了第一数量的类别的聚类之后,可根据每个聚类中所包含的特征标签向量,计算出相应的中心点,该中心点即为对应类别的信息的新的中心向量。在一个实施例中,可对每个聚类中的特征标签向量进行算术平均,将所得到的平均值作为相应的新的中心向量。
步骤508,判断聚类的中心点是否已收敛。若是,则执行步骤510,否则,继续执行步骤504~508,直至判断结果为是。
在一个实施例中,判断所计算出的新的中心点与前一次的中心点之间的差值是否小于预设距离值。若是,则判断所计算出的中心点收敛,否则,判断不收敛。
本实施例中,服务器中对应预设有一个距离值,该预设距离值用于作为判断对应中心点是否收敛的标准。当其中的一个或多个聚类的中心点不收敛时,可继续执行步骤504,将每个类别的信息,进行重新聚类。该每个聚类的中心点即为对应类别的信息的上一次的中心向量。若所计算出的新的中心点与前一次的差值处于小于该预设距离值,则说明所计算出的新的中心点收敛,可将其作为该类别的信息最终的中心向量。具体地,当判断不收敛时,可将当前计算出的每个聚类的中心点作为对应类别的信息的上一次中心向量,返回上述步骤504,继续执行步骤504~508,计算种子用户群的每个特征标签向量与每个类别的信息的上一次中心向量的第二距离,直至判定计算出的聚类的中心点收敛,并执行步骤510。
步骤510,将该中心点作为对应类别的信息的中心向量。
当在判断出所有聚类的中心点已均经收敛时,则可将该中心点作为对应 类别的信息最终的中心向量。
本实施例中,通过判断所形成的中心向量是否收敛,若否,则循对每个类别的信息进行聚类,根据所形成的新的聚类重新计算中心点,直至每个类别的中心点均收敛,则可将该中心点作为对应类别的信息最终的中心向量,从而也可提高所计算出的中心向量的准确度,进而提高了对目标用户选取的精准度。
在一个实施例中,如图6所示,步骤306包括:
步骤602,将种子用户群中的特征标签向量作为正样本特征标签向量。
本实施例中,可将种子用户群中的所有种子用户或选取出部分种子用户的特征标签向量,将其作为正样本特征标签向量,作为正样本,形成正样本向量集。
步骤604,从潜在用户群中获取与种子用户数量相同的特征标签向量,作为负样本特征标签向量。
其中,可采用预设的随机函数选取中与正样本特征标签向量数量等同的负样本特征标签向量,作为负样本,形成负样本向量集。
在一个实施例中,步骤602和步骤604的执行顺序可不做限定。
步骤606,根据正样本特征标签向量和负样本特征标签向量,按照预设分类模型进行训练学习,生成特征权值向量。
本实施例中,该预设分类模型可为任意的二分类模型,具体的,可为逻辑回归分类模型。服务器可基于正样本向量集和负样本向量集进行二分类模型训练,进而可获得各聚类下的特征权值向量。即该特征权值向量是训练二分类模型之后得到的,是二分类模型训练之后获得的参数。
本实施例中,通过上述的预设模型可提高所获取的特征权值向量的准确度,从而也相应提高了对第一距离的计算的准确度,同样提高了对目标用户选取的精准度。
在一个实施例中,步骤310包括:根据分类模型对潜在用户群中的特征标签向量进行筛选;计算筛选出的每个潜在用户和每个类别的中心向量的第 一距离。
本实施例中,分类模型与上述步骤606中的分类模型相同,可为任意的二分类模型。服务器可将潜在用户群中的潜在用户的特征标签向量输入到该分类模型中,并计算输出结果。若输出结果为1,则表示对应的潜在用户与推送信息具有一定的匹配度,为可投放推送信息的用户。若输出结果为0,则表示对应的潜在用户与推送信息不相符,可将其剔除,不作为投放推送信息的用户。其中,计算结果为1的潜在用户即为筛选出的潜在用户。服务器可仅对所筛选出的每个潜在用户的特征标签向量、特征权值向量以及中心向量,计算对应潜在用户和每个类别的中心向量的第一距离。
本实施例中,服务器可对所存储的海量的潜在用户在求取第一距离之前,进行筛选,以将剔除一部分与推送信息不匹配的潜在用户,使得无需再对该部分潜在用户进行第一距离的计算,从而可减少计算量,降低了对资源的占用,提高了对目标用户的选取效率。
在一个实施例中,步骤312包括:对第一距离进行总的排名;从总的排名中选取排名靠前的对应数量的潜在用户,作为目标用户。
本实施例中,所述总的排名为不考虑分类而进行的混合排名,通过进行总的排名,可使得所选取的目标用户为所有潜在用户中,与准备推送的信息的某一个或多个种类的匹配度均是最高的,从而提高了目标用户选取的精准度。
在一个实施例中,步骤312包括:分别对每个类别对应的第一距离进行单独排名;从每个类别的排名中选取排名靠前的对应数量的潜在用户,作为目标用户。
本实施例中,服务器还可直接提取每个类别下的潜在用户对应的第一距离,针对每个类别进行单独排名,分别从每个类别的排名中选取排名靠前的对应数量的潜在用户,作为目标用户。
进一步的,服务器还可在计算出对应潜在用户和每个类别的中心向量的第一距离后,可在该每个类别的中心向量的第一距离中选取出最小第一距离, 作为第三距离。并将该潜在用户设置一个与该最小第一距离对应的类别信息的类别标识。通过该类别标识,可获知对应潜在用户与那种类别的信息最匹配。
服务器可分别针对具有同一类别标识的所有潜在用户的第三距离进行排名,并从每种类别标识对应的潜在用户中选取出距离最小的对应数量的潜在用户,将其作为用于推送信息的目标用户。
其中,该对应数量既可根据不同类别的信息的需求进行配置。还可以根据针对每个类别信息对应设置一个距离阈值,并选取出对应类别中,小于该距离阈值的第三距离对应的潜在用户,将所选取出的潜在用户作为目标用户。所选取出的目标用户的数量即为第二数量。
本实施例中,通过针对每个类别对应的第一距离进行单独排名,并从每个类别的排名中选取排名靠前的对应数量的潜在用户,作为目标用户,使得所选取的目标用户的数量可按照待推送的信息的类型进行合理的配置。
在一个实施例中,在步骤314之后,还包括:获取目标用户的反馈信息;根据反馈信息更新每个类别的信息对应的中心向量和特征权值向量。
本实施例中,目标用户的反馈信息包括对应目标用户对所推荐的信息是否感兴趣的信息。目标用户的终端在接收到服务商的推荐信息后,可向服务器发送对该推荐信息感兴趣或者不感兴趣的反馈信息,服务器可接收目标用户的终端所发送的反馈信息,根据该反馈信息可获知目标用户对该推荐信息是否感兴趣。
进一步的,服务器可检测所获取的目标用户的反馈信息的数量是否达到预设数量,当反馈信息的数量达到预设数量时,则执行根据反馈信息更新每个类别的信息对应的中心向量和特征权值向量。
对于有反馈信息的目标用户,可获取对该目标用户所划分的聚类。若该反馈信息表示目标用户对推荐信息感兴趣,则将该目标用户归类到对应类别的种子用户群中,根据归类后的种子用户群中对应用户的特征标签向量来更新对应的种子中心。若该反馈信息表示目标用户对推荐信息不感兴趣,则可 将该目标用户的特征标签向量划分到负样本向量集中,并根据新形成的种子用户群中的特征标签向量所构成的正样本向量集,按照预设分类模型进行训练学习,生成新的特征权值向量。从而实现了对中心向量和特征权值向量的更新,使获得的中心向量和特征权值向量更加准确,从而在后续再次选取目标用户时,可使得所选取的目标用户更加精准。
在一个实施例中,如图7所示,根据反馈信息更新每个类别的信息对应的中心向量和特征权值向量的步骤,包括:
步骤702,根据反馈信息确定目标用户是否为种子用户。
本实施例中,当该反馈信息表示目标用户对推荐信息感兴趣时,则可将该目标用户作为种子用户,将其归入到种子用户群中;当反馈信息表示目标用户对推荐信息不感兴趣时,则不将该目标用户归入到种子用户群中。
步骤704,当目标用户为种子用户时,将目标用户的特征标签向量加入到对应类别的聚类中。
对于划分为种子用户的目标用户,可根据该目标用户的类别标识获取到对应的信息的类别,并将该目标用户的特征标签向量加入到对应类别的聚类中,该聚类为由服务商所提供的种子用户的特征标签向量所形成的聚类。
步骤706,更新聚类的中心点,将更新后的中心点作为对应类别信息的中心向量。
在一个实施例中,可按照上述的步骤510的计算方法,计算出相应的中心点,将该中心点作为对应类别的信息的中心向量。通过更新中心向量,可使得所确定的中心向量的准确度更高,从而使得根据该中心向量所选取的目标用户更加精准。
在一个实施例中,如图8所示,根据反馈信息更新每个类别的信息对应的中心向量和特征权值向量的步骤,包括:
步骤802,根据反馈信息对目标用户划分所属样本向量集。
本实施例中,服务器可分别筛选出反馈信息表示对推荐信息感兴趣以及不感兴趣的目标用户,将所筛选出的感兴趣的目标用户的特征标签向量作为 正样本,增加到正样本向量集中,将所筛选出的不感兴趣的目标用户的特征标签向量作为负样本,增加到负样本向量集中。
检测正样本向量集和负样本向量集中的样本数量是否相同,若不相同,可对正样本向量集或负样本向量集中的样本进行增加或删减,以使得正样本数量与负样本数量相同。
在一个实施例中,当负样本向量集的样本数量大于正样本向量集中的样本数量时,可对从负样本向量集中删减出超过数量的样本,其中,可优先删减之前的潜在用户群中获取的负样本特征标签向量。当负样本向量集的样本数量小于正样本向量集中的样本数量时,则可从潜在用户群中继续选取一定数量的潜在用户的特征标签向量,作为负样本,增加到负样本向量集中,以保持正样本数量与负样本数量相同。
步骤804,根据划分后的样本向量集,按照预设分类模型进行训练学习,更新特征权值向量。
分类模型与上述步骤606中的分类模型相同,可为任意的二分类模型。服务器可基于新的正样本向量集和负样本向量集进行二分类模型训练,重新计算各聚类下的特征权值向量,将重新计算出的特征权值向量作为对应类别的信息的特征权值向量。
本实施例中,通过根据反馈信息重新对相应的目标用户进行正负样本向量集的划分,并根据划分后的样本向量集来重新计算特征权值向量,使得所计算出的特征权值向量更能反映出对应特征标签所占的比重,从而使得根据该特征权值向量所选取的目标用户更加精准。
在一个实施例中,如图9所示,提供了一种服务器,该服务器包括:
特征标签向量获取模块902,用于获取每个种子用户的特征标签向量。
中心向量计算模块904,用于根据所有种子用户的特征标签向量形成预设的第一数量的聚类,根据每个聚类中的种子用户的特征标签向量计算相应聚类的中心向量。
特征权值向量获取模块906,用于获取每个类别的信息对应的特征权值 向量。
特征标签向量获取模块902还用于获取潜在用户群中的每个潜在用户的特征标签向量。
第一距离计算模块908,用于根据潜在用户的特征标签向量、特征权值向量以及中心向量,计算潜在用户和每个类别的中心向量的第一距离。
目标用户选取模块910,用于从第一距离中选取距离最短的第二数量的潜在用户,作为目标用户。
信息推送模块912,用于向目标用户的终端发送与对应类别相匹配的推送信息。
在一个实施例中,中心向量计算模块904还用于当种子用户的信息中包含类别标识时,根据所述类别标识确定对应种子用户的特征标签向量所归属的类别,形成第一数量的类别的聚类;计算每个聚类的中心点,将该中心点作为对应类别的信息的中心向量。
在一个实施例中,中心向量计算模块904还用于当种子用户的信息中不包含类别标识时,从种子用户群中选取第一数量的特征标签向量,将所选取出的每个特征标签向量分别作为其中一个类别的信息的初始中心向量,使得每个类别的信息均具有一个初始中心向量;计算种子用户群的每个特征标签向量与每个类别的信息的上一次中心向量的第二距离,根据第二距离确定对应的特征标签向量所归属的类别,形成第一数量的类别的聚类;计算每个聚类的中心点;判断聚类的中心点是否已收敛,若是,则将该中心点作为对应类别的信息的中心向量;否则,将当前计算出的每个聚类的中心点作为对应类别的信息的上一次中心向量,返回所述计算种子用户群的每个特征标签向量与每个类别的信息的上一次中心向量的第二距离,直至判定计算出的聚类的中心点收敛。
在一个实施例中,特征标签向量获取模块902还用于将种子用户群中的特征标签向量作为正样本特征标签向量;从潜在用户群中获取与种子用户数量相同的特征标签向量,作为负样本特征标签向量;根据正样本特征标签向 量和负样本特征标签向量,按照预设分类模型进行训练学习,生成特征权值向量。
在一个实施例中,第一距离计算模块908还用于根据分类模型对潜在用户群中的特征标签向量进行筛选;计算筛选出的每个潜在用户和每个类别的中心向量的第一距离。
在一个实施例中,目标用户选取模块910还用于分别对每个类别对应的第一距离进行单独排名;从每个类别的排名中选取排名靠前的对应数量的潜在用户,作为目标用户。
在一个实施例中,如图10所示,提供了另一种服务器,该服务器还包括:
反馈信息获取模块914,用于获取目标用户的反馈信息。
中心向量计算模块904还用于根据反馈信息更新每个类别的信息对应的中心向量。
特征权值向量获取模块906还用于根据反馈信息更新每个类别的信息对应的特征权值向量。
在一个实施例中,如图11所示,中心向量计算模块904还包括:
种子用户确定单元1102,用于根据反馈信息确定目标用户是否为种子用户。
聚类更新单元1104,用于当目标用户为种子用户时,将目标用户的特征标签向量加入到对应类别的聚类中。
中心向量更新单元1206,用于更新聚类的中心点,将更新后的中心点作为对应类别信息的中心向量。
在一个实施例中,如图12所示,特征权值向量获取模块906还包括:
样本向量集划分单元1202,用于根据反馈信息对目标用户划分所属样本向量集。
特征权值向量更新单元1204,用于根据划分后的样本向量集,按照预设模型进行训练学习,更新特征权值向量。
在一个实施例中,信息推送模块912还用于将目标用户的信息发送给客 户终端,以使客户终端推送信息至目标用户的终端。
上述服务器中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于服务器中的处理器中,也可以以软件形式存储于服务器中的存储器中,以便于处理器调用执行以上各个模块对应的操作。该处理器可以为中央处理单元(CPU)、微处理器、单片机等。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (20)

  1. 一种信息推送方法,包括:
    服务器获取每个种子用户的特征标签向量;
    所述服务器根据所有种子用户的特征标签向量形成预设的第一数量的聚类,根据每个聚类中的种子用户的特征标签向量计算相应聚类的中心向量;
    所述服务器获取所述每个类别的信息对应的特征权值向量;
    所述服务器获取潜在用户群中的每个潜在用户的特征标签向量;
    所述服务器根据所述潜在用户的特征标签向量、特征权值向量以及中心向量,计算潜在用户和每个类别的中心向量的第一距离;
    所述服务器从所述第一距离中选取距离最短的第二数量的潜在用户,作为目标用户;及
    所述服务器向所述目标用户的终端发送与对应类别相匹配的推送信息。
  2. 根据权利要求1所述的方法,其特征在于,所述服务器根据所有种子用户的特征标签向量形成预设的第一数量的聚类,根据每个聚类中的种子用户的特征标签向量计算相应聚类的中心向量,包括:
    当种子用户的信息中包含类别标识时,根据所述类别标识确定对应种子用户的特征标签向量所归属的类别,形成第一数量的类别的聚类;计算每个聚类的中心点,将该中心点作为对应类别的信息的中心向量。
  3. 根据权利要求1所述的方法,其特征在于,所述服务器根据所有种子用户的特征标签向量形成预设的第一数量的聚类,根据每个聚类中的种子用户的特征标签向量计算相应聚类的中心向量,包括:
    当种子用户的信息中不包含类别标识时,从种子用户群中选取第一数量的特征标签向量,将所选取出的每个特征标签向量分别作为其中一个类别的信息的初始中心向量,使得每个类别的信息均具有一个初始中心向量;
    计算种子用户群的每个特征标签向量与每个类别的信息的上一次中心向量的第二距离,根据第二距离确定对应的特征标签向量所归属的类别,形成第一数量的类别的聚类;
    计算每个聚类的中心点;及
    判断聚类的中心点是否已收敛,若是,则将所述中心点作为对应类别的信息的中心向量;否则,将当前计算出的每个聚类的中心点作为对应类别的信息的上一次中心向量,返回所述计算种子用户群的每个特征标签向量与每个类别的信息的上一次中心向量的第二距离,直至判定计算出的聚类的中心点收敛。
  4. 根据权利要求1所述的方法,其特征在于,所述服务器获取每个类别的信息对应的特征权值向量,包括:
    将种子用户群中的特征标签向量作为正样本特征标签向量;
    从潜在用户群中获取与种子用户数量相同的特征标签向量,作为负样本特征标签向量;及
    根据正样本特征标签向量和负样本特征标签向量,按照预设分类模型进行训练学习,生成特征权值向量。
  5. 根据权利要求1所述的方法,其特征在于,所述服务器根据所述每个潜在用户的特征标签向量、特征权值向量以及中心向量,计算潜在用户和每个类别的中心向量的第一距离,包括:
    根据分类模型对所述潜在用户群中的特征标签向量进行筛选;及
    计算筛选出的每个潜在用户和每个类别的中心向量的第一距离。
  6. 根据权利要求1所述的方法,其特征在于,所述服务器从所述第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户,包括:
    分别对每个类别对应的第一距离进行单独排名;及
    从每个类别的排名中选取排名靠前的对应数量的潜在用户,作为所述目标用户。
  7. 根据权利要求1所述的方法,其特征在于,在所述服务器向所述目标用户发送与对应类别相匹配的推送信息之后,还包括:
    获取所述目标用户的反馈信息;及
    根据所述反馈信息更新每个类别的信息对应的中心向量和特征权值向量。
  8. 根据权利要求7所述的方法,其特征在于,所述根据所述反馈信息更新每个类别的信息对应的中心向量和特征权值向量,包括:
    根据所述反馈信息确定所述目标用户是否为种子用户;
    当所述目标用户为种子用户时,将所述目标用户的特征标签向量加入到对应类别的聚类中;及
    更新所述聚类的中心点,将更新后的中心点作为对应类别信息的中心向量。
  9. 根据权利要求7所述的方法,其特征在于,所述根据所述反馈信息更新每个类别的信息对应的中心向量和特征权值向量,包括:
    根据所述反馈信息对所述目标用户划分所属样本向量集;
    根据划分后的样本向量集,按照预设模型进行训练学习,更新特征权值向量。
  10. 根据权利要求1所述的方法,其特征在于,所述服务器向所述目标用户的终端发送与对应类别相匹配的推送信息,包括:
    将所述目标用户的信息发送给客户终端,以使所述客户终端推送信息至所述目标用户的终端。
  11. 一种服务器,包括存储器和处理器,所述存储器中储存有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行以下步骤:
    获取每个种子用户的特征标签向量;
    根据所有种子用户的特征标签向量形成预设的第一数量的聚类,根据每个聚类中的种子用户的特征标签向量计算相应聚类的中心向量;
    获取所述每个类别的信息对应的特征权值向量;
    获取潜在用户群中的每个潜在用户的特征标签向量;
    根据所述潜在用户的特征标签向量、特征权值向量以及中心向量,计算 潜在用户和每个类别的中心向量的第一距离;
    从所述第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户;及
    向所述目标用户的终端发送与对应类别相匹配的推送信息。
  12. 根据权利要求11所述的服务器,其特征在于,所述计算机可读指令被所述处理器执行时,还使得所述处理器执行以下步骤:
    根据分类模型对所述潜在用户群中的特征标签向量进行筛选;及
    计算筛选出的每个潜在用户和每个类别的中心向量的第一距离。
  13. 根据权利要求11所述的服务器,其特征在于,所述计算机可读指令被所述处理器执行时,还使得所述处理器执行以下步骤:
    分别对每个类别对应的第一距离进行单独排名;及
    从每个类别的排名中选取排名靠前的对应数量的潜在用户,作为所述目标用户。
  14. 根据权利要求11所述的服务器,其特征在于,所述计算机可读指令被所述处理器执行时,还使得所述处理器执行以下步骤:
    获取所述目标用户的反馈信息;及
    根据所述反馈信息更新每个类别的信息对应的中心向量和特征权值向量。
  15. 根据权利要求11所述的服务器,其特征在于,所述计算机可读指令被所述处理器执行时,还使得所述处理器执行以下步骤:
    根据所述反馈信息确定所述目标用户是否为种子用户;
    当所述目标用户为种子用户时,将所述目标用户的特征标签向量加入到对应类别的聚类中;及
    更新所述聚类的中心点,将更新后的中心点作为对应类别信息的中心向量。
  16. 根据权利要求11所述的服务器,其特征在于,所述计算机可读指令被所述处理器执行时,还使得所述处理器执行以下步骤:
    根据所述反馈信息对所述目标用户划分所属样本向量集;及
    根据划分后的样本向量集,按照预设模型进行训练学习,更新特征权值向量。
  17. 一个或多个存储有计算机可读指令的计算机可读非易失性存储介质,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行以下步骤:
    获取每个种子用户的特征标签向量;
    根据所有种子用户的特征标签向量计算预设的第一数量的信息类别中,每个类别的信息对应的中心向量;
    获取所述每个类别的信息对应的特征权值向量;
    获取潜在用户群中的每个潜在用户的特征标签向量;
    根据所述潜在用户的特征标签向量、特征权值向量以及中心向量,计算潜在用户和每个类别的中心向量的第一距离;
    从所述第一距离中选取距离最短的第二数量的潜在用户,作为用于推送信息的目标用户;及
    向所述目标用户的终端发送与对应类别相匹配的推送信息。
  18. 根据权利要求17所述的存储介质,其特征在于,所述计算机可读指令被一个或多个处理器执行时,还使得所述一个或多个处理器执行以下步骤:
    根据分类模型对所述潜在用户群中的特征标签向量进行筛选;及
    计算筛选出的每个潜在用户和每个类别的中心向量的第一距离。
  19. 根据权利要求17所述的存储介质,其特征在于,所述计算机可读指令被一个或多个处理器执行时,还使得所述一个或多个处理器执行以下步骤:
    分别对每个类别对应的第一距离进行单独排名;及
    从每个类别的排名中选取排名靠前的对应数量的潜在用户,作为所述目标用户。
  20. 根据权利要求17所述的存储介质,其特征在于,所述计算机可读指令被一个或多个处理器执行时,还使得所述一个或多个处理器执行以下步骤:
    获取所述目标用户的反馈信息;及
    根据所述反馈信息更新每个类别的信息对应的中心向量和特征权值向量。
PCT/CN2017/099790 2016-08-31 2017-08-31 信息推送方法、存储介质和服务器 WO2018041168A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US16/208,226 US11574139B2 (en) 2016-08-31 2018-12-03 Information pushing method, storage medium and server

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201610797458.3 2016-08-31
CN201610797458.3A CN106355449B (zh) 2016-08-31 2016-08-31 用户选取方法和装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US16/208,226 Continuation-In-Part US11574139B2 (en) 2016-08-31 2018-12-03 Information pushing method, storage medium and server

Publications (1)

Publication Number Publication Date
WO2018041168A1 true WO2018041168A1 (zh) 2018-03-08

Family

ID=57859421

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2017/099790 WO2018041168A1 (zh) 2016-08-31 2017-08-31 信息推送方法、存储介质和服务器

Country Status (3)

Country Link
US (1) US11574139B2 (zh)
CN (1) CN106355449B (zh)
WO (1) WO2018041168A1 (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109118288A (zh) * 2018-08-22 2019-01-01 中国平安人寿保险股份有限公司 基于大数据分析的目标用户获取方法及装置
CN109241427A (zh) * 2018-09-04 2019-01-18 中国平安人寿保险股份有限公司 信息推送方法、装置、计算机设备和存储介质
CN110059221A (zh) * 2019-03-11 2019-07-26 咪咕视讯科技有限公司 视频推荐方法、电子设备及计算机可读存储介质
CN110111192A (zh) * 2019-02-19 2019-08-09 西北大学 多过滤器结合nsd指标的信贷客户特征选择方法和系统
CN110751219A (zh) * 2019-10-23 2020-02-04 郑州阿帕斯科技有限公司 一种内容发送方法和装置
CN111046902A (zh) * 2019-10-30 2020-04-21 平安科技(深圳)有限公司 基于聚类算法的分类方法、装置、计算机设备及存储介质
CN111460293A (zh) * 2020-03-30 2020-07-28 招商局金融科技有限公司 信息推送方法、装置及计算机可读存储介质
CN111882398A (zh) * 2020-07-31 2020-11-03 深圳市华云中盛科技股份有限公司 智慧城市服务推荐方法、装置、计算机设备及存储介质
CN112749331A (zh) * 2020-06-28 2021-05-04 腾讯科技(深圳)有限公司 一种数据推荐方法、装置以及计算机可读存储介质
CN113793191A (zh) * 2021-02-09 2021-12-14 京东科技控股股份有限公司 商品的匹配方法、装置及电子设备
CN114422585A (zh) * 2021-12-27 2022-04-29 航天信息股份有限公司 一种企业服务平台消息推送方法及系统

Families Citing this family (66)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106355449B (zh) * 2016-08-31 2021-09-07 腾讯科技(深圳)有限公司 用户选取方法和装置
CN106886918A (zh) * 2017-02-06 2017-06-23 中国联合网络通信集团有限公司 一种目标用户的确定方法、装置及系统
CN108306811B (zh) * 2017-02-06 2021-03-26 腾讯科技(深圳)有限公司 一种消息处理方法及装置
CN108427690B (zh) * 2017-02-15 2022-09-13 腾讯科技(深圳)有限公司 信息投放方法及装置
CN106997629B (zh) * 2017-02-17 2019-06-11 北京格灵深瞳信息技术有限公司 门禁控制方法、装置及系统
CN107247786A (zh) * 2017-06-15 2017-10-13 北京小度信息科技有限公司 用于确定相似用户的方法、装置和服务器
CN107688984A (zh) * 2017-07-27 2018-02-13 上海壹账通金融科技有限公司 产品信息推送方法、装置、存储介质和计算机设备
CN109819282B (zh) * 2017-11-22 2021-04-23 腾讯科技(深圳)有限公司 一种视频用户类别识别方法、装置和介质
CN108108451A (zh) * 2017-12-27 2018-06-01 合肥美的智能科技有限公司 群体的群体用户画像获取方法和装置
CN109977979B (zh) * 2017-12-28 2021-12-07 中国移动通信集团广东有限公司 定位种子用户的方法、装置、电子设备和存储介质
CN108230029A (zh) * 2017-12-29 2018-06-29 西南大学 客户交易行为分析方法
CN108737491B (zh) * 2018-03-23 2020-09-01 腾讯科技(深圳)有限公司 信息推送方法和装置以及存储介质、电子装置
CN108763246B (zh) * 2018-03-29 2022-04-22 科大讯飞股份有限公司 人员分组方法及装置、存储介质、电子设备
CN108777701B (zh) * 2018-04-24 2022-01-25 微梦创科网络科技(中国)有限公司 一种确定信息受众的方法及装置
CN108694606B (zh) * 2018-05-11 2022-07-26 南京邮电大学 一种基于关联规则的客户画像及服务推送方法
CN110267086B (zh) * 2018-05-16 2022-02-25 腾讯数码(天津)有限公司 主播标签建立方法和装置、直播网络界面引擎接口和介质
CN112106067A (zh) * 2018-05-18 2020-12-18 北京嘀嘀无限科技发展有限公司 一种用于用户分析的系统和方法
CN110675179A (zh) * 2018-07-03 2020-01-10 百度在线网络技术(北京)有限公司 营销信息处理方法、装置、电子设备及可读存储介质
CN108932658B (zh) * 2018-07-13 2021-07-06 京东数字科技控股有限公司 数据处理方法、装置和计算机可读存储介质
CN109639561B (zh) * 2018-10-25 2022-03-04 北京达佳互联信息技术有限公司 基于信息反馈的分享方法、装置、电子设备及存储介质
CN109636482B (zh) * 2018-12-21 2021-07-27 南京星云数字技术有限公司 基于相似度模型的数据处理方法及系统
CN109816043B (zh) * 2019-02-02 2021-01-01 拉扎斯网络科技(上海)有限公司 用户识别模型的确定方法、装置、电子设备及存储介质
CN109903086B (zh) * 2019-02-14 2020-12-18 北京奇艺世纪科技有限公司 一种相似人群扩展方法、装置及电子设备
CN109949160A (zh) * 2019-03-27 2019-06-28 上海优扬新媒信息技术有限公司 一种区块链的分片方法及装置
CN110147821A (zh) * 2019-04-15 2019-08-20 中国平安人寿保险股份有限公司 目标用户群体确定方法、装置、计算机设备及存储介质
CN110275986B (zh) * 2019-04-23 2022-02-11 深圳市傲天科技股份有限公司 基于协同过滤的视频推荐方法、服务器及计算机存储介质
CN110097111A (zh) * 2019-04-26 2019-08-06 深圳前海微众银行股份有限公司 一种确定目标用户的方法及装置
CN110069663B (zh) * 2019-04-29 2021-06-04 厦门美图之家科技有限公司 视频推荐方法及装置
CN111861065A (zh) * 2019-04-30 2020-10-30 北京嘀嘀无限科技发展有限公司 一种用户数据管理方法、装置、电子设备及存储介质
CN110197402B (zh) * 2019-06-05 2022-07-15 中国联合网络通信集团有限公司 基于用户群的用户标签分析方法、装置、设备和存储介质
CN110399430A (zh) * 2019-06-14 2019-11-01 平安科技(深圳)有限公司 用户特征确定方法、装置、设备及计算机可读存储介质
CN110321834A (zh) * 2019-06-28 2019-10-11 深圳市商汤科技有限公司 一种身份确定方法及装置、存储介质
CN110309878B (zh) * 2019-06-28 2022-02-22 深圳市商汤科技有限公司 一种信息处理方法及装置、存储介质
CN110413852A (zh) * 2019-07-19 2019-11-05 深圳市元征科技股份有限公司 一种信息推送方法、装置、设备及介质
CN110569428B (zh) * 2019-08-08 2023-10-20 创新先进技术有限公司 一种推荐模型的构建方法、装置及设备
CN110517114A (zh) * 2019-08-21 2019-11-29 广州云徙科技有限公司 一种基于社区发现算法的信息推送方法及系统
CN110740166B (zh) * 2019-09-19 2022-06-17 平安科技(深圳)有限公司 基于距离的信息发送方法、装置、计算机设备和存储介质
CN114223012A (zh) * 2019-10-31 2022-03-22 深圳市欢太科技有限公司 推送对象确定方法、装置、终端设备及存储介质
CN111010595B (zh) * 2019-12-25 2021-08-24 广州欢聊网络科技有限公司 一种新节目推荐的方法及装置
CN111353825B (zh) * 2020-03-10 2024-01-12 北京爱笔科技有限公司 一种消息传输方法及装置
CN111382283B (zh) * 2020-03-12 2023-01-03 腾讯科技(深圳)有限公司 资源类别标签标注方法、装置、计算机设备和存储介质
CN111464641B (zh) * 2020-03-31 2022-11-01 深圳前海微众银行股份有限公司 消息推送优化方法、设备及可读存储介质
CN113821703B (zh) * 2020-06-18 2023-12-08 广州汽车集团股份有限公司 一种车联网用户画像生成方法及其系统
CN111698332A (zh) * 2020-06-23 2020-09-22 深圳壹账通智能科技有限公司 业务对象的分配方法、装置、设备及存储介质
CN111738774A (zh) * 2020-06-30 2020-10-02 中国平安财产保险股份有限公司 识别潜在目标用户的方法、装置、计算机设备和存储介质
CN111973996B (zh) * 2020-08-20 2024-03-12 腾讯科技(上海)有限公司 一种游戏资源投放方法和装置
CN112001760B (zh) * 2020-08-28 2021-10-12 贝壳找房(北京)科技有限公司 潜在用户挖掘方法、装置、电子设备和存储介质
CN112381598B (zh) * 2020-10-26 2023-12-05 泰康保险集团股份有限公司 产品服务信息推送方法及装置
CN113807905A (zh) * 2020-11-05 2021-12-17 北京沃东天骏信息技术有限公司 物品的推荐方法及装置、计算机存储介质、电子设备
CN112270492A (zh) * 2020-11-12 2021-01-26 北京百家科技集团有限公司 一种资源分配方法、装置、计算机设备和存储介质
CN112270008A (zh) * 2020-11-16 2021-01-26 加和(北京)信息科技有限公司 一种精准计算群体特征的方法及系统
CN112561571A (zh) * 2020-12-07 2021-03-26 深圳市思为软件技术有限公司 购房意向评估方法及相关设备
CN112434136B (zh) * 2020-12-08 2024-04-23 深圳市欢太科技有限公司 性别分类方法、装置、电子设备以及计算机存储介质
CN112613917A (zh) * 2020-12-30 2021-04-06 平安壹钱包电子商务有限公司 基于用户画像的信息推送方法、装置、设备及存储介质
CN113781085A (zh) * 2021-01-20 2021-12-10 北京沃东天骏信息技术有限公司 信息生成方法、装置、电子设备和计算机可读介质
CN112835958A (zh) * 2021-02-04 2021-05-25 中国工商银行股份有限公司 目标客户确定方法及装置
CN112989198B (zh) * 2021-03-30 2022-06-07 北京三快在线科技有限公司 推送内容的确定方法、装置、设备及计算机可读存储介质
CN113033685A (zh) * 2021-04-01 2021-06-25 安徽理工大学 一种航空旅客付费选座意愿画像及分析的方法
CN112967100B (zh) * 2021-04-02 2024-03-15 杭州网易云音乐科技有限公司 相似人群扩展方法、装置、计算设备以及介质
CN113139381B (zh) * 2021-04-29 2023-11-28 平安国际智慧城市科技股份有限公司 不均衡样本分类方法、装置、电子设备及存储介质
CN113255694B (zh) * 2021-05-21 2022-11-11 北京百度网讯科技有限公司 训练图像特征提取模型和提取图像特征的方法、装置
CN113409081A (zh) * 2021-06-16 2021-09-17 建信金融科技有限责任公司 一种信息处理方法和装置
CN113657971B (zh) * 2021-08-31 2023-12-01 卓尔智联(武汉)研究院有限公司 物品推荐方法、装置及电子设备
CN114090401A (zh) * 2021-11-01 2022-02-25 支付宝(杭州)信息技术有限公司 处理用户行为序列的方法及装置
CN113902132B (zh) * 2021-12-09 2022-05-24 北京达佳互联信息技术有限公司 负反馈行为预测模型训练方法、消息推送方法及设备
CN116401460B (zh) * 2023-04-23 2024-04-05 中航信移动科技有限公司 一种提高信息推送准确性的方法、存储介质及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040122819A1 (en) * 2002-12-19 2004-06-24 Heer Jeffrey M. Systems and methods for clustering user sessions using multi-modal information including proximal cue information
CN101520878A (zh) * 2009-04-03 2009-09-02 华为技术有限公司 向用户进行广告推送的方法、装置和系统
CN103077220A (zh) * 2012-12-29 2013-05-01 中国科学院深圳先进技术研究院 一种基于用户群关联度的个性化推荐方法及系统
CN104063801A (zh) * 2014-06-23 2014-09-24 广州优蜜信息科技有限公司 一种基于聚类的移动广告推荐方法
CN104408642A (zh) * 2014-10-29 2015-03-11 云南大学 一种基于用户体验质量的广告制作方法
CN105787061A (zh) * 2016-02-29 2016-07-20 广东顺德中山大学卡内基梅隆大学国际联合研究院 信息推送方法
CN106355449A (zh) * 2016-08-31 2017-01-25 腾讯科技(深圳)有限公司 用户选取方法和装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6317722B1 (en) * 1998-09-18 2001-11-13 Amazon.Com, Inc. Use of electronic shopping carts to generate personal recommendations
US7739314B2 (en) * 2005-08-15 2010-06-15 Google Inc. Scalable user clustering based on set similarity
US8095521B2 (en) * 2007-03-30 2012-01-10 Amazon Technologies, Inc. Recommendation system with cluster-based filtering of recommendations
US7966225B2 (en) * 2007-03-30 2011-06-21 Amazon Technologies, Inc. Method, system, and medium for cluster-based categorization and presentation of item recommendations
CN101082972A (zh) * 2007-05-30 2007-12-05 华为技术有限公司 预测用户对商品的兴趣的方法、装置和广告发布方法
CN104111946B (zh) * 2013-04-19 2018-08-07 腾讯科技(深圳)有限公司 基于用户兴趣的聚类方法和装置
US10509816B2 (en) * 2014-05-16 2019-12-17 Facebook, Inc. Runtime expansion of targeting criteria based on user characteristics
CN103996088A (zh) * 2014-06-10 2014-08-20 苏州工业职业技术学院 基于多维特征组合逻辑回归的广告点击率预测方法
CN105868243A (zh) * 2015-12-14 2016-08-17 乐视网信息技术(北京)股份有限公司 信息处理方法及装置
CN105447730B (zh) * 2015-12-25 2020-11-06 腾讯科技(深圳)有限公司 目标用户定向方法及装置
CN105681089B (zh) * 2016-01-26 2019-10-18 上海晶赞科技发展有限公司 网络用户行为聚类方法、装置及终端

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040122819A1 (en) * 2002-12-19 2004-06-24 Heer Jeffrey M. Systems and methods for clustering user sessions using multi-modal information including proximal cue information
CN101520878A (zh) * 2009-04-03 2009-09-02 华为技术有限公司 向用户进行广告推送的方法、装置和系统
CN103077220A (zh) * 2012-12-29 2013-05-01 中国科学院深圳先进技术研究院 一种基于用户群关联度的个性化推荐方法及系统
CN104063801A (zh) * 2014-06-23 2014-09-24 广州优蜜信息科技有限公司 一种基于聚类的移动广告推荐方法
CN104408642A (zh) * 2014-10-29 2015-03-11 云南大学 一种基于用户体验质量的广告制作方法
CN105787061A (zh) * 2016-02-29 2016-07-20 广东顺德中山大学卡内基梅隆大学国际联合研究院 信息推送方法
CN106355449A (zh) * 2016-08-31 2017-01-25 腾讯科技(深圳)有限公司 用户选取方法和装置

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109118288B (zh) * 2018-08-22 2023-06-20 中国平安人寿保险股份有限公司 基于大数据分析的目标用户获取方法及装置
CN109118288A (zh) * 2018-08-22 2019-01-01 中国平安人寿保险股份有限公司 基于大数据分析的目标用户获取方法及装置
CN109241427A (zh) * 2018-09-04 2019-01-18 中国平安人寿保险股份有限公司 信息推送方法、装置、计算机设备和存储介质
CN109241427B (zh) * 2018-09-04 2023-08-18 中国平安人寿保险股份有限公司 信息推送方法、装置、计算机设备和存储介质
CN110111192A (zh) * 2019-02-19 2019-08-09 西北大学 多过滤器结合nsd指标的信贷客户特征选择方法和系统
CN110059221A (zh) * 2019-03-11 2019-07-26 咪咕视讯科技有限公司 视频推荐方法、电子设备及计算机可读存储介质
CN110059221B (zh) * 2019-03-11 2023-10-20 咪咕视讯科技有限公司 视频推荐方法、电子设备及计算机可读存储介质
CN110751219A (zh) * 2019-10-23 2020-02-04 郑州阿帕斯科技有限公司 一种内容发送方法和装置
CN111046902A (zh) * 2019-10-30 2020-04-21 平安科技(深圳)有限公司 基于聚类算法的分类方法、装置、计算机设备及存储介质
CN111046902B (zh) * 2019-10-30 2024-02-02 平安科技(深圳)有限公司 基于聚类算法的分类方法、装置、计算机设备及存储介质
CN111460293A (zh) * 2020-03-30 2020-07-28 招商局金融科技有限公司 信息推送方法、装置及计算机可读存储介质
CN112749331A (zh) * 2020-06-28 2021-05-04 腾讯科技(深圳)有限公司 一种数据推荐方法、装置以及计算机可读存储介质
CN112749331B (zh) * 2020-06-28 2023-09-19 腾讯科技(深圳)有限公司 一种数据推荐方法、装置以及计算机可读存储介质
CN111882398A (zh) * 2020-07-31 2020-11-03 深圳市华云中盛科技股份有限公司 智慧城市服务推荐方法、装置、计算机设备及存储介质
CN113793191A (zh) * 2021-02-09 2021-12-14 京东科技控股股份有限公司 商品的匹配方法、装置及电子设备
CN113793191B (zh) * 2021-02-09 2024-05-24 京东科技控股股份有限公司 商品的匹配方法、装置及电子设备
CN114422585A (zh) * 2021-12-27 2022-04-29 航天信息股份有限公司 一种企业服务平台消息推送方法及系统

Also Published As

Publication number Publication date
CN106355449B (zh) 2021-09-07
US11574139B2 (en) 2023-02-07
US20190102652A1 (en) 2019-04-04
CN106355449A (zh) 2017-01-25

Similar Documents

Publication Publication Date Title
WO2018041168A1 (zh) 信息推送方法、存储介质和服务器
CN109919316B (zh) 获取网络表示学习向量的方法、装置和设备及存储介质
CN107424043B (zh) 一种产品推荐方法及装置,电子设备
CN105224699B (zh) 一种新闻推荐方法及装置
WO2017121251A1 (zh) 一种信息推送方法及装置
WO2020048084A1 (zh) 资源推荐方法、装置、计算机设备及计算机可读存储介质
CN110543598B (zh) 信息推荐方法、装置及终端
CN105022761B (zh) 群组查找方法和装置
CN107833117B (zh) 一种考虑标签信息的贝叶斯个性化排序推荐方法
US20170039242A1 (en) Branching mobile-device to system-namespace identifier mappings
US10380649B2 (en) System and method for logistic matrix factorization of implicit feedback data, and application to media environments
US20090259606A1 (en) Diversified, self-organizing map system and method
CN108648058B (zh) 产品排序方法及装置,电子设备、存储介质
CN104077723B (zh) 一种社交网络推荐系统及方法
KR20130062442A (ko) 협업 필터링 추천 방식을 이용한 추천 방법 및 추천 시스템
CN109241451B (zh) 一种内容组合推荐方法、装置及可读存储介质
CN112015998A (zh) 一种基于用户画像的商品推荐方法
WO2018176913A1 (zh) 搜索方法、装置及非临时性计算机可读存储介质
JP6767342B2 (ja) 検索装置、検索方法および検索プログラム
CN111310032B (zh) 资源推荐方法、装置、计算机设备及可读存储介质
CN110909222A (zh) 基于聚类的用户画像建立方法、装置、介质及电子设备
CN114329207A (zh) 多业务信息排序系统、方法、存储介质及电子设备
CN112861963A (zh) 训练实体特征提取模型的方法、装置和存储介质
CN109146606B (zh) 一种品牌推荐方法、电子设备、存储介质及系统
CN114254615A (zh) 组卷方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17845470

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17845470

Country of ref document: EP

Kind code of ref document: A1