WO2019242331A1 - 用户行为预测方法及装置、行为预测模型训练方法及装置 - Google Patents

用户行为预测方法及装置、行为预测模型训练方法及装置 Download PDF

Info

Publication number
WO2019242331A1
WO2019242331A1 PCT/CN2019/077452 CN2019077452W WO2019242331A1 WO 2019242331 A1 WO2019242331 A1 WO 2019242331A1 CN 2019077452 W CN2019077452 W CN 2019077452W WO 2019242331 A1 WO2019242331 A1 WO 2019242331A1
Authority
WO
WIPO (PCT)
Prior art keywords
contribution value
feature data
feature
behavior
sample
Prior art date
Application number
PCT/CN2019/077452
Other languages
English (en)
French (fr)
Inventor
唐睿明
钮敏哲
曲彦儒
张伟楠
俞勇
Original Assignee
华为技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 华为技术有限公司 filed Critical 华为技术有限公司
Priority to EP19822110.3A priority Critical patent/EP3690768A4/en
Publication of WO2019242331A1 publication Critical patent/WO2019242331A1/zh
Priority to US16/850,549 priority patent/US11531867B2/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • G06Q30/0271Personalized advertisement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Definitions

  • the present application relates to the field of big data processing, and in particular, to a user behavior prediction method and device, and a behavior prediction model training method and device.
  • User behavior prediction is a technology that predicts user behavior based on behavior prediction information (such as user attribute data, current environmental data, and attribute execution object attribute data, etc.). This user behavior prediction technology is widely used in personalized recommendations and advertising. Precision placement and other fields.
  • a linear regression model (Linear Regression model, LR model) is usually used to predict user behavior.
  • the LR model can calculate the contribution value of each feature data in the behavior prediction information to the specified behavior, and then accumulate the contribution value of each feature data to the specified behavior. Get the probability that the user will perform the specified behavior.
  • the contribution value may be used to indicate the degree of influence of the feature data on the user performing the specified behavior, and the size of the contribution value is positively related to the level of the influence.
  • the LR model in the related technology only considers the degree of influence of each feature data on the specified behavior separately, and the accuracy of the user behavior prediction method is low.
  • the present application provides a user behavior prediction method and device, and a behavior prediction model training method and device, which can solve the problem of low accuracy of the behavior prediction method in related technologies.
  • a user behavior prediction method may include: acquiring behavior prediction information for predicting a specified behavior.
  • the behavior prediction information may include multiple feature data, and a category to which any two feature data belong. different. Thereafter, a first contribution value of each feature data of the plurality of feature data to the specified behavior may be obtained, the first contribution value is used to indicate the degree of influence on the execution of the specified behavior, and the size of the first contribution value is There is a positive correlation with the level of this impact.
  • a corresponding feature interaction model For each N feature data of the plurality of feature data, a corresponding feature interaction model may be used for processing to obtain a second contribution value of each N feature data to the specified behavior, where N is greater than 1
  • An integer and a feature interaction model corresponding to any N feature data is determined by the N categories to which the arbitrary N feature data belongs, the second contribution value is used to indicate the degree of influence on the execution of the specified behavior, and the second contribution The magnitude of the value is positively related to the level of the impact.
  • the execution probability of the specified behavior may be determined according to the first contribution value of each feature data and the second contribution value of every N feature data.
  • the user behavior prediction method provided in this application can effectively improve the accuracy of behavior prediction because it takes into account the interactive effects of multiple feature data on the specified behavior.
  • the feature interaction model corresponding to each N feature data is determined based on the category to which the N feature data belongs, that is, each N category corresponds to a feature interaction model, so not only can all feature data be prevented from using the same feature interaction model.
  • the problem of poor prediction results caused by processing can also avoid the problem that each N feature data is processed by an independent feature interaction model, which leads to excessive computational complexity. That is, the behavior prediction method provided in this application can obtain better prediction results with lower computational complexity.
  • the process of determining the execution probability of the specified behavior may include:
  • a first comprehensive contribution value is determined according to the first contribution value of each acquired feature data, and a second comprehensive contribution value is determined according to the second contribution value of each N feature data acquired.
  • a preset weight value may be used to perform a weighted sum of the first comprehensive contribution value and the second comprehensive contribution value to obtain the execution probability.
  • the preset weight value can be obtained by training the training sample data in advance. Using the preset weight value to perform a weighted sum of two comprehensive contribution values can better balance the impact of the individual feature data on the specified behavior. , And the interactive effects of multiple feature data on the specified behavior to ensure the predictive effect of behavior prediction.
  • the process of determining the second comprehensive contribution value according to the obtained second contribution value of each N feature data may include:
  • the method for obtaining the second comprehensive contribution value is relatively simple and has low calculation complexity.
  • the second contribution value of each N feature data obtained may also be input to a neural network, and the output of the neural network may be used as the second comprehensive contribution value.
  • the neural network may be a multilayer neural network, and the weights and biases between the neurons may be obtained by training the training sample data in advance.
  • the pre-trained neural network is used to obtain the second comprehensive contribution value, which can ensure the accuracy of the obtained second comprehensive contribution value, and further ensure the prediction effect of the behavior prediction.
  • the process of determining the first comprehensive contribution value according to the obtained first contribution value of each feature data may include:
  • the reference contribution value may be obtained by training the training sample data in advance.
  • the method may further include:
  • a feature identifier of each feature data in the plurality of feature data is determined, and the feature identifier may be a codeword or a vector that meets a preset format requirement. Since the data format of each feature data in the behavior prediction information may be different, first obtain the feature ID of each feature data, and can convert each feature data into a feature ID of a uniform format, which facilitates subsequent data processing and improves the efficiency of behavior prediction. .
  • the process of obtaining a first contribution value of each feature data of the plurality of feature data to a specified behavior may include:
  • the first contribution value corresponding to the feature identification of each feature data in the plurality of feature data is respectively determined.
  • the corresponding relationship between the feature identifier and the contribution value can be obtained by training the training sample data, and the first contribution value of each feature data is directly obtained based on the corresponding relationship, and the efficiency is high.
  • a corresponding feature interaction model is used to process, and a process of obtaining a second contribution value of each N feature data to the specified behavior may include:
  • the feature vectors corresponding to the feature IDs of each feature data in each of the N feature data are obtained separately, and the feature vectors corresponding to each feature ID are equal in length; and then corresponding to the N categories to which each N feature data belongs.
  • the length of the feature ID corresponding to different feature data may be different, and the length of the feature ID of the feature data of some categories (for example, city, time, temperature, etc.) may be too long, and there is less effective information. Therefore, the feature identifier of each feature data is converted into a feature vector of uniform length and then processed, which can improve the efficiency of data processing.
  • the method may further include:
  • a corresponding feature interaction model is determined from the correspondence between the feature interaction model and the category.
  • the corresponding relationship includes multiple feature interaction models, each of which corresponds to N categories, and any two of the feature interaction models have different categories.
  • the first contribution value, the second contribution value, and the execution probability may all be obtained by a behavior prediction model.
  • the method may further include the following training process:
  • the training sample data may include multiple sample feature data and behavior tags of sample behaviors. Any two sample feature data belong to different categories, and the behavior tags are used to indicate whether the user performs the sample behavior.
  • a first reference contribution value of each sample feature data to the sample behavior is obtained from the plurality of sample feature data, and for each N sample feature data of the plurality of sample feature data, a corresponding feature interaction model is adopted The processing is performed to obtain the second reference contribution value of each N sample feature data to the sample behavior. Further, the execution probability of the sample behavior is determined according to the obtained first reference contribution value of each sample feature data and the second reference contribution value of every N sample feature data.
  • adjust the model parameters of the behavior prediction model and continue training until the training stop condition is satisfied, and the behavior prediction model after adjusting the model parameters is obtained.
  • the adjusted model parameters of the behavior prediction model may include model parameters of each feature interaction model, and may also include a first reference contribution value corresponding to each sample feature data.
  • the behavior prediction model trained by the training process may include multiple feature interaction models, and each feature interaction model may correspond to N categories.
  • each feature interaction model may correspond to N categories.
  • the process of determining the execution probability of the sample behavior may include:
  • the adjusted model parameters of the behavior prediction model may further include at least the reference contribution value, weights and biases between the neurons in the neural network, and the preset weight value.
  • the feature interaction model may include a kernel function
  • the form of the kernel function may be a vector, a matrix, or a function.
  • the form of the kernel function is various, and the flexibility of the behavior prediction model is relatively high.
  • the N may be 2, that is, for each two feature data, a feature interaction model corresponding to two categories to which the two feature data belong may be processed, thereby improving the prediction effect of the behavior prediction.
  • the behavior prediction information may include user attribute data, current environment data, and attribute data of an execution object of the specified behavior.
  • the user attribute data is characteristic data for describing user attributes, and may include characteristic data of multiple categories such as gender, age, and occupation.
  • the current environmental data is characteristic data for describing the state of the environment at the moment of behavior prediction, and may include characteristic data of multiple categories such as time, place, and weather.
  • the attribute data of the execution object specifying the behavior is characteristic data for describing the attributes of the execution object, and may include characteristic data of multiple categories such as the brand and type of the execution object.
  • a method for training a behavior prediction model includes multiple feature interaction models, where each feature interaction model corresponds to N categories, and any two categories corresponding to the feature interaction model are different.
  • the category is the category of sample feature data in the training sample data.
  • the training method may include:
  • the training sample data includes multiple sample feature data and behavior tags of sample behaviors. Any two sample feature data belong to different categories, and the behavior tags are used to indicate whether the user performs the sample behavior.
  • a first reference contribution value of each of the plurality of sample characteristic data to the sample behavior may be obtained after the first reference contribution value is used to indicate the degree of influence on the execution of the sample behavior, and the first reference contribution The magnitude of the value is positively related to the level of the impact.
  • a corresponding feature interaction model is used for processing to obtain a second reference contribution value of the N sample feature data for the sample behavior, and the second reference contribution value It is used to indicate the degree of influence on the execution of the sample behavior, and the magnitude of the second reference contribution value is positively related to the level of the influence.
  • the execution probability of the sample behavior may be determined according to the obtained first reference contribution value of each sample feature data and the second reference contribution value of every N sample feature data.
  • the behavior prediction model trained by the model training method provided in this application may include multiple feature interaction models, and each feature interaction model may correspond to N categories.
  • each feature interaction model may correspond to N categories.
  • each N category corresponds to a feature interaction model during model training, not only the problem of poor training results caused by the processing of the same feature interaction model for all sample feature data can be avoided, but also every N samples can be avoided.
  • Feature data are processed by independent feature interaction model, which leads to the problem of high training computation complexity. That is, the training method provided by the embodiment of the present invention can obtain better training effects with lower computational complexity.
  • the process of determining the execution probability of the sample behavior may include:
  • the first reference comprehensive contribution value and the second reference comprehensive contribution value may be weighted and summed according to a preset weight value to obtain an execution probability of the sample behavior.
  • model parameters adjusted according to the difference may further include at least the reference contribution value, weights and biases between the neurons in the neural network, and the preset weight value.
  • a user behavior prediction device may include at least one module, and the at least one module may be configured to implement the user behavior prediction method according to the foregoing aspect.
  • a behavior prediction model training device may include at least one module, and the at least one module may be used to implement the behavior prediction model training method described in the foregoing aspect.
  • a server may include: a memory, a processor, and a computer program stored on the memory and executable on the processor.
  • the processor executes the computer program, the processor is implemented as described above.
  • a computer-readable storage medium has instructions stored therein, and when the computer-readable storage medium is run on a computer, the computer is caused to perform user behavior prediction according to the foregoing aspect. Method, or a behavior prediction model training method as described in the above aspect.
  • a computer program product containing instructions is provided.
  • the computer program product runs on a computer, the computer is caused to execute the user behavior prediction method according to the above aspect, or the behavior prediction according to the above aspect. Model training methods.
  • the first contribution value of each feature data to the specified behavior can be calculated separately, and the second contribution of N feature data to the specified behavior can be calculated according to the feature interaction model. Contribution value, because the interaction of multiple feature data on the specified behavior is considered, so the accuracy of behavior prediction is effectively improved.
  • the feature interaction model corresponding to each N feature data is determined based on the category to which the N feature data belongs, that is, each N category corresponds to a feature interaction model, so not only can all feature data be prevented from using the same feature interaction model.
  • the problem of poor prediction results caused by processing can also avoid the problem that each N feature data is processed by an independent feature interaction model, which leads to excessive computational complexity. That is, the technical solution provided by this application can obtain better prediction effect with lower calculation complexity.
  • FIG. 1 is a schematic structural diagram of an object pushing system according to an embodiment of the present invention
  • FIG. 2 is a flowchart of a user behavior prediction method according to an embodiment of the present invention.
  • FIG. 3 is a schematic structural diagram of a behavior prediction model according to an embodiment of the present invention.
  • FIG. 4 is an architecture diagram of a behavior prediction model according to an embodiment of the present invention.
  • FIG. 5 is a schematic structural diagram of a kernel function according to an embodiment of the present invention.
  • FIG. 6 is a schematic structural diagram of another kernel function according to an embodiment of the present invention.
  • FIG. 7 is a schematic structural diagram of still another kernel function according to an embodiment of the present invention.
  • FIG. 8 is a schematic structural diagram of a neural network according to an embodiment of the present invention.
  • FIG. 9 is a flowchart of a method for training a behavior prediction model according to an embodiment of the present invention.
  • FIG. 12 is a schematic structural diagram of a first determining module according to an embodiment of the present invention.
  • FIG. 13 is a schematic structural diagram of another user behavior prediction apparatus according to an embodiment of the present invention.
  • FIG. 15 is a schematic structural diagram of a server according to an embodiment of the present invention.
  • the user behavior prediction method provided by the embodiment of the present invention can be applied to an object push system, and the object push system can be deployed in a server.
  • the server has a communication connection with multiple terminals through a wired network or a wireless network, and can push applications, news, or advertisements to users of each terminal.
  • the server may be a server, a server cluster composed of several servers, or a cloud computing service center.
  • the terminal may be a smart phone, a desktop computer, a notebook computer, a tablet computer, or a wearable device.
  • the behavior prediction model 20 may determine the probability of the user performing the specified behavior according to the obtained behavior prediction information for predicting the specified behavior, and send the determined probability to the push model 30.
  • the push model 30 may sort the probabilities of the users performing each specified behavior determined by the behavior prediction model 20, and push the execution target of the specified behavior with a higher probability to the user.
  • the log file 40 may be a network (Web) log, a log obtained through a packet sniffer, a log obtained through a buried point technology, or a log obtained through other methods, which is not limited in the embodiment of the present invention.
  • the behavior prediction information used to predict the specified behavior may include: user attribute data (such as the user's gender, age, occupation, and education), attribute data of the execution target of the specified behavior (such as the type of application, release time, and Brand, etc.) and current environmental data (e.g. time, weather, temperature, location, etc.).
  • the object pushing system is a personalized recommendation system for pushing applications
  • the personalized recommendation system is deployed in a background server of an application market.
  • the application market can send a recommendation request to the background server.
  • the background server can separately obtain behavior prediction information for predicting the behavior of the user downloading each candidate application, and can use the obtained behavior prediction information Predict the probability that a user will download each candidate application.
  • the background server can recommend several applications with a higher probability to the application market for display, thereby achieving the effect of improving the download rate of the applications.
  • the actual download behavior data of the user will be stored in the log file 40 as new training sample data, so that the learning module 10 continuously updates the model parameters of the behavior prediction model 20 through training on the new training sample data, so as to improve The prediction effect of the behavior prediction model 20.
  • the behavior prediction model 20 is mainly used to predict the user's advertisement click behavior.
  • the historical behavior information obtained by the learning module 10 may be historical data of user clicks on advertisements.
  • the behavior prediction model 20 can predict the probability of a user clicking each advertisement based on the acquired user attribute data, current environmental data, and attribute data of each candidate advertisement provided by the advertiser, and display the highest probability advertisement to the user.
  • the user's actual click behavior data will be stored in the log file 40 as new training sample data, so that the learning module 10 continues to train the new training sample data.
  • the advertisement click history data obtained by the learning module 10 usually includes multiple feature data belonging to different categories.
  • each advertisement click history data may include multiple categories of characteristic data such as the user's age, gender, city, time when the advertisement was clicked, the brand of the advertisement, and Internet Protocol (IP) address.
  • IP Internet Protocol
  • the first four items are characteristic data, and the last one is a behavior label.
  • the behavior label can be used to indicate whether the user clicked on the advertisement. For example, 1 indicates that the user clicked on the advertisement, and 0 indicates that the user did not click on the advertisement.
  • the categories to which the characteristic data included in each advertisement click history data belong are: the city where the user is located, the day of the week, the time, and the brand of the advertisement. Therefore, the second ad click history data can indicate a click on the advertisement of fast food A by a user in Shanghai at 11:20 am on Sunday.
  • the categories to which the multiple feature data included in the advertisement click history data belong are different, and the multiple feature data have strong discrete characteristics (that is, each feature data can be represented by discrete numerical values)
  • interactions between different types of feature data sometimes have a positive correlation distribution with the probability of the user clicking the ad, and sometimes a negative correlation distribution.
  • food-related ads are more likely to be clicked during meal times, while cold drink-related ads are less likely to be clicked during winter. Therefore, mining the relationship between feature data has an important impact on improving the accuracy of object push systems.
  • Step 101 Obtain behavior prediction information for predicting a specified behavior.
  • the behavior prediction model may obtain behavior prediction information for predicting a specified behavior after receiving a prediction request sent by a terminal.
  • the specified behavior may be one of a plurality of candidate behaviors pre-configured in the object push system.
  • the behavior prediction information used to predict the specified behavior may include multiple feature data, and the categories to which any two feature data belong are different.
  • the prediction request may be a request for the terminal to obtain a candidate object.
  • the prediction request may instruct the user to start an application (such as an application market, news, or video), and then the terminal may send an object acquisition request to the background server.
  • a request is used to request an object such as an application, news, or video.
  • the prediction request may also be a request for the terminal to obtain a specified object.
  • the prediction request may instruct the user to obtain a video object acquisition request sent by the terminal to a background server after the terminal plays a video online. After the background server receives the video object acquisition request, before sending the video object to the terminal, it can predict the probability of the terminal user clicking each candidate advertisement based on the obtained behavior prediction information, and push the highest probability advertisement to the terminal.
  • the behavior prediction information used to predict the specified behavior may include user attribute data, current environment data, and attribute data of an execution object of the specified behavior.
  • the user attribute data may be characteristic data for describing user attributes, and may include, for example, characteristic data of multiple categories such as gender, age, occupation, education, and place of origin.
  • the current environmental data is characteristic data for describing an environmental state at the moment of behavior prediction, and may include, for example, characteristic data of multiple categories such as time, place, temperature, and weather.
  • the attribute data of the execution object specifying the behavior may be characteristic data for describing the attributes of the execution object, and may include, for example, characteristic data of multiple categories such as the brand, type, and release time of the execution object.
  • the user attribute data in the behavior prediction information may be obtained from a log file, or may be obtained from a background server (for example, a user database of a video server) of the object provider.
  • the attribute data of the execution object may be obtained from a log file, or may be obtained from a background server (such as a video database of a video server) of the object provider.
  • the object pushing system is an accurate advertisement delivery system for pushing advertisements before a video is played
  • the user behavior is a behavior of a user clicking an advertisement
  • the prediction request may be a request for obtaining a video object sent by a terminal.
  • the behavior prediction model 20 of the advertisement accurate delivery system can detect the prediction request and can obtain the advertisements for users. Click the behavior of each candidate ad to predict the behavior prediction information.
  • the behavior prediction information obtained by the behavior prediction model 20 and used to predict the behavior of the user clicking on the advertisement A may include: female, 30 years old, 12:00, advertisement A, and food.
  • the categories to which the plurality of characteristic data included in the behavior prediction information belong are: gender, age, time, the brand of the advertisement, and the type of the advertisement. Among them, gender and age are attribute data of the user, time is the current environmental data, and the brand and type of the advertisement are attribute data of the execution object.
  • Step 102 Determine a feature identifier of each feature data in the plurality of feature data according to a correspondence between the feature data and the feature identifier. Go to step 103 and step 104.
  • the behavior prediction model may first determine the feature identifier of each feature data, which may be a codeword that meets the requirements of a preset format or Vector, which can convert each feature data into a feature identifier of a uniform format, which facilitates subsequent data processing and improves the efficiency of behavior prediction.
  • Each feature data corresponds to a unique feature identifier in the category to which it belongs, and the feature identifiers corresponding to the feature data of different categories may be the same.
  • the feature identifier of each feature data may be a vector obtained by using a one-hot code. Only one bit of the feature ID obtained by using the one-hot code is 1 and the other bits are 0, and the length of the feature ID is equal to the total number of feature data included in the category to which the feature data belongs.
  • the feature identifier obtained by using the one-hot code may be a code word including two binary numbers. For example, the codeword corresponding to a gender female can be 01, and the codeword corresponding to a gender male can be 10.
  • Step 103 Obtain a first contribution value of each feature data of the plurality of feature data to the specified behavior. Go to step 105.
  • the first contribution value may be used to indicate the degree of influence of the feature data on performing the specified behavior, and the size of the first contribution value is positively related to the level of the influence. That is, the larger the first contribution value of certain feature data is, the higher the degree of influence of the feature data on performing the specified behavior, that is, the more likely the user is to perform the specified behavior.
  • the first contribution value may be a positive number not greater than 1.
  • the data processing module 201 can sort the feature identifiers of each feature data according to a predetermined category order (for example, the category of the first feature data is gender, and the second feature data The categories are age, etc.) to obtain an identification sequence, and then input the identification sequence to the width model module 202.
  • the width model module 202 After the width model module 202 obtains the identification sequence, it can determine the category to which the characteristic data indicated by the characteristic identification belongs based on the position of each characteristic identification in the identification sequence based on the predetermined feature sequence, and then can obtain the The corresponding relationship corresponding to the category, and the first contribution value of the feature data is obtained from the corresponding relationship.
  • N may be 2, that is, for each two feature data, a feature interaction model corresponding to two categories to which the two feature data belong may be processed, thereby effectively ensuring the The prediction effect of the behavior prediction model.
  • the behavior prediction model may include 10 feature interaction models.
  • the correspondence between the 10 feature interaction models and the categories can be shown in Table 1.
  • the feature interaction model corresponding to gender and age is ⁇ 0,1
  • the feature interaction model corresponding to age and time is ⁇ 1,2 .
  • Table 1 it can be known that in the behavior prediction model, the feature interaction model corresponding to the i-th category and the j-th category in the multiple categories can be expressed as ⁇ i, j .
  • the behavior prediction model since the behavior prediction model obtains a feature identifier of each feature data in the above step 102, when obtaining the second contribution value of each N feature data, the The behavior prediction model may first obtain the feature vector corresponding to the feature ID of each feature data in the N feature data, and then use a feature interaction model corresponding to the N categories to which the N feature data belongs, to obtain the obtained N feature vectors are processed to obtain a second contribution value of the N feature data to the specified behavior.
  • the behavior prediction model may previously store the correspondence between the feature ID and the feature vector, and the length of the feature vector corresponding to each feature ID is equal.
  • the length of the feature vector may be determined by experience values, for example, it may be 16 or 32. Wait. Because the length of the feature ID corresponding to different feature data may be different, and the length of the feature ID of the feature data of some categories (for example, city, time, temperature, etc.) may be too long, and there is less effective information. Therefore, in order to improve the data processing efficiency, before calculating the second contribution value of every N feature data, the feature identifier of each feature data can be converted into a feature vector of a uniform length, and then each of the N feature vectors is further processed. Processing to obtain the corresponding second contribution value.
  • the correspondence between the feature identifiers and feature vectors stored in the width model module 202 may include multiple correspondences, each correspondence corresponds to a category, each The corresponding relationship is used to record the feature vector corresponding to each feature data in the corresponding category.
  • the identification sequence sent by the data processing module 201 to the feature interaction submodule 2031 is 1, 30, 12, 1, and 4.
  • the feature interaction sub-module 2031 may determine the category to which the feature data indicated by each feature identifier in the identification sequence belongs according to a predetermined category order: gender, age, time, brand of the advertisement, and type of advertisement.
  • the feature interaction submodule 2031 may determine that the category to which the feature data indicated by the feature identifier belongs is gender, and therefore may be determined from the correspondence between the feature identifier corresponding to the gender and the feature vector
  • the feature vector corresponding to the feature ID 1 is v 0,1 .
  • the feature interaction sub-module 2031 can sequentially obtain the feature vectors corresponding to the other four feature identifiers based on the same method: v 1,30 , v 2,12 , v 3,1, and v 4,4 .
  • the first bit of the subscript in each feature vector may indicate the category of the feature data, that is, the position of the feature identifier in the identification sequence, and the second bit is the feature identifier of the feature data in the category to which the feature data belongs.
  • the prediction effect of the behavior prediction model can be effectively improved.
  • the feature interaction model in the behavior prediction model may be a kernel function ⁇ , and the form of the kernel function ⁇ may be a vector, a matrix, or a function.
  • the structures of the kernel functions of different feature interaction models may be the same (for example, they may all be in matrix form), but the parameters of the kernel functions of different feature interaction models are different.
  • the parameters of each kernel function are obtained by training the training sample data in advance.
  • the kernel function ⁇ in the feature interaction model may be a kernel vector; or as shown in FIG. 6, the kernel function ⁇ may be a kernel matrix; or, As shown in FIG. 7, the kernel function ⁇ may be a functional kernel represented in the form of a neural network.
  • the embodiment of the present invention extends the implementation of the feature interaction model from a single calculation vector inner product to a kernel function, and maps the feature vectors to different spaces to calculate the influence of each feature vector on the execution of a specified behavior, effectively improving Flexibility in feature interaction model implementation. And because the structure of the kernel function is more diverse, the accuracy of the second contribution value calculated by the feature interaction model can be further improved.
  • the behavior prediction model may sum the first contribution value and the reference contribution value of each acquired characteristic data to obtain the first comprehensive contribution value.
  • the reference contribution value may be obtained by training the behavior prediction model on the sample feature data in advance, and the reference contribution value may also be a positive number not greater than 1.
  • the reference contribution value may be an output of the width model module 202 when no feature data is input.
  • the first comprehensive contribution value out 1 can satisfy:
  • the behavior prediction model may also directly sum the first contribution values of the respective acquired characteristic data, so as to obtain the first comprehensive contribution value. That is, the behavior prediction model may not need to train and store the reference contribution value.
  • the obtaining of the determined second comprehensive contribution value may also be implemented by the feature interaction model module 203 in the behavior prediction model.
  • the feature interaction model module 203 may be implemented by the integrated processing sub-module 2032 in the feature interaction model module 203.
  • the behavior prediction model may directly sum the obtained second contribution values of every N feature data to obtain the second comprehensive contribution value.
  • the method for obtaining the second comprehensive contribution value is relatively Simple and low computational complexity.
  • the behavior prediction model may further input a second contribution value of each N feature data obtained into the neural network, and use the output of the neural network as the second comprehensive contribution value.
  • the pre-trained neural network is used to obtain the second comprehensive contribution value, which can ensure the accuracy of the obtained second comprehensive contribution value, and further ensure the prediction effect of the behavior prediction.
  • the comprehensive processing sub-module 2032 may be a neural network module.
  • the feature interaction submodule 2031 can generate a feature interaction vector based on each second contribution value it obtains, and input the feature interaction vector to A neural network (for example, each second contribution value in the feature interaction vector can be input into a neuron in the input layer).
  • the length of the feature interaction vector is Exemplarily, the feature interaction sub-module 2031 generates a feature interaction vector V f based on the second contribution value obtained by it:
  • V f [f 0,1 , f 0,2 , f 0,3 , f 0,4 , f 1,2 , f 1,3 , f 1,4 , f 2,3 , f 2,4 , f 3,4 ].
  • each second contribution value in the feature interaction vector may be arranged according to the order of the categories to which the N feature data corresponding to the second contribution value belong in the identification sequence.
  • the category to which the two feature data corresponding to the second contribution value f 0,1 belong is the first two bits in the identification sequence, so the second contribution value f 0,1 may be used as the first position in the feature interaction vector.
  • the category to which the two feature data corresponding to the second contribution value f 3,4 belong is the last two bits in the identification sequence, so the second contribution value f 3,4 may be used as the last bit in the feature interaction vector.
  • FIG. 8 is a schematic structural diagram of a neural network according to an embodiment of the present invention.
  • the neural network may be a multi-layer neural network, and each layer of the neural network includes multiple neurons.
  • the weights and offsets can also be located during training. After the neural network obtains the interactive feature vector, it can calculate the value of each neuron layer by layer based on the weights and offsets between the trained neurons, and finally calculate the value of the neurons in the output layer.
  • the input layer of the neural network is the lowest layer of the entire network, and the output layer is the uppermost layer.
  • Each layer of neurons in a neural network is connected to one or more neurons in an adjacent layer, and the connecting edge between two neurons contains a weight and bias.
  • the neural network processes the input interactive feature vector, it can calculate from the input layer to the upper layer, and the value of each neuron is determined by the value of the neuron in the next layer connected to it.
  • the contribution value of each lower neuron to the neuron in the upper layer it is connected to is obtained by multiplying the value of the lower neuron by the weight of the corresponding connected edge and adding the offset.
  • the three neurons are y1, y2, and y3.
  • w kl be the weight of the edge between the k-th neuron in the second layer and the l-th neuron in the first layer
  • b k be the offset of the k-th neuron in the second layer.
  • the values of the three neurons in the second layer are:
  • y2 A (x1 * w 21 + x2 * w 22 + x3 * w 23 + b 2 );
  • y3 A (x1 * w 31 + x2 * w 32 + x3 * w 33 + b 3 );
  • the values of the three neurons in the second layer can be expressed in the form of matrix multiplication as follows:
  • the value of the neurons in the final output layer (that is, the second comprehensive contribution value) out 2 can satisfy:
  • r H-1 is the neuron in the H-1 layer
  • W H-1 and b H-1 are the sum of the weights of the edges between the neuron in the H-1 layer and the neuron in the output layer, respectively.
  • the preset weight value is also obtained by training the behavior prediction model on the sample feature data in advance, and the preset weight value includes a weight of the first comprehensive contribution value and a weight of the second comprehensive contribution value.
  • the weighted summation is used to obtain the execution probability, which can better balance the influence of individual feature data on the specified behavior, and the interactive influence of multiple feature data on the specified behavior, and ensure the prediction effect of behavior prediction.
  • the execution probability P may also be referred to as a predicted score of a specified behavior. The higher the execution probability P of the specified behavior, the more likely the user is to perform the specified behavior.
  • the weighted summation of the first comprehensive contribution value and the second comprehensive contribution value may obtain a summing result that may exceed the range of [0,1], after performing the weighted summing, if the summing result is Beyond the range of [0,1], you can also use a mapping function to process the summation result to map the summation result to the interval of [0,1].
  • the mapping function may be an sigmoid function or other functions having similar functions, which is not limited in the embodiment of the present invention.
  • the behavior prediction model may calculate the execution probability of each candidate behavior performed by the user by using the methods shown in the above steps 101 to 107, and may The calculation results are sent to the push model 30.
  • the push model 30 can sort the execution probability of each candidate behavior in order from highest to lowest, and push the execution object of the candidate behavior with the highest probability to the terminal, or can push several candidates with the highest execution probability ranking to the terminal.
  • the execution object of the behavior may be calculated using the methods shown in the above steps 101 to 107.
  • the candidate behavior is a behavior of clicking an advertisement
  • the execution target of the candidate behavior is an advertisement. If the advertisement precise delivery system has five candidate advertisements A to E in advance, the probability of the user clicking the five advertisements calculated by the behavior prediction model is 0.8, 0.5, 0.3, 0.6, and 0.4, respectively. Then, the push model 30 can determine that the user has the highest probability of clicking the advertisement A, and therefore can push the advertisement A to the terminal.
  • the object pushing system is a personalized recommendation system
  • the personalized recommendation system is deployed in a background server in the application market.
  • the application market can send a recommendation request to the background server.
  • the personalized recommendation system deployed in the background server for multiple candidate applications, such as application 1 to application 10, the behavior prediction model of the personalized recommendation system can calculate the user to download each candidate application separately Probability of the program.
  • the background server can recommend several applications with higher probability to the application market for display.
  • the objects pushed by the object pushing system can be not only advertisements and applications, but also videos, music, and news, which are not limited in the embodiment of the present invention.
  • An embodiment of the present invention further provides a training method for a behavior prediction model, and the training method may be used to train the behavior prediction model used in the foregoing method embodiments.
  • This training method can be applied to the learning module 10 in the object push system shown in FIG. 1. Referring to FIG. 9, the method may include:
  • Step 301 Obtain training sample data, where the training sample data includes multiple sample feature data and behavior labels of sample behaviors.
  • the learning module 10 may store an initial reference contribution value corresponding to each sample feature data, and the initial reference contribution value may be obtained by random initialization.
  • the learning module 10 may obtain a first reference contribution value of each sample feature data to the sample behavior based on the corresponding relationship.
  • the learning module 10 may store initial model parameters of multiple feature interaction models, where each feature interaction model may correspond to N categories, and categories corresponding to each feature interaction model are different from each other.
  • the initial model parameters of each feature interaction model may be the same or different, which is not limited in the embodiment of the present invention.
  • the learning module may compare the difference between the execution probability and the behavior label recorded in the training sample data, and adjust the model parameters of the behavior prediction model based on the difference.
  • the model parameters may include model parameters of each feature interaction model and a first reference contribution value corresponding to each sample feature data.
  • the model parameters may include parameters of a kernel function and a feature vector corresponding to a feature identifier of each feature data.
  • FIG. 10 is a flowchart of a method for determining an execution probability of a sample behavior according to an embodiment of the present invention.
  • the method may include:
  • the reference contribution value may be a preset value less than 1, for example, may be 0.
  • Step 3042 The second reference contribution value of each sample feature data obtained is input to a neural network, and the output of the neural network is used as the second reference comprehensive contribution value.
  • the neural network may be a multilayer neural network, and each layer includes multiple neurons.
  • the weights and biases between the neurons in adjacent layers can be both preset initial values.
  • Step 3043 Perform a weighted sum of the first reference comprehensive contribution value and the second reference comprehensive contribution value according to a preset weight value to obtain an execution probability of the sample behavior.
  • the preset weight value may also be a preset fixed value.
  • the weights of the first reference comprehensive contribution value and the second reference comprehensive contribution value may both be 0.5.
  • the model parameters adjusted by the learning module 10 may at least further include: the reference contribution value, weights and offsets between neurons in the neural network, and the preset weight value.
  • the method may further include:
  • a characteristic identifier of each sample characteristic data in the plurality of sample characteristic data is determined.
  • step 302 may include:
  • step 303 may include:
  • Step 3031 The feature vectors corresponding to the feature identifiers of each sample feature data in each N sample feature data are respectively obtained, and the lengths of the feature vectors corresponding to each feature identifier are equal.
  • Step 3032 Using a feature interaction model corresponding to the N categories to which each N sample feature data belongs, process the obtained N feature vectors to obtain a second contribution of each N sample feature data to the sample behavior. value.
  • the model parameters of the behavior prediction model adjusted based on the difference may further include a feature vector corresponding to each feature identifier.
  • the learning module needs to train a large amount of training sample data, and the process of training for each training sample data can refer to the above steps 301 to 305. I will not repeat them here.
  • steps 301 to 305 and steps 3041 to 3043 reference may also be made to corresponding steps in the embodiment shown in FIG. 2 above, and details are not described herein again.
  • a corresponding feature interaction model can be established for each N categories in the feature data. If the same feature interaction model is established for any number of categories of feature data, although the efficiency of model training can be effectively improved, the effect of the feature interaction model is poor, and the interaction characteristics between feature data of different categories cannot be effectively expressed. If an independent feature interaction model is established for each N feature data, although the interaction characteristics between the feature data can be fully expressed, the number of parameters in the feature interaction model is greatly increased, which greatly increases the complexity of the model and Difficulty of training.
  • n m is the total number of sample feature data included in the m-type sample feature data (m is a positive integer not greater than M) of the sample feature data.
  • N 2
  • only a feature interaction model corresponding to the gender and the brand of the advertisement, the gender and the week, and the brand and the week of the advertisement need to be established, and the number of the feature interaction models Is 3.
  • the feature data includes two types of men and women, that is, the total number of feature data is two.
  • the characteristic data includes Monday to Sunday, and the total number of characteristic data is 7, assuming that the category of advertisement brand, the total number of characteristic data is 5.
  • the method provided by the embodiment of the present invention establishes a corresponding feature interaction model for different types of feature data, and can better solve the contradiction relationship between the prediction effect and the complexity of the behavior prediction model.
  • the training method provided by the embodiment of the present invention can establish a corresponding feature interaction model for every N categories, thus achieving explicit modeling of feature interaction between multiple feature data, compared with implicit modeling. This explicit modeling can better explain and reflect the interaction between different feature data.
  • the embodiment of the present invention also compares the prediction effect of the behavior prediction model provided in this application with the prediction model in the related art.
  • the comparison process four data sets commonly used in behavior prediction methods are used.
  • the objects of comparison include LR models in related technologies, Factorization Machine (FM) models, and Factorization Machines (FFM). ) Model, Deep Neural Network (DNN) model, Attentional Factorization Machine (AFM) and Deep Factorization Machine (DeepFM) model based on Factorization Machine.
  • the first data set contains a large number of users' advertisement click records for one month.
  • the advertisement click records of one day are used as the training set, and the advertisement click records of another day are used as Test set.
  • the negative samples in the training set that is, the samples whose behavior labels are used to indicate unclicked ads
  • the negative samples in the training set that is, the samples whose behavior labels are used to indicate unclicked ads
  • the second data set in the embodiment of the present invention, 80% of the data is randomly selected as the training set, and the remaining 20% of the data is used as the test set.
  • the categories with less than 20 occurrences in the training set are deleted.
  • the third data set itself contains the training and test sets, so it can be used directly in this comparison process.
  • the fourth data set is the click-to-download data set for game applications in the application market.
  • the behavior prediction model provided by the embodiment of the present invention may be referred to as a product-network-based neural network (PIN) model.
  • PIN product-network-based neural network
  • each model in the PIN model and the LR model, FM model, FFM model, DNN model, AFM model, and DeepFM model in the related technology needs to use the data provided by each of the four data sets above.
  • the training set is used for model training, and then the behavior prediction is performed on the test set provided by each data set.
  • the prediction results are measured by the area AUC (AreaUnder Curve) and the log loss under the receiver operating characteristic curve (ROC curve).
  • AUC AverageUnder Curve
  • ROC curve receiver operating characteristic curve
  • the size of the AUC is positively related to the accuracy of the prediction result, that is, the larger the AUC, the better the prediction effect.
  • the size of Logloss has a negative correlation with the accuracy of the prediction result, that is, the smaller the Logloss, the better the prediction effect.
  • the behavior prediction models provided by the embodiments of the present invention and the prediction results of each model in the related technology under the four data sets are shown in Table 2 below.
  • Table 2 it can be seen that the DeepFM model predicts the AUC of the training set in the first data set is 79.91%, and the Logloss is 0.5423.
  • the behavior prediction model PIN model provided in the embodiment of the present application predicts the training set of the first data set with an AUC of 80.21% and a Logloss of 0.5390. According to Table 2, it can be known that the prediction effect of the behavior prediction model provided in the embodiment of the present invention in each data set is better than other models.
  • the behavior prediction model provided in this application has an improvement in AUC of 0.15% to 0.3% compared to the second-ranked DeepFM model.
  • a smaller AUC increase can bring a larger click-through rate (CTR).
  • CTR click-through rate
  • the complexity of each model is analyzed, assuming that the size of the embedding layer in each model is L (that is, the embedding layer can convert the feature identification into a feature vector of length L), and the number of categories of sample feature data is M, the total number of feature data included in each category is n.
  • the parameter scale is O (Ln)
  • the parameter scale of the FFM model is O (nLM)
  • the parameter scale of the PIN model provided by the embodiment of the present invention is O (Ln + M * (M -1) / 2 * q).
  • O () can also be understood as space complexity, that is, the order of memory space consumed during model training.
  • q is the number of parameters included in the feature interaction model (such as a kernel function) in the behavior prediction model provided by the embodiment of the present invention. Since the value of n is usually large and the value of q is relatively small in practical applications, the parameters of the PIN model provided by the embodiment of the present invention will be much smaller than the FFM model.
  • Table 3 is a comparison table of parameter scales required for each model to train the same training set according to an embodiment of the present invention.
  • the comparison table uses the memory occupied by the parameters as a parameter scale measurement standard. It can be seen from Table 3 that the memory required for the parameters required by the LR model is 1 ⁇ 10 6 bytes, and the memory required for the parameters required by the FFM model is greater than or equal to 40 ⁇ 10 6 bytes.
  • the memory required for the parameters of the PIN model is 26.48 ⁇ 10 6 bytes, and its parameter scale is much smaller than that of the FFM model.
  • the behavior prediction model training method provided by the embodiment of the present invention may be executed before step 101 in the embodiment shown in FIG. 2. Alternatively, it may be performed after the above step 107, that is, after the behavior prediction model determines the execution probability, the learning module may determine the behavior label of the specified behavior according to the behavior actually performed by the user, and generate the behavior label based on the behavior prediction information and the behavior label. Training sample data, and continue to train the newly generated training sample data by using the method shown in step 301 to step 305 above.
  • an embodiment of the present invention provides a behavior prediction model training method.
  • a corresponding feature interaction model is used to calculate the second contribution value of the N sample feature data.
  • the behavior prediction model thus trained may include multiple feature interaction models, and each feature interaction model may correspond to N categories.
  • each feature interaction model may correspond to N categories.
  • the accuracy of the prediction can be effectively improved.
  • each N category corresponds to a feature interaction model during model training, not only the problem of poor training results caused by the processing of the same feature interaction model for all sample feature data can be avoided, but also every N samples can be avoided.
  • Feature data are processed by independent feature interaction model, which leads to the problem of high training computation complexity. That is, the training method provided by the embodiment of the present invention can obtain better training effects with lower calculation complexity, and can meet actual deployment requirements.
  • FIG. 11 is a schematic structural diagram of a user behavior prediction apparatus according to an embodiment of the present invention.
  • the apparatus may be applied to the object pushing system shown in FIG. 1.
  • the apparatus may include:
  • the first obtaining module 401 may be configured to implement the method shown in step 101 in the foregoing method embodiment.
  • the second obtaining module 402 may be configured to implement the method shown in step 103 in the foregoing method embodiment.
  • the first processing module 403 may be configured to implement the method shown in step 104 in the foregoing method embodiment.
  • the first determining module 404 is configured to determine an execution probability of a specified behavior according to the first contribution value of each feature data and the second contribution value of each N feature data.
  • FIG. 12 is a schematic structural diagram of a first determining module 404 according to an embodiment of the present invention. As shown in FIG. 12, the first determining module 404 may include:
  • the first determining sub-module 4041 may be configured to implement the method shown in step 105 in the foregoing method embodiment.
  • the second determining sub-module 4042 may be used to implement the method shown in step 106 in the foregoing method embodiment.
  • the first summing sub-module 4043 may be configured to implement the method shown in step 107 in the foregoing method embodiment.
  • the second determining sub-module 4042 may be used for:
  • the obtained second contribution value of each N feature data is input to a neural network, and the output of the neural network is used as the second comprehensive contribution value.
  • the first determining sub-module 4041 may be configured to:
  • FIG. 13 is a schematic structural diagram of another user behavior prediction device according to an embodiment of the present invention. As shown in FIG. 13, the device may further include:
  • the second determining module 405 may be configured to implement the method shown in step 102 in the foregoing method embodiment.
  • the second obtaining module 402 may be configured to:
  • the first contribution value corresponding to the feature identification of each feature data in the plurality of feature data is respectively determined.
  • the first processing module 403 may be configured to:
  • a feature interaction model corresponding to the N categories to which each N feature data belongs is used to process the obtained N feature vectors to obtain a second contribution value of each N feature data to the specified behavior.
  • the apparatus may further include:
  • a third determining module 406 is configured to, for each N of the plurality of feature data, before the first processing module 403 uses a corresponding feature interaction model for processing, for each N of the plurality of feature data, Feature data, and determine a corresponding feature interaction model from the correspondence between the feature interaction model and the category;
  • the corresponding relationship may include multiple feature interaction models, each of which may correspond to N categories, and the categories corresponding to any two feature interaction models are different.
  • the first contribution value, the second contribution value, and the execution probability may all be obtained by a behavior prediction model.
  • the device may further include:
  • the third obtaining module 407 may be configured to implement the method shown in step 301 in the foregoing method embodiment.
  • the fourth obtaining module 408 may be configured to implement the method shown in step 302 in the foregoing method embodiment.
  • the second processing module 409 may be configured to implement the method shown in step 303 in the foregoing method embodiment.
  • the fourth determining module 410 may be configured to implement the method shown in step 304 in the foregoing method embodiment.
  • the adjustment module 411 may be configured to implement the method shown in step 305 in the foregoing method embodiment.
  • the fourth determining module 410 may be configured to implement the methods shown in steps 3041 to 3043 in the foregoing method embodiment.
  • the feature interaction model may include: a kernel function; the N may be 2; and the behavior prediction information may include: user attribute data, current environment data, and attribute data of an execution object of the specified behavior.
  • an embodiment of the present invention provides a behavior prediction device.
  • the device predicts the execution probability of a specified behavior according to the obtained behavior prediction information, it can separately calculate the first contribution of each feature data to the specified behavior. Value, and the second contribution value of N feature data to the specified behavior can be calculated according to the feature interaction model. Since the interactive influence of multiple feature data on the specified behavior is considered, the accuracy of the behavior prediction is effectively improved.
  • the feature interaction model corresponding to each N feature data is determined based on the category to which the N feature data belongs, that is, each N category corresponds to a feature interaction model, so not only can all feature data be prevented from using the same feature interaction model.
  • the problem of poor prediction results caused by processing can also avoid the problem that each N feature data is processed by an independent feature interaction model, which leads to excessive computational complexity. That is, the behavior prediction device provided by the embodiment of the present invention can obtain a better prediction effect with lower calculation complexity.
  • FIG. 14 is a schematic structural diagram of a behavior prediction model training device according to an embodiment of the present invention.
  • the device can be applied to the object pushing system shown in FIG. 1.
  • the behavior prediction model may include multiple feature interaction models, where each feature interaction model corresponds to N categories, and any two of the feature interaction models correspond to different categories, and the category is the category of sample feature data in the training sample data.
  • the apparatus may include:
  • the first obtaining module 501 may be configured to implement the method shown in step 301 in the foregoing method embodiment.
  • the second obtaining module 502 may be configured to implement the method shown in step 302 in the foregoing method embodiment.
  • the processing module 503 may be configured to implement the method shown in step 303 in the foregoing method embodiment.
  • the determining module 504 may be configured to implement the method shown in step 304 in the foregoing method embodiment.
  • the adjustment module 505 may be configured to implement the method shown in step 305 in the foregoing method embodiment.
  • the determining module 504 may be configured to implement the methods shown in steps 3041 to 3043 in the foregoing method embodiment.
  • an embodiment of the present invention provides a behavior prediction model training device.
  • a corresponding feature interaction model is used to calculate the second contribution value of the N sample feature data.
  • the behavior prediction model thus trained may include multiple feature interaction models, and each feature interaction model may correspond to N categories.
  • each N category corresponds to a feature interaction model during model training, not only the problem of poor training results caused by the processing of the same feature interaction model for all sample feature data can be avoided, but also every N samples can be avoided.
  • Feature data are processed by independent feature interaction model, which leads to the problem of high training computation complexity. That is, the training device provided by the embodiment of the present invention can obtain better training effects with lower computational complexity, and can meet actual deployment requirements.
  • the server may include a processor 1201 (such as a CPU), a memory 1202, a network interface 1203, and a bus 1204.
  • the bus 1204 is used to connect the processor 1201, the memory 1202, and the network interface 1203.
  • the memory 1202 may include random access memory (Random Access Memory, RAM), and may also include non-volatile memory (non-volatile memory), such as at least one disk memory.
  • a communication connection between the server and the communication device is implemented through a network interface 1203 (which may be wired or wireless).
  • the memory 1202 stores a computer program 12021, which is used to implement various application functions, and the processor 1201 is configured to execute the computer program 12021 stored in the memory 1202 to implement the user behavior prediction method or behavior prediction provided by the foregoing method embodiments. Model training methods.
  • An embodiment of the present invention further provides a computer-readable storage medium.
  • the computer-readable storage medium stores instructions.
  • the computer-readable storage medium runs on a computer, the computer is caused to perform user behaviors provided by the foregoing method embodiments. Prediction method or behavior prediction model training method.
  • An embodiment of the present invention also provides a computer program product containing instructions.
  • the computer program product runs on a computer, the computer is caused to execute the user behavior prediction method or the behavior prediction model training method provided by the foregoing method embodiments.
  • the above embodiments it may be implemented in whole or in part by software, hardware, firmware, or any combination thereof.
  • software it may be implemented in whole or in part in the form of a computer program product that includes one or more computer instructions.
  • the computer program instructions When the computer program instructions are loaded and executed on a computer, the processes or functions according to the embodiments of the present invention are wholly or partially generated.
  • the computer may be a general-purpose computer, a computer network, or other programmable device.
  • the computer instructions may be stored in a computer-readable storage medium or transmitted from one computer-readable storage medium to another computer-readable storage medium, for example, the computer instructions may be from a website site, computer, server, or data
  • the center transmits to another website site, computer, server or data center through wired (such as coaxial cable, optical fiber, digital subscriber line) or wireless (such as infrared, wireless, microwave, etc.).
  • the computer-readable storage medium may be any available medium that can be accessed by a computer or a data storage device such as a server, a data center, or the like that includes one or more available medium integration.
  • the usable medium may be a magnetic medium (for example, a floppy disk, a hard disk, a magnetic tape), an optical medium, or a semiconductor medium (for example, a solid state hard disk).

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Development Economics (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Accounting & Taxation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Neurology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)

Abstract

一种用户行为预测方法及装置,行为预测模型训练方法及装置,属于大数据处理领域,以及人工智能领域。该用户行为预测方法获取到包括多个特征数据的行为预测信息后,可以分别获取每个特征数据对于指定行为的第一贡献值,并且对于该多个特征数据中的每N个特征数据,可以采用对应的一个特征交互模型对该每N个特征数据进行处理,得到每N个特征数据对于所述指定行为的第二贡献值。最后可以根据获取到的第一贡献值和第二贡献值,确定用户执行指定行为的执行概率,实现对用户行为的预测。由于本方法在进行行为预测时,考虑了多个特征数据对该指定行为的交互影响,因此有效提高了行为预测的准确性。

Description

用户行为预测方法及装置、行为预测模型训练方法及装置
本申请要求于2018年06月20日提交的申请号为201810636443.8、发明名称为“用户行为预测方法及装置、行为预测模型训练方法及装置”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及大数据处理领域,特别涉及一种用户行为预测方法及装置、行为预测模型训练方法及装置。
背景技术
用户行为预测是一种根据行为预测信息(例如用户属性数据、当前环境数据以及行为的执行对象的属性数据等)对用户行为进行预测的技术,该用户行为预测技术广泛应用于个性化推荐及广告精准投放等领域。
相关技术中,通常采用线性回归模型(Linear Regression model,LR model)对用户行为进行预测。对于某个指定行为的行为预测信息,该LR模型可以计算该行为预测信息中的每个特征数据对于该指定行为的贡献值,然后将各个特征数据对于该指定行为的贡献值进行累加,即可得到用户执行该指定行为的概率。其中,贡献值可以用于指示特征数据对于用户执行该指定行为的影响程度,且该贡献值的大小与影响程度的高低正相关。
但是,相关技术中的LR模型仅单独考虑了每个特征数据对于指定行为的影响程度,该用户行为预测方法的准确性较低。
发明内容
本申请提供了一种用户行为预测方法及装置、行为预测模型训练方法及装置,可以解决相关技术中的行为预测方法准确性较低的问题。
一方面,提供了一种用户行为预测方法,该方法可以包括:获取用于对指定行为进行预测的行为预测信息,该行为预测信息可以包括多个特征数据,且任意两个特征数据所属的类别不同。之后,可以分别获取该多个特征数据中每个特征数据对于该指定行为的第一贡献值,该第一贡献值用于指示对执行该指定行为的影响程度,且该第一贡献值的大小与该影响程度的高低正相关。对于该多个特征数据中的每N个特征数据,则可以采用对应的一个特征交互模型进行处理,得到每N个特征数据对于该指定行为的第二贡献值,其中,该N为大于1的整数,且任意N个特征数据对应的一个特征交互模型由该任意N个特征数据所属的N个类别确定,该第二贡献值用于指示对执行该指定行为的影响程度,且该第二贡献值的大小与该影响程度的高低正相关。最后,可以根据获取到的每个特征数据的第一贡献值和每N个特征数据的第二贡献值,确定该指定行为的执行概率。
本申请提供的用户行为预测方法在对指定行为进行预测时,由于考虑了多个特征数据对指定行为的交互影响,因此可以有效提高行为预测的准确性。并且,由于每N个特征数据对应的特征交互模型是基于该N个特征数据所属的类别确定的,即每N个类别对应一个特征交互模型,因此不仅可以避免所有特征数据采用同一特征交互模型进行处理而导致预测结果不佳的问题,还可避免每N个特征数据均采用独立的特征交互模型进行处理,而导致计算复杂 度过高的问题。即本申请提供的行为预测方法能够以较低的计算复杂度获得较好的预测效果。
可选的,根据获取到的每个特征数据的第一贡献值和每N个特征数据的第二贡献值,确定指定行为的执行概率的过程可以包括:
根据获取到的每个特征数据的第一贡献值确定第一综合贡献值,并根据获取到的每N个特征数据的第二贡献值确定第二综合贡献值。最后可以采用预设权重值,对该第一综合贡献值和该第二综合贡献值进行加权求和,得到该执行概率。
其中,该预设权重值可以为预先对训练样本数据进行训练得到的,采用该预设权重值对两个综合贡献值进行加权求和,可以较好的平衡单独的特征数据对指定行为的影响,以及多个特征数据对指定行为的交互影响,保证行为预测的预测效果。
可选的,根据获取到的每N个特征数据的第二贡献值确定该第二综合贡献值的过程可以包括:
直接对获取到的每N个特征数据的第二贡献值进行求和,得到该第二综合贡献值。该获取第二综合贡献值的方法较为简单,计算复杂度较低。
或者,也可以将获取到的每N个特征数据的第二贡献值均输入神经网络,并将该神经网络的输出作为该第二综合贡献值。其中,该神经网络可以为多层神经网络,且各神经元之间的权重和偏置可以为预先对训练样本数据进行训练得到的。采用预先训练得到的神经网络获取该第二综合贡献值,可以保证获取到的第二综合贡献值的准确性,进而可以保证行为预测的预测效果。
可选的,根据获取到的每个特征数据的第一贡献值确定第一综合贡献值的过程可以包括:
对获取到的各个特征数据的第一贡献值和基准贡献值进行求和,得到该第一综合贡献值。
其中,该基准贡献值可以为预先对训练样本数据进行训练得到的。
可选的,在获取该多个特征数据中每个特征数据对于指定行为的第一贡献值之前,该方法还可以包括:
根据特征数据与特征标识的对应关系,确定该多个特征数据中每个特征数据的特征标识,该特征标识可以为满足预设格式要求的码字或者向量。由于行为预测信息中各特征数据的数据格式可能不同,因此先获取每个特征数据的特征标识,可以将各个特征数据转换为统一格式的特征标识,便于后续的数据处理,提高了行为预测的效率。
相应的,该获取该多个特征数据中每个特征数据对于指定行为的第一贡献值的过程可以包括:
根据特征标识与贡献值的对应关系,分别确定该多个特征数据中每个特征数据的特征标识所对应的第一贡献值。
该特征标识与贡献值的对应关系可以是对训练样本数据进行训练得到的,直接基于对应关系获取每个特征数据的第一贡献值,效率较高。
可选的,对于该多个特征数据中的每N个特征数据,采用对应的一个特征交互模型进行处理,得到每N个特征数据对于该指定行为的第二贡献值的过程可以包括:
分别获取该每N个特征数据中每个特征数据的特征标识所对应的特征向量,且各个特征标识对应的特征向量的长度相等;然后再采用与该每N个特征数据所属的N个类别对应的一个特征交互模型,对获取到的N个特征向量进行处理,得到该每N个特征数据对于该指定行为的第二贡献值。
由于不同特征数据对应的特征标识的长度可能不同,且某些类别(例如城市、时间和温度等)的特征数据的特征标识的长度可能过长,而有效信息较少。因此将每个特征数据的特 征标识均转换为统一长度的特征向量然后再进行处理,可以提高数据处理的效率。
可选的,在对于该多个特征数据中的每N个特征数据,采用对应的一个特征交互模型进行处理之前,该方法还可以包括:
对于该多个特征数据中的每N个特征数据,从特征交互模型与类别的对应关系中,确定对应的一个特征交互模型。其中,该对应关系中包括多个特征交互模型,每个该特征交互模型对应N个类别,且任意两个该特征交互模型对应的类别不同。
可选的,上述第一贡献值、第二贡献值和执行概率可以均由行为预测模型获取,该方法还可以包括如下训练过程:
获取训练样本数据,该训练样本数据可以包括多个样本特征数据以及样本行为的行为标签,任意两个样本特征数据所属的类别不同,该行为标签用于指示用户是否执行该样本行为。之后,获取该多个样本特征数据中每个样本特征数据对于该样本行为的第一参考贡献值,并且对于该多个样本特征数据中的每N个样本特征数据,采用对应的一个特征交互模型进行处理,得到每N个样本特征数据对于该样本行为的第二参考贡献值。进一步的,根据获取到的每个样本特征数据的第一参考贡献值和每N个样本特征数据的第二参考贡献值,确定该样本行为的执行概率。最后,根据该样本行为的执行概率与该行为标签的差异,调整该行为预测模型的模型参数并继续训练,直至满足训练停止条件时结束训练,得到调整模型参数后的该行为预测模型。
其中,调整的该行为预测模型的模型参数可以包括各个特征交互模型的模型参数,还可以包括每个样本特征数据对应的第一参考贡献值。
在本申请中,上述训练过程训练得到的行为预测模型中可以包括多个特征交互模型,且每个特征交互模型可以对应N个类别。采用该行为预测模型进行行为预测时,由于可以考虑N个特征数据对指定行为的交互影响,因此可以有效提高预测的准确性。
可选的,根据获取到的每个样本特征数据的第一参考贡献值和每N个样本特征数据的第二参考贡献值,确定该样本行为的执行概率的过程可以包括:
对获取到的各个样本特征数据的第一参考贡献值和基准贡献值进行求和,得到第一参考综合贡献值;将获取到的每个样本特征数据的第二参考贡献值均输入神经网络,并将该神经网络的输出作为第二参考综合贡献值;最后按照预设权重值,对该第一参考综合贡献值和该第二参考综合贡献值进行加权求和,得到该样本行为的执行概率。
相应的,调整的该行为预测模型的模型参数至少还可以包括:该基准贡献值,该神经网络中各神经元之间的权重和偏置,以及该预设权重值。
可选的,该特征交互模型可以包括:核函数,该核函数的形式可以为向量、矩阵或者泛函。该核函数的形式较为多样,行为预测模型建模时的灵活性较高。
可选的,该N可以为2,即对于每两个特征数据,可以采用对应该两个特征数据所属的两个类别的特征交互模型进行处理,由此可以改善行为预测的预测效果。
可选的,该行为预测信息可以包括:用户属性数据、当前环境数据以及该指定行为的执行对象的属性数据。
其中,用户属性数据为用于描述用户属性的特征数据,可以包括性别、年龄和职业等多个类别的特征数据。当前环境数据为用于描述行为预测时刻的环境状态的特征数据,可以包括时间、地点和天气等多个类别的特征数据。指定行为的执行对象的属性数据为用于描述执行对象的属性的特征数据,可以包括执行对象的品牌和类型等多个类别的特征数据。
另一方面,提供了一种行为预测模型训练方法,该行为预测模型包括多个特征交互模型,其中每个该特征交互模型对应N个类别,任意两个该特征交互模型对应的类别不同,该类别为训练样本数据中样本特征数据的类别。该训练方法可以包括:
获取训练样本数据,该训练样本数据包括多个样本特征数据以及样本行为的行为标签,任意两个样本特征数据所属的类别不同,该行为标签用于指示用户是否执行该样本行为。之后可以获取该多个样本特征数据中每个样本特征数据对于该样本行为的第一参考贡献值,该第一参考贡献值用于指示对执行该样本行为的影响程度,且该第一参考贡献值的大小与该影响程度的高低正相关。对于该多个样本特征数据中的每N个样本特征数据,采用对应的一个特征交互模型进行处理,得到每N个样本特征数据对于该样本行为的第二参考贡献值,该第二参考贡献值用于指示对执行该样本行为的影响程度,且该第二参考贡献值的大小与该影响程度的高低正相关。进一步的,可以根据获取到的每个样本特征数据的第一参考贡献值和每N个样本特征数据的第二参考贡献值,确定该样本行为的执行概率。最后,可以根据该样本行为的执行概率与该行为标签的差异,调整该行为预测模型的模型参数并继续训练,直至满足训练停止条件时结束训练,得到调整模型参数后的该行为预测模型。
在本申请提供的模型训练方法训练得到的行为预测模型中可以包括多个特征交互模型,且每个特征交互模型可以对应N个类别。采用该行为预测模型进行行为预测时,由于可以考虑N个特征数据对指定行为的交互影响,因此可以有效提高预测的准确性。
并且,由于在进行模型训练时,每N个类别对应一个特征交互模型,因此不仅可以避免所有样本特征数据采用同一特征交互模型进行处理而导致训练结果不佳的问题,还可避免每N个样本特征数据均采用独立的特征交互模型进行处理,而导致训练算复杂度过高的问题。即本发明实施例提供的训练方法能够以较低的算复杂度获得较好的训练效果。
可选的,根据获取到的每个样本特征数据的第一参考贡献值和每N个样本特征数据的第二参考贡献值,确定该样本行为的执行概率的过程可以包括:
对获取到的各个样本特征数据的第一参考贡献值和基准贡献值进行求和,得到第一参考综合贡献值,然后将获取到的每个样本特征数据的第二参考贡献值均输入神经网络,并将该神经网络的输出作为第二参考综合贡献值。之后,可以按照预设权重值,对该第一参考综合贡献值和该第二参考综合贡献值进行加权求和,得到该样本行为的执行概率。
相应的,根据该差异调整的模型参数至少还可以包括:该基准贡献值,该神经网络中各神经元之间的权重和偏置,以及该预设权重值。
又一方面,提供了一种用户行为预测装置,该装置可以包括至少一个模块,该至少一个模块可以用于实现上述方面所述的用户行为预测方法。
再一方面,提供了一种行为预测模型训练装置,该装置可以包括至少一个模块,该至少一个模块可以用于实现上述方面所述的行为预测模型训练方法。
再一方面,提供了一种服务器,该服务器可以包括:存储器,处理器及存储在该存储器上并可在该处理器上运行的计算机程序,该处理器执行该计算机程序时实现如上述方面所述的用户行为预测方法,或者,如上述方面所述的行为预测模型训练方法。
再一方面,提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当该计算机可读存储介质在计算机上运行时,使得计算机执行如上述方面所述的用户行为预测方法,或者,如上述方面所述的行为预测模型训练方法。
再一方面,提供了一种包含指令的计算机程序产品,当该计算机程序产品在计算机上运 行时,使得计算机执行如上述方面所述的用户行为预测方法,或者,如上述方面所述的行为预测模型训练方法。
本申请提供的技术方案带来的有益效果至少可以包括:
根据获取到的行为预测信息对指定行为的执行概率进行预测时,可以分别计算每个特征数据对指定行为的第一贡献值,并可以根据特征交互模型计算N个特征数据对指定行为的第二贡献值,由于考虑了多个特征数据对指定行为的交互影响,因此有效提高了行为预测的准确性。并且,由于每N个特征数据对应的特征交互模型是基于该N个特征数据所属的类别确定的,即每N个类别对应一个特征交互模型,因此不仅可以避免所有特征数据采用同一特征交互模型进行处理而导致预测结果不佳的问题,还可避免每N个特征数据均采用独立的特征交互模型进行处理,而导致计算复杂度过高的问题。即本申请提供的技术方案能够以较低的计算复杂度获得较好的预测效果。
附图说明
图1是本发明实施例提供的一种对象推送系统的结构示意图;
图2是本发明实施例提供的一种用户行为预测方法的流程图;
图3是本发明实施例提供的一种行为预测模型的结构示意图;
图4是本发明实施例提供的一种行为预测模型的架构图;
图5是本发明实施例提供的一种核函数的结构示意图;
图6是本发明实施例提供的另一种核函数的结构示意图;
图7是本发明实施例提供的又一种核函数的结构示意图;
图8是本发明实施例提供的一种神经网络的结构示意图;
图9是本发明实施例提供的一种行为预测模型的训练方法的流程图;
图10是本发明实施例提供的一种确定样本行为的执行概率的方法流程图;
图11是本发明实施例提供的一种用户行为预测装置的结构示意图;
图12是本发明实施例提供的一种第一确定模块的结构示意图;
图13是本发明实施例提供的另一种用户行为预测装置的结构示意图;
图14是本发明实施例提供的一种行为预测模型训练装置的结构示意图;
图15是本发明实施例提供的一种服务器的结构示意图。
具体实施方式
本发明实施例提供的用户行为预测方法可以应用于对象推送系统,该对象推送系统可以部署于服务器中。该服务器与多个终端通过有线网络或者无线网络建立有通信连接,能够向每个终端的用户推送应用程序、新闻或者广告等对象。其中,该服务器可以是一台服务器,或者由若干台服务器组成的服务器集群,或者是一个云计算服务中心。该终端可以为智能手机、台式电脑、笔记本电脑、平板电脑或者可穿戴式设备等。
可选的,该对象推送系统可以包括个性化推荐系统和广告精准投放系统等。其中,个性化推荐系统可以向终端的用户推荐应用程序和媒体内容(例如视频、新闻或者音乐等)等对象。广告精准投放系统则可以向终端的用户推送广告。良好的对象推送系统不仅影响到用户体验,同时更直接影响到对象提供方(如应用程序开发商和内容提供商)的收益。
如图1所示,本发明实施例提供的对象推送系统可以包括学习模块10、行为预测模型20和推送模型30。该学习模块10、行为预测模型20和推送模型30可以部署在同一个服务器中, 或者,也可以部署在不同的服务器中,例如该学习模块10和行为预测模型20可以部署在训练服务器中,该推送模型30可以部署在对象提供方的后台服务器中。其中,学习模块10用于获取日志文件40中记录的用户的历史行为信息,将该历史行为信息作为训练样本数据,并采用机器学习算法对该训练样本数据进行训练。训练结束后,学习模块10可以基于训练结果更新该行为预测模型20中的模型参数。该行为预测模型20可以根据获取到用于对指定行为进行预测的行为预测信息,确定用户执行该指定行为的概率,并将该确定的概率发送至推送模型30。推送模型30则可以对行为预测模型20确定的用户执行各个指定行为的概率进行排序,并向用户推送概率较高的指定行为的执行对象。
其中,该日志文件40可以为网络(Web)日志、通过数据包嗅探器获取到的日志、通过埋点技术获取到的日志或者其他方式获取到的日志,本发明实施例对此不做限定。用于对指定行为进行预测的行为预测信息可以包括:用户属性数据(例如用户的性别、年龄、职业和学历等)、该指定行为的执行对象的属性数据(例如应用程序的类型、发布时间和品牌等)以及当前的环境数据(例如时间、天气、温度和地点等)等数据。
示例的,假设该对象推送系统为用于推送应用程序的个性化推荐系统,且该个性化推荐系统部署于应用市场的后台服务器中。当用户打开手机中安装的应用程序:应用市场时,该应用市场可以向后台服务器发送推荐请求。后台服务器在接收到该推荐请求后,对于多个候选应用程序,后台服务器可以分别获取用于对用户下载每个候选应用程序的行为进行预测的行为预测信息,并可以根据获取到的行为预测信息预测用户下载各个候选应用程序的概率。之后,后台服务器可以将概率较高的若干个应用程序推荐至应用市场进行显示,从而达到提高应用程序的下载率的效果。同时,用户的实际下载行为数据会存入到日志文件40中作为新的训练样本数据,以便学习模块10通过对该新的训练样本数据的训练,不断更新行为预测模型20的模型参数,以提高该行为预测模型20的预测效果。
在广告精准投放系统中,行为预测模型20主要用于预测用户的广告点击行为。相应的,该学习模块10获取的历史行为信息可以为用户的广告点击历史数据。该行为预测模型20可以根据获取到的用户属性数据、当前的环境数据以及广告商提供的各个候选广告的属性数据,预测用户点击每个广告的概率,并向用户展示概率最高的广告。同时,用户的实际点击行为数据会存入到日志文件40中作为新的训练样本数据,以便学习模块10继续对该新的训练样本数据的训练。
其中,学习模块10获取到的广告点击历史数据通常会包含多个属于不同类别的特征数据。例如,每个广告点击历史数据可以包括用户的年龄、性别、所在城市、点击广告的时间、广告的品牌以及互联网协议(Internet Protocol,IP)地址等多个类别的特征数据。以下述两个广告点击历史数据为例:
北京,周二,17:00,快餐A,0;
上海,周日,11:20,快餐B,1;
在该两个广告点击历史数据中,前四项均是特征数据,最后一项为行为标签。该行为标签可以用于指示用户是否点击了广告,例如,1表示用户点击了广告,0表示用户没有点击广告。上述两个广告点击历史数据中,每个广告点击历史数据中所包括的特征数据所属的类别依次为:用户所在城市、星期、时间以及广告的品牌。因此,第二个广告点击历史数据可以指示上海的一位用户在周日上午11:20对快餐A的广告的一次点击行为。
根据上述举例可以看出,广告点击历史数据所包括的多个特征数据所属的类别各不相同,该多个特征数据具有较强的离散特性(即每个特征数据均可以由离散的数值表示),且不同 类别的特征数据之间存在着复杂的交互关系:不同类别的特征数据之间的交互有时与用户点击广告的概率呈正相关分布,有时则呈负相关分布。例如,在用餐时间食品相关的广告更有被点击的可能,而在冬季冷饮相关的广告被点击的概率较低。因此,挖掘特征数据之间的联系对提高对象推送系统的推送正确率有着重要影响。
本发明实施例提供了一种用户行为预测方法,可以通过分析不同类别的特征数据之间对指定行为的交互影响,提高行为预测的准确性。该方法可以应用于图1所示的对象推送系统中的行为预测模型20,该对象推送系统可以部署于服务器中。参考图2,该方法可以包括:
步骤101、获取用于对指定行为进行预测的行为预测信息。
在本发明实施例中,行为预测模型可以在接收到终端发送的预测请求后,获取用于对指定行为进行预测的行为预测信息。该指定行为可以为对象推送系统中预先配置的多个候选行为中的一个。用于对该指定行为进行预测的行为预测信息可以包括多个特征数据,且任意两个特征数据所属的类别不同。
该预测请求可以为终端获取候选对象的请求,例如该预测请求可以为用户指示终端启动某个应用程序(如应用市场、新闻或者视频)后,终端向后台服务器发送的对象获取请求,该对象获取请求用于请求获取候选的应用程序、新闻或者视频等对象。或者,该预测请求也可以为终端获取指定对象的请求,例如该预测请求可以为用户指示终端在线播放某个视频后,终端向后台服务器发送的视频对象获取请求。后台服务器接收到该视频对象获取请求后,可以在向终端发送视频对象之前,根据获取到的行为预测信息预测终端的用户点击各个候选广告的概率,并向终端推送概率最高的广告。
可选的,用于对该指定行为进行预测的行为预测信息可以包括:用户属性数据、当前环境数据以及该指定行为的执行对象的属性数据。其中,用户属性数据可以为用于描述用户属性的特征数据,例如可以包括性别、年龄、职业、学历和籍贯等多个类别的特征数据。当前环境数据为用于描述行为预测时刻的环境状态的特征数据,例如可以包括时间、地点、气温和天气等多个类别的特征数据。指定行为的执行对象的属性数据可以为用于描述该执行对象的属性的特征数据,例如可以包括执行对象的品牌、类型和发布时间等多个类别的特征数据。其中,该行为预测信息中的用户属性数据可以是从日志文件中获取的,或者可以是从对象提供方的后台服务器(例如视频服务器的用户数据库)中获取的。执行对象的属性数据可以是从日志文件中获取的,或者也可以是从该对象提供方的后台服务器(例如视频服务器的视频数据库)中获取的。
示例的,假设该对象推送系统为用于在视频播放前推送广告的广告精准投放系统,则该用户行为即为用户点击广告的行为,该预测请求可以为终端发送的获取视频对象的请求。若该广告精准投放系统的推送模型30中预先存储有广告A至广告E共五个候选广告,则该广告精准投放系统的行为预测模型20检测到该预测请求后,可以分别获取用于对用户点击每个候选广告的行为进行预测的行为预测信息。例如,该行为预测模型20获取到的用于对用户点击广告A的行为进行预测的行为预测信息可以包括:女、30岁、12:00、广告A和食品。该行为预测信息中包括的多个特征数据所属的类别依次为:性别、年龄、时间、广告的品牌以及广告的类型。其中,性别和年龄为用户属性数据,时间为当前的环境数据,广告的品牌和类型为执行对象的属性数据。
步骤102、根据特征数据与特征标识的对应关系,确定该多个特征数据中每个特征数据的特征标识。执行步骤103和步骤104。
由于行为预测信息中各特征数据的数据格式可能不同,因此为了提高数据处理的效率,行为预测模型可以先确定每个特征数据的特征标识,该特征标识可以为满足预设格式要求的码字或者向量,由此可以将各个特征数据转换为统一格式的特征标识,便于后续的数据处理,提高了行为预测的效率。其中,每个特征数据在其所属的类别中对应有唯一的特征标识,不同类别的特征数据所对应的特征标识可以相同。
可选的,每个特征数据的特征标识可以为采用独热码(one-hot code)编码得到的向量。采用独热码得到的特征标识中仅有一位为1,其他位均为0,且该特征标识的长度与特征数据所属类别包括的特征数据的总数相等。示例的,对于性别这一类别,由于该类别的特征数据仅包括男和女两种特征数据,因此采用独热码得到的特征标识可以为包括两位二进制数的码字。例如性别女对应的码字可以为01,性别男对应的码字可以为10。对于星期这一类别,由于该类别的特征数据包括星期一至星期日共7种特征数据,因此采用独热码得到的特征标识可以为长度为7的向量,例如星期一对应的特征标识可以为向量[1,0,0,0,0,0,0],星期三对应的特征标识可以为向量[0,0,1,0,0,0,0]。
在本发明实施例中,每个特征数据的特征标识也可以为采用其他编码方式编码得到的码字或向量,只要保证每个特征数据在其所属的类别中对应有唯一的特征标识即可。示例的,对于行为预测信息:女、30岁、12:00、广告A和食品,该行为预测模型中的数据处理模块201获取到的与该五个特征数据对应的特征标识可以依次为:1、30、12、1和4。
图3是本发明实施例提供的一种行为预测模型的结构示意图,参考图3,该行为预测模型可以包括:数据处理模块201、宽度模型模块202、特征交互模型模块203以及结果整合模块204。上述步骤101所示的获取行为预测信息的步骤,以及步骤102中确定特征标识的步骤均可以由该数据处理模块201实现。
步骤103、获取该多个特征数据中每个特征数据对于该指定行为的第一贡献值。执行步骤105。
在本发明实施例中,行为预测模型中可以预先存储有特征标识与贡献值的对应关系,该对应关系是预先对训练样本数据进行训练得到的,且该对应关系中记录的特征标识可以包括该行为预测模型训练过的所有特征数据中每个特征数据的特征标识。在进行用户行为预测时,行为预测模型获取到行为预测信息中每个特征数据的特征标识后,可以直接根据该对应关系,获取每个特征数据对于该指定行为的第一贡献值。
其中,该第一贡献值可以用于指示特征数据对执行该指定行为的影响程度,且该第一贡献值的大小与该影响程度的高低正相关。即某个特征数据的第一贡献值越大,则表明该特征数据对执行该指定行为的影响程度越高,即用户越有可能执行该指定行为。可选的,该第一贡献值可以为不大于1的正数。
可选的,步骤103中确定第一贡献值的步骤可以由该宽度模型模块202实现。如前文所述,由于不同类别的特征数据的特征标识可能相同,因此该宽度模型模块202中存储的特征标识与贡献值的对应关系可以包括多个对应关系,每个对应关系对应一个类别,且每个对应关系用于记录对应类别中每个特征数据对应的第一贡献值。
为了保证该宽度模型模块202能够准确识别每个特征数据,数据处理模块201可以将各个特征数据的特征标识按照预先约定的类别顺序(例如第一个特征数据的类别为性别,第二个特征数据的类别为年龄等)进行排列后得到一个标识序列,然后再将该标识序列输入至宽度模型模块202。宽度模型模块202获取到标识序列后,可以基于该预先约定的特征顺序,根据每个特征标识在该标识序列中所处的位置,确定该特征标识指示的特征数据所属的类别, 进而可以获取该类别对应的对应关系,并从该对应关系中获取该特征数据的第一贡献值。
示例的,假设该预先约定的类别顺序为:性别,年龄,时间,广告的品牌,广告的类型。若宽度模型模块202获取到的标识序列为1,30,12,1,4,则对于该标识序列中的第一个特征标识1,宽度模型模块202可以确定该特征标识指示的特征数据所属的类别为性别,因此可以从对应于性别的特征标识与第一贡献值的对应关系中,获取特征标识1对应的第一贡献值c 0,1。同理,该宽度模型模块202可以基于同样的方法,依次获取到其他四个特征标识对应的第一贡献值:c 1,30,c 2,12,c 3,1以及c 4,4。其中,该每个第一贡献值中的下标的第一位可以表示特征数据的类别,即特征标识在标识序列中所处的位置,第二位即为特征数据在其所属类别中的特征标识。
步骤104、对于该多个特征数据中的每N个特征数据,采用对应的一个特征交互模型进行处理,得到每N个特征数据对于该指定行为的第二贡献值。执行步骤106。
其中,该N为大于1的整数,任意N个特征数据对应的一个特征交互模型由该任意N个特征数据所属的N个类别确定,该第二贡献值用于指示对执行该指定行为的影响程度,且该第二贡献值的大小与该影响程度的高低正相关。
在本发明实施例中,该行为预测模型可以包括预先训练得到的多个特征交互模型,其中每个特征交互模型对应N个类别,且任意两个特征交互模型对应的类别不同。行为预测模型在获取到行为预测信息后,可以根据特征交互模型与类别的对应关系,确定每N个特征数据所属的N个类别对应的一个特征交互模型。之后,即可采用该确定出的特征交互模型对对应的N个特征数据进行处理,得到该N个特征数据对于该指定行为的第二贡献值。
若该行为预测信息中包括的特征数据的个数为M(即类别数为M),由于对于M个中的每N个特征数据均需确定对应的一个特征交互模型,因此该行为预测模型一共需采用
Figure PCTCN2019077452-appb-000001
个特征交互模型对该行为预测信息中对应的特征交互数据进行处理。相应的,行为预测模型最终可以得到
Figure PCTCN2019077452-appb-000002
个第二贡献值。可选的,在本发明实施例中,N可以为2,即对于每两个特征数据,可以采用对应该两个特征数据所属的两个类别的特征交互模型进行处理,由此可以有效确保该行为预测模型的预测效果。
示例的,假设在进行模型训练时,样本特征数据所属的类别数M=5,每个特征交互模型对应的类别数N=2,则该行为预测模型中可以包括10个特征交互模型。该10个特征交互模型与类别的对应关系可以如表1所示。其中,性别和年龄对应的特征交互模型为σ 0,1,年龄和时间对应的特征交互模型为σ 1,2。根据表1可知,该行为预测模型中,多个类别中的第i个类别和第j个类别对应的特征交互模型可以表示为σ i,j
表1
Figure PCTCN2019077452-appb-000003
进一步的,若行为预测模型获取到的行为预测信息中包括的特征数据所属的类别依次为: 性别,年龄,时间,广告的品牌,广告的类型(即M=5),且N=2。则对该5个类别的特征数据进行两两组合,一共可以得到
Figure PCTCN2019077452-appb-000004
种类别组合方式。对于其中每两个类别,行为预测模型可以根据上述表1所示的对应关系,确定与该两个类别对应的特征交互模型。例如对于性别与年龄,行为预测模型可以确定该两个类别对应的特征交互模型为σ 0,1,并可以采用该特征交互模型为σ 0,1对类别为性别的特征数据和类别为年龄的特征数据进行处理,从而得到该两个特征数据对于指定行为的第二贡献值。
在本发明实施例一种可选的实现方式中,由于在上述步骤102中,行为预测模型获取到了每个特征数据的特征标识,因此在获取每N个特征数据的第二贡献值时,该行为预测模型可以先分别获取该N个特征数据中每个特征数据的特征标识所对应的特征向量,然后再采用与该N个特征数据所属的N个类别对应的一个特征交互模型,对获取到的N个特征向量进行处理,得到该N个特征数据对于该指定行为的第二贡献值。
其中,该行为预测模型中可以预先存储有特征标识与特征向量的对应关系,且各个特征标识对应的特征向量的长度均相等,该特征向量的长度可以由经验值确定,例如可以为16或者32等。由于不同特征数据对应的特征标识的长度可能不同,且某些类别(例如城市、时间和温度等)的特征数据的特征标识的长度可能过长,而有效信息较少。因此为了提高数据的处理效率,在计算每N个特征数据的第二贡献值之前,可以将每个特征数据的特征标识均转换为统一长度的特征向量,进而再对该每N个特征向量进行处理,得到对应的第二贡献值。
可选的,如图3所示,该数据处理模块201可以将生成的标识序列发送至特征交互模型模块203中的特征交互子模块2031,之后可以由该特征交互子模块2031获取每N个特征数据的第二贡献值。图4是本发明实施例提供的一种行为预测模型的架构图,参考图4可以看出,该行为预测模型中可以包括嵌入层,该嵌入层可以为数据处理模块201中用于将特征标识转换为特征向量的处理层。如图4所示,该嵌入层可以将M个特征数据中的每个特征数据均转换为对应的特征向量,然后再将该特征向量输入至特征交互模型。
如前文所述,由于不同类别的特征数据的特征标识可能相同,因此该宽度模型模块202中存储的特征标识与特征向量的对应关系可以包括多个对应关系,每个对应关系对应一个类别,每个对应关系用于记录对应类别中每个特征数据对应的特征向量。
示例的,如图3所示,假设数据处理模块201发送至特征交互子模块2031的标识序列为1,30,12,1,4。该特征交互子模块2031可以根据预先约定的类别顺序:性别,年龄,时间,广告的品牌,广告的类型,确定该标识序列中每个特征标识指示的特征数据所属的类别。对于该标识序列中的第一个特征标识1,特征交互子模块2031可以确定该特征标识指示的特征数据所属的类别为性别,因此可以从对应于性别的特征标识与特征向量的对应关系中确定该特征标识1对应的特征向量为v 0,1。同理,特征交互子模块2031可以基于同样的方法,依次获取到其他四个特征标识对应的特征向量:v 1,30,v 2,12,v 3,1以及v 4,4。其中,该每个特征向量中的下标的第一位可以表示特征数据的类别,即特征标识在标识序列中所处的位置,第二位即为特征数据在其所属类别中的特征标识。
进一步的,对于该五个特征向量中的每两个特征向量,特征交互子模块2031可以根据该两个特征向量指示的特征数据所属的类别,采用对应的一个特征交互模型对该两个特征向量进行处理。例如,对于特征向量v 0,1和v 1,30,参考表1,该特征交互子模块2031可以采用特征交互模型σ 0,1进行处理,得到该两个特征向量指示的特征数据的第二贡献值f 0,1。同理,对于其他每两个特征向量,特征交互子模块2031可以分别采用对应的特征交互模型进行处理。特征交互子模块2031最终得到的第二贡献值可以依次为:f 0,1,f 0,2,f 0,3,f 0,4,f 1,2,f 1,3,f 1,4, f 2,3,f 2,4,f 3,4。该第二贡献值的下标中的两位数字可以表示该第二贡献值对应的两个特征数据所属的类别。
在本发明实施例中,通过计算不同类别的特征数据对指定行为的第二贡献值,考虑特征数据之间对用户执行该指定行为的交互影响,因此可以有效提高行为预测模型的预测效果,
可选的,在本发明实施例中,该行为预测模型中的特征交互模型可以为核函数σ,并且该核函数σ的形式可以为向量、矩阵或者泛函。不同的特征交互模型的核函数的结构可以相同(例如可以均为矩阵形式),但不同特征交互模型的核函数的参数不同。该各个核函数的参数是预先对训练样本数据进行训练得到的。
示例的,如图5所示,该特征交互模型中的核函数σ可以为核向量(kernel vector);或者如图6所示,该核函数σ可以为核矩阵(kernel matrix);又或者,如图7所示,该核函数σ可以为以神经网络形式进行表示的泛函(functional kernel)。本发明实施例将特征交互模型的实现方式由单一的计算向量内积扩展到核函数,通过将特征向量映射到不同的空间中来计算各个特征向量之间对执行指定行为的影响,有效提高了特征交互模型实现时的灵活性。并且由于核函数的结构较为多样,可以进一步提高该特征交互模型计算得到的第二贡献值的准确性。
步骤105、根据获取到的每个特征数据的第一贡献值确定第一综合贡献值。
该第一综合贡献值可以与每个特征数据的第一贡献值正相关,即每个特征数据的第一贡献值越大,该第一综合贡献值也就越大。在本发明实施例中,该确定第一综合贡献值的过程也可以由该行为预测模型中的宽度模型模块202实现。
作为一种可选的实现方式,行为预测模型可以对获取到的各个特征数据的第一贡献值和基准贡献值进行求和,得到该第一综合贡献值。其中,该基准贡献值可以为行为预测模型预先对样本特征数据进行训练得到的,且该基准贡献值也可以为不大于1的正数。例如,该基准贡献值可以为宽度模型模块202在无特征数据输入时的输出。
示例的,假设该行为预测模型获取到的各个特征数据的第一贡献值为:c 0,1,c 1,30,c 2,12,c 3,1以及c 4,4,预先训练得到的基准贡献值为c g,则该第一综合贡献值out 1可以满足:
out 1=c 0,1+c 1,30+c 2,12+c 3,1+c 4,4+c g
作为另一种可选的实现方式,行为预测模型也可以直接对获取到的各个特征数据的第一贡献值进行求和,从而得到该第一综合贡献值。即该行为预测模型也可以无需训练和存储该基准贡献值。
步骤106、根据获取到的每N个特征数据的第二贡献值确定第二综合贡献值。
在本发明实施例中,该确定第二综合贡献值的获取也可以由该行为预测模型中的特征交互模型模块203实现。例如,可以由该特征交互模型模块203中的综合处理子模块2032实现。
作为一种可选的实现方式,行为预测模型可以直接对获取到的每N个特征数据的第二贡献值进行求和,得到该第二综合贡献值,该获取第二综合贡献值的方法较为简单,计算复杂度较低。
示例的,假设N=2,该综合处理子模块2032获取到的10个特征交互模型输出的第二贡献值依次为:f 0,1,f 0,2,f 0,3,f 0,4,f 1,2,f 1,3,f 1,4,f 2,3,f 2,4,f 3,4。则该综合处理子模块2032对上述第二贡献值进行求和,得到的第二综合贡献值out 2可以满足:
out 2=f 0,1+f 0,2+f 0,3+f 0,4+f 1,2+f 1,3+f 1,4+f 2,3+f 2,4+f 3,4
作为另一种可选的实现方式,行为预测模型还可以将获取到的每N个特征数据的第二贡献值均输入神经网络,并将该神经网络的输出作为该第二综合贡献值。采用预先训练得到的 神经网络获取该第二综合贡献值,可以保证获取到的第二综合贡献值的准确性,进而可以保证行为预测的预测效果。
可选的,综合处理子模块2032可以为一个神经网络模块。结合图3和图4,特征交互子模块2031获取到每N个特征数据的第二贡献值后,可以基于其获取到的各个第二贡献值生成特征交互向量,并将该特征交互向量输入至神经网络(例如,可以将该特征交互向量中的每个第二贡献值输入至输入层的一个神经元中)。该特征交互向量的长度为
Figure PCTCN2019077452-appb-000005
示例的,特征交互子模块2031基于其获取到的第二贡献值生成特征交互向量V f可以为:
V f=[f 0,1,f 0,2,f 0,3,f 0,4,f 1,2,f 1,3,f 1,4,f 2,3,f 2,4,f 3,4]。
其中,该特征交互向量中各个第二贡献值的排列顺序,可以是按照第二贡献值所对应的N个特征数据所属的类别在标识序列中的顺序进行排列的。例如,第二贡献值f 0,1对应的两个特征数据所属的类别在标识序列中位于前两位,因此可以将该第二贡献值f 0,1作为特征交互向量中的第一位。第二贡献值f 3,4对应的两个特征数据所属的类别在标识序列中位于最后两位,因此可以将该第二贡献值f 3,4作为特征交互向量中的最后一位。
图8是本发明实施例提供的一种神经网络的结构示意图,参考图8,该神经网络可以为多层神经网络,每层神经网络均包括多个神经元,位于相邻层的神经元之间的权重和偏置也可以位于训练得到的。神经网络获取到该交互特征向量后,可以基于训练得到的各神经元之间的权重和偏置逐层计算每个神经元的数值,并最终计算得到输出层的神经元的数值。
如图8所示,神经网络的输入层是整个网络的最底层,输出层是最上层。神经网络中每层神经元与相邻层的一个或者多个神经元相连,两个神经元之间的连边均包含一个权重和偏置。该神经网络在对输入的交互特征向量进行处理时,可以从输入层开始从底层向上层计算,每个神经元的数值由与之相连接的下一层的神经元的数值决定。每个下层神经元对其所连接的上一层的神经元的贡献值,由该下层神经元的数值乘以对应连边的权重后再加上偏置得到。对于每个神经元,可以在对其所连接的各个下层神经元的贡献值进行求和后,再乘以激活函数(通常是一个从全体实数映射到固定区间的非线性函数,以保证每个神经元的数值在固定范围内)即可得到该神经元的数值。神经网络可以重复上述过程直到计算得到输出层的神经元的数值,该数值就是整个神经网络的输出,也即是第二综合贡献值。
示例的,假设第h+1层的神经元为r h+1,该第h+1层的神经元r h+1与第h层的神经元r h连接,且与该第h层的神经元r h之间连边的权重为W h,偏置为b h,A为激活函数,则神经网络中第h+1层的神经元r h+1的数值的计算公式如下:
r h+1=A(W hr h+b h);
上述公式中的r h+1和b h可以均为K×1的矩阵,r h可以为L×1的矩阵,W h可以为K×L的矩阵,K为该第h+1层包括的神经元的个数,L为该第h层包括的神经元的个数。W h中第k行第l列(k为不大于K的正整数,l为不大于L的正整数)的元素为第h+1层中第k个神经元与第h层中第l个神经元之间连边的权重,b h中第k行的元素为该第h+1层中第k个神经元的偏置。
示例的,假设神经网络中第一层和第二层均包括3个神经元(即W=L=3),其中第一层的3个神经元分别为x1,x2,x3,第二层的3个神经元分别为y1,y2,y3。以w kl表示第二层中第k个神经元与第一层中第l个神经元之间连边的权重,并以b k表示第二层中第k个神经元的偏置,则该第二层的3个神经元的取值分别为:
y1=A(x1*w 11+x2*w 12+x3*w 13+b 1);
y2=A(x1*w 21+x2*w 22+x3*w 23+b 2);
y3=A(x1*w 31+x2*w 32+x3*w 33+b 3);
该第二层的3个神经元的取值可以采用矩阵相乘的形式表示如下:
Figure PCTCN2019077452-appb-000006
假设神经网络共有H层,那么最终输出层的神经元的数值(即第二综合贡献值)out 2可以满足:
out 2=r H=W H-1r H-1+b H-1=W H-1[A(W H-2r H-2+b H-2)]+b H-1
其中,r H-1为第H-1层的神经元,W H-1和b H-1分别为该第H-1层的神经元与输出层的神经元之间的连边的权重和偏置。参考上述公式可知,在计算该输出层的神经元的数值时,无需考虑该激活函数A,即仅在计算输出层之前的网络层的神经元时,需要乘以该激活函数A。
步骤107、采用预设权重值,对该第一综合贡献值和该第二综合贡献值进行加权求和,得到该指定行为的执行概率。
该预设权重值也是行为预测模型预先对样本特征数据进行训练得到的,且该预设权重值包括第一综合贡献值的权重,以及第二综合贡献值的权重。通过加权求和的方式得到该执行概率,可以较好的平衡单独的特征数据对指定行为的影响,以及多个特征数据对指定行为的交互影响,保证行为预测的预测效果。
示例的,假设第一综合贡献值的权重为k 1,第二综合贡献值的权重为k 2,则该行为预测模型最终计算得到的用户执行该指定行为的执行概率P满足:
P=k 1×out 1+k 2×out 2
该执行概率P也可以称为指定行为的预测分数(score)。该指定行为的执行概率P越高,表明用户越有可能执行该指定行为。
可选的,由于对第一综合贡献值和第二综合贡献值进行加权求和后得到求和结果有可能超出[0,1]的范围,因此在进行加权求和之后,若该求和结果超出了[0,1]的范围,则还可以采用映射函数对该求和结果进行处理,以将该求和结果映射到[0,1]的区间内。其中,该映射函数可以为S形(sigmoid)函数,或者具备类似功能的其他函数,本发明实施例对此不做限定。
在本发明实施例中,对于对象推送系统中预先配置的多个候选行为,行为预测模型可以通过上述步骤101至107所示的方法,分别计算用户执行每个候选行为的执行概率,并可以将计算结果发送至推送模型30。该推送模型30可以对各个候选行为的执行概率按照由高至低的顺序进行排序,并向终端推送执行概率最高的候选行为的执行对象,或者可以向终端推送执行概率排序靠前的若干个候选行为的执行对象。
在一种可选的应用场景中,假设该对象推送系统为广告精准投放系统,则该候选行为即为点击广告的行为,该候选行为的执行对象即广告。若该广告精准投放系统中预先存储有广告A至广告E共五个候选广告,行为预测模型计算得到的用户点击上述五个广告的概率依次为0.8、0.5、0.3、0.6和0.4。则该推送模型30可以确定用户点击广告A的概率最高,因此可以向终端推送广告A。
在另一种可选的应用场景中,假设该对象推送系统为个性化推荐系统,且该个性化推荐系统部署于应用市场的后台服务器中。当用户打开手机中安装的应用程序:应用市场时,该应用市场可以向后台服务器发送推荐请求。后台服务器中部署的个性化推荐系统在接收到该推荐请求后,对于多个候选应用程序,例如应用程序1至应用程序10,个性化推荐系统的行为预测模型可以分别计算用户下载每个候选应用程序的概率。之后,后台服务器可以将概率 较高的若干个应用程序推荐至应用市场进行显示。
可选的,在本发明实施例提供中,该对象推送系统所推送的对象除了可以为广告和应用程序之外,还可以为视频、音乐和新闻等,本发明实施例对此不做限定。
需要说明的是,本发明实施例提供的行为预测方法的步骤的先后顺序可以进行适当调整,步骤也可以根据情况进行相应增减。例如104与步骤103可以同步执行,或者步骤102也可以根据情况进行删除,即行为预测模型可以直接基于接收到的特征数据,获取第一贡献值和第二贡献值。任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化的方法,都应涵盖在本申请的保护范围之内,因此不再赘述。
综上所述,本发明实施例提供了一种行为预测方法,该方法根据获取到的行为预测信息对指定行为的执行概率进行预测时,可以分别计算每个特征数据对指定行为的第一贡献值,并可以根据特征交互模型计算N个特征数据对指定行为的第二贡献值,由于考虑了多个特征数据对指定行为的交互影响,因此有效提高了行为预测的准确性。并且,由于每N个特征数据对应的特征交互模型是基于该N个特征数据所属的类别确定的,即每N个类别对应一个特征交互模型,因此不仅可以避免所有特征数据采用同一特征交互模型进行处理而导致预测结果不佳的问题,还可避免每N个特征数据均采用独立的特征交互模型进行处理,而导致计算复杂度过高的问题。即本发明实施例提供的行为预测方法能够以较低的计算复杂度获得较好的预测效果。
本发明实施例还提供了一种行为预测模型的训练方法,该训练方法可以用于训练上述方法实施例中所采用的行为预测模型。该训练方法可以应用于图1所示的对象推送系统中的学习模块10。参考图9,该方法可以包括:
步骤301、获取训练样本数据,该训练样本数据包括多个样本特征数据以及样本行为的行为标签。
如图1所示,该训练样本数据可以是从日志文件40中获取到的用户的历史行为信息。该训练样本数据中,任意两个样本特征数据所属的类别不同。该行为标签可以用于指示用户是否执行该样本行为,且该行为标签的取值可以为0或1。其中,0用于指示未执行样本行为,1用于指示执行了样本行为。与行为预测信息类似,该训练样本数据中的样本特征数据也可以包括用户属性数据、环境数据以及样本行为的执行对象的属性数据。
例如,学习模块10获取到的某个训练样本数据可以为:北京,周二,17:00,快餐A,0,该训练样本数据可以表示,北京的一位用户在周二下午17:00接收到快餐A的广告后,未点击该广告。其中,北京所属类别为用户所在城市,为用户属性数据;周二所属类别为星期,17:00所属类别为时间,该两个训练样本数据均为环境数据;快餐A所属类别为广告的品牌,为执行对象的属性数据。
步骤302、获取该多个样本特征数据中每个样本特征数据对于该样本行为的第一参考贡献值。
在本发明实施例中,在初次训练时,学习模块10中可以存储有每个样本特征数据对应的初始参考贡献值,该初始参考贡献值可以是随机初始化得到的。学习模块10可以基于该对应关系,获取每个样本特征数据对于该样本行为的第一参考贡献值。
步骤303、对于该多个样本特征数据中的每N个样本特征数据,采用对应的一个特征交互模型进行处理,得到每N个样本特征数据对于该样本行为的第二参考贡献值。
可选的,该学习模块10中可以存储有多个特征交互模型的初始模型参数,其中每个特征 交互模型可以对应N个类别,各个特征交互模型对应的类别互不相同。并且,各个特征交互模型的初始模型参数可以相同,也可以不同,本发明实施例对此不做限定。
对于该多个样本特征数据中的每N个样本特征数据,学习模块10可以根据该N个样本特征数据所属的N个类别,确定与该N个类别对应的一个特征交互模型,并采用该确定的特征交互模型对该N个样本特征数据进行处理。若该训练样本数据中包括M个样本特征数据,则该学习模块10最终可以得到
Figure PCTCN2019077452-appb-000007
个的第二参考贡献值。
步骤304、根据获取到的每个样本特征数据的第一参考贡献值和每N个样本特征数据的第二参考贡献值,确定该样本行为的执行概率。
可选的,学习模块10可以将获取到的各个样本特征数据的第一参考贡献值以及获取到的第二参考贡献值进行累加,得到该样本行为的执行概率。
步骤305、根据该样本行为的执行概率与该行为标签的差异,调整该行为预测模型的模型参数并继续训练,直至满足训练停止条件时结束训练,得到调整模型参数后的该行为预测模型。
在本发明实施例中,学习模块在确定出样本行为的执行概率后,可以对比该执行概率与训练样本数据中记录的行为标签的差异,并基于该差异调整行为预测模型的模型参数。其中,该模型参数可以包括各个特征交互模型的模型参数、以及每个样本特征数据对应的第一参考贡献值。其中,该模型参数可以包括核函数的参数,以及每个特征数据的特征标识所对应的特征向量。
该训练停止条件可以包括:迭代训练的次数达到指定次数,或者执行概率与行为标签的差异小于指定差异阈值。在结束训练后,最终得到的行为预测模型可以包括多个特征交互模型,其中每个特征交互模型可以对应N个类别,且任意两个特征交互模型对应的类别不同。
可选的,图10是本发明实施例提供的一种确定样本行为的执行概率的方法流程图,参考图10,该方法可以包括:
步骤3041、对获取到的各个样本特征数据的第一参考贡献值和基准贡献值进行求和,得到第一参考综合贡献值。
其中,在初次训练时,该基准贡献值可以为预先设定的小于1的数值,例如可以0。
步骤3042、将获取到的每个样本特征数据的第二参考贡献值均输入神经网络,并将该神经网络的输出作为第二参考综合贡献值。
该神经网络可以为多层神经网络,每层均包括多个神经元。在初次训练时,相邻层的神经元之间的权重和偏置可以均为预先设定的初始值。
步骤3043、按照预设权重值,对该第一参考综合贡献值和该第二参考综合贡献值进行加权求和,得到该样本行为的执行概率。
同理,在初次训练时,该预设权重值也可以为预先设定的固定值。例如初次训练时,该第一参考综合贡献值和该第二参考综合贡献值的权重可以均为0.5。
相应的,在上述步骤305中,该学习模块10所调整的模型参数至少还可以包括:该基准贡献值,该神经网络中各神经元之间的权重和偏置,以及该预设权重值。
可选的,在上述步骤302之前,该方法还可以包括:
根据样本特征数据与特征标识的对应关系,确定该多个样本特征数据中每个样本特征数据的特征标识。
该确定样本特征数据的特征标识的过程可以参考上述步骤102,此处不再赘述。
相应的,上述步骤302可以包括:
根据特征标识与参考贡献值的对应关系,分别确定该多个样本特征数据中每个样本特征数据的特征标识所对应的第一参考贡献值。
相应的,上述步骤303可以包括:
步骤3031、分别获取每N个样本特征数据中每个样本特征数据的特征标识所对应的特征向量,各个特征标识对应的特征向量的长度相等。
步骤3032、采用与该每N个样本特征数据所属的N个类别对应的一个特征交互模型,对获取到的N个特征向量进行处理,得到每N个样本特征数据对于该样本行为的第二贡献值。
因此,在上述步骤305中,基于差异调整的行为预测模型的模型参数还可以包括每个特征标识所对应的特征向量。
需要说明的是,为了保证训练得到的行为预测模型的性能,学习模块需要对大量的训练样本数据进行训练,其中对于每个训练样本数据进行训练的过程均可以参考上述步骤301至步骤305,此处不再赘述。并且,上述步骤301至步骤305,以及步骤3041至步骤3043的具体实现过程还可以参考上述图2所示实施例中的对应步骤,此处也不再赘述。
本发明实施例提供的方法在对行为预测模型进行训练时,对于特征数据中的每N个类别可以建立对应的一个特征交互模型。如果对任意多个类别的特征数据均建立同一个特征交互模型,虽然可以有效提高模型训练的效率,但该特征交互模型的效果较差,不能有效表达不同类别的特征数据之间的交互特性。如果对于每N个特征数据均建立一个独立的特征交互模型,虽然能够充分表达特征数据之间的交互特性,但也使得特征交互模型中的参数数量大幅增加,极大增加了模型的复杂度以及训练的难度。
例如,假设样本特征数据的类别共有M类,若对于每两类(即N=2)建立对应的一个特征交互模型,则需建立的特征交互模型的数量为
Figure PCTCN2019077452-appb-000008
若该M类样本特征数据中,每一类样本特征数据包括的样本特征数据的总数依次为n 1,n 2,…,n M,则需建立的特征交互模型的数量为:
Figure PCTCN2019077452-appb-000009
其中,n m为该M类样本特征数据中第m(m为不大于M的正整数)类样本特征数据包括的样本特征数据的总数。由此可以看出,如果对每两个特征数据均建立一个特征交互模型,则会显著提升模型训练的复杂度,降低模型训练的效率。
示例的,假设训练样本数据的类别为性别、广告的品牌和星期,即M=3。若采用本发明实施例提供的方法,且N=2,则仅需为性别与广告的品牌,性别与星期,以及广告的品牌与星期分别建立对应的一个特征交互模型,该特征交互模型的数量为3。但如果需要对每两个特征数据均建立对应的一个特征交互模型,则由于在性别这一类别中,特征数据包括男和女两种,即特征数据的总数为2。星期这一类别中,特征数据包括星期一至星期日,特征数据的总数为7,假设广告的品牌这一类别中,特征数据的总数为5。则在建模时,需要对女性和星期一建立对应的一个特征交互模型,需要对男性和星期一建立对应的一个特征交互模型,还需要对女性和星期二建立对应的一个特征交互模型,依次类推,需要建立的特征交互模型的数量为
Figure PCTCN2019077452-appb-000010
根据上述分析可知,本发明实施例提供的方法对不同类别的特征数据建立对应的特征交互模型,能够较好的解决行为预测模型的预测效果和复杂度之间的矛盾关系。并且,本发明实施例提供的训练方法可以针对每N个类别建立一个对应的特征交互模型,因此实现了对多 个特征数据之间的特征交互的显式建模,相比于隐式建模,该显式建模能够更好的解释和体现不同特征数据之间的交互情况。
本发明实施例还对本申请提供的行为预测模型与相关技术中的预测模型的预测效果进行了对比。对比过程中采用了行为预测方法中常用的四个数据集,对比的对象包括相关技术中的LR模型、因式分解机(Factorization Machine,FM)模型、场感知因式分解机(Factorization Machine,FFM)模型、深度神经网络(Deep Neural Network,DNN)模型、基于注意力的因式分解机(Attentional Factorization Machine,AFM)以及基于因式分解机的深度学习(Deep Factorization Machine,DeepFM)模型。
对比过程中采用的四个数据集中,第一个数据集包含了大量用户一个月的广告点击纪录,本发明实施例采用了其中某一天的广告点击记录作为训练集,另一天的广告点击记录作为测试集。同时对该训练集中的负样本(即行为标签用于指示未点击广告的样本)进行降采样,使最终训练集中正负样本比为1:1。对于第二个数据集,本发明实施例随机选取了其中80%的数据作为训练集,剩下的20%的数据作为测试集,同时删除了训练集中出现次数少于20的类别。第三个数据集本身即包含训练集与测试集,因此在本次对比过程中可以直接使用。第四个数据集为应用市场的游戏类应用程序的点击下载数据集。
本发明实施例提供的行为预测模型可以称为基于乘积网络的神经网络(Product-network In Network,PIN)模型。在对比过程中,PIN模型以及相关技术中的LR模型、FM模型、FFM模型、DNN模型、AFM模型以及DeepFM模型中的每个模型,需分别采用上述四个数据集中的每个数据集提供的训练集进行模型训练,然后再对每个数据集提供的测试集进行行为预测。预测结果采用受试者工作特征曲线(receiver operating characteristic curve,ROC曲线)下的面积AUC(AreaUnder Curve)和对数损失(Logloss)进行衡量。其中,AUC的大小与预测结果的准确性正相关,即AUC越大,表明预测效果越好。Logloss的大小与预测结果的准确性负相关,即Logloss越小,表明预测效果越好。
本发明实施例提供的行为预测模型以及相关技术中的各个模型在该四个数据集下的预测结果如下述表2所示。参考表2可以看出,DeepFM模型对第一个数据集中的训练集进行预测后的AUC为79.91%,Logloss为0.5423。而本申请实施例提供的行为预测模型PIN模型对第一个数据集中的训练集进行预测后的AUC为80.21%,Logloss为0.5390。根据表2可知,本发明实施例提供的行为预测模型在各个数据集中的预测效果均优于其他模型。
表2
Figure PCTCN2019077452-appb-000011
并且,对比各个预测结果还可以看出,本申请提供的行为预测模型相比排名第二的DeepFM模型在AUC上均有0.15%至0.3%的提升。而通常情况下,较小的AUC提升可以带来较大的点击通过率(Click-Through-Rate,CTR)的提升。例如,若AUC提升0.275%,可以使得CTR提升约3.9%,该3.9%的CTR提升率可以为对象提供商带来较高的收益。
进一步的,对各个模型的复杂度进行分析,假设各个模型中嵌入层(embedding)的大小为L(即嵌入层可以将特征标识转换为长度为L的特征向量),样本特征数据的类别数为M,各个类别所包括的特征数据的总数为n。则对于相关技术中的FM模型,其参数规模为O(Ln),FFM模型的参数规模为O(nLM),而本发明实施例提供的PIN模型的参数规模为O(Ln+M*(M-1)/2*q)。其中,O()也可以理解为空间复杂度,即模型训练时所耗费的内存空间的数量级。q为本发明实施例提供的行为预测模型中,特征交互模型(例如核函数)所包括的参数的个数。由于实际应用中n的取值通常较大,而q的取值相对较小,因此本发明实施例提供的PIN模型的参数相比FFM模型会少很多。
表3是本发明实施例提供的一种各个模型对相同训练集进行训练时,所需的参数规模的对比表,该对比表以参数占用的内存作为参数规模的衡量标准。参考表3可以看出,LR模型所需的参数占用的内存为1×10 6字节,FFM模型所需的参数占用的内存大于或等于40×10 6字节,而本发明实施例提供的PIN模型所需的参数占用的内存为26.48×10 6字节,其参数规模比FFM模型小很多。
表3
模型 LR DNN FM FFM PIN
参数规模(10 6) 1 22.51 21 ≥40 26.48
需要说明的是,本发明实施例提供的行为预测模型训练方法可以在上述图2所示实施例中的步骤101之前执行。或者,也可以在上述步骤107之后执行,即在行为预测模型确定出执行概率后,学习模块可以根据用户实际执行的行为,确定该指定行为的行为标签,并基于该行为预测信息和行为标签生成训练样本数据,并继续通过上述步骤301至步骤305所示的方法对该新生成的训练样本数据进行训练。
综上所述,本发明实施例提供了一种行为预测模型训练方法,该方法在对训练样本数据进行训练时,对于每N个样本特征数据,可以根据该N个样本特征数据所属的类别,采用对应的一个特征交互模型计算该N个样本特征数据的第二贡献值,由此训练得到的行为预测模型中可以包括多个特征交互模型,且每个特征交互模型可以对应N个类别。采用该行为预测模型进行行为预测时,由于可以考虑N个特征数据对指定行为的交互影响,因此可以有效提高预测的准确性。并且,由于在进行模型训练时,每N个类别对应一个特征交互模型,因此不仅可以避免所有样本特征数据采用同一特征交互模型进行处理而导致训练结果不佳的问题,还可避免每N个样本特征数据均采用独立的特征交互模型进行处理,而导致训练算复杂度过高的问题。即本发明实施例提供的训练方法能够以较低的算复杂度获得较好的训练效果,能够满足实际部署需求。
图11是本发明实施例提供的一种用户行为预测装置的结构示意图,该装置可以应用于图1所示的对象推送系统中。参考图11,该装置可以包括:
第一获取模块401,可以用于实现上述方法实施例中步骤101所示的方法。
第二获取模块402,可以用于实现上述方法实施例中步骤103所示的方法。
第一处理模块403,可以用于实现上述方法实施例中步骤104所示的方法。
第一确定模块404,用于根据获取到的每个特征数据的第一贡献值和每N个特征数据的第二贡献值,确定指定行为的执行概率。
图12是本发明实施例提供的一种第一确定模块404的结构示意图,如图12所示,该第一确定模块404可以包括:
第一确定子模块4041,可以用于实现上述方法实施例中步骤105所示的方法。
第二确定子模块4042,可以用于实现上述方法实施例中步骤106所示的方法。
第一求和子模块4043,可以用于实现上述方法实施例中步骤107所示的方法。
可选的,该第二确定子模块4042可以用于:
对获取到的每N个特征数据的第二贡献值进行求和,得到该第二综合贡献值;
或者,将获取到的每N个特征数据的第二贡献值均输入神经网络,并将该神经网络的输出作为该第二综合贡献值。
可选的,该第一确定子模块4041可以用于:
对获取到的各个特征数据的第一贡献值和基准贡献值进行求和,得到该第一综合贡献值。
图13是本发明实施例提供的另一种用户行为预测装置的结构示意图,如图13所示,该装置还可以包括:
第二确定模块405,可以用于实现上述方法实施例中步骤102所示的方法。
相应的,该第二获取模块402可以用于:
根据特征标识与贡献值的对应关系,分别确定该多个特征数据中每个特征数据的特征标识所对应的第一贡献值。
相应的,该第一处理模块403可以用于:
分别获取该每N个特征数据中每个特征数据的特征标识所对应的特征向量;
采用与该每N个特征数据所属的N个类别对应的一个特征交互模型,对获取到的N个特征向量进行处理,得到该每N个特征数据对于该指定行为的第二贡献值。
继续参考图13,该装置还可以包括:
第三确定模块406,用于在该第一处理模块403对于该多个特征数据中的每N个特征数据,采用对应的一个特征交互模型进行处理之前,对于该多个特征数据中的每N个特征数据,从特征交互模型与类别的对应关系中,确定对应的一个特征交互模型;
该对应关系中可以包括多个特征交互模型,每个该特征交互模型可以对应N个类别,且任意两个特征交互模型对应的类别不同。
可选的,第一贡献值、第二贡献值和执行概率可以均由行为预测模型获取,如图13所示,该装置还可以包括:
第三获取模块407,可以用于实现上述方法实施例中步骤301所示的方法。
第四获取模块408,可以用于实现上述方法实施例中步骤302所示的方法。
第二处理模块409,可以用于实现上述方法实施例中步骤303所示的方法。
第四确定模块410,可以用于实现上述方法实施例中步骤304所示的方法。
调整模块411,可以用于实现上述方法实施例中步骤305所示的方法。
可选的,该第四确定模块410可以用于实现上述方法实施例中步骤3041至步骤3043所示的方法。
可选的,该特征交互模型可以包括:核函数;该N可以为2;该行为预测信息可以包括: 用户属性数据、当前环境数据以及该指定行为的执行对象的属性数据。
综上所述,本发明实施例提供了一种行为预测装置,该装置根据获取到的行为预测信息对指定行为的执行概率进行预测时,可以分别计算每个特征数据对指定行为的第一贡献值,并可以根据特征交互模型计算N个特征数据对指定行为的第二贡献值,由于考虑了多个特征数据对指定行为的交互影响,因此有效提高了行为预测的准确性。并且,由于每N个特征数据对应的特征交互模型是基于该N个特征数据所属的类别确定的,即每N个类别对应一个特征交互模型,因此不仅可以避免所有特征数据采用同一特征交互模型进行处理而导致预测结果不佳的问题,还可避免每N个特征数据均采用独立的特征交互模型进行处理,而导致计算复杂度过高的问题。即本发明实施例提供的行为预测装置能够以较低的计算复杂度获得较好的预测效果。
图14是本发明实施例提供的一种行为预测模型训练装置的结构示意图,该装置可以应用于图1所示的对象推送系统中。该行为预测模型可以包括多个特征交互模型,其中每个该特征交互模型对应N个类别,且任意两个该特征交互模型对应的类别不同,该类别为训练样本数据中样本特征数据的类别。参考图14,该装置可以包括:
第一获取模块501,可以用于实现上述方法实施例中步骤301所示的方法。
第二获取模块502,可以用于实现上述方法实施例中步骤302所示的方法。
处理模块503,可以用于实现上述方法实施例中步骤303所示的方法。
确定模块504,可以用于实现上述方法实施例中步骤304所示的方法。
调整模块505,可以用于实现上述方法实施例中步骤305所示的方法。
可选的,该确定模块504可以用于实现上述方法实施例中步骤3041至步骤3043所示的方法。
综上所述,本发明实施例提供了一种行为预测模型训练装置,该装置在对训练样本数据进行训练时,对于每N个样本特征数据,可以根据该N个样本特征数据所属的类别,采用对应的一个特征交互模型计算该N个样本特征数据的第二贡献值,由此训练得到的行为预测模型中可以包括多个特征交互模型,且每个特征交互模型可以对应N个类别。采用该行为预测模型进行行为预测时,由于可以考虑N个特征数据对指定行为的交互影响,因此可以有效提高预测的准确性。并且,由于在进行模型训练时,每N个类别对应一个特征交互模型,因此不仅可以避免所有样本特征数据采用同一特征交互模型进行处理而导致训练结果不佳的问题,还可避免每N个样本特征数据均采用独立的特征交互模型进行处理,而导致训练算复杂度过高的问题。即本发明实施例提供的训练装置能够以较低的算复杂度获得较好的训练效果,能够满足实际部署需求。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
图15是本发明实施例提供的一种服务器的结构示意图,如图15所示,该服务器可以包括:处理器1201(如CPU)、存储器1202、网络接口1203和总线1204。其中,总线1204用于连接处理器1201、存储器1202和网络接口1203。存储器1202可能包含随机存取存储器(Random Access Memory,RAM),也可能包含非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过网络接口1203(可以是有线或者无线)实现服务器与通信设备之间的通信连接。存储器1202中存储有计算机程序12021,该计算机程序12021用于实现 各种应用功能,处理器1201用于执行存储器1202中存储的计算机程序12021来实现上述方法实施例提供的用户行为预测方法或者行为预测模型训练方法。
本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当该计算机可读存储介质在计算机上运行时,使得计算机执行上述方法实施例提供的用户行为预测方法或者行为预测模型训练方法。
本发明实施例还提供了一种包含指令的计算机程序产品,当该计算机程序产品在计算机上运行时,使得计算机执行上述方法实施例提供的用户行为预测方法或者行为预测模型训练方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现,所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机的可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质,或者半导体介质(例如固态硬盘)等。
以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (30)

  1. 一种用户行为预测方法,其特征在于,所述方法包括:
    获取用于对指定行为进行预测的行为预测信息,所述行为预测信息包括多个特征数据,且任意两个特征数据所属的类别不同;
    获取所述多个特征数据中每个特征数据对于所述指定行为的第一贡献值,所述第一贡献值用于指示对执行所述指定行为的影响程度,且所述第一贡献值的大小与所述影响程度的高低正相关;
    对于所述多个特征数据中的每N个特征数据,采用对应的一个特征交互模型进行处理,得到每N个特征数据对于所述指定行为的第二贡献值,其中,所述N为大于1的整数,任意N个特征数据对应的一个特征交互模型由所述任意N个特征数据所属的N个类别确定,所述第二贡献值用于指示对执行所述指定行为的影响程度,且所述第二贡献值的大小与所述影响程度的高低正相关;
    根据获取到的每个特征数据的第一贡献值和每N个特征数据的第二贡献值,确定所述指定行为的执行概率。
  2. 根据权利要求1所述的方法,其特征在于,所述根据获取到的每个特征数据的第一贡献值和每N个特征数据的第二贡献值,确定所述指定行为的执行概率,包括:
    根据获取到的每个特征数据的第一贡献值确定第一综合贡献值;
    根据获取到的每N个特征数据的第二贡献值确定第二综合贡献值;
    采用预设权重值,对所述第一综合贡献值和所述第二综合贡献值进行加权求和,得到所述执行概率。
  3. 根据权利要求2所述的方法,其特征在于,所述根据获取到的每N个特征数据的第二贡献值确定第二综合贡献值,包括:
    对获取到的每N个特征数据的第二贡献值进行求和,得到所述第二综合贡献值;
    或者,将获取到的每N个特征数据的第二贡献值均输入神经网络,并将所述神经网络的输出作为所述第二综合贡献值。
  4. 根据权利要求2所述的方法,其特征在于,所述根据获取到的每个特征数据的第一贡献值确定第一综合贡献值,包括:对获取到的各个特征数据的第一贡献值和基准贡献值进行求和,得到所述第一综合贡献值。
  5. 根据权利要求1所述的方法,其特征在于,在所述获取所述多个特征数据中每个特征数据对于所述指定行为的第一贡献值之前,所述方法还包括:
    根据特征数据与特征标识的对应关系,确定所述多个特征数据中每个特征数据的特征标识;
    所述获取所述多个特征数据中每个特征数据对于所述指定行为的第一贡献值,包括:
    根据特征标识与贡献值的对应关系,分别确定所述多个特征数据中每个特征数据的特征标识所对应的第一贡献值。
  6. 根据权利要求1所述的方法,其特征在于,在所述获取所述多个特征数据中每个特征数据对于所述指定行为的第一贡献值之前,所述方法还包括:
    根据特征数据与特征标识的对应关系,确定所述多个特征数据中每个特征数据的特征标识;
    所述对于所述多个特征数据中的每N个特征数据,采用对应的一个特征交互模型进行处理,得到每N个特征数据对于所述指定行为的第二贡献值,包括:
    分别获取所述每N个特征数据中每个特征数据的特征标识所对应的特征向量,各个特征标识对应的特征向量的长度相等;
    采用与所述每N个特征数据所属的N个类别对应的一个特征交互模型,对获取到的N个特征向量进行处理,得到所述每N个特征数据对于所述指定行为的第二贡献值。
  7. 根据权利要求1至6任一所述的方法,其特征在于,在对于所述多个特征数据中的每N个特征数据,采用对应的一个特征交互模型进行处理之前,所述方法还包括:
    对于所述多个特征数据中的每N个特征数据,从特征交互模型与类别的对应关系中,确定对应的一个特征交互模型;
    所述对应关系中包括多个特征交互模型,每个所述特征交互模型对应N个类别,且任意两个所述特征交互模型对应的类别不同。
  8. 根据权利要求1至7任一所述的方法,其特征在于,所述第一贡献值、所述第二贡献值和所述执行概率均由行为预测模型获取,所述方法还包括:
    获取训练样本数据,所述训练样本数据包括多个样本特征数据以及样本行为的行为标签,任意两个样本特征数据所属的类别不同,所述行为标签用于指示用户是否执行所述样本行为;
    获取所述多个样本特征数据中每个样本特征数据对于所述样本行为的第一参考贡献值;
    对于所述多个样本特征数据中的每N个样本特征数据,采用对应的一个特征交互模型进行处理,得到每N个样本特征数据对于所述样本行为的第二参考贡献值;
    根据获取到的每个样本特征数据的第一参考贡献值和每N个样本特征数据的第二参考贡献值,确定所述样本行为的执行概率;
    根据所述样本行为的执行概率与所述行为标签的差异,调整所述行为预测模型的模型参数并继续训练,直至满足训练停止条件时结束训练,得到调整模型参数后的所述行为预测模型。
  9. 根据权利要求8所述的方法,其特征在于,所述根据获取到的每个样本特征数据的第一参考贡献值和每N个样本特征数据的第二参考贡献值,确定所述样本行为的执行概率,包括:
    对获取到的各个样本特征数据的第一参考贡献值和基准贡献值进行求和,得到第一参考综合贡献值;
    将获取到的每个样本特征数据的第二参考贡献值均输入神经网络,并将所述神经网络的输出作为第二参考综合贡献值;
    按照预设权重值,对所述第一参考综合贡献值和所述第二参考综合贡献值进行加权求和,得到所述样本行为的执行概率;
    所述模型参数至少包括:所述基准贡献值,所述神经网络中各神经元之间的权重和偏置, 以及所述预设权重值。
  10. 根据权利要求1至7任一所述的方法,其特征在于,所述特征交互模型包括:核函数。
  11. 根据权利要求1至7任一所述的方法,其特征在于,所述N为2。
  12. 根据权利要求1至7任一所述的方法,其特征在于,所述行为预测信息包括:用户属性数据、当前环境数据以及所述指定行为的执行对象的属性数据。
  13. 一种行为预测模型训练方法,其特征在于,所述行为预测模型包括多个特征交互模型,其中每个所述特征交互模型对应N个类别,任意两个所述特征交互模型对应的类别不同,所述类别为训练样本数据中样本特征数据的类别;所述方法包括:
    获取训练样本数据,所述训练样本数据包括多个样本特征数据以及样本行为的行为标签,任意两个样本特征数据所属的类别不同,所述行为标签用于指示用户是否执行所述样本行为;
    获取所述多个样本特征数据中每个样本特征数据对于所述样本行为的第一参考贡献值,所述第一参考贡献值用于指示对执行所述样本行为的影响程度,且所述第一参考贡献值的大小与所述影响程度的高低正相关;
    对于所述多个样本特征数据中的每N个样本特征数据,采用对应的一个特征交互模型进行处理,得到每N个样本特征数据对于所述样本行为的第二参考贡献值,所述第二参考贡献值用于指示对执行所述样本行为的影响程度,且所述第二参考贡献值的大小与所述影响程度的高低正相关;
    根据获取到的每个样本特征数据的第一参考贡献值和每N个样本特征数据的第二参考贡献值,确定所述样本行为的执行概率;
    根据所述样本行为的执行概率与所述行为标签的差异,调整所述行为预测模型的模型参数并继续训练,直至满足训练停止条件时结束训练,得到调整模型参数后的所述行为预测模型。
  14. 根据权利要求13所述的方法,其特征在于,所述根据获取到的每个样本特征数据的第一参考贡献值和每N个样本特征数据的第二参考贡献值,确定所述样本行为的执行概率,包括:
    对获取到的各个样本特征数据的第一参考贡献值和基准贡献值进行求和,得到第一参考综合贡献值;
    将获取到的每个样本特征数据的第二参考贡献值均输入神经网络,并将所述神经网络的输出作为第二参考综合贡献值;
    按照预设权重值,对所述第一参考综合贡献值和所述第二参考综合贡献值进行加权求和,得到所述样本行为的执行概率;
    所述模型参数至少包括:所述基准贡献值,所述神经网络中各神经元之间的权重和偏置,以及所述预设权重值。
  15. 一种用户行为预测装置,其特征在于,所述装置包括:
    第一获取模块,用于获取用于对指定行为进行预测的行为预测信息,所述行为预测信息包括多个特征数据,且任意两个特征数据所属的类别不同;
    第二获取模块,用于获取所述多个特征数据中每个特征数据对于所述指定行为的第一贡献值,所述第一贡献值用于指示对执行所述指定行为的影响程度,且所述第一贡献值的大小与所述影响程度的高低正相关;
    第一处理模块,用于对于所述多个特征数据中的每N个特征数据,采用对应的一个特征交互模型进行处理,得到每N个特征数据对于所述指定行为的第二贡献值,其中,所述N为大于1的整数,任意N个特征数据对应的一个特征交互模型由所述任意N个特征数据所属的N个类别确定,所述第二贡献值用于指示对执行所述指定行为的影响程度,且所述第二贡献值的大小与所述影响程度的高低正相关;
    第一确定模块,用于根据获取到的每个特征数据的第一贡献值和每N个特征数据的第二贡献值,确定所述指定行为的执行概率。
  16. 根据权利要求15所述的装置,其特征在于,所述第一确定模块,包括:
    第一确定子模块,用于根据获取到的每个特征数据的第一贡献值确定第一综合贡献值;
    第二确定子模块,用于根据获取到的每N个特征数据的第二贡献值确定第二综合贡献值;
    第一求和子模块,用于采用预设权重值,对所述第一综合贡献值和所述第二综合贡献值进行加权求和,得到所述执行概率。
  17. 根据权利要求16所述的装置,其特征在于,所述第二确定子模块,用于:对获取到的每N个特征数据的第二贡献值进行求和,得到所述第二综合贡献值;
    或者,将获取到的每N个特征数据的第二贡献值均输入神经网络,并将所述神经网络的输出作为所述第二综合贡献值。
  18. 根据权利要求16所述的装置,其特征在于,所述第一确定子模块,用于:对获取到的各个特征数据的第一贡献值和基准贡献值进行求和,得到所述第一综合贡献值。
  19. 根据权利要求15所述的装置,其特征在于,所述装置还包括:
    第二确定模块,用于在所述第二获取模块获取所述多个特征数据中每个特征数据对于所述指定行为的第一贡献值之前,根据特征数据与特征标识的对应关系,确定所述多个特征数据中每个特征数据的特征标识;
    所述第二获取模块,用于:
    根据特征标识与贡献值的对应关系,分别确定所述多个特征数据中每个特征数据的特征标识所对应的第一贡献值。
  20. 根据权利要求15所述的装置,其特征在于,所述装置还包括:
    第二确定模块,用于在所述第二获取模块获取所述多个特征数据中每个特征数据对于所述指定行为的第一贡献值之前,根据特征数据与特征标识的对应关系,确定所述多个特征数据中每个特征数据的特征标识;
    所述第一处理模块,用于:
    分别获取所述每N个特征数据中每个特征数据的特征标识所对应的特征向量,各个特征标识对应的特征向量的长度相等;
    采用与所述每N个特征数据所属的N个类别对应的一个特征交互模型,对获取到的N个特征向量进行处理,得到所述每N个特征数据对于所述指定行为的第二贡献值。
  21. 根据权利要求15至20任一所述的装置,其特征在于,所述装置还包括:
    第三确定模块,用于在所述第一处理模块对于所述多个特征数据中的每N个特征数据,采用对应的一个特征交互模型进行处理之前,对于所述多个特征数据中的每N个特征数据,从特征交互模型与类别的对应关系中,确定对应的一个特征交互模型;
    所述对应关系中包括多个特征交互模型,每个所述特征交互模型对应N个类别,且任意两个所述特征交互模型对应的类别不同。
  22. 根据权利要求15至21任一所述的装置,其特征在于,所述第一贡献值、所述第二贡献值和所述执行概率均由行为预测模型获取,所述装置还包括:
    第三获取模块,用于获取训练样本数据,所述训练样本数据包括多个样本特征数据以及样本行为的行为标签,任意两个样本特征数据所属的类别不同,所述行为标签用于指示用户是否执行所述样本行为;
    第四获取模块,用于获取所述多个样本特征数据中每个样本特征数据对于所述样本行为的第一参考贡献值;
    第二处理模块,用于对于所述多个样本特征数据中的每N个样本特征数据,采用对应的一个特征交互模型进行处理,得到每N个样本特征数据对于所述样本行为的第二参考贡献值;
    第四确定模块,用于根据获取到的每个样本特征数据的第一参考贡献值和每N个样本特征数据的第二参考贡献值,确定所述样本行为的执行概率;
    调整模块,用于根据所述样本行为的执行概率与所述行为标签的差异,调整所述行为预测模型的模型参数并继续训练,直至满足训练停止条件时结束训练,得到调整模型参数后的所述行为预测模型。
  23. 根据权利要求22所述的装置,其特征在于,所述第四确定模块,用于:
    对获取到的各个样本特征数据的第一参考贡献值和基准贡献值进行求和,得到第一参考综合贡献值;
    将获取到的每个样本特征数据的第二参考贡献值均输入神经网络,并将所述神经网络的输出作为第二参考综合贡献值;
    按照预设权重值,对所述第一参考综合贡献值和所述第二参考综合贡献值进行加权求和,得到所述样本行为的执行概率;
    所述模型参数至少包括:所述基准贡献值,所述神经网络中各神经元之间的权重和偏置,以及所述预设权重值。
  24. 根据权利要求15至21任一所述的装置,其特征在于,所述特征交互模型包括:核函数。
  25. 根据权利要求15至21任一所述的装置,其特征在于,所述N为2。
  26. 根据权利要求15至21任一所述的装置,其特征在于,所述行为预测信息包括:用户属性数据、当前环境数据以及所述指定行为的执行对象的属性数据。
  27. 一种行为预测模型训练装置,其特征在于,所述行为预测模型包括多个特征交互模型,其中每个所述特征交互模型对应N个类别,任意两个所述特征交互模型对应的类别不同,所述类别为训练样本数据中样本特征数据的类别;所述装置包括:
    第一获取模块,用于获取训练样本数据,所述训练样本数据包括多个样本特征数据以及样本行为的行为标签,任意两个样本特征数据所属的类别不同,所述行为标签用于指示用户是否执行所述样本行为;
    第二获取模块,用于获取所述多个样本特征数据中每个样本特征数据对于所述样本行为的第一参考贡献值,所述第一参考贡献值用于指示对执行所述样本行为的影响程度,且所述第一参考贡献值的大小与所述影响程度的高低正相关;
    处理模块,用于对于所述多个样本特征数据中的每N个样本特征数据,采用对应的一个特征交互模型进行处理,得到每N个样本特征数据对于所述样本行为的第二参考贡献值,所述第二参考贡献值用于指示对执行所述样本行为的影响程度,且所述第二参考贡献值的大小与所述影响程度的高低正相关;
    确定模块,用于根据获取到的每个样本特征数据的第一参考贡献值和每N个样本特征数据的第二参考贡献值,确定所述样本行为的执行概率;
    调整模块,用于根据所述样本行为的执行概率与所述行为标签的差异,调整所述行为预测模型的模型参数并继续训练,直至满足训练停止条件时结束训练,得到调整模型参数后的所述行为预测模型。
  28. 根据权利要求27所述的装置,其特征在于,所述确定模块,用于:
    对获取到的各个样本特征数据的第一参考贡献值和基准贡献值进行求和,得到第一参考综合贡献值;
    将获取到的每个样本特征数据的第二参考贡献值均输入神经网络,并将所述神经网络的输出作为第二参考综合贡献值;
    按照预设权重值,对所述第一参考综合贡献值和所述第二参考综合贡献值进行加权求和,得到所述样本行为的执行概率;
    所述模型参数至少包括:所述基准贡献值,所述神经网络中各神经元之间的权重和偏置,以及所述预设权重值。
  29. 一种服务器,其特征在于,所述服务器包括:存储器,处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至12任一所述的用户行为预测方法,或者,如权利要求13或14所述的行为预测模型训练方法。
  30. 一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述计算机可读存储介质在计算机上运行时,使得计算机执行如权利要求1至12任一所述的用户行为预测方法,或者,如权利要求13或14所述的行为预测模型训练方法。
PCT/CN2019/077452 2018-06-20 2019-03-08 用户行为预测方法及装置、行为预测模型训练方法及装置 WO2019242331A1 (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
EP19822110.3A EP3690768A4 (en) 2018-06-20 2019-03-08 USER BEHAVIOR PREDICTION METHOD AND APPARATUS, AND BEHAVIOR PREDICTION MODEL TRAINING METHOD AND APPARATUS
US16/850,549 US11531867B2 (en) 2018-06-20 2020-04-16 User behavior prediction method and apparatus, and behavior prediction model training method and apparatus

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810636443.8 2018-06-20
CN201810636443.8A CN109902849B (zh) 2018-06-20 2018-06-20 用户行为预测方法及装置、行为预测模型训练方法及装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US16/850,549 Continuation US11531867B2 (en) 2018-06-20 2020-04-16 User behavior prediction method and apparatus, and behavior prediction model training method and apparatus

Publications (1)

Publication Number Publication Date
WO2019242331A1 true WO2019242331A1 (zh) 2019-12-26

Family

ID=66943195

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2019/077452 WO2019242331A1 (zh) 2018-06-20 2019-03-08 用户行为预测方法及装置、行为预测模型训练方法及装置

Country Status (4)

Country Link
US (1) US11531867B2 (zh)
EP (1) EP3690768A4 (zh)
CN (1) CN109902849B (zh)
WO (1) WO2019242331A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111311372A (zh) * 2020-03-04 2020-06-19 支付宝(杭州)信息技术有限公司 一种用户识别方法和装置
CN111506811A (zh) * 2020-03-19 2020-08-07 上海理工大学 一种基于深度残差网络的点击率预测方法
CN111523026A (zh) * 2020-04-15 2020-08-11 咪咕文化科技有限公司 用户画像更新方法、系统、网络设备及存储介质
CN113283345A (zh) * 2021-05-27 2021-08-20 新东方教育科技集团有限公司 板书书写行为检测方法、训练方法、装置、介质及设备
CN113313328A (zh) * 2021-06-30 2021-08-27 广州酷狗计算机科技有限公司 信任参数确定方法、装置、计算机设备和存储介质
CN113569111A (zh) * 2021-09-24 2021-10-29 腾讯科技(深圳)有限公司 对象属性识别方法、装置、存储介质及计算机设备
CN113596528A (zh) * 2020-04-30 2021-11-02 北京达佳互联信息技术有限公司 视频推送模型的训练方法、装置、服务器及存储介质
CN116205376A (zh) * 2023-04-27 2023-06-02 北京阿帕科蓝科技有限公司 行为预测方法、行为预测模型的训练方法和装置
EP4131031A4 (en) * 2020-04-14 2023-06-21 Huawei Technologies Co., Ltd. RECOMMENDATION METHOD AND DEVICE BASED ON AUTOMATIC CHARACTERISTIC GROUPING

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109902849B (zh) * 2018-06-20 2021-11-30 华为技术有限公司 用户行为预测方法及装置、行为预测模型训练方法及装置
CN110298508A (zh) * 2019-06-28 2019-10-01 京东数字科技控股有限公司 行为预测方法、装置及设备
CN110570232B (zh) * 2019-08-05 2023-07-28 科大讯飞股份有限公司 互联网广告投放方法、装置、服务器及存储介质
CN110472686A (zh) * 2019-08-15 2019-11-19 中国银行股份有限公司 对象行为执行概率预测方法及装置
CN111242310B (zh) * 2020-01-03 2023-04-18 深圳市雅阅科技有限公司 特征有效性评估方法、装置、电子设备及存储介质
CN111626898B (zh) * 2020-03-20 2022-03-15 贝壳找房(北京)科技有限公司 用于实现事件归因的方法、装置、介质和电子设备
CN111860870A (zh) * 2020-07-29 2020-10-30 北京达佳互联信息技术有限公司 交互行为确定模型的训练方法、装置、设备及介质
CN112070545B (zh) * 2020-09-10 2021-12-21 贝壳找房(北京)科技有限公司 用于优化信息触达的方法、装置、介质和电子设备
CN112115371A (zh) * 2020-09-30 2020-12-22 山东建筑大学 一种基于因子分解机的神经注意力机制手机应用推荐模型
US20220171845A1 (en) * 2020-11-30 2022-06-02 Rovi Guides, Inc. Enhancing intelligence in parental control
CN112560987A (zh) * 2020-12-25 2021-03-26 北京百度网讯科技有限公司 图像样本处理方法、装置、设备、存储介质和程序产品
CN112700277B (zh) * 2020-12-30 2024-05-28 北京爱笔科技有限公司 用户行为数据的处理方法和多行为序列转化模型训练方法
CN112890572B (zh) * 2021-02-07 2021-08-17 广州一盒科技有限公司 一种食材烹调智能控制系统及方法
KR102671703B1 (ko) * 2021-04-02 2024-06-05 한국전자통신연구원 행동 목적 달성 여부 인식 장치 및 방법
CN113222650B (zh) * 2021-04-29 2023-11-14 西安点告网络科技有限公司 广告投放模型的训练特征选取方法、系统、设备及介质
CN113095890A (zh) * 2021-04-29 2021-07-09 平安普惠企业管理有限公司 电子优惠券发放方法、装置、计算机设备和存储介质
US12014029B2 (en) * 2021-05-26 2024-06-18 Intuit Inc. Smart navigation
CN113426109B (zh) * 2021-06-24 2023-09-26 深圳市优智创芯科技有限公司 一种基于因式分解机进行棋牌游戏行为克隆的方法
CN113282857B (zh) * 2021-07-22 2021-12-07 北京明略软件系统有限公司 一种投放点位贡献度的确定方法、装置及可读存储介质
CN113612639B (zh) * 2021-07-30 2022-11-11 江苏易安联网络技术有限公司 基于网站访问记录分析预测文件下载行为的方法和装置
CN116109354A (zh) * 2021-11-09 2023-05-12 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备、存储介质及计算机程序产品
CN115208938B (zh) * 2022-07-06 2023-08-01 中移互联网有限公司 用户行为管控方法及装置、计算机可读存储介质
CN116028881B (zh) * 2023-03-15 2023-06-02 深圳市大数据研究院 基于多维数据库的再次出现限制行为的预测方法及系统
CN116628349B (zh) * 2023-07-25 2023-12-19 腾讯科技(深圳)有限公司 信息推荐方法、装置、设备、存储介质及程序产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105868847A (zh) * 2016-03-24 2016-08-17 车智互联(北京)科技有限公司 一种购物行为的预测方法及装置
CN106776884A (zh) * 2016-11-30 2017-05-31 江苏大学 一种基于多标签组合多分类器的恐怖行为预测方法
CN107798332A (zh) * 2016-09-05 2018-03-13 华为技术有限公司 一种用户行为预测方法及装置
CN108062573A (zh) * 2017-12-29 2018-05-22 广东欧珀移动通信有限公司 模型训练方法及装置

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8484077B2 (en) * 2010-07-21 2013-07-09 Yahoo! Inc. Using linear and log-linear model combinations for estimating probabilities of events
US8909564B1 (en) * 2011-06-21 2014-12-09 Google Inc. Predictive model evaluation and training based on utility
US20140100835A1 (en) * 2012-10-04 2014-04-10 Futurewei Technologies, Inc. User Behavior Modeling for Intelligent Mobile Companions
US10558987B2 (en) * 2014-03-12 2020-02-11 Adobe Inc. System identification framework
CN103971170B (zh) * 2014-04-17 2017-09-29 北京百度网讯科技有限公司 一种用于对特征信息的变化进行预测的方法和装置
CN103996088A (zh) * 2014-06-10 2014-08-20 苏州工业职业技术学院 基于多维特征组合逻辑回归的广告点击率预测方法
CN105160548A (zh) * 2015-08-20 2015-12-16 北京奇虎科技有限公司 对广告点击率进行预测的方法及装置
CN105631711A (zh) * 2015-12-30 2016-06-01 合一网络技术(北京)有限公司 一种广告投放方法及装置
CN105654200A (zh) * 2015-12-30 2016-06-08 上海珍岛信息技术有限公司 一种基于深度学习的广告点击率预测方法及装置
US20180129929A1 (en) * 2016-11-09 2018-05-10 Fuji Xerox Co., Ltd. Method and system for inferring user visit behavior of a user based on social media content posted online
CN108122122A (zh) * 2016-11-29 2018-06-05 腾讯科技(深圳)有限公司 广告投放方法和系统
CN108038720A (zh) * 2017-12-06 2018-05-15 电子科技大学 一种基于因子分解机的广告点击率预测方法
JP7322714B2 (ja) * 2018-01-19 2023-08-08 ソニーグループ株式会社 情報処理装置、情報処理方法及びプログラム
CN109902849B (zh) * 2018-06-20 2021-11-30 华为技术有限公司 用户行为预测方法及装置、行为预测模型训练方法及装置
CN109902222B (zh) * 2018-11-30 2022-05-13 华为技术有限公司 一种推荐方法及装置
US11068758B1 (en) * 2019-08-14 2021-07-20 Compellon Incorporated Polarity semantics engine analytics platform
CN112487278A (zh) * 2019-09-11 2021-03-12 华为技术有限公司 推荐模型的训练方法、预测选择概率的方法及装置
WO2021224453A1 (en) * 2020-05-07 2021-11-11 UMNAI Limited Distributed architecture for explainable ai models
US11715007B2 (en) * 2020-08-28 2023-08-01 UMNAI Limited Behaviour modeling, verification, and autonomous actions and triggers of ML and AI systems
EP4264498A1 (en) * 2020-12-17 2023-10-25 Umnai Limited Explainable transducer transformers

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105868847A (zh) * 2016-03-24 2016-08-17 车智互联(北京)科技有限公司 一种购物行为的预测方法及装置
CN107798332A (zh) * 2016-09-05 2018-03-13 华为技术有限公司 一种用户行为预测方法及装置
CN106776884A (zh) * 2016-11-30 2017-05-31 江苏大学 一种基于多标签组合多分类器的恐怖行为预测方法
CN108062573A (zh) * 2017-12-29 2018-05-22 广东欧珀移动通信有限公司 模型训练方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3690768A4

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111311372A (zh) * 2020-03-04 2020-06-19 支付宝(杭州)信息技术有限公司 一种用户识别方法和装置
CN111506811A (zh) * 2020-03-19 2020-08-07 上海理工大学 一种基于深度残差网络的点击率预测方法
EP4131031A4 (en) * 2020-04-14 2023-06-21 Huawei Technologies Co., Ltd. RECOMMENDATION METHOD AND DEVICE BASED ON AUTOMATIC CHARACTERISTIC GROUPING
CN111523026A (zh) * 2020-04-15 2020-08-11 咪咕文化科技有限公司 用户画像更新方法、系统、网络设备及存储介质
CN111523026B (zh) * 2020-04-15 2023-10-17 咪咕文化科技有限公司 用户画像更新方法、系统、网络设备及存储介质
CN113596528A (zh) * 2020-04-30 2021-11-02 北京达佳互联信息技术有限公司 视频推送模型的训练方法、装置、服务器及存储介质
CN113283345A (zh) * 2021-05-27 2021-08-20 新东方教育科技集团有限公司 板书书写行为检测方法、训练方法、装置、介质及设备
CN113283345B (zh) * 2021-05-27 2023-11-24 新东方教育科技集团有限公司 板书书写行为检测方法、训练方法、装置、介质及设备
CN113313328A (zh) * 2021-06-30 2021-08-27 广州酷狗计算机科技有限公司 信任参数确定方法、装置、计算机设备和存储介质
CN113569111A (zh) * 2021-09-24 2021-10-29 腾讯科技(深圳)有限公司 对象属性识别方法、装置、存储介质及计算机设备
CN116205376A (zh) * 2023-04-27 2023-06-02 北京阿帕科蓝科技有限公司 行为预测方法、行为预测模型的训练方法和装置
CN116205376B (zh) * 2023-04-27 2023-10-17 北京阿帕科蓝科技有限公司 行为预测方法、行为预测模型的训练方法和装置

Also Published As

Publication number Publication date
US11531867B2 (en) 2022-12-20
EP3690768A4 (en) 2020-10-14
US20200242450A1 (en) 2020-07-30
EP3690768A1 (en) 2020-08-05
CN109902849A (zh) 2019-06-18
CN109902849B (zh) 2021-11-30

Similar Documents

Publication Publication Date Title
WO2019242331A1 (zh) 用户行为预测方法及装置、行为预测模型训练方法及装置
CN109345302B (zh) 机器学习模型训练方法、装置、存储介质和计算机设备
WO2020135535A1 (zh) 一种推荐模型训练方法及相关装置
US8732015B1 (en) Social media pricing engine
CN110147882B (zh) 神经网络模型的训练方法、人群扩散方法、装置及设备
CN111242748B (zh) 用于向用户推荐项目的方法、装置和存储介质
CN109961080B (zh) 终端识别方法及装置
CN111008335B (zh) 一种信息处理方法、装置、设备及存储介质
CN111798280A (zh) 多媒体信息推荐方法、装置和设备及存储介质
CN112348592A (zh) 广告推荐方法、装置、电子设备及介质
WO2022247666A1 (zh) 一种内容的处理方法、装置、计算机设备和存储介质
CN113706211A (zh) 基于神经网络的广告点击率预测方法及系统
CN113763019A (zh) 一种用户信息管理方法和装置
CN115018552A (zh) 产品点击率确定方法
CN113256335B (zh) 数据筛选方法、多媒体数据的投放效果预测方法及装置
CN109075987A (zh) 优化数字组件分析系统
CN108647986B (zh) 一种目标用户确定方法、装置及电子设备
CN115730125A (zh) 对象识别方法、装置、计算机设备和存储介质
CN115131052A (zh) 一种数据处理方法、计算机设备和存储介质
CN113822734A (zh) 用于生成信息的方法和装置
CN112435070A (zh) 确定用户年龄的方法、装置、设备及存储介质
CN112115354A (zh) 信息处理方法、装置、服务器及存储介质
US20120004957A1 (en) Forecasting supply for advertisements according to a non-parametric supply model
CN115345635A (zh) 推荐内容的处理方法、装置、计算机设备和存储介质
CN114092162A (zh) 推荐质量确定方法、推荐质量确定模型的训练方法及装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19822110

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2019822110

Country of ref document: EP

Effective date: 20200429

NENP Non-entry into the national phase

Ref country code: DE