WO2017219548A1 - 用户属性预测方法及装置 - Google Patents

用户属性预测方法及装置 Download PDF

Info

Publication number
WO2017219548A1
WO2017219548A1 PCT/CN2016/102466 CN2016102466W WO2017219548A1 WO 2017219548 A1 WO2017219548 A1 WO 2017219548A1 CN 2016102466 W CN2016102466 W CN 2016102466W WO 2017219548 A1 WO2017219548 A1 WO 2017219548A1
Authority
WO
WIPO (PCT)
Prior art keywords
user
application
attribute
module
prediction
Prior art date
Application number
PCT/CN2016/102466
Other languages
English (en)
French (fr)
Inventor
周二亮
Original Assignee
乐视控股(北京)有限公司
乐视网信息技术(北京)股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 乐视控股(北京)有限公司, 乐视网信息技术(北京)股份有限公司 filed Critical 乐视控股(北京)有限公司
Publication of WO2017219548A1 publication Critical patent/WO2017219548A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Definitions

  • the embodiments of the present invention relate to the field of mobile internet technologies, and in particular, to a user attribute prediction method and apparatus.
  • the personalized search service provided by Google is based on the user's geographic location information and user's search.
  • the history returns a personalized search list for the user, providing the user with a personalized search service.
  • the user-based attributes here usually refer to the user's age, gender, income status, geographic location, education level, religious beliefs and other basic attributes.
  • the simplest way is to fill in the obtained user attribute information by registering the user's data, but the coverage and accuracy of the method cannot be guaranteed, and it is difficult to meet the application requirements.
  • problems such as low registration rate, fewer login users, random filling of personal data, use of default options, and sharing of computers by multiple people.
  • the research on the user's weblog is mainly based on the study of the user's web log writing habits and the use of language habits to predict the user's gender and age and other user attributes.
  • the method adopted is mainly based on text classification method.
  • the research on the user's search content mainly analyzes the relationship between the user's search content and the user's basic attributes to achieve the purpose of predicting the user's basic attributes.
  • the methods adopted are generally statistical analysis and association rule analysis.
  • the method of obtaining user attributes in the technology is not applicable to the prediction and analysis of user attributes in the mobile terminal.
  • the reason is: on the one hand, unlike the computer, the operation of the user in the mobile terminal is mainly not reflected in the web log and the search content, therefore, the web log and the search content are not representative; on the other hand, in the mobile terminal due to the user
  • the various usage information is usually kept secret, making it difficult to obtain the corresponding information for prediction. Therefore, there is currently no means for predicting user attributes in mobile terminals.
  • an object of the embodiments of the present invention is to provide a user attribute prediction method and apparatus, which can accurately predict user attributes of a mobile terminal user.
  • the application installed by the target user is obtained, and the application installed by the target user is input into a prediction model of the predicted user attribute, and the user attribute prediction result of the target user is calculated.
  • the step of using the user attribute label of the sample user and the application installed by the sample user as training data further includes:
  • the user attribute tag of the sample user, the application installed by the sample user, and the weight corresponding to each application are used as training data.
  • step of obtaining statistics on the number of uses of each application further includes:
  • the number of times each application is effectively used is counted as the number of uses per application.
  • the method further includes:
  • a corresponding relationship list between the preset application and the time threshold is retrieved, and a preset time threshold corresponding to each application is obtained.
  • the step of calculating the user attribute prediction result of the target user further includes:
  • the method further includes:
  • An embodiment of the present invention further provides a user attribute prediction apparatus, including:
  • a data acquisition module configured to acquire a user attribute label of the sample user and an application installed by the sample user, and send the obtained user attribute label and the application to the model training module;
  • a model training module configured to receive a user attribute tag and an application sent by the data acquisition module, and input the user attribute tag of the sample user and an application installed by the sample user as training data, and input the pre-built user attribute.
  • the training obtains a prediction model for predicting user attributes;
  • the attribute prediction module is configured to obtain an application installed by the target user, input an application installed by the target user into a prediction model of the predicted user attribute, and calculate a user attribute prediction result of the target user.
  • the model training module includes: a quantity statistics module, a weight calculation module, and a data training module;
  • the data obtaining module is further configured to send the obtained user attribute label and an application to Quantity statistics module;
  • the quantity statistics module is configured to receive a user attribute tag and an application sent by the data acquisition module, and obtain each application according to the user attribute tag of the sample user and an application program installed by the sample user.
  • the number of uses; the number of uses of each application is sent to the weight calculation module;
  • the weight calculation module is configured to receive the number of uses of each application sent by the quantity statistics module, and multiply the number of uses of each application by a preset weight coefficient, and calculate the installed value of the sample user.
  • the application corresponds to the weight of each application; the weight of each calculated application is sent to the data training module;
  • the data training module is configured to receive a weight of each application sent by the weight calculation module, a user attribute label of the sample user, an application installed by the sample user, and a weight corresponding to each application.
  • a predictive model for predicting user attributes is trained by inputting a pre-built algorithm model of user attribute prediction.
  • the quantity statistics module is further configured to: determine whether the usage time of the application installed by the sample user is greater than a preset time threshold; if yes, the use of the application is recorded as a valid use; otherwise, The use of this application is recorded as an invalid use;
  • the number of times each application is effectively used is counted as the number of uses per application.
  • model training module further includes a time threshold search module
  • the data acquisition module is further configured to send the acquired application to the time threshold search module;
  • the time threshold search module is configured to receive an application sent by the data acquisition module, and retrieve a correspondence list between the preset application and the time threshold according to the type of each application, to obtain a preset corresponding to each application. Setting a time threshold, and sending a preset time threshold corresponding to each application to the quantity statistics module;
  • the quantity statistics module is further configured to receive a preset time threshold corresponding to each application sent by the time threshold search module.
  • the attribute prediction module includes an application acquisition module, a probability prediction module, and a result output module;
  • the application obtaining module is configured to acquire an application in a target user's mobile terminal, and Sent to the probability prediction module;
  • the probability prediction module is configured to receive an application in a mobile terminal of a target user sent by the application acquiring module, and input an application in the mobile terminal of the target user into a prediction model for predicting user attributes, and calculate The predicted probability value of the different attribute categories in the user attribute of the target user; the predicted probability values of the calculated different attribute categories are sent to the result output module;
  • the result output module is configured to receive a prediction probability value of different attribute categories sent by the probability prediction module, select an attribute category with a maximum predicted probability value, and determine whether the predicted probability value of the attribute category is greater than a preset probability threshold. If yes, the attribute category is used as a prediction result; otherwise, all attribute categories in the user attribute and corresponding predicted probability values are used as prediction results.
  • the attribute prediction module further includes a probability threshold search module
  • the result output module is further configured to send the selected attribute category with the largest predicted probability value to the probability threshold search module;
  • the probability threshold value searching module is configured to receive an attribute category with a maximum predicted probability value sent by the result output module, and search for a relationship list corresponding to the preset attribute category and the probability threshold, and obtain a pre-correspondence corresponding to the attribute category with the largest predicted probability value. Setting a probability threshold, and sending the preset probability threshold to the result output module;
  • the result output module is further configured to receive a preset probability threshold sent by the probability threshold search module.
  • An embodiment of the present invention further provides an electronic device, including:
  • At least one processor At least one processor
  • the memory stores program instructions executable by the at least one processor, the at least one processor invoking the program instructions to perform any of the user attribute prediction methods described above.
  • Embodiments of the present invention also provide a computer program product comprising a computer program stored on a non-transitory computer readable storage medium, the computer program comprising program instructions, when the program instructions are executed by a computer
  • the computer is caused to perform the user attribute prediction method described in any of the above.
  • Embodiments of the present invention also provide a non-transitory computer readable storage medium storing computer instructions that cause the computer to perform any of the user attributes described above method of prediction.
  • the user attribute prediction method and apparatus acquires the user attribute label of the known sample user and the type of the application installed in the sample user mobile terminal, and then utilizes the The user attribute tag and the type of the installed application are used as training data to train a prediction model capable of predicting the user attribute. Finally, the type of the application installed in the mobile terminal of the target user is input into the prediction model, and the prediction model can be predicted. User attribute of the target user. Therefore, the user attribute prediction method and apparatus can accurately predict user attributes of mobile terminal users.
  • FIG. 1 is a schematic flowchart diagram of an embodiment of a method for predicting user attributes provided by the present invention
  • FIG. 2 is a schematic flowchart diagram of another embodiment of a method for predicting user attributes provided by the present invention.
  • FIG. 3 is a schematic structural diagram of an embodiment of a user attribute prediction apparatus provided by the present invention.
  • FIG. 4 is a schematic structural diagram of another embodiment of a user attribute prediction apparatus according to the present invention.
  • FIG. 1 is a schematic flowchart diagram of an embodiment of a method for predicting user attributes provided by the present invention.
  • the user attribute prediction method includes:
  • Step 101 Obtain a user attribute label of the sample user and an application installed by the sample user;
  • the user attribute label refers to a label of an expression user attribute or a specific attribute category indicating a user attribute. For example, if the user attribute is gender, the user attribute label is male or female; if the user attribute is age, the user is The attribute label is the age range of the specific age or certain rules (under 20 years old, 20 to 30 years old, 30 to 40 years old, 40 years old and above, etc.).
  • the user attributes may include basic information such as gender, age, marital status, nationality, income status, geographic location, education level (education), religious belief, and the like.
  • the installed application described herein can refer to an application installed by a user on a mobile terminal, or an application installed by a sample user on multiple mobile terminals based on the same user account.
  • the mobile terminal may include various types of smart mobile devices such as a mobile phone and a tablet.
  • the user attribute tags and applications obtained in this step are usually pointers to a large number of different sample users of known user attributes, and respectively acquire the applications installed by the plurality of different sample users.
  • the application may also be pre-selected.
  • An application type that has a user attribute preference. For example, if the user attribute is gender, then the gender-oriented application is pre-screened as the data to be used, and other non-sex-oriented applications (including the application as the training data and the target user) can Ignoring, in this way, not only can the accuracy of the prediction be further improved, but also the speed and efficiency of the prediction of the user attribute can be improved.
  • Step 102 The user attribute tag of the sample user and the application installed by the sample user are used as training data, and input into a pre-built algorithm model of user attribute prediction, and a prediction model for predicting user attributes is trained.
  • the training data may further include: a training parameter and a test parameter, wherein the training parameter is used to train and construct a prediction model, and the test parameter is used to test the prediction model.
  • the algorithm model may include:
  • the naive Bayesian model classification algorithm model the principle is: for the given item to be classified, the probability of occurrence of each category under the condition of occurrence of this item, which is the largest, is considered to belong to which category. Generally speaking, it is like this. You see a black man on the street. I ask you, guess where this buddy came from, and you guess Africa in all likelihood. why? Because blacks have the highest ratio of Africans, of course, people may also be Americans or Asians, but without other available information, we will choose the category with the highest conditional probability. This is the ideological basis of Na ⁇ ve Bayes.
  • Logistic Regression (LR) model the principle is: only on the basis of linear regression, a logic function is applied, but because of this logic function, the logistic regression model has become a dazzling star in the field of machine learning. It is the core of computing advertising.
  • C4.5 is a series of algorithms used in the classification problem of machine learning and data mining. Its goal is to supervise learning: Given a data set, each of these tuples can be described by a set of attribute values, each of which belongs to a class in a mutually exclusive category. The goal of C4.5 is to find a mapping from attribute values to categories by learning. Relationships, and this mapping can be used to classify entities with unknown new categories.
  • Support vector machine is a classification algorithm, which seeks to improve the generalization ability of learning machine by seeking the minimum structural risk, and realize the minimum of empirical risk and confidence range. In order to achieve a good statistical rule in the case of a small sample size. Generally speaking, it is a two-class classification model. The basic model is defined as the linear classifier with the largest interval in the feature space. That is, the learning strategy of the support vector machine is to maximize the interval and finally transform into a convex quadratic. Solving the problem of planning.
  • Random forest model the principle is: random forest is a multi-functional machine learning algorithm that can perform the tasks of regression and classification. At the same time, it is also a data dimension reduction method for dealing with missing values, outliers and other important steps in data exploration, and has achieved good results. In addition, it serves as an important method in integrated learning, and is used to integrate several inefficient models into a highly efficient model.
  • Adaboost is an iterative algorithm, the core idea is to train different classifiers (weak classifiers) for the same training set, and then combine these weak classifiers. Form a stronger final classifier (strong classifier).
  • Step 103 Acquire an application installed by the target user, input an application installed by the target user into a prediction model of the predicted user attribute, and calculate a user attribute prediction result of the target user.
  • the prediction of the attribute user can be started.
  • all the applications installed by the target user need to be acquired first, and then the acquired application is substituted into the prediction model to obtain the user attribute of the target user.
  • forecast result For example, if the user attribute refers to gender, then it can be predicted whether the target user is male or female.
  • the application obtained here can be only some of the applications installed by the target user, and the more comprehensive the acquired application, the more accurate the prediction result.
  • the installation described here means that the target user installs the application and uses the application.
  • the user attribute prediction method obtained by the embodiment of the present invention obtains a user attribute tag of a large number of known sample users and a type of an application installed in the sample user mobile terminal, and then utilizes the user.
  • the attribute tag and the type of the installed application are used as training data to train a prediction model capable of predicting user attributes.
  • the user attribute of the target user is predicted.
  • the user attribute prediction method is capable of accurately predicting user attributes of the target user based on an application installed by the sample user.
  • FIG. 2 it is a schematic flowchart of another embodiment of a method for predicting user attributes provided by the present invention.
  • the user attribute prediction method includes:
  • Step 201 Obtain a user attribute label of the sample user and an application installed by the sample user;
  • Step 202 retrieve a correspondence list between the preset application and the time threshold according to the type of each application, and obtain a preset time threshold corresponding to each application.
  • the type of the application refers to a specific category of the application, such as WeChat, QQ, Tencent News, Alipay, and the like.
  • the correspondence list of the application and the time threshold refers to a pre-built list or calculation formula for setting a time threshold for each application, so that different applications correspond to the nature of the application.
  • the threshold value is convenient for improving the accuracy and reliability of the subsequent effective use of the application.
  • Step 203 it is determined whether the application time of the application installed by the sample user is greater than a preset time threshold; if yes, step 204 is performed; otherwise, step 205 is performed;
  • the use of the sample user's application is effectively used, so that the number of invalid uses can be eliminated, thereby improving the accuracy of the usage times, and finally improving the user attribute prediction.
  • the accuracy For example, some applications are used because of the multiple use of the mobile terminal due to frequent network disconnection. Or, the use of some applications is only because the user promotes the installation, but it is uninstalled after a short time.
  • Step 204 According to step 203, if the usage time of the application installed by the sample user is greater than a preset time threshold, indicating that the usage is valid, the use of the application is recorded as a valid use; It can be known from step 202 that different application programs may correspond to different time thresholds, so when determining whether the usage time is greater than a preset time threshold, You also need to first determine the type of application.
  • Step 205 according to step 203, if the application time of the application installed by the sample user is not greater than the preset time threshold, indicating that the use is invalid use, the use of the application is recorded as an invalid use;
  • Step 206 Statistics are obtained as the number of times each application is effectively used, as the number of uses of each application;
  • the number of uses in the fixed time length interval may be set, for example, the number of times the application is used in a certain month is used as a statistical usage number. Further, it may be set.
  • the maximum number of times per cycle in the length of time for example, the number of uses per day can not exceed 3, which can avoid some sample users like to use an application repeatedly in a short time, resulting in interference with the number of uses.
  • Step 207 multiplying the number of uses of each application by a preset weight coefficient, and calculating a weight corresponding to each application of the application installed by the sample user;
  • the preset weight coefficient refers to a preset coefficient value for converting the number of times into a weight value, and the same weight coefficient may be set for different applications, or may be different according to different applications. Type, set different weight coefficients. In this way, the number of uses of the application is converted into a weight and will also be used as training data, which can improve the accuracy of user attribute prediction.
  • Step 208 The user attribute tag of the sample user, the application installed by the sample user, and the weight corresponding to each application are used as training data, and input into a pre-built algorithm model of user attribute prediction, and the predicted user is trained. a predictive model of the attribute;
  • the weight value of each application based on the number of uses is calculated by step 207, and the weight value of each application is used together with the application itself as training data, so that the accuracy of the prediction model prediction obtained by the training can be greatly improved. For example, different sample users can completely distinguish the different natures of different sample users even if the installed applications are exactly the same, so that the application installed by the target user and the use of each application can be obtained. The number of times, which can more accurately predict the user attribute of the target user. Weight Generally, the more the number of uses, the greater the weight value.
  • Step 209 Acquire an application installed by the target user, input an application installed by the target user into a prediction model of the predicted user attribute, and calculate a user attribute prediction probability value of the target user.
  • the result of the prediction model calculation of the predicted user attribute may be either a direct prediction result of the user attribute or a predicted probability value of the different attribute category.
  • Step 210 Select an attribute category with the largest predicted probability value, and search for a relationship list corresponding to the preset attribute category and the probability threshold, and obtain a preset probability threshold corresponding to the attribute category with the largest predicted probability value;
  • the embodiment of the present invention sets a corresponding probability threshold for different attribute categories, thereby further improving the prediction accuracy of the user attribute.
  • Step 211 it is determined whether the predicted probability value of the attribute category is greater than a preset probability threshold, and if so, step 212 is performed; otherwise, step 213 is performed;
  • Step 212 According to step 211, if the predicted probability value of the attribute category is greater than the preset probability threshold, indicating that the accuracy of the prediction reaches a preset criterion, the attribute category may be directly used as a prediction result; for example: If the predicted probability value of the target user is male is 95%, and the set probability threshold is 80%, the current target user can be basically predicted to be a male user.
  • Step 213 according to step 211, if the predicted probability value of the attribute category is not greater than the preset probability threshold, indicating that the accuracy of the prediction does not reach the preset standard, and the forecasting result is more clear to the forecaster in the future, and the user is All attribute categories in the attribute and the corresponding predicted probability values are used as prediction results and sent to the forecaster or displayed.
  • the user attribute prediction method improves the accuracy of the target user prediction by converting the number of times the sample user uses the application program into the weight of the application program and using the training data as the prediction model. At the same time, it also reflects the difference between different target users; through the preset time threshold, the effective use times are filtered out, thereby improving the stability of the statistics of the application usage times; and further aiming at different applications.
  • the type sets different preset time thresholds, which enables more accurate statistics of the number of applications for different properties, further improves the accuracy and reliability of user attribute prediction; and improves the prediction result by a preset prediction probability threshold. Accuracy, further by setting different prediction probability thresholds for different attribute categories, can reduce the difference between different attribute categories, making the judgment result more accurate and reliable.
  • the method for predicting user attributes may include step 201, step 206, step 207, and step 208. Specifically:
  • the user attribute tag of the sample user, the application installed by the sample user, and the weight corresponding to each application are used as training data.
  • the accuracy of predicting user attributes is improved by converting the number of times the application is used to the weight of the application.
  • the method for predicting user attributes may include step 201, step 203, step 204, step 205, step 206, step 207, and step 208. Specifically:
  • the user attribute tag of the sample user, the application installed by the sample user, and the weight corresponding to each application are used as training data.
  • the method for predicting user attributes may further include step 201, step 202, step 203, step 204, step 205, step 206, step 207, and step 208.
  • step 201 may further include step 201, step 202, step 203, step 204, step 205, step 206, step 207, and step 208.
  • the user attribute tag of the sample user, the application installed by the sample user, and the weight corresponding to each application are used as training data.
  • the method for predicting user attributes may include step 101, step 102, step 209, step 211, step 212, and step 213. Specifically:
  • the accuracy of the prediction result can be further improved, and at the same time, the predicted probability value can be displayed when the prediction result is inaccurate.
  • the method for predicting user attributes may include step 101, step 102, step 209, step 210, step 211, step 212, and step 213. Specifically:
  • the user attribute is a gender attribute
  • the user attribute prediction method is:
  • the training module predicts the user's prediction module for men and women;
  • Obtaining the application installed by the target user, and then inputting the application installed by the target user into the prediction model, can predict the gender (either male or female) of the current target user.
  • the information that is easily acquired by the target user of the mobile terminal, that is, the application can predict the gender of the target user, and then can implement a targeted service plan for the gender of the target user, thereby achieving differentiated management of the target user.
  • an embodiment of the present invention further provides a user attribute prediction apparatus.
  • FIG. 3 it is a schematic structural diagram of an embodiment of a user attribute prediction apparatus provided by the present invention.
  • the user attribute prediction apparatus includes:
  • the data acquisition module 301 is configured to acquire a user attribute tag of the sample user and an application program installed by the sample user, and send the obtained user attribute tag and the application program to the model training module 302;
  • the model training module 302 is configured to receive the user attribute tag and the application sent by the data obtaining module 301, and input the user attribute tag of the sample user and the application installed by the sample user as training data into the pre-built In the algorithm model of user attribute prediction, the training obtains a prediction model for predicting user attributes;
  • the attribute prediction module 303 is configured to acquire an application installed by the target user, input an application installed by the target user into a prediction model of the predicted user attribute, and calculate a user attribute prediction result of the target user.
  • the user attribute prediction apparatus acquires a user attribute tag of a user of a known attribute sample and an application installed by the sample user by using the data acquisition module 301, and the model training module 302 passes the known User properties and application training According to the training, a prediction model for predicting user attributes is obtained, and the attribute prediction module 303 predicts the user attribute prediction result of the target user by inputting the application installed by the target user into the prediction module.
  • the user attribute predicting device can accurately predict the user attribute of the current target user through the application program installed by the current sample user, and overcome the defect that the existing equipment intelligence obtains the user attribute through the input of the user, thereby realizing the differentiated management of the user. .
  • FIG. 4 it is a schematic structural diagram of another embodiment of a user attribute prediction apparatus provided by the present invention.
  • the model training module 302 includes: a quantity statistics module 3022, a weight calculation module 3023, and a data training module 3024;
  • the data acquisition module 301 is further configured to send the obtained user attribute tag and application to the quantity statistics module 3022;
  • the quantity statistic module 3022 is configured to receive the user attribute label and the application program sent by the data obtaining module 301, and obtain statistics according to the user attribute label of the sample user and the application program installed by the sample user. The number of times the application is used; the number of uses of each application is sent to the weight calculation module 3023;
  • the weight calculation module 3023 is configured to receive the number of uses of each application sent by the quantity statistics module 3022, and multiply the number of uses of each application by a preset weight coefficient, and calculate the sample user
  • the installed application corresponds to the weight of each application; the calculated weight of each application is sent to the data training module 3024;
  • the data training module 3024 is configured to receive a weight of each application sent by the weight calculation module 3023, a user attribute label of the sample user, an application installed by the sample user, and a corresponding application.
  • the weight is used as training data, input into the algorithm model of the pre-built user attribute prediction, and the training model is predicted to predict the user attribute.
  • the model training module 302 obtains the number of uses of the application by the quantity statistics module 3022, and calculates the weight of the application based on the number of uses by the weight calculation module 3023, and then applies the application through the data training module 3024.
  • the weight of the program also serves as training data, which improves the accuracy of the prediction of the user attributes.
  • the quantity statistic module 3022 is further configured to: determine whether the usage time of the application installed by the sample user is greater than a preset time threshold; If so, the use of the application is recorded as a valid use; otherwise, the use of the application is recorded as an invalid use; the number of times each application is effectively used is counted as the number of uses per application. In this way, the quantity statistics module 3022 compares the usage time of the application with the preset time threshold, thereby screening out the effective use times of the application, and further improving the accuracy of the user attribute prediction.
  • the model training module 302 further includes a time threshold search module 3021;
  • the data acquisition module 301 is further configured to send the acquired application to the time threshold search module 3021;
  • the time threshold search module 3021 is configured to receive an application sent by the data obtaining module 301, and retrieve a correspondence list between the preset application and the time threshold according to the type of each application, to obtain a corresponding correspondence of each application. a preset time threshold, the preset time threshold corresponding to each application is sent to the quantity statistics module 3022;
  • the quantity statistics module 3022 is further configured to receive a preset time threshold corresponding to each application sent by the time threshold search module 3021.
  • the model training module 302 searches the preset relationship list of the preset application and the time threshold by using the time threshold searching module 3021, and obtains a preset time threshold corresponding to each application, so that it can be implemented for different applications. Different criteria for judging further reduce the differences between application types and thus improve the accuracy of predicting user attributes.
  • the attribute prediction module 303 includes an application obtaining module 3031, a probability prediction module 3032, and a result output module 3033;
  • the application obtaining module 3031 is configured to acquire an application in the mobile terminal of the target user, and send the result to the probability prediction module 3032.
  • the probability prediction module 3032 is configured to receive an application in the mobile terminal of the target user sent by the application obtaining module 3031, and input an application in the mobile terminal of the target user into a prediction model for predicting user attributes, Calculating the predicted probability value of the different attribute categories in the user attribute of the target user; sending the calculated predicted probability values of the different attribute categories to the result output module 3033;
  • the result output module 3033 is configured to receive the predicted probability value of the different attribute categories sent by the probability prediction module 3032, select an attribute category with the largest predicted probability value, and determine whether the predicted probability value of the attribute category is greater than a preset probability. The threshold, if yes, the attribute category is used as a prediction result; otherwise, all attribute categories in the user attribute and corresponding predicted probability values are used as prediction results.
  • the attribute prediction module 303 predicts the predicted probability value of the different attribute categories of the target user by using the probability prediction module 3032, and determines, by the result output module 3033, whether the predicted probability value is greater than a preset probability threshold, and further adjusts the output result. In this way, the prediction result of the user attribute prediction apparatus is made more reliable.
  • the attribute prediction module 303 further includes a probability threshold value finding module 3034;
  • the result output module 3033 is further configured to send the selected attribute category with the largest predicted probability value to the probability threshold search module 3034;
  • the probability threshold value searching module 3034 is configured to receive an attribute category with the highest predicted probability value sent by the result output module 3033, and search for a relationship list corresponding to the preset attribute category and the probability threshold, and obtain an attribute category with the largest predicted probability value.
  • the preset probability threshold, the preset probability threshold is sent to the result output module 3033;
  • the result output module 3033 is further configured to receive a preset probability threshold sent by the probability threshold search module.
  • the attribute prediction module 303 searches the relationship list corresponding to the probability threshold by using the probability threshold search module 3034 to obtain a preset probability threshold corresponding to the attribute category with the largest predicted probability value, so that the attribute prediction is performed.
  • the module 303 can make corresponding result judgments according to the respective characteristics of different attribute categories, thereby further improving the accuracy and reliability of the user attribute prediction.
  • an electronic device is provided, and an embodiment of the electronic device includes:
  • One or more processors optionally, the one or more processors for performing the steps defined in the method of any one or more of the above embodiments;
  • a memory for storing operational instructions
  • the one or more processors are configured to retrieve an operational instruction from the memory and execute:
  • the application installed by the target user is obtained, and the application installed by the target user is input into a prediction model of the predicted user attribute, and the user attribute prediction result of the target user is calculated.
  • the processor is further configured to:
  • the user attribute tag of the sample user, the application installed by the sample user, and the weight corresponding to each application are used as training data.
  • the processor is further configured to:
  • the number of times each application is effectively used is counted as the number of uses per application.
  • the processor is further configured to: retrieve, according to the type of each application, a preset relationship list between the preset application and the time threshold, to obtain a preset time threshold corresponding to each application.
  • the processor is further configured to:
  • the processor is further configured to:
  • this embodiment discloses a computer program product comprising a computer program stored on a non-transitory computer readable storage medium, the computer program comprising program instructions, when the program instructions are When executed, the computer can perform the methods provided by the foregoing method embodiments, including, for example:
  • the embodiment provides a non-transitory computer readable storage medium, the non-transitory computer readable storage medium storing computer instructions, the computer instructions causing the computer to perform the methods provided by the foregoing method embodiments, including, for example, :
  • the apparatus described in the present disclosure may be various electronic terminal devices such as mobile phones, personal digital assistants (PDAs), tablet computers (PADs), tablet computers (PADs), smart televisions, etc., and thus the protection of the present disclosure
  • PDAs personal digital assistants
  • PADs tablet computers
  • PADs tablet computers
  • smart televisions etc.
  • the scope should not be limited to a particular type of device.
  • the method according to the present disclosure may also be implemented as a computer program executed by a CPU,
  • the computer program can be stored in a computer readable storage medium.
  • the above-described functions defined in the method of the present disclosure are performed when the computer program is executed by the CPU.
  • the method steps and system units described above may also be implemented with a controller and a computer readable storage medium for storing a computer program that causes the controller to implement the steps or unit functions described above.
  • non-volatile memory may include read only memory (ROM), programmable ROM (PROM), electrically programmable ROM (EPROM), electrically erasable programmable ROM (EEPROM), or flash.
  • ROM read only memory
  • PROM programmable ROM
  • EPROM electrically programmable ROM
  • EEPROM electrically erasable programmable ROM
  • flash flash.
  • Volatile memory can include random access memory (RAM), which can act as external cache memory.
  • RAM can be obtained in a variety of forms, such as synchronous RAM (DRAM), dynamic RAM (DRAM), synchronous DRAM (SDRAM), double data rate SDRAM (DDR SDRAM), enhanced SDRAM (ESDRAM), Synchronous Link DRAM (SLDRAM) and direct Rambus RAM (DRRAM).
  • DRAM synchronous RAM
  • DRAM dynamic RAM
  • SDRAM synchronous DRAM
  • DDR SDRAM double data rate SDRAM
  • ESDRAM enhanced SDRAM
  • SLDRAM Synchronous Link DRAM
  • DRRAM direct Rambus RAM
  • Storage devices of the disclosed aspects are intended to comprise, without being limited to, these and other suitable types of memory.
  • DSPs digital signal processors
  • ASIC dedicated An integrated circuit
  • FPGA field programmable gate array
  • a general purpose processor may be a microprocessor, but in the alternative, the processor may be any conventional processor, controller, microcontroller, or state machine.
  • the processor can also be implemented as a combination of computing devices, such as a combination of a DSP and a microprocessor, a plurality of microprocessors, one or Multiple microprocessors incorporate a DSP core, or any other such configuration.
  • a software module may reside in RAM memory, flash memory, ROM memory, EPROM memory, EEPROM memory, registers, hard disk, a removable disk, a CD-ROM, or any other form of storage medium known in the art.
  • An exemplary storage medium is coupled to the processor, such that the processor can read information from or write information to the storage medium.
  • the storage medium can be integrated with a processor.
  • the processor and the storage medium can reside in an ASIC.
  • the ASIC can reside in the user terminal.
  • the processor and the storage medium may reside as discrete components in the user terminal.
  • the functions may be implemented in hardware, software, firmware, or any combination thereof. If implemented in software, the functions may be stored on or transmitted as one or more instructions or code on a computer readable medium.
  • Computer readable media includes both computer storage media and communication media including any medium that facilitates transfer of a computer program from one location to another.
  • a storage medium may be any available media that can be accessed by a general purpose or special purpose computer.
  • the computer readable medium may comprise RAM, ROM, EEPROM, CD-ROM or other optical disk storage device, disk storage device or other magnetic storage device, or may be used to carry or store a form of instructions Or the required program code of the data structure and any other medium that can be accessed by a general purpose or special purpose computer or a general purpose or special purpose processor. Also, any connection is properly termed a computer-readable medium.
  • a coaxial cable, fiber optic cable, twisted pair, digital subscriber line (DSL), or wireless technology such as infrared, radio, and microwave is used to transmit software from a website, server, or other remote source
  • the coaxial line Cables, fiber optic cables, twisted pair, DSL, or wireless technologies such as infrared, radio, and microwave are all included in the definition of the medium.
  • a magnetic disk and an optical disk include a compact disk (CD), a laser disk, an optical disk, a digital versatile disk (DVD), a floppy disk, a Blu-ray disk, in which a disk generally reproduces data magnetically, and the optical disk optically reproduces data using a laser. . Combinations of the above should also be included within the scope of computer readable media.
  • a person skilled in the art may understand that all or part of the steps of implementing the above embodiments may be completed by hardware, or may be instructed by a program to execute related hardware, and the program may be stored in a computer readable storage medium.
  • the storage medium mentioned may be a read only memory, a magnetic disk or an optical disk or the like.

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种用户属性预测方法及装置,所述方法包括:获取样本用户属性标签以及样本用户所安装的应用程序(101);将用户属性标签以及样本用户所安装的应用程序作为训练数据,输入预先构建的算法模型中,训练得到预测用户属性的预测模型(102);获取目标用户所安装的应用程序,并输入预测用户属性的预测模型中,计算得到目标用户的用户属性预测结果(103)。所述用户属性预测方法及装置通过将已知的用户属性以及该样本用户所安装的应用程序作为训练数据,训练得到能够预测用户属性的预测模型,通过将目标用户所安装的应用程序的类型输入预测模型中,能够预测目标用户的用户属性。所述用户属性预测方法基于应用程序能够对目标用户的用户属性进行准确的预测。

Description

用户属性预测方法及装置
交叉引用
本申请引用于2016年6月20日提交的专利名称为“用户属性预测方法及装置”的第2016104477184号中国专利申请,其通过引用被全部并入本申请。
技术领域
本发明实施例涉及移动互联网技术领域,特别是指一种用户属性预测方法及装置。
背景技术
随着web2.0的到来和移动互联网的飞速发展,用户的基础属性在网络应用中扮演的角色越来越重要,例如:Google提供的个性化搜索服务是根据用户的地理位置信息和用户的搜索历史记录为用户返回个性化的搜索列表,给用户提供个性化的搜索服务。这是因为用户属性很大程度上决定了用户的意图和习惯,知晓用户属性对于满足用户的潜在需求具有重大意义。这里的用户基础属性通常是指用户的年龄、性别、收入状况、地理位置、文化程度、宗教信仰等基础属性。
现有技术中,一种最简单的方式是通过注册用户的资料填写获取得到的用户属性信息,但是这种方法的覆盖率和准确率都无法得到保证,难以达到应用需求。特别是对于用户粘性不够高的产品来说,普遍存在注册比例低、登录用户少、乱填个人资料、使用默认选项、多人共用电脑等诸多问题。还有一种用户属性获取的方法,是主要研究集中在用户的网络日志和用户的搜索内容上。对用户的网络日志的研究主要是通过研究用户网络日志的书写习惯和用语习惯预测作者的性别和年龄等用户属性,采取的方法主要是基于文本的分类方法。对用户的搜索内容研究主要是分析用户的搜索内容和用户的基础属性之间的联系,以实现对用户的基础属性预测目的,采取的方法一般是统计分析和关联规则分析。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:现 有技术中获取用户属性的方法并不适用于移动终端中用户属性的预测、分析。原因在于:一方面,与电脑不同,移动终端中用户的操作主要并不是体现在网络日志和搜索内容上,因此,网络日志和搜索内容不具有代表性;另一方面,在移动终端中由于用户的各种使用信息通常处于保密状态,导致难以获得相应的信息进行预测。因此,目前缺乏针对移动终端中用户属性预测的手段。
发明内容
有鉴于此,本发明实施例的目的在于提出一种用户属性预测方法及装置,能够对移动终端用户的用户属性进行准确的预测。
基于上述目的本发明实施例提供的一种用户属性预测方法,包括:
获取样本用户的用户属性标签以及所述样本用户所安装的应用程序;
将所述样本用户的用户属性标签以及所述样本用户所安装的应用程序作为训练数据,输入预先构建的用户属性预测的算法模型中,训练得到预测用户属性的预测模型;
获取目标用户所安装的应用程序,将所述目标用户所安装的应用程序输入预测用户属性的预测模型中,计算得到目标用户的用户属性预测结果。
可选的,所述将所述样本用户的用户属性标签以及所述样本用户所安装的应用程序作为训练数据的步骤还包括:
根据所述样本用户的用户属性标签以及所述样本用户所安装的应用程序,统计得到每个应用程序的使用次数;
将每个应用程序的使用次数与预设权重系数相乘,计算得到所述样本用户所安装的应用程序对应每个应用程序的权重;
将所述样本用户的用户属性标签、所述样本用户所安装的应用程序以及对应每个应用程序的权重作为训练数据。
进一步,所述统计得到每个应用程序的使用次数的步骤还包括:
判断所述样本用户所安装的应用程序每次的使用时间是否大于预设时间阈值;若是,则该次应用程序的使用记为一次有效使用,否则,该次应用程序的使用记为一次无效使用;
统计得到每个应用程序有效使用的次数,作为每个应用程序的使用次数。
进一步,所述判断所述样本用户所安装的应用程序每次的使用时间是否大于预设时间阈值的步骤之前还包括:
根据每个应用程序的类型,检索预设的应用程序与时间阈值的对应关系列表,得到每个应用程序对应的预设时间阈值。
可选的,所述计算得到目标用户的用户属性预测结果的步骤还包括:
根据预测用户属性的预测模型,计算得到目标用户的用户属性中不同属性类别的预测概率值;
选取预测概率值最大的属性类别,并判断所述属性类别的预测概率值是否大于预设概率阈值,若是,则将所述属性类别作为预测结果,否则,将用户属性中所有属性类别以及对应的预测概率值作为预测结果。
进一步,所述选取预测概率值最大的属性类别的步骤之后还包括:
查找预设的属性类别与概率阈值对应的关系列表,得到预测概率值最大的属性类别对应的预设概率阈值。
本发明实施例还提供了一种用户属性预测装置,包括:
数据获取模块,用于获取样本用户的用户属性标签以及所述样本用户所安装的应用程序,将获取的用户属性标签和应用程序发送给模型训练模块;
模型训练模块,用于接收所述数据获取模块发送的用户属性标签和应用程序,将所述样本用户的用户属性标签以及所述样本用户所安装的应用程序作为训练数据,输入预先构建的用户属性预测的算法模型中,训练得到预测用户属性的预测模型;
属性预测模块,用于获取目标用户所安装的应用程序,将所述目标用户所安装的应用程序输入预测用户属性的预测模型中,计算得到目标用户的用户属性预测结果。
可选的,所述模型训练模块包括:数量统计模块、权重计算模块和数据训练模块;
所述数据获取模块还用于,将获取的用户属性标签和应用程序发送给 数量统计模块;
所述数量统计模块,用于接收所述数据获取模块发送的用户属性标签和应用程序,并根据所述样本用户的用户属性标签以及所述样本用户所安装的应用程序,统计得到每个应用程序的使用次数;将得到的每个应用程序的使用次数发送给权重计算模块;
所述权重计算模块,用于接收所述数量统计模块发送的每个应用程序的使用次数,并将每个应用程序的使用次数与预设权重系数相乘,计算得到所述样本用户所安装的应用程序对应每个应用程序的权重;将计算得到的每个应用程序的权重发送给数据训练模块;
所述数据训练模块,用于接收所述权重计算模块发送的每个应用程序的权重,将所述样本用户的用户属性标签、所述样本用户所安装的应用程序以及对应每个应用程序的权重作为训练数据,输入预先构建的用户属性预测的算法模型中,训练得到预测用户属性的预测模型。
进一步,所述数量统计模块还用于,判断所述样本用户所安装的应用程序每次的使用时间是否大于预设时间阈值;若是,则该次应用程序的使用记为一次有效使用,否则,该次应用程序的使用记为一次无效使用;
统计得到每个应用程序有效使用的次数,作为每个应用程序的使用次数。
进一步,所述模型训练模块还包括时间阈值查找模块;
所述数据获取模块还用于,将获取的应用程序发送给所述时间阈值查找模块;
所述时间阈值查找模块,用于接收所述数据获取模块发送的应用程序,根据每个应用程序的类型,检索预设的应用程序与时间阈值的对应关系列表,得到每个应用程序对应的预设时间阈值,将每个应用程序对应的预设时间阈值发送给所述数量统计模块;
所述数量统计模块还用于,接收所述时间阈值查找模块发送的每个应用程序对应的预设时间阈值。
可选的,所述属性预测模块包括应用获取模块、概率预测模块和结果输出模块;
所述应用获取模块,用于获取目标用户的移动终端中的应用程序,并 发送到概率预测模块中;
所述概率预测模块,用于接收所述应用获取模块发送的目标用户的移动终端中的应用程序,并将所述目标用户的移动终端中的应用程序输入预测用户属性的预测模型中,计算得到目标用户的用户属性中不同属性类别的预测概率值;将计算得到的不同属性类别的预测概率值发送给结果输出模块;
所述结果输出模块,用于接收所述概率预测模块发送的不同属性类别的预测概率值,选取预测概率值最大的属性类别,并判断所述属性类别的预测概率值是否大于预设概率阈值,若是,则将所述属性类别作为预测结果,否则,将用户属性中所有属性类别以及对应的预测概率值作为预测结果。
进一步,所述属性预测模块还包括概率阈值查找模块;
所述结果输出模块还用于,将选取出的预测概率值最大的属性类别发送给概率阈值查找模块;
所述概率阈值查找模块,用于接收所述结果输出模块发送的预测概率值最大的属性类别,查找预设的属性类别与概率阈值对应的关系列表,得到预测概率值最大的属性类别对应的预设概率阈值,将所述预设概率阈值发送给结果输出模块;
所述结果输出模块还用于,接收所述概率阈值查找模块发送的预设概率阈值。
本发明实施例还提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的程序指令,所述至少一个处理器调用所述程序指令能够执行上述任意一种所述的用户属性预测方法。
本发明实施例还提供了一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述任意一种所述的用户属性预测方法。
本发明实施例还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述任意一种所述的用户属性预测方法。
从上面所述可以看出,本发明实施例提供的用户属性预测方法及装置,通过获取已知样本用户的用户属性标签以及该样本用户移动终端中所安装的应用程序的类型,然后利用所述用户属性标签和所安装的应用程序的类型作为训练数据,训练得到能够预测用户属性的预测模型,最后,将目标用户的移动终端中所安装的应用程序的类型输入预测模型中,就能够预测得到目标用户的用户属性。因此,所述用户属性预测方法及装置能够对移动终端用户的用户属性进行准确的预测。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
为了更清楚地说明本公开的实施例,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的用户属性预测方法的一个实施例的流程示意图;
图2为本发明提供的用户属性预测方法的另一个实施例的流程示意图;
图3为本发明提供的用户属性预测装置的一个实施例的结构示意图;
图4为本发明提供的用户属性预测装置的另一个实施例的结构示意图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实 施例,并参照附图,对本发明进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
面对飞速发展的移动终端领域,获取移动终端中用户的用户属性变得越来越重要。然而,基于移动终端的特点以及用户对于移动终端数据安全的要求,目前常规获取用户属性的方法完全不适用于移动终端中。本发明针对这一问题,提出了一种用户属性预测方法,能够实现移动终端中用户属性的预测、分析。参照图1所示,为本发明提供的用户属性预测方法的一个实施例的流程示意图。
所述用户属性预测方法包括:
步骤101,获取样本用户的用户属性标签以及所述样本用户所安装的应用程序;
为了预测目标用户的用户属性,首先必须获得一些已知用户属性的用户数据,本发明基于移动终端的使用特点,发现在移动终端中使用最为频繁且具有代表性的事件就是关于各类应用程序的使用,因此,本发明将样本用户的移动终端中所安装的应用程序的类型作为预测用户属性的关键数据。所述用户属性标签是指表情用户属性的标签或者是指明用户属性的具体属性类别,例如:用户属性为性别,则所述用户属性标签为男或者女;若用户属性为年龄,则所述用户属性标签为具体的年龄或者一定规则划分的年龄段(20岁以下、20岁到30岁、30岁到40岁、40岁以上等等)。具体的,所述用户属性可以包括:性别、年龄、婚否、国籍、收入状况、地理位置、文化程度(学历)、宗教信仰等等基本信息。这里所述的所安装的应用程序既可以是指用户在一个移动终端上安装的应用程序,也可以是样本用户基于同一个用户账号在多个移动终端上所安装的应用程序。所述移动终端可以包括:手机、平板等各类智能移动设备。本步骤中所述获取的用户属性标签及应用程序,通常是指针对于已知用户属性的大量不同样本用户,分别获取所述大量不同样本用户对应所安装的应用程序。
可选的,在本发明另一些实施例中,所述应用程序还可以是预先选定 的具有用户属性倾向的应用程序类型。例如:所述用户属性是性别,那么预先筛选出具有性别倾向的应用程序作为需要使用的数据,而其他不具有性别倾向的应用程序(包括作为训练数据的应用程序以及目标用户的应用程序)可以忽略,这样,不仅可以进一步提高预测的准确性,而且可以提高所述用户属性预测的速度和效率。
步骤102,将所述样本用户的用户属性标签以及所述样本用户所安装的应用程序作为训练数据,输入预先构建的用户属性预测的算法模型中,训练得到预测用户属性的预测模型;
为了预测未知用户属性的目标用户的用户属性,需要构建一个预测模型,基于本发明实施例中所述的方案是基于用户属性分类性质的判定,因此,本发明实施例中选用具有分类功能的算法模型进行训练,进而得到预测模型。输入时,需要将每个样本用户的用户属性标签与样本用户对应安装的应用程序相互对应起来,使其具有关联性。可选的,所述训练数据还可以包括:训练参数和测试参数,其中,所述训练参数用于训练并且构建预测模型,所述测试参数用于对所述预测模型进行测试。可选的,所述算法模型可以包括:
(1)朴素贝叶斯模分类算法模型,原理在于:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。通俗来说,就好比这么个道理,你在街上看到一个黑人,我问你你猜这哥们哪里来的,你十有八九猜非洲。为什么呢?因为黑人中非洲人的比率最高,当然人家也可能是美洲人或亚洲人,但在没有其它可用信息下,我们会选择条件概率最大的类别,这就是朴素贝叶斯的思想基础。
(2)逻辑回归(LR)模型,原理在于:仅在线性回归的基础上,套用了一个逻辑函数,但也就由于这个逻辑函数,使得逻辑回归模型成为了机器学习领域一颗耀眼的明星,更是计算广告学的核心。
(3)c4.5决策树模型,原理在于:C4.5是一系列用在机器学习和数据挖掘的分类问题中的算法。它的目标是监督学习:给定一个数据集,其中的每一个元组都能用一组属性值来描述,每一个元组属于一个互斥的类别中的某一类。C4.5的目标是通过学习,找到一个从属性值到类别的映射 关系,并且这个映射能用于对新的类别未知的实体进行分类。
(4)支持向量机模型(SVM),原理在于:支持向量机(support vector machine)是一种分类算法,通过寻求结构化风险最小来提高学习机泛化能力,实现经验风险和置信范围的最小化,从而达到在统计样本量较少的情况下,亦能获得良好统计规律的目的。通俗来讲,它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,即支持向量机的学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。
(5)随机森林模型,原理在于:随机森林是一种多功能的机器学习算法,能够执行回归和分类的任务。同时,它也是一种数据降维手段,用于处理缺失值、异常值以及其他数据探索中的重要步骤,并取得了不错的成效。另外,它还担任了集成学习中的重要方法,在将几个低效模型整合为一个高效模型时大显身手。
(6)集成分类器模型(Adaboost),原理在于:Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。
步骤103,获取目标用户所安装的应用程序,将所述目标用户所安装的应用程序输入预测用户属性的预测模型中,计算得到目标用户的用户属性预测结果。
当预测模型已经构建完成以后,可以开始进行属性用户的预测,此时,需要先获取目标用户所安装的所有应用程序,然后将获取的应用程序代入预测模型中就能够得到目标用户的用户属性的预测结果。例如:若用户属性是指性别,那么就可以预测得到目标用户是男还是女。当然,这里获取的应用程序可以只是该目标用户所安装的部分应用程序,而获取的应用程序越全面,那么预测结果越准确。同时,这里所述的安装是指目标用户安装该应用程序,并且使用了该应用程序。
由上述实施例可知,本发明实施例提供的所述用户属性预测方法,通过获取大量已知样本用户的用户属性标签以及该样本用户移动终端中所安装的应用程序的类型,然后利用所述用户属性标签和所安装的应用程序的类型作为训练数据,训练得到能够预测用户属性的预测模型,最后,将目标用户的移动终端中所安装的应用程序的类型输入预测模型中,就能够 预测得到目标用户的用户属性。所述用户属性预测方法基于样本用户所安装的应用程序能够对所述目标用户的用户属性进行准确的预测。
参照图2所示,为本发明提供的用户属性预测方法的另一个实施例的流程示意图。
所述用户属性预测方法包括:
步骤201,获取样本用户的用户属性标签以及所述样本用户所安装的应用程序;
步骤202,根据每个应用程序的类型,检索预设的应用程序与时间阈值的对应关系列表,得到每个应用程序对应的预设时间阈值。其中,所述应用程序的类型是指应用程序的具体类别,例如微信、QQ、腾讯新闻、支付宝等等。所述应用程序与时间阈值的对应关系列表是指预先构建的一个用于给每个应用程序设定一个时间阈值的列表或计算公式,使得不同的应用程序与所述应用程序的性质对应的时间阈值,便于提高后续判断应用程序的有效使用次数的准确性和可靠性。这是应为针对于不同的应用程序,用户对所述应用程序使用的时间以及周期差别较大,有的应用程序的生命周期可能只是几个小时,而有的则可能是用户终身使用,所以若是采用同一个时间阈值判断,则会给使用次数的判断带来不准确性。
步骤203,判断所述样本用户所安装的应用程序每次的使用时间是否大于预设时间阈值;若是,则执行步骤204,否则,执行步骤205;
通过判断使用时间是否大于预设的时间阈值,使得所述样本用户的应用程序的使用均为有效使用,这样能够剔除一些无效使用的次数,进而提高使用次数的准确性,最后提高了用户属性预测的准确性。例如:有一些应用程序的使用是由于移动终端频繁断网导致的多次使用的记录。或者,某些应用程序的使用只是由于广告推广而使得用户安装,但是短时间后又卸载了的情形。
步骤204,根据步骤203,若所述样本用户所安装的应用程序每次的使用时间大于预设时间阈值,表示该次使用为有效使用,则将该次应用程序的使用记为一次有效使用;由步骤202可知,不同的应用程序可能对应了不同的时间阈值,所以在判断使用时间是否大于预设的时间阈值的时候 也需要首先确定应用程序的类型。
步骤205,根据步骤203,若所述样本用户所安装的应用程序每次的使用时间不大于预设时间阈值,表示该次使用为无效使用,则该次应用程序的使用记为一次无效使用;
步骤206,统计得到每个应用程序有效使用的次数,作为每个应用程序的使用次数;
只有经过筛选判断后的有效使用的次数统计,才能够作为后续应用程序的使用次数。可选的,在统计应用程序的使用次数时,既可以设定在固定时间长度区间内的使用次数,例如,将某个月份内应用程序的使用次数作为统计的使用次数,进一步,还可以设定该时间长度内每个周期的次数上限,例如:每天的使用次数不能超过3次,这样能够避免一些样本用户喜欢在短时间内反复使用某一款应用程序,从而导致使用次数的干扰。还可以设定所述应用程序的使用次数为最近某个时间长度区间的使用次数,例如最近一个月的使用次数作为应用程序的使用次数。
步骤207,将每个应用程序的使用次数与预设权重系数相乘,计算得到所述样本用户所安装的应用程序对应每个应用程序的权重;
其中,所述预设权重系数是指为了将次数转化为权重值的一个预先设定的系数值,针对于不同的应用程序,既可以设定同一个权重系数,也可以根据不同的应用程序的类型,设定不同的权重系数。这样,所述应用程序的使用次数换算成权重后也将作为训练数据,能够提高用户属性预测的准确性。
步骤208,将所述样本用户的用户属性标签、所述样本用户所安装的应用程序以及对应每个应用程序的权重作为训练数据,输入预先构建的用户属性预测的算法模型中,训练得到预测用户属性的预测模型;
通过步骤207计算得到每个应用程序基于使用次数的权重值,将每个应用程序的权重值与应用程序本身一起作为训练数据,使得能够极大地提高训练得到的预测模型预测的准确性。例如:不同的样本用户即使所安装的应用程序完全一样,若是其使用的次数不同,也能够进一步区分不同样本用户的不同性质,使得通过获取目标用户所安装的应用程序以及每个应用程序的使用次数,能够更加精确的预测目标用户的用户属性。所述权重 一般是使用次数越多,则权重值越大。
步骤209,获取目标用户所安装的应用程序,将所述目标用户所安装的应用程序输入预测用户属性的预测模型中,计算得到目标用户的用户属性预测概率值。所述预测用户属性的预测模型计算的结果既可以是用户属性的直接预测结果,也可以是不同属性类别的预测概率值。
步骤210,选取预测概率值最大的属性类别,查找预设的属性类别与概率阈值对应的关系列表,得到预测概率值最大的属性类别对应的预设概率阈值;
在任何判断中,都是选取概率最大的一个座位最有可能的判断结果,且概率越大则预测结果与实际的结果相同的可能性就越大。因此,为了提高预测用户属性的准确性,需要设定一个概率阈值进行判断,但是,基于不同属性类别的数据可能存在很大的差异,若是采用同一个概率阈值也可能引起一定的偏差,所以,本发明实施例针对不同的属性类别设定了对应的概率阈值,进而进一步提高用户属性的预测准确性。
步骤211,判断所述属性类别的预测概率值是否大于预设概率阈值,若是,则执行步骤212,否则,执行步骤213;
步骤212,根据步骤211,若所述属性类别的预测概率值大于预设概率阈值,表示此次预测的准确性达到了预设的标准,因而可以直接将所述属性类别作为预测结果;例如:判断目标用户为男性的预测概率值达到了95%,而设定的概率阈值为80%,则基本可以预测当前目标用户为男性用户。
步骤213,根据步骤211,若所述属性类别的预测概率值没有大于预设概率阈值,表示此次预测的准确性没有达到了预设的标准,未来给预测人员更加清晰的预测结果,将用户属性中所有属性类别以及对应的预测概率值作为预测结果,发送给预测人员或者显示出来。
由上述实施例可知,本发明实施例所述的用户属性预测方法,通过将样本用户使用应用程序的次数换算为应用程序的权重,并作为预测模型的训练数据,提高了目标用户预测的准确性,同时也体现出不同目标用户之间的差异;通过预设的时间阈值,筛选出有效的使用次数,进而提高了应用程序使用次数统计数据的稳定性;又进一步通过针对不同的应用程序的 类型设定不同的预设时间阈值,使得能够对于不同性质的应用程序实现更加准确的次数统计,进一步提高了用户属性预测的准确性和可靠性;通过预设的预测概率阈值提高预测结果判断的准确性,又进一步通过针对不同的属性类别设置不同的预测概率阈值使得能够减少不同属性类别之间的差异性,使得判断结果更加准确、可靠。
需要说明的是,上述实施例只是为了表述本发明的设计思路的一个示例性的实施例,而本发明的思路并不限于上述实施例中所表述的步骤的数量和顺序。也即针对于某些步骤可以省略,或者有的步骤之间的顺序还可以根据需要发生改变。
在本发明一个可选的实施例中,所述用户属性预测的方法可以包括步骤201、步骤206、步骤207和步骤208。具体为:
获取样本用户的用户属性标签以及所述样本用户所安装的应用程序;
根据所述样本用户的用户属性标签以及所述样本用户所安装的应用程序,统计得到每个应用程序的使用次数;
将每个应用程序的使用次数与预设权重系数相乘,计算得到所述样本用户所安装的应用程序对应每个应用程序的权重;
将所述样本用户的用户属性标签、所述样本用户所安装的应用程序以及对应每个应用程序的权重作为训练数据。
这样,通过将应用程序的使用次数换算成应用程序的权重,进而提高预测用户属性的准确性。
在本发明另一个可选的实施例中,所述用户属性预测的方法可以包括步骤201、步骤203、步骤204、步骤205、步骤206、步骤207和步骤208。具体为:
获取样本用户的用户属性标签以及所述样本用户所安装的应用程序;
判断所述样本用户所安装的应用程序每次的使用时间是否大于预设时间阈值;若是,则该次应用程序的使用记为一次有效使用,否则,该次应用程序的使用记为一次无效使用;
统计得到每个应用程序有效使用的次数,作为每个应用程序的使用次数;
将每个应用程序的使用次数与预设权重系数相乘,计算得到所述样本用户所安装的应用程序对应每个应用程序的权重;
将所述样本用户的用户属性标签、所述样本用户所安装的应用程序以及对应每个应用程序的权重作为训练数据。
这样,通过将应用程序的使用时间与预设的时间阈值比较,能够筛选出有效的使用次数,进而提高用户属性预测的稳定性和可靠性。
进一步地,所述用户属性预测的方法还可以包括步骤201、步骤202、步骤203、步骤204、步骤205、步骤206、步骤207和步骤208。具体为:
获取样本用户的用户属性标签以及所述样本用户所安装的应用程序;
根据每个应用程序的类型,检索预设的应用程序与时间阈值的对应关系列表,得到每个应用程序对应的预设时间阈值;
判断所述样本用户所安装的应用程序每次的使用时间是否大于预设时间阈值;若是,则该次应用程序的使用记为一次有效使用,否则,该次应用程序的使用记为一次无效使用;
统计得到每个应用程序有效使用的次数,作为每个应用程序的使用次数;
将每个应用程序的使用次数与预设权重系数相乘,计算得到所述样本用户所安装的应用程序对应每个应用程序的权重;
将所述样本用户的用户属性标签、所述样本用户所安装的应用程序以及对应每个应用程序的权重作为训练数据。
这样,通过将应用程序的使用时间与预设的时间阈值比较,能够筛选出有效的使用次数,进而提高用户属性预测的稳定性和可靠性。
在本发明一些可选的实施例中,所述用户属性预测的方法可以包括步骤101、步骤102、步骤209、步骤211、步骤212、步骤213。具体为:
获取样本用户的用户属性标签以及所述样本用户所安装的应用程序;
将所述样本用户的用户属性标签以及所述样本用户所安装的应用程 序作为训练数据,输入预先构建的用户属性预测的算法模型中,训练得到预测用户属性的预测模型;
获取目标用户所安装的应用程序,将所述目标用户所安装的应用程序输入预测用户属性的预测模型中,计算得到目标用户的用户属性预测概率值;
选取预测概率值最大的属性类别,并判断所述属性类别的预测概率值是否大于预设概率阈值,若是,则将所述属性类别作为预测结果,否则,将用户属性中所有属性类别以及对应的预测概率值作为预测结果。
这样,通过将预测得到的用户属性的预测概率值与预设的概率阈值比较,能够进一步提高预测结果的准确性,同时,使得在预测结果判断不准确的时候也能够将预测的概率值显示出来。
在本发明另一些可选的实施例中,所述用户属性预测的方法可以包括步骤101、步骤102、步骤209、步骤210、步骤211、步骤212、步骤213。具体为:
获取样本用户的用户属性标签以及所述样本用户所安装的应用程序;
将所述样本用户的用户属性标签以及所述样本用户所安装的应用程序作为训练数据,输入预先构建的用户属性预测的算法模型中,训练得到预测用户属性的预测模型;
获取目标用户所安装的应用程序,将所述目标用户所安装的应用程序输入预测用户属性的预测模型中,计算得到目标用户的用户属性预测概率值;
选取预测概率值最大的属性类别,查找预设的属性类别与概率阈值对应的关系列表,得到预测概率值最大的属性类别对应的预设概率阈值;
判断所述属性类别的预测概率值是否大于预设概率阈值,若是,则将所述属性类别作为预测结果,否则,将用户属性中所有属性类别以及对应的预测概率值作为预测结果。
这样,通过针对用户属性中的不同属性类型,减小不同属性类别数据之间的差异,使得统一用户属性中的所有属性类别均能够根据自身的特征得到较为准确的预测结果。
在一些可选的实施例中,所述用户属性为性别属性,所述用户属性预测方法为:
获取大量样本用户,所述样本用户均已知性别为男或为女,同时获取所述用户所安装的应用程序的类型;
将大量样本用户的性别和应用程序类型作为训练数据,训练得打预测用户男女的预测模块;
获取目标用户所安装的应用程序,然后将所述目标用户所安装的应用程序输入预测模型中,就能够预测得到当前目标用户的性别(为男性或者女性)。这样,通过移动终端目标用户容易获取的信息,即应用程序,就能够预测得到该目标用户的性别,进而后续能够针对目标用户的性别做出针对性的服务方案,实现目标用户的差异化管理。
在本发明的一个方面,本发明实施例还提供了一种用户属性预测装置,参照图3所示,为本发明提供的用户属性预测装置的一个实施例的结构示意图。
所述用户属性预测装置包括:
数据获取模块301,用于获取样本用户的用户属性标签以及所述样本用户所安装的应用程序,将获取的用户属性标签和应用程序发送给模型训练模块302;
模型训练模块302,用于接收所述数据获取模块301发送的用户属性标签和应用程序,将所述样本用户的用户属性标签以及所述样本用户所安装的应用程序作为训练数据,输入预先构建的用户属性预测的算法模型中,训练得到预测用户属性的预测模型;
属性预测模块303,用于获取目标用户所安装的应用程序,将所述目标用户所安装的应用程序输入预测用户属性的预测模型中,计算得到目标用户的用户属性预测结果。
由上述实施例可知,所述用户属性预测装置通过所述数据获取模块301获取已知属性样本用户的用户属性标签以及所述样本用户所安装的应用程序,所述模型训练模块302通过已知的用户属性和应用程序的训练数 据训练得到预测用户属性的预测模型,所述属性预测模块303通过将目标用户所安装的应用程序输入预测模块,预测得到目标用户的用户属性预测结果。所述用户属性预测装置能够通过当前样本用户所安装的应用程序进而准确预测得到当前目标用户的用户属性,克服了现有装备智能通过用户的输入获得用户属性的缺陷,进而实现用户的差异化管理。
参见图4所示,为本发明提供的用户属性预测装置的另一个实施例的结构示意图。
在一些可选的实施例中,所述模型训练模块302包括:数量统计模块3022、权重计算模块3023和数据训练模块3024;
所述数据获取模块301还用于,将获取的用户属性标签和应用程序发送给数量统计模块3022;
所述数量统计模块3022,用于接收所述数据获取模块301发送的用户属性标签和应用程序,并根据所述样本用户的用户属性标签以及所述样本用户所安装的应用程序,统计得到每个应用程序的使用次数;将得到的每个应用程序的使用次数发送给权重计算模块3023;
所述权重计算模块3023,用于接收所述数量统计模块3022发送的每个应用程序的使用次数,并将每个应用程序的使用次数与预设权重系数相乘,计算得到所述样本用户所安装的应用程序对应每个应用程序的权重;将计算得到的每个应用程序的权重发送给数据训练模块3024;
所述数据训练模块3024,用于接收所述权重计算模块3023发送的每个应用程序的权重,将所述样本用户的用户属性标签、所述样本用户所安装的应用程序以及对应每个应用程序的权重作为训练数据,输入预先构建的用户属性预测的算法模型中,训练得到预测用户属性的预测模型。
这样,所述模型训练模块302通过所述数量统计模块3022统计得到应用程序的使用次数,通过所述权重计算模块3023计算得到应用程序基于使用次数的权重,然后通过所述数据训练模块3024将应用程序的权重也作为训练数据,提高了所述用户属性预测的准确性。
在本发明进一步的实施例中,所述数量统计模块3022还用于,判断所述样本用户所安装的应用程序每次的使用时间是否大于预设时间阈值; 若是,则该次应用程序的使用记为一次有效使用,否则,该次应用程序的使用记为一次无效使用;统计得到每个应用程序有效使用的次数,作为每个应用程序的使用次数。这样,所述数量统计模块3022通过将应用程序的使用时间与预设时间阈值比较,进而筛选出应用程序的有效使用次数,进一步提高的用户属性预测的准确性。
在本发明可选的实施例中,所述模型训练模块302还包括时间阈值查找模块3021;
所述数据获取模块301还用于,将获取的应用程序发送给所述时间阈值查找模块3021;
所述时间阈值查找模块3021,用于接收所述数据获取模块301发送的应用程序,根据每个应用程序的类型,检索预设的应用程序与时间阈值的对应关系列表,得到每个应用程序对应的预设时间阈值,将每个应用程序对应的预设时间阈值发送给所述数量统计模块3022;
所述数量统计模块3022还用于,接收所述时间阈值查找模块3021发送的每个应用程序对应的预设时间阈值。
这样,所述模型训练模块302通过所述时间阈值查找模块3021查找预设的应用程序与时间阈值的对应关系列表,得到每个应用程序对应的预设时间阈值,使得能够针对于不同应用程序实现不同的判断标准,进一步减少了应用程序类型之间的差异,进而提高了预测用户属性的准确性。
在本发明另一些可选的实施例中,所述属性预测模块303包括应用获取模块3031、概率预测模块3032和结果输出模块3033;
所述应用获取模块3031,用于获取目标用户的移动终端中的应用程序,并发送到概率预测模块3032中;
所述概率预测模块3032,用于接收所述应用获取模块3031发送的目标用户的移动终端中的应用程序,并将所述目标用户的移动终端中的应用程序输入预测用户属性的预测模型中,计算得到目标用户的用户属性中不同属性类别的预测概率值;将计算得到的不同属性类别的预测概率值发送给结果输出模块3033;
所述结果输出模块3033,用于接收所述概率预测模块3032发送的不同属性类别的预测概率值,选取预测概率值最大的属性类别,并判断所述属性类别的预测概率值是否大于预设概率阈值,若是,则将所述属性类别作为预测结果,否则,将用户属性中所有属性类别以及对应的预测概率值作为预测结果。
所述属性预测模块303通过所述概率预测模块3032预测得到目标用户不同属性类别的预测概率值,通过所述结果输出模块3033判断所述预测概率值是否大于预设概率阈值,进而调整输出结果。这样,使得所述用户属性预测装置的预测结果更为可靠。
在本发明进一步的实施例中,所述属性预测模块303还包括概率阈值查找模块3034;
所述结果输出模块3033还用于,将选取出的预测概率值最大的属性类别发送给概率阈值查找模块3034;
所述概率阈值查找模块3034,用于接收所述结果输出模块3033发送的预测概率值最大的属性类别,查找预设的属性类别与概率阈值对应的关系列表,得到预测概率值最大的属性类别对应的预设概率阈值,将所述预设概率阈值发送给结果输出模块3033;
所述结果输出模块3033还用于,接收所述概率阈值查找模块发送的预设概率阈值。
这样,所述属性预测模块303通过所述概率阈值查找模块3034查找预设的属性类别与概率阈值对应的关系列表,得到预测概率值最大的属性类别对应的预设概率阈值,使得所述属性预测模块303能够根据不同属性类别的各自特征,做出相应的结果判断,进一步提高了用户属性预测的准确性和可靠性。
本发明的又一方面,还提供了一种电子设备,所述电子设备的一个实施例,包括:
一个或多个处理器,可选的,所述一个或多个处理器用于执行上面任意一个或多个实施例所述的方法中所限定的步骤;以及
用于存储操作指令的存储器;
所述一个或多个处理器被配置为从所述存储器中获取操作指令并执行:
获取样本用户的用户属性标签以及所述样本用户所安装的应用程序;
将所述样本用户的用户属性标签以及所述样本用户所安装的应用程序作为训练数据,输入预先构建的用户属性预测的算法模型中,训练得到预测用户属性的预测模型;
获取目标用户所安装的应用程序,将所述目标用户所安装的应用程序输入预测用户属性的预测模型中,计算得到目标用户的用户属性预测结果。
可选的,所述处理器还用于执行:
根据所述样本用户的用户属性标签以及所述样本用户所安装的应用程序,统计得到每个应用程序的使用次数;
将每个应用程序的使用次数与预设权重系数相乘,计算得到所述样本用户所安装的应用程序对应每个应用程序的权重;
将所述样本用户的用户属性标签、所述样本用户所安装的应用程序以及对应每个应用程序的权重作为训练数据。
可选的,所述处理器还用于执行:
判断所述样本用户所安装的应用程序每次的使用时间是否大于预设时间阈值;若是,则该次应用程序的使用记为一次有效使用,否则,该次应用程序的使用记为一次无效使用;
统计得到每个应用程序有效使用的次数,作为每个应用程序的使用次数。
可选的,所述处理器还用于执行:根据每个应用程序的类型,检索预设的应用程序与时间阈值的对应关系列表,得到每个应用程序对应的预设时间阈值。
可选的,所述处理器还用于执行:
根据预测用户属性的预测模型,计算得到目标用户的用户属性中不同属性类别的预测概率值;
选取预测概率值最大的属性类别,并判断所述属性类别的预测概率值是否大于预设概率阈值,若是,则将所述属性类别作为预测结果,否则, 将用户属性中所有属性类别以及对应的预测概率值作为预测结果。
可选的,所述处理器还用于执行:
查找预设的属性类别与概率阈值对应的关系列表,得到预测概率值最大的属性类别对应的预设概率阈值。
参见图1,本实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:
获取样本用户的用户属性标签以及所述样本用户所安装的应用程序;
将所述样本用户的用户属性标签以及所述样本用户所安装的应用程序作为训练数据,输入预先构建的用户属性预测的算法模型中,训练得到预测用户属性的预测模型;
获取目标用户所安装的应用程序,将所述目标用户所安装的应用程序输入预测用户属性的预测模型中,计算得到所述目标用户的用户属性预测结果。
本实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:
获取样本用户的用户属性标签以及所述样本用户所安装的应用程序;
将所述样本用户的用户属性标签以及所述样本用户所安装的应用程序作为训练数据,输入预先构建的用户属性预测的算法模型中,训练得到预测用户属性的预测模型;
获取目标用户所安装的应用程序,将所述目标用户所安装的应用程序输入预测用户属性的预测模型中,计算得到所述目标用户的用户属性预测结果。
此外,典型地,本公开所述的装置可为各种电子终端设备,例如手机、个人数字助理(PDA)、平板电脑(PAD)、平板电脑(PAD)、智能电视等,因此本公开的保护范围不应限定为某种特定类型的装置。
此外,根据本公开的方法还可以被实现为由CPU执行的计算机程序, 该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被CPU执行时,执行本公开的方法中限定的上述功能。
此外,上述方法步骤以及系统单元也可以利用控制器以及用于存储使得控制器实现上述步骤或单元功能的计算机程序的计算机可读存储介质实现。
此外,应该明白的是,本文所述的计算机可读存储介质(例如,存储器)可以是易失性存储器或非易失性存储器,或者可以包括易失性存储器和非易失性存储器两者。作为例子而非限制性的,非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦写可编程ROM(EEPROM)或快闪存储器。易失性存储器可以包括随机存取存储器(RAM),该RAM可以充当外部高速缓存存储器。作为例子而非限制性的,RAM可以以多种形式获得,比如同步RAM(DRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据速率SDRAM(DDR SDRAM)、增强SDRAM(ESDRAM)、同步链路DRAM(SLDRAM)以及直接RambusRAM(DRRAM)。所公开的方面的存储设备意在包括但不限于这些和其它合适类型的存储器。
本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现所述的功能,但是这种实现决定不应被解释为导致脱离本公开的范围。
结合这里的公开所描述的各种示例性逻辑块、模块和电路可以利用被设计成用于执行这里所述功能的下列部件来实现或执行:通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立门或晶体管逻辑、分立的硬件组件或者这些部件的任何组合。通用处理器可以是微处理器,但是可替换地,处理器可以是任何传统处理器、控制器、微控制器或状态机。处理器也可以被实现为计算设备的组合,例如,DSP和微处理器的组合、多个微处理器、一个或 多个微处理器结合DSP核、或任何其它这种配置。
结合这里的公开所描述的方法或算法的步骤可以直接包含在硬件中、由处理器执行的软件模块中或这两者的组合中。软件模块可以驻留在RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动盘、CD-ROM、或本领域已知的任何其它形式的存储介质中。示例性的存储介质被耦合到处理器,使得处理器能够从该存储介质中读取信息或向该存储介质写入信息。在一个替换方案中,所述存储介质可以与处理器集成在一起。处理器和存储介质可以驻留在ASIC中。ASIC可以驻留在用户终端中。在一个替换方案中,处理器和存储介质可以作为分立组件驻留在用户终端中。
在一个或多个示例性设计中,所述功能可以在硬件、软件、固件或其任意组合中实现。如果在软件中实现,则可以将所述功能作为一个或多个指令或代码存储在计算机可读介质上或通过计算机可读介质来传送。计算机可读介质包括计算机存储介质和通信介质,该通信介质包括有助于将计算机程序从一个位置传送到另一个位置的任何介质。存储介质可以是能够被通用或专用计算机访问的任何可用介质。作为例子而非限制性的,该计算机可读介质可以包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储设备、磁盘存储设备或其它磁性存储设备,或者是可以用于携带或存储形式为指令或数据结构的所需程序代码并且能够被通用或专用计算机或者通用或专用处理器访问的任何其它介质。此外,任何连接都可以适当地称为计算机可读介质。例如,如果使用同轴线缆、光纤线缆、双绞线、数字用户线路(DSL)或诸如红外线、无线电和微波的无线技术来从网站、服务器或其它远程源发送软件,则上述同轴线缆、光纤线缆、双绞线、DSL或诸如红外先、无线电和微波的无线技术均包括在介质的定义。如这里所使用的,磁盘和光盘包括压缩盘(CD)、激光盘、光盘、数字多功能盘(DVD)、软盘、蓝光盘,其中磁盘通常磁性地再现数据,而光盘利用激光光学地再现数据。上述内容的组合也应当包括在计算机可读介质的范围内。
公开的示例性实施例,但是应当注公开的示例性实施例,但是应当注意,在不背离权利要求限定的本公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动 作不需以任何特定顺序执行。此外,尽管本公开的元素可以以个体形式描述或要求,但是也可以设想多个,除非明确限制为单数。
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
上述本公开实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

Claims (15)

  1. 一种用户属性预测方法,其特征在于,包括:
    获取样本用户的用户属性标签以及所述样本用户所安装的应用程序;
    将所述样本用户的用户属性标签以及所述样本用户所安装的应用程序作为训练数据,输入预先构建的用户属性预测的算法模型中,训练得到预测用户属性的预测模型;
    获取目标用户所安装的应用程序,将所述目标用户所安装的应用程序输入预测用户属性的预测模型中,计算得到所述目标用户的用户属性预测结果。
  2. 根据权利要求1所述的方法,其特征在于,所述将所述样本用户的用户属性标签以及所述样本用户所安装的应用程序作为训练数据的步骤还包括:
    根据所述样本用户的用户属性标签以及所述样本用户所安装的应用程序,统计得到每个应用程序的使用次数;
    将每个应用程序的使用次数与预设权重系数相乘,计算得到所述样本用户所安装的应用程序对应每个应用程序的权重;
    将所述样本用户的用户属性标签、所述样本用户所安装的应用程序以及对应每个应用程序的权重作为训练数据。
  3. 根据权利要求2所述的方法,其特征在于,所述统计得到每个应用程序的使用次数的步骤还包括:
    判断所述样本用户所安装的应用程序每次的使用时间是否大于预设时间阈值;若是,则该次应用程序的使用记为一次有效使用,否则,该次应用程序的使用记为一次无效使用;
    统计得到每个应用程序有效使用的次数,作为每个应用程序的使用次数。
  4. 根据权利要求3所述的方法,其特征在于,所述判断所述样本用户所安装的应用程序每次的使用时间是否大于预设时间阈值的步骤之前还包括:
    根据每个应用程序的类型,检索预设的应用程序与时间阈值的对应关系列表,得到每个应用程序对应的预设时间阈值。
  5. 根据权利要求1所述的方法,其特征在于,所述计算得到目标用户的用户属性预测结果的步骤还包括:
    根据预测用户属性的预测模型,计算得到目标用户的用户属性中不同属性类别的预测概率值;
    选取预测概率值最大的属性类别,并判断所述属性类别的预测概率值是否大于预设概率阈值,若是,则将所述属性类别作为预测结果,否则,将用户属性中所有属性类别以及对应的预测概率值作为预测结果。
  6. 根据权利要求5所述的方法,其特征在于,所述选取预测概率值最大的属性类别的步骤之后还包括:
    查找预设的属性类别与概率阈值对应的关系列表,得到预测概率值最大的属性类别对应的预设概率阈值。
  7. 一种用户属性预测装置,其特征在于,包括:
    数据获取模块,用于获取样本用户的用户属性标签以及所述样本用户所安装的应用程序,将获取的用户属性标签和应用程序发送给模型训练模块;
    模型训练模块,用于接收所述数据获取模块发送的用户属性标签和应用程序,将所述样本用户的用户属性标签以及所述样本用户所安装的应用程序作为训练数据,输入预先构建的用户属性预测的算法模型中,训练得到预测用户属性的预测模型;
    属性预测模块,用于获取目标用户所安装的应用程序,将所述目标用户所安装的应用程序输入预测用户属性的预测模型中,计算得到目标用户的用户属性预测结果。
  8. 根据权利要求7所述的装置,其特征在于,所述模型训练模块包括:数量统计模块、权重计算模块和数据训练模块;
    所述数据获取模块还用于,将获取的用户属性标签和应用程序发送给数量统计模块;
    所述数量统计模块,用于接收所述数据获取模块发送的用户属性标签和应用程序,并根据所述样本用户的用户属性标签以及所述样本用户所安装的应用程序,统计得到每个应用程序的使用次数;将得到的每个应用程 序的使用次数发送给权重计算模块;
    所述权重计算模块,用于接收所述数量统计模块发送的每个应用程序的使用次数,并将每个应用程序的使用次数与预设权重系数相乘,计算得到所述样本用户所安装的应用程序对应每个应用程序的权重;将计算得到的每个应用程序的权重发送给数据训练模块;
    所述数据训练模块,用于接收所述权重计算模块发送的每个应用程序的权重,将所述样本用户的用户属性标签、所述样本用户所安装的应用程序以及对应每个应用程序的权重作为训练数据,输入预先构建的用户属性预测的算法模型中,训练得到预测用户属性的预测模型。
  9. 根据权利要求8所述的装置,其特征在于,所述数量统计模块还用于,判断所述样本用户所安装的应用程序每次的使用时间是否大于预设时间阈值;若是,则该次应用程序的使用记为一次有效使用,否则,该次应用程序的使用记为一次无效使用;
    统计得到每个应用程序有效使用的次数,作为每个应用程序的使用次数。
  10. 根据权利要求9所述的装置,其特征在于,所述模型训练模块还包括时间阈值查找模块;
    所述数据获取模块还用于,将获取的应用程序发送给所述时间阈值查找模块;
    所述时间阈值查找模块,用于接收所述数据获取模块发送的应用程序,根据每个应用程序的类型,检索预设的应用程序与时间阈值的对应关系列表,得到每个应用程序对应的预设时间阈值,将每个应用程序对应的预设时间阈值发送给所述数量统计模块;
    所述数量统计模块还用于,接收所述时间阈值查找模块发送的每个应用程序对应的预设时间阈值。
  11. 根据权利要求7所述的装置,其特征在于,所述属性预测模块包括应用获取模块、概率预测模块和结果输出模块;
    所述应用获取模块,用于获取目标用户的移动终端中的应用程序,并发送到概率预测模块中;
    所述概率预测模块,用于接收所述应用获取模块发送的目标用户的移 动终端中的应用程序,并将所述目标用户的移动终端中的应用程序输入预测用户属性的预测模型中,计算得到目标用户的用户属性中不同属性类别的预测概率值;将计算得到的不同属性类别的预测概率值发送给结果输出模块;
    所述结果输出模块,用于接收所述概率预测模块发送的不同属性类别的预测概率值,选取预测概率值最大的属性类别,并判断所述属性类别的预测概率值是否大于预设概率阈值,若是,则将所述属性类别作为预测结果,否则,将用户属性中所有属性类别以及对应的预测概率值作为预测结果。
  12. 根据权利要求11所述的装置,其特征在于,所述属性预测模块还包括概率阈值查找模块;
    所述结果输出模块还用于,将选取出的预测概率值最大的属性类别发送给概率阈值查找模块;
    所述概率阈值查找模块,用于接收所述结果输出模块发送的预测概率值最大的属性类别,查找预设的属性类别与概率阈值对应的关系列表,得到预测概率值最大的属性类别对应的预设概率阈值,将所述预设概率阈值发送给结果输出模块;
    所述结果输出模块还用于,接收所述概率阈值查找模块发送的预设概率阈值。
  13. 一种电子设备,其特征在于,包括:
    至少一个处理器;以及
    与所述至少一个处理器通信连接的存储器;其中,
    所述存储器存储有可被所述至少一个处理器执行的程序指令,所述至少一个处理器调用所述程序指令能够执行如权利要求1至6任一所述的方法。
  14. 一种计算机程序产品,其特征在于,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行如权利要求1至6任一所述的方法。
  15. 一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算 机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至6任一所述的方法。
PCT/CN2016/102466 2016-06-20 2016-10-18 用户属性预测方法及装置 WO2017219548A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201610447718.4 2016-06-20
CN201610447718.4A CN106126597A (zh) 2016-06-20 2016-06-20 用户属性预测方法及装置

Publications (1)

Publication Number Publication Date
WO2017219548A1 true WO2017219548A1 (zh) 2017-12-28

Family

ID=57471021

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2016/102466 WO2017219548A1 (zh) 2016-06-20 2016-10-18 用户属性预测方法及装置

Country Status (2)

Country Link
CN (1) CN106126597A (zh)
WO (1) WO2017219548A1 (zh)

Cited By (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180165697A1 (en) * 2016-12-08 2018-06-14 App Annie Inc. Determining usage data of mobile applications for a population
CN108961071A (zh) * 2018-06-01 2018-12-07 中国平安人寿保险股份有限公司 自动预测组合业务收益的方法及终端设备
CN109218411A (zh) * 2018-08-22 2019-01-15 中国平安人寿保险股份有限公司 数据处理方法及装置、计算机可读存储介质、电子设备
CN109241418A (zh) * 2018-08-22 2019-01-18 中国平安人寿保险股份有限公司 基于随机森林的异常用户识别方法及装置、设备、介质
CN109255391A (zh) * 2018-09-30 2019-01-22 武汉斗鱼网络科技有限公司 一种识别恶意用户的方法、装置及存储介质
CN109345302A (zh) * 2018-09-27 2019-02-15 腾讯科技(深圳)有限公司 机器学习模型训练方法、装置、存储介质和计算机设备
CN109523296A (zh) * 2018-10-12 2019-03-26 中国平安人寿保险股份有限公司 用户行为概率分析方法及装置、电子设备、存储介质
CN109544150A (zh) * 2018-10-09 2019-03-29 阿里巴巴集团控股有限公司 一种分类模型生成方法及装置、计算设备及存储介质
CN109636446A (zh) * 2018-11-16 2019-04-16 北京奇虎科技有限公司 用户流失预测方法、装置及电子设备
CN109635990A (zh) * 2018-10-12 2019-04-16 阿里巴巴集团控股有限公司 一种训练方法、预测方法、装置及电子设备
CN109801101A (zh) * 2019-01-03 2019-05-24 深圳壹账通智能科技有限公司 标签确定方法、装置、计算机设备和存储介质
CN110223108A (zh) * 2019-05-27 2019-09-10 北京金山安全软件有限公司 点击通过率的预测方法、装置及设备
CN110490625A (zh) * 2018-05-11 2019-11-22 北京京东尚科信息技术有限公司 用户偏好确定方法及装置、电子设备、存储介质
CN110598124A (zh) * 2019-08-14 2019-12-20 平安科技(深圳)有限公司 数值属性挖掘方法、装置、计算机设备和存储介质
CN110730164A (zh) * 2019-09-18 2020-01-24 平安科技(深圳)有限公司 安全预警方法及相关设备、计算机可读存储介质
CN110880149A (zh) * 2019-11-29 2020-03-13 上海商汤智能科技有限公司 信息处理方法及装置、电子设备和存储介质
CN110956303A (zh) * 2019-10-12 2020-04-03 未鲲(上海)科技服务有限公司 信息预测方法、装置、终端及可读存储介质
CN111046952A (zh) * 2019-12-12 2020-04-21 深圳市随手金服信息科技有限公司 标签挖掘模型的建立方法、装置、存储介质及终端
CN111062749A (zh) * 2019-12-12 2020-04-24 北京爱奇艺科技有限公司 增长量预估方法、装置、电子设备及存储介质
CN111160604A (zh) * 2019-11-22 2020-05-15 深圳壹账通智能科技有限公司 缺失信息预测方法、装置、计算机设备及存储介质
CN111159243A (zh) * 2019-12-30 2020-05-15 中国移动通信集团江苏有限公司 用户类型识别方法、装置、设备及存储介质
CN111178983A (zh) * 2020-01-03 2020-05-19 北京搜狐新媒体信息技术有限公司 用户性别预测方法、装置、设备及存储介质
CN111191601A (zh) * 2019-12-31 2020-05-22 深圳云天励飞技术有限公司 同行用户识别方法、装置、服务器及存储介质
CN111209929A (zh) * 2019-12-19 2020-05-29 平安信托有限责任公司 访问数据处理方法、装置、计算机设备及存储介质
CN111222897A (zh) * 2018-11-23 2020-06-02 中国移动通信集团广东有限公司 基于客户上网满意度预测方法及装置
CN111222026A (zh) * 2020-01-09 2020-06-02 支付宝(杭州)信息技术有限公司 用户类别识别模型的训练方法和用户类别识别方法
CN111340115A (zh) * 2020-02-27 2020-06-26 深圳创新奇智科技有限公司 基于特征动态构造的推荐模型训练方法及系统
CN111353513A (zh) * 2018-12-20 2020-06-30 杭州海康威视数字技术股份有限公司 一种目标人群筛选的方法、装置、终端和存储介质
CN111401563A (zh) * 2018-12-28 2020-07-10 杭州海康威视数字技术股份有限公司 机器学习模型更新方法和装置
CN111476258A (zh) * 2019-01-24 2020-07-31 杭州海康威视数字技术股份有限公司 一种基于注意力机制的特征提取方法、装置及电子设备
CN111507483A (zh) * 2019-01-30 2020-08-07 鸿富锦精密电子(天津)有限公司 返修板检测装置、方法及计算机可读存储介质
CN111506617A (zh) * 2019-01-31 2020-08-07 华为技术有限公司 一种基于用户数据生成标签的方法及装置
CN111652742A (zh) * 2020-04-30 2020-09-11 中国平安财产保险股份有限公司 用户数据处理方法、装置、电子设备及可读存储介质
CN111898738A (zh) * 2020-07-30 2020-11-06 北京智能工场科技有限公司 一种基于全连接神经网络实现的移动终端用户性别预测方法和系统
CN112036486A (zh) * 2020-08-31 2020-12-04 北京百度网讯科技有限公司 训练标签生成模型的方法、装置、设备及其存储介质
CN112149807A (zh) * 2020-09-28 2020-12-29 北京百度网讯科技有限公司 用户特征信息的处理方法和装置
CN112445689A (zh) * 2020-11-27 2021-03-05 广州三七互娱科技有限公司 用户分类方法、装置及电子设备
CN112529301A (zh) * 2020-12-14 2021-03-19 南京中兴力维软件有限公司 用电量预测方法、设备及存储介质
CN112738895A (zh) * 2020-12-25 2021-04-30 深圳市微网力合信息技术有限公司 Wifi信道分配方法及设备
CN112908453A (zh) * 2021-02-09 2021-06-04 京东方科技集团股份有限公司 数据处理方法、装置、设备和介质
CN113344062A (zh) * 2021-05-31 2021-09-03 北京达佳互联信息技术有限公司 异常帐户识别方法、装置、服务器及存储介质
CN113391923A (zh) * 2021-06-18 2021-09-14 上海钧正网络科技有限公司 系统资源数据分配方法和装置
CN113496236A (zh) * 2020-03-20 2021-10-12 北京沃东天骏信息技术有限公司 用户标签信息确定方法、装置、设备和存储介质
CN113988152A (zh) * 2021-09-23 2022-01-28 北京达佳互联信息技术有限公司 用户类型预测模型训练方法、资源分配方法、介质及装置
US20220051282A1 (en) * 2018-01-19 2022-02-17 Intuit Inc. Method and system for using machine learning techniques to identify and recommend relevant offers
CN114358807A (zh) * 2021-03-12 2022-04-15 上海序言泽网络科技有限公司 基于可预测用户特征属性的用户画像方法及系统
CN115361651A (zh) * 2022-08-19 2022-11-18 中国联合网络通信集团有限公司 终端定位方法、装置、电子设备及存储介质
CN115545088A (zh) * 2022-02-22 2022-12-30 北京百度网讯科技有限公司 模型构建方法、分类方法、装置和电子设备
CN116028882A (zh) * 2023-03-29 2023-04-28 深圳市傲天科技股份有限公司 用户标注和分类方法、装置、设备及存储介质
CN117574177A (zh) * 2024-01-15 2024-02-20 每日互动股份有限公司 一种用于用户扩线的数据处理方法、装置、介质及设备

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106682686A (zh) * 2016-12-09 2017-05-17 北京拓明科技有限公司 一种基于手机上网行为的用户性别预测方法
CN108228595A (zh) * 2016-12-14 2018-06-29 中国电信股份有限公司 推测获得用户属性的方法和系统
CN108229989B (zh) * 2016-12-14 2020-09-22 北京国双科技有限公司 一种确定用户属性的属性类别的方法及装置
CN106651057B (zh) * 2017-01-03 2020-04-10 有米科技股份有限公司 一种基于安装包序列表的移动端用户年龄预测方法
CN106709298B (zh) * 2017-01-04 2020-04-17 Oppo广东移动通信有限公司 一种信息处理方法、装置及智能终端
CN107066518B (zh) * 2017-02-08 2021-01-08 创新先进技术有限公司 数据处理方法及系统
CN107291840B (zh) * 2017-05-31 2020-01-21 北京奇艺世纪科技有限公司 一种用户属性预测模型构建方法和装置
CN107330445B (zh) * 2017-05-31 2020-06-05 北京京东尚科信息技术有限公司 用户属性的预测方法和装置
CN109389138A (zh) * 2017-08-09 2019-02-26 武汉安天信息技术有限责任公司 一种用户画像方法及装置
CN107770241A (zh) * 2017-08-22 2018-03-06 北京五八信息技术有限公司 推荐信息的获取方法和装置
CN107730038A (zh) * 2017-10-09 2018-02-23 小草数语(北京)科技有限公司 用户偏好性别的预测方法、装置及其设备
CN107862339B (zh) * 2017-11-15 2022-04-29 百度在线网络技术(北京)有限公司 用于输出信息的方法和装置
CN107908742A (zh) * 2017-11-15 2018-04-13 百度在线网络技术(北京)有限公司 用于输出信息的方法和装置
CN107947951B (zh) * 2017-12-21 2019-10-15 Oppo广东移动通信有限公司 用户群组推荐方法、装置及存储介质和服务器
CN109992364B (zh) * 2017-12-29 2020-12-22 Oppo广东移动通信有限公司 应用冻结方法、装置、计算机设备和计算机可读存储介质
CN108537043B (zh) * 2018-03-30 2021-11-05 上海携程商务有限公司 移动终端的风险控制方法及系统
CN109191185A (zh) * 2018-08-15 2019-01-11 深圳市和讯华谷信息技术有限公司 一种客群分类方法及系统
CN109214448B (zh) * 2018-08-27 2023-04-07 平安科技(深圳)有限公司 非绩优人员培训方法、系统、终端及计算机可读存储介质
CN110876088A (zh) * 2018-09-03 2020-03-10 广州虎牙信息科技有限公司 一种直播间推荐的方法、装置、设备及存储介质
CN111105117B (zh) * 2018-10-29 2023-06-23 微梦创科网络科技(中国)有限公司 一种用户信息的确定方法和装置
CN109522197B (zh) * 2018-11-23 2022-09-27 每日互动股份有限公司 一种用户app行为的预测方法
CN110049446B (zh) * 2019-03-25 2020-12-29 每日互动股份有限公司 一种基于移动终端数据获取终端用户属性标签的服务器
CN111797874B (zh) * 2019-04-09 2024-04-09 Oppo广东移动通信有限公司 行为预测方法、装置、存储介质及电子设备
CN111832782B (zh) * 2019-04-17 2024-06-18 北京京东振世信息技术有限公司 确定物品物流属性的方法和装置
CN110121088B (zh) * 2019-04-17 2021-05-25 北京奇艺世纪科技有限公司 一种用户属性信息确定方法、装置及电子设备
CN110096526A (zh) * 2019-04-30 2019-08-06 秒针信息技术有限公司 一种用户属性标签的预测方法及预测装置
CN110309307A (zh) * 2019-06-20 2019-10-08 上海上湖信息技术有限公司 一种基于应用程序预测用户文化水平的方法和系统
TWI714213B (zh) * 2019-08-14 2020-12-21 東方線上股份有限公司 用戶型態預測系統及其方法
CN110796542A (zh) * 2019-09-26 2020-02-14 北京淇瑀信息科技有限公司 金融风险控制方法、金融风险控制装置和电子设备
CN110705637A (zh) * 2019-09-29 2020-01-17 上海淇玥信息技术有限公司 一种基于应用安装列表信息的用户分类的方法、装置和电子设备
CN110990714B (zh) * 2019-11-01 2023-05-23 中国联合网络通信集团有限公司 一种用户行为意图预测方法和装置
CN111078742B (zh) * 2019-12-09 2023-09-05 秒针信息技术有限公司 用户分类模型训练方法、用户分类方法及装置
CN111210109A (zh) * 2019-12-20 2020-05-29 上海淇玥信息技术有限公司 基于关联用户预测用户风险的方法、装置和电子设备
CN111582649B (zh) * 2020-04-09 2023-09-29 上海淇毓信息科技有限公司 基于用户app独热编码的风险评估方法、装置和电子设备
CN111639714B (zh) * 2020-06-01 2021-07-23 贝壳找房(北京)科技有限公司 确定用户的属性的方法、装置和设备
CN111863104B (zh) * 2020-07-29 2023-05-09 展讯通信(上海)有限公司 眼图判定模型训练方法、眼图判定方法、装置、设备及介质
CN111914927A (zh) * 2020-07-30 2020-11-10 北京智能工场科技有限公司 一种优化数据不平衡状态的移动app用户性别识别方法和系统
CN111915378A (zh) * 2020-08-17 2020-11-10 深圳墨世科技有限公司 用户属性预测方法、装置、计算机设备及存储介质
CN112700285A (zh) * 2021-01-08 2021-04-23 北京明略昭辉科技有限公司 用于预测用户属性标签的方法及装置、设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103927675A (zh) * 2014-04-18 2014-07-16 北京京东尚科信息技术有限公司 判断用户年龄段的方法及装置
CN104090888A (zh) * 2013-12-10 2014-10-08 深圳市腾讯计算机系统有限公司 一种用户行为数据的分析方法和装置
CN105117440A (zh) * 2015-08-11 2015-12-02 北京奇虎科技有限公司 确定待推荐应用app的方法及装置
CN105354725A (zh) * 2015-11-20 2016-02-24 珠海多玩信息技术有限公司 一种应用推广效果的预测方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104090888A (zh) * 2013-12-10 2014-10-08 深圳市腾讯计算机系统有限公司 一种用户行为数据的分析方法和装置
CN103927675A (zh) * 2014-04-18 2014-07-16 北京京东尚科信息技术有限公司 判断用户年龄段的方法及装置
CN105117440A (zh) * 2015-08-11 2015-12-02 北京奇虎科技有限公司 确定待推荐应用app的方法及装置
CN105354725A (zh) * 2015-11-20 2016-02-24 珠海多玩信息技术有限公司 一种应用推广效果的预测方法及系统

Cited By (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180165697A1 (en) * 2016-12-08 2018-06-14 App Annie Inc. Determining usage data of mobile applications for a population
US11074599B2 (en) * 2016-12-08 2021-07-27 App Annie Inc. Determining usage data of mobile applications for a population
US20220051282A1 (en) * 2018-01-19 2022-02-17 Intuit Inc. Method and system for using machine learning techniques to identify and recommend relevant offers
CN110490625A (zh) * 2018-05-11 2019-11-22 北京京东尚科信息技术有限公司 用户偏好确定方法及装置、电子设备、存储介质
CN108961071B (zh) * 2018-06-01 2023-07-21 中国平安人寿保险股份有限公司 自动预测组合业务收益的方法及终端设备
CN108961071A (zh) * 2018-06-01 2018-12-07 中国平安人寿保险股份有限公司 自动预测组合业务收益的方法及终端设备
CN109241418B (zh) * 2018-08-22 2024-04-09 中国平安人寿保险股份有限公司 基于随机森林的异常用户识别方法及装置、设备、介质
CN109218411B (zh) * 2018-08-22 2022-10-18 中国平安人寿保险股份有限公司 数据处理方法及装置、计算机可读存储介质、电子设备
CN109241418A (zh) * 2018-08-22 2019-01-18 中国平安人寿保险股份有限公司 基于随机森林的异常用户识别方法及装置、设备、介质
CN109218411A (zh) * 2018-08-22 2019-01-15 中国平安人寿保险股份有限公司 数据处理方法及装置、计算机可读存储介质、电子设备
CN109345302A (zh) * 2018-09-27 2019-02-15 腾讯科技(深圳)有限公司 机器学习模型训练方法、装置、存储介质和计算机设备
CN109345302B (zh) * 2018-09-27 2023-04-18 腾讯科技(深圳)有限公司 机器学习模型训练方法、装置、存储介质和计算机设备
CN109255391B (zh) * 2018-09-30 2021-07-23 武汉斗鱼网络科技有限公司 一种识别恶意用户的方法、装置及存储介质
CN109255391A (zh) * 2018-09-30 2019-01-22 武汉斗鱼网络科技有限公司 一种识别恶意用户的方法、装置及存储介质
CN109544150A (zh) * 2018-10-09 2019-03-29 阿里巴巴集团控股有限公司 一种分类模型生成方法及装置、计算设备及存储介质
CN109523296A (zh) * 2018-10-12 2019-03-26 中国平安人寿保险股份有限公司 用户行为概率分析方法及装置、电子设备、存储介质
CN109635990A (zh) * 2018-10-12 2019-04-16 阿里巴巴集团控股有限公司 一种训练方法、预测方法、装置及电子设备
CN109523296B (zh) * 2018-10-12 2023-10-27 中国平安人寿保险股份有限公司 用户行为概率分析方法及装置、电子设备、存储介质
CN109635990B (zh) * 2018-10-12 2022-09-16 创新先进技术有限公司 一种训练方法、预测方法、装置、电子设备及存储介质
CN109636446A (zh) * 2018-11-16 2019-04-16 北京奇虎科技有限公司 用户流失预测方法、装置及电子设备
CN109636446B (zh) * 2018-11-16 2023-10-24 三六零科技集团有限公司 用户流失预测方法、装置及电子设备
CN111222897B (zh) * 2018-11-23 2023-04-07 中国移动通信集团广东有限公司 基于客户上网满意度预测方法及装置
CN111222897A (zh) * 2018-11-23 2020-06-02 中国移动通信集团广东有限公司 基于客户上网满意度预测方法及装置
CN111353513B (zh) * 2018-12-20 2023-04-18 杭州海康威视数字技术股份有限公司 一种目标人群筛选的方法、装置、终端和存储介质
CN111353513A (zh) * 2018-12-20 2020-06-30 杭州海康威视数字技术股份有限公司 一种目标人群筛选的方法、装置、终端和存储介质
CN111401563A (zh) * 2018-12-28 2020-07-10 杭州海康威视数字技术股份有限公司 机器学习模型更新方法和装置
CN111401563B (zh) * 2018-12-28 2023-11-03 杭州海康威视数字技术股份有限公司 机器学习模型更新方法和装置
CN109801101A (zh) * 2019-01-03 2019-05-24 深圳壹账通智能科技有限公司 标签确定方法、装置、计算机设备和存储介质
CN111476258B (zh) * 2019-01-24 2024-01-05 杭州海康威视数字技术股份有限公司 一种基于注意力机制的特征提取方法、装置及电子设备
CN111476258A (zh) * 2019-01-24 2020-07-31 杭州海康威视数字技术股份有限公司 一种基于注意力机制的特征提取方法、装置及电子设备
CN111507483A (zh) * 2019-01-30 2020-08-07 鸿富锦精密电子(天津)有限公司 返修板检测装置、方法及计算机可读存储介质
CN111506617A (zh) * 2019-01-31 2020-08-07 华为技术有限公司 一种基于用户数据生成标签的方法及装置
CN111506617B (zh) * 2019-01-31 2023-10-20 华为技术有限公司 一种基于用户数据生成标签的方法及装置
CN110223108A (zh) * 2019-05-27 2019-09-10 北京金山安全软件有限公司 点击通过率的预测方法、装置及设备
CN110598124A (zh) * 2019-08-14 2019-12-20 平安科技(深圳)有限公司 数值属性挖掘方法、装置、计算机设备和存储介质
CN110730164A (zh) * 2019-09-18 2020-01-24 平安科技(深圳)有限公司 安全预警方法及相关设备、计算机可读存储介质
CN110730164B (zh) * 2019-09-18 2022-09-16 平安科技(深圳)有限公司 安全预警方法及相关设备、计算机可读存储介质
CN110956303A (zh) * 2019-10-12 2020-04-03 未鲲(上海)科技服务有限公司 信息预测方法、装置、终端及可读存储介质
CN111160604A (zh) * 2019-11-22 2020-05-15 深圳壹账通智能科技有限公司 缺失信息预测方法、装置、计算机设备及存储介质
CN110880149A (zh) * 2019-11-29 2020-03-13 上海商汤智能科技有限公司 信息处理方法及装置、电子设备和存储介质
CN111046952B (zh) * 2019-12-12 2023-11-14 深圳市铭数信息有限公司 标签挖掘模型的建立方法、装置、存储介质及终端
CN111062749A (zh) * 2019-12-12 2020-04-24 北京爱奇艺科技有限公司 增长量预估方法、装置、电子设备及存储介质
CN111046952A (zh) * 2019-12-12 2020-04-21 深圳市随手金服信息科技有限公司 标签挖掘模型的建立方法、装置、存储介质及终端
CN111209929A (zh) * 2019-12-19 2020-05-29 平安信托有限责任公司 访问数据处理方法、装置、计算机设备及存储介质
CN111159243B (zh) * 2019-12-30 2023-08-04 中国移动通信集团江苏有限公司 用户类型识别方法、装置、设备及存储介质
CN111159243A (zh) * 2019-12-30 2020-05-15 中国移动通信集团江苏有限公司 用户类型识别方法、装置、设备及存储介质
CN111191601A (zh) * 2019-12-31 2020-05-22 深圳云天励飞技术有限公司 同行用户识别方法、装置、服务器及存储介质
CN111178983A (zh) * 2020-01-03 2020-05-19 北京搜狐新媒体信息技术有限公司 用户性别预测方法、装置、设备及存储介质
CN111178983B (zh) * 2020-01-03 2024-03-12 北京搜狐新媒体信息技术有限公司 用户性别预测方法、装置、设备及存储介质
CN111222026B (zh) * 2020-01-09 2023-07-14 支付宝(杭州)信息技术有限公司 用户类别识别模型的训练方法和用户类别识别方法
CN111222026A (zh) * 2020-01-09 2020-06-02 支付宝(杭州)信息技术有限公司 用户类别识别模型的训练方法和用户类别识别方法
CN111340115B (zh) * 2020-02-27 2023-05-12 青岛创新奇智科技集团股份有限公司 基于特征动态构造的推荐模型训练方法及系统
CN111340115A (zh) * 2020-02-27 2020-06-26 深圳创新奇智科技有限公司 基于特征动态构造的推荐模型训练方法及系统
CN113496236B (zh) * 2020-03-20 2024-05-24 北京沃东天骏信息技术有限公司 用户标签信息确定方法、装置、设备和存储介质
CN113496236A (zh) * 2020-03-20 2021-10-12 北京沃东天骏信息技术有限公司 用户标签信息确定方法、装置、设备和存储介质
CN111652742B (zh) * 2020-04-30 2023-08-22 中国平安财产保险股份有限公司 用户数据处理方法、装置、电子设备及可读存储介质
CN111652742A (zh) * 2020-04-30 2020-09-11 中国平安财产保险股份有限公司 用户数据处理方法、装置、电子设备及可读存储介质
CN111898738A (zh) * 2020-07-30 2020-11-06 北京智能工场科技有限公司 一种基于全连接神经网络实现的移动终端用户性别预测方法和系统
CN112036486A (zh) * 2020-08-31 2020-12-04 北京百度网讯科技有限公司 训练标签生成模型的方法、装置、设备及其存储介质
CN112149807A (zh) * 2020-09-28 2020-12-29 北京百度网讯科技有限公司 用户特征信息的处理方法和装置
CN112445689B (zh) * 2020-11-27 2023-01-24 广州三七互娱科技有限公司 用户分类方法、装置及电子设备
CN112445689A (zh) * 2020-11-27 2021-03-05 广州三七互娱科技有限公司 用户分类方法、装置及电子设备
CN112529301B (zh) * 2020-12-14 2023-11-14 南京中兴力维软件有限公司 用电量预测方法、设备及存储介质
CN112529301A (zh) * 2020-12-14 2021-03-19 南京中兴力维软件有限公司 用电量预测方法、设备及存储介质
CN112738895A (zh) * 2020-12-25 2021-04-30 深圳市微网力合信息技术有限公司 Wifi信道分配方法及设备
CN112908453A (zh) * 2021-02-09 2021-06-04 京东方科技集团股份有限公司 数据处理方法、装置、设备和介质
CN114358807A (zh) * 2021-03-12 2022-04-15 上海序言泽网络科技有限公司 基于可预测用户特征属性的用户画像方法及系统
CN113344062A (zh) * 2021-05-31 2021-09-03 北京达佳互联信息技术有限公司 异常帐户识别方法、装置、服务器及存储介质
CN113344062B (zh) * 2021-05-31 2024-03-22 北京达佳互联信息技术有限公司 异常帐户识别方法、装置、服务器及存储介质
CN113391923A (zh) * 2021-06-18 2021-09-14 上海钧正网络科技有限公司 系统资源数据分配方法和装置
CN113988152A (zh) * 2021-09-23 2022-01-28 北京达佳互联信息技术有限公司 用户类型预测模型训练方法、资源分配方法、介质及装置
CN115545088B (zh) * 2022-02-22 2023-10-24 北京百度网讯科技有限公司 模型构建方法、分类方法、装置和电子设备
CN115545088A (zh) * 2022-02-22 2022-12-30 北京百度网讯科技有限公司 模型构建方法、分类方法、装置和电子设备
CN115361651B (zh) * 2022-08-19 2024-04-09 中国联合网络通信集团有限公司 终端定位方法、装置、电子设备及存储介质
CN115361651A (zh) * 2022-08-19 2022-11-18 中国联合网络通信集团有限公司 终端定位方法、装置、电子设备及存储介质
CN116028882A (zh) * 2023-03-29 2023-04-28 深圳市傲天科技股份有限公司 用户标注和分类方法、装置、设备及存储介质
CN116028882B (zh) * 2023-03-29 2023-06-02 深圳市傲天科技股份有限公司 用户标注和分类方法、装置、设备及存储介质
CN117574177A (zh) * 2024-01-15 2024-02-20 每日互动股份有限公司 一种用于用户扩线的数据处理方法、装置、介质及设备
CN117574177B (zh) * 2024-01-15 2024-04-19 每日互动股份有限公司 一种用于用户扩线的数据处理方法、装置、介质及设备

Also Published As

Publication number Publication date
CN106126597A (zh) 2016-11-16

Similar Documents

Publication Publication Date Title
WO2017219548A1 (zh) 用户属性预测方法及装置
US12093753B2 (en) Method and system for synthetic generation of time series data
US10026021B2 (en) Training image-recognition systems using a joint embedding model on online social networks
US10599774B1 (en) Evaluating content items based upon semantic similarity of text
US20190370695A1 (en) Enhanced pipeline for the generation, validation, and deployment of machine-based predictive models
WO2019062414A1 (zh) 应用程序管控方法、装置、存储介质及电子设备
US20180089542A1 (en) Training Image-Recognition Systems Based on Search Queries on Online Social Networks
US10311058B1 (en) Techniques for processing neural queries
US10692089B2 (en) User classification using a deep forest network
US11715042B1 (en) Interpretability of deep reinforcement learning models in assistant systems
US11157836B2 (en) Changing machine learning classification of digital content
US11586838B2 (en) End-to-end fuzzy entity matching
US9928284B2 (en) File recognition system and method
US20200012930A1 (en) Techniques for knowledge neuron enhancements
US20230022673A1 (en) Knowledge discovery based on indirect inference of association
US11507747B2 (en) Hybrid in-domain and out-of-domain document processing for non-vocabulary tokens of electronic documents
CN110377733B (zh) 一种基于文本的情绪识别方法、终端设备及介质
CN112612898A (zh) 文本分类的方法和装置
US20230275900A1 (en) Systems and Methods for Protecting Against Exposure to Content Violating a Content Policy
US20240086736A1 (en) Fault detection and mitigation for aggregate models using artificial intelligence
KR101894194B1 (ko) 감성 기반의 사용자 관리 방법 및 이를 수행하는 장치들
US12087413B2 (en) Method, apparatus and computer program product for graph-based encoding of natural language data objects
CN114707041A (zh) 消息推荐方法、装置、计算机可读介质及电子设备
WO2020170020A1 (en) Feedback mining with domain-specific modeling
US20230214676A1 (en) Prediction model training method, information prediction method and corresponding device

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16906088

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 16906088

Country of ref document: EP

Kind code of ref document: A1