WO2019205795A1 - 兴趣推荐方法、计算机设备及存储介质 - Google Patents

兴趣推荐方法、计算机设备及存储介质 Download PDF

Info

Publication number
WO2019205795A1
WO2019205795A1 PCT/CN2019/076164 CN2019076164W WO2019205795A1 WO 2019205795 A1 WO2019205795 A1 WO 2019205795A1 CN 2019076164 W CN2019076164 W CN 2019076164W WO 2019205795 A1 WO2019205795 A1 WO 2019205795A1
Authority
WO
WIPO (PCT)
Prior art keywords
user
interest
similarity
list
feature
Prior art date
Application number
PCT/CN2019/076164
Other languages
English (en)
French (fr)
Inventor
杨春风
Original Assignee
腾讯科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 腾讯科技(深圳)有限公司 filed Critical 腾讯科技(深圳)有限公司
Publication of WO2019205795A1 publication Critical patent/WO2019205795A1/zh
Priority to US16/909,682 priority Critical patent/US11593894B2/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2323Non-hierarchical techniques based on graph theory, e.g. minimum spanning trees [MST] or graph cuts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures

Definitions

  • the present application relates to the field of Internet technologies, and in particular, to an interest recommendation method, apparatus, server, and storage medium.
  • Video recommendations have become an integral part of online video services.
  • the existing video recommendation algorithms are mainly divided into non-personalized recommendation algorithms and personalized recommendation algorithms. Please refer to Figure 1.
  • the data used in these algorithms mainly include user images, user viewing records, and video attributes.
  • the non-personalized recommendation algorithm includes a popularity based video recommendation algorithm based on a popularity (Popularity) video recommendation algorithm and a user based on artificial statistical information.
  • Personalized recommendations mainly include relevant recommendations based on the user's current viewing video and personalized recommendations based on user history preferences (ie, historical viewing history).
  • related recommendations are based on Association Rules (AR); and historical recommendations based on historical preferences include Collaborative Filtering (CF) and Content-Based Recommendations (Content-Based, CB).
  • AR Association Rules
  • CB Content-Based Recommendations
  • Video recommendation algorithms include content-based recommendations, collaborative filtering recommendations, and social recommendations.
  • the common shortcoming of these algorithms is the problem of cold start and data sparsity, that is, when the user does not have enough viewing history, the traditional video recommendation algorithm often cannot meet the user's needs.
  • the traditional way to solve cold start is to cluster users, such as users of similar age, same gender, similar geographic area, or the same community.
  • various embodiments of the present application provide an interest recommendation method, a computer device, and a computer readable storage medium.
  • An interest recommendation method implemented by a computer device comprising:
  • the interest similarity prediction model is an interest similarity of each pair of users in the sample set according to the user history record.
  • the tree model coding hybrid linear model algorithm is implemented based on a tree model and a linear model;
  • a computer apparatus comprising a processor and a memory, the memory storing computer readable instructions, the computer readable instructions being executed by the processor such that the processor performs the following steps:
  • the interest similarity prediction model is an interest similarity of each pair of users in the sample set according to the user history record.
  • the tree model coding hybrid linear model algorithm is implemented based on a tree model and a linear model;
  • a non-transitory computer readable storage medium storing computer readable instructions, when executed by one or more processors, causes the one or more processors to perform the following steps:
  • the interest similarity prediction model is based on similar interest of each pair of users in the sample set according to the user history record. Degree, based on a tree model coding hybrid linear model algorithm; the tree model coding hybrid linear model algorithm is implemented based on a tree model and a linear model;
  • 1 is a classification structure diagram of a video recommendation algorithm in the prior art
  • FIG. 2 is a schematic diagram of an implementation environment provided by an embodiment of the present application.
  • FIG. 3 is a schematic diagram of a model of a tree model coding hybrid linear model provided by an embodiment of the present application.
  • FIG. 4 is a flowchart of a tree model coding hybrid linear model algorithm provided by an embodiment of the present application.
  • FIG. 5 is a flowchart of a method for generating an interest similarity prediction model according to an embodiment of the present application
  • FIG. 6 is a flowchart of a method for predicting similarity of interest provided by an embodiment of the present application.
  • FIG. 7 is a framework diagram of a user-based collaborative filtering algorithm provided by an embodiment of the present application.
  • FIG. 9 is a flowchart of an interest recommendation method provided by an embodiment of the present application.
  • FIG. 10 is a flowchart of a method for generating a video recommendation list according to an embodiment of the present application.
  • FIG. 11 is a schematic diagram of a user interface provided by an embodiment of the present application.
  • FIG. 12 is a schematic structural diagram of a computer device according to an embodiment of the present application.
  • FIG. 13 is a schematic structural diagram of a prediction model generation module according to an embodiment of the present application.
  • FIG. 14 is a schematic structural diagram of a tree model hybrid linear model module according to an embodiment of the present application.
  • 15 is a flowchart of a social software-based friend relationship chain video recommendation method according to an embodiment of the present application.
  • FIG. 16 is a schematic structural diagram of a computer device according to an embodiment of the present application.
  • the cold start indicates that the system accumulates too little data and cannot give personalized recommendations to new users. This is a big problem in product recommendation. Basically, the cold start problem can be divided into the following three categories:
  • User cold start mainly solves the problem of how to make personalized recommendations for new users. When a new user arrives, we don't have his behavioral data, so we can't predict its interest based on his historical behavior, so I can't give him a personalized recommendation.
  • Item Cold Start The item cold start primarily addresses the issue of how to recommend new items to users who might be interested in it.
  • System cold start mainly solves how to design a personalized recommendation system on a newly developed website (no user, no user behavior, only some items of information), so that the user can experience the website when it is just released.
  • Personalized recommendation service mainly solves how to design a personalized recommendation system on a newly developed website (no user, no user behavior, only some items of information), so that the user can experience the website when it is just released.
  • the embodiment of the present application mainly provides a processing method for a user cold start in a recommendation system.
  • the implementation environment includes: a plurality of terminal devices 210 and a server 220, which may be, but not limited to, a mobile phone, a tablet computer, and a desktop computer. And other terminal equipment.
  • the server 220 can be a server, a server cluster composed of several servers, or a cloud computing service center.
  • the terminal device 210 can communicate with various networks such as the Internet, an intranet, a wireless network, etc., and the wireless network can include a cellular telephone network, a wireless local area network, or a metropolitan area network.
  • the above wireless networks can use various communication standards, protocols, and technologies.
  • the terminal device 210 sends a request to the server 220 over a network, and the server 220 receives the request and performs processing.
  • the server 220 may obtain user information of a plurality of terminal devices 210, perform user interest similarity calculation according to the acquired user information, and provide relevant recommendations to the user according to the interest similarity, thereby finally implementing the user's personality. Recommended.
  • Linear models such as Linear Regression
  • the disadvantage is that they cannot fit nonlinear associations;
  • the decision tree has the advantage of being able to fit nonlinear relationships and can be applied to discrete features and continuous features.
  • the disadvantage is that it is not good at capturing linear or approximate linear relationships and is more complicated.
  • the embodiment of the present application proposes a Hybrid Tree-encoded Linear Model, and FIG. 3 shows the model.
  • the algorithm is mainly divided into two steps, specifically
  • the gradient lifting decision tree GBDT
  • GBDT gradient lifting decision tree
  • FIG. 4 a method flow diagram of a tree model hybrid linear model algorithm is illustrated, including:
  • a GBDT with 2 subtrees is used to fit the training data.
  • the result of the fitting is that the first subtree has 3 leaf nodes, and the second subtree has 2 leaf nodes. If a sample passes the GBDT and falls on the second leaf node in the first subtree (that is, coded as 010, each bit corresponds to a leaf node), and falls in the first subtree in the first subtree.
  • the leaf node that is, coded as 10
  • the final result of the sample is 01010, corresponding to five binary features.
  • a method for generating an interest similarity prediction model includes:
  • demographic characteristics For example, demographic characteristics, social software usage characteristics, network behavior characteristics, socio-cultural background characteristics, and historical interest similarity characteristics.
  • Demographic characteristics include at least one of the following information: age, age difference, region, gender, etc.;
  • the social software usage feature includes at least one of the following information: whether it is a social software friend (such as QQ, WeChat, Want Want, Nail, Alipay, MSN, Weibo, Yixin, etc.), historical interaction record (such as the frequency of sending messages, The number of messages sent, the number of common friends, the number of common groups, the number of emails sent each other, etc., the duration of the online, the frequency of use, etc.;
  • a social software friend such as QQ, WeChat, Want Want, Nail, Alipay, MSN, Weibo, Yixin, etc.
  • historical interaction record such as the frequency of sending messages, The number of messages sent, the number of common friends, the number of common groups, the number of emails sent each other, etc., the duration of the online, the frequency of use, etc.
  • the network behavior feature includes at least one of the following information: a website with a high frequency of browsing, a page view amount, a visit duration, a topic of interest, or a public number;
  • the sociocultural background features include at least one of the following information: academic qualifications, graduate school, occupation, work unit, hobbies, etc.;
  • the historical interest similarity feature includes at least one of the following information: interest similarity in the past three months, interest similarity in the past half year, interest similarity in the past year, and the like.
  • I u and I v are the video list sets viewed by the user u and the user v history (the past month), respectively, where the cosine similarity between the two user historical viewing sets is calculated as their interest similarity.
  • the feature of the sample set is used as an input of the tree model mixed linear model algorithm, and the interest similarity of each pair of users is used as a predicted target value, and the feature of the sample set is trained by a tree model mixed linear model algorithm. .
  • the tree model hybrid linear model algorithm specifically includes:
  • a GBDT with 2 subtrees is used to fit the training data.
  • the result of the fitting is that the first subtree has 3 leaf nodes, and the second subtree has 2 leaf nodes. If a sample passes the GBDT and falls on the second leaf node in the first subtree (that is, coded as 010, each bit corresponds to a leaf node), and falls in the first subtree in the first subtree.
  • the leaf node that is, coded as 10
  • the final result of the sample is 01010, corresponding to five binary features.
  • the prediction target value ie, the true interest similarity degree
  • the prediction target value is binarized, that is, the similarity is greater than a certain threshold value as a positive sample, and the other is used as a negative sample, thus A problem with binary classification.
  • the labeled sample data set (obtained by the method of constructing the labeled sample in this embodiment) is divided into a training set (70%) and a test set (30%).
  • the predicted performance evaluation index used is the area under the ROC curve.
  • the algorithm of the tree model coding hybrid linear model proposed in this embodiment is compared with several other commonly used machine learning algorithms (logical regression algorithm, decision tree algorithm and random forest algorithm), and the comparison results of the prediction effects are as follows. Show:
  • the tree model hybrid linear model proposed by the embodiment of the present application has a significant improvement in the accuracy of the similarity prediction.
  • the embodiment of the present application provides a method for predicting the similarity of interest.
  • the method specifically includes:
  • the target user is a cold-start user, and may be a newly registered user or a user with less history.
  • the feature information includes demographic characteristics, social software usage characteristics, network behavior characteristics, social cultural background characteristics, and historical interest similarity characteristics.
  • Demographic characteristics include at least one of the following information: age, age difference, region, gender, etc.;
  • the social software usage feature includes at least one of the following information: whether it is a social software friend (such as QQ, WeChat, Want Want, Nail, Alipay, MSN, Weibo, Yixin, etc.), historical interaction record (such as the frequency of sending messages, The number of messages sent, the number of common friends, the number of common groups, the number of emails sent each other, etc., the duration of the online, the frequency of use, etc.;
  • a social software friend such as QQ, WeChat, Want Want, Nail, Alipay, MSN, Weibo, Yixin, etc.
  • historical interaction record such as the frequency of sending messages, The number of messages sent, the number of common friends, the number of common groups, the number of emails sent each other, etc., the duration of the online, the frequency of use, etc.
  • the network behavior feature includes at least one of the following information: a website with a high frequency of browsing, a page view amount, a visit duration, a topic of interest, or a public number;
  • the sociocultural background features include at least one of the following information: academic qualifications, graduate school, occupation, work unit, hobbies, etc.;
  • the historical interest similarity feature includes at least one of the following information: interest similarity in the past three months, interest similarity in the past half year, interest similarity in the past year, and the like.
  • the feature information may also be a description of the user's interest, such as pre-capturing the user information.
  • the user when the new user enters the system, in addition to filling in some basic personal information, the user may also set some categories or labels for the user. For the user to choose. It can also be an off-site behavior imported from other websites. For example, if a user logs in with a social networking account, the user can import part of the behavior data and social network data of the user on the social networking website.
  • the interest similarity prediction model is used to predict an interest similarity between the target user and the user group according to the feature information; the interest similarity prediction model is an interest of each pair of users in a sample set according to a user history record. Similarity is implemented based on a tree model coding hybrid linear model algorithm; the tree model coding hybrid linear model algorithm is implemented based on a tree model and a linear model.
  • an interest similarity prediction model is used to predict an interest similarity between the target user and each user in the user group.
  • User history includes user history viewing records.
  • the method for generating the interest similarity prediction model specifically includes:
  • the following technical features can be designed, including demographic characteristics, social software usage characteristics, network behavior characteristics, socio-cultural background characteristics, and historical interest similarity characteristics.
  • I u and I v are the video list sets viewed by the user u and the user v history (the past month), respectively, where the cosine similarity between the two user historical viewing sets is calculated as their interest similarity.
  • the feature of the sample set is used as an input of the tree model mixed linear model algorithm, and the interest similarity of each pair of users is used as a predicted target value, and the feature of the sample set is trained by a tree model mixed linear model algorithm. .
  • FIG. 7 shows a framework diagram of a user-based collaborative filtering algorithm.
  • the user-based collaborative filtering algorithm can be split into two steps:
  • a group of users with similar interests are searched by comparing the historical viewing records of the target user and other users, and then other videos preferred by the group of users (ie, target users) are selected.
  • Recommended for the target user This algorithm is simple and effective when the data is sufficient, but there are fewer target users for new users or viewing behaviors, because they do not know their viewing preferences, so they cannot find a user group similar to the target user, so there is no way to give the target. The user accurately recommended the video.
  • the embodiment of the present application provides an enhanced recommendation method, which is an enhanced user-based collaborative filtering algorithm.
  • the algorithm framework diagram is shown in Figure 8.
  • the supervised machine learning method is used to predict the similarity between users, thus enhancing the user-based collaborative filtering algorithm.
  • an interest recommendation method specifically includes:
  • the target user is a cold-start user, and may be a newly registered user or a user with less history.
  • the feature information includes:
  • demographic characteristics For example, demographic characteristics, social software usage characteristics, network behavior characteristics, socio-cultural background characteristics, and historical interest similarity characteristics.
  • Demographic characteristics include at least one of the following information: age, age difference, region, gender, etc.;
  • the social software usage feature includes at least one of the following information: whether it is a social software friend (such as QQ, WeChat, Want Want, Nail, Alipay, MSN, Weibo, Yixin, etc.), historical interaction record (such as the frequency of sending messages, The number of messages sent, the number of common friends, the number of common groups, the number of emails sent each other, etc., the duration of the online, the frequency of use, etc.;
  • a social software friend such as QQ, WeChat, Want Want, Nail, Alipay, MSN, Weibo, Yixin, etc.
  • historical interaction record such as the frequency of sending messages, The number of messages sent, the number of common friends, the number of common groups, the number of emails sent each other, etc., the duration of the online, the frequency of use, etc.
  • the network behavior feature includes at least one of the following information: a website with a high frequency of browsing, a page view amount, a visit duration, a topic of interest, or a public number;
  • the sociocultural background features include at least one of the following information: academic qualifications, graduate school, occupation, work unit, hobbies, etc.;
  • the historical interest similarity feature includes at least one of the following information: interest similarity in the past three months, interest similarity in the past half year, interest similarity in the past year, and the like.
  • the feature information may also be a description of the user's interest, such as pre-capturing the user information.
  • the user when the new user enters the system, in addition to filling in some basic personal information, the user may also set some categories or labels for the user. For the user to choose. It can also be an off-site behavior imported from other websites. For example, if a user logs in with a social networking account, the user can import part of the behavior data and social network data of the user on the social networking website.
  • the interest similarity prediction model is used to predict an interest similarity between the target user and the user group according to the feature information; the interest similarity prediction model is an interest of each pair of users in a sample set according to a user history record. Similarity is implemented based on a tree model coding hybrid linear model algorithm; the tree model coding hybrid linear model algorithm is implemented based on a tree model and a linear model.
  • an interest similarity prediction model is used to predict an interest similarity between the target user and each user in the user group.
  • User history includes user history viewing records.
  • the method for generating the interest similarity prediction model specifically includes:
  • demographics For this million pairs of users, three types of characteristics are designed: demographics, social features, and historical interest characteristics.
  • I u and I v are the video list sets viewed by the user u and the user v history (the past month), respectively, where the cosine similarity between the two user historical viewing sets is calculated as their interest similarity.
  • step S9024 further includes the following sub-steps:
  • the feature of the sample set and the binary feature are used as input features, and training is performed by a linear model.
  • the similarities are ranked in descending order, and the similarity ranking is selected.
  • K users are recommended users, where K is an integer, and the specific value can be set according to specific requirements.
  • the item in the interest list is scored and similarly weighted by acquiring the interest list of the recommended user, and the result of the rating and the similarity weighting is sorted to obtain a sorting result, according to the sorting result.
  • the target user creates a recommendation list.
  • the recommendation list includes a list of videos that the recommended user is interested in and the target user has not viewed.
  • the video recommendation is taken as an example, including:
  • the set is represented by the set S(u, K).
  • S9044 Generate a recommendation list according to the sorting result, and perform recommendation on the target user u.
  • the degree to which user u is interested can be calculated by the following formula:
  • r vi represents the degree of preference of user v for video i, i.e., the score for i
  • w uv represents the similarity between users u and v.
  • Collaborative filtering recommendation systems often need to process millions or even hundreds of millions of data records. How to access these massive data and quickly calculate the recommended results becomes a huge challenge for collaborative filtering.
  • Cloud computing adopts distributed technology.
  • the cloud system is built on a large number of inexpensive server clusters. Through large-scale clustering, it obtains the computing power and storage capacity equivalent to high-performance computers. Cluster management improves system scalability.
  • Combining collaborative filtering with cloud computing technology enables collaborative filtering recommendation systems to have stronger parallel computing capabilities, fault tolerance and higher recommended real-time performance.
  • An interest recommendation method provided by the present application can be applied to a personalized recommendation module of a video website or a video APP.
  • the user is provided with a video list that conforms to his viewing interest, and implements the module of “Thousands of People”. surface”. Increased user experience and increased user viscosity.
  • the embodiment of the present application further provides an interest recommendation device.
  • the method specifically includes:
  • the feature information obtaining module 1210 is configured to acquire feature information of the target user.
  • the interest similarity prediction module 1220 is configured to predict an interest similarity between the target user and the user group by using an interest similarity prediction model according to the feature information; the interest similarity prediction model is a sample according to a user history record.
  • the interest similarity of each pair of users in the set is implemented based on a tree model coding hybrid linear model algorithm; the tree model coding hybrid linear model algorithm is implemented based on a tree model and a linear model.
  • the recommended user determining module 1230 is configured to determine, according to the interest similarity, a recommended user in the user group that is similar to the target user.
  • the recommended user determining module 1230 further includes a sorting module 1231, which is used to sort the interest similarity between the target user and each user in the user group from high to low, and select the top ranked Several users are recommended users.
  • the recommendation list creation module 1240 is configured to acquire the interest list of the recommended user, and create a recommendation list for the target user according to the interest list.
  • the recommendation list creation module 1240 includes a score weighting module 1241 and a list generation module 1242, and the score weighting module 1241 is configured to acquire the interest list of the recommended user, and perform scoring and similarity weighting on the items in the interest list;
  • the list generating module 1242 is configured to sort the results of the scoring and similarity weighting to obtain a sorting result, and generate a recommendation list according to the sorting result.
  • the interest similarity prediction module 1220 includes a prediction model generation module 1221 for generating a prediction model of interest similarity based on the feature information.
  • the prediction model generation module 1221 further includes:
  • a sample set obtaining module 1310 configured to acquire a sample set of a user history viewing record
  • a feature construction module 1320 configured to construct a feature of the sample set
  • u represents a first user
  • v represents a second user
  • Iu and Iv are historical video watch list sets of the first user and the second user, respectively ;
  • a training module 1340 configured to use a feature of the sample set as an input of the tree model hybrid linear model algorithm, using the interest similarity of each pair of users as a predicted target value, using a tree model mixed linear model algorithm The characteristics of the sample set are trained.
  • the tree model mixed linear model includes:
  • the encoding module 1410 is configured to encode the feature of the sample set by using a tree model to obtain a coded binary feature
  • the fitting module 1420 is configured to use the feature of the sample set and the binary feature as input features to perform training through a linear model.
  • the embodiment of the present application further provides a video recommendation method based on a social software-based friend relationship chain.
  • the method includes:
  • a part of the users are filtered first, leaving only at least one of the relationship chains is the friend relationship chain of the X video users.
  • Short-term The intimacy calculated based on the communication frequency of recent social software; the disadvantage of adopting short-term intimacy is in communication with friends who may include some aspects such as business, and the sparsity is large (in the short term, such as 30) The number of friends in the day is generally small, so it is ultimately necessary to comprehensively weigh the long-term and short-term intimacy to select the final friend video recommendation candidate.
  • the embodiment of the present application further provides a server.
  • FIG. 16 it is a schematic structural diagram of a server, where the server is used to implement the recommended system cold start processing method provided in the foregoing embodiment, specifically, the server structure.
  • the recommended system cold start processing device described above may be included.
  • the server 1600 can vary considerably depending on configuration or performance, and can include one or more Central Processing Units (CPUs) 1610 (eg, one or more processors) and memory 1630, one or one
  • the computer readable storage medium 1620 eg, one or one of the Shanghai quantity storage devices
  • Memory 1630 and computer readable storage medium 1620 can be short-lived or persistent.
  • the program stored on computer readable storage medium 1620 can include one or more modules, each of which can include a series of instruction operations in the server.
  • central processor 1610 can be configured to communicate with computer readable storage medium 1620 on which a series of instruction operations in computer readable storage medium 1620 are performed.
  • Server 1600 may also include one or more power sources 1660, one or more wired or wireless network interfaces 1650, one or more input and output interfaces 1640, and/or one or more operating systems 1621, such as Windows ServerTM, Mac OS XTM, UnixTM, LinuxTM, FreeBSDTM and more.
  • one or more power sources 1660 one or more wired or wireless network interfaces 1650, one or more input and output interfaces 1640, and/or one or more operating systems 1621, such as Windows ServerTM, Mac OS XTM, UnixTM, LinuxTM, FreeBSDTM and more.
  • operating systems 1621 such as Windows ServerTM, Mac OS XTM, UnixTM, LinuxTM, FreeBSDTM and more.
  • the embodiment of the present application further provides a computer readable storage medium, which can be used to save program code for implementing the recommended system cold start processing method in the foregoing method embodiment.
  • the program code can be used to implement:
  • the interest similarity prediction model is implemented by a tree model coding hybrid linear algorithm
  • the computer readable storage medium may be located in at least one network device of the plurality of network devices of the computer network.
  • the computer readable storage medium may include, but is not limited to, a USB flash drive, a Read-Only Memory (ROM), a Random Access Memory (RAM), and a mobile device.
  • ROM Read-Only Memory
  • RAM Random Access Memory
  • the present application obtains feature information of a target user, and according to the feature information, uses a supervised machine learning algorithm to predict an interest similarity between the target user and other user groups, and determines according to the predicted similarity of interest.
  • the user is recommended to create a recommendation list for the target user according to the recommended user's interest list.
  • the application solves the cold start problem of the traditional collaborative filtering algorithm, that is, the recommendation problem when the user does not have enough viewing history, improves the accuracy of the recommendation result, brings about a significant increase in the click rate, and realizes the personalized recommendation. Thousands of thousands of people.”
  • the structure shown in this embodiment is only a partial structure related to the solution of the present application, and does not constitute a limitation on the device to which the solution of the present application is applied.
  • the specific device may include more or more than shown. There are few parts, or some parts are combined, or have different parts.
  • the program can be stored in a non-transitory computer.
  • the program may be stored in a non-volatile storage medium of the computer system and executed by at least one processor in the computer system to implement an embodiment including the methods as described above.
  • the storage medium may be a magnetic disk, an optical disk, a read-only memory (ROM), or a random access memory (RAM).

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computational Linguistics (AREA)
  • Medical Informatics (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Discrete Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种兴趣推荐方法、计算机设备及存储介质,所述方法包括:获取目标用户的特征信息;根据所述特征信息,采用兴趣相似度预测模型预测所述目标用户与用户群体之间的兴趣相似度;所述兴趣相似度预测模型是根据用户历史记录的样本集合中每对用户的兴趣相似度,基于树模型编码混合线性模型算法实现的;所述树模型编码混合线性模型算法是基于树模型和线性模型实现的;根据所述兴趣相似度,确定所述用户群体中与所述目标用户兴趣相似的推荐用户;获取所述推荐用户的兴趣列表,并为所述目标用户创建推荐列表。

Description

兴趣推荐方法、计算机设备及存储介质
相关申请的交叉引用
本申请要求于2018年04月26日提交中国专利局、申请号为2018103876928、发明名称为“一种兴趣推荐方法、装置、服务器及存储介质”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及互联网技术领域,尤其涉及一种兴趣推荐方法、装置、服务器及存储介质。
背景技术
视频推荐已经成为在线视频服务中不可或缺的一部分。现有的视频推荐算法主要分为非个性化推荐算法和个性化推荐算法,请参见图1,这些算法用到的数据主要有用户画像,用户观影记录,以及视频属性等信息。非个性化推荐算法包括基于流行度(Popularity)视频推荐算法和基于人工统计学信息的用户分群配合基于流行度的视频推荐。个性化推荐主要包括基于用户当前观看视频的相关推荐以及基于用户历史偏好(即历史观看记录)的个性化推荐。对于个性化推荐来说,相关推荐是基于关联规则(Association Rule,AR)的方式;而基于历史偏好的个性化推荐包括协同过滤推荐(Collaborative Filtering,CF)和基于内容的推荐(Content-Based,CB)。
目前比较流行的视频推荐算法包括基于内容的推荐、协同过滤推荐和社交化推荐(social recommendation)。这些算法共同的不足之处是面对冷启动(cold start)和数据稀疏(data sparsity)的难题,即当用户没有足够的观看历史时,传统的视频推荐算法往往不能够满足用户的需求。
对于协同过滤和基于内容的推荐,需要用到用户的历史观影行为数据,这些方法对于新用户或者行为较少用户无法使用或者效果差,这些问题都会 影响到用户的体验从而影响用户粘性和视频服务的长远发展。
传统的解决冷启动的方法是对用户进行聚类,比如寻找相似年龄、相同性别、相近地域或者同一社群的用户。
发明内容
有鉴于此,本申请的各种实施例,提供了一种兴趣推荐方法、计算机设备及计算机可读存储介质。
一种兴趣推荐方法,该方法由计算机设备实施,包括:
获取目标用户的特征信息;
根据所述特征信息,采用兴趣相似度预测模型预测所述目标用户与用户群体之间的兴趣相似度;所述兴趣相似度预测模型是根据用户历史记录的样本集合中每对用户的兴趣相似度,基于树模型编码混合线性模型算法实现的;所述树模型编码混合线性模型算法是基于树模型和线性模型实现的;
根据所述兴趣相似度,确定所述用户群体中与所述目标用户兴趣相似的推荐用户;及
获取所述推荐用户的兴趣列表,并根据所述兴趣列表为所述目标用户创建推荐列表。
一种计算机设备,包括处理器和存储器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行以下步骤:
获取目标用户的特征信息;
根据所述特征信息,采用兴趣相似度预测模型预测所述目标用户与用户群体之间的兴趣相似度;所述兴趣相似度预测模型是根据用户历史记录的样本集合中每对用户的兴趣相似度,基于树模型编码混合线性模型算法实现的;所述树模型编码混合线性模型算法是基于树模型和线性模型实现的;
根据所述兴趣相似度,确定所述用户群体中与所述目标用户兴趣相似的推荐用户;及
获取所述推荐用户的兴趣列表,并根据所述兴趣列表为所述目标用户创建推荐列表。
一种非易失性的计算机可读存储介质,存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行以下步骤:
获取目标用户的特征信息;
根据所述特征信息,采用兴趣相似度预测模型预测所述目标用户与用户群体之间的兴趣相似度;所述兴趣相似度预测模型基于是根据用户历史记录的样本集合中每对用户的兴趣相似度,基于树模型编码混合线性模型算法实现的;所述树模型编码混合线性模型算法是基于树模型和线性模型实现的;
根据所述兴趣相似度,确定所述用户群体中与所述目标用户兴趣相似的推荐用户;及
获取所述推荐用户的兴趣列表,并根据所述兴趣列表为所述目标用户创建推荐列表。
本申请的一个或多个实施例的细节在下面的附图和描述中提出。本申请的其它特征、目的和优点将从说明书、附图以及权利要求书变得明显。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是现有技术中视频推荐算法的分类结构图;
图2是本申请实施例提供的实施环境的示意图;
图3是本申请实施例提供的一种树模型编码混合线性模型的模型示意图;
图4是本申请实施例提供的一种树模型编码混合线性模型算法的流程图;
图5是本申请实施例提供的一种兴趣相似度预测模型生成方法流程图;
图6是本申请实施例提供的一种兴趣相似度的预测方法流程图;
图7是本申请实施例提供的一种基于用户的协同过滤算法的框架图;
图8是本申请实施例提供的一种兴趣推荐方法的算法框架图;
图9是本申请实施例提供的一种兴趣推荐方法流程图;
图10是本申请实施例提供的一种视频推荐列表生成方法流程图;
图11是本申请实施例提供的一种用户界面示意图;
图12是本申请实施例提供的一种计算机设备结构示意图;
图13是本申请实施例提供的一种预测模型生成模块结构示意图;
图14是本申请实施例提供的一种树模型混合线性模型模块的结构示意图;
图15是本申请实施例提供的一种基于社交软件的好友关系链视频推荐方法流程图;
图16是本申请实施例提供的一种计算机设备构架示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
冷启动在推荐系统中表示该系统积累数据量过少,无法给新用户做个性化推荐的问题,这是产品推荐的一大难题。基本上,冷启动问题可以分为以下三类:
用户冷启动:用户冷启动主要解决如何给新用户做个性化推荐的问题。当新用户到来时,我们没有他的行为数据,所以也无法根据他的历史行为预测其兴趣,从而无法借此给他做个性化推荐。
物品冷启动:物品冷启动主要解决如何将新的物品推荐给可能对它感兴趣的用户这一问题。
系统冷启动:系统冷启动主要解决如何在一个新开发的网站上(还没有用户,也没有用户行为,只有一些物品的信息)设计个性化推荐系统,从而在网站刚发布时就让用户体验到个性化推荐服务这一问题。
本申请实施例主要提供的是针对推荐系统中用户冷启动的处理方法。
请参见图2,其示出了本申请实施例提供的实施环境的示意图,该实施环境包括:若干终端设备210和服务器220,所述终端设备210可以但不限于为手机、平板电脑、台式计算机等终端设备。所述服务器220可以是一台服务器,也可以是由若干服务器组成的服务器集群,或者是一个云计算服务中心。
所述终端设备210可以与各种网络如互联网、企业内部网、无线网络等进行通讯,上述的无线网络可包括蜂窝式电话网、无线局域网或者城域网。上述的无线网络可以使用各种通信标准、协议及技术。所述终端设备210通过网络向所述服务器220发送请求,所述服务器220接收所述请求并进行处理。
在实际应用场景中,服务器220可获取若干终端设备210的用户信息,根据获取的用户信息进行用户兴趣相似度的计算,并根据所述兴趣相似度为用户提供相关的推荐,最终实现用户的个性化推荐。
最常用的有监督机器学习算法有线性模型和树模型,线性模型,如线性回归(Linear Regression)的优点是简单,易用于大规模数据集,缺点是无法拟合非线性关联;而树模型,如决策树(Decision Tree)的优点是可以拟合非线性关系,而且可以应用于离散特征和连续特征上,缺点是不善于捕捉线性或者近似线性关系,且较为复杂。
为了同时利用两类模型的优点,本申请实施例提出了一种树模型编码混合线性模型(Hybrid Tree-encoded Linear Model),图3示出了其模型,该算法主要分为两个步骤,具体来说,为了增强模型的最终非线性表达能力,先使用梯度提升决策树(GBDT)对特征进行非线性变换,即将原始特征变换成一系列二进制特征,类似于编码。
再将所有编码后的特征,即二值特征和所有的原始特征一起作为输入特征,放入线性回归模型中训练(使用梯度下降法进行训练),得到最终的混合 模型结果,将训练好的模型在测试集上进行预测,即可判断该模型的效果。
请参见图4,其示出了一种树模型混合线性模型算法的方法流程图,包括:
S401.采用树模型对所述样本集合的特征进行编码,得到编码后的二值特征。
例如,使用有2棵子树的GBDT来拟合训练数据,拟合的结果是第一颗子树有3个叶子节点,第二颗子树有2个叶子节点。如果一个样本经过该GBDT后在第一颗子树中落在了第二个叶子节点(即编码为010,每一位对应一个叶子节点),在第二颗子树中落在了第一个叶子节点(即编码为10),这样最终该样本的编码结果为01010,对应了5个二值特征。
S402.将所述样本集合的特征和所述二值特征作为输入特征,通过线性模型进行训练。
再将所有编码后的特征,即5个二值特征和所有的原始特征一起作为输入特征,放入线性回归模型中训练(使用梯度下降法进行训练),得到最终的混合模型结果,将训练好的模型在测试集上进行预测,即可判断该模型的效果。
请参见图5,其示出了一种兴趣相似度预测模型生成方法,具体包括:
S501.获取用户历史观影记录的样本集合。
因为是有监督机器学习,需要构造有标签的样本来进行学习:从过去一个月历史观影记录表中随机抽取一百万对用户,每一对用户均为活跃用户(如观影数量>=30)。
S502.构造所述样本集合的特征。
为了构建有效的有监督机器学习算法,分别需要进行数据准备(特征构造和选择)。
作为机器学习算法的输入,我们需要去构造这些样本的特征:
对这一百万对用户,可以设计以下特征:
比如,人口统计学特征、社交软件使用特征、网络行为特征、社会文化背景特征以及历史兴趣相似度特征等。
人口统计学特征包括以下信息中的至少一种:年龄、年龄差、所在的地 区、性别等;
社交软件使用特征包括以下信息中的至少一种:是否是社交软件好友(比如QQ、微信、旺旺、钉钉、支付宝、MSN、微博、易信等),历史交互记录(比如发消息频率,发消息的数量,共同好友数,共同群组数,互发邮件数等),在线时长,使用频率等;
网络行为特征包括以下信息中的至少一种:浏览频率较高的网站、页面浏览量、访问时长、关注的话题或者公众号等;
社会文化背景特征包括以下信息中的至少一种:学历、毕业学校、职业、工作单位、兴趣爱好等;
历史兴趣相似度特征包括以下信息中的至少一种:过去三个月兴趣相似度、过去半年兴趣相似度、过去一年兴趣相似度等。
S503.计算所述样本集合中每对用户的兴趣相似度。
对于用户u和用户v,他们的兴趣相似度定义为:
Figure PCTCN2019076164-appb-000001
I u和I v分别是用户u和用户v历史(过去一个月)观看过的视频列表集合,这里是计算了两个用户历史观影集合之间的余弦相似度作为他们的兴趣相似度的。
S504.使用树模型混合线性模型算法对所述特征进行训练和预测。
将所述样本集合的特征作为所述树模型混合线性模型算法的输入,将所述每对用户的兴趣相似度作为预测目标值,采用树模型混合线性模型算法对所述样本集合的特征进行训练。
所述树模型混合线性模型算法具体包括:
S401.采用树模型对所述样本集合的特征进行编码,得到编码后的二值特征。
例如,使用有2棵子树的GBDT来拟合训练数据,拟合的结果是第一颗子树有3个叶子节点,第二颗子树有2个叶子节点。如果一个样本经过该GBDT后在第一颗子树中落在了第二个叶子节点(即编码为010,每一位对 应一个叶子节点),在第二颗子树中落在了第一个叶子节点(即编码为10),这样最终该样本的编码结果为01010,对应了5个二值特征。
S402.将所述样本集合的特征和所述二值特征作为输入特征,通过线性模型进行训练。
再将所有编码后的特征,即5个二值特征和所有的原始特征一起作为输入特征,放入线性回归模型中训练(使用梯度下降法进行训练),得到最终的混合模型结果,将训练好的模型在测试集上进行预测,即可判断该模型的效果。
为了将该预测问题简单化,本实施例中将预测目标值(即真实兴趣相似度)进行二值化,即相似度大于某一个门限值的作为正样本,其他的作为负样本,这样就是一个二分类(binary classification)的问题。
将有标签的样本数据集(按本实施例中构造有标签的样本的方法得到)分为训练集(占70%)和测试集(占30%)。采用的预测效果评价指标是AUC值(area under the ROC curve)。将本实施例提出的树模型编码混合线性模型的算法和其他几个常用机器学习算法(逻辑斯特回归算法,决策树算法和随机森林算法)进行了比较,其预测效果的比较结果如下表所示:
算法 AUC值
逻辑斯特回归 0.783
决策树 0.810
随机森林 0.818
树模型编码混合线性模型 0.834
从表中可以看出,相对于逻辑斯特回归算法,决策树算法和随机森林算法,本申请实施例提出的树模型混合线性模型在相似度预测的准确性上有明显提升。
对于推荐系统冷启动而导致的无法计算目标用户与用户群体之间的相似度,本申请实施例提供了一种兴趣相似度的预测方法,请参见图6,具体包括:
S601.获取目标用户的特征信息。
所述目标用户即为冷启动的用户,可以是新注册的用户或者是历史记录较少的用户。
所述特征信息包括:人口统计学特征、社交软件使用特征、网络行为特征、社会文化背景特征以及历史兴趣相似度特征等。
人口统计学特征包括以下信息中的至少一种:年龄、年龄差、所在的地区、性别等;
社交软件使用特征包括以下信息中的至少一种:是否是社交软件好友(比如QQ、微信、旺旺、钉钉、支付宝、MSN、微博、易信等),历史交互记录(比如发消息频率,发消息的数量,共同好友数,共同群组数,互发邮件数等),在线时长,使用频率等;
网络行为特征包括以下信息中的至少一种:浏览频率较高的网站、页面浏览量、访问时长、关注的话题或者公众号等;
社会文化背景特征包括以下信息中的至少一种:学历、毕业学校、职业、工作单位、兴趣爱好等;
历史兴趣相似度特征包括以下信息中的至少一种:过去三个月兴趣相似度、过去半年兴趣相似度、过去一年兴趣相似度等。
所述特征信息还可以是用户的兴趣描述,比如对用户信息进行预采集,在一个实施例中,当新用户进入系统时除了填写一些个人基本信息之外,还可以为用户设置一些类别或者标签供用户选择。还可以是从其他网站导入的用户站外行为,比如用户利用社交网站账号登录,就可以在获得用户授权的情况下导入用户在该社交网站的部分行为数据和社交网络数据。
S602.根据所述特征信息,采用兴趣相似度预测模型预测所述目标用户与用户群体之间的兴趣相似度;所述兴趣相似度预测模型是根据用户历史记录的样本集合中每对用户的兴趣相似度,基于树模型编码混合线性模型算法实现的;所述树模型编码混合线性模型算法是基于树模型和线性模型实现的。
当获取到所述目标用户的特征信息时,采用兴趣相似度预测模型,预测所述目标用户与所述用户群体中的每个用户之间的兴趣相似度。用户历史记录包括用户历史观影记录。
所述兴趣相似度预测模型的生成方法具体包括:
S6021.获取用户历史观影记录的样本集合。
因为是有监督机器学习,需要构造有标签的样本来进行学习:从过去一个月历史观影记录表中随机抽取一百万对用户,每一对用户均为活跃用户(如观影数量>=30)。
S6022.构造所述样本集合的特征。
为了构建有效的有监督机器学习算法,分别需要进行数据准备(特征构造和选择)。
作为机器学习算法的输入,我们需要去构造这些样本的特征:
对这一百万对用户,可以设计如下技术特征,包括人口统计学特征、社交软件使用特征、网络行为特征、社会文化背景特征以及历史兴趣相似度特征等。
S6023.计算所述样本集合中每对用户的兴趣相似度。
对于用户u和用户v,他们的兴趣相似度定义为:
Figure PCTCN2019076164-appb-000002
I u和I v分别是用户u和用户v历史(过去一个月)观看过的视频列表集合,这里是计算了两个用户历史观影集合之间的余弦相似度作为他们的兴趣相似度的。
S6024.使用树模型混合线性模型算法对所述特征进行训练和预测。
将所述样本集合的特征作为所述树模型混合线性模型算法的输入,将所述每对用户的兴趣相似度作为预测目标值,采用树模型混合线性模型算法对所述样本集合的特征进行训练。
请参见图7,其示出了一种基于用户的协同过滤算法的框架图,基于用户的协同过滤算法可拆分为两个步骤:
找到与目标用户兴趣相似的用户集合;
找到这个集合中用户喜欢的,并且目标用户没有看过的物品推荐给目标用户。
具体来说,当需要给一个目标用户推荐视频时,通过比较该目标用户和 其他用户的历史观影记录,来寻找兴趣相似的一群用户,然后将这群用户所偏好的其他视频(即目标用户没有看过的)推荐给目标用户。这个算法在数据充足的情况下简单有效,但是对于新用户或者观影行为较少目标用户,因为不知道他们的观影喜好,从而无法找到与目标用户相似的用户群体,这样就没法给目标用户准确的推荐视频了。
为了解决因为冷启动的原因导致无法计算用户兴趣相似度,而使得协同过滤算法失效的问题,本申请实施例提供了一种兴趣推荐方法,是一种增强型的基于用户的协同过滤算法,其算法框架图请参见图8,通过有监督机器学习方法预测用户之间的兴趣相似度,从而增强了基于用户的协同过滤算法。
请参见图9,一种兴趣推荐方法具体包括:
S901.获取目标用户的特征信息。
所述目标用户即为冷启动的用户,可以是新注册的用户或者是历史记录较少的用户。
所述特征信息包括:
比如,人口统计学特征、社交软件使用特征、网络行为特征、社会文化背景特征以及历史兴趣相似度特征等。
人口统计学特征包括以下信息中的至少一种:年龄、年龄差、所在的地区、性别等;
社交软件使用特征包括以下信息中的至少一种:是否是社交软件好友(比如QQ、微信、旺旺、钉钉、支付宝、MSN、微博、易信等),历史交互记录(比如发消息频率,发消息的数量,共同好友数,共同群组数,互发邮件数等),在线时长,使用频率等;
网络行为特征包括以下信息中的至少一种:浏览频率较高的网站、页面浏览量、访问时长、关注的话题或者公众号等;
社会文化背景特征包括以下信息中的至少一种:学历、毕业学校、职业、工作单位、兴趣爱好等;
历史兴趣相似度特征包括以下信息中的至少一种:过去三个月兴趣相似度、过去半年兴趣相似度、过去一年兴趣相似度等。
所述特征信息还可以是用户的兴趣描述,比如对用户信息进行预采集, 在一个实施例中,当新用户进入系统时除了填写一些个人基本信息之外,还可以为用户设置一些类别或者标签供用户选择。还可以是从其他网站导入的用户站外行为,比如用户利用社交网站账号登录,就可以在获得用户授权的情况下导入用户在该社交网站的部分行为数据和社交网络数据。
S902.根据所述特征信息,采用兴趣相似度预测模型预测所述目标用户与用户群体之间的兴趣相似度;所述兴趣相似度预测模型是根据用户历史记录的样本集合中每对用户的兴趣相似度,基于树模型编码混合线性模型算法实现的;所述树模型编码混合线性模型算法是基于树模型和线性模型实现的。
当获取到所述目标用户的特征信息时,采用兴趣相似度预测模型,预测所述目标用户与所述用户群体中的每个用户之间的兴趣相似度。用户历史记录包括用户历史观影记录。
所述兴趣相似度预测模型的生成方法具体包括:
S9021.获取用户历史观影记录的样本集合。
因为是有监督机器学习,需要构造有标签的样本来进行学习:从过去一个月历史观影记录表中随机抽取一百万对用户,每一对用户均为活跃用户(如观影数量>=30)。
S9022.构造所述样本集合的特征。
为了构建有效的有监督机器学习算法,分别需要进行数据准备(特征构造和选择)。
作为机器学习算法的输入,我们需要去构造这些样本的特征:
对这一百万对用户,设计三类特征:人口统计学特征、社交特征和历史兴趣特征。
S9023.计算所述样本集合中每对用户的兴趣相似度。
对于用户u和用户v,他们的兴趣相似度定义为:
Figure PCTCN2019076164-appb-000003
I u和I v分别是用户u和用户v历史(过去一个月)观看过的视频列表集合,这里是计算了两个用户历史观影集合之间的余弦相似度作为他们的兴趣相似 度的。
S9024.将所述样本集合的特征作为所述树模型混合线性模型算法的输入,将所述每对用户的兴趣相似度作为预测目标值,采用树模型混合线性模型算法对所述样本集合的特征进行训练。
上述步骤S9024还包括如下子步骤:
采用树模型对所述样本集合的特征进行编码,得到编码后的二值特征;
将所述样本集合的特征和所述二值特征作为输入特征,通过线性模型进行训练。
S903.根据所述兴趣相似度,确定所述用户群体中与所述目标用户兴趣相似的推荐用户。
当得到所述目标用户与所述用户群体中的每个用户两两之间的兴趣预测相似度之后,将所述相似度按从高到低的顺序进行排序,并选择相似度排名靠前的K个用户作为推荐用户,这里的K是整数,具体值可根据具体要求进行设置。
S904.获取所述推荐用户的兴趣列表,并根据所述兴趣列表为所述目标用户创建推荐列表。
具体可通过获取所述推荐用户的兴趣列表,对所述兴趣列表中的项目进行评分与相似度加权,并对所述评分与相似度加权的结果进行排序得到排序结果,根据所述排序结果为所述目标用户创建推荐列表。
所述推荐列表包括所述推荐用户感兴趣的而所述目标用户没有观看过的视频列表。
基于上述基于用户的协同过滤算法,确定了与所述目标用户兴趣相似的推荐用户之后,以视频推荐为例,具体包括:
S9041.针对目标用户u,以及选出的兴趣相似度最高的K位推荐用户,用集合S(u,K)表示。
S9042.将集合S中所有用户喜欢的视频列表取出来并去除目标用户u已经观看过或者感兴趣的视频,获得第一列表。
S9043.对所述第一列表中的视频进行评分与相似度加权,并对结果进行排序得到排序结果。
S9044.根据所述排序结果生成推荐列表,对目标用户u进行推荐。
每个可能推荐的视频i,用户u对其感兴趣的程度可以用如下公式计算:
Figure PCTCN2019076164-appb-000004
r vi表示用户v对视频i的喜欢程度,即对i的评分,w uv表示用户u和v之间的相似度。
协同过滤推荐系统常需要处理上百万乃至上亿级的数据记录,如何存取这些海量数据以及快速计算出推荐结果,成为协同过滤面临的巨大挑战。云计算采用分布式技术,云端系统构建在大量廉价的服务器集群之上,通过大规模集群获得与高性能计算机相当的计算能力和存储能力,集群的管理提高系统的可扩展性。将协同过滤与云计算技术相结合,使协同过滤推荐系统具有更强的并行计算能力、容错能力和更高的推荐实时性。
本申请提供的一种兴趣推荐方法可以应用于视频网站或视频APP的个性化推荐模块,请参见图11,即为用户提供符合其观影兴趣的视频列表,实现这一模块的“千人千面”。提升了用户体验,增强了用户粘度。
相应地,本申请实施例还提供了一种兴趣推荐装置,请参见图12,具体包括:
特征信息获取模块1210,用于获取目标用户的特征信息。
兴趣相似度预测模块1220,用于根据所述特征信息,采用兴趣相似度预测模型预测所述目标用户与用户群体之间的兴趣相似度;所述兴趣相似度预测模型是根据用户历史记录的样本集合中每对用户的兴趣相似度,基于树模型编码混合线性模型算法实现的;所述树模型编码混合线性模型算法是基于树模型和线性模型实现的。
推荐用户确定模块1230,用于根据所述兴趣相似度,确定所述用户群体中与所述目标用户兴趣相似的推荐用户。所述推荐用户确定模块1230还包括排序模块1231,用于将所述目标用户与所述用户群体中的每个用户之间的兴趣相似度按从高到低进行排序,并选择排名靠前的若干位用户作为推荐用户。
推荐列表创建模块1240,用于获取所述推荐用户的兴趣列表,并根据所 述兴趣列表为所述目标用户创建推荐列表。所述推荐列表创建模块1240包括评分加权模块1241和列表生成模块1242,所述评分加权模块1241用于获取所述推荐用户的兴趣列表,对所述兴趣列表中的项目进行评分与相似度加权;所述列表生成模块1242用于对所述评分与相似度加权的结果进行排序得到排序结果,根据所述排序结果生成推荐列表。
进一步地,所述兴趣相似度预测模块1220包括预测模型生成模块1221,用于生成基于所述特征信息的兴趣相似度的预测模型。
请参见图13,所述预测模型生成模块1221还包括:
样本集合获取模块1310,用于获取用户历史观影记录的样本集合;
特征构造模块1320,用于构造所述样本集合的特征;
目标相似度计算模块1330,用于根据余弦相似度公式
Figure PCTCN2019076164-appb-000005
计算所述样本集合中每对用户的兴趣相似度,u表示第一用户,v表示第二用户,I u和I v分别是所述第一用户和所述第二用户的历史视频观看列表集合;
训练模块1340,用于将所述样本集合的特征作为所述树模型混合线性模型算法的输入,将所述每对用户的兴趣相似度作为预测目标值,采用树模型混合线性模型算法对所述样本集合的特征进行训练。
请参见图14,所述树模型混合线性模型包括:
编码模块1410,用于采用树模型对所述样本集合的特征进行编码,得到编码后的二值特征;
拟合模块1420,用于将所述样本集合的特征和所述二值特征作为输入特征,通过线性模型进行训练。
本申请实施例还提供了一种基于社交软件的好友关系链的视频推荐方法,请参见图15,包括:
S1510.对社交软件的好友关系链进行过滤,保留关系链中至少有一方是X视频用户的好友关系链。
为了降低社交软件的好友关系链计算的巨大困难,先过滤掉一部分用户, 仅留下关系链中至少有一方是X视频用户的好友关系链。
S1520.计算所述用户与好友中为X视频用户的好友之间的关系强度。
所述关系强度及亲密度,所述亲密度的计算方法有两种:
(1)长期的:基于长期社交网络交互计算的亲密度;
(2)短期的:基于近期社交软件的通信频度计算的亲密度;采用短期亲密度的缺点在与可能会包含一些如商业等方面的通信好友,且稀疏度较大(短期内,如30天通信好友数一般较少),因此最终需要综合权衡长期和短期的亲密度选出最终的好友视频推荐候选人。
S1530.根据所述关系强度来加权聚合好友近期观影行为,产生基于好友关系链的视频推荐列表,并推荐给所述用户。
本申请实施例还提供了一种服务器,请参见图16,其示出服务器的结构示意图,该服务器用于实施上述实施例中提供的推荐系统冷启动处理方法,具体来讲,所述服务器结构可以包括上述推荐系统冷启动处理装置。
该服务器1600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(Central Processing Units,CPU)1610(例如,一个或一个以上处理器)和存储器1630,一个或一个以上存储应用程序1623或数据1622的计算机可读存储介质1620(例如一个或一个以上海量存储设备)。存储器1630和计算机可读存储介质1620可以是短暂存储或持久存储。存储在计算机可读存储介质1620的程序可以包括一个或一个以上模块,每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1610可以设置为与计算机可读存储介质1620通信,在服务器1600上执行计算机可读存储介质1620中的一系列指令操作。服务器1600还可以包括一个或一个以上电源1660,一个或一个以上有线或无线网络接口1650,一个或一个以上输入输出接口1640,和/或,一个或一个以上操作系统1621,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质可用于保存用于实现上述方法实施例中推荐系统冷启动处理方法的程序代码。所述程序代码可用于实现:
获取目标用户的特征信息;
根据所述特征信息,采用兴趣相似度预测模型预测所述目标用户与用户群体之间的兴趣相似度;所述兴趣相似度预测模型基于树模型编码混合线性算法实现;
根据所述兴趣相似度,确定所述用户群体中与所述目标用户兴趣相似的推荐用户;
获取所述推荐用户的兴趣列表,并根据所述兴趣列表为所述目标用户创建推荐列表。
可选地,在本实施例,上述计算机可读存储介质可以位于计算机网络的多个网络设备中的至少一个网络设备。可选地,在本实施例中,上述计算机可读存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本申请通过获取目标用户的特征信息,并根据所述特征信息,采用有监督机器学习算法来预测所述目标用户与其他用户群体之间的兴趣相似度,并根据预测的所述兴趣相似度确定推荐用户,再根据所述推荐用户的兴趣列表为所述目标用户创建推荐列表。本申请解决了传统协同过滤算法的冷启动问题,即当用户没有足够的观看历史时的推荐问题,提高了推荐结果的准确性,带来点击率上的明显提升,实现了个性化推荐的“千人千面”。
本实施例中所示出的结构,仅仅是与本申请方案相关的部分结构,并不构成对本申请方案所应用于其上的设备的限定,具体的设备可以包括比示出的更多或更少的部件,或者组合某些部件,或者具有不同的部件的布置。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机可读指令来指令相关的硬件来完成,所述的程序可存储于一非易失性的计算机可读存储介质中,如本申请实施例中,该程序可存储于计算机系统的非易失性存储介质中,并被该计算机系统中的至少一个处理器执行,以实现包括如上述各方法的实施例的流程。所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未 对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (20)

  1. 一种兴趣推荐方法,该方法由计算机设备实施,包括:
    获取目标用户的特征信息;
    根据所述特征信息,采用兴趣相似度预测模型预测所述目标用户与用户群体之间的兴趣相似度;所述兴趣相似度预测模型是根据用户历史记录的样本集合中每对用户的兴趣相似度,基于树模型编码混合线性模型算法实现的;所述树模型编码混合线性模型算法是基于树模型和线性模型实现的;
    根据所述兴趣相似度,确定所述用户群体中与所述目标用户兴趣相似的推荐用户;及
    获取所述推荐用户的兴趣列表,并根据所述兴趣列表为所述目标用户创建推荐列表。
  2. 根据权利要求1所述的一种兴趣推荐方法,其特征在于,所述特征信息包括人口统计学特征、社交软件使用特征、网络行为特征、社会文化背景特征和历史兴趣相似度特征中的至少一种特征信息。
  3. 根据权利要求1所述的一种兴趣推荐方法,其特征在于,所述兴趣相似度预测模型通过如下步骤生成:
    获取用户历史观影记录的样本集合;
    构造所述样本集合的特征;
    根据余弦相似度公式
    Figure PCTCN2019076164-appb-100001
    计算所述样本集合中每对用户的兴趣相似度,u表示第一用户,v表示第二用户,I u和I v分别是所述第一用户和所述第二用户的历史视频观看列表集合;及
    将所述样本集合的特征作为所述树模型混合线性模型算法的输入,将所述每对用户的兴趣相似度作为预测目标值,采用树模型混合线性模型算法对所述样本集合的特征进行训练。
  4. 根据权利要求3所述的一种兴趣推荐方法,其特征在于,所述采用树模型混合线性模型算法对所述样本集合的特征进行训练包括:
    采用树模型对所述样本集合的特征进行编码,得到编码后的二值特征;及
    将所述样本集合的特征和所述二值特征作为输入特征,通过线性模型进行训练。
  5. 根据权利要求1所述的一种兴趣推荐方法,其特征在于,根据所述兴趣相似度,确定所述用户群体中与所述目标用户兴趣相似的推荐用户包括:
    将所述目标用户与所述用户群体中的每个用户之间的兴趣相似度按从高到低进行排序,并选择排名靠前的若干位用户作为推荐用户。
  6. 根据权利要求1所述的一种兴趣推荐方法,其特征在于,所述获取所述推荐用户的兴趣列表,并根据所述兴趣列表为所述目标用户创建推荐列表包括:
    获取所述推荐用户的兴趣列表,对所述兴趣列表中的项目进行评分与相似度加权,并对所述评分与相似度加权的结果进行排序得到排序结果,根据所述排序结果为所述目标用户创建推荐列表;
    所述推荐列表包括所述推荐用户感兴趣的而所述目标用户没有观看过的视频列表。
  7. 根据权利要求1-6中任一项所述的一种兴趣推荐方法,其特征在于,所述目标用户的特征信息为冷启动的用户所对应的特征信息。
  8. 一种计算机设备,其特征在于,包括处理器和存储器,所述存储器存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行以下步骤:
    获取目标用户的特征信息;
    根据所述特征信息,采用兴趣相似度预测模型预测所述目标用户与用户 群体之间的兴趣相似度;所述兴趣相似度预测模型是根据用户历史记录的样本集合中每对用户的兴趣相似度,基于树模型编码混合线性模型算法实现的;所述树模型编码混合线性模型算法是基于树模型和线性模型实现的;
    根据所述兴趣相似度,确定所述用户群体中与所述目标用户兴趣相似的推荐用户;及
    获取所述推荐用户的兴趣列表,并根据所述兴趣列表为所述目标用户创建推荐列表。
  9. 根据权利要求8所述的计算机设备,其特征在于,所述特征信息包括人口统计学特征、社交软件使用特征、网络行为特征、社会文化背景特征和历史兴趣相似度特征中的至少一种特征信息。
  10. 根据权利要求8所述的计算机设备,其特征在于,所述兴趣相似度预测模型通过如下步骤生成:
    获取用户历史观影记录的样本集合;
    构造所述样本集合的特征;
    根据余弦相似度公式
    Figure PCTCN2019076164-appb-100002
    计算所述样本集合中每对用户的兴趣相似度,u表示第一用户,v表示第二用户,I u和I v分别是所述第一用户和所述第二用户的历史视频观看列表集合;及
    将所述样本集合的特征作为所述树模型混合线性模型算法的输入,将所述每对用户的兴趣相似度作为预测目标值,采用树模型混合线性模型算法对所述样本集合的特征进行训练。
  11. 根据权利要求10所述的计算机设备,其特征在于,所述采用树模型混合线性模型算法对所述样本集合的特征进行训练包括:
    采用树模型对所述样本集合的特征进行编码,得到编码后的二值特征;及
    将所述样本集合的特征和所述二值特征作为输入特征,通过线性模型进 行训练。
  12. 根据权利要求8所述的计算机设备,其特征在于,根据所述兴趣相似度,确定所述用户群体中与所述目标用户兴趣相似的推荐用户包括:
    将所述目标用户与所述用户群体中的每个用户之间的兴趣相似度按从高到低进行排序,并选择排名靠前的若干位用户作为推荐用户。
  13. 根据权利要求8所述的计算机设备,其特征在于,所述获取所述推荐用户的兴趣列表,并根据所述兴趣列表为所述目标用户创建推荐列表包括:
    获取所述推荐用户的兴趣列表,对所述兴趣列表中的项目进行评分与相似度加权,并对所述评分与相似度加权的结果进行排序得到排序结果,根据所述排序结果为所述目标用户创建推荐列表;
    所述推荐列表包括所述推荐用户感兴趣的而所述目标用户没有观看过的视频列表。
  14. 根据权利要求8-13中任一项所述的计算机设备,其特征在于,所述目标用户的特征信息为冷启动的用户所对应的特征信息。
  15. 一种非易失性的计算机可读存储介质,存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行以下步骤:
    获取目标用户的特征信息;
    根据所述特征信息,采用兴趣相似度预测模型预测所述目标用户与用户群体之间的兴趣相似度;所述兴趣相似度预测模型是根据用户历史记录的样本集合中每对用户的兴趣相似度,基于树模型编码混合线性模型算法实现的;所述树模型编码混合线性模型算法是基于树模型和线性模型实现的;
    根据所述兴趣相似度,确定所述用户群体中与所述目标用户兴趣相似的推荐用户;及
    获取所述推荐用户的兴趣列表,并根据所述兴趣列表为所述目标用户创建推荐列表。
  16. 根据权利要求15所述的存储介质,其特征在于,所述特征信息包括人口统计学特征、社交软件使用特征、网络行为特征、社会文化背景特征和历史兴趣相似度特征中的至少一种特征信息。
  17. 根据权利要求15所述的存储介质,其特征在于,所述兴趣相似度预测模型通过如下步骤生成:
    获取用户历史观影记录的样本集合;
    构造所述样本集合的特征;
    根据余弦相似度公式
    Figure PCTCN2019076164-appb-100003
    计算所述样本集合中每对用户的兴趣相似度,u表示第一用户,v表示第二用户,I u和I v分别是所述第一用户和所述第二用户的历史视频观看列表集合;及
    将所述样本集合的特征作为所述树模型混合线性模型算法的输入,将所述每对用户的兴趣相似度作为预测目标值,采用树模型混合线性模型算法对所述样本集合的特征进行训练。
  18. 根据权利要求17所述的存储介质,其特征在于,所述采用树模型混合线性模型算法对所述样本集合的特征进行训练包括:
    采用树模型对所述样本集合的特征进行编码,得到编码后的二值特征;及
    将所述样本集合的特征和所述二值特征作为输入特征,通过线性模型进行训练。
  19. 根据权利要求15所述的存储介质,其特征在于,所述获取所述推荐用户的兴趣列表,并根据所述兴趣列表为所述目标用户创建推荐列表包括:
    获取所述推荐用户的兴趣列表,对所述兴趣列表中的项目进行评分与相似度加权,并对所述评分与相似度加权的结果进行排序得到排序结果,根据 所述排序结果为所述目标用户创建推荐列表;
    所述推荐列表包括所述推荐用户感兴趣的而所述目标用户没有观看过的视频列表。
  20. 根据权利要求15-19中任一项所述的存储介质,其特征在于,所述目标用户的特征信息为冷启动的用户所对应的特征信息。
PCT/CN2019/076164 2018-04-26 2019-02-26 兴趣推荐方法、计算机设备及存储介质 WO2019205795A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US16/909,682 US11593894B2 (en) 2018-04-26 2020-06-23 Interest recommendation method, computer device, and storage medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810387692.8A CN108763314B (zh) 2018-04-26 2018-04-26 一种兴趣推荐方法、装置、服务器及存储介质
CN201810387692.8 2018-04-26

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US16/909,682 Continuation US11593894B2 (en) 2018-04-26 2020-06-23 Interest recommendation method, computer device, and storage medium

Publications (1)

Publication Number Publication Date
WO2019205795A1 true WO2019205795A1 (zh) 2019-10-31

Family

ID=64011944

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2019/076164 WO2019205795A1 (zh) 2018-04-26 2019-02-26 兴趣推荐方法、计算机设备及存储介质

Country Status (3)

Country Link
US (1) US11593894B2 (zh)
CN (1) CN108763314B (zh)
WO (1) WO2019205795A1 (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110874437A (zh) * 2019-11-14 2020-03-10 重庆邮电大学 一种基于多重兴趣点对排序的个性化兴趣点推荐方法
CN111291264A (zh) * 2020-01-23 2020-06-16 腾讯科技(深圳)有限公司 基于机器学习的访问对象预测方法、装置和计算机设备
CN111460130A (zh) * 2020-03-27 2020-07-28 咪咕数字传媒有限公司 信息推荐方法、装置、设备和可读存储介质
CN111708952A (zh) * 2020-06-18 2020-09-25 小红书科技有限公司 一种标签推荐方法及系统
CN112434391A (zh) * 2020-12-10 2021-03-02 四川长虹电器股份有限公司 一种基于注塑件相似度比较推荐工艺参数的方法
CN112464087A (zh) * 2020-11-23 2021-03-09 北京明略软件系统有限公司 推荐概率的输出方法及装置、存储介质、电子设备
CN112785372A (zh) * 2021-01-11 2021-05-11 北京欧拉认知智能科技有限公司 一种基于语义关系的智能推荐方法
CN112862007A (zh) * 2021-03-29 2021-05-28 山东大学 基于用户兴趣编辑的商品序列推荐方法及系统
CN112948701A (zh) * 2021-04-16 2021-06-11 泰康保险集团股份有限公司 信息推荐装置、方法、设备及存储介质
CN112950325A (zh) * 2021-03-16 2021-06-11 山西大学 一种社交行为融合的自注意力序列推荐方法
CN113269262A (zh) * 2021-06-02 2021-08-17 腾讯音乐娱乐科技(深圳)有限公司 训练匹配度检测模型的方法、设备和存储介质
CN113407772A (zh) * 2020-03-16 2021-09-17 北京达佳互联信息技术有限公司 视频推荐模型的生成方法、视频推荐方法、装置
CN113596528A (zh) * 2020-04-30 2021-11-02 北京达佳互联信息技术有限公司 视频推送模型的训练方法、装置、服务器及存储介质
CN113609394A (zh) * 2021-08-09 2021-11-05 上海交通大学 面向信息流的安全推荐系统
CN113836444A (zh) * 2021-09-30 2021-12-24 中国科学院深圳先进技术研究院 一种线性时间好友推荐方法、系统、终端以及存储介质
CN113836310A (zh) * 2021-08-04 2021-12-24 欧冶工业品股份有限公司 知识图谱驱动的工业品供应链管理方法和系统
CN114282106A (zh) * 2021-12-22 2022-04-05 北京网聘咨询有限公司 一种职位信息快速投递方法
CN116596576A (zh) * 2023-07-17 2023-08-15 深圳须弥云图空间科技有限公司 目标推荐方法及装置
CN116887001A (zh) * 2023-09-06 2023-10-13 四川中电启明星信息技术有限公司 融合社会属性信息的短视频推送方法、装置及电子设备
CN113127750B (zh) * 2021-05-19 2024-04-02 同盾科技有限公司 信息列表生成方法及装置、存储介质、电子设备
CN117874349A (zh) * 2024-01-18 2024-04-12 谷麦香(宁夏)餐饮管理有限公司 基于大数据分析的菜包肉养生配方推荐方法

Families Citing this family (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108763314B (zh) * 2018-04-26 2021-01-19 深圳市腾讯计算机系统有限公司 一种兴趣推荐方法、装置、服务器及存储介质
CN110245301A (zh) 2018-11-29 2019-09-17 腾讯科技(深圳)有限公司 一种推荐方法、装置及存储介质
CN109597940A (zh) * 2018-12-06 2019-04-09 上海哔哩哔哩科技有限公司 基于商业兴趣的目标人群确定及信息推送方法和系统
CN111353015B (zh) * 2018-12-24 2024-03-15 阿里巴巴集团控股有限公司 众包题目推荐方法、装置、设备及存储介质
CN109829105A (zh) * 2019-01-18 2019-05-31 王惟惟 一种可应用区块链技术的人工智能创作辅助系统
CN109829110A (zh) * 2019-01-29 2019-05-31 四川长虹电器股份有限公司 一种学习资料的个性化推荐方法
CN109885770B (zh) * 2019-02-20 2022-01-07 杭州威佩网络科技有限公司 一种信息推荐方法、装置、电子设备及存储介质
CN110134390B (zh) * 2019-03-30 2022-11-25 杭州电子科技大学 一种基于用户相似度的可编程控制器图编程控件的智能推送功能的实现方法
CN110059249B (zh) * 2019-04-03 2022-11-25 华为技术有限公司 个性化推荐的方法、终端设备和系统
CN110046303B (zh) * 2019-04-09 2022-05-17 有光创新(北京)信息技术有限公司 一种基于需求匹配平台实现的信息推荐方法及装置
CN110008408B (zh) * 2019-04-12 2021-04-06 山东大学 一种会话推荐方法、系统、设备及介质
CN110222254A (zh) * 2019-04-26 2019-09-10 平安科技(深圳)有限公司 课程推荐方法、装置、设备及计算机可读存储介质
CN110209946B (zh) * 2019-06-10 2021-03-09 合肥工业大学 基于社交和社群的产品推荐方法、系统和存储介质
CN110443717A (zh) * 2019-07-16 2019-11-12 阿里巴巴集团控股有限公司 一种基于信用评估的保险理赔方法和系统
CN112395487B (zh) * 2019-08-14 2024-04-26 腾讯科技(深圳)有限公司 信息推荐方法、装置、计算机可读存储介质及电子设备
US11727312B2 (en) 2019-09-03 2023-08-15 International Business Machines Corporation Generating personalized recommendations to address a target problem
CN110677701A (zh) * 2019-11-20 2020-01-10 咪咕文化科技有限公司 视频流推荐方法、电子设备和存储介质
CN111026977B (zh) * 2019-12-17 2022-04-08 腾讯科技(深圳)有限公司 信息推荐方法、装置及存储介质
CN113286199A (zh) * 2020-02-20 2021-08-20 佛山市云米电器科技有限公司 节目推荐方法、电视机和存储介质
CN111310056B (zh) * 2020-03-11 2023-04-14 深圳市雅阅科技有限公司 基于人工智能的信息推荐方法、装置、设备及存储介质
CN113495989A (zh) * 2020-04-01 2021-10-12 北京达佳互联信息技术有限公司 一种对象推荐方法、装置、计算设备及存储介质
CN111581506B (zh) * 2020-04-28 2023-04-25 海南太美航空股份有限公司 基于协同过滤的航班推荐方法及系统
CN111552883B (zh) * 2020-05-13 2023-12-12 咪咕文化科技有限公司 内容推荐方法及计算机可读存储介质
CN112765449B (zh) * 2020-06-19 2023-09-12 腾讯科技(深圳)有限公司 一种应用程序展示方法、装置及存储介质
CN111914177B (zh) * 2020-08-18 2023-11-14 深圳市雅阅科技有限公司 媒体信息兴趣度的匹配方法、装置、设备及存储介质
CN112131485A (zh) * 2020-08-19 2020-12-25 贝壳技术有限公司 房源推荐方法及装置
CN112395499B (zh) * 2020-11-03 2022-08-12 腾讯科技(深圳)有限公司 信息推荐方法及装置、电子设备、存储介质
CN112507163B (zh) * 2020-12-02 2023-07-21 北京奇艺世纪科技有限公司 时长预测模型训练方法、推荐方法、装置、设备及介质
CN112487300B (zh) * 2020-12-18 2024-06-07 上海众源网络有限公司 一种视频推荐方法、装置、电子设备及存储介质
CN114765624B (zh) * 2020-12-31 2024-04-30 北京达佳互联信息技术有限公司 信息推荐方法、装置、服务器及存储介质
CN112989146B (zh) * 2021-02-18 2024-04-23 百度在线网络技术(北京)有限公司 向目标用户推荐资源的方法、装置、设备、介质和程序产品
CN113010788B (zh) * 2021-03-19 2023-05-23 成都欧珀通信科技有限公司 信息推送方法及装置、电子设备、计算机可读存储介质
CN113139834A (zh) * 2021-04-29 2021-07-20 北京沃东天骏信息技术有限公司 信息处理方法、装置、电子设备和存储介质
CN113329344B (zh) * 2021-05-19 2022-08-30 中国科学院计算技术研究所 一种用于通讯网络的文件推荐的方法
CN113469786A (zh) * 2021-06-29 2021-10-01 深圳市点购电子商务控股股份有限公司 物品推荐的方法、装置、计算机设备和存储介质
CN113626686A (zh) * 2021-07-19 2021-11-09 上海泛宥信息科技有限公司 基于用户数据分析的自动推送方法、装置和计算机设备
CN113609388B (zh) * 2021-07-27 2024-02-06 浙江大学 基于反事实用户行为序列生成的序列推荐方法
CN113378071A (zh) * 2021-08-16 2021-09-10 武汉卓尔数字传媒科技有限公司 广告推荐方法及装置、电子设备、存储介质
CN113630631A (zh) * 2021-08-23 2021-11-09 南京金智视讯技术有限公司 一种基于协同过滤推荐算法的hls缓存方法及系统
CN113656698B (zh) * 2021-08-24 2024-04-09 北京百度网讯科技有限公司 兴趣特征提取模型的训练方法、装置和电子设备
CN113674065B (zh) * 2021-08-30 2023-09-22 中国平安人寿保险股份有限公司 基于服务触点的业务推荐方法、装置、电子设备及介质
CN113836412A (zh) * 2021-09-24 2021-12-24 北京爱奇艺科技有限公司 一种信息推荐方法、装置、电子设备及存储介质
CN114168465B (zh) * 2021-12-02 2024-05-17 天津大学 一种基于计算实验的推荐系统验证方法
CN114595345A (zh) * 2022-03-04 2022-06-07 江苏锐天智能科技股份有限公司 一种基于兴趣点的机载娱乐信息推荐系统及方法
CN115065845A (zh) * 2022-06-17 2022-09-16 联通沃音乐文化有限公司 一种社群融合推荐的影音视频播放管理方法及系统
CN116579820A (zh) * 2023-04-11 2023-08-11 广州携旅信息科技有限公司 一种商城商品推荐算法方法、系统、电子设备和存储介质
CN116610864A (zh) * 2023-06-06 2023-08-18 北京科码先锋互联网技术股份有限公司 一种基于pgc、ugc内容版块千人千面的内容呈现算法及系统
CN117132356B (zh) * 2023-08-29 2024-02-13 重庆大学 基于自适应用户兴趣变化周期的推荐方法、装置及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103345503A (zh) * 2013-07-01 2013-10-09 杭州万事利丝绸科技有限公司 一种基于小波网络的丝绸产品个性化推荐方法
CN104915861A (zh) * 2015-06-15 2015-09-16 浙江经贸职业技术学院 基于评分和标签构建用户群体模型的电子商务推荐方法
CN105809479A (zh) * 2016-03-07 2016-07-27 海信集团有限公司 物品推荐方法及装置
CN106708953A (zh) * 2016-11-28 2017-05-24 西安电子科技大学 基于离散粒子群优化的局部社区检测协同过滤推荐方法
CN106933821A (zh) * 2015-12-29 2017-07-07 中国电信股份有限公司 一种基于相似度计算的个性化职位推荐方法和系统
CN107169573A (zh) * 2017-05-05 2017-09-15 第四范式(北京)技术有限公司 利用复合机器学习模型来执行预测的方法及系统
CN108763314A (zh) * 2018-04-26 2018-11-06 深圳市腾讯计算机系统有限公司 一种兴趣推荐方法、装置、服务器及存储介质

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7734680B1 (en) * 1999-09-30 2010-06-08 Koninklijke Philips Electronics N.V. Method and apparatus for realizing personalized information from multiple information sources
US7613664B2 (en) * 2005-03-31 2009-11-03 Palo Alto Research Center Incorporated Systems and methods for determining user interests
US9654721B2 (en) * 2007-07-10 2017-05-16 Verizon Patent And Licensing Inc. System and method for providing personal content recommendations
US8696470B2 (en) * 2010-04-09 2014-04-15 Nguyen Gaming Llc Spontaneous player preferences
KR20120003362A (ko) * 2010-07-02 2012-01-10 아코지토(주) 협력적 필터링 알고리즘 기반의 iptv 개인별 선호프로그램 추천시스템
US20130031162A1 (en) * 2011-07-29 2013-01-31 Myxer, Inc. Systems and methods for media selection based on social metadata
US8831902B2 (en) * 2011-09-22 2014-09-09 Tcl Lab (Us) Inc. Least click TV
US9473730B1 (en) * 2012-02-13 2016-10-18 Nbcuniversal Media, Llc Method and system for personalized recommendation modeling
US10521473B2 (en) * 2012-05-21 2019-12-31 Kent State University Shortest path computation in large networks
CN103116614B (zh) * 2013-01-25 2016-04-13 北京奇艺世纪科技有限公司 一种协同过滤推荐方法、装置及系统
US20170098197A1 (en) * 2014-02-21 2017-04-06 Rna Labs Inc. Systems and Methods for Automatically Collecting User Data and Making a Real-World Action for a User
US20150248651A1 (en) * 2014-02-28 2015-09-03 Christine E. Akutagawa Social networking event planning
CN105022754B (zh) * 2014-04-29 2020-05-12 腾讯科技(深圳)有限公司 基于社交网络的对象分类方法及装置
US10083494B2 (en) * 2015-01-30 2018-09-25 Huawei Technologies Co., Ltd. Systems, devices and methods for distributed content pre-fetching to a user device
CN106557513B (zh) * 2015-09-29 2022-05-10 腾讯科技(深圳)有限公司 事件信息推送方法及事件信息推送装置
US10341728B2 (en) * 2015-12-30 2019-07-02 Sling Media L.L.C. Media systems for temporally and contextually relevant recommendations
US10832031B2 (en) * 2016-08-15 2020-11-10 Apple Inc. Command processing using multimodal signal analysis
US10657574B2 (en) * 2016-09-13 2020-05-19 Adobe Inc. Item recommendation techniques
WO2018077039A1 (zh) * 2016-10-27 2018-05-03 腾讯科技(深圳)有限公司 社区发现方法、装置、服务器及计算机存储介质
CN106709076B (zh) * 2017-02-27 2023-09-29 华南理工大学 基于协同过滤的社交网络推荐装置及方法
CN107169574A (zh) * 2017-05-05 2017-09-15 第四范式(北京)技术有限公司 利用嵌套机器学习模型来执行预测的方法及系统
CN107273438B (zh) * 2017-05-24 2021-02-23 深圳大学 一种推荐方法、装置、设备及存储介质
CN107563542A (zh) * 2017-08-02 2018-01-09 阿里巴巴集团控股有限公司 数据预测方法及装置和电子设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103345503A (zh) * 2013-07-01 2013-10-09 杭州万事利丝绸科技有限公司 一种基于小波网络的丝绸产品个性化推荐方法
CN104915861A (zh) * 2015-06-15 2015-09-16 浙江经贸职业技术学院 基于评分和标签构建用户群体模型的电子商务推荐方法
CN106933821A (zh) * 2015-12-29 2017-07-07 中国电信股份有限公司 一种基于相似度计算的个性化职位推荐方法和系统
CN105809479A (zh) * 2016-03-07 2016-07-27 海信集团有限公司 物品推荐方法及装置
CN106708953A (zh) * 2016-11-28 2017-05-24 西安电子科技大学 基于离散粒子群优化的局部社区检测协同过滤推荐方法
CN107169573A (zh) * 2017-05-05 2017-09-15 第四范式(北京)技术有限公司 利用复合机器学习模型来执行预测的方法及系统
CN108763314A (zh) * 2018-04-26 2018-11-06 深圳市腾讯计算机系统有限公司 一种兴趣推荐方法、装置、服务器及存储介质

Cited By (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110874437B (zh) * 2019-11-14 2023-06-16 重庆邮电大学 一种基于多重兴趣点对排序的个性化兴趣点推荐方法
CN110874437A (zh) * 2019-11-14 2020-03-10 重庆邮电大学 一种基于多重兴趣点对排序的个性化兴趣点推荐方法
CN111291264A (zh) * 2020-01-23 2020-06-16 腾讯科技(深圳)有限公司 基于机器学习的访问对象预测方法、装置和计算机设备
CN111291264B (zh) * 2020-01-23 2023-06-23 腾讯科技(深圳)有限公司 基于机器学习的访问对象预测方法、装置和计算机设备
CN113407772B (zh) * 2020-03-16 2023-12-26 北京达佳互联信息技术有限公司 视频推荐模型的生成方法、视频推荐方法、装置
CN113407772A (zh) * 2020-03-16 2021-09-17 北京达佳互联信息技术有限公司 视频推荐模型的生成方法、视频推荐方法、装置
CN111460130A (zh) * 2020-03-27 2020-07-28 咪咕数字传媒有限公司 信息推荐方法、装置、设备和可读存储介质
CN111460130B (zh) * 2020-03-27 2023-07-25 咪咕数字传媒有限公司 信息推荐方法、装置、设备和可读存储介质
CN113596528A (zh) * 2020-04-30 2021-11-02 北京达佳互联信息技术有限公司 视频推送模型的训练方法、装置、服务器及存储介质
CN111708952B (zh) * 2020-06-18 2023-10-20 小红书科技有限公司 一种标签推荐方法及系统
CN111708952A (zh) * 2020-06-18 2020-09-25 小红书科技有限公司 一种标签推荐方法及系统
CN112464087B (zh) * 2020-11-23 2024-03-01 北京明略软件系统有限公司 推荐概率的输出方法及装置、存储介质、电子设备
CN112464087A (zh) * 2020-11-23 2021-03-09 北京明略软件系统有限公司 推荐概率的输出方法及装置、存储介质、电子设备
CN112434391A (zh) * 2020-12-10 2021-03-02 四川长虹电器股份有限公司 一种基于注塑件相似度比较推荐工艺参数的方法
CN112434391B (zh) * 2020-12-10 2022-03-01 四川长虹电器股份有限公司 一种基于注塑件相似度比较推荐工艺参数的方法
CN112785372A (zh) * 2021-01-11 2021-05-11 北京欧拉认知智能科技有限公司 一种基于语义关系的智能推荐方法
CN112785372B (zh) * 2021-01-11 2023-09-12 北京欧拉认知智能科技有限公司 一种基于语义关系的智能推荐方法
CN112950325B (zh) * 2021-03-16 2023-10-03 山西大学 一种社交行为融合的自注意力序列推荐方法
CN112950325A (zh) * 2021-03-16 2021-06-11 山西大学 一种社交行为融合的自注意力序列推荐方法
CN112862007B (zh) * 2021-03-29 2022-12-13 山东大学 基于用户兴趣编辑的商品序列推荐方法及系统
CN112862007A (zh) * 2021-03-29 2021-05-28 山东大学 基于用户兴趣编辑的商品序列推荐方法及系统
CN112948701B (zh) * 2021-04-16 2023-10-20 泰康保险集团股份有限公司 信息推荐装置、方法、设备及存储介质
CN112948701A (zh) * 2021-04-16 2021-06-11 泰康保险集团股份有限公司 信息推荐装置、方法、设备及存储介质
CN113127750B (zh) * 2021-05-19 2024-04-02 同盾科技有限公司 信息列表生成方法及装置、存储介质、电子设备
CN113269262A (zh) * 2021-06-02 2021-08-17 腾讯音乐娱乐科技(深圳)有限公司 训练匹配度检测模型的方法、设备和存储介质
CN113836310A (zh) * 2021-08-04 2021-12-24 欧冶工业品股份有限公司 知识图谱驱动的工业品供应链管理方法和系统
CN113836310B (zh) * 2021-08-04 2022-11-29 欧冶工业品股份有限公司 知识图谱驱动的工业品供应链管理方法和系统
CN113609394B (zh) * 2021-08-09 2023-09-05 上海交通大学 面向信息流的安全推荐系统
CN113609394A (zh) * 2021-08-09 2021-11-05 上海交通大学 面向信息流的安全推荐系统
CN113836444A (zh) * 2021-09-30 2021-12-24 中国科学院深圳先进技术研究院 一种线性时间好友推荐方法、系统、终端以及存储介质
CN113836444B (zh) * 2021-09-30 2024-04-19 中国科学院深圳先进技术研究院 一种线性时间好友推荐方法、系统、终端以及存储介质
CN114282106B (zh) * 2021-12-22 2023-07-25 北京网聘咨询有限公司 一种职位信息快速投递方法
CN114282106A (zh) * 2021-12-22 2022-04-05 北京网聘咨询有限公司 一种职位信息快速投递方法
CN116596576A (zh) * 2023-07-17 2023-08-15 深圳须弥云图空间科技有限公司 目标推荐方法及装置
CN116596576B (zh) * 2023-07-17 2024-04-16 深圳须弥云图空间科技有限公司 目标推荐方法及装置
CN116887001A (zh) * 2023-09-06 2023-10-13 四川中电启明星信息技术有限公司 融合社会属性信息的短视频推送方法、装置及电子设备
CN116887001B (zh) * 2023-09-06 2023-12-15 四川中电启明星信息技术有限公司 融合社会属性信息的短视频推送方法、装置及电子设备
CN117874349A (zh) * 2024-01-18 2024-04-12 谷麦香(宁夏)餐饮管理有限公司 基于大数据分析的菜包肉养生配方推荐方法

Also Published As

Publication number Publication date
CN108763314A (zh) 2018-11-06
CN108763314B (zh) 2021-01-19
US20200320646A1 (en) 2020-10-08
US11593894B2 (en) 2023-02-28

Similar Documents

Publication Publication Date Title
WO2019205795A1 (zh) 兴趣推荐方法、计算机设备及存储介质
US10515424B2 (en) Machine learned query generation on inverted indices
Bagrow et al. Information flow reveals prediction limits in online social activity
CN105224699B (zh) 一种新闻推荐方法及装置
US20180068023A1 (en) Similarity Search Using Polysemous Codes
US20180181667A1 (en) System and method to model recognition statistics of data objects in a business database
Shi et al. Learning-to-rank for real-time high-precision hashtag recommendation for streaming news
WO2009023070A1 (en) Systems and methods for keyword selection in a web-based social network
US20170270210A1 (en) Data Infrastructure and Method for Ingesting and Updating A Continuously Evolving Social Network
US9542669B1 (en) Encoding and using information about distributed group discussions
CN110795641A (zh) 基于表示学习的网络谣言传播控制方法
Yuvaraj et al. Twitter sentiment classification using binary shuffled frog algorithm
US20240193402A1 (en) Method and apparatus for determining representation information, device, and storage medium
CN111552884A (zh) 用于内容推荐的方法和设备
Chen et al. Context-aware ensemble of multifaceted factorization models for recommendation prediction in social networks
WO2023024408A1 (zh) 用户特征向量确定方法、相关设备及介质
US20240193219A1 (en) Generating high visibility social annotations
Cui et al. Personalized microblog recommendation using sentimental features
EP3293696A1 (en) Similarity search using polysemous codes
Reshma et al. Semantic based trust recommendation system for social networks using virtual groups
Soltani et al. Identity matching in social media platforms
Sha et al. Trend makers and trend spotters in a mobile application
Gan et al. GLORY: Exploration and integration of global and local correlations to improve personalized online social recommendations
WO2024114034A1 (zh) 内容推荐方法、装置、设备、介质和程序产品
Shafiloo et al. Predicting user demographics based on interest analysis

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19791838

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19791838

Country of ref document: EP

Kind code of ref document: A1