WO2015058558A1 - 问题推荐方法、装置及系统 - Google Patents

问题推荐方法、装置及系统 Download PDF

Info

Publication number
WO2015058558A1
WO2015058558A1 PCT/CN2014/081808 CN2014081808W WO2015058558A1 WO 2015058558 A1 WO2015058558 A1 WO 2015058558A1 CN 2014081808 W CN2014081808 W CN 2014081808W WO 2015058558 A1 WO2015058558 A1 WO 2015058558A1
Authority
WO
WIPO (PCT)
Prior art keywords
interest
user
question
vector
term
Prior art date
Application number
PCT/CN2014/081808
Other languages
English (en)
French (fr)
Inventor
冯扬
李京生
孙拔群
Original Assignee
腾讯科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 腾讯科技(深圳)有限公司 filed Critical 腾讯科技(深圳)有限公司
Publication of WO2015058558A1 publication Critical patent/WO2015058558A1/zh
Priority to US15/135,410 priority Critical patent/US9875441B2/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Definitions

  • the present invention relates to the field of computer Internet technologies, and in particular, to a problem recommendation method, apparatus and system. Background of the invention
  • the characteristics are: Some users as questioners in the community to ask questions, others who have the ability to answer and identify and answer these questions as respondents, solve the questioner's questions; and questions and answers will be precipitated in the platform, forming
  • the knowledge base can provide immediate answers to the "questioners," who have the same questions later.
  • hundreds of thousands of questions are asked every day. In order to get these questions answered quickly and effectively, you need One way for respondents to find problems that match their interests and abilities in a timely manner.
  • the purpose of the problem recommendation system is to recommend to competent users questions that match their interests and abilities.
  • the present invention provides a problem recommendation method, apparatus and system that can solve the problems in the prior art.
  • An embodiment of the present invention provides a method for recommending a problem, including:
  • the server constructs an interest vector of the user according to the short-term interest, long-term interest, and crowd interest of the user, where the interest vector of the user includes multiple interest items;
  • the question to be recommended is recommended to the client of the user.
  • An embodiment of the present invention provides a problem recommendation apparatus, including:
  • An interest vector calculation module configured to construct an interest vector of the user according to a short-term interest, a long-term interest, and a crowd interest of the user, where the interest vector of the user includes multiple interest items;
  • a candidate recommendation problem obtaining module configured to acquire at least one candidate recommendation problem from the set of problems to be solved according to the plurality of interest items
  • a to-be-recommended problem obtaining module configured to estimate, according to the click-through rate model, a probability that the user answers the candidate recommendation question, and select a to-be-recommended question from the at least one candidate recommendation question according to the estimated probability;
  • the problem recommendation module is configured to recommend the to-be-recommended question to the client of the user.
  • An embodiment of the present invention provides a problem recommendation system, including a client and a server, where the client sends a problem recommendation request to the server, and the server returns a to-be-recommended question to the client according to the problem recommendation request.
  • the server includes: an interest vector calculation module, configured to calculate a short-term interest, a long-term interest, a crowd interest, and a click-through rate model of the user, and the user is constructed according to the short-term interest, long-term interest, and crowd interest of the user
  • An interest vector the user's interest vector includes a plurality of interest items
  • a candidate recommendation problem obtaining module configured to obtain a candidate recommendation problem from the to-be-solved problem set according to the plurality of interest items
  • a problem recommendation module configured to recommend the to-be-recommended question to the client .
  • the problem recommendation method, device and system proposed by the present invention are combined by the user's short-term Interest, long-term interest and crowd interest to construct the user's interest vector, and obtain candidate recommendation questions from the set of questions to be solved according to the interest items in the user's interest vector, and then estimate the probability of the user answering the candidate recommendation question according to the click rate model.
  • the problem to be recommended is selected according to the estimated probability, and the problem to be recommended is recommended to the client, so that the recommended question is both in line with the user's interest and the user's high willingness to answer. In this way, an implementation and comprehensive recommendation result can be obtained. Further, the question answer rate of the interactive question and answer platform can be improved.
  • FIG. 1 is a schematic diagram showing the principle of a problem recommendation method in the prior art
  • FIG. 2 is a schematic diagram showing the principle of another method for recommending problems in the prior art
  • FIG. 3 is a schematic flowchart of a problem recommendation method in a first embodiment of the present invention
  • FIG. 4 is a schematic flowchart diagram of a problem recommendation method in a second embodiment of the present invention
  • FIG. 6 is a schematic diagram of a specific process of step S21 in FIG. 4;
  • Figure 7 is a schematic diagram of a circular queue of short-term interest items of a user
  • step S23 in FIG. 4 is a schematic diagram of a specific process of step S23 in FIG. 4;
  • step S24 in FIG. 4 is a schematic diagram of a specific process of step S24 in FIG. 4;
  • Figure 10 is a block diagram showing the selection of candidate recommendation questions
  • step S25 in FIG. 4 is a schematic diagram of a specific process of step S25 in FIG. 4;
  • Figure 12 is a block diagram of the CTR model training and CTR estimation
  • FIG. 13 is a schematic structural diagram of a problem recommendation apparatus according to a third embodiment of the present invention
  • FIG. 14 is a schematic structural diagram of a problem recommendation device in a fourth embodiment of the present invention
  • FIG. 15 is a schematic diagram showing a specific structure of the short-term interest calculation unit in FIG.
  • 16 is a schematic diagram showing the specific structure of the crowd interest calculation unit of FIG. 14;
  • FIG. 17 is a schematic structural diagram of a click rate model establishing unit of FIG. 14;
  • FIG. 18 is a schematic block diagram of a problem recommendation system in a fifth embodiment of the present invention. Mode for carrying out the invention
  • the offline mining technology is used to mine the user's interest through the user's existing answer.
  • interest matching users are recommended to solve the problem of their interest.
  • the recommendation based on the click estimate, through the historical exposure log (which records which questions are shown to which users) and the answer log (which records which questions were answered by which users), offline training out click prediction model.
  • the model is used to predict the probability that a problem to be solved is displayed to a specific user and is answered by the user. According to the probability of answering, all the problems to be solved are sorted, and the first N problems to be solved are displayed as recommended results.
  • the offline mining of user interest lags behind the user's interest change. Therefore, the recommendation result does not reflect the interest migration reflected by the user's recent behavior.
  • the user's long-term interest is relatively stable and slow to change over time, reflecting the accumulation of points of interest embodied by the user's behavior over a longer period of time. But the user's interest will migrate (change) over time, and the closer the behavior is, the greater the effect on the change in user interest.
  • the traditional method of offline calculation is often to update the user interest model through timing calculation, unable to capture the user interest change in real time, and can not find the short-term interest generated by the user's recent behavior, so that it can not be quickly in the recommendation result. reflect.
  • the problem recommendation method proposed in the present invention is directed to the above problem, and the short-term interest of the user is calculated by real-time capturing the user's real-time answer record, and the problem of recommendation interest lag in the problem recommendation method based on the user interest matching is solved;
  • the historical answer record carries out demographic statistical analysis, constructs a crowd interest model, supplements user interest, and solves the phenomenon that the recommendation result is not comprehensive and the result is single in the recommendation method based on the click prediction. Combine users' long-term interests, short-term interests, and crowd interests to build a complete user interest vector.
  • the candidate question is searched in the question set, and the CTR estimate is made for the purpose of the user's answer rate, and the question of satisfying the interest and willingness to answer is recommended for the user, and the question answer rate of the interactive question answering platform is improved.
  • a problem recommendation system is built to provide problem recommendation service for the interactive question and answer community platform.
  • FIG. 3 is a schematic flowchart diagram of a problem recommendation method according to a first embodiment of the present invention.
  • the method for recommending problems in the embodiment of the present invention includes:
  • Step S11 The server constructs a user's interest vector according to the user's short-term interest, long-term interest, and crowd interest, and the interest vector includes multiple interest items.
  • the short-term interest of the user can be obtained according to the real-time answer record of the user, and the interest change reflected by the user behavior is quickly perceived by calculating the short-term interest of the user within a predetermined time period.
  • the real-time answer record records which questions the user has answered within the predetermined time period.
  • the short-term interest reflects the interest items reflected by the user's behavior in a short period of time, which is characterized by relatively unstable, rapid changes with time and social hotspots, and concentrated interest items.
  • the long-term interest of the user may be the user interest obtained by mining the historical answer record, or may be based on the user's interest in the user profile stored in various applications (such as QQ or "question") in the server or database. obtain.
  • Long-term interest can reflect the accumulation of interest items reflected by the user's behavior over a long period of time. It has the characteristics of relatively stable, slow change with time, and scattered interest items.
  • the historical answer record records which users have answered which questions. For example, five questions a, b, c, d, e are recommended for user ul. Five questions c, d, e, f, g are also recommended for user u2. Then the question &, b only shows (exposure) to the user ul.
  • the questions e and f are only shown to the user u2. Questions c, d, and e are shown to users ul and u2 at the same time. Suppose user ul answers questions a, c, and user u2 answers questions c, f. Then, the above answering behavior will be recorded in the historical answer record.
  • the user's crowd interest can be divided into several groups according to the attributes of the user. For long-term interests of different groups of people, in the case of sparse user interest, use group interest to estimate the user's personalized interest, and supplement user interest according to the user's group.
  • the user's attributes can include age, gender, industry, education level, and so on. Crowd interest can reflect the long-term interest of a group of users with the same attributes, which is the accumulation of interest items reflected by similar behaviors of a population base over a longer period of time.
  • CTR indicates the probability that the question will be answered by the user after being displayed.
  • the CTR model can be trained based on historical answer records, historical exposure records, and CTR models.
  • the historical exposure record records which questions are displayed to which users. For example, five questions a, b, c, d, e are recommended for user ul. Five questions 0, d, e, f, g are also recommended for user u2. Then, the questions a, b are only exposed to the user ul. The problem e, f is only exposed to the user u2.
  • the questions c, d, and e are exposed to the user ul and u2 at the same time. This exposure information will be recorded in the historical exposure record, as well as scene information during exposure (such as exposure time, placement, paging, sorting, etc.).
  • Step S12 The server obtains a candidate recommendation question from the to-be-solved problem set according to the plurality of interest items in the interest vector.
  • Step S13 The server estimates, according to the click-through rate model, a probability that the user answers the candidate recommendation question, and selects a to-be-recommended question from the candidate recommendation question according to the estimated probability.
  • the CTR model can be used to predict the probability of the user answering the candidate recommendation question for the user feature, the problem feature, and the scene feature, that is, the CTR estimation is performed, and the answer probability is sorted, and the highest probability of answer is extracted.
  • issues are considered as issues to be recommended.
  • Step S14 The server recommends the selected candidate to be recommended to the client of the user.
  • the user's short-term interest, candidate problem retrieval and CTR estimation are online calculation, and the population interest model and CTR model training are offline calculation.
  • the problem recommendation method proposed in this embodiment constructs a user's interest vector by integrating the user's short-term interest, long-term interest, and crowd interest, and obtains a candidate recommendation problem from the to-be-solved problem set according to the interest item in the user's interest vector, and then according to The click rate model estimates the probability that the user answers the candidate recommendation question, selects the question to be recommended from the candidate recommendation question according to the estimated probability, and recommends the to-be-recommended question to the client of the user, so that the recommended question is consistent with
  • the user's interest is also a question of the user's willingness to answer. In this way, real-time, comprehensive recommendations can be obtained. Further, the question answer rate of the interactive question and answer platform can be improved.
  • FIG. 4 is a schematic flowchart diagram of a problem recommendation method according to a second embodiment of the present invention.
  • FIG. 5 is a schematic block diagram of a method for recommending a problem according to an embodiment of the present invention. Referring to FIG. 4 and FIG. 5 simultaneously, the method for recommending problems in the embodiment of the present invention includes:
  • Step S21 Calculate the short-term interest of the user according to the real-time answer record of the user within a predetermined time period from the current time.
  • the interest vector can be used to represent the user's interest.
  • the user's short-term interest can be represented by a short-term interest vector.
  • the interest item may include a interest keyword or an interest classification.
  • the user's short-term interest is calculated based on the weight of each interest item in the short-term interest vector. For example, use (: beating generation
  • the short-term interest of the table user, c can be expressed as:
  • the frequency of the interest item When calculating a user's short-term interest, two main factors are considered: the frequency of the interest item and the effectiveness of the interest item. The higher the frequency of interest items involved in a user's answer to a question in a short period of time, the greater the weight of the item of interest in the vector. The longer the user answers the question from the current time point, the lower the weight of the interest item involved in the question (ie, the weight decays over time). When this time exceeds the preset threshold, the weight is reduced to zero.
  • step S21 may include:
  • Step S211 Acquire a real-time answer record of the user within a predetermined time period from the current time.
  • the real-time answer record can be obtained from the question answer log recorded by the user's client.
  • Step S212 extracting the interest items corresponding to each question and the time for answering each question according to the real-time answer record.
  • the time to answer each question is the timestamp of the item of interest corresponding to the question, and the item of interest is used as an element and a loop queue is constructed according to its corresponding timestamp.
  • a circular queue of fixed length L can be established for each user who has answered the question behavior.
  • Each element of the queue corresponds to an interest item and the timestamp of the item of interest, and records the location of the latest item of interest, as shown in Figure 7.
  • the timestamp of the interest item and behavior corresponding to the question is extracted, inserted into the previous position of the latest interest item (inserted in the direction of decreasing time), and the latest interest item position is changed ( Move in the direction of insertion).
  • Step S213 calculating a weight corresponding to each interest item according to the circular queue.
  • calculating the user's short-term interest starting from the latest interest item position, traversing in the opposite direction to the insertion, counting the frequency of the interest items, and calculating the weight according to the timestamp.
  • a time decay function when each interest item appears at the position and a time stamp and current time when each interest item appears at the position may be calculated.
  • the weight corresponding to each interest item is calculated based on the time decay function when each interest item appears at the position and the time period between the time stamp when each interest item appears at the position and the current time.
  • T. pos is the duration of the feature term tj at the position p OS from the current time point, the constant and the amplitude and half-life for adjusting the time decay; r is the expiration threshold of the interest term.
  • Step S214 Calculate the short-term interest of the user according to the weight corresponding to each interest item. That is, it is calculated by the formula (2) and substituted into the formula (1) to calculate the user's short-term interest C.
  • Step S22 Acquire the long-term interest of the user according to the historical answer record.
  • Step S23 Calculate the interest of the user according to the history answer record, the attribute combination of the user, and the probability of occurrence of the interest item corresponding to each user attribute.
  • step S23 may include:
  • Step S231 dividing all users into a plurality of different types of people according to the attribute combination of the user;
  • Step S232 calculating a probability of occurrence of each interest item corresponding to the attribute combination of the user
  • Step S233 calculating, according to the probability, an interest item corresponding to each type of crowd Weights
  • Step S234 Search for a crowd corresponding to the user according to the attribute of the user.
  • Step S235 Calculate the interest of the user according to the weight of the interest item corresponding to the group.
  • each user has certain attributes. When these attributes are combined and combined, they constitute different types of people (for example: "25 ⁇ 27 years old, male, undergraduate, IT practitioner").
  • Crowd interest modeling builds a crowd interest model by segmenting demographic interest items to estimate which items of interest are most likely to be in the case of a user belonging to a particular group, and what are the weights of those items of interest.
  • the meaning of / ⁇ / ⁇ 2 ,..., 3 ⁇ 4 is the probability of occurrence of the interest item when the user attribute combination / ⁇ 2 ,..., 3 ⁇ 4 appears.
  • Crowd interest modeling is to establish such a probabilistic model for all the interest items, then build the crowd to the inverted list of interest items, and sort by probability size in the inverted list to filter out the interest items with lower probability values.
  • the probability of expressing the interest item ⁇ in the formulas (4), (5), and (6), / ⁇ . ⁇ is the conditional probability that the i-th attribute takes the value ⁇ under the condition that the interest item appears, ⁇ (/ is the first The probability that the attributes are valued. ), . ⁇ ( ⁇
  • D a represents the crowd interest vector of user u
  • v represents the weight of the interest item ⁇ in the vector:
  • Step S24 Establish a click rate model based on the historical answer record and the historical exposure record.
  • step S24 may include:
  • Step S241 marking the problem that has been answered by the user in the historical exposure record as a positive sample, marking the problem in the historical exposure record that has not been answered by the user as a negative sample;
  • Step S242 extracting all positive samples and negative The feature vector of the sample;
  • Step S243 performing a click rate model training by using feature vectors of the positive sample and the negative sample to establish a click rate model.
  • the feature vector includes: a user feature vector, a problem feature vector, and a scene Feature vector.
  • the user characteristics are characteristics inherent to the user, which vary little with the scene, such as the user's long-term interest classification, the user's long-term interest keywords, the user's experience value, points, answer frequency, and the like.
  • the problem characteristics are inherent to the problem, such as the classification of the problem, the keyword of the question, the value of the question, the regionality of the question, the length of the title, and so on.
  • Scene features are features that vary greatly over time and space, such as how well the problem matches the user's interests, the type of problem hitting the user's interest, the time the question is recommended, and so on.
  • LR Logistic Regression
  • SGD Stochastic Gradient Descent
  • SGD is one of the methods to solve the above optimization problem during training.
  • the parameter estimated from the training sample is the weight coefficient vector W of the feature vector.
  • the final CTR model is described by this weight coefficient vector.
  • steps S21 to S24 may be performed at the same time, or may be performed in sequence, and the specific embodiments of the present invention are not limited thereto.
  • Step S25 construct an interest vector of the user according to the short-term interest, the long-term interest, and the interest of the user, where the interest vector includes multiple interest items, and the candidate recommendation problem is obtained from the set of problems to be solved according to the plurality of interest items. .
  • the user's short-term interest, long-term interest, and crowd interest can be combined by linear weighting of the vector to obtain the user's interest vector:
  • the weighting coefficient a of the user's long-term interest vector A is 0.1 ⁇ 0.5
  • the vector weighting coefficient c of the user's short-term interest C combat is 0.5 c 0.8
  • the range of ⁇ / is 0.1 0.5.
  • ac, ⁇ ⁇ satisfies the relationship ⁇ ⁇ > ⁇ /. That is, the vector weighting coefficient of the user's short-term interest > the vector weighting coefficient of the long-term interest > the vector weighting coefficient of the crowd interest
  • may be 0.2
  • c may be 0.7
  • step S25 may further include:
  • Step S251 Calculate a correlation between a problem in the to-be-solved problem set and the interest vector of the user according to multiple interest items in the user's interest vector;
  • Step S252 sorting the questions according to the correlation
  • Step S253 extracting a question that the correlation is within a predetermined range as the candidate recommendation question question.
  • correlation calculations may be performed using methods such as Pearson correlation, Euclidean distance, and BM2.5 correlation calculation.
  • the CTR estimation method is based on the user response rate, and predicts a user's relevance to a new problem by reflecting the correlation between each feature (including user characteristics, problem characteristics, scene characteristics) and the answer reflected in the historical problem record. The probability of answering.
  • the CTR model can be used to predict the probability of the user answering the candidate recommendation question for the user feature, the problem feature, and the scene feature. That is, the CTR estimation is performed and sorted according to the magnitude of the answer probability, and a number of questions with the highest answer probability are extracted as the questions to be recommended. Specifically, the user, the candidate recommendation question, and the feature vector of the current scene may be extracted first; and the feature vector and the click rate model are used to estimate the probability that the user answers the candidate recommendation question.
  • the step of selecting the to-be-recommended question according to the estimated probability comprises sorting the candidate recommendation questions according to the estimated probability, and extracting a problem whose probability is within a predetermined range as the to-be-recommended question.
  • Step S27 recommend the selected to-be-recommended question to the client of the user.
  • the problem recommendation method proposed in this embodiment integrates the short-term interest and long-term interest of the user. And the crowd interest to construct the user's interest vector, and obtain the candidate recommendation question from the to-be-solved problem set according to the interest item in the user's interest vector, and then estimate the probability of the user answering the candidate recommendation question according to the click-through rate model, according to the estimated Probability selects the problem to be recommended, and recommends the to-be-recommended question to the client, so that the recommended question is both in line with the user's interest and the user's high willingness to answer. In this way, real-time, comprehensive recommendations can be obtained in a timely manner. Further, the question answer rate of the interactive question and answer platform can be improved.
  • FIG. 13 is a schematic structural diagram of a problem recommendation apparatus according to a third embodiment of the present invention.
  • the device may be operated by the server in the above embodiment, and the device 30 includes: an interest vector calculation module 31, a candidate recommendation problem acquisition module 32, a to-be-recommended problem acquisition module 33, and a question recommendation module 34.
  • the interest vector calculation module 31 is configured to construct an interest vector of the user according to a short-term interest, a long-term interest, and a crowd interest of the user, where the interest vector of the user includes multiple interest items;
  • the candidate recommendation problem obtaining module 32 is configured to obtain at least one candidate recommendation problem from the to-be-solved problem set according to the plurality of interest items;
  • the to-be-recommended question obtaining module 33 is configured to estimate, according to the click-through rate model, a probability that the user answers the candidate recommendation question, and select a to-be-recommended question from the at least one candidate recommendation question according to the estimated probability;
  • the question recommendation module 34 is configured to recommend the to-be-recommended question to the client of the user.
  • Each of the above modules may be implemented by software code. In this case, each of the above modules may be stored in the memory.
  • the above modules can also be implemented by hardware such as an integrated circuit chip.
  • the embodiment of the present invention constructs a user's interest vector by integrating the user's short-term interest, long-term interest, and crowd interest, and obtains a candidate recommendation question from the to-be-solved problem set according to the interest item in the user's interest vector, and then according to the click-through rate model.
  • the probability of the user answering the candidate recommendation question is estimated, the question to be recommended is selected according to the estimated probability, and the question to be recommended is recommended to the client, so that the recommended question is both in line with the user's interest and the user's high willingness to answer. In this way, real-time, comprehensive recommendations can be obtained in a timely manner. Further, the question answer rate of the interactive question and answer platform can be improved.
  • FIG. 14 is a schematic structural diagram of a problem recommendation apparatus according to a fourth embodiment of the present invention.
  • the device can operate on the server in the above embodiment.
  • the apparatus 40 includes: an interest vector calculation module 41, a candidate recommendation problem acquisition module 42, a problem recommendation acquisition module 43 and a problem recommendation module 44.
  • the interest vector calculation module 41 is configured to use the interest vector of the user according to the short-term interest, long-term interest, and crowd interest of the user, where the user's interest vector includes multiple interest items;
  • the candidate recommendation problem obtaining module 42 is configured to obtain at least one candidate recommendation problem from the to-be-solved problem set according to the plurality of interest items;
  • the to-be-recommended question obtaining module 43 is configured to estimate, according to the click-through rate model, a probability that the user answers the candidate recommendation question, and select a to-be-recommended question from the at least one candidate recommendation question according to the estimated probability;
  • the question recommendation module 44 is configured to recommend the to-be-recommended question to the client of the user.
  • the device further includes: a short-term interest calculation unit 411, configured to calculate the short-term interest of the user according to the real-time answer record of the user within a predetermined time period from the current time;
  • the device further includes: a long-term interest acquisition unit 412, configured to: Obtaining the long-term interest of the user based on historical answer records;
  • the apparatus further includes: a crowd interest calculation unit 413, configured to calculate a crowd interest of the user according to a history answer record, a user attribute, and a probability of occurrence of an interest item corresponding to each user attribute;
  • the apparatus further includes: a click rate model establishing unit 414, configured to establish a click rate model according to the historical answer record and the historical exposure record;
  • the interest vector calculation module 41 may include:
  • the interest vector calculation unit 415 is configured to: according to the vector weighting coefficient of the user's short-term interest, the vector weighting coefficient of the user's long-term interest, and the vector weighting coefficient of the user's crowd interest, the short-term interest, long-term interest, and The crowd interests are merged to get the user's interest vector.
  • the vector weighting coefficient of the user's short-term interest is greater than the vector weighting coefficient of the user's long-term interest, and the vector weighting coefficient of the user's long-term interest is greater than the vector weighting coefficient of the user's interest, wherein the vector weighting coefficient of the user's short-term interest is greater than or equal to 0.5 and less than or equal to 0.8, the user
  • the vector weighting coefficient of long-term interest is greater than or equal to 0.1 and less than or equal to 0.5
  • the vector weighting coefficient of the user's population interest is greater than or equal to 0.1 and less than or equal to 0.5.
  • the vector weighting coefficient of the user's long-term interest is 0.2
  • the vector weighting coefficient of the user's short-term interest is 0.7
  • the vector weighting factor of the user's population interest is 0.1.
  • the candidate recommendation problem obtaining module 42 includes:
  • a correlation calculation unit 421, configured to calculate, according to the plurality of interest items, a correlation between a problem in the to-be-solved problem set and the interest vector of the user;
  • the first sorting unit 422 is configured to sort the questions according to the correlation; and the candidate recommendation question selecting unit 423 is configured to extract a problem that the correlation is within a predetermined range as the candidate recommendation question.
  • the to-be-recommended problem obtaining module 43 includes: The estimating unit 431 is configured to estimate, according to the click rate model, a probability that the user answers the candidate recommendation question;
  • a second sorting unit 432 configured to sort the candidate recommendation questions according to the estimated probability
  • the to-be-recommended question selection unit 433 is configured to extract a problem in which the probability is within a predetermined range as the to-be-recommended question.
  • the short-term interest calculation unit 411 may include: a real-time answer record acquisition sub-unit 4111, configured to acquire a real-time answer record of the user within a predetermined time period from the current time;
  • the loop queue construction sub-unit 4112 is configured to extract, according to the real-time answer record, the interest items corresponding to each question and the time for answering each question, to answer the time of each question as the time stamp of the interest item corresponding to the question Constructing a circular queue with the interest item as an element and a corresponding timestamp thereof;
  • a first weight calculation sub-unit 4113 configured to calculate, according to the circular queue, a weight corresponding to each interest item
  • the short-term interest calculation sub-unit 4114 is configured to calculate the short-term interest of the user according to the weight corresponding to each interest item.
  • the first weight calculation sub-unit 4113 is configured to calculate a time decay function when each interest item appears at the position according to the position of each interest item in the circular queue, and each interest item appears at the position Timestamp of the time and the duration of the current time; Calculate each interest item based on the time decay function when each interest item appears at the position and the timestamp when each interest item appears at the position and the duration of the current time Corresponding weights.
  • the crowd interest calculation unit 413 may include: a crowd classification sub-unit 4131, configured to divide all users into a plurality of different types of people according to a combination of attributes of the user; a probability calculation subunit 4132, configured to calculate a probability of occurrence of each interest item corresponding to a combination of attributes of the user;
  • a second weight calculation sub-unit 4133 configured to calculate, according to the probability, a weight of an interest item corresponding to each type of crowd;
  • a finding subunit 4134 configured to find a crowd corresponding to the user according to an attribute of the user
  • the crowd interest calculation sub-unit 4135 is configured to calculate the crowd interest of the user according to the weight of the interest item corresponding to the crowd.
  • the click rate model establishing unit 414 may include: a sample marking subunit 4141, for marking a problem in the historical exposure record that has been answered by the user as a positive sample, and the history is A question in the exposure record that has not been answered by the user is marked as a negative sample;
  • Feature vector extraction sub-unit 4142 for extracting feature vectors of all positive and negative samples
  • the model training subunit 4143 performs training of the hit rate model by using the feature vectors of the positive sample and the negative sample to establish a click rate model.
  • the feature vector includes: a user feature vector, a problem feature vector, and a scene feature vector.
  • Each of the above modules may be implemented by software code.
  • each of the above modules may be stored in the memory.
  • the above modules can also be implemented by hardware such as an integrated circuit chip.
  • the embodiment of the present invention constructs a user's interest vector by integrating the user's short-term interest, long-term interest, and crowd interest, and sets the problem to be solved according to the interest item in the user's interest vector.
  • the candidate recommendation problem is obtained, and the probability of the user answering the candidate recommendation question is estimated according to the click rate model, the problem to be recommended is selected according to the estimated probability, and the problem to be recommended is recommended to the client, so that the recommended problem is consistent with
  • the user's interest is also a question of the user's willingness to answer. In this way, the recommendation results further improve the question answer rate of the interactive question and answer platform.
  • FIG. 18 is a schematic structural diagram of a problem recommendation system according to a fifth embodiment of the present invention.
  • the system 50 includes: a client 51 and a server.
  • the client 51 feeds back the user's answering behavior to the server, and sends a question recommendation request to the server.
  • the server includes an offline mining service device 521 and an online recommendation service device.
  • the offline mining service device 521 is configured to acquire long-term interests of the user, model the interest of the crowd, and establish a CTR model according to the attributes of the user and the answer answer record.
  • the offline mining service device 521 can analyze the user through the user analysis module 5211, including integrating the attributes of the user and mining the long-term interest of the user.
  • the offline mining service device 521 can also perform problem analysis through the problem analysis module 5212, including text analysis of the problem, extraction of problem keywords, classification of the problem, and the like.
  • the offline mining service device 521 can also model the crowd interest through the crowd interest modeling module 5213, including training the crowd interest model based on the historical answer record.
  • the offline mining service device 521 can also perform CTR model training through the CTR modeling evaluation and release module 5214, including training the CTR model based on the feature vector of the online partial cache, the historical exposure record, and the question answer record provided by the client.
  • the offline mining service device 521 can also train and release the CTR model through the CTR model training module 5215, automatically evaluate the CTR model and the newly trained model that are being used on the line, and determine whether the new model is selected due to the online model.
  • the online recommendation service device 522 is configured to calculate a short-term interest of the user according to a real-time answer record of the user within a predetermined time period from the current time, and acquire a user's population according to the crowd interest model.
  • interesting, and constructing a user's interest vector according to the user's long-term interest, short-term interest, and crowd interest acquiring at least one candidate recommendation question from the to-be-solved problem set according to multiple interest items in the interest vector, and estimating the user according to the CTR model Answering the probability of the candidate recommendation question, and selecting the to-be-recommended question from the at least one candidate recommendation question according to the estimated probability, and recommending the client.
  • the online recommendation service device 522 can provide short-term interest services through the short-term interest service module 5221, including responsible for maintaining the user's recent response behavior, calculating the user's short-term interest, and providing consultation.
  • the online recommendation service device 522 can also provide data services through the data service module 5222, including responsible for providing user information (including user attributes and long-term interests), problem information (including attribute of the problem, classification of the problem, and key issues) to the recommendation service. Words, etc.).
  • the online recommendation service device 522 can also provide a recommendation service, that is, a main service of the system, through the recommendation service module 5223.
  • the candidate question retrieval sub-module 52231 retrieves user information, short-term interest of the user, calculates interest of the user group, and searches for candidate recommendation questions for the recommendation request of the client.
  • the CTR estimation module 52232 performs CTR estimation, sorting, and the like on the candidate recommendation problem, and also includes recording feature vectors.
  • the online recommendation service device 522 can also perform a recommendation proxy service through the recommendation proxy service 5224, including processing the client's request, submitting a recommendation request to the recommendation service, caching the recommendation result, and recording the exposure log.
  • one is a self-feedback mechanism for short-term interest, and the user's question answering behavior on the client will be fed back to the short-term interest service through the message bus, and the short-term interest service is responsible for maintaining the behavior list. And provide an update of short-term interest; the other is the self-feedback mechanism of the CTR model, the recommendation service, the recommendation agent service, and the feature vector recorded by the client, the exposure problem record, and the historical answer record will be automatically pushed to the offline CTR training module, wherein 90% of the samples can be used as training samples for CTR model training, and 10% of samples can be used as test samples for model evaluation, comparing new models with online models. After the type of estimation effect, the model is automatically released.
  • a person skilled in the art may understand that all or part of the steps of implementing the above embodiments may be completed by hardware, or may be instructed by a program to execute related hardware, and the program may be stored in a computer readable storage medium.
  • the storage medium mentioned may be a read only memory, a magnetic disk or an optical disk or the like.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种问题推荐方法、装置及系统,方法包括:服务器根据用户的短期兴趣、长期兴趣以及人群兴趣构建用户的兴趣向量,用户的兴趣向量中包括多个兴趣项;根据多个兴趣项由待解决问题集合中获取候选推荐问题;根据点击率模型预估所述用户回答候选推荐问题的概率,并根据预估的概率选取待推荐问题;向客户端推荐所述待推荐问题。这样,可以获得实时、全面的推荐结果,也可以提高互动问答平台的问题回答率。

Description

问题推荐方法、 装置及系统
技术领域
本发明涉及计算机互联网技术领域, 特别是涉及一种问题推荐方 法、 装置及系统。 发明背景
特点是: 一些用户作为提问者在社区中提出问题, 另一些有能力作答的 用户以回答者的身份发现并回答这些问题, 解决提问者的疑问; 而问题 和答案会在平台中沉淀下来, 形成知识库, 可以为后来具有相同问题的 "提问者,, 直接提供解答。 在互动问答社区中, 每天会有数以十万级的 问题被提出, 为了能够让这些问题得到快速有效的回答, 就需要一种途 径让回答者们能及时地发现符合自己兴趣和能力的问题。 问题推荐系统 的目的就是向有能力的用户推荐符合其兴趣和能力的问题。 发明内容
本发明提供一种问题推荐方法、 装置及系统, 可以解决现有技术中 的问题。
本发明实施例提供一种问题推荐方法, 包括:
服务器根据用户的短期兴趣、 长期兴趣以及人群兴趣构建所述用户 的兴趣向量, 所述用户的兴趣向量中包括多个兴趣项;
根据所述多个兴趣项由待解决问题集合中获取至少一个候选推荐 问题;
根据所述点击率模型预估所述用户回答所述候选推荐问题的概率, 并根据预估的概率从所述至少一个候选推荐问题中选取待推荐问题; 以 及
向所述用户的客户端推荐所述待推荐问题。
本发明实施例提供一种问题推荐装置, 包括:
兴趣向量计算模块, 用于根据用户的短期兴趣、 长期兴趣以及人群 兴趣构建所述用户的兴趣向量, 所述用户的兴趣向量中包括多个兴趣 项;
候选推荐问题获取模块, 用于根据所述多个兴趣项由待解决问题集 合中获取至少一个候选推荐问题;
待推荐问题获取模块, 用于根据所述点击率模型预估所述用户回答 所述候选推荐问题的概率, 并根据预估的概率从所述至少一个候选推荐 问题中选取待推荐问题; 以及
问题推荐模块, 用于向所述用户的客户端推荐所述待推荐问题。 本发明实施例提供一种问题推荐系统, 包括客户端以及服务器, 所述客户端向所述服务器发送问题推荐请求, 所述服务器根据问题 推荐请求向所述客户端返回待推荐问题。
所述服务器包括: 提供兴趣向量计算模块, 用于计算所述用户的短 期兴趣、 长期兴趣、 人群兴趣以及建立点击率模型, 根据所述用户的短 期兴趣、 长期兴趣以及人群兴趣构建的所述用户的兴趣向量, 所述用户 的兴趣向量中包括多个兴趣项; 候选推荐问题获取模块, 用于根据所述 多个兴趣项由待解决问题集合中获取候选推荐问题; 待推荐问题获取模 块, 用于根据所述点击率模型预估所述用户回答所述候选推荐问题的概 率, 并根据预估的概率选取待推荐问题; 以及问题推荐模块, 用于向所 述客户端推荐所述待推荐问题。
本发明所提出的问题推荐方法、 装置及系统通过融合用户的短期兴 趣、 长期兴趣和人群兴趣来构建用户的兴趣向量, 并根据用户的兴趣向 量中的兴趣项由待解决问题集合中获取候选推荐问题, 再根据点击率模 型预估用户回答候选推荐问题的概率, 根据预估的概率选取待推荐的问 题, 并向客户端推荐所述待推荐问题, 使得推荐的问题既符合用户的兴 趣又是用户回答意愿较高的问题。 这样, 可以获取实施、 全面的推荐结 果。 进一步地, 可以提高互动问答平台的问题回答率。
上述说明仅是本发明技术方案的概述, 为了能够更清楚了解本发明 的技术手段, 而可依照说明书的内容予以实施, 并且为了让本发明的上 述和其他目的、 特征和优点能够更明显易懂, 以下特举较佳实施例, 并 配合附图, 详细说明如下。 附图简要说明
图 1为现有技术的一种问题推荐方法的原理示意图;
图 2为现有技术的另一种问题推荐方法的原理示意图;
图 3为本发明第一实施例中的问题推荐方法的流程示意图; 图 4为本发明第二实施例中的问题推荐方法的流程示意图; 图 5为本发明第二实施例中的问题推荐方法的原理框图; 图 6为图 4中步骤 S21的具体流程示意图;
图 7为用户短期兴趣项的循环队列示意图;
图 8为图 4中步骤 S23的具体流程示意图;
图 9为图 4中步骤 S24的具体流程示意图;
图 10为候选推荐问题选取的原理框图;
图 11为图 4中步骤 S25的具体流程示意图;
图 12为 CTR模型训练和 CTR预估的原理框图;
图 13为本发明第三实施例中的问题推荐装置的结构示意图; 图 14为本发明第四实施例中的问题推荐装置的结构示意图; 图 15为图 14中短期兴趣计算单元的具体结构示意图;
图 16为图 14中人群兴趣计算单元的具体结构示意图;
图 17为图 14中点击率模型建立单元的具体结构示意图; 图 18为本发明第五实施例中的问题推荐系统的原理框图。 实施本发明的方式
为更进一步阐述本发明为达成预定发明目的所釆取的技术手段及 功效,以下结合附图及较佳实施例,对依据本发明提出的问题推荐方法及 系统其具体实施方式、 方法、 步骤、 结构、 特征及其功效, 详细说明如 下。
现有的问题推荐方法主要有两类: 一类是基于用户兴趣匹配的问题 推荐方法, 另一类是基于点击 (CTR, Click Through Rate )预估的问题 推荐方法。
如图 1所示, 基于用户兴趣匹配的问题推荐, 利用离线挖掘技术, 通过用户已有的回答来挖掘用户的兴趣。 通过兴趣匹配, 为用户推荐匹 配其兴趣的待解决问题。
如图 2所示,基于点击预估的问题推荐,通过历史的曝光日志 (记录 了哪些问题展示给了哪些用户)与回答日志 (记录了哪些问题被哪些用户 回答过), 离线训练出点击预测模型。 在推荐过程中, 利用该模型预测一 个待解决问题展示给一个特定用户后被其回答的概率, 根据回答概率度 对所有待解决问题排序, 取前 N个待解决问题的作为推荐结果进行展 示。
但是, 离线挖掘用户兴趣滞后于用户的兴趣变化, 因此, 推荐结果 中无法体现用户的近期行为所反应出来的兴趣迁移。 通过离线计算, 从 用户的历史回答记录中挖掘出来的兴趣是用户的长期兴趣, 这种长期兴 趣相对稳定, 随时间变化慢, 反映用户在较长一段时间内的行为所体现 出的兴趣点的累积。但是用户的兴趣是会随着时间迁移(发生变化)的, 并且越近的行为对于体现用户兴趣变化的作用越大。 但, 传统的离线计 算的方式往往是通过定时计算来更新用户兴趣模型, 无法做到实时捕捉 用户兴趣变化, 无法挖掘到用户的近期行为而产生的短期兴趣, 从而也 就无法在推荐结果中迅速体现。
在基于点击预估的问题推荐系统中, 由于待解决问题的数量比较 多, 不可能针对所有的问题进行计算, 因此也会釆用用户兴趣匹配的方 法, 首先对待解决问题进行初步的筛选, 仅提取出与用户兴趣相匹配的 若干问题作为候选, 然后再进行回答概率的预估计算。 用户兴趣是依靠 对其行为数据的挖掘得到的, 无论是基于用户兴趣匹配还是基于点击预 估的问题推荐, 都需要依靠用户兴趣进行问题和用户兴趣的匹配计算。
但是对于一些不活跃用户而言, 由于其行为数据非常少 (有些甚至 没有), 那么这部分用户就无法通过挖掘的手段来获取其用户兴趣, 也 就无法匹配到兴趣相关的问题。 此外, 有很大一部分的用户即使能够提 取到兴趣, 也会产生兴趣稀疏的现象, 这些用户的兴趣点过于集中, 或 者兴趣点很偏僻, 很少有相关问题切中该兴趣点。 因此, 会造成推荐结 果不全面、 结果单一的现象。
本发明中提出的问题推荐方法针对上述问题, 通过实时捕获用户的 实时回答记录, 计算用户的短期兴趣, 解决基于用户兴趣匹配的问题推 荐方法中推荐兴趣滞后的问题; 通过对用户填写的兴趣或历史回答记录 进行人口学统计分析, 构建人群兴趣模型, 补充用户兴趣, 解决基于点 击预估的问题推荐方法中推荐结果不全面、 结果单一的现象。 结合用户 的长期兴趣、 短期兴趣、 人群兴趣构建完整的用户兴趣向量。 在待解决 问题集合中检索候选推荐问题, 并以用户回答率为目的进行 CTR预估, 为用户推荐符合兴趣并且愿意作答的问题, 提高互动问答平台的问题回 答率。 另外, 在该问题推荐方法的基础上搭建了问题推荐系统, 为互动 问答社区平台提供问题推荐服务。
有关本发明的前述及其技术内容、 特点及功效, 在以下配合参考图 式的较佳实施例的详细说明中将可清楚呈现。 通过具体实施方式的说 入且具体的了解, 然而所附图式仅是提供参考与说明之用, 并非用来对 本发明加以限制。
第一实施例
图 3为本发明第一实施例的问题推荐方法的流程示意图。 请参照图 3, 本发明实施例中的问题推荐方法包括:
步骤 S11 : 服务器根据用户的短期兴趣、 长期兴趣以及人群兴趣构 建用户的兴趣向量, 所述兴趣向量中包括多个兴趣项。
其中, 用户的短期兴趣可以根据用户的实时回答记录获得, 通过计 算用户在预定时长内的短期兴趣, 快速感知用户行为体现出的兴趣变 化。 其中, 实时回答记录记录了用户在预定时长内对哪些问题进行了回 答。 短期兴趣反映用户在较短时间段的行为所体现出的兴趣项, 具有相 对不稳定、 随时间和社会热点变化快、 兴趣项比较集中等特点。
用户的长期兴趣可以是通过对历史回答记录进行挖掘得到的用户 兴趣, 也可以根据存储在服务器或数据库中的各种应用(例如 QQ或 "问 问")的用户档案资料中用户所填写的兴趣获得。 长期兴趣可以反映用户 在较长时间段内的行为所体现出的兴趣项的累积, 具有相对稳定、 随时 间变化慢、 兴趣项比较分散等特点。 其中, 历史回答记录记录了哪些用 户回答过哪些问题。 例如, 对用户 ul推荐了 5个问题 a、 b、 c、 d、 e。 对用户 u2也推荐了 5个问题 c、 d、 e、 f、 g。 那么问题&、 b只展示 (曝 光)给了用户 ul。 问题 e、 f只展示给了用户 u2。 问题 c、 d、 e同时展示 给了用户 ul和 u2。 假设用户 ul回答了问题 a、 c, 用户 u2回答了问题 c、 f。 那么, 在历史回答记录中将记录上述回答行为。
用户的人群兴趣可以依据用户的属性将用户划分为若干人群。 针对 不同人群挖掘长期兴趣, 在用户兴趣稀疏的情况下, 利用群体性的兴趣 去估计用户的个性化兴趣, 根据用户所属人群来补充用户兴趣。 其中, 用户的属性可以包括年龄、 性别、 行业、 教育程度等等。 人群兴趣可以 反映具有相同属性的用户构成的人群所具有的长期兴趣, 是一个人群基 体在较长时间段的相似行为所体现出的兴趣项的累积。
通过对不同来源的用户兴趣 (包括用户的长期兴趣、用户的短期兴趣 以及人群兴趣)进行兴趣融合, 构建出完整的用户兴趣向量。
在问题推荐系统中, CTR表示问题被展示后被用户回答的概率。 CTR模型可以根据历史回答记录、 历史曝光记录, 通过 CTR模型训练 得到。 其中, 历史曝光记录记录了哪些问题展示给了哪些用户。 例如, 对用户 ul推荐了 5个问题 a、 b、 c、 d、 e。 对用户 u2也推荐了 5个问 题0、 d、 e、 f、 g。 那么, 问题 a、 b只曝光给了用户 ul。 问题 e、 f只曝 光给了用户 u2。 问题 c、 d、 e同时曝光给了用户 ul和 u2。 在历史曝光 记录中将会记录这种曝光信息, 以及在曝光过程中的场景信息(如曝光 时间、 展示位置、 分页、 排序等)。
步骤 S12: 服务器根据所述兴趣向量中的多个兴趣项, 由待解决问 题集合中获取候选推荐问题。
于此步骤中, 根据用户兴趣向量中的兴趣项, 从待解决问题库中检 索出与用户兴趣相关的问题, 计算检索出的问题与用户兴趣的相关性, 提取出其中相关性最高的至少一个问题作为候选推荐问题。 步骤 S13: 服务器根据所述点击率模型预估用户回答所述候选推荐 问题的概率, 并根据预估的概率从候选推荐问题中选取待推荐问题。
具体的, 可以针对用户特征、 问题特征以及场景特征, 利用 CTR 模型来预测用户回答候选推荐问题的概率,也就是进行 CTR预估,并按 回答概率的大小进行排序, 提取出其中回答概率最高的若干问题作为待 推荐问题。
步骤 S14: 服务器向该用户的客户端推荐所选取的待推荐问题。 其中, 用户的短期兴趣, 候选问题检索和 CTR预估为在线计算, 人 群兴趣模型和 CTR模型训练为离线计算。
本实施例提出的问题推荐方法通过融合用户的短期兴趣、 长期兴趣 和人群兴趣来构建用户的兴趣向量, 并根据用户的兴趣向量中的兴趣项 由待解决问题集合中获取候选推荐问题, 再根据点击率模型预估用户回 答候选推荐问题的概率, 根据预估的概率从该候选推荐问题中选取待推 荐的问题, 并向该用户的客户端推荐所述待推荐问题, 使得推荐的问题 既符合用户的兴趣又是用户回答意愿较高的问题。这样,可以获得实时、 全面的推荐结果。 进一步地, 可以提高互动问答平台的问题回答率。
第二实施例
图 4为本发明第二实施例的问题推荐方法的流程示意图。 图 5为本 发明实施例的问题推荐方法的原理框图, 请同时参照图 4及图 5, 本发 明实施例中的问题推荐方法包括:
步骤 S21 : 根据所述用户在距离当前时间预定时长内的实时回答记 录, 计算所述用户的短期兴趣。
可以用兴趣向量表示用户的兴趣。 用户的短期兴趣可以用短期兴趣 向量来表示。 其中, 兴趣项可以包括兴趣关键词或兴趣分类。 根据每个 兴趣项在短期兴趣向量中的权重计算用户的短期兴趣。 例如, 用(:„来代 表用户"的短期兴趣, c„可以表示为:
Cu = {{t W ) \j = l 2,..N} (1) 其中, ^为一个兴趣项, 为兴趣项 ^在短期兴趣向量中的权重。 计算一个用户的短期兴趣, 就是获得短期兴趣向量中各兴趣项的权重。
计算用户的短期兴趣时, 主要考虑两个方面的因素: 兴趣项的频率 以及兴趣项的实效性。 短时间内用户回答问题所涉及的兴趣项出现频率 越高, 则该兴趣项在向量中的权重越大。 用户回答问题距当前时间点越 久, 该问题所涉及兴趣项的权重越低(即权重随时间衰减)。 当这个时 间超出预设的阔值时, 权重降为 0。
出于上述两个因素的考虑, 请参照图 6, 具体的, 步骤 S21可以包 括:
步骤 S 211, 获取用户在距离当前时间预定时长内的实时回答记录。 实时回答记录可以由该用户的客户端记录的问题回答日志中获取。 步骤 S212,根据所述实时回答记录,提取每个问题对应的兴趣项以 及回答每个问题的时间。 以回答每个问题的时间为所述问题对应的兴趣 项的时间戳, 以所述兴趣项为元素并根据其对应的时间戳构建循环队 列。
在用户的短期兴趣计算中, 可以为每个有回答问题行为的用户建立 一个固定长度 L的循环队列。 队列每个元素对应一个兴趣项以及该兴趣 项的时间戳, 并记录最新兴趣项的位置, 如图 7所示。
当一个用户有新回答行为产生时, 会提取该问题对应的兴趣项及行 为的时间戳, 插入到最新兴趣项的前一个位置(沿时间减少的方向进行 插入), 并改变最新兴趣项位置 (向插入方向移动)。
步骤 S213, 根据所述循环队列计算每个兴趣项对应的权重。 在计算用户的短期兴趣时, 从最新兴趣项位置开始, 沿着与插入相 反的方向进行遍历, 统计兴趣项的频率以及根据时间戳计算权重。
具体的, 可以根据每个兴趣项在所述循环队列中的位置, 计算每个 兴趣项出现在该位置上时的时间衰减函数以及每个兴趣项出现在该位 置上时的时间戳与当前时间之间的时长。 根据每个兴趣项出现在该位置 上时的时间衰减函数以及每个兴趣项出现在该位置上时的时间戳与当 前时间之间的时长, 计算每个兴趣项对应的权重。
其中 函数。
Figure imgf000011_0001
T. pos为位置 pOS上的特征项 tj距离当前时间点的时长, 常数 和 用于调 节时间衰减的幅度和半衰期; r为兴趣项的有效期阔值。
步骤 S214, 根据每个兴趣项对应的权重计算所述用户的短期兴趣。 也就是将通过公式 (2)计算得到的 , 代入公式 (1)来计算用户的短 期兴趣 C 。
步骤 S22: 根据历史回答记录, 获取所述用户的长期兴趣。
步骤 S23: 根据历史回答记录、 用户的属性组合以及与每种用户属 性对应的兴趣项出现的概率, 计算所述用户的人群兴趣。
请参照图 8, 步骤 S23可以包括:
步骤 S231,根据用户的属性组合, 将所有用户分为多个不同类型的 人群;
步骤 S232, 计算与用户的属性组合所对应的每个兴趣项出现的概 率;
步骤 S233,根据所述概率, 计算与每种类型的人群对应的兴趣项的 权重;
步骤 S234, 根据所述用户的属性, 查找与所述用户对应的人群; 步骤 S235,根据该人群对应的兴趣项的权重, 计算所述用户的人群 兴趣。
具体来讲, 每个用户都具有一定的属性。 当这些属性取不同值并组 合在一起的时候, 就构成不同类型的人群(例如: "25~27周岁, 男性, 大学本科学历、 IT从业者")。 人群兴趣建模通过分人群统计兴趣项, 构 建人群兴趣模型, 用来估计当用户属于某特定人群的情况下, 最可能具 有哪些兴趣项, 以及这些兴趣项的权重是多少。
如果用 £)代表人群兴趣, ζ.表示用户的第 个属性取值, 模型可以表 示为:
Figure imgf000012_0001
/^ /^2,...,¾)的含义是当用户属性组合 /^2,...,¾出现时,兴趣项 ·出 现的概率。 人群兴趣建模就是对所有的兴趣项建立这样的概率模型, 然 后建立人群到兴趣项的倒排表, 并在倒排表内按概率大小进行排序, 过 滤掉概率值较低的兴趣项。
直接统计 ^^,^…,/^非常耗费空间 (例如: 当兴趣项为百万级, 人群有上千个的时候, 需要有上十亿的存储单元用于记录兴趣项的频 率)。 因此, 如果假设用户属性的取值相互独立, 则可利用贝叶斯定律 来计算 ^ |/^2,...,¾;) : (4)
Figure imgf000012_0002
在公式 (4)中 ^,r2,...,rM |^和 ^,r2,...,rM ; (为两个联合概率, 由于属性 之间相互独立, 则有:
Figure imgf000013_0001
公式 (4)、 (5)、 (6)中的 表示兴趣项 ^的概率, /^.Μ为在兴趣项 出现的条件下第 i个属性取值为 η的条件概率, Ρ (/ 为第 个属性取值 为 的概率。 )、 . Ρ (η
Figure imgf000013_0002
接在历史回答记录中统计 得到。 然后利用公式 (4)计算所有每个属性取值组合下的 /^^, 2,...,¾ 建立倒排, 并进行排序和过滤。
在建立了人群兴趣模型后, 对于用户 , 只要根据属性组合就可 以获取其所属人群。 根据该人群的兴趣项集合构建用户 u的人群兴趣 向量:
Figure imgf000013_0003
其中 Da表示用户 u的人群兴趣向量, v )表示兴趣项 ^在向量中的 权重:
Figure imgf000013_0004
步骤 S24: 根据历史回答记录、 历史曝光记录建立点击率模型。 请参照图 9, 步骤 S24可以包括:
步骤 S241,将所述历史曝光记录中已被用户回答过的问题标记为正 样本, 将所述历史曝光记录中未被用户回答过的问题标记为负样本; 步骤 S242, 提取所有正样本和负样本的特征向量;
步骤 S243,利用所述正样本和负样本的特征向量进行点击率模型训 练, 建立点击率模型。
其中, 所述特征向量包括: 用户特征向量、 问题特征向量以及场景 特征向量。
其中, 用户特征为用户固有的, 随场景变化较小的特征, 如用户的 长期兴趣分类、 用户的长期兴趣关键词、 用户的经验值、 积分、 回答频 率等等。
问题特征为问题固有的, 随场景变化较小的特征, 如问题的分类、 问题的关键词、 问题的悬赏值、 问题的地域性、 标题长度等等。
场景特征为随时间和空间变化较大的特征, 如问题与用户兴趣的匹 配程度、 问题命中用户兴趣的类型、 推荐该问题的时间等等。
可以釆用如下方法进行点击率模型训练: 逻辑回归 (LR, Logistic Regression ), 最大熵、 决策树等等。 例如, 釆用逻辑回归 ( LR, Logistic Regression )方法进行点击率模型训练, 并在模型训练过程中, 釆用随机 梯度下降法 (SGD, Stochastic Gradient Descent)" 对逻辑回归模型的参数 进行估计。 通过训练样本训练出的 CTR模型实际上是一个逻辑回归模 型。 通过这个模型能够对未知 CTR概率的样本进行 CTR预估。
具体的, 假设逻辑回归中的目标函数为:
Figure imgf000014_0001
其中, = ( , .. 为特征向量, W
Figure imgf000014_0002
'" ^为 特征权重向量, y = +l, y = -l分别表示点击或不点击, /^) = ±1)为点击或 不点击的概率。
在训练过程中, 每个样本的 y值 (是否点击), 样本的特征向量 X已 知, 需要求一个 W使得目标函数最大(即概率最大化), 是一个最优化 问题, 即求一个 W使得公式(10 )成立: max. ∑log (p ( yi )) \ = -∑{! + exp (-y.W'X, )} (1 0) 上式中 为第 个样本是否被点击 (+1 或 -1), X,为第 个样本的特 征向量。
在一个实施方式中, SGD就是在训练过程中求解上述最优化问题的 方法之一。 根据训练样本所估计的参数就是特征向量的权重系数向量 W。 最终 CTR模型用这个权重系数向量来描述。
需要说明的是, 上述步骤 S21至步骤 S24可以同时执行, 也可以按 顺序执行, 本发明的具体实施方式并不以此为限。
步骤 S25: 根据用户的短期兴趣、 长期兴趣以及人群兴趣构建所述 用户的兴趣向量, 所述兴趣向量中包括多个兴趣项, 根据所述多个兴趣 项由待解决问题集合中获取候选推荐问题。
请同时参考图 10, 可以通过向量的线性加权, 将所述用户的短期兴 趣、 长期兴趣以及人群兴趣进行合并, 得到用户的兴趣向量 :
Su =axAu+cxCu+d Du (11)
其中, A为用户长期兴趣向量,用户长期兴趣向量 A的加权系数 a的 范围为 0.1 Ω 0.5,用户短期兴趣 C„的向量加权系数 c的范围为 0.5 c 0.8, 用户人群兴趣的向量 的加权系数 ^ /的范围为 0.1 0.5。 在 一个实施方式中, a c、 ίΓ满足关系 θΩ>ί/。 也就是说, 用户的短期兴 趣的向量加权系数>长期兴趣的向量加权系数>人群兴趣的向量加权系 数。 在一个实施方式中, Ω可以为 0.2, c可以为 0.7, 可以为 0.1。
请参照图 11, 步骤 S25还可以包括:
步骤 S251,根据所述用户的兴趣向量中的多个兴趣项, 计算待解决 问题集合中的问题与所述用户的兴趣向量的相关性;
步骤 S252, 根据相关性对这些问题进行排序;
步骤 S253, 提取相关性在预定范围内的问题作为所述候选推荐问 题。
在一个实施方式中, 可以釆用皮尔逊相关性、 欧式距离、 BM2.5进 行相关性计算等方法进行相关性计算。 例如, 釆用余弦相关性计算方法 来计算待解决问题集合中的问题与用户的兴趣向量之间的相关性。 假定 ft为问题 的关键词向量。 那么向量 ft与用户兴趣向量 之间夹角的余 弦值就是问题 与用户兴趣向量 之间的相关性: sim {Su , ft ) = c。s(S„ , ft ) = I ( 12) 步骤 S26: 根据所述点击率模型预估用户回答所述候选推荐问题的 概率, 并根据预估的概率选取待推荐问题。
相关问题不一定是用户擅长的、 或用户愿意回答的。 兴趣相关与用 户的回答(或推荐的转换)之间并不存在必然的因果关系。 CTR预估方 法则是以用户回答率为目标的方法, 通过历史问题记录反映出的各个特 征(包括用户特征、 问题特征、 场景特征)与回答之间的相关性, 预测 一个用户对一个新问题的回答概率。
具体的,请参照图 12,可以针对用户特征、问题特征以及场景特征, 利用 CTR模型来预测用户回答候选推荐问题的概率。也就是,进行 CTR 预估, 并按回答概率的大小进行排序, 提取出其中回答概率最高的若干 问题作为待推荐问题。 具体的, 可以先提取所述用户、 候选推荐问题以 及当前场景的特征向量; 再利用所述特征向量以及所述点击率模型预估 所述用户回答所述候选推荐问题的概率。 所述根据预估的概率选取待推 荐问题的步骤包括根据预估的概率对候选推荐问题进行排序, 提取概率 在预定范围内的问题作为所述待推荐问题。
步骤 S27: 向所述用户的客户端推荐所选取的待推荐问题。
本实施例提出的问题推荐方法通过融合用户的短期兴趣、 长期兴趣 和人群兴趣来构建用户的兴趣向量, 并根据用户的兴趣向量中的兴趣项 由待解决问题集合中获取候选推荐问题, 再根据点击率模型预估用户回 答候选推荐问题的概率, 根据预估的概率选取待推荐的问题, 并向客户 端推荐所述待推荐问题, 使得推荐的问题既符合用户的兴趣又是用户回 答意愿较高的问题。 这样, 可以及时获得实时、 全面的推荐结果。 进一 步地, 可以提高互动问答平台的问题回答率。
第三实施例
请参见图 13,为本发明第三实施例提供的一种问题推荐装置的结构 示意图。 该装置可以运行于上述实施例中的服务器, 该装置 30 包括: 兴趣向量计算模块 31、 候选推荐问题获取模块 32、 待推荐问题获取模 块 33以及问题推荐模块 34。
其中, 兴趣向量计算模块 31 用于根据用户的短期兴趣、 长期兴趣 以及人群兴趣构建所述用户的兴趣向量, 所述用户的兴趣向量中包括多 个兴趣项;
候选推荐问题获取模块 32用于根据所述多个兴趣项由待解决问题 集合中获取至少一个候选推荐问题;
待推荐问题获取模块 33 用于根据所述点击率模型预估所述用户回 答所述候选推荐问题的概率, 并根据预估的概率从所述至少一个候选推 荐问题中选取待推荐问题; 以及
问题推荐模块 34用于向所述用户的客户端推荐所述待推荐问题。 以上各模块可以是由软件代码实现, 此时, 上述的各模块可存储于 存储器内。 以上各模块同样可以由硬件例如集成电路芯片实现。
需要说明的是, 本发明实施例的各功能模块的功能可根据上述方法 实施例中的方法具体实现, 其具体实现过程可以参照上述方法实施例的 相关描述, 在此不赘述。 本发明实施例通过融合用户的短期兴趣、 长期兴趣和人群兴趣来构 建用户的兴趣向量, 并根据用户的兴趣向量中的兴趣项由待解决问题集 合中获取候选推荐问题, 再根据点击率模型预估用户回答候选推荐问题 的概率, 根据预估的概率选取待推荐的问题, 并向客户端推荐所述待推 荐问题, 使得推荐的问题既符合用户的兴趣又是用户回答意愿较高的问 题。 这样, 可以及时获得实时、 全面的推荐结果。 进一步地, 可以提高 互动问答平台的问题回答率。
第四实施例
请参见图 14,为本发明第四实施例提供的一种问题推荐装置的结构 示意图。 该装置可以运行于上述实施例中的服务器。 该装置 40 包括: 兴趣向量计算模块 41、 候选推荐问题获取模块 42、 待推荐问题获取模 块 43以及问题推荐模块 44。
其中, 兴趣向量计算模块 41 用于根据所述用户的短期兴趣、 长期 兴趣以及人群兴趣构建的所述用户的兴趣向量, 所述用户的兴趣向量中 包括多个兴趣项;
候选推荐问题获取模块 42用于根据所述多个兴趣项由待解决问题 集合中获取至少一个候选推荐问题;
待推荐问题获取模块 43 用于根据所述点击率模型预估所述用户回 答所述候选推荐问题的概率, 并根据预估的概率从至少一个候选推荐问 题中选取待推荐问题; 以及
问题推荐模块 44用于向所述用户的客户端推荐所述待推荐问题。 在一个实施方式中, 该装置还包括: 短期兴趣计算单元 411, 用于 根据所述用户在距离当前时间预定时长内的实时回答记录, 计算所述用 户的短期兴趣;
在一个实施方式中, 该装置还包括: 长期兴趣获取单元 412, 用于 根据历史回答记录, 获取所述用户的长期兴趣;
在一个实施方式中, 该装置还包括: 人群兴趣计算单元 413, 用于 根据历史回答记录、 用户的属性以及与每种用户属性对应的兴趣项出现 的概率, 计算所述用户的人群兴趣; 以及
在一个实施方式中, 该装置还包括: 点击率模型建立单元 414, 用 于根据历史回答记录、 历史曝光记录建立点击率模型;
于本实施例中, 所述兴趣向量计算模块 41可以包括:
兴趣向量计算单元 415, 用于根据用户短期兴趣的向量加权系数、 用户长期兴趣的向量加权系数、 用户人群兴趣的向量加权系数, 通过向 量的线性加权, 将所述用户的短期兴趣、 长期兴趣以及人群兴趣进行合 并, 得到用户的兴趣向量。
用户短期兴趣的向量加权系数大于用户长期兴趣的向量加权系数, 用户长期兴趣的向量加权系数大于用户人群兴趣的向量加权系数, 其 中, 用户短期兴趣的向量加权系数大于等于 0.5且小于等于 0.8, 用户长 期兴趣的向量加权系数大于等于 0.1且小于等于 0.5,用户人群兴趣的向 量加权系数大于等于 0.1且小于等于 0.5。 优选的, 用户长期兴趣的向量 加权系数为 0.2, 用户短期兴趣的向量加权系数为 0.7, 用户人群兴趣的 向量加权系数为 0.1。
于本实施例中, 所述候选推荐问题获取模块 42包括:
相关性计算单元 421, 用于根据所述多个兴趣项, 计算待解决问题 集合中的问题与所述用户的兴趣向量的相关性;
第一排序单元 422, 用于根据相关性对这些问题进行排序; 以及 候选推荐问题选取单元 423, 用于提取相关性在预定范围内的问题 作为所述候选推荐问题。
于本实施例中, 所述待推荐问题获取模块 43包括: 预估单元 431, 用于根据所述点击率模型预估所述用户回答所述候 选推荐问题的概率;
第二排序单元 432,用于根据预估的概率对候选推荐问题进行排序; 以及
待推荐问题选取单元 433, 用于提取概率在预定范围内的问题作为 所述待推荐问题。
请参照图 15, 进一步的, 所述短期兴趣计算单元 411可以包括: 实时回答记录获取子单元 4111,用于获取用户在距离当前时间预定 时长内的实时回答记录;
循环队列构建子单元 4112, 用于根据所述实时回答记录, 提取每个 问题对应的兴趣项以及回答每个问题的时间, 以回答每个问题的时间为 所述问题对应的兴趣项的时间戳, 以所述兴趣项为元素并 居其对应的 时间戳构建循环队列;
第一权重计算子单元 4113,用于根据所述循环队列计算每个兴趣项 对应的权重; 以及
短期兴趣计算子单元 4114,用于根据每个兴趣项对应的权重计算所 述用户的短期兴趣。
所述第一权重计算子单元 4113 用于根据每个兴趣项在所述循环队 列中的位置, 计算每个兴趣项出现在该位置上时的时间衰减函数以及每 个兴趣项出现在该位置上时的时间戳与当前时间的时长; 根据每个兴趣 项出现在该位置上时的时间衰减函数以及每个兴趣项出现在该位置上 时的时间戳与当前时间的时长, 计算每个兴趣项对应的权重。
请参照图 16, 进一步的, 所述人群兴趣计算单元 413可以包括: 人群分类子单元 4131, 用于根据用户的属性组合, 将所有用户分为 多个不同类型的人群; 概率计算子单元 4132,用于计算与用户的属性组合所对应的每个兴 趣项出现的概率;
第二权重计算子单元 4133, 用于根据所述概率, 计算与每种类型的 人群对应的兴趣项的权重;
查找子单元 4134, 用于才艮据所述用户的属性, 查找与所述用户对应 的人群; 以及
人群兴趣计算子单元 4135, 用于根据该人群对应的兴趣项的权重, 计算所述用户的人群兴趣。
请参照图 17, 进一步的, 所述点击率模型建立单元 414可以包括: 样本标记子单元 4141,用于将所述历史曝光记录中已被用户回答过 的问题标记为正样本, 将所述历史曝光记录中未被用户回答过的问题标 记为负样本;
特征向量提取子单元 4142,用于提取所有正样本和负样本的特征向 量; 以及
模型训练子单元 4143,利用所述正样本和负样本的特征向量进行点 击率模型训练, 建立点击率模型。
所述特征向量包括: 用户特征向量、 问题特征向量以及场景特征向 量。
以上各模块可以是由软件代码实现, 此时, 上述的各模块可存储于 存储器内。 以上各模块同样可以由硬件例如集成电路芯片实现。
需要说明的是, 本发明实施例的各功能模块的功能可根据上述方法 实施例中的方法具体实现, 其具体实现过程可以参照上述方法实施例的 相关描述, 在此不赘述。
本发明实施例通过融合用户的短期兴趣、 长期兴趣和人群兴趣来构 建用户的兴趣向量, 并根据用户的兴趣向量中的兴趣项由待解决问题集 合中获取候选推荐问题, 再根据点击率模型预估用户回答候选推荐问题 的概率, 根据预估的概率选取待推荐的问题, 并向客户端推荐所述待推 荐问题, 使得推荐的问题既符合用户的兴趣又是用户回答意愿较高的问 题。 这样, 推荐结果进一步地, 可以提高互动问答平台的问题回答率。
第五实施例
请参见图 18,为本发明第五实施例提供的一种问题推荐系统的结构 示意图。 该系统 50包括: 客户端 51及服务端。 所述客户端 51将用户 的回答行为反馈至所述服务端, 向所述服务端发送问题推荐请求。
其中, 服务端包括离线挖掘服务装置 521 以及在线推荐服务装置
522。
其中, 离线挖掘服务装置 521用于根据用户的属性、 问题回答记录 获取用户的长期兴趣、 对人群兴趣进行建模、 建立 CTR模型。
具体的, 离线挖掘服务装置 521可以通过用户分析模块 5211, 对用 户进行分析, 包括整合用户的属性、 挖掘用户的长期兴趣。 离线挖掘服 务装置 521还可以通过问题分析模块 5212, 进行问题分析, 包括对问题 进行文本分析, 提取问题关键词、 对问题进行分类等。 离线挖掘服务装 置 521还可以通过人群兴趣建模模块 5213, 对人群兴趣进行建模, 包括 基于历史回答记录训练人群兴趣模型。 离线挖掘服务装置 521还可以通 过 CTR建模评估与发布模块 5214, 进行 CTR模型训练, 包括基于在线 部分緩存的特征向量、 历史曝光记录以及客户端提供的问题回答记录, 训练 CTR模型。 离线挖掘服务装置 521还可以通过 CTR模型训练模块 5215 , 对 CTR模型训练及发布, 自动评估线上正在使用的 CTR模型和 新训练生成的模型, 判断新模型是否由于线上模型, 择优发布。
在线推荐服务装置 522用于根据用户在距离当前时间预定时长内的 实时回答记录计算用户的短期兴趣, 根据人群兴趣建模获取用户的人群 兴趣, 并根据用户的长期兴趣、 短期兴趣、 人群兴趣构建用户的兴趣向 量, 根据兴趣向量中的多个兴趣项由待解决问题集合中获取至少一个候 选推荐问题, 根据 CTR模型预估所述用户回答所述候选推荐问题的概 率, 并根据预估的概率从至少一个候选推荐问题中选取待推荐问题, 对 客户端进行推荐。
具体的, 在线推荐服务装置 522可以通过短期兴趣服务模块 5221, 提供短期兴趣服务, 包括负责维护用户的近期回答行为, 计算用户短期 兴趣, 并提供咨询。 在线推荐服务装置 522 还可以通过数据服务模块 5222,提供数据服务, 包括负责向推荐服务提供用户信息(包括用户的属 性和长期兴趣)、 问题信息(包括问题的属性、 问题的分类以及问题的关 键词等)。 在线推荐服务装置 522还可以通过推荐服务模块 5223, 提供 推荐服务, 也就是系统的主服务。 具体的, 候选问题检索子模块 52231 针对客户端的推荐请求, 检索用户信息、 用户的短期兴趣、 计算用户人 群兴趣、 检索候选推荐问题。 CTR预估模块 52232对候选推荐问题进行 CTR预估、 排序等, 还包括记录特征向量等。 在线推荐服务装置 522还 可以通过推荐代理服务 5224, 进行推荐代理服务, 包括负责处理客户端 的请求, 向推荐服务提交推荐请求, 緩存推荐结果, 并对曝光日志进行 记录。
在上述系统中, 存在两个自反馈机制: 一个是短期兴趣的自反馈机 制, 用户在客户端进行问题回答行为将通过消息总线的方式反馈到短期 兴趣服务中, 由短期兴趣服务负责维护行为列表, 并提供短期兴趣的更 新; 另一个是 CTR模型的自反馈机制, 推荐服务、推荐代理服务以及客 户端记录的特征向量、 曝光问题记录、 历史回答记录将自动推送到离线 的 CTR训练模块, 其中 90%的样本可以作为训练样本进行 CTR模型训 练, 10%的样本可以作为模型评估的测试样本, 在对比新模型与线上模 型的预估效果后, 自动进行模型的发布。
需要说明的是, 本说明书中的各个实施例均釆用递进的方式描述, 每个实施例重点说明的都是与其他实施例的不同之处, 各个实施例之间 相同相似的部分互相参见即可。 对于装置类实施例而言, 由于其与方法 实施例基本相似, 所以描述的比较简单, 相关之处参见方法实施例的部 分说明即可。
需要说明的是, 在本文中, 术语"包括"、 "包含 "或者其任何其他变 体意在涵盖非排他性的包含, 从而使得包括一系列要素的过程、 方法、 物品或者装置不仅包括那些要素, 而且还包括没有明确列出的其他要 素, 或者是还包括为这种过程、 方法、 物品或者装置所固有的要素。 在 没有更多限制的情况下, 由语句 "包括一个 ...... "限定的要素, 并不排除 在包括所述要素的过程、方法、物品或者装置中还存在另外的相同要素。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤 可以通过硬件来完成, 也可以通过程序来指令相关的硬件完成, 所述的 程序可以存储于一种计算机可读存储介质中, 上述提到的存储介质可以 是只读存储器, 磁盘或光盘等。
以上所述, 仅是本发明的较佳实施例而已, 并非对本发明作任何形 式上的限制, 虽然本发明已以较佳实施例揭露如上, 然而并非用以限定 本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内, 当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效 实施例, 但凡是未脱离本发明技术方案内容, 依据本发明的技术实质对 以上实施例所作的任何简单修改、 等同变化与修饰, 均仍属于本发明技 术方案的范围内。

Claims

权利要求书
1. 一种问题推荐方法, 其特征在于, 包括:
服务器根据用户的短期兴趣、 长期兴趣以及人群兴趣构建所述用户 的兴趣向量, 所述用户的兴趣向量中包括多个兴趣项;
服务器根据所述多个兴趣项由待解决问题集合中获取至少一个候 选推荐问题;
服务器根据点击率模型, 分别预估所述用户回答所述至少一个候选 推荐问题的概率;
服务器根据所述预估的概率, 从所述至少一个候选推荐问题中选取 待推荐问题; 以及
向所述用户的客户端推荐所述待推荐问题。
2. 如权利要求 1所述的方法, 其特征在于, 根据所述用户的短期兴 趣、长期兴趣以及人群兴趣构建所述用户的兴趣向量之前,进一步包括: 根据所述用户在距离当前时间预定时长内的回答记录, 计算所述用 户的短期兴趣。
3. 如权利要求 1所述的方法, 其特征在于, 根据所述用户的短期兴 趣、长期兴趣以及人群兴趣构建所述用户的兴趣向量之前,进一步包括: 根据历史回答记录, 获取所述用户的长期兴趣。
4. 如权利要求 1所述的方法, 其特征在于, 根据所述用户的短期兴 趣、长期兴趣以及人群兴趣构建所述用户的兴趣向量之前,进一步包括: 根据历史回答记录、 用户的属性以及与每种用户属性对应的兴趣项 出现的概率, 计算所述用户的人群兴趣。
5. 如权利要求 1所述的方法, 其特征在于, 根据所述用户的短期兴 趣、长期兴趣以及人群兴趣构建所述用户的兴趣向量之前,进一步包括: 根据历史回答记录、 历史曝光记录建立点击率模型。
6. 如权利要求 2所述的方法, 其特征在于, 所述根据所述用户在距 离当前时间预定时长内的实时回答记录, 计算所述用户的短期兴趣, 包 括:
获取用户在距离当前时间预定时长内的实时回答记录;
根据所述实时回答记录, 提取每个问题对应的兴趣项以及回答每个 问题的时间, 以回答每个问题的时间为所述问题对应的兴趣项的时间 戳, 以所述兴趣项为元素并根据其对应的时间戳构建循环队列;
根据所述循环队列计算每个兴趣项对应的权重; 以及
根据每个兴趣项对应的权重计算所述用户的短期兴趣。
7. 如权利要求 6所述的方法, 其特征在于, 所述根据所述循环队列 计算每个兴趣项对应的权重的步骤, 包括:
根据每个兴趣项在所述循环队列中的位置, 计算每个兴趣项出现在 该位置上时的时间衰减函数以及每个兴趣项出现在该位置上时的时间 戳与当前时间的时间差; 以及
根据每个兴趣项出现在该位置上时的时间衰减函数以及每个兴趣 项出现在该位置上时的时间戳与当前时间的时间差, 计算每个兴趣项对 应的权重。
8. 如权利要求 4所述的方法,其特征在于,所述根据历史回答记录、 用户的属性组合以及与每种用户属性对应的兴趣项出现的概率, 计算所 述用户的人群兴趣, 包括:
根据所述用户的属性组合, 将所有用户分为多个不同类型的人群; 计算与所述用户的属性组合所对应的每个兴趣项出现的概率; 根据所述概率, 计算与每种类型的人群对应的兴趣项的权重; 根据所述用户的属性, 查找与所述用户对应的人群; 以及
根据该人群对应的兴趣项的权重, 计算所述用户的人群兴趣。
9. 如权利要求 1所述的方法, 其特征在于, 所述根据用户的短期兴 趣、 长期兴趣以及人群兴趣构建用户的兴趣向量, 包括:
根据用户短期兴趣的向量加权系数、 用户长期兴趣的向量加权系 数、 用户人群兴趣的向量加权系数, 通过向量的线性加权, 将所述用户 的短期兴趣、 长期兴趣以及人群兴趣进行合并, 得到用户的兴趣向量。
10. 如权利要求 9所述的方法, 其特征在于, 用户短期兴趣的向量 加权系数大于所述用户长期兴趣的向量加权系数, 所述用户长期兴趣的 向量加权系数大于所述用户人群兴趣的向量加权系数, 其中, 所述用户 短期兴趣的向量加权系数大于等于 0.5且小于等于 0.8,所述用户长期兴 趣的向量加权系数大于等于 0.1且小于等于 0.5,所述用户人群兴趣的向 量加权系数大于等于 0.1且小于等于 0.5。
11. 如权利要求 5所述的方法, 其特征在于, 所述根据历史回答记 录、 历史曝光记录建立点击率模型的步骤, 包括:
将所述历史曝光记录中已被所述用户回答过的问题标记为正样本, 将所述历史曝光记录中未被所述用户回答过的问题标记为负样本;
提取所有正样本和负样本的特征向量; 以及
利用所述正样本和负样本的特征向量进行点击率模型训练, 建立点 击率模型。
12. 如权利要求 11所述的方法, 其特征在于, 所述特征向量包括: 用户特征向量、 问题特征向量以及场景特征向量。
13. 如权利要求 1所述的方法, 其特征在于, 根据所述多个兴趣项 由待解决问题集合中获取至少一个候选推荐问题, 包括:
根据所述多个兴趣项, 计算待解决问题集合中的问题与所述用户的 兴趣向量的相关性;
根据相关性对这些问题进行排序; 以及 提取相关性在预定范围内的问题作为所述候选推荐问题。
14. 如权利要求 1所述的方法, 其特征在于, 所述根据点击率模型 预估所述用户回答所述候选推荐问题的概率, 包括:
提取用户特征向量、 候选推荐问题特征向量以及当前场景的特征向 量;
利用所述特征向量以及所述点击率模型预估所述用户回答所述候 选推荐问题的概率。
15. 如权利要求 1所述的方法, 其特征在于, 所述根据预估的概率 选取待推荐问题, 包括:
根据预估的概率对候选推荐问题进行排序, 提取概率在预定范围内 的问题作为所述待推荐问题。
16. 一种问题推荐装置, 其特征在于, 包括:
兴趣向量计算模块, 用于根据用户的短期兴趣、 长期兴趣以及人群 兴趣构建所述用户的兴趣向量, 所述用户的兴趣向量中包括多个兴趣 项;
候选推荐问题获取模块, 用于根据所述多个兴趣项由待解决问题集 合中获取至少一个候选推荐问题;
待推荐问题获取模块, 用于根据点击率模型分别预估所述用户回答 所述候选推荐问题的概率, 并根据所述预估的概率从所述至少一个候选 推荐问题中选取待推荐问题; 以及
问题推荐模块, 用于向所述用户的客户端推荐所述待推荐问题。
17. 如权利要求 16所述的装置, 其特征在于, 进一步包括: 短期兴趣计算单元, 用于根据所述用户在距离当前时间预定时长内 的实时回答记录, 计算所述用户的短期兴趣。
18. 如权利要求 16所述的装置, 其特征在于, 进一步包括: 长期兴趣获取单元, 用于根据历史回答记录, 获取所述用户的长期 兴趣。
19. 如权利要求 16所述的装置, 其特征在于, 进一步包括: 人群兴趣计算单元, 用于所述根据历史回答记录、 用户的属性以及 与每种用户属性对应的兴趣项出现的概率, 计算所述用户的人群兴趣。
20. 如权利要求 16所述的装置, 其特征在于, 进一步包括: 点击率模型建立单元, 用于根据所述历史回答记录、 历史曝光记录 建立点击率模型。
21. 如权利要求 17所述的装置, 其特征在于, 所述短期兴趣计算单 元, 包括:
实时回答记录获取子单元, 用于获取用户在距离当前时间预定时长 内的实时回答记录;
循环队列构建子单元, 用于根据所述实时回答记录, 提取每个问题 对应的兴趣项以及回答每个问题的时间, 以回答每个问题的时间为所述 问题对应的兴趣项的时间戳, 以所述兴趣项为元素并根据其对应的时间 戳构建循环队列;
第一权重计算子单元, 用于根据所述循环队列计算每个兴趣项对应 的权重; 以及
短期兴趣计算子单元, 用于根据每个兴趣项对应的权重计算所述用 户的短期兴趣。
22. 如权利要求 21所述的装置, 其特征在于, 所述第一权重计算子 单元用于根据每个兴趣项在所述循环队列中的位置, 计算每个兴趣项出 现在该位置上时的时间衰减函数以及每个兴趣项出现在该位置上时的 时间戳与当前时间的时间差; 根据每个兴趣项出现在该位置上时的时间 衰减函数以及每个兴趣项出现在该位置上时的时间戳与当前时间的时 间差, 计算每个兴趣项对应的权重。
23. 如权利要求 19所述的装置, 其特征在于, 所述人群兴趣计算单 元, 包括:
人群分类子单元, 用于根据用户的属性组合, 将所有用户分为多个 不同类型的人群;
概率计算子单元, 用于计算与所述用户的属性组合所对应的每个兴 趣项出现的概率;
第二权重计算子单元, 用于根据所述概率, 计算与每种类型的人群 对应的兴趣项的权重;
查找子单元, 用于根据所述用户的属性, 查找与所述用户对应的人 群; 以及
人群兴趣计算子单元, 用于根据该人群对应的兴趣项的权重, 计算 所述用户的人群兴趣。
24. 如权利要求 16所述的装置, 其特征在于, 所述兴趣向量计算模 块包括:
兴趣向量计算单元, 用于根据用户短期兴趣的向量加权系数、 用户 长期兴趣的向量加权系数、 用户人群兴趣的向量加权系数, 通过向量的 线性加权, 将所述用户的短期兴趣、 长期兴趣以及人群兴趣进行合并, 得到用户的兴趣向量。
25. 如权利要求 24所述的装置, 其特征在于, 用户短期兴趣的向量 加权系数大于所述用户长期兴趣的向量加权系数, 所述用户长期兴趣的 向量加权系数大于所述用户人群兴趣的向量加权系数, 其中, 所述用户 短期兴趣的向量加权系数大于等于 0.5且小于等于 0.8,所述用户长期兴 趣的向量加权系数大于等于 0.1且小于等于 0.5,所述用户人群兴趣的向 量加权系数大于等于 0.1且小于等于 0.5。
26. 如权利要求 20所述的装置, 其特征在于, 所述点击率模型建立 单元包括:
样本标记子单元, 用于将所述历史曝光记录中已被所述用户回答过 的问题标记为正样本, 将所述历史曝光记录中未被所述用户回答过的问 题标记为负样本;
特征向量提取子单元, 用于提取所有正样本和负样本的特征向量; 以及
模型训练子单元, 利用所述正样本和负样本的特征向量进行点击率 模型训练, 建立点击率模型。
27. 如权利要求 26所述的装置, 其特征在于, 所述特征向量包括: 用户特征向量、 问题特征向量以及场景特征向量。
28. 如权利要求 16所述的装置, 其特征在于, 所述候选推荐问题获 取模块包括:
相关性计算单元, 用于根据所述多个兴趣项, 计算待解决问题集合 中的问题与所述用户的兴趣向量的相关性;
低于排序单元, 用于根据相关性对这些问题进行排序; 以及 候选推荐问题选取单元, 用于提取相关性在预定范围内的问题作为 所述候选推荐问题。
29. 如权利要求 16所述的装置, 其特征在于, 所述待推荐问题获取 模块包括:
预估单元, 用于根据所述点击率模型预估所述用户回答所述候选推 荐问题的概率;
第二排序单元, 用于根据预估的概率对候选推荐问题进行排序; 以 及
待推荐问题选取单元, 用于提取概率在预定范围内的问题作为所述 待推荐问题。
30. 一种问题推荐系统, 包括客户端以及服务端, 其特征在于: 所述客户端将用户的回答行为反馈至所述服务端, 向所述服务端发 送问题推荐请求;
所述服务端响应所述客户端的问题推荐请求向所述客户端发送待 推荐的问题,
其中,所述服务端包括: 离线挖掘服务装置以及在线推荐服务装置; 所述离线挖掘服务装置, 用于获取用户的长期兴趣、 对人群兴趣进 行建模、 建立点击率模型;
所述在线推荐服务装置用于根据用户在距离当前时间预定时长内 的实时回答记录计算用户的短期兴趣, 根据人群兴趣建模获取用户的人 群兴趣, 并根据用户的长期兴趣、 短期兴趣、 人群兴趣构建用户的兴趣 向量, 根据兴趣向量中的多个兴趣项, 由待解决问题集合中获取至少一 个候选推荐问题, 根据点击率模型预估所述用户回答所述至少一个候选 推荐问题的概率, 并根据预估的概率选取所述待推荐问题, 并向所述客 户端发送所述待推荐问题。
PCT/CN2014/081808 2013-10-23 2014-07-08 问题推荐方法、装置及系统 WO2015058558A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US15/135,410 US9875441B2 (en) 2013-10-23 2016-04-21 Question recommending method, apparatus and system

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201310503499.3 2013-10-23
CN201310503499.3A CN104572734B (zh) 2013-10-23 2013-10-23 问题推荐方法、装置及系统

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US15/135,410 Continuation US9875441B2 (en) 2013-10-23 2016-04-21 Question recommending method, apparatus and system

Publications (1)

Publication Number Publication Date
WO2015058558A1 true WO2015058558A1 (zh) 2015-04-30

Family

ID=52992212

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2014/081808 WO2015058558A1 (zh) 2013-10-23 2014-07-08 问题推荐方法、装置及系统

Country Status (3)

Country Link
US (1) US9875441B2 (zh)
CN (1) CN104572734B (zh)
WO (1) WO2015058558A1 (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107291815A (zh) * 2017-05-22 2017-10-24 四川大学 基于跨平台标签融合的问答社区推荐方法
JP2019511764A (ja) * 2016-01-29 2019-04-25 アリババ グループ ホウルディング リミテッド 質問を推薦する方法及び装置
CN111930925A (zh) * 2020-07-20 2020-11-13 湖北美和易思教育科技有限公司 一种基于在线教学平台的试题推荐方法及系统
US20210034305A1 (en) * 2019-03-19 2021-02-04 Boe Technology Group Co., Ltd. Question generating method and apparatus, inquiring diagnosis system, and computer readable storage medium
CN112380426A (zh) * 2020-10-23 2021-02-19 南京邮电大学 一种基于图嵌入与用户长短期兴趣融合的兴趣点推荐方法、系统
US20210068766A1 (en) * 2015-08-11 2021-03-11 Cognoa, Inc. Methods and apparatus to determine developmental progress with artificial intelligence and user input
CN112966577A (zh) * 2021-02-23 2021-06-15 北京三快在线科技有限公司 一种模型训练以及信息提供的方法及装置
CN113158136A (zh) * 2021-04-23 2021-07-23 北京明略软件系统有限公司 关键词推荐效果评估方法、系统、电子设备及存储介质
CN114491150A (zh) * 2022-03-28 2022-05-13 苏州浪潮智能科技有限公司 一种视频推荐方法、系统、设备及计算机可读存储介质
CN115858926A (zh) * 2022-11-29 2023-03-28 杭州电子科技大学 基于用户的复杂多模式兴趣提取与建模的序列推荐方法
CN116887001A (zh) * 2023-09-06 2023-10-13 四川中电启明星信息技术有限公司 融合社会属性信息的短视频推送方法、装置及电子设备

Families Citing this family (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106211097A (zh) * 2015-05-08 2016-12-07 董嘉慧 一种交互信息推送方法及装置
CN106296247B (zh) * 2015-05-26 2020-12-22 腾讯科技(深圳)有限公司 网络信息资源在线排序方法和装置
US10268748B2 (en) * 2015-06-07 2019-04-23 Apple Inc. Reader application with a personalized feed and method of providing recommendations while maintaining user privacy
CN106469173B (zh) * 2015-08-19 2019-05-03 武汉市尺度网络科技有限公司 一种问题优先级别权重确定方法、装置、系统及服务器
JP6618735B2 (ja) * 2015-08-31 2019-12-11 国立研究開発法人情報通信研究機構 質問応答システムの訓練装置及びそのためのコンピュータプログラム
CN106503014B (zh) * 2015-09-08 2020-08-07 腾讯科技(深圳)有限公司 一种实时信息的推荐方法、装置和系统
CN105260471B (zh) * 2015-10-19 2019-03-26 广州品唯软件有限公司 商品个性化排序模型训练方法及系统
CN105407391A (zh) * 2015-11-24 2016-03-16 天脉聚源(北京)科技有限公司 一种互动电视系统配置互动信息的方法及装置
CN107408116B (zh) * 2015-12-14 2021-02-02 微软技术许可有限责任公司 使用动态知识图谱来促进信息项的发现
CN106960248B (zh) 2016-01-08 2021-02-23 阿里巴巴集团控股有限公司 一种基于数据驱动预测用户问题的方法及装置
CN105678587B (zh) * 2016-01-12 2020-11-24 腾讯科技(深圳)有限公司 一种推荐特征确定方法、信息推荐方法及装置
CN105915438B (zh) * 2016-04-15 2019-02-19 北京奇虎科技有限公司 消息推送方法、装置及系统
CN107436900B (zh) * 2016-05-26 2022-08-09 北京搜狗科技发展有限公司 基于搜索引擎的信息处理方法和装置
CN106326486B (zh) * 2016-09-05 2019-10-15 北京百度网讯科技有限公司 基于人工智能的推送信息的方法和装置
CN106372249B (zh) * 2016-09-23 2018-04-13 北京三快在线科技有限公司 一种点击率预估方法、装置及电子设备
CN106339510B (zh) * 2016-10-28 2019-12-06 北京百度网讯科技有限公司 基于人工智能的点击预估方法及装置
TWI771284B (zh) * 2017-01-23 2022-07-21 香港商阿里巴巴集團服務有限公司 基於資料驅動預測使用者問題的方法及裝置
CN108572984A (zh) * 2017-03-13 2018-09-25 阿里巴巴集团控股有限公司 一种实时用户兴趣识别方法及装置
CN107016122B (zh) * 2017-04-26 2021-02-02 天津大学 基于时间迁移的知识推荐方法
CN107562836B (zh) * 2017-06-07 2020-10-30 北京航空航天大学 基于主题模型和机器学习的回答者推荐方法
CN107451199B (zh) * 2017-07-05 2020-06-26 阿里巴巴集团控股有限公司 问题推荐方法及装置、设备
CN107704580A (zh) * 2017-09-30 2018-02-16 百度在线网络技术(北京)有限公司 基于用户时期的问答推送方法、装置、服务器及存储介质
US11429405B2 (en) 2017-11-28 2022-08-30 Intuit, Inc. Method and apparatus for providing personalized self-help experience
US11106686B1 (en) * 2017-11-28 2021-08-31 Snap Inc. Ranking notifications in a social network feed
CN108230009B (zh) * 2017-11-30 2021-09-03 北京三快在线科技有限公司 一种用户偏好的预测方法及装置,电子设备
US11250038B2 (en) * 2018-01-21 2022-02-15 Microsoft Technology Licensing, Llc. Question and answer pair generation using machine learning
CN110309357B (zh) * 2018-02-27 2022-12-02 腾讯科技(深圳)有限公司 应用数据推荐的方法、模型训练的方法、装置及存储介质
JP6569846B1 (ja) * 2018-03-02 2019-09-04 富士通株式会社 応答処理プログラム、応答処理方法、応答処理装置および応答処理システム
CN110309405B (zh) * 2018-03-08 2022-09-30 腾讯科技(深圳)有限公司 一种项目推荐方法、装置及存储介质
CN112106067A (zh) 2018-05-18 2020-12-18 北京嘀嘀无限科技发展有限公司 一种用于用户分析的系统和方法
CN108804619B (zh) * 2018-05-31 2020-11-03 腾讯科技(深圳)有限公司 兴趣偏好预测方法、装置、计算机设备及存储介质
CN108875022B (zh) * 2018-06-20 2021-03-02 北京奇艺世纪科技有限公司 一种视频推荐方法及装置
CN108920649B (zh) * 2018-06-29 2021-09-17 北京百度网讯科技有限公司 一种信息推荐方法、装置、设备和介质
CN109087162A (zh) * 2018-07-05 2018-12-25 杭州朗和科技有限公司 数据处理方法、系统、介质和计算设备
CN109255070B (zh) * 2018-08-01 2022-04-12 百度在线网络技术(北京)有限公司 推荐信息处理方法、装置、计算机设备及存储介质
CN109165350A (zh) * 2018-08-23 2019-01-08 成都品果科技有限公司 一种基于深度知识感知的信息推荐方法和系统
CN109446411A (zh) * 2018-09-21 2019-03-08 广州神马移动信息科技有限公司 知识社区中预约答题方法及其装置、电子设备、计算机可读介质
CN109299351B (zh) * 2018-09-21 2022-04-12 北京百度网讯科技有限公司 内容推荐方法和装置、电子设备及计算机可读介质
GB201815765D0 (en) 2018-09-27 2018-11-14 Microsoft Technology Licensing Llc Gathering data in a communication system
GB201815743D0 (en) * 2018-09-27 2018-11-14 Microsoft Technology Licensing Llc Gathering data in a communication system
CN109284383A (zh) * 2018-10-09 2019-01-29 北京来也网络科技有限公司 文本处理方法及装置
CN109408619B (zh) * 2018-10-10 2021-09-07 桂林电子科技大学 一种面向问答领域动态计算问句与答案相似性的方法
CN109710853B (zh) * 2018-12-27 2021-05-04 深圳铁盒子文化科技发展有限公司 一种人工智能分类匹配方法及系统
CN111488517A (zh) * 2019-01-29 2020-08-04 北京沃东天骏信息技术有限公司 用于训练点击率预估模型的方法和装置
CN111695919B (zh) * 2019-03-11 2024-04-26 北京嘀嘀无限科技发展有限公司 评价数据处理方法、装置、电子设备及存储介质
CN111833080A (zh) * 2019-04-15 2020-10-27 北京嘀嘀无限科技发展有限公司 信息推送的方法、装置、电子设备和计算机可读存储介质
JP7252969B2 (ja) * 2019-04-30 2023-04-05 北京字節跳動網絡技術有限公司 対象推薦方法および装置、記憶媒体と端末装置
CN110111010B (zh) * 2019-05-10 2020-07-03 山东大学 一种基于众智网络的问答任务分配方法及系统
CN110232115A (zh) * 2019-05-21 2019-09-13 北京力拓飞远科技有限公司 问题处理方法、设备、装置和计算机可读存储介质
CN110245293B (zh) 2019-05-28 2023-07-11 深圳市雅阅科技有限公司 一种网络内容召回方法和装置
CN110348006A (zh) * 2019-06-11 2019-10-18 平安科技(深圳)有限公司 问题信息的生成方法、装置、计算机设备及其存储介质
CN110490389B (zh) * 2019-08-27 2023-07-21 腾讯科技(深圳)有限公司 点击率预测方法、装置、设备及介质
CN110516159B (zh) * 2019-08-30 2022-12-20 北京字节跳动网络技术有限公司 一种信息推荐方法、装置、电子设备及存储介质
CN110825857B (zh) * 2019-09-24 2023-07-21 平安科技(深圳)有限公司 多轮问答识别方法、装置、计算机设备及存储介质
CN111046230B (zh) * 2019-12-06 2023-09-15 北京奇艺世纪科技有限公司 内容推荐方法及装置、电子设备和可存储介质
CN110929164B (zh) * 2019-12-09 2023-04-21 北京交通大学 一种基于用户动态偏好与注意力机制的兴趣点推荐方法
CN113627967A (zh) * 2020-05-09 2021-11-09 北京奇虎科技有限公司 行为数据处理方法、装置、设备及存储介质
WO2021237707A1 (zh) * 2020-05-29 2021-12-02 京东方科技集团股份有限公司 问题推荐方法及装置、系统和电子设备、可读存储介质
CN111723306B (zh) * 2020-05-29 2023-07-25 长三角信息智能创新研究院 一种基于地理感知的序列位置推荐方法
CN111475638A (zh) * 2020-06-02 2020-07-31 北京邮电大学 一种兴趣挖掘方法及装置
CN111859150B (zh) * 2020-08-03 2021-06-25 上海垚亨电子商务有限公司 基于大数据的终端信息推荐方法
CN112115352A (zh) * 2020-08-28 2020-12-22 齐鲁工业大学 基于用户兴趣的会话推荐方法及系统
CN112182379B (zh) * 2020-09-28 2021-07-13 上海嗨普智能信息科技股份有限公司 数据处理方法、电子设备及介质
CN112651862A (zh) * 2020-12-24 2021-04-13 成都存时科技有限公司 学生学业发展方向规划方法、装置、设备及可读存储介质
CN112800208B (zh) * 2021-01-21 2022-10-18 中国人民解放军国防科技大学 面向问答社区的问题审阅人自动化推荐方法及系统
CN113420058B (zh) * 2021-07-01 2022-07-01 宁波大学 一种基于结合用户历史行为的对话式学术会议推荐方法
CN113590948B (zh) * 2021-07-28 2024-03-26 咪咕数字传媒有限公司 信息推荐方法、装置、设备以及计算机存储介质
CN113626720B (zh) * 2021-10-12 2022-02-25 中国科学院自动化研究所 基于动作剪枝的推荐方法、装置、电子设备与存储介质
CN114168465B (zh) * 2021-12-02 2024-05-17 天津大学 一种基于计算实验的推荐系统验证方法
CN114564640A (zh) * 2022-02-17 2022-05-31 上海师范大学 基于长短期记忆和图注意力网络的oj平台题目推荐方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101093509A (zh) * 2007-07-18 2007-12-26 中国科学院计算技术研究所 一种查询交互系统和方法
CN101221583A (zh) * 2008-01-29 2008-07-16 北京百问百答网络技术有限公司 一种问题推荐方法及系统
CN101354701A (zh) * 2008-09-16 2009-01-28 四川虹微技术有限公司 一种实现基4 fft/ifft计算的fft处理器

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6655963B1 (en) * 2000-07-31 2003-12-02 Microsoft Corporation Methods and apparatus for predicting and selectively collecting preferences based on personality diagnosis
CN101354714B (zh) 2008-09-09 2010-09-08 浙江大学 一种基于概率潜在语义分析的问题推荐方法
US8589378B2 (en) * 2010-10-11 2013-11-19 Yahoo! Inc. Topic-oriented diversified item recommendation
CN101986301B (zh) * 2010-10-31 2014-05-07 华南理工大学 一种基于逆邻分析的协作过滤推荐系统及方法
CN102637170A (zh) * 2011-02-10 2012-08-15 北京百度网讯科技有限公司 一种问题推送方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101093509A (zh) * 2007-07-18 2007-12-26 中国科学院计算技术研究所 一种查询交互系统和方法
CN101221583A (zh) * 2008-01-29 2008-07-16 北京百问百答网络技术有限公司 一种问题推荐方法及系统
CN101354701A (zh) * 2008-09-16 2009-01-28 四川虹微技术有限公司 一种实现基4 fft/ifft计算的fft处理器

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210068766A1 (en) * 2015-08-11 2021-03-11 Cognoa, Inc. Methods and apparatus to determine developmental progress with artificial intelligence and user input
JP7007279B2 (ja) 2016-01-29 2022-01-24 アリババ グループ ホウルディング リミテッド 質問を推薦する方法及び装置
JP2019511764A (ja) * 2016-01-29 2019-04-25 アリババ グループ ホウルディング リミテッド 質問を推薦する方法及び装置
CN107291815A (zh) * 2017-05-22 2017-10-24 四川大学 基于跨平台标签融合的问答社区推荐方法
US20210034305A1 (en) * 2019-03-19 2021-02-04 Boe Technology Group Co., Ltd. Question generating method and apparatus, inquiring diagnosis system, and computer readable storage medium
US11600389B2 (en) * 2019-03-19 2023-03-07 Boe Technology Group Co., Ltd. Question generating method and apparatus, inquiring diagnosis system, and computer readable storage medium
CN111930925A (zh) * 2020-07-20 2020-11-13 湖北美和易思教育科技有限公司 一种基于在线教学平台的试题推荐方法及系统
CN111930925B (zh) * 2020-07-20 2024-01-23 湖北美和易思教育科技有限公司 一种基于在线教学平台的试题推荐方法及系统
CN112380426A (zh) * 2020-10-23 2021-02-19 南京邮电大学 一种基于图嵌入与用户长短期兴趣融合的兴趣点推荐方法、系统
CN112380426B (zh) * 2020-10-23 2023-10-13 南京邮电大学 一种基于图嵌入与用户长短期兴趣融合的兴趣点推荐方法、系统
CN112966577A (zh) * 2021-02-23 2021-06-15 北京三快在线科技有限公司 一种模型训练以及信息提供的方法及装置
CN113158136A (zh) * 2021-04-23 2021-07-23 北京明略软件系统有限公司 关键词推荐效果评估方法、系统、电子设备及存储介质
CN114491150A (zh) * 2022-03-28 2022-05-13 苏州浪潮智能科技有限公司 一种视频推荐方法、系统、设备及计算机可读存储介质
CN114491150B (zh) * 2022-03-28 2022-07-15 苏州浪潮智能科技有限公司 一种视频推荐方法、系统、设备及计算机可读存储介质
CN115858926A (zh) * 2022-11-29 2023-03-28 杭州电子科技大学 基于用户的复杂多模式兴趣提取与建模的序列推荐方法
CN115858926B (zh) * 2022-11-29 2023-09-01 杭州电子科技大学 基于用户的复杂多模式兴趣提取与建模的序列推荐方法
CN116887001A (zh) * 2023-09-06 2023-10-13 四川中电启明星信息技术有限公司 融合社会属性信息的短视频推送方法、装置及电子设备
CN116887001B (zh) * 2023-09-06 2023-12-15 四川中电启明星信息技术有限公司 融合社会属性信息的短视频推送方法、装置及电子设备

Also Published As

Publication number Publication date
US20160239738A1 (en) 2016-08-18
CN104572734A (zh) 2015-04-29
CN104572734B (zh) 2019-04-30
US9875441B2 (en) 2018-01-23

Similar Documents

Publication Publication Date Title
WO2015058558A1 (zh) 问题推荐方法、装置及系统
US11659050B2 (en) Discovering signature of electronic social networks
US11593894B2 (en) Interest recommendation method, computer device, and storage medium
WO2022041979A1 (zh) 一种信息推荐模型的训练方法和相关装置
US11790933B2 (en) Systems and methods for manipulating electronic content based on speech recognition
Keneshloo et al. Predicting the popularity of news articles
Efron Information search and retrieval in microblogs
JP5454357B2 (ja) 情報処理装置および方法、並びに、プログラム
CN107862022B (zh) 文化资源推荐系统
CN111027838B (zh) 一种众包任务推送方法、装置、设备及其存储介质
KR20190122334A (ko) 소셜 네트워크 시스템 기반의 질의 응답 서비스 제공을 위한 전문가 추천 방법 및 전문가 추천 시스템
Wood-Doughty et al. Johns Hopkins or Johnny-Hopkins: classifying individuals versus organizations on Twitter
Deshpande Prediction & evaluation of online news popularity using machine intelligence
Balduini et al. A Case Study of Active, Continuous and Predictive Social Media Analytics for Smart City.
Chakraborty et al. Clustering of web sessions by FOGSAA
WO2023082864A1 (zh) 内容推荐模型的训练方法、装置、设备及存储介质
Yan et al. User recommendation with tensor factorization in social networks
Al-Ghossein Context-aware recommender systems for real-world applications
Wang et al. Recommendation algorithm based on graph-model considering user background information
CN110413770A (zh) 将群消息归类到群话题的方法及装置
CN112182390B (zh) 一种函件推送方法、装置、计算机设备及存储介质
JP7312134B2 (ja) 学習装置、学習方法及び学習プログラム
Silva et al. USTAR: Online multimodal embedding for modeling user-guided spatiotemporal activity
Nguyen et al. Pagerank-based approach on ranking social events: a case study with flickr
Shukla et al. A Methodology to Detect and Track Breaking News on Twitter

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14855079

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 14855079

Country of ref document: EP

Kind code of ref document: A1