WO2012159308A1 - 一种业务交叉时的项目推荐方法及系统 - Google Patents

一种业务交叉时的项目推荐方法及系统 Download PDF

Info

Publication number
WO2012159308A1
WO2012159308A1 PCT/CN2011/076551 CN2011076551W WO2012159308A1 WO 2012159308 A1 WO2012159308 A1 WO 2012159308A1 CN 2011076551 W CN2011076551 W CN 2011076551W WO 2012159308 A1 WO2012159308 A1 WO 2012159308A1
Authority
WO
WIPO (PCT)
Prior art keywords
item
user
service
digital media
project
Prior art date
Application number
PCT/CN2011/076551
Other languages
English (en)
French (fr)
Inventor
杜家春
汪芳山
钟杰萍
Original Assignee
华为技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 华为技术有限公司 filed Critical 华为技术有限公司
Priority to CN201180001057.8A priority Critical patent/CN102959539B/zh
Priority to PCT/CN2011/076551 priority patent/WO2012159308A1/zh
Publication of WO2012159308A1 publication Critical patent/WO2012159308A1/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Definitions

  • the present invention relates to the field of communication and Internet technologies, and in particular, to a method and system for recommending items when digital media or e-commerce services cross.
  • the data information can be analyzed and processed before the data information is displayed to the user.
  • the personalized recommendation technology is recommended by the user to meet the interests or needs of the user.
  • Personalized recommendation technology has been widely used in e-commerce, digital libraries, music, video and news, and many other applications also include a variety of services, such as telecom operators launched ring tones in the music field. For the telecom operators, some of the projects in the various services (here, music) overlap with each other. Further users of each service may overlap.
  • each seller can be regarded as a business, the seller's goods may be coincident, and the seller's customers may also coincide.
  • This partial overlap of business projects and/or users of multiple services in the same application domain is a business crossover phenomenon.
  • a traditional technique for personalized recommendation is collaborative filtering technology.
  • Collaborative filtering technology is based on user-item rating data for personalized recommendations, and user-item rating data can be explicitly and/or implicitly obtained.
  • the sparsity of the data will affect the final recommendation.
  • the user-item rating data indicates the user's preference for an item in the business, and the greater the score of the user-item rating data indicates that the user prefers the item.
  • User-item rating data can be obtained explicitly or implicitly, for example, the user can directly rate the item.
  • users may only score a small part of a large number of project collections, so there is a lot of missing user-item rating data, and user-item rating data will be sparse.
  • the user's rating on the unrated item can be set as a rating.
  • One method is to use some recommendation algorithms to predict the user's score on the unrated item; however, this method based on the prediction score is based on the scoring model obtained from the original sparse data, so there is no guarantee that the score data is true and effective.
  • the project recommendation is also less efficient.
  • the sparseness problem of the user-item scoring data cannot be solved well, and the data quality is not high enough, the data information that is not required to be displayed to the user is displayed to the user, which reduces the effectiveness and accuracy of the project recommendation.
  • the embodiments of the present invention provide a method and system for recommending a project when a digital media or an e-commerce service crosses, to solve the sparseness problem of the user-item scoring data in the prior art, and reduce the processing time of the project recommendation, thereby improving The efficiency of the project recommendation.
  • an embodiment of the present invention provides a method for recommending a project when a digital media or an e-commerce service crosses, and the method includes:
  • the digital media or e-commerce service server sends the final item recommendation list to the target user's client for presentation.
  • Embodiments of the present invention provide a project recommendation system when digital media or e-commerce services cross System, the system includes:
  • an identifier unit configured to obtain, by using a computer network interface, a digital media or an e-commerce service identifier and a target user identifier that are used by the target user;
  • Obtaining a service source data unit configured to obtain pre-stored service source data from the memory according to the service identifier
  • Generating a candidate set unit configured to generate a candidate recommendation item set for the target user according to the target user identifier, the digital media or e-commerce service identifier and the service source data that the target user is using;
  • Obtaining a prediction scoring unit configured to obtain a predicted score of each candidate recommendation item in the candidate recommendation item set according to at least a user similarity and/or an item similarity in the service source data;
  • Generating a final list unit configured to extract a qualified candidate recommendation item from the candidate recommendation items according to the predicted score of the candidate recommended item to generate a final recommended item list of the target user;
  • a display unit configured to send the final item recommendation list to a client of the target user for display.
  • the embodiments of the present invention have the following advantages: user similarity and project similarity can directly provide data for project recommendation, which can reduce the processing time of project recommendation, thereby improving the efficiency of project recommendation. Further, before the user similarity and the project similarity are stored in advance, the mapped user-item scoring data of the service is selected to improve the effective evaluation result by the calculated user similarity and the project similarity. Sex and accuracy. Therefore, the embodiment of the present invention can solve the sparseness problem of the user-item scoring data well, can reduce the processing time of the project recommendation, thereby improving the efficiency of project recommendation, and can improve the validity of the user-item scoring data and Authenticity, to improve the effectiveness and accuracy of online recommendations.
  • 1 is a flow chart showing the acquisition of user similarity and/or project similarity in the project recommendation method when the digital media or e-commerce service of the present invention is crossed;
  • Figure 2 is a flow chart of step 102 in the flow chart shown in Figure 1;
  • Figure 3 is a flow chart of step 202 in the flow chart shown in Figure 2;
  • Figure 4 is a flow chart of step 304 in the flow chart shown in Figure 3;
  • Figure 5 is a flow chart showing an embodiment of a project recommendation method when the digital media or e-commerce service of the present invention is crossed;
  • Figure 6 is a flow chart showing another embodiment of the item recommendation method when the digital media or e-commerce service of the present invention intersects;
  • Figure 7 is a flow chart showing still another embodiment of the project recommendation method when digital media or e-commerce services cross;
  • FIG. 8 is a schematic structural diagram of an acquisition embodiment of user similarity and/or item similarity when the digital media or e-commerce service of the present invention intersects;
  • FIG. 9 is a schematic structural diagram of an integration unit 802 in the embodiment shown in FIG. 8;
  • FIG. 10 is a schematic structural diagram of a second matching subunit 902 in the integrating unit 802 shown in FIG. 9.
  • FIG. 11 is a schematic structural diagram of a service matching subunit 1004 in the second matching subunit 902 shown in FIG.
  • Figure 12 is a block diagram showing the structure of a project recommendation system when digital media or e-commerce services of the present invention are crossed. Detailed ways
  • the user's rating of the project is such that the rating can be obtained explicitly (the user scoring the project) or implicitly (calculated by the user constructing a scoring function for the search, browsing or/and purchase of the project) ).
  • the score of the user-item score is expressed as an integer limited to a certain range. The larger the score, the more the user likes the item.
  • the most commonly used in collaborative filtering technology is memory-based collaborative filtering technology.
  • Memory-based collaborative filtering technologies include user-based collaborative filtering technology and project-based collaborative filtering technology.
  • the basic principle of the user-based collaborative filtering algorithm is to use the similarity of the user's rating of the items to mutually recommend items that the user may be interested in.
  • the system calculates the closest user with the rating behavior as the user's nearest neighbor set through the score record and the specific similarity function, and generates the candidate recommendation set by the statistical neighboring users who have scored and not scored. Then, the predicted scores for each item in the candidate recommendation set are calculated, and the W items with the highest predicted scores are taken as the user-W recommendation set.
  • the project-based collaborative filtering algorithm compares similarities between projects and generates candidate recommendation sets based on similar items of current user-scoring projects.
  • the project recommendation method when the digital media or e-commerce service of the present invention crosses is mainly composed of an offline (can be understood as a background system) and an online (can be understood as a foreground system), wherein the function recommended by the project is an online part.
  • an offline can be understood as a background system
  • an online can be understood as a foreground system
  • the function recommended by the project is an online part.
  • Realized and the business source data used in the project recommendation method is operated and stored in the offline part, and the source data should include at least user similarity and/or project similarity, so that the online system can be similar to the user.
  • Project recommendation based on degree and/or project similarity.
  • the acquiring method of the similarity and/or item similarity may be performed by a processor, and storing the execution result in a memory; and the user item recommendation method may be functionally connected to the digital medium connected to the processor in a specific implementation
  • the e-commerce server performs, the digital media or the e-commerce server can perform data interaction with the user through the human-computer interaction interface, and can realize the acquisition and sharing of the initial source data or the service source data through the computer network interface.
  • Step 101 Acquire initial source data of a plurality of different digital media or e-commerce services, where the initial source data includes: initial user-item rating data of the plurality of digital media or e-commerce services.
  • the initial source data should include at least initial user-project rating data of multiple services; optionally, user attribute data and item attribute data of multiple services, and call detail data, and the like may also be included.
  • the digital media or e-commerce service includes but is not limited to: music, application download, online bookstore, electronic reading, games, and/or online shopping.
  • the user-item scoring data is the scoring data of the user-to-project generated by the user corresponding to each service in the course of business use.
  • the call details are the call records between users during a period of time. You can also use SMS details, instant messaging records, or email communication records to reflect data similar to the contact between users.
  • Step 102 Depending on a matching result of all users and items between multiple digital media or e-commerce services and a normalized result of initial user-item scoring data of the plurality of digital media or e-commerce services, the plurality of numbers
  • the initial user-item scoring data for the media or e-commerce business is integrated into unified user-item rating data for all users and projects including the various digital media or e-commerce businesses.
  • the initial source data may further include: user attribute data and item attribute data of a plurality of services.
  • the step 102 may further include the following steps in the specific implementation: Step 201: According to the user attribute data.
  • the initial user identifier, the initial user attribute, and the initial user attribute value are matched to obtain an actual user unique among a plurality of digital media or e-commerce services; the initial user identifier indicates a unique user within a certain service;
  • the initial user attribute value is used to represent a user that is unique among the plurality of services.
  • the user attribute data is used to describe attributes of each user in various services
  • the item attribute data is used to describe attributes of each item in various services.
  • user attribute data in each business includes a user's contact telephone number
  • the item attribute data in each service includes a music name, a singer, a genre, an album name, a release time, a region, a language, a duration, and/or Format, etc.
  • Step 201 performs the process of matching all users between multiple digital media or e-commerce services in step 102, where user matching refers to determining which users are the same user among the different user attribute data.
  • the user matching can be completed according to the association between the user attribute value of each service and the user identifier, wherein the user attribute value can uniquely identify the user identity; and the associated matching relationship is used to find out which users in the service are the same user.
  • the initial user ID is "Zhang lawyer"
  • business B the initial user ID is "Zhang San”
  • the contact information of the two initial user IDs is "1380000000", that is, the user
  • the attribute value is "1380000000”, which means that "Zhang Lawyer” in Business A is the same person as "Zhang San” in Business B.
  • Step 202 Match, according to the initial item identifier, the initial item attribute, and the initial item attribute value in the item attribute data, the actual item that is unique among the plurality of digital media or the e-commerce service; the initial item identifier is expressed in a certain A unique item within a business.
  • the step 202 performs the process of matching all the items between the various services in step 102. Project matching is to determine which of these different businesses are the same project.
  • the step 202 may further include the following steps in a specific implementation: Step 301: Match different actual content between multiple digital media or e-commerce services by using initial item attributes of multiple digital media or e-commerce services. Project properties.
  • the attribute names of the items included in the item attribute data of various digital media or e-commerce businesses are matched by the name matching relationship of the initial item attributes, and the actual item attributes between the respective digital media or e-commerce businesses are obtained.
  • the name matching relationship of the initial project attributes can be pre-established in each field or manually. In the process of matching attribute names, it can be considered that "music name” and “song name” refer to the same item attribute, or "singer” and “singer” refer to the same item attribute.
  • Step 302 Acquire an item attribute set coincidence degree between the plurality of digital media or the e-commerce service according to the different actual item attributes, and an average value of the item attribute set coincidence degree of each type of service and other services.
  • Step 303 Sort the plurality of digital media or e-commerce services according to the size of the item attribute set coincidence mean.
  • the various digital media or e-commerce services are sorted, and the average of the item attribute set coincidence degree of the service in front of the sequence after the sorting is large, and the average of the item attribute set coincidence values of the digital media or the e-commerce business located behind the sequence is small.
  • Step 304 Perform a service matching process by using the first type of service as the current service according to the sequence of the plurality of digital media or the e-commerce service after the sorting, where the service matching process includes: determining a matching item between the current service and another service, And deleting the current business.
  • Step 401 Select the first project as the current project execution project matching process according to the initial project identification sequence included in the current business. Specifically, in each item included in the current digital media or e-commerce business (ie, the first type of business), the first item needs to be selected as the current item execution item matching process according to the initial item identification order; specifically, the item matches
  • the process can include:
  • Sub-step 4011 Calculate the matching degree between the current item and each item in other business by using the initial item attribute value
  • Sub-step 4012 For each other service, selecting an appropriate item matching degree according to a preset threshold condition to form a plurality of item matching degree sets;
  • the predetermined threshold is related to each service, and its value is between 0 and 1, which may vary according to the actual service.
  • Sub-step 4013 selecting the item with the highest matching degree in each item matching degree set as the matching item of the current item;
  • Sub-step 4014 recording a matching relationship between the current item and its matching item, and deleting the matching item included in the plurality of digital media or e-commerce services;
  • Sub-step 4015 deleting the current item
  • Sub-step 4016 Determine whether all itemsets of the digital media or e-commerce service are empty, and if so, end, otherwise step 402 is performed.
  • Step 402 Perform the item matching process by using the second item in the first type of service as the current item, until the item included in the first type of service is empty.
  • the project After the first item of the first type of business is matched, the second item is current The project performs the project matching process until all the items included in the first type of business are matched.
  • Step 305 Perform a service matching process for the current service by using the second service, and when the service in the sequence is empty, obtain the multiple digital media or e-commerce service according to the matching item and the item matching relationship. The only actual project between the two.
  • the second service is used as the current service, and the business matching process is executed until all the items in the digital media or e-commerce business are matched.
  • the actual project that is unique between each digital media or e-commerce business is determined based on the matching project and the project matching relationship.
  • Step 203 Acquire the multiple according to the initial user-item scoring data of the plurality of digital media or e-commerce services, the user-item scoring score range of the plurality of digital media or e-commerce services, and the minimum value of the score range.
  • the score range of the user-item scoring data of various digital media or e-commerce businesses is normalized, and the user-item scoring data of various digital media or e-commerce services after normalization is calculated.
  • the calculation formula for the normalized result is: Wherein, assuming that there are a total of K types of business, ( ⁇ ⁇ ⁇ ) indicates the score of the normalized result of the user ⁇ in the first business after normalization, (1 ⁇ ⁇ ) indicates the original score of the user in the first business, g e (1 ⁇ ⁇ ) indicates the score range of the first service, and min( ra t e w ) ( 1 ⁇ ⁇ ) indicates the minimum value of the score range of the first service.
  • Step 204 Integrate the actual user, the actual project, and the normalized result.
  • User-item scoring data of a plurality of digital media or e-commerce businesses generating unified user-item scoring data, wherein the unified user-item scoring data includes all users and items in the plurality of digital media or e-commerce businesses Integrated user-item rating data.
  • the actual user’s unique rating for the actual project can use the formula.
  • (1 ⁇ ⁇ ) in formula (6) is the user's preference weight for the first type of business, which can be set in advance as the number of times the user scores in the first type of business, or the user uses The length of the business, etc.; It should be noted that when the user's project attribute data includes the call details, the formula (7) can be used to calculate, and the ⁇ ' in the formula (7) is the user's contact within a certain period of time.
  • the collection of people can be obtained by calling the detailed list, or by SMS details, instant messaging records or email communication records. It is the closeness between the user and the user. It can be set in advance to the frequency of contact between the user and the user, or the length of contact.
  • Step 103 The unified user-item scoring data is sequentially mapped to the plurality of digital media or e-commerce services, and the user-item scoring data mapped by the plurality of digital media or e-commerce services is generated.
  • the unified user-item scoring data After obtaining unified user-item scoring data, the unified user-item scoring data needs to be mapped to various digital media or e-commerce services in order to generate user-item scores after mapping various digital media or e-commerce services. data.
  • mode 1 All the score data corresponding to all the items included in each service can be extracted from the unified user-item score data, and the mapped user-project score data of various businesses are formed;
  • Method 2 All the rating data corresponding to all the users included in each service may be extracted from the unified user-item scoring data, and the mapped user-project rating data of various services may be formed;
  • Method 3 It is also possible to extract all the score data corresponding to all the items included in each service and all the users in the unified user-item scoring data, and constitute the mapped user-project score data of various businesses.
  • Step 104 Acquire user similarity between different users in the same service and/or project similarity between different items in the same service according to the user-item scoring data mapped by the plurality of digital media or e-commerce services. .
  • calculating, according to the mapped user-item scoring data, a set of items that are jointly scored by two different users in the same service, and a set of items that are respectively scored by the two different users calculating the two different users.
  • step 104 Calculating between the two different items according to the mapped user-item scoring data, a set of users scoring two different items in the same business, and a set of users scoring each of the two different items Project similarity.
  • step 104 only the user similarity between different users in the same service may be calculated, or only the user similarity between different items in the same service may be calculated, or different in the same service.
  • the similarity is calculated between the user and the different projects.
  • the cosine similarity of the formula (8) can be used to calculate the user similarity between different users in the same service:
  • Step 105 Store the user similarity and/or item similarity into the memory.
  • the user similarity and/or project similarity may be first stored in the memory, so that if the project recommendation is required to the user subsequently , the user similarity and/or project similarity can be obtained directly from the memory, so that the service source data can be directly provided for the subsequent execution of the project recommendation, so as to reduce the recommendation time of the project recommendation, thereby improving the project recommendation. effectiveness.
  • the method for acquiring user similarity and/or project similarity disclosed in FIG. 1 is because user similarity or project is calculated by specification integration and mapping of user-item scoring data. Similarity, not only can provide data for project recommendation, but also improve the validity of project recommendation by selecting the mapped user-project rating data of the service and the corresponding user similarity and/or project similarity. Sex.
  • Step 501 Acquire initial source data of a plurality of digital media or e-commerce services, where the initial source data includes: initial user-item rating data of a plurality of digital media or e-commerce services.
  • the user attribute data in service S is shown in Table 2:
  • the score range is 1 - 10
  • the user-item score data in the business is shown in Table 4:
  • the score score range is 1 - 5
  • the user-item score data in the business is shown in Table 7:
  • the first column in Table 10 represents the actual user ID that is uniquely assigned within each service after being re-assigned by the user, and also represents the user in the unified user-item rating data.
  • the user behavior is described in the second behavior example of Table 10: This line indicates that the user of the service S is the same user as the user of the service, and is represented in the unified user-item score data.
  • Step 503 Match, according to the initial item identifier, the initial item attribute, and the initial item attribute value in the item attribute data, to obtain an actual item that is unique between the plurality of digital media or e-commerce services.
  • the attribute name is matched first.
  • the project attributes "music name” and “song name” refer to the same project attribute, while “singer” and “singer” also refer to the same project attribute.
  • the average of the project attribute set coincidence values of various services obtained by formulas (1) and (2) is shown in Table 11:
  • the first column of data in Table 12 represents the actual project identifiers that are unique among various services that are redistributed after item matching, and also represent the items in the unified user-item rating data.
  • the item matching relationship is illustrated by the second behavior example of Table 12: This line indicates that the item of the business S is the same item as the item l of the business, and is represented in the unified user-item rating data.
  • Step 504 Calculate according to the initial user-item scoring data of the plurality of digital media or e-commerce services, the user-item score score range of the plurality of digital media or e-commerce services, and the minimum value of the score range. Normalized results of initial user-item scoring data for the various digital media or e-commerce businesses.
  • the user-item rating data of various services after normalization is obtained by using the formula (4).
  • the normalized user-item rating data for business S is shown in Table 13:
  • Table 15 The normalized user-item scoring data for the business is shown in Table 15: Table 15
  • Step 505 Integrate the user-item scoring data of the plurality of digital media or e-commerce services according to the actual user, the actual project, and the normalization result, to generate unified user-item scoring data, and the unified user-item rating
  • the data includes consolidated user-item rating data for all users and projects in the various digital media or e-commerce businesses.
  • step 505 the unified user-item scoring data obtained by using the foregoing formula (5) is specifically shown in Table 16:
  • Table 16 the user and the project are each unique among various services. As can be seen from Table 16, among the three types of services, there are 10 different actual users, and 9 different actual projects.
  • Step 506 Map the unified user-item scoring data to the plurality of digital media or e-commerce services in sequence, and generate user-item scoring data mapped by the plurality of digital media or e-commerce services.
  • the user-project evaluation data related to the service after the various services are mapped can be obtained.
  • the user-project score data in the business S is shown in Table 17:
  • Step 507 User-project based on the various digital media or e-commerce services mapped The scoring data calculates project similarities between different projects within the same business.
  • step 507 it is assumed that the similarity between different items in the same digital media or e-commerce service is calculated, and the similarity of items of various digital media or e-commerce services can be calculated by the above formula (9).
  • the project similarity data of business S is shown in Table 20:
  • the mapped user-item score data of the service is more abundant than the original user-item score data of various services, and the credibility is high, which can be very Goodly solve the sparseness problem of user-item scoring data, and then select the mapped user-item scoring data of the service and the corresponding user similarity and/or project similarity when performing project recommendation. Can improve the effectiveness and accuracy of project recommendations.
  • the acquisition flow step 601 of the user similarity and/or the project similarity involved in the embodiment of the present invention is introduced: the service identifier and the target user identifier that the target user is using are obtained through the computer network interface.
  • the target user is the user who needs to recommend the project.
  • the target user identifier is unique in the same service and is not necessarily unique in different services. However, because a target service can be uniquely determined according to the service identifier, the target service identifier can be in the target service. Uniquely identify a user.
  • Step 602 Acquire pre-stored service source data from the memory according to the service identifier.
  • the service source data may specifically include: user-project score data after the service mapping, similarity between different items of the service, user matching relationship data, and item matching relationship data; or, after the service mapping User-item scoring data, similarity between different users of the service, user matching relationship data, and item matching relationship data.
  • the similarity between the user-project score data of the service mapping and different items of the service, and the user matching relationship data and the item matching relationship data may be obtained from the result of the offline data processing flow, and may also be The result of the offline data processing process obtains the similarity between the user-project score data of the service mapping and different users of the service, and also obtains the user matching relationship data and the item matching relationship data.
  • the obtained target service identifier is a service
  • the target user identifier is a user in the service
  • the mapped user-item score data obtained according to the target service identifier is a table.
  • the similarity between different items in the business is the content shown in Table 22
  • the user matching relationship data is the content shown in Table 10
  • the item matching relationship data is the content shown in Table 12.
  • Step 603 Generate a candidate recommendation item set for the target user according to the target user identifier, the service identifier used by the target user, and the service source data.
  • a candidate recommendation item set needs to be generated for the target user according to the target user identifier, the service identifier used by the target user, and the service source data.
  • the candidate recommendation item can be combined with any one of the following methods or a combination of the two methods in the acquisition process:
  • Method A selecting a user whose similarity with the target user meets a preset condition, and selecting an item composition candidate whose user similarity satisfies the preset condition is higher than a predetermined threshold and the target user does not score Recommended project collection;
  • the candidate recommendation items in the candidate recommendation item set belong to the digital media or e-commerce service that the target user is using.
  • the candidate recommendation item may include: digital media content, an e-commerce product, or a uniform resource locator URL.
  • Method B selecting an item with a user-item score of the target user that is higher than a preset threshold, and selecting an item similarity between the item with the user-item score higher than a preset threshold to satisfy a preset condition and
  • the items that are not scored by the target user constitute a candidate recommendation item set; wherein the candidate recommended items in the candidate recommended item set belong to the service that the target user is using.
  • judging whether an item belongs to the digital media or e-commerce business that the target user is using can be judged according to the service identifier and the actual project identifier that the target user is using.
  • the item having the high score value of the user-item data of the user ⁇ 5 (that is, in the table 19) is satisfied and the score value is satisfied.
  • the items with high similarity between the items and the users who have not evaluated the items constitute a set of candidate recommended items.
  • Step 604 Obtain a prediction score of each candidate recommendation item in the candidate recommendation item set according to at least a user similarity and/or an item similarity in the service source data.
  • the user's predicted score for the project ' can be calculated using any of the formulas ( 10 ), ( 11 ), and ( 12 ):
  • ⁇ in formula (10) represents a set of users with high similarity to the user, ie the user's neighbors; ⁇ ⁇ ) indicates the similarity between the user and the user ⁇ in formula (11) represents a set of items with high similarity to the project, ie, a similar item set of the project, ' W , ' indicates the similarity between the item and item 4; "is 0 in formula (12)
  • the parameters between 1 can be manually set according to experience, or learned from training data, such as constantly adjusting the value of "the smallest one with the smallest final error.”
  • Step 605 Extract a qualified candidate recommendation item from the candidate recommended item according to the predicted score of the candidate recommended item to generate a final recommended item list of the target user.
  • a final item list is generated for the target user according to the predicted score.
  • the final item list includes several items with higher predicted scores, and the specific number of items can be adjusted according to actual conditions. Assuming that the candidate recommendation item with the highest prediction score is taken as the final item list in this example, the final item list is the item ⁇ . Of course, you can also choose the project and as a final project list.
  • Step 606 The digital media or e-commerce service server sends the final recommended item list to the client of the target user for display.
  • the digital media or e-commerce service server After generating the final item list, the digital media or e-commerce service server presents the final recommended item list to the target user's client for presentation.
  • the mapped user-item scoring data of the service and the corresponding user similarity and/or project similarity may be selected, by directly utilizing the memory.
  • the stored user similarity and/or project similarity, that is, the mapped user-item scoring data and the corresponding similarity of the service are selected well, so the processing time of the project recommendation is reduced, and the project recommendation is improved. Efficiency, and can improve the effectiveness and accuracy of project recommendations.
  • an embodiment of the present invention further discloses a project recommendation method when a service crosses.
  • the method includes the acquisition process of the user similarity and/or the project similarity and the project recommendation process.
  • the project recommendation method when the service crosses may include the following steps:
  • Step 701 Acquire initial source data of a plurality of different digital media or e-commerce services, where the initial source data includes: initial user-item rating data of multiple services.
  • Step 702 The plurality of digital media are determined according to a matching result of users and items between multiple digital media or e-commerce services and normalized results of initial user-item scoring data of the plurality of digital media or e-commerce services. Or initial user-item scoring data for an e-commerce business is integrated into unified user-item rating data for users and projects that include the various digital media or e-commerce businesses.
  • Step 703 Map the unified user-item scoring data to the plurality of digital media or e-commerce services in sequence, and generate user-item scoring data mapped by the plurality of digital media or e-commerce services.
  • Step 704 Acquire user similarity between different users in the same service and/or project similarity between different items in the same service according to the user-item scoring data mapped by the plurality of digital media or e-commerce services. .
  • Step 705 Store the user similarity and/or item similarity into the memory. It should be noted that the process of storing the user similarity and/or the project similarity illustrated in steps 701 to 705 can be regarded as a pre-processing process, and can be performed independently of the project recommendation process illustrated in the subsequent steps 706 to 711. It can guarantee the real-time and effectiveness of project recommendation. In the present embodiment, the pre-processing process and the project recommendation process are sequentially performed for the sake of convenience.
  • Step 706 Obtain the service identifier and the target user identifier that the target user is using through the computer network interface.
  • Step 707 Acquire pre-stored service source data from the memory according to the service identifier.
  • Step 708 Generate a candidate recommendation item set for the target user according to the target user identifier, the digital media or e-commerce service identifier and source data that the target user is using.
  • Step 709 Obtain a prediction score of each candidate recommendation item in the candidate recommendation item set according to at least user similarity and/or item similarity in the service source data.
  • Step 710 According to the prediction score of the candidate recommendation item, from the candidate recommendation item Extracting the eligible candidate recommendation items generates a list of final recommended items of the target user.
  • Step 711 The digital media or e-commerce service server sends the final item recommendation list to the client of the target user for display.
  • the present embodiment is not exhaustive and can refer to the user similarity and/or the project similarity. Get an introduction to the process and project recommendation process.
  • the embodiment of the present invention further provides a structure for acquiring the user similarity and/or the project similarity.
  • the schematic diagram may specifically include:
  • an initial source data unit 801 configured to obtain initial source data of different digital media or e-commerce services, where the initial source data includes: initial user-item scoring data of a plurality of digital media or e-commerce services;
  • the integration unit 802 is configured to: according to the matching result of the user and the item between the plurality of digital media or e-commerce services and the normalized result of the initial user-item scoring data of the plurality of digital media or e-commerce services, Initial user-item scoring data for a digital media or e-commerce service is integrated into unified user-item scoring data for users and projects comprising the plurality of digital media or e-commerce services;
  • the initial source data may further include: user attribute data and item attribute data of a plurality of digital media or e-commerce services.
  • the integration unit 802 may specifically include:
  • the first matching subunit 901 is configured to match, according to the initial user identifier, the initial user attribute, and the initial user attribute value in the user attribute data, an actual user that is unique between the plurality of digital media or e-commerce services;
  • the initial user identifier indicates that it is unique within a certain service
  • the initial user attribute value is used to indicate a user unique among the plurality of services;
  • the second matching sub-unit 902 is configured to determine an initial item identifier, an initial item attribute, and the initial item attribute in the item attribute data.
  • An initial project attribute value that matches a physical item that is unique among a plurality of digital media or e-commerce businesses; the initial item identifier indicating a unique item within a certain service;
  • the second matching subunit 902 may specifically include:
  • the third matching subunit 1001 is configured to use a plurality of digital media or an initial item attribute of the e-commerce service to match different actual item attributes between the plurality of digital media or the e-commerce service; the second obtaining subunit 1002 is configured to use the The different actual project attributes are obtained to obtain the coincidence degree of the item attribute set between the plurality of digital media or the e-commerce business and the mean value of the coincidence degree of the item attribute set of each type of business and other services;
  • a sorting subunit 1003 configured to sort the plurality of digital media or e-commerce services according to a size of the item attribute set coincidence mean
  • the service matching sub-unit 1004 is configured to perform a service matching process by using the first service as the current service according to the sequence of the multiple digital media or the e-commerce service after the sorting, where the service matching process includes: determining the current service Matching items with other businesses, and deleting the current business;
  • the service matching subunit 1004 may specifically include: an item matching subunit 1102, configured to select a first item as a current item according to an initial item identification order included in the first type of service.
  • the project matching process includes: calculating a project matching degree between the current project and each project in another business; for each other service, selecting an appropriate project matching degree according to a preset threshold condition to form a plurality of projects a matching degree set; selecting, in each item matching degree set, the item with the highest matching degree as a matching item of the current item; recording a matching relationship between the current item and the matching item, and deleting the matching item included in each service; Delete the current item;
  • the loop subunit 1103 executes the project matching process by using the second item in the first type of service as the current item until the item included in the first type of service is empty.
  • a third obtaining sub-unit 1005 configured to perform a service matching process for the current service by using the second service, until the service in the sequence is empty, according to the matching item and the item matching
  • the relationship acquires actual items that are unique between the various digital media or e-commerce businesses.
  • the first obtaining subunit 903 is configured to obtain an initial of the multiple services according to initial user-item scoring data of multiple services, a user-item scoring score range of multiple services, and a minimum value of the score range. Normalized results of user-item scoring data;
  • the integration sub-unit 904 is configured to integrate user-item scoring data of the plurality of digital media or e-commerce services according to the actual user, the actual project, and the normalization result, to generate unified user-item scoring data, the unified User-item scoring data includes consolidated user-item scoring data for users and projects in the various digital media or e-commerce businesses.
  • Generating a scoring data unit 803, configured to sequentially map the unified user-item scoring data to the plurality of digital media or e-commerce services, and generate user-item scoring data mapped by the plurality of digital media or e-commerce services ;
  • the generating and scoring data unit 803 may further be configured to: extract, for each service, all items included in each digital media or e-commerce service in unified user-item scoring data and/or All user-item scoring data corresponding to all users constitute the mapped user-item scoring data of various services.
  • the obtaining similarity unit 804 is configured to calculate the similarity between different users in the same service and/or different items in the same service according to the plurality of digital media or e-commerce service mapped user-item scoring data. Similarity.
  • the acquiring similarity unit 804 may further be used to:
  • the storage unit 805 is configured to store the user similarity and/or item similarity into the memory.
  • a system for acquiring user similarity and/or project similarity disclosed in the embodiments of the present invention because user similarity or project is calculated by specification integration and mapping of user-item scoring data Similarity, not only can provide data for project recommendation, but also improve the validity of project recommendation by selecting the mapped user-project rating data of the service and the corresponding user similarity and/or project similarity. Sex.
  • an embodiment of the present invention further discloses a project recommendation system when a service crosses, and the project recommendation system includes:
  • the obtaining identifier unit 1201 is configured to obtain, by using a computer network interface, a digital media or an e-commerce service identifier and a target user identifier that are used by the target user;
  • the service source data unit 1202 is configured to obtain pre-stored service source data from the memory according to the service identifier.
  • the generating candidate set unit 1202 may be further configured to: select a user whose user similarity with the target user meets a preset condition, and select a user whose user similarity meets the preset condition is high. Items that are predetermined thresholds and that are not scored by the target user constitute a set of candidate recommendation items; and/or,
  • Selecting an item with the target user's user-item rating higher than a preset threshold, and selecting an item similarity between the item with the user-item score higher than a preset threshold to satisfy a preset condition and the target user Items that are not graded constitute a set of candidate recommendation items.
  • the candidate recommended items all belong to the digital media or e-commerce service that the target user is using.
  • the acquisition prediction scoring unit 1204 is configured to obtain a prediction score of each candidate recommendation item in the candidate recommendation item set according to at least a user similarity and/or an item similarity in the service source data;
  • the final list unit 1205 is configured to generate a final recommended item list of the target user by extracting the qualified candidate recommendation item from the candidate recommended item according to the predicted score of the candidate recommended item;
  • a display unit 1206, configured to send the final item recommendation list to the target user The client performs the presentation.
  • the mapped user-item scoring data of the service and the corresponding user similarity and/or project similarity may be selected and directly utilized.
  • the user similarity and/or project similarity stored in the memory is that the mapped user-item scoring data and the corresponding similarity of the service are better selected, so the processing time of the project recommendation is reduced, and the project is improved. Recommended efficiency, and can improve the effectiveness and accuracy of project recommendations.
  • the system for obtaining the user similarity and/or the project similarity and the system for recommending the project can work independently, because the user similarity and/or the project similarity are obtained.
  • the project recommendation can be carried out at the same time. It is only necessary to obtain the calculated user similarity and/or project similarity when the project recommendation is made, so as to ensure the real-time and effectiveness of the project recommended by the project recommendation system.
  • the program may be stored in a computer readable storage medium, and the storage medium may include: ROM, RAM, disk or CD, etc.

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

数字媒体或电子商务业务交叉时的项目推荐方法及系统,该方法包括:通过计算机网络接口获取目标用户正在使用的数字媒体或电子商务业务标识和目标用户标识,并根据所述业务标识从存储器中获取预先存储的业务源数据;为所述目标用户生成候选推荐项目集合;获取所述候选推荐项目集合中每一个候选推荐项目的预测评分;根据所述候选推荐项目的预测评分从所述候选推荐项目中抽取符合条件的候选推荐项目生成所述目标用户的最终推荐项目列表;将所述最终推荐项目列表发送至所述目标用户的客户端进行展示。所述方法和系统能够减少项目推荐时的处理时间从而提升项目推荐的效率。

Description

一种业务交叉时的项目推荐方法及系统
技术领域
本发明涉及通信及互联网技术领域,尤其涉及一种数字媒体或电子商务业 务交叉时的项目推荐方法及系统。
背景技术
随着互联网技术的普及和迅猛发展, 互联网上出现了大量的数据信息, 而 用户在浏览网页的时候只希望看到自己感兴趣或者需要的数据信息,但是在实 际场景中往往会同时出现很多其他无关的数据信息,这就导致虽然数据信息越 来越多, 但数据信息的利用率却越来越低的现象, 称为信息超载现象。
为了防止或者尽量减少信息超载现象给用户与互联网的交互带来的影响, 可以在数据信息显示给用户之前对数据信息进行分析处理,例如个性化推荐技 术即是通过为用户推荐符合其兴趣或需求的资源来减少信息超载现象的一种 方法。 个性化推荐技术目前已被广泛应用到电子商务、 数字图书馆、 音乐、 视 频和新闻等多个领域中, 这多个应用领域也包含多种业务, 例如电信运营商在 音乐领域里推出了彩铃业务、 振铃业务和全曲业务等, 对电信运营商而言, 各 个业务中的项目 (这里指音乐)又有一部分是相互重合的, 进一步的各个业务 的用户可能也有重合。再例如电子商务网站,每一个卖家可以看成是一个业务, 卖家的商品可能是重合的, 卖家的客户也可能是重合的。这种同一应用领域中 多种业务的业务项目和 /或用户的部分重合现象, 即是业务交叉现象。
个性化推荐的一个传统的技术是协同过滤技术, 协同过滤技术基于用户- 项目评分数据来进行个性化推荐,用户-项目评分数据可以显式和 /或隐式获得。 数据的稀疏性会影响最终的推荐效果。在个性化推荐技术的应用领域中, 用户 -项目评分数据表示用户对于业务中某个项目的喜好程度, 用户 -项目评分数据 的分值越大表示用户越喜好这个项目。 用户 -项目评分数据可以显式或隐式获 得, 例如用户直接对项目进行评分操作。 但是大多数应用领域中, 用户可能仅 对大量项目集合中的艮少的一部分进行了评分, 因此用户 -项目评分数据就有 很多缺失的现象, 用户 -项目评分数据也会比较稀疏。
现有技术中, 为解决用户-项目评分数据的稀疏性问题, 有一种方法是补 足用户对未评分项目的评分数据;例如可以将用户对未评分项目的评分设为评 分范围的中间值,或是直接将未评分项目的评分设置为用户的平均评分; 但是 这种默认设置的评分数据具有一定的主观性, 通常与实际的用户-项目评分数 据差异较大;还有一种方法发是釆用某些推荐算法预测出用户对未评分项目的 评分; 但是这种基于预测评分的方法因为是基于原稀疏数据得到的评分模型, 所以也不能保证评分数据的真实有效。
进一步的, 当应用现有技术的上述方法时, 因为每次在进行项目推荐时都 需要动态获取用户 -项目评分数据, 再根据用户 -项目评分数据进行推荐, 所以 也导致项目推荐的效率较低; 并且, 因为无法很好的解决用户 -项目评分数据 的稀疏性问题,且数据质量也不够高,会使得本来不需要显示给用户的数据信 息显示给用户, 降低了项目推荐的有效性和准确性。 发明内容
本发明实施例提供数字媒体或电子商务业务交叉时的项目推荐方法及系 统, 以结合实际应用领域解决现有技术中用户-项目评分数据的稀疏性问题, 减少项目推荐时的处理时间, 从而提升项目推荐的效率。
为解决上述技术问题, 本发明实施例提供了一种数字媒体或电子商务业 务交叉时的项目推荐方法, 该方法包括:
通过计算机网络接口获取目标用户正在使用的数字媒体或电子商务业 务标识和目标用户标识, 并根据所述业务标识从存储器中获取预先存储的 业务源数据;
根据所述目标用户标识、 目标用户正在使用的数字媒体或电子商务业 务标识及业务源数据, 为所述目标用户生成候选推荐项目集合;
至少根据所述业务源数据中的用户相似度和 /或项目相似度获取所述 候选推荐项目集合中每一个候选推荐项目的预测评分;
根据所述候选推荐项目的预测评分从所述候选推荐项目中抽取符合条 件的候选推荐项目生成所述目标用户的最终推荐项目列表;
数字媒体或电子商务业务服务器将所述最终项目推荐列表发送至所述 目标用户的客户端进行展示。
本发明实施例提供了一种数字媒体或电子商务业务交叉时的项目推荐系 统, 该系统包括:
获取标识单元, 用于通过计算机网络接口获取目标用户正在使用的数 字媒体或电子商务业务标识和目标用户标识;
获取业务源数据单元, 用于根据所述业务标识从存储器中获取预先存 储的业务源数据;
生成候选集合单元, 用于根据所述目标用户标识、 目标用户正在使用 的数字媒体或电子商务业务标识及业务源数据, 为所述目标用户生成候选 推荐项目集合;
获取预测评分单元, 用于至少根据所述业务源数据中的用户相似度和 / 或项目相似度, 获取所述候选推荐项目集合中每一个候选推荐项目的预测 评分;
生成最终列表单元 ,用于根据所述候选推荐项目的预测评分从所述候 选推荐项目中抽取符合条件的候选推荐项目生成所述目标用户的最终推荐 项目列表;
展示单元, 用于将所述最终项目推荐列表发送至所述目标用户的客户 端进行展示。
本发明实施例具有以下优点: 用户相似度和项目相似度, 可以直接为项目推荐提供数据, 这样就能减少 项目推荐时的处理时间, 从而提升项目推荐的效率。 进一步的, 在预先存 储用户相似度和项目相似度之前, 通过 4艮好的选择该业务的映射后的用户- 项目评分数据, 可以通过计算出的用户相似度和项目相似度提高推荐结果 的有效性和准确性。 因此, 本发明实施例能够很好的解决用户 -项目评分数 据的稀疏性问题, 能减少项目推荐时的处理时间, 从而提升项目推荐的效 率, 并且可以通过提升用户-项目评分数据的有效性和真实性, 来提升线上 推荐结果的有效性和准确性。 当然, 实施本发明公开的任意一个实施例不 一定需要同时达到上述所有效果。 附图说明 为了更清楚地说明本发明实施例或现有技术中的技术方案, 下面将对实施 例或现有技术描述中所需要使用的附图作简单地介绍, 显而易见地, 下面描述 中的附图仅仅是本发明的一些实施例, 对于本领域普通技术人员来讲, 在不付 出创造性劳动性的前提下, 还可以根据这些附图获得其他的附图。
图 1 是本发明的数字媒体或电子商务业务交叉时的项目推荐方法中用户 相似度和 /或项目相似度的获取流程图;
图 2是图 1所示的流程图中步骤 102的流程图;
图 3是图 2所示的流程图中步骤 202的流程图;
图 4是图 3所示的流程图中步骤 304的流程图;
图 5 是本发明的数字媒体或电子商务业务交叉时的项目推荐方法一个实 施例的流程图;
图 6是本发明的数字媒体或电子商务业务交叉时的项目推荐方法另一个 实施例的流程图;
图 7是的数字媒体或电子商务业务交叉时的项目推荐方法又一个实施例 的流程图;
图 8是本发明的数字媒体或电子商务业务交叉时的用户相似度和 /或项目 相似度的获取实施例的结构示意图;
图 9是图 8所示的实施例中整合单元 802的结构示意图;
图 10是图 9所示的整合单元 802中第二匹配子单元 902的结构示意图; 图 11是图 10所示的第二匹配子单元 902中业务匹配子单元 1004的结构 示意图;
图 12是本发明的数字媒体或电子商务业务交叉时的项目推荐系统的结构 示意图。 具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清 楚、 完整地描述, 显然, 所描述的实施例仅仅是本发明一部分实施例, 而不是 全部的实施例。基于本发明中的实施例, 本领域普通技术人员在没有做出创造 性劳动前提下所获得的所有其他实施例, 都属于本发明保护的范围。 首先对背景技术中提到的个性化推荐技术作进一步的介绍。在个性化推荐 技术中应用最广泛的是协同过滤技术。 协同过滤技术基于用户-项目评分数据 为用户进行个性化推荐。 这里假设用户 对项目 的评分为 , 这种评分可以 显式获得 (用户对项目进行评分操作 ), 也可以隐式获得(通过用户对项目的 搜索、 浏览或 /和购买等行为构造评分函数计算得到)。 通常, 用户-项目评分 的分值都会以限定在某一范围内的整数表示, 分值越大表示用户越喜欢该项 目。 在协同过滤技术中最常用的为基于记忆的协同过滤技术,基于记忆的协同 过滤技术包括基于用户的协同过滤技术与基于项目的协同过滤技术。基于用户 的协同过滤算法的基本原理是利用用户对项目评分的相似性来互相推荐用户 可能感兴趣的项目。 例如, 对当前用户 , 系统通过其评分记录及特定相似度 函数, 计算出与其评分行为最相近的 个用户作为用户 的最近邻居集, 通过 统计 的近邻用户评分过而 未评分的项目生成候选推荐集, 然后计算 对候 选推荐集中每个项目 的预测评分, 并取其中预测评分最高的 W个项目作为用 户 的 - W推荐集。 基于项目的协同过滤算法则比较项目之间的相似性, 并 根据当前用户已评分项目的相似项目生成候选推荐集。
本发明的数字媒体或电子商务业务交叉时的项目推荐方法主要由线下 (可以理解为后台系统) 和线上 (可以理解为前台系统) 两部分组成, 其 中, 项目推荐的功能是在线上部分实现的, 而项目推荐方法中所使用的业 务源数据在线下部分进行运算并存储至存储器中, 所述源数据应至少包括 用户相似度和 /或项目相似度, 以便线上系统可以根据用户相似度和 /或项 目相似度进行项目推荐。 并且, 所述相似度和 /或项目相似度的获取方法可 由处理器执行, 并将执行结果存储至存储器中; 而用户项目推荐方法在具 体实施时可由与所述处理器功能上相连的数字媒体或电子商务服务器执 行, 该数字媒体或电子商务服务器可以通过人机交互界面和用户进行数据 交互, 并可通过计算机网络接口实现初始源数据或者业务源数据的获取和 共享。
在实施例部分, 为了方便本领域技术人员更清楚的了解存储器中存储 的用户相似度和 /或项目相似度的获取方式, 所以参考图 1 , 为实现本发明 实施例中用户相似度和 /或项目相似度的获取方法流程图,具体可以包括以 下步骤:
步骤 101 : 获取多种不同数字媒体或电子商务业务的初始源数据, 所 述初始源数据包括: 所述多种数字媒体或电子商务业务的初始用户-项目评 分数据。
在实际应用中, 所述初始源数据应该至少包括多种业务的初始用户-项 目评分数据; 可选的, 还可以包括多种业务的用户属性数据和项目属性数 据, 以及通话详单数据等。
其中, 所述数字媒体或电子商务业务, 包括但不限于: 音乐、 应用下 载、 网上书店、 电子阅读、 游戏和 /或网上购物。 用户-项目评分数据为各种 业务对应的用户在业务使用过程中产生的用户对项目的评分数据。 通话详 单为一段时间内用户之间的通话记录, 也可利用短信详单、 即时通讯记录 或电子邮件通信记录等类似反映用户之间联系情况的数据。
步骤 102: 依据多种数字媒体或电子商务业务之间的所有用户和项目 的匹配结果及所述多种数字媒体或电子商务业务的初始用户 -项目评分数 据的规范化结果, 将所述多种数字媒体或电子商务业务的初始用户-项目评 分数据整合为包括所述多种数字媒体或电子商务业务的所有用户及项目的 统一用户-项目评分数据。
其中, 所述初始源数据还可以包括: 多种业务的用户属性数据和项目 属性数据, 参考图 2, 所述步骤 102在具体实现时又可以包括如下步骤: 步骤 201 : 依据所述用户属性数据中的初始用户标识、 初始用户属性 及初始用户属性值, 匹配得到在多种数字媒体或电子商务业务之间唯一的 实际用户; 所述初始用户标识表示在某一种业务内唯一的用户; 所述初始 用户属性值用于表示在所述多种业务之间都唯一的用户。
其中, 所述用户属性数据用以描述各种业务中的各个用户的属性, 所 述项目属性数据用以描述各种业务中的各个项目的属性。 例如在音乐领域 内, 各业务中的用户属性数据包括用户的联系电话等, 而各业务中的项目 属性数据包括音乐名、 歌手、 流派、 专辑名、 发行时间、 地域、 语种、 时 长和 /或格式等。 步骤 201执行的即是步骤 102中对多种数字媒体或电子商务业务之间 的所有用户进行匹配的过程, 这里的用户匹配是指确定在这些不同的用户 属性数据中, 哪些用户是同一个用户。 用户匹配可以根据各业务的用户属 性值与用户标识之间的关联匹配完成, 其中用户属性值能唯一标识用户身 份; 并通过关联匹配关系找出各业务中哪些用户是同一个用户。
例如在业务 A中, 初始用户标识为 "张律师", 而在业务 B中, 初始 用户标识为 "张三", 但是这两个初始用户标识对应的联系方式都为 " 1380000000" , 即是用户属性值都为 " 1380000000" , 则表示业务 A中的 "张律师" 与业务 B中的 "张三" 为同一个人。
步骤 202: 依据所述项目属性数据中的初始项目标识、 初始项目属性 及初始项目属性值, 匹配得到在多种数字媒体或电子商务业务之间唯一的 实际项目; 所述初始项目标识表示在某一种业务内唯一的项目。
所述步骤 202执行的即是步骤 102中对各种业务之间的所有项目进行 匹配的过程。 项目匹配是指确定在这些不同的业务中哪些项目是同一个项 目。
参考图 3所示, 所述步骤 202在具体实现时又可以包括如下步骤: 步骤 301 : 利用多种数字媒体或电子商务业务的初始项目属性匹配多 种数字媒体或电子商务业务之间不同的实际项目属性。
本步骤即是利用初始项目属性的名称匹配关系将各种数字媒体或电子 商务业务的项目属性数据所包含的项目的属性名称进行匹配, 得到在各个 数字媒体或电子商务业务之间的实际项目属性。 初始项目属性的名称匹配 关系可以是各领域预先建立好的, 也可以由人工参与的方式完成。 在属性 名称匹配的过程中, 可以认为 "音乐名" 与 "歌曲名" 指的是同一个项目 属性, 或者 "歌手" 与 "歌唱家" 指的是同一个项目属性。
步骤 302: 依据所述不同的实际项目属性获取多种数字媒体或电子商 务业务之间的项目属性集重合度以及每一种业务与其他业务的项目属性集 重合度均值。
假设经过项目属性的名称匹配之后得到的所有的不同属性名称为 个,则两种数字媒体或电子商务业务之间的项目属性集重合度通过公式( 1 ) C(S S ) = \ {Attrt I Attrt e Sjn {Attrt \ Attrt £ S,} | i≤ ^ ^
'·, 7 I {Attrt I Attrt e S,.} U {Attrt | Attrt e S川, (丄) 其中, 假设业务一共有 K种, 和 ( ^≤i≠J≤K ) 分别表示第 种业 务和第 种业务, 表示第 种业务中的项目属性集合, At 表 示第 个属性。 那么, 第 种业务与其他业务的项目属性集重合度均值通过公式 (2 )
Figure imgf000009_0001
步骤 303 : 按照所述项目属性集重合度均值的大小对所述多种数字媒 体或电子商务业务进行排序。
对所述各种数字媒体或电子商务业务进行排序, 排序之后位于序列前 面的业务的项目属性集重合度均值大, 位于序列后面的数字媒体或电子商 务业务的项目属性集重合度均值小。
步骤 304: 按照排序之后多种数字媒体或电子商务业务的先后顺序, 以第一种业务为当前业务执行业务匹配流程, 所述业务匹配流程包括: 确 定所述当前业务与其他业务的匹配项目, 以及, 删除所述当前业务。
选择序列中第一种业务, 按照该业务内所包含项目的项目标识顺序, 依次为该第一种业务中的每一个项目在其他业务中确定匹配项目, 该匹配 项目与第一种业务中的项目是同一个项目, 当第一种业务的各个项目匹配 完成之后, 删除第一种业务, 再开始匹配第二种业务中的各个项目, 以此 类推, 直至所有的业务都匹配完成。
参考图 4所示, 所述步骤 304中在确定所述当前业务与其他业务的匹 配项目时, 可以按照如下方式进行:
步骤 401 : 按照当前业务所包含的初始项目标识顺序, 选择第一个项 目作为当前项目执行项目匹配流程。 具体在当前数字媒体或电子商务业务(即是第一种业务) 包括的各个 项目中, 需要按照初始项目标识顺序先选择第一个项目作为当前项目执行 项目匹配流程; 具体的, 所述项目匹配流程可以包括:
子步骤 4011: 利用初始项目属性值计算当前项目与其他业务中各个项 目的项目匹配度;
在计算项目匹配度的时候, 可以利用初始项目属性值釆用公式(3 )进 行处理:
Figure imgf000010_0001
其中, '·和 分别表示两个项目, w' ( i≤ r ) 为第 个属性的权重, ^^( ')表示项目 '的第 个属性的属性值。当项目 '和 的第 个属性的属性 值都存在且相等时, 函数 取值为 1 , 否则为 0。
子步骤 4012: 针对每一种其他业务, 依据预设的阈值条件选取合适的 项目匹配度, 以形成多个项目匹配度集合;
针对每一种其他业务, 保留所有不小于预定阈值的项目匹配度, 形成 多个项目匹配度数据集。 这里的预定阈值与每个业务相关, 其取值在 0〜1 之间, 可以依据实际业务有所不同。
子步骤 4013 : 在每个项目匹配度集合中选择匹配度最高的项目作为当 前项目的匹配项目;
子步骤 4014: 记录所述当前项目与其匹配项目的匹配关系, 并删除所 述多种数字媒体或电子商务业务中包括的所述匹配项目;
子步骤 4015: 删除所述当前项目;
子步骤 4016:判断该数字媒体或电子商务业务的所有项目集是否为空, 如果是则结束, 否则执行步骤 402。
步骤 402: 以所述第一种业务中的第二个项目为当前项目, 执行所述 项目匹配流程, 直至所述第一种业务中包含的项目为空。
当所述第一种业务的第一个项目匹配完毕之后, 以第二个项目为当前 项目, 执行所述项目匹配流程, 直至所述第一种业务中包含的项目全部匹 配完毕。
步骤 305 : 以第二种业务为所述当前业务执行业务匹配流程, 直至所 述序列中的业务为空时, 依据所述匹配项目以及项目匹配关系获取在所述 多种数字媒体或电子商务业务之间都唯一的实际项目。
当所述第一种业务包含的所有项目都匹配完毕之后, 再以第二种业务 为当前业务, 执行业务匹配流程, 直至所有的数字媒体或电子商务业务中 的所有项目都匹配完毕。
当所有数字媒体或电子商务业务的所有项目都匹配完毕之后, 依据匹 配项目以及项目匹配关系确定出在各个数字媒体或电子商务业务之间都唯 一的实际项目。
步骤 203 : 依据多种数字媒体或电子商务业务的初始用户 -项目评分数 据、 多种数字媒体或电子商务业务的用户 -项目评分分值范围及所述分值范 围的最小值, 获取所述多种数字媒体或电子商务业务的初始用户-项目评分 数据的规范化结果。
当确定出实际项目之后, 将各种数字媒体或电子商务业务的用户-项目 评分数据中的评分分值范围规范化, 并计算规范化后的各种数字媒体或电 子商务业务的用户 -项目评分数据。 规范化结果的计算公式为:
Figure imgf000011_0001
其中, 假设业务一共有 K种, ( ι≤ ≤ )表示规范化后第 种业 务中用户 ^对项目 的规范化结果的评分, ( 1≤ ≤ ) 表示第 种业 务中用户 对项目 的原始评分, ge ( 1≤ ≤ )表示第 种业务的评 分分值范围, min(rate w ) ( 1≤ ≤ )表示第 种业务的评分分值范围的最小 值。
步骤 204: 依据所述实际用户、 实际项目以及规范化结果, 整合所述 多种数字媒体或电子商务业务的用户 -项目评分数据,生成统一的用户 -项目 评分数据, 所述统一的用户-项目评分数据中包括所述多种数字媒体或电子 商务业务中所有用户和项目的整合后的用户-项目评分数据。
基于用户匹配、 项目匹配以及各种数字媒体或电子商务业务的用户-项 目评分数据规范化之后的结果, 整合各种数字媒体或电子商务业务的用户- 项目评分数据, 生成统一的用户-项目评分数据。 因为在原始的用户-项目评 分数据中, 各个用户之间以及各个项目之间存在重复现象, 所以要将原始 的用户 -项目评分数据进行整合,生成的统一的用户 -项目评分数据中用户和 项目都是实际用户和实际项目, 因此, 同一个用户对同一个项目的评分数 据只有一个分值。
在本步骤中, 实际用户 对实际项目 的唯一的评分 可以使用公式
( 5)、 (6) 或者 (7) 中的任一 方法得到:
( 6)
Figure imgf000012_0001
(7) 其中, 公式 (6) 中的" ( 1≤ ≤ ) 为用户 '对第 种业务的偏好权 重, 可以预先设为用户 在第 种业务中的评分次数, 或是用户 使用第 种业务的时长等; 需要说明的是, 在用户项目属性数据中包括通话详单时, 可以釆用公式( 7 )来计算, 公式( 7 ) 中的 ^')是用户 在一段时间内的 联系人集合, 通过通话详单可以得到, 也可以通过短信详单、 即时通讯记 录或电子邮件通信记录等得到。 是用户 与用户 的紧密度, 可以预先 设为一段时间内用户 与用户 的联系频率, 或者联系时长等。
步骤 103 : 将所述统一用户-项目评分数据依次映射到所述多种数字媒 体或电子商务业务, 生成所述多种数字媒体或电子商务业务映射后的用户- 项目评分数据。
当得到统一的用户 -项目评分数据之后, 需要再将统一的用户 -项目评 分数据依次映射到各种数字媒体或电子商务业务, 以生成各种数字媒体或 电子商务业务映射后的用户-项目评分数据。
针对每种业务, 方式一: 可以在统一的用户 -项目评分数据中抽取出每 种业务所包含的全体项目对应的所有评分数据, 构成映射后的各种业务相 关的用户-项目评分数据;
方式二: 也可以在统一的用户 -项目评分数据中抽取出每种业务所包含 的全体用户对应的所有的评分数据, 构成映射后的各种业务相关的用户-项 目评分数据;
方式三: 也可以在统一的用户 -项目评分数据中抽取出每种业务所包含 的全体项目和全体用户均对应的所有评分数据, 构成映射后的各种业务相 关的用户 -项目评分数据。
步骤 104: 依据所述多种数字媒体或电子商务业务映射后的用户 -项目 评分数据获取同一种业务内不同用户之间的用户相似度和 /或同一种业务 内不同项目之间的项目相似度。
具体的, 依据所述映射后的用户-项目评分数据、 同一种业务内两个不 同用户共同评分的项目的集合和所述两个不同用户各自评分的项目的集合 计算所述两个不同用户之间的用户相似度; 和 /或,
依据所述映射后的用户 -项目评分数据、 同一种业务内对两个不同项目 共同评分的用户的集合和所述对两个不同项目各自评分的用户的集合计算 所述两个不同项目之间的项目相似度。 需要说明的是, 在步骤 104中, 可以只计算同一种业务内不同用户之间 的用户相似度, 也可以只计算同一种业务内不同项目之间的用户相似度, 也可以同一种业务中不同用户和不同项目之间都计算相似度。 具体的, 可 以釆用公式(8 )的余弦相似度计算同一种业务内不同用户之间的用户相似 度:
Figure imgf000014_0001
其中, " 表示用户 '和用户 所共同评过分的项目的集合, Au '表示 用户 所评过分的项目的集合。 釆用公式( 9 )的余弦相似度计算同一种业务内不同项目之间的项目相 似度: · rtj
Figure imgf000014_0002
其中, ^表示对项目 7'·和项目 都评过分的用户的集合, 表示对 项目 '·评过分的用户的集合。
步骤 105: 将所述用户相似度和 /或项目相似度存储至所述存储器中。 在获取到用户相似度和 /或项目相似度之后, 因为需要在进行项目推荐 时使用, 所以可以先将用户相似度和 /或项目相似度存储至存储器中, 这样 后续如果需要向用户进行项目推荐, 就可以直接从存储器中获取到所需要 的用户相似度和 /或项目相似度, 这样就能够直接为后续执行的项目推荐提 供业务源数据, 以减少项目推荐的推荐时间, 从而提高项目推荐的效率。
进一步的, 图 1公开的用户相似度和 /或项目相似度的获取方法, 因为 通过用户-项目评分数据的规范整合以及映射来计算用户相似度或者项目 相似度, 不仅可以为项目推荐提供数据, 还可以通过很好的选择该业务的 映射后的用户 -项目评分数据以及相应的用户相似度和 /或项目相似度,可以 提高项目推荐的有效性准确性。
为了方便本领域技术人员更好的理解关于用户相似度和 /或项目相似 度的原理, 参考图 5 , 给出了一个获取用户相似度和 /或项目相似度的具体 实例, 其实现的方法可以包括以下步骤:
步骤 501 : 获取多种数字媒体或电子商务业务的初始源数据, 所述初 始源数据包括: 多种数字媒体或电子商务业务的初始用户-项目评分数据。
假设在音乐领域中存在 3种业务, 分别记为 在业务 S中, 假设评分分值范围是 1 - 5 , 业务 S中的用户 -项目评分数据如表 1所示: 表 1
Figure imgf000015_0001
表 1中没有数据的位置表示用户没有针对对应的项目评过分, 即用户 项目评分数据不存在。
业务 S中的用户属性数据如表 2所示:
表 2
用户标识 联系电话 u、
u2 u3
U5 137** ***** * 业务 中的项目属性数据如表 3所示: 表 3
Figure imgf000016_0001
而在业务 中, 评分分值范围是 1 - 10, 业务 中的用户 -项目评分数 据如表 4所示:
表 4
Figure imgf000016_0002
业务 中的用户属性数据如表 5所示: 表 5
用户标识 联系电话 u、
u2
u3
u4 137** ***** *
150^^^^^^^^ u6
业务 中的项目属性数据如表 6所示:
表 6
Figure imgf000017_0002
而在业务 中, 评分分值范围是 1 - 5, 业务 中的用户-项目评分数据 如表 7所示:
表 7
Figure imgf000017_0001
u2 5
u3 3 5
u4 3 4
3 5
5 4
u7 5
业务 中的用户属性数据如表 8所示:
表 8
Figure imgf000018_0001
业务 中的项目属性数据如表 9所示:
表 9
项目标识 歌曲名 入子 流派 语种 完美的互动 王力宏 普通话 一剪梅 费玉清 经典老歌 普通话 秋天不回来 王强 普通话 七里香 周杰伦 普通话 园游会 周杰伦 普通话 步骤 502: 依据所述用户属性数据中的初始用户标识、 初始用户属性及 初始用户属性值, 匹配得到在多种数字媒体或电子商务业务之间唯一的实 际用户。
首先进行多种业务中的用户匹配过程。 根据表 2、 表 5和表 8的内容, 以联 系电话相同的用户为同一个用户, 得到 3种业务中的所有用户匹配关系数据如 表 10所示:
表 10
Figure imgf000019_0001
在表 10中的第一列表示经过用户匹配之后重新分配的在各个业务内都唯 一的实际用户标识, 也表示在统一的用户 -项目评分数据中的用户。 以表 10的 第二行为例说明用户匹配关系:该行表明业务 S的用户 与业务 的用户 是 同一个用户, 在统一的用户 -项目评分数据中以 表示。
步骤 503 : 依据所述项目属性数据中的初始项目标识、 初始项目属性及 初始项目属性值, 匹配得到在所述多种数字媒体或电子商务业务之间唯一 的实际项目。 在本步骤中首先是属性名称匹配。 在本实例中, 项目属性 "音乐名" 与 "歌曲名" 指的是同一个项目属性, 而 "歌手" 与 "歌唱家" 也指的是 同一个项目属性。 那么由公式 ( 1 ) 和 (2 ) 得到的各种业务的项目属性集 重合度均值如表 11所示:
表 11
Figure imgf000020_0001
假设在项目匹配过程中, 取音乐名、 歌手、 专辑名、 流派和语种的权 重分别为 0.5、 0.3、 0.1、 0.05和 0.05 , 并取业务 S与业务 、业务 S与业务 、 业务 与业务 &的项目 匹配度阈值分别为 0.8、 0.7和 0.7的情况下, 得到本 实例中的项目匹配关系如表 12所示:
表 12
匹配后分配的项目标识 s2 s3
i,' 在表 12中的第一列数据表示经过项目匹配之后重新分配的在各种业务 间都唯一的实际项目标识, 也表示在统一的用户 -项目评分数据中的项目。 以表 12的第二行为例说明项目匹配关系:该行表明业务 S的项目 与业务 的项目 l是同一个项目, 在统一的用户 -项目评分数据中以 表示。
步骤 504: 依据所述多种数字媒体或电子商务业务的初始用户-项目评 分数据、 多种数字媒体或电子商务业务的用户-项目评分分值范围及所述分 值范围的最小值, 计算得到所述多种数字媒体或电子商务业务的初始用户- 项目评分数据的规范化结果。
在本步骤中利用公式 (4 ), 得到的规范化之后的各种业务的用户 -项 目评分数据。 业务 S的规范化后用户 -项目评分数据如表 13所示:
表 13
Figure imgf000021_0002
2的规范化后的用户-项目评分数据如表 14所示:
Figure imgf000021_0001
u2 4 u3 5 u4 4 5
4 3 u6 5 4 业务 的规范化后的用户-项目评分数据如表 15所示: 表 15
Figure imgf000022_0001
步骤 505: 依据所述实际用户、 实际项目以及规范化结果, 整合所述 多种数字媒体或电子商务业务的用户 -项目评分数据,生成统一的用户 -项目 评分数据, 所述统一的用户 -项目评分数据中包括所述多种数字媒体或电子 商务业务中所有用户和项目的整合后的用户-项目评分数据。
在步骤 505中具体利用前述公式( 5 ),得到的统一用户 -项目评分数据, 具体如表 16所示:
表 16
Figure imgf000023_0001
在表 16中, 用户和项目都分别在各种业务之间唯一, 则可以从表 16中看出, 在 3种业务中, 不同的实际用户有 10个, 不同的实际项目有 9个。
步骤 506: 将所述统一用户-项目评分数据依次映射到所述多种数字媒 体或电子商务业务, 生成所述多种数字媒体或电子商务业务映射后的用户- 项目评分数据。
利用前述方式三, 可以得到各种业务映射后的业务相关的用户 -项目评 分数据。 业务 S中映射后的用户 -项目评分数据如表 17所示:
表 17
Figure imgf000023_0002
5 5
u2' 2 5 u3' 4 3
u4 4 5
Us 4 5 业务 中映射后的用户 -项目评分数据如表 18所示:
表 18
Figure imgf000024_0002
业务 中映射后的用户-项目评分数据如表 19所示:
表 19
Figure imgf000024_0001
Us 5 5 u2' 5 3 5 u6 3 3 4 u9 3 5 υΊ' 5 4 3 4 ul'0 5 步骤 507: 依据所述多种数字媒体或电子商务业务映射后的用户 -项目 评分数据计算同一种业务内不同项目之间的项目相似度。
在步骤 507中假设计算同一种数字媒体或电子商务业务内不同项目之 间的相似度, 利用前述公式(9 )可以计算得到各种数字媒体或电子商务业 务的项目相似度。 业务 S的项目相似度数据如表 20所示:
表 20
Figure imgf000025_0001
业务 的项目相似度数据如表 21所示: 表 21 ι6 1,'
1.00 0.44 0.49 0.38 0.24
0.44 1.00 0.00 0.77 0.64 0.49 0.00 1.00 0.00 0.42 i6 0.38 0.77 0.00 1.00 0.73
0.24 0.64 0.42 0.73 1.00 业务 的项目相似度数据如表 22所示: 表 22
Figure imgf000026_0001
在本例子中, 因为各种数字媒体或电子商务业务同属于音乐领域, 所 以进行用户-项目评分数据的规范、 整合与映射是合理的。 通过本实施例的 这种项目相似度的获取方法, 得到的映射后的业务相关的用户-项目评分数 据比原始的各种业务的用户 -项目评分数据更加丰富, 并且可信度高, 可以 很好地解决用户-项目评分数据的稀疏性问题, 而在进行项目推荐时再通过 很好的选择该业务的映射后的用户-项目评分数据以及相应的用户相似度 和 /或项目相似度, 也可以提高项目推荐的有效性和准确性。 介绍完本发明实施例中涉及的用户相似度和 /或项目相似度的获取流 步骤 601 : 通过计算机网络接口获取目标用户正在使用的业务标识和 目标用户标识。
在本步骤中目标用户即是需要为其推荐项目的用户, 首先获取目标用 户正在使用的业务标识及其用户标识。 需要说明的是, 这里的目标用户标 识在同一个业务内是唯一的, 在不同业务中不一定唯一, 但是因为可以依 据业务标识唯一确定一个目标业务, 因此, 目标业务标识在该目标业务中 可以唯一确定一个用户。
步骤 602: 根据所述业务标识从存储器中获取预先存储的业务源数据。 其中, 所述业务源数据具体可以包括: 该业务映射后的用户-项目评分 数据、 该业务的不同项目之间的相似度、 用户匹配关系数据和项目匹配关 系数据; 或者, 该业务映射后的用户-项目评分数据、 该业务的不同用户之 间的相似度、 用户匹配关系数据和项目匹配关系数据。
根据业务标识可以从线下数据处理流程的结果中获取该业务映射后的 用户 -项目评分数据和该业务的不同项目之间的相似度, 以及用户匹配关系 数据和项目匹配关系数据, 也可以从线下数据处理流程的结果中获取该业 务映射后的用户 -项目评分数据和该业务的不同用户之间的相似度, 还可以 获取到用户匹配关系数据和项目匹配关系数据。
假设在实际中需要为前述业务 的用户 推荐一个项目, 则获取到的 目标业务标识为业务 , 目标用户标识为业务 中的用户 , 根据目标业 务标识获取到的映射后的用户 -项目评分数据为表 19 所示的内容, 该业务 内不同项目之间的相似度为表 22所示的内容, 用户匹配关系数据为表 10 所示的内容, 项目匹配关系数据为表 12所示的内容。
步骤 603 : 根据所述目标用户标识、 目标用户正在使用的业务标识及 业务源数据, 为所述目标用户生成候选推荐项目集合。
在本步骤中需要根据目标用户标识、 目标用户正在使用的业务标识及 业务源数据为目标用户生成候选推荐项目集合。 该候选推荐项目结合在获 取过程中可以釆用如下任一种方式或者两种方式的结合:
方式 A: 选择与所述目标用户的用户相似度满足预置条件的用户, 并选 择所述用户相似度满足预置条件的用户的评分高于预定阈值且所述目标用 户没有评分的项目组成候选推荐项目集合;
其中, 所述候选推荐项目集合中的候选推荐项目均属于所述目标用户 正在使用的数字媒体或电子商务业务。 其中, 所述候选推荐项目可以包括: 数字媒体内容、 电子商务产品或 统一资源定位符 URL。
方式 B: 选择与所述目标用户的用户-项目评分高于预设阈值的项目, 并选择与所述用户-项目评分高于预设阈值的项目之间的项目相似度满足 预置条件且所述目标用户没有评分的项目组成候选推荐项目集合; 其中, 所述候选推荐项目集合中的候选推荐项目均属于所述目标用户正在使用的 业务。
其中, 判断一个项目是否属于目标用户正在使用的数字媒体或电子商 务业务, 可以根据目标用户正在使用的业务标识和实际项目标识进行判 断。
以方式 B为例, 根据步骤 601中获取到的表 19和表 22, 针对用户^5 (即 是表 19中的 )的用户-项目数据的评分值高的项目, 满足与所述评分值高 的项目之间的相似度高并且用户 没有评过分的项目组成候选推荐项目集 合。
在本例子中,假设认为用户 评分值不小于 3的项目定义为评分值高的 项目, 则得到的项目为 4和 ; 再假设相似度高的含义为相似度不小于 0.4 , 那么, 与 /4相似度高且用户 没有评过分的项目为 6、 r,和1 与 相似度 高并且用户 没有评过分的项目为 6和 , 因此候选推荐项目集合包括
^和 9 , 对应到业务 中的项目为 、 和 。
步骤 604: 至少根据所述业务源数据中的用户相似度和 /或项目相似度 获取所述候选推荐项目集合中每一个候选推荐项目的预测评分。
在实际应用中, 用户 对项目 的预测评分 ' 可以釆用公式 ( 10 )、 ( 11 ) 和 ( 12 ) 中的任意一种方式计算:
Figure imgf000028_0001
( 11 ) ∑ simiU^ U,) - ^ ∑ sim{L,Ik) - rik
Uk≡NNVi
R a
∑ s U^ X \ sim{I Ik) \ 其中, 公式( 10 ) 中的^^表示与用户 相似度高的用户组成的集合, 即用户 的近邻; ^^ Ά)表示用户 与用户 的相似度; 公式( 11 ) 中 的^ 表示与项目 相似度高的项目组成的集合, 即项目 的相似项目集, 'W , )表示项目 与项目 4的相似度; 公式( 12 ) 中的 "是 0到 1之间的 参数, 可以依据经验人工设定, 或者根据训练数据学习得到, 例如不断调 整"的值, 选择最终误差最小的那一个。
假设利用公式( 11 )计算预测评分, 则用户 对项目 2、 和 的预测 评分分别为 3.96、 3.87和 3.00。
步骤 605: 根据所述候选推荐项目的预测评分从所述候选推荐项目中 抽取符合条件的候选推荐项目生成所述目标用户的最终推荐项目列表。
根据预测评分为目标用户生成最终项目列表, 该最终项目列表包含预 测评分较高的若干个项目, 具体选取多少个项目还可以根据实际情况进行 调整。假设在本实例中取预测评分最高的候选推荐项目作为最终项目列表, 则最终项目列表为项目 ^。当然,也可以选择项目 和 作为最终项目列表。
步骤 606: 数字媒体或电子商务业务服务器将所述最终推荐项目列表 发送至所述目标用户的客户端进行展示。
当生成最终项目列表之后, 数字媒体或电子商务业务服务器在将最终 推荐项目列表发送给所述目标用户的客户端进行展示。
在本实施例中, 进行项目推荐时, 根据目标用户标识和业务标识, 可 以选择该业务的映射后的用户 -项目评分数据以及相应的用户相似度和 /或 项目相似度, 通过直接利用存储器中存储的用户相似度和 /或项目相似度, 即是较好地选择了该业务的映射后的用户-项目评分数据以及相应的相似 度, 所以减少了项目推荐的处理时间, 提升了项目推荐的效率, 并且可以 提高项目推荐的有效性和准确性。 参考图 7 , 本发明实施例还公开了一种业务交叉时的项目推荐方法, 该方法同时包括了用户相似度和 /或项目相似度的获取流程和项目推荐流 程; 具体的, 该业务交叉时的项目推荐方法可以包括如下步骤:
步骤 701 : 获取多种不同数字媒体或电子商务业务的初始源数据, 所 述初始源数据包括: 多种业务的初始用户-项目评分数据。
步骤 702 : 依据多种数字媒体或电子商务业务之间的用户和项目的匹 配结果及所述多种数字媒体或电子商务业务的初始用户-项目评分数据的 规范化结果,将所述多种数字媒体或电子商务业务的初始用户-项目评分数 据整合为包括所述各多种数字媒体或电子商务业务的用户及项目的统一用 户-项目评分数据。
步骤 703: 将所述统一用户-项目评分数据依次映射到所述多种数字媒 体或电子商务业务,生成所述多种数字媒体或电子商务业务映射后的用户- 项目评分数据。
步骤 704 : 依据所述多种数字媒体或电子商务业务映射后的用户-项目 评分数据获取同一种业务内不同用户之间的用户相似度和 /或同一种业务 内不同项目之间的项目相似度。
步骤 705: 将所述用户相似度和 /或项目相似度存储至所述存储器中。 需要说明的是,步骤 701〜步骤 705所示意的存储用户相似度和 /或项目 相似度的过程可以认为是预处理过程, 可以和后续步骤 706〜711 所示意的 项目推荐过程独立进行, 这样也能保证项目推荐的实时性和有效性。 在本 实施例中为了方便起见才将预处理过程和项目推荐过程按照顺序进行介 步骤 706: 通过计算机网络接口获取目标用户正在使用的业务标识和 目标用户标识。
步骤 707: 根据所述业务标识从存储器中获取预先存储的业务源数据。 步骤 708: 根据所述目标用户标识、 目标用户正在使用的数字媒体或 电子商务业务标识及源数据, 为所述目标用户生成候选推荐项目集合。
步骤 709: 至少根据所述业务源数据中的用户相似度和 /或项目相似度 获取所述候选推荐项目集合中每一个候选推荐项目的预测评分。
步骤 710: 根据所述候选推荐项目的预测评分从所述候选推荐项目中 抽取符合条件的候选推荐项目生成所述目标用户的最终推荐项目列表。 步骤 711 : 数字媒体或电子商务业务服务器将所述最终项目推荐列表 发送至所述目标用户的客户端进行展示。
因为用户相似度和 /或项目相似度的获取流程与项目推荐流程在之前 的实施例中已经介绍的非常详细, 所以本实施例未尽之处, 可以参考用户 相似度和 /或项目相似度的获取流程与项目推荐流程的相关介绍。
需要说明的是, 对于前述的各方法实施例, 为了简单描述, 故将其都 表述为一系列的动作组合, 但是本领域技术人员应该知悉, 本发明并不受 所描述的动作顺序的限制, 因为依据本发明, 某些步骤可以釆用其他顺序 或者同时进行。 其次, 本领域技术人员也应该知悉, 说明书中所描述的实 施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
与上述本发明实施例所提供的用户相似度和 /或项目相似度的获取方 法相对应, 参见图 8 , 本发明实施例还提供了用户相似度和 /或项目相似度 的获取实施例的结构示意图, 具体可以包括:
获取初始源数据单元 801 , 用于获取不同数字媒体或电子商务业务的 初始源数据, 所述初始源数据包括: 多种数字媒体或电子商务业务的初始 用户-项目评分数据;
整合单元 802 , 用于依据多种数字媒体或电子商务业务之间的用户和 项目的匹配结果及所述多种数字媒体或电子商务业务的初始用户-项目评 分数据的规范化结果, 将所述多种数字媒体或电子商务业务的初始用户-项 目评分数据整合为包括所述多种数字媒体或电子商务业务的用户及项目的 统一用户-项目评分数据;
所述初始源数据还可以包括: 多种数字媒体或电子商务业务的用户属 性数据和项目属性数据, 参考图 9所示, 则所述整合单元 802具体可以包 括:
第一匹配子单元 901 , 用于依据所述用户属性数据中的初始用户标识、 初始用户属性及初始用户属性值, 匹配得到在所述多种数字媒体或电子商 务业务之间唯一的实际用户; 所述初始用户标识表示在某一种业务内唯一 的用户; 所述初始用户属性值用于表示在所述多种业务之间都唯一的用户; 第二匹配子单元 902, 用于依据所述项目属性数据中的初始项目标识、 初始项目属性及初始项目属性值, 匹配得到在多种数字媒体或电子商务业 务之间唯一的实际项目; 所述初始项目标识表示在某一种业务内唯一的项 目;
参考图 10所示, 所述第二匹配子单元 902具体又可以包括:
第三匹配子单元 1001 , 用于利用多种数字媒体或电子商务业务的初始 项目属性匹配多种数字媒体或电子商务业务之间不同的实际项目属性; 第二获取子单元 1002 , 用于依据所述不同的实际项目属性获取多种数 字媒体或电子商务业务之间的项目属性集重合度以及每一种业务与其他业 务的项目属性集重合度均值;
排序子单元 1003 , 用于按照所述项目属性集重合度均值的大小对所述 多种数字媒体或电子商务业务进行排序;
业务匹配子单元 1004 , 用于按照排序之后所述多种数字媒体或电子商 务业务的先后顺序, 以第一种业务为当前业务执行业务匹配流程, 所述业 务匹配流程包括: 确定所述当前业务与其他业务的匹配项目, 以及, 删除 所述当前业务;
参考图 1 1所示, 所述业务匹配子单元 1004, 具体又可以包括: 项目匹配子单元 1102, 用于按照第一种业务所包含的初始项目标识顺 序, 选择第一个项目作为当前项目执行项目匹配流程; 所述项目匹配流程 包括: 计算当前项目与其他业务中各个项目的项目匹配度; 针对每一种其 他业务, 依据预设的阈值条件选取合适的项目匹配度, 以形成多个项目匹 配度集合; 在每个项目匹配度集合中选择匹配度最高的项目作为当前项目 的匹配项目; 记录所述当前项目与其匹配项目的匹配关系, 并删除各种业 务中包括的所述匹配项目; 删除所述当前项目;
循环子单元 1103 , 以所述第一种业务中的第二个项目为当前项目, 执 行所述项目匹配流程, 直至所述第一种业务中包含的项目为空。
第三获取子单元 1005 , 用于以第二种业务为所述当前业务执行业务匹 配流程, 直至所述序列中的业务为空时, 依据所述匹配项目以及项目匹配 关系获取在所述多种数字媒体或电子商务业务之间都唯一的实际项目。 第一获取子单元 903 , 用于依据多种业务的初始用户-项目评分数据、 多种业务的用户 -项目评分分值范围及所述分值范围的最小值, 获取所述多 种业务的初始用户-项目评分数据的规范化结果;
整合子单元 904, 用于依据所述实际用户、 实际项目以及规范化结果, 整合所述多种数字媒体或电子商务业务的用户-项目评分数据, 生成统一的 用户 -项目评分数据,所述统一的用户-项目评分数据包括所述多种数字媒体 或电子商务业务中用户和项目的整合后的用户-项目评分数据。
生成评分数据单元 803 , 用于将所述统一用户-项目评分数据依次映射 到所述多种数字媒体或电子商务业务, 生成所述多种数字媒体或电子商务 业务映射后的用户 -项目评分数据;
在实际应用中, 所述生成评分数据单元 803 , 进一步可以用于: 针对每种业务, 在统一的用户 -项目评分数据中抽取出每种数字媒体或 电子商务业务所包含的全体项目和 /或全体用户对应的所有用户-项目评分 数据, 构成各种业务的映射后的用户-项目评分数据。
获取相似度单元 804,用于依据所述多种数字媒体或电子商务业务映射 后的用户 -项目评分数据计算同一种业务内不同用户之间的相似度和 /或同 一种业务内不同项目之间的相似度。
在实际应用中, 所述获取相似度单元 804, 进一步可以用于:
依据所述映射后的用户-项目评分数据、 同一种业务内两个不同用户共 同评分的项目的集合和所述两个不同用户各自评分的项目的集合计算所述 两个不同用户之间的相似度; 和 /或,
依据所述映射后的用户 -项目评分数据、 同一种业务内对两个不同项目 共同评分的用户的集合和所述对两个不同项目各自评分的用户的集合计算 所述两个不同项目之间的相似度。
存储单元 805 , 用于将所述用户相似度和 /或项目相似度存储至所述存 储器中。
本发明实施例中公开的用户相似度和 /或项目相似度的获取系统, 因为 通过用户-项目评分数据的规范整合以及映射来计算用户相似度或者项目 相似度, 不仅可以为项目推荐提供数据, 还可以通过很好的选择该业务的 映射后的用户 -项目评分数据以及相应的用户相似度和 /或项目相似度,可以 提高项目推荐的有效性准确性。 参考图 12所示, 本发明实施例还公开了一种业务交叉时的项目推荐 系统, 该项目推荐系统包括:
获取标识单元 1201 , 用于通过计算机网络接口获取目标用户正在使用 的数字媒体或电子商务业务标识和目标用户标识;
获取业务源数据单元 1202, 用于根据所述业务标识从存储器中获取预 先存储的业务源数据;
生成候选集合单元 1203 , 用于根据所述目标用户标识、 目标用户正在 使用的数字媒体或电子商务业务标识及业务源数据, 为所述目标用户生成 候选推荐项目集合;
在实际应用中, 所述生成候选集合单元 1202进一步可以用于: 选择与所述目标用户的用户相似度满足预置条件的用户, 并选择所述 用户相似度满足预置条件的用户的评分高于预定阈值且所述目标用户没有 评分的项目组成候选推荐项目集合; 和 /或,
选择与所述目标用户的用户-项目评分高于预设阈值的项目, 并选择与 所述用户-项目评分高于预设阈值的项目之间的项目相似度满足预置条件 且所述目标用户没有评分的项目组成候选推荐项目集合。
其中, 所述候选推荐项目均属于所述目标用户正在使用的数字媒体或 电子商务业务。
获取预测评分单元 1204, 用于至少根据所述业务源数据中的用户相似 度和 /或项目相似度, 获取所述候选推荐项目集合中每一个候选推荐项目的 预测评分;
生成最终列表单元 1205 , 用于根据所述候选推荐项目的预测评分从所 述候选推荐项目中抽取符合条件的候选推荐项目生成所述目标用户的最终 推荐项目列表;
展示单元 1206, 用于将所述最终项目推荐列表发送至所述目标用户的 客户端进行展示。
本实施例的项目推荐系统在进行项目推荐时, 根据目标用户标识和业 务标识, 可以选择该业务的映射后的用户 -项目评分数据以及相应的用户相 似度和 /或项目相似度,通过直接利用存储器中存储的用户相似度和 /或项目 相似度, 即是较好地选择了该业务的映射后的用户-项目评分数据以及相应 的相似度, 所以减少了项目推荐的处理时间, 提升了项目推荐的效率, 并 且可以提高项目推荐的有效性和准确性。
需要说明的是, 在实际应用的项目推荐系统中, 执行获取用户相似度 和 /或项目相似度的系统和进行项目推荐的系统, 可以分别独立工作, 因为 获取用户相似度和 /或项目相似度的项目推荐可以同时进行,只需在进行项 目推荐时能够获取已经计算出来的用户相似度和 /或项目相似度即可,这样 也能保证项目推荐系统所推荐项目的实时性和有效性。
需要说明的是, 本说明书中的各个实施例均釆用递进的方式描述, 每 个实施例重点说明的都是与其他实施例的不同之处, 各个实施例之间相同 相似的部分互相参见即可。 对于系统类实施例而言, 由于其与方法实施例 基本相似, 所以描述的比较简单, 相关之处参见方法实施例的部分说明即 可。
还需要说明的是, 在本文中, 术语 "包括"、 "包含" 或者其任何其他 变体意在涵盖非排他性的包含, 从而使得包括一系列要素的过程、 方法、 物品或者设备不仅包括那些要素, 而且还包括没有明确列出的其他要素, 或者是还包括为这种过程、 方法、 物品或者设备所固有的要素。 在没有更 多限制的情况下, 由语句 "包括一个 ... ... " 限定的要素, 并不排除在包括 所述要素的过程、 方法、 物品或者设备中还存在另外的相同要素。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步 骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读 存储介质中, 存储介质可以包括: ROM、 RAM, 磁盘或光盘等。
以上对本发明实施例所提供的业务交叉时的项目推荐方法及系统进行了 上实施例的说明只是用于帮助理解本发明实施例的方法及其思想; 同时,对于 本领域的一般技术人员,依据本发明实施例的思想,在具体实施方式及应用范 围上均会有改变之处, 综上所述, 本说明书内容不应理解为对本发明的限制。

Claims

权 利 要 求
1、一种数字媒体或电子商务业务交叉时的项目推荐方法,其特征在于, 包括:
通过计算机网络接口获取目标用户正在使用的数字媒体或电子商务业 务标识和目标用户标识, 并根据所述业务标识从存储器中获取预先存储的 业务源数据;
根据所述目标用户标识、 目标用户正在使用的数字媒体或电子商务业 务标识及业务源数据, 为所述目标用户生成候选推荐项目集合;
至少根据所述业务源数据中的用户相似度和 /或项目相似度获取所述 候选推荐项目集合中每一个候选推荐项目的预测评分;
根据所述候选推荐项目的预测评分从所述候选推荐项目中抽取符合条 件的候选推荐项目生成所述目标用户的最终推荐项目列表;
数字媒体或电子商务业务服务器将所述最终项目推荐列表发送至所述 目标用户的客户端进行展示。
2、 根据权利要求 1所述的方法, 其特征在于, 所述根据所述目标用户 标识、 目标用户正在使用的数字媒体或电子商务业务标识及业务源数据, 为所述目标用户生成候选推荐项目集合, 包括:
选择与所述目标用户的用户相似度满足预置条件的用户, 并选择所述 用户相似度满足预置条件的用户的评分高于预定阈值且所述目标用户没有 评分的项目组成候选推荐项目; 和 /或,
选择与所述目标用户的用户-项目评分高于预设阈值的项目, 并选择与 所述用户-项目评分高于预设阈值的项目之间的项目相似度满足预置条件 且所述目标用户没有评分的项目组成候选推荐项目;
其中, 所述候选推荐项目均属于所述目标用户正在使用的数字媒体或 电子商务业务。
3、 根据权利要求 1所述的方法, 其特征在于, 还包括:
获取多种不同数字媒体或电子商务业务的初始源数据, 所述初始源数 据包括: 所述多种数字媒体或电子商务业务的初始用户-项目评分数据; 依据所述多种数字媒体或电子商务业务之间的用户和项目的匹配结果 及所述多种数字媒体或电子商务业务的初始用户-项目评分数据的规范化 结果, 将所述多种数字媒体或电子商务业务的初始用户-项目评分数据整合 为包括所述多种数字媒体或电子商务业务的用户及项目的统一用户-项目 评分数据;
将所述统一用户-项目评分数据依次映射到所述多种数字媒体或电子 商务业务, 生成所述多种数字媒体或电子商务业务映射后的用户-项目评分 数据;
依据所述多种数字媒体或电子商务业务映射后的用户-项目评分数据 获取同一种业务内不同用户之间的用户相似度和 /或同一种业务内不同项 目之间的项目相似度;
将所述用户相似度和 /或项目相似度存储至所述存储器中。
4、根据权利要求 3所述的方法,其特征在于,所述初始源数据还包括: 多种数字媒体或电子商务业务的用户属性数据和项目属性数据, 则所述将 所述多种数字媒体或电子商务业务的初始用户-项目评分数据整合为包括 所述多种数字媒体或电子商务业务的用户及项目的统一用户-项目评分数 据, 包括:
依据所述用户属性数据中的初始用户标识、 初始用户属性及初始用户 属性值, 匹配得到在多种数字媒体或电子商务业务之间唯一的实际用户; 所述初始用户标识表示在某一种业务内唯一的用户; 所述初始用户属性值 用于表示在所述多种数字媒体或电子商务业务之间都唯一的用户;
依据所述项目属性数据中的初始项目标识、 初始项目属性及初始项目 属性值, 匹配得到在多种数字媒体或电子商务业务之间唯一的实际项目; 所述初始项目标识表示在某一种业务内唯一的项目;
依据多种数字媒体或电子商务业务的初始用户-项目评分数据、 多种数 字媒体或电子商务业务的用户-项目评分分值范围及所述分值范围的最小 值, 获取所述多种数字媒体或电子商务业务的初始用户-项目评分数据的规 范化结果;
依据所述实际用户、 实际项目以及规范化结果, 整合所述多种数字媒 体或电子商务业务的用户 -项目评分数据, 生成统一的用户 -项目评分数据 , 所述统一的用户-项目评分数据包括所述多种数字媒体或电子商务业务中 用户和项目的整合后的用户 -项目评分数据。
5、 根据权利要求 4所述的方法, 其特征在于, 所述依据所述项目属性 数据中的初始项目标识、 初始项目属性及初始项目属性值, 匹配得到在多 种数字媒体或电子商务业务之间唯一的实际项目, 包括:
利用所述多种数字媒体或电子商务业务的初始项目属性匹配所述数字 媒体或电子商务多种业务之间不同的实际项目属性;
依据所述不同的实际项目属性获取所述多种数字媒体或电子商务业务 之间的项目属性集重合度以及每一种业务与其他业务的项目属性集重合度 均值;
按照所述项目属性集重合度均值的大小对所述多种数字媒体或电子商 务业务进行排序;
按照排序之后多种数字媒体或电子商务业务的先后顺序, 以第一种业 务为当前业务执行业务匹配流程, 所述业务匹配流程包括: 确定所述当前 业务与其他业务的匹配项目, 以及, 删除所述当前业务;
以第二种业务为所述当前业务执行业务匹配流程, 直至所述序列中的 业务为空时, 依据所述匹配项目以及项目匹配关系获取在所述多种数字媒 体或电子商务业务之间都唯一的实际项目。
6、 根据权利要求 5所述的方法, 其特征在于, 所述确定所述当前业务 与其他业务的匹配项目, 包括:
按照当前业务所包含的初始项目标识顺序, 选择第一个项目作为当前 项目执行项目匹配流程; 所述项目匹配流程包括: 计算当前项目与其他业 务中各个项目的项目匹配度; 针对每一种其他业务, 依据预设的阈值条件 选取合适的项目匹配度, 以形成多个项目匹配度集合; 在每个项目匹配度 集合中选择匹配度最高的项目作为当前项目的匹配项目; 记录所述当前项 目与其匹配项目的匹配关系,并删除所述多种业务中包括的所述匹配项目; 删除所述当前项目;
以所述当前业务中的第二个项目为当前项目,执行所述项目匹配流程, 直至所述当前业务中包含的项目为空。
7、 根据权利要求 3 所述的方法, 其特征在于, 所述将所述统一用户- 项目评分数据依次映射到所述多种数字媒体或电子商务业务, 生成所述多 种数字媒体或电子商务业务映射后的用户-项目评分数据, 包括:
针对每种业务, 在统一的用户 -项目评分数据中抽取出每种业务所包含 的全体项目和 /或全体用户对应的所有用户-项目评分数据,构成各种业务的 映射后的用户 -项目评分数据。
8、 根据权利要求 3所述的方法, 其特征在于, 所述依据所述多种数字 媒体或电子商务业务映射后的用户-项目评分数据获取同一种业务内不同 用户之间的相似度和 /或同一种业务内不同项目之间的相似度, 包括:
依据所述映射后的用户-项目评分数据、 同一种业务内两个不同用户共 同评分的项目的集合和所述两个不同用户各自评分的项目的集合计算所述 两个不同用户之间的相似度; 和 /或,
依据所述映射后的用户 -项目评分数据、 同一种业务内对两个不同项目 共同评分的用户的集合和所述对两个不同项目各自评分的用户的集合计算 所述两个不同项目之间的相似度。
9、 根据权利要求 1所述的方法, 其特征在于, 所述数字媒体或电子商 务业务, 包括但不限于: 音乐、 应用下载、 网上书店、 电子阅读、 游戏和 / 或网上购物。
10、根据权利要求 1所述的方法,其特征在于,所述候选推荐项目包括: 数字媒体内容、 电子商务产品或统一资源定位符 URL。
11、 一种数字媒体或电子商务业务交叉时的项目推荐系统, 其特征在 于, 包括:
获取标识单元, 用于通过计算机网络接口获取目标用户正在使用的数 字媒体或电子商务业务标识和目标用户标识;
获取业务源数据单元, 用于根据所述业务标识从存储器中获取预先存 储的业务源数据;
生成候选集合单元, 用于根据所述目标用户标识、 目标用户正在使用 的数字媒体或电子商务业务标识及业务源数据, 为所述目标用户生成候选 推荐项目集合; 获取预测评分单元, 用于至少根据所述业务源数据中的用户相似度和 / 或项目相似度, 获取所述候选推荐项目集合中每一个候选推荐项目的预测 评分;
生成最终列表单元 ,用于根据所述候选推荐项目的预测评分从所述候 选推荐项目中抽取符合条件的候选推荐项目生成所述目标用户的最终推荐 项目列表;
展示单元, 用于将所述最终项目推荐列表发送至所述目标用户的客户 端进行展示。
12、 如权利要求 11所述的系统, 其特征在于, 所述生成候选集合单元 进一步用于:
选择与所述目标用户的用户相似度满足预置条件的用户, 并选择所述 用户相似度满足预置条件的用户的评分高于预定阈值且所述目标用户没有 评分的项目组成候选推荐项目; 和 /或,
选择与所述目标用户的用户-项目评分高于预设阈值的项目, 并选择与 所述用户-项目评分高于预设阈值的项目之间的项目相似度满足预置条件 且所述目标用户没有评分的项目组成候选推荐项目;
其中, 所述候选推荐项目均属于所述目标用户正在使用的数字媒体或 电子商务业务。
13、 如权利要求 11所述的系统, 其特征在于, 还包括:
获取初始源数据单元, 用于获取不同数字媒体或电子商务业务的初始 源数据, 所述初始源数据包括: 所述多种数字媒体或电子商务业务的初始 用户-项目评分数据;
整合单元, 用于依据多种数字媒体或电子商务业务之间的用户和项目 的匹配结果及所述多种数字媒体或电子商务业务的初始用户 -项目评分数 据的规范化结果, 将所述多种数字媒体或电子商务业务的初始用户-项目评 分数据整合为包括所述多种数字媒体或电子商务业务的用户及项目的统一 用户-项目评分数据;
生成评分数据单元, 用于将所述统一用户 -项目评分数据依次映射到所 述多种数字媒体或电子商务业务, 生成所述多种数字媒体或电子商务业务 映射后的用户 -项目评分数据;
获取相似度单元, 用于依据所述多种数字媒体或电子商务业务映射后 的用户 -项目评分数据获取同一种业务内不同用户之间的用户相似度和 /或 同一种业务内不同项目之间的项目相似度;
存储单元, 用于将所述用户相似度和 /或项目相似度存储至所述存储器 中。
14、 如权利要求 13所述的系统, 其特征在于, 所述初始源数据还包括: 多种数字媒体或电子商务业务的用户属性数据和项目属性数据, 则所述整 合单元包括:
第一匹配子单元, 用于依据所述用户属性数据中的初始用户标识、 初 始用户属性及初始用户属性值, 匹配得到在所述多种数字媒体或电子商务 业务之间唯一的实际用户; 所述初始用户标识表示在某一种业务内唯一的 用户; 所述初始用户属性值用于表示在所述多种数字媒体或电子商务业务 之间都唯一的用户;
第二匹配子单元, 用于依据所述项目属性数据中的初始项目标识、 初 始项目属性及初始项目属性值, 匹配得到在所述多种数字媒体或电子商务 业务之间唯一的实际项目; 所述初始项目标识表示在某一种业务内唯一的 项目;
第一获取子单元, 用于依据多数字媒体或电子商务业务的初始用户-项 目评分数据、 多种数字媒体或电子商务业务的用户-项目评分分值范围及所 述分值范围的最小值, 获取所述多种数字媒体或电子商务业务的初始用户- 项目评分数据的规范化结果;
整合子单元, 用于依据所述实际用户、 实际项目以及规范化结果, 整 合所述多种数字媒体或电子商务业务的用户-项目评分数据, 生成统一的用 户-项目评分数据,所述统一的用户-项目评分数据包括所述多种数字媒体或 电子商务业务中用户和项目的整合后的用户-项目评分数据。
15、 如权利要求 14所述的系统, 其特征在于, 所述第二匹配子单元包 括:
第三匹配子单元, 用于利用所述多种数字媒体或电子商务业务的初始 项目属性匹配多种数字媒体或电子商务业务之间不同的实际项目属性; 第二获取子单元, 用于依据所述不同的实际项目属性获取多种数字媒 体或电子商务业务之间的项目属性集重合度以及每一种业务与其他业务的 项目属性集重合度均值;
排序子单元, 用于按照所述项目属性集重合度均值的大小对所述多种 数字媒体或电子商务业务进行排序;
业务匹配子单元, 用于按照排序之后多种数字媒体或电子商务业务的 先后顺序, 以第一种业务为当前业务执行业务匹配流程, 所述业务匹配流 程包括: 确定所述当前业务与其他业务的匹配项目, 以及, 删除所述当前 业务;
第三获取子单元, 用于以第二种业务为所述当前业务执行业务匹配流 程, 直至所述序列中的业务为空时, 依据所述匹配项目以及项目匹配关系 获取在所述多种数字媒体或电子商务业务之间都唯一的实际项目。
16、 如权利要求 15所述的系统, 其特征在于, 所述业务匹配子单元具 体配置为:
项目匹配子单元, 用于按照当前业务所包含的初始项目标识顺序, 选 择第一个项目作为当前项目执行项目匹配流程; 所述项目匹配流程包括: 计算当前项目与其他业务中各个项目的项目匹配度;针对每一种其他业务, 依据预设的阈值条件选取合适的项目匹配度, 以形成多个项目匹配度集合; 在每个项目匹配度集合中选择匹配度最高的项目作为当前项目的匹配项 目; 记录所述当前项目与其匹配项目的匹配关系, 并删除所述多种业务中 包括的所述匹配项目; 删除所述当前项目;
循环子单元, 用于以所述当前业务中的第二个项目为当前项目, 执行 所述项目匹配流程, 直至所述当前业务中包含的项目为空。
17、 如权利要求 13所述的系统, 其特征在于, 所述生成评分数据单元 具体配置为:
针对每种业务, 在统一的用户 -项目评分数据中抽取出每种业务所包含 的全体项目和 /或全体用户对应的所有用户 -项目评分数据,构成所述多种数 字媒体或电子商务业务的映射后的用户-项目评分数据。
18、 如权利要求 13所述的系统, 其特征在于, 所述获取相似度单元具 体配置为:
依据所述映射后的用户 -项目评分数据、 同一种业务内两个不同用户共 同评分的项目的集合和所述两个不同用户各自评分的项目的集合计算所述 两个不同用户之间的相似度; 和 /或,
依据所述映射后的用户 -项目评分数据、 同一种业务内对两个不同项目 共同评分的用户的集合和所述对两个不同项目各自评分的用户的集合计算 所述两个不同项目之间的相似度。
PCT/CN2011/076551 2011-06-29 2011-06-29 一种业务交叉时的项目推荐方法及系统 WO2012159308A1 (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201180001057.8A CN102959539B (zh) 2011-06-29 2011-06-29 一种业务交叉时的项目推荐方法及系统
PCT/CN2011/076551 WO2012159308A1 (zh) 2011-06-29 2011-06-29 一种业务交叉时的项目推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2011/076551 WO2012159308A1 (zh) 2011-06-29 2011-06-29 一种业务交叉时的项目推荐方法及系统

Publications (1)

Publication Number Publication Date
WO2012159308A1 true WO2012159308A1 (zh) 2012-11-29

Family

ID=47216551

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2011/076551 WO2012159308A1 (zh) 2011-06-29 2011-06-29 一种业务交叉时的项目推荐方法及系统

Country Status (2)

Country Link
CN (1) CN102959539B (zh)
WO (1) WO2012159308A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105338408A (zh) * 2015-12-02 2016-02-17 南京理工大学 基于时间因子的视频推荐方法
CN106512405A (zh) * 2016-12-06 2017-03-22 腾讯科技(深圳)有限公司 一种虚拟对象的外挂资源获取的方法及装置
CN107807967A (zh) * 2017-10-13 2018-03-16 平安科技(深圳)有限公司 实时推荐方法、电子设备及计算机可读存储介质
US11020664B2 (en) 2016-12-06 2021-06-01 Tencent Technology (Shenzhen) Company Limited Method and apparatus for obtaining virtual resource of virtual object
CN114417136A (zh) * 2021-12-24 2022-04-29 珠海大横琴科技发展有限公司 一种用户对象推荐的方法和装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107656938B (zh) * 2016-07-26 2022-01-11 北京搜狗科技发展有限公司 一种推荐方法和装置、一种用于推荐的装置
CN108355349A (zh) * 2018-03-14 2018-08-03 张伟东 游戏系统
CN108536662B (zh) * 2018-04-16 2022-04-12 苏州大学 一种数据标注方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090299996A1 (en) * 2008-06-03 2009-12-03 Nec Laboratories America, Inc. Recommender system with fast matrix factorization using infinite dimensions
WO2010037286A1 (zh) * 2008-09-27 2010-04-08 华为技术有限公司 一种基于协同过滤的推荐方法和系统
CN101878482A (zh) * 2007-11-29 2010-11-03 思科技术公司 社交协同过滤

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10339538B2 (en) * 2004-02-26 2019-07-02 Oath Inc. Method and system for generating recommendations
US7797197B2 (en) * 2004-11-12 2010-09-14 Amazon Technologies, Inc. Method and system for analyzing the performance of affiliate sites
CN101459908B (zh) * 2007-12-13 2012-04-25 华为技术有限公司 一种业务订阅方法、系统、服务器
CN101329683A (zh) * 2008-07-25 2008-12-24 华为技术有限公司 推荐系统及方法
JP2010176327A (ja) * 2009-01-28 2010-08-12 Sony Corp 学習装置、学習方法、情報処理装置、データ選択方法、データ蓄積方法、データ変換方法、及びプログラム
US20110112981A1 (en) * 2009-11-09 2011-05-12 Seung-Taek Park Feature-Based Method and System for Cold-Start Recommendation of Online Ads
JP5740814B2 (ja) * 2009-12-22 2015-07-01 ソニー株式会社 情報処理装置および方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101878482A (zh) * 2007-11-29 2010-11-03 思科技术公司 社交协同过滤
US20090299996A1 (en) * 2008-06-03 2009-12-03 Nec Laboratories America, Inc. Recommender system with fast matrix factorization using infinite dimensions
WO2010037286A1 (zh) * 2008-09-27 2010-04-08 华为技术有限公司 一种基于协同过滤的推荐方法和系统

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105338408A (zh) * 2015-12-02 2016-02-17 南京理工大学 基于时间因子的视频推荐方法
CN105338408B (zh) * 2015-12-02 2018-11-13 南京理工大学 基于时间因子的视频推荐方法
CN106512405A (zh) * 2016-12-06 2017-03-22 腾讯科技(深圳)有限公司 一种虚拟对象的外挂资源获取的方法及装置
CN106512405B (zh) * 2016-12-06 2019-02-19 腾讯科技(深圳)有限公司 一种虚拟对象的外挂资源获取的方法及装置
US11020664B2 (en) 2016-12-06 2021-06-01 Tencent Technology (Shenzhen) Company Limited Method and apparatus for obtaining virtual resource of virtual object
CN107807967A (zh) * 2017-10-13 2018-03-16 平安科技(深圳)有限公司 实时推荐方法、电子设备及计算机可读存储介质
CN107807967B (zh) * 2017-10-13 2021-10-22 平安科技(深圳)有限公司 实时推荐方法、电子设备及计算机可读存储介质
CN114417136A (zh) * 2021-12-24 2022-04-29 珠海大横琴科技发展有限公司 一种用户对象推荐的方法和装置
CN114417136B (zh) * 2021-12-24 2024-10-18 珠海大横琴科技发展有限公司 一种用户对象推荐的方法和装置

Also Published As

Publication number Publication date
CN102959539A (zh) 2013-03-06
CN102959539B (zh) 2015-09-23

Similar Documents

Publication Publication Date Title
WO2012159308A1 (zh) 一种业务交叉时的项目推荐方法及系统
WO2020048084A1 (zh) 资源推荐方法、装置、计算机设备及计算机可读存储介质
CN107172151B (zh) 用于推送信息的方法和装置
US20170286539A1 (en) User profile stitching
WO2017096877A1 (zh) 一种推荐方法和装置
RU2627717C2 (ru) Способ и устройство для автоматического генерирования рекомендаций
US20130085745A1 (en) Semantic-based approach for identifying topics in a corpus of text-based items
Cufoglu User profiling-a short review
US8250096B2 (en) Access to trusted user-generated content using social networks
US8874655B2 (en) Matching participants in a P2P recommendation network loosely coupled to a subscription service
US10133710B2 (en) Generating preview data for online content
US9442903B2 (en) Generating preview data for online content
US20090307314A1 (en) Musical interest specific dating and social networking process
US7921097B1 (en) Systems and methods for generating a descriptive uniform resource locator (URL)
WO2017028624A1 (zh) 一种资源的处理方法及装置
WO2016015468A1 (zh) 数据信息交易方法和系统
Deldjoo et al. MMTF-14K: a multifaceted movie trailer feature dataset for recommendation and retrieval
WO2014180196A1 (zh) 信息推荐处理方法及装置
CN108304422B (zh) 一种媒体搜索词推送方法和装置
KR20090027262A (ko) 추천을 생성하기 위한 방법 및 시스템
WO2009091700A1 (en) Enhancing and storing data for recall and use
JP2011175362A (ja) 情報処理装置、重要度算出方法及びプログラム
US20180121470A1 (en) Object Annotation in Media Items
EP2494506A1 (en) Co-occurrence serendipity recommender
WO2019141143A1 (zh) 物品间关系挖掘及推荐方法、装置、计算设备、存储介质

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201180001057.8

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11866331

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 11866331

Country of ref document: EP

Kind code of ref document: A1