WO2019214245A1 - 一种信息推送方法、装置、终端设备及存储介质 - Google Patents

一种信息推送方法、装置、终端设备及存储介质 Download PDF

Info

Publication number
WO2019214245A1
WO2019214245A1 PCT/CN2018/122729 CN2018122729W WO2019214245A1 WO 2019214245 A1 WO2019214245 A1 WO 2019214245A1 CN 2018122729 W CN2018122729 W CN 2018122729W WO 2019214245 A1 WO2019214245 A1 WO 2019214245A1
Authority
WO
WIPO (PCT)
Prior art keywords
user
group
tag
label
information
Prior art date
Application number
PCT/CN2018/122729
Other languages
English (en)
French (fr)
Inventor
蔡梦婵
Original Assignee
深圳壹账通智能科技有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 深圳壹账通智能科技有限公司 filed Critical 深圳壹账通智能科技有限公司
Publication of WO2019214245A1 publication Critical patent/WO2019214245A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Definitions

  • the present application relates to the field of computer technologies, and in particular, to an information push method, apparatus, terminal device, and storage medium.
  • the business units of some government units, media, and enterprises push some business information to users according to the characteristics of their own businesses, but the level of intelligence of existing push service information methods is low and not targeted.
  • these business information becomes a disguised advertisement, which is not conducive to the use of users, and also affects the efficiency of business departments to promote business information.
  • the embodiment of the present invention provides an information pushing method, a device, a terminal device, and a storage medium, so as to solve the problem of low intelligence level of business information push and low efficiency of business information promotion in the prior art.
  • an embodiment of the present application provides an information pushing method, including:
  • the user keyword is trained in a word vector manner to determine a user tag
  • the user tags are classified according to a K-Means aggregation algorithm to obtain an original user tag group;
  • an information pushing apparatus including:
  • a historical behavior information acquiring module configured to acquire historical behavior information of the user
  • a user keyword obtaining module configured to analyze and filter the historical behavior information, and obtain a user keyword
  • a user tag generating module configured to train the user keyword by using a word vector to determine a user tag
  • An original user label group generating module configured to classify the user label based on a K-Means aggregation algorithm, to obtain an original user label group;
  • a target user label group generating module configured to sort the original user label group according to the historical behavior information of the user, to obtain a target user label group
  • a user preference information obtaining module configured to acquire preference information of the user based on the target user tag group
  • the first service information information pushing module is configured to obtain a service tag corresponding to the preference information from a preset service tag library, and push the service information information corresponding to the service tag to the user.
  • an embodiment of the present application provides a terminal device, including a memory, a processor, and computer readable instructions stored in the memory and executable on the processor, where the processor executes the computer
  • the steps of the information pushing method are implemented when the command is read.
  • embodiments of the present application provide one or more non-volatile readable instructions, when the computer readable instructions are executed by one or more processors, causing the one or more processors to execute The steps of the information push method.
  • step S30 is a flowchart of an implementation of step S30 in the information pushing method provided in Embodiment 1 of the present application;
  • step S40 is a flowchart of an implementation of step S40 in the information pushing method provided in Embodiment 1 of the present application;
  • step S50 is a flowchart showing an implementation of step S50 in the information pushing method provided in Embodiment 1 of the present application;
  • FIG. 6 is a flowchart of an implementation of determining a user group and generating a group label, and pushing the service information corresponding to the group label to the user in the information pushing method provided in Embodiment 1 of the present application;
  • FIG. 7 is a schematic diagram of an information pushing apparatus provided in Embodiment 2 of the present application.
  • FIG. 8 is a schematic diagram of a terminal device according to Embodiment 4 of the present application.
  • FIG. 1 shows an implementation flow of the information pushing method provided in this embodiment. Details are as follows:
  • S10 Acquire historical behavior information of the user.
  • the server obtains log information of the historical behavior of the user from the background database, and obtains historical behavior information of the user by extracting the log.
  • the user history behavior refers to all the operation behaviors of the user after logging in to the website platform, and the operation behavior is recorded in the log information of the server back-end database.
  • Historical behavior information includes, but is not limited to, historical search records, historical click records, and historical browsing records.
  • Historical search records include, but are not limited to, user information, search time, and search keywords.
  • the user information includes basic information of the user, such as name, gender, age, etc.
  • the search time refers to the specific time when the retrieval operation is detected
  • the retrieval keyword refers to the keyword that is input and retrieved by the retrieval time.
  • the historical search record is: "(Zhang San, male, 23), 2018-01-29 20:46:50, washing machine", wherein “Zhang San, male, 23” is the user Information, “January 29, 2018 20:46:50” is the search time, "washing machine” is the search keyword.
  • the history click record includes but is not limited to: user information, click time and click identifier (Identification, ID), click time refers to the specific time when the click operation is detected, and the click ID of the hyperlink refers to the object of the click operation.
  • ID refers to the specific time when the click operation is detected
  • click ID of the hyperlink refers to the object of the click operation.
  • the ID further, the click history also records whether the product was clicked in the search results or clicked on the recommended results.
  • the history click record is: "(Zhang San, male, 23), 2018-01-29 20:51:50, 65936, S", wherein "65936" is the corresponding in the background database
  • the ID of the hyperlink of the page of the specific introduction of a domestic washing machine, "S” is the ID of the hyperlink obtained by the hyperlinked hyperlink.
  • Historical browsing records include, but are not limited to, user information, browsing time, and browsing data.
  • browsing is a browsing record generated by a user browsing product information, and a page viewed by one click records a plurality of browsing data, which is sampling data.
  • S20 Analyze and filter historical behavior information to obtain user keywords.
  • the user initial keyword is obtained by performing key information extraction analysis on the search keyword in the historical behavior information, the page information corresponding to the ID of the click hyperlink, and the browsed page information.
  • the page information corresponding to the ID of the click hyperlink refers to the page information corresponding to the ID of the object of the click operation in the background database.
  • the page corresponding to the hyperlink with the hyperlink ID "NZ_5263” is queried in the background database as "https://miaosha.xxxxxx.com/ #1892018", and then extract the product title of the page, product basic information, etc., get the initial user keyword: "exquisite luxury bright diamond embroidery can rival the XXX famous brand autumn and winter new Korean sweater.”
  • the interference vocabulary in the initial keyword of the user is culled to obtain a user keyword.
  • the implementation manner of culling the interference vocabulary in the initial keyword of the user is:
  • Each word segment is classified according to the part of speech of the participle. For example, according to part of speech, these word segments are divided into subjective vocabulary and objective vocabulary;
  • the extracted initial keyword of the user is “exquisite luxury bright diamond embroidery comparable to XXX famous brand autumn and winter new Korean knit sweater”, and when performing word segmentation processing, “exquisite luxury bright diamond embroidery can be The product titles of XXX's famous brand autumn and winter Korean knitwear are divided into “exquisite luxury”, “bright diamond embroidery”, “comparable”, “XXX famous brand”, “autumn winter”, “new”, “Korean version”, “ “Knitwear” has seven key words, while the words “exquisite luxury”, “bright diamond embroidery” and “comfortable beauty” are subjective vocabulary, which can be excluded, "XXX famous brand”, “autumn winter”, “new”, “Korean version” and “Knitwear” are words that reflect the characteristics of users' products.
  • the last five keywords are: “XXX Famous Brand”, “Autumn and Winter”, “New”, “Korean Edition” and “Knitting Shirt.”
  • S30 The user keyword is trained by using a word vector to determine a user tag.
  • language representation mainly refers to the formal or mathematical description of a language in order to represent a language in a computer and to allow computer readable instructions to be processed automatically.
  • the word vector referred to in the embodiment of the present application is a vector to represent a keyword.
  • all user keywords are trained by using a word vector to obtain a user tag that meets the preset requirement.
  • the basic word vector of each user keyword is constructed according to a preset corpus, and for each basic word vector, the spatial distance between the basic word vector and other basic word vectors is calculated, and the basic word is obtained.
  • the minimum spatial distance of the vector, and then the basic word vector of the minimum spatial distance that is less than or equal to the preset spatial distance threshold is used as the user label.
  • S40 classify user tags based on the K-Means aggregation algorithm to obtain an original user tag group.
  • the K-Means aggregation algorithm is used to aggregate user tags, and the user tags with high degree of aggregation are placed in the same category to obtain different classifications, which are the original user tag groups.
  • the K-means algorithm is a distance-based clustering algorithm, which uses distance as an evaluation index of similarity, that is, the closer the distance between two objects is, the greater the similarity is.
  • the algorithm considers clusters to be composed of objects that are close together, thus making compact and independent clusters the ultimate goal.
  • S50 Sort the original user label group according to the historical behavior information of the user, and obtain the target user label group.
  • the historical behavior information of the user includes the time when the historical behavior occurs, and the user labels corresponding to the historical behavior information are sorted according to the time sequence in which the historical behavior information occurs, and then the original user label group is sorted according to the sorting result. Sort to get the target user tag group.
  • S60 Acquire user preference information based on the target user tag group.
  • the target user tag group including the push type is extracted from the target user tag group according to the push type of the preset service information information, and the pre-predetermined pre-filter is selected therefrom.
  • the target user tag group is set, and the user preference of the corresponding push category is obtained according to the user keyword corresponding to each user tag in the selected target user tag group.
  • the preset service information information push type is no more than three types, that is, a maximum of three types of user interest preferences are obtained, and the first three sets of target user label groups are sequentially selected according to the order of the target user label group.
  • S70 Obtain a service tag corresponding to the user preference information from the preset service tag library, and push the service information information corresponding to the service tag to the user.
  • the service tag corresponding to the service tag is selected from the preset service tag library according to the preference information of the user, and the service information corresponding to the service tag is obtained, and the user preference of each push category obtained in step S60 is preferentially pushed. If the service information corresponding to the first category of user preferences is received, if the user closes the request to push the service consultation information or does not receive the feedback of the user within a preset time, the service corresponding to the user preference of the second category is pushed to the user. Consult the message until the preset push count is reached and the push ends.
  • the user history information is collected, and the historical behavior information of the user is analyzed and filtered to obtain a user keyword.
  • the user tag uses the K-Means aggregation algorithm to group the user tags to obtain the original user tag group, and then sorts the original user tag group to obtain the target user tag group, based on the target user tag group and the preset service tag library.
  • the business information information is used to push the user's preferred business information information to the user, and the user's historical behavior is analyzed according to the historical behavior of the user, and the user's interest preference is dynamically obtained in real time, and the different interest preferences of different users are pushed. Corresponding business information, which effectively improves the intelligence level of business information push, and thus improves the promotion efficiency of different business information.
  • the user keyword is trained in the manner of using the word vector mentioned in step S30 by a specific embodiment to determine the specific implementation method of the user label. Detailed instructions are given.
  • FIG. 2 shows a specific implementation process of step S30 provided by the embodiment of the present application, which is described in detail as follows:
  • S31 Construct a basic word vector for each user keyword based on a preset corpus.
  • the keywords in the user historical behavior information are mapped into a vector according to a preset corpus, and the vectors are linked together to form a word vector space, and each vector is equivalent to a point in the space.
  • a car sales company's product name contains two keywords, BMW and Mercedes. According to the default corpus, all possible categories of these two keywords are obtained: “car”, “luxury”, “animal”, “Action” and “Gourmet”. Therefore, a vector representation is introduced for these two keywords:
  • the computer may learn:
  • BMW ⁇ 0.5, 0.2, 0.2, 0.0, 0.1>
  • each dimension of the basic word vector represents a certain semantic and grammatically interpretable feature, so each dimension of the basic word vector can be referred to as a keyword feature.
  • a keyword word vector is constructed for each keyword of the user to obtain a basic word vector.
  • each user keyword corresponds to a unique basic word vector
  • each basic word vector corresponds to at least one user keyword
  • the words that cannot be accurately understood by the machine are converted into word vectors that are easily recognized and operated by the machine, which is beneficial to the accurate identification of user preferences.
  • S32 Calculate a spatial distance between the basic word vector and other basic word vectors for each basic word vector, and select a minimum value from the spatial distance as the minimum spatial distance of the basic word vector.
  • the spatial distance between the basic word vector and all other basic word vectors is calculated separately, and the minimum value of these spatial distances is found.
  • n is a positive integer greater than or equal to 2.
  • the basic word vector includes G 1 (0.9, 0.1), G 2 (0.5, 0.5) G 3 (0.8, 0.2), and for G 1 , G 1 is calculated according to formula (1).
  • the spatial distance of G 2 is 0.5659, and the spatial distance of G 1 to G 3 is 0.1414, and the minimum spatial distance of G 1 is 0.1414.
  • S33 The basic word vector of the minimum spatial distance that is less than or equal to the preset spatial distance threshold is used as the user label.
  • the minimum spatial distance of each basic word vector is calculated according to step S32, the minimum spatial distance is compared with a preset spatial distance threshold, and the basic word vector whose minimum spatial distance is less than or equal to the spatial distance threshold is used as the user. label.
  • the preset spatial distance threshold is 0.8
  • the basic word vector includes H 1 (0.9, 0.1, 0), H 2 (0.8, 0.1, 0.1), and H 3 ( 0 , 0.1, 0.9).
  • the minimum spatial distance of H 1 calculated by the formula (1) in step S32 is 0.4243
  • the minimum spatial distance of H 2 is 0.4243
  • the minimum spatial distance of H 3 is 1.1314
  • the minimum spatial distance of H 1 and H 2 is smaller than
  • the preset spatial distance threshold is 0.8, so H 1 and H 2 are used as user tags.
  • a basic word vector of each user keyword is constructed based on a preset corpus, and a spatial distance between the basic word vector and other basic word vectors is calculated for each basic word vector, and The minimum value is selected from the spatial distance as the minimum spatial distance of the basic word vector, and the basic word vector of the minimum spatial distance that is less than or equal to the preset spatial distance threshold is used as the user label, and the user keyword can be recognized by converting the user keyword into a machine.
  • the user label is classified according to the K-Means aggregation algorithm mentioned in step S40 by a specific embodiment, and the specific implementation method of the original user label group is obtained. Detailed description.
  • FIG. 3 shows a specific implementation process of step S40 provided by the embodiment of the present application, which is described in detail as follows:
  • S41 randomly select m user tags from the n user tags A 1 , A 2 , A 3 , . . . , A n as cluster centers, where n and m are positive integers, and m is less than or equal to n.
  • n is the total number of user tags of the user
  • m is the number of cluster centers preset according to needs
  • m user tags are randomly selected from the n user tags of the user, and the m user tags are used as original aggregation. Class center.
  • S42 Calculate a first distance between the user label and each current cluster center for each user label, and put the user label into a cluster where the cluster center corresponding to the minimum first distance is located, and obtain m Temporary clustering.
  • step S32 calculating a spatial distance between the user label and each cluster center, as the first distance, obtaining m first distances, and from the The minimum value is obtained as the first distance in the m first distances, and the cluster centers corresponding to the minimum first distance are placed in the same cluster. According to this method, m temporary clusters are obtained.
  • Cluster center 1 Cluster Center 2
  • Cluster Center 3 User tag 1 0.5 1.9 0.7 User tag 2 2.5 0.2 0.9 User tag 3
  • 0.1 0.8 User tag 4 1.6 0.1 0.7 User tag 5 1.8 0.9 0.2 User tag 6
  • 0.6 0.8 1.6 User tag 7 0.7 0.8 0.2 User tag 8 1.1 0.3 0.9
  • the minimum first distance of each user tag to the three cluster centers is 0.5, so the user tag is 1 into the cluster where the cluster center 1 is located, according to this method, the three temporary clusters are: temporary cluster 1 (user label 1, user label 6), temporary cluster 2 (user label 2, User tag 3, user tag 4, user tag 8) and temporary cluster 3 (user tag 5, user tag 7).
  • S43 Calculate, for each temporary cluster, an average of the temporary cluster, and a second distance between each user label and the mean in the temporary cluster, and select a user label corresponding to the smallest second distance as the temporary cluster.
  • the new clustering center gets updated m temporary clusters.
  • the mean of the temporary cluster is calculated by the formula (2):
  • k is the number of user tags in the temporary cluster
  • a i is the i-th user tag in the temporary cluster, i ⁇ [1, k].
  • step S32 the spatial distance between each user tag in the cluster center and the mean value of the temporary cluster, that is, the second distance, is calculated.
  • the user label corresponding to the minimum second distance is selected as the new cluster center of the temporary cluster, and the updated m temporary clusters are obtained.
  • is the standard deviation and ⁇ is the average of the temporary cluster where the user tag A i is located, i ⁇ [1, n].
  • step S45 If at least one standard deviation of the m candidate temporary clusters has a standard deviation greater than or equal to a preset standard deviation threshold, return to step S42.
  • step S44 by comparing each updated temporary clustering standard deviation calculated in step S44 with a preset standard deviation threshold, when there is a temporary aggregation in which the temporary clustering standard deviation is greater than or equal to a preset standard deviation threshold
  • the process returns to step S42, and the clustering is continued according to the processing of steps S42 to S44.
  • each updated temporary cluster when the standard deviation of each updated temporary cluster is less than a preset standard deviation threshold, it indicates that the updated temporary cluster has been able to satisfy the similarity requirement of the user label, and the m updated temporary Clustering is used as the original user tag group.
  • the clustering is continued according to the above method.
  • the clustering is ended until the standard deviation of all the updated temporary clusters is less than the standard deviation of the preset standard deviation threshold, and the current m temporary clusters are used as the original user label group.
  • the originally dispersed user tags can be clustered according to the similarity between the user tags, thereby realizing the classification of the user tags, thereby effectively improving the accuracy of the classification, thereby Users with the same preference can be clustered into the same category, so that when the service information information is pushed to the user according to the user label, the relevant business information can be accurately pushed according to the user's interest preference, and the intelligent level of the business information push is improved. And the efficiency of business information to promote business information.
  • the original group label group is sorted for each user group mentioned in step S50 by a specific embodiment, and the group corresponding to the user group is obtained.
  • the specific implementation method of the label group is described in detail.
  • FIG. 4 shows a specific implementation process of step S50 provided by the embodiment of the present application, which is described in detail as follows:
  • S51 Acquire a generation time of historical behavior information corresponding to the user label based on the historical behavior information.
  • the historical behavior information includes, but is not limited to, a history search record, a history click record, and a history browsing record.
  • the historical search record includes the search time
  • the historical click record includes the click time
  • the historical browsing record includes the browsing time. Therefore, each user historical behavior information corresponds to the generation time.
  • the generation time corresponding to the user label can be determined.
  • the user tag is ⁇ 0.6, 0.15, 0.25>
  • the corresponding user keyword is “washing machine”
  • the user history behavior information corresponding to the user keyword “washing machine” includes “history click record: ( Zhang San, male, 23), 2018-01-29 20:51:50, 65936, S", easy to understand, the user tag generation time is "2018-01-29 20:51:50”.
  • S52 Sort the user tags according to the generation time to obtain a sequence of user tags.
  • the user labels are sorted according to the sequence of the generation time, and the user label sequence is obtained.
  • the generation time corresponding to the user label A is “15:06:38 on January 29, 2018”
  • the generation time corresponding to the user label B is: “January 29, 2018, 15:23:54”
  • user label C The corresponding generation time is: “15:07:14 on January 26, 2018”
  • the sequence of user tags obtained according to the sequence of generation time is: "user tag C, user tag A, user tag B”.
  • S53 Sort the original user label group according to the user label sequence to obtain the target user label group.
  • the first user tag in each original user tag group is obtained according to the user tag sequence obtained in step S52, and the user tags ranked first in the original tag group are sorted to obtain the original user tag group.
  • the order of the original user tag group is sorted in this order to obtain the target user tag group.
  • original user label group A (user label 1, user label 2, user label 3), original user label group B (user label 4, user label).
  • original user tag group C user tag 6, user tag 7
  • the sequence of the user tag is "user tag 5, user tag 2, user tag 1, user tag 7, user tag 4, user tag 6,
  • the user tag 3 as shown in the sequence, the first user tag in the original user tag group A is "user tag 2", and the first user tag in the original user tag group B is "user tag 5".
  • the first user tag in the original user tag group C is "user tag 7".
  • the target user tag group sorted according to the order is: "target user tag group B, target user tag group A, target user tag group C".
  • the generation time of the historical behavior information corresponding to the user label is obtained according to the historical behavior information, and the user labels are sorted according to the generation time, and the user label sequence is obtained, and then the original user is obtained according to the user label sequence.
  • the tag groups are sorted to obtain the target user tag group.
  • the user's preferences are sorted according to the time sequence that the user recently pays attention to, and the user's recent preference information can be preferentially selected when pushing the business information, thereby improving the intelligence level of the business information push.
  • the user keyword is trained in the manner of using the word vector mentioned in step S30.
  • the user group can be further determined and a group tag is generated, and the group is pushed to the user.
  • the service information information corresponding to the label is as shown in FIG. 5, and the information pushing method further includes:
  • S81 Determine different user groups and their corresponding user tags according to a preset customer tag library, and obtain a group tag.
  • the group feature information of different user groups is included, and the user belongs to the user group corresponding to the group feature according to the group characteristics of the user, and then the user tag of the user is placed in the In the group tag, different user groups and group tags corresponding to each user group are obtained.
  • each user belongs to at least one user group according to preset group feature information.
  • the user group of the customer tag library includes: user group A (male, 18-25 years old), user Group B (male, 26-45 years old) and user group C (male, 46 years and older), wherein "male” is a gender feature and "18-25 years old” is an age feature.
  • the client The user base of the tag library includes: user group D (male, specialist) and user group E (male, undergraduate), wherein "specialist” is a feature of education level. Then, according to the basic information of the user, the user group to which the user belongs is determined, and the user tag of each user is placed in the group tag.
  • the K-Means aggregation algorithm is used to cluster the group labels, and the group labels with high degree of aggregation are put into the same category to obtain different classifications, which are the original group label groups.
  • S83 Sort the original group label group corresponding to the user group for each user group, and obtain a group label group corresponding to the user group.
  • the number of occurrences of the user labels in each original group label group is counted, and the original group label groups are sorted in order of total number of occurrences, and the user is obtained.
  • the group label group corresponding to the group makes the content with high overall attention of the group be pushed preferentially, which improves the efficiency of pushing the business consultation information.
  • the user group to which the user belongs is determined according to the basic information of the user and the group feature information in the customer tag library mentioned in step S81.
  • the target user group of the user may be one or more.
  • the basic information of the user is “male, 22 years old, undergraduate”, and there are two user groups including these characteristics: user group G (male, 18-25 years old) and user group. K (male, undergraduate), therefore, the target user group of the user is: user group G and user group K.
  • S85 Obtain a target group label group corresponding to the target user group according to each user group and its corresponding group label group.
  • step S83 a corresponding group label group is generated for each user group, and after determining the target user group of the user, the group label group corresponding to all the user groups included in the target user group is obtained.
  • the target group tag group for this user is obtained.
  • S86 Acquire group preference information based on the target group tag group.
  • the target group label group including the push type is extracted from the target group label group according to the preset push type of the service information information, and the preset preset is selected from the preset group label group.
  • the target group label group of the quantity, and then the user preference corresponding to the push category is obtained according to the user keyword corresponding to each group label in the selected target group label group.
  • S87 Obtain a service tag corresponding to the group preference information of the user from the preset service tag library, and push the service information information corresponding to the service tag to the user.
  • the user information corresponding to the group preference may be recommended to the users, specifically from the preset
  • the process of obtaining the service tag corresponding to the group preference information of the user in the service tag library, and implementing the service information information corresponding to the service tag to the user is the same as the implementation method in step S70. To avoid repetition, details are not described herein again.
  • the preference information of the push user or the service consultation information corresponding to the group preference information may be selected according to the preset push condition.
  • the preset push condition may be set according to the needs of the actual application, and is not limited herein.
  • a group label is obtained by determining different user groups and their corresponding user labels according to a preset customer label library, and for each user group, the group is based on a K-Means aggregation algorithm.
  • the label is classified, the original group label group corresponding to the user group is obtained, and the original group label group is sorted, and the group label group corresponding to the user group is obtained, and after receiving the user's request for visiting the website, according to the basic information of the user Determining the target user group of the user, thereby determining the target user group of the user and the corresponding target user group tag group, thereby obtaining the group preference of the user, and being able to flexibly select different business consulting information according to the user preference information or the group preference information. Pushing to users improves the intelligence level of business information push, and thus improves the promotion efficiency of different business information.
  • the original group label group corresponding to the user group is sorted for each user group mentioned in step S83 by a specific embodiment, and the user is obtained.
  • the specific implementation method of the group label group corresponding to the group is described in detail.
  • FIG. 6 shows a specific implementation process of step S83 provided by the embodiment of the present application, which is described in detail as follows:
  • S831 For each user group, obtain user labels A 1 , A 2 , A 3 , ... of each user in the original group label group B 1 , B 2 , . . . , B t corresponding to the user group.
  • the word frequency refers to the ratio of the number of occurrences of the keyword corresponding to the user tag to all the keywords corresponding to all user tags.
  • the sum of word frequencies of all user labels in the original group label group is counted as the original group label word frequency.
  • the group tag frequency of all the original group tag groups is sorted according to the value of the word frequency, and the original group tag group whose group tag word frequency is greater than the preset word frequency threshold is used as the group tag group.
  • the word frequency of the keyword corresponding to all the user labels of each user in the original group label group is obtained, and the group label word frequency of the original group label group is calculated, and According to the order of the group tag frequency, the original group tag group is sorted to obtain the target group tag group, so that the content of each group with high attention is preferentially pushed in front, which improves the efficiency of the business department to promote business information.
  • FIG. 7 shows an information push device corresponding to the information push method provided in the first embodiment, and for convenience of explanation, only the portions related to the embodiment of the present application are shown.
  • the information pushing apparatus includes: a historical behavior information acquiring module 10, a user keyword obtaining module 20, a user label generating module 30, an original user label group generating module 40, a target user label group generating module 50, and user preferences.
  • Each function module is described in detail as follows:
  • the historical behavior information obtaining module 10 is configured to acquire historical behavior information of the user
  • the user key information obtaining module 20 is configured to analyze and filter historical behavior information to obtain a user keyword
  • the user tag generating module 30 is configured to train the user keyword by using a word vector to determine a user tag.
  • the original user label group generating module 40 is configured to classify user labels based on the K-Means aggregation algorithm to obtain an original user label group.
  • the target user label group generating module 50 is configured to sort the original user label group according to the historical behavior information of the user, to obtain a target user label group;
  • the user preference information obtaining module 60 is configured to acquire preference information of the user based on the target user tag group;
  • the first service information information pushing module 70 is configured to obtain a service tag corresponding to the preference information from the preset service tag library, and push the service information information corresponding to the service tag to the user.
  • the user tag generating module 30 includes:
  • the basic word vector obtaining unit 31 is configured to construct a basic word vector of each user keyword based on the preset corpus;
  • the minimum spatial distance obtaining unit 32 is configured to calculate, for each basic word vector, a spatial distance between the basic word vector and other basic word vectors, and select a minimum value from the spatial distance as a minimum spatial distance of the basic word vector;
  • the user tag generating unit 33 is configured to use the basic word vector of the minimum spatial distance that is less than or equal to the preset spatial distance threshold as the user tag.
  • the original user tag group generation module 40 includes:
  • the clustering center acquiring unit 41 is configured to randomly select m user tags from the n user tags A 1 , A 2 , A 3 , . . . , A n as cluster centers, where n and m are positive integers. , m is less than or equal to n;
  • the temporary cluster obtaining unit 42 is configured to calculate, for each user label, a first distance between the user label and each current cluster center, and place the user label in a cluster center corresponding to the minimum first distance. In the clustering, m temporary clusters are obtained;
  • the temporary cluster updating unit 43 is configured to calculate, for each temporary cluster, an average of the temporary cluster, and a second distance between each user label and the average value in the temporary cluster, and select a minimum second distance corresponding to the second cluster
  • the user tag is used as a new clustering center of the temporary cluster, and the updated m temporary clusters are obtained;
  • the standard deviation calculation unit 44 is configured to calculate the standard deviation of each updated temporary cluster according to the following formula:
  • is the standard deviation and ⁇ is the average value of the updated temporary cluster where the user tag A i is located, i ⁇ [1, n];
  • the cyclic clustering unit 45 is configured to: if at least one standard deviation of the m candidate temporary clusters has a standard deviation greater than or equal to a preset standard deviation threshold, return to perform execution for each user label, and calculate the user label and The current first distance between each cluster center, the user label is placed in the cluster where the cluster center corresponding to the minimum first distance is located, and m temporary clustering steps are obtained;
  • the original user tag group generating unit 46 is configured to use the m updated temporary clusters as the original user tag group if the standard deviation of the m updated temporary clusters is less than the standard deviation threshold.
  • the target user tag group generation module 50 includes:
  • the tag generation time obtaining unit 51 is configured to acquire, according to the historical behavior information, a generation time of the historical behavior information corresponding to the user tag.
  • the user tag sequence generating unit 52 is configured to sort the user tags according to the generation time to obtain a user tag sequence.
  • the target user tag group generating unit 53 is configured to sort the original user tag group according to the user tag sequence to obtain a target user tag group.
  • the information pushing device further includes:
  • the group label obtaining unit 81 is configured to determine different user groups and corresponding user labels according to the preset customer label library, and obtain a group label.
  • the original group label group generating unit 82 is configured to classify the group label according to the K-Means aggregation algorithm for each user group, and obtain an original group label group corresponding to the user group;
  • the group label group generating unit 83 is configured to sort the original group label group for each user group, and obtain a group label group corresponding to the user group;
  • a target user group determining unit 84 configured to determine a target user group of the user
  • the target group tag group obtaining unit 85 is configured to obtain a target group tag group corresponding to the target user group according to each user group and its corresponding target group tag group;
  • a group preference information obtaining unit 86 configured to acquire group preference information based on the target group tag group
  • the second service information information pushing unit 87 is configured to obtain a service tag corresponding to the group preference information from the preset service tag library, and push the service information information corresponding to the service tag to the user.
  • group tag group generating unit 83 includes:
  • the user tag word frequency acquisition sub-unit 831 is configured to acquire the user tags A 1 , A 2 , A 3 , of each user in the original group tag group B 1 , B 2 , . . . , B t for each user group. .., A p user tag frequency in the preset time interval Where t and p are positive integers;
  • a group tag group generating sub-unit 833 for using a group tag frequency The size of the original group of tags is sorted to get the target group tag group.
  • the embodiment provides one or more non-volatile readable storage media having stored thereon computer readable storage medium having stored thereon computer readable instructions embodied by one or more processors
  • the information pushing method in Embodiment 1 is implemented at the time of execution, or the functions of the modules/units in the information pushing device in Embodiment 2 are implemented when the computer readable instructions are executed by one or more processors. To avoid repetition, we will not repeat them here.
  • the one or more non-volatile readable storage media storing computer readable instructions may comprise: any entity or device capable of carrying the computer readable instructions, a recording medium, a USB flash drive, a mobile hard disk , disk, optical disk, computer memory, read-only memory (ROM), random access memory (Random Access Memory, RAM), electrical carrier signals and telecommunications signals.
  • FIG. 8 is a schematic diagram of a terminal device according to an embodiment of the present application.
  • the terminal device 90 of this embodiment includes a processor 91, a memory 92, and a program of computer readable instructions 93, such as an information push method, stored in the memory 92 and operable on the processor 91.
  • the processor 91 executes the computer readable instructions 93
  • the steps of the information pushing method in the above-described first embodiment are implemented, such as steps S1 to S7 shown in FIG.
  • the processor 91 executes the computer readable instructions 93
  • the functions of the modules/units in the various apparatus embodiments described above are implemented, such as the functions of the modules 10 through 70 shown in FIG.
  • computer readable instructions 93 may be partitioned into one or more modules/units, one or more modules/units being stored in memory 92 and executed by processor 91 to complete the application.
  • the one or more modules/units can be an instruction segment of a series of computer readable instructions capable of performing a particular function, which is used to describe the execution of computer readable instructions 93 in the terminal device 90.
  • the computer readable instructions 93 may be divided into a historical behavior information acquisition module, a user keyword acquisition module, a user label generation module, an original user label group generation module, a target user label group generation module, a user preference information acquisition module, and business information. Information push module.
  • the specific functions of the modules are as shown in Embodiment 2. To avoid repetition, details are not described herein again.
  • the terminal device 90 can be a computing device such as a desktop computer, a notebook, a palmtop computer, and a cloud server.
  • Terminal device 90 may include, but is not limited to, processor 91, memory 92. It will be understood by those skilled in the art that FIG. 8 is merely an example of the terminal device 90 and does not constitute a limitation of the terminal device 90, and may include more or less components than those illustrated, or may combine certain components or different components.
  • the terminal device 90 may further include an input/output device, a network access device, a bus, and the like.
  • the processor 91 may be a central processing unit (CPU), or may be another general-purpose processor, a digital signal processor (DSP), or an application specific integrated circuit (ASIC). Field-Programmable Gate Array (FPGA) or other programmable logic device, discrete gate or transistor logic device, discrete hardware components, etc.
  • CPU central processing unit
  • DSP digital signal processor
  • ASIC application specific integrated circuit
  • FPGA Field-Programmable Gate Array
  • the memory 92 may be an internal storage unit of the terminal device 90, such as a hard disk or a memory of the terminal device 90.
  • the memory 92 may also be an external storage device of the terminal device 90, such as a plug-in hard disk equipped with the terminal device 90, a smart memory card (SMC), a Secure Digital (SD) card, and a flash memory card (Flash). Card) and so on.
  • the memory 92 may also include both an internal storage unit of the terminal device 90 and an external storage device.
  • Memory 92 is used to store computer readable instructions as well as other programs and data required by terminal device 90.
  • the memory 92 can also be used to temporarily store data that has been output or is about to be output.

Abstract

本申请公开了一种信息推送方法、装置、终端设备及存储介质。所述方法包括:获取用户的历史行为信息;对所述历史行为信息进行分析过滤,获取用户关键字;采用词向量的方式对所述用户关键字进行训练,确定用户标签;基于K-Means聚合算法对所述用户标签进行分类,得到原始用户标签组;根据所述用户的历史行为信息,对所述原始用户标签组进行排序,得到目标用户标签组;基于所述目标用户标签组,获取所述用户的偏好信息;从预设的业务标签库中获取所述偏好信息对应的业务标签,并向所述用户推送所述业务标签对应的业务资讯信息。本申请的技术方案有效提高了业务资讯推送的智能化水平和业务资讯的推广效率。

Description

一种信息推送方法、装置、终端设备及存储介质
本申请以2018年5月9日提交的申请号为201810435812.7,名称为“一种信息推送方法、装置、终端设备及存储介质”的中国发明专利申请为基础,并要求其优先权。
技术领域
本申请涉及计算机技术领域,尤其涉及一种信息推送方法、装置、终端设备及存储介质。
背景技术
随着互联网络科技的迅速发展,互联网络已经深入到千家万户,许多人的工作和生活已经离不开互联网了,上网已经成为不少人学习、工作和生活的一部分,许多人每天都会使用网络进行购物、社交、娱乐、办公和查找资料等。
众多的政府单位、媒体和企业的业务部门为了满足广大用户需求,往往会在自己的站点上发布符合不同用户需求的海量信息,但这也使得网络信息变得庞杂,使得用户每次都需要花费大量时间去寻找想要购买的商品或者频繁使用搜索工具搜索资料和感兴趣的话题,影响了用户的使用效率。
在现有技术中,一些政府单位、媒体和企业的业务部门根据自己业务上的特色,向用户推送了一些业务资讯,但现有推送业务资讯方式的智能化水平较低,不具有针对性,对不需要这些业务资讯的用户来说,这些业务资讯则变成了一种变相的广告,不利于用户的使用,也影响了业务部门推广业务资讯的效率。
发明内容
本申请实施例提供一种信息推送方法、装置、终端设备及存储介质,以解决现有技术中业务资讯推送的智能化水平较低和业务资讯推广效率不高的问题。
第一方面,本申请实施例提供一种信息推送方法,包括:
获取用户的历史行为信息;
对所述历史行为信息进行分析过滤,获取用户关键字;
采用词向量的方式对所述用户关键字进行训练,确定用户标签;
基于K-Means聚合算法对所述用户标签进行分类,得到原始用户标签组;
根据所述用户的历史行为信息,对所述原始用户标签组进行排序,得到目标用户标签组;
基于所述目标用户标签组,获取所述用户的偏好信息;
从预设的业务标签库中获取所述偏好信息对应的业务标签,并向所述用户推送所述业务标签对应的业务资讯信息。
第二方面,本申请实施例提供一种信息推送装置,包括:
历史行为信息获取模块,用于获取用户的历史行为信息;
用户关键字获取模块,用于对所述历史行为信息进行分析过滤,获取用户关键字;
用户标签生成模块,用于采用词向量的方式对所述用户关键字进行训练,确定用户标签;
原始用户标签组生成模块,用于基于K-Means聚合算法对所述用户标签进行分类,得 到原始用户标签组;
目标用户标签组生成模块,用于根据所述用户的历史行为信息,对所述原始用户标签组进行排序,得到目标用户标签组;
用户偏好信息获取模块,用于基于所述目标用户标签组,获取所述用户的偏好信息;
第一业务资讯信息推送模块,用于从预设的业务标签库中获取所述偏好信息对应的业务标签,并向所述用户推送所述业务标签对应的业务资讯信息。
第三方面,本申请实施例提供一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现所述信息推送方法的步骤。
第四方面,本申请实施例提供一个或多个非易失性可读指令,所述所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行所述信息推送方法的步骤。
本申请的一个或多个实施例的细节在下面的附图和描述中提出,本申请的其他特征和优点将从说明书、附图以及权利要求变得明显。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例1提供的信息推送方法的流程图;
图2是本申请实施例1提供的信息推送方法中步骤S30的实现流程图;
图3是本申请实施例1提供的信息推送方法中步骤S40的实现流程图;
图4是本申请实施例1提供的信息推送方法中步骤S50的实现流程图;
图5是本申请实施例1提供的信息推送方法中群体信息推送的实现流程图;
图6是本申请实施例1提供的信息推送方法中确定用户群体并生成群体标签,向用户推送群体标签对应的业务资讯信息的实现流程图;
图7是本申请实施例2提供的信息推送装置的示意图;
图8是本申请实施例4提供的终端设备的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
实施例1
请参阅图1,图1示出本实施例提供的信息推送方法的实现流程。详述如下:
S10:获取用户的历史行为信息。
具体地,服务器从后台数据库获取记录用户历史行为的日志信息,通过对日志的提取,得到用户的历史行为信息。
其中,用户历史行为是指用户在登录网站平台后的全部操作行为,该操作行为被记录在服务器后台数据库的日志信息中。
历史行为信息包括但不限于:历史搜索记录、历史点击记录、历史浏览记录。
历史搜索记录包括但不限于:用户信息、搜索时间和检索关键词。用户信息包括用户的基本信息,如姓名、性别、年龄等,搜索时间是指检测到检索操作的具体时间,检索关键词是指检索时间输入并进行查询的关键词。
例如,在一具体实施方式中,历史搜索记录为:“(张三,男,23),2018-01-29 20:46:50,洗衣机”,其中,“张三,男,23”为用户信息,“2018年1月29日20:46:50”为搜索时间,“洗衣机”为搜索关键字。
历史点击记录包括但不限于:用户信息、点击时间和点击超链接的身份识别符(Identification,ID),点击时间是指检测到点击操作的具体时间,点击超链接的ID是指点击操作的对象的ID,进一步地,点击历史记录还记录了该产品是在搜索结果中点击的还是推荐结果中点击的。
例如,在一具体实施方式中,历史点击记录为:“(张三,男,23),2018-01-29 20:51:50,65936,S”,其中,“65936”为后台数据库中对应的一国产的洗衣机的具体介绍的页面的超链接的ID,“S”为该所点击的超链接的ID为根据搜索的方式得到的超链接的ID。
历史浏览记录包括但不限于:用户信息、浏览时间和浏览数据,其中,浏览是用户在浏览产品信息的产生的浏览记录,一次点击查看的页面会记录多条浏览数据,该数据是采样数据。
S20:对历史行为信息进行分析过滤,获取用户关键字。
具体地,通过对历史行为信息中的搜索关键字、点击超链接的ID所对应的页面信息和浏览的页面信息进行关键信息提取分析,获取用户初始关键字。
其中,点击超链接的ID所对应的页面信息是指点击操作的对象的ID在后台数据库中对应的页面信息。
例如,在用户点击超链接ID为“NZ_5263”的超链接后,通过在后台数据库中查询获知超链接ID为“NZ_5263”的超链接所对应的页面为“https://miaosha.xxxxxx.com/#1892018”,进而提取该页面的产品标题,产品基本信息等,得到初始用户关键字:“精美奢华亮钻刺绣可媲美XXX知名品牌秋冬新款韩版针织衫”。
进一步地,对用户初始关键字中的干扰词汇进行剔除,得到用户关键字。
具体地,对用户初始关键字中的干扰词汇进行剔除的实现方式为:
根据预设字典对初始用户关键字进行分词处理,得到初始用户关键字的多个分词;
对各个分词按照该分词的词性进行词语分类,例如,按照词性将这些分词分为主观词汇和客观词汇;
获取符合预设词性条件的分词作为用户关键字。
例如,在一具体实施方式中,提取到的用户初始关键字为“精美奢华亮钻刺绣可媲美XXX知名品牌秋冬新款韩版针织衫”,在进行分词处理时,可将“精美奢华亮钻刺绣可媲美XXX知名品牌秋冬新款韩版针织衫”的产品标题分割为“精美奢华”、“亮钻刺绣”、“可媲美”、“XXX知名品牌”、“秋冬”、“新款”、“韩版”、“针织衫”七个关键词汇,而“精美奢华”、“亮钻刺绣”、“可媲美”三个词均为主观词汇,可予剔除,“XXX知名品牌”、“秋冬”、“新款”、“韩版”、和“针织衫”为能反应用户需求的产品特征的词汇,则最后得到的五个关键词为:“XXX知名品牌”、“秋冬”、“新款”、“韩版”和“针织衫”。
S30:采用词向量的方式对用户关键字进行训练,确定用户标签。
在人工智能中,语言表示主要指语言的形式化或数学的描述,以便在计算机中表示语言,并能让计算机可读指令自动处理。本申请实施例中所指的词向量就是用向量的形式来表示一个关键词。
具体地,通过使用词向量的方式对所有用户关键字进行训练,得到符合预设要求的用户标签。
在一具体实施方式中,根据预设语料库,构建每个用户关键字的基础词向量,针对每个基础词向量,计算该基础词向量与其他基础词向量之间的空间距离,获取该基础词向量的最小空间距离,进而将最小空间距离中小于或等于预设空间距离阈值的基础词向量作为用户标签。使得在生成用户标签的时候,过滤掉用户很少关注的用户关键字,进而可以更 加准确地确定用户偏好。
S40:基于K-Means聚合算法对用户标签进行分类,得到原始用户标签组。
具体地,使用K-Means聚合算法对用户标签进行聚合,将聚合度高的用户标签放入同一个分类,得到不同的分类,这些分类即为原始用户标签组。
K-means算法是基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。
S50:根据用户的历史行为信息,对原始用户标签组进行排序,得到目标用户标签组。
具体地,由步骤S1可知,用户的历史行为信息包含该历史行为发生的时间,按照历史行为信息发生的时间顺序,对历史行为信息对应的用户标签进行排序,进而根据排序结果对原始用户标签组进行排序,得到目标用户标签组。
S60:基于目标用户标签组,获取用户的偏好信息。
具体地,根据步骤S50生成的目标用户标签组,按照预设的业务资讯信息的推送种类,从目标用户标签组中提取包含该推送种类的目标用户标签组,并从中筛选出排序在前的预设数量的目标用户标签组,进而根据筛选出的目标用户标签组中每个用户标签对应的用户关键字,得到相对应的推送类别的用户偏好。
例如,在一具体实施方式中,预设的业务资讯信息推送种类为不超过三类,即最多获取三类用户兴趣偏好,按照目标用户标签组的排序,按顺序选取前三组目标用户标签组对应的三组用户关键字,并根据该三组用户关键字得到当前用户的偏好信息。
S70:从预设的业务标签库中获取用户的偏好信息对应的业务标签,并向该用户推送该业务标签对应的业务资讯信息。
具体地,根据用户的偏好信息,从预设的业务标签库中选取与之对应的业务标签,进而获取业务标签对应的业务资讯信息,按照步骤S60得到的每种推送类别的用户偏好,优先推送第一类别的用户偏好对应的业务资讯信息,若接收到用户关闭推送该业务咨询信息的请求或者在预设时间内没有接收到用户的反馈,则向用户推送第二类别的用户偏好对应的业务咨询信息,直到达到预设推送次数时结束推送。
在图1对应的实施例中,通过收集用户历史行为信息,并对该用户历史行为信息进行分析过滤,得到用户关键字,通过对用户关键字进行训练,剔除掉含义比较模糊的关键字,得到用户标签,使用K-Means聚合算法对用户标签进行分组,得到原始用户标签组,再对该原始用户标签组进行排序,得到目标用户标签组,基于目标用户标签组和预设的业务标签库中的业务资讯信息,向用户推送用户偏好的业务资讯信息,实现了根据对用户的历史行为进行分析,并利用机器学习的方法,实时动态获取用户的兴趣偏好,针对不同用户的不同兴趣偏好,推送相应的业务资讯,从而有效提高了业务资讯推送的智能化水平,进而提高了不同业务资讯的推广效率。
接下来,在图1对应的实施例的基础之上,下面通过一个具体的实施例来对步骤S30中所提及的采用词向量的方式对用户关键字进行训练,确定用户标签的具体实现方法进行详细说明。
请参阅图2,图2示出了本申请实施例提供的步骤S30的具体实现流程,详述如下:
S31:基于预设语料库,构建每个用户关键字的基础词向量。
具体地,将用户历史行为信息中的关键字按照预设的语料库映射到一个向量中,将这些向量联系在一起,形成一个词向量空间,每个向量相当于是这个空间中的一个点。
例如,某汽车销售公司产品名称里面有宝马、奔驰这两个关键字,根据预设的语料库,获取了这两个关键字的所有可能分类:“汽车”、“奢侈品”、“动物”、“动作”和“美食”。因此,对这两个关键字引入一种向量表示:
<汽车,奢侈品,动物,动作,美食>
根据统计学习的方法计算这两个关键字属于每个分类的概率,计算机学到的可能是:
宝马=<0.5,0.2,0.2,0.0,0.1>
奔驰=<0.7,0.2,0.0,0.1,0.0>
可以理解地,基础词向量的每一维的值代表一个具有一定的语义和语法上能够解释的特征,故可以将基础词向量的每一维称为一个关键字特征。
进一步地,为用户的每个关键字均构建关键字词向量,得到基础词向量。
需要说明的是,每个用户关键字对应唯一的基础词向量,每个基础词向量对应至少一个用户关键字。
通过基于预设语料库,构建每个用户关键字的基础词向量,使得将机器无法准确理解的文字转换成了机器容易识别并进行运算的词向量,有利于对用户偏好的准确识别
S32:针对每个基础词向量,计算该基础词向量与其他基础词向量之间的空间距离,并从空间距离中选取最小值作为该基础词向量的最小空间距离。
具体地,针对每个基础词向量,使用空间距离的计算公式,分别计算该基础词向量与其他所有基础词向量之间的空间距离,并找出这些空间距离的最小值。
按照公式(1)计算基础词向量A(a 1,a 2,...,a n)和基础词向量B(b 1,b 2,...,b n)之间的空间距离L:
Figure PCTCN2018122729-appb-000001
其中,n为大于或等于2的正整数。
例如,在一具体实施方式中,基础词向量包含G 1(0.9,0.1)、G 2(0.5,0.5)G 3(0.8,0.2),针对G 1,按照公式(1)分别计算G 1到G 2的空间距离为0.5659,以及G 1到G 3的空间距离为0.1414,则G 1的最小空间距离为0.1414。
S33:将最小空间距离中小于或等于预设空间距离阈值的基础词向量,作为用户标签。
具体地,根据步骤S32计算出每个基础词向量的最小空间距离之后,对这些最小空间距离与预设的空间距离阈值进行比较,将最小空间距离小于或等于空间距离阈值的基础词向量作为用户标签。
通过对不符合空间距离阈值要求的基础词向量进行过滤,避免了将用户关注度低的内容也放入用户标签,从而可以更准确的确定用户偏好。
例如,在一具体实施方式中,预设的空间距离阈值为0.8,基础词向量包括H 1(0.9,0.1,0)、H 2(0.8,0.1,0.1)和H 3(0,0.1,0.9),通过步骤S32中的公式(1)计算得到H 1的最小空间距离为0.4243,H 2的最小空间距离为0.4243,H 3的最小空间距离为1.1314,H 1和H 2的最小空间距离小于预设的空间距离阈值0.8,因此,将H 1和H 2作为用户标签。
在图2对应的实施例中,基于预设语料库,构建每个用户关键字的基础词向量,并针对每个基础词向量,计算该基础词向量与其他基础词向量之间的空间距离,并从空间距离中选取最小值作为该基础词向量的最小空间距离,将最小空间距离中小于或等于预设空间距离阈值的基础词向量,作为用户标签,通过将用户关键字转换成机器能够识别运算的词向量,并按照预设条件过滤掉模糊关键字或者其他词向量相似度较低的词向量,实现对用户偏好的准确识别,有效提高了业务资讯推送的智能化水平。
在图1对应的实施例的基础之上,下面通过一个具体的实施例来对步骤S40中所提及的基于K-Means聚合算法对用户标签进行分类,得到原始用户标签组的具体实现方法进行详细说明。
请参阅图3,图3示出了本申请实施例提供的步骤S40的具体实现流程,详述如下:
S41:从n个用户标签A 1,A 2,A 3,...,A n中随机选取m个用户标签作为聚类中心,其中, n和m均为正整数,m小于或等于n。
具体地,n为用户的用户标签总数,m为根据需要预设的聚类中心个数,从该用户的n个用户标签中随机选取m个用户标签,把这m个用户标签作为原始的聚类中心。
S42:针对每个用户标签,计算该用户标签与当前每个聚类中心之间的第一距离,将该用户标签放入最小第一距离对应的聚类中心所在的聚类中,得到m个临时聚类。
具体地,针对每个用户标签,采用步骤S32中的公式(1),计算该用户标签与每个聚类中心之间的空间距离,作为第一距离,得到m个第一距离,并从该m个第一距离中获取最小值作为做小第一距离,将该用户标签与最小第一距离对应的聚类中心放入同一个聚类中,依照这个方法,得到m个临时聚类。
例如,在一具体实施方式中,存在8个用户标签,预设的聚类中心个数为3个,在随机生成三个聚类中心之后,按照步骤S32中的公式(1)计算得到每个用户标签分别到三个聚类中心的第一距离如表一所示:
表一
  聚类中心1 聚类中心2 聚类中心3
用户标签1 0.5 1.9 0.7
用户标签2 2.5 0.2 0.9
用户标签3 1.3 0.1 0.8
用户标签4 1.6 0.1 0.7
用户标签5 1.8 0.9 0.2
用户标签6 0.6 0.8 1.6
用户标签7 0.7 0.8 0.2
用户标签8 1.1 0.3 0.9
根据计算出的这些第一距离,很容易得到各用户标签到三个聚类中心的最小第一距离,例如,用户标签1到三个聚类中心的最小第一距离为0.5,因此将用户标签1放入聚类中心1所在的聚类中,按照这个方法,得到的三个临时聚类分别为:临时聚类1(用户标签1,用户标签6)、临时聚类2(用户标签2,用户标签3,用户标签4,用户标签8)和临时聚类3(用户标签5,用户标签7)。
S43:针对每个临时聚类,计算该临时聚类的均值,以及该临时聚类中每个用户标签和均值之间的第二距离,选取最小第二距离对应的用户标签作为该临时聚类的新的聚类中心,得到更新后的m个临时聚类。
具体地,通过公式(2)计算临时聚类的均值:
Figure PCTCN2018122729-appb-000002
其中,
Figure PCTCN2018122729-appb-000003
为临时聚类的均值,k为该临时聚类中用户标签的个数,a i为该临时聚类中第i个用户标签,i∈[1,k]。
使用步骤S32中的公式(1),计算该聚类中心中每个用户标签和该临时聚类的均值之间的空间距离,即第二距离。选取最小第二距离对应的用户标签作为该临时聚类的新的聚类中心,得到更新后的m个临时聚类。
需要说明的是,根据临时聚类的新的聚类中心,得到更新后的m个临时聚类的具体实现过程和步骤S42的处理过程相同,为避免重复,此处不再赘述。
S44:按照公式(3)计算每个更新后的临时聚类的标准差:
Figure PCTCN2018122729-appb-000004
其中,σ为标准差,μ为用户标签A i所在的临时聚类的平均值,i∈[1,n]。
S45:若m个更新后的临时聚类的标准差中至少存在一个标准差大于或者等于预设的标准差阈值,则返回执行步骤S42。
具体地,通过对步骤S44中计算出的每个更新后的临时聚类标准差与预设的标准差阈值进行对比,当存在临时聚类标准差大于或者等于预设的标准差阈值的临时聚类时,说明该更新后的临时聚类尚未满足用户标签的相似度要求,则返回步骤S42,按照步骤S42至步骤S44的处理过程继续进行聚类。
S46:若m个更新后的临时聚类的标准差均小于预设的标准差阈值,则将该m个更新后的临时聚类作为原始用户标签组。
具体地,当每个更新后的临时聚类的标准差都小于预设的标准差阈值时,说明该更新后的临时聚类已经能够满足用户标签的相似度要求,将m个更新后的临时聚类作为原始用户标签组。
在图3对应的实施例中,通过从n个用户标签中随机选取m个用户标签作为聚类中心,并按照公式(1)计算每个用户标签与这m个聚类中心的距离,找出该用户标签距离m个聚类中心的第一最小距离,进而将该用户标签和第一最小距离对用的聚类中心放入同一个聚类,以此方法,得到m个临时聚类,然后针对每个临时聚类,按照公式(2)计算该临时聚类的平均值,并将与平均值距离最小的用户标签作为新的聚类中心,得到更新后的临时聚类,按照公式(3)计算该更新后的临时聚类的标准差,如果存在更新后的临时聚类的标准差大于或等于预设标准差阈值,则根据新的聚类中心,重新按上述方法继续进行聚类,直到所有更新后的临时聚类的标准差均小于预设标准差阈值的标准差时结束聚类,并将当前的m个临时聚类作为原始用户标签组。通过使用K-Means聚合算法对用户标签进行分类,使得原本分散的用户标签,能够根据用户标签之间的相似度进行聚类,实现对用户标签的分类,有效提高了分类的准确度,从而将具有相同偏好的用户能够被聚类到同一个分类中,从而在按照用户标签向用户推送业务资讯信息时,能够针对用户的兴趣偏好准确推送相关的业务资讯,提高了业务资讯推送的智能化水平和业务部门推广业务资讯的效率。
在图1对应的实施例的基础之上,下面通过一个具体的实施例来对步骤S50中所提及的针对每个用户群体,对该原始群体标签组进行排序,得到该用户群体对应的群体标签组的具体实现方法进行详细说明。
请参阅图4,图4示出了本申请实施例提供的步骤S50的具体实现流程,详述如下:
S51:基于历史行为信息,获取用户标签对应的历史行为信息的生成时间。
具体地,基于步骤S10中的具体说明,历史行为信息包括但不限于:历史搜索记录、历史点击记录和历史浏览记录。其中历史搜索记录包含搜索时间,历史点击记录包含点击时间,历史浏览记录包含浏览时间,因此,每条用户历史行为信息均对应有生成时间。
进一步地,根据用户标签对应的历史行为信息,即可确定该用户标签对应的生成时间。
例如,在一具体实施方式中,用户标签为<0.6,0.15,0.25>,其对应的用户关键字为“洗衣机”,用户关键字“洗衣机”对应的用户历史行为信息包括“历史点击记录:(张三,男,23),2018-01-29 20:51:50,65936,S”,容易理解地,该用户标签生成时间为“2018-01-29 20:51:50”。
S52:按照生成时间对用户标签进行排序,得到用户标签序列。
具体地,在获取到每个用户标签的生成时间后,根据生成时间的先后顺序,对用户标签进行排序,得到用户标签序列。
例如,用户标签A对应的生成时间为“2018年1月29日15:06:38”,用户标签B对应的生成时间为:“2018年1月29日15:23:54”,用户标签C对应的生成时间为:“2018年1月26日15:07:14”,按照生成时间的先后顺序后得到的用户标签序列为:“用户标签C,用户标签A,用户标签B”。
S53:根据用户标签序列,对原始用户标签组进行排序,得到目标用户标签组。
具体地,根据步骤S52中得到的用户标签序列,获取每个原始用户标签组中排序第一的用户标签,将这些在所在原始标签组中排序第一的用户标签进行排序,得到原始用户标签组的顺序,将原始用户标签组按照该顺序进行排序,得到目标用户标签组。
例如,在一具体实施方式中,存在3组原始用户标签组,分别为原始用户标签组A(用户标签1,用户标签2,用户标签3)、原始用户标签组B(用户标签4,用户标签5)和原始用户标签组C(用户标签6,用户标签7),其中,用户标签的序列为“用户标签5,用户标签2,用户标签1,用户标签7,用户标签4,用户标签6,用户标签3”,由该序列可知,原始用户标签组A中的排序第一的用户标签为“用户标签2”,原始用户标签组B中的排序第一的用户标签为“用户标签5”,原始用户标签组C中的排序第一的用户标签为“用户标签7”,经过对“用户标签2”、“用户标签5”和“用户标签7”进行排序,得到原始用户标签组的排序顺序,根据该顺序排序得到的目标用户标签组为:“目标用户标签组B、目标用户标签组A、目标用户标签组C”。
在图4对应的实施例中,根据历史行为信息,获取用户标签对应的历史行为信息的生成时间,并按照生成时间对用户标签进行排序,得到用户标签序列,进而根据用户标签序列,对原始用户标签组进行排序,得到目标用户标签组。使得对提取出的用户的偏好按照用户最近关注的时间顺序来进行先后排序,在进行业务资讯的推送时能够优先推选用户最近关注的偏好资讯,提高了业务资讯推送的智能化水平。
在图1对应的实施例的基础之上,在步骤S30提及的采用词向量的方式对用户关键字进行训练,确定用户标签之后,还可以进一步确定用户群体并生成群体标签,向用户推送群体标签对应的业务资讯信息,如图5所示,该信息推送方法还包括:
S81:根据预设的客户标签库,确定不同的用户群体及其对应的用户标签,得到群体标签。
具体地,在预设的客户标签库中,包含不同用户群体的群体特征信息,根据用户的群体特征,将该用户归属于该群体特征对应的用户群体,进而将该用户的用户标签放入该群体标签中,得到不同用户群体以及每个用户群体对应的群体标签。
需要说明的是,按照预设的群体特征信息,每个用户属于至少一个用户群体。
在预设的客户标签库中可以根据需要设置不同的用户群体的分类方式,例如,在一具体实施方式中,客户标签库的用户群体包括:用户群体A(男,18-25岁)、用户群体B(男,26-45岁)和用户群体C(男,46岁以上),其中,“男”为性别特征,“18-25岁”为年龄特征,在另一具体实施方式中,客户标签库的用户群体包括:用户群体D(男,专科)和用户群体E(男,本科),其中,“专科”为教育程度特征。进而根据用户的基本信息,确定用户所属用户群体,将每个用户的用户标签放入群体标签之中。
S82:针对每个用户群体,基于K-Means聚合算法对群体标签进行分类,得到该用户群体对应的原始群体标签组。
具体地,针对每个用户群体,使用K-Means聚合算法对群体标签进行聚类,将聚合度高的群体标签放入同一个分类,得到不同的分类,这些分类即为原始群体标签组。
需要说明的是,使用K-Means聚合算法对群体标签进行分类的实现过程与步骤S41至步骤S46对用户标签进行分类的方法相同,为避免重复,此处不再赘述。
S83:针对每个用户群体,对该用户群体对应的原始群体标签组进行排序,得到该用户群体对应的群体标签组。
具体地,针对每个用户群体对应的原始群体标签组,统计每个原始群体标签组中用户标签出现的次数,按出现总次数由大到小的顺序对原始群体标签组进行排序,得到该用户群体对应的群体标签组,使得该群体总体关注度高的内容会优先进行推送,提高了业务咨询信息推送的效率。
S84:确定用户的目标用户群体。
具体地,在接收到用户访问站点的请求后,根据用户的基本信息与步骤S81中提及的客户标签库中的群体特征信息,确定该用户所属的用户群体,即该用户的目标用户群体。
可以理解地,用户的目标用户群体可以为一个也可以为多个。
例如,在一具体实施方式中,用户的基本信息为“男,22岁,本科”,包含这些特征的有两个用户群体,分别为:用户群体G(男,18-25岁)和用户群体K(男,本科),因此,该用户的目标用户群体为:用户群体G和用户群体K。
S85:根据每个用户群体及其对应的群体标签组,获取该目标用户群体对应的目标群体标签组。
具体地,在步骤S83中,针对每个用户群体均生成了其对应的群体标签组,在确定了用户的目标用户群体之后,获取目标用户群体中包含的所有用户群体所对应的群体标签组,作为该用户的目标群体标签组。
S86:基于目标群体标签组,获取群体偏好信息。
具体地,根据步骤S85得到的目标群体标签组,按照预设的业务资讯信息的推送种类,从目标群体标签组中提取包含该推送种类的目标群体标签组,并从中选择排序在前的预设数量的目标群体标签组,进而根据筛选出的目标群体标签组中每个群体标签对应的用户关键字,得到相对应的推送类别的用户偏好。
S87:从预设的业务标签库中获取用户的群体偏好信息对应的业务标签,并向该用户推送该业务标签对应的业务资讯信息。
具体地,针对历史行为信息比较少的新用户,或者在步骤S70中收到关闭推送该业务咨询信息的请求的老用户,可以向这些用户推荐群体偏好对应的业务资讯信息,具体从预设的业务标签库中获取用户的群体偏好信息对应的业务标签,并向该用户推送该业务标签对应的业务资讯信息的实现过程与步骤S70中的实现方法相同,为避免重复,此处不再赘述。
可以理解地,也可以根据预设的推送条件来选择推送用户的偏好信息或者群体偏好信息对应的业务咨询信息,该预设的推送条件可以根据实际应用的需要进行设置,此处不做限制。
在图5对应的实施例中,通过根据预设的客户标签库,确定不同的用户群体及其对应的用户标签,得到群体标签,并针对每个用户群体,基于K-Means聚合算法对该群体标签进行分类,得到该用户群体对应的原始群体标签组,并对该原始群体标签组进行排序,得到该用户群体对应的群体标签组,在接收到用户的访问站点请求后,根据用户的基本信息确定用户的目标用户群体,进而确定用户的目标用户群体和对应的目标用户群体标签组,从而获取该用户的群体偏好,并能够根据用户的偏好信息或者群体偏好信息灵活选择不同的业务咨询信息,向用户进行推送,提高了业务资讯推送的智能化水平,进而提高了不同业务资讯的推广效率。
在图5对应的实施例的基础之上,下面通过一个具体的实施例来对步骤S83中所提及的针对每个用户群体,对该用户群体对应的原始群体标签组进行排序,得到该用户群体对应的群体标签组具体实现方法进行详细说明。
请参阅图6,图6示出了本申请实施例提供的步骤S83的具体实现流程,详述如下:
S831:针对每个用户群体,获取该用户群体对应的原始群体标签组B 1,B 2,...,B t中每个用户的用户标签A 1,A 2,A 3,...,A p在预设时间间隔内的用户标签词频
Figure PCTCN2018122729-appb-000005
其中,t和p为正整数。
具体地,针对每个用户群体,获取该用户群体对应的原始群体标签组中每个用户的所有用户标签,根据需要预设时间间隔,并对该预设时间间隔内的每个用户的所有用户标签进行词频的计算。
其中,词频是指该用户标签对应的关键字出现的次数占所有用户标签对应的所有关键字的比例。
S832:将原始群体标签组B j中的每个用户标签的词频相加,得到群体标签组B j的群体标签词频
Figure PCTCN2018122729-appb-000006
其中,j∈[1,t]。
具体地,针对每个原始群体标签组,统计该原始群体标签组里面所有用户标签的词频之和,作为该原始群体标签词频。
S833:根据群体标签词频
Figure PCTCN2018122729-appb-000007
的大小对原始群体标签组进行排序,得到群体标签组。
具体地,将所有原始群体标签组的群体标签词频按照词频的值的大小进行排序,将群体标签词频的值大于预设的词频阈值的原始群体标签组作为群体标签组。
在图6对应的实施例中,针对每个用户群体,获取该原始群体标签组中每个用户的所有用户标签所对应的关键字的词频,计算出该原始群体标签组的群体标签词频,并按照群体标签词频的大小顺序,对原始群体标签组进行排序,得到目标群体标签组,使得每个群体的用户关注度高的内容被排在前面优先推送,提高了业务部门推广业务资讯的效率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
实施例2
对应于实施例1中的信息推送方法,图7示出了与实施例1提供的信息推送方法一一对应的信息推送装置,为了便于说明,仅示出了与本申请实施例相关的部分。
如图7所示,该信息推送装置包括:历史行为信息获取模块10、用户关键字获取模块20、用户标签生成模块30、原始用户标签组生成模块40、目标用户标签组生成模块50、用户偏好信息获取模块60和业务资讯信息推送模块70。各功能模块详细说明如下:
历史行为信息获取模块10,用于获取用户的历史行为信息;
用户关键信息获取模块20,用于对历史行为信息进行分析过滤,获取用户关键字;
用户标签生成模块30,用于采用词向量的方式对用户关键字进行训练,确定用户标签;
原始用户标签组生成模块40,用于基于K-Means聚合算法对用户标签进行分类,得到原始用户标签组;
目标用户标签组生成模块50,用于根据用户的历史行为信息,对原始用户标签组进行排序,得到目标用户标签组;
用户偏好信息获取模块60,用于基于目标用户标签组,获取用户的偏好信息;
第一业务资讯信息推送模块70,用于从预设的业务标签库中获取偏好信息对应的业务标签,并向用户推送业务标签对应的业务资讯信息。
进一步地,用户标签生成模块30包括:
基础词向量获取单元31,用于基于预设语料库,构建每个用户关键字的基础词向量;
最小空间距离获取单元32,用于针对每个基础词向量,计算该基础词向量与其他基础 词向量之间的空间距离,并从空间距离中选取最小值作为该基础词向量的最小空间距离;
用户标签生成单元33,用于将最小空间距离中小于或等于预设空间距离阈值的基础词向量,作为用户标签。
进一步地,原始用户标签组生成模块40包括:
聚类中心获取单元41,用于从n个用户标签A 1,A 2,A 3,...,A n中随机选取m个用户标签作为聚类中心,其中,n和m均为正整数,m小于或等于n;
临时聚类获取单元42,用于针对每个用户标签,计算该用户标签与当前每个聚类中心之间的第一距离,将该用户标签放入最小第一距离对应的聚类中心所在的聚类中,得到m个临时聚类;
临时聚类更新单元43,用于针对每个临时聚类,计算该临时聚类的均值,以及该临时聚类中每个用户标签和均值之间的第二距离,选取最小第二距离对应的用户标签作为该临时聚类的新的聚类中心,得到更新后的m个临时聚类;
标准差计算单元44,用于按照如下公式计算每个更新后的临时聚类的标准差:
Figure PCTCN2018122729-appb-000008
其中,σ为标准差,μ为用户标签A i所在的更新后的临时聚类的平均值,i∈[1,n];
循环聚类单元45,用于若m个更新后的临时聚类的标准差中至少存在一个标准差大于或者等于预设的标准差阈值,则返回执行针对每个用户标签,计算该用户标签与当前每个聚类中心之间的第一距离,将该用户标签放入最小第一距离对应的聚类中心所在的聚类中,得到m个临时聚类的步骤;
原始用户标签组生成单元46,用于若m个更新后的临时聚类的标准差均小于标准差阈值,则将该m个更新后的临时聚类作为原始用户标签组。
进一步地,目标用户标签组生成模块50包括:
标签生成时间获取单元51,用于基于历史行为信息,获取用户标签对应的历史行为信息的生成时间;
用户标签序列生成单元52,用于按照生成时间对用户标签进行排序,得到用户标签序列;
目标用户标签组生成单元53,用于根据用户标签序列,对原始用户标签组进行排序,得到目标用户标签组。
进一步地,该信息推送装置还包括:
群体标签获取单元81,用于根据预设的客户标签库,确定不同的用户群体及其对应的用户标签,得到群体标签;
原始群体标签组生成单元82,用于针对每个用户群体,基于K-Means聚合算法对该群体标签进行分类,得到用户群体对应的原始群体标签组;
群体标签组生成单元83,用于针对每个用户群体,对原始群体标签组进行排序,得到用户群体对应的群体标签组;
目标用户群体确定单元84,用于确定用户的目标用户群体;
目标群体标签组获取单元85,用于根据每个用户群体及其对应的目标群体标签组,获取目标用户群体对应的目标群体标签组;
群体偏好信息获取单元86,用于基于目标群体标签组,获取群体偏好信息;
第二业务资讯信息推送单元87,用于从预设的业务标签库中获取群体偏好信息对应的业务标签,并向用户推送业务标签对应的业务资讯信息。
进一步地,群体标签组生成单元83包括:
用户标签词频获取子单元831,用于针对每个用户群体,获取原始群体标签组B 1,B 2,...,B t中每个用户的用户标签A 1,A 2,A 3,...,A p在预设时间间隔内的用户标签词频
Figure PCTCN2018122729-appb-000009
其中,t和p为正整数;
群体标签词频获取子单元832,用于将原始群体标签组B j中的每个用户标签的词频相加,得到原始群体标签组B j的群体标签词频
Figure PCTCN2018122729-appb-000010
其中,j∈[1,t];
群体标签组生成子单元833,用于根据群体标签词频
Figure PCTCN2018122729-appb-000011
的大小对原始群体标签组进行排序,得到目标群体标签组。
本实施例提供的一种信息推送装置中各模块实现各自功能的过程,具体可参考实施例1的描述,此处不再赘述。
实施例3
本实施例提供一个或多个存储有计算机可读指令的非易失性可读存储介质,该计算机可读存储介质上存储有计算机可读指令,该计算机可读指令被一个或多个处理器执行时实现实施例1中信息推送方法,或者,该计算机可读指令被一个或多个处理器执行时实现实施例2中信息推送装置中各模块/单元的功能。为避免重复,这里不再赘述。
可以理解地,所述一个或多个存储有计算机可读指令的非易失性可读存储介质可以包括:能够携带所述计算机可读指令的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号和电信信号等。
实施例4
图8是本申请一实施例提供的终端设备的示意图。如图8所示,该实施例的终端设备90包括:处理器91、存储器92以及存储在存储器92中并可在处理器91上运行的计算机可读指令93,例如信息推送方法的程序。处理器91执行计算机可读指令93时实现上述实施例1中的信息推送方法的步骤,例如图1所示的步骤S1至步骤S7。或者,处理器91执行计算机可读指令93时实现上述各装置实施例中各模块/单元的功能,例如图7所示模块10至模块70的功能。
示例性的,计算机可读指令93可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器92中,并由处理器91执行,以完成本申请。一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令的指令段,该指令段用于描述计算机可读指令93在终端设备90中的执行过程。例如,计算机可读指令93可以被分割成历史行为信息获取模块、用户关键字获取模块、用户标签生成模块、原始用户标签组生成模块、目标用户标签组生成模块、用户偏好信息获取模块和业务资讯信息推送模块。各模块的具体功能如实施例2所示,为避免重复,这里不再赘述。
终端设备90可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。终端设备90可包括,但不仅限于,处理器91、存储器92。本领域技术人员可以理解,图8仅仅是终端设备90的示例,并不构成对终端设备90的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如终端设备90还可以包括输入输出设备、网络接入设备、总线等。
所称处理器91可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
存储器92可以是终端设备90的内部存储单元,例如终端设备90的硬盘或内存。存储器92也可以是终端设备90的外部存储设备,例如终端设备90上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器92还可以既包括终端设备90的内部存储单元也包括外部存储设备。存储器92用于存储计算机可读指令以及终端设备90所需的其他程序和数据。存储器92还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (20)

  1. 一种信息推送方法,其特征在于,所述信息推送方法包括:
    获取用户的历史行为信息;
    对所述历史行为信息进行分析过滤,获取用户关键字;
    采用词向量的方式对所述用户关键字进行训练,确定用户标签;
    基于K-Means聚合算法对所述用户标签进行分类,得到原始用户标签组;
    根据所述用户的历史行为信息,对所述原始用户标签组进行排序,得到目标用户标签组;
    基于所述目标用户标签组,获取所述用户的偏好信息;
    从预设的业务标签库中获取所述偏好信息对应的业务标签,并向所述用户推送所述业务标签对应的业务资讯信息。
  2. 如权利要求1所述的信息推送方法,其特征在于,所述采用词向量的方式对所述用户关键字进行训练,确定用户标签包括:
    基于预设语料库,构建每个所述用户关键字的基础词向量;
    针对每个所述基础词向量,计算该基础词向量与其他基础词向量之间的空间距离,并从所述空间距离中选取最小值作为该基础词向量的最小空间距离;
    将所述最小空间距离中小于或等于预设空间距离阈值的基础词向量,作为用户标签。
  3. 如权利要求1所述的信息推送方法,其特征在于,所述基于K-Means聚合算法对所述用户标签进行分类,得到原始用户标签组包括:
    从n个用户标签A 1,A 2,A 3,...,A n中随机选取m个用户标签作为聚类中心,其中,所述n和所述m均为正整数,所述m小于或等于所述n;
    针对每个所述用户标签,计算该用户标签与当前每个所述聚类中心之间的第一距离,将该用户标签放入最小第一距离对应的聚类中心所在的聚类中,得到m个临时聚类;
    针对每个所述临时聚类,计算该临时聚类的均值,以及该临时聚类中每个用户标签和所述均值之间的第二距离,选取最小第二距离对应的用户标签作为该临时聚类的新的聚类中心,得到更新后的m个临时聚类;
    按照如下公式计算每个更新后的临时聚类的标准差:
    Figure PCTCN2018122729-appb-100001
    其中,σ为所述标准差,μ为用户标签A i所在的更新后的临时聚类的平均值,i∈[1,n];
    若m个所述更新后的临时聚类的标准差中至少存在一个标准差大于或者等于预设的标准差阈值,则返回执行所述针对每个所述用户标签,计算该用户标签与当前每个所述聚类中心之间的第一距离,将该用户标签放入最小第一距离对应的聚类中心所在的聚类中,得到m个临时聚类的步骤;
    若m个所述更新后的临时聚类的标准差均小于所述标准差阈值,则将该m个所述更新后的临时聚类作为所述原始用户标签组。
  4. 如权利要求1所述的信息推送方法,其特征在于,所述根据所述用户的历史行为信息,对所述原始用户标签组进行排序,得到目标用户标签组包括:
    基于所述历史行为信息,获取用户标签对应的所述历史行为信息的生成时间;
    按照所述生成时间对所述用户标签进行排序,得到用户标签序列;
    根据所述用户标签序列,对所述原始用户标签组进行排序,得到所述目标用户标签组。
  5. 如权利要求1所述的信息推送方法,其特征在于,在所述采用词向量的方式对所述用户关键字进行训练,确定用户标签之后,所述信息推送方法还包括:
    根据预设的客户标签库,确定不同的用户群体及其对应的用户标签,得到群体标签;
    针对每个所述用户群体,基于所述K-Means聚合算法对所述群体标签进行分类,得到该用户群体对应的原始群体标签组;
    针对每个所述用户群体,对所述原始群体标签组进行排序,得到该用户群体对应的群体标签组;
    确定所述用户的目标用户群体;
    根据每个所述用户群体及其对应的目标群体标签组,获取所述目标用户群体对应的目标群体标签组;
    基于所述目标群体标签组,获取群体偏好信息;
    从预设的业务标签库中获取所述群体偏好信息对应的业务标签,并向所述用户推送所述业务标签对应的业务资讯信息。
  6. 如权利要求5所述的信息推送方法,其特征在于,所述针对每个所述用户群体,对所述原始群体标签组进行排序,得到该用户群体对应的群体标签组包括:
    针对每个所述用户群体,获取所述原始群体标签组B 1,B 2,...,B t中每个用户的用户标签A 1,A 2,A 3,...,A p在预设时间间隔内的用户标签词频
    Figure PCTCN2018122729-appb-100002
    其中,所述t和所述p为正整数;
    将所述原始群体标签组B j中的每个所述用户标签的词频相加,得到所述原始群体标签组B j的群体标签词频
    Figure PCTCN2018122729-appb-100003
    其中,j∈[1,t];
    根据所述群体标签词频
    Figure PCTCN2018122729-appb-100004
    的大小对所述原始群体标签组进行排序,得到所述群体标签组。
  7. 一种信息推送装置,其特征在于,所述信息推送装置包括:
    历史行为信息获取模块,用于获取用户的历史行为信息;
    用户关键字获取模块,用于对所述历史行为信息进行分析过滤,获取用户关键字;
    用户标签生成模块,用于采用词向量的方式对所述用户关键字进行训练,确定用户标签;
    原始用户标签组生成模块,用于基于K-Means聚合算法对所述用户标签进行分类,得到原始用户标签组;
    目标用户标签组生成模块,用于根据所述用户的历史行为信息,对所述原始用户标签组进行排序,得到目标用户标签组;
    用户偏好信息获取模块,用于基于所述目标用户标签组,获取所述用户的偏好信息;
    第一业务资讯信息推送模块,用于从预设的业务标签库中获取所述偏好信息对应的业务标签,并向所述用户推送所述业务标签对应的业务资讯信息。
  8. 如权利要求7所述的信息推送装置,其特征在于,所述用户标签生成模块包括:
    基础词向量获取单元,用于基于预设语料库,构建每个所述用户关键字的基础词向量;
    最小空间距离获取单元,用于针对每个所述基础词向量,计算该基础词向量与其他基础词向量之间的空间距离,并从所述空间距离中选取最小值作为该基础词向量的最小空间距离;
    用户标签生成单元,用于将所述最小空间距离中小于或等于预设空间距离阈值的基础 词向量,作为用户标签。
  9. 如权利要求7所述的信息推送装置,其特征在于,所述原始用户标签组生成模块包括:
    聚类中心获取单元,用于从n个用户标签A 1,A 2,A 3,...,A n中随机选取m个用户标签作为聚类中心,其中,所述n和所述m均为正整数,所述m小于或等于所述n;
    临时聚类获取单元,用于针对每个所述用户标签,计算该用户标签与当前每个所述聚类中心之间的第一距离,将该用户标签放入最小第一距离对应的聚类中心所在的聚类中,得到m个临时聚类;
    临时聚类更新单元,用于针对每个所述临时聚类,计算该临时聚类的均值,以及该临时聚类中每个用户标签和所述均值之间的第二距离,选取最小第二距离对应的用户标签作为该临时聚类的新的聚类中心,得到更新后的m个临时聚类;
    标准差计算单元,用于按照如下公式计算每个更新后的临时聚类的标准差:
    Figure PCTCN2018122729-appb-100005
    其中,σ为所述标准差,μ为用户标签A i所在的更新后的临时聚类的平均值,i∈[1,n];
    循环聚类单元45,用于若m个所述更新后的临时聚类的标准差中至少存在一个标准差大于或者等于预设的标准差阈值,则返回执行所述针对每个所述用户标签,计算该用户标签与当前每个所述聚类中心之间的第一距离,将该用户标签放入最小第一距离对应的聚类中心所在的聚类中,得到m个临时聚类的步骤;
    原始用户标签组生成单元,用于若m个所述更新后的临时聚类的标准差均小于所述标准差阈值,则将该m个所述更新后的临时聚类作为所述原始用户标签组。
  10. 如权利要求7所述的信息推送装置,其特征在于,所述信息推送装置还包括:
    群体标签获取单元,用于根据预设的客户标签库,确定不同的用户群体及其对应的用户标签,得到群体标签;
    原始群体标签组生成单元,用于针对每个所述用户群体,基于所述K-Means聚合算法对所述群体标签进行分类,得到该用户群体对应的原始群体标签组;
    群体标签组生成单元,用于针对每个所述用户群体,对所述原始群体标签组进行排序,得到该用户群体对应的群体标签组;
    目标用户群体确定单元,用于确定所述用户的目标用户群体;
    目标群体标签组获取单元,用于根据每个所述用户群体及其对应的目标群体标签组,获取所述目标用户群体对应的目标群体标签组;
    群体偏好信息获取单元,用于基于所述目标群体标签组,获取群体偏好信息;
    第二业务资讯信息推送单元,用于从预设的业务标签库中获取所述群体偏好信息对应的业务标签,并向所述用户推送所述业务标签对应的业务资讯信息。
  11. 一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,其特征在于,所述处理器执行所述计算机可读指令时实现如下信息推送方法:
    获取用户的历史行为信息;
    对所述历史行为信息进行分析过滤,获取用户关键字;
    采用词向量的方式对所述用户关键字进行训练,确定用户标签;
    基于K-Means聚合算法对所述用户标签进行分类,得到原始用户标签组;
    根据所述用户的历史行为信息,对所述原始用户标签组进行排序,得到目标用户标签组;
    基于所述目标用户标签组,获取所述用户的偏好信息;
    从预设的业务标签库中获取所述偏好信息对应的业务标签,并向所述用户推送所述业务标签对应的业务资讯信息。
  12. 如权利要求11所述的终端设备,其特征在于,所述采用词向量的方式对所述用户关键字进行训练,确定用户标签包括:
    基于预设语料库,构建每个所述用户关键字的基础词向量;
    针对每个所述基础词向量,计算该基础词向量与其他基础词向量之间的空间距离,并从所述空间距离中选取最小值作为该基础词向量的最小空间距离;
    将所述最小空间距离中小于或等于预设空间距离阈值的基础词向量,作为用户标签。
  13. 如权利要求11所述的终端设备,其特征在于,所述基于K-Means聚合算法对所述用户标签进行分类,得到原始用户标签组包括:
    从n个用户标签A 1,A 2,A 3,...,A n中随机选取m个用户标签作为聚类中心,其中,所述n和所述m均为正整数,所述m小于或等于所述n;
    针对每个所述用户标签,计算该用户标签与当前每个所述聚类中心之间的第一距离,将该用户标签放入最小第一距离对应的聚类中心所在的聚类中,得到m个临时聚类;
    针对每个所述临时聚类,计算该临时聚类的均值,以及该临时聚类中每个用户标签和所述均值之间的第二距离,选取最小第二距离对应的用户标签作为该临时聚类的新的聚类中心,得到更新后的m个临时聚类;
    按照如下公式计算每个更新后的临时聚类的标准差:
    Figure PCTCN2018122729-appb-100006
    其中,σ为所述标准差,μ为用户标签A i所在的更新后的临时聚类的平均值,i∈[1,n];
    若m个所述更新后的临时聚类的标准差中至少存在一个标准差大于或者等于预设的标准差阈值,则返回执行所述针对每个所述用户标签,计算该用户标签与当前每个所述聚类中心之间的第一距离,将该用户标签放入最小第一距离对应的聚类中心所在的聚类中,得到m个临时聚类的步骤;
    若m个所述更新后的临时聚类的标准差均小于所述标准差阈值,则将该m个所述更新后的临时聚类作为所述原始用户标签组。
  14. 如权利要求11所述的终端设备,其特征在于,所述根据所述用户的历史行为信息,对所述原始用户标签组进行排序,得到目标用户标签组包括:
    基于所述历史行为信息,获取用户标签对应的所述历史行为信息的生成时间;
    按照所述生成时间对所述用户标签进行排序,得到用户标签序列;
    根据所述用户标签序列,对所述原始用户标签组进行排序,得到所述目标用户标签组。
  15. 如权利要求11所述的终端设备,其特征在于,在所述采用词向量的方式对所述用户关键字进行训练,确定用户标签之后,所述处理器执行所述计算机可读指令时还包括实现如下步骤:
    根据预设的客户标签库,确定不同的用户群体及其对应的用户标签,得到群体标签;
    针对每个所述用户群体,基于所述K-Means聚合算法对所述群体标签进行分类,得到该用户群体对应的原始群体标签组;
    针对每个所述用户群体,对所述原始群体标签组进行排序,得到该用户群体对应的群体标签组;
    确定所述用户的目标用户群体;
    根据每个所述用户群体及其对应的目标群体标签组,获取所述目标用户群体对应的目 标群体标签组;
    基于所述目标群体标签组,获取群体偏好信息;
    从预设的业务标签库中获取所述群体偏好信息对应的业务标签,并向所述用户推送所述业务标签对应的业务资讯信息。
  16. 一个或多个存储有计算机可读指令的非易失性可读存储介质,其特征在于,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行如下步骤:
    获取用户的历史行为信息;
    对所述历史行为信息进行分析过滤,获取用户关键字;
    采用词向量的方式对所述用户关键字进行训练,确定用户标签;
    基于K-Means聚合算法对所述用户标签进行分类,得到原始用户标签组;
    根据所述用户的历史行为信息,对所述原始用户标签组进行排序,得到目标用户标签组;
    基于所述目标用户标签组,获取所述用户的偏好信息;
    从预设的业务标签库中获取所述偏好信息对应的业务标签,并向所述用户推送所述业务标签对应的业务资讯信息。
  17. 如权利要求16所述的非易失性可读存储介质,其特征在于,所述采用词向量的方式对所述用户关键字进行训练,确定用户标签包括:
    基于预设语料库,构建每个所述用户关键字的基础词向量;
    针对每个所述基础词向量,计算该基础词向量与其他基础词向量之间的空间距离,并从所述空间距离中选取最小值作为该基础词向量的最小空间距离;
    将所述最小空间距离中小于或等于预设空间距离阈值的基础词向量,作为用户标签。
  18. 如权利要求16所述的非易失性可读存储介质,其特征在于,所述基于K-Means聚合算法对所述用户标签进行分类,得到原始用户标签组包括:
    从n个用户标签A 1,A 2,A 3,...,A n中随机选取m个用户标签作为聚类中心,其中,所述n和所述m均为正整数,所述m小于或等于所述n;
    针对每个所述用户标签,计算该用户标签与当前每个所述聚类中心之间的第一距离,将该用户标签放入最小第一距离对应的聚类中心所在的聚类中,得到m个临时聚类;
    针对每个所述临时聚类,计算该临时聚类的均值,以及该临时聚类中每个用户标签和所述均值之间的第二距离,选取最小第二距离对应的用户标签作为该临时聚类的新的聚类中心,得到更新后的m个临时聚类;
    按照如下公式计算每个更新后的临时聚类的标准差:
    Figure PCTCN2018122729-appb-100007
    其中,σ为所述标准差,μ为用户标签A i所在的更新后的临时聚类的平均值,i∈[1,n];
    若m个所述更新后的临时聚类的标准差中至少存在一个标准差大于或者等于预设的标准差阈值,则返回执行所述针对每个所述用户标签,计算该用户标签与当前每个所述聚类中心之间的第一距离,将该用户标签放入最小第一距离对应的聚类中心所在的聚类中,得到m个临时聚类的步骤;
    若m个所述更新后的临时聚类的标准差均小于所述标准差阈值,则将该m个所述更新后的临时聚类作为所述原始用户标签组。
  19. 如权利要求16所述的非易失性可读存储介质,其特征在于,所述根据所述用户的历史行为信息,对所述原始用户标签组进行排序,得到目标用户标签组包括:
    基于所述历史行为信息,获取用户标签对应的所述历史行为信息的生成时间;
    按照所述生成时间对所述用户标签进行排序,得到用户标签序列;
    根据所述用户标签序列,对所述原始用户标签组进行排序,得到所述目标用户标签组。
  20. 如权利要求16所述的非易失性可读存储介质,其特征在于,在所述采用词向量的方式对所述用户关键字进行训练,确定用户标签之后,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器还执行如下步骤:
    根据预设的客户标签库,确定不同的用户群体及其对应的用户标签,得到群体标签;
    针对每个所述用户群体,基于所述K-Means聚合算法对所述群体标签进行分类,得到该用户群体对应的原始群体标签组;
    针对每个所述用户群体,对所述原始群体标签组进行排序,得到该用户群体对应的群体标签组;
    确定所述用户的目标用户群体;
    根据每个所述用户群体及其对应的目标群体标签组,获取所述目标用户群体对应的目标群体标签组;
    基于所述目标群体标签组,获取群体偏好信息;
    从预设的业务标签库中获取所述群体偏好信息对应的业务标签,并向所述用户推送所述业务标签对应的业务资讯信息。
PCT/CN2018/122729 2018-05-09 2018-12-21 一种信息推送方法、装置、终端设备及存储介质 WO2019214245A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810435812.7 2018-05-09
CN201810435812.7A CN108363821A (zh) 2018-05-09 2018-05-09 一种信息推送方法、装置、终端设备及存储介质

Publications (1)

Publication Number Publication Date
WO2019214245A1 true WO2019214245A1 (zh) 2019-11-14

Family

ID=63011935

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2018/122729 WO2019214245A1 (zh) 2018-05-09 2018-12-21 一种信息推送方法、装置、终端设备及存储介质

Country Status (2)

Country Link
CN (1) CN108363821A (zh)
WO (1) WO2019214245A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111723289A (zh) * 2020-06-08 2020-09-29 北京声智科技有限公司 信息推荐方法及装置
CN113362105A (zh) * 2021-06-01 2021-09-07 北京十一贝科技有限公司 用户标签形成方法、装置及计算机可读存储介质

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108363821A (zh) * 2018-05-09 2018-08-03 深圳壹账通智能科技有限公司 一种信息推送方法、装置、终端设备及存储介质
CN110110038B (zh) * 2018-08-17 2023-04-18 平安科技(深圳)有限公司 话务预测方法、装置、服务器及存储介质
CN109299356B (zh) * 2018-08-22 2024-02-06 中国平安人寿保险股份有限公司 基于大数据的活动推荐方法、装置、电子设备及存储介质
CN109284372B (zh) * 2018-09-03 2023-07-25 平安证券股份有限公司 用户操作行为分析方法、电子装置及计算机可读存储介质
CN109271609A (zh) * 2018-09-14 2019-01-25 广州神马移动信息科技有限公司 标签生成方法、装置、终端设备及计算机存储介质
CN109344253A (zh) * 2018-09-18 2019-02-15 平安科技(深圳)有限公司 添加用户标签的方法、装置、计算机设备和存储介质
CN109214904A (zh) * 2018-10-11 2019-01-15 平安科技(深圳)有限公司 财务造假线索的获取方法、装置、计算机设备和存储介质
CN109558530A (zh) * 2018-10-23 2019-04-02 深圳壹账通智能科技有限公司 基于数据处理的用户画像自动生成方法和系统
CN109492159A (zh) * 2018-10-31 2019-03-19 深圳市轱辘汽车维修技术有限公司 一种内容推送方法、内容推送装置及电子设备
CN109360658B (zh) * 2018-11-01 2021-06-08 北京航空航天大学 一种基于词向量模型的疾病模式挖掘方法及装置
CN109344232B (zh) * 2018-11-13 2024-03-15 平安科技(深圳)有限公司 一种舆情信息检索方法及终端设备
CN109658129A (zh) * 2018-11-22 2019-04-19 北京奇虎科技有限公司 一种用户画像的生成方法及装置
CN111444417A (zh) * 2018-12-27 2020-07-24 北京奇虎科技有限公司 推广用户群的智能定向方法、装置及计算设备
CN109857854A (zh) * 2019-01-02 2019-06-07 新浪网技术(中国)有限公司 一种用户商业标签挖掘方法及装置、服务器
CN109842688B (zh) * 2019-03-07 2022-03-01 北京达佳互联信息技术有限公司 一种内容推荐方法、装置、电子设备及存储介质
CN109960763B (zh) * 2019-03-21 2020-12-22 湖南大学 基于用户细粒度摄影偏好的摄影社区个性化好友推荐方法
CN110163719A (zh) * 2019-04-15 2019-08-23 深圳壹账通智能科技有限公司 信息推送方法、装置、计算机设备及存储介质
CN110135893A (zh) * 2019-04-16 2019-08-16 深圳壹账通智能科技有限公司 潜在用户的确定方法、装置、计算机设备及存储介质
CN110069635A (zh) * 2019-04-30 2019-07-30 秒针信息技术有限公司 一种热度词的确定方法及装置
CN110188273B (zh) * 2019-05-27 2022-02-22 北京字节跳动网络技术有限公司 资讯内容的通知方法、装置、服务器及可读介质
CN110351343A (zh) * 2019-06-21 2019-10-18 北京纵横无双科技有限公司 一种基于大数据分析的信息精准推送方法及装置
CN113412608B (zh) * 2019-06-24 2022-11-15 深圳市欢太科技有限公司 内容推送方法、装置、服务端及存储介质
CN110517114A (zh) * 2019-08-21 2019-11-29 广州云徙科技有限公司 一种基于社区发现算法的信息推送方法及系统
CN110688475A (zh) * 2019-09-05 2020-01-14 上海异势信息科技有限公司 基于内容主观倾向的文章推荐方法及系统
CN110688406A (zh) * 2019-09-06 2020-01-14 平安医疗健康管理股份有限公司 数据处理方法、装置、计算机设备和存储介质
CN110727859B (zh) * 2019-09-12 2022-07-01 北京十分科技有限公司 一种推荐信息推送方法及其装置
CN110765275B (zh) * 2019-10-14 2023-02-07 深圳平安医疗健康科技服务有限公司 搜索方法、装置、计算机设备和存储介质
CN110765328A (zh) * 2019-10-25 2020-02-07 腾讯科技(深圳)有限公司 一种数据处理的方法、装置及存储介质
CN110827138B (zh) * 2019-10-31 2022-07-05 北京芯盾时代科技有限公司 一种推送信息确定方法及装置
CN112788087B (zh) * 2019-11-11 2023-04-07 中国电信股份有限公司 业务产品信息推送方法、装置以及存储介质
CN110969486B (zh) * 2019-11-29 2024-02-27 中国银行股份有限公司 广告投放方法、用户端、服务器、系统及存储介质
CN111047336A (zh) * 2019-12-24 2020-04-21 太平金融科技服务(上海)有限公司 用户标签推送、用户标签展示方法、装置和计算机设备
CN111309903B (zh) * 2020-01-20 2023-06-16 北京大米未来科技有限公司 一种数据处理方法、装置、存储介质和电子设备
CN111401935B (zh) * 2020-02-21 2023-04-07 中国平安财产保险股份有限公司 资源分配方法、装置及存储介质
CN111400375A (zh) * 2020-03-19 2020-07-10 畅捷通信息技术股份有限公司 一种基于财务业务数据商机挖掘方法及装置
CN113516524A (zh) * 2020-04-10 2021-10-19 北京沃东天骏信息技术有限公司 用于推送信息的方法和装置
CN113676505B (zh) * 2020-05-15 2023-11-28 财付通支付科技有限公司 信息推送方法、装置、计算机设备和存储介质
CN111782949A (zh) * 2020-06-30 2020-10-16 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN111882400A (zh) * 2020-07-31 2020-11-03 平安国际融资租赁有限公司 行为识别分析方法、装置、计算机设备及可读存储介质
CN112150199A (zh) * 2020-09-21 2020-12-29 北京小米松果电子有限公司 垂类特征的确定方法及装置、存储介质
CN112182390B (zh) * 2020-09-29 2024-02-09 中国平安人寿保险股份有限公司 一种函件推送方法、装置、计算机设备及存储介质
CN112419011A (zh) * 2020-12-14 2021-02-26 国泰新点软件股份有限公司 一种公共资源交易推荐方法、装置、计算机可读存储介质
CN112613917A (zh) * 2020-12-30 2021-04-06 平安壹钱包电子商务有限公司 基于用户画像的信息推送方法、装置、设备及存储介质
CN113723984A (zh) * 2021-03-03 2021-11-30 京东城市(北京)数字科技有限公司 人群消费画像信息的获取方法、装置和存储介质
CN113222697A (zh) * 2021-05-11 2021-08-06 湖北三赫智能科技有限公司 商品信息推送方法、装置计算机设备及可读存储介质
CN113239185B (zh) * 2021-07-13 2021-10-29 深圳市创能亿科科技开发有限公司 教学课件的制作方法、设备及计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103886090A (zh) * 2014-03-31 2014-06-25 北京搜狗科技发展有限公司 基于用户喜好的内容推荐方法及装置
CN104216881A (zh) * 2013-05-29 2014-12-17 腾讯科技(深圳)有限公司 一种个性化标签的推荐方法及装置
US9134957B2 (en) * 2011-12-16 2015-09-15 International Business Machines Corporation Recommending tags based on user ratings
CN106611052A (zh) * 2016-12-26 2017-05-03 东软集团股份有限公司 文本标签的确定方法及装置
CN107908789A (zh) * 2017-12-12 2018-04-13 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN108363821A (zh) * 2018-05-09 2018-08-03 深圳壹账通智能科技有限公司 一种信息推送方法、装置、终端设备及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102253996B (zh) * 2011-07-08 2013-08-21 北京航空航天大学 一种多视角阶段式的图像聚类方法
US8923608B2 (en) * 2013-03-04 2014-12-30 Xerox Corporation Pre-screening training data for classifiers
CN104636470B (zh) * 2015-02-11 2018-04-24 广州华多网络科技有限公司 一种推荐业务资讯的方法及装置
CN106503015A (zh) * 2015-09-07 2017-03-15 国家计算机网络与信息安全管理中心 一种构建用户画像的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9134957B2 (en) * 2011-12-16 2015-09-15 International Business Machines Corporation Recommending tags based on user ratings
CN104216881A (zh) * 2013-05-29 2014-12-17 腾讯科技(深圳)有限公司 一种个性化标签的推荐方法及装置
CN103886090A (zh) * 2014-03-31 2014-06-25 北京搜狗科技发展有限公司 基于用户喜好的内容推荐方法及装置
CN106611052A (zh) * 2016-12-26 2017-05-03 东软集团股份有限公司 文本标签的确定方法及装置
CN107908789A (zh) * 2017-12-12 2018-04-13 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN108363821A (zh) * 2018-05-09 2018-08-03 深圳壹账通智能科技有限公司 一种信息推送方法、装置、终端设备及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111723289A (zh) * 2020-06-08 2020-09-29 北京声智科技有限公司 信息推荐方法及装置
CN111723289B (zh) * 2020-06-08 2024-02-02 北京声智科技有限公司 信息推荐方法及装置
CN113362105A (zh) * 2021-06-01 2021-09-07 北京十一贝科技有限公司 用户标签形成方法、装置及计算机可读存储介质
CN113362105B (zh) * 2021-06-01 2024-02-02 北京十一贝科技有限公司 用户标签形成方法、装置及计算机可读存储介质

Also Published As

Publication number Publication date
CN108363821A (zh) 2018-08-03

Similar Documents

Publication Publication Date Title
WO2019214245A1 (zh) 一种信息推送方法、装置、终端设备及存储介质
US11663254B2 (en) System and engine for seeded clustering of news events
US9418144B2 (en) Similar document detection and electronic discovery
US9317613B2 (en) Large scale entity-specific resource classification
WO2018028443A1 (zh) 数据处理方法、设备及系统
US20140214835A1 (en) System and method for automatically classifying documents
WO2018040068A1 (zh) 基于知识图谱的语意分析系统及方法
CN104834651B (zh) 一种提供高频问题回答的方法和装置
WO2018157625A1 (zh) 基于强化学习的排序学习方法及服务器
WO2018176913A1 (zh) 搜索方法、装置及非临时性计算机可读存储介质
CN108027814A (zh) 停用词识别方法与装置
CN111444304A (zh) 搜索排序的方法和装置
CN113268667B (zh) 一种基于中文评论情感引导的序列推荐方法及系统
CN103778206A (zh) 一种网络服务资源的提供方法
CA2956627A1 (en) System and engine for seeded clustering of news events
CN110688572A (zh) 冷启动状态下搜索意图的识别方法
Aung et al. Random forest classifier for multi-category classification of web pages
CN105159898A (zh) 一种搜索的方法和装置
TW201243627A (en) Multi-label text categorization based on fuzzy similarity and k nearest neighbors
Jiang et al. Durable product review mining for customer segmentation
Saha et al. A large scale study of SVM based methods for abstract screening in systematic reviews
CN116610853A (zh) 搜索推荐方法、搜索推荐系统、计算机设备及存储介质
CN114528378A (zh) 文本分类方法、装置、电子设备及存储介质
van Delden et al. Searching for business websites
Ferdous et al. Assortment of bangladeshi e-commerce site reviews using machine learning approaches

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18917907

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 03/05/2021)

122 Ep: pct application non-entry in european phase

Ref document number: 18917907

Country of ref document: EP

Kind code of ref document: A1