WO2017084362A1 - 模型生成方法、推荐方法及对应装置、设备和存储介质 - Google Patents

模型生成方法、推荐方法及对应装置、设备和存储介质 Download PDF

Info

Publication number
WO2017084362A1
WO2017084362A1 PCT/CN2016/089648 CN2016089648W WO2017084362A1 WO 2017084362 A1 WO2017084362 A1 WO 2017084362A1 CN 2016089648 W CN2016089648 W CN 2016089648W WO 2017084362 A1 WO2017084362 A1 WO 2017084362A1
Authority
WO
WIPO (PCT)
Prior art keywords
entity
feature vector
specified
candidate
obtaining
Prior art date
Application number
PCT/CN2016/089648
Other languages
English (en)
French (fr)
Inventor
黄际洲
孙明明
丁世强
王海峰
Original Assignee
百度在线网络技术(北京)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 百度在线网络技术(北京)有限公司 filed Critical 百度在线网络技术(北京)有限公司
Publication of WO2017084362A1 publication Critical patent/WO2017084362A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Definitions

  • the present invention relates to the field of search technologies, and in particular, to a model generation method, a recommendation method, and corresponding devices, devices, and storage media.
  • FIG. 1 is a first example diagram of a search recommendation based on a knowledge map in the prior art.
  • the non-search result area of the search result page may be recommended.
  • the famous alumni of Princeton University, shown in Figure 1 is a recommended entity that is very relevant to the query term "Princeton University.”
  • the search recommendation method cannot satisfy the user's search recommendation requirement, and the recommended entity has a relatively low click rate.
  • an embodiment of the present invention provides a method and a device for generating a model, a recommendation method, and a device, and a deep fusion model is generated by integrating various relationships between entities, and the deep fusion model can be used to obtain a surprise between entities. Therefore, the entity can be recommended to the user based on the degree of surprise, the user's search recommendation requirement is satisfied, and the click rate of the recommended entity is improved.
  • An aspect of an embodiment of the present invention provides a method for generating a model, including:
  • any possible implementation manner further provide an implementation manner of obtaining a user behavior relationship feature vector of each entity, including:
  • a user behavior relationship feature vector of each entity is obtained according to a search behavior and a click behavior of the user for the entities.
  • the aspect as described above and any possible implementation manner further provide an implementation manner of obtaining a feature vector of each entity, including: randomly generating the feature vector for each entity according to an entity defined in the knowledge map.
  • An aspect of an embodiment of the present invention provides a recommendation method, including:
  • a document content feature vector of the specified entity And at least one of a document content feature vector of the specified entity, a logical association feature vector between the specified entity and the candidate entity, a user behavior relationship feature vector of the specified entity, and a feature feature vector of the specified entity, and the candidate Entering a depth fusion model to obtain at least one of a document content feature vector of the entity and a feature vector of the candidate entity a degree of surprise of the candidate entity; the depth fusion model obtained by using the method of one of claims 1 to 3;
  • obtaining a candidate entity corresponding to the specified entity includes:
  • the aspect as described above, and any possible implementation manner, further provide an implementation manner, according to the surprise degree and the candidate entity, obtaining a recommended entity corresponding to the specified entity, including:
  • the candidate entities are sorted according to the order of the surprise degree to obtain a sorting result, and at least one candidate entity ranked first in the sorting result is used as the recommended entity corresponding to the specified entity.
  • An aspect of an embodiment of the present invention provides a model generating apparatus, including:
  • a vector obtaining unit configured to obtain at least one of a document content feature vector of each entity in the knowledge map, a logical association feature vector between each entity, a user behavior relationship feature vector of each entity, and a feature vector of each entity;
  • a model generating unit configured to perform machine learning according to at least one of the document content feature vector, the logical relationship feature vector, the user behavior relationship feature vector, and the feature vector to generate a depth fusion model.
  • a user behavior relationship feature vector of each entity is obtained according to a search behavior and a click behavior of the user for the entities.
  • the above-mentioned aspect and any possible implementation manner further provide an implementation manner, where the vector obtaining unit is specifically configured to randomly generate the feature vector for each entity according to an entity defined in the knowledge map.
  • An aspect of an embodiment of the present invention provides a recommendation apparatus, including:
  • An entity acquiring unit configured to obtain a candidate entity corresponding to the specified entity
  • a surprise degree obtaining unit configured to use a document content feature vector of the specified entity, a logical association feature vector between the specified entity and the candidate entity, a user behavior relationship feature vector of the specified entity, and a feature feature vector of the specified entity At least one, and at least one of a document content feature vector of the candidate entity and a feature vector of the candidate entity, input a depth fusion model to obtain a surprise degree of the candidate entity; the depth fusion model is to utilize claim 8 Generated by the device of one of ten;
  • An entity processing unit configured to obtain, according to the surprise degree and the candidate entity, a recommended entity corresponding to the specified entity.
  • the candidate entities are sorted according to the order of the surprise degree to obtain a sorting result, and at least one candidate entity ranked first in the sorting result is used as the recommended entity corresponding to the specified entity.
  • the device further includes:
  • a vector adjustment unit configured to adjust a feature vector of the specified entity according to the recommended entity corresponding to the specified entity, and the adjusted feature vector is used to generate the depth fusion model.
  • the technical solution provided by the embodiment of the present invention can generate a deep fusion model by integrating various relationships between entities, and the deep fusion model can be used to obtain a surprise between entities, so that an entity can be recommended to the user based on the degree of surprise.
  • the recommendation entity provided by the embodiment of the present invention can further attract the interest of the user, so that the search recommendation requirement of the user can be satisfied, and the click rate of the recommended entity is improved. .
  • FIG. 1 is a first exemplary diagram of a search recommendation based on a knowledge map in the prior art
  • FIG. 2 is a schematic flowchart of a method for generating a model according to an embodiment of the present invention
  • FIG. 3 is a diagram showing an example of generating a depth fusion model according to an embodiment of the present invention
  • FIG. 4 is a schematic flowchart of a recommendation method provided by an embodiment of the present invention.
  • FIG. 5 is a first exemplary diagram of performing search recommendation based on a deep fusion model according to an embodiment of the present invention
  • FIG. 6 is a second exemplary diagram of performing search recommendation based on a knowledge map in the prior art
  • FIG. 7 is a second exemplary diagram of performing search recommendation based on a deep fusion model according to an embodiment of the present invention.
  • FIG. 8 is a functional block diagram of a model generating apparatus according to an embodiment of the present invention.
  • FIG. 9 is a functional block diagram of a recommendation apparatus according to an embodiment of the present invention.
  • the word “if” as used herein may be interpreted as “when” or “when” or “in response to determining” or “in response to detecting.”
  • the phrase “if determined” or “if detected (conditions or events stated)” may be interpreted as “when determined” or “in response to determination” or “when detected (stated condition or event) “Time” or “in response to a test (condition or event stated)”.
  • An embodiment of the present invention provides a method for generating a model.
  • FIG. 2 it is a schematic flowchart of a method for generating a model according to an embodiment of the present invention. As shown in the figure, the method includes the following steps:
  • the knowledge map defines related information of each entity and each entity; the entity refers to real life things, such as characters, objects, virtual characters or places. Wait.
  • FIG. 3 is a schematic diagram of generating a depth fusion model according to an embodiment of the present invention.
  • any two entities e1 and in the knowledge map are generated. E2, it is required to obtain the document content feature vector s1 of the entity e1, the document content feature vector s2 of the entity e2, the logical association feature vector k between the entity e1 and the entity e2, the user behavior relationship feature vector c of the entity e1 and the entity e2, The feature vector p1 of the entity e1 and the feature vector p2 of the entity e2.
  • the method for obtaining the document content feature vector of each entity may include, but is not limited to, modeling the document d1 of the entity e1 by using a convolutional neural network, and performing the document d2 of the entity e2. Modeling to obtain the document content feature vector s1 of the entity e1, and the document content feature vector s2 of the entity e2.
  • the entity e1 is taken as an example for description: the document d1 of the entity e1 can be obtained from the knowledge map first.
  • the text in the encyclopedia page of the entity e1 can be used as the document d1 of the entity e1.
  • the word feature vectors w1 to wn are extracted from the document d1.
  • the word feature vectors w1 to wn are convoluted in the convolutional layer to obtain a vector feature.
  • the vector feature of the convolutional layer output is maximized by the maximum pooling layer to obtain the document content feature vector s1 of the entity e1.
  • the entity's document content feature vector and the convolution model used in the convolution operation can automatically optimize during the deep machine training based on the deep neural network when generating the deep fusion model.
  • the method for obtaining the logical association feature vector between the entities may include, but is not limited to, obtaining the logical association feature vector k between the entity e1 and the entity e2 from the knowledge map. It can be understood that the logical association feature vector k can represent a logical association relationship between the entity e1 and the entity e2 in the knowledge map.
  • the method for obtaining a user behavior relationship vector may include, but is not limited to:
  • the user behavior relationship feature vector of each entity includes a plurality of values, and each value may represent a user behavior relationship between the entity and another entity, so the user behavior relationship feature vector It can also be understood as a vector of user behavior relationships between one entity and another.
  • the number of clicks in the user behavior relationship feature vector of the entity e1 and the entity e2 is increased by one.
  • the number of searches in the user behavior relationship feature vector of the entity e1 and the entity e2 is increased by 1; and the user searches through the search engine.
  • the search result of the click contains the information of another entity e2, and the number of jumps in the user behavior relationship feature vector of the entity e1 and the entity e2 is increased by one.
  • the foregoing statistical method for obtaining the value in the user behavior relationship feature vector is only an example.
  • the user of each entity is obtained according to the search behavior and the click behavior of the user for the entities.
  • the manner in which the behavior relationship feature vector is performed is not particularly limited.
  • the feature vector of the entity includes other entities that are relatively low in relevance to the entity but are more likely to cause surprises to the user, and have no particularly obvious association relationship with the entity.
  • the method for obtaining the feature vector of each entity may include, but is not limited to:
  • the feature vector may be randomly generated for each entity based on the entities defined in the knowledge map.
  • the depth fusion model is used to obtain a corresponding recommendation entity for the specified entity, and then the feature vector of the specified entity is adjusted according to the recommended entity corresponding to the specified entity. Then, using the adjusted feature vector, the machine learning is re-executed to generate a new depth fusion model, thus achieving continuous optimization of the feature vector and the depth fusion model.
  • the feature vector of the specified entity may be adjusted by a back propagation optimization mechanism of the training error during deep machine learning using the deep neural network.
  • At least one input depth of the obtained document content feature vector, the logical association feature vector, the user behavior relationship feature vector, and the feature vector may be obtained.
  • Neural networks, deep neural networks perform deep machine learning on user preferences based on input vectors to generate deep fusion models.
  • the embodiment of the present invention provides a recommendation method.
  • the depth fusion model used in the recommendation method provided by the embodiment is the depth fusion model generated by using the model generation method provided in the first embodiment.
  • FIG. 4 is a schematic flowchart of a recommendation method according to an embodiment of the present invention. As shown in the figure, the method includes the following steps:
  • the depth fusion model is input to obtain a surprise degree of the candidate entity; the depth fusion model is obtained by using the above model generation method.
  • the method for obtaining the candidate entity corresponding to the specified entity may include, but is not limited to, the following two types:
  • the candidate entity is obtained according to an entity defined in the knowledge map. For example, all entities defined in the knowledge map can be used as the candidate entity.
  • the user behavior relationship feature vector of each entity can be stored, so that when the recommendation entity needs to be obtained by using the deep fusion model, the designation can be found according to the name of the specified entity.
  • a plurality of user behavior relationship feature vectors corresponding to the entity, and the user behavior relationship feature vectors represent user behavior relationships between the specified entity and each of the plurality of entities.
  • multiple entities having a user behavior relationship feature vector with the specified entity may be used as candidate entities corresponding to the specified entity.
  • the second method utilizes the user behavior relationship feature vector to filter the entities defined in the knowledge map to narrow the scope of the candidate entity and reduce the calculation amount when using the deep fusion model to obtain the recommended entity. , thereby improving the efficiency of the deep fusion model to obtain recommended entities.
  • the finger when obtaining the surprise degree of each candidate entity, may be a document content feature vector of the fixed entity, a logical association feature vector between the specified entity and the candidate entity, at least one of a user behavior relationship feature vector of the specified entity, and a feature vector of the specified entity, and a document of the candidate entity
  • the depth fusion model is input, and the depth fusion model can calculate and output the surprise degree of each candidate entity, thereby obtaining the surprise degree of the candidate entity.
  • the vector of the depth fusion model input here needs to be consistent with the vector used in the deep machine learning when generating the depth fusion model, for example, when using the deep fusion model, if the specified entity and the candidate entity are used.
  • the logical association feature vector performs deep machine learning, and then the logical association feature vector between the specified entity and the candidate entity needs to be input into the depth fusion model.
  • the depth fusion model is generated, if the feature vector of the entity is used for deep machine learning, the feature vector of the specified entity and the feature vector of the candidate entity need to be input into the depth fusion model.
  • the degree of expectation refers to the ratio of recommended entities derived from the knowledge map and the rules to all recommended entities.
  • the degree of surprise is equal to 1 minus the expected degree.
  • the degree of surprise refers to the ratio of other entities other than the recommended entity generated by the knowledge map and the rule to all recommended entities in the recommendation result, and the name of the specified entity is input for the user in the prediction. After that, the degree of surprise of the user to the recommended entity when the user is provided with the recommendation entity.
  • the method for obtaining the recommended entity corresponding to the first entity may include, but is not limited to:
  • the candidate entities are sorted according to the order of the surprise degree from large to small to obtain a sort result. Then, according to the preset recommended number, the corresponding number of at least one candidate entity ranked first in the sorting result is extracted, and the extracted at least one candidate entity is used as the recommended entity corresponding to the specified entity.
  • the obtained recommendation entity can be recommended to the user when the search result matching the specified entity is output to the user, for example, the recommendation entity can be displayed on the right side of the search result page.
  • the feature vector of the specified entity may be adjusted according to the recommended entity corresponding to the specified entity, and the entity included in the feature vector of the specified entity may be the One or more of the recommended entities.
  • the adjusted feature vector can be used for deep machine learning to generate a new depth fusion model, the new depth fusion model can further be used to obtain a recommended entity, and so on, so that the entity can be continuously.
  • the feature vector is optimized and adjusted, and the deep fusion model is optimized and adjusted to continuously improve the accuracy of the recommendation entity, continuously improve the user satisfaction with the recommended entity, and improve the click rate of the recommended entity.
  • FIG. 5 is a first example diagram of performing search recommendation based on a deep fusion model according to an embodiment of the present invention.
  • the name of the specified entity input by the user is “Princeton University”
  • the recommended entities shown in FIG. 1 will be obtained, and these recommended entities are well known to the user and cannot be of interest to the user.
  • the recommended entities shown in FIG. 1 will be obtained, and these recommended entities are well known to the user and cannot be of interest to the user.
  • the recommended entities are entities that are not obviously related to the specified entity, but some learners, obviously these learners can cause more User interest, which in turn triggers the user's clicks, motivates the user's potential search needs, so these recommended entities can better meet the user's needs, improve the recommendation accuracy rate and the click rate of the recommended entity.
  • FIG. 6 and FIG. 7 are respectively a second example diagram of performing search recommendation based on the knowledge map in the prior art, and a second search recommendation based on the depth fusion model provided by the embodiment of the present invention. sample graph.
  • the user's potential needs can include: horror movies, Halloween-related movies, props for Halloween, games/themes for Halloween parties, other scary ghosts/monsters/ creatures.
  • the recommended entity to be displayed to the user based on the knowledge map is a Halloween-related Chinese and Western festival, which brings a low degree of surprise to the user.
  • the recommended entity generated using the deep fusion model contains 7 horror movies (the entities identified by the dashed box in Figure 7) and contains all 5 other recommended entities (implemented in Figure 7) The entities identified by the box), the coverage of these recommended entities is broader, and the recommended entities shown in Figure 7 give users a greater degree of surprise.
  • the recommended entities indicated by the solid line and dashed boxes in Figure 7 represent entities with high user click rates in the experiment. It can be seen that the surprise of the entity mined by the deep fusion model does gain more attention and interest from the user.
  • Embodiments of the present invention further provide an apparatus embodiment for implementing the steps and methods in the foregoing method embodiments.
  • FIG. 8 is a functional block diagram of a model generating apparatus according to an embodiment of the present invention. As shown, the device includes:
  • the vector obtaining unit 81 is configured to obtain at least one of a document content feature vector of each entity in the knowledge map, a logical association feature vector between each entity, a user behavior relationship feature vector of each entity, and a feature vector of each entity;
  • the model generating unit 82 is configured to perform machine learning according to at least one of the document content feature vector, the logical relationship feature vector, the user behavior relationship feature vector, and the feature vector to generate a depth fusion model.
  • the vector obtaining unit 81 is specifically configured to:
  • a user behavior relationship feature vector of each entity is obtained according to a search behavior and a click behavior of the user for the entities.
  • the vector obtaining unit 81 is specifically configured to randomly generate the feature vector for each entity according to an entity defined in the knowledge map.
  • FIG. 9 is a functional block diagram of a recommendation apparatus according to an embodiment of the present invention. As shown, the device includes:
  • An entity obtaining unit 91 configured to obtain a candidate entity corresponding to the specified entity
  • the surprise degree obtaining unit 92 is configured to use a document content feature vector of the specified entity, a logical association feature vector between the specified entity and the candidate entity, a user behavior relationship feature vector of the specified entity, and a feature feature vector of the specified entity At least one of the document content feature vector of the candidate entity and the feature vector of the candidate entity, the depth fusion model is input to obtain a surprise degree of the candidate entity; the depth fusion model is generated by using a model Device generated
  • the entity processing unit 93 is configured to obtain, according to the surprise degree and the candidate entity, a recommended entity corresponding to the specified entity.
  • the entity obtaining unit 91 is specifically configured to:
  • the entity processing unit 93 is specifically configured to:
  • the candidate entities are sorted according to the order of the surprise degree to obtain a sorting result, and at least one candidate entity ranked first in the sorting result is used as the recommended entity corresponding to the specified entity.
  • the apparatus further includes:
  • the vector adjustment unit 94 is configured to adjust a feature vector of the specified entity according to the recommended entity corresponding to the specified entity, and the adjusted feature vector is used to generate the depth fusion model.
  • the document content vector of each entity in the knowledge map, the logical association vector between the entities, the user behavior relationship vector of each entity, and the feature vector of each entity are obtained; thereby, according to the document content vector
  • the logical association vector, the user behavior relationship vector, and the feature vector are machine-learned to generate a deep fusion model.
  • the technical solution provided by the embodiment of the present invention can generate a deep fusion model by integrating various relationships between entities, and the deep fusion model can be used to obtain a surprise between entities, so that an entity can be recommended to the user based on the degree of surprise.
  • the recommendation entity provided by the embodiment of the present invention can further attract the interest of the user, so that the search recommendation requirement of the user can be satisfied, and the click rate of the recommended entity is improved. .
  • the disclosed system, apparatus, and method may be implemented in other manners.
  • the device embodiments described above are merely illustrative.
  • the division of the unit is only a logical function division.
  • multiple units or components may be combined. Or it can be integrated into another system, or some features can be ignored or not executed.
  • the mutual coupling or direct coupling or communication connection shown or discussed may be an indirect coupling or communication connection through some interface, device or unit, and may be in an electrical, mechanical or other form.
  • the units described as separate components may or may not be physically separated, and the components displayed as units may or may not be physical units, that is, may be located in one place, or may be distributed to multiple network units. Some or all of the units may be selected according to actual needs to achieve the purpose of the solution of the embodiment.
  • each functional unit in each embodiment of the present invention may be integrated into one processing unit, or each unit may exist physically separately, or two or more units may be integrated into one unit.
  • the above integrated unit can be implemented in the form of hardware or in the form of hardware plus software functional units.
  • the above-described integrated unit implemented in the form of a software functional unit can be stored in a computer readable storage medium.
  • the above software functional unit is stored in a storage medium and includes instructions for causing a computer device (which may be a personal computer, a server, or a network device, etc.) or a processor to perform the methods of the various embodiments of the present invention. Part of the steps.
  • the foregoing storage medium includes: a USB flash drive, a mobile hard disk, a read-only memory (ROM), and a random access memory (Random Access Memory, A variety of media that can store program code, such as RAM, disk, or optical disk.

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种模型生成方法、推荐方法及对应装置、设备和存储介质。一方面,本发明实施例的模型生成方法中,通过获得知识图谱中各实体的文档内容特征向量、各实体之间的逻辑关联关系特征向量、各实体的用户行为关系特征向量和各实体的特征向量中至少一个;从而,根据所述文档内容特征向量、所述逻辑关联关系特征向量、所述用户行为关系特征向量和所述特征向量中至少一个进行机器学习,生成深度融合模型。因此,本发明实施例提供的技术方案能够通过整合实体之间的各种关系生成深度融合模型,深度融合模型可以用于获得实体之间的惊喜度,从而可以基于惊喜度向用户推荐实体,满足了用户的搜索推荐需求,提高了推荐实体的点击率。

Description

模型生成方法、推荐方法及对应装置、设备和存储介质
本申请要求了申请日为2015年11月18日,申请号为201510794561.8发明名称为“模型生成方法及装置、推荐方法及装置”的中国专利申请的优先权。
技术领域
本发明涉及搜索技术领域,尤其涉及一种模型生成方法、推荐方法及对应装置、设备和存储介质。
背景技术
目前,在进行搜索推荐时,是基于在用户的主搜索需求得到满足的情况下,通过向用户提供与查询词相关的其他可能有兴趣的内容,来激发用户的潜在需求。例如,请参考图1,其为现有技术中基于知识图谱进行搜索推荐的第一示例图,如图所示,在用户查询“普林斯顿大学”时,在搜索结果页的非搜索结果区域可以推荐图1所示的普林斯顿大学的著名校友,这是与查询词“普林斯顿大学”非常相关的推荐实体。
然而,现有技术中,基于知识图谱进行搜索推荐时,推荐的实体往往是众所周知,不能引起的用户兴趣。因此,这种搜索推荐方式不能满足用户搜索推荐需求,导致推荐实体的点击率比较低。
发明内容
有鉴于此,本发明实施例提供了一种模型生成方法及装置、推荐方法及装置,通过整合实体之间的各种关系生成深度融合模型,深度融合模型可以用于获得实体之间的惊喜度,从而可以基于惊喜度向用户推荐实体,满足了用户的搜索推荐需求,提高了推荐实体的点击率。
本发明实施例的一方面,提供一种模型生成方法,包括:
获得知识图谱中各实体的文档内容特征向量、各实体之间的逻辑关联关系特征向量、各实体的用户行为关系特征向量和各实体的特征向量中至少一个;
根据所述文档内容特征向量、所述逻辑关联关系特征向量、所述用户行为关系特征向量和所述特征向量中至少一个进行机器学习,生成深度融合模型。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,获得各实体的用户行为关系特征向量,包括:
获取用户的历史搜索行为记录;
根据所述历史搜索行为记录,获得用户针对所述各实体的搜索行为和点击行为;
根据用户针对所述各实体的搜索行为和点击行为,获得所述各实体的用户行为关系特征向量。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,获得各实体的特征向量,包括:根据知识图谱中定义的实体,为各实体随机生成所述特征向量。
本发明实施例的一方面,提供一种推荐方法,包括:
获得指定实体对应的候选实体;
将所述指定实体的文档内容特征向量、指定实体与候选实体之间的逻辑关联关系特征向量、所述指定实体的用户行为关系特征向量和指定实体的特征特征向量中至少一个,以及所述候选实体的文档内容特征向量和所述候选实体的特征向量中至少一个,输入深度融合模型,以获得 所述候选实体的惊喜度;所述深度融合模型为利用权利要求1至3中一项所述方法获得的;
根据所述惊喜度和所述候选实体,获得所述指定实体对应的推荐实体。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获得指定实体对应的候选实体,包括:
根据所述指定实体以及所述指定实体的用户行为关系特征向量,获得所述候选实体;或者,根据知识图谱中定义的实体,获得所述候选实体。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,根据所述惊喜度和所述候选实体,获得所述指定实体对应的推荐实体,包括:
根据所述惊喜度由大到小的顺序,对所述候选实体进行排序,以获得排序结果,以及将排序结果中排序靠前的至少一个候选实体作为所述指定实体对应的推荐实体。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述方法还包括:
根据所述指定实体对应的推荐实体,调整所述指定实体的特征向量,调整后获得的特征向量用于生成所述深度融合模型。
本发明实施例的一方面,提供一种模型生成装置,包括:
向量获取单元,用于获得知识图谱中各实体的文档内容特征向量、各实体之间的逻辑关联关系特征向量、各实体的用户行为关系特征向量和各实体的特征向量中至少一个;
模型生成单元,用于根据所述文档内容特征向量、所述逻辑关联关系特征向量、所述用户行为关系特征向量和所述特征向量中至少一个进行机器学习,生成深度融合模型。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述向量获取单元,具体用于:
获取用户的历史搜索行为记录;
根据所述历史搜索行为记录,获得用户针对所述各实体的搜索行为和点击行为;
根据用户针对所述各实体的搜索行为和点击行为,获得所述各实体的用户行为关系特征向量。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述向量获取单元,具体用于:根据知识图谱中定义的实体,为各实体随机生成所述特征向量。
本发明实施例的一方面,提供一种推荐装置,包括:
实体获取单元,用于获得指定实体对应的候选实体;
惊喜度获取单元,用于将所述指定实体的文档内容特征向量、指定实体与候选实体之间的逻辑关联关系特征向量、所述指定实体的用户行为关系特征向量和指定实体的特征特征向量中至少一个,以及所述候选实体的文档内容特征向量和所述候选实体的特征向量中至少一个,输入深度融合模型,以获得所述候选实体的惊喜度;所述深度融合模型为利用权利要求8至10中一项所述装置生成的;
实体处理单元,用于根据所述惊喜度和所述候选实体,获得所述指定实体对应的推荐实体。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述实体获取单元,具体用于:
根据所述指定实体以及所述指定实体的用户行为关系特征向量,获得所述候选实体;或者,根据知识图谱中定义的实体,获得所述候选实体。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述实体处理单元,具体用于:
根据所述惊喜度由大到小的顺序,对所述候选实体进行排序,以获得排序结果,以及将排序结果中排序靠前的至少一个候选实体作为所述指定实体对应的推荐实体。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述装置还包括:
向量调整单元,用于根据所述指定实体对应的推荐实体,调整所述指定实体的特征向量,调整后获得的特征向量用于生成所述深度融合模型。
由以上技术方案可以看出,本发明实施例具有以下有益效果:
本发明实施例提供的技术方案能够通过整合实体之间的各种关系生成深度融合模型,该深度融合模型可以用于获得实体之间的惊喜度,从而可以基于惊喜度向用户推荐实体。与现有技术中,仅基于知识图谱进行搜索推荐的方式相比,本发明实施例所提供的推荐实体能够更加引起用户的兴趣,所以能够满足用户的搜索推荐需求,提高了推荐实体的点击率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是现有技术中基于知识图谱进行搜索推荐的第一示例图;
图2是本发明实施例所提供的模型生成方法的流程示意图;
图3是本发明实施例所提供的深度融合模型的生成示例图;
图4是本发明实施例所提供的推荐方法的流程示意图;
图5是本发明实施例所提供的基于深度融合模型进行搜索推荐的第一示例图;
图6是现有技术中基于知识图谱进行搜索推荐的第二示例图;
图7是本发明实施例所提供的基于深度融合模型进行搜索推荐的第二示例图;
图8是本发明实施例所提供的模型生成装置的功能方块图;
图9是本发明实施例所提供的推荐装置的功能方块图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单 数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
实施例一
本发明实施例给出一种模型生成方法,请参考图2,其为本发明实施例所提供的模型生成方法的流程示意图,如图所示,该方法包括以下步骤:
S201,获得知识图谱中各实体的文档内容特征向量、各实体之间的逻辑关联关系特征向量、各实体的用户行为关系特征向量和各实体的特征向量中至少一个。
S202,根据所述文档内容特征向量、所述逻辑关联关系特征向量、所述用户行为关系特征向量和所述特征向量中至少一个进行机器学习,生成深度融合模型。
需要说明的是,知识图谱中定义了各实体以及各实体的相关信息;所述实体指的是现实生活中的事物,如人物、物品、虚拟人物或者地点 等。
请参考图3,其为本发明实施例所提供的深度融合模型的生成示例图,如图所示,本发明实施例中,在生成深度融合模型之前,对于知识图谱中任意两个实体e1和e2,需要获得实体e1的文档内容特征向量s1、实体e2的文档内容特征向量s2、实体e1与实体e2之间的逻辑关联关系特征向量k、实体e1与实体e2的用户行为关系特征向量c、实体e1的特征向量p1以及实体e2的特征向量p2。
举例说明,本发明实施例中,获得各实体的文档内容特征向量的方法可以包括但不限于:可以利用卷积神经网络,对实体e1的文档d1进行建模,以及对实体e2的文档d2进行建模,以获得实体e1的文档内容特征向量s1,以及实体e2的文档内容特征向量s2。
例如,以实体e1为例进行说明:可以先从知识图谱中获得实体e1的文档d1,例如,实体e1的百科页中的文本可以作为实体e1的文档d1。然后,从文档d1中提取词特征向量w1~wn。接着,词特征向量w1~wn在卷积层中进行卷积运算,以获得向量特征。最后,在最大池化层对卷积层输出的向量特征进行最大值池化处理,以获得实体e1的文档内容特征向量s1。其中,实体的文档内容特征向量以和卷积运算时所使用的卷积模型,可以生成深度融合模型时,基于深度神经网络进行深度机器训练的过程中进行自动优化。
举例说明,本发明实施例中,获得各实体之间的逻辑关联关系特征向量的方法可以包括但不限于:可以从知识图谱中获得实体e1与实体e2的之间的逻辑关联关系特征向量k。可以理解的是,逻辑关联关系特征向量k可以表示在知识图谱中实体e1与实体e2之间的逻辑关联关系。
举例说明,本发明实施例中,获得用户行为关系向量的方法可以包括但不限于:
首先,获取用户的历史搜索行为记录。然后,根据所述用户的历史搜索行为记录,获得用户针对所述各实体的搜索行为和点击行为。最后,根据用户针对所述各实体的搜索行为和点击行为,获得所述各实体的用户行为关系特征向量。
可以理解的是,本发明实施例中,各实体的用户行为关系特征向量中包含若干数值,每个数值可以表示该实体与另一实体之间的一种用户行为关系,所以用户行为关系特征向量也可以理解成一个实体与另一个实体之间的用户行为关系特征向量。
例如,用户在搜索引擎中搜索完实体e1之后,点击了搜索结果页面右侧的推荐实体中的实体e2,则实体e1与实体e2的用户行为关系特征向量的中点击次数加1。以及,用户在搜索引擎中搜索完实体e1之后,又在搜索引擎中搜索实体e2,则实体e1与实体e2的用户行为关系特征向量中的搜索次数加1;以及,用户在搜索引擎中搜索完实体e1之后,所点击的一个搜索结果中包含另一个实体e2的信息,则实体e1与实体e2的用户行为关系特征向量中的跳转次数加1。可以理解的是,上述获得用户行为关系特征向量中数值的统计方式仅为举例说明,本发明实施例中,对于根据用户针对所述各实体的搜索行为和点击行为,获得所述各实体的用户行为关系特征向量的方式不进行特别限定。
本发明实施例中,实体的特征向量中包含的是与该实体的相关性比较低但更能引起用户惊喜的其他实体,与该实体没有特别明显的关联关系。
举例说明,本发明实施例中,获得各实体的特征向量的方法可以包括但不限于:
可以根据知识图谱中定义的实体,为各实体随机生成所述特征向量。或者,还可以在根据随机生成的特征向量,生成深度融合模型之后,利用深度融合模型为指定实体获得对应的推荐实体,然后根据所述指定实体对应的推荐实体,调整所述指定实体的特征向量,然后,再利用调整后获得的特征向量,重新进行机器学习,以生成新的深度融合模型,从而实现了特征向量和深度融合模型的不断优化。或者,还可以在利用深度神经网络进行深度机器学习的过程中,通过训练误差的反向传播优化机制,调整所述指定实体的特征向量。
在一个具体的实现过程中,如图3所示,可以将获得的所述文档内容特征向量、所述逻辑关联关系特征向量、所述用户行为关系特征向量和所述特征向量中至少一个输入深度神经网络,深度神经网络根据输入的向量对用户偏好进行深度机器学习,以生成深度融合模型。
实施例二
本发明实施例给出一种推荐方法,本实施例所提供的推荐方法中所使用的深度融合模型是利用上述实施例一所提供的模型生成方法中生成的深度融合模型。请参考图4,其为本发明实施例所提供的推荐方法的流程示意图,如图所示,该方法包括以下步骤:
S401,获得指定实体对应的候选实体。
S402,将所述指定实体的文档内容特征向量、指定实体与候选实体之间的逻辑关联关系特征向量、所述指定实体的用户行为关系特征向量和指定实体的特征特征向量中至少一个,以及所述候选实体的文档内容 特征向量和所述候选实体的特征向量中至少一个,输入深度融合模型,以获得所述候选实体的惊喜度;所述深度融合模型为利用上述模型生成方法获得的。
S403,根据所述惊喜度和所述候选实体,获得所述指定实体对应的推荐实体。
举例说明,本发明实施例中,获得指定实体对应的候选实体的方法可以包括但不限于以下两种:
第一种:根据知识图谱中定义的实体,获得所述候选实体。例如,可以将知识图谱中定义的所有实体都作为所述候选实体。
第二种:根据用户输入的指定实体的名称,获得指定实体的若干用户行为关系特征向量;然后,根据所述指定实体以及所述指定实体的用户行为关系特征向量,获得所述候选实体。
可以理解的是,在上述实施例一中可以在获得各实体的用户行为关系特征向量之后对其进行存储,这样,当需要利用深度融合模型获得推荐实体时,可以根据指定实体的名称,找到指定实体对应的若干用户行为关系特征向量,这些用户行为关系特征向量表示了指定实体与多个实体中每个实体之间的用户行为关系。本方法中,可以将与指定实体之间存在用户行为关系特征向量的多个实体作为指定实体对应的候选实体。
与第一种方法相比,第二种方法中利用了用户行为关系特征向量对知识图谱中定义的实体进行筛选,以缩小候选实体的范围,减少了利用深度融合模型获得推荐实体时的计算量,从而提高了深度融合模型获得推荐实体的效率。
本发明实施例中,在获得每个候选实体的惊喜度时,可以将所述指 定实体的文档内容特征向量、指定实体与候选实体之间的逻辑关联关系特征向量、所述指定实体的用户行为关系特征向量和指定实体的特征向量中至少一个,以及,所述候选实体的文档内容特征向量和所述候选实体的特征向量中至少一个,输入深度融合模型,深度融合模型可以计算并输出每个候选实体的惊喜度,从而获得了所述候选实体的惊喜度。
需要说明的是,这里输入深度融合模型的向量需要与生成深度融合模型时,在进行深度机器学习时所使用的向量一致,例如,在生成深度融合模型时,若使用指定实体与候选实体之间的逻辑关联关系特征向量进行深度机器学习,则这里需要将指定实体与候选实体之间的逻辑关联关系特征向量输入深度融合模型。或者,又例如,在生成深度融合模型时,若使用实体的特征向量进行深度机器学习,则这里需要将指定实体的特征向量与候选实体的特征向量输入深度融合模型。
可以理解的是,预期度指的是推荐结果中,来源于知识图谱以及规则产生的推荐实体占所有推荐实体的比例。惊喜度等于1减去预期度,惊喜度指的是推荐结果中,来源于知识图谱与规则生成的推荐实体之外的其他实体占所有推荐实体的比例,为预测的在用户输入指定实体的名称后,向用户提供推荐实体时用户对于推荐实体的惊喜程度。
举例说明,根据所述惊喜度和所述候选实体,获得所述第一实体对应的推荐实体的方法可以包括但不限于:
首先,根据所述惊喜度由大到小的顺序,对所述候选实体进行排序,以获得排序结果。然后,根据预设的推荐数目,提取排序结果中排序靠前的相应数目的至少一个候选实体,将提取出的至少一个候选实体作为所述指定实体对应的推荐实体。
可以理解的是,可以在向用户输出与指定实体相匹配的搜索结果时,将获得的推荐实体推荐给用户,例如,推荐实体可以展现在搜索结果页的右侧。
可选的,在本实施例的一个可能的实现方式中,还可以根据所述指定实体对应的推荐实体,调整所述指定实体的特征向量,指定实体的特征向量中包含的实体可以为所述推荐实体中的一个或者多个。进一步的,调整后获得的特征向量可以用于进行深度机器学习,以生成新的深度融合模型,新的深度融合模型进一步还可以用于获得推荐实体,以此类推,如此反复将可以不断对实体的特征向量进行优化调整,以及对深度融合模型进行优化调整,从而不断提高推荐实体的获取准确性,不断提高用户对推荐实体的满意度,提高推荐实体的点击率。
例如,请参考图5,其为本发明实施例所提供的基于深度融合模型进行搜索推荐的第一示例图,如图5所示,如果用户输入的指定实体的名称为“普林斯顿大学”,如果利用现有技术中基于知识图谱进行搜索推荐,将获得图1所示的推荐实体,这些推荐实体对于用户而言是众所周知的,无法引起用户的兴趣。然而,利用本发明实施例所提供的深度融合模型,可以获得图5所示的推荐实体,这些推荐实体是与指定实体没有明显相关的实体,而是一些学霸,显然这些学霸更能引起用户兴趣,进而触发用户的点击,激发用户潜在搜索需求,因此这些推荐实体更能满足用户需求,提高了推荐准确率和推荐实体的点击率。
或者,又例如,请参考图6和图7,分别为现有技术中基于知识图谱进行搜索推荐的第二示例图,以及,本发明实施例所提供的基于深度融合模型进行搜索推荐的第二示例图。
当用户搜索“万圣节”时,用户的潜在需求可以包括:惊悚恐怖的电影、万圣节相关的电影、准备万圣节所需的道具、万圣节聚会的游戏/主题、其他可怕的鬼/怪物/生物。如图6所示,基于知识图谱将向用户显示的推荐实体为万圣节相关的中西方节日,给用户带来的惊喜程度比较低。然而,如图7所示,如果利用深度融合模型生成的推荐实体包含了7个恐怖的电影(图7中虚线框标识出的实体)以及包含了全部5个其他的推荐实体(图7中实现框标识出的实体),这些推荐实体的覆盖面更广,图7中所示的推荐实体给用户带来的惊喜程度更大。图7中实线框和虚线框标示出的推荐实体表示实验中用户点击率高的实体。可以看出,深度融合模型挖掘出的实体的惊喜度的确获得了用户的更多的关注和兴趣。
本发明实施例进一步给出实现上述方法实施例中各步骤及方法的装置实施例。
请参考图8,其为本发明实施例所提供的模型生成装置的功能方块图。如图所示,该装置包括:
向量获取单元81,用于获得知识图谱中各实体的文档内容特征向量、各实体之间的逻辑关联关系特征向量、各实体的用户行为关系特征向量和各实体的特征向量中至少一个;
模型生成单元82,用于根据所述文档内容特征向量、所述逻辑关联关系特征向量、所述用户行为关系特征向量和所述特征向量中至少一个进行机器学习,生成深度融合模型。
在一个具体的实现过程中,所述向量获取单元81,具体用于:
获取用户的历史搜索行为记录;
根据所述历史搜索行为记录,获得用户针对所述各实体的搜索行为和点击行为;
根据用户针对所述各实体的搜索行为和点击行为,获得所述各实体的用户行为关系特征向量。
在一个具体的实现过程中,所述向量获取单元81,具体用于:根据知识图谱中定义的实体,为各实体随机生成所述特征向量。
由于本实施例中的各单元能够执行图2所示的方法,本实施例未详细描述的部分,可参考对图2的相关说明。
请参考图9,其为本发明实施例所提供的推荐装置的功能方块图。如图所示,该装置包括:
实体获取单元91,用于获得指定实体对应的候选实体;
惊喜度获取单元92,用于将所述指定实体的文档内容特征向量、指定实体与候选实体之间的逻辑关联关系特征向量、所述指定实体的用户行为关系特征向量和指定实体的特征特征向量中至少一个,以及所述候选实体的文档内容特征向量和所述候选实体的特征向量中至少一个,输入深度融合模型,以获得所述候选实体的惊喜度;所述深度融合模型为利用模型生成装置生成的;
实体处理单元93,用于根据所述惊喜度和所述候选实体,获得所述指定实体对应的推荐实体。
在一个具体的实现过程中,所述实体获取单元91,具体用于:
根据所述指定实体以及所述指定实体的用户行为关系特征向量,获得所述候选实体;或者,根据知识图谱中定义的实体,获得所述候选实体。
在一个具体的实现过程中,所述实体处理单元93,具体用于:
根据所述惊喜度由大到小的顺序,对所述候选实体进行排序,以获得排序结果,以及将排序结果中排序靠前的至少一个候选实体作为所述指定实体对应的推荐实体。
可选的,在本实施例的一个可能的实现方式中,所述装置还包括:
向量调整单元94,用于根据所述指定实体对应的推荐实体,调整所述指定实体的特征向量,调整后获得的特征向量用于生成所述深度融合模型。
由于本实施例中的各单元能够执行图4所示的方法,本实施例未详细描述的部分,可参考对图4的相关说明。
本发明实施例的技术方案具有以下有益效果:
本发明实施例中,通过获得知识图谱中各实体的文档内容向量、各实体之间的逻辑关联关系向量、各实体的用户行为关系向量和各实体的特征向量;从而,根据所述文档内容向量、所述逻辑关联关系向量、所述用户行为关系向量和所述特征向量进行机器学习,生成深度融合模型。
本发明实施例提供的技术方案能够通过整合实体之间的各种关系生成深度融合模型,该深度融合模型可以用于获得实体之间的惊喜度,从而可以基于惊喜度向用户推荐实体。与现有技术中,仅基于知识图谱进行搜索推荐的方式相比,本发明实施例所提供的推荐实体能够更加引起用户的兴趣,所以能够满足用户的搜索推荐需求,提高了推荐实体的点击率。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例 中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory, RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (18)

  1. 一种模型生成方法,其特征在于,所述方法包括:
    获得知识图谱中各实体的文档内容特征向量、各实体之间的逻辑关联关系特征向量、各实体的用户行为关系特征向量和各实体的特征向量中至少一个;
    根据所述文档内容特征向量、所述逻辑关联关系特征向量、所述用户行为关系特征向量和所述特征向量中至少一个进行机器学习,生成深度融合模型。
  2. 根据权利要求1所述的方法,其特征在于,获得各实体的用户行为关系特征向量,包括:
    获取用户的历史搜索行为记录;
    根据所述历史搜索行为记录,获得用户针对所述各实体的搜索行为和点击行为;
    根据用户针对所述各实体的搜索行为和点击行为,获得所述各实体的用户行为关系特征向量。
  3. 根据权利要求1所述的方法,其特征在于,获得各实体的特征向量,包括:根据知识图谱中定义的实体,为各实体随机生成所述特征向量。
  4. 一种推荐方法,其特征在于,所述方法包括:
    获得指定实体对应的候选实体;
    将所述指定实体的文档内容特征向量、指定实体与候选实体之间的逻辑关联关系特征向量、所述指定实体的用户行为关系特征向量和指定实体的特征特征向量中至少一个,以及所述候选实体的文档内容特征向 量和所述候选实体的特征向量中至少一个,输入深度融合模型,以获得所述候选实体的惊喜度;所述深度融合模型为利用权利要求1至3中一项所述方法获得的;
    根据所述惊喜度和所述候选实体,获得所述指定实体对应的推荐实体。
  5. 根据权利要求4所述的方法,其特征在于,所述获得指定实体对应的候选实体,包括:
    根据所述指定实体以及所述指定实体的用户行为关系特征向量,获得所述候选实体;或者,根据知识图谱中定义的实体,获得所述候选实体。
  6. 根据权利要求4所述的方法,其特征在于,根据所述惊喜度和所述候选实体,获得所述指定实体对应的推荐实体,包括:
    根据所述惊喜度由大到小的顺序,对所述候选实体进行排序,以获得排序结果,以及将排序结果中排序靠前的至少一个候选实体作为所述指定实体对应的推荐实体。
  7. 根据权利要求4至6中任一项所述的方法,其特征在于,所述方法还包括:
    根据所述指定实体对应的推荐实体,调整所述指定实体的特征向量,调整后获得的特征向量用于生成所述深度融合模型。
  8. 一种模型生成装置,其特征在于,所述装置包括:
    向量获取单元,用于获得知识图谱中各实体的文档内容特征向量、各实体之间的逻辑关联关系特征向量、各实体的用户行为关系特征向量和各实体的特征向量中至少一个;
    模型生成单元,用于根据所述文档内容特征向量、所述逻辑关联关系特征向量、所述用户行为关系特征向量和所述特征向量中至少一个进行机器学习,生成深度融合模型。
  9. 根据权利要求8所述的装置,其特征在于,所述向量获取单元,具体用于:
    获取用户的历史搜索行为记录;
    根据所述历史搜索行为记录,获得用户针对所述各实体的搜索行为和点击行为;
    根据用户针对所述各实体的搜索行为和点击行为,获得所述各实体的用户行为关系特征向量。
  10. 根据权利要求8所述的装置,其特征在于,所述向量获取单元,具体用于:根据知识图谱中定义的实体,为各实体随机生成所述特征向量。
  11. 一种推荐装置,其特征在于,所述装置包括:
    实体获取单元,用于获得指定实体对应的候选实体;
    惊喜度获取单元,用于将所述指定实体的文档内容特征向量、指定实体与候选实体之间的逻辑关联关系特征向量、所述指定实体的用户行为关系特征向量和指定实体的特征特征向量中至少一个,以及所述候选实体的文档内容特征向量和所述候选实体的特征向量中至少一个,输入深度融合模型,以获得所述候选实体的惊喜度;所述深度融合模型为利用权利要求8至10中一项所述装置生成的;
    实体处理单元,用于根据所述惊喜度和所述候选实体,获得所述指定实体对应的推荐实体。
  12. 根据权利要求11所述的装置,其特征在于,所述实体获取单元,具体用于:
    根据所述指定实体以及所述指定实体的用户行为关系特征向量,获得所述候选实体;或者,根据知识图谱中定义的实体,获得所述候选实体。
  13. 根据权利要求11所述的装置,其特征在于,所述实体处理单元,具体用于:
    根据所述惊喜度由大到小的顺序,对所述候选实体进行排序,以获得排序结果,以及将排序结果中排序靠前的至少一个候选实体作为所述指定实体对应的推荐实体。
  14. 根据权利要求11至13中任一项所述的装置,其特征在于,所述装置还包括:
    向量调整单元,用于根据所述指定实体对应的推荐实体,调整所述指定实体的特征向量,调整后获得的特征向量用于生成所述深度融合模型。
  15. 一种设备,包括
    一个或者多个处理器;
    存储器;
    一个或者多个程序,所述一个或者多个程序存储在所述存储器中,当被所述一个或者多个处理器执行时:
    获得知识图谱中各实体的文档内容特征向量、各实体之间的逻辑关联关系特征向量、各实体的用户行为关系特征向量和各实体的特征向量中至少一个;
    根据所述文档内容特征向量、所述逻辑关联关系特征向量、所述用户行为关系特征向量和所述特征向量中至少一个进行机器学习,生成深度融合模型。
  16. 一种设备,包括
    一个或者多个处理器;
    存储器;
    一个或者多个程序,所述一个或者多个程序存储在所述存储器中,当被所述一个或者多个处理器执行时:
    获得指定实体对应的候选实体;
    将所述指定实体的文档内容特征向量、指定实体与候选实体之间的逻辑关联关系特征向量、所述指定实体的用户行为关系特征向量和指定实体的特征特征向量中至少一个,以及所述候选实体的文档内容特征向量和所述候选实体的特征向量中至少一个,输入深度融合模型,以获得所述候选实体的惊喜度;所述深度融合模型为利用权利要求1至3中一项所述方法获得的;
    根据所述惊喜度和所述候选实体,获得所述指定实体对应的推荐实体。
  17. 一种计算机存储介质,所述计算机存储介质被编码有计算机程序,所述程序在被一个或多个计算机执行时,使得所述一个或多个计算机执行如下操作:
    获得知识图谱中各实体的文档内容特征向量、各实体之间的逻辑关联关系特征向量、各实体的用户行为关系特征向量和各实体的特征向量中至少一个;
    根据所述文档内容特征向量、所述逻辑关联关系特征向量、所述用户行为关系特征向量和所述特征向量中至少一个进行机器学习,生成深度融合模型。
  18. 一种计算机存储介质,所述计算机存储介质被编码有计算机程序,所述程序在被一个或多个计算机执行时,使得所述一个或多个计算机执行如下操作:
    获得指定实体对应的候选实体;
    将所述指定实体的文档内容特征向量、指定实体与候选实体之间的逻辑关联关系特征向量、所述指定实体的用户行为关系特征向量和指定实体的特征特征向量中至少一个,以及所述候选实体的文档内容特征向量和所述候选实体的特征向量中至少一个,输入深度融合模型,以获得所述候选实体的惊喜度;所述深度融合模型为利用权利要求1至3中一项所述方法获得的;
    根据所述惊喜度和所述候选实体,获得所述指定实体对应的推荐实体。
PCT/CN2016/089648 2015-11-18 2016-07-11 模型生成方法、推荐方法及对应装置、设备和存储介质 WO2017084362A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201510794561.8A CN105335519B (zh) 2015-11-18 2015-11-18 模型生成方法及装置、推荐方法及装置
CN201510794561.8 2015-11-18

Publications (1)

Publication Number Publication Date
WO2017084362A1 true WO2017084362A1 (zh) 2017-05-26

Family

ID=55286046

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2016/089648 WO2017084362A1 (zh) 2015-11-18 2016-07-11 模型生成方法、推荐方法及对应装置、设备和存储介质

Country Status (2)

Country Link
CN (1) CN105335519B (zh)
WO (1) WO2017084362A1 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108665394A (zh) * 2018-05-07 2018-10-16 北京文华在线教育科技股份有限公司 自适应学习方法及系统
CN109657069A (zh) * 2018-12-11 2019-04-19 北京百度网讯科技有限公司 知识图谱的生成方法及其装置
CN109697050A (zh) * 2019-01-07 2019-04-30 浙江大学 一种基于知识图谱面向电商领域的需求描述模型设计方法
CN109828965A (zh) * 2019-01-09 2019-05-31 北京小乘网络科技有限公司 一种数据处理的方法及电子设备
CN110555753A (zh) * 2019-08-14 2019-12-10 中国平安人寿保险股份有限公司 基于推荐的排序控制方法、装置、计算机设备及存储介质
CN110888990A (zh) * 2019-11-22 2020-03-17 深圳前海微众银行股份有限公司 文本推荐方法、装置、设备及介质
CN111428053A (zh) * 2020-03-30 2020-07-17 西安交通大学 一种面向税务领域知识图谱的构建方法
CN111949803A (zh) * 2020-08-21 2020-11-17 深圳供电局有限公司 一种基于知识图谱的网络异常用户检测方法、装置和设备
CN112950321A (zh) * 2021-03-10 2021-06-11 北京汇钧科技有限公司 一种物品推荐方法和装置
CN117787392A (zh) * 2024-02-23 2024-03-29 支付宝(杭州)信息技术有限公司 一种知识图谱的融合方法和装置

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105335519B (zh) * 2015-11-18 2021-08-17 百度在线网络技术(北京)有限公司 模型生成方法及装置、推荐方法及装置
CN105808931B (zh) * 2016-03-03 2019-05-07 北京大学深圳研究生院 一种基于知识图谱的针灸决策支持方法及装置
CN105912500B (zh) * 2016-03-30 2017-11-14 百度在线网络技术(北京)有限公司 机器学习模型生成方法和装置
CN106022877A (zh) * 2016-05-19 2016-10-12 华南理工大学 一种基于用户手游行为图谱的游戏推荐方法
CN106649774A (zh) * 2016-12-27 2017-05-10 北京百度网讯科技有限公司 基于人工智能的对象推送方法及装置
CN108804387B (zh) * 2017-04-27 2021-07-23 腾讯科技(深圳)有限公司 目标用户确定方法及装置
CN107330050A (zh) * 2017-06-28 2017-11-07 达而观信息科技(上海)有限公司 一种个性化推荐方法及系统
CN109388793B (zh) * 2017-08-03 2023-04-07 阿里巴巴集团控股有限公司 实体标注方法、意图识别方法及对应装置、计算机存储介质
CN107463701B (zh) * 2017-08-15 2020-09-08 北京百度网讯科技有限公司 基于人工智能推送信息流的方法和装置
CN107506486A (zh) * 2017-09-21 2017-12-22 北京航空航天大学 一种基于实体链接的关系扩充方法
TWI651664B (zh) * 2017-11-15 2019-02-21 財團法人資訊工業策進會 模型生成伺服器及其模型生成方法
CN108509479B (zh) * 2017-12-13 2022-02-11 深圳市腾讯计算机系统有限公司 实体推荐方法及装置、终端及可读存储介质
CN108334588B (zh) * 2018-01-29 2021-03-23 北京搜狐新媒体信息技术有限公司 一种用户标签构建方法及装置
CN108345702A (zh) * 2018-04-10 2018-07-31 北京百度网讯科技有限公司 实体推荐方法和装置
CN108829854B (zh) * 2018-06-21 2021-08-31 北京百度网讯科技有限公司 用于生成文章的方法、装置、设备和计算机可读存储介质
CN109829116B (zh) * 2019-02-14 2021-07-30 北京达佳互联信息技术有限公司 一种内容推荐方法、装置、服务器及计算机可读存储介质
CN111782774B (zh) * 2019-04-03 2024-04-19 北京嘀嘀无限科技发展有限公司 一种问题推荐的方法及装置
CN110674394B (zh) * 2019-08-20 2024-03-15 腾讯科技(深圳)有限公司 一种基于知识图谱的信息推荐方法、装置及存储介质
CN110728783A (zh) * 2019-08-31 2020-01-24 苏州浪潮智能科技有限公司 一种人脸识别系统的自我纠正方法、系统及设备
CN110717099B (zh) * 2019-09-25 2022-04-22 优地网络有限公司 一种推荐影片的方法及终端
CN112182115A (zh) * 2020-09-10 2021-01-05 珠海格力电器股份有限公司 关系的展示方法和装置、存储介质、电子装置
CN112291272B (zh) * 2020-12-24 2021-05-11 鹏城实验室 网络威胁检测方法、装置、设备及计算机可读存储介质
CN113536137A (zh) * 2021-08-13 2021-10-22 北京字节跳动网络技术有限公司 一种信息展示方法、装置以及计算机存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101114294A (zh) * 2007-08-22 2008-01-30 杭州经合易智控股有限公司 自助式智能垂直搜索方法
CN104035917A (zh) * 2014-06-10 2014-09-10 复旦大学 一种基于语义空间映射的知识图谱管理方法和系统
CN104462293A (zh) * 2014-11-27 2015-03-25 百度在线网络技术(北京)有限公司 搜索处理方法、生成搜索结果排序模型的方法和装置
CN105335519A (zh) * 2015-11-18 2016-02-17 百度在线网络技术(北京)有限公司 模型生成方法及装置、推荐方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101436191A (zh) * 2007-11-13 2009-05-20 日电(中国)有限公司 用于计算对象之间竞争性度量的方法与系统
CN103593792B (zh) * 2013-11-13 2016-09-28 复旦大学 一种基于中文知识图谱的个性化推荐方法与系统
CN104090963A (zh) * 2014-07-14 2014-10-08 百度在线网络技术(北京)有限公司 查询信息推荐方法和装置
CN104346446A (zh) * 2014-10-27 2015-02-11 百度在线网络技术(北京)有限公司 一种基于知识图谱的论文关联信息推荐方法及装置
CN104484459B (zh) * 2014-12-29 2019-07-23 北京奇虎科技有限公司 一种对知识图谱中的实体进行合并的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101114294A (zh) * 2007-08-22 2008-01-30 杭州经合易智控股有限公司 自助式智能垂直搜索方法
CN104035917A (zh) * 2014-06-10 2014-09-10 复旦大学 一种基于语义空间映射的知识图谱管理方法和系统
CN104462293A (zh) * 2014-11-27 2015-03-25 百度在线网络技术(北京)有限公司 搜索处理方法、生成搜索结果排序模型的方法和装置
CN105335519A (zh) * 2015-11-18 2016-02-17 百度在线网络技术(北京)有限公司 模型生成方法及装置、推荐方法及装置

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108665394B (zh) * 2018-05-07 2021-11-30 北京文华在线教育科技股份有限公司 自适应学习方法及系统
CN108665394A (zh) * 2018-05-07 2018-10-16 北京文华在线教育科技股份有限公司 自适应学习方法及系统
CN109657069A (zh) * 2018-12-11 2019-04-19 北京百度网讯科技有限公司 知识图谱的生成方法及其装置
CN109697050A (zh) * 2019-01-07 2019-04-30 浙江大学 一种基于知识图谱面向电商领域的需求描述模型设计方法
CN109697050B (zh) * 2019-01-07 2021-04-27 浙江大学 一种基于知识图谱面向电商领域的需求描述模型设计方法
CN109828965A (zh) * 2019-01-09 2019-05-31 北京小乘网络科技有限公司 一种数据处理的方法及电子设备
CN110555753A (zh) * 2019-08-14 2019-12-10 中国平安人寿保险股份有限公司 基于推荐的排序控制方法、装置、计算机设备及存储介质
CN110888990A (zh) * 2019-11-22 2020-03-17 深圳前海微众银行股份有限公司 文本推荐方法、装置、设备及介质
CN110888990B (zh) * 2019-11-22 2024-04-12 深圳前海微众银行股份有限公司 文本推荐方法、装置、设备及介质
CN111428053A (zh) * 2020-03-30 2020-07-17 西安交通大学 一种面向税务领域知识图谱的构建方法
CN111428053B (zh) * 2020-03-30 2023-10-20 西安交通大学 一种面向税务领域知识图谱的构建方法
CN111949803A (zh) * 2020-08-21 2020-11-17 深圳供电局有限公司 一种基于知识图谱的网络异常用户检测方法、装置和设备
CN111949803B (zh) * 2020-08-21 2024-05-28 深圳供电局有限公司 一种基于知识图谱的网络异常用户检测方法、装置和设备
CN112950321A (zh) * 2021-03-10 2021-06-11 北京汇钧科技有限公司 一种物品推荐方法和装置
CN117787392A (zh) * 2024-02-23 2024-03-29 支付宝(杭州)信息技术有限公司 一种知识图谱的融合方法和装置

Also Published As

Publication number Publication date
CN105335519B (zh) 2021-08-17
CN105335519A (zh) 2016-02-17

Similar Documents

Publication Publication Date Title
WO2017084362A1 (zh) 模型生成方法、推荐方法及对应装置、设备和存储介质
US10552488B2 (en) Social media user recommendation system and method
WO2022041979A1 (zh) 一种信息推荐模型的训练方法和相关装置
WO2020083020A1 (zh) 确定用户对物品的兴趣度的方法与装置、设备和存储介质
JP5736469B2 (ja) ユーザ意図の有無に基づく検索キーワードの推薦
US9997157B2 (en) Knowledge source personalization to improve language models
CN105431844B (zh) 用于搜索系统的第三方搜索应用
US20180101540A1 (en) Diversifying Media Search Results on Online Social Networks
US10216851B1 (en) Selecting content using entity properties
US8782051B2 (en) System and method for text categorization based on ontologies
CN104750798B (zh) 一种应用程序的推荐方法和装置
US20180114136A1 (en) Trend identification using multiple data sources and machine learning techniques
US11256747B1 (en) Data reduction for node graph creation
US10467307B1 (en) Grouping of item data using seed expansion
US9767417B1 (en) Category predictions for user behavior
US11055312B1 (en) Selecting content using entity properties
KR20150018474A (ko) 시맨틱 키워드를 추출하기 위한 방법, 비일시성의 시스템 및 컴퓨터 판독 가능한 기록 매체
US9767204B1 (en) Category predictions identifying a search frequency
US10353966B2 (en) Dynamic attributes for searching
WO2018058118A1 (en) Method, apparatus and client of processing information recommendation
US10474670B1 (en) Category predictions with browse node probabilities
RU2744028C2 (ru) Способ и система для хранения множества документов
CN106462588B (zh) 来自所提取的内容的内容创建
US10387934B1 (en) Method medium and system for category prediction for a changed shopping mission
US10394913B1 (en) Distributed grouping of large-scale data sets

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16865541

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 16865541

Country of ref document: EP

Kind code of ref document: A1