CN112256719A - 实体查询方法、装置、可读介质与电子设备 - Google Patents
实体查询方法、装置、可读介质与电子设备 Download PDFInfo
- Publication number
- CN112256719A CN112256719A CN202011126459.8A CN202011126459A CN112256719A CN 112256719 A CN112256719 A CN 112256719A CN 202011126459 A CN202011126459 A CN 202011126459A CN 112256719 A CN112256719 A CN 112256719A
- Authority
- CN
- China
- Prior art keywords
- entity
- candidate
- user
- target
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 83
- 230000003993 interaction Effects 0.000 claims abstract description 141
- 238000012549 training Methods 0.000 claims description 36
- 230000006399 behavior Effects 0.000 claims description 32
- 230000002452 interceptive effect Effects 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 16
- 238000003062 neural network model Methods 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 13
- 238000011156 evaluation Methods 0.000 claims description 12
- 239000000126 substance Substances 0.000 claims description 3
- 230000000875 corresponding effect Effects 0.000 description 170
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 235000019633 pungent taste Nutrition 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/288—Entity relationship models
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开涉及一种实体查询方法、装置、可读介质与电子设备,以提升查询效率。所述方法包括:接收用户发送的查询请求,所述查询请求包括实体信息;确定与所述实体信息匹配的多个候选实体,获取各所述候选实体对应的至少两个维度的特征数据;其中,所述维度包括所述候选实体与所述用户的交互维度;根据各所述候选实体对应的至少两个维度的特征数据,确定与所述实体信息匹配的目标实体。
Description
技术领域
本公开涉及计算机技术领域,具体地,涉及一种实体查询方法、装置、可读介质与电子设备。
背景技术
随着互联网技术的发展,各平台(或者,应用程序)的用户数量逐渐增多,因此,对平台的用户搜索(或查询)功能的需求也越来越多。一般情况下,用户会主动输入用于查询的信息,搜索引擎会根据该信息返回一些结果。例如,用户在搜索框中输入“用户A”,搜索引擎会返回一些可能是“用户A”的搜索结果。
相关技术中,一般通过与用户输入内容之间的相关性、热度等信息确定展现的查询结果。但是,上述方式依赖于用户的输入内容,也就是说,不同用户输入相同的内容,会得到相同的返回结果,而返回的结果可能与用户的搜索意图并不匹配,导致用户无法快速定位自己查询的内容,查询效率低。
发明内容
提供该发明内容部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
第一方面,本公开提供一种实体查询方法,所述方法包括:
接收用户发送的查询请求,所述查询请求包括实体信息;
确定与所述实体信息匹配的多个候选实体,获取各所述候选实体对应的至少两个维度的特征数据;其中,所述维度包括所述候选实体与所述用户的交互维度;
根据各所述候选实体对应的至少两个维度的特征数据,确定与所述实体信息匹配的目标实体。
第二方面,本公开提供一种实体查询方法,所述方法包括:
接收用户的查询请求,所述查询请求包括实体信息;
获取与所述实体信息匹配的目标实体;其中,所述目标实体至少基于所述目标实体对应的与所述用户交互维度的特征数据确定;
展示所述目标实体的目标实体信息。
第三方面,本公开提供一种实体查询装置,所述装置包括:
第一接收模块,用于接收用户发送的查询请求,所述查询请求包括实体信息;
第一获取模块,用于确定与所述实体信息匹配的多个候选实体,获取各所述候选实体对应的至少两个维度的特征数据;其中,所述维度包括所述候选实体与所述用户的交互维度;
确定模块,用于根据各所述候选实体对应的至少两个维度的特征数据,确定与所述实体信息匹配的目标实体。
第四方面,本公开提供一种实体查询装置,所述装置包括:
第二接收模块,用于接收用户的查询请求,所述查询请求包括实体信息;
第二获取模块,用于获取与所述实体信息匹配的目标实体;其中,所述目标实体至少基于所述目标实体对应的与所述用户交互维度的特征数据确定;
展示模块,用于展示所述目标实体的目标实体信息。
第五方面,本公开提供一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现本公开第一方面所述方法的步骤,或者,该程序被处理装置执行时实现本公开第二方面所述方法的步骤。
第六方面,本公开提供一种电子设备,包括:
存储装置,其上存储有计算机程序;
处理装置,用于执行所述存储装置中的所述计算机程序,以实现本公开第一方面所述方法的步骤,或者,实现本公开第二方面所述方法的步骤。
通过上述技术方案,接收用户发送的查询请求,查询请求包括实体信息,确定与实体信息匹配的多个候选实体,获取各候选实体对应的至少两个维度的特征数据,并根据各所述候选实体对应的至少两个维度的特征数据,确定与所述实体信息匹配的目标实体。其中,至少两个维度中包括候选实体与用户的交互维度。一方面,通过实体信息,能够从信息匹配的角度帮助确定各候选实体与实体信息的符合程度;另一方面,通过各候选实体对应于与用户的交互维度的特征数据,能够从互动性、亲密性的角度帮助确定各候选实体与用户的亲密程度。从而,基于实体信息和候选实体对应的至少两个维度的特征数据,能够至少兼顾信息匹配与亲密性两方面,获得更加符合用户期望的目标实体,提升查询准确性及效率,有利于为用户提供个性化查询,进而提升用户的查询体验。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。在附图中:
图1是根据本公开的一种实施方式提供的实体查询方法的流程图;
图2是根据本公开提供的实体查询方法中,根据各候选实体对应的至少两个维度的特征数据,确定与实体信息匹配的目标实体的步骤的一种示例性的流程图;
图3是根据本公开的一种实施方式提供的实体查询方法的流程图;
图4至图6是几种示例性的目标实体信息的展示示意图;
图7是根据本公开的一种实施方式提供的实体查询装置的框图;
图8是根据本公开的一种实施方式提供的实体查询装置的框图;
图9示出了适于用来实现本公开实施例的电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
如背景技术所述,用户主动输入用于查询的信息,搜索引擎会根据该信息返回一些结果。相关技术中,一般通过与用户输入内容之间的相关性、热度等信息确定待展现的查询结果。为了获得查询结果,一般为候选内容与用户输入内容之间的相关性、候选内容的热度这几者各自分配一个权重,针对每一候选内容,根据候选内容与用户输入内容之间的相关性、候选内容的热度各自对应的权重,按照如下公式计算出一数值结果:
数值结果=w1*相关性数值+w2*热度数值
其中,w1为候选内容与用户输入内容之间的相关性对应的权重,w2为候选内容的热度对应的权重。并且,候选内容对应的数值结果越大,表示该候选内容越有可能是用户所要查询的内容。
之后,根据各候选内容对应的数值结果的大小,将数值结果较大的一个或若干个候选内容作为查询结果返回给用户,同时,在返回给用户的查询结果中,可以按照数值结果的大小进行排序。
然而,由于每个用户本身的搜索、查询需求不同,不同的用户输入相同的内容,所期望的针对该内容的结果可能不同,例如,不同的用户输入相同的文本“用户A”,所寻找的可能并不是同一个用户A,也就是说,对于相同的输入内容,不同的用户所期望的查询结果可能并不相同。而在上述方式中,只要用户输入的内容相同,就会得到完全一致的结果,并未考虑到用户与各个候选内容之间的关系,因此,可能导致用户想找的内容排序较为靠后,甚至不会被作为查询结果返回。可见,上述方式无法准确匹配用户的搜索意图,用户无快速定位自身查询的内容,导致查询效率低,用户的查询体验不佳。
为了解决上述问题,本公开提供一种实体查询方法、装置、可读介质与电子设备,能够为用户提供个性化查询结果,提升实体查询的准确性,提升用户的查询体验。
图1是根据本公开的一种实施方式提供的实体查询方法的流程图。如图1所示,该方法可以包括以下步骤。
在步骤11中,接收由用户发送的查询请求。
其中,查询请求包括实体信息。实体信息用于指示查询请求所查询的实体是什么样的实体,实体可以例如为账号、媒体文件等。为了说明方便,本文中将以实体为账号作为示例,对本公开方法中的相关步骤进行说明。
示例地,实体信息可以为实体名称。再例如,实体信息可以为实体对应的ID(Identity document,身份证标识号)。
举例来说,假设为用户提供用于查询的操作界面,该操作界面包括查询输入框和查询按钮,用户通过查询界面的查询输入框输入内容、且按下查询按钮后,查询请求生成,用户通过查询输入框输入的内容就是实体信息。此时,即接收到用户发送的查询请求。
在步骤12中,确定与实体信息匹配的多个候选实体,获取各候选实体对应的至少两个维度的特征数据。
在这里,候选实体可以为已有实体中的全部或部分实体。
在一种可能的情况中,候选实体为已有实体中除本用户之外的所有实体。在另一种可能的情况中,还可以预先对已有实体按照一定的筛选条件进行匹配筛选,并将通过筛选的实体作为候选实体。其中,匹配筛选条件可以根据实际需求自由设定。示例地,匹配筛选条件可以为候选实体的实体信息与查询请求的实体信息之间的相似度高于某一值。再例如,匹配筛选条件可以为候选实体的粉丝数量高于某一值。
在确定好多个候选实体之后,针对多个候选实体中的每一候选实体,可以获取各候选实体对应的至少两个维度的特征数据。其中,上述至少两个维度包括候选实体与用户的交互维度。
候选实体对应的交互维度的特征数据可以用于表征候选实体与用户的亲密程度。示例地,候选实体对应的交互维度的特征数据可以通过候选实体与用户之间的关注关系(如用户关注候选实体、或候选实体关注用户)确定,若候选实体与用户之间不存在关注关系,可以表示候选实体与用户的亲密程度较低,而若候选实体与用户之间存在关注关系,可表示候选实体与用户的亲密程度较高。再例如,候选实体对应的交互维度的特征数据可以通过候选实体与用户是否存在共同好友确定,若候选实体与用户不存在共同好友,可以表示候选实体与用户的亲密程度较低,若候选实体与用户存在共同好友,可以表示候选实体与用户的亲密程度较高,并且,二者共同好友的数量越多,可以表示二者之间的亲密程度越高。
另外,除了交互维度,上述维度中还可以包括以下中的至少一者:相关性维度、属性维度、交互性预测维度。
在步骤13中,根据各候选实体对应的至少两个维度的特征数据,确定与实体信息匹配的目标实体。
在确定各候选实体对应的至少两个维度的特征数据后,根据各候选实体对应的至少两个维度的特征数据,可以从候选实体中确定出与实体信息匹配的目标实体,作为对应于查询请求的查询结果。一方面,通过实体信息,能够从信息匹配的角度帮助确定各候选实体与实体信息的符合程度;另一方面,通过各候选实体对应于与用户的交互维度的特征数据,能够从互动性、亲密性的角度帮助确定各候选实体与用户的亲密程度。从而,两方面结合,能够获得更加符合用户期望的目标实体,提升查询效率。
通过上述技术方案,接收用户发送的查询请求,查询请求包括实体信息,确定与实体信息匹配的多个候选实体,获取各候选实体对应的至少两个维度的特征数据,并根据各所述候选实体对应的至少两个维度的特征数据,确定与所述实体信息匹配的目标实体。其中,至少两个维度中包括候选实体与用户的交互维度。一方面,通过实体信息,能够从信息匹配的角度帮助确定各候选实体与实体信息的符合程度;另一方面,通过各候选实体对应于与用户的交互维度的特征数据,能够从互动性、亲密性的角度帮助确定各候选实体与用户的亲密程度。从而,基于实体信息和候选实体对应的至少两个维度的特征数据,能够至少兼顾信息匹配与亲密性两方面,获得更加符合用户期望的目标实体,提升查询准确性及效率,有利于为用户提供个性化查询,进而提升用户的查询体验。
为了使本领域技术人员更加理解本发明实施例提供的技术方案,下面对上文中的相应步骤及相关概念进行详细的说明。
在一种可能的实施方式中,步骤12中,候选实体对应的交互维度的特征数据可以通过如下方式获得:
获取候选实体在预设交互特征项下相对于用户的交互数据;
根据交互数据,通过亲密度模型确定候选实体与用户之间的亲密值,作为候选实体对应的交互维度的特征数据。
也就是说,针对每一预设交互特征项,可以获取候选实体在该预设交互特征项下相对于用户的交互数据,进而,根据交互数据,确定候选实体与用户之间的亲密值,并将该亲密值作为候选实体对应的交互维度的特征数据。
其中,预设交互特征项可以根据实际需求人为设置。预设交互特征项为用于表征实体间亲密程度的特征,相应地,预设交互特征项下的交互数据就是候选实体对应于该预设交互特征项的具体内容。举例来说,若预设交互特征项为共同好友数据,则这一预设交互特征项下的交互数据就是候选实体与用户的共同好友的相关信息(例如,实体名称),这一交互数据可以通过用户的好友关系和候选实体的好友关系获得。再例如,若预设交互特征项为是否同城,则这一预设交互特征项下的交互数据就是同城或非同城,这一交互数据可以通过候选实体对应的地理位置与用户对应的地理位置是否处于同一城市获得。
在一种可能的实施方式中,预设交互特征项可以包括以下至少一种:用于反映实体间社交关系的第一特征项、用于反映实体间行为关系的第二特征项、用于反映实体间地理位置距离的第三特征项。相应地,在这一实施方式中,获取候选实体在预设交互特征项下相对于用户的交互数据,可以包括以下中的至少一种:
根据用户的第一社交关系数据和/或候选实体的第二社交关系数据,确定候选实体在第一特征项下相对于用户的交互数据;
根据用户的历史行为数据获取关联信息,基于关联信息确定候选实体在第二特征项下相对于用户的交互数据;
根据用户对应的第一地理位置和候选实体对应的第二地理位置,确定候选实体在第三特征项下相对于用户的交互数据。
第一特征项可以是反映实体间社交关系(如,候选实体关注用户,或者,候选实体被用户关注、候选实体是否与用户存在共同好友、候选实体与用户的共同好友数据等)的特征项。
第二特征项可以反映候选实体与用户历史行为之间的关联,例如,若实体所在平台(或,应用程序)提供观看视频、视频评论等功能,则第二特征项可以例如为候选实体是否为用户观看过的视频的作者、候选实体是否在用户观看过的视频中被提到、候选实体是否在用户观看过的视频的标题中出现、候选实体是否针对用户观看过的视频发布过评论、候选实体是否在用户观看过的视频的评论中被提到等。再例如,若实体所在平台(或,应用程序)提供观看直播等功能,则第二特征项可以例如为候选实体是否为用户观看过的直播的主播、候选实体是否曾在用户观看过的直播中与主播连麦、候选实体是否在用户观看过的直播中送出礼物、候选实体是否在用户观看过的直播中发言、候选实体是否与用户看过相同的直播、候选实体是否在用户观看过的直播中被提到等。
第三特征项可以例如为候选实体所在的地理位置与用户所在的地理位置是否为同城、候选实体所在的地理位置与用户所在的地理位置之间的距离等。其中,预设交互特征项所包括的第一特征项、第二特征项或第三特征项均可以为多种。
相应地,根据用户的第一社交关系数据和/或候选实体的第二社交关系数据,可以确定候选实体在第一特征项下相对于用户的交互数据。其中,若第一特征项为实体间关注关系,则仅通过用户的第一社交关系数据,或者,仅通过候选实体的第二社交关系数据即可获得。若第一特种特征项为候选实体和用户的共同好友数据,则需要通过用户的第一社交关系数据和候选实体的第二社交关系数据获得。
以及,根据用户的历史行为数据获取关联信息,基于关联信息确定候选实体在第二特征项下相对于用户的交互数据。其中,如上所述,历史行为数据可以包含用户历史的所有行为,例如浏览行为、评论行为、点赞行为等,基于这些行为可以得到关联信息,关联信息可以基于用户在执行历史行为数据中行为的过程中涉及到了哪些实体。
以及,根据用户对应的第一地理位置和候选实体对应的第二地理位置,可以确定二者之间的距离、确定二者是否同城等,从而能够确定候选实体在第三特征项下相对于用户的交互数据。
在获取到上述交互数据之后,可以进一步根据这些交互数据,确定候选实体与用户之间的亲密值,进而得到候选实体对应的交互维度的特征数据。其中,候选实体与用户之间的亲密值可以根据交互数据,通过亲密度模型确定出。
示例地,亲密度模型可以通过如下方式获得:
获取多组第一训练数据;
根据多组第一训练数据,对预设神经网络模型进行训练,以获得亲密度模型。
其中,每一组第一训练数据可以包括第一实体在预设交互特征项下相对于第二实体的历史交互数据以及用于表征第一实体与第二实体之间的亲密程度的历史亲密值。第一实体在预设交互特征项下相对于第二实体的历史交互数据可以通过多维特征向量体现,其中每一维度对应一种预设交互特征项,每一维对应的数据就是相应预设交互特征项下的交互数据。
并且,预设神经网络模型的网络复杂度大于第一复杂度,或者,预设神经网络模型的网络复杂度小于第二复杂度,第一复杂度大于第二复杂度,且不同的复杂度对应于模型内部结构的不同复杂程度。
对于延时要求低的场景,由于对模型的输出速度没有高要求,因此,在训练时,可以适当设置预设神经网络模型的结构,以使其网络复杂度大于第一复杂度,这样获得的亲密度模型能够输出较为准确的输出结果。
对于延时要求高的场景,由于对模型的输出速度有较高要求,因此,在训练时,可以适当设置预设神经网络模型的结构,以使其网络复杂度小于第二复杂度,这样获得的亲密度模型能够基于输入数据较快地输出结果。
上述针对神经网络模型的具体训练方式属于本领域的公知常识,此处对更加细节的内容不再赘述。
根据候选实体在预设交互特征项下相对于用户的交互数据,可以获得对应的特征向量,将该特征向量输入至亲密度模型,可通过亲密度模型确定候选实体与用户之间的亲密值。示例地,若预设交互特征项共有16项,则通过候选实体在预设交互特征项下相对于用户的交互数据,可以获得16维特征向量,特征向量中每一维对应一种预设交互特征项,每一维对应的数据就是相应预设交互特征项下的交互数据。
通过上述方案,可以通过预设交互特征项,系统地收集能够表征候选实体与用户间亲密程度的交互数据,便于后续利用这些数据确定出更优的目标,且预设交互特征项可以根据实际需求人为设置,灵活性很高。同时,使用预先训练好的亲密度模型,能够通过上述交互数据快速且准确地得到亲密值结果。
另外,如前文所述,除了交互维度,上述维度中还可以包括相关性维度、属性维度、交互性预测维度中的至少一者。下面将依次针对这些维度,对这些维度下的特征数据的获得方式进行详细说明。
示例地,候选实体对应的相关性维度的特征数据可以通过如下方式获得:
确定候选实体的实体信息和查询请求所包括的实体信息之间的文本相似度,并将文本相似度作为候选实体对应的相关性维度的特征数据。
其中,文本相似度的计算方式为本领域的公知常识,此处不详细列出。从而,在计算出候选实体的实体信息和查询请求所包括的实体信息之间的文本相似度之后,即可将文本相似度对应的数值作为候选实体对应的相关性维度的特征数据。
示例地,候选实体对应的属性维度的特征数据可以通过如下方式获得:
通过预设的多个权威性评价指标,以及候选实体对应于各权威性评价指标的关联数据,确定候选实体的权威值,并将权威值作为候选实体对应的属性维度的特征数据。
其中,预设的权威性评价指标可以包括但不限于以下中的至少一者:粉丝数、知名度、专业程度等。示例地,可以预先设置权威性评价指标下不同表现与权威值之间的计算公式或对应关系,从而,针对预设的权威性评价指标,获取候选实体对应于各指标的关联数据,之后,根据这些数据以及预先设置的计算公式或对应关系,即可确定出权威值,再将权威值对应的数值作为候选实体对应的属性维度的特征数据。
并且,上述计算公式和对应关系可以根据实际需求自由设置。例如,预设的权威性评价指标为粉丝数量,则可以设置粉丝数量与权威值之间的对应关系,在确定权威值时,根据候选实体的粉丝数量以及该对应关系即可得到。其中,粉丝数量与权威值呈正相关关系。
示例地,候选实体对应的交互性预测维度的特征数据可以通过如下方式获得:
根据用户的第一交互行为信息和候选实体的第二交互行为信息,通过预测模型确定用户对候选实体的交互概率,并将交互概率作为候选实体对应的交互性预测维度的特征数据。
其中,用户对候选实体的交互概率可以例如通过用户点击候选实体的概率、用户为候选实体点赞的概率、用户收藏候选实体的概率、用户推荐候选实体的概率等体现。示例地,若用户对候选实体的交互概率通过用户点击候选实体的概率体现,则预测模型可以使用CTR预估模型(Click-Through-Rate,点击通过率),该CTR预估模型可以通过用户的第一交互行为信息和候选实体的第二交互行为信息获得。
在一种可能的实施方式中,步骤13中,根据各候选实体对应的至少两个维度的特征数据,确定与实体信息匹配的目标实体,可以包括以下步骤:
确定每一候选实体的实体信息与查询请求的实体信息之间的相似度;
将相似度大于相似度阈值、且候选实体在预设交互特征项下相对于用户的交互数据中存在预设信息的候选实体确定为所述查询结果。
其中,预设信息可以设置为能够表征两个实体之间具有较高亲密程度所对应的信息。例如,预设信息可以为候选实体与用户存在超过K个共同好友,K为预设正整数。
这样,根据相似度和相似度阈值,能够筛选出与查询请求的实体信息相似的候选实体,同时,根据候选实体在预设交互特征项下相对于用户的交互数据和预设信息,能够筛选出与用户亲密程度较高的候选实体,两者结合,就可以生成兼顾实体信息相似度和实体间亲密程度的查询结果。
在另一种可能的实施方式中,步骤13中,根据各候选实体对应的至少两个维度的特征数据,确定与实体信息匹配的目标实体,可以包括以下步骤,如图2所示:
在步骤21中,针对每一候选实体,根据候选实体对应的至少两个维度的特征数据,以及至少两个维度中各维度对应的权重,计算候选实体对应的匹配值;
在步骤22中,根据每一候选实体对应的匹配值,确定目标实体。
其中,匹配值能够反映候选实体与用户发送的查询请求所包括的实体信息之间的匹配程度。
针对每一候选实体,根据候选实体对应的至少两个维度的特征数据,以及至少两个维度中各维度对应的权重,进行加权求和,将得到的数值作为候选实体对应的匹配值。
示例地,至少两个维度中各维度对应的权重可以是预先设置好的定值,例如,可根据经验值设定。
再例如,至少两个维度中各维度对应的权重可以通过权重模型获得。其中,权重模型可以通过如下方式获得:
获取多组每一组第二训练数据包括第三实体在至少两个维度的历史特征数据、至少两个维度中各维度对应的历史权重以及用于表征其他实体是否与第三实体存在预设互动行为的标签信息;
根据多组第二训练数据,对预设线性模型进行训练,以获得权重模型。
其中,利用训练数据训练线性模型的方式属于本领域的公知常识,此处不再详细描述。
在一种可能的实施方式中,步骤22,根据每一候选实体对应的匹配值,确定目标实体,可以包括以下步骤:
根据每一候选实体对应的匹配值,将最大的前N个匹配值对应的候选实体确定为目标实体。其中,N为正整数。
示例地,目标实体的顺序可以参照候选实体对应的匹配值确定,例如,按照匹配值由大到小的由先到后顺序排列。
在确定目标实体后,目标实体可以作为查询结果向用户展示,或用于向用户提供查询建议。在展示目标实体时,可以显示与目标实体相关的信息(例如,实体名称、实体ID、实体粉丝数等)。
在一种可能的实施方式中,本公开提供的方法还可以包括以下步骤:
针对每一目标实体,执行如下操作:
根据目标实体对应的至少两个维度的特征数据,以及述至少两个维度中各维度对应的权重,计算目标实体对应于每个维度的特征值;
根据目标实体对应于每个维度的特征值以及每个维度各自对应的特征阈值,确定目标实体对应的目标维度;
根据目标实体对应于目标维度的特征数据,生成与述目标实体对应的实体标签,并将实体标签与目标实体相关联。
针对目标实体对应的至少两个维度中的每一维度,可以将该维度的特征数据与该维度对应的权重二者的乘积作为目标实体对应于该维度的特征值。从而,可以确定出目标实体对应于至少两个维度中每个维度的特征值。
同时,目标实体对应的至少两个维度中每个维度均可以对应有一特征阈值,该特征阈值可以根据实际需求或经验值预先设定。从而,针对任一维度,若该维度对应的特征值大于或者等于该维度对应的特征阈值,则可以将该维度确定为目标实体对应的目标维度。若目标实体D1的目标维度为D2,则说明目标实体D1在目标维度D2表现较为优秀,在目标维度D2下与用户存在更多的共性。
进而,根据目标实体对应于目标维度的特征数据,可以生成与目标实体对应的实体标签,并将生成的实体标签与该目标实体相关联,可在后续展示场景中在目标实体对应的位置处展示该实体标签。示例地,若目标维度为交互维度,则实体标签可以通过目标实体在预设交互特征项下相对于用户的特征数据生成。
其中,实体标签可以例如为关注的人、评论过的实体、附近的人、共同好友等。例如,若目标维度为交互维度,且预设交互特征项包含共同好友数据这一项,而这一项对应的交互数据为AA、BB、CC,那么,生成的实体标签可以为“存在共同好友AA、BB、CC”。
通过上述方式,生成与目标实体相关联的实体标签,能够更加直接地标识二者之间的相关关系,也能标识目标实体被判定为与用户相关程度高的原因,这样,在后续展示目标实体时,还可以同时展示实体标签,为用户提供较为直观的信息,用户可通过实体标签更加简单、快速地分辨当前实体是不是自己所查询的实体。
图3是根据本公开的一种实施方式提供的实体查询方法的流程图。如图3所示,该方法可以包括以下步骤。
在步骤31中,接收用户的查询请求。
其中,查询请求包括实体信息,有关于此的详细说明已在前文中给出,此处不赘述。
在步骤32中,获取与实体信息匹配的目标实体。
其中,目标实体至少基于目标实体对应的与用户交互维度的特征数据确定。详细的目标实体的确定方式已在前文中给出,此处不再重复说明。
在步骤33中,展示目标实体的目标实体信息。
目标实体可以包括多个,且多个目标实体的展示顺序可以基于交互维度的特征数据确定,例如,如前文所述,匹配值越高,展示顺序越靠前。
示例地,步骤33可以包括以下步骤:
在搜索提示区域的各提示位置处展示所述目标实体的目标实体信息;和/或
在搜索结果展示页面展示所述目标实体的目标实体信息。
在一种情况中,可以无需用户主动搜索,仅根据用户的历史查询内容,为用户自动生成查询建议,并展示在与查询输入框相关的位置。示例地,搜索提示区域可以例如为查询输入框,或者,可以为查询输入框附近的位置。如图4所示,示出了搜索提示区域为查询输入框、且以查询输入框对应的单行位置为提示位置的目标实体信息展示界面。如图5所示,示出了搜索提示区域为查询输入框、且以包括查询输入框在内的多行位置为提示位置的目标实体信息展示界面。并且,在搜索提示区域的各提示位置处展示目标实体信息,可以基于上述展示顺序依次在各个提示位置处展示目标实体信息。
在另一种情况中,可以基于用户本次查询的输入内容,在用户确认查询(例如,用户点击查询按键)后,在搜索结果展示页面展示目标实体的目标实体信息。
另外,目标实体还可能关联有实体标签,则步骤33可以包括以下步骤:
若目标实体关联有实体标签,将与目标实体相关联的实体标签与目标实体信息关联展示。
示例地,若在搜索结果展示页面展示目标实体信息,则带有实体标签的展示野蛮可以如图6所示,其中30为用户KK的实体标签。
图7是根据本公开的一种实施方式提供的实体查询装置的框图。如图7所示,该装置70可以包括:
第一接收模块71,用于接收用户发送的查询请求,所述查询请求包括实体信息;
第一获取模块72,用于确定与所述实体信息匹配的多个候选实体,获取各所述候选实体对应的至少两个维度的特征数据;其中,所述维度包括所述候选实体与所述用户的交互维度;
确定模块73,用于根据各所述候选实体对应的至少两个维度的特征数据,确定与所述实体信息匹配的目标实体。
可选地,所述第一获取模块72包括:
获取子模块,用于获取所述候选实体在预设交互特征项下相对于所述用户的交互数据;
第一确定子模块,用于根据所述交互数据,通过亲密度模型确定所述候选实体与所述用户之间的亲密值,作为所述候选实体对应的交互维度的特征数据。
可选地,所述预设交互特征项包括以下至少一种:用于反映实体间社交关系的第一特征项、用于反映实体间行为关系的第二特征项、用于反映实体间地理位置距离的第三特征项;
所述获取子模块用于执行以下中的至少一种:
根据所述用户的第一社交关系数据和/或所述候选实体的第二社交关系数据,确定所述候选实体在所述第一特征项下相对于所述用户的交互数据;
根据所述用户的历史行为数据获取关联信息,基于所述关联信息确定所述候选实体在所述第二特征项下相对于所述用户的交互数据;
根据所述用户对应的第一地理位置和所述候选实体对应的第二地理位置,确定所述候选实体在所述第三特征项下相对于所述用户的交互数据。
可选地,所述亲密度模型通过如下方式获得:
获取多组第一训练数据,其中,每一组第一训练数据包括第一实体在所述预设交互特征项下相对于第二实体的历史交互数据以及用于表征所述第一实体与所述第二实体之间的亲密程度的历史亲密值;
根据所述多组第一训练数据,对预设神经网络模型进行训练,以获得所述亲密度模型;
其中,所述预设神经网络模型的网络复杂度大于第一复杂度,或者,所述预设神经网络模型的网络复杂度小于第二复杂度,所述第一复杂度大于所述第二复杂度,且不同的复杂度对应于模型内部结构的不同复杂程度。
可选地,所述维度还包括以下至少一种:相关性维度、属性维度、交互性预测维度;
所述候选实体对应的相关性维度的特征数据通过如下方式获得:
确定所述候选实体的实体信息和所述查询请求所包括的实体信息之间的文本相似度,并将所述文本相似度作为所述候选实体对应的相关性维度的特征数据;
所述候选实体对应的属性维度的特征数据通过如下方式获得:
通过预设的多个权威性评价指标,以及所述候选实体对应于各权威性评价指标的关联数据,确定所述候选实体的权威值,并将所述权威值作为所述候选实体对应的属性维度的特征数据;
所述候选实体对应的交互性预测维度的特征数据通过如下方式获得:
根据所述用户的第一交互行为信息和所述候选实体的第二交互行为信息,通过预测模型确定所述用户对所述候选实体的交互概率,并将所述交互概率作为所述候选实体对应的交互性预测维度的特征数据。
可选地,所述确定模块73包括:
第二确定子模块,用于针对每一所述候选实体,根据所述候选实体对应的至少两个维度的特征数据,以及所述至少两个维度中各维度对应的权重,计算所述候选实体对应的匹配值,其中,所述匹配值反映所述候选实体与所述实体信息之间的匹配程度;
第三确定子模块,用于根据每一所述候选实体对应的匹配值,确定所述目标实体。
可选地,所述至少两个维度中各维度对应的权重通过权重模型获得;
所述权重模型通过如下方式获得:
获取多组第二训练数据,每一组第二训练数据包括第三实体在所述至少两个维度的历史特征数据、所述至少两个维度中各维度对应的历史权重以及用于表征其他实体是否与所述第三实体存在预设互动行为的标签信息;
根据所述多组第二训练数据,对预设线性模型进行训练,以获得所述权重模型。
可选地,所述第三确定子模块用于:
根据每一所述候选实体对应的匹配值,将最大的前N个匹配值对应的候选实体确定为目标实体,其中,N为正整数。
可选地,所述装置70还包括:
针对每一所述目标实体,执行如下操作:
根据所述目标实体对应的至少两个维度的特征数据,以及所述至少两个维度中各维度对应的权重,计算所述目标实体对应于每个维度的特征值;
根据所述目标实体对应于每个维度的特征值以及每个维度各自对应的特征阈值,确定所述目标实体对应的目标维度;
根据所述目标实体对应于所述目标维度的特征数据,生成与所述目标实体对应的实体标签,并将所述实体标签与所述目标实体相关联。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图8是根据本公开的一种实施方式提供的实体查询装置的框图。如图8所示,该装置80可以包括:
第二接收模块81,用于接收用户的查询请求,所述查询请求包括实体信息;
第二获取模块82,用于获取与所述实体信息匹配的目标实体;其中,所述目标实体至少基于所述目标实体对应的与所述用户交互维度的特征数据确定;
展示模块83,用于展示所述目标实体的目标实体信息。
可选地,所述目标实体包括多个,多个所述目标实体的展示顺序是基于所述交互维度的特征数据确定的;其中,
所述展示模块83包括:
第一展示子模块,用于在搜索提示区域的各提示位置处展示所述目标实体的目标实体信息;和/或
第二展示子模块,用于在搜索结果展示页面展示所述目标实体的目标实体信息。
可选地,所述展示模块83包括:
第三展示子模块,用于若所述目标实体关联有实体标签,将与所述目标实体相关联的实体标签与所述目标实体信息关联展示。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
下面参考图9,其示出了适于用来实现本公开实施例的电子设备600的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图9示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图9所示,电子设备600可以包括处理装置(例如中央处理器、图形处理器等)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储装置608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有电子设备600操作所需的各种程序和数据。处理装置601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
通常,以下装置可以连接至I/O接口605:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置606;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置607;包括例如磁带、硬盘等的存储装置608;以及通信装置609。通信装置609可以允许电子设备600与其他设备进行无线或有线通信以交换数据。虽然图9示出了具有各种装置的电子设备600,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置609从网络上被下载和安装,或者从存储装置608被安装,或者从ROM 602被安装。在该计算机程序被处理装置601执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:接收用户发送的查询请求,所述查询请求包括实体信息;确定与所述实体信息匹配的多个候选实体,获取各所述候选实体对应的至少两个维度的特征数据;其中,所述维度包括所述候选实体与所述用户的交互维度;根据各所述候选实体对应的至少两个维度的特征数据,确定与所述实体信息匹配的目标实体。
或者,上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:接收用户的查询请求,所述查询请求包括实体信息;获取与所述实体信息匹配的目标实体;其中,所述目标实体至少基于所述目标实体对应的与所述用户交互维度的特征数据确定;展示所述目标实体的目标实体信息。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块的名称在某种情况下并不构成对该模块本身的限定,例如,第一接收模块还可以被描述为“接收由用户发送的查询请求的模块”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
根据本公开的一个或多个实施例,提供了一种实体查询方法,所述方法包括:
接收用户发送的查询请求,所述查询请求包括实体信息;
确定与所述实体信息匹配的多个候选实体,获取各所述候选实体对应的至少两个维度的特征数据;其中,所述维度包括所述候选实体与所述用户的交互维度;
根据各所述候选实体对应的至少两个维度的特征数据,确定与所述实体信息匹配的目标实体。
根据本公开的一个或多个实施例,提供了一种实体查询方法,所述候选实体对应的交互维度的特征数据通过如下方式获得:
获取所述候选实体在预设交互特征项下相对于所述用户的交互数据;
根据所述交互数据,通过亲密度模型确定所述候选实体与所述用户之间的亲密值,作为所述候选实体对应的交互维度的特征数据。
根据本公开的一个或多个实施例,提供了一种实体查询方法,所述预设交互特征项包括以下至少一种:用于反映实体间社交关系的第一特征项、用于反映实体间行为关系的第二特征项、用于反映实体间地理位置距离的第三特征项;
所述获取所述候选实体在预设交互特征项下相对于所述用户的交互数据,包括以下中的至少一种:
根据所述用户的第一社交关系数据和/或所述候选实体的第二社交关系数据,确定所述候选实体在所述第一特征项下相对于所述用户的交互数据;
根据所述用户的历史行为数据获取关联信息,基于所述关联信息确定所述候选实体在所述第二特征项下相对于所述用户的交互数据;
根据所述用户对应的第一地理位置和所述候选实体对应的第二地理位置,确定所述候选实体在所述第三特征项下相对于所述用户的交互数据。
根据本公开的一个或多个实施例,提供了一种实体查询方法,所述亲密度模型通过如下方式获得:
获取多组第一训练数据,其中,每一组第一训练数据包括第一实体在所述预设交互特征项下相对于第二实体的历史交互数据以及用于表征所述第一实体与所述第二实体之间的亲密程度的历史亲密值;
根据所述多组第一训练数据,对预设神经网络模型进行训练,以获得所述亲密度模型;
其中,所述预设神经网络模型的网络复杂度大于第一复杂度,或者,所述预设神经网络模型的网络复杂度小于第二复杂度,所述第一复杂度大于所述第二复杂度,且不同的复杂度对应于模型内部结构的不同复杂程度。
根据本公开的一个或多个实施例,提供了一种实体查询方法,所述维度还包括以下至少一种:相关性维度、属性维度、交互性预测维度;
所述候选实体对应的相关性维度的特征数据通过如下方式获得:
确定所述候选实体的实体信息和所述查询请求所包括的实体信息之间的文本相似度,并将所述文本相似度作为所述候选实体对应的相关性维度的特征数据;
所述候选实体对应的属性维度的特征数据通过如下方式获得:
通过预设的多个权威性评价指标,以及所述候选实体对应于各权威性评价指标的关联数据,确定所述候选实体的权威值,并将所述权威值作为所述候选实体对应的属性维度的特征数据;
所述候选实体对应的交互性预测维度的特征数据通过如下方式获得:
根据所述用户的第一交互行为信息和所述候选实体的第二交互行为信息,通过预测模型确定所述用户对所述候选实体的交互概率,并将所述交互概率作为所述候选实体对应的交互性预测维度的特征数据。
根据本公开的一个或多个实施例,提供了一种实体查询方法,所述根据各所述候选实体对应的至少两个维度的特征数据,确定与所述实体信息匹配的目标实体,包括:
针对每一所述候选实体,根据所述候选实体对应的至少两个维度的特征数据,以及所述至少两个维度中各维度对应的权重,计算所述候选实体对应的匹配值,其中,所述匹配值反映所述候选实体与所述实体信息之间的匹配程度;
根据每一所述候选实体对应的匹配值,确定所述目标实体。
根据本公开的一个或多个实施例,提供了一种实体查询方法,所述至少两个维度中各维度对应的权重通过权重模型获得;
所述权重模型通过如下方式获得:
获取多组第二训练数据,每一组第二训练数据包括第三实体在所述至少两个维度的历史特征数据、所述至少两个维度中各维度对应的历史权重以及用于表征其他实体是否与所述第三实体存在预设互动行为的标签信息;
根据所述多组第二训练数据,对预设线性模型进行训练,以获得所述权重模型。
根据本公开的一个或多个实施例,提供了一种实体查询方法,所述根据每一所述候选实体对应的匹配值,确定所述目标实体,包括:
根据每一所述候选实体对应的匹配值,将最大的前N个匹配值对应的候选实体确定为目标实体,其中,N为正整数。
根据本公开的一个或多个实施例,提供了一种实体查询方法,所述方法还包括:
针对每一所述目标实体,执行如下操作:
根据所述目标实体对应的至少两个维度的特征数据,以及所述至少两个维度中各维度对应的权重,计算所述目标实体对应于每个维度的特征值;
根据所述目标实体对应于每个维度的特征值以及每个维度各自对应的特征阈值,确定所述目标实体对应的目标维度;
根据所述目标实体对应于所述目标维度的特征数据,生成与所述目标实体对应的实体标签,并将所述实体标签与所述目标实体相关联。
根据本公开的一个或多个实施例,提供了一种实体查询方法,所述方法包括:
接收用户的查询请求,所述查询请求包括实体信息;
获取与所述实体信息匹配的目标实体;其中,所述目标实体至少基于所述目标实体对应的与所述用户交互维度的特征数据确定;
展示所述目标实体的目标实体信息。
根据本公开的一个或多个实施例,提供了一种实体查询方法,所述目标实体包括多个,多个所述目标实体的展示顺序是基于所述交互维度的特征数据确定的;其中,
所述展示所述目标实体的目标实体信息,包括:
在搜索提示区域的各提示位置处展示所述目标实体的目标实体信息;和/或
在搜索结果展示页面展示所述目标实体的目标实体信息。
根据本公开的一个或多个实施例,提供了一种实体查询方法,所述展示所述目标实体的目标实体信息,包括:
若所述目标实体关联有实体标签,将与所述目标实体相关联的实体标签与所述目标实体信息关联展示。
根据本公开的一个或多个实施例,提供了一种实体查询装置,所述装置包括:
第一接收模块,用于接收用户发送的查询请求,所述查询请求包括实体信息;
第一获取模块,用于确定与所述实体信息匹配的多个候选实体,获取各所述候选实体对应的至少两个维度的特征数据;其中,所述维度包括所述候选实体与所述用户的交互维度;
确定模块,用于根据各所述候选实体对应的至少两个维度的特征数据,确定与所述实体信息匹配的目标实体。
根据本公开的一个或多个实施例,提供了一种实体查询装置,所述装置包括:
第二接收模块,用于接收用户的查询请求,所述查询请求包括实体信息;
第二获取模块,用于获取与所述实体信息匹配的目标实体;其中,所述目标实体至少基于所述目标实体对应的与所述用户交互维度的特征数据确定;
展示模块,用于展示所述目标实体的目标实体信息。
根据本公开的一个或多个实施例,提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现本公开任意实施例所述的实体查询方法的步骤。
根据本公开的一个或多个实施例,提供了一种电子设备,包括:
存储装置,其上存储有计算机程序;
处理装置,用于执行所述存储装置中的所述计算机程序,以实现本公开任意实施例所述的实体查询方法的步骤。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
Claims (16)
1.一种实体查询方法,其特征在于,所述方法包括:
接收用户发送的查询请求,所述查询请求包括实体信息;
确定与所述实体信息匹配的多个候选实体,获取各所述候选实体对应的至少两个维度的特征数据;其中,所述维度包括所述候选实体与所述用户的交互维度;
根据各所述候选实体对应的至少两个维度的特征数据,确定与所述实体信息匹配的目标实体。
2.根据权利要求1所述的方法,其特征在于,所述候选实体对应的交互维度的特征数据通过如下方式获得:
获取所述候选实体在预设交互特征项下相对于所述用户的交互数据;
根据所述交互数据,通过亲密度模型确定所述候选实体与所述用户之间的亲密值,作为所述候选实体对应的交互维度的特征数据。
3.根据权利要求2所述的方法,其特征在于,所述预设交互特征项包括以下至少一种:用于反映实体间社交关系的第一特征项、用于反映实体间行为关系的第二特征项、用于反映实体间地理位置距离的第三特征项;
所述获取所述候选实体在预设交互特征项下相对于所述用户的交互数据,包括以下中的至少一种:
根据所述用户的第一社交关系数据和/或所述候选实体的第二社交关系数据,确定所述候选实体在所述第一特征项下相对于所述用户的交互数据;
根据所述用户的历史行为数据获取关联信息,基于所述关联信息确定所述候选实体在所述第二特征项下相对于所述用户的交互数据;
根据所述用户对应的第一地理位置和所述候选实体对应的第二地理位置,确定所述候选实体在所述第三特征项下相对于所述用户的交互数据。
4.根据权利要求2所述的方法,其特征在于,所述亲密度模型通过如下方式获得:
获取多组第一训练数据,其中,每一组第一训练数据包括第一实体在所述预设交互特征项下相对于第二实体的历史交互数据以及用于表征所述第一实体与所述第二实体之间的亲密程度的历史亲密值;
根据所述多组第一训练数据,对预设神经网络模型进行训练,以获得所述亲密度模型;
其中,所述预设神经网络模型的网络复杂度大于第一复杂度,或者,所述预设神经网络模型的网络复杂度小于第二复杂度,所述第一复杂度大于所述第二复杂度,且不同的复杂度对应于模型内部结构的不同复杂程度。
5.根据权利要求1所述的方法,其特征在于,所述维度还包括以下至少一种:相关性维度、属性维度、交互性预测维度;
所述候选实体对应的相关性维度的特征数据通过如下方式获得:
确定所述候选实体的实体信息和所述查询请求所包括的实体信息之间的文本相似度,并将所述文本相似度作为所述候选实体对应的相关性维度的特征数据;
所述候选实体对应的属性维度的特征数据通过如下方式获得:
通过预设的多个权威性评价指标,以及所述候选实体对应于各权威性评价指标的关联数据,确定所述候选实体的权威值,并将所述权威值作为所述候选实体对应的属性维度的特征数据;
所述候选实体对应的交互性预测维度的特征数据通过如下方式获得:
根据所述用户的第一交互行为信息和所述候选实体的第二交互行为信息,通过预测模型确定所述用户对所述候选实体的交互概率,并将所述交互概率作为所述候选实体对应的交互性预测维度的特征数据。
6.根据权利要求1所述的方法,其特征在于,所述根据各所述候选实体对应的至少两个维度的特征数据,确定与所述实体信息匹配的目标实体,包括:
针对每一所述候选实体,根据所述候选实体对应的至少两个维度的特征数据,以及所述至少两个维度中各维度对应的权重,计算所述候选实体对应的匹配值,其中,所述匹配值反映所述候选实体与所述实体信息之间的匹配程度;
根据每一所述候选实体对应的匹配值,确定所述目标实体。
7.根据权利要求6所述的方法,其特征在于,所述至少两个维度中各维度对应的权重通过权重模型获得;
所述权重模型通过如下方式获得:
获取多组第二训练数据,每一组第二训练数据包括第三实体在所述至少两个维度的历史特征数据、所述至少两个维度中各维度对应的历史权重以及用于表征其他实体是否与所述第三实体存在预设互动行为的标签信息;
根据所述多组第二训练数据,对预设线性模型进行训练,以获得所述权重模型。
8.根据权利要求6所述的方法,其特征在于,所述根据每一所述候选实体对应的匹配值,确定所述目标实体,包括:
根据每一所述候选实体对应的匹配值,将最大的前N个匹配值对应的候选实体确定为目标实体,其中,N为正整数。
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:
针对每一所述目标实体,执行如下操作:
根据所述目标实体对应的至少两个维度的特征数据,以及所述至少两个维度中各维度对应的权重,计算所述目标实体对应于每个维度的特征值;
根据所述目标实体对应于每个维度的特征值以及每个维度各自对应的特征阈值,确定所述目标实体对应的目标维度;
根据所述目标实体对应于所述目标维度的特征数据,生成与所述目标实体对应的实体标签,并将所述实体标签与所述目标实体相关联。
10.一种实体查询方法,其特征在于,所述方法包括:
接收用户的查询请求,所述查询请求包括实体信息;
获取与所述实体信息匹配的目标实体;其中,所述目标实体至少基于所述目标实体对应的与所述用户交互维度的特征数据确定;
展示所述目标实体的目标实体信息。
11.根据权利要求10所述的方法,其特征在于,所述目标实体包括多个,多个所述目标实体的展示顺序是基于所述交互维度的特征数据确定的;其中,
所述展示所述目标实体的目标实体信息,包括:
在搜索提示区域的各提示位置处展示所述目标实体的目标实体信息;和/或
在搜索结果展示页面展示所述目标实体的目标实体信息。
12.根据权利要求10所述的方法,其特征在于,所述展示所述目标实体的目标实体信息,包括:
若所述目标实体关联有实体标签,将与所述目标实体相关联的实体标签与所述目标实体信息关联展示。
13.一种实体查询装置,其特征在于,所述装置包括:
第一接收模块,用于接收用户发送的查询请求,所述查询请求包括实体信息;
第一获取模块,用于确定与所述实体信息匹配的多个候选实体,获取各所述候选实体对应的至少两个维度的特征数据;其中,所述维度包括所述候选实体与所述用户的交互维度;
确定模块,用于根据各所述候选实体对应的至少两个维度的特征数据,确定与所述实体信息匹配的目标实体。
14.一种实体查询装置,其特征在于,所述装置包括:
第二接收模块,用于接收用户的查询请求,所述查询请求包括实体信息;
第二获取模块,用于获取与所述实体信息匹配的目标实体;其中,所述目标实体至少基于所述目标实体对应的与所述用户交互维度的特征数据确定;
展示模块,用于展示所述目标实体的目标实体信息。
15.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理装置执行时实现权利要求1-9中任一项所述方法的步骤,或者,该程序被处理装置执行时实现权利要求10-12中任一项所述方法的步骤。
16.一种电子设备,其特征在于,包括:
存储装置,其上存储有计算机程序;
处理装置,用于执行所述存储装置中的所述计算机程序,以实现权利要求1-9中任一项所述方法的步骤,或者,实现权利要求10-12中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011126459.8A CN112256719A (zh) | 2020-10-20 | 2020-10-20 | 实体查询方法、装置、可读介质与电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011126459.8A CN112256719A (zh) | 2020-10-20 | 2020-10-20 | 实体查询方法、装置、可读介质与电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112256719A true CN112256719A (zh) | 2021-01-22 |
Family
ID=74244151
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011126459.8A Pending CN112256719A (zh) | 2020-10-20 | 2020-10-20 | 实体查询方法、装置、可读介质与电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112256719A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113297277A (zh) * | 2021-06-18 | 2021-08-24 | 北京有竹居网络技术有限公司 | 检验统计量确定方法、装置、可读介质及电子设备 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107451284A (zh) * | 2011-06-03 | 2017-12-08 | 脸谱公司 | 用于处理搜索查询的方法、系统和存储介质 |
US20180144051A1 (en) * | 2016-11-18 | 2018-05-24 | Facebook, Inc. | Entity Linking to Query Terms on Online Social Networks |
CN108280115A (zh) * | 2017-10-24 | 2018-07-13 | 腾讯科技(深圳)有限公司 | 识别用户关系的方法及装置 |
CN108446410A (zh) * | 2018-05-29 | 2018-08-24 | 科大讯飞股份有限公司 | 信息推荐方法、装置、系统、设备及可读存储介质 |
CN109086394A (zh) * | 2018-07-27 | 2018-12-25 | 天津字节跳动科技有限公司 | 搜索排序方法、装置、计算机设备和存储介质 |
CN110334159A (zh) * | 2019-05-29 | 2019-10-15 | 苏宁金融服务(上海)有限公司 | 基于关系图谱的信息查询方法和装置 |
CN110837732A (zh) * | 2019-10-31 | 2020-02-25 | 北京奇艺世纪科技有限公司 | 目标人物间亲密度识别方法、装置、电子设备及存储介质 |
CN111178714A (zh) * | 2019-12-19 | 2020-05-19 | 浙江大搜车软件技术有限公司 | 亲密度确定方法、装置、计算机设备和存储介质 |
CN111311409A (zh) * | 2020-02-13 | 2020-06-19 | 腾讯云计算(北京)有限责任公司 | 目标对象确定方法、装置、电子设备及存储介质 |
-
2020
- 2020-10-20 CN CN202011126459.8A patent/CN112256719A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107451284A (zh) * | 2011-06-03 | 2017-12-08 | 脸谱公司 | 用于处理搜索查询的方法、系统和存储介质 |
US20180144051A1 (en) * | 2016-11-18 | 2018-05-24 | Facebook, Inc. | Entity Linking to Query Terms on Online Social Networks |
CN108280115A (zh) * | 2017-10-24 | 2018-07-13 | 腾讯科技(深圳)有限公司 | 识别用户关系的方法及装置 |
CN108446410A (zh) * | 2018-05-29 | 2018-08-24 | 科大讯飞股份有限公司 | 信息推荐方法、装置、系统、设备及可读存储介质 |
CN109086394A (zh) * | 2018-07-27 | 2018-12-25 | 天津字节跳动科技有限公司 | 搜索排序方法、装置、计算机设备和存储介质 |
CN110334159A (zh) * | 2019-05-29 | 2019-10-15 | 苏宁金融服务(上海)有限公司 | 基于关系图谱的信息查询方法和装置 |
CN110837732A (zh) * | 2019-10-31 | 2020-02-25 | 北京奇艺世纪科技有限公司 | 目标人物间亲密度识别方法、装置、电子设备及存储介质 |
CN111178714A (zh) * | 2019-12-19 | 2020-05-19 | 浙江大搜车软件技术有限公司 | 亲密度确定方法、装置、计算机设备和存储介质 |
CN111311409A (zh) * | 2020-02-13 | 2020-06-19 | 腾讯云计算(北京)有限责任公司 | 目标对象确定方法、装置、电子设备及存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113297277A (zh) * | 2021-06-18 | 2021-08-24 | 北京有竹居网络技术有限公司 | 检验统计量确定方法、装置、可读介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108804532B (zh) | 一种查询意图的挖掘和查询意图的识别方法、装置 | |
CN107679211B (zh) | 用于推送信息的方法和装置 | |
CN108885624B (zh) | 信息推荐系统及方法 | |
CN110619063A (zh) | 基于视频搜索的视频推送方法、装置、电子设备 | |
US20110252065A1 (en) | Apparatus and method for semantic-based search and semantic metadata providing server and method of operating the same | |
CN111368185A (zh) | 数据展示方法、装置、存储介质及电子设备 | |
CN110990598B (zh) | 资源检索方法、装置、电子设备及计算机可读存储介质 | |
CN111279334A (zh) | 利用上下文分析的搜索查询增强 | |
CN113806588B (zh) | 搜索视频的方法和装置 | |
CN112328889A (zh) | 推荐搜索词确定方法、装置、可读介质及电子设备 | |
KR101873339B1 (ko) | 관심사 및 콘텐츠를 제공하는 방법 및 시스템 | |
CN112948540A (zh) | 信息查询方法、装置、电子设备以及计算机可读介质 | |
CN110059172B (zh) | 基于自然语言理解的推荐答案的方法和装置 | |
CN115687690A (zh) | 一种视频推荐方法、装置、电子设备及存储介质 | |
CN111259225B (zh) | 新媒体信息展示方法、装置、电子设备及计算机可读介质 | |
CN114357325A (zh) | 内容搜索方法、装置、设备及介质 | |
CN112256719A (zh) | 实体查询方法、装置、可读介质与电子设备 | |
WO2022222660A1 (zh) | 对象展示方法、装置、电子设备及计算机可读存储介质 | |
CN112035740B (zh) | 项目使用时长预测方法、装置、设备及存储介质 | |
CN113836415A (zh) | 信息推荐方法、装置、介质及设备 | |
CN110879863B (zh) | 跨领域搜索方法和跨领域搜索装置 | |
KR20210084641A (ko) | 정보를 송신하는 방법 및 장치 | |
CN111339452A (zh) | 搜索结果展现的方法、终端、服务器和系统 | |
CN111382365A (zh) | 用于输出信息的方法和装置 | |
CN114238229B (zh) | 一种打印文件的搜索方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |