CN110795627A - 信息推荐方法及装置、电子设备 - Google Patents
信息推荐方法及装置、电子设备 Download PDFInfo
- Publication number
- CN110795627A CN110795627A CN201911032556.8A CN201911032556A CN110795627A CN 110795627 A CN110795627 A CN 110795627A CN 201911032556 A CN201911032556 A CN 201911032556A CN 110795627 A CN110795627 A CN 110795627A
- Authority
- CN
- China
- Prior art keywords
- search
- retrieval
- sub
- keyword
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/40—Data acquisition and logging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
- G06F16/9558—Details of hyperlinks; Management of linked annotations
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种信息推荐方法及装置、电子设备。其中,该方法包括:构造检索关系图,其中,检索关系图中包含有多个利用不同关键词得到搜索结果所对应的子检索关系图,每个子检索关系图中包含有至少一条连接有向边,连接有向边用于指示利用关键词搜索得到的链接网页节点;接收待检索的目标关键词;在检索关系图中查询与目标关键词对应的所有链接网页节点和每个链接网页节点的权重值,以确定目标搜索列表,其中,目标搜索列表中包含有按照权重值排序的多个推荐信息;展示目标搜索列表。本发明解决了相关技术中进行信息推荐时,无法准确抓住用户搜索意图,导致推荐误差较大的技术问题。
Description
技术领域
本发明涉及信息处理技术领域,具体而言,涉及一种信息推荐方法及装置、电子设备。
背景技术
相关技术中,随着网络的发展,用户越来越依赖搜索引擎获取信息,由于用户的知识水平不同以及对搜索目标的理解不同,造成用户可能会通过更长的路径获取到想获取的内容。因此各大搜索引擎均提供相关搜索入口,提供与用户搜索内容相关的搜索query(可理解为推荐关键词)供用户选择。现在相关搜索的通用做法是将用户的搜索query进行核心词提取,提取出一个或多个核心词,之后从平台所有包含该核心词的搜索query提取出来作为相关搜索列表的候选集,之后对候选集中的每个词的近期搜索总频次和与该用户搜索的query之间的相关程度做加权求和得到每个词的得分,按得分由高到低作为相关搜索的推荐内容。
但是,这种做相关搜索的推荐虽然考虑了用户的历史搜索频次以及与用户搜索的query的相关程度,但是忽略了当用户并不能很好的描述自己想搜索的内容时,更多的是采用形容词、问答式query或者与搜索目的略微相关的词进行搜索,这样提取query关键词后,关键词很可能与用户真正的搜索意图不相符,并不能准确的抓住用户的搜索意图。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种信息推荐方法及装置、电子设备,以至少解决相关技术中进行信息推荐时,无法准确抓住用户搜索意图,导致推荐误差较大的技术问题。
根据本发明实施例的一个方面,提供了一种信息推荐方法,包括:构造检索关系图,其中,检索关系图中包含有多个利用不同关键词得到搜索结果所对应的子检索关系图,每个所述子检索关系图中包含有至少一条连接有向边,所述连接有向边用于指示利用关键词搜索得到的链接网页节点;接收待检索的目标关键词;在所述检索关系图中查询与所述目标关键词对应的所有链接网页节点和每个所述链接网页节点的权重值,以确定目标搜索列表,其中,所述目标搜索列表中包含有按照所述权重值排序的多个推荐信息;展示所述目标搜索列表。
可选地,构造检索关系图的步骤,包括:获取所有历史搜索信息,其中,所述历史搜索信息记录历史过程中对应于每个用户从开始搜索至结束搜索的所有会话控制单;提取所述历史搜索信息中的每个会话控制单,确定所有的子检索关系图;综合所有的子检索关系图,得到子检索关系图集合;依据关键词的关联关系,合并所有的所述子检索关系图,得到所述检索关系图。
可选地,提取所述历史搜索信息中的每个会话控制单,确定所有的子检索关系图的步骤,包括:提取每个所述会话控制单中从开始搜索至结束搜索过程时记录的所有搜索关键词以及点击网页;以时间序列为基准,建立各个所述搜索关键词之间的有向边,并赋予每个搜索关键词所对应的点击网页的链接标识;以所述有向边和所述链接标识建立各个子检索关系图,得到所有的子检索关系图。
可选地,提取所述历史搜索信息中的每个会话控制单的步骤,包括:确定每个会话控制单的开始时间和和结束时间,以及与所述开始时间对应的初始搜索关键词和与所述结束时间对应的结束搜索关键词;按照所述初始搜索关键词和所述结束搜索关键词,切割所述历史搜索信息中的各个会话控制单。
可选地,依据关键词的关联关系,合并所有的所述子检索关系图,得到所述检索关系图的步骤,包括:确定每个子检索关系图的每条有向边;对有向边进行去重处理;依据关键词的关联关系,合并所有的有向边;对所有的有向边进行归一化处理,得到所述检索关系图。
可选地,在构造检索关系图的之后,所述方法还包括:通过预设网页排名算法预处理每个搜索关键词的权重,其中,所述预设网页排名算法至少包括:PageRank算法;基于每个搜索关键词的权重和链接网页内容,确定每个链接网页节点的权重值。
可选地,确定目标搜索列表的步骤,包括:在所述检索关系图中,查找与所述目标关键词对应的所有链接网页节点;查询每个所述链接网页节点的权重值;依据权重值对所有的链接网页节点排序;查询将每个链接网页节点对应的推荐关键词和/或推荐语句,得到所述推荐信息,并确定所述目标搜索列表。
根据本发明实施例的另一方面,还提供了一种信息推荐装置,包括:构建单元,用于构造检索关系图,其中,检索关系图中包含有多个利用不同关键词得到搜索结果所对应的子检索关系图,每个所述子检索关系图中包含有至少一条连接有向边,所述连接有向边用于指示利用关键词搜索得到的链接网页节点;接收单元,用于接收待检索的目标关键词;确定单元,用于在所述检索关系图中查询与所述目标关键词对应的所有链接网页节点和每个所述链接网页节点的权重值,以确定目标搜索列表,其中,所述目标搜索列表中包含有按照所述权重值排序的多个推荐信息;展示单元,展示所述目标搜索列表。
可选地,所述构建单元包括:第一获取模块,用于获取所有历史搜索信息,其中,所述历史搜索信息记录历史过程中对应于每个用户从开始搜索至结束搜索的所有会话控制单;第一提取模块,用于提取所述历史搜索信息中的每个会话控制单,确定所有的子检索关系图;综合模块,用于综合所有的子检索关系图,得到子检索关系图集合;第一合并模块,用于依据关键词的关联关系,合并所有的所述子检索关系图,得到所述检索关系图。
可选地,所述第一提取模块包括:第一提取子模块,用于提取每个所述会话控制单中从开始搜索至结束搜索过程时记录的所有搜索关键词以及点击网页;第一建立子模块,用于以时间序列为基准,建立各个所述搜索关键词之间的有向边,并赋予每个搜索关键词所对应的点击网页的链接标识;第二建立子模块,用于以所述有向边和所述链接标识建立各个子检索关系图,得到所有的子检索关系图。
可选地,所述第一提取模块还包括:第一确定子模块,用于确定每个会话控制单的开始时间和和结束时间,以及与所述开始时间对应的初始搜索关键词和与所述结束时间对应的结束搜索关键词;切割子模块,用于按照所述初始搜索关键词和所述结束搜索关键词,切割所述历史搜索信息中的各个会话控制单。
可选地,所述第一合并模块包括:第二确定子模块,用于确定每个子检索关系图的每条有向边;对有向边进行去重处理;第一合并子模块,用于依据关键词的关联关系,合并所有的有向边;归一化模块,用于对所有的有向边进行归一化处理,得到所述检索关系图。
可选地,所述信息推荐装置还包括:预处理单元,用于在构造检索关系图的之后,通过预设网页排名算法预处理每个搜索关键词的权重,其中,所述预设网页排名算法至少包括:PageRank算法;第一确定模块,用于基于每个搜索关键词的权重和链接网页内容,确定每个链接网页节点的权重值。
可选地,所述确定单元包括:在所述检索关系图中,查找与所述目标关键词对应的所有链接网页节点;查询每个所述链接网页节点的权重值;依据权重值对所有的链接网页节点排序;查询将每个链接网页节点对应的推荐关键词和/或推荐语句,得到所述推荐信息,并确定所述目标搜索列表。
根据本发明实施例的另一方面,还提供了一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的信息推荐方法。
根据本发明实施例的另一方面,还提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述任意一项所述的信息推荐方法。
在本发明实施例中,采用先构造检索关系图,其中,检索关系图中包含有多个利用不同关键词得到搜索结果所对应的子检索关系图,每个子检索关系图中包含有至少一条连接有向边,连接有向边用于指示利用关键词搜索得到的链接网页节点;接收待检索的目标关键词,然后在检索关系图中查询与目标关键词对应的所有链接网页节点和每个链接网页节点的权重值,以确定目标搜索列表,其中,目标搜索列表中包含有按照权重值排序的多个推荐信息,最后可以展示目标搜索列表。在该实施例中,可以利用用户对某一个领域的理解过程是相同,在做相关搜索推荐中,考虑了用户搜索的行为序列与用户意图的关系,通过历史的搜索行为序列,得到历史用户真正搜索意图,并根据这些历史行为推断新用户在搜索某一query时的真正搜索意图,缩短用户的搜索路径,提高用户体验,并且利用权重值来确定待推荐的搜索列表,让用户能够查看到最想要的信息,从而解决相关技术中进行信息推荐时,无法准确抓住用户搜索意图,导致推荐误差较大的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的信息推荐方法的流程图图;
图2是根据本发明实施例的一种可选的确定各个子检索关系图的示意图;
图3是根据本发明实施例的另一种可选的确定检索关系图的示意图;
图4是根据本发明实施例的一种可选的信息推荐装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明下述实施例,可以应用于各种搜索引擎、搜索推荐框、SEO中扩充搜索词购买等场景,在用户向输入框输入关键词/语句/文件后,可以推送相应的推荐列表信息,让用户能够快速查找到自己想要的内容,与用户的搜索意图更匹配,提高搜索效率。
虽然用户在互联网上的搜索行为以及目的不尽相同,而且在给定领域中,用户对该领域所理解掌握的程度也不尽相同,但是,用户对该领域的理解过程却是趋同的,因此,当一个用户遇到了某个问题需要通过搜索引擎予以解决,那么在此之前,大概率有其他用户也遇到了相同问题并且已经通过搜索引擎得到了解决,本发明实施例利用这种分析方式,查询得到想要的推荐信息。
根据本发明实施例,提供了一种信息推荐方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种可选的信息推荐方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,构造检索关系图,其中,检索关系图中包含有多个利用不同关键词得到搜索结果所对应的子检索关系图,每个子检索关系图中包含有至少一条连接有向边,连接有向边用于指示利用关键词搜索得到的链接网页节点;
步骤S104,接收待检索的目标关键词;
步骤S106,在检索关系图中查询与目标关键词对应的所有链接网页节点和每个链接网页节点的权重值,以确定目标搜索列表,其中,目标搜索列表中包含有按照权重值排序的多个推荐信息;
步骤S108,展示目标搜索列表。
通过上述步骤,可以采用先构造检索关系图,其中,检索关系图中包含有多个利用不同关键词得到搜索结果所对应的子检索关系图,每个子检索关系图中包含有至少一条连接有向边,连接有向边用于指示利用关键词搜索得到的链接网页节点;接收待检索的目标关键词,然后在检索关系图中查询与目标关键词对应的所有链接网页节点和每个链接网页节点的权重值,以确定目标搜索列表,其中,目标搜索列表中包含有按照权重值排序的多个推荐信息,最后可以展示目标搜索列表。在该实施例中,可以利用用户对某一个领域的理解过程是相同,在做相关搜索推荐中,考虑了用户搜索的行为序列与用户意图的关系,通过历史的搜索行为序列,得到历史用户真正搜索意图,并根据这些历史行为推断新用户在搜索某一query时的真正搜索意图,缩短用户的搜索路径,提高用户体验,并且利用权重值来确定待推荐的搜索列表,让用户能够查看到最想要的信息,从而解决相关技术中进行信息推荐时,无法准确抓住用户搜索意图,导致推荐误差较大的技术问题。
下面结合各步骤对本发明实施例进行详细说明。
本发明实施例中定义检索关系图为G。通过该检索关系图,可检索与输入的目标关键词对应的后继节点以及每个节点的权重,从而确定待推荐的关键词序列。
步骤S102,构造检索关系图,其中,检索关系图中包含有多个利用不同关键词得到搜索结果所对应的子检索关系图,每个子检索关系图中包含有至少一条连接有向边,连接有向边用于指示利用关键词搜索得到的链接网页节点。
可选的,构造检索关系图的步骤,包括:获取所有历史搜索信息,其中,历史搜索信息记录历史过程中对应于每个用户从开始搜索至结束搜索的所有会话控制单;提取历史搜索信息中的每个会话控制单,确定所有的子检索关系图;综合所有的子检索关系图,得到子检索关系图集合;依据关键词的关联关系,合并所有的子检索关系图,得到检索关系图。
在本发明实施例中,可以定义会话控制单为session。定义一个Session为用户一次进入到搜索引擎并且在搜索引擎不断搜索查看直到解决问题退出搜索引擎的过程,那么,在某一Session中,用户每次搜索,对用户来说,都是一个信息的增加,越靠后的搜索行为由于越接近用户真实所需,因此对用户信息的增加越多,直到搜索到最后一个query,用户的信息获取完毕,离开搜索引擎。因此,可以理解为在一个Session中,先搜索的query对于后搜索的query是一个铺垫,是找到后面搜索query的线索,而后搜索的query是用户通过前面搜索行为得到的意图,因此在做相关搜索列表的推荐中,后搜索的query应该被赋予更高的权重。
在本发明实施例中,提取历史搜索信息中的每个会话控制单,确定所有的子检索关系图的步骤,包括:提取每个会话控制单中从开始搜索至结束搜索过程时记录的所有搜索关键词以及点击网页;以时间序列为基准,建立各个搜索关键词之间的有向边,并赋予每个搜索关键词所对应的点击网页的链接标识;以有向边和链接标识建立各个子检索关系图,得到所有的子检索关系图。
可选的,提取历史搜索信息中的每个会话控制单的步骤,包括:确定每个会话控制单的开始时间和和结束时间,以及与开始时间对应的初始搜索关键词和与结束时间对应的结束搜索关键词;按照初始搜索关键词和结束搜索关键词,切割历史搜索信息中的各个会话控制单。
即可以在提取所有用户的所有搜索行为后,按照用户开始搜索和结束搜索为标识切割为多个session。
在本发明实施例中,依据关键词的关联关系,合并所有的子检索关系图,得到检索关系图的步骤,包括:确定每个子检索关系图的每条有向边;对有向边进行去重处理;依据关键词的关联关系,合并所有的有向边;对所有的有向边进行归一化处理,得到检索关系图。
即可以对于每个session,可以提取出子检索关系图,得到子检索关系图集合,并将每个session的关系图合并,得到G。
另一种可选的,在构造检索关系图的之后,方法还包括:通过预设网页排名算法预处理每个搜索关键词的权重,其中,预设网页排名算法至少包括:PageRank算法;基于每个搜索关键词的权重和链接网页内容,确定每个链接网页节点的权重值。
在相关搜索列表的推荐中,可以通过PageRank算法来预处理每个搜索query的权重,举例说明,对用户搜索的每个Session S=[q1,q2,…,qn],对于任意i,j满足i<j,连接qi,与qj,做一有向边,边权值为v(i,j),这样就可以根据Session构造出检索关系图。这样对于所有用户的所有Session,可以将每个Session构造出的子关系图进行合并,得到一个query关系图G(U,V),G为有向图,U为该图中所有节点的集合,每个节点表示一条query,节点数则为所有用户搜索的所有去重后的query,V为该图中所有边的集合,该图中的边为每个子关系图的边的并集,每条边的边权为所有子图中对应起点和终点的边权之和,并按照起点进行归一化后的值。
步骤S104,接收待检索的目标关键词。
步骤S106,在检索关系图中查询与目标关键词对应的所有链接网页节点和每个链接网页节点的权重值,以确定目标搜索列表,其中,目标搜索列表中包含有按照权重值排序的多个推荐信息。
作为本发明可选的实施例,确定目标搜索列表的步骤,包括:在检索关系图中,查找与目标关键词对应的所有链接网页节点;查询每个链接网页节点的权重值;依据权重值对所有的链接网页节点排序;查询将每个链接网页节点对应的推荐关键词和/或推荐语句,得到推荐信息,并确定目标搜索列表。
构造出query关系图G后,采用PageRank算法求得每个query的权重,权重高的意味着对于用户来说可以获取到有用信息的概率越高。而在生成相关搜索的推荐列表时,假设用户此时的搜索query为q,则在G中寻找所有q的后继,按照权重从大到小排序即可。
上述权重值可以是用户自行设定,根据不同的使用环境设置合适的数值。
步骤S108,展示目标搜索列表。
举例说明,用户A搜索了两个Session:Session1:[“谁提笔只两行歌词”“红昭愿”,“音阙诗听”,“王梓钰”],Session2:[“国风美少年”,“鞠婧祎”];
用户B搜索了一个Session:[“红昭愿”,“红昭愿原唱”];
用户C搜索了一个Session:[“鞠婧祎”,“红昭愿”,“叹云兮”];
假设边权重设置为常数1,即v(qi,qj)=1时,可得到如图2所示的4个子检索关系图,图2是根据本发明实施例的一种可选的确定各个子检索关系图的示意图,包括子检索关系图1、子检索关系图2、子检索关系图3、子检索关系图4。
将如图2所示的4个子检索关系图合并,且归一化处理后,可得到检索关系图。图3是根据本发明实施例的另一种可选的确定检索关系图的示意图。
对如图3所示的检索关系图,应用PageRank算法得到每个query的权值如下表1所示:
表1
当用户搜索“红昭愿”时,此时根据query关系图,并且通过每个query的权重值,可以得到相关搜索列表按顺序为“红昭愿原唱”,“叹云兮”,“王梓钰”,“音阙诗听”四个query。
通过上述实施例,可以在做相关推荐中,考虑了用户搜索的行为序列与用户意图的关系,通过历史的搜索行为序列,得到历史用户真正搜索意图,并根据这些历史行为推断新用户在搜索某一query时的真正搜索意图,缩短用户的搜索路径,提高用户体验。
下面通过另一可选的信息推荐装置来说明本发明。
图4是根据本发明实施例的一种可选的信息推荐装置的示意图,如图4所示,该信息推荐装置可以包括:构建单元41,接收单元43,确定单元45,展示单元47,其中,
构建单元41,用于构造检索关系图,其中,检索关系图中包含有多个利用不同关键词得到搜索结果所对应的子检索关系图,每个子检索关系图中包含有至少一条连接有向边,连接有向边用于指示利用关键词搜索得到的链接网页节点;
接收单元43,用于接收待检索的目标关键词;
确定单元45,用于在检索关系图中查询与目标关键词对应的所有链接网页节点和每个链接网页节点的权重值,以确定目标搜索列表,其中,目标搜索列表中包含有按照权重值排序的多个推荐信息;
展示单元47,展示目标搜索列表。
上述信息推荐装置,可以通过构建单元41先构造检索关系图,其中,检索关系图中包含有多个利用不同关键词得到搜索结果所对应的子检索关系图,每个子检索关系图中包含有至少一条连接有向边,连接有向边用于指示利用关键词搜索得到的链接网页节点;通过接收单元43接收待检索的目标关键词,然后在通过确定单元45检索关系图中查询与目标关键词对应的所有链接网页节点和每个链接网页节点的权重值,以确定目标搜索列表,其中,目标搜索列表中包含有按照权重值排序的多个推荐信息,最后可以通过展示单元47展示目标搜索列表。在该实施例中,可以利用用户对某一个领域的理解过程是相同,在做相关搜索推荐中,考虑了用户搜索的行为序列与用户意图的关系,通过历史的搜索行为序列,得到历史用户真正搜索意图,并根据这些历史行为推断新用户在搜索某一query时的真正搜索意图,缩短用户的搜索路径,提高用户体验,并且利用权重值来确定待推荐的搜索列表,让用户能够查看到最想要的信息,从而解决相关技术中进行信息推荐时,无法准确抓住用户搜索意图,导致推荐误差较大的技术问题。
可选的,构建单元包括:第一获取模块,用于获取所有历史搜索信息,其中,历史搜索信息记录历史过程中对应于每个用户从开始搜索至结束搜索的所有会话控制单;第一提取模块,用于提取历史搜索信息中的每个会话控制单,确定所有的子检索关系图;综合模块,用于综合所有的子检索关系图,得到子检索关系图集合;第一合并模块,用于依据关键词的关联关系,合并所有的子检索关系图,得到检索关系图。
另一种可选的,第一提取模块包括:第一提取子模块,用于提取每个会话控制单中从开始搜索至结束搜索过程时记录的所有搜索关键词以及点击网页;第一建立子模块,用于以时间序列为基准,建立各个搜索关键词之间的有向边,并赋予每个搜索关键词所对应的点击网页的链接标识;第二建立子模块,用于以有向边和链接标识建立各个子检索关系图,得到所有的子检索关系图。
可选的,第一提取模块还包括:第一确定子模块,用于确定每个会话控制单的开始时间和和结束时间,以及与开始时间对应的初始搜索关键词和与结束时间对应的结束搜索关键词;切割子模块,用于按照初始搜索关键词和结束搜索关键词,切割历史搜索信息中的各个会话控制单。
在本发明实施例中,第一合并模块包括:第二确定子模块,用于确定每个子检索关系图的每条有向边;对有向边进行去重处理;第一合并子模块,用于依据关键词的关联关系,合并所有的有向边;归一化模块,用于对所有的有向边进行归一化处理,得到检索关系图。
可选的,信息推荐装置还包括:预处理单元,用于在构造检索关系图的之后,通过预设网页排名算法预处理每个搜索关键词的权重,其中,预设网页排名算法至少包括:PageRank算法;第一确定模块,用于基于每个搜索关键词的权重和链接网页内容,确定每个链接网页节点的权重值。
可选的,确定单元包括:在检索关系图中,查找与目标关键词对应的所有链接网页节点;查询每个链接网页节点的权重值;依据权重值对所有的链接网页节点排序;查询将每个链接网页节点对应的推荐关键词和/或推荐语句,得到推荐信息,并确定目标搜索列表。
上述的信息推荐装置还可以包括处理器和存储器,上述构建单元41,接收单元43,确定单元45,展示单元47等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
上述处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来推荐与用户搜索意图适应的关键词。
上述存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
根据本发明实施例的另一方面,还提供了一种电子设备,包括:处理器;以及存储器,用于存储处理器的可执行指令;其中,处理器配置为经由执行可执行指令来执行上述任意一项的信息推荐方法。
根据本发明实施例的另一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述任意一项的信息推荐方法。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:构造检索关系图,其中,检索关系图中包含有多个利用不同关键词得到搜索结果所对应的子检索关系图,每个子检索关系图中包含有至少一条连接有向边,连接有向边用于指示利用关键词搜索得到的链接网页节点;接收待检索的目标关键词;在检索关系图中查询与目标关键词对应的所有链接网页节点和每个链接网页节点的权重值,以确定目标搜索列表,其中,目标搜索列表中包含有按照权重值排序的多个推荐信息;展示目标搜索列表。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种信息推荐方法,其特征在于,包括:
构造检索关系图,其中,检索关系图中包含有多个利用不同关键词得到搜索结果所对应的子检索关系图,每个所述子检索关系图中包含有至少一条连接有向边,所述连接有向边用于指示利用关键词搜索得到的链接网页节点;
接收待检索的目标关键词;
在所述检索关系图中查询与所述目标关键词对应的所有链接网页节点和每个所述链接网页节点的权重值,以确定目标搜索列表,其中,所述目标搜索列表中包含有按照所述权重值排序的多个推荐信息;
展示所述目标搜索列表。
2.根据权利要求1所述的方法,其特征在于,构造检索关系图的步骤,包括:
获取所有历史搜索信息,其中,所述历史搜索信息记录历史过程中对应于每个用户从开始搜索至结束搜索的所有会话控制单;
提取所述历史搜索信息中的每个会话控制单,确定所有的子检索关系图;
综合所有的子检索关系图,得到子检索关系图集合;
依据关键词的关联关系,合并所有的所述子检索关系图,得到所述检索关系图。
3.根据权利要求2所述的方法,其特征在于,提取所述历史搜索信息中的每个会话控制单,确定所有的子检索关系图的步骤,包括:
提取每个所述会话控制单中从开始搜索至结束搜索过程时记录的所有搜索关键词以及点击网页;
以时间序列为基准,建立各个所述搜索关键词之间的有向边,并赋予每个搜索关键词所对应的点击网页的链接标识;
以所述有向边和所述链接标识建立各个子检索关系图,得到所有的子检索关系图。
4.根据权利要求2所述的方法,其特征在于,提取所述历史搜索信息中的每个会话控制单的步骤,包括:
确定每个会话控制单的开始时间和和结束时间,以及与所述开始时间对应的初始搜索关键词和与所述结束时间对应的结束搜索关键词;
按照所述初始搜索关键词和所述结束搜索关键词,切割所述历史搜索信息中的各个会话控制单。
5.根据权利要求2所述的方法,其特征在于,依据关键词的关联关系,合并所有的所述子检索关系图,得到所述检索关系图的步骤,包括:
确定每个子检索关系图的每条有向边;
对有向边进行去重处理;
依据关键词的关联关系,合并所有的有向边;
对所有的有向边进行归一化处理,得到所述检索关系图。
6.根据权利要求1所述的方法,其特征在于,在构造检索关系图的之后,所述方法还包括:
通过预设网页排名算法预处理每个搜索关键词的权重,其中,所述预设网页排名算法至少包括:PageRank算法;
基于每个搜索关键词的权重和链接网页内容,确定每个链接网页节点的权重值。
7.根据权利要求1所述的方法,其特征在于,确定目标搜索列表的步骤,包括:
在所述检索关系图中,查找与所述目标关键词对应的所有链接网页节点;
查询每个所述链接网页节点的权重值;
依据权重值对所有的链接网页节点排序;
查询将每个链接网页节点对应的推荐关键词和/或推荐语句,得到所述推荐信息,并确定所述目标搜索列表。
8.一种信息推荐装置,其特征在于,包括:
构建单元,用于构造检索关系图,其中,检索关系图中包含有多个利用不同关键词得到搜索结果所对应的子检索关系图,每个所述子检索关系图中包含有至少一条连接有向边,所述连接有向边用于指示利用关键词搜索得到的链接网页节点;
接收单元,用于接收待检索的目标关键词;
确定单元,用于在所述检索关系图中查询与所述目标关键词对应的所有链接网页节点和每个所述链接网页节点的权重值,以确定目标搜索列表,其中,所述目标搜索列表中包含有按照所述权重值排序的多个推荐信息;
展示单元,展示所述目标搜索列表。
9.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至7中任意一项所述的信息推荐方法。
10.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至7中任意一项所述的信息推荐方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911032556.8A CN110795627B (zh) | 2019-10-28 | 2019-10-28 | 信息推荐方法及装置、电子设备 |
JP2020525901A JP7225229B2 (ja) | 2019-10-28 | 2019-11-22 | 情報推薦方法及び装置、電子機器 |
PCT/CN2019/120290 WO2021082123A1 (zh) | 2019-10-28 | 2019-11-22 | 信息推荐方法及装置、电子设备 |
US16/629,560 US11436289B2 (en) | 2019-10-28 | 2019-11-22 | Information recommendation method and apparatus, and electronic device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911032556.8A CN110795627B (zh) | 2019-10-28 | 2019-10-28 | 信息推荐方法及装置、电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110795627A true CN110795627A (zh) | 2020-02-14 |
CN110795627B CN110795627B (zh) | 2022-08-19 |
Family
ID=69441567
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911032556.8A Active CN110795627B (zh) | 2019-10-28 | 2019-10-28 | 信息推荐方法及装置、电子设备 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11436289B2 (zh) |
JP (1) | JP7225229B2 (zh) |
CN (1) | CN110795627B (zh) |
WO (1) | WO2021082123A1 (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111768234A (zh) * | 2020-06-28 | 2020-10-13 | 百度在线网络技术(北京)有限公司 | 为用户生成推荐文案的方法及设备、电子设备和介质 |
CN112131246A (zh) * | 2020-09-28 | 2020-12-25 | 范馨月 | 基于自然语言语义解析的数据中心智能查询统计方法 |
CN112347260A (zh) * | 2020-11-24 | 2021-02-09 | 深圳市欢太科技有限公司 | 数据处理方法、装置以及电子设备 |
CN112559926A (zh) * | 2020-12-22 | 2021-03-26 | 北京百度网讯科技有限公司 | 搜索展示条目的上线处理方法、装置、设备、介质及产品 |
CN113516491A (zh) * | 2020-04-09 | 2021-10-19 | 百度在线网络技术(北京)有限公司 | 推广信息展示方法、装置、电子设备及存储介质 |
CN113792163A (zh) * | 2021-08-09 | 2021-12-14 | 北京达佳互联信息技术有限公司 | 多媒体推荐方法、装置、电子设备及存储介质 |
CN113836437A (zh) * | 2021-09-14 | 2021-12-24 | 上海任意门科技有限公司 | 用于帖子推荐的方法、电子设备和存储介质 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11934476B2 (en) * | 2021-10-28 | 2024-03-19 | Toyota Research Institute, Inc. | System and method for contextualizing and improving understanding of web search results |
CN118277340B (zh) * | 2024-06-04 | 2024-08-13 | 山东广厚信息科技有限公司 | 一种城市园林植物档案数据处理方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100005087A1 (en) * | 2008-07-01 | 2010-01-07 | Stephen Basco | Facilitating collaborative searching using semantic contexts associated with information |
US20110202526A1 (en) * | 2010-02-12 | 2011-08-18 | Korea Advanced Institute Of Science And Technology | Semantic search system using semantic ranking scheme |
CN105808590A (zh) * | 2014-12-31 | 2016-07-27 | 中国电信股份有限公司 | 搜索引擎实现方法、搜索方法以及装置 |
CN107239462A (zh) * | 2016-03-28 | 2017-10-10 | 北京搜狗科技发展有限公司 | 一种搜索方法和装置以及浏览器 |
CN109190049A (zh) * | 2018-11-02 | 2019-01-11 | 北京字节跳动网络技术有限公司 | 关键词推荐方法、系统、电子设备和计算机可读介质 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7539697B1 (en) * | 2002-08-08 | 2009-05-26 | Spoke Software | Creation and maintenance of social relationship network graphs |
US8326847B2 (en) | 2008-03-22 | 2012-12-04 | International Business Machines Corporation | Graph search system and method for querying loosely integrated data |
US20090248661A1 (en) * | 2008-03-28 | 2009-10-01 | Microsoft Corporation | Identifying relevant information sources from user activity |
JP2009251845A (ja) | 2008-04-04 | 2009-10-29 | Toshiba Corp | 検索結果評価装置及び検索結果評価方法 |
US7945565B2 (en) * | 2008-11-20 | 2011-05-17 | Yahoo! Inc. | Method and system for generating a hyperlink-click graph |
US8219591B2 (en) * | 2010-05-03 | 2012-07-10 | Hewlett-Packard Development Company, L.P. | Graph query adaptation |
JP5752245B2 (ja) | 2011-05-26 | 2015-07-22 | 株式会社日立製作所 | 情報検索方法、情報検索装置及び記憶媒体 |
CN104462084B (zh) | 2013-09-13 | 2019-08-16 | Sap欧洲公司 | 基于多个查询提供搜索细化建议 |
US9785696B1 (en) * | 2013-10-04 | 2017-10-10 | Google Inc. | Automatic discovery of new entities using graph reconciliation |
CN106570046A (zh) | 2016-03-02 | 2017-04-19 | 合网络技术(北京)有限公司 | 一种基于用户操作行为推荐相关搜索数据的方法及装置 |
CN105912630B (zh) * | 2016-04-07 | 2020-01-31 | 北京搜狗信息服务有限公司 | 一种信息扩展方法及装置 |
US20180052884A1 (en) * | 2016-08-16 | 2018-02-22 | Ebay Inc. | Knowledge graph construction for intelligent online personal assistant |
US9787705B1 (en) * | 2016-08-19 | 2017-10-10 | Quid, Inc. | Extracting insightful nodes from graphs |
US10585903B2 (en) * | 2016-12-05 | 2020-03-10 | Dropbox, Inc. | Identifying relevant information within a document hosting system |
CN108829865B (zh) | 2018-06-22 | 2021-04-09 | 海信集团有限公司 | 信息检索方法及装置 |
US20200074322A1 (en) * | 2018-09-04 | 2020-03-05 | Rovi Guides, Inc. | Methods and systems for using machine-learning extracts and semantic graphs to create structured data to drive search, recommendation, and discovery |
-
2019
- 2019-10-28 CN CN201911032556.8A patent/CN110795627B/zh active Active
- 2019-11-22 US US16/629,560 patent/US11436289B2/en active Active
- 2019-11-22 WO PCT/CN2019/120290 patent/WO2021082123A1/zh active Application Filing
- 2019-11-22 JP JP2020525901A patent/JP7225229B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100005087A1 (en) * | 2008-07-01 | 2010-01-07 | Stephen Basco | Facilitating collaborative searching using semantic contexts associated with information |
US20110202526A1 (en) * | 2010-02-12 | 2011-08-18 | Korea Advanced Institute Of Science And Technology | Semantic search system using semantic ranking scheme |
CN105808590A (zh) * | 2014-12-31 | 2016-07-27 | 中国电信股份有限公司 | 搜索引擎实现方法、搜索方法以及装置 |
CN107239462A (zh) * | 2016-03-28 | 2017-10-10 | 北京搜狗科技发展有限公司 | 一种搜索方法和装置以及浏览器 |
CN109190049A (zh) * | 2018-11-02 | 2019-01-11 | 北京字节跳动网络技术有限公司 | 关键词推荐方法、系统、电子设备和计算机可读介质 |
Non-Patent Citations (2)
Title |
---|
CHEN L C: "Building a term suggestion and ranking system based on a probabilistic analysis model and a semantic analysis graph", 《DECISION SUPPORT SYSTEMS》 * |
安冲: "一种在搜索日志中挖掘用户搜索意图并推荐相关搜索词的方法", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113516491A (zh) * | 2020-04-09 | 2021-10-19 | 百度在线网络技术(北京)有限公司 | 推广信息展示方法、装置、电子设备及存储介质 |
CN113516491B (zh) * | 2020-04-09 | 2024-04-30 | 百度在线网络技术(北京)有限公司 | 推广信息展示方法、装置、电子设备及存储介质 |
CN111768234A (zh) * | 2020-06-28 | 2020-10-13 | 百度在线网络技术(北京)有限公司 | 为用户生成推荐文案的方法及设备、电子设备和介质 |
CN111768234B (zh) * | 2020-06-28 | 2023-12-19 | 百度在线网络技术(北京)有限公司 | 为用户生成推荐文案的方法及设备、电子设备和介质 |
CN112131246A (zh) * | 2020-09-28 | 2020-12-25 | 范馨月 | 基于自然语言语义解析的数据中心智能查询统计方法 |
CN112347260A (zh) * | 2020-11-24 | 2021-02-09 | 深圳市欢太科技有限公司 | 数据处理方法、装置以及电子设备 |
CN112559926A (zh) * | 2020-12-22 | 2021-03-26 | 北京百度网讯科技有限公司 | 搜索展示条目的上线处理方法、装置、设备、介质及产品 |
CN112559926B (zh) * | 2020-12-22 | 2023-10-03 | 北京百度网讯科技有限公司 | 搜索展示条目的上线处理方法、装置、设备、介质及产品 |
CN113792163A (zh) * | 2021-08-09 | 2021-12-14 | 北京达佳互联信息技术有限公司 | 多媒体推荐方法、装置、电子设备及存储介质 |
CN113836437A (zh) * | 2021-09-14 | 2021-12-24 | 上海任意门科技有限公司 | 用于帖子推荐的方法、电子设备和存储介质 |
CN113836437B (zh) * | 2021-09-14 | 2024-01-30 | 上海任意门科技有限公司 | 用于帖子推荐的方法、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2021082123A1 (zh) | 2021-05-06 |
CN110795627B (zh) | 2022-08-19 |
JP2022510522A (ja) | 2022-01-27 |
US20220253491A1 (en) | 2022-08-11 |
JP7225229B2 (ja) | 2023-02-20 |
US11436289B2 (en) | 2022-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110795627B (zh) | 信息推荐方法及装置、电子设备 | |
US8527506B2 (en) | Media discovery and playlist generation | |
US9600533B2 (en) | Matching and recommending relevant videos and media to individual search engine results | |
CN101241512B (zh) | 一种重新定义查询词的搜索方法及装置 | |
US8332391B1 (en) | Method and apparatus for automatically identifying compounds | |
CN103678576B (zh) | 基于动态语义分析的全文检索系统 | |
JP5540079B2 (ja) | 知識ベース構築の方法および装置 | |
CN107180093B (zh) | 信息搜索方法及装置和时效性查询词识别方法及装置 | |
US20080154886A1 (en) | System and method for summarizing search results | |
US20090254540A1 (en) | Method and apparatus for automated tag generation for digital content | |
US20060248458A1 (en) | Method and apparatus for storing and retrieving data using ontologies | |
CN108304444A (zh) | 信息查询方法及装置 | |
WO2008106667A1 (en) | Searching heterogeneous interrelated entities | |
KR20080031262A (ko) | 관계 네트워크 | |
EP2480995A1 (en) | Searching for information based on generic attributes of the query | |
JP4896268B2 (ja) | 情報価値を反映した情報検索方法及びその装置 | |
JP2000090103A (ja) | 情報検索装置及び情報検索プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
CN103744970B (zh) | 一种确定图片的主题词的方法及装置 | |
CN103226601A (zh) | 一种图片搜索的方法和装置 | |
CN113593543B (zh) | 智能音箱语音服务系统、方法、装置及设备 | |
CN111680130B (zh) | 文本检索方法、装置、设备及存储介质 | |
Mohajer | The Extraction of Social Networks from Web Using Search Engines | |
Knees et al. | Supervised and Unsupervised Web Document Filtering Techniques to Improve Text-Based Music Retrieval. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information | ||
CB03 | Change of inventor or designer information |
Inventor after: Li Dongjun Inventor after: Chen Yingxiang Inventor after: Wang Fenglei Inventor before: Chen Yingxiang Inventor before: Wang Fenglei Inventor before: Li Dongjun |
|
GR01 | Patent grant | ||
GR01 | Patent grant |