CN111475725A - 用于搜索内容的方法、装置、设备和计算机可读存储介质 - Google Patents

用于搜索内容的方法、装置、设备和计算机可读存储介质 Download PDF

Info

Publication number
CN111475725A
CN111475725A CN202010252907.2A CN202010252907A CN111475725A CN 111475725 A CN111475725 A CN 111475725A CN 202010252907 A CN202010252907 A CN 202010252907A CN 111475725 A CN111475725 A CN 111475725A
Authority
CN
China
Prior art keywords
historical search
search
historical
record
records
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010252907.2A
Other languages
English (en)
Other versions
CN111475725B (zh
Inventor
姜富春
陆伟
史利
王锦东
潘平
赵世奇
袁怀文
金慈航
王彬
欧玉龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010252907.2A priority Critical patent/CN111475725B/zh
Publication of CN111475725A publication Critical patent/CN111475725A/zh
Priority to KR1020227027825A priority patent/KR20220119745A/ko
Priority to EP20929634.2A priority patent/EP4113329A4/en
Priority to PCT/CN2020/117129 priority patent/WO2021196541A1/zh
Priority to US17/914,557 priority patent/US20230147941A1/en
Priority to JP2022553192A priority patent/JP7451747B2/ja
Application granted granted Critical
Publication of CN111475725B publication Critical patent/CN111475725B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • G06F16/24534Query rewriting; Transformation
    • G06F16/24539Query rewriting; Transformation using cached or materialised query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query
    • G06F16/3326Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3349Reuse of stored results of previous queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering

Abstract

根据本公开的实施例,提供了用于搜索内容的方法、装置、设备和计算机可读存储介质,涉及数据处理领域。在该方法中,响应于接收到针对目标搜索项的搜索请求,获取与多个历史搜索请求有关的多个历史搜索记录,每个历史搜索记录包括相对应的历史搜索请求所针对的历史搜索项。然后,从多个历史搜索记录中确定与目标搜索项匹配的第一历史搜索记录。进而,基于多个历史搜索记录之间的关系,从多个历史搜索记录中确定与第一历史搜索记录相关联的第二历史搜索记录。该方法还包括基于与第二历史搜索记录相对应的搜索结果,确定针对目标搜索项的扩展结果。通过该方法,能够提供可能满足用户搜索需求的扩展结果,提高了搜索质量和效果,改进了用户体验。

Description

用于搜索内容的方法、装置、设备和计算机可读存储介质
技术领域
本公开的实施例主要涉及数据处理领域,并且更具体地,涉及用于搜索内容的方法、装置、设备和计算机可读存储介质。
背景技术
随着信息技术的快速发展,很多用户和网站提供了大量的信息可供访问。然后,由于网站提供的数据量越来越大,对于单个用户而言,要去各个网站或信息源查找相关的信息变得非常困难。
为了解决信息检索的困难,出现了许多搜索引擎来帮助用户查找信息。由于搜索引擎会从大量的网站的将各种信息收集到本地,然后经过加工建立各种信息数据库。当用户想要查找的内容时,通过在搜索引擎输入搜索内容便可以轻松快速的获得想要查找的内容。然而,在使用搜索引擎查找内容的过程中还存在着许多需要解决的问题。
发明内容
根据本公开的示例实施例,提供了一种用于搜索内容的方案。
在本公开的第一方面中,提供了一种用于搜索内容的方法。该方法包括响应于接收到针对目标搜索项的搜索请求,获取与多个历史搜索请求有关的多个历史搜索记录,每个历史搜索记录包括相对应的历史搜索请求所针对的历史搜索项。该方法还包括从多个历史搜索记录中确定与目标搜索项匹配的第一历史搜索记录。该方法还包括基于多个历史搜索记录之间的关系,从多个历史搜索记录中确定与第一历史搜索记录相关联的第二历史搜索记录。该方法还包括基于与第二历史搜索记录相对应的搜索结果,确定针对目标搜索项的扩展结果。
在本公开的第二方面中,提供了一种搜索内容的装置。该装置包括历史搜索记录获取模块,被配置为响应于接收到针对目标搜索项的搜索请求,获取与多个历史搜索请求有关的多个历史搜索记录,每个历史搜索记录包括相对应的历史搜索请求所针对的历史搜索项;目标搜索项匹配模块,被配置为从多个历史搜索记录中确定与目标搜索项匹配的第一历史搜索记录;历史搜索记录确定模块,被配置为基于多个历史搜索记录之间的关系,从多个历史搜索记录中确定与第一历史搜索记录相关联的第二历史搜索记录;以及扩展结果确定模块,被配置为基于与第二历史搜索记录相对应的搜索结果,确定针对目标搜索项的扩展结果。
在本公开的第三方面中,提供了一种电子设备,包括一个或多个处理器;以及存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现根据本公开的第一方面的方法。
在本公开的第四方面中,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现根据本公开的第一方面的方法。
附图说明
结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标注表示相同或相似的元素,其中:
图1示出了根据传统方案来提供推荐结果的示例100的示意图;
图2示出了本公开的多个实施例的能够在其中实现的环境200的示意图;
图3示出了根据本公开的一些实施例的用于搜索内容的方法300的流程图;
图4示出了根据本公开的一些实施例的用于获取多个历史搜索记录的方法400的流程图;
图5示出了根据本公开的一些实施例的用于确定历史搜索记录类别和关系的方法500的流程图;
图6示出了根据本公开的一些实施例的用于确定历史搜索记录间的关系的方法600的流程图;
图7示出了根据本公开的一些实施例的用于搜索内容的装置700的框图;
图8示出了根据本公开的一些实施例的用于搜索内容的装置800的框图;以及
图9示出了能够实施本公开的多个实施例的设备900的框图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
在本公开的实施例的描述中,术语“包括”及其类似用语应当理解为开放性包含,即“包括但不限于”。术语“基于”应当理解为“至少部分地基于”。术语“一个实施例”或“该实施例”应当理解为“至少一个实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
在搜索引擎中,用户提交搜索项,搜索引擎对网页库进行检索。然后搜索引擎获取和搜索项匹配的结果,对结果进行排序后返回给用户。除了搜索项所明确表达的信息需求之外,用户往往同时有一些相关的信息需求。因此在传统的搜索引擎产品中,都具有一定的推荐功能,为当前的搜索项推荐相关的搜索项,以满足用户这些相关的信息需求。例如,图1示出了传统方案提供推荐的搜索项的示例100的示意图。在用户在搜索引擎中输入“刘**”后提供了两个推荐框102和104。在框102中提供了一些推荐搜索项,而在框104中也提供了一些推荐搜索项。
然而,传统方案给出的推荐搜索项无法直接满足用户的相关需求,并且需要用户点击搜索项,在新搜索页面中人工筛选可以满足需求的文档资源。此外,传统方案中的搜索项文本普遍较短,其作为推荐内容的吸引力弱,并且搜索项为通过用户生成内容的方式产生,难以控制其质量和安全性。
根据本公开的实施例,提出一种搜索内容的改进方案。在该方案中,在接收到针对目标搜索项的搜索请求时,先获取与多个历史搜索请求有关的多个历史搜索记录,其中每个历史搜索记录包括相对应的历史搜索请求所针对的历史搜索项。然后从多个历史搜索记录中确定与目标搜索项匹配的第一历史搜索记录。通过多个历史搜索记录之间的关系,从多个历史搜索记录中确定与第一历史搜索记录相关联的第二历史搜索记录。然后基于与第二历史搜索记录相对应的搜索结果,确定针对目标搜索项的扩展结果。通过该方法,能够提供可能满足用户搜索需求的扩展结果,提高了搜索质量和效果,改进了用户体验。
图2示出了本公开的多个实施例能够在其中实现的环境200的示意图。在该示例环境200中,在该示例环境200中包括终端设备204和计算设备208。计算设备208基于来自终端设备204的搜索请求206来为用户202提供与针对搜索请求206的扩展结果212。
终端设备204可以运行用于搜索的应用或程序,诸如搜索引擎应用。终端设备204接收用户202输入的目标搜索项,例如用户202输入“奔驰C200多少钱”。然后终端设备204生成针对该目标搜索项的搜索请求206并将搜索请求206发送到计算设备208。
终端设备204包括但不限于个人计算机、服务器计算机、手持或膝上型设备、移动设备(诸如移动电话、个人数字助理(PDA)、媒体播放器等)、多处理器系统、消费电子产品、小型计算机、大型计算机、包括上述系统或设备中的任意一个的分布式计算环境等。
计算设备208包括但不限于个人计算机、服务器计算机、手持或膝上型设备、多处理器系统、消费电子产品、小型计算机、大型计算机、包括上述系统或设备中的任意一个的分布式计算环境、云平台中的虚拟机或其他计算设备等。
计算设备208在接收到来自终端设备204的搜索请求206后,计算设备208不仅生成针对搜索请求206中的目标搜索项的搜索结果,还会根据搜索请求206的目标搜索项从计算设备208获得扩展结果212。计算设备208获得的多个历史搜索记录210,通过将目标搜索项与多个历史搜索记录210中的历史搜索项进行匹配查找匹配的历史搜索记录。
图2中示出了计算设备208从其他设备接收多个历史搜索记录210,其仅是示例,而非对本公开的具体限定。多个历史搜索记录210也可以在计算设备208内或由计算设备208在接收到搜索请求206时生成。
多个历史搜索记录210是由搜索日志中的日志数据确定的。多个历史搜索记录210中的每个历史搜索记录包括相对应的历史搜索请求所针对的历史搜索项。在一些实施例中,每个历史搜索项还包括关键实体,该关键实体是通过对日志数据中的历史搜索项进行实体识别,从多个识别的实体中根据实体在历史搜索项中出现的次数来确定出来的。备选地或附加地,每个历史搜索项还包括与该历史搜索项相对应的需求的类别。在一些实施例中,每个历史搜索记录除了历史搜索项之外,还包括与该历史搜索项相关联的历史搜索项,以及与相关联的历史搜索项的关联程度。
在一些实施例中,计算设备208在多个历史搜索记录210中查找与目标搜索项相同的历史搜索项,例如查找历史搜索项为“奔驰C200多少钱”的历史搜索记录。在一些实施例中,计算设备208在多个历史搜索记录210查找与目标搜索项匹配程度高于阈值程度的历史搜索项。上述示例仅是用于描述本公开,而非对本公开的具体限定。
计算设备208在查找到与目标搜索项相匹配的第一历史搜索记录时,计算设备208还会获得多个历史搜索记录210之间的关系。然后计算设备208基于多个历史之间的关系来确定出与第一历史搜索记录相关联的第二历史搜索记录,例如第二历史搜索记录中的历史搜索项为“奔驰C200的照片”。备选地或附加地,计算设备208还可以确定出其他的一个或多个历史搜索记录。在一些实施例中,多个历史搜索记录之间的关系是与多个历史搜索记录的多个类别之间的相关程度。在一些实施例中,多个历史搜索记录之间的关系是多个历史搜索记录之间的关联程度。
计算设备208然后基于第二历史搜索记录的历史搜索项来获得扩展结果212。然后计算设备208将扩展结果212和/或由目标搜索项获得的目标搜索结果提供给用户202。
上面图2示出了本公开的多个实施例能够在其中实现的环境200的示意图。下面结合图3描述根据本公开的一些实施例的用于搜索内容的方法300的流程图。方法300可以由图2中的计算设备208或其它任意合适的设备来实现。
在框302处,计算设备208会确定是否接收到针对目标搜索项的搜索请求206。在接收到搜索请求206时,在框304处,计算设备208获取与多个历史搜索请求有关的多个历史搜索记录210。其中,每个历史搜索记录包括相对应的历史搜索请求所针对的历史搜索项。
在一些实施例中,多个历史搜索记录210的每个历史搜索记录包括历史搜索项。在一些实施例中,多个历史搜索记录210中的每个历史搜索记录包括历史搜索项和与历史搜索项相对应的关键实体。在一些实施例中,多个历史搜索记录210的每个历史搜索记录包括历史搜索项与历史搜索项相对应的关键实体及其对应的需求类别。在一些实施例中,多个历史搜索记录210的每个历史搜索记录包括历史搜索项、对应的历史搜索项以及历史搜索项和对应历史搜索项之间的关联程度。上述示例仅是用于描述本公开,而非对本公开的具体限定。
在一些实施例中,多个历史搜索记录210是计算设备208多其他服务器或计算机获取的。在一些实施例中,多个历史搜索记录210在计算设备208内已生成好。在一些实施例中,多个历史搜索记录210是在用户202进行检索时由计算设备208在线生成的。计算设备208获取多个历史搜索记录210的过程将结合图4进行描述。
在框306处,计算设备208从多个历史搜索记录210中确定与目标搜索项匹配的第一历史搜索记录。计算设备208在获得多个历史搜索记录210以及目标搜索项后,会从多个历史搜索记录210中查找与多个历史搜索记录210相匹配的第一历史搜索记录。在一些实施例中,目标搜索项与第一历史搜索记录中的历史搜索项完全相同。在一些实施例中,目标搜索项与第一历史搜索记录中的历史搜索项的匹配程度高于预定的匹配阈值。上述示例仅是用于描述本公开,而非对本公开的具本限定。
在框308处,计算设备208基于多个历史搜索记录210之间的关系,从多个历史搜索记录210中确定与第一历史搜索记录相关联的第二历史搜索记录。在一些实施例中,计算设备208除了获得第二历史搜索记录之外,还会获取与第一历史搜索记录相关联的其他历史搜索记录。
在一些实施例中,在多个历史搜索记录210中的每个历史搜索记录包括历史搜索项和关键实体、或每个历史搜索记录包括历史搜索项和关键实体和每个历史搜索记录的类别时,多个历史搜索记录210之间的关系是多个类别之间的关联程度。计算设备208基于多个历史搜索记录210之间的关系,确定与第一历史搜索记录的第一类别相关联的第二类别。然后计算设备208从多个历史搜索记录210确定具有第二类别的第二历史搜索记录,第二历史搜索记录包括第一历史搜索记录的关键实体。通过上述方法,可以快速准确的查找到高匹配程度的第二历史搜索记录。
对于每个历史搜索记录的类别,计算设备208利用多个历史搜索记录210包括的多个历史搜索项来确定多个历史搜索记录210的类别。然后计算设备208基于类别,确定多个历史搜索记录210之间的关系。通过上述方式,可以更快更准确地确定类别和多个历史搜索记录之间的关系。确定类别和确定与类别相关的多个历史搜索记录之间的关系的过程将在后面结合图5进行描述。
在一些实施例中,在计算设备208获取多个历史搜索记录210时会获取多个历史搜索记录210之间的关系。该关系描述了多个历史搜索记录210中的每个历史搜索记录和与其对应的历史搜索记录之间的关联程度。计算设备208可以基于多个历史搜索记录210之间的关系,确定与第一历史搜索记录相关联的一组历史搜索记录,第一历史搜索记录与一组历史搜索记录中的每个历史搜索记录具有关联程度。然后计算设备208基于关联程度,从一组历史搜索记录中确定第二历史搜索记录。通过该方法,可以快速准确的查找到高匹配程度的第二历史搜索记录。确定每个历史搜索记录和与其对应的历史搜索记录之间的关联程度的过程将在下面结合图6进行描述。
在框310处,计算设备208基于与第二历史搜索记录相对应的搜索结果,确定针对目标搜索项的扩展结果212。
在一些实施例中,在获得第二历史搜索记录之后,计算设备208获取针对第二历史搜索记录中的历史搜索项的搜索结果。在一些实施例中,计算设备208利用第二历史搜索记录中的历史搜索项重新进行搜索,从而实时获得该搜索结果。作为备选方式,在一些实施例中,计算设备208也可以查找关于第二历史搜索记录中的历史搜索项的历史搜索结果。举例而言,计算设备208可以从搜索日志中查找上述历史搜索结果。应当理解,上述示例仅是用于描述本公开,而非对本公开的具体限定,计算设备208可以通过多种方式来获取针对第二历史搜索记录中的历史搜索项的搜索结果。
然后,计算设备208将由第二历史搜索记录中的搜索项得到的搜索结果确定为扩展结果212。通过这种方式,可以快速自动的扩展出适合用户的信息。
在一些实施例中,在获得第二历史搜索记录之后,计算设备208会利用第二历史搜索记录来进行搜索以获取针对第二历史搜索记录中的历史搜索项的历史搜索结果。例如,计算设备208可以从搜索日增收志中查找该历史搜索结果。然后,计算设备208从历史搜索结果中确定已被用户202访问的部分历史搜索结果。此时,计算设备208将部分历史搜索结果确定为扩展结果212。通过这种方式,可以更准确的确定出与用户相关的扩展结果212。
在一些实施例中,在获得第二历史搜索记录之后,计算设备208还会获取用户202在针对第二历史搜索记录中的历史搜索项进行搜索时所产生的信息流。在一些实施例中,该信息流是在日志记录中记录的用户在使用第二历史搜索记录中的历史搜索项进行搜索时,提供给用户的历史信息流。历史信息流可以新闻、各种网络信息、推送广告等。然后计算设备208基于该信息流,将用户202在搜索时浏览的信息流确定为扩展结果212。例如,执行第二历史搜索记录的用户202在搜索信息时还查看了来自网络服务器推送的信息流,则该被查看的信息流作为扩展结果212。备选地或附加地,被查看的信息流中需要存在用户202建立的关注点标签。通过这种方式,可以增加扩展结果的来源,提供更多的扩展结果。
在一些实施例中,在获得扩展结果212后,计算设备208会向终端设备204提供扩展结果212,或者计算设备208会向终端设备204提供扩展结果212和针对目标搜索项的目标搜索结果。通过这种方式,可以使和户快速获得扩展结果和目标搜索结果。
在一些实施例中,在向用户202提供扩展结果212和目标搜索结果时,计算设备208会确定扩展结果212的第一分数,第一分数指示扩展结果212与第二历史搜索记录中的历史搜索项的相关度。该分数是通过神经网络模型来生成的。通过向神经网络模块输入扩展结果212中每项结果的用户点击分布、用户点击率预估、标题、内容、长度和第二历史搜索记录的历史搜索项等信息来确定每项结果的分数。该神经网络模型是通过样本用户点击分布、样本用户点击率预估样本搜索结果项、样本搜索项、扩展结果的标题、内容、长度等信信息以及样本分数确定的。
计算设备208还会确定目标搜索结果的第二分数,第二分数指示目标搜索结果与目标搜索项的相关度。其也是向上述神经网络模型中输入目标搜索结果的每项结果的标题、内容长度、目标搜索项等信息来确定目标搜索结果的分数。
计算设备208基于第一分数和第二分数,确定扩展结果212和目标搜索结果的优先级。然后,计算设备208根据优先级提供扩展结果212和目标搜索结果。备选地或附中地,计算设备208还可以对扩展结果212的显示设置一些限制条件。如提供的预定数量的结果中只能有第一数量的扩展结果212,或者设置扩展结果212连续的数目等。上述示例仅是用于描述本公开,而非对本公开的具体限定。本领域技术人员可以依据需来设置。通过上述方法,可以向用户相关度更高和更准确的目标搜索结果和推荐结果。
在一些实施例中,计算设备208还会建立用于获得与第二历史搜索记录相对应的搜索结果的目标数据源。在一些实施例中,该目标数据源可以是其他设备生成,然后计算设备208从其他设备获取该目标数据源。通过建立目标数据源,可以提高目标数据源的质量,从而可以为用户提供高质量的内容。
在一些实施例中,计算设备208在建立目标数据源时,先确定多个原始数据源中的多个文档的分数,每个文档的分数指示文档的质量。对文档打分时通过以下方式来确定:媒体站点打分:包括基于自动链接分析方法的站点打分,以及专家标注的站点打分;媒体作者打分:包括专家标注的作者登记、通过大数据分析的作者知名度、通过点赞、评论等读者反馈信息综合出的作者受欢迎度;以及媒体文本、图片、视频的丰富程度。
然后,计算设备208将多个文档中分数超过阈值分数的文档确定为目标数据源中的文档。通过这种方式,可以通过截断操作来获取优质候选结果。
上面结合图3描述了根据本公开的一些实施例的用于搜索内容的方法300的流程图。下面结合图4详细描述图3中的框304处的获取多个历史搜索记录的过程。图4示出了根据本公开的一些实施例的用于获取多个历史搜索记录的方法400的流程图。图4中的方法400可以图2中的计算设备208或其它任意合适的设备来执行。
在框402处,计算设备208从搜索日志中确定一组历史搜索请求所针对的一组历史搜索项。通常,搜索日志中会存储所有用户的搜索日志项。因此,可以从搜索日志中确定出一组历史搜索项。
在框404处,计算设备208从一组历史搜索项中确定多个实体,每个实体标识与对应历史搜索项相关联的对象。计算设备208会对一组历史搜索项中的每个历史搜索项执行实体识别,例如通过命名实体识别方法来识别实体。
在框406处,计算设备208基于多个实体在一组历史搜索项中的出现次数,从多个实体中确定关键实体。
在一些实施例中,计算设备208从一组历史搜索项中确定包括单个实体的历史搜索项集合。然后,计算设备208从历史搜索项集合确定至少一个历史搜索项,至少一个历史搜索项包括的单个实体在历史搜索项集合中的出现次数超过第一阈值次数。计算设备208将至少一个历史搜索项包括的单个实体确定为关键实体。通过这种方法,可以快速准确的确定出关键实体。
例如,假如一组历史搜索项中由实体“奔驰C200”作为历史搜索项的数目为4,而在阈值次数为3时,则可以将“奔驰C200”作为关键实体。
在一些实施例中,在确定关键实体时,计算设备208基于多个实体在一组历史搜索项中的出现次数,从多个实体中确定出现次数超过第二阈值次数的高频实体。计算设备208根据确定高频实体在对应的历史搜索项中的权重超过阈值权重,将高频实体确定为关键实体,其中权重指示高频实体在对应的历史搜索项中的重要性。通过上述方法,可以快速准确的确定出关键实体。
在一些实施例中,计算设备208通过高频实体在对应的历史搜索项中的位置来确定权重。在一些实施例中,计算设备208根据高频实体的长度与对应的历史搜索项的长度之间的关系来确定权重。在一些实施例中,计算设备208还可以根据上述方法的给合以及利用任意其他合适的信息来确定权重。上述示例仅是和于描述本公开,而非对本公开的具体限定,也可以由上述方式进行组合或其他方式来获得权重。通过上述方法,可以准确、快速的确定出权重。
在框408处,计算设备208从一组历史搜索项中选择包括关键实体的多个历史搜索项。在确定出关键实体后,计算设备208利用关键实体来确定出仅包括关键实体的历史搜索项。
在框410处,计算设备208根据多个历史搜索项和关键实体生成多个历史搜索记录210。此时,多个历史搜索记录210中的每个历史搜索记录至少包括历史搜索项和其对应的关键实体。
在一些实施例中,上述多个历史搜索记录210可以由其他设备根据搜索日志生成,计算设备208从其他设备接收多个历史搜索记录210。
通过上述方法,可以从搜索日志中快速准确地确定出包括关键实体的多个历史搜索记录,从而可以使得推荐结果更准确。
上面结合图4描述了根据本公开的一些实施例的用于获取多个历史搜索记录的方法400的流程图。下面结合图5详细描述图3中的框308处的确定历史搜索记录间的类别和关系的过程。图5示出了根据本公开的一些实施例的用于确定历史搜索记录类别和关系500的流程图。图5中的方法500可以用图2中的计算设备208或其它任意合适的设备来执行。
在框502处,多个历史搜索记录210中的每个历史搜索记录除了包括历史搜索项之外,还包括关键实体。计算设备208通过从多个历史搜索项中去除相应的关键实体,获得多个历史搜索项各自的剩余部分。例如,在多个历史搜索项为“奔驰C200多少钱”、“奔驰C200的价格”、“奔驰C200的图片”时,关键实体为“奔驰C200”时,剩余部分为“多少钱”、“的价格”、“的图片”。
在框504处,计算设备208至少基于剩余部分确定与多个历史搜索项相关联的需求信息。计算设备208将剩余部分确定用户的需求信息,例如将剩余部分“多少钱”、“的价格”、“的图片”确定为需求信息。
在框506处,计算设备208基于需求信息来确定多个历史搜索记录210的类别。在一些实施例中,计算设备208采用聚类操作来处理需求信息以确定多个历史搜索记录210的类别,例如采用k-means方法来处理需求信息。在一些实施例中,计算设备208也可以通过其他合适的方式来确定需求信息的类别,例如通过人工来进行分类。上述示例仅是用于描述本公开,而非对本公开的具体限定。
通过上述方式,可以准确的确定出多个历史搜索项的需求类别,也实现了对多个历史搜索记录的分类。
在框508处,计算设备208从搜索日志中确定针对多个历史搜索项的搜索时间或搜索结果。在确定好各个类别后,计算设备208需要确定各个类别之间的关联关系。因此,计算设备208会再从搜索日志中确定针对多个历史搜索项的目志记录,在后确定出这些日志记录的搜索时间和搜索结果。
在框510处,计算设备208基于搜索时间或搜索结果,确定多个类别之间的相关程度。计算设备208在日志中同一用户在预定时间内的具有不同类别的两次历史搜索记录确定为这两个类别之间的相关程度增加1,备选地或附加地,两次历史搜索记录的历史搜索项的关键实体相同。例中,用户202在预定时段内搜索了“奔驰C200的价格”和“奔驰C200的图片”,则可以确定“价格”对应的类别和“图片”对应的类别之间的相关程度为1。以此类推,可以确定多个类别之间的相关程度。
在框512处,计算设备208基于多个类别之间的相关程度,确定多个历史搜索记录210之间的关系。通过各个类别之间的相关程度,可以确定出多个历史搜索记录210之间的关系。例如,在一个历史搜索记录具有第一类别时,可以通过第一类别确定出与其相关程度较高的一个或多个其他类别,然后通过该第一历史搜索记录的关键实体结合一个或多个其他类别便能确定出与该历史搜索记录相关联的其他历史搜索记录。
通过上述方法,可以快速准确的确定多个类别之间的相关程度,以使得可以在进行搜索时确保推荐结果的准确性。
上面结合图5描述了根据本公开的一些实施例的用于确定历史搜索记录类别和关系500的流程图。下面结合图6详细描述图3中的框308处的确定历史搜索记录间的关系的过程。图6示出了根据本公开的一些实施例的用于确定历史搜索记录间的关系600的流程图。图6中的方法600可以图2中的计算设备208或其它任意合适的设备来执行。
在框602处,计算设备208从搜索日志中确定针对多个历史搜索项的搜索时间或搜索结果。搜索日志内存储了很多用户的搜索日志项,通过该搜索日志项可以确定出多个历史搜索项的搜索时间和搜索结果。
在框604处,计算设备208基于搜索时间或搜索结果,确定多个历史搜索记录210的之间的关联程度。计算设备208基于同一用户在预定时段内执行两个搜索项或者两个搜索项的搜索结果中具有相同的结果项而确定两个搜索记录之间具有相关性。例如用户202在预定时段内执行两个历史搜索项,则可以将包括两个搜索项的两个历史搜索记录之间的关联程度增加1。如果两个历史搜索项对应的搜索结果中有预定数目的相同的结果项,则可以将两个历史搜索记录之间的关联程度增加1。上述示例仅是用于描述本公开,而非对本公开的具体限定。备选地或附加地,还可以通相关程度进行限定,仅在上面确定两个历史搜索项相关联时,还需要通过两个历史搜索项所属的领域来确定其关联程度。
在框606处,计算设备208基于多个历史搜索记录210之间的关联程度,确定多个历史搜索记录210之间的关系。计算设备208基于所确定的关联程度,确定多个历史搜索记录210之间的关联关系。
在一些实施例中,多个历史搜索记录210及多个历史搜索记录210之间的关联关系可以由其他设备生成,计算设备208从其他设备获得。
在一些实施例中,不可以根据用户的搜索和浏览序列,提取重要关键词,建立用户关注点标签。
通过该方法,可以快速准确地确定出多个历史搜索记录之间的关联关系,使得可以快速准确的确定出扩展结果。
上面结合图6描述了根据本公开的一些实施例的用于确定历史搜索记录间的关系600的流程图。下面结合图7详细描述根据本公开的一些实施例的用于搜索内容的装置700的框图。
装置700包括优质结果筛选模块702、相关需求挖掘模块704、推荐结果匹配模块706和搜索结果与推荐结果混排模块708。在用户提交搜索词之后,相关需求挖掘模块704基于原始搜索词,挖掘出相关需求,相关需求的具体表达形式可以是搜索词的形式,也可以是关键词组合、语义向量等形式。基于挖掘出的相关需求,推荐结果匹配模块706检索优质结果筛选模块702筛选出的结果,从中找到可以满足相关需求的资源作为推荐结果;最后搜索结果与推荐结果混排模块708将推荐结果与搜索引擎检索出的正常结果进行混排,形成最终的结果列表,返回给用户。
相关需求挖掘模块704基于用户的原始搜索词挖掘出相关需求,其使用的技术方法包括如下几种:基于内容的挖掘方法:首先,对搜索项内容做拆分,定义了两种概念:搜索关键实体和需求维度。搜索核心主体是用户在搜索过程中,可以从搜索序列中提取的主体字串,这个主体字串能表征用户的核心诉求。如搜索项为“奔驰c200多少钱”,核心主体是“奔驰c200”,而“多少钱”是用户对核心主体的一种需求刻画,这里需求是询问价格。对于“奔驰c200”这个主体存在多种需求维度,如:奔驰c200图片,奔驰c200性能油耗,奔驰c200销量等。基于内容的挖掘的思想是在保持关键实体不变的情况下,为用户推荐与搜索项本身维度强关联的不同需求维度的文章。
在挖掘核心主体时,首先从搜索日志中获取历史搜索项集合,通过命名实体识别(NER)和统计高频子串的方式确定关键实体,关键实体满足三个条件:1)关键实体本身作为搜索项有较高数量;2)关键实体作为子串频繁出现在多个历史搜索项中。3)在所有包含主体字串的搜索项中,主体字串的平均词项权重占比较高。
在挖掘需求维度时,需求维度是关键产体的属性,通过聚集同关键实体的搜索项,将去掉关键实体剩余的字串作为需求。初步获取的需求子串不同表述可能是同需求的,比如“奔驰c200多少钱”和“奔驰c200价格”的需求是相同的。我们通过聚类方法对需求子串做聚集,实现对不同需求类别的划分。同时根据不同类别的共现关联,计算不同维度之间的关联矩阵,以表征维度之间的紧密关系。
历史搜索项通过关键实体和需求信息的拆分,并通过挖掘好的需求类别关联矩阵,将强关联需求的搜索项作为当前搜索项的相关扩展需求集合。
还可以基于用户搜索大数据的挖掘方法来确定扩展历史搜索项:以所有用户搜索的搜索项为节点构建一张关联图,其中图的边包括:搜索行为(共现,具有相同检索结果的搜索项等)和领域关联(同领域,有强关联的不同领域)。基于图的挖掘方法,挖掘与当前搜索项强关联的搜索项集合,作为当前搜索项的相关扩展需求。同时根据用户的搜索和浏览序列,提取核心关键词,建立用户关注点标签。
推荐结果匹配模块706基于挖掘出的相关需求,从资源库中匹配可以满足相关需求的结果,其使用的技术方法包括如下几种:基于搜索检索系统的匹配:用扩展搜索项搜索检索系统,获取与扩展搜索项匹配的满足结果。并根据关联强度归并所有的结果,作为搜索项的推荐结果。基于用户搜索大数据的匹配:根据共现和有点等用户行为,挖掘扩展搜索项关联的文章,作为搜索项的推荐结果。基于用户搜索和信息流浏览大数据的匹配:通过从用户搜索和信息流浏览数据中挖掘统计用户的关注点标签,并通过关注点匹配召回文章,作为用户的个性化推荐结果。
目标搜索结果与扩展结果混排模块708主要包括搜索结果打分、推荐结果打分、混排。搜索结果打分:主要基于历史点击分布、用户点击率预估等特征的融合模型打分。推荐结果打分基于历史点击分布、用户点击率预估打分等。
在混排时,基于搜索结果打分、推荐结果打分进行从高到低的排序。同时,也会进行多样性控制,包括基于推荐结果密度的多样性控制,以及同主题的推荐结果密度的多样性控制。
优质结果筛选模块702基于一些基本的质量因素,对文档资源进行打分,并基于打分进行截断,获取优质候选结果。基本质量因素包括:媒体站点打分:包括基于自动链接分析方法的站点打分,以及专家标注的站点打分;媒体作者打分:包括专家标注的作者登记、通过大数据分析的作者知名度、通过点赞、评论等读者反馈信息综合出的作者受欢迎度;媒体文本、图片、视频的丰富程度。
图8示出了根据本公开实施例的用于搜索内容的装置800的示意性框图。如图8所示,装置800可以包括历史搜索记录获取模块802,被配置为响应于接收到针对目标搜索项的搜索请求,获取与多个历史搜索请求有关的多个历史搜索记录,每个历史搜索记录包括相对应的历史搜索请求所针对的历史搜索项。装置800还包括目标搜索项匹配模块804,被配置为从多个历史搜索记录中确定与目标搜索项匹配的第一历史搜索记录。装置800还包括历史搜索记录确定模块806,被配置为基于多个历史搜索记录之间的关系,从多个历史搜索记录中确定与第一历史搜索记录相关联的第二历史搜索记录。装置800还包括扩展结果确定模块,被配置为基于与第二历史搜索记录相对应的搜索结果,确定针对目标搜索项的扩展结果。
在一些实施例中,历史搜索记录获取模块802包括:第一历史搜索项确定模块,被配置为从搜索日志中确定一组历史搜索请求所针对的一组历史搜索项;实体确定模块,被配置为从一组历史搜索项中确定多个实体,每个实体标识与对应历史搜索项相关联的对象;第一关键实体确定模块,被配置为基于多个实体在一组历史搜索项中的出现次数,从多个实体中确定关键实体;选择模块,被配置为从一组历史搜索项中选择包括关键实体的多个历史搜索项;以及生成模块,被配置为基于多个历史搜索项和关键实体生成多个历史搜索记录。
在一些实施例中,第一关键实体确定模块包括历史搜索项集合确定模块,被配置为从一组历史搜索项中确定包括单个实体的历史搜索项集合;第二历史搜索项确定模块,被配置为从历史搜索项集合确定至少一个历史搜索项,至少一个历史搜索项包括的单个实体在历史搜索项集合中的出现次数超过第一阈值次数;以及针对单个实体的关键实体确定模块,被配置为将至少一个历史搜索项包括的单个实体确定为关键实体。
在一些实施例中,关键实体确定模块包括高频实体确定模块,被配置为基于多个实体在一组历史搜索项中的出现次数,从多个实体中确定出现次数超过第二阈值次数的高频实体;以及第二关键实体确定模块,被配置为根据确定高频实体在对应的历史搜索项中的权重超过阈值权重,将高频实体确定为关键实体,其中权重指示高频实体在对应的历史搜索项中的重要性。
在一些实施例中,第二关键实体确定模块包括位置确定模块,被配置为高频实体在对应的历史搜索项中的位置,以及长度关系确定模块,被配置为高频实体的长度与对应的历史搜索项的长度之间的关系。
在一些实施例中,装置800还包括类别确定模块,被配置为基于多个历史搜索记录包括的多个历史搜索项,确定多个历史搜索记录的类别;以及历史搜索记录关系确定模块,被配置为基于类别,确定多个历史搜索记录之间的关系。
在一些实施例中,多个历史搜索记录中的每个历史搜索记录还包括关键实体,其中类别确定模块包括:剩余部分确定模块,被配置为通过从多个历史搜索项中去除相应的关键实体,获得多个历史搜索项各自的剩余部分;需求信息确定模块,被配置为至少基于剩余部分确定与多个历史搜索项相关联的需求信息;以及历史搜索记录类别确定模块,被配置为基于需求信息来确定多个历史搜索记录的类别。
在一些实施例中,多个历史搜索记录具有多个类别,并且其中历史搜索记录关系确定模块包括:第一搜索时间或搜索结果确定模块,被配置为从搜索日志中确定针对多个历史搜索项的搜索时间或搜索结果;相关程度确定模块,被配置为基于搜索时间或搜索结果,确定多个类别之间的相关程度;以及基于相关程度的关系确定模块,被配置为基于多个类别之间的相关程度,确定多个历史搜索记录之间的关系。
在一些实施例中,装置800还包括第二搜索时间或搜索结果配置模块,被配置为从搜索日志中确定针对多个历史搜索项的搜索时间或搜索结果;关联程度确定模块,被配置为基于搜索时间或搜索结果,确定多个历史搜索记录的之间的关联程度;以及基于关联程度的关系确定模块,被配置为基于多个历史搜索记录之间的关联程度,确定多个历史搜索记录之间的关系。
在一些实施例中,多个历史搜索记录中的每个历史搜索记录还包括关键实体和每个历史搜索记录的类别,其中历史搜索记录确定模块806包括:第二类别确定模块,被配置为基于多个历史搜索记录之间的关系,确定与第一历史搜索记录的第一类别相关联的第二类别;以及具有类别的第二历史搜索记录确定模块,被配置为从多个历史搜索记录确定具有第二类别的第二历史搜索记录,第二历史搜索记录包括第一历史搜索记录的关键实体。
在一些实施例中,历史搜索记录确定模块806包括一组历史搜索记录确定模块,被配置为基于多个历史搜索记录之间的关系,确定与第一历史搜索记录相关联的一组历史搜索记录,第一历史搜索记录与一组历史搜索记录中的每个历史搜索记录具有关联程度;以及基于关联程度的历史搜索记录确定模块,被配置为基于关联程度,从一组历史搜索记录中确定第二历史搜索记录。
在一些实施例中,扩展结果确定模块808包括第一搜索结果获取模块,被配置为获取针对第二历史搜索记录中的历史搜索项的搜索结果;以及针对搜索结果的扩展结果确定模块,被配置为将搜索结果确定为扩展结果。
在一些实施例中,扩展结果确定模块808包括第二搜索结果获取模块,被配置为获取针对第二历史搜索记录中的历史搜索项的历史搜索结果;部分历史搜索结果确定模块,被配置为从历史搜索结果中确定已被用户访问的部分历史搜索结果;以及部分历史搜索结果扩展模块,被配置为将部分历史搜索结果确定为扩展结果。
在一些实施例中,扩展结果确定模块包括信息流模块,被配置为获取用户在针对第二历史搜索记录中的历史搜索项进行搜索时所产生的信息流;以及针地信息流的扩展结果模块,被配置为基于信息流,确定扩展结果。
在一些实施例中,装置800还包括以下至少一项:第一提供装置,被配置为提供扩展结果;以及第二提供装置,被配置为提供扩展结果和针对目标搜索项的目标搜索结果。
在一些实施例中,第二提供装置包括第一分数确定模块,被配置为确定扩展结果的第一分数,第一分数指示扩展结果与第二历史搜索记录中的历史搜索项的相关度;第二分数确定模块,被配置为确定目标搜索结果的第二分数,第二分数指示目标搜索结果与目标搜索项的相关度;优先级确定模块,被配置为基于第一分数和第二分数,确定扩展结果和目标搜索结果的优先级;以及扩展结果和搜索结果提供模块,被配置为基于优先级提供扩展结果和目标搜索结果。
在一些实施例中,装置800还包括目标数据源建立模块,被配置为建立用于获得与第二历史搜索记录相对应的搜索结果的目标数据源。
在一些实施例中,目标数据源建立模块包括文档分数确定模块,被配置为确定多个原始数据源中的多个文档的分数,每个文档的分数指示文档的质量;以及目标数据源文档确定模块,被配置为将多个文档中分数超过阈值分数的文档确定为目标数据源中的文档。
图9示出了可以用来实施本公开的实施例的电子设备900的示意性框图。设备900可以用于实现图1中的终端设备204和计算设备208。如图所示,设备900包括计算单元901,其可以根据存储在只读存储器(ROM)902中的计算机程序指令或者从存储单元808加载到随机访问存储器(RAM)903中的计算机程序指令,来执行各种适当的动作和处理。在RAM 903中,还可存储设备900操作所需的各种程序和数据。计算单元901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(I/O)接口905也连接至总线904。
设备900中的多个部件连接至I/O接口905,包括:输入单元906,例如键盘、鼠标等;输出单元907,例如各种类型的显示器、扬声器等;存储单元908,例如磁盘、光盘等;以及通信单元909,例如网卡、调制解调器、无线通信收发机等。通信单元909允许设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元901可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元901的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元901执行上文所描述的各个方法和处理,例如方法300、400、500和600。例如,在一些实施例中,300、400、500和600可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元908。在一些实施例中,计算机程序的部分或者全部可以经由ROM 902和/或通信单元909而被载入和/或安装到设备900上。当计算机程序加载到RAM 903并由计算单元901执行时,可以执行上文描述的方法300、400、500和600的一个或多个步骤。备选地,在其他实施例中,计算单元901可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行方法900。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)等等。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
此外,虽然采用特定次序描绘了各操作,但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行,或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地,在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (38)

1.一种搜索内容的方法,包括:
响应于接收到针对目标搜索项的搜索请求,获取与多个历史搜索请求有关的多个历史搜索记录,每个历史搜索记录包括相对应的历史搜索请求所针对的历史搜索项;
从所述多个历史搜索记录中确定与所述目标搜索项匹配的第一历史搜索记录;
基于所述多个历史搜索记录之间的关系,从所述多个历史搜索记录中确定与所述第一历史搜索记录相关联的第二历史搜索记录;以及
基于与所述第二历史搜索记录相对应的搜索结果,确定针对所述目标搜索项的扩展结果。
2.根据权利要求1所述的方法,还包括:
基于所述多个历史搜索记录包括的多个历史搜索项,确定所述多个历史搜索记录的类别;以及
基于所述类别,确定所述多个历史搜索记录之间的关系。
3.根据权利要求2所述的方法,其中所述多个历史搜索记录中的每个历史搜索记录还包括关键实体,其中确定所述多个历史搜索记录的类别包括:
通过从所述多个历史搜索项中去除相应的关键实体,获得所述多个历史搜索项各自的剩余部分;
至少基于所述剩余部分确定与所述多个历史搜索项相关联的需求信息;以及
基于所述需求信息来确定所述多个历史搜索记录的类别。
4.根据权利要求2所述的方法,其中所述多个历史搜索记录具有多个类别,并且其中确定所述多个历史搜索记录之间的关系包括:
从搜索日志中确定针对所述多个历史搜索项的搜索时间或搜索结果;
基于所述搜索时间或所述搜索结果,确定所述多个类别之间的相关程度;以及
基于所述多个类别之间的相关程度,确定所述多个历史搜索记录之间的关系。
5.根据权利要求1所述的方法,还包括:
从搜索日志中确定针对所述多个历史搜索项的搜索时间或搜索结果;
基于所述搜索时间或所述搜索结果,确定所述多个历史搜索记录的之间的关联程度;以及
基于所述多个历史搜索记录之间的关联程度,确定所述多个历史搜索记录之间的关系。
6.根据权利要求1所述的方法,其中所述多个历史搜索记录中的每个历史搜索记录还包括关键实体和每个历史搜索记录的类别,其中确定所述第二历史搜索记录包括:
基于所述多个历史搜索记录之间的所述关系,确定与所述第一历史搜索记录的第一类别相关联的第二类别;以及
从所述多个历史搜索记录确定具有第二类别的第二历史搜索记录,所述第二历史搜索记录包括所述第一历史搜索记录的关键实体。
7.根据权利要求1所述的方法,其中确定所述第二历史搜索记录包括:
基于所述多个历史搜索记录之间的关系,确定与所述第一历史搜索记录相关联的一组历史搜索记录,所述第一历史搜索记录与所述一组历史搜索记录中的每个历史搜索记录具有关联程度;以及
基于所述关联程度,从所述一组历史搜索记录中确定所述第二历史搜索记录。
8.根据权利要求1所述的方法,其中获取所述多个历史搜索记录包括:
从搜索日志中确定一组历史搜索请求所针对的一组历史搜索项;
从所述一组历史搜索项中确定多个实体,每个实体标识与对应历史搜索项相关联的对象;
基于所述多个实体在所述一组历史搜索项中的出现次数,从所述多个实体中确定关键实体;
从所述一组历史搜索项中选择包括所述关键实体的多个历史搜索项;以及
基于所述多个历史搜索项和所述关键实体生成所述多个历史搜索记录。
9.根据权利要求8所述的方法,其中确定所述关键实体包括:
从所述一组历史搜索项中确定包括单个实体的历史搜索项集合;
从所述历史搜索项集合确定至少一个历史搜索项,所述至少一个历史搜索项包括的单个实体在所述历史搜索项集合中的出现次数超过第一阈值次数;以及
将所述至少一个历史搜索项包括的单个实体确定为所述关键实体。
10.根据权利要求8所述的方法,其中确定所述关键实体包括:
基于所述多个实体在所述一组历史搜索项中的出现次数,从所述多个实体中确定出现次数超过第二阈值次数的高频实体;以及
根据确定所述高频实体在对应的历史搜索项中的权重超过阈值权重,将所述高频实体确定为所述关键实体,其中所述权重指示所述高频实体在所述对应的历史搜索项中的重要性。
11.根据权利要求10所述的方法,其中所述权重是基于以下至少一项确定的:
所述高频实体在所述对应的历史搜索项中的位置,以及
所述高频实体的长度与所述对应的历史搜索项的长度之间的关系。
12.根据权利要求1所述的方法,其中确定针对所述目标搜索项的扩展结果包括:
获取针对所述第二历史搜索记录中的历史搜索项的搜索结果;以及
将所述搜索结果确定为所述扩展结果。
13.根据权利要求1所述的方法,其中确定针对所述目标搜索项的扩展结果包括:
获取针对所述第二历史搜索记录中的历史搜索项的历史搜索结果;
从所述历史搜索结果中确定已被用户访问的部分历史搜索结果;以及
将所述部分历史搜索结果确定为所述扩展结果。
14.根据权利要求1所述的方法,其中确定针对所述目标搜索项的扩展结果包括:
获取用户在针对所述第二历史搜索记录中的历史搜索项进行搜索时所产生的信息流;以及
基于所述信息流,确定所述扩展结果。
15.根据权利要求1所述的方法,还包括以下至少一项:
提供所述扩展结果;以及
提供所述扩展结果和针对所述目标搜索项的目标搜索结果。
16.根据权利要求15所述的方法,其中提供所述扩展结果和所述目标搜索结果包括:
确定所述扩展结果的第一分数,所述第一分数指示所述扩展结果与所述第二历史搜索记录中的历史搜索项的相关度;
确定所述目标搜索结果的第二分数,所述第二分数指示所述目标搜索结果与所述目标搜索项的相关度;
基于所述第一分数和所述第二分数,确定所述扩展结果和所述目标搜索结果的优先级;以及
基于所述优先级提供所述扩展结果和所述目标搜索结果。
17.根据权利要求1所述的方法,还包括:
建立用于获得与所述第二历史搜索记录相对应的搜索结果的目标数据源。
18.根据权利要求17所述的方法,其中建立所述目标数据源包括:
确定多个原始数据源中的多个文档的分数,每个文档的所述分数指示所述文档的质量;以及
将所述多个文档中分数超过阈值分数的文档确定为所述目标数据源中的文档。
19.一种搜索内容的装置,包括:
历史搜索记录获取模块,被配置为响应于接收到针对目标搜索项的搜索请求,获取与多个历史搜索请求有关的多个历史搜索记录,每个历史搜索记录包括相对应的历史搜索请求所针对的历史搜索项;
目标搜索项匹配模块,被配置为从所述多个历史搜索记录中确定与所述目标搜索项匹配的第一历史搜索记录;
历史搜索记录确定模块,被配置为基于所述多个历史搜索记录之间的关系,从所述多个历史搜索记录中确定与所述第一历史搜索记录相关联的第二历史搜索记录;以及
扩展结果确定模块,被配置为基于与所述第二历史搜索记录相对应的搜索结果,确定针对所述目标搜索项的扩展结果。
20.根据权利要求19所述的装置,还包括:
类别确定模块,被配置为基于所述多个历史搜索记录包括的多个历史搜索项,确定所述多个历史搜索记录的类别;以及
历史搜索记录关系确定模块,被配置为基于所述类别,确定所述多个历史搜索记录之间的关系。
21.根据权利要求20所述的装置,其中所述多个历史搜索记录中的每个历史搜索记录还包括关键实体,其中所述类别确定模块包括:
剩余部分确定模块,被配置为通过从所述多个历史搜索项中去除相应的关键实体,获得所述多个历史搜索项各自的剩余部分;
需求信息确定模块,被配置为至少基于所述剩余部分确定与所述多个历史搜索项相关联的需求信息;以及
历史搜索记录类别确定模块,被配置为基于所述需求信息来确定所述多个历史搜索记录的类别。
22.根据权利要求20所述的装置,其中所述多个历史搜索记录具有多个类别,并且其中所述历史搜索记录关系确定模块包括:
第一搜索时间或搜索结果确定模块,被配置为从搜索日志中确定针对所述多个历史搜索项的搜索时间或搜索结果;
相关程度确定模块,被配置为基于所述搜索时间或所述搜索结果,确定所述多个类别之间的相关程度;以及
基于相关程度的关系确定模块,被配置为基于所述多个类别之间的相关程度,确定所述多个历史搜索记录之间的关系。
23.根据权利要求19所述的装置,还包括:
第二搜索时间或搜索结果配置模块,被配置为从搜索日志中确定针对所述多个历史搜索项的搜索时间或搜索结果;
关联程度确定模块,被配置为基于所述搜索时间或所述搜索结果,确定所述多个历史搜索记录的之间的关联程度;以及
基于关联程度的关系确定模块,被配置为基于所述多个历史搜索记录之间的关联程度,确定所述多个历史搜索记录之间的关系。
24.根据权利要求19所述的装置,其中所述多个历史搜索记录中的每个历史搜索记录还包括关键实体和每个历史搜索记录的类别,其中所述历史搜索记录确定模块包括:
第二类别确定模块,被配置为基于所述多个历史搜索记录之间的所述关系,确定与所述第一历史搜索记录的第一类别相关联的第二类别;以及
具有类别的第二历史搜索记录确定模块,被配置为从所述多个历史搜索记录确定具有第二类别的第二历史搜索记录,所述第二历史搜索记录包括所述第一历史搜索记录的关键实体。
25.根据权利要求19所述的装置,其中所述历史搜索记录确定模块包括:
一组历史搜索记录确定模块,被配置为基于所述多个历史搜索记录之间的关系,确定与所述第一历史搜索记录相关联的一组历史搜索记录,所述第一历史搜索记录与所述一组历史搜索记录中的每个历史搜索记录具有关联程度;以及
基于关联程度的历史搜索记录确定模块,被配置为基于所述关联程度,从所述一组历史搜索记录中确定所述第二历史搜索记录。
26.根据权利要求19所述的装置,其中所述历史搜索记录获取模块包括:
第一历史搜索项确定模块,被配置为从搜索日志中确定一组历史搜索请求所针对的一组历史搜索项;
实体确定模块,被配置为从所述一组历史搜索项中确定多个实体,每个实体标识与对应历史搜索项相关联的对象;
第一关键实体确定模块,被配置为基于所述多个实体在所述一组历史搜索项中的出现次数,从所述多个实体中确定关键实体;
选择模块,被配置为从所述一组历史搜索项中选择包括所述关键实体的多个历史搜索项;以及
生成模块,被配置为基于所述多个历史搜索项和所述关键实体生成所述多个历史搜索记录。
27.根据权利要求26所述的装置,其中所述第一关键实体确定模块包括:
历史搜索项集合确定模块,被配置为从所述一组历史搜索项中确定包括单个实体的历史搜索项集合;
第二历史搜索项确定模块,被配置为从所述历史搜索项集合确定至少一个历史搜索项,所述至少一个历史搜索项包括的单个实体在所述历史搜索项集合中的出现次数超过第一阈值次数;以及
针对单个实体的关键实体确定模块,被配置为将所述至少一个历史搜索项包括的单个实体确定为所述关键实体。
28.根据权利要求26所述的装置,其中关键实体确定模块包括:
高频实体确定模块,被配置为基于所述多个实体在所述一组历史搜索项中的出现次数,从所述多个实体中确定出现次数超过第二阈值次数的高频实体;以及
第二关键实体确定模块,被配置为根据确定所述高频实体在对应的历史搜索项中的权重超过阈值权重,将所述高频实体确定为所述关键实体,其中所述权重指示所述高频实体在所述对应的历史搜索项中的重要性。
29.根据权利要求28所述的装置,其中所述第二关键实体确定模块包括:
位置确定模块,被配置为所述高频实体在所述对应的历史搜索项中的位置,以及
长度关系确定模块,被配置为所述高频实体的长度与所述对应的历史搜索项的长度之间的关系。
30.根据权利要求19所述的装置,其中所述扩展结果确定模块包括:
第一搜索结果获取模块,被配置为获取针对所述第二历史搜索记录中的历史搜索项的搜索结果;以及
针对搜索结果的扩展结果确定模块,被配置为将所述搜索结果确定为所述扩展结果。
31.根据权利要求19所述的装置,其中所述扩展结果确定模块包括:
第二搜索结果获取模块,被配置为获取针对所述第二历史搜索记录中的历史搜索项的历史搜索结果;
部分历史搜索结果确定模块,被配置为从所述历史搜索结果中确定已被用户访问的部分历史搜索结果;以及
部分历史搜索结果扩展模块,被配置为将所述部分历史搜索结果确定为所述扩展结果。
32.根据权利要求19所述的装置,其中所述扩展结果确定模块包括:
信息流模块,被配置为获取用户在针对所述第二历史搜索记录中的历史搜索项进行搜索时所产生的信息流;以及
针地信息流的扩展结果模块,被配置为基于所述信息流,确定所述扩展结果。
33.根据权利要求19所述的装置,还包括以下至少一项:
第一提供装置,被配置为提供所述扩展结果;以及
第二提供装置,被配置为提供所述扩展结果和针对所述目标搜索项的目标搜索结果。
34.根据权利要求33所述的装置,其中第二提供装置包括:
第一分数确定模块,被配置为确定所述扩展结果的第一分数,所述第一分数指示所述扩展结果与所述第二历史搜索记录中的历史搜索项的相关度;
第二分数确定模块,被配置为确定所述目标搜索结果的第二分数,所述第二分数指示所述目标搜索结果与所述目标搜索项的相关度;
优先级确定模块,被配置为基于所述第一分数和所述第二分数,确定所述扩展结果和所述目标搜索结果的优先级;以及
扩展结果和搜索结果提供模块,被配置为基于所述优先级提供所述扩展结果和所述目标搜索结果。
35.根据权利要求19所述的装置,还包括:
目标数据源建立模块,被配置为建立用于获得与所述第二历史搜索记录相对应的搜索结果的目标数据源。
36.根据权利要求35所述的装置,其中所述目标数据源建立模块包括:
文档分数确定模块,被配置为确定多个原始数据源中的多个文档的分数,每个文档的所述分数指示所述文档的质量;以及
目标数据源文档确定模块,被配置为将所述多个文档中分数超过阈值分数的文档确定为所述目标数据源中的文档。
37.一种电子设备,包括:
一个或多个处理器;以及
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现根据权利要求1-18中任一项所述的方法。
38.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-18中任一项所述的方法。
CN202010252907.2A 2020-04-01 2020-04-01 用于搜索内容的方法、装置、设备和计算机可读存储介质 Active CN111475725B (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN202010252907.2A CN111475725B (zh) 2020-04-01 2020-04-01 用于搜索内容的方法、装置、设备和计算机可读存储介质
KR1020227027825A KR20220119745A (ko) 2020-04-01 2020-09-23 콘텐츠를 검색하는 방법, 장치, 기기 및 컴퓨터 판독 가능 저장 매체
EP20929634.2A EP4113329A4 (en) 2020-04-01 2020-09-23 METHOD, APPARATUS AND DEVICE FOR SEARCHING CONTENT, AND COMPUTER-READABLE STORAGE MEDIUM
PCT/CN2020/117129 WO2021196541A1 (zh) 2020-04-01 2020-09-23 用于搜索内容的方法、装置、设备和计算机可读存储介质
US17/914,557 US20230147941A1 (en) 2020-04-01 2020-09-23 Method, apparatus and device used to search for content
JP2022553192A JP7451747B2 (ja) 2020-04-01 2020-09-23 コンテンツを検索する方法、装置、機器及びコンピュータ読み取り可能な記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010252907.2A CN111475725B (zh) 2020-04-01 2020-04-01 用于搜索内容的方法、装置、设备和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111475725A true CN111475725A (zh) 2020-07-31
CN111475725B CN111475725B (zh) 2023-11-07

Family

ID=71749483

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010252907.2A Active CN111475725B (zh) 2020-04-01 2020-04-01 用于搜索内容的方法、装置、设备和计算机可读存储介质

Country Status (6)

Country Link
US (1) US20230147941A1 (zh)
EP (1) EP4113329A4 (zh)
JP (1) JP7451747B2 (zh)
KR (1) KR20220119745A (zh)
CN (1) CN111475725B (zh)
WO (1) WO2021196541A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112053688A (zh) * 2020-08-27 2020-12-08 海信视像科技股份有限公司 一种语音交互方法及交互设备、服务器
CN112528144A (zh) * 2020-12-08 2021-03-19 北京百度网讯科技有限公司 搜索推荐方法、装置、智能设备、电子设备及存储介质
CN113051485A (zh) * 2021-03-26 2021-06-29 北京达佳互联信息技术有限公司 群组搜索方法、装置、终端及存储介质
WO2021196541A1 (zh) * 2020-04-01 2021-10-07 百度在线网络技术(北京)有限公司 用于搜索内容的方法、装置、设备和计算机可读存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116628129B (zh) * 2023-07-21 2024-02-27 南京爱福路汽车科技有限公司 一种汽车配件搜索方法及系统

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101192223A (zh) * 2006-11-27 2008-06-04 北京三星通信技术研究有限公司 黄页搜索方法和黄页搜索系统
US20090164460A1 (en) * 2007-12-21 2009-06-25 Samsung Elcetronics Co., Ltd. Digital television video program providing system, digital television, and control method for the same
CN102419776A (zh) * 2011-12-31 2012-04-18 北京百度网讯科技有限公司 一种满足用户多维度搜索需求的方法和设备
CN103593410A (zh) * 2013-10-22 2014-02-19 上海交通大学 通过替换概念性词语进行搜索推荐系统
CN103617266A (zh) * 2013-12-03 2014-03-05 北京奇虎科技有限公司 个性化扩展搜索方法及装置、系统
WO2014056370A1 (zh) * 2012-10-12 2014-04-17 合一网络技术(北京)有限公司 一种用于提供个性化搜索列表的方法及系统
CN105893397A (zh) * 2015-06-30 2016-08-24 北京爱奇艺科技有限公司 一种视频推荐方法及装置
CN105898423A (zh) * 2015-12-08 2016-08-24 乐视网信息技术(北京)股份有限公司 视频推送方法、系统及服务器
CN106095819A (zh) * 2016-05-31 2016-11-09 北京奇艺世纪科技有限公司 一种视频推荐方法及装置
CN108399232A (zh) * 2018-02-13 2018-08-14 北京奇虎科技有限公司 一种信息推送方法、装置及电子设备
CN109101658A (zh) * 2018-08-31 2018-12-28 优视科技新加坡有限公司 信息搜索方法、装置及设备/终端/服务器
CN109446402A (zh) * 2017-08-29 2019-03-08 阿里巴巴集团控股有限公司 一种搜索方法及装置

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7562069B1 (en) * 2004-07-01 2009-07-14 Aol Llc Query disambiguation
US20060224583A1 (en) 2005-03-31 2006-10-05 Google, Inc. Systems and methods for analyzing a user's web history
JP2010122932A (ja) 2008-11-20 2010-06-03 Nippon Telegr & Teleph Corp <Ntt> 文書検索装置、文書検索方法、および文書検索プログラム
JP5220659B2 (ja) 2009-02-27 2013-06-26 ヤフー株式会社 検索装置及び方法
US20100332493A1 (en) * 2009-06-25 2010-12-30 Yahoo! Inc. Semantic search extensions for web search engines
CN102012900B (zh) * 2009-09-04 2013-01-30 阿里巴巴集团控股有限公司 信息检索方法和系统
JP5493845B2 (ja) 2009-12-28 2014-05-14 富士通株式会社 検索支援プログラム、検索支援装置、及び検索支援方法
CN101840420B (zh) 2010-04-02 2011-12-28 清华大学 搜索辅助系统与搜索辅助方法
US20140358971A1 (en) * 2010-10-19 2014-12-04 Google Inc. Techniques for identifying chain businesses and queries
US20120203751A1 (en) * 2011-02-07 2012-08-09 International Business Machines Corporation Capture, Aggregate, and Use Search Activities as a Source of Social Data Within an Enterprise
KR101818717B1 (ko) * 2011-09-27 2018-01-15 네이버 주식회사 컨셉 키워드 확장 데이터 셋을 이용한 검색방법, 장치 및 컴퓨터로 판독 가능한 기록매체
US20130124511A1 (en) * 2011-11-14 2013-05-16 Noah Levin Visual search history
CN103577489A (zh) * 2012-08-08 2014-02-12 百度在线网络技术(北京)有限公司 一种网页浏览历史查询方法及装置
CN103049495A (zh) * 2012-12-07 2013-04-17 百度在线网络技术(北京)有限公司 用于提供与查询序列相对应的搜索建议的方法、装置与设备
US20160306887A1 (en) * 2013-12-03 2016-10-20 Beijing Qihoo Technology Company Limited Methods, apparatuses and systems for linked and personalized extended search
CN105335391B (zh) * 2014-07-09 2019-02-15 阿里巴巴集团控股有限公司 基于搜索引擎的搜索请求的处理方法和装置
CN104462325B (zh) * 2014-12-02 2019-05-03 百度在线网络技术(北京)有限公司 搜索推荐方法及装置
CN104537057B (zh) * 2014-12-26 2016-06-29 奇飞翔艺(北京)软件有限公司 数据搜索方法及客户端
JP6664599B2 (ja) 2015-08-25 2020-03-13 ヤフー株式会社 曖昧性評価装置、曖昧性評価方法、及び曖昧性評価プログラム
CN106372231A (zh) * 2016-09-08 2017-02-01 乐视控股(北京)有限公司 一种搜索方法及装置
CA3128459A1 (en) * 2019-02-01 2020-08-06 Ancestry.Com Operations Inc. Search and ranking of records across different databases
CN110245357B (zh) * 2019-06-26 2023-05-02 北京百度网讯科技有限公司 主实体识别方法和装置
CN111475725B (zh) * 2020-04-01 2023-11-07 百度在线网络技术(北京)有限公司 用于搜索内容的方法、装置、设备和计算机可读存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101192223A (zh) * 2006-11-27 2008-06-04 北京三星通信技术研究有限公司 黄页搜索方法和黄页搜索系统
US20090164460A1 (en) * 2007-12-21 2009-06-25 Samsung Elcetronics Co., Ltd. Digital television video program providing system, digital television, and control method for the same
CN102419776A (zh) * 2011-12-31 2012-04-18 北京百度网讯科技有限公司 一种满足用户多维度搜索需求的方法和设备
WO2014056370A1 (zh) * 2012-10-12 2014-04-17 合一网络技术(北京)有限公司 一种用于提供个性化搜索列表的方法及系统
CN103593410A (zh) * 2013-10-22 2014-02-19 上海交通大学 通过替换概念性词语进行搜索推荐系统
CN103617266A (zh) * 2013-12-03 2014-03-05 北京奇虎科技有限公司 个性化扩展搜索方法及装置、系统
CN105893397A (zh) * 2015-06-30 2016-08-24 北京爱奇艺科技有限公司 一种视频推荐方法及装置
CN105898423A (zh) * 2015-12-08 2016-08-24 乐视网信息技术(北京)股份有限公司 视频推送方法、系统及服务器
CN106095819A (zh) * 2016-05-31 2016-11-09 北京奇艺世纪科技有限公司 一种视频推荐方法及装置
CN109446402A (zh) * 2017-08-29 2019-03-08 阿里巴巴集团控股有限公司 一种搜索方法及装置
CN108399232A (zh) * 2018-02-13 2018-08-14 北京奇虎科技有限公司 一种信息推送方法、装置及电子设备
CN109101658A (zh) * 2018-08-31 2018-12-28 优视科技新加坡有限公司 信息搜索方法、装置及设备/终端/服务器

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
PENGCHAO SUN; SHIQUN YIN; YUPENG ZHANG; TAO TAN: "Research on Personalized Recommendation Algorithm Based on Time Weighted and Sparse Space Clustering", 2018 IEEE 9TH INTERNATIONAL CONFERENCE ON SOFTWARE ENGINEERING AND SERVICE SCIENCE (ICSESS) *
冯莉: "基于K-means的远程教育课程推荐系统的设计", 《厦门广播电视大学学报》, no. 4 *
温宇俊 袁晖: "基于用户上下文序列的个性化新闻推荐方法研究", 《中国传媒大学学报》, vol. 25, no. 4 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021196541A1 (zh) * 2020-04-01 2021-10-07 百度在线网络技术(北京)有限公司 用于搜索内容的方法、装置、设备和计算机可读存储介质
CN112053688A (zh) * 2020-08-27 2020-12-08 海信视像科技股份有限公司 一种语音交互方法及交互设备、服务器
CN112053688B (zh) * 2020-08-27 2024-03-08 海信视像科技股份有限公司 一种语音交互方法及交互设备、服务器
CN112528144A (zh) * 2020-12-08 2021-03-19 北京百度网讯科技有限公司 搜索推荐方法、装置、智能设备、电子设备及存储介质
CN113051485A (zh) * 2021-03-26 2021-06-29 北京达佳互联信息技术有限公司 群组搜索方法、装置、终端及存储介质
CN113051485B (zh) * 2021-03-26 2023-08-22 北京达佳互联信息技术有限公司 群组搜索方法、装置、终端及存储介质

Also Published As

Publication number Publication date
JP7451747B2 (ja) 2024-03-18
JP2023516209A (ja) 2023-04-18
WO2021196541A1 (zh) 2021-10-07
CN111475725B (zh) 2023-11-07
EP4113329A4 (en) 2024-04-24
EP4113329A1 (en) 2023-01-04
US20230147941A1 (en) 2023-05-11
KR20220119745A (ko) 2022-08-30

Similar Documents

Publication Publication Date Title
US11663254B2 (en) System and engine for seeded clustering of news events
CN111475725B (zh) 用于搜索内容的方法、装置、设备和计算机可读存储介质
Ding et al. Entity discovery and assignment for opinion mining applications
US9846744B2 (en) Media discovery and playlist generation
US20170116200A1 (en) Trust propagation through both explicit and implicit social networks
CN104899322A (zh) 搜索引擎及其实现方法
CN107180093B (zh) 信息搜索方法及装置和时效性查询词识别方法及装置
US20130060769A1 (en) System and method for identifying social media interactions
Manjari et al. Extractive Text Summarization from Web pages using Selenium and TF-IDF algorithm
CN113297457B (zh) 一种高精准性的信息资源智能推送系统及推送方法
US20100042610A1 (en) Rank documents based on popularity of key metadata
CN111753167B (zh) 搜索处理方法、装置、计算机设备和介质
CN102737021A (zh) 搜索引擎及其实现方法
CN111444304A (zh) 搜索排序的方法和装置
CA2956627A1 (en) System and engine for seeded clustering of news events
CN114330329A (zh) 一种业务内容搜索方法、装置、电子设备及存储介质
CN114090877A (zh) 职位信息推荐方法、装置、电子设备及存储介质
Wei et al. Online education recommendation model based on user behavior data analysis
CN116431895A (zh) 安全生产知识个性化推荐方法及系统
Rajkumar et al. Users’ click and bookmark based personalization using modified agglomerative clustering for web search engine
Maake et al. Information processing in research paper recommender system classes
Ren et al. Role-explicit query extraction and utilization for quantifying user intents
CN111831884A (zh) 一种基于信息查找的匹配系统与方法
Alattar et al. A PERSONALIZED SEARCH ENGINE BASED ON CORRELATION CLUSTERING METHOD.
Ullah et al. Query subtopic mining for search result diversification

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant