CN111382339B - 一种搜索处理方法、装置和用于搜索处理的装置 - Google Patents

一种搜索处理方法、装置和用于搜索处理的装置 Download PDF

Info

Publication number
CN111382339B
CN111382339B CN202010163233.9A CN202010163233A CN111382339B CN 111382339 B CN111382339 B CN 111382339B CN 202010163233 A CN202010163233 A CN 202010163233A CN 111382339 B CN111382339 B CN 111382339B
Authority
CN
China
Prior art keywords
search
search results
theme
topics
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010163233.9A
Other languages
English (en)
Other versions
CN111382339A (zh
Inventor
宫兆汉
陈炜鹏
黄晓烽
黄冰俏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN202010163233.9A priority Critical patent/CN111382339B/zh
Publication of CN111382339A publication Critical patent/CN111382339A/zh
Application granted granted Critical
Publication of CN111382339B publication Critical patent/CN111382339B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例提供了一种搜索处理方法、装置和用于搜索处理的装置。其中的方法具体包括:确定第一搜索词对应的多个第一搜索结果;基于主题对所述多个第一搜索结果进行聚类,以得到所述多个第一搜索结果分别对应的第一主题;依据所述第一主题,对所述多个第一搜索结果进行聚合展示。本发明实施例可以节省逐个点击搜索结果项的操作成本,提高用户的信息获取效率。

Description

一种搜索处理方法、装置和用于搜索处理的装置
技术领域
本发明涉及互联网信息处理技术领域,尤其涉及一种搜索处理方法、装置和用于搜索处理的装置。
背景技术
搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供搜索服务,并将用户搜索相关的信息展示给用户的系统。
目前,用户可以在搜索引擎的搜索框中输入搜索词,而搜索引擎可以根据该搜索词,在数据库中进行搜索,以获得与该搜索词相匹配的网页,并在搜索结果页中展现上述网页对应的搜索结果项。搜索结果项通常包括:网页的标题、摘要等信息,以使用户根据标题、摘要等信息、确定是否打开对应的网页。
在实际应用中,搜索结果页中通常包括大量的搜索结果项,用户需要通过逐个点击搜索结果项的方式、从大量的搜索结果项中寻找其所需的信息;该寻找过程中,用户需要大量的点击操作、才能获得所需的信息,导致用户的信息获取效率较低。
发明内容
本发明实施例提供一种搜索处理方法、装置和用于搜索处理的装置,可以节省逐个点击搜索结果项的操作成本,提高用户的信息获取效率。
为了解决上述技术问题,本发明实施例公开了一种搜索处理方法,包括:
确定第一搜索词对应的多个第一搜索结果;
基于主题对所述多个第一搜索结果进行聚类,以得到所述多个第一搜索结果分别对应的第一主题;
依据所述第一主题,对所述多个第一搜索结果进行聚合展示。
另一方面,本发明实施例公开了一种搜索处理装置,包括:
搜索结果确定模块,用于确定第一搜索词对应的多个第一搜索结果;
第一聚类模块,用于基于主题对所述多个第一搜索结果进行聚类,以得到所述多个第一搜索结果分别对应的第一主题;以及
第一聚合展示模块,用于依据所述第一主题,对所述多个第一搜索结果进行聚合展示。
再一方面,本发明实施例公开了一种用于搜索处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
确定第一搜索词对应的多个第一搜索结果;
基于主题对所述多个第一搜索结果进行聚类,以得到所述多个第一搜索结果分别对应的第一主题;
依据所述第一主题,对所述多个第一搜索结果进行聚合展示。
又一方面,本发明实施例公开了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如前述一个或多个所述的搜索处理方法。
本发明实施例包括以下优点:
本发明实施例中的一个主题可以反映一个维度的用户需求,本发明实施例按照第一主题对多个第一搜索结果进行聚合展示,可以明确第一主题所反映的用户需求,以使用户在大量的搜索结果项中快速定位到自身需求所对应的目标第一主题,并对目标第一主题对应的多个第一搜索结果进行集中浏览。由于本发明实施例可以节省逐个点击搜索结果项的操作成本,因此能够提高用户的信息获取效率。
并且,在用户需求不明确的情况下,本发明实施例可以帮助用户通过浏览不同的第一主题来明确用户需求,具体地,可以帮助用户在搜索结果页中找到与自身需求相应的第一主题并集中查看,而可以不修改搜索词并重新搜索。由于能够节省用户修改搜索词并重新搜索的操作,因此能够进一步提高用户的信息获取效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的一种搜索处理方法的应用环境的结构示意图;
图2是本发明的一种搜索处理方法实施例一的步骤流程图;
图3是本发明实施例的一种搜索结果页的示意;
图4是本发明实施例的另一种搜索结果页的示意;
图5是本发明的一种搜索处理方法实施例二的步骤流程图;
图6是本发明的一种搜索处理装置实施例的结构框图;
图7是本发明的一种用于搜索处理的装置800的框图;及
图8是本发明的一些实施例中服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在实际应用中,搜索结果页中通常包括大量的搜索结果项,用户通常需要依据自身的阅读和理解,从大量的搜索结果项中去寻找其所需的信息,上述寻找过程需要耗费较多的操作成本,导致用户的信息获取效率较低。
针对用户的信息获取效率较低的技术问题,本发明实施例提供了一种搜索处理方法,该方法可以包括:确定第一搜索词对应的多个第一搜索结果;基于主题对上述多个第一搜索结果进行聚类,以得到上述多个第一搜索结果分别对应的第一主题;依据上述第一主题,对上述多个第一搜索结果进行聚合展示。
主题是指搜索结果所要表现的中心思想,泛指主要内容。本发明实施例中的一个主题可以反映一个维度的用户需求,本发明实施例按照第一主题对多个第一搜索结果进行聚合展示,不同第一主题的展示区域可以相互独立,故可以明确第一主题所反映的用户需求,以使用户在大量的搜索结果项中快速定位到自身需求所对应的目标第一主题,并对目标第一主题对应的多个第一搜索结果进行集中浏览。由于本发明实施例可以节省逐个点击搜索结果项的操作成本,因此能够提高用户的信息获取效率。
并且,在用户需求不明确的情况下,本发明实施例可以使得用户通过浏览不同的第一主题来明确用户需求,因此能够进一步提高用户的信息获取效率。
例如,搜索词为“人名A”,本发明实施例可以对“人名A”对应的第一搜索结果进行聚类,以得到如下第一主题中的至少一种:“人名A直播清单”、“人名A推荐的口红有哪些”、“人名A有哪些精彩视频”、“人名A和小助理什么情况”、“人名A直播翻车是怎么回事”、“人名A直播在哪里看”、“人名A的新浪微博”、“人名A怎么火的”、“如何评价人名A”等等,并按照各个第一主题对第一搜索结果进行聚合展示。任意用户可以在搜索结果页中快速定位到自身需求所对应的目标第一主题,并对目标第一主题对应的多个第一搜索结果进行集中浏览。
例如,用户A的需求为“人名A直播清单”,则其可以查看“人名A直播清单”对应的第一搜索结果。又如,用户B的需求为“人名A直播在哪里看”,则其可以查看“人名A直播在哪里看”对应的第一搜索结果。或者,用户C的需求为“人名A怎么火的”,则其可以查看“人名A怎么火的”对应的第一搜索结果,等等。
本申请实施例提供的搜索处理方法可应用于图1所示的应用环境中,如图1所示,客户端100与服务器200位于有线或无线网络中,通过该有线或无线网络,客户端100与服务器200进行数据交互。
可选地,客户端100可以运行在设备上,例如,客户端100可以为设备上运行的APP(应用程序,Application)或网站,如搜索APP等,本申请实施例对于客户端所对应的具体APP或网站不加以限制。
可选地,上述设备具体可以包括但不限于:智能手机、平板电脑、电子书阅读器、MP3(动态影像专家压缩标准音频层面3,Moving Picture Experts Group Audio LayerIII)播放器、MP4(动态影像专家压缩标准音频层面4,Moving Picture Experts GroupAudio Layer IV)播放器、膝上型便携计算机、车载电脑、台式计算机、机顶盒、智能电视机、可穿戴设备、智能音箱等等。可以理解,本申请实施例对于具体的设备不加以限制。
方法实施例一
参照图2,示出了本发明的一种搜索处理方法实施例一的步骤流程图,具体可以包括如下步骤:
步骤201、确定第一搜索词对应的多个第一搜索结果;
步骤202、基于主题对上述多个第一搜索结果进行聚类,以得到上述多个第一搜索结果分别对应的第一主题;
步骤203、依据上述第一主题,对上述多个第一搜索结果进行聚合展示。
图2所示实施例的至少一个步骤可由服务器和/或客户端执行,当然本发明实施例对于各个步骤的具体执行主体不加以限制。
在步骤201中,客户端可以通过语音输入方式、键盘输入方式等输入方式,接收用户输入的第一搜索词。可以理解,本发明实施例对于第一搜索词的具体触发方式不加以限制。
本发明实施例可以假定第一搜索词呈现为文本形式。对于呈现为非文本形式的第一搜索词,可以将非文本形式的第一搜索词转换为文本形式的第一搜索词。例如,可以通过语音识别技术,将语音形式的第一搜索词转换为文本形式的第一搜索词。又如,可以对图片形式的第一搜索词进行OCR(光学字符识别,Optical Character Recognition),以得到文本形式的第一搜索词。
本发明实施例可以在搜索引擎的数据库中进行搜索,以得到第一搜索词对应的多个第一搜索结果。第一搜索结果可以对应有网页、或者文档等资源。假设第一搜索结果的数量为M(M可以为大于1的自然数),本发明实施例对于具体的第一搜索结果不加以限制。
步骤202中,将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。
本发明实施例基于主题对上述多个第一搜索结果进行聚类,可以将具有相似主题内容的第一搜索结果聚集至相同的第一主题,而可以将具有相异主题内容的第一搜索结果聚集至不同的第一主题。
在本发明的一种可选实施例中,上述基于主题对上述多个第一搜索结果进行聚类,具体包括:依据上述多个第一搜索结果分别对应的内容特征,确定上述多个第一搜索结果分别对应的语义主题信息;依据上述多个第一搜索结果分别对应的语义主题信息,对上述多个第一搜索结果进行聚类,以得到上述多个第一搜索结果分别对应的第一主题。
上述内容特征可以包括:标题内容、摘要内容、或者正文内容。本发明实施例可以从内容特征提取出现频率符合预设条件的关键内容,以得到语义主题信息。预设条件可以包括:出现频率超过频率阈值、或者出现频率的排序结果靠前等。语义主题信息可以包括:至少一个关键内容。包括多个关键内容的语义主题信息可以称为语义主题向量。关键内容对应的语言单位可以包括:词、或短语、或句子等。
本发明实施例可以利用聚类方法,依据语义主题信息,对上述多个第一搜索结果进行聚类。可用的聚类方法可以包括:K均值聚类方法、均值漂移聚类方法、基于密度的聚类方法、用高斯混合模型的最大期望聚类方法、凝聚层次聚类方法、图团体检测方法等,可以理解,本发明实施例对于具体的聚类方法不加以限制。
可以理解,上述依据语义主题信息,对上述多个第一搜索结果进行聚类,只是作为对上述多个第一搜索结果进行聚类的可选实施例,实际上,本发明实施例对于对上述多个第一搜索结果进行聚类的具体过程不加以限制。例如,本发明实施例可以预先确定第一搜索词对应的主题,并依据第一搜索结果在第一搜索词对应的主题上的概率,确定第一搜索结果对应的主题。
对上述多个第一搜索结果进行聚类,可以得到至少一个第一主题、以及每个第一主题包括的第一搜索结果。
步骤203中,可以通过第一主题,将原本分散的第一搜索结果聚集在一起展示。
本发明实施例中,可以在搜索结果页中展示主题区域,主题区域可以包括:第一主题的标识、以及第一主题包括的第一搜索结果的信息。
本发明实施例中,主题区域可以呈现为卡片的形式,也即可以通过卡片承载第一主题对应的第一搜索结果的信息,当然,本发明实施例对于第一主题对应的第一搜索结果的信息的具体呈现方式不加以限制。
参照图3,示出了本发明实施例的一种搜索结果页的示意,其中,该搜索结果页可以包括:搜索框301和N个主题对应的主题区域302,N可以为大于0的自然数。
其中,搜索框301中可以显示有用户输入的搜索词,如本发明实施例的第一搜索词。
本发明实施例可以对第一搜索词对应的多个第一搜索结果进行聚类,以得到N个主题。则本发明实施例在搜索结果页中设置N个主题分别对应的主题区域302,并在每个主题区域302中展示对应的第一搜索结果。可以理解,一个主题区域302中可以包括:一个或多个第一搜索结果。
可以理解,图3中N个主题对应的主题区域302的排列方式只是作为示例,而不理解为对主题区域302的排列方式的应用限制。
在本发明的一种可选实施例中,可以在搜索结果页中提供N个主题对应的主题选项,并依据用户针对主题选项的选择操作,展示选择的目标主题选项对应的第一搜索结果。
例如,图4中的搜索结果页可以包括:搜索框401、选项区域402和主题区域403。
选项区域402可以包括:N个主题分别对应的主题选项,若一个目标主题选项被选中,则可以在主题区域403中显示选中的目标主题选项对应的第一搜索结果。如图4中,主题1被选中,则主题区域403中可以显示主题1对应的第一搜索结果。
选项区域402中,可以依据所述第一主题对应的热度信息和/或时效信息,对多个第一主题对应的主题选项进行排序展示。
在本发明的另一种可选实施例中,上述方法还可以包括:在上述第一搜索词对应的搜索结果页中展示目录入口。上述目录入口用于跳转至主题对应的目录。
本发明实施例中,目录入口可以为目录控件。目录控件可以位于搜索结果页的左下侧、右下侧等位置。
可选地,该目录控件对应的图标可以为对象的图标,对象可以包括:人、虚拟人、动物、虚拟动物、植物、虚拟植物等。例如,对象可以为虚拟猫、虚拟狗等虚拟动物。目标控件的图标为例如虚拟动物的图标,可以提高目标控件对于用户的吸引度和参与度,在此基础上可以提高目标控件的操作的准确度。
本发明实施例中,可选的是,上述方法还可以包括:响应于针对上述目录入口的触发操作,展示上述搜索结果页对应的多个主题选项。上述主题选项与搜索结果页对应的主题(如第一主题)相关联。在展示上述搜索结果页对应的多个主题选项的情况下,可以停止展示目录入口。
可选地,可以通过位于搜索结果页之上的蒙层展示目录区域,并在目录区域中展示上述搜索结果页对应的多个主题选项。上述目录区域的尺寸可以小于或等于搜索结果页的尺寸。
蒙层是指具有一定透明值的图层,蒙层的参数可以包括大小、显示位置和透明值。本发明实施例中的蒙层覆盖在搜索结果页的显示元素上,这样,可以通过蒙层的参数,实现蒙层和搜索结果页的显示元素的同时显示。例如,可以通过搜索结果页显示具体的搜索结果,同时通过蒙层显示搜索结果对应的主题选项。
当然,通过位于搜索结果页之上的蒙层展示目录区域,只是作为可选实施例,实际上还可以通过弹窗展示搜索结果页对应的多个主题选项,本发明实施例对于搜索结果页对应的多个主题选项的具体展示方式不加以限制。
本发明实施例中,可选的是,上述方法还可以包括:响应于针对目标主题选项的触发操作,在上述搜索结果页中定位到上述目标主题选项对应主题的位置。
本发明实施例中,搜索结果页中可以包括较多的页面内容。例如,搜索结果页中可以包括:主题类型的搜索结果。主题类型的搜索结果可以表征针对主题聚合展示的搜索结果。
可选地,除了主题类型的搜索结果之外,搜索结果页中还可以包括:非主题类型的搜索结果,如百科类型的搜索结果。可选地,可以将百科类型的搜索结果展示在主题类型的搜索结果的前面。
受到页面区域的限制,在搜索结果页包含主题的数量较多的情况下,用户通常需要通过滚动、滑动等方式,对搜索结果页的页面内容进行切换。
例如,搜索结果页包含N个主题,N大于10,假设一个时刻搜索结果页最多能够显示2个主题的搜索结果,则通常需要多次切换才能查看所需主题的搜索结果。
本发明实施例通过目录的形式提供多个主题分别对应的主题选项,并响应于针对目标主题选项的触发操作,在上述搜索结果页中定位到上述目标主题选项对应主题的位置,可以帮助用户实现所需主题对应搜索结果的快速定位,因此能够进一步提高用户的信息获取效率。
本发明实施例中,可以将目标主题选项对应主题的搜索结果返定位至页面区域的开头、中间等预设位置,以使用户在合适的位置查看所需主题对应的搜索结果。
可选地,在接收到针对目标主题选项的触发操作后,可以停止展示搜索结果页对应的多个主题选项,以避免主题选项影响用户针对所需主题对应的搜索结果的阅读。此种情况下,可以重新展示目录入口,以便于用户对搜索结果页中的主题进行切换。
本发明实施例中,可选的是,上述方法还可以包括:响应于针对上述目录入口的触发操作,展示上述搜索结果页对应的多个主题选项,并对最近一次触发的目标主题选项进行标记展示。
上述标记展示可以包括:边框展示、下划线展示、底纹展示等。最近一次触发的目标主题选项的标记展示,能够提示用户最近浏览的主题的信息,能够帮助用户确定后续需要触发的主题选项,提高主题选项的操作准确率。
本发明实施例中,可选的是,可以展示所述第一主题对应的热度信息。例如,可以在主题区域中主题标识的周围展示热度信息。热度信息的展示文本可以为“XXX人在关注”等。
本领域中,通常包含某个主题的信息产生的网络流量越大,则一定程度上可以表明该主题收到的关注可能越多,因此,可以根据第一主题对应的文本信息的网络流量数据,确定第一主题的热度信息。所述网络流量数据可以包括:点击数据、分享数据、评论数据、文本信息数量或文本来源数量等。
在本发明的一种可选实施例中,上述对所述多个第一搜索结果进行聚合展示,具体可以包括:依据所述第一主题对应的热度信息和/或时效信息,对多个第一主题对应的第一搜索结果进行排序展示。
根据一种实施例,可以将第一热度信息对应的第一主题排在第二热度信息对应的第一主题的前面,其中,第一热度信息对应的热度高于第二热度信息对应的热度,以将热度更高的第一主题排在较为靠前的位置。
根据另一种实施例,可以将第一时效信息对应的第一主题排在第二时效信息对应的第一主题的前面,其中,第一时效信息对应的时效高于第二时效信息对应的时效,以将时效更高的第一主题排在较为靠前的位置。
本发明实施例可以依据第一主题在预设时间段内的网络流量数据,确定第一主题对应的时效信息。预设时间段可由本领域技术人员根据实际应用需求确定,预设时间段可以为最近7天、最近3天等,由此可以根据最近一个时间段内的网络流量数据,确定时效信息。
本发明实施例中,可选的是,可以展示所述第一主题对应的搜索入口,该搜索入口可用于触发第一主题对应的搜索。
可选地,上述方法还可以包括:响应于针对所述搜索入口的触发操作,确定所述第一主题对应的第三搜索词;展示所述第三搜索词对应的第三搜索结果。
本发明实施例可以自动确定第一主题对应的第三搜索词,并展示第三搜索词对应的第三搜索结果。例如,可以跳转至第三搜索词对应的搜索结果页,并展示第三搜索词对应的第三搜索结果。
第三搜索词可以为第一主题包括的、不同于第一搜索词的搜索词。本发明实施例提供第三搜索词对应的第三搜索结果,可以在第一搜索结果的基础上,对第一主题的搜索结果进行扩充,以满足用户的信息需求。
根据一种实施例,可以将第一主题的标识作为第三搜索词。
根据另一种实施例,可以从第一主题对应的网页或文档中提取第一关键内容,并依据提取的第一关键内容得到第三搜索词。例如,可以直接将第一关键内容作为第三搜索词。又如,可以对提取的多个第一关键内容进行组合,得到第三搜索词。再如,可以将提取的第一关键内容与第一主题的标识进行组合,以得到第三搜索词等。
根据再一种实施例,可以依据第一主题对应的用户行为数据,确定第三搜索词。用户行为数据可以包括:用户搜索数据、用户点击数据或用户输入数据等。
本发明实施例可以从用户行为数据中提取与第一主题相关的第二关键内容,并依据第二关键内容得到第三搜索词。例如,可以直接将第二关键内容作为第三搜索词。又如,可以对提取的多个第二关键内容进行组合,得到第三搜索词。再如,可以将提取的第二关键内容与第一主题的标识进行组合,以得到第三搜索词等。
例如,用户搜索数据可以包括:同一用户在一个时间段内多次输入的多个搜索词等。
在实际应用中,可能会出现搜索结果不符合用户需求的情形,在出现此种情形的情况下,用户通常会反复修改搜索词,直至得到符合用户需求的搜索结果。因此,本发明实施例可以对用户在一个时间段内多次输入的多个搜索词进行分析,以得到第一主题对应的第二关键内容。
当然,用户搜索数据可以包括:不同用户输入的多个搜索词。本发明实施例可以利用搜索词与第一主题的标识之间的匹配度,确定第一主题对应的相关搜索词,并依据相关搜索词得到第三搜索词。相关搜索词可以为第二关键内容的一个例子。
用户点击数据可以包括:同一用户在一个时间段内浏览的页面内容。用户在一个时间段内关注的内容通常与一个主题相关,因此,同一用户在一个时间段内浏览的页面内容可以属于同一个主题。本发明实施例可以对同一用户在一个时间段内的浏览内容进行分析,以得到对应的语义主题。并利用语义主题与第一主题之间的匹配度,确定第一主题对应的浏览内容,进而从浏览内容中确定第一主题对应的相关浏览内容。相关浏览内容可以为第二关键内容的一个例子。
在互联网时代,用户可以针对一个主题在设备上输入自身的言论。用户输入数据可以包括:一个或多个用户针对主题输入的上屏内容。本发明实施例可以从用户输入数据中提取与第一主题相关的第二关键内容,并依据第二关键内容得到第三搜索词。
综上,本发明实施例的搜索处理方法,一个主题可以反映一个维度的用户需求,本发明实施例按照第一主题对多个第一搜索结果进行聚合展示,可以明确第一主题所反映的用户需求,以使用户在大量的搜索结果项中快速定位到自身需求所对应的目标第一主题,并对目标第一主题对应的多个第一搜索结果进行集中浏览。由于本发明实施例可以节省逐个点击搜索结果项的操作成本,因此能够提高用户的信息获取效率。
并且,在用户需求不明确的情况下,本发明实施例可以帮助用户通过浏览不同的第一主题来明确用户需求,具体地,可以帮助用户在搜索结果页中找到与自身需求相应的第一主题并集中查看,而可以不修改搜索词并重新搜索。由于能够节省用户修改搜索词并重新搜索的操作,因此能够进一步提高用户的信息获取效率。
方法实施例二
参照图5,示出了本发明的一种搜索处理方法实施例二的步骤流程图,具体可以包括如下步骤:
步骤501、确定第一搜索词对应的多个第一搜索结果;
步骤502、基于主题对上述多个第一搜索结果进行聚类,以得到上述多个第一搜索结果分别对应的第一主题;
步骤503、若上述多个第一搜索结果对应的第一主题的数量不超过阈值,则依据上述第一搜索词对应的用户行为数据和/或站点数据和/或第一主题,确定第二搜索词;
步骤504、基于主题对上述第二搜索词对应的第二搜索结果进行聚类,以得到上述多个第二搜索结果分别对应的第二主题;
步骤505、在上述第一搜索词对应的搜索结果页中,依据上述第一主题、对上述多个第一搜索结果进行聚合展示,以及依据上述第二主题、对上述多个第二搜索结果进行聚合展示。
在实际应用中,可能存在第一主题的数量不超过阈值的情况下,此种情况下,可能会存在搜索结果对于用户需求的覆盖率较低的问题。上述阈值可由本领域技术人员根据实际应用需求确定,例如,阈值可以为1、2、3等自然数。
针对搜索结果对于用户需求的覆盖率较低的问题,本发明实施例依据上述第一搜索词对应的用户行为数据和/或站点数据和/或第一主题,确定第二搜索词,并基于主题对上述第二搜索词对应的第二搜索结果进行聚类,以得到第二主题。第二主题可以作为第一主题的扩充,以提高搜索结果对于用户需求的覆盖率。
用户行为数据可以反映用户在使用互联网过程中的用户需求。例如,用户在一个时间段内多次输入的多个搜索词,通常是为了满足一种用户需求。又如,用户在一个时间段内关注的内容通常与一个主题相关。或者,用户可以针对一个主题发表自身的言论等。因此本发明实施例可以对第一搜索词对应的用户行为数据进行挖掘,以得到表征用户需求的第二搜索词。
站点数据可以包括:微信、知乎等优质站点的数据,例如,知乎上包括针对人物或事件的优秀评论数据等。本发明实施例可以对优质站点上第一搜索词对应的站点数据进行挖掘,以得到表征用户需求的第二搜索词。
为了满足同一主题对应的用户需求,用户可能通过不同的搜索词进行搜索。因此,第一主题可以具有对应的搜索词。本发明实施例可以在第一主题对应的搜索词的基础上进行扩展,以得到表征用户需求的第二搜索词。
本发明实施例可以采用如下确定方式确定第二搜索词:
确定方式1、依据上述第一搜索词在用户搜索数据中对应的第一相关内容,确定第二搜索词;和/或
确定方式2、依据上述第一搜索词在用户点击数据中对应的第二相关内容,确定第二搜索词;和/或
确定方式3、依据上述第一搜索词在用户输入数据中对应的第三相关内容,确定第二搜索词;和/或
确定方式4、依据上述第一搜索词在站点数据中对应的第四相关内容,确定第二搜索词;和/或
确定方式5、依据上述第一主题对应的搜索词,确定第二搜索词。
对于确定方式1至确定方式4,本发明实施例可以从用户行为数据或站点数据中提取第一搜索内容对应的相关内容,并依据提取的相关内容确定第二搜索词。
例如,可以直接将相关内容作为第二搜索词。又如,可以对提取的多个相关内容进行组合,得到第二搜索词。再如,可以将提取的相关内容与第一搜索词进行组合,以得到第二搜索词等。
对于确定方式5,可以依据方法实施例一的内容,确定上述第一主题对应的搜索词,并依据第一主题对应的搜索词,确定第二搜索词。例如,可以直接将第一主题对应的搜索词作为第二搜索词。又如,可以对第一主题对应的搜索词于第一搜索词进行组合,以得到第二搜索词等。
对于基于主题对上述第二搜索词对应的第二搜索结果进行聚类的过程而言,由于其与基于主题对上述第一搜索词对应的第一搜索结果进行聚类的过程类似,故在此不作赘述,相互参照即可。
本发明实施例可以在第一搜索词对应的搜索结果页中,显示第一主题和第二主题分别对应的搜索结果。因此,搜索结果页对应的主题可以包括:第一主题和第二主题。
在本发明的一种可选实施例中,可以依据所述第一主题和第二主题对应的热度信息和/或时效信息,对第一主题和第二主题对应的搜索结果进行混合展示。例如,可以将热度更高的第二主题对应的搜索结果排在热度较低的第一主题对应的搜索结果的前面,等等。又如,可以将时效更高的第二主题对应的搜索结果排在时效较低的第一主题对应的搜索结果的前面等等。
可以理解,在提供目录区域的情况下,目录区域中展示的主题选项可以包括:第一主题对应的第一主题选项、以及第二主题对应的第二主题选项,这样,可以通过目录区域实现主题选项的快速索引。
综上,本发明实施例的搜索处理方法,依据上述第一搜索词对应的用户行为数据和/或站点数据和/或第一主题,确定第二搜索词,并基于主题对上述第二搜索词对应的第二搜索结果进行聚类,以得到第二主题。第二主题可以作为第一主题的扩充,以提高搜索结果对于用户需求的覆盖率。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
装置实施例
参照图6,示出了本发明的一种搜索处理装置实施例的结构框图,具体可以包括:搜索结果确定模块601、第一聚类模块602和第一聚合展示模块603。
其中,搜索结果确定模块601,用于确定第一搜索词对应的多个第一搜索结果;
第一聚类模块602,用于基于主题对所述多个第一搜索结果进行聚类,以得到所述多个第一搜索结果分别对应的第一主题;以及
第一聚合展示模块603,用于依据所述第一主题,对所述多个第一搜索结果进行聚合展示。
可选地,第一聚类模块602可以包括:
语义主题确定模块,用于依据上述多个第一搜索结果分别对应的内容特征,确定上述多个第一搜索结果分别对应的语义主题信息;
主题聚类模块,用于依据上述多个第一搜索结果分别对应的语义主题信息,对上述多个第一搜索结果进行聚类,以得到上述多个第一搜索结果分别对应的第一主题。
可选地,上述装置还可以包括:
第二搜索词确定模块,用于若上述多个第一搜索结果对应的第一主题的数量不超过阈值,则依据上述第一搜索词对应的用户行为数据和/或站点数据和/或第一主题,确定第二搜索词;
第二聚类模块,用于基于主题对上述第二搜索词对应的第二搜索结果进行聚类,以得到上述多个第二搜索结果分别对应的第二主题;
第二聚合展示模块,用于在上述第一搜索词对应的搜索结果页中,依据上述第一主题、对上述多个第一搜索结果进行聚合展示,以及依据上述第二主题、对上述多个第二搜索结果进行聚合展示。
可选地,上述第二搜索词确定模块可以包括:
第一确定模块,用于依据上述第一搜索词在用户搜索数据中对应的第一相关内容,确定第二搜索词;和/或
第二确定模块,用于依据上述第一搜索词在用户点击数据中对应的第二相关内容,确定第二搜索词;和/或
第三确定模块,用于依据上述第一搜索词在用户输入数据中对应的第三相关内容,确定第二搜索词;和/或
第四确定模块,用于依据上述第一搜索词在站点数据中对应的第四相关内容,确定第二搜索词;和/或
第五确定模块,用于依据上述第一主题对应的搜索词,确定第二搜索词。
可选地,第一聚合展示模块603可以包括:
排序展示模块,用于依据上述第一主题对应的热度信息和/或时效信息,对多个第一主题对应的第一搜索结果进行排序展示。
可选地,上述装置还可以包括:
热度搜索入口展示模块,用于展示上述第一主题对应的热度信息、和\或、搜索入口。
可选地,上述装置还可以包括:
第三搜索词确定模块,用于响应于针对上述搜索入口的触发操作,确定上述第一主题对应的第三搜索词;
第三搜索结果展示模块,用于展示上述第三搜索词对应的第三搜索结果。
可选地,上述装置还可以包括:
目录入口展示模块,用于在上述第一搜索词对应的搜索结果页中展示目录入口。
可选地,上述装置还可以包括:
主题选项确定模块,用于响应于针对上述目录入口的触发操作,展示上述搜索结果页对应的多个主题选项。
可选地,上述装置还可以包括:
主题定位模块,用于响应于针对目标主题选项的触发操作,在上述搜索结果页中定位到上述目标主题选项对应主题的位置。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本发明实施例提供了一种用于搜索处理的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:确定第一搜索词对应的多个第一搜索结果;基于主题对所述多个第一搜索结果进行聚类,以得到所述多个第一搜索结果分别对应的第一主题;依据所述第一主题,对所述多个第一搜索结果进行聚合展示。
图7是根据一示例性实施例示出的一种用于搜索处理的装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图4,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音搜索处理模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频搜索处理(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
图8是本发明的一些实施例中服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processingunits,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在服务器1900上执行存储介质1930中的一系列指令操作。
服务器1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(服务器或者终端)的处理器执行时,使得装置能够执行图2至图5中任一所示的搜索处理方法。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(服务器或者终端)的处理器执行时,使得装置能够执行一种搜索处理方法,所述方法包括:确定第一搜索词对应的多个第一搜索结果;基于主题对所述多个第一搜索结果进行聚类,以得到所述多个第一搜索结果分别对应的第一主题;依据所述第一主题,对所述多个第一搜索结果进行聚合展示。
本发明实施例公开了A1、一种搜索处理方法,所述方法包括:
确定第一搜索词对应的多个第一搜索结果;
基于主题对所述多个第一搜索结果进行聚类,以得到所述多个第一搜索结果分别对应的第一主题;
依据所述第一主题,对所述多个第一搜索结果进行聚合展示。
A2、根据A1所述的方法,其特征在于,所述基于主题对所述多个第一搜索结果进行聚类,包括:
依据所述多个第一搜索结果分别对应的内容特征,确定所述多个第一搜索结果分别对应的语义主题信息;
依据所述多个第一搜索结果分别对应的语义主题信息,对所述多个第一搜索结果进行聚类,以得到所述多个第一搜索结果分别对应的第一主题。
A3、根据A1所述的方法,其特征在于,所述方法还包括:
若所述多个第一搜索结果对应的第一主题的数量不超过阈值,则依据所述第一搜索词对应的用户行为数据和/或站点数据和/或第一主题,确定第二搜索词;
基于主题对所述第二搜索词对应的第二搜索结果进行聚类,以得到所述多个第二搜索结果分别对应的第二主题;
在所述第一搜索词对应的搜索结果页中,依据所述第一主题、对所述多个第一搜索结果进行聚合展示,以及依据所述第二主题、对所述多个第二搜索结果进行聚合展示。
A4、根据A3所述的方法,其特征在于,所述确定第二搜索词,包括:
依据所述第一搜索词在用户搜索数据中对应的第一相关内容,确定第二搜索词;和/或
依据所述第一搜索词在用户点击数据中对应的第二相关内容,确定第二搜索词;和/或
依据所述第一搜索词在用户输入数据中对应的第三相关内容,确定第二搜索词;和/或
依据所述第一搜索词在站点数据中对应的第四相关内容,确定第二搜索词;和/或
依据所述第一主题对应的搜索词,确定第二搜索词。
A5、根据A1所述的方法,其特征在于,所述对所述多个第一搜索结果进行聚合展示,包括:
依据所述第一主题对应的热度信息和/或时效信息,对多个第一主题对应的第一搜索结果进行排序展示。
A6、根据A1至A5中任一所述的方法,其特征在于,所述方法还包括:
展示所述第一主题对应的热度信息、和\或、搜索入口。
A7、根据A6所述的方法,其特征在于,所述方法还包括:
响应于针对所述搜索入口的触发操作,确定所述第一主题对应的第三搜索词;
展示所述第三搜索词对应的第三搜索结果。
A8、根据A1至A5中任一所述的方法,其特征在于,所述方法还包括:
在所述第一搜索词对应的搜索结果页中展示目录入口。
A9、根据A8所述的方法,其特征在于,所述方法还包括:
响应于针对所述目录入口的触发操作,展示所述搜索结果页对应的多个主题选项。
A10、根据A9所述的方法,其特征在于,所述方法还包括:
响应于针对目标主题选项的触发操作,在所述搜索结果页中定位到所述目标主题选项对应主题的位置。
本发明实施例公开了B11、一种搜索处理装置,其特征在于,包括:
搜索结果确定模块,用于确定第一搜索词对应的多个第一搜索结果;
第一聚类模块,用于基于主题对所述多个第一搜索结果进行聚类,以得到所述多个第一搜索结果分别对应的第一主题;以及
第一聚合展示模块,用于依据所述第一主题,对所述多个第一搜索结果进行聚合展示。
B12、根据B11所述的装置,其特征在于,所述第一聚类模块包括:
语义主题确定模块,用于依据所述多个第一搜索结果分别对应的内容特征,确定所述多个第一搜索结果分别对应的语义主题信息;
主题聚类模块,用于依据所述多个第一搜索结果分别对应的语义主题信息,对所述多个第一搜索结果进行聚类,以得到所述多个第一搜索结果分别对应的第一主题。
B13、根据B11所述的装置,其特征在于,所述装置还包括:
第二搜索词确定模块,用于若所述多个第一搜索结果对应的第一主题的数量不超过阈值,则依据所述第一搜索词对应的用户行为数据和/或站点数据和/或第一主题,确定第二搜索词;
第二聚类模块,用于基于主题对所述第二搜索词对应的第二搜索结果进行聚类,以得到所述多个第二搜索结果分别对应的第二主题;
第二聚合展示模块,用于在所述第一搜索词对应的搜索结果页中,依据所述第一主题、对所述多个第一搜索结果进行聚合展示,以及依据所述第二主题、对所述多个第二搜索结果进行聚合展示。
B14、根据B13所述的装置,其特征在于,所述第二搜索词确定模块包括:
第一确定模块,用于依据所述第一搜索词在用户搜索数据中对应的第一相关内容,确定第二搜索词;和/或
第二确定模块,用于依据所述第一搜索词在用户点击数据中对应的第二相关内容,确定第二搜索词;和/或
第三确定模块,用于依据所述第一搜索词在用户输入数据中对应的第三相关内容,确定第二搜索词;和/或
第四确定模块,用于依据所述第一搜索词在站点数据中对应的第四相关内容,确定第二搜索词;和/或
第五确定模块,用于依据所述第一主题对应的搜索词,确定第二搜索词。
B15、根据B11所述的装置,其特征在于,所述第一聚合展示模块包括:
排序展示模块,用于依据所述第一主题对应的热度信息和/或时效信息,对多个第一主题对应的第一搜索结果进行排序展示。
16、根据B11至B15中任一所述的装置,其特征在于,所述装置还包括:
热度搜索入口展示模块,用于展示所述第一主题对应的热度信息、和\或、搜索入口。
B17、根据B16所述的装置,其特征在于,所述装置还包括:
第三搜索词确定模块,用于响应于针对所述搜索入口的触发操作,确定所述第一主题对应的第三搜索词;
第三搜索结果展示模块,用于展示所述第三搜索词对应的第三搜索结果。
B18、根据B11至B15中任一所述的装置,其特征在于,所述装置还包括:
目录入口展示模块,用于在所述第一搜索词对应的搜索结果页中展示目录入口。
B19、根据B18所述的装置,其特征在于,所述装置还包括:
主题选项确定模块,用于响应于针对所述目录入口的触发操作,展示所述搜索结果页对应的多个主题选项。
B20、根据B19所述的装置,其特征在于,所述装置还包括:
主题定位模块,用于响应于针对目标主题选项的触发操作,在所述搜索结果页中定位到所述目标主题选项对应主题的位置。
本发明实施例公开了C21、一种用于搜索处理的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
确定第一搜索词对应的多个第一搜索结果;
基于主题对所述多个第一搜索结果进行聚类,以得到所述多个第一搜索结果分别对应的第一主题;
依据所述第一主题,对所述多个第一搜索结果进行聚合展示。
C22、根据C21所述的装置,其特征在于,所述基于主题对所述多个第一搜索结果进行聚类,包括:
依据所述多个第一搜索结果分别对应的内容特征,确定所述多个第一搜索结果分别对应的语义主题信息;
依据所述多个第一搜索结果分别对应的语义主题信息,对所述多个第一搜索结果进行聚类,以得到所述多个第一搜索结果分别对应的第一主题。
C23、根据C21所述的装置,其特征在于,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
若所述多个第一搜索结果对应的第一主题的数量不超过阈值,则依据所述第一搜索词对应的用户行为数据和/或站点数据和/或第一主题,确定第二搜索词;
基于主题对所述第二搜索词对应的第二搜索结果进行聚类,以得到所述多个第二搜索结果分别对应的第二主题;
在所述第一搜索词对应的搜索结果页中,依据所述第一主题、对所述多个第一搜索结果进行聚合展示,以及依据所述第二主题、对所述多个第二搜索结果进行聚合展示。
C24、根据C23所述的装置,其特征在于,所述确定第二搜索词,包括:
依据所述第一搜索词在用户搜索数据中对应的第一相关内容,确定第二搜索词;和/或
依据所述第一搜索词在用户点击数据中对应的第二相关内容,确定第二搜索词;和/或
依据所述第一搜索词在用户输入数据中对应的第三相关内容,确定第二搜索词;和/或
依据所述第一搜索词在站点数据中对应的第四相关内容,确定第二搜索词;和/或
依据所述第一主题对应的搜索词,确定第二搜索词。
C25、根据C21所述的装置,其特征在于,所述对所述多个第一搜索结果进行聚合展示,包括:
依据所述第一主题对应的热度信息和/或时效信息,对多个第一主题对应的第一搜索结果进行排序展示。
C26、根据C21至C25中任一所述的装置,其特征在于,所述装置还包括:
展示所述第一主题对应的热度信息、和\或、搜索入口。
C27、根据C26所述的装置,其特征在于,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
响应于针对所述搜索入口的触发操作,确定所述第一主题对应的第三搜索词;
展示所述第三搜索词对应的第三搜索结果。
C28、根据C21至C25中任一所述的装置,其特征在于,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
在所述第一搜索词对应的搜索结果页中展示目录入口。
C29、根据C28所述的装置,其特征在于,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
响应于针对所述目录入口的触发操作,展示所述搜索结果页对应的多个主题选项。
C30、根据C29所述的装置,其特征在于,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
响应于针对目标主题选项的触发操作,在所述搜索结果页中定位到所述目标主题选项对应主题的位置。
D31、一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如A1至A10中一个或多个所述的搜索处理方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上对本发明所提供的一种搜索处理方法、一种搜索处理装置和一种用于搜索处理的装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (22)

1.一种搜索处理方法,其特征在于,所述方法包括:
确定第一搜索词对应的多个第一搜索结果;
基于主题对所述多个第一搜索结果进行聚类,以得到所述多个第一搜索结果分别对应的第一主题;
依据所述第一主题,对所述多个第一搜索结果进行聚合展示;
所述方法还包括:若所述多个第一搜索结果对应的第一主题的数量不超过阈值,则依据所述第一搜索词对应的用户行为数据和/或站点数据和/或第一主题,确定第二搜索词;
基于主题对所述第二搜索词对应的第二搜索结果进行聚类,以得到所述多个第二搜索结果分别对应的第二主题;
在所述第一搜索词对应的搜索结果页中,依据所述第一主题、对所述多个第一搜索结果进行聚合展示,以及依据所述第二主题、对所述多个第二搜索结果进行聚合展示;
在所述第一搜索词对应的搜索结果页中展示目录入口,所述目录入口是目录控件,所述目录控件对应的图标是对象的图标;
响应于针对所述目录入口的触发操作,展示所述搜索结果页对应的多个主题选项,通过位于所述搜索结果页之上的蒙层展示目录区域,并在所述目录区域中展示所述搜索结果页对应的多个主题选项。
2.根据权利要求1所述的方法,其特征在于,所述基于主题对所述多个第一搜索结果进行聚类,包括:
依据所述多个第一搜索结果分别对应的内容特征,确定所述多个第一搜索结果分别对应的语义主题信息;
依据所述多个第一搜索结果分别对应的语义主题信息,对所述多个第一搜索结果进行聚类,以得到所述多个第一搜索结果分别对应的第一主题。
3.根据权利要求1所述的方法,其特征在于,所述确定第二搜索词,包括:
依据所述第一搜索词在用户搜索数据中对应的第一相关内容,确定第二搜索词;和/或
依据所述第一搜索词在用户点击数据中对应的第二相关内容,确定第二搜索词;和/或
依据所述第一搜索词在用户输入数据中对应的第三相关内容,确定第二搜索词;和/或
依据所述第一搜索词在站点数据中对应的第四相关内容,确定第二搜索词;和/或
依据所述第一主题对应的搜索词,确定第二搜索词。
4.根据权利要求1所述的方法,其特征在于,所述对所述多个第一搜索结果进行聚合展示,包括:
依据所述第一主题对应的热度信息和/或时效信息,对多个第一主题对应的第一搜索结果进行排序展示。
5.根据权利要求1至4中任一所述的方法,其特征在于,所述方法还包括:
展示所述第一主题对应的热度信息、和\或、搜索入口。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
响应于针对所述搜索入口的触发操作,确定所述第一主题对应的第三搜索词;
展示所述第三搜索词对应的第三搜索结果。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于针对目标主题选项的触发操作,在所述搜索结果页中定位到所述目标主题选项对应主题的位置。
8.一种搜索处理装置,其特征在于,包括:
搜索结果确定模块,用于确定第一搜索词对应的多个第一搜索结果;
第一聚类模块,用于基于主题对所述多个第一搜索结果进行聚类,以得到所述多个第一搜索结果分别对应的第一主题;以及
第一聚合展示模块,用于依据所述第一主题,对所述多个第一搜索结果进行聚合展示;
所述装置还包括:第二搜索词确定模块,用于若所述多个第一搜索结果对应的第一主题的数量不超过阈值,则依据所述第一搜索词对应的用户行为数据和/或站点数据和/或第一主题,确定第二搜索词;
第二聚类模块,用于基于主题对所述第二搜索词对应的第二搜索结果进行聚类,以得到所述多个第二搜索结果分别对应的第二主题;
第二聚合展示模块,用于在所述第一搜索词对应的搜索结果页中,依据所述第一主题、对所述多个第一搜索结果进行聚合展示,以及依据所述第二主题、对所述多个第二搜索结果进行聚合展示;
目录入口展示模块,用于在所述第一搜索词对应的搜索结果页中展示目录入口,所述目录入口是目录控件,所述目录控件对应的图标是对象的图标;
主题选项确定模块,用于响应于针对所述目录入口的触发操作,展示所述搜索结果页对应的多个主题选项,通过位于所述搜索结果页之上的蒙层展示目录区域,并在所述目录区域中展示所述搜索结果页对应的多个主题选项。
9.根据权利要求8所述的装置,其特征在于,所述第一聚类模块包括:
语义主题确定模块,用于依据所述多个第一搜索结果分别对应的内容特征,确定所述多个第一搜索结果分别对应的语义主题信息;
主题聚类模块,用于依据所述多个第一搜索结果分别对应的语义主题信息,对所述多个第一搜索结果进行聚类,以得到所述多个第一搜索结果分别对应的第一主题。
10.根据权利要求8所述的装置,其特征在于,所述第二搜索词确定模块包括:
第一确定模块,用于依据所述第一搜索词在用户搜索数据中对应的第一相关内容,确定第二搜索词;和/或
第二确定模块,用于依据所述第一搜索词在用户点击数据中对应的第二相关内容,确定第二搜索词;和/或
第三确定模块,用于依据所述第一搜索词在用户输入数据中对应的第三相关内容,确定第二搜索词;和/或
第四确定模块,用于依据所述第一搜索词在站点数据中对应的第四相关内容,确定第二搜索词;和/或
第五确定模块,用于依据所述第一主题对应的搜索词,确定第二搜索词。
11.根据权利要求8所述的装置,其特征在于,所述第一聚合展示模块包括:
排序展示模块,用于依据所述第一主题对应的热度信息和/或时效信息,对多个第一主题对应的第一搜索结果进行排序展示。
12.根据权利要求8至11中任一所述的装置,其特征在于,所述装置还包括:
热度搜索入口展示模块,用于展示所述第一主题对应的热度信息、和\或、搜索入口。
13.根据权利要求12所述的装置,其特征在于,所述装置还包括:
第三搜索词确定模块,用于响应于针对所述搜索入口的触发操作,确定所述第一主题对应的第三搜索词;
第三搜索结果展示模块,用于展示所述第三搜索词对应的第三搜索结果。
14.根据权利要求8所述的装置,其特征在于,所述装置还包括:
主题定位模块,用于响应于针对目标主题选项的触发操作,在所述搜索结果页中定位到所述目标主题选项对应主题的位置。
15.一种用于搜索处理的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
确定第一搜索词对应的多个第一搜索结果;
基于主题对所述多个第一搜索结果进行聚类,以得到所述多个第一搜索结果分别对应的第一主题;
依据所述第一主题,对所述多个第一搜索结果进行聚合展示;
若所述多个第一搜索结果对应的第一主题的数量不超过阈值,则依据所述第一搜索词对应的用户行为数据和/或站点数据和/或第一主题,确定第二搜索词;
基于主题对所述第二搜索词对应的第二搜索结果进行聚类,以得到所述多个第二搜索结果分别对应的第二主题;
在所述第一搜索词对应的搜索结果页中,依据所述第一主题、对所述多个第一搜索结果进行聚合展示,以及依据所述第二主题、对所述多个第二搜索结果进行聚合展示;
在所述第一搜索词对应的搜索结果页中展示目录入口,所述目录入口是目录控件,所述目录控件对应的图标是对象的图标;
响应于针对所述目录入口的触发操作,展示所述搜索结果页对应的多个主题选项,通过位于所述搜索结果页之上的蒙层展示目录区域,并在所述目录区域中展示所述搜索结果页对应的多个主题选项。
16.根据权利要求15所述的装置,其特征在于,所述基于主题对所述多个第一搜索结果进行聚类,包括:
依据所述多个第一搜索结果分别对应的内容特征,确定所述多个第一搜索结果分别对应的语义主题信息;
依据所述多个第一搜索结果分别对应的语义主题信息,对所述多个第一搜索结果进行聚类,以得到所述多个第一搜索结果分别对应的第一主题。
17.根据权利要求15所述的装置,其特征在于,所述确定第二搜索词,包括:
依据所述第一搜索词在用户搜索数据中对应的第一相关内容,确定第二搜索词;和/或
依据所述第一搜索词在用户点击数据中对应的第二相关内容,确定第二搜索词;和/或
依据所述第一搜索词在用户输入数据中对应的第三相关内容,确定第二搜索词;和/或
依据所述第一搜索词在站点数据中对应的第四相关内容,确定第二搜索词;和/或
依据所述第一主题对应的搜索词,确定第二搜索词。
18.根据权利要求15所述的装置,其特征在于,所述对所述多个第一搜索结果进行聚合展示,包括:
依据所述第一主题对应的热度信息和/或时效信息,对多个第一主题对应的第一搜索结果进行排序展示。
19.根据权利要求15至18中任一所述的装置,其特征在于,所述装置还包括:
展示所述第一主题对应的热度信息、和\或、搜索入口。
20.根据权利要求19所述的装置,其特征在于,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
响应于针对所述搜索入口的触发操作,确定所述第一主题对应的第三搜索词;
展示所述第三搜索词对应的第三搜索结果。
21.根据权利要求15所述的装置,其特征在于,所述装置还经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
响应于针对目标主题选项的触发操作,在所述搜索结果页中定位到所述目标主题选项对应主题的位置。
22.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至7中一个或多个所述的搜索处理方法。
CN202010163233.9A 2020-03-10 2020-03-10 一种搜索处理方法、装置和用于搜索处理的装置 Active CN111382339B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010163233.9A CN111382339B (zh) 2020-03-10 2020-03-10 一种搜索处理方法、装置和用于搜索处理的装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010163233.9A CN111382339B (zh) 2020-03-10 2020-03-10 一种搜索处理方法、装置和用于搜索处理的装置

Publications (2)

Publication Number Publication Date
CN111382339A CN111382339A (zh) 2020-07-07
CN111382339B true CN111382339B (zh) 2024-04-02

Family

ID=71217244

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010163233.9A Active CN111382339B (zh) 2020-03-10 2020-03-10 一种搜索处理方法、装置和用于搜索处理的装置

Country Status (1)

Country Link
CN (1) CN111382339B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111930949B (zh) * 2020-09-11 2021-01-15 腾讯科技(深圳)有限公司 搜索串处理方法、装置、计算机可读介质及电子设备
CN113094522A (zh) * 2021-06-09 2021-07-09 北京达佳互联信息技术有限公司 多媒体资源处理方法、装置、电子设备及存储介质
CN116415081A (zh) * 2021-12-30 2023-07-11 华为技术有限公司 搜索方法及电子设备
CN117573704B (zh) * 2024-01-17 2024-04-12 上海合见工业软件集团有限公司 Eda软件的复合文档索引方法、装置、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914543A (zh) * 2014-04-03 2014-07-09 北京百度网讯科技有限公司 搜索结果的展现方法和装置
CN104462471A (zh) * 2014-12-17 2015-03-25 北京奇虎科技有限公司 提供细分搜索结果的方法和装置
CN106096037A (zh) * 2016-06-27 2016-11-09 北京百度网讯科技有限公司 基于人工智能的搜索结果聚合方法、装置以及搜索引擎
CN106919572A (zh) * 2015-12-24 2017-07-04 北京奇虎科技有限公司 网页搜索方法及浏览器
CN109597929A (zh) * 2018-09-21 2019-04-09 北京字节跳动网络技术有限公司 搜索结果的展示方法、装置、终端及可读介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8214360B2 (en) * 2006-04-06 2012-07-03 International Business Machines Corporation Browser context based search disambiguation using existing category taxonomy

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914543A (zh) * 2014-04-03 2014-07-09 北京百度网讯科技有限公司 搜索结果的展现方法和装置
CN104462471A (zh) * 2014-12-17 2015-03-25 北京奇虎科技有限公司 提供细分搜索结果的方法和装置
CN106919572A (zh) * 2015-12-24 2017-07-04 北京奇虎科技有限公司 网页搜索方法及浏览器
CN106096037A (zh) * 2016-06-27 2016-11-09 北京百度网讯科技有限公司 基于人工智能的搜索结果聚合方法、装置以及搜索引擎
CN109597929A (zh) * 2018-09-21 2019-04-09 北京字节跳动网络技术有限公司 搜索结果的展示方法、装置、终端及可读介质

Also Published As

Publication number Publication date
CN111382339A (zh) 2020-07-07

Similar Documents

Publication Publication Date Title
CN111382339B (zh) 一种搜索处理方法、装置和用于搜索处理的装置
CN105760508A (zh) 一种信息推送方法、装置及电子设备
CN107423296B (zh) 搜索方法、装置以及用于搜索的装置
CN107315487B (zh) 一种输入处理方法、装置及电子设备
CN110222256B (zh) 一种信息推荐方法、装置和用于信息推荐的装置
KR101626874B1 (ko) 이동 단말기 및 이동 단말기에서의 컨텐츠 전송 방법
CN111708943B (zh) 一种搜索结果展示方法、装置和用于搜索结果展示的装置
CN110391966B (zh) 一种消息处理方法、装置和用于消息处理的装置
CN106815291B (zh) 搜索结果项展现方法、装置和用于搜索结果项展现的装置
CN108874827B (zh) 一种搜索方法及相关装置
CN110110207B (zh) 一种信息推荐方法、装置及电子设备
CN107515869B (zh) 一种搜索方法和装置、一种用于搜索的装置
CN107515870B (zh) 一种搜索方法和装置、一种用于搜索的装置
CN112784142A (zh) 一种信息推荐方法及装置
CN110633391B (zh) 一种信息搜索方法及装置
CN108717403B (zh) 一种处理方法、装置和用于处理的装置
WO2021190292A1 (zh) 详情页的处理方法, 装置, 系统, 电子设备和存储介质
CN107784037B (zh) 信息处理方法和装置、用于信息处理的装置
CN111752436A (zh) 一种推荐方法、装置和用于推荐的装置
CN112115341A (zh) 内容展示方法、装置、终端、服务器、系统及存储介质
CN110020106B (zh) 一种推荐方法、推荐装置和用于推荐的装置
CN110020335B (zh) 收藏夹的处理方法和装置
CN108205534B (zh) 一种皮肤资源展示方法、装置及电子设备
CN108073664B (zh) 一种信息处理方法、装置、设备及客户端设备
CN112052395B (zh) 一种数据处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant