CN114020864A - 搜索结果的展示方法、装置及设备 - Google Patents

搜索结果的展示方法、装置及设备 Download PDF

Info

Publication number
CN114020864A
CN114020864A CN202111288875.2A CN202111288875A CN114020864A CN 114020864 A CN114020864 A CN 114020864A CN 202111288875 A CN202111288875 A CN 202111288875A CN 114020864 A CN114020864 A CN 114020864A
Authority
CN
China
Prior art keywords
category
search results
vectors
vector
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111288875.2A
Other languages
English (en)
Inventor
秦海龙
郑伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qury Technology Co ltd
Shandong Kurui Technology Co ltd
Original Assignee
Beijing Qury Technology Co ltd
Shandong Kurui Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qury Technology Co ltd, Shandong Kurui Technology Co ltd filed Critical Beijing Qury Technology Co ltd
Priority to CN202111288875.2A priority Critical patent/CN114020864A/zh
Publication of CN114020864A publication Critical patent/CN114020864A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开涉及一种搜索结果的展示方法、装置及设备,其中,方法包括:响应于搜索请求,获取多个搜索结果;对多个搜索结果中的目标内容进行向量化,生成多个向量;根据多个向量之间的相似度对多个搜索结果进行聚类,生成多个类别;根据每个类别对应的搜索结果进行关键词提取,生成每个类别对应的类别关键词,以根据类别关键词对各类别对应的搜索结果进行分组展示。根据本公开的技术方案能够提高搜索结果准确度,使用户可以快速定位到需要的内容。

Description

搜索结果的展示方法、装置及设备
技术领域
本公开涉及互联网技术领域,尤其涉及一种搜索结果的展示方法、装置及设备。
背景技术
随着人们信息获取需求的增长,各类搜索引擎被广泛使用。搜索引擎基于用户输入的搜索式进行内容库召回,并对召回结果进行排序和展示。
相关技术中,采用排序规则或算法对召回内容进行排序,然而,内容库中存在大量的相似内容,相似内容在在算法中的得分和排名接近,导致连续若干内容都相同或相近,同一页面的内容几乎一致,增加了用户的搜索成本,搜索结果准确度有待提高。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种搜索结果的展示方法、装置及设备。
第一方面,本公开实施例提供了一种搜索结果的展示方法,包括:
响应于搜索请求,获取多个搜索结果;
对所述多个搜索结果中的目标内容进行向量化,生成多个向量;
根据所述多个向量之间的相似度对所述多个搜索结果进行聚类,生成多个类别;
根据每个类别对应的搜索结果进行关键词提取,生成每个类别对应的类别关键词,以根据所述类别关键词对各类别对应的搜索结果进行分组展示。
可选地,所述搜索结果包括标题和正文,所述对所述多个搜索结果中的目标内容进行向量化,生成多个向量包括:对每个标题进行分词,生成每个标题的分词结果;对于每个标题,根据所有标题的分词结果确定所述向量的维度,以及根据各分词结果在该标题中的出现频次确定各维度的向量值。
可选地,所述搜索结果包括摘要和正文,所述对所述多个搜索结果中的目标内容进行向量化,生成多个向量包括:对每个摘要进行关键词提取,生成每个摘要的摘要关键词;对于每个摘要,根据所有摘要的摘要关键词确定所述向量的维度,以及根据各摘要关键词在该摘要中的出现频次确定各维度的向量值。
可选地,所述根据所述多个向量之间的相似度对所述多个搜索结果进行聚类,生成多个类别包括:根据所述多个向量中的任一向量建立一个类别;对于多个向量中的待分类向量,确定所述待分类向量与已有类别中各向量之间的相似度;若所述待分类向量与任一已有类别中所有向量之间的相似度均大于阈值,则将所述待分类向量添加至该已有类别;否则,根据所述待分类向量新建一个类别。
可选地,所述根据每个类别对应的搜索结果进行关键词提取,生成每个类别对应的类别关键词包括:对所述每个类别对应的搜索结果进行分词,生成每个类别的分词结果;基于textrank算法或者词频逆文本频率指数值从所述每个类别的分词结果中确定所述每个类别的类别关键词。
可选地,所述根据所述类别关键词对各类别对应的搜索结果进行分组展示,包括:根据搜索多个类别的类别关键词生成多个选项;响应于用户对所有选项中目标选项的触发操作,对所述目标选项对应类别的搜索结果进行展示。
第二方面,本公开实施例提供了一种搜索结果的展示装置,包括:
获取模块,用于响应于搜索请求,获取多个搜索结果;
生成模块,用于对所述多个搜索结果中的目标内容进行向量化,生成多个向量;
聚类模块,用于根据所述多个向量之间的相似度对所述多个搜索结果进行聚类,生成多个类别;
展示模块,用于根据每个类别对应的搜索结果进行关键词提取,生成每个类别对应的类别关键词,以根据所述类别关键词对各类别对应的搜索结果进行分组展示。
第三方面,本公开实施例提供了一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述第一方面所述的搜索结果的展示方法。
第四方面,本公开实施例提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的搜索结果的展示方法。
本公开实施例提供的技术方案与现有技术相比具有如下优点:通过在获取多个搜索结果之后,对多个搜索结果中的目标内容进行向量化,生成多个向量,根据多个向量之间的相似度对多个搜索结果进行聚类,生成多个类别,进而,根据每个类别对应的搜索结果进行关键词提取,生成每个类别对应的类别关键词,以根据类别关键词对各类别对应的搜索结果进行分组展示,解决了相关技术中在搜索结果展示时连续若干内容都相同或相近,导致用户查询需要的内容时操作不便的问题,提高搜索结果准确度和用户搜索体验。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例所提供的一种搜索结果的展示方法的流程示意图;
图2为本公开实施例所提供的一种搜索结果的展示装置的结构示意图;
图3为本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
图1为本公开实施例所提供的一种搜索结果的展示方法的流程示意图,如图1所示,本公开实施例提供的搜索结果的展示方法可包括:
步骤101,响应于搜索请求,获取多个搜索结果。
本公开实施例的方法,可以应用于搜索引擎。
本公开实施例中,响应于搜索请求,利用搜索词进行内容库召回,生成多个搜索结果。例如,利用预设的排序规则或排序算法对召回内容排序,通过抽取每条召回内容的特征,并计算得出每个召回内容的分数,根据分数由大到小的顺序对召回内容进行排序。
步骤102,对多个搜索结果中的目标内容进行向量化,生成多个向量。
本公开实施例中,对于多个搜索结果中的每个搜索结果,根据该搜索结果中的目标内容进行向量化处理,生成与该搜索结果对应的向量。其中,搜索结果与向量一一对应,目标内容例如包括标题、标签、摘要。
在本公开的一个实施例中,搜索结果包括标题和正文,则对多个搜索结果中的目标内容进行向量化,生成多个向量包括:对每个标题进行分词,生成每个标题的分词结果,进而,对于每个标题,根据所有标题的分词结果确定向量的维度,以及根据各分词结果在该标题中的出现频次确定各维度的向量值。
本实施例中,每个标题对应生成一个向量,对所有标题进行分词处理后,将所有标题的分词结果进行去重处理,根据去重后的分词结果确定向量的维度,其中,对于每个标题,向量中的每一维度表示一个词,向量值为该词在该标题中出现频次。作为一种示例,对于标题AABB和标题BBCC,分别生成向量[2,2,0]和[0,2,2]。
在本公开的一个实施例中,搜索结果包括摘要和正文,则对多个搜索结果中的目标内容进行向量化,生成多个向量包括:对每个摘要进行关键词提取,生成每个摘要的摘要关键词,进而,对于每个摘要,根据摘要的摘要关键词确定向量的维度,以及根据各摘要关键词在该摘要中的出现频次确定各维度的向量值。
本实施例中,每个摘要对应生成一个向量,对各摘要分别进行关键词提取,关键词提取的方式包括但不限于textrank算法等。根据所有摘要关键词进行去重处理,根据去重后的摘要关键词确定向量的维度,其中,对于每个摘要,向量中的每一维度表示一个词,向量值为该词在该摘要中出现频次。
在本公开的一个实施例中,搜索结果包括标签和正文,则对多个搜索结果中的目标内容进行向量化,生成多个向量包括:对于每个搜索结果,根据所有搜索结果的所有标签中的词汇确定向量的维度,以及根据各词汇在在该搜索结果的标签中的出现频次确定各维度的向量值。
本实施例中,每个搜索结果对应生成一个向量,对所有搜索结果的所有标签中的词汇进行去重处理,根据去重后的词汇确定向量的维度,其中,对于每个搜索结果,向量中的每一维度表示一个词,向量值为该词在该搜索结果的标签中出现频次。
需要说明的是,上述出现频次可以是词频,也可以根据实际采用需要采用TFIDF(term frequency–inverse document frequency,词频-逆文本频率指数),此处不作限制。
步骤103,根据多个向量之间的相似度对多个搜索结果进行聚类,生成多个类别。
本实施例中,对于M个搜索结果的M个向量,根据向量之间的相似度,可以将M个搜索结果进行聚类,生成N个类别,每个类别包括至少一个搜索结果。其中,向量之间的相似度包括但不限于余弦相似度等方式。
作为一种示例,首先,根据多个向量中的任一向量建立一个类别,进而,对于多个向量中的待分类向量,确定待分类向量与已有类别中各向量之间的相似度。若待分类向量与任一已有类别中所有向量之间的相似度均大于阈值,则将待分类向量添加至该已有类别;否则,若该待分类向量与所有已有类别均不满足上述条件,则根据待分类向量新建一个类别。重复上述步骤,直至所有向量均分类完毕。
步骤104,根据每个类别对应的搜索结果进行关键词提取,生成每个类别对应的类别关键词,以根据类别关键词对各类别对应的搜索结果进行分组展示。
本实施例中,对于每个类别,对该类别对应的搜索结果的文档进行分词,生成该类别的分词结果,通过相关关键词提取方法从该类别的分词结果中确定关键词,作为该类别的类别关键词。
作为一种示例,基于textrank算法从每个类别的分词结果中确定每个类别的类别关键词。
作为另一种示例,通过计算分词后各词的TFIDF值,根据各词的TFIDF值从所有词中确定关键词,作为该类别的类别关键词,例如,将TFIDF值最大的词作为类别关键词,再例如,将TFIDF值大于阈值的词作为类别关键词。
本实施例中,根据类别关键词对各类别对应的搜索结果进行分组展示,例如对于N个类别的搜索结果,对应分为N组展示。
作为一种示例,根据类别关键词对各类别对应的搜索结果进行分组展示,包括:根据搜索多个类别的类别关键词生成多个选项,响应于用户对所有选项中目标选项的触发操作,对目标选项对应类别的搜索结果进行展示。例如,对于每个类别,根据该类别的类别关键词生成一个选项,通过获取用户对选项的选择操作,在用户选择后,优先展示用户选择的分组。本示例中,通过对每组聚类结果提取语义关键词并提供可勾选选项,使用户可以快速定位到需要的内容,降低页面内容重复度。
作为另一种示例,根据类别关键词对各类别对应的搜索结果进行分组展示,包括:根据多个搜索结果的排序确定各分组的展示顺序,例如,利用预设的排序规则或排序算法获取每个搜索结果的分数,将每个分组所对应的搜索结果的分数求平均值,作为该分组的分数,按照分组分数由高到低的顺序进行展示。
相关技术中,采用同一的排序规则或算法对召回内容进行排序,由于算法对每条内容抽取的特征是相同的,抽取后模型的计算逻辑也相同,导致特征相似的内容在算法中的得分和排名非常相近,例如不同新闻网站报道的同一事件。该情况下内容的排序分布经常呈现出连续若干内容都相同或相近,相同页面的内容几乎都一致的效果,增加了用户搜索成本。
根据本公开实施例的技术方案,通过在获取多个搜索结果之后,对多个搜索结果中的目标内容进行向量化,生成多个向量,根据多个向量之间的相似度对多个搜索结果进行聚类,生成多个类别,进而,根据每个类别对应的搜索结果进行关键词提取,生成每个类别对应的类别关键词,以根据类别关键词对各类别对应的搜索结果进行分组展示,由此,对搜索结果进行语义层面的聚合,将相似的文本依照主题进行聚类,解决了相关技术中在搜索结果展示时连续若干内容都相同或相近,导致用户查询需要的内容时操作不便的问题,提高搜索结果准确度和用户搜索体验,此外,通过提供可勾选选项的问答方式,使用户能够快速定位到需要的内容。
基于上述实施例,本公开还提出一种搜索结果的展示装置。
图2为本公开实施例所提供的一种搜索结果的展示装置的结构示意图,如图2所示,该搜索结果的展示装置包括:获取模块21,生成模块22,聚类模块23,展示模块24。
其中,获取模块21,用于响应于搜索请求,获取多个搜索结果。
生成模块22,用于对所述多个搜索结果中的目标内容进行向量化,生成多个向量。
聚类模块23,用于根据所述多个向量之间的相似度对所述多个搜索结果进行聚类,生成多个类别。
展示模块24,用于根据每个类别对应的搜索结果进行关键词提取,生成每个类别对应的类别关键词,以根据所述类别关键词对各类别对应的搜索结果进行分组展示。
在本公开的一个实施例中,所述搜索结果包括标题和正文,生成模块22具体用于:对每个标题进行分词,生成每个标题的分词结果;对于每个标题,根据所有标题的分词结果确定所述向量的维度,以及根据各分词结果在该标题中的出现频次确定各维度的向量值。
在本公开的一个实施例中,所述搜索结果包括摘要和正文,生成模块22具体用于:对每个摘要进行关键词提取,生成每个摘要的摘要关键词;对于每个摘要,根据所有摘要的摘要关键词确定所述向量的维度,以及根据各摘要关键词在该摘要中的出现频次确定各维度的向量值。
在本公开的一个实施例中,聚类模块23具体用于:根据所述多个向量中的任一向量建立一个类别;对于多个向量中的待分类向量,确定所述待分类向量与已有类别中各向量之间的相似度;若所述待分类向量与任一已有类别中所有向量之间的相似度均大于阈值,则将所述待分类向量添加至该已有类别;否则,根据所述待分类向量新建一个类别。
在本公开的一个实施例中,展示模块24具体用于:对所述每个类别对应的搜索结果进行分词,生成每个类别的分词结果;基于textrank算法或者词频逆文本频率指数值从所述每个类别的分词结果中确定所述每个类别的类别关键词。
在本公开的一个实施例中,展示模块24具体用于:根据搜索多个类别的类别关键词生成多个选项;响应于用户对所有选项中目标选项的触发操作,对所述目标选项对应类别的搜索结果进行展示。
本公开实施例所提供的搜索结果的展示装置可执行本公开实施例所提供的任意搜索结果的展示方法,具备执行方法相应的功能模块和有益效果。本公开装置实施例中未详尽描述的内容可以参考本公开任意方法实施例中的描述。
图3为本公开实施例提供的一种电子设备的结构示意图。如图3所示,电子设备600包括一个或多个处理器601和存储器602。
处理器601可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备600中的其他组件以执行期望的功能。
存储器602可以包括一个或多个计算机程序产品,计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器601可以运行程序指令,以实现上文的本公开的实施例的方法以及/或者其他期望的功能。在计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。
在一个示例中,电子设备600还可以包括:输入装置603和输出装置604,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。此外,该输入装置603还可以包括例如键盘、鼠标等等。该输出装置604可以向外部输出各种信息,包括确定出的距离信息、方向信息等。该输出装置604可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图3中仅示出了该电子设备600中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备600还可以包括任何其他适当的组件。
除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,计算机程序指令在被处理器运行时使得处理器执行本公开实施例所提供的任意方法。
计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,计算机程序指令在被处理器运行时使得处理器执行本公开实施例所提供的任意方法。
计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (9)

1.一种搜索结果的展示方法,其特征在于,包括:
响应于搜索请求,获取多个搜索结果;
对所述多个搜索结果中的目标内容进行向量化,生成多个向量;
根据所述多个向量之间的相似度对所述多个搜索结果进行聚类,生成多个类别;
根据每个类别对应的搜索结果进行关键词提取,生成每个类别对应的类别关键词,以根据所述类别关键词对各类别对应的搜索结果进行分组展示。
2.如权利要求1所述的方法,其特征在于,所述搜索结果包括标题和正文,所述对所述多个搜索结果中的目标内容进行向量化,生成多个向量包括:
对每个标题进行分词,生成每个标题的分词结果;
对于每个标题,根据所有标题的分词结果确定所述向量的维度,以及根据各分词结果在该标题中的出现频次确定各维度的向量值。
3.如权利要求1所述的方法,其特征在于,所述搜索结果包括摘要和正文,所述对所述多个搜索结果中的目标内容进行向量化,生成多个向量包括:
对每个摘要进行关键词提取,生成每个摘要的摘要关键词;
对于每个摘要,根据所有摘要的摘要关键词确定所述向量的维度,以及根据各摘要关键词在该摘要中的出现频次确定各维度的向量值。
4.如权利要求1所述的方法,其特征在于,所述根据所述多个向量之间的相似度对所述多个搜索结果进行聚类,生成多个类别包括:
根据所述多个向量中的任一向量建立一个类别;
对于多个向量中的待分类向量,确定所述待分类向量与已有类别中各向量之间的相似度;
若所述待分类向量与任一已有类别中所有向量之间的相似度均大于阈值,则将所述待分类向量添加至该已有类别;
否则,根据所述待分类向量新建一个类别。
5.如权利要求1所述的方法,其特征在于,所述根据每个类别对应的搜索结果进行关键词提取,生成每个类别对应的类别关键词包括:
对所述每个类别对应的搜索结果进行分词,生成每个类别的分词结果;
基于textrank算法或者词频逆文本频率指数值从所述每个类别的分词结果中确定所述每个类别的类别关键词。
6.如权利要求1所述的方法,其特征在于,所述根据所述类别关键词对各类别对应的搜索结果进行分组展示,包括:
根据搜索多个类别的类别关键词生成多个选项;
响应于用户对所有选项中目标选项的触发操作,对所述目标选项对应类别的搜索结果进行展示。
7.一种搜索结果的展示装置,其特征在于,包括:
获取模块,用于响应于搜索请求,获取多个搜索结果;
生成模块,用于对所述多个搜索结果中的目标内容进行向量化,生成多个向量;
聚类模块,用于根据所述多个向量之间的相似度对所述多个搜索结果进行聚类,生成多个类别;
展示模块,用于根据每个类别对应的搜索结果进行关键词提取,生成每个类别对应的类别关键词,以根据所述类别关键词对各类别对应的搜索结果进行分组展示。
8.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-6中任一所述的搜索结果的展示方法。
9.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1-6中任一所述的搜索结果的展示方法。
CN202111288875.2A 2021-11-02 2021-11-02 搜索结果的展示方法、装置及设备 Pending CN114020864A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111288875.2A CN114020864A (zh) 2021-11-02 2021-11-02 搜索结果的展示方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111288875.2A CN114020864A (zh) 2021-11-02 2021-11-02 搜索结果的展示方法、装置及设备

Publications (1)

Publication Number Publication Date
CN114020864A true CN114020864A (zh) 2022-02-08

Family

ID=80060339

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111288875.2A Pending CN114020864A (zh) 2021-11-02 2021-11-02 搜索结果的展示方法、装置及设备

Country Status (1)

Country Link
CN (1) CN114020864A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116910260A (zh) * 2023-09-13 2023-10-20 中国标准化研究院 一种基于大数据的数字资产搜索方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116910260A (zh) * 2023-09-13 2023-10-20 中国标准化研究院 一种基于大数据的数字资产搜索方法
CN116910260B (zh) * 2023-09-13 2023-11-17 中国标准化研究院 一种基于大数据的数字资产搜索方法

Similar Documents

Publication Publication Date Title
US9342583B2 (en) Book content item search
CN111046221B (zh) 歌曲推荐方法、装置、终端设备以及存储介质
US9483460B2 (en) Automated formation of specialized dictionaries
US8316032B1 (en) Book content item search
KR20180011254A (ko) 웹페이지 트레이닝 방법 및 기기, 그리고 검색 의도 식별 방법 및 기기
US20130060769A1 (en) System and method for identifying social media interactions
US20230147941A1 (en) Method, apparatus and device used to search for content
JP2013541793A (ja) マルチモード検索クエリー入力手法
KR20160107187A (ko) 검색 결과에서의 논리적인 질문 응답 기법
US20150186495A1 (en) Latent semantic indexing in application classification
CN110968789B (zh) 电子书推送方法、电子设备及计算机存储介质
Satwick Gupta et al. Extractive summarization of Indian legal documents
CN114255067A (zh) 数据定价方法和装置、电子设备、存储介质
CN114003725A (zh) 信息标注模型的构建方法以及信息标注的生成方法
CN114020864A (zh) 搜索结果的展示方法、装置及设备
Li et al. Infographics retrieval: A new methodology
CN111737607B (zh) 数据处理方法、装置、电子设备以及存储介质
CN112818206A (zh) 一种数据分类方法、装置、终端及存储介质
JP2016110256A (ja) 情報処理装置及び情報処理プログラム
CN113449063B (zh) 一种构建文档结构信息检索库的方法及装置
CN112632232B (zh) 一种文本匹配方法、装置、设备及介质
US8195458B2 (en) Open class noun classification
JP2015036892A (ja) 情報処理装置、情報処理方法、及び、プログラム
WO2015159702A1 (ja) 部分情報抽出システム
CN112579774A (zh) 模型训练方法、模型训练装置及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination