CN116415081A - 搜索方法及电子设备 - Google Patents
搜索方法及电子设备 Download PDFInfo
- Publication number
- CN116415081A CN116415081A CN202111669800.9A CN202111669800A CN116415081A CN 116415081 A CN116415081 A CN 116415081A CN 202111669800 A CN202111669800 A CN 202111669800A CN 116415081 A CN116415081 A CN 116415081A
- Authority
- CN
- China
- Prior art keywords
- topic
- search
- card
- theme
- web page
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 107
- 238000009826 distribution Methods 0.000 claims description 169
- 230000015654 memory Effects 0.000 claims description 41
- 238000004590 computer program Methods 0.000 claims description 12
- 238000004458 analytical method Methods 0.000 description 48
- 239000010410 layer Substances 0.000 description 30
- 230000006870 function Effects 0.000 description 27
- 238000004891 communication Methods 0.000 description 25
- 238000012545 processing Methods 0.000 description 24
- 238000007726 management method Methods 0.000 description 21
- 230000004044 response Effects 0.000 description 16
- 239000013598 vector Substances 0.000 description 15
- 238000010586 diagram Methods 0.000 description 13
- 230000004927 fusion Effects 0.000 description 12
- 238000010295 mobile communication Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 12
- 230000003993 interaction Effects 0.000 description 11
- 230000005236 sound signal Effects 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 8
- 230000006399 behavior Effects 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 229920001621 AMOLED Polymers 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 230000003416 augmentation Effects 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000005352 clarification Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 239000012792 core layer Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/957—Browsing optimisation, e.g. caching or content distillation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例提供一种搜索方法及电子设备,该方法应用于电子设备,该方法包括:接收用户输入的第一搜索请求;显示第一界面,第一界面包括第一搜索集合,第一搜索集合包括至少一个网页卡片以及至少一个网页卡片分别对应的主题标签,主题标签用于指示网页卡片对应的网页内容所属的分类,至少一个网页卡片和第一搜索请求相关。本申请实施例能将和搜索结果对应的主题标签展示给用户,让用户快速高效地获取到所需的信息。
Description
技术领域
本申请涉计算机技术领域,尤其涉及一种搜索方法及电子设备。
背景技术
目前用户想获取信息时,可以通过电子设备的搜索功能实现,例如浏览器应用的网页搜索功能,电子设备可以基于用户输入的查询语句从互联网中搜索出相关的网页,并按照顺序显示这些网页的概要信息(可称网页列表),用户可以点击列表中任意一个网页来查看该网页的具体内容。
但是,当用户输入的查询语句较模糊时,得到的搜索结果通常涉及范围较广,例如网页内容分别属于游戏、影视、历史等多个分类的多个网页,电子设备通常将繁多的搜索结果排序后展示给用户,而用户往往难以从大量的搜索结果中找到自己真正需要的信息,进而造成搜索结果不够准确。
发明内容
本申请实施例公开了一种搜索方法及电子设备,可以将和搜索结果对应的主题标签展示给用户,让用户可以快速高效地获取到所需的信息。
第一方面,本申请提供了一种搜索方法,应用于电子设备,该方法包括:接收用户输入的第一搜索请求;显示第一界面,上述第一界面包括第一搜索集合,上述第一搜索集合包括至少一个网页卡片以及上述至少一个网页卡片分别对应的主题标签,其中,上述主题标签用于指示上述网页卡片对应的网页内容所属的分类,上述至少一个网页卡片和上述第一搜索请求相关。
在上述方法中,电子设备不仅可以展示搜索结果(即上述网页卡片),还可以展示网页卡片对应的主题标签,协助用户从大量搜索结果中找到自己真正需要的信息,搜索结果更加准确,搜索过程更加快速高效。
在一种可能的实现方式中,上述第一搜索集合包括主题卡片,上述主题卡片包括至少一个上述主题标签,上述主题卡片和上述第一搜索请求相关。
在上述方法中,电子设备可以以主题卡片的形式展示至少一个主题标签,让用户可以从一个主题卡片获取到相关的主题标签,查看更加方便,提升搜索效率。
在一种可能的实现方式中,上述主题标签包括第一主题标签;上述显示第一界面之后,上述方法还包括:接收作用于上述第一主题标签的第一用户操作;响应于上述第一用户操作,显示第二界面,上述第二界面包括第二搜索集合,上述第二搜索集合包括的网页卡片对应的上述主题标签为上述第一主题标签。
在上述方法中,电子设备展示的主题标签提供交互功能,能为用户展示和用户选择的第一主题标签匹配的第二搜索集合,也可理解为是提供满足用户实际查询意图的搜索结果,实现更为精准地搜索和推荐,进一步方便用户快速高效地获取到所需的信息。
在一种可能的实现方式中,上述至少一个网页卡片包括第一网页卡片,上述第一网页卡片包括上述第一网页卡片对应的上述第一主题标签;或者,上述主题卡片包括上述第一主题标签。
在上述方法中,提供交互功能的主题标签可以是任意一个网页卡片包括的主题标签,也可以是主题卡片包括的主题标签,应用场景不局限,实现方式灵活,进一步提升用户使用感。
在一种可能的实现方式中,上述至少一个网页卡片包括第二网页卡片,上述第二网页卡片包括第一关键词,上述第一关键词是根据上述第一搜索请求获取的;上述显示第一界面,包括:在上述第一界面中按照第一显示方式显示上述第一关键词,按照第二显示方式显示上述第二网页卡片中排除上述第一关键词以外的信息,上述第一显示方式和上述第二显示方式不同。
在上述方法中,电子设备可以区别显示第二网页卡片中和用户输入的搜索请求对应的第一关键词,进一步协助用户从大量搜索结果中找到自己真正需要的信息,提升搜索效率。
在一种可能的实现方式中,上述第二搜索集合包括第三网页卡片,上述第三网页卡片包括第一关键词和第二关键词,上述第一关键词是根据上述第一搜索请求获取的,上述第二关键词是根据上述第一主题标签获取的;上述显示第二界面,包括:在上述第二界面中按照第三显示方式显示上述第一关键词和上述第二关键词,按照第四显示方式显示上述第三网页卡片中排除上述第一关键词和上述第二关键词以外的信息,上述第三显示方式和上述第四显示方式不同。
在上述方法中,电子设备可以区别显示第三网页卡片中的第一关键词和第二关键词,第一关键词和用户输入的搜索请求相关,第二关键词和用户选择的第一主题标签相关,进一步协助用户从大量搜索结果中找到自己真正需要的信息,提升搜索效率。
在一种可能的实现方式中,上述主题卡片位于上述至少一个网页卡片中排列在第一个的上述网页卡片之前,或者,上述主题卡片位于上述至少一个网页卡片中的两个上述网页卡片之间。
在上述方法中,主题卡片可以插入到至少一个网页卡片中显示,不占用额外的显示位置,减小对用户查看搜索结果的影响,提升用户阅读感受。
在一种可能的实现方式中,上述显示第一界面,包括:在第一位置显示第二主题标签,在第二位置显示第三主题标签,上述第二主题标签和上述第三主题标签为上述主题卡片包括的任意两个上述主题标签,上述主题卡片和第一主题分布相关,上述第一主题分布是根据第一关键词获取的,上述第一关键词是根据上述第一搜索请求获取的,上述第一主题分布包括的上述第二主题标签对应的概率大于上述第一主题分布包括的上述第三主题标签对应的概率,上述第一位置在上述第二位置之前。
在上述方法中,主题卡片包括的主题标签,和用户输入的搜索请求对应的第一关键词相关的概率越大,显示位置越前,让用户可以优先获取到和搜索请求相关度高的主题标签,显示方式和用户需求更加匹配,提升用户阅读感受。
在一种可能的实现方式中,上述第一搜索集合包括的上述网页卡片与第一关键词和第一主题分布相关,上述第一关键词是根据上述第一搜索请求获取的,上述第一主题分布是根据上述第一关键词获取的。
在上述方法中,第一搜索集合不仅和用户输入的搜索请求对应的第一关键词相关,而且和根据第一关键词获取的第一主题分布相关,提升了搜索结果的相关性和多样性。
在一种可能的实现方式中,上述显示第一界面之前,上述方法还包括:向网络设备发送第一查询请求,上述第一查询请求用于请求获取上述第一搜索请求相关的搜索结果;获取上述网络设备发送的上述第一搜索集合。
在一种可能的实现方式中,上述显示第二界面之前,上述方法还包括:响应于上述第一用户操作,向网络设备发送第二查询请求,上述第二查询请求用于请求获取上述第一主题标签及上述第一搜索请求相关的搜索结果;获取上述网络设备发送的上述第二搜索集合。
第二方面,本申请提供了又一种搜索方法,应用于网络设备,该方法包括:接收第一查询请求,上述第一查询请求为电子设备接收到用户输入的第一搜索请求时发送的,上述第一查询请求用于请求获取上述第一搜索请求相关的搜索结果;向上述电子设备发送第一搜索集合,上述第一搜索集合用于上述电子设备显示第一界面,上述第一界面包括上述第一搜索集合,上述第一搜索集合包括至少一个网页卡片以及上述至少一个网页卡片分别对应的主题标签,上述主题标签用于指示上述网页卡片对应的网页内容所属的分类,上述至少一个网页卡片和上述第一搜索请求相关。
在上述方法中,网络设备可以向电子设备发送第一搜索请求相关的第一搜索集合,以使电子设备可以展示搜索结果(即上述网页卡片)和网页卡片对应的主题标签,协助用户从大量搜索结果中找到自己真正需要的信息,搜索结果更加准确,搜索过程更加快速高效。
在一种可能的实现方式中,上述第一搜索集合包括主题卡片,上述主题卡片包括至少一个上述主题标签,上述主题卡片和上述第一搜索请求相关。
在上述方法中,电子设备可以以主题卡片的形式展示至少一个主题标签,让用户可以从一个主题卡片获取到相关的主题标签,查看更加方便,提升搜索效率。
在一种可能的实现方式中,上述第一界面中,上述主题卡片位于上述至少一个网页卡片中排列在第一个的上述网页卡片之前,或者,上述第一界面中,上述主题卡片位于上述至少一个网页卡片中的两个上述网页卡片之间。
在上述方法中,主题卡片可以插入到至少一个网页卡片中显示,不占用额外的显示位置,减小对用户查看搜索结果的影响,提升用户阅读感受。
在一种可能的实现方式中,上述主题标签包括第一主题标签;上述向上述电子设备发送至少一个网页卡片之后,该方法还包括:接收第二查询请求,上述第二查询请求为上述电子设备接收到作用于上述第一主题标签的第一用户操作时发送的,上述第二查询请求用于请求获取上述第一主题标签及上述第一搜索请求相关的搜索结果;向上述电子设备发送第二搜索集合,上述第二搜索集合用于上述电子设备显示第二界面,上述第二界面包括上述第二搜索集合,上述第二搜索集合包括的上述网页卡片对应的上述主题标签为上述第一主题标签。
在上述方法中,电子设备展示的主题标签提供交互功能,能为用户展示和用户选择的第一主题标签匹配的第二搜索集合,也可理解为是提供满足用户实际查询意图的搜索结果,实现更为精准地搜索和推荐,进一步方便用户快速高效地获取到所需的信息。
在一种可能的实现方式中,上述至少一个网页卡片包括第一网页卡片,上述第一网页卡片包括上述第一网页卡片对应的上述第一主题标签;或者,上述主题卡片包括上述第一主题标签。
在上述方法中,提供交互功能的主题标签可以是任意一个网页卡片包括的主题标签,也可以是主题卡片包括的主题标签,应用场景不局限,实现方式灵活,进一步提升用户使用感。
在一种可能的实现方式中,上述向上述电子设备发送第一搜索集合之前,上述方法还包括:根据第一主题分布对上述主题卡片包括的上述至少一个上述主题标签进行排序,上述第一主题分布是根据第一关键词获取的,上述第一关键词是根据上述第一搜索请求获取的,上述第一主题分布包括的第二主题标签对应的概率大于上述第一主题分布包括的第三主题标签对应的概率,上上述第二主题标签的排列顺序在上述第三主题标签之前,上述第一界面中上述第二主题标签显示在上述第三主题标签之前。
在一些实施例中,上述第一主题分布包括的主题标签对应的概率,可以表征该主题标签和上述第一搜索请求的关联程度,例如概率越大,关联程度越高,也就是说,在上述方法中,电子设备显示的主题卡片包括的至少一个主题标签是排序后的,和用户输入的搜索请求的关联程度越高的主题标签,排列顺序越靠前,显示位置越靠前,让用户可以优先获取到和搜索请求的关联程度高的主题标签,显示方式和用户需求更加匹配,提升用户阅读感受。
在一种可能的实现方式中,上述第一搜索集合包括的上述网页卡片与第一关键词和第一主题分布相关,上述第一关键词是根据上述第一搜索请求获取的,上述第一主题分布是根据上述第一关键词获取的。
在上述方法中,第一搜索集合不仅和用户输入的搜索请求对应的第一关键词相关,而且和根据第一关键词获取的第一主题分布相关,提升了搜索结果的相关性和多样性。
在一种可能的实现方式中,上述接收第一查询请求之后,上述方法还包括:获取第一关键词对应的第二主题分布,上述第一关键词是根据上述第一搜索请求获取的;获取第三搜索集合对应的第三主题分布,上述第三搜索集合是根据上述第一关键词获取到的;将上述第二主题分布和上述第三主题分布融合为上述第一主题分布。
在上述方法中,和主题卡片相关的第一主题分布,和/或,和第一搜索集合相关的第一主题分布,可以是融合第二主题分布和第三主题分布得到的,即使不存在第一关键词对应的第二主题分布,还可以使用根据第一关键词召回的第三搜索集合对应的第三主题分布,处理方式更全面,提升容错性。
在一种可能的实现方式中,上述至少一个网页卡片是从网页库中获取到的,上述接收第二查询请求之后,上述方法还包括:从上述网页库或者上述至少一个网页卡片中获取第四搜索集合,上述第四搜索集合包括的上述网页卡片对应的上述主题标签为上述第一主题标签;从优质库中获取第五搜索集合,上述第五搜索集合包括的上述网页卡片对应的上述主题标签为上述第一主题标签,上述优质库为基于上述网页库中的网页的质量确定的优质数据库;将上述第四搜索集合和上述第五搜索集合融合为上述第二搜索集合。
在上述方法中,不是单一地将第一搜索集合中对应的主题标签为第一主题标签的网页卡片的集合(如第四搜索集合)确定为是第二搜索集合,还融合了从优质库中召回的对应的主题标签为第一主题标签的网页卡片的集合(即第五搜索集合),不仅保证了网页的相关性(和用户选择的第一主题标签匹配),还保证了网页的多样性,扩展用户的阅读,提升用户使用感。
第三方面,本申请提供了一种通信装置,包括收发器、处理器和存储器,上述存储器用于存储计算机程序,上述处理器调用上述计算机程序,用于执行上述任一方面任意一种可能的实现方式中的搜索方法。
第四方面,本申请提供了一种通信装置,包括一个或多个处理器和一个或多个存储器。该一个或多个存储器与一个或多个处理器耦合,一个或多个存储器用于存储计算机程序代码,计算机程序代码包括计算机指令,当一个或多个处理器执行计算机指令时,使得上述通信装置执行上述任一方面任意一种可能的实现方式中的搜索方法。
第五方面,本申请实施例提供了一种计算机存储介质,上述计算机存储介质存储有计算机程序,上述计算机程序被处理器执行时,实现上述任一方面任意一种可能的实现方式中的搜索方法。
第六方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行上述任一方面任意一种可能的实现方式中的搜索方法。
附图说明
以下对本申请实施例用到的附图进行介绍。
图1A是本申请实施例提供的一种搜索系统的架构示意图;
图1B是本申请实施例提供的一种搜索系统的交互示意图;
图2A是本申请实施例提供的一种电子设备的硬件结构示意图;
图2B是本申请实施例提供的一种电子设备的软件架构示意图;
图2C是本申请实施例提供的一种网络设备的硬件结构示意图;
图3是本申请实施例提供的一种用户界面实施例的示意图;
图4是本申请实施例提供的又一种用户界面实施例的示意图;
图5是本申请实施例提供的又一种用户界面实施例的示意图;
图6是本申请实施例提供的又一种用户界面实施例的示意图;
图7是本申请实施例提供的一种搜索方法的流程示意图;
图8是本申请实施例提供的又一种搜索方法的流程示意图;
图9是本申请实施例提供的又一种搜索方法的流程示意图;
图10是本申请实施例提供的一种获取优质库的流程示意图;
图11是本申请实施例提供的又一种搜索方法的流程示意图。
具体实施方式
在本文中对本发明的描述中所使用的术语只是为了描述特定实施例的目的,而并非旨在作为对本发明的限制。如本在发明的说明书和所附权利要求书中所使用的那样,单数表达形式“一个”、“一种”、“所述”、“该”和“这一”旨在也包括复数表达形式,除非其上下文中明确地有相反指示。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
本申请提供了一种搜索方法,可以应用于电子设备。该方法例如应用于搜索系统或者推荐系统。在一些实施例中,电子设备接收到用户输入的查询语句(query)和针对该查询语句的搜索请求时,可以将搜索结果和搜索结果相关的主题标签展示给用户进行交互,在一些实施例中,电子设备可以为用户提供和用户选择的主题标签匹配的搜索结果,即满足用户查询的实际意图的搜索结果,这样可以减少用户在获取所需信息时执行的操作,搜索结果更加准确,并且降低了设备处理压力。该方法例如应用于网页搜索领域,一个搜索结果可以对应一个网页。其中:
搜索系统和推荐系统通常涉及到两个技术:召回和排序。其中,召回是指从原始数据(一般理解为全量信息集合,例如网页库)中触发尽可能多的正确结果,可选地,触发“正确结果”时可以基于和查询语句的相关度实现,例如相关度排列在前N位的网页为召回的结果,N为正整数。排序则是对输入的数据(如召回得到的正确结果)进行打分和排序,以得到得分最高的至少一个结果。例如可以基于相关参数来进行打分,相关参数例如但不限于包括网页内容、网页质量、站点权威性、和查询语句的相关度等。可选地,召回可以从千万级内容池中召回几千个数据结果,然后将数据结果返回其他排序层进行挑选,相当于粗排序。搜索系统和推荐系统可以将排序输出的至少一个结果显示给用户。在一些实施例中,还可以结合用户的信息(例如兴趣特点和行为日志)来得到搜索结果,例如召回和排序时可以基于和用户的信息的相关度进行打分,从而向用户推荐其感兴趣的内容。
网页搜索可以理解为是:基于用户输入的查询语句,使用特定的算法和策略从互联网搜索出和查询语句相关的搜索结果,每个搜索结果对应一个网页,然后对这些搜索结果进行排序和显示搜索结果列表,搜索结果列表中每个搜索结果可以包括对应的网页的概要信息。用户可以操作任意一个搜索结果查看对应的网页的具体内容。网页搜索也可以理解为是电子设备通过用户输入的查询语句,有效整合互联网上相关的网页内容,并通过统一入口帮助用户快速获取所需的信息。
可以理解地,任意一个信息可以存在一个主题标签(后续描述也可简称为主题),例如一个网页可以对应一个主题标签,主题标签可以用于指示网页的内容所属的分类,例如为游戏、影视、历史、明星、农业、科技、军事等。但需要说明的是,也存在信息的主题标签不明确的情况,即信息的主题标签无法被清楚地识别出来,在一些实施例中,可以通过主题分布来表征这种信息的主题。
其中,主题分布不是一个明确的主题标签,可以表征主题标签的多种可能情况,也就是说,主题标签存在多种可能的情况时,可以通过数学分布(即上述主题分布)来表征,数学分布的形式不作限定,例如包括多个可能的主题分别对应的概率。例如,查询语句1可以对应主题分布1,主题分布1包括主题标签1对应的概率1、主题标签2对应的概率2和其他主题对应的概率3,概率1、概率2和概率3之和为1,主题分布1可以表征查询语句1的主题为主题标签1的概率为概率1,查询语句1的主题为主题标签2的概率为概率2,查询语句1的主题为主题标签1和主题标签2以外的其他主题的概率为概率3。
在一些实施例中,电子设备可以识别网页集合(包括多个网页)的主题分布,例如该网页集合的主题分布可表征该网页集合包括的网页的内容可能所属的多个分类,以及属于每个分类的概率。在一些实施例中,电子设备可以识别查询语句的主题分布(本申请将查询语句的主题分布称为第一主题分布),可选地,可以理解为是进行用户查询的多意图的识别,可选地,可以理解为是识别用户搜索的隐示意图,隐示意图可以是无法从查询语句包括的内容直接得到的意图,例如查询语句为水果1,隐式意图可以为农业和食谱等,和隐式意图相反,即能直接从查询语句得到的意图可以为水果1。
在一些实施例中,一个(明确的)主题标签可以对应一个词分布,词分布可以指示用于表征对应的主题标签的多个词语,这多个词语也可称为主题标签的相关词,词分布也为数学分布,具体形式不作限定,例如包括多个词语分别对应的概率。可选地,可以仅取这多个词语中排在前N位的N个词语来表征词分布,N为正整数。例如,主题标签1可以对应词分布1,词分布1包括用于表征主题标签1的10个词语分别对应的概率,上述10个词语可以是用于表征主题标签1的多个词语经过排序后,排在前10位的词语,例如但不限于通过和主题的相关度来排序。
网页库,可以用于电子设备召回网页,网页库例如是电子设备使用爬虫技术从互联网上爬取的大量网页构成的集合。
优质库,可以用于电子设备召回网页,优质库例如是电子设备使用网页处理分析技术对网页库中的网页进行权威性、重要程度等方面进行分析得到的,例如基于权威性、重要程度等来确定网页的质量,并将质量较高的网页集合筛选出来,优质库可以理解为是网页库的子集。电子设备基于网页库获取优质库的过程的示例可参见下图10,暂不详述。
下面介绍本申请实施例涉及的一种搜索系统10。
图1A示例性示出了本申请实施例提供的一种搜索系统10的架构示意图。
如图1A所示,搜索系统10可以包括电子设备100和网络设备200。电子设备可以通过有线(例如,通用串行总线(universal serial bus,USB)、双绞线、同轴电缆和光纤等)或无线(例如,无线局域网(wireless local area networks,WLAN)、蓝牙和移动设备网络等)的方式,和网络设备进行通信。
其中,电子设备100可以是手机、平板电脑、手持计算机、个人数字助理(PersonalDigital Assistant,PDA)等移动终端,智能电视、智能摄像头等智能家居设备,智能手环、智能手表、智能眼镜等可穿戴设备,或其他桌面型、膝上型、笔记本电脑、超级移动个人计算机(Ultra-mobile Personal Computer,UMPC)、上网本、智慧屏等设备。本申请实施例对电子设备100的具体类型不作特殊限制。
其中,网络设备200可以包括至少一个服务器,在一些实施例中,任意一个服务器可以为硬件服务器,在一些实施例中,任意一个服务器可以为云服务器。
在一些实施例中,电子设备100可以与网络设备200基于浏览器/服务器(browser/server,B/S)架构通信,也可以基于客户端/服务器(client/server,C/S)架构通信。电子设备100可以接收用户输入的搜索请求,向网络设备200请求获取该搜索请求对应的网页搜索结果,该网页搜索结果可以是基于查询语句进行搜索得到的,查询语句可以是基于用户输入的搜索请求获取到的。电子设备100可以响应于该搜索请求,显示从网络设备200处获取到的上述网页搜索结果。
图1B示例性示出了本申请实施例提供的一种搜索系统10的交互示意图。
如图1B所示,搜索系统10中的电子设备100可以包括应用程序,例如浏览器。搜索系统10中的网络设备200可以包括查询模块(Query)、召回模块和排序模块(Ranker),其中:
电子设备100的应用程序可以用于接收用户输入的搜索请求,以及基于接收到的搜索请求向网络设备200的查询模块发送查询请求,以请求获取该搜索请求对应的网页搜索结果。
网络设备200的查询模块可以用于分析处理查询语句,查询语句可以是基于用户输入的搜索请求获取到的。在一些实施例中,查询模块可以对查询语句进行分析理解,以得到关键词、向量等查询语句的分析结果,以及向网络设备200的召回模块发送查询语句的分析结果。在一些实施例中,查询模块可以对查询语句的分析结果进行主题识别,以得到查询语句的主题分布,以及向网络设备200的召回模块发送查询语句的主题分布。
网络设备200的召回模块可以用于召回网页集合,以及将召回的网页集合发送给网络设备200的排序模块。在一些实施例中,召回模块可以基于查询模块发送的查询语句的分析结果和主题分布召回网页集合。
网络设备200的排序模块可以用于对召回模块发送的网页集合进行排序以得到排序结果,以及将排序结果发送给电子设备100的应用程序。在一些实施例中,排序模块还可以将排序结果中至少一个网页分别对应的主题标签发送给电子设备100的应用程序。在一些实施例中,排序模块可以对网页集合和主题卡片一起进行排序以得到排序结果,主题卡片包括至少一个主题标签,可选地,主题卡片对应查询语句的主题分布。
电子设备100的应用程序可以用于接收网络设备200的排序模块发送的排序结果,以及显示排序结果。在一些实施例中,应用程序可以显示排序结果中至少一个网页分别对应的主题标签。在一些实施例中,应用程序显示的排序结果可以包括主题卡片,显示的主题卡片可以包括至少一个主题标签。
在一些实施例中,电子设备100的应用程序可以用于接收用户输入的作用于第一主题标签的搜索请求,以及基于接收到的搜索请求向网络设备200的召回模块发送查询请求,以请求获取该搜索请求对应的网页搜索结果。网络设备200的召回模块可以基于第一主题标签召回网页集合,以及将召回的网页集合发送给网络设备200的排序模块。排序模块可以对召回模块发送的网页集合进行排序以得到排序结果,以及将排序结果发送给电子设备100的应用程序。电子设备100的应用程序可以显示接收到的排序结果,该排序结果中的网页对应的主题标签为第一主题标签。
接下来介绍本申请实施例中提供的示例性的电子设备。
请参见图2A,图2A示出了一种电子设备100的结构示意图。
电子设备100可以包括处理器110,外部存储器接口120,内部存储器121,USB接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器模块180,按键190,马达191,指示器192,摄像头193,显示屏194,以及用户标识模块(subscriber identification module,SIM)卡接口195等。其中传感器模块180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。
可以理解的是,本发明实施例示意的结构并不构成对电子设备100的具体限定。在本申请另一些实施例中,电子设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器110的等待时间,因而提高了系统的效率。
在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuitsound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general-purposeinput/output,GPIO)接口,用户标识模块(subscriber identity module,SIM)接口,和/或通用串行总线(universal serial bus,USB)接口等。
可以理解的是,本发明实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对电子设备100的结构限定。在本申请另一些实施例中,电子设备100也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
充电管理模块140用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。在一些有线充电的实施例中,充电管理模块140可以通过USB接口130接收有线充电器的充电输入。在一些无线充电的实施例中,充电管理模块140可以通过电子设备100的无线充电线圈接收无线充电输入。充电管理模块140为电池142充电的同时,还可以通过电源管理模块141为电子设备供电。
电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,显示屏194,摄像头193,和无线通信模块160等供电。电源管理模块141还可以用于监测电池容量,电池循环次数,电池健康状态(漏电,阻抗)等参数。在其他一些实施例中,电源管理模块141也可以设置于处理器110中。在另一些实施例中,电源管理模块141和充电管理模块140也可以设置于同一个器件中。
电子设备100的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。电子设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块150可以提供应用在电子设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中,移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。
调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器170A,受话器170B等)输出声音信号,或通过显示屏194显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器110,与移动通信模块150或其他功能模块设置在同一个器件中。
无线通信模块160可以提供应用在电子设备100上的包括WLAN(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth,BT),全球导航卫星系统(globalnavigation satellite system,GNSS),调频(frequency modulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
在一些实施例中,电子设备100的天线1和移动通信模块150耦合,天线2和无线通信模块160耦合,使得电子设备100可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(global system for mobile communications,GSM),通用分组无线服务(general packet radio service,GPRS),码分多址接入(codedivision multiple access,CDMA),宽带码分多址(wideband code division multipleaccess,WCDMA),时分码分多址(time-division code division multiple access,TD-SCDMA),长期演进(long term evolution,LTE),BT,GNSS,WLAN,NFC,FM,和/或IR技术等。所述GNSS可以包括全球卫星定位系统(global positioning system,GPS),全球导航卫星系统(global navigation satellite system,GLONASS),北斗卫星导航系统(beidounavigation satellite system,BDS),准天顶卫星系统(quasi-zenith satellitesystem,QZSS)和/或星基增强系统(satellite based augmentation systems,SBAS)。
电子设备100通过GPU,显示屏194,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode的,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,电子设备100可以包括1个或N个显示屏194,N为大于1的正整数。
电子设备100可以通过ISP,摄像头193,视频编解码器,GPU,显示屏194以及应用处理器等实现拍摄功能。
ISP用于处理摄像头193反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度,肤色进行算法优化。ISP还可以对拍摄场景的曝光,色温等参数优化。在一些实施例中,ISP可以设置在摄像头193中。
摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB,YUV等格式的图像信号。在一些实施例中,电子设备100可以包括1个或N个摄像头193,N为大于1的正整数。
外部存储器接口120可以用于连接外部存储卡,例如Micro SD卡,实现扩展电子设备100的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐,视频等文件保存在外部存储卡中。
内部存储器121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)等。存储数据区可存储电子设备100使用过程中所创建的数据(比如音频数据,电话本等)等。此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,UFS)等。处理器110通过运行存储在内部存储器121的指令,和/或存储在设置于处理器中的存储器的指令,执行电子设备100的各种功能应用以及数据处理。
电子设备100可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。
音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中,音频模块170可以设置于处理器110中,或将音频模块170的部分功能模块设置于处理器110中。
扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。电子设备100可以通过扬声器170A收听音乐,或收听免提通话。
受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。当电子设备100接听电话或语音信息时,可以通过将受话器170B靠近人耳接听语音。
麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风170C发声,将声音信号输入到麦克风170C。电子设备100可以设置至少一个麦克风170C。在另一些实施例中,电子设备100可以设置两个麦克风170C,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,电子设备100还可以设置三个,四个或更多麦克风170C,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。
压力传感器180A用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中,压力传感器180A可以设置于显示屏194。压力传感器180A的种类很多,如电阻式压力传感器,电感式压力传感器,电容式压力传感器等。电容式压力传感器可以是包括至少两个具有导电材料的平行板。当有力作用于压力传感器180A,电极之间的电容改变。电子设备100根据电容的变化确定压力的强度。当有触摸操作作用于显示屏194,电子设备100根据压力传感器180A检测所述触摸操作强度。电子设备100也可以根据压力传感器180A的检测信号计算触摸的位置。在一些实施例中,作用于相同触摸位置,但不同触摸操作强度的触摸操作,可以对应不同的操作指令。例如:当有触摸操作强度小于第一压力阈值的触摸操作作用于短消息应用图标时,执行查看短消息的指令。当有触摸操作强度大于或等于第一压力阈值的触摸操作作用于短消息应用图标时,执行新建短消息的指令。
触摸传感器180K,也称“触控器件”。触摸传感器180K可以设置于显示屏194,由触摸传感器180K与显示屏194组成触摸屏,也称“触控屏”。触摸传感器180K用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器180K也可以设置于电子设备100的表面,与显示屏194所处的位置不同。
按键190包括开机键,音量键等。按键190可以是机械按键。也可以是触摸式按键。电子设备100可以接收按键输入,产生与电子设备100的用户设置以及功能控制有关的键信号输入。
电子设备100的软件系统可以采用分层架构,事件驱动架构,微核架构,微服务架构,或云架构。例如,分层架构的软件系统可以是安卓(Android)系统,也可以是华为移动服务(huawei mobile services,HMS)系统,或其它软件系统。本申请实施例以分层架构的Android系统为例,示例性说明电子设备100的软件结构。
图2B是本发明实施例的电子设备100的软件结构框图。
分层架构将软件分成若干个层,每一层都有清晰的角色和分工。层与层之间通过软件接口通信。在一些实施例中,将Android系统分为四层,从上至下分别为应用程序层,应用程序框架层,安卓运行时(Android runtime)和系统库,以及内核层。
应用程序层可以包括一系列应用程序包。
如图2B所示,应用程序包可以包括相机,日历,音乐,短信息,图库,通话,导航,蓝牙,浏览器等应用程序。
应用程序框架层为应用程序层的应用程序提供应用编程接口(applicationprogramming interface,API)和编程框架。应用程序框架层包括一些预先定义的函数。
如图2B所示,应用程序框架层可以包括窗口管理器,内容提供器,视图系统,电话管理器,资源管理器,通知管理器等。
窗口管理器用于管理窗口程序。窗口管理器可以获取显示屏大小,判断是否有状态栏,锁定屏幕,截取屏幕等。
内容提供器用来存放和获取数据,并使这些数据可以被应用程序访问。所述数据可以包括视频,图像,音频,拨打和接听的电话,浏览历史和书签,电话簿等。
视图系统包括可视控件,例如显示文字的控件,显示图片的控件等。视图系统可用于构建应用程序。显示界面可以由一个或多个视图组成的。例如,包括短信通知图标的显示界面,可以包括显示文字的视图以及显示图片的视图。
电话管理器用于提供电子设备100的通信功能。例如通话状态的管理(包括接通,挂断等)。
资源管理器为应用程序提供各种资源,比如本地化字符串,图标,图片,布局文件,视频文件等等。
通知管理器使应用程序可以在状态栏中显示通知信息,可以用于传达告知类型的消息,可以短暂停留后自动消失,无需用户交互。比如通知管理器被用于告知下载完成,消息提醒等。通知管理器还可以是以图表或者滚动条文本形式出现在系统顶部状态栏的通知,例如后台运行的应用程序的通知,还可以是以对话窗口形式出现在屏幕上的通知。例如在状态栏提示文本信息,发出提示音,电子设备振动,指示灯闪烁等。
Android Runtime包括核心库和虚拟机。Android runtime负责安卓系统的调度和管理。
核心库包含两部分:一部分是java语言需要调用的功能函数,另一部分是安卓的核心库。
应用程序层和应用程序框架层运行在虚拟机中。虚拟机将应用程序层和应用程序框架层的java文件执行为二进制文件。虚拟机用于执行对象生命周期的管理,堆栈管理,线程管理,安全和异常的管理,以及垃圾回收等功能。
系统库可以包括多个功能模块。例如:表面管理器(surface manager),媒体库(Media Libraries),三维图形处理库(例如:OpenGL ES),2D图形引擎(例如:SGL)等。
表面管理器用于对显示子系统进行管理,并且为多个应用程序提供了2D和3D图层的融合。
媒体库支持多种常用的音频,视频格式回放和录制,以及静态图像文件等。媒体库可以支持多种音视频编码格式,例如:MPEG4,H.264,MP3,AAC,AMR,JPG,PNG等。
三维图形处理库用于实现三维图形绘图,图像渲染,合成,和图层处理等。
2D图形引擎是2D绘图的绘图引擎。
内核层是硬件和软件之间的层。内核层至少包含显示驱动,摄像头驱动,音频驱动,传感器驱动。
下面结合搜索场景,示例性说明电子设备100软件以及硬件的工作流程。
当触摸传感器180K接收到触摸操作,相应的硬件中断被发给内核层。内核层将触摸操作加工成原始输入事件(包括触摸坐标,触摸操作的时间戳等信息)。原始输入事件被存储在内核层。应用程序框架层从内核层获取原始输入事件,识别该输入事件所对应的控件。以该触摸操作是触摸单击操作,该单击操作所对应的控件为浏览器的搜索控件为例,浏览器调用应用框架层的接口,基于用户在浏览器的搜索框控件输入的查询语句进行搜索,进而通过调用内核层启动显示驱动,通过显示屏194显示搜索得到的网页列表。用户可以通过搜索得到的网页列表获取所需的信息。
接下来介绍本申请实施例中提供的示例性的网络设备。
请参见图2C,图2C示出了一种网络设备200的结构示意图。
如图2C所示,网络设备200可以包括一个或多个处理器201、通信接口202、存储器203,其中处理器201、通信接口202、存储器203可通过总线或者其它方式连接,本申请实施例以通过总线204连接为例。其中:
处理器201可以由一个或者多个通用处理器构成,例如CPU。处理器201可用于运行设备控制方法的相关的程序代码。
通信接口202可以为有线接口(例如以太网接口)或无线接口(例如蜂窝网络接口或使用无线局域网接口),用于与其他节点进行通信。本申请实施例中,通信接口202具体可用于与电子设备100进行通信。
存储器203可以包括易失性存储器(volatile memory),例如RAM;存储器也可以包括非易失性存储器(non-vlatile memory),例如ROM、快闪存储器(flash memory)、HDD或固态硬盘SSD。存储器203还可以包括上述种类的存储器的组合。存储器203可用于存储一组程序代码,以便于处理器201调用存储器203中存储的程序代码以实现本申请实施例的在服务器的实现方法。在本申请实施例中,存储器203还可以是存储阵列,等等。
在一些实施例中,网络设备200可以包括多个服务器,例如,网页服务器、后台服务器、下载服务器等,这多个服务器的硬件结构都可参照图2C所示的网络设备200的硬件结构。
需要说明的,图2C所示的网络设备200仅仅是本申请实施例的一种实现方式,实际应用中,网络设备200还可以包括更多或更少的部件,这里不作限制。
下面介绍本申请实施例涉及的应用场景以及该场景下的用户界面实施例。
请参见图3,图3示例性示出一种用户界面的示意图。图3的(A)示出了点击搜索控件311B之前的用户界面310,图3的(B)示出了点击搜索控件311B之后的用户界面320。
如图3的(A)所示,电子设备可以显示浏览器的用户界面310,在一些实施例中,用户界面310可以是电子设备响应于作用于桌面的浏览器的图标的触摸操作(例如点击操作)显示的,在一些实施例中,用户界面310可以为浏览器的首页。用户界面310可以包括搜索栏311、导航栏和推荐的网页。其中:
搜索栏311可以用于实现搜索功能。搜索栏311可以包括搜索框311A和搜索控件311B,搜索框311A可以用于输入查询语句,例如用户界面310中的搜索框311A包括文字:“搜索”,用于提示用户输入查询语句。搜索控件311B可以用于触发和查询语句对应的搜索。电子设备可以接收用户基于搜索框311A输入的查询语句,然后可以接收作用于搜索控件311B的触摸操作(例如点击操作),响应于该触摸操作,基于查询语句进行搜索以得到至少一个和查询语句相关的网页,并对这至少一个网页进行排序。电子设备可以显示排序后的网页,例如显示图3的(B)所示的用户界面320。
如图3的(B)所示,电子设备可以显示浏览器的用户界面320。用户界面320可以包括搜索栏311,用户界面320中的搜索栏311和图3的(A)所示的用户界面310中的搜索栏311类似,区别在于,用户界面320中的搜索栏311中,搜索框311A包括的文字为用户输入的查询语句:“人物A”。用户界面320可以用于显示和该查询语句对应的搜索结果列表,例如按照排序的先后顺序依次为网页321、网页322和网页323,不限于此,得到的搜索结果可以更多也可以更少,本申请对此不作限定。搜索结果列表中任意一个网页可以包括标题和网址,标题可以指示该网页的内容,网址即为该网页的地址,可以通过网址来访问该网页的具体内容。以网页321为例进行说明,网页321包括标题321A(包括字符“人物A-游戏1官网”)和网址321B(包括字符“网址aaa”),其中本申请以“人物A”对应的游戏名称为“游戏1”为例,网址可以是互联网协议(internet protocol,IP)地址,也可以是域名地址,具体形式不作限定。其他搜索结果的说明类似,具体可参见网页322和网页323,不再赘述。
如图3所示,用户输入的查询语句为“人物A”时,电子设备基于该查询语句得到的搜索结果中,网页321中的“人物A”对应“游戏1”中的游戏角色,网页322和网页323中的“人物A”对应历史人物,不限于此,其他搜索结果中的“人物A”也可以对应明星、影视角色等等。也就是说,用户输入的查询语句较模糊存在多意图时,搜索结果涉及范围较广,例如上述涉及了游戏、历史、明星和影视等多个领域,这样才能保证网页的相关性和多样性。并且电子设备只是简单地将搜索结果排序后展示给用户,用户实际的搜索意图可能只涉及其中一个领域,用户往往需要多次操作才能获取到所需的信息,例如多次执行滑动操作以查看当前界面未显示的其他搜索结果,多次点击列表中的网页来查看具体内容然后返回搜索结果的列表,也就是说用户从查询语句相关的搜索结果中筛选所需的信息时,需执行的用户操作繁琐,设备处理压力也较大,搜索结果无法很好地满足用户的实际意图。
本申请中,电子设备可以在展示搜索结果时将和搜索结果相关的主题标签一起展示给用户进行交互,减少用户从大量搜索结果中获取所需信息时所执行的操作,也降低了设备处理压力。
在一些实施例中,电子设备可以显示任意一个搜索结果对应的主题标签,具体示例如下图4所示。
请参见图4,图4示例性示出又一种用户界面的示意图。图4的(A)示出了点击搜索控件311B之前的用户界面310,图4的(B)示出了点击搜索控件311B之后的用户界面330。
如图4的(A)所示,电子设备可以显示浏览器的用户界面310,即图3的(A)所示的用户界面310。电子设备可以接收用户基于搜索框311A输入的查询语句“人物A”,并响应于作用于搜索控件311B的触摸操作(例如点击操作),基于查询语句进行搜索以得到至少一个搜索结果,并对这至少一个搜索结果进行排序,每个搜索结果对应一个网页。在一些实施例中,电子设备可以在显示排序后的至少一个搜索结果时,显示部分或全部搜索结果对应的主题标签,例如图4的(B)所示的用户界面330。
如图4的(B)所示,用户界面330可以包括搜索栏311,具体可参见图3的(B)所示的用户界面320中的搜索栏311的说明。用户界面330可以用于显示和查询语句“人物A”对应的搜索结果列表,例如按照排序的先后顺序依次为网页331、网页333和网页332,不限于此,得到的搜索结果可以更多也可以更少,本申请对此不作限定。搜索结果列表中任意一个搜索结果可以包括对应网页的标题、简介、网址、来源和主题标签,标题和简介可以指示该网页的内容,网址为访问该网页的入口地址,来源为发布该网页的源头(例如为网站名称、公众号名称、企业名称等)。例如,网页331包括标题331A(包括字符“人物A-游戏1官网”)、简介331B(包括字符“游戏1角色资料:人物A…”)、网址331C、来源331D和主题331E(包括字符“游戏1”)。网页332包括标题332A(包括字符“历史人物A的一生”)、简介332B(包括字符“介绍朝代H的人物A…”)、网址332C、来源332D和主题332E(包括文字“历史人物”),其中本申请以“人物A”对应的历史朝代为“朝代H”为例。网页333包括标题333A(包括字符“人物A明星资料大全”)、简介333B(包括字符“人物A热门影视作品…”)、网址333C、来源333D和主题333E(包括文字“明星”)。其中,网页331、网页332和网页333为排列在前3位的搜索结果,可选地,电子设备可以响应于触摸操作(例如从下往上的滑动操作),显示排在第3位的搜索结果(即网页332)之后的搜索结果,但不显示这些搜索结果的主题标签。
不限于上述示例,在另一些示例中,电子设备也可以显示更多搜索结果的主题标签,本申请对此不作限定。
在一些实施例中,电子设备可以接收作用于任意一个搜索结果对应的主题标签的触摸操作(例如点击操作),例如图4的(B)所示的用户界面330中的主题331E、主题332E或者主题333E,响应于该触摸操作,显示和查询语句以及用户选择的主题标签相关的搜索结果,例如下图6的(A)所示的用户界面410(对应主题332E)或者图6的(B)所示的用户界面420(对应主题331E)。
在另一些实施例中,电子设备可以在搜索结果列表中显示主题卡片,主题卡片包括和搜索结果列表中的搜索结果对应的至少一个主题标签,具体示例如下图5所示。
请参见图5,图5示例性示出又一种用户界面的示意图。图5的(A)示出了点击搜索控件311B之前的用户界面310,图5的(B)示出了点击搜索控件311B之后的用户界面340。
如图5的(A)所示,电子设备可以显示浏览器的用户界面310,即图3的(A)所示的用户界面310。电子设备可以接收用户基于搜索框311A输入的查询语句“人物A”,并响应于作用于搜索控件311B的触摸操作(例如点击操作),基于查询语句进行搜索以得到至少一个搜索结果。在一些实施例中,电子设备可以对搜索得到的至少一个搜索结果和查询语句的主题卡片进行排序,并显示排序后的结果,例如图5的(B)所示的用户界面340。
如图5的(B)所示,用户界面340可以包括搜索栏311,具体可参见图3的(B)所示的用户界面320中的搜索栏311的说明。用户界面340可以用于显示和查询语句“人物A”对应的多个搜索结果和主题卡片,例如按照排序的先后顺序依次为网页341、网页342、主题卡片343和网页344,网页341、网页342和网页344分别和图4的(B)所示的用户界面330中的网页331、网页333和网页332类似,区别在于用户界面340中的网页不包括主题标签。主题卡片343可以包括标题(包括文字“推荐内容”)和多个主题标签,例如主题343A(包括字符“历史人物”),主题343B(包括字符“明星”),主题343C(包括字符“游戏1”)。
在一些实施例中,主题卡片是根据查询语句的主题分布确定的,例如用户界面340中的主题卡片343用于指示查询语句的主题分布,该主题分布包括三个明确的主题:“历史人物”、“明星”和“游戏1”,分别对应主题343A、主题343B和主题343C。
在一些实施例中,电子设备可以接收作用于主题卡片343中的任意一个主题标签的触摸操作(例如点击操作),例如主题343A、主题343B或者主题343C,响应于该触摸操作,显示和查询语句以及用户选择的主题标签相关的搜索结果,例如下图6的(A)所示的用户界面410(对应主题343A)或者图6的(B)所示的用户界面420(对应主题343C)。
在一些实施例中,电子设备可以命中显示(也可称为突出显示)搜索结果列表中的查询语句“人物A”,命中显示可以理解为是显示方式和其他显示方式不同,例如图4的(B)所示的用户界面330中,网页331的标题331A和简介331B中的“人物A”,网页332的标题332A和简介332B中的“人物A”,以及网页333的标题333A和简介333B中的“人物A”,均局部灰色显示,其他字符并未局部灰色显示。图5的(B)所示的用户界面340的命中显示和图4的(B)一致,不再赘述。
不限于上述示例的情况,在另一些示例中,图5的(B)所示的用户界面340中的网页也可以包括主题标签,具体可参见图4的(B)所示的用户界面330。
以上实施例以主题卡片显示在搜索结果列表中为例进行说明,在另一些示例中,主题卡片也可以悬浮显示在搜索结果列表之上,也可以显示在搜索结果列表的旁边(例如显示屏的左侧或右侧边缘),本申请对主题卡片的显示方式不作限定。
在一些实施例中,电子设备可以显示和用户选择的主题标签相关的搜索结果,具体示例如下图6所示。
请参见图6,图6示例性示出又一种用户界面的示意图。
如图6的(A)所示,电子设备可以显示浏览器的用户界面410,用户界面410可以包括搜索结果列表和导航栏415。其中:
搜索结果列表中的搜索结果是基于查询语句“人物A”和用户选择的主题“历史人物”进行搜索得到的,例如按照排序的先后顺序依次为网页411、网页412、网页413和网页414,不限于此,得到的搜索结果可以更多也可以更少,本申请对此不作限定。搜索结果列表中任意一个搜索结果可以包括对应网页的标题、网址、来源,可选地还包括简介。例如,网页411包括标题411A(包括字符“历史人物A的故事”)和简介411B(包括字符“人物A是朝代H的…”)。网页412包括标题412A(包括图标和字符“解说朝代H的历史人物”,图标指示该网页包括视频信息)。网页413包括标题413A(包括字符“历史人物A的一生”)和简介413B(包括字符“介绍朝代H的人物A…”)。网页414包括标题414A(包括字符“历史上人物A怎么死的”)和简介414B(包括字符“人物A死于…”)。从这些网页的标题可以看出,网页411、网页413和网页414和查询语句“人物A”相关,网页412和用户选择的主题标签“历史人物”相关,当然这并不限定网页411、网页413和网页414和“历史人物”无关,也并不限定网页412和“人物A”无关。可以理解地,电子设备为用户推荐主题标签为用户选择的主题标签“历史人物”的搜索结果,更符合用户查询的实际意图。并且,这些搜索结果不限定于和查询语句“人物A”相关,例如网页412的标题412A不包括查询语句“人物A”,包括用户选择的主题标签“历史人物”,可以理解为是基于查询的实际意图进行了聚合扩展,推荐了更多和用户选择的主题标签相关的搜索结果,扩展用户的阅读,提升体验。
导航栏415可以包括返回控件415A和窗口数量415B。返回控件415A可以用于返回上一级界面,例如图6的(A)所示用户界面410中,电子设备可以响应于作用于返回控件415A的触摸操作(例如点击操作),响应于该触摸操作,返回显示上一级网页,即图4的(B)所示的用户界面330或者图5的(B)所示的用户界面340。窗口数量415B可以表征同时打开的窗口数量,例如同时打开了图6的(A)所示用户界面410和上一级网页。
如图6的(B)所示,电子设备可以显示浏览器的用户界面420,用户界面420和图6的(A)所示的用户界面410类似,区别在于,用户界面420显示的搜索结果是基于查询语句“人物A”和用户选择的主题标签“游戏1”进行搜索得到的,例如按照排序的先后顺序依次为网页421、网页422、网页423和网页424,其中,网页421包括标题421A(包括字符“游戏1角色介绍”)和简介421B(包括字符“游戏1的角色包括人物A、人物B”)。网页422包括标题422A(包括字符“游戏1技能分析”)和简介422B(包括字符“人物A的技能包括”)。网页423包括标题423A(包括字符“人物A-游戏1官网”)和简介423B(包括字符“游戏1角色资料:人物A…”)。网页424包括标题424A(包括字符“人物A装备推荐”)和简介424B(包括字符“人物A的核心装备是…”)。基于这些搜索结果的标题可以看出,网页423和网页424和查询语句“人物A”相关,网页421和网页422和用户选择的主题标签“游戏1”相关,当然这并不限定网页423和网页424与“游戏1”无关,也并不限定网页421和网页422与“人物A”无关。可以理解地,电子设备为用户推荐主题标签为用户选择的主题标签“游戏1”的搜索结果,更符合用户查询的实际意图。
在一些实施例中,电子设备可以命中显示搜索结果列表中的查询语句“人物A”、用户选择的主题标签和该主题标签的相关词。例如,如图6的(A)所示,用户选择的主题标签为“历史人物”。假设“历史人物”的相关词包括“历史”和“朝代H”(“人物A”对应的历史朝代)。用户界面410中,网页411的标题411A中“历史人物A”、简介411B中“人物A”和“朝代H”,网页412的标题412A中“朝代H”和“历史人物”,网页413的标题413A中“历史人物A”、简介413B中“朝代H”和“人物A”,网页414的标题414A中“历史”、简介414B中“人物A”,均局部灰色显示,其他字符并未局部灰色显示。
例如,如图6的(B)所示,用户选择的主题标签为“游戏1”。假设“游戏1”的相关词包括“技能”、“角色”和“装备”。用户界面420中,网页421的标题421A中“游戏1”和“角色”,简介421B中“游戏1”、“角色”和“人物A”,网页422的标题422A中“游戏1”和“技能”,简介422B中“人物A”和“技能”,网页423的标题423A中“人物A”和“游戏1”,简介423B中“游戏1”和“人物A”,网页424的标题424A中“人物A”和“装备”,简介424B中“人物A”和“装备”,均局部灰色显示,其他字符并未局部灰色显示。
在一些实施例中,如图4的(B)所示的用户界面330,图5的(B)所示的用户界面340图6的(A)所示的用户界面410或者图6的(B)所示的用户界面420,电子设备可以接收作用于任意一个搜索结果的触摸操作(例如点击操作),响应于该触摸操作,显示搜索结果的具体内容,例如跳转到用户选择的网页所在的用户界面,该用户界面用于显示该网页的具体内容。
可以理解地,电子设备在实现搜索功能或者推荐功能时,可以基于用户输入的查询语句返回搜索结果和搜索结果相关的主题标签,通过主题标签提供良好的意图澄清的交互方式,如图4的(B)所示的用户界面330中显示通过查询语句得到的搜索结果分别对应的主题标签,如图5的(B)所示的用户界面340中显示查询语句对应的主题卡片。并且,电子设备可以为用户推荐主题标签为用户选择的主题标签的搜索结果,即为用户提供更符合用户实际意图的搜索结果,例如图6所示的用户界面410和图6的(B)所示的用户界面420,此时得到的搜索结果更加准确。这样,用户能够快速高效地从大量的搜索结果中获取到所需的信息,减少用户操作,降低设备处理压力。
基于以上实施例,介绍本申请涉及的搜索方法。该方法可以应用于图1A和图1B所示的搜索系统10。
请参见图7,图7是本申请实施例提供的一种搜索方法的流程示意图。该方法可以包括但不限于如下流程:
1.电子设备的应用程序向网络设备的查询模块发送查询请求。
在一些实施例中,电子设备可以接收用户通过应用程序输入的搜索请求,该搜索请求可以用于请求搜索对应的查询语句,例如上图3-图5所示实施例中,电子设备可以接收用户基于搜索框311A输入的查询语句“人物A”,然后可以接收作用于搜索控件311B的触摸操作,此时可以理解为是接收到请求搜索查询语句“人物A”的搜索请求。本申请中,电子设备例如但不限于通过接收字符、接收语音或接收手势等方式来接收搜索请求。
在一些实施例中,应用程序可以基于接收到的用户输入的搜索请求,向查询模块发送查询请求,该查询请求用于请求获取查询语句相关的搜索结果,查询语句可以是应用程序基于搜索请求获取到的。
2.网络设备的查询模块分析查询语句得到关键词、向量等分析结果。
在一些实施例中,查询模块可以基于电子设备的应用程序发送的查询请求,对查询语句进行分析理解以得到查询语句的分析结果。
例如,查询语句为“人物A是谁”或者“人物A的信息”,分析结果可以包括对查询语句进行实体词识别得到的关键词“人物A”。
例如,查询语句为“城市A有什么景点”,分析结果可以包括对查询语句进行分词得到的关键词“城市A”和“景点”,以及对查询语句进行扩展得到的关键词“景观”和“风景”(也可称为获取同义词)。不限于此,实现查询语句(query)理解的方式还包括纠错等,本申请对此不作限定。
3.网络设备的查询模块基于查询语句的分析结果确定第二主题分布。
在一些实施例中,查询模块中可以预设有关键词和主题分布的对应关系,查询模块可以根据该对应关系确定分析结果中的至少一个关键词分别对应的主题分布,然后对确定的至少一个主题分布进行加权求和以得到第二主题分布。例如,上图4-图6所示实施例中,查询语句的分析结果为关键词“人物A”,查询模块根据预设的对应关系确定的第二主题分布包括:主题为“明星”的概率0.4,主题为“历史人物”的概率0.3,主题为这两个主题以外的其他主题的概率0.3。其中,本申请将主题不明确的情况归类在一起,称为主题为其他主题的情况。
4.网络设备的查询模块向网络设备的召回模块发送查询语句的分析结果。
在一些实施例中,查询模块可以将对查询语句分析得到的关键词“人物A”发送给召回模块。
5.网络设备的召回模块基于查询语句的分析结果召回第一网页集合。
在一些实施例中,召回模块可以基于对查询语句分析得到的关键词“人物A”召回第一网页集合,可选地,基于网页和查询语句的分析结果“人物A”的相关度,召回相关度排列较前的多个网页,例如,第一网页集合包括上图3的(B)所示的用户界面320中的网页:网页321、网页322和网页323,这些网页和查询语句的分析结果“人物A”的相关度较高。
在一些实施例中,召回模块还可以基于第二主题分布召回第一网页集合,可选地,基于网页和查询语句的分析结果的相关度,以及网页和第二主题分布的相关度,召回相关度排列较前的多个网页。
在一些实施例中,召回模块还可以基于用户的信息(例如兴趣特点和网页行为日志)召回第一网页集合,可选地,基于网页和查询语句的分析结果的相关度,以及网页和用户的信息的相关度,召回相关度排列较前的多个网页。例如,假设用户的网页行为日志表征用户浏览过最多的网页所属的分类为“游戏”,第一网页集合包括上图3的(B)所示的用户界面320中的网页:网页321、网页322和网页323,其中网页321可以是网页内容和查询语句的分析结果“人物A”的相关度,以及网页内容和用户的信息(即上述“游戏”)的相关度均较高的网页。
6.网络设备的召回模块向网络设备的查询模块发送第一网页集合。
7.网络设备的查询模块基于第一网页集合确定第三主题分布。
在一些实施例中,步骤1之前,查询模块可以先识别多个待搜索的网页的主题,例如对网页库中的每一个网页进行主题识别,该过程可以理解为是离线预测主题。可选地,离线预测主题阶段识别出的网页可以存储在电子设备中。
在一些实施例中,查询模块可以对第一网页集合中每一个网页进行主题识别,可选地,若待识别的网页为离线预测主题阶段已识别出主题的网页,可以直接得到该网页的主题,可选地,若待识别的网页不为离线预测主题阶段已识别出主题的网页(例如离线预测主题阶段之后新发布的新闻网页),可以实时识别该网页的主题标签。从而减少实时处理的数据量,加快处理速度。然后,查询模块可以统计第一网页集合中的网页的主题,以确定第三主题分布。
在一些实施例中,查询模块可以调用主题模型对网页进行预测,将该网页的信息作为该主题模型的输入,得到输出:该网页的主题的标识(identity document,id)、该id对应的词分布(例如指示表征该主题的前10个词语)。然后基于该主题的id,对应的词分布和该网页的具体内容生成该主题的详细信息,即识别出该网页的主题标签。例如,查询模块可以将网页1的具体内容作为主题模型的输入,得到输出:网页1的主题的id(假设为111)、该id对应的词分布(假设包括“影视”的概率0.5、“游戏”的概率0.3和“明星”的概率0.2),然后基于该id、该词分布和网页1的具体内容生成网页1的主题“娱乐”,其中“娱乐”可以通过主题id111来唯一标识。
在另一些实施例中,电子设备接收用户手动输入的多个主题id分别对应的主题的详细信息,例如,电子设备接收用户手动输入的id为111的主题为“娱乐”。
在一些实施例中,第一网页集合为召回模块基于查询语句的分析结果“人物A”和第二主题分布召回得到的,可以理解地,结合上述召回的说明,第一网页集合可以包括主题为第二主题分布指示的主题的网页,也可以包括主题为第二主题分布未指示的主题的网页,因此第一网页集合对应的第三主题分布指示的主题和第二主题分布指示的主题可以相同,也可以不同。
例如,假设第一网页集合包括一千个网页,其中五百个网页的主题标签为“历史人物”,三百个网页的主题标签为“游戏1”,其余两百个网页的主题标签不明确,则基于第一网页集合确定的第三主题分布包括:主题为“历史人物”的概率500/1000=0.5,主题为“游戏1”的概率300/1000=0.3,主题为这两个主题以外的其他主题的概率200/1000=0.2。
8.网络设备的查询模块融合第二主题分布和第三主题分布得到第一主题分布(也可称为查询语句的主题分布)。
在一些实施例中,查询模块可以对第二主题分布和第三主题分布进行加权求和,以得到第一主题分布。
例如,假设第二主题分布为步骤3示例的第二主题分布:主题为“明星”的概率0.4,主题为“历史人物”的概率0.3,主题为这两个主题以外的其他主题的概率0.3。假设第三主题分布为步骤7示例的第三主题分布:主题为“历史人物”的概率0.5,主题为“游戏1”的概率0.3,主题为这两个主题以外的其他主题的概率0.2。则第一主题分布包括:主题为“历史人物的”概率(0.3+0.5)/2=0.4,主题为“明星”的概率(0.4+0)/2=0.2,主题为“游戏1”的概率(0+0.3)/2=0.15,主题为这三个主题以外的其他主题的概率(0.3+0.2)/2=0.25。可以理解地,此处只是示例融合第二主题分布和第三主题分布得到第一主题分布的计算方式,在另一些示例中,还可以设置计算第一主题分布时第二主题分布和第三主题分布的权重,第二主题分布和第三主题分布的权重可以不同,可以根据实际情况确定,本申请对具体计算方式不作限定。
9.网络设备的查询模块向网络设备的召回模块发送第一主题分布。
10.网络设备的召回模块基于分析结果和第一主题分布召回第二网页集合。
在一些实施例中,召回模块可以基于网页和对查询语句分析得到的关键词“人物A”的相关度,以及网页和第一主题分布的相关度,可选地以及网页和用户的信息(例如兴趣特点和网页行为日志)的相关度,召回相关度排列较前的多个网页。结合用户的信息召回网页的示例可参见步骤5中基于用户的信息召回第一网页集合的说明。
例如,第二网页集合包括上图4的(B)所示的用户界面330中的网页:网页331、网页333和网页332,这些网页和查询语句的分析结果“人物A”的相关度较高,并且网页331和第一主题分布(假设为步骤8示例的第一主题分布)指示的主题“游戏1”的相关度较高,网页333和第一主题分布指示的主题“明星”的相关度较高,网页332和第一主题分布指示的主题“历史人物”的相关度较高。
在上述示例的第二网页集合的基础上,假设第一网页集合包括上图3的(B)所示的用户界面320中的网页,第二主题分布、第三主题分布和第一主题分布为步骤8示例的第二主题分布、第三主题分布和第一主题分布。相比上图3的(B)所示的用户界面320中的网页(第一网页集合),上图4的(B)所示的用户界面330中的网页(第二网页集合)是结合了第一主题分布和其他参数召回得到的,而第一主题分布是融合第二主题分布和第三主题分布得到的,因此上图4的(B)所示的用户界面330中的网页(即第二网页集合)可以还包括主题标签为“明星”的网页333,“明星”为第二主题分布包括的主题标签,且为第三主题分布未包括的主题标签。
11a.网络设备的召回模块向网络设备的排序模块发送第二网页集合。
12a.网络设备的排序模块对第二网页集合进行排序得到第一排序结果。
在一些实施例中,排序模块可以基于每个网页的相关参数来进行打分,相关参数包括以下至少一项:网页间的相关度、网页内容、网页质量、站点权威性、和查询语句的分析结果“人物A”的相关度、和第一主题分布的相关度、和用户的信息(例如兴趣特点和网页行为日志)的相关度。然后对打分后的网页进行排序,分数越高排列顺序越靠前,例如排列在前N位的N个网页即为第一排序结果,N为正整数。
例如,第一排序结果包括上图4的(B)所示的用户界面330中的网页(排列在前3位的网页),按照排列顺序依次为网页331(主题为“游戏1”)、网页333(主题为“明星”)和网页332(主题为“历史人物”)。假设对第一网页集合排序后的结果为上图3的(B)所示的用户界面320中的网页,按照排列顺序依次为网页321(主题为“游戏1”)、网页322(主题为“历史人物”)和网页323(主题为“历史人物”)。相比上图3的(B)所示的用户界面320中的网页(对第一网页集合排序后的结果),上图4的(B)所示的用户界面330中的网页(第一排序结果)是结合了和第一主题分布的相关度和其他相关参数排序得到的,在结合和第一主题分布的相关度进行排序的情况下,由于上图4的(B)所示的用户界面330中的网页333的内容和第一主题分布指示的主题“明星”的相关度较高,网页332的内容和第一主题分布指示的主题“历史人物”的相关度较低,因此网页333的排列顺序高于网页332。
13a.网络设备的排序模块向电子设备的应用程序发送第一排序结果和第一排序结果中至少一个网页的主题标签。
在一些实施例中,排序模块可以判断是否向应用程序发送第一排序结果的主题标签,例如,排序模块可以判断第一排序结果中排在前N位的N个网页是否有明确的主题标签,如果这N个网页中至少一个网页有明确的主题标签,排序模块可以向应用程序发送这至少一个网页的主题标签,N为正整数。
14a.电子设备的应用程序显示第一排序结果和第一排序结果中至少一个网页的主题标签。
在一些实施例中,应用程序显示的第一排序结果和步骤1中用户通过应用程序输入的搜索请求相关,可选地具体包括:应用程序显示的第一排序结果和查询语句的分析结果相关,查询语句是根据该搜索请求获取到的(具体示例可参见图7的步骤2)。例如,假设查询语句的分析结果为关键词“人物A”,图4的(B)所示的用户界面330用于显示第一排序结果:按照排列顺序依次为网页331、网页333和网页332,这些网页的标题和简介均包括关键词“人物A”,可以理解为是第一排序结果和关键词“人物A”相关。
在一些实施例中,应用程序显示第一排序结果时,可以一起显示这至少一个网页的主题标签,可选地,显示这至少一个网页中任意一个网页时,可以对应显示该网页的主题标签。例如,上图4的(B)所示的用户界面330中,排在前3位的网页均有明确的主题标签,上述N大于或等于3,网页331包括主题331E,指示主题为“游戏1”,网页332包括主题332E,指示主题为“历史人物”,网页333包括主题333E,指示主题为“明星”。
在以上实施例中,步骤3和步骤4的顺序不作限定。
请参见图8,图8是本申请实施例提供的又一种搜索方法的流程示意图。
该方法可以包括图7实施例中的步骤1-10,具体可参见图7的步骤1-10的说明。在一些实施例中,该方法还包括:
11b.网络设备的召回模块向网络设备的排序模块发送第一主题分布和第二网页集合。
12b.网络设备的排序模块对第二网页集合和第一主题分布进行排序得到第二排序结果。
在一些实施例中,排序模块对第二网页集合中的每个网页进行打分,并对第一主题分布进行打分,然后对打分后的网页和第一主题分布进行排序,分数越高排列顺序越靠前,排列在前N位的N个网页即为第二排序结果,N为正整数。例如,第二排序结果包括上图5的(B)所示的用户界面340中的网页和主题卡片(对应第一主题分布),由于网页341的分数高于网页342的分数,主题卡片343的分数低于网页342的分数且高于网页344的分数,因此用户界面340中的网页和主题卡片按照排列顺序依次为:网页341、网页342、主题卡片343和网页344。
其中,排序模块对网页打分的示例可参见图7的步骤12a的说明。排序模块对第一主题分布打分的示例如下所示:
例如,假设第一主题分布为上图7的步骤8示例的第一主题分布:主题为“历史人物的”概率0.4,主题为“明星”的概率0.2,主题为“游戏1”的概率0.15,主题为这三个主题以外的其他主题的概率0.25。排序模块可以基于第一主题分布指示的明确的主题的概率确定第一主题分布的分数:0.4+0.2+0.15=0.75。
13b.网络设备的排序模块向应用程序发送第二排序结果。
在一些实施例中,排序模块可以判断是否向应用程序发送包括第一主题分布的第二排序结果,例如,排序模块可以判断第二排序结果中第一主题分布是否排在前N位,若是,排序模块可以向应用程序发送第二排序结果,否则可以执行图7的步骤12a和步骤13a,N为正整数。
14b.电子设备的应用程序显示第二排序结果。
在一些实施例中,应用程序显示的第二排序结果包括主题卡片和多个网页,主题卡片包括至少一个主题标签,其中:
在一些实施例中,第二排序结果包括的多个网页和步骤1中用户通过应用程序输入的搜索请求相关,可选地具体包括:上述多个网页和查询语句的分析结果相关,查询语句是根据该搜索请求获取到的(具体过程示例可参见图7的步骤2)。例如,假设查询语句的分析结果为关键词“人物A”,图5的(B)所示的用户界面340用于显示第二排序结果:按照排列顺序依次为网页341、网页342、主题卡片343和网页344,其中网页341、网页342和网页344的标题和/或简介均包括关键词“人物A”,可以理解为是第二排序结果包括的多个网页和关键词“人物A”相关。
在一些实施例中,第二排序结果包括的主题卡片和步骤1所述的用户通过应用程序输入的搜索请求相关,可选地具体包括:主题卡片和第一主题分布相关,第一主题分布是基于查询语句的分析结果获取到的(具体过程示例可参见图7的步骤3-8),查询语句是根据该搜索请求获取到的(具体过程示例可参见图7的步骤2)。例如,主题卡片和第一主题分布相关,具体为:主题卡片包括的至少一个主题标签为第一主题分布包括的至少一个明确的主题标签。假设第一主题分布为上图7的步骤8示例的第一主题分布:主题为“历史人物的”概率0.4,主题为“明星”的概率0.2,主题为“游戏1”的概率0.15,主题为这三个主题以外的其他主题的概率0.25。上图5的(B)所示的用户界面340用于显示第二排序结果:按照排列顺序依次为网页341、网页342、主题卡片343和网页344,其中主题卡片343包括主题343A(包括字符“历史人物”),主题343B(包括字符“明星”),主题343C(包括字符“游戏1”),可以指示主题卡片包括三个主题标签“历史人物”、“明星”和“游戏1”,即第一主题分布包括的三个明确的主题标签。
在一些实施例中,应用程序显示的主题卡片和第一主题分布相关,具体包括:主题卡片包括的至少一个主题标签的显示位置和第一主题分布包括的主题标签对应的概率相关,例如,第一主题分布中主题标签对应的概率越高,显示位置越优先。假设第一主题分布为上图7的步骤8示例的第一主题分布:主题为“历史人物的”概率0.4,主题为“明星”的概率0.2,主题为“游戏1”的概率0.15,主题为这三个主题以外的其他主题的概率0.25。上图5的(B)所示的用户界面340用于显示第二排序结果,第二排序结果中的主题卡片343包括的三个主题标签的显示位置是按照第一主题分布中主题的概率大小来确定的,假设按照概率从大到小排列,显示位置的先后顺序依次为:指示“历史人物”的主题343A,指示“明星”的主题343B和指示“游戏1”的主题343C。
可选地,排序模块可以基于第一主题分布包括的主题标签对应的概率,确定主题卡片包括的多个主题标签的显示位置,可以理解为是对主题卡片包括的多个主题标签进行排序,应用程序可以按照确定的显示位置显示主题卡片包括的多个主题标签。
不限于上述列举的示例,在另一些实施例中,排序模块可以先对第二网页集合进行排序得到第一排序结果,具体可参见图7的步骤12a,然后排序模块再对第一排序结果和第一主题分布重新进行排序得到第二排序结果,可选地,可以理解为是基于第一排序结果(包括已打分的网页),对新增的主题卡片(表征第一主题分布)进行打分,以计算出该主题卡片插入第一排序结果中的位置。
请参见图9,图9是本申请实施例提供的又一种搜索方法的流程示意图。该方法可以包括但不限于如下流程:
15.电子设备的应用程序向网络设备的召回模块发送基于第一主题标签的查询请求。
在一些实施例中,电子设备可以接收用户通过应用程序输入的用于选择第一主题标签的用户操作,此时可以理解为是接收到基于第一主题标签的搜索请求。
在一些实施例中,步骤15之前电子设备执行图7所示流程。电子设备可以接收基于第一排序结果中至少一个网页的主题标签中的第一主题标签的搜索请求,例如电子设备显示图4的(B)所示的用户界面330时,电子设备可以接收作用于指示网页331的主题“游戏1”的主题331E的触摸操作,此时第一主题标签为“游戏1”,或者,电子设备可以接收作用于指示网页332的主题“历史人物”的主题332E的触摸操作,此时第一主题标签为“历史人物”,或者电子设备可以接收作用于指示网页333的主题“明星”的主题333E的触摸操作,此时第一主题标签为“明星”。
在另一些实施例中,步骤15之前电子设备执行图8所示流程。电子设备可以接收基于第二排序结果包括的主题卡片中的第一主题标签的搜索请求,例如电子设备显示图5的(B)所示的用户界面340时,电子设备可以接收作用于主题卡片343中的主题343A的触摸操作,此时第一主题标签为主题343A指示的主题“历史人物”,或者,电子设备可以接收作用于主题卡片343中的主题343B的触摸操作,此时第一主题标签为主题343B指示的主题“明星”,或者,电子设备可以接收作用于主题卡片343中的主题343C的触摸操作,此时第一主题标签为主题343C指示的主题“游戏1”。
在一些实施例中,应用程序可以基于接收到的用户输入的搜索请求,向查询模块发送查询请求,该查询请求用于请求获取第一主题标签相关的搜索结果,第一主题标签可以是应用程序基于搜索请求获取到的。
16.网络设备的召回模块基于查询语句的分析结果和第一主题标签从优质库中召回第三网页集合。
在一些实施例中,召回模块基于网页和对查询语句分析得到的关键词“人物A”的相关度,网页和第一主题标签的相关度,可选地以及网页和用户的信息(例如兴趣特点和网页行为日志)的相关度,从优质库中召回相关度排列较前的多个网页。结合用户的信息召回网页的示例可参见图7的步骤5中基于用户的信息召回第一网页集合的说明。可选地,召回模块基于网页和第一主题标签的相关度从优质库中召回第三网页集合,可以包括:召回模块从优质库中召回网页的主题标签为第一主题标签的多个网页,也就是说,第三网页集合包括的网页的主题标签为第一主题标签。
17.网络设备的召回模块基于查询语句的分析结果和第一主题标签从第二网页集合中获取第四网页集合。
在一些实施例中,第二网页集合是从网页库中召回的,在一些实施例中,召回模块可以基于网页和对查询语句分析得到的关键词“人物A”结果的相关度,网页和第一主题标签的相关度,可选地以及网页和用户的信息(例如兴趣特点和网页行为日志)的相关度,从第二网页集合中确定出第四网页集合。结合用户的信息召回网页的示例可参见图7的步骤5中基于用户的信息召回第一网页集合的说明。可选地,召回模块基于网页和第一主题标签的相关度从第二网页集合中获取第四网页集合,包括:召回模块从第二网页集合中确定出网页的主题标签为第一主题标签的多个网页,也就是说,第四网页集合包括的网页的主题标签为第一主题标签。
不限于上述示例的情况,在另一些示例中,召回模块可以基于查询语句的分析结果“人物A”和第一主题标签从网页库中召回第四网页集合。
其中,步骤16和步骤17的顺序不作限定。
18.网络设备的召回模块融合第三网页集合和第四网页集合以得到第五网页集合。
在一些实施例中,召回模块可以融合从优质库召回的第三网页集合和从网页库召回的第四网页集合,以得到第五网页集合。也就是说,最终得到的第五网页集合融合了从范围较广的网页库召回的第四网页集合,以及经过多模态优质网页筛选得到的优质库召回的第三网页集合,实现了搜索系统和推荐系统的融合,这样既可以为用户推荐质量更高的网页,也能保证网页的多样性和相关性。
19.网络设备的召回模块向网络设备的排序模块发送第五网页集合。
20.网络设备的排序模块对第五网页集合进行排序得到第三排序结果。
具体示例和图7的步骤12a类似,不再赘述。
21.网络设备的排序模块向电子设备的应用程序发送第三排序结果。
22.电子设备的应用程序显示第三排序结果。
在一些实施例中,应用程序显示的第三排序结果和步骤1中用户通过应用程序输入的搜索请求相关,可选地具体包括:应用程序显示的第三排序结果和查询语句的分析结果相关,查询语句是根据该搜索请求获取到的(具体示例可参见图7的步骤2)。并且,应用程序显示的第三排序结果和用户选择的第一主题标签相关,可选地具体包括:第三排序结果包括的网页对应的主题标签为第一主题标签。
例如,假设查询语句的分析结果为关键词“人物A”,第一主题标签为“历史人物”,第一主题标签的相关词包括“历史”和“朝代H”,上图6的(A)所示的用户界面410用于显示第三排序结果:按照排序的先后顺序依次为网页411、网页412、网页413和网页414,这些网页的标题和/或简介包括以下至少一项:关键词“人物A”、第一主题标签“历史人物”和第一主题标签的相关词(“历史”、“朝代H”),可以理解为是第三排序结果和关键词、第一主题标签相关。
又例如,假设查询语句的分析结果为关键词“人物A”,第一主题标签为“游戏1”,第一主题标签的相关词包括“技能”、“角色”、“装备”,上图6的(B)所示的用户界面420用于显示第三排序结果:按照排序的先后顺序依次为网页421、网页422、网页423和网页424,这些网页的标题和/或简介包括以下至少一项:关键词“人物A”、第一主题标签“游戏1”和第一主题标签的相关词(“技能”、“角色”、“装备”),可以理解为是第三排序结果和关键词、第一主题标签相关。
在一些实施例中,应用程序显示第三排序结果时,可以命中显示以下至少一项:查询语句的分析结果、用户选择的第一主题标签和第一主题标签的相关词,其中,命中显示可以理解为是显示方式和其他显示方式不同。例如,上图6的(A)所示的用户界面410中,查询语句的分析结果“人物A”、用户选择的第一主题标签“历史人物”和第一主题标签的相关词“历史”和“朝代H”,均局部灰色显示,即命中显示,其他字符并未局部灰色显示。
在一些实施例中,上图7-图8中的召回是从网页库中召回的,在另一些实施例中,上图7-图8中的召回是从优质库中召回的。
不限于上图9示例的情况,在另一些实施例中,召回模块可以在召回了第三网页集合后,直接向排序模块发送第三网页集合,排序模块对第三网页集合进行排序后将排序结果返回给应用程序显示。在另一些实施例中,召回模块可以在召回了第四网页集合后,直接向排序结果发送第四网页集合,排序模块对第四网页集合进行排序后将排序结果返回给应用程序显示。
以上实施例的示例中,网页集合和对该网页集合进行排序得到的排序结果包括的搜索结果相同,只是排序结果是对这些搜索结果进行了排序后得到的,例如第二网页集合和第一排序结果的示例均为上图4的(B)所示的用户界面330包括的三个网页,在另一些示例中,排序结果可以为网页集合的子集,即排序后的搜索结果少于排序前的搜索结果。
在上述方法中,电子设备可以展示搜索结果和搜索结果相关的主题标签,以供用户交互,例如图7所示方法中,可以展示基于查询语句得到的至少一个搜索结果分别对应的主题,可以理解为是主题被注入到不同的网页中。又例如图8所示的方法中,可以将包括至少一个主题标签的主题卡片和至少一个搜索结果一起排序并展示,可以理解为是将主题聚合后注入到搜索结果列表中。
基于这样的意图澄清交互方式,当用户选择某一个主题标签后,可以结合查询语句和用户选择的主题标签进行更为精准地召回和排序,例如图9所示方法中,可以展示主题标签为用户选择的主题标签的至少一个搜索结果,也就是为用户提供满足用户实际意图的搜索结果,方便用户快速获取所需的信息,减小设备的处理压力。并且相比基于用户输入的查询语句召回的网页集合(仅包括查询语句相关的网页),结合用户澄清的主题标签(可以表征用户查询的实际意图)召回的网页集合,同时融合了查询语句相关和用户选择的主题标签相关的网页,从而扩展了用户的阅读,进一步提升了网页的相关性和多样性。
在一些实施例中,电子设备可以对网页库包括的网页进行处理和筛选,以得到优质库包括的网页,接下来以网页库包括的任意一个网页(称为第一网页)为例说明处理过程,如下图10所示:
首先,电子设备可以提取第一网页中的图片信息和文本信息,图片信息可以输入到卷积神经网络(convolutional neural networks,CNN)中,文本信息可以输入到网页文本编码器(transformer encoder)中。
电子设备可以利用卷积神经网络提取图片的特征并将提取出的特征转换为图片向量(例如emb格式),例如使用多层CNN提取图片的特征,多层CNN按照处理的先后顺序可以依次包括卷积层(convolution laye,Conv)、分批归一化(batch normalization,BN)、线性整流函数(rectified linear unit,ReLU)、Cnonv、BN、ReLU、…、Cnonv、BN、ReLU,可以理解为是按照Cnonv、BN、ReLU为一个大层,构建多个大层。
网页文本编码器可以融合文本信息的传统特征和深度特征,并将提取出的特征转换为文本向量(例如emb格式)。传统特征例如但不限于包括:站点值(site value)、网页值(page value)、站点排序分类(site rank category)和网页分类(page category)。深度特征例如但不限于包括:词向量(word to vector,word2vec)、神经网络(neural network)、编码器(encoders)、双向编码器(bidirectional encoder representations fromtransformers,BERT)。示例性地,电子设备可以对传统特征和深度特征进行加权,然后经过激活函数,以得到文本向量。
电子设备可以将卷积神经网络输出的图片向量和网页文本编码器输出的文本向量输入到图片融合模块(Image Fuse Backbone)和文本融合模块(Text Fuse Backbone)中,图片融合模块和文本融合模块可以对图片向量和文本向量进行交互操作,图片融合模块输出的向量和文本融合模块输入的向量可以进行拼接,拼接得到的向量(例如emb格式)可以输入给网页质量解码器(page quality decoder)(例如通过全连接神经网络实现)。
在一些实施例中,电子设备可以将网页库划分为N个等级的数据库,N为正整数,例如为5。可选地,级别越高的数据库包括的网页质量越高。在一些实施例中,上述拼接得到的向量输入给网页质量解码器时,得到的输出可以为第一网页分别属于这N个等级的数据库的概率,电子设备可以基于这些概率判断第一网页所属的数据库,例如网页库还包括这N个等级的数据库以外的数据,若第一网页分别属于N个等级的数据库的概率均小于预设概率值,则确定第一网页不属于这A个等级的数据库。又例如,第一网页属于N个等级的数据库中M等级的数据库的概率大于或等于预设概率值,并且大于属于N个等级的数据库中除M等级以外的其他等级的数据库的概率,则可以确定第一网页属于M等级的数据库,M为正整数,M小于或等于N。
电子设备可以对网页库中的每个网页执行上述处理过程,从而确定出N个等级的数据库分别包括的网页。
在一些实施例中,电子设备可以直接将这N个等级的数据库确定为是优质库。在另一些实施例中,电子设备可以从N个等级的数据库中选择出排在前X位的X个等级的数据库,将这X个等级的数据库确定为是优质库,X为正整数,X小于或等于N。
示例性地,电子设备可以包括推荐优质库模块,推荐优质库模块可以用于实现上述处理过程,如通过优质库筛选模型对网页库包括的网页进行处理和筛选,以得到优质库。
上图10所示实施例中,可以理解为是通过划分的数据库的等级来体现网页的质量,即优质库的等级越高,该优质库包括的网页的质量越高。不限于上述示例的情况,在另一些实施例中,电子设备也可以基于网页内容的重要程度、网页的权威性等参数来确定网页的质量,并将质量较高的网页构成的集合确定为是优质库。
在一些实施例中,电子设备可以自行确定优质库,在另一些实施例中,电子设备可以向网络设备获取优质库,优质库是网络设备获取的,获取方式的示例和上述示例类似,不再赘述。
请参见图11,图11是本申请实施例提供的又一种搜索方法的流程示意图。该方法包括但不限于如下流程:
S101:电子设备接收第一搜索请求。
在一些实施例中,电子设备接收用户输入的第一搜索请求,第一搜索请求用于请求搜索用户输入的查询语句。
在一些实施例中,电子设备可以接收用户输入的查询语句和用户操作,此时可以理解为是接收到第一搜索请求,例如,上图3-图5所示实施例中,电子设备可以接收用户基于搜索框311A输入的查询语句“人物A”,然后可以接收作用于搜索控件311B的触摸操作(例如点击操作),此时可以理解为是接收到用于请求查询“人物A”的第一搜索请求。
在一些实施例中,用户基于电子设备输入的查询语句的形式可以但不限于包括文字、图片、语音、视频、运动姿态等。用户基于电子设备输入查询语句的方式例如但不限于包括:用户通过触摸电子设备的显示屏输入文字、图片或者视频形式的查询语句,用户通过电子设备连接的键盘输入文字形式的查询语句,用户通过电子设备连接或内置的麦克风输入语音形式的查询语句,用户通过电子设备连接或者内置的摄像头输入图片、视频或者运动姿态形式的查询语句。
在一些实施例中,电子设备接收的用户操作可以用于触发电子设备获取查询语句相关的搜索结果,例如电子设备可以响应于该用户操作,使用爬虫技术去互联网上爬取和查询语句相关的大量的网页结果。该用户操作的形式可以但不限于包括作用于显示屏的触摸操作(例如点击操作)、语音、运动姿态(如手势)、脑电波等。
S102:电子设备显示第一界面,第一界面包括第一搜索集合,第一搜索集合包括至少一个网页卡片和至少一个主题标签。
在一些实施例中,电子设备接收到第一搜索请求时,可以向网络设备发送第一查询请求,第一查询请求用于请求获取第一搜索请求对应的搜索结果,具体示例可参见图7的步骤1。在一些实施例中,电子设备可以接收网络设备基于第一查询请求发送的第一搜索集合,并显示第一界面,具体示例可参见图7的步骤13a和14a,或者图8的步骤13b和步骤14b。
其中,主题标签用于指示网页卡片对应的网页内容所属的分类,例如为游戏、影视、历史、明星、农业、科技、军事等。
在一些实施例中,网络设备接收到第一查询请求后,可以先对用户输入的查询语句进行分析理解,例如将查询语句分解为至少一个关键词(可称为分词),纠正查询语句的语法、语序等错误(可称为纠错),对查询语句进行扩展以得到同义词(可称为扩展),识别查询语句中的实体词等。例如通过自然语言处理技术实现。可选地,分析理解的结果可以包括至少一个关键词,例如查询语句包括的关键词或相近的关键词。可选地,分析理解的结果可以包括向量。具体示例可参见图7的步骤2。以下实施例将分析理解的结果称为第一关键词,第一关键词可以用于进行搜索以得到上述至少一个网页卡片。
在一些实施例中,网络设备可以基于查询语句进行主题识别,以得到查询语句的主题分布(即以上实施例中的第一主题分布),可选地,第一主题分布可以用于进行搜索以得到上述至少一个网页卡片,可选地,第一主题分布可以用于确定主题卡片。在一种示例中,网络设备可以对查询语句进行主题识别,以得到第二主题分布,可简称为对查询语句进行意图(如隐式意图)分析,具体说明可参见图7的步骤3。网络设备可以基于查询语句召回第三搜索集合,并对第三搜索集合进行主题识别,以得到第三主题分布,具体说明可参见图7的步骤4-7。网络设备可以融合第二主题分布和第三主题分布并得到第一主题分布,具体说明可参见图7的步骤8。
在一些实施例中,网络设备可以基于查询语句的分析结果(即第一关键词,例如“人物A”)和第一主题分布获取上述至少一个网页卡片,上述至少一个网页卡片和第一关键词和第一主题分布相关,具体说明可参见图7的步骤9-10。示例性地,召回网页集合时,可以基于第一关键词和相关的信息(例如第一主题分布、用户兴趣特点和行为日志等信息)生成查询命令,例如领域专用语言(domain specific language,DSL)等形式的查询命令,基于查询命令从网页库中召回网页集合。
在一些实施例中,网络设备可以对上述召回的网页集合进行排序,并将排序结果发送给电子设备,上述排序结果包括排序后的上述至少一个网页卡片,网络设备还可以将上述至少一个网页卡片分别对应的主题标签发送给电子设备,具体示例可参见图7的步骤12a和步骤13a,上述排序结果为第一排序结果。在一些实施例中,电子设备显示的第一搜索集合可以包括排序后的至少一个网页卡片和这至少一个网页卡片分别对应的主题标签,可选地,电子设备显示的至少一个网页卡片中任意一个网页卡片包括对应的主题标签,具体示例可参见图7的步骤14a。
例如,电子设备可以显示图4的(B)所示的用户界面330(可以理解为是第一界面),用户界面330包括排序后的网页,按照排列顺序依次为网页331、网页333和网页332(可以理解为是排序后的至少一个网页卡片),这三个网页均有明确的主题,网页331包括主题331E,指示主题为“游戏1”,网页332包括主题332E,指示主题为“历史人物”,网页333包括主题333E,指示主题为“明星”,可以理解为是任意一个网页卡片包括对应的主题标签。
在另一些实施例中,网络设备可以对上述召回的网页集合和主题卡片一起进行排序,并向排序结果发送给电子设备,上述排序结果包括排序后的上述至少一个网页卡片和主题卡片,例如,可以将主题卡片看做一个整体来进行打分,按照主题卡片的分数和至少一个网页分别对应的分数的高低来进行排序(如分数越高排列越靠前),具体示例可参见图8的步骤12b和步骤13b,上述排序结果为第二排序结果。在一些实施例中,电子设备显示的第一搜索集合可以包括排序后的至少一个网页卡片和主题卡片,主题卡片包括至少一个主题标签,具体示例可参见图8的步骤14b。
例如,电子设备可以显示图5的(B)所示的用户界面340(可以理解为是第一界面),用户界面340包括排序后的网页和主题卡片,按照排列顺序依次为网页341、网页342、主题卡片343和网页344(可以理解为是排序后的至少一个网页卡片和主题卡片),假设查询语句的主题分布包括三个明确的主题:“历史人物”、“明星”和“游戏1”,则指示查询语句的主题分布的主题卡片343可以包括三个主题标签:主题343A(包括字符“历史人物”),主题343B(包括字符“明星”),主题343C(包括字符“游戏1”),可以理解为是主题卡片包括至少一个主题标签。
在一些实施例中,网络设备可以根据第一主题分布确定主题卡片,主题卡片包括的至少一个主题标签为第一主题分布包括的主题标签。例如第一主题分布包括:主题标签“历史人物的”,主题标签“明星”,以及主题标签“游戏1”,则主题卡片为图5的(B)所示的用户界面340中的主题卡片343,包括三个主题标签:主题343A(包括字符“历史人物”),主题343B(包括字符“明星”),主题343C(包括字符“游戏1”)。
在一些实施例中,网络设备可以根据第一主题分布包括的主题标签对应的概率,对主题卡片包括的至少一个主题标签进行排序,例如第一主题分布包括的主题标签对应的概率越大,该主题标签的排列顺序越靠前。在一些实施例中,网络设备向电子设备发送的主题卡片可以是经过排序的,电子设备可以按照排序结果显示主题卡片中的至少一个主题标签,可选地,排列顺序越靠前,显示位置越靠前。例如,第一主题分布包括的主题标签对应的概率按照从大到小依次为:主题标签“历史人物的”对应的概率0.4,主题标签“明星”对应的概率0.2,主题标签“游戏1”对应的概率0.15,其他主题标签对应的概率0.25,则主题卡片为图5的(B)所示的用户界面340中的主题卡片343,主题卡片343包括的主题标签按照从前往后的顺序依次为:主题343A(包括字符“历史人物”),主题343B(包括字符“明星”),主题343C(包括字符“游戏1”)。
S103:响应于作用于第一主题标签的第一用户操作,电子设备显示第二界面,第二界面包括第二搜索集合,第二搜索集合包括的网页卡片对应的主题标签为第一主题标签。
S103为可选的步骤。
在一些实施例中,电子设备可以接收作用于第一主题标签的第一用户操作,第一主题标签为第一搜索集合包括的至少一个主题标签中任意一个主题标签,第一用户操作的形式不做限定,具体示例可参见S101中的用户操作。
在一些实施例中,电子设备可以响应于第一用户操作,向网络设备发送第二查询请求,第二查询请求用于请求获取第一主题标签相关的搜索结果,具体示例可参见图9的步骤15。在一些实施例中,电子设备可以接收网络设备基于第二查询请求发送的第二搜索集合,并显示第二界面,具体示例可参见图9的步骤21-22。
在一些实施例中,网络设备接收到第二查询请求后,可以基于查询语句的分析结果(即第一关键词,例如“人物A”)和第一主题标签召回网页集合,可选地,网络设备可以基于第一关键词和第一主题标签从网页库或者第一搜索集合中召回第四搜索集合,以及从优质库中召回第五搜索集合,并融合第四搜索集合和第五搜索集合,上述召回的网页集合为融合第四搜索集合和第五搜索集合得到的,具体示例可参见图9的步骤16-18。然后,网络设备可以对上述召回的网页集合进行排序,并将排序结果发送给电子设备,具体示例可参见图9的步骤19-21,上述排序结果为第三排序结果。在一些实施例中,电子设备显示的第二搜索集合可以包括上述排序结果,具体示例可参见图9的步骤22。
在一些实施例中,电子设备显示的上述至少一个网页卡片中的第一网页卡片包括第一主题标签,可以理解为是用户选择的第一主题标签为电子设备显示的第一网页卡片对应的主题标签。
例如,第一用户操作为作用于图4的(B)所示的用户界面330中网页332的主题332E的触摸操作,网页332可以理解为是第一网页卡片,第一主题标签为网页332的主题332E指示的“历史人物”。响应于第一用户操作,电子设备可以显示图6的(A)所示的用户界面410(可以理解为是第二界面),用户界面410包括和第一关键词“人物A”相关以及和第一主题标签“历史人物”相关的搜索结果(即第二搜索集合)。
又例如,第一用户操作为作用于图4的(B)所示的用户界面330中网页331的主题331E的触摸操作,网页331可以理解为是第一网页卡片,第一主题标签为网页331的主题331E指示的“游戏1”。响应于第一用户操作,电子设备可以显示图6的(B)所示的用户界面420(可以理解为是第二界面),用户界面420包括和第一关键词“人物A”相关以及和第一主题标签“游戏1”相关的搜索结果(即第二搜索集合)。
在另一些实施例中,电子设备的显示的主题卡片包括第一主题标签。
例如,第一用户操作为作用于图5的(B)所示的用户界面340中主题卡片343的主题343A的触摸操作,第一主题标签为主题343A指示的“历史人物”。响应于第一用户操作,电子设备可以显示图6的(A)所示的用户界面410(可以理解为是第二界面),用户界面410包括和第一关键词“人物A”相关以及和第一主题标签“历史人物”相关的搜索结果(即第二搜索集合)。
又例如,第一用户操作为作用于图5的(B)所示的用户界面340中主题卡片343的主题343C的触摸操作,第一主题标签为主题343C指示的“游戏1”。响应于第一用户操作,电子设备可以显示图6的(B)所示的用户界面420(可以理解为是第二界面),用户界面420包括和第一关键词“人物A”相关以及和第一主题标签“游戏1”相关的搜索结果(即第二搜索集合)。
在一些实施例中,电子设备可以在第一界面中按照第一显示方式显示第二网页卡片中的第一关键词,按照第二显示方式显示第二网页卡片中排除第一关键词以外的信息,第二网页卡片为上述至少一个网页卡片中任意一个网页卡片,可以理解为是命中显示第二网页卡片中的第一关键词。例如,第一关键词为“人物A”,图4的(B)所示的用户界面330(可以理解为是第一界面)中,网页331(可以理解为是第一网页卡片)的标题331A和简介331B中的“人物A”局部灰色显示(可以理解为是第一显示方式),其他字符并未局部灰色显示。
在一些实施例中,电子设备可以在第二界面中按照第三显示方式显示第三网页卡片中的第一关键词和第二关键词,按照第四显示方式显示第三网页卡片中排除第一关键词和第二关键词以外的信息,第二关键词为第一主题标签和/或第一主题标签的相关词,第三网页卡片为第二搜索集合中任意一个网页卡片,可以理解为是命中显示第三网页卡片中的第一关键词和第二关键词。例如,第一关键词为“人物A”,第二关键词为用户选择的第一主题标签“历史人物”和第一主题标签的相关词“历史”和“朝代H”,图6的(A)所示的用户界面410(可以理解为是第二界面)中,网页411(可以理解为是第二网页卡片)的标题411A中“历史人物A”、简介411B中“人物A”和“朝代H”局部灰色显示(可以理解为是第三显示方式),其他字符并未局部灰色显示。
在图11所示的方法中,电子设备可以结合查询语句的主题分布(即上述第一主题分布)来实现搜索功能,进行用户多意图的识别,并显示搜索结果和搜索结果对应的主题标签,可以理解为是将查询语句和/或网页的主题标签注入到前端中,还可以理解为是提供了意图澄清交互方式。电子设备可以基于用户澄清的意图(即用户选择的第一主题标签)进行更为精准的搜索和排序,为用户推荐主题标签为第一主题标签的至少一个网页,更符合用户实际意图,并且,搜索结果不再受限于查询语句,可以和第一主题标签相关,因此也扩展了用户的阅读。
以上模块或单元执行的步骤可以分成多个模块或单元来实现。以上模块或单元的一个或多个可以软件、硬件或二者结合来实现。例如,召回模块可以包括搜索模块(Searcher)、推荐模块(Recommend)和融合搜索模块(Fusion Search),其中搜索模块用于基于网页库召回网页,推荐模块用于基于优质库召回网页,融合搜索模块用于融合搜索模块和推荐模块召回的网页。查询模块可以包括查询(Query)理解模块和主题预测模块,查询理解模块用于对查询语句进行分析理解,主题预测模块用于进行主题识别和融合主题分布等。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,该流程可以由计算机程序来计算机程序相关的硬件完成,该计算机程序可存储于计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法实施例的流程。而前述的存储介质包括:只读存储器(read-only memory,ROM)或随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可存储计算机程序代码的介质。
Claims (13)
1.一种搜索方法,其特征在于,应用于电子设备,所述方法包括:
接收用户输入的第一搜索请求;
显示第一界面,所述第一界面包括第一搜索集合,所述第一搜索集合包括至少一个网页卡片以及所述至少一个网页卡片分别对应的主题标签,其中,所述主题标签用于指示所述网页卡片对应的网页内容所属的分类,所述至少一个网页卡片和所述第一搜索请求相关。
2.如权利要求1所述的方法,其特征在于,所述第一搜索集合包括主题卡片,所述主题卡片包括至少一个所述主题标签,所述主题卡片和所述第一搜索请求相关。
3.如权利要求1或2所述的方法,其特征在于,所述主题标签包括第一主题标签;所述显示第一界面之后,所述方法还包括:
接收作用于所述第一主题标签的第一用户操作;
响应于所述第一用户操作,显示第二界面,所述第二界面包括第二搜索集合,所述第二搜索集合包括的所述网页卡片对应的所述主题标签为所述第一主题标签。
4.如权利要求3所述的方法,其特征在于,所述至少一个网页卡片包括第一网页卡片,所述第一网页卡片包括所述第一网页卡片对应的所述第一主题标签;或者,所述主题卡片包括所述第一主题标签。
5.如权利要求1-4任一项所述的方法,其特征在于,所述至少一个网页卡片包括第二网页卡片,所述第二网页卡片包括第一关键词,所述第一关键词是根据所述第一搜索请求获取的;
所述显示第一界面,包括:
在所述第一界面中按照第一显示方式显示所述第一关键词,按照第二显示方式显示所述第二网页卡片中排除所述第一关键词以外的信息,所述第一显示方式和所述第二显示方式不同。
6.如权利要求4或5所述的方法,其特征在于,所述第二搜索集合包括第三网页卡片,所述第三网页卡片包括第一关键词和第二关键词,所述第一关键词是根据所述第一搜索请求获取的,所述第二关键词是根据所述第一主题标签获取的;
所述显示第二界面,包括:
在所述第二界面中按照第三显示方式显示所述第一关键词和所述第二关键词,按照第四显示方式显示所述第三网页卡片中排除所述第一关键词和所述第二关键词以外的信息,所述第三显示方式和所述第四显示方式不同。
7.如权利要求2所述的方法,其特征在于,所述主题卡片位于所述至少一个网页卡片中排列在第一个的所述网页卡片之前,或者,所述主题卡片位于所述至少一个网页卡片中的两个所述网页卡片之间。
8.如权利要求2或7所述的方法,其特征在于,所述显示第一界面,包括:
在第一位置显示第二主题标签,在第二位置显示第三主题标签,所述第二主题标签和所述第三主题标签为所述主题卡片包括的任意两个所述主题标签,所述主题卡片和第一主题分布相关,所述第一主题分布是根据第一关键词获取的,所述第一关键词是根据所述第一搜索请求获取的,所述第一主题分布包括的所述第二主题标签对应的概率大于所述第一主题分布包括的所述第三主题标签对应的概率,所述第一位置在所述第二位置之前。
9.如权利要求1-8任一项所述的方法,其特征在于,所述第一搜索集合包括的所述网页卡片与第一关键词和第一主题分布相关,所述第一关键词是根据所述第一搜索请求获取的,所述第一主题分布是根据所述第一关键词获取的。
10.如权利要求1-9任一项所述的方法,其特征在于,所述显示第一界面之前,所述方法还包括:
向网络设备发送第一查询请求,所述第一查询请求用于请求获取所述第一搜索请求相关的搜索结果;
获取所述网络设备发送的所述第一搜索集合。
11.如权利要求3或4所述的方法,其特征在于,所述显示第二界面之前,所述方法还包括:
响应于所述第一用户操作,向网络设备发送第二查询请求,所述第二查询请求用于请求获取所述第一主题标签及所述第一搜索请求相关的搜索结果;
获取所述网络设备发送的所述第二搜索集合。
12.一种电子设备,其特征在于,包括收发器、处理器和存储器,所述存储器用于存储计算机程序,所述处理器调用所述计算机程序,用于执行如权利要求1-11任一项所述的方法。
13.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现权利要求1-11任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111669800.9A CN116415081A (zh) | 2021-12-30 | 2021-12-30 | 搜索方法及电子设备 |
PCT/CN2022/141403 WO2023125284A1 (zh) | 2021-12-30 | 2022-12-23 | 搜索方法及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111669800.9A CN116415081A (zh) | 2021-12-30 | 2021-12-30 | 搜索方法及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116415081A true CN116415081A (zh) | 2023-07-11 |
Family
ID=86997833
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111669800.9A Pending CN116415081A (zh) | 2021-12-30 | 2021-12-30 | 搜索方法及电子设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN116415081A (zh) |
WO (1) | WO2023125284A1 (zh) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100121842A1 (en) * | 2008-11-13 | 2010-05-13 | Dennis Klinkott | Method, apparatus and computer program product for presenting categorized search results |
WO2013060015A1 (en) * | 2011-10-28 | 2013-05-02 | Google Inc. | Advertisement determination system and method for clustered search results |
CN102567530B (zh) * | 2011-12-31 | 2014-06-11 | 凤凰在线(北京)信息技术有限公司 | 一种文章类型网页智能抽取系统及其方法 |
CN105138703B (zh) * | 2015-09-30 | 2019-08-16 | 北京奇虎科技有限公司 | 一种基于搜索引擎的网络搜索方法及电子设备 |
CN111382339B (zh) * | 2020-03-10 | 2024-04-02 | 北京搜狗科技发展有限公司 | 一种搜索处理方法、装置和用于搜索处理的装置 |
-
2021
- 2021-12-30 CN CN202111669800.9A patent/CN116415081A/zh active Pending
-
2022
- 2022-12-23 WO PCT/CN2022/141403 patent/WO2023125284A1/zh unknown
Also Published As
Publication number | Publication date |
---|---|
WO2023125284A1 (zh) | 2023-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112269853B (zh) | 检索处理方法、装置及存储介质 | |
CN112163428A (zh) | 语义标签的获取方法、装置、节点设备及存储介质 | |
US20160004779A1 (en) | Electronic device and method for providing content on electronic device | |
CN112287234B (zh) | 信息检索方法、装置及存储介质 | |
WO2022111726A1 (zh) | 一种信息排序方法及电子设备 | |
CN113254684B (zh) | 一种内容时效的确定方法、相关装置、设备以及存储介质 | |
CN111881315A (zh) | 图像信息输入方法、电子设备及计算机可读存储介质 | |
CN113596601A (zh) | 一种视频画面的定位方法、相关装置、设备及存储介质 | |
CN110196833A (zh) | 应用程序的搜索方法、装置、终端及存储介质 | |
CN110929137B (zh) | 文章推荐方法、装置、设备及存储介质 | |
CN114281936A (zh) | 分类方法、装置、计算机设备及存储介质 | |
CN113806469B (zh) | 语句意图识别方法及终端设备 | |
CN116758362A (zh) | 图像处理方法、装置、计算机设备及存储介质 | |
WO2023125284A1 (zh) | 搜索方法及电子设备 | |
US20150052155A1 (en) | Method and system for ranking multimedia content elements | |
CN112307198B (zh) | 一种单文本的摘要确定方法和相关装置 | |
CN111222011B (zh) | 一种视频向量确定方法和装置 | |
CN111859240A (zh) | 一种图片导出的方法、相关装置及存储介质 | |
KR20110017171A (ko) | 검색쿼리를 이용한 영상검색 서비스 제공 시스템, 서버, 휴대단말 및 방법 | |
CN112685578B (zh) | 一种多媒体信息内容提供方法及装置 | |
WO2022228073A1 (zh) | 一种图像的搜索方法、终端和服务器 | |
CN109348043A (zh) | 信息的收藏方法、装置、存储介质及电子设备 | |
WO2023130813A1 (zh) | 信息获取方法、图形码生成方法、装置、终端及介质 | |
CN114817521B (zh) | 搜索方法和电子设备 | |
CN112765447B (zh) | 数据搜索方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |