CN112948539A - 信息搜索方法、装置、电子设备及计算机可读介质 - Google Patents

信息搜索方法、装置、电子设备及计算机可读介质 Download PDF

Info

Publication number
CN112948539A
CN112948539A CN202110126811.6A CN202110126811A CN112948539A CN 112948539 A CN112948539 A CN 112948539A CN 202110126811 A CN202110126811 A CN 202110126811A CN 112948539 A CN112948539 A CN 112948539A
Authority
CN
China
Prior art keywords
category
search
target
content corresponding
association
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110126811.6A
Other languages
English (en)
Other versions
CN112948539B (zh
Inventor
关凯文
王永娴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN202110126811.6A priority Critical patent/CN112948539B/zh
Publication of CN112948539A publication Critical patent/CN112948539A/zh
Application granted granted Critical
Publication of CN112948539B publication Critical patent/CN112948539B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种信息搜索方法、装置、电子设备及计算机可读介质,涉及计算机技术领域。该方法包括:接收搜索语句,搜索语句与目标实体相关;获取搜索语句对应的一条搜索展示结果;其中,搜索展示结果包括搜索语句所属的目标实体下的目标类别对应的聚合内容、以及关联类别对应的聚合内容,关联类别是基于目标类别确定的;展示搜索展示结果。本公开终端设备可以基于一个搜索语句搜索得到目标类别对应的聚合内容以及关联类别对应的聚合内容,加快了搜索效率。

Description

信息搜索方法、装置、电子设备及计算机可读介质
技术领域
本公开涉及计算机技术领域,具体而言,本公开涉及一种信息搜索方法、装置、电子设备及计算机可读介质。
背景技术
任一实体的搜索词(query)意图丰富多样,如果能基于用户输入的搜索词返回更加符合用户意图的信息,会大大提升用户的医疗搜索体验。
目前,基于用户输入的一个实体某一方面搜索词,服务器可以向终端设备返回与该搜索词某一方面对应的内容,如果用户需要了解相关其他方面的内容,需要重新输入其他搜索词进行搜索,导致搜索路径长,搜索效率较低。
发明内容
提供该发明内容部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
本公开的第一方面提供了一种信息搜索方法,包括:
接收搜索语句,搜索语句与目标实体相关;
获取搜索语句对应的一条搜索展示结果;其中,搜索展示结果包括搜索语句所属的目标实体下的目标类别对应的聚合内容、以及关联类别对应的聚合内容,关联类别是基于目标类别确定的;
展示搜索展示结果。
本公开的第二方面提供了一种信息搜索方法,包括:
接收与目标实体相关的搜索语句,识别搜索语句所属的目标实体下的目标类别;
基于预置的类别关联关系,确定目标类别的关联类别;
基于目标类别对应的聚合内容和关联类别对应的聚合内容生成一条搜索展示结果;
向终端设备发送搜索展示结果。
本公开的第三方面提供了一种信息搜索装置,包括:
第一接收模块,用于接收搜索语句,搜索语句与目标实体相关;
第一获取模块,用于获取搜索语句对应的一条搜索展示结果;其中,搜索展示结果包括搜索语句所属的目标实体下的目标类别对应的聚合内容以及关联类别对应的聚合内容,关联类别是基于目标类别确定的;
第一展示模块,用于展示搜索展示结果。
本公开的第四方面提供了信息搜索装置,包括:
第二接收模块,用于接收与目标实体相关的搜索语句,识别搜索语句所属的目标实体下的目标类别;
第一确定模块,用于基于预置的类别关联关系,确定目标类别的关联类别;
第一生成模块,用于基于目标类别对应的聚合内容和关联类别对应的聚合内容生成一条搜索展示结果;
发送模块,用于向终端设备发送搜索展示结果。
本公开第五方面,提供了一种电子设备,该电子设备包括:
电子设备包括存储器和处理器;
存储器中存储有计算机程序;
处理器,用于在运行计算机程序时执行第一方面及其可选实施例或第二方面及其可选实施例的方法。
本公开第六方面,提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时第一方面及其可选实施例或第二方面及其可选实施例的方法。
本公开提供的技术方案带来的有益效果是:
接收到与目标实体相关的搜索语句后,可以获取该搜索语句的一条搜索展示结果,该搜索展示结果中包括搜索语句所属目标实体下的目标类别对应的聚合内容,目标类别对应的聚合内容即为针对搜索语句本身搜索到的内容,同时搜索展示结果中还包括关联类别对应的聚合内容,该关联类别是基于目标类别确定的,则关联类别对应的聚合内容即为用户可能感兴趣的其他方面的内容,这样相对于现有方案,只需要基于一条搜索语句就可以搜索得到目标类别对应的聚合内容以及用户可能感兴趣的其他方面的内容,减少了搜索路径,加快了搜索的效率。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1为本公开信息搜索方法的一个实施例示意图;
图2为本公开信息搜索方法的一个场景示意图;
图3(a)为本公开目标类别对应的聚合内容的一种展示情况;
图3(b)为本公开目标类别对应的聚合内容的另一种展示情况;
图4为本公开信息搜索方法的另一个实施例示意图;
图5为本公开类别关联关系的一种可能的情况;
图6为本公开信息搜索方法的另一个场景示意图;
图7为本公开信息搜索方法的另一个场景示意图;
图8为本公开信息搜索方法的另一个实施例示意图;
图9为本公开信息搜索装置的一种结构示意图;
图10为本公开信息搜索装置的另一种结构示意图;
图11为本公开电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对装置、模块或单元进行区分,并非用于限定这些装置、模块或单元一定为不同的装置、模块或单元,也并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
目前的信息搜索方案主要具有如下缺点:
1、基于一个搜索语句终端可以召回多条搜索结果,由于搜索结果数量过多,用户需要调整或细化搜索语句再次搜索才能找到满足用户意图的搜索结果,或者需要用户查看多条搜索结果才能找到满足用户意图的搜索结果,或搜索结果中没有满足用户意图的搜索结果是也需要重新输入搜索语句进行搜索。可见,现有的方案搜索路径是比较长的,搜索效率低,同时,不能较好的满足用户搜索意图;
2、对于某些实体的搜索语句,服务器可能会同时搜索到该搜索语句对应类别的实体信息以及针对该搜索语句的精准答案,现有的方案一般是用在两个页面上分别展示实体信息和精准答案,这种方式需要对两个页面进行排序,无法保障排序在前页面展示的内容是满足用户意图,同时,两个页面上展示的内容很可能存在重复内容。
请参照图1,本公开提供了一种信息搜索方法,该方法可以由终端设备执行,该终端设备可以是台式终端或移动终端,该方法可以包括:
步骤S101、接收搜索语句,搜索语句与目标实体相关;
终端设备接收用户输入的或其他设备发送的搜索语句,搜索语句可以是短语或句子,该搜索语句是关于目标实体的搜索语句。
目标实体可以是某一领域下的关键词或标识词,若搜索语句中包含该关键词,则认为该搜索语句是针对目标实体的搜索语句。
步骤S102、获取搜索语句对应的一条搜索展示结果;其中,搜索展示结果包括搜索语句所属的目标实体下的目标类别对应的聚合内容以及关联类别对应的聚合内容,关联类别是基于目标类别确定的;
终端设备可以接收服务器发送的该搜索语句对应的一条搜索展示结果。
搜索展示结果包括搜索语句所属的目标实体下目标类别对应的聚合内容。目标类别指的是搜索语句的语义所指向的类别,则基于搜索语句可以直接确定目标类别。
搜索展示结果中还包括该目标实体下关联类别对应的聚合内容,关联类别指的是搜索语句的语义并没有直接指向的、但是与搜索语句的语义所指向的目标类别存在关联关系的类别,关联类别是针对用户想要浏览的类别的预测。可见,由于关联类别与目标类别存在关联关系,这样用户搜索目标类别的内容时,关联类别的内容很大程度上也满足用户意图。
需要说明的是,该目标类别以及关联类别和其他类别是针对该目标实体的内容进行分类得到的,因此目标类别、关联类别或其他类别均为目标实体下的类别。
在本实施例中,服务器获取目标类别对应的聚合内容以及关联类别对应的聚合内容后,可以基于获取的两类聚合内容生成一条搜索展示结果,具体生成搜索展示结果的方式可以是:
将目标类别对应的聚合内容和关联类别对应的聚合内容共同作为该搜索展示结果。在本实施例中,聚合内容指的是非自然内容,是由多个已有的内容聚合得到的,例如针对目标实体下的目标类别可以搜索得到多个已有网页,则服务器可以从该多个已有网页的内容中筛选处理得到多个目标内容,聚合目标内容得到聚合内容。
可见,上述实施例中,服务器可以将目标类别对应的聚合内容和关联类别对应的聚合内容整合为一条信息放在一个页面上展示,因此,最终得到的是一条搜索展示结果。将多个聚合内容整合为一条信息具体是:将多个聚合内容进行排版以及调整展示格式等。
步骤S103、展示搜索展示结果。
终端设备可以通过卡片的形式展示该搜索展示结果,例如在该信息搜索方法用于疾病领域时,可以通过疾病卡片展示该搜索展示结果。
在本实施例中,卡片是终端设备上预设置的展示该搜索展示结果的工具,卡片可以是终端设备中的一个软件功能模块。
可见,在本实施例中,接收到与目标实体相关的搜索语句后,可以获取该搜索语句的一条搜索展示结果,该搜索展示结果中包括搜索语句所属目标实体下的目标类别对应的聚合内容,目标类别对应的聚合内容即为针对搜索语句本身搜索到的内容,同时搜索展示结果中还包括关联类别对应的聚合内容,该关联类别是基于目标类别确定的,则关联类别对应的聚合内容即为用户可能感兴趣的其他方面的内容,这样相对于现有方案,只需要基于一条搜索语句就可以搜索得到目标类别对应的聚合内容以及用户可能感兴趣的其他方面的内容,减少了搜索路径,加快了搜索的效率。
同时,本申请可以推测用户除想要浏览目标类别对应的聚合内容外,进一步想要浏览的内容,能够更好地满足了用户搜索意图。
进一步的,若搜索语句中还包括特定关键词,则上述服务器获取目标类别对应的聚合内容的方式可以是:
目标类别对应的聚合内容指的是与目标类别以及特定关键词对应的聚合内容,服务器可以基于所确定的该目标类别以及特定关键词,确定得到针对目标实体的、与目标类别以及特定关键词对应的聚合内容,例如,搜索语句为“糖尿病的早期症状”,则类别标识词为“症状”,特定关键词为“早期”,则服务器可以基于症状以及早期,确定针对糖尿病的早期症状对应的聚合内容。
可见,本实施例,服务器返回给终端设备的目标类别对应的聚合内容是基于特定关键词确定,这样目标类别的内容更加符合用户意图。
可选的,步骤S103、展示搜索展示结果包括:
展示搜索展示结果包括:
展示目标类别对应的聚合内容、关联类别对应的聚合内容以及其他类别的标识;
其中,其他类别为目标实体下不同于目标类别和关联类别的类别。
在本实施例中,终端设备展示搜索展示结果具体可以是:
终端设备展示目标类别对应的聚合内容中的全部内容,终端设备还展示关联类别对应的聚合内容中全部或部分的内容,终端设备还可以展示其他类别的标识。
需要说明的是,其他类别为该目标实体下不同于目标类别和关联类别的类别。其他类别的标识可以是其他类别的名称或入口链接。
如图2所述,为本申请所展示的搜索展示结果的一种可能的情况:
屏幕界面上问答模块区域展示搜索语句所指向的目标类别对应的聚合内容,关联模块区域展示关联类别对应的聚合内容,若无法确定目标类别的关联类别,则由人工设计目标类别的最相关类别,关联模块区域的兜底内容为最相关类别对应的聚合内容,屏幕界面的其他区域可以展示其他类别的标识,以便于用户查看其他类别对应的聚合内容。
可选的,展示目标类别对应的聚合内容,包括以下至少一项:
展示目标类别对应的至少一个子聚合内容以及各子聚合内容对应的时间信息;
展示目标类别对应的至少一个子聚合内容以及各子聚合内容对应的子类别信息;
展示目标类别对应的多媒体信息。
在本实施例中,展示目标类别对应的聚合内容具体有如下方式:
一种可能的方式A是:目标类别对应的聚合内容中包括目标类别对应的至少一个子聚合内容,终端设备可以展示各子聚合内容,同时展示每一个子聚合内容对应的时间信息以形成时间轴,每一个子聚合内容对应的时间信息可以是每一个子聚合内容适用于的时间段,例如某一子聚合内容的方案适用于用户在某一时间段使用。
另一种可能实现的方式B是:目标类别可以进一步细分为子类别,目标类别中可以包括多个子类别,则目标类别对应的聚合内容中包括多个子类别分别对应的子聚合内容,终端设备可以展示子类别信息以及每一子类别对应的子聚合内容,子类别信息可以是子类别名称等。
另一种可能实现的方式C是:目标类别对应的聚合内容可以为目标类别对应的多媒体信息,多媒体信息可以是视频、文字、图片以及音频中至少一项。可见,本实施例限定了目标类别对应的聚合内容的格式。
进一步的,本申请的方案可以应用于疾病领域,目标实体疾病下的关键词集合(例如疾病名称的集合),这样搜索语句中只要包含关键词集合中的关键词,即认为该搜索语句是针对目标实体的搜索语句,本实施例中搜索语句为疾病的搜索语句,搜索语句可以是疾病的名称,也可以是针对某一疾病发起的提问,例如“xx疾病是由什么原因引起的”、“xx疾病怎么治疗”等。
目标实体的类别可以被划分为问答、概述、病因、症状、治疗以及日常护理等6个类别,则上述目标类别、关联类别或其他类别指的是这6个类别中的某一个,基于此:
针对上述可能实现的方式A,如图3(a)所示,终端设备可以展示由第一时间段(或早期)、第二时间段(或中期)以及第三时间段(或晚期)等相连续的时间段形成的时间轴,还可以把时间段划分的更精细,针对不同的时间段,治疗类别对应的至少一个子聚合内容包括早期治疗方案a、中期治疗方案b以及晚期治疗方案c,日常护理类别对应的至少一个子聚合内容包括早期护理方式a、中期护理方式b以及晚期护理方式c,症状类别对应的至少一个子聚合内容包括早期症状a、中期症状b以及晚期症状c。
针对上述可能实现的方式B,如图3(b)所示,可以展示子类别1至3的名称,且在子类别1对应区域展示子聚合内容1,在子类别2对应区域展示子聚合内容2以及在子类别3对应区域展示子聚合内容3。
具体的,若任一类别(可以是目标类别)可以为概述,则概述包括如下子类别:就诊科室、临床症状、主要危害、并发症、检查、诊断、治疗原则、饮食建议以及治愈性等;
任一类别为病因,则病因包括如下子类别:流行病学、传播途径、主要病因以及易感人群等;
任一类别为症状,则症状包括如下子类别:典型症状、其他症状以及诊断依据等;
任一类别为治疗,则治疗包括如下子类别:治疗方针、药物治疗、手术治疗、其他治疗以及预后情况等;
任一类别为日常护理,则日常护理包括如下子类别:基本日常护理、饮食调理以及预防措施等。
需要说明的是,关联类别对应的聚合内容或其他类别对应的聚合内容的展示形式可以参照上述目标类别对应的聚合内容的展示形式的相关论述,具体此处不做限定。
可见,本公开可以以多种方式展示目标类别对应的聚合内容,聚合内容的展示更加丰富和灵活。
可选的,该方法还可以包括:
响应针对其他类别的标识的触发操作时,展示其他类别对应的聚合内容。
在本实施例中,终端设备检测到用户针对其他类别的标识的触发操作时,终端设备可以向服务器发送目标实体下其他类别的内容获取指令,则服务器接收到该内容获取指令后,可以基于该内容获取指令,获取其他类别对应的聚合内容,服务器将其他类别对应的聚合内容发送给该终端设备。
终端设备接收到该其他类别对应的聚合内容后,可以跳转到另一张疾病卡片上展示该其他类别对应的聚合内容,或者在该疾病卡片上以弹窗形式展示该其他类别对应的聚合内容。
可见,本实施例终端设备还可以展示其他类别对应的聚合内容,满足了用户浏览各类别对应内容的需求。
上面从终端设备的角度对本申请的方案进行了介绍,下面,参照图4,从服务器的角度对本申请的方案进行详细说明。
本申请的信息搜索方法还可以由服务器执行,该服务器可以是虚拟服务器也可以是实体服务器,该方法可以包括:
步骤S301、接收与目标实体相关的搜索语句,识别搜索语句所属的目标实体下的目标类别;
服务器接收到终端发送的搜索语句后,服务器可以提取搜索语句中的关键词,关键词包括类别标识词以及实体名称,服务器基于实体名称可以确定搜索语句所属目标实体,基于类别标识词确定出目标实体下的该目标类别,从而服务器可以获取目标类别对应的聚合内容。
步骤S302、基于预置的类别关联关系,确定目标类别的关联类别;
服务器确定目标类别后可以基于该目标类别以及预置的类别关联关系确定关联类别,从而服务器可以获取关联类别对应的聚合内容。
在本实施例中,类别关联关系指的是至少两个类别之间的关联关系,相关联的至少两个类别包括:基于搜索语句直接确定的用户意图浏览的类别,以及服务器预测的用户意图浏览的类别,类别关联关系可以以关联列表的形式存储,类别关联关系是通过大量数据训练得到的,基于该类别关联关系,服务器可以确定出目标类别的关联类别,可见,本申请基于类别关联关系确定目标类别的关联类别,可以对用户想要浏览的类别进行横向扩展,可以更好地满足用户需求。需要说明的是,本申请应用于疾病领域时,各类别之间的关联关系的一种可能的情况如下图5所示,病因与治疗相关联,表示搜索语句指示搜索病因类别对应的内容,服务器基于搜索语句所指向的类别预测用户可能还想要浏览治疗类别对应的内容;症状与治疗相关联;治疗与日常护理相关联。
步骤S303、基于目标类别对应的聚合内容和关联类别对应的聚合内容生成一条搜索展示结果;
步骤S304、向终端设备发送搜索展示结果。
本实施例与上述图1所示实施例为实质上相同的方案,其具体实现方式以及所产生的有益效果可以参照上述图1所示实施例的相关论述,具体此处不再赘述。
可选的,步骤S302基于预置的类别关联关系,确定目标类别的关联类别之前,该方法还可以包括:
获取针对目标实体的多组搜索会话信息;搜索会话信息为在一定时间内围绕目标实体进行的搜索会话;
基于多组搜索会话信息,确定目标实体下各类别的关联性;
根据目标实体下各类别的关联性,构建预置的类别关联关系。
在本实施例中,服务器可以获取针对目标实体的多组搜索会话信息,每一组搜索会话信息指的是在该一定时间内围绕该目标实体进行搜索所产生的多个搜索数据。具体的,搜索数据可以是用户输入的历史搜索语句,和/或针对用户输入的历史搜索语句的搜索结果进行交互搜索产生的搜索交互数据。可能的情况1:例如用户输入了历史搜索语句A之后,历史搜索语句A的搜索结果无法满足用户意图,则需要补充检索,用户紧接着又输入了历史搜索语句B,则历史搜索语句A和历史搜索语句B均为搜索数据,当然后续还可以输入其他历史搜索语句;可能的情况2:例如,用户围绕目标实体输入历史搜索语句后,可以得到搜索结果,搜索结果中包括多个可搜索对象,当用户选择某一可搜索对象时,可以生成搜索交互数据,实际上可以将用户选择的可搜索对象直接作为搜索交互数据,可搜索对象也是围绕目标实体的,可搜索对象可以是针对历史搜索语句的发散扩展或细化。
在本实施例中,该一定时间可以是预先设置的某一时长,也可以是各用户搜索引擎开启时刻到搜索引擎关闭时刻的时长,具体此处不做限定。
基于多组搜索会话信息,确定目标实体下各类别的关联性有如下可能的情况:
针对每组搜索会话信息,若搜索会话信息中只包括两个搜索数据(可以是两条历史搜索语句或一条历史搜索语句结合一条搜索交互数据),则可以基于两个搜索数据确定出两个类别相关联;若搜索会话信息中包括多个搜索数据(可以是多条历史搜索语句或一条搜索语句结合多条搜索交互数据),可以将搜索时间上相邻的两个搜索数据作为相关联的两个搜索数据,分别确定出两个类别相关联,或将第二个至第n个搜索数据分别作为与第一个搜索数据相关联的搜索数据,n为大于1的正整数,从而基于相关联的两个搜索数据确定出两个类别相关联;
可见,基于上述确定各类别的关联性的方式,服务器基于多组搜索会话信息就可以综合确定得到目标实体下各类别的关联性,从而基于目标实体下各类别的关联性,可以构建该预置的类别关联关系。
构建该预置的类别关联关系具体为:若某一类别只与一个类别相关联,则构建这两个类别的关联关系;若某一类别与多个类别相关联,则将关联程序最大的类别作为目标类别的关联类别以构建类别关联关系,或将与目标类别关联程度更大的类别作为最相关类别,其次作为次相关类别以此类推,以构建目标类别与多个类别的关联关系。
本实施例的一种可能的场景是,若一定时长内,N个用户中N1个用户在搜索类别A后又搜索了类别B,N2个用户在搜类别A后又搜索了类别C,N3个用户不再进行其他搜索,N1大于N2,则N1个用户以及N2个用户中每一用户的搜索都可以作为一组搜索会话信息,基于所确定的搜索会话信息,服务器将与类别A关联程度最大的类别B作为类别A的关联类别;或服务器可以将类别B和类别C均作为类别A的关联类别,具体可以将类别B作为类别A的首要关联类别,类别C作为类别A的次要关联类别。
进一步的,每组搜索会话信息通过如下方法确定:
获取针对目标实体的历史搜索数据;
从历史搜索数据中确定在预设时长内针对目标实体进行连续搜索的目标搜索数据;
基于目标搜索数据生成搜索会话信息。
在本实施例中,服务器可以获取针对目标实体的历史搜索数据,历史搜索数据中包括多个未处理搜索数据,从而服务器可以从多条未处理搜索数据中确定该用户在预设时长(即上述一定时间)内针对目标实体进行连续搜索的至少两个未处理搜索数据,这样可以排除多条未处理搜索数据中非连续搜索以及搜索时间差间隔较大的未处理搜索数据,也可以排除多个未处理搜索数据中没有针对目标实体进行搜索的未处理搜索数据,服务器可以将至少两个未处理搜索数据作为目标搜索数据(即上述多个搜索数据),从而将目标搜索数据作为一组搜索会话信息。
进一步的,基于多组搜索会话信息确定目标实体下各类别的关联性,包括:
针对多组所述搜索会话信息,确定所述搜索会话信息所包含的历史搜索语句以及搜索交互数据;
分别确定所述历史搜索语句以及所述搜索交互数据中所分包含的类别标识词;
基于所述类别标识词,确定所述目标实体下各类别的关联性。
如上述搜索会话信息中包括多个搜索数据,搜索数据包括历史搜索语句和/或搜索交互数据,可以基于上述实施例中方法确定两两相关联的搜索数据,一种可能的情况是:每个搜索数据中包括类别标识词,服务器可以基于两个相关联的搜索数据分别确定出两个类别标识词(若搜索会话信息包括历史搜索语句以及搜索交互数据,则分别确定历史搜索语句所包含的类别标识词以及搜索交互数据所包含的类别标识词),服务器基于两个类别标识词,确定该两个类别标识词分别指示的两个类别相关联,以此得到各类别的关联性即类别关联关系。
在本实施例中,例如某一搜索数据为“xx疾病的症状”,则类别标识词为“症状”,某一搜索数据为“xx疾病的护理”,则类别标识词为“日常护理”。例如两个相关联的搜索数据分别为“xxx疾病的症状”以及“xxx疾病的治疗”,则可以确定症状和治疗相关联;
另一种可能的情况是:每一搜索数据均具有对应可以召回的多个搜索结果,针对每一搜索数据,服务器确定用户所选择的多个搜索结果中的目标搜索结果,服务器解析目标搜索结果从而确定用户意图浏览的类别,则服务器基于两个相关联的搜索数据确定出用户意图浏览的两个类别,从而确定这两个类别相关联。
进一步的,确定目标类别的关联类别,并展示关联类别对应的聚合内容之后,很可能对于某些用户而言依然无法满足用户意图,需要再次输入搜索语句搜索,则为了更准确的确定目标类别的关联类别,需要对类别关联关系不断的调整和完善,具体的:
进一步的,调整类别关联关系的方式是:
该方法还可以包括:
获取针对目标实体的搜索展示结果的第一交互行为数据;
根据搜索展示结果中目标实体的目标类别,从第一交互数据中确定每个目标类别下的第二交互行为数据;
基于第二交互行为数据,生成目标类别与其他类别的关联度;
根据目标类别与其他类别的关联度,调整类别关联关系。
如上述终端设备向用户展示目标类别对应的聚合内容、关联类别对应的聚合内容及其他类别的标识后,服务器可以分析用户后续是浏览了除目标类别对应的内容外哪一类别对应的聚合内容,从而基于分析结果调整上述类别关联关系,具体而言:
服务器可以获取多个用户针对目标实体的搜索展示结果进行交互搜索所产生的第一交互行为数据,例如,展示目标实体的搜索展示结果后,若N个用户针对该搜索展示结果进行了交互搜索,则将N个用户的行为数据作为第一交互行为数据。
本实施中,第一交互行为数据指的是用户搜索目标实体下某一类别对应的聚合内容的行为数据,具体可以是:用户点击了其他类别的标识(即认为用户搜索了其他类别对应的聚合内容);还可以是用户滑动疾病卡片到关联类别对应的聚合内容的展示区域(即认为用户搜索了关联类别对应的聚合内容);疾病卡中还包括关联类别的标识,该第一交互行为数据还可以是用户点击了关联类别的标识(即认为用户搜索了关联类别对应的聚合内容)。
服务器基于该搜索展示结果确定对应的目标实体的目标类别,并从第一交互行为数据中确定第二交互行为数据,第一交互行为数据中的第二交互行为数据指的是第一交互行为数据中占比最多的交互行为数据,例如N个用户中大部分用户均搜索了某一类别(N为大于0的正整数),则将该大部分用户的交互行为数据作为第一交互行为数据中的第二交互行为数据,该第二交互行为数据是针对目标类别的,因此该第二交互行为数据为目标类别下的交互行为数据。
服务器基于第二交互行为数据,可以生成目标类别与第二交互行为所指示的其他类别(这里的其他类别与上述其他类别的理解不同,指的是除目标类别以外的类别)的关联度,从而基于该关联的反向调整上述类别关联关系,以完善类别关联关系。
综上,本实施例的一种可能的应用场景如下:
第一步:对大量用户的搜索会话信息进行分析,分析用户在搜索了某疾病的搜索语句后,会如何基于疾病进行其他意图词的横向发问。比如,有100个用户搜索了“xx病的症状”,其中80个用户在同一个搜索会话信息还会搜索“xx病的治疗方式”,10个用户会再搜索“xx病的原因”,另外10个用户不再进行该疾病相关的其他搜索。那么对用户来说,在询问某疾病“症状”的同时,很有可能还会关心“如何治疗”,其次关心“原因”是什么。则与“症状”类别最相关的类别为“治疗”,次相关类别为“病因”,基于此,可以构建初始类别关联关系。
第二步,对疾病卡片各类别的点击数据进行分析,验证第一步构建的初始类别关联关系是否准确。分析疾病卡片在展示了疾病的某个类别的内容后,用户会如何进行下一步其他类别的内容的查看。比如,有100个用户查看了xx病的“症状”内容,其中80个用户会紧接着点击“治疗”控件查看“治疗”类别的内容,10个用户会点击“病因”控件查看“病因”类别的内容,另外10个用户不进行疾病卡片其他操作。那么对于疾病卡来说,“症状”最相关的类别为“治疗”,次相关类别为“病因”。以此类推,验证第一步得到的初始类别关联关系是否准确,从而调整初始类别关联关系,得到疾病的类别关联关系。
进一步的,步骤S303基于目标类别对应的聚合内容和关联类别对应的聚合内容生成一条搜索展示结果之前,方法还可以包括:
获取目标类别对应的聚合内容以及关联类别对应的聚合内容;
其中,针对任一类别,获取类别对应的聚合内容,包括:
针对任一类别,确定类别对应的至少一个维度;
从类别对应的实体信息中确定至少一个维度的实体信息,将至少一个维度的实体信息进行聚合得到聚合内容。
在本实施例中,对于任一类别(可以是目标类别或关联类别),服务器可以:
确定该类别对应的至少一个维度,该维度可以是上述子类别,例如症状的子类别为典型症状、其他症状以及诊断依据,具体各类别的子类别可以参照上述实施例的相关解释,此处不再赘述;该维度也可以是上述时间维度,例如症状的至少一个时间维度为:早期症状、中期症状以及晚期症状,当然该维度也可以是其他可能的情况,具体此处不做限定。
基于所确定的该类别对应的至少一个维度,服务器可以从类别对应的实体信息中确定该至少一个维度的实体信息,该实体信息可以是疾病信息,从而服务器将至少一个维度的实体信息进行聚合就可以得到该聚合内容。如上述的目标类别可以搜索到多个已有网页,则服务器可以从多个已有网页中确定至少一个维度对应的网页内容,聚合该至少一个维度对应的网页内容得到聚合内容。
进一步的,步骤S303基于目标类别对应的聚合内容和关联类别对应的聚合内容生成一条搜索展示结果,可以包括:
获取与搜索语句对应的、不同于目标类别对应的聚合内容的答案信息;
基于目标类别对应的聚合内容、关联类别对应的聚合内容以及答案信息,生成一条搜索展示结果。
服务器还可以获取到与搜索词对应的专家的答案信息(即上述精准回答),服务器可以基于目标类别对应的聚合内容、关联类别对应的聚合内容以及该答案信息,共同生成一条搜索展示结果,从而终端设备向用户展示该搜索展示结果。
在本实施例中,答案信息一般为针对搜索语句的专家回答内容,可以是专家实时在线生成的答案信息,也可以服务器获取的专家离线生成的答案信息,若服务器搜索到的答案信息与目标类别对应的内容重复(部分重复或全部重复),则服务器可以重新基于搜索语句重新搜索答案信息,直至搜索得到的答案信息的内容不同于目标类别对应的内容。
可见,上述实施例中关联类别对应的内容和答案信息均是基于搜索词确定的,这样服务器向终端设备返回的内容更加符合用户意图。同时,避免了答案信息与目标类别对应的内容的重复。
可选的,向终端设备发送搜索展示结果之后,方法还包括:
获取第一目标实体下其他类别的内容获取指令;其中,其他类别为不同于目标类别以及关联类别的类别;
基于内容获取指令,获取其他类别对应的聚合内容。
本实施例的可实现方式可以参照上述实施例的相关论述,具体此处不再赘述。
下面,结合图示,对本申请方案疾病卡片的展示情况进行说明:
如上述服务器向终端设备发送的搜索展示结果可以在终端设备上以疾病卡的形式展示,疾病卡包括至少以下三个区域的内容信息:问答模块区域、关联模块区域以及其他区域,下面,分别对疾病卡中这三个区域的内容信息进行说明。
(一)问答模块区域以及关联模块区域
一种可能的情况是:终端设备可以在问答区域展示搜索展示结果中目标类别的聚合内容,在关联模块区域展示关联类别对应的聚合内容。
用户点击关联模块区域可以跳转至关联类别对应的聚合内容的落地页,落地页中可以展示关联类别对应的聚合内容的详细内容;或落地页中可以展示关联类别对应的其他聚合内容(其他聚合内容不同于该关联类别对应的聚合内容);或若关联模块区域只展示有关联模块对应聚合内容中的部分内容,则落地页中可以展示关联模块对应聚合内容中的剩余部分内容。
同时,关联模块区域最多展示关联类别的两个子类别的内容,若无法得到关联模块对应的聚合内容,则关联模块区域的兜底内容为人工设计的目标类别最相关类别对应的聚合内容。
用户点击问答模块区域可以展示目标类别对应的聚合内容的落地页,如上述服务器基于某个疾病的搜索语句搜索到专家的答案信息,则向终端设备返回了该答案信息,用户点击问答模块区域时,跳转逻辑如下:
方案1:目标类别对应的聚合内容的落地页中包括专家的答案信息以及目标类别对应的聚合内容的详细内容或目标类别对应的其他聚合内容(其他聚合内容不同于上述目标类别对应的聚合内容)。
如图6所示,一种可能的场景是:用户点击问答模块区域时,终端设备可以跳转至第二展示页面,用第二展示页面替换第一展示页面,在第二展示页面上展示答案信息和目标类别对应的其他聚合内容,即疾病卡中既有专家的答案信息又有目标类别对应的其他聚合内容,后续的,用户可以点击“返回”按钮,返回第一展示页面。
方案2:目标类别对应的聚合内容的落地页中仅包括专家的答案信息,需要用户再点击目标类别对应的控件,终端设备才能展示目标类别对应的聚合内容的详细内容或目标类别对应的其他聚合内容。
如图7所示,一种可能的场景是:用户点击问答模块区域时,终端设备可以跳转至第二展示页面,用第二展示页面替换第一展示页面,在第二展示页面上展示答案信息,同时,用户可以点击“返回”按钮,返回第一展示页面,用户可以点击目标类别对应的控件,可以用第三展示页面替换第一展示页面,在第三展示页面上展示目标类别对应的其他聚合内容,例如,目标类别为症状,则用户点击“症状”控件,可以展示症状对应的其他聚合内容。
(二)其他区域
其他区域可以展示“概述”“病因”“症状”“治疗”以及“护理(即日常护理)”分别对应的控件,点击相应的控件可以跳转至相应控件的落地页,落地页中具体为相应控件对应类别对应的内容;
可见,在本实施例中,终端设备可以将答案信息与目标类别对应的内容在一张疾病卡上展示,不需要考虑答案信息与目标类别对应的聚合内容展示时的排序问题,展示的疾病内容更加满足用户意图,也更加丰富,同时,也可以保证答案信息与目标类别对应的聚合内容不重复。
从上述实施例中可以看出,本公开的方式实质上涉及终端设备和服务器之间的交互,下面,参照图8,从设备交互的角度,对本公开的方案进行解释说明,本公开的疾病信息的处理方法包括:
步骤S1:终端设备向服务器发送疾病的搜索语句;
步骤S2:服务器基于搜索语句,确定与搜索语句对应的目标类别,并确定目标类别对应的聚合内容;
S3:服务器基于预置的类别关联关系,确定目标类别的关联类别;
S4:服务器向终端设备返回目标类别对应的聚合内容以及关联类别的聚合内容;
S5:终端设备在问答模块区域展示目标类别对应的聚合内容,且终端设备在关联模块区域展示关联类别对应的聚合内容;
S6:若终端设备检测到用户针对问答模块区域的点击操作,则终端设备跳转展示答案信息和目标类别对应的其他聚合内容,或终端设备跳转展示答案信息。
综上,本公开实施例具有以下优点:
1、一个搜索语句可以同时搜索到基于搜索语句本身所确定的目标类别对应的聚合内容和用户可能感兴趣的关联类别对应的聚合内容,对用户横向拓展需求进行了的推测和满足,减小了搜索路径,提升了搜索效率。
2、提出了疾病卡跳转方案,实现了答案信息和目标类别对应的聚合内容进行整合,用一张卡片来做内容的承接,不需要再考虑类别对应的内容以及答案信息展示时的排序问题,给用户的整体感知更强,更精准的满足用户搜索意图。同时,搜索到的答案信息不同于目标类别对应的内容,也避免了答案信息与目标类别对应的内容的重复问题。
请参照图9,本公开还提供了一种信息搜索装置,可以包括:
第一接收模块801,用于接收搜索语句,搜索语句与目标实体相关;
第一获取模块802,用于获取搜索语句对应的一条搜索展示结果;其中,搜索展示结果包括搜索语句所属的目标实体下的目标类别对应的聚合内容以及关联类别对应的聚合内容,关联类别是基于目标类别确定的;
第一展示模块803,用于展示搜索展示结果。
可选的,第一展示模块803,具体用于:
展示目标类别对应的聚合内容、关联类别对应的聚合内容以及其他类别的标识;
其中,其他类别为目标实体下不同于目标类别和关联类别的类别。
可选的,第一展示模块803在展示目标类别对应的聚合内容时,具体用于执行以下至少一项的操作:
展示目标类别对应的至少一个子聚合内容以及各子聚合内容对应的时间信息;
展示目标类别对应的至少一个子聚合内容以及各子聚合内容对应的子类别信息;
展示目标类别对应的多媒体信息。
可选的,该装置还包括第二展示模块;
第二展示模块,用于响应针对其他类别的标识的触发操作时,展示其他类别对应的聚合内容。
请参照图10,本公开还提供了一种信息搜索装置,可以包括:
第二接收模块901,用于接收与目标实体相关的搜索语句,识别搜索语句所属的目标实体下的目标类别;
第一确定模块902,用于基于预置的类别关联关系,确定目标类别的关联类别;
第一生成模块903,用于基于目标类别对应的聚合内容和关联类别对应的聚合内容生成一条搜索展示结果;
发送模块904,用于向终端设备发送搜索展示结果。
可选的,该装置还包括第二获取模块、第二确定模块以及构建模块;
第一确定模块902在基于预置的类别关联关系,确定目标类别的关联类别之前;
第二获取模块,用于获取针对目标实体的多组搜索会话信息;搜索会话信息为在一定时间内围绕目标实体进行的搜索会话;
第二确定模块,用于基于多组搜索会话信息,确定目标实体下各类别的关联性;
构建模块,用于根据目标实体下各类别的关联性,构建预置的类别关联关系。
可选的,每组搜索会话信息通过如下方法确定:
获取针对目标实体的历史搜索数据;
从历史搜索数据中确定在预设时长内针对目标实体进行连续搜索的目标搜索数据;
基于目标搜索数据生成搜索会话信息。
可选的,第二确定模块,具体用于:
针对多组所述搜索会话信息,确定所述搜索会话信息所包含的历史搜索语句以及搜索交互数据;
分别确定所述历史搜索语句以及所述搜索交互数据中所分包含的类别标识词;
基于所述类别标识词,确定所述目标实体下各类别的关联性可选的,该装置还包括第三获取模块、第三确定模块、第二生成模块以及调整模块;
第三获取模块,用于获取针对目标实体的搜索展示结果的第一交互行为数据;
第三确定模块,用于根据搜索展示结果中目标实体的目标类别,从第一交互行为数据中确定每个目标类别下的第二交互行为数据;
第二生成模块,用于基于第二交互行为数据,生成目标类别与其他类别的关联度;
调整模块,用于根据目标类别与其他类别的关联度,调整类别关联关系。
可选的,该装置还包括第四获取模块;第一生成模块903在基于目标类别对应的聚合内容和关联类别对应的聚合内容生成一条搜索展示结果之前;
第四获取模块,用于获取目标类别对应的聚合内容以及关联类别对应的聚合内容;
其中,针对任一类别,获取模块在获取类别对应的聚合内容时,具体用于:
针对任一类别,确定类别对应的至少一个维度;
从类别对应的实体信息中确定至少一个维度的实体信息,将至少一个维度的实体信息进行聚合得到聚合内容。
可选的,该装置还包括第五获取模块以及第六获取模块;
在发送模块904向终端设备发送搜索展示结果之后;
第五获取模块,用于获取目标实体下其他类别的内容获取指令;其中,其他类别为不同于目标类别以及关联类别的类别;
第六获取模块,用于基于内容获取指令,获取其他类别对应的聚合内容。
下面参考图11,其示出了适于用来实现本公开实施例的电子设备(例如图1中的终端设备或图4中的服务器)600的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图10示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
电子设备包括:存储器以及处理器,其中,这里的处理器可以称为下文的处理装置601,存储器可以包括下文中的只读存储器(ROM)602、随机访问存储器(RAM)603以及存储装置608中的至少一项,具体如下所示:
如图10所示,电子设备600可以包括处理装置(例如中央处理器、图形处理器等)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储装置608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有电子设备600操作所需的各种程序和数据。处理装置601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
通常,以下装置可以连接至I/O接口605:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置606;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置607;包括例如磁带、硬盘等的存储装置608;以及通信装置609。通信装置609可以允许电子设备600与其他设备进行无线或有线通信以交换数据。虽然图10示出了具有各种装置的电子设备600,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置609从网络上被下载和安装,或者从存储装置608被安装,或者从ROM 602被安装。在该计算机程序被处理装置601执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:接收搜索语句,搜索语句与目标实体相关;获取搜索语句对应的一条搜索展示结果;其中,搜索展示结果包括搜索语句所属的目标实体下的目标类别对应的聚合内容以及关联类别对应的聚合内容,关联类别是基于目标类别确定的;展示搜索展示结果。
或上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:接收与目标实体相关的搜索语句,识别搜索语句所属的目标实体下的目标类别;基于预置的类别关联关系,确定目标类别的关联类别;基于目标类别对应的聚合内容和关联类别对应的聚合内容生成一条搜索展示结果;向终端设备发送搜索展示结果。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的模块或单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块或单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一接收模块还可以被描述为“接收搜索语句的模块”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
本公开的一个或多个实施例,提供了一种信息搜索方法,包括:
接收搜索语句,搜索语句与目标实体相关;
获取搜索语句对应的一条搜索展示结果;其中,搜索展示结果包括搜索语句所属的目标实体下的目标类别对应的聚合内容以及关联类别对应的聚合内容,关联类别是基于目标类别确定的;
展示搜索展示结果。
可选的,展示搜索展示结果包括:
展示目标类别对应的聚合内容、关联类别对应的聚合内容以及其他类别的标识;
其中,其他类别为目标实体下不同于目标类别和关联类别的类别。
可选的,展示目标类别对应的聚合内容,包括以下至少一项:
展示目标类别对应的至少一个子聚合内容以及各子聚合内容对应的时间信息;
展示目标类别对应的至少一个子聚合内容以及各子聚合内容对应的子类别信息;
展示目标类别对应的多媒体信息。
可选的,方法还包括:
响应针对其他类别的标识的触发操作时,展示其他类别对应的聚合内容。
本公开的一个或多个实施例,还提供了一种信息搜索方法,包括:
接收与目标实体相关的搜索语句,识别搜索语句所属的目标实体下的目标类别;
基于预置的类别关联关系,确定目标类别的关联类别;
基于目标类别对应的聚合内容和关联类别对应的聚合内容生成一条搜索展示结果;
向终端设备发送搜索展示结果。
可选的,基于预置的类别关联关系,确定目标类别的关联类别之前,方法还包括:
获取针对目标实体的多组搜索会话信息;搜索会话信息为在一定时间内围绕目标实体进行的搜索会话;
基于多组搜索会话信息,确定目标实体下各类别的关联性;
根据目标实体下各类别的关联性,构建预置的类别关联关系。
可选的,每组搜索会话信息通过如下方法确定:
获取针对目标实体的历史搜索数据;
从历史搜索数据中确定在预设时长内针对目标实体进行连续搜索的目标搜索数据;
基于目标搜索数据生成搜索会话信息。
可选的,基于多组搜索会话信息确定目标实体下各类别的关联性,包括:
针对多组所述搜索会话信息,确定所述搜索会话信息所包含的历史搜索语句以及搜索交互数据;
分别确定所述历史搜索语句以及所述搜索交互数据中所分包含的类别标识词;
基于所述类别标识词,确定所述目标实体下各类别的关联性可选的,方法还包括:
获取针对目标实体的搜索展示结果的第一交互行为数据;
根据搜索展示结果中目标实体的目标类别,从第一交互行为数据中确定每个目标类别下的第二交互行为数据;
基于第二交互行为数据,生成目标类别与其他类别的关联度;
根据目标类别与其他类别的关联度,调整类别关联关系。
可选的,基于目标类别对应的聚合内容和关联类别对应的聚合内容生成一条搜索展示结果之前,方法还包括:
获取目标类别对应的聚合内容以及关联类别对应的聚合内容;
其中,针对任一类别,获取类别对应的聚合内容,包括:
针对任一类别,确定类别对应的至少一个维度;
从类别对应的实体信息中确定至少一个维度的实体信息,将至少一个维度的实体信息进行聚合得到聚合内容。
可选的,向终端设备发送搜索展示结果之后,方法还包括:
获取目标实体下其他类别的内容获取指令;其中,其他类别为不同于目标类别以及关联类别的类别;
基于内容获取指令,获取其他类别对应的聚合内容。
本公开的一个或多个实施例,还提供了一种信息搜索装置,包括:
第一接收模块,用于接收搜索语句,搜索语句与目标实体相关;
第一获取模块,用于获取搜索语句对应的一条搜索展示结果;其中,搜索展示结果包括搜索语句所属的目标实体下的目标类别对应的聚合内容以及关联类别对应的聚合内容,关联类别是基于目标类别确定的;
第一展示模块,用于展示搜索展示结果。
可选的,第一展示模块,具体用于:
展示目标类别对应的聚合内容、关联类别对应的聚合内容以及其他类别的标识;
其中,其他类别为目标实体下不同于目标类别和关联类别的类别。
可选的,第一展示模块在展示目标类别对应的聚合内容时,具体用于执行以下至少一项的操作:
展示目标类别对应的至少一个子聚合内容以及各子聚合内容对应的时间信息;
展示目标类别对应的至少一个子聚合内容以及各子聚合内容对应的子类别信息;
展示目标类别对应的多媒体信息。
可选的,该装置还包括第二展示模块;
第二展示模块,用于响应针对其他类别的标识的触发操作时,展示其他类别对应的聚合内容。
根据本公开的一个或多个实施例,提供了一种信息搜索装置,包括:
第二接收模块,用于接收与目标实体相关的搜索语句,识别搜索语句所属的目标实体下的目标类别;
第一确定模块,用于基于预置的类别关联关系,确定目标类别的关联类别;
第一生成模块,用于基于目标类别对应的聚合内容和关联类别对应的聚合内容生成一条搜索展示结果;
发送模块,用于向终端设备发送搜索展示结果。
可选的,该装置还包括第二获取模块、第二确定模块以及构建模块;
第一确定模块在基于预置的类别关联关系,确定目标类别的关联类别之前;
第二获取模块,用于获取针对目标实体的多组搜索会话信息;搜索会话信息为在一定时间内围绕目标实体进行的搜索会话;
第二确定模块,用于基于多组搜索会话信息,确定目标实体下各类别的关联性;
构建模块,用于根据目标实体下各类别的关联性,构建预置的类别关联关系。
可选的,每组搜索会话信息通过如下方法确定:
获取针对目标实体的历史搜索数据;
从历史搜索数据中确定在预设时长内针对目标实体进行连续搜索的目标搜索数据;
基于目标搜索数据生成搜索会话信息。
可选的,第二确定模块,具体用于:
针对多组搜索会话信息,确定搜索会话信息所包含的至少两条历史搜索语句;
确定至少两条历史搜索语句分别包含的类别标识词;
基于类别标识词,确定目标实体下各类别的关联性。
可选的,该装置还包括第三获取模块、第三确定模块、第二生成模块以及调整模块;
第三获取模块,用于获取针对目标实体的搜索展示结果的第一交互行为数据;
第三确定模块,用于根据搜索展示结果中目标实体的目标类别,从第一交互行为数据中确定每个目标类别下的第二交互行为数据;
第二生成模块,用于基于第二交互行为数据,生成目标类别与其他类别的关联度;
调整模块,用于根据目标类别与其他类别的关联度,调整类别关联关系。
可选的,该装置还包括第四获取模块;第一生成模块在基于目标类别对应的聚合内容和关联类别对应的聚合内容生成一条搜索展示结果之前;
第四获取模块,用于获取目标类别对应的聚合内容以及关联类别对应的聚合内容;
其中,针对任一类别,获取模块在获取类别对应的聚合内容时,具体用于:
针对任一类别,确定类别对应的至少一个维度;
从类别对应的实体信息中确定至少一个维度的实体信息,将至少一个维度的实体信息进行聚合得到聚合内容。
可选的,该装置还包括第五获取模块以及第六获取模块;
在发送模块向终端设备发送搜索展示结果之后;
第五获取模块,用于获取目标实体下其他类别的内容获取指令;其中,其他类别为不同于目标类别以及关联类别的类别;
第六获取模块,用于基于内容获取指令,获取其他类别对应的聚合内容。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (15)

1.一种信息搜索方法,其特征在于,包括:
接收搜索语句,所述搜索语句与目标实体相关;
获取所述搜索语句对应的一条搜索展示结果;其中,所述搜索展示结果包括所述搜索语句所属的所述目标实体下的目标类别对应的聚合内容、以及关联类别对应的聚合内容,所述关联类别是基于所述目标类别确定的;
展示所述搜索展示结果。
2.根据权利要求1所述的方法,其特征在于,所述展示所述搜索展示结果包括:
展示所述目标类别对应的聚合内容、所述关联类别对应的聚合内容以及其他类别的标识;
其中,所述其他类别为所述目标实体下不同于所述目标类别和所述关联类别的类别。
3.根据权利要求2所述的方法,其特征在于,所述展示所述目标类别对应的聚合内容,包括以下至少一项:
展示所述目标类别对应的至少一个子聚合内容以及各子聚合内容对应的时间信息;
展示所述目标类别对应的至少一个子聚合内容以及各子聚合内容对应的子类别信息;
展示所述目标类别对应的多媒体信息。
4.根据权利要求2或3所述的方法,其特征在于,所述方法还包括:
响应针对所述其他类别的标识的触发操作时,展示所述其他类别对应的聚合内容。
5.一种信息搜索方法,其特征在于,包括:
接收与目标实体相关的搜索语句,识别所述搜索语句所属的所述目标实体下的目标类别;
基于预置的类别关联关系,确定所述目标类别的关联类别;
基于所述目标类别对应的聚合内容和所述关联类别对应的聚合内容生成一条搜索展示结果;
向终端设备发送所述搜索展示结果。
6.根据权利要求5所述的方法,其特征在于,所述基于预置的类别关联关系,确定所述目标类别的关联类别之前,所述方法还包括:
获取针对所述目标实体的多组搜索会话信息;所述搜索会话信息为在一定时间内围绕所述目标实体进行的搜索会话;
基于多组所述搜索会话信息,确定所述目标实体下各类别的关联性;
根据所述目标实体下各类别的关联性,构建所述预置的类别关联关系。
7.根据权利要求6所述的方法,其特征在于,每组所述搜索会话信息通过如下方法确定:
获取针对所述目标实体的历史搜索数据;
从所述历史搜索数据中确定在预设时长内针对所述目标实体进行连续搜索的目标搜索数据;
基于所述目标搜索数据生成所述搜索会话信息。
8.根据权利要求6所述的方法,其特征在于,所述基于多组所述搜索会话信息确定所述目标实体下各类别的关联性,包括:
针对多组所述搜索会话信息,确定所述搜索会话信息所包含的历史搜索语句以及搜索交互数据;
分别确定所述历史搜索语句以及所述搜索交互数据中所分包含的类别标识词;
基于所述类别标识词,确定所述目标实体下各类别的关联性。
9.根据权利要求5至8中任一项所述的方法,其特征在于,所述方法还包括:
获取针对所述目标实体的所述搜索展示结果的第一交互行为数据;
根据所述搜索展示结果中所述目标实体的目标类别,从所述第一交互行为数据中确定每个所述目标类别下的第二交互行为数据;
基于所述第二交互行为数据,生成所述目标类别与其他类别的关联度;
根据所述目标类别与其他类别的关联度,调整所述类别关联关系。
10.根据权利要求5至8中任一项所述的方法,其特征在于,所述基于所述目标类别对应的聚合内容和所述关联类别对应的聚合内容生成一条搜索展示结果之前,所述方法还包括:
获取所述目标类别对应的聚合内容以及所述关联类别对应的聚合内容;
其中,针对任一类别,获取所述类别对应的聚合内容,包括:
针对任一类别,确定所述类别对应的至少一个维度;
从所述类别对应的实体信息中确定所述至少一个维度的实体信息,将所述至少一个维度的实体信息进行聚合得到所述聚合内容。
11.根据权利要求5至8中任一项所述的方法,其特征在于,所述向终端设备发送所述搜索展示结果之后,所述方法还包括:
获取所述目标实体下其他类别的内容获取指令;其中,所述其他类别为不同于所述目标类别以及所述关联类别的类别;
基于所述内容获取指令,获取所述其他类别对应的聚合内容。
12.一种信息搜索装置,其特征在于,包括:
第一接收模块,用于接收搜索语句,所述搜索语句与目标实体相关;
第一获取模块,用于获取所述搜索语句对应的一条搜索展示结果;其中,所述搜索展示结果包括所述搜索语句所属的所述目标实体下的目标类别对应的聚合内容、以及关联类别对应的聚合内容,所述关联类别是基于所述目标类别确定的;
第一展示模块,用于展示所述搜索展示结果。
13.一种信息搜索装置,其特征在于,包括:
第二接收模块,用于接收与目标实体相关的搜索语句,识别所述搜索语句所属的所述目标实体下的目标类别;
第一确定模块,用于基于预置的类别关联关系,确定所述目标类别的关联类别;
第一生成模块,用于基于所述目标类别对应的聚合内容和所述关联类别对应的聚合内容生成一条搜索展示结果;
发送模块,用于向终端设备发送所述搜索展示结果。
14.一种电子设备,其特征在于,包括:
所述电子设备包括存储器和处理器;
所述存储器中存储有计算机程序;
所述处理器,用于在运行所述计算机程序时执行权利要求1-11任一项所述的方法。
15.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-11任一项所述的方法。
CN202110126811.6A 2021-01-29 2021-01-29 信息搜索方法、装置、电子设备及计算机可读介质 Active CN112948539B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110126811.6A CN112948539B (zh) 2021-01-29 2021-01-29 信息搜索方法、装置、电子设备及计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110126811.6A CN112948539B (zh) 2021-01-29 2021-01-29 信息搜索方法、装置、电子设备及计算机可读介质

Publications (2)

Publication Number Publication Date
CN112948539A true CN112948539A (zh) 2021-06-11
CN112948539B CN112948539B (zh) 2023-03-24

Family

ID=76239779

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110126811.6A Active CN112948539B (zh) 2021-01-29 2021-01-29 信息搜索方法、装置、电子设备及计算机可读介质

Country Status (1)

Country Link
CN (1) CN112948539B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113407852A (zh) * 2021-07-16 2021-09-17 北京字节跳动网络技术有限公司 内容搜索方法、装置、设备及介质
CN113792226A (zh) * 2021-09-22 2021-12-14 北京字节跳动网络技术有限公司 一种信息展示方法、装置以及计算机存储介质
CN114048404A (zh) * 2021-10-25 2022-02-15 北京字跳网络技术有限公司 展示方法、装置和电子设备
CN115329772A (zh) * 2022-08-09 2022-11-11 抖音视界有限公司 词条交互的方法、装置、设备和存储介质
WO2024174907A1 (zh) * 2023-02-20 2024-08-29 北京字跳网络技术有限公司 内容搜索方法、装置、设备、计算机可读存储介质及产品

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110264651A1 (en) * 2010-04-21 2011-10-27 Yahoo! Inc. Large scale entity-specific resource classification
CN107992554A (zh) * 2017-11-28 2018-05-04 北京百度网讯科技有限公司 提供问答信息的聚合结果的搜索方法和装置
CN111538894A (zh) * 2020-06-19 2020-08-14 腾讯科技(深圳)有限公司 查询反馈方法、装置、计算机设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110264651A1 (en) * 2010-04-21 2011-10-27 Yahoo! Inc. Large scale entity-specific resource classification
CN107992554A (zh) * 2017-11-28 2018-05-04 北京百度网讯科技有限公司 提供问答信息的聚合结果的搜索方法和装置
CN111538894A (zh) * 2020-06-19 2020-08-14 腾讯科技(深圳)有限公司 查询反馈方法、装置、计算机设备及存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113407852A (zh) * 2021-07-16 2021-09-17 北京字节跳动网络技术有限公司 内容搜索方法、装置、设备及介质
CN113792226A (zh) * 2021-09-22 2021-12-14 北京字节跳动网络技术有限公司 一种信息展示方法、装置以及计算机存储介质
CN113792226B (zh) * 2021-09-22 2024-01-26 抖音视界有限公司 一种信息展示方法、装置以及计算机存储介质
CN114048404A (zh) * 2021-10-25 2022-02-15 北京字跳网络技术有限公司 展示方法、装置和电子设备
CN115329772A (zh) * 2022-08-09 2022-11-11 抖音视界有限公司 词条交互的方法、装置、设备和存储介质
WO2024174907A1 (zh) * 2023-02-20 2024-08-29 北京字跳网络技术有限公司 内容搜索方法、装置、设备、计算机可读存储介质及产品

Also Published As

Publication number Publication date
CN112948539B (zh) 2023-03-24

Similar Documents

Publication Publication Date Title
CN112948539B (zh) 信息搜索方法、装置、电子设备及计算机可读介质
CN111414498B (zh) 多媒体信息推荐方法、装置及电子设备
US11669579B2 (en) Method and apparatus for providing search results
CN111368185B (zh) 数据展示方法、装置、存储介质及电子设备
JP2024516666A (ja) 検索結果表示方法、装置、機器及び媒体
CN112948540B (zh) 信息查询方法、装置、电子设备以及计算机可读介质
CN111400625B (zh) 页面处理方法、装置、电子设备及计算机可读存储介质
CN112287206A (zh) 信息处理方法、装置和电子设备
CN114265981A (zh) 推荐词确定方法、装置、设备及存储介质
WO2020117694A1 (en) New media information displaying method, device, electronic device, and computer readable medium
CN113838548A (zh) 病例信息处理方法、装置及医疗信息系统
CN110399459B (zh) 在线文档的搜索方法、装置、终端、服务器及存储介质
CN115080816A (zh) 摘要信息生成与搜索结果展示方法、装置、设备和介质
CN112765424B (zh) 数据查询方法、装置、设备及计算机可读介质
CN114357325A (zh) 内容搜索方法、装置、设备及介质
CN113111648B (zh) 信息的处理方法、装置、终端和存储介质
CN113934938A (zh) 信息展示的方法、装置、可读介质和电子设备
CN111382365B (zh) 用于输出信息的方法和装置
CN113157649A (zh) 一种文档搜索方法、装置、设备及介质、程序产品
WO2023088172A1 (zh) 交互方法、装置、电子设备和存储介质
CN113221572B (zh) 一种信息处理方法、装置、设备及介质
CN110543491A (zh) 搜索方法、装置、电子设备和计算机可读存储介质
US20240289394A1 (en) Web page classification method, apparatus, storage medium and electronic device
CN114428823B (zh) 基于多维变量表达式的数据联动方法、装置、设备和介质
CN114741626B (zh) 一种搜索结果展示方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Applicant after: Douyin Vision Co.,Ltd.

Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Applicant before: Tiktok vision (Beijing) Co.,Ltd.

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Applicant after: Tiktok vision (Beijing) Co.,Ltd.

Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Applicant before: BEIJING BYTEDANCE NETWORK TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant