CN111339424A - 基于关键词进行搜索的方法、装置、设备及存储介质 - Google Patents

基于关键词进行搜索的方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111339424A
CN111339424A CN202010144955.XA CN202010144955A CN111339424A CN 111339424 A CN111339424 A CN 111339424A CN 202010144955 A CN202010144955 A CN 202010144955A CN 111339424 A CN111339424 A CN 111339424A
Authority
CN
China
Prior art keywords
search
supplementary
keyword
information
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010144955.XA
Other languages
English (en)
Other versions
CN111339424B (zh
Inventor
张迎超
林馨怡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Douyin Vision Co Ltd
Douyin Vision Beijing Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN202010144955.XA priority Critical patent/CN111339424B/zh
Publication of CN111339424A publication Critical patent/CN111339424A/zh
Application granted granted Critical
Publication of CN111339424B publication Critical patent/CN111339424B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开的实施例提供了一种基于关键词进行搜索的方法、装置、设备及存储介质。所述方法包括:获取用户当前搜索的关键词;根据所述关键词判断是否属于目标搜索场景,若是,则生成补充引导信息并发送至所述用户的终端以呈现;获取补充搜索信息,所述补充搜索信息是根据用户对所述补充引导信息的操作而生成的;根据所述关键词和所述补充搜索信息进行搜索。本公开的实施例使得搜索结果更加符合用户的实际需求,减少了用户重复搜索的场景数量,降低用户搜索成本,提高了搜索效率和准确性,有效提升了用户体验。

Description

基于关键词进行搜索的方法、装置、设备及存储介质
技术领域
本公开的实施例一般地涉及信息搜索技术领域,并且更具体地,涉及一种基于关键词进行搜索的方法、装置、设备及存储介质。
背景技术
搜索是互联网应用中常见的功能,用户通过搜索可以主动地获取所需的信息。现有通用的搜索流程包括:用户在终端应用界面的搜索框中输入关键词,搜索框向下弹出sug词(搜索提示词),如果满足搜索需求,则用户点击一个sug词或直接点击搜索控件进行搜索,并从界面呈现的搜索结果中寻找所需信息,如果不满足,则用户需在搜索框中补充输入或更改关键词。
然而,在例如医疗等对搜索结果的权威性和专业性要求较高的特定的搜索场景下,同一类问题存在多种不同情况。当用户在互联网上搜索此类特定的问题时,难以确定合适且足够多的关键词以体现实际的需求,导致搜索结果无法满足用户需求甚至给用户造成误导,用户往往需要修改、补充关键词进行多次反复查询,严重影响了用户体验。
发明内容
为此,根据本公开的实施例,提供了一种基于关键词进行搜索的方法、装置、设备及存储介质,能够提高用户在特定场景下的搜索效率和准确性。
在本公开的第一方面,提供了一种基于关键词进行搜索的方法,包括:
获取用户当前搜索的关键词;
根据所述关键词判断是否属于目标搜索场景,若是,则生成补充引导信息并发送至所述用户的终端以呈现;
获取补充搜索信息,所述补充搜索信息是根据用户对所述补充引导信息的操作而生成的;
根据所述关键词和所述补充搜索信息进行搜索。
进一步地,所述根据所述关键词判断是否属于目标搜索场景,若是,则生成补充引导信息包括:
将所述关键词输入预先生成的垂类判断模型以判断是否属于目标垂类;
若是,则获取所述目标垂类对应的分类判断模型,将所述关键词输入所述分类判断模型以判断是否属于目标分类;
若是,则获取所述目标分类中的指定关键词集合,从所述指定关键词集合中获取与所述关键词匹配的指定关键词;
根据所述指定关键词生成补充引导信息。
进一步地,所述垂类判断模型和分类判断模型是按照下述方式生成的:
根据历史搜索数据归纳得到所述垂类;
从所述历史搜索数据中获取属于每个垂类的搜索词,对所述搜索词排序并归类得到所述垂类包含的分类;
利用神经网络模型对历史搜索数据进行训练,生成所述垂类判断模型和分类判断模型。
进一步地,所述从所述指定关键词集合中获取与所述关键词匹配的指定关键词包括:
对所述关键词进行泛化处理,得到其泛化表达;
从所述指定关键词集合中查询与所述关键词或其泛化表达相同的指定关键词,作为与所述关键词匹配的指定关键词。
进一步地,所述根据所述指定关键词生成补充引导信息包括:
按照预设规则获取与所述指定关键词对应的补充引导信息,所述补充引导信息包括问题及其选项。
进一步地,所述方法还包括:
根据所述关键词确定搜索提示词;
发送所述搜索提示词至所述用户的终端以呈现;
根据所述关键词或用户选择的搜索提示词以及所述补充搜索信息进行搜索。
在本公开的第二方面,提供了一种基于关键词进行搜索的方法,包括:
接收用户输入的关键词;
获取补充引导信息并呈现,所述补充引导信息是在所述关键词属于目标搜索场景时生成的;
接收所述用户对所述补充引导信息的操作并生成补充搜索信息;
获取搜索结果并呈现,所述搜索结果是根据所述关键词以及所述补充搜索信息进行搜索的结果。
进一步地,所述补充引导信息包括问题及其选项;
所述接收所述用户对所述补充引导信息的操作并生成补充搜索信息包括:
接收所述用户针对每个所述问题的选项进行的选择操作;
根据所述问题以及所选择的选项的内容生成补充搜索信息。
进一步地,所述方法还包括:
接收根据所述关键词确定的搜索提示词;
在呈现所述补充引导信息的同时呈现所述搜索提示词;
获取搜索结果并呈现,所述搜索结果是根据所述关键词或所述搜索提示词以及所述补充搜索信息进行搜索的结果。
在本公开的第三方面,提供了一种基于关键词进行搜索的装置,包括:
获取模块,用于获取用户当前搜索的关键词;
补充引导信息生成模块,用于根据所述关键词判断是否属于目标搜索场景,若是,则生成补充引导信息并发送至所述用户的终端以呈现;
补充搜索信息获取模块,用于获取补充搜索信息,所述补充搜索信息是根据用户对所述补充引导信息的操作而生成的;
搜索模块,用于根据所述关键词和所述补充搜索信息进行搜索。
在本公开的第四方面,提供了一种基于关键词进行搜索的装置,包括:
接收模块,用于接收用户输入的关键词;
补充引导信息获取模块,用于获取补充引导信息并呈现,所述补充引导信息是在所述关键词属于目标搜索场景时生成的;
补充搜索信息生成模块,用于接收所述用户对所述补充引导信息的操作并生成补充搜索信息;
搜索结果获取模块,用于获取搜索结果并呈现,所述搜索结果是根据所述关键词以及所述补充搜索信息进行搜索的结果。
在本公开的第五方面,提供了一种电子设备。该电子设备包括:存储器和处理器,所述存储器上存储有计算机程序,所述处理器执行所述程序时实现如第一方面所述的方法。
在本公开的第六方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如第一方面所述的方法。
本公开实施例提供的基于关键词进行搜索的方案通过根据输入关键词确定特定搜索场景并呈现补充引导信息,以引导用户补充搜索信息,从而使得搜索结果更加符合用户的实际需求,提高了搜索效率和准确性,减少了用户重复搜索的场景数量,降低用户搜索成本,有效提升了用户体验;通过包括问题和选项的补充引导信息,保障了补充搜索信息内容的规范性和专业性,进一步优化了搜索效果。
应当理解,发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。
附图说明
结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素,其中:
图1示出了能够在其中实现本公开的实施例的示例性运行环境的示意图;
图2示出了根据本公开第一实施例的基于关键词进行搜索的方法的流程图;
图3示出了根据本公开第一实施例的方法中目标搜索场景判断步骤的具体流程图;
图4示出了根据本公开第二实施例的基于关键词进行搜索的方法的流程图;
图5示出了根据本公开第三实施例的基于关键词进行搜索的装置的结构示意图;
图6示出了根据本公开第四实施例的基于关键词进行搜索的装置的结构示意图;
图7示出了根据本公开第五实施例的补充引导信息呈现界面的示意图;
图8示出了能够实施本公开实施例的示例性电子设备的方框图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本公开保护的范围。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
图1示出了能够在其中实现本公开的实施例的示例性运行环境100。在运行环境100中包括终端设备101、102、103,网络104和服务器105。终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息,网络104可以包括各种连接类型。终端设备101、102、103包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等。终端设备101、102、103上安装有客户端应用程序,服务器105提供所述应用程序的服务器端,终端设备101、102、103中的应用程序界面上具有搜索框,用户在搜索框中输入关键词进行搜索,终端设备101、102、103将所述关键词发送至服务器105,服务器105根据所述关键词在数据库中识别和召回相关的信息资源,将其作为搜索结果发送至终端设备101、102、103,以在应用程序的界面上呈现给用户。最终呈现的搜索结果能否满足用户实际需求主要取决于以下三点:1、用户搜索关键词描述是否清晰完整;2、数据库中的信息资源是否丰富;3、识别和召回技术是否精准。当在资源和技术上满足第2、3点时,搜索结果的精准性就强依赖于用户对需求的关键词描述是否清晰完整。在对权威性和专业性要求较高的特定的搜索场景下,用户难以通过关键词描述实际的需求,需要通过其它方式引导用户补充搜索信息,从而弥补关键词描述的不足,使得搜索结果能够满足用户实际需求。
为此,本公开的第一实施例提供了一种基于关键词进行检索的方法200,可选地由服务器执行,其流程如图2所示,包括:
S210、获取用户当前搜索的关键词。
当用户需要进行搜索时,在终端设备的应用程序界面上的搜索框中输入关键词,所述关键词包括一个或多个字、词、短语和/或句子等。服务器通过网络从终端设备获取所输入的关键词。
S220、根据所述关键词判断是否属于目标搜索场景,若是,则生成补充引导信息并发送至所述用户的终端以呈现。
其中,所述目标搜索场景是基于历史搜索数据归纳得到的,可选地为专业性和权威性较强的搜索场景,例如医疗健康、法律法规等。可选地,所述目标搜索场景包括对应的垂类和分类,每个垂类包括多个分类,每个分类中预设有指定关键词。
该步骤具体地包括:
将所述关键词输入预先生成的垂类判断模型以判断是否属于目标垂类;
若是,则获取所述目标垂类对应的分类判断模型,将所述关键词输入所述分类判断模型以判断是否属于目标分类;
若是,则获取所述目标分类中的指定关键词集合,从所述指定关键词集合中获取与所述关键词匹配的指定关键词;
根据所述指定关键词生成补充引导信息。
所述补充引导信息用于引导用户补充搜索信息,可选地包括问题及其选项。
S230、获取补充搜索信息,所述补充搜索信息是根据用户对所述补充引导信息的操作而生成的。
在补充引导信息呈现后,用户根据所述补充引导信息进行点击、输入等操作,生成补充搜索信息。可选地,用户针对补充引导信息中的每个问题,选择其相应的选项,所述问题及用户选择的选项内容组成补充搜索信息。通过该方式,用户只需在给定的选项中点选而无需输入文字,避免了表达方式的差异,保障了补充搜索信息的规范性。
S240、根据所述关键词和所述补充搜索信息进行搜索。
可选地,使用所述关键词得到搜索结果,再基于所述补充搜索信息对搜索结果进行筛选和/或排序,从而得到符合用户需求的搜索结果。或者可选地,先根据所述补充搜索信息生成补充关键词,再同时使用用户输入的所述关键词和补充关键词进行搜索,得到最终的搜索结果。
可选地,所述方法在步骤S210之后,还包括如下步骤:
根据所述关键词确定搜索提示词并发送所述搜索提示词至所述用户的终端以呈现;
在步骤S240中,根据所述关键词或用户选择的搜索提示词以及所述补充搜索信息进行搜索。其中,判断是否接收到用户对搜索提示词的选择操作,如是,则根据用户选择的搜索提示词以及所述补充搜索信息进行搜索,否则,根据所述关键词以及所述补充搜索信息进行搜索。
由此,可以同时向用户呈现搜索提示词以及补充引导信息,用户可以从搜索提示词中选择较输入的关键词更符合自己需求的关键词,用于和补充搜索信息结合进行搜索,从而进一步提高了搜索效率和准确性。
本公开上述实施例的方法根据关键词确定目标搜索场景并生成补充引导信息,以引导用户补充搜索信息,从而使得搜索结果更加符合用户的实际需求,减少了用户重复搜索的场景数量,降低用户搜索成本,提高了搜索效率和准确性,有效提升了用户体验。
图3示出了根据本公开第一实施例的方法中步骤220的具体流程,包括:
S221、将关键词输入预先生成的垂类判断模型;
S222、根据垂类判断模型的输出判断是否属于某一目标垂类,如是,则进入步骤S223,否则进入步骤S228;
S223、获取所述目标垂类的分类判断模型,将所述关键词输入步骤S222中获取的分类判断模型;
S224、根据分类判断模型的输出确定是否属于某一目标分类,如是,则进入步骤S225,否则进入步骤S228;
S225、获取所述目标分类中的指定关键词集合,进行关键词泛化匹配;
其中,所述关键词泛化匹配包括对所述关键词进行泛化处理,得到其泛化表达,再从所述指定关键词集合中查询与所述关键词或其泛化表达相同的指定关键词。关键词泛化处理是指获取与所述关键词具有关联性的其它关键词,例如通过查找同义词、近义词或者通过语义分析得到。可选地,所述关键词泛化处理是采用自然语言处理NLP(NaturalLanguage Processing)中的BERT(Bidirectional Encoder Representations fromTransformers)模型,其基于深度transformer的双向编码表征,通过导入大量的数据来训练得到一个泛化能力很强的模型。BERT数据输入可以是单一的句子或者是句子对,在涉及关键词文本相似度计算等特定泛化场景的使用时,只需要修改输出层,用正向的数据进行增量训练,对权重进行轻微的调整。
S226、判断是否匹配得到指定关键词,如是,则进入步骤S227,否则进入步骤S228;
S227、按照预设规则获取与所述指定关键词对应的补充引导信息并发送至用户的终端设备;
S228、不属于目标搜索场景,无补充引导信息。此时按照现有搜索流程处理。
在该实施例中,所述垂类判断模型和分类判断模型是按照下述方式预先生成的:
首先,根据历史搜索数据归纳得到所述垂类。所述历史搜索数据包括query(搜索词或查询词)、搜索结果的PV(页面浏览量)等。可选地,对于PV(页面浏览量)大于第一预设阈值的query进行归纳、概括得到垂类及其审核标准。
然后,从所述历史搜索数据中获取属于每个垂类的query(搜索词或查询词),对所述query排序并归类得到所述垂类包含的分类。其中,根据各query的PV(页面浏览量)对query进行降序排列并归类得到分类,以及对所述query的数据特征进行分析,制定分类的审核标准。
之后,利用神经网络模型对历史搜索数据进行训练,生成所述垂类判断模型和分类判断模型。其中,作为模型训练的语料,文本形式的历史搜索数据无法直接使用,需要对上述数据进行预处理,拆解为机器语言,例如将历史搜索数据的文本通过分词转换为一个个数字,由神经网络模型通过语料训练得到词向量,一个语料训练出一个词向量文件,不同语料训练出不同的词向量文件,实现由词到向量的转换过程。从经过预处理生成的向量文件中确定一个训练集,其中每一条数据都按照上述垂类或分类的审核标准被标记,之后采用CNN(卷积神经网络)进行训练。神经网络最简单的结构包括输入层、隐含层和输出层,每一层网络有多个神经元,上一层的神经元通过激活函数映射到下一层神经元,每个神经元之间有相对应的权值,训练集数据作为输入,输出即为我们的分类类别。可选地,通过反向传播的训练过程来调整神经元对应的权重,反向传播过程分为四部分:前向传导、损失函数、后向传导以及权重更新,其中损失函数采用MSE,训练的目标是预测标记(卷积网络的输出)与训练标记相同,也就意味着模型预测正确,能够对搜索词进行正确的垂类或分类判断。按照该方式,最终训练得到垂类判断模型和分类判断模型。可选地,所述训练集中包括正例和负例,从而优化模型训练效果。
在得到分类判断模型后,对于每个分类,从历史搜索数据中确定指定关键词,例如对历史搜索数据中属于该分类的query进行去重、合并等处理后作为指定关键词,并对每个指定关键词设置相应的补充引导信息。
由此,当用户输入搜索关键词时,依次通过垂类判断模型和分类判断模型进行判断,对符合某一分类的搜索词再进行关键词泛化匹配,触发指定关键词时显示搜索补充引导信息。此外,可以根据业务场景的拓展,不断修正判断模型的标准,增加指定关键词的数据库,从而动态优化场景判断的准确性。例如,定期获取历史搜索数据,更新所述垂类、分类及其判断模型;基于属于某一个分类,但未匹配到指定关键词的query补充指定关键词以及相应的补充引导信息。
在该实施例中,通过垂类、分类、指定关键词的多级匹配方式,可以减少总的运算量,以高效地生成补充引导信息。可选地,可以采用较少或更多级的类别匹配,来识别是否属于目标搜索场景。
本公开的第二实施例提供了一种基于关键词进行搜索的方法400,可选地由终端设备执行,其流程如图4所示,包括:
S410、接收用户输入的关键词;
其中,用户在终端设备的应用程序界面上的搜索框中输入所述关键词,所述关键词包括一个或多个字、词、短语和/或句子等。所输入关键词被发送至服务器。
S420、获取补充引导信息并呈现,所述补充引导信息是在所述关键词属于目标搜索场景时生成的;
其中,所述补充引导信息以可交互的方式呈现在搜索框的下方,包括一个或多个问题及其选项,用户可通过点击等方式对补充引导信息中的选项做出选择。所述补充引导信息的生成过程在本公开第一实施例中已进行了详细说明,在此不再赘述。
S430、接收所述用户对所述补充引导信息的操作并生成补充搜索信息;
其中,接收所述用户针对每个所述问题的选项进行的选择操作,根据所述问题以及所选择的选项的内容生成补充搜索信息。
S440、获取搜索结果并呈现,所述搜索结果是根据所述关键词以及所述补充搜索信息进行搜索的结果。
进一步地,所述方法还包括:
接收根据所述关键词确定的搜索提示词;
在呈现所述补充引导信息的同时呈现所述搜索提示词;
获取搜索结果并呈现,所述搜索结果是根据所述关键词或所述搜索提示词以及所述补充搜索信息进行搜索的结果。
其中,若用户选择了搜索提示词,则所述搜索结果是根据用户选择的搜索提示词以及所述补充搜索信息进行搜索的结果,否则,所述搜索结果是根据所述关键词以及所述补充搜索信息进行搜索的结果。
本公开上述实施例的方法通过在关键词属于目标搜索场景时呈现补充引导信息,以引导用户补充搜索信息,从而使得搜索结果更加符合用户的实际需求,减少了用户重复搜索的场景数量,降低用户搜索成本,提高了搜索效率和准确性,有效提升了用户体验。
本公开的第三实施例提供了一种基于关键词进行搜索的装置500,其可选地位于服务器中,如图5所示,所述装置的结构包括:
获取模块510,用于获取用户当前搜索的关键词。
补充引导信息生成模块520,用于根据所述关键词判断是否属于目标搜索场景,若是,则生成补充引导信息并发送至所述用户的终端以呈现。
补充搜索信息获取模块530,用于获取补充搜索信息,所述补充搜索信息是根据用户对所述补充引导信息的操作而生成的。
搜索模块540,用于根据所述关键词和所述补充搜索信息进行搜索。
其中,补充引导信息生成模块520进一步包括:
垂类判断单元521,用于将所述关键词输入预先生成的垂类判断模型以判断是否属于目标垂类。
分类判断单元522,用于获取目标垂类对应的分类判断模型,将所述关键词输入所述分类判断模型以判断是否属于目标分类。
关键词匹配单元523,用于获取目标分类中的指定关键词集合,从所述指定关键词集合中获取与所述关键词匹配的指定关键词。具体地,包括泛化子单元,用于对所述关键词进行泛化处理,得到其泛化表达;查询子单元,用于从所述指定关键词集合中查询与所述关键词或其泛化表达相同的指定关键词,作为与所述关键词匹配的指定关键词。
生成单元524,用于根据所述指定关键词生成补充引导信息。具体地,包括按照预设规则获取与所述指定关键词对应的补充引导信息,所述补充引导信息包括问题及其选项。
其中,所述垂类判断模型和分类判断模型是按照下述方式预先生成的:
根据历史搜索数据归纳得到所述垂类;
从所述历史搜索数据中获取属于每个垂类的搜索词,对所述搜索词排序并归类得到所述垂类包含的分类;
利用神经网络模型对历史搜索数据进行训练,生成所述垂类判断模型和分类判断模型。
进一步地,所述装置500还包括提示词确定模块(未示出),用于根据所述关键词确定搜索提示词,并发送所述搜索提示词至所述用户的终端以呈现。搜索模块540还用于根据用户选择的搜索提示词以及所述补充搜索信息进行搜索。
本公开上述实施例的装置根据关键词确定目标搜索场景并生成补充引导信息,以引导用户补充搜索信息,从而使得搜索结果更加符合用户的实际需求,减少了用户重复搜索的场景数量,降低用户搜索成本,提高了搜索效率和准确性,有效提升了用户体验。
本公开的第四实施例提供了一种基于关键词进行搜索的装置600,其可选地位于终端设备中,如图6所示,所述装置的结构包括:
接收模块610,用于接收用户输入的关键词。
补充引导信息获取模块620,用于获取补充引导信息并呈现,所述补充引导信息是在所述关键词属于目标搜索场景时生成的。
补充搜索信息生成模块630,用于接收所述用户对所述补充引导信息的操作并生成补充搜索信息。
搜索结果获取模块640,用于获取搜索结果并呈现,所述搜索结果是根据所述关键词以及所述补充搜索信息进行搜索的结果。
进一步地,所述装置600还包括提示词接收模块和提示词呈现模块(未示出),所述提示词接收模块用于接收根据所述关键词确定的搜索提示词,所述提示词呈现模块用于在呈现所述补充引导信息的同时呈现所述搜索提示词。所述搜索结果获取模块640获取的搜索结果是根据所述关键词或所述搜索提示词以及所述补充搜索信息进行搜索的结果。
本公开上述实施例的装置通过在关键词属于目标搜索场景时呈现补充引导信息,以引导用户补充搜索信息,从而使得搜索结果更加符合用户的实际需求,减少了用户重复搜索的场景数量,降低用户搜索成本,提高了搜索效率和准确性,有效提升了用户体验。
本公开的第五实施例提供了基于关键词进行搜索的一个具体示例,其在终端设备上呈现的补充引导信息如图7所示。在该实施例中,所述目标搜索场景包括医疗健康搜索场景、法律法规搜索场景、宠物搜索场景、植物搜索场景、三农搜索场景和健身搜索场景,对应地包括医疗健康、法律法规、宠物、植物、三农、健身等6个垂类,每个垂类中包括多个分类,如下表所示:
Figure BDA0002400415850000131
Figure BDA0002400415850000141
基于以上垂类和分类,利用历史搜索数据预先训练生成垂类判断模型和分类判断模型,且为每个分类生成指定关键词集合,每个指定关键词均具有对应的补充引导信息,上述模型及数据均存储在服务器的数据库中。
当用户检索时,终端设备接收用户输入的关键词,例如“感冒”,将所输入的关键词发送至服务器。服务器将所述关键词输入垂类判断模型,判断是否属于某一目标垂类,对于关键词“感冒”,判断属于“医疗健康”垂类,则进入下一步,将所述关键词输入所述目标垂类的分类判断模型,判断是否属于某一目标分类,对于关键词“感冒”,判断属于“医疗健康”垂类中的“疾病咨询”分类,则进入下一步,获取所述目标分类的指定关键词集合,判断是否存在与所述关键词或其泛化表达匹配的指定关键词,对于关键词“感冒”,在所述“疾病咨询”分类的指定关键词集合中匹配得到指定关键词“感冒”,则进入下一步,服务器根据指定关键词生成补充引导信息,对于关键词“感冒”,获取指定关键词“感冒”对应的补充引导信息,包括患者年龄、感冒类型、感冒时间、症状等问题和选项。并行地,服务器根据所述关键词生成sug词,并将其与所述补充引导信息一起发送至终端设备。终端设备在界面上呈现所述补充引导信息和sug词,如图7所示,在搜索框的下方呈现所述补充引导信息,以由用户根据自身情况进行点选;在补充引导信息的下方,呈现所述sug词。所述补充引导信息和sug词也可以呈现在界面上的其它位置。在用户完成选择并点击确定之后,终端设备根据用户对所述补充引导信息的操作生成补充搜索信息,例如“患者年龄18以上;感冒类型病毒性感冒;感冒1-3天;症状有发烧、咳嗽、四肢无力”。最后,终端设备接收用户对某一sug词或者搜索控件的点击操作,将所述补充搜索信息和所述关键词或点击的sug词发送至服务器。例如:用户点击搜索框一侧的搜索控件,则终端设备将关键词“感冒”和上述补充搜索信息发送至服务器;或者,用户点击sug词中的“感冒怎么好得快”,则终端设备将关键词“感冒怎么好得快”和上述补充搜索信息发送至服务器。服务器根据所述补充搜索信息和所述关键词或点击的sug词进行搜索,得到搜索结果并返回至终端设备以呈现给用户。
本公开的实施例还提供了一种电子设备。该电子设备包括:存储器和处理器,所述存储器上存储有计算机程序,所述处理器执行所述程序时实现如上所述的方法。进一步地,还提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上所述的方法。图8示出了可以用来实施本公开的实施例的电子设备800的示意性框图。如图所示,设备800包括中央处理单元(CPU)801,其可以根据存储在只读存储器(ROM)802中的计算机程序指令或者从存储单元808加载到随机访问存储器(RAM)803中的计算机程序指令,来执行各种适当的动作和处理。在RAM 803中,还可以存储设备800操作所需的各种程序和数据。CPU 801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
设备800中的多个部件连接至I/O接口805,包括:输入单元806,例如键盘、鼠标等;输出单元807,例如各种类型的显示器、扬声器等;存储单元808,例如磁盘、光盘等;以及通信单元809,例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理单元801执行上文所描述的各个方法和处理,例如方法200、400。例如,在一些实施例中,方法200、400可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。在一些实施例中,计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到RAM 803并由CPU 801执行时,可以执行上文描述的方法200、400的一个或多个步骤。备选地,在其他实施例中,CPU801可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行方法200、400。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)等等。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
此外,虽然采用特定次序描绘了各操作,但是这应当理解为要求这样操作以所示出的特定次序或以顺序次序执行,或者要求所有图示的操作应被执行以取得期望的结果。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实现中。相反地,在单个实现的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实现中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (13)

1.一种基于关键词进行搜索的方法,其特征在于,包括:
获取用户当前搜索的关键词;
根据所述关键词判断是否属于目标搜索场景,若是,则生成补充引导信息并发送至所述用户的终端以呈现;
获取补充搜索信息,所述补充搜索信息是根据用户对所述补充引导信息的操作而生成的;
根据所述关键词和所述补充搜索信息进行搜索。
2.根据权利要求1所述的方法,其特征在于,所述根据所述关键词确定是否属于目标搜索场景,若是,则生成补充引导信息包括:
将所述关键词输入预先生成的垂类判断模型以判断是否属于目标垂类;
若是,则获取所述目标垂类对应的分类判断模型,将所述关键词输入所述分类判断模型以判断是否属于目标分类;
若是,则获取所述目标分类中的指定关键词集合,从所述指定关键词集合中获取与所述关键词匹配的指定关键词;
根据所述指定关键词生成补充引导信息。
3.根据权利要求2所述的方法,其特征在于,所述垂类判断模型和分类判断模型是按照下述方式生成的:
根据历史搜索数据归纳得到所述垂类;
从所述历史搜索数据中获取属于每个垂类的搜索词,对所述搜索词排序并归类得到所述垂类包含的分类;
利用神经网络模型对历史搜索数据进行训练,生成所述垂类判断模型和分类判断模型。
4.根据权利要求2所述的方法,其特征在于,所述从所述指定关键词集合中获取与所述关键词匹配的指定关键词包括:
对所述关键词进行泛化处理,得到其泛化表达;
从所述指定关键词集合中查询与所述关键词或其泛化表达相同的指定关键词,作为与所述关键词匹配的指定关键词。
5.根据权利要求2所述的方法,其特征在于,所述根据所述指定关键词生成补充引导信息包括:
按照预设规则获取与所述指定关键词对应的补充引导信息,所述补充引导信息包括问题及其选项。
6.根据权利要求1所述的方法,其特征在于,还包括:
根据所述关键词确定搜索提示词并发送所述搜索提示词至所述用户的终端以呈现;
根据所述关键词或用户选择的搜索提示词以及所述补充搜索信息进行搜索。
7.一种基于关键词进行搜索的方法,其特征在于,包括:
接收用户输入的关键词;
获取补充引导信息并呈现,所述补充引导信息是在所述关键词属于目标搜索场景时生成的;
接收所述用户对所述补充引导信息的操作并生成补充搜索信息;
获取搜索结果并呈现,所述搜索结果是根据所述关键词以及所述补充搜索信息进行搜索的结果。
8.根据权利要求7所述的方法,其特征在于,所述补充引导信息包括问题及其选项;
所述接收所述用户对所述补充引导信息的操作并生成补充搜索信息包括:
接收所述用户针对每个所述问题的选项进行的选择操作;
根据所述问题以及所选择的选项的内容生成补充搜索信息。
9.根据权利要求8所述的方法,其特征在于,还包括:
接收根据所述关键词确定的搜索提示词;
在呈现所述补充引导信息的同时呈现所述搜索提示词;
获取搜索结果并呈现,所述搜索结果是根据所述关键词或所述搜索提示词以及所述补充搜索信息进行搜索的结果。
10.一种基于关键词进行搜索的装置,其特征在于,包括:
获取模块,用于获取用户当前搜索的关键词;
补充引导信息生成模块,用于根据所述关键词判断是否属于目标搜索场景,若是,则生成补充引导信息并发送至所述用户的终端以呈现;
补充搜索信息获取模块,用于获取补充搜索信息,所述补充搜索信息是根据用户对所述补充引导信息的操作而生成的;
搜索模块,用于根据所述关键词和所述补充搜索信息进行搜索。
11.一种基于关键词进行搜索的装置,其特征在于,包括:
接收模块,用于接收用户输入的关键词;
补充引导信息获取模块,用于获取补充引导信息并呈现,所述补充引导信息是在所述关键词属于目标搜索场景时生成的;
补充搜索信息生成模块,用于接收所述用户对所述补充引导信息的操作并生成补充搜索信息;
搜索结果获取模块,用于获取搜索结果并呈现,所述搜索结果是根据所述关键词以及所述补充搜索信息进行搜索的结果。
12.一种电子设备,包括存储器和处理器,所述存储器上存储有计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1~9中任一项所述的方法。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1~9中任一项所述的方法。
CN202010144955.XA 2020-03-04 2020-03-04 基于关键词进行搜索的方法、装置、设备及存储介质 Active CN111339424B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010144955.XA CN111339424B (zh) 2020-03-04 2020-03-04 基于关键词进行搜索的方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010144955.XA CN111339424B (zh) 2020-03-04 2020-03-04 基于关键词进行搜索的方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN111339424A true CN111339424A (zh) 2020-06-26
CN111339424B CN111339424B (zh) 2021-05-14

Family

ID=71182175

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010144955.XA Active CN111339424B (zh) 2020-03-04 2020-03-04 基于关键词进行搜索的方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111339424B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111767259A (zh) * 2020-06-29 2020-10-13 北京字节跳动网络技术有限公司 内容分享的方法、装置、可读介质和电子设备
CN112905643A (zh) * 2021-03-11 2021-06-04 广西电力职业技术学院 一种从汽车故障案例库自动检索的方法和系统
CN117392826A (zh) * 2023-12-11 2024-01-12 吉林大学 一种基于大数据的网络信息预警方法及系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7562069B1 (en) * 2004-07-01 2009-07-14 Aol Llc Query disambiguation
CN102456018A (zh) * 2010-10-18 2012-05-16 腾讯科技(深圳)有限公司 一种交互搜索方法及装置
US20120271843A1 (en) * 2011-04-19 2012-10-25 International Business Machines Corporation Computer Processing Method and System for Searching
CN103294777A (zh) * 2013-05-13 2013-09-11 沈文策 一种问题解答方法及系统
US8700621B1 (en) * 2012-03-20 2014-04-15 Google Inc. Generating query suggestions from user generated content
CN106339756A (zh) * 2016-08-25 2017-01-18 北京百度网讯科技有限公司 训练数据的生成方法、搜索方法以及装置
CN107784029A (zh) * 2016-08-31 2018-03-09 阿里巴巴集团控股有限公司 生成提示关键词、建立索引关系的方法、服务器和客户端
CN108846037A (zh) * 2018-05-29 2018-11-20 天津字节跳动科技有限公司 提示搜索词的方法和装置
CN109635196A (zh) * 2018-12-17 2019-04-16 广东小天才科技有限公司 一种基于多义词的智能搜索方法及家教设备
CN109871483A (zh) * 2019-01-22 2019-06-11 珠海天燕科技有限公司 一种推荐信息的确定方法及装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7562069B1 (en) * 2004-07-01 2009-07-14 Aol Llc Query disambiguation
CN102456018A (zh) * 2010-10-18 2012-05-16 腾讯科技(深圳)有限公司 一种交互搜索方法及装置
US20120271843A1 (en) * 2011-04-19 2012-10-25 International Business Machines Corporation Computer Processing Method and System for Searching
US8700621B1 (en) * 2012-03-20 2014-04-15 Google Inc. Generating query suggestions from user generated content
CN103294777A (zh) * 2013-05-13 2013-09-11 沈文策 一种问题解答方法及系统
CN106339756A (zh) * 2016-08-25 2017-01-18 北京百度网讯科技有限公司 训练数据的生成方法、搜索方法以及装置
CN107784029A (zh) * 2016-08-31 2018-03-09 阿里巴巴集团控股有限公司 生成提示关键词、建立索引关系的方法、服务器和客户端
CN108846037A (zh) * 2018-05-29 2018-11-20 天津字节跳动科技有限公司 提示搜索词的方法和装置
CN109635196A (zh) * 2018-12-17 2019-04-16 广东小天才科技有限公司 一种基于多义词的智能搜索方法及家教设备
CN109871483A (zh) * 2019-01-22 2019-06-11 珠海天燕科技有限公司 一种推荐信息的确定方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SUKYOUNG KIM ET AL: "Search word suggestion conversation agent of user experience based on improvement of smart phone usability", 《2012 6TH INTERNATIONAL CONFERENCE ON NEW TRENDS IN INFORMATION SCIENCE, SERVICE SCIENCE AND DATA MINING》 *
肖海鹏: "基于Web挖掘的搜索关键词建议研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111767259A (zh) * 2020-06-29 2020-10-13 北京字节跳动网络技术有限公司 内容分享的方法、装置、可读介质和电子设备
CN112905643A (zh) * 2021-03-11 2021-06-04 广西电力职业技术学院 一种从汽车故障案例库自动检索的方法和系统
CN112905643B (zh) * 2021-03-11 2022-12-16 广西电力职业技术学院 一种从汽车故障案例库自动检索的方法和系统
CN117392826A (zh) * 2023-12-11 2024-01-12 吉林大学 一种基于大数据的网络信息预警方法及系统
CN117392826B (zh) * 2023-12-11 2024-02-13 吉林大学 一种基于大数据的网络信息预警方法及系统

Also Published As

Publication number Publication date
CN111339424B (zh) 2021-05-14

Similar Documents

Publication Publication Date Title
US10896212B2 (en) System and methods for automating trademark and service mark searches
CN111125334B (zh) 一种基于预训练的搜索问答系统
CN109408622B (zh) 语句处理方法及其装置、设备和存储介质
CN111339424B (zh) 基于关键词进行搜索的方法、装置、设备及存储介质
CN104216913A (zh) 问题回答框架
CN112035599B (zh) 基于垂直搜索的查询方法、装置、计算机设备及存储介质
CN111753167B (zh) 搜索处理方法、装置、计算机设备和介质
CN112307182B (zh) 一种基于问答系统的伪相关反馈的扩展查询方法
CN109948154B (zh) 一种基于邮箱名的人物获取及关系推荐系统和方法
CN110442702A (zh) 搜索方法、装置、可读存储介质和电子设备
CN110990533A (zh) 确定查询文本所对应标准文本的方法及装置
WO2022151594A1 (zh) 智能推荐的方法、装置以及计算机设备
CN1629837A (zh) 电子文档的处理、浏览及分类查询的方法、装置及其系统
CN114840671A (zh) 对话生成方法、模型的训练方法、装置、设备及介质
US11379527B2 (en) Sibling search queries
CN116610810A (zh) 基于调控云知识图谱血缘关系的智能搜索方法及系统
CN112445902A (zh) 一种多轮对话中用户意图的识别方法及相关设备
CN115713349A (zh) 一种小样本评论数据驱动的产品关键用户需求挖掘方法
CN112800314B (zh) 搜索引擎询问自动补全的方法、系统、存储介质及设备
CN112650951A (zh) 一种企业相似度匹配方法、系统和计算装置
CN113449165A (zh) 搜索引擎优化方法、装置、设备及存储介质
CN117033613B (zh) 一种应答文本的生成方法、电子设备及存储介质
CN117033584B (zh) 类案文本确定方法、装置及电子设备
CN113672700B (zh) 内容项的搜索方法、装置、电子设备以及存储介质
US11550782B2 (en) Machine learning systems and methods for interactive concept searching using attention scoring

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee after: Douyin Vision Co.,Ltd.

Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee before: Tiktok vision (Beijing) Co.,Ltd.

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee after: Tiktok vision (Beijing) Co.,Ltd.

Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee before: BEIJING BYTEDANCE NETWORK TECHNOLOGY Co.,Ltd.