CN112765424B - 数据查询方法、装置、设备及计算机可读介质 - Google Patents

数据查询方法、装置、设备及计算机可读介质 Download PDF

Info

Publication number
CN112765424B
CN112765424B CN202110129388.5A CN202110129388A CN112765424B CN 112765424 B CN112765424 B CN 112765424B CN 202110129388 A CN202110129388 A CN 202110129388A CN 112765424 B CN112765424 B CN 112765424B
Authority
CN
China
Prior art keywords
query
query request
request
type
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110129388.5A
Other languages
English (en)
Other versions
CN112765424A (zh
Inventor
关凯文
吴狄
王永娴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Douyin Vision Co Ltd
Original Assignee
Douyin Vision Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Douyin Vision Co Ltd filed Critical Douyin Vision Co Ltd
Priority to CN202110129388.5A priority Critical patent/CN112765424B/zh
Publication of CN112765424A publication Critical patent/CN112765424A/zh
Application granted granted Critical
Publication of CN112765424B publication Critical patent/CN112765424B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种数据查询方法、装置、设备及计算机可读介质,涉及数据处理的技术领域。该方法包括:获取用户的查询请求,并向服务器发送查询请求;接收服务器基于查询请求返回的结构化形态和查询结果;其中,结构化形态和查询结果基于目标查询类型确定;基于结构化形态的展示方式展示查询结果。本公开实施例通过获取用户查询请求,并接收服务器基于该查询请求返回的结构化形态和查询结果,基于该结构化形态展示该查询结果,其中,结构化形态和查询结果基于目标查询类型确定,目标查询类型是查询请求在预设查询类型中匹配得到的,不需要人工对查询请求进行分类,降低运营成本,且查询展示效率更高,提升用户体验。

Description

数据查询方法、装置、设备及计算机可读介质
技术领域
本公开涉及数据处理的技术领域,具体而言,本公开涉及一种数据查询方法、装置、设备及计算机可读介质。
背景技术
随着互联网技术的快速发展,信息的传递速度也越来越快,传播范围也越来越广,人们对于未知的事物,都可以通过上网进行查询。
网络中的查询意图种类丰富,对于不同需求的查询,现有的很多搜索引擎会做出不同的结构化样式来承接回答内容。而目前的各大搜索引擎,主要是依赖人工运营方式,对各种各样的查询进行聚类,用于判断查询适合的结构化形式,对查询的聚类成本较高,在对查询进行结果展示时,无法快速准确的确定查询结果的展示模板,用户查看不方便,搜索结果不能满足需求或者不能给出用户答案,需要用户二次搜索,准确性差,搜索效率低等。
由此可见,现有的查询结果展示中,对于查询种类的分类主要依赖人工进行,导致确定查询结果展示模板的效率低、成本高,搜索结果不能满足需求或者不能给出用户答案,需要用户二次搜索,准确性差,搜索效率低,需要改进。
发明内容
本公开提供了一种数据查询方法、装置、设备及计算机可读介质,用于解决现有的查询结果展示中,对于查询种类的分类主要依赖人工进行,导致确定查询结果展示模板的效率低、成本高,无法满足现代社会的需求的技术问题。
第一方面,提供了一种数据查询方法,应用于用户终端,该数据查询方法包括:
获取用户的查询请求,并向服务器发送所述查询请求;
接收服务器基于所述查询请求返回的结构化形态和查询结果;其中,所述结构化形态和所述查询结果基于目标查询类型确定,所述目标查询类型是所述查询请求在预设查询类型中匹配得到的;
基于所述结构化形态的展示方式展示所述查询结果。
第二方面,提供了一种数据查询方法,应用于服务器,该数据查询方法包括:
接收用户终端发送的查询请求,基于所述查询请求在预设查询类型中确定目标查询类型;
根据所述查询请求和所述目标查询类型获取查询结果;
基于所述查询类型确定对应的结构化形态,并通过所述结构化形态的展示方式将所述查询结果发送至所述用户终端。
第三方面,提供了一种数据查询装置,包括:
请求获取模块,用于获取用户的查询请求,并向服务器发送所述查询请求;
结果获取模块,用于接收服务器基于所述查询请求返回的结构化形态和查询结果;其中,所述结构化形态和所述查询结果基于目标查询类型确定,所述目标查询类型是所述查询请求在预设查询类型中匹配得到的;
展示模块,用于基于所述结构化形态的展示方式展示所述查询结果。
第四方面,提供了一种数据查询装置,包括:
请求接收模块,用于接收用户终端发送的查询请求,基于所述查询请求在预设查询类型中确定目标查询类型;
结果确认模块,用于根据所述查询请求和所述目标查询类型获取查询结果;
展示方式确认模块,用于基于所述目标查询类型确定对应的结构化形态,并通过所述结构化形态的展示方式将所述查询结果发送至所述用户终端。
第五方面,提供了一种电子设备,包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行上述的数据查询方法。
第六方面,提供了一种计算机可读存储介质,所述可读介质存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述的数据查询方法。
本公开实施例通过获取用户查询请求,并接收服务器基于该查询请求返回的结构化形态和查询结果,基于该结构化形态展示该查询结果,其中,结构化形态和查询结果基于目标查询类型确定,目标查询类型是查询请求在预设查询类型中匹配得到的,不需要人工对查询请求进行分类,降低运营成本,且查询展示效率更高,提升用户体验。
附图说明
为了更清楚地说明本公开实施例中的技术方案,下面将对本公开实施例描述中所需要使用的附图作简单地介绍。
图1为本公开实施例提供的一种应用于用户终端的数据查询方法的流程示意图;
图2为本公开实施例提供的一种结构化形态展示方式示意图;
图3为本公开实施例提供的一种应用于服务器的数据查询方法流程示意图;
图4为本公开实施例提供的一种短答案长文本展示方式示意图;
图5为本公开实施例提供的一种疾病卡片展示方式示意图;
图6为本公开实施例提供的一种相关疾病列表展示方式示意图;
图7为本公开实施例提供的一种内容分条相关推荐展示方式示意图;
图8为本公开实施例提供的一种查询类型确认方法流程示意图;
图9为本公开实施例提供的一种根据标准句式确认方法流程示意图;
图10为本公开实施例提供的一种基于查询请求确认标准句式的方法的流程示意图;
图11为本公开实施例提供的一种特征向量提取方法的流程示意图;
图12为本公开实施例提供的一种特征向量提取模型结构示意图;
图13为本公开实施例提供的一种模型训练方法的流程示意图;
图14为本公开实施例提供的一种通过模型确认查询类型的方法的流程示意图;
图15为本公开实施例提供的一种相关性确认模型的训练方法的流程示意图;
图16为本公开实施例提供的一种基于用户历史行为数据确认查询类型的方法的流程示意图;
图17为本公开实施例提供的一种查询结果确认方法的流程示意图;
图18为本公开实施例提供的一种数据查询装置的结构示意图;
图19为本公开实施例提供的一种应用于服务器的数据查询装置的结构示意图;
图20为本公开实施例提供的一种电子设备的结构示意图。
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对装置、模块或单元进行区分,并非用于限定这些装置、模块或单元一定为不同的装置、模块或单元,也并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
下面以具体地实施例对本公开的技术方案以及本公开的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本公开的实施例进行描述。
本公开实施例中提供了一种数据查询方法,应用于用户在终端,如图1所示,该方法包括:
步骤S101,获取用户的查询请求,并向服务器发送查询请求。
在本公开实施例中,提供的数据查询方法应用于用户终端,其中,用户终端是具有上网功能的电子设备,可以是电脑、平板电脑、手机、智能手表、车载电脑等,其中,该用户终端可以自带或者外接有用于显示查询结果的显示装置,如显示屏。在本公开实施例中,查询请求可以多种多样,包括用户需要查询的内容,其包含的领域也可能多种多样,例如,以医学领域为例,查询请求的具体形式可以是文本信息,如“孕妇可以吃香蕉吗?”,用户终端接收用户的查询请求的方式可以是接收用户通过外接输入设备输入的文本信息,也可以是通过语音接收装置接收用户的语音输入信息,并将语音输入信息转化为文本信息,还可以是通过图像接收装置接收图形信息,并基于图像信息生成查询请求的文本信息。在获取到用户的查询请求之后,将该查询请求发送至服务器。
步骤S102,接收服务器基于查询请求返回的结构化形态和查询结果;其中,结构化形态和查询结果基于目标查询类型确定,目标查询类型是查询请求在预设查询类型中匹配得到的。
在本公开实施例中,服务器接收到查询请求后,会基于该查询请求返回对应的结构化形态和查询结果。其中,结构化形态是指用于展示查询结果的形态,可以是预先设置的展示形态,如文字卡片,其中,结构化形态和查询结果都是基于目标查询类型确定的,该目标查询类型时该查询请求在预设的查询类型中匹配得到的。作为本公开一种可能的实施方式,如图2所示,结构化形态可以是文字卡片,该结构化形态中包括用于展示查询请求的区域201、用于展示该查询请求对应的查询结果的区域202、以及说明展示区域203,其中,查询结果按照预设的排版格式进行展示。
步骤S103,基于结构化形态的展示方式展示查询结果。
在本公开实施例中,在确定查询请求对应的结构化形态和查询结果后,基于该结构化展示形态的展示方式对该查询结果进行展示。
本公开实施例通过基于查询请求确定该查询请求对应的目标查询类型,并基于目标查询类型确定该查询请求对应的结构化形态,按照该结构化形态的展示方式对该查询请求的查询结果进行展示,能给降低查询请求与展示形态匹配的人工运行成本,提高线索分析效率,提升用户的产品体验。
本公开实施例提供了一种数据查询方法,应用于服务器,如图3所示,包括:
步骤S301,接收用户终端发送的查询请求,基于查询请求在预设查询类型中确定目标查询类型。
在本公开实施例中,服务器接收用户终端发送的查询请求,其中,查询请求可以多种多样,包括用户需要查询的内容,其包含的领域也可能多种多样,例如,以医学领域为例,查询请求的具体形式可以是文本信息,如“孕妇可以吃香蕉吗?”。基于该查询请求,服务器可以在预设的数据库中确定与该查询请求对应的目标查询类型,其中,目标查询类型用于表示其对应的查询请求的查询类别,针对不同的查询类别,可以对应不同的查询结果的展示形态。
步骤S302,根据查询请求和目标查询类型获取查询结果。
在本公开实施例中,在确定查询请求的目标查询类型之后,基于该查询请求和该查询请求对应的目标查询类型确定查询结果,其中,查询结果中的内容用于回答该查询请求。作为本公开实施例一种可能的实施方式,在获取查询结果时,可以基于查询请求对应的目标查询类型,确定对应格式的查询请求结果。
步骤S303,基于查询类型确定对应的结构化形态,并通过结构化形态的展示方式将查询结果发送至用户终端。
在本公开是实施例中,在对查询结果进行展示之前,需要确定用于展示该查询结果的结构化形态,其中,该结构化形态是基于目标查询类型确定的,不同的目标查询类型会对应不同的结构化展示形态,不同的结构化展示形态对查询结果的展示方式不同。作为本公开一种可能的实施方式,对于查询请求里包括“是/否”、“能/不能”等问询类关键词时,其对应的结构化展示形态可以是短答案长文本类类的结构化展示形态,如图4所示,其中,短答案部分用于回答“是/否”、“能/不能”,长文本中的内容用于解释回答。作为本公开一种可能的实施方式,当查询请求中包括疾病名称并基于该疾病进行拓展发问时,其对应的目标查询类型为疾卡片类型,其对应的结构化展示形态可以是疾病卡片展示形态,如图5所示,如查询请求为“糖尿病的症状”,则可以通过疾病卡片的形式展示糖尿病有哪些症状。作为本公开一种可能的实施方式,当查询请求中存在与疾病症状相关的关键词时,该查询请求可以对应于相关疾病列表类的目标查询类型,可以通过相关疾病列表的结构化展示形态对查询结构进行展示,如图6所示,如查询请求是“腹部绞痛是什么原因导致的”,则可以通过相关疾病列表的形式展示可能的疾病和病因。作为本公开一种可能的实施方式,当查询请求中包括对于饮食或用药的询问时,该查询请求对应的目标查询类型可以是相关内容推荐类型,其查询结果可以通过内容分条相关推荐的结构化展示形态进行展示,如图7所示,查询请求中包括“失眠吃什么药”,则可以通过内容分条相关推荐的形式展示查询结果,推荐用户应该吃那些药。在本公开实施例中,在确定查询请求对应的结构化展示形态之后,基于该结构化展示形态的展示方式对查询结果进行展示。
本公开实施例通过基于查询请求确定该查询请求对应的目标查询类型,并基于目标查询类型确定该查询请求对应的结构化形态,按照该结构化形态的展示方式对该查询请求的查询结果进行展示,能给降低查询请求与展示形态匹配的人工运行成本,提高线索分析效率,提升用户的产品体验。
本公开实施例提供了一种可能的实施方式,在该实施方式中,如图8所示,基于查询请求确定对应的查询类型,包括:
步骤S801,确定查询请求对应的标准句式。
步骤S802,基于标准句式确定查询请求对应的查询类型。
在本公开实施例中,标准句式是指预先设置好的句式,不同的查询请求可以对应不同的标准句式,不同的标注句式会对应不同的查询类型。作为本公开一种可能的实施方式,如查询请求“孕妇能不能吃香蕉”可以对应的标准句式为“能/不能”句式,“能/不能”句式对应的查询类型为短文本长答案类型;如查询请求“糖尿病的症状是什么”可以对应的标准句式为“xx(疾病)的症状”,“xx(疾病)的症状”对应的查询类型可以是疾病卡片类型;如查询请求“腹部绞痛是什么原因导致的”可以对应的标准句式为“xx(症状)是什么原因”,该标准句式对应的查询类型可以是相关疾病列表类。
本公开实施例中,通过确定查询请求对应的标准句式,在基于该标准句式确定对应的查询类型,保证查询类型确认的准确性,并提升类型确认速度。
本公开实施例提供了一种可能的实现方式,在该实现方式中,如图9所示,确定查询请求对应的标准句式,包括:
步骤S901,基于预设的多个结构化形态分别对应的标准查询请求,确定每个查询类型的特征;
步骤S902,基于每个查询类型的特征确定对应的多个标准句式;
步骤S903,在多个标准句式中确定与查询请求对应的标准句式。
在本公开实施例中,对于每个结构化形态,可以预先设置多个对应的标准查询请求,并基于该标准查询请求确定每个查询类型的特征,其中,查询类型的特征是指查询类型中的关键词,基于每个查询类型的特征确定对应的标准句式,该标准句式中包括对应的关键词,并在多个标准句式中确定与查询请求对应的标准句式。
作为本公开一种可能的实施方式,为方便说明,以一个具体实施例为例,对于前述多个查询类型,如短文本长答案类的结构化形态对应的标准查询请求为“孕妇能吃香蕉吗?”、“感冒患者能喝可乐吗?”、“橙子是寒性食物吗?”,确定该短文本长答案类型的结构化形态对应的标准查询请求的特征为包括关键“能…吗?”、“是…吗?”等,则确定其对应的标准句式为“xxx能/不能xxx吗?”、“xxx是/不是xxx吗?”。则在确定查询请求对应的标准句式时,判定查询请求是否上述标准句式,如“糖尿病患者能吃西瓜吗?”就是上述的“xxx能/不能xxx吗?”标准句式,则该查询请求对应的结构化形态为短文本长答案。当然,上述只是本公开一种可能的实施方式,对于本公开前述提供的多个结构化形态,都可以通过上述实施例确认其对应的标准句式。
本公开实施例通过基于结构化形态对应的标准查询请求确定每个查询类型的特征,并基于该特征确定每个查询类型对应的标准化句式,可以根据该标准化句式确定查询请求对应的查询类型,无需人工对查询请求的类型进行分类,提高工作效率。
本公开实施例提供了一种可能的实施方式,在该实施方式中,如图10所示,基于查询请求确定对应的标准句式,包括:
步骤S1001,将查询请求输入预设的特征向量提取模型,提取查询请求的特征向量;
步骤S1002,分别计算查询请求的特征向量与预设数据中各标准句式的特征向量的相似度;
步骤S1003,基于相似度,确定查询请求的标准句式。
在本公开实施例中,在确定查询请求对应的标准句式时,是采用预设的模型识别的,其中,该模型为特征向量提取模型,将查询请求输入至该预设的特征向量提取模型中,提取该查询请求的特征向量,并计算该查询请求的特征向量分别与各标准句式的特征向量的相似度,根据相似度,确定该查询请求对应的标准句式,其中,可以是将相似度最高的一个或多个确认为该查询请求对应的标准句式。
本公开实施例通过预设的特征向量提取模型提取查询请求的特征向量,并基于该特征向量与预设的标准句式的特征向量之间的相似度确定该查询请求对应的标准句式,标准句式的确认速度快,结果准确。
本公开实施例提供了一种可能的实施方式,在该实施方式中,预设的特征向量提取模型为基于双向编码表示的特征向量提取模型,将查询请求输入预设的特征向量提取模型,提取查询请求的特征向量,如图11所示,包括:
步骤S1101,将查询请求分别作为特征向量提取模型的第一输入和第二输入;
步骤S1102,在第一输入前端插入第一特征字符,在第一输入与第二输入之间加入第二特征字符后,输入至向量提取模型中,得到查询请求对应的特征向量。
在本公开实施例中,预设的特征向量提取模型为bert模型,通过bert模型的向量提取功能,提取查询请求的特征向量,将查询请求分别作为bert模型的第一输入和第二输入,如图12所示为bert模型的示意图,bert模型有两个输入,则对于一个查询请求,可以将该查询请求分别作为bert模型的两个输入,在第一输入前端插入第一特征字符,在第一输入与第二输入之间加入第二特征字符后,输入至bert模型中,得到查询请求对应的特征向量,其中,第一字符为[CLS],第二字符为[SEP],将查询请求输入到bert模型中之后,得到该查询请求的特征向量T,可以计算该特征向量与数据库中预存的各目标查询类型的特征向量的相似度,并根据相似度确定该查询请求对应的目标查询类型。
本公开实施例通过bert模型对查询请求进行特征向量的提取,能够准确、快速的提取查询请求的向量,方便后续目标查询类型的确定。
本公开实施例提供了一种可能的实施方式,在该实施方式中,如图13所示,预设的特征向量提取模型通过如下方式训练得到:
步骤S1301,获取各训练样本,训练样本包括样本查询请求、样本查询请求对应的样本查询结果、以及各样本查询结果的相关性分数;
步骤S1302,将样本查询请求、样本查询请求对应的样本查询结果及样本查询结果的相关性分数作为一个训练数据,对预训练的特征向量提取模型进行训练,得到预设的特征向量提取模型。
在本公开实施例中,预设的特征向量提取模型需要进行训练得到,在训练该特征向量提取模型时,先获取训练样本,针对不同领域的查询,需要采用不同的训练样本进行训练,以医学领域为例,一个训练样本包括样本查询请求、样本查询请求对应的样本查询结果、以及各样本查询结果的相关性分数,该样本查询请求全部为医学相关的样本查询请求,其中,样本查询请求和样本查询请求对应的样本查询结果都是文本形式,采用人工标注的方式,标注该样本查询请求和该样本查询结果之间的关联性,例如,存在一个样本查询请求Q,其对应的查询结果包括D1、D2、D3、D4、D5,其中各个查询结果与样本查询请求的相关性分数可以根据线上排名的方式确定,如在该一个样本查询请求下用户点击答案D1的次数最多,则标注该答案D1与该目标查询类型Q之间的想关性分数最高,可以采用打分的方式标注相关性分数,如[Q,D1,1],[Q,D2,0.8]...[Q,D5,0.2]等,将多个样本查询请求对应形成的训练样本作为特征向量提取模型的训练样本集,对特征向量提取模型进行训练,当该特征向量提取模型提取的样本查询请求的特征向量与查询结果的特征向量的相似度与标注的相似度的误差在预设范围内时,则该特征向量提取模型训练完成。
本公开实施例通过根据查询请求领域的不同,采用相应领域的样本查询请求、对应的查询结果及两者的相关性分数作为训练样本,能够有效提高特征向量提取模型的识别精度。
本公开实施例提供了一种可能的实施方式,在该实施方式中,如图14,基于查询请求确定对应查询类型,包括:
步骤S1401,将查询请求和预设的查询类型输入至预设的相关性确认模型中,得到查询请求与查询类型的相关程度;
步骤S1402,将与查询请求相关程度最高的查询类型确认为查询请求确定对应查询类型。
在本公开实施例中,提供了另外一种用于确认查询请求对应的查询类型的方法,采用预设的相关性确认模型,将查询请求和预设的查询类型输入至预设的相关性确认模型中,得到查询请求与各查询类型的相关程度,并将于该查询请求相关程度最高的一个或多个查询类型确定为该查询请求对应的查询类型。
在本公开实施例中,如图15所示,该预设的相关性确认模型通过如下方式训练得到:
步骤S1501,获取历史查询数据,历史查询数据包括历史查询请求和历史查询请求下的历史用户行为数据;
步骤S1502,基于历史查询数据构建训练集,其中,训练集中的一个样本数据包括两个历史查询请求、两个历史查询请求分别对应的历史用户行为数据以及两个历史查询请求的相关程度;
步骤S1503,采用训练集对梯度提升决策树模型进行训练,得到预设的相关性确认模型。
在本公开实施例中,历史用户行为数据包括在某个查询请求下用户的行为数据,如针对两个查询请求,历史用户行为数据包括两个查询请求的搜索频次、用户分别在这两个查询请求下点击做多的网页、以及各网页的点击次数、两个查询下共同点击过的网页等,根据上述用户行为数据,确定这两个查询请求的相关程度。
在本公开实施例中,基于历史查询数据构建训练集,其中,训练集中的一个样本数据包括两个历史查询请求、两个历史查询请求分别对应的历史用户行为数据以及两个历史查询请求的相关程度;采用训练集对梯度提升决策树模型进行训练,得到预设的相关性确认模型。通过预设的相关性确认模型计算查询请求与各查询类型之间的相关程度,将相关程度最高的查询类型确定为该查询请求对应的查询类型。具体的,可以采用GBDT(GradientBoosting Decision Tree,梯度提升迭代决策树)模型,可以输入两个查询请求的文本信息,输出这两个查询请求的相关程度,如可以将用户输入的查询请求作为一个输入,将数据库中预存的一个查询类型作为另一个输入,计算查询请求与查询类型之间的相关程度,将相关程度最高的查询类型确定为用户输入的查询请求对应的目标查询类型。
在本公开实施例中,预设的相关性确认模型是根据用户行为数据进行计算的,其中,用户行为数据包括在某个标准查询请求下用户的行为数据,如针对两个查询请求,用户行为数据包括两个查询请求的搜索频次、用户分别在这两个查询请求下点击做多的网页、以及各网页的点击次数、两个查询下共同点击过的网页等,根据上述用户行为数据,确定这两个查询请求是否为同类的查询请求。例如,查询请求A和查询请求B下有大量用户点击过多个相同的页面,则表示这两个查询请求是同一类的查询请求。
对于本公开实施例,为方便说明,以一个具体实施例为例,服务器在接收到一个用户查询请求之后,在数据库中查找是够存在该查询请求的历史查询请求,当存在该查询的历史查询请求时,获取该历史查询请求下的历史用户行为数据,包括但不限于该历史查询请求下用户的操作,如点击哪些网页、链接等,将该历史用户行为数据与各查询类型下的历史用户行为数据进行对比,确定该查询请求与各查询类型的相关程度,基于该相关程度,获取与该查询请求对应的目标查询类型,可选的,可以选择与该查询请求相关程度最高的查询类型作为该查询请求的目标查询类型,例如,查询请求A和查询请求B下有大量用户点击过多个相同的页面,则表示这两个查询请求是同一类的查询请求。
本公开实施例通过历史行为数据对梯度提升决策树模型进行训练,得到预设的相关性确认模型,通过该模型可以直接计算查询请求与查询类型的相关程度,并基于该相关程度确认查询请求对应的目标查询类型,无需人工分类,且分类准确。
本公开实施例提供了一种可能的实施方式,在该实施方式中,如图16所示,基于查询请求确定对应的查询类型,包括:
步骤S1601,将查询请求输入预设的特征向量提取模型,提取查询请求的特征向量;
步骤S1602,分别计算查询请求的特征向量与预设数据中各标准句式的特征向量的相似度;
步骤S1603,提取查询请求对应的第一用户行为数据、以及各查询类型对应的第二用户行为数据;
步骤S1604,对于一个查询类型,根据第一用户行为数据和该查询对应的第二用户行为数据,确定查询请求和该查询类型之间的相关程度;
步骤S1605,基于相似度和相关程度确定查询请求对应的查询类型。
在本公开实施例中,为保证确认的查询请求对应的查询类型的准确性,可以基于本公开实施例前述提供的两种方法一起确认查询请求对应的查询类型,如在接收到用户的查询请求之后,将该查询请求输入至前述的预设的特征向量提取模型中,提取该查询请求的特征向量,并计算该特征向量与预设的标准句式的特征向量的相似度,提取该查询请求对应的第一用户数据,提取个查询类型的第二用户数据,并基于该第一用户数据和第二用户数据确认该查询请求与各查询类型之间的相关程度,然后基于查询请求与标准句式之间的相似度和查询请求与查询类型之间的相关程度,确认查询请求最终对应的查询类型,如可以将查询请求与标准句式之间的相似度高于预设值且查询请求与查询类型之间的相关程度大于预设值的查询类型确认为该查询请求对应的查询类型,其中,该标准句式为该查询类型对应的查询类型。
本公开实施例通过结合查询请求与标准句式的相关性和查询类型之间的相关程度确认查询请求对应的查询类型,保证查询类型确认的准确性。
本公开实施例提供了一种可能的实施方式,在该实施方式中,如图17所示,根据查询请求和目标查询类型获取查询结果,包括:
步骤S1701,提取查询请求中的关键字,将关键字填充至目标查询类型对应的标准句式中,得到查询语句;
步骤S1702,根据查询语句确定需要的各维度信息,得到查询结果。
在本公开实施例中,在基于查询请求和目标查询类型获取查询结果时,提取查询请求中的关键字,并将关键字填充至目标查询类型对应的标准句式中,得到查询语句,例如,对于“一岁半的小孩子可以吃香蕉不?”,可以提取其关键字为“小孩、吃香蕉”,其对应的标准句式为“xxx能xxx吗?”,则对应的查询语句为“小孩可以吃香蕉吗?”,然后基于该查询语句确定需要的各维度信息,得到查询结果。
本公开实施例通过提取查询请求关键字,并填充至对应的标准句式中得到查询语句,进而基于查询语句获取查询结果,方便快捷,查询结果的获取准确。
本公开实施例通过获取用户查询请求,并接收服务器基于该查询请求返回的结构化形态和查询结果,基于该结构化形态展示该查询结果,其中,结构化形态和查询结果基于目标查询类型确定,目标查询类型是查询请求在预设查询类型中匹配得到的,不需要人工对查询请求进行分类,降低运营成本,且查询展示效率更高,提升用户体验。
本公开实施例提供了一种数据查询装置,如图18所示,该数据查询装置180可以包括:请求获取模块1801、结果获取模块1802以及展示模块1803,其中,
请求获取模块1801,用于获取用户的查询请求,并向服务器发送查询请求;
结果获取模块1802,用于接收服务器基于查询请求返回的结构化形态和查询结果;其中,结构化形态和查询结果基于目标查询类型确定,目标查询类型是查询请求在预设查询类型中匹配得到的;
展示模块1803,用于基于结构化形态的展示方式展示查询结果。
本公开实施例提供了一种数据查询装置,如图19所示,该数据查询装置190可以包括:请求接收模块1901、结果确认模块1902、以及展示方式确认模块1903,其中,
请求接收模块1901,用于接收用户终端发送的查询请求,基于查询请求在预设查询类型中确定目标查询类型;
结果确认模块1902,用于根据查询请求和目标查询类型获取查询结果;
展示方式确认模块1903,用于基于目标查询类型确定对应的结构化形态,并通过结构化形态的展示方式将查询结果发送至用户终端。
可选的,请求接收模块1901在基于查询请求确定对应的查询类型时,可以用于:
确定查询请求对应的标准句式;
基于标准句式确定查询请求对应的查询类型。
可选的,请求接收模块1901在确定查询请求对应的标准句式时,可以用于:
基于预设的多个结构化形态分别对应的标准查询请求,确定每个查询类型的特征;
基于每个查询类型的特征确定对应的多个标准句式;
在多个标准句式中确定与查询请求对应的标准句式。
可选的,请求接收模块1901在确定查询请求对应的标准句式时,可以用于:
将查询请求输入预设的特征向量提取模型,提取查询请求的特征向量;
分别计算查询请求的特征向量与预设数据中各标准句式的特征向量的相似度;
基于相似度,确定查询请求的标准句式。
可选的,预设的特征向量提取模型为基于双向编码表示的特征向量提取模型,请求接收模块1901在将查询请求输入预设的特征向量提取模型,提取查询请求的特征向量时,可以用于:
将查询请求分别作为特征向量提取模型的第一输入和第二输入;
在第一输入前端插入第一特征字符,在第一输入与第二输入之间加入第二特征字符后,输入至向量提取模型中,得到查询请求对应的特征向量。
可选的,预设的特征向量提取模型通过如下方式训练得到:
获取各训练样本,训练样本包括样本查询请求、样本查询请求对应的样本查询结果、以及各样本查询结果的相关性分数;
将样本查询请求、样本查询请求对应的样本查询结果及样本查询结果的相关性分数作为一个训练数据,对预训练的特征向量提取模型进行训练,得到预设的特征向量提取模型。
可选的,结果确认模块1902在基于查询请求确定对应查询类型时,可以用于:
将查询请求和预设的查询类型输入至预设的相关性确认模型中,得到查询请求与查询类型的相关程度;
将与查询请求相关程度最高的查询类型确认为查询请求确定对应查询类型。
可选的,预设的相关性确认模型通过如下方式训练得到:
获取历史查询数据,历史查询数据包括历史查询请求和历史查询请求下的历史用户行为数据;
基于历史查询数据构建训练集,其中,训练集中的一个样本数据包括两个历史查询请求、两个历史查询请求分别对应的历史用户行为数据以及两个历史查询请求的相关程度;
采用训练集对梯度提升决策树模型进行训练,得到预设的相关性确认模型。
可选的,结果确认模块1902在基于查询请求确定对应查询类型时,可以用于:
将查询请求输入预设的特征向量提取模型,提取查询请求的特征向量;
分别计算查询请求的特征向量与预设数据中各标准句式的特征向量的相似度;
提取查询请求对应的第一用户行为数据、以及各查询类型对应的第二用户行为数据;
对于一个查询类型,根据第一用户行为数据和该查询对应的第二用户行为数据,确定查询请求和该查询类型之间的相关程度;
基于相似度和相关程度确定查询请求对应的查询类型。
可选的,结果确认模块1902在根据查询请求和目标查询类型获取查询结果时,可以用于:
提取查询请求中的关键字,将关键字填充至目标查询类型对应的标准句式中,得到查询语句;
根据查询语句确定需要的各维度信息,得到查询结果。
本公开实施例的数据查询装置可执行本公开前述实施例所示的数据查询方法,其实现原理相类似,此处不再赘述。
本公开实施例中服务器通过在预设的数据库中查找查询请求对应的目标查询类型,并套用该目标查询类型的结果与展示模板,对查询请求的结果进行展示,不再需要人工对查询请求进行分类,再依据分类结果去查找对应的结果和展示模板,对查询请求的响应速度更快,效率更高。
下面参考图20,其示出了适于用来实现本公开实施例的电子设备2000的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图20示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
电子设备包括:存储器以及处理器,其中,这里的处理器可以称为下文的处理装置2001,存储器可以包括下文中的只读存储器(ROM)2002、随机访问存储器(RAM)2003以及存储装置2008中的至少一项,具体如下所示:
如图20所示,电子设备2000可以包括处理装置(例如中央处理器、图形处理器等)2001,其可以根据存储在只读存储器(ROM)2002中的程序或者从存储装置2008加载到随机访问存储器(RAM)2003中的程序而执行各种适当的动作和处理。在RAM 2003中,还存储有电子设备2000操作所需的各种程序和数据。处理装置2001、ROM 2002以及RAM 2003通过总线2004彼此相连。输入/输出(I/O)接口2005也连接至总线2004。
通常,以下装置可以连接至I/O接口2005:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置2006;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置2007;包括例如磁带、硬盘等的存储装置2008;以及通信装置2009。通信装置2009可以允许电子设备2000与其他设备进行无线或有线通信以交换数据。虽然图20示出了具有各种装置的电子设备2000,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置2009从网络上被下载和安装,或者从存储装置2008被安装,或者从ROM 2002被安装。在该计算机程序被处理装置2001执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读介质或者是上述两者的任意组合。计算机可读介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:接收用户输入的查询请求;在预设的数据库中查找与查询请求对应的目标查询类型;获取目标查询类型的结果及目标查询类型对应的展示模板;按照展示模板对结果进行展示。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
根据本公开提供的一个或多个实施例,提供了一种数据查询方法,应用于用户终端,包括:
获取用户的查询请求,并向服务器发送查询请求;
接收服务器基于查询请求返回的结构化形态和查询结果;其中,结构化形态和查询结果基于目标查询类型确定,目标查询类型是查询请求在预设查询类型中匹配得到的;
基于结构化形态的展示方式展示查询结果。
根据本公开提供的一个或多个实施例,提供了一种数据查询方法,应用于服务器,包括:
接收用户终端发送的查询请求,基于查询请求在预设查询类型中确定目标查询类型;
根据查询请求和目标查询类型获取查询结果;
基于目标查询类型确定对应的结构化形态,并通过结构化形态的展示方式将查询结果发送至用户终端。
可选的,基于查询请求确定对应的查询类型,包括:
确定查询请求对应的标准句式;
基于标准句式确定查询请求对应的查询类型。
可选的,确定查询请求对应的标准句式,包括:
基于预设的多个结构化形态分别对应的标准查询请求,确定每个查询类型的特征;
基于每个查询类型的特征确定对应的多个标准句式;
在多个标准句式中确定与查询请求对应的标准句式。
可选的,基于查询请求确定对应的标准句式,包括:
将查询请求输入预设的特征向量提取模型,提取查询请求的特征向量;
分别计算查询请求的特征向量与预设数据中各标准句式的特征向量的相似度;
基于相似度,确定查询请求的标准句式。
可选的,预设的特征向量提取模型为基于双向编码表示的特征向量提取模型,将查询请求输入预设的特征向量提取模型,提取查询请求的特征向量,包括:
将查询请求分别作为特征向量提取模型的第一输入和第二输入;
在第一输入前端插入第一特征字符,在第一输入与第二输入之间加入第二特征字符后,输入至向量提取模型中,得到查询请求对应的特征向量。
可选的,预设的特征向量提取模型通过如下方式训练得到:
获取各训练样本,训练样本包括样本查询请求、样本查询请求对应的样本查询结果、以及各样本查询结果的相关性分数;
将样本查询请求、样本查询请求对应的样本查询结果及样本查询结果的相关性分数作为一个训练数据,对预训练的特征向量提取模型进行训练,得到预设的特征向量提取模型。
可选的,基于查询请求确定对应查询类型,包括:
将查询请求和预设的查询类型输入至预设的相关性确认模型中,得到查询请求与查询类型的相关程度;
将与查询请求相关程度最高的查询类型确认为查询请求确定对应查询类型。
可选的,预设的相关性确认模型通过如下方式训练得到:
获取历史查询数据,历史查询数据包括历史查询请求和历史查询请求下的历史用户行为数据;
基于历史查询数据构建训练集,其中,训练集中的一个样本数据包括两个历史查询请求、两个历史查询请求分别对应的历史用户行为数据以及两个历史查询请求的相关程度;
采用训练集对梯度提升决策树模型进行训练,得到预设的相关性确认模型。
可选的,基于查询请求确定对应的查询类型,包括:
将查询请求输入预设的特征向量提取模型,提取查询请求的特征向量;
分别计算查询请求的特征向量与预设数据中各标准句式的特征向量的相似度;
提取查询请求对应的第一用户行为数据、以及各查询类型对应的第二用户行为数据;
对于一个查询类型,根据第一用户行为数据和该查询对应的第二用户行为数据,确定查询请求和该查询类型之间的相关程度;
基于相似度和相关程度确定查询请求对应的查询类型。
可选的,根据查询请求和目标查询类型获取查询结果,包括:
提取查询请求中的关键字,将关键字填充至目标查询类型对应的标准句式中,得到查询语句;
根据查询语句确定需要的各维度信息,得到查询结果。
根据本公开提供的一个或多个实施例,提供了一种数据查询装置,包括:
请求获取模块,用于获取用户的查询请求,并向服务器发送查询请求;
结果获取模块,用于接收服务器基于查询请求返回的结构化形态和查询结果;其中,结构化形态和查询结果基于目标查询类型确定,目标查询类型是查询请求在预设查询类型中匹配得到的;
展示模块,用于基于结构化形态的展示方式展示查询结果。
根据本公开提供的一个或多个实施例,提供了一种数据查询装置,包括:
请求接收模块,用于接收用户终端发送的查询请求,基于查询请求在预设查询类型中确定目标查询类型;
结果确认模块,用于根据查询请求和目标查询类型获取查询结果;
展示方式确认模块,用于基于目标查询类型确定对应的结构化形态,并通过结构化形态的展示方式将查询结果发送至用户终端。
可选的,请求接收模块在基于查询请求确定对应的查询类型时,可以用于:
确定查询请求对应的标准句式;
基于标准句式确定查询请求对应的查询类型。
可选的,请求接收模块在确定查询请求对应的标准句式时,可以用于:
基于预设的多个结构化形态分别对应的标准查询请求,确定每个查询类型的特征;
基于每个查询类型的特征确定对应的多个标准句式;
在多个标准句式中确定与查询请求对应的标准句式。
可选的,请求接收模块在确定查询请求对应的标准句式时,可以用于:
将查询请求输入预设的特征向量提取模型,提取查询请求的特征向量;
分别计算查询请求的特征向量与预设数据中各标准句式的特征向量的相似度;
基于相似度,确定查询请求的标准句式。
可选的,预设的特征向量提取模型为基于双向编码表示的特征向量提取模型,请求接收模块在将查询请求输入预设的特征向量提取模型,提取查询请求的特征向量时,可以用于:
将查询请求分别作为特征向量提取模型的第一输入和第二输入;
在第一输入前端插入第一特征字符,在第一输入与第二输入之间加入第二特征字符后,输入至向量提取模型中,得到查询请求对应的特征向量。
可选的,预设的特征向量提取模型通过如下方式训练得到:
获取各训练样本,训练样本包括样本查询请求、样本查询请求对应的样本查询结果、以及各样本查询结果的相关性分数;
将样本查询请求、样本查询请求对应的样本查询结果及样本查询结果的相关性分数作为一个训练数据,对预训练的特征向量提取模型进行训练,得到预设的特征向量提取模型。
可选的,结果确认模块在基于查询请求确定对应查询类型时,可以用于:
将查询请求和预设的查询类型输入至预设的相关性确认模型中,得到查询请求与查询类型的相关程度;
将与查询请求相关程度最高的查询类型确认为查询请求确定对应查询类型。
可选的,预设的相关性确认模型通过如下方式训练得到:
获取历史查询数据,历史查询数据包括历史查询请求和历史查询请求下的历史用户行为数据;
基于历史查询数据构建训练集,其中,训练集中的一个样本数据包括两个历史查询请求、两个历史查询请求分别对应的历史用户行为数据以及两个历史查询请求的相关程度;
采用训练集对梯度提升决策树模型进行训练,得到预设的相关性确认模型。
可选的,结果确认模块在基于查询请求确定对应查询类型时,可以用于:
将查询请求输入预设的特征向量提取模型,提取查询请求的特征向量;
分别计算查询请求的特征向量与预设数据中各标准句式的特征向量的相似度;
提取查询请求对应的第一用户行为数据、以及各查询类型对应的第二用户行为数据;
对于一个查询类型,根据第一用户行为数据和该查询对应的第二用户行为数据,确定查询请求和该查询类型之间的相关程度;
基于相似度和相关程度确定查询请求对应的查询类型。
可选的,结果确认模块在根据查询请求和目标查询类型获取查询结果时,可以用于:
提取查询请求中的关键字,将关键字填充至目标查询类型对应的标准句式中,得到查询语句;
根据查询语句确定需要的各维度信息,得到查询结果。
根据本公开提供的一个或多个实施例,提供了一种电子设备,包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序配置用于:执行前述的数据查询方法。
根据本公开提供的一个或多个实施例,提供了一种计算机可读介质,存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现前述的数据查询方法。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (13)

1.一种数据查询方法,应用于用户终端,其特征在于,包括:
获取用户的查询请求,并向服务器发送所述查询请求;
接收服务器基于所述查询请求返回的结构化形态和查询结果;其中,所述结构化形态基于目标查询类型确定,所述查询结果基于所述查询请求和所述目标查询类型确定;所述目标查询类型是所述查询请求在预设查询类型中匹配得到的;
基于所述结构化形态的展示方式展示所述查询结果;其中,所述结构化形态是指用于展示查询结果的形态;
其中,所述目标查询类型基于标准句式确定,所述标准句式包括基于每个查询类型的特征所确定的多个标准句式中与所述查询请求对应的标准句式,所述每个查询类型的特征基于预设的多个结构化形态分别对应的标准查询请求确定。
2.一种数据查询方法,应用于服务器,其特征在于,包括:
接收用户终端发送的查询请求,基于所述查询请求在预设查询类型中确定目标查询类型;
根据所述查询请求和所述目标查询类型获取查询结果;
基于所述目标查询类型确定对应的结构化形态,并通过所述结构化形态的展示方式将所述查询结果发送至所述用户终端;其中,所述结构化形态是指用于展示查询结果的形态;其中,基于所述查询请求确定对应的查询类型,包括:
确定所述查询请求对应的标准句式;
基于所述标准句式确定所述查询请求对应的查询类型;
所述确定所述查询请求对应的标准句式,包括:
基于预设的多个结构化形态分别对应的标准查询请求,确定每个查询类型的特征;
基于所述每个查询类型的特征确定对应的多个标准句式;
在所述多个标准句式中确定与所述查询请求对应的标准句式。
3.根据权利要求2所述的方法,其特征在于,所述基于所述查询请求确定对应的标准句式,包括:
将所述查询请求输入预设的特征向量提取模型,提取所述查询请求的特征向量;
分别计算所述查询请求的特征向量与预设数据中各标准句式的特征向量的相似度;
基于所述相似度,确定所述查询请求的标准句式。
4.根据权利要求3所述的方法,其特征在于,所述预设的特征向量提取模型为基于双向编码表示的特征向量提取模型,所述将所述查询请求输入预设的特征向量提取模型,提取所述查询请求的特征向量,包括:
将所述查询请求分别作为所述特征向量提取模型的第一输入和第二输入;
在所述第一输入前端插入第一特征字符,在所述第一输入与所述第二输入之间加入第二特征字符后,输入至所述向量提取模型中,得到所述查询请求对应的特征向量。
5.根据权利要求3所述的方法,其特征在于,所述预设的特征向量提取模型通过如下方式训练得到:
获取各训练样本,所述训练样本包括样本查询请求、所述样本查询请求对应的样本查询结果、以及各所述样本查询结果的相关性分数;
将所述样本查询请求、所述样本查询请求对应的样本查询结果及所述样本查询结果的相关性分数作为一个训练数据,对预训练的特征向量提取模型进行训练,得到所述预设的特征向量提取模型。
6.根据权利要求2所述的方法,其特征在于,所述基于所述查询请求确定对应的查询类型,包括:
将所述查询请求和预设的查询类型输入至预设的相关性确认模型中,得到所述查询请求与所述查询类型的相关程度;
将与所述查询请求相关程度最高的所述查询类型确认为所述查询请求确定对应查询类型。
7.根据权利要求6所述的方法,其特征在于,所述预设的相关性确认模型通过如下方式训练得到:
获取历史查询数据,所述历史查询数据包括历史查询请求和历史查询请求下的历史用户行为数据;
基于所述历史查询数据构建训练集,其中,所述训练集中的一个样本数据包括两个历史查询请求、所述两个历史查询请求分别对应的历史用户行为数据以及所述两个历史查询请求的相关程度;
采用所述训练集对梯度提升决策树模型进行训练,得到所述预设的相关性确认模型。
8.根据权利要求2所述的方法,其特征在于,所述基于所述查询请求确定对应的查询类型,包括:
将所述查询请求输入预设的特征向量提取模型,提取所述查询请求的特征向量;
分别计算所述查询请求的特征向量与预设数据中各标准句式的特征向量的相似度;
提取所述查询请求对应的第一用户行为数据、以及各查询类型对应的第二用户行为数据;
对于一个查询类型,根据所述第一用户行为数据和该查询对应的所述第二用户行为数据,确定所述查询请求和该查询类型之间的相关程度;
基于所述相似度和所述相关程度确定所述查询请求对应的查询类型。
9.根据权利要求2所述的方法,其特征在于,所述根据所述查询请求和所述目标查询类型获取查询结果,包括:
提取所述查询请求中的关键字,将所述关键字填充至所述目标查询类型对应的标准句式中,得到查询语句;
根据所述查询语句确定需要的各维度信息,得到查询结果。
10.一种数据查询装置,其特征在于,包括:
请求获取模块,用于获取用户的查询请求,并向服务器发送所述查询请求;
结果获取模块,用于接收服务器基于所述查询请求返回的结构化形态和查询结果;其中,所述结构化形态基于目标查询类型确定,所述查询结果基于所述查询请求和所述目标查询类型确定;所述目标查询类型是所述查询请求在预设查询类型中匹配得到的;其中,所述结构化形态是指用于展示查询结果的形态;其中,所述目标查询类型基于标准句式确定,所述标准句式包括基于每个查询类型的特征所确定的多个标准句式中与所述查询请求对应的标准句式,所述每个查询类型的特征基于预设的多个结构化形态分别对应的标准查询请求确定;
展示模块,用于基于所述结构化形态的展示方式展示所述查询结果。
11.一种数据查询装置,其特征在于,包括:
请求接收模块,用于接收用户终端发送的查询请求,基于所述查询请求在预设查询类型中确定目标查询类型;
结果确认模块,用于根据所述查询请求和所述目标查询类型获取查询结果;
展示方式确认模块,用于基于所述目标查询类型确定对应的结构化形态,并通过所述结构化形态的展示方式将所述查询结果发送至所述用户终端;其中,所述结构化形态是指用于展示查询结果的形态;
其中,所述请求接收模块,还用于:
确定查询请求对应的标准句式;
基于标准句式确定查询请求对应的查询类型;
其中,所述请求接收模块,还用于:
基于预设的多个结构化形态分别对应的标准查询请求,确定每个查询类型的特征;
基于所述每个查询类型的特征确定对应的多个标准句式;
在所述多个标准句式中确定与所述查询请求对应的标准句式。
12.一种电子设备,其特征在于,其包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行根据权利要求1~9任一项所述的数据查询方法。
13.一种计算机可读介质,其特征在于,所述可读介质存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1~9任一所述的数据查询方法。
CN202110129388.5A 2021-01-29 2021-01-29 数据查询方法、装置、设备及计算机可读介质 Active CN112765424B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110129388.5A CN112765424B (zh) 2021-01-29 2021-01-29 数据查询方法、装置、设备及计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110129388.5A CN112765424B (zh) 2021-01-29 2021-01-29 数据查询方法、装置、设备及计算机可读介质

Publications (2)

Publication Number Publication Date
CN112765424A CN112765424A (zh) 2021-05-07
CN112765424B true CN112765424B (zh) 2023-10-10

Family

ID=75703937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110129388.5A Active CN112765424B (zh) 2021-01-29 2021-01-29 数据查询方法、装置、设备及计算机可读介质

Country Status (1)

Country Link
CN (1) CN112765424B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113886435B (zh) * 2021-12-08 2022-03-18 国能大渡河大数据服务有限公司 一种基于循环神经网络的信息查询方法及系统
WO2024036616A1 (zh) * 2022-08-19 2024-02-22 华为技术有限公司 一种基于终端的问答方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103425741A (zh) * 2013-07-16 2013-12-04 北京中科汇联信息技术有限公司 一种信息展示方法和装置
CN111177180A (zh) * 2019-12-11 2020-05-19 北京百分点信息科技有限公司 一种数据查询方法、装置以及电子设备
CN111310008A (zh) * 2020-03-20 2020-06-19 北京三快在线科技有限公司 搜索意图识别方法、装置、电子设备和存储介质
CN112069422A (zh) * 2020-08-11 2020-12-11 长沙市到家悠享网络科技有限公司 信息展示方法、服务器、终端和介质
CN112183953A (zh) * 2020-09-08 2021-01-05 北京达佳互联信息技术有限公司 客服资源的分配方法、装置、电子设备和存储介质
CN112199479A (zh) * 2020-09-15 2021-01-08 北京捷通华声科技股份有限公司 优化语言语义理解模型方法、装置、设备及存储介质
CN113886544A (zh) * 2021-09-29 2022-01-04 唯品会(广州)软件有限公司 文本匹配方法、装置、存储介质及计算机设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103425741A (zh) * 2013-07-16 2013-12-04 北京中科汇联信息技术有限公司 一种信息展示方法和装置
CN111177180A (zh) * 2019-12-11 2020-05-19 北京百分点信息科技有限公司 一种数据查询方法、装置以及电子设备
CN111310008A (zh) * 2020-03-20 2020-06-19 北京三快在线科技有限公司 搜索意图识别方法、装置、电子设备和存储介质
CN112069422A (zh) * 2020-08-11 2020-12-11 长沙市到家悠享网络科技有限公司 信息展示方法、服务器、终端和介质
CN112183953A (zh) * 2020-09-08 2021-01-05 北京达佳互联信息技术有限公司 客服资源的分配方法、装置、电子设备和存储介质
CN112199479A (zh) * 2020-09-15 2021-01-08 北京捷通华声科技股份有限公司 优化语言语义理解模型方法、装置、设备及存储介质
CN113886544A (zh) * 2021-09-29 2022-01-04 唯品会(广州)软件有限公司 文本匹配方法、装置、存储介质及计算机设备

Also Published As

Publication number Publication date
CN112765424A (zh) 2021-05-07

Similar Documents

Publication Publication Date Title
US11172040B2 (en) Method and apparatus for pushing information
CN112163076B (zh) 知识问题库构建方法、问答处理方法、装置、设备和介质
US20130117303A1 (en) Data search device, data search method, and program
CN112765424B (zh) 数据查询方法、装置、设备及计算机可读介质
CN113204691B (zh) 一种信息展示方法、装置、设备及介质
CN112948540A (zh) 信息查询方法、装置、电子设备以及计算机可读介质
CN111177523A (zh) 网页推荐方法、装置、电子设备及计算机可读介质
CN111324700A (zh) 资源召回方法、装置、电子设备及计算机可读存储介质
CN112052297B (zh) 信息生成方法、装置、电子设备和计算机可读介质
CN112948539A (zh) 信息搜索方法、装置、电子设备及计算机可读介质
CN111538830B (zh) 法条检索方法、装置、计算机设备及存储介质
CN113868538A (zh) 信息处理方法、装置、设备及介质
CN114357325A (zh) 内容搜索方法、装置、设备及介质
CN113407814A (zh) 文本搜索方法、装置、可读介质及电子设备
CN114463768A (zh) 表格识别方法、装置、可读介质和电子设备
KR20210084641A (ko) 정보를 송신하는 방법 및 장치
CN111767259A (zh) 内容分享的方法、装置、可读介质和电子设备
US20240169000A1 (en) Information processing method and apparatus, device, and medium
CN112084441A (zh) 信息检索方法、装置和电子设备
CN111339124B (zh) 显示数据方法、装置、电子设备和计算机可读介质
CN112148751B (zh) 用于查询数据的方法和装置
CN113609309A (zh) 知识图谱构建方法、装置、存储介质及电子设备
CN112182290A (zh) 一种信息处理方法、装置和电子设备
CN114238229B (zh) 一种打印文件的搜索方法、装置、电子设备和存储介质
CN114565928B (zh) 文本识别方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Applicant after: Tiktok vision (Beijing) Co.,Ltd.

Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Applicant before: BEIJING BYTEDANCE NETWORK TECHNOLOGY Co.,Ltd.

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Applicant after: Douyin Vision Co.,Ltd.

Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Applicant before: Tiktok vision (Beijing) Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant