CN110866092B - 信息搜索方法、装置、电子设备和存储介质 - Google Patents

信息搜索方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN110866092B
CN110866092B CN201911168422.9A CN201911168422A CN110866092B CN 110866092 B CN110866092 B CN 110866092B CN 201911168422 A CN201911168422 A CN 201911168422A CN 110866092 B CN110866092 B CN 110866092B
Authority
CN
China
Prior art keywords
text
segment
sample
fragment
text information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911168422.9A
Other languages
English (en)
Other versions
CN110866092A (zh
Inventor
郭文琪
侯兴林
洪嘉灏
苏孔明
王晓义
胡泊
陈华荣
亓超
马宇驰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201911168422.9A priority Critical patent/CN110866092B/zh
Publication of CN110866092A publication Critical patent/CN110866092A/zh
Application granted granted Critical
Publication of CN110866092B publication Critical patent/CN110866092B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种信息搜索方法、装置、电子设备及存储介质,涉及信息处理技术领域。该方法包括:当获取到用户针对第一文本信息中的标记片段的触发操作时,获取标记片段所对应的搜索结果;将标记片段所对应的搜索结果提供给用户;其中,第一文本信息中的标记片段,是利用神经网络模型确定的第一文本信息中特定类型的片段,搜索结果是基于标记片段所对应的意图确定的。本申请利用神经网络模型确定第一文本信息中特定类型的片段,并对该片段进行标记,基于标记的片段所对应的意图确定搜索结果,提高了搜索结果与用户意图的相关度,从而提升了用户体验。

Description

信息搜索方法、装置、电子设备和存储介质
技术领域
本申请涉及信息处理技术领域,具体而言,本申请涉及一种信息搜索方法、装置、电子设备和存储介质。
背景技术
随着计算机技术和网络技术的迅速发展,人们越来越习惯通过互联网获取各种信息,网络改变了人们传统的生活方式,为日常生活带来了极大便利。
用户在上网观看文章时,有时还想了解当前文章相关的更多内容,如与当前文章中的相关实体关联的内容,例如,用户在查看包含“电动牙刷真的会伤害牙龈吗”的文章时,可能想获取验证电动牙刷到底会不会伤害牙龈的相关信息。
现有技术中,将文章中的实体进行标记,用户通过点击标记后的实体,获取实体对应的内容。但是,单纯通过实体来预测用户想要了解的信息,往往并不是用户真正想要获取的结果,例如,在包含“电动牙刷真的会伤害牙龈吗”的文章中,根据实体“电动牙刷”,只能获取到与电动牙刷相关的内容,这些内容往往与电动牙刷到底会不会伤害牙龈无关。因此,这种标记方式无法满足用户需求。
发明内容
本申请提供了一种信息搜索方法、装置、电子设备和存储介质,用于解决现有技术中通过对实体进行标记的方式向用户展示相关信息时,与用户意图相关度不高,无法满足用户需求的问题。
第一方面,本申请提供了一种信息搜索方法,该方法包括:
当获取到用户针对第一文本信息中的标记片段的触发操作时,获取标记片段所对应的搜索结果;
将标记片段所对应的搜索结果提供给用户;
其中,第一文本信息中的标记片段,是利用神经网络模型确定的第一文本信息中特定类型的片段,搜索结果是基于标记片段所对应的意图确定的。
在一种可能的实现方式中,标记片段是通过以下方式确定的:
获取第一文本信息;
确定第一文本信息中的待处理文本片段;
将第一文本信息和各待处理文本片段输入至神经网络模型中,基于神经网络模型的输出,确定各待处理文本片段中的特定类型的片段;
对第一文本信息中各特定类型的片段进行标记,得到标记片段。
在一种可能的实现方式中,神经网络模型的输出为待处理文本片段是特定类型的片段的概率;
基于神经网络模型的输出,确定各待处理文本片段中的特定类型的片段,包括:
若待处理文本片段是特定类型的片段的概率大于等于预设阈值,则将待处理文本片段确定为特定类型的片段;或者,
将各待处理文本片段是特定类型的片段的概率进行排序,根据排序结果确定各待处理文本片段中的特定类型的片段。
在一种可能的实现方式中,确定第一文本信息中的待处理文本片段,包括:
确定第一文本信息中的初始文本片段;
提取满足第一预设条件的初始文本片段作为待处理文本片段;
其中,满足第一预设条件的初始文本片段包括以下任一项:
在第一文本信息中文本片段的出现次数大于等于第一设定次数的文本片段;
在第一文本信息中文本片段的出现次数大于等于第二设定次数、且文本片段的长度大于等于预设长度的文本片段;
在第一文本信息中与指定符号的位置关系满足预设位置关系的文本片段。
在一种可能的实现方式中,神经网络模型是通过以下方式训练得到的:
获取训练样本,训练样本包括样本数据,样本数据包括样本文本信息、以及样本文本信息的各样本文本片段,每个样本文本片段携带有样本标签,样本标签表征样本文本片段是否为特定类型的片段;
利用训练样本集对初始网络模型进行训练,直至满足预设的训练结束条件,将满足训练结束条件时的初始网络模型作为神经网络模型,初始网络模型的输入为样本文本信息、以及样本文本信息的样本文本片段,初始网络模型的输出表征了所输入的样本文本片段是否为特定类型的片段。
在一种可能的实现方式中,利用训练样本集对初始网络模型进行训练,包括:
提取各样本文本信息中满足第二预设条件的样本文本片段;
利用各样本文本信息、以及各样本文本信息所对应的满足第二预设条件的样本文本片段对初始网络模型进行训练;
其中,满足第二预设条件的样本文本片段包括以下任一项:
在样本文本信息中文本片段的出现次数大于等于第一设定次数的文本片段;
在样本文本信息中文本片段的出现次数大于等于第二设定次数、且文本片段的长度大于等于预设长度的文本片段;
在样本文本信息中与指定符号的位置关系满足预设位置关系的文本片段。
在一种可能的实现方式中,方法还包括:
获取第一文本信息的文本标识;
将第一文本信息以及第一文本信息的文本标识关联存储到预设数据库中。
在一种可能的实现方式中,方法还包括:
当获取到用户的文本浏览操作时,获取文本浏览操作中的文本标识,并将对应的第二文本信息提供给用户;
在预设数据库中查询是否存在文本标识,如果存在,则将文本标识关联的第一文本信息提供给用户,其中,第二文本信息与第一文本信息的文本内容相同,第二文本信息中的文本信息为未进行标记的文本信息。
在一种可能的实现方式中,当标记片段所对应的搜索结果包括至少两个时,将标记片段所对应的搜索结果提供给用户,包括:按照预设规则将搜索结果提供给用户。
第二方面,本申请提供了一种信息搜索装置,该装置包括:
获取模块,用于当获取到用户针对第一文本信息中的标记片段的触发操作时,获取标记片段所对应的搜索结果;
提供模块,用于将标记片段所对应的搜索结果提供给用户;
其中,第一文本信息中的标记片段,是利用神经网络模型确定的第一文本信息中特定类型的片段,搜索结果是基于标记片段所对应的意图确定的。
第三方面,提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序配置用于:执行根据第一方面或者第一方面任一可能的实现方式所示的信息搜索方法。
第四方面,提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现本申请第一方面或者第一方面任一可能的实现方式所示的信息搜索方法。
本申请提供的技术方案带来的有益效果是:
本申请提供了一种信息搜索方法、装置、电子设备和存储介质,当获取到用户针对第一文本信息中的标记片段的触发操作时,获取标记片段所对应的搜索结果;将标记片段所对应的搜索结果提供给用户;其中,第一文本信息中的标记片段,是利用神经网络模型确定的第一文本信息中特定类型的片段,搜索结果是基于标记片段所对应的意图确定的。本申请利用神经网络模型确定第一文本信息中特定类型的片段,并对该片段进行标记,基于标记的片段所对应的意图确定搜索结果,提高了搜索结果与用户意图的相关度,从而提升了用户体验。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1为本申请实施例提供的一种信息搜索方法的流程示意图;
图2为本申请实施例提供的一种信息搜索装置的结构示意图;
图3为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本申请技术方案的执行主体为计算机设备,包括但不限于服务器、个人电脑、笔记本电脑、平板电脑、智能手机等。计算机设备包括用户设备与网络设备。其中,用户设备包括但不限于电脑、智能手机、PAD等;网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或于云计算的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,计算机设备可单独运行来实现本申请,也可接入网络并通过与网络中的其他计算机设备的交互操作来实现本申请。其中,计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图1为本申请实施例提供的一种信息搜索方法的流程示意图,如图1所示,该方法可以包括:
步骤S101,当获取到用户针对第一文本信息中的标记片段的触发操作时,获取标记片段所对应的搜索结果;
本申请技术方案的执行主体可以为终端设备,也可以为服务器。
其中,第一文本信息可以为用户通过浏览器或者应用程序窗口浏览到的语句或文章的文本信息。标记片段可以包括第一文本信息中的词、短语、句子等,通过预设的标记方式进行标记之后,向用户进行显示。预设的标记方式包括能够和第一文本信息中的非标记片段的文字进行区分的方式,例如,高亮显示标记片段的文字、利用特殊颜色显示标记片段的文字、利用特殊字体显示标记片段的文字等。
当执行主体为终端设备时,如果终端设备检测到用户浏览文章时针对的标记片段的触发操作,则确定标记片段对应的意图,向服务器发送意图对应的搜索请求,服务器通过搜索引擎搜索意图对应的搜索结果发送给终端设备。
当执行主体为服务器时,如果服务器通过终端设备获取到用户浏览文章时针对的标记片段的触发操作,则确定标记片段对应的意图,通过搜索引擎搜索意图对应的搜索结果。
其中,第一文本信息中的标记片段,是利用神经网络模型确定的第一文本信息中特定类型的片段。搜索结果是基于标记片段所对应的意图确定的。
本申请的可选实施例中,标记片段是通过以下方式确定的:
获取第一文本信息;
确定第一文本信息中的待处理文本片段;
将第一文本信息和各待处理文本片段输入至神经网络模型中,基于神经网络模型的输出,确定各待处理文本片段中的特定类型的片段;
对第一文本信息中各特定类型的片段进行标记,得到标记片段。
在实际应用中,对于标记片段的确定,可以通过神经网络模型来实现。具体的,将用户当前阅读的文章划分为多个文本片段,从中提取出待处理文本片段,利用预先训练的神经网络模型,从各待处理文本片段中确定出特定类型的片段,并通过预设的标记方式将特定类型的片段进行标记。其中,特定类型的片段所指的具体类型可以根据实际需求配置的,也就是可以是指定的类型,例如,可以是社会新闻类型、科技信息类型等。
在一示例中,第一文本信息为“电动牙刷真的会伤害牙龈吗”,则特定类型的片段可以包括“电动牙刷”、“伤害牙龈”等,可以通过高亮显示的方式对“电动牙刷”、“伤害牙龈”进行标记,得到标记片段。
本申请实施例中,由于神经网络模型是通过大量用户意图对应的片段作为样本数据训练得到的,基于神经网络模型的输出确定的特定类型的片段,与用户意图的相关性更高,根据这些片段确定的搜索结果更加能够满足用户的需求。
本申请的可选实施例中,神经网络模型的输出为待处理文本片段是特定类型的片段的概率;
基于神经网络模型的输出,确定各待处理文本片段中的特定类型的片段,包括:
若待处理文本片段是特定类型的片段的概率大于等于预设阈值,则将待处理文本片段确定为特定类型的片段;或者,
将各待处理文本片段是特定类型的片段的概率进行排序,根据排序结果确定各待处理文本片段中的特定类型的片段。
在实际应用中,基于神经网络模型的输出,每个待处理文本片段对应一个概率值,设定一个预设阈值,将概率值大于等于预设阈值的待处理文本片段作为特定类型的片段;或者,将各概率值进行排序,将排序在预设位置的概率值对应的待处理文本片段作为特定类型的片段。另外,还可以首先过滤掉概率值小于预设阈值的待处理文本片段,然后将大于等于预设阈值的概率值进行排序,将排在预设位置的概率值对应的待处理文本片段作为特定类型的片段。
在本申请实施例中,通过对神经网络模型输出的概率值进行筛选,将概率值符合条件的待处理文本片段作为特定类型的文本片段,通过这种方式得到的特定类型的片段与用户意图相关度更高。
本申请的可选实施例中,确定第一文本信息中的待处理文本片段,包括:
确定第一文本信息中的初始文本片段;
提取满足第一预设条件的初始文本片段作为待处理文本片段;
其中,满足第一预设条件的初始文本片段包括以下任一项:
在第一文本信息中文本片段的出现次数大于等于第一设定次数的文本片段;
在第一文本信息中文本片段的出现次数大于等于第二设定次数、且文本片段的长度大于等于预设长度的文本片段;
在第一文本信息中与指定符号的位置关系满足预设位置关系的文本片段。
在实际应用中,对第一文本信息进行划分,得到多个初始文本片段,从初始文本片段中提取出满足第一预设条件的文本片段,作为待处理文本片段。第一预设条件可以根据文本片段在第一文本信息中的出现次数、文本片段的长度、文本片段在第一文本信息中与指定符号的位置关系等来确定。其中,指定符号包括成对出现的符号,例如,书名号、引号、括号等。与指定符号的位置关系满足预设位置关系的文本片段具体可以包括在书名号、引号或者括号中的文本片段。
在一示例中,将在第一文本信息中出现三次,长度在2-15维度(一个汉字的长度为一个维度)的初始文本片段作为待处理文本片段。
在另一示例中,将书名号中的初始文本片段作为待处理文本片段。
在本申请实施例中,设置第一预设条件,将满足第一预设条件的初始文本片段作为待处理文本片段,过滤掉了不适合作为特定类型片段的待处理文本片段,减少了神经网络模型的数据处理量,提高了数据处理的效率。
本申请的可选实施例中,神经网络模型是通过以下方式训练得到的:
获取训练样本,训练样本包括样本数据,样本数据包括样本文本信息、以及样本文本信息的各样本文本片段,每个样本文本片段携带有样本标签,样本标签表征样本文本片段是否为特定类型的片段;
利用训练样本集对初始网络模型进行训练,直至满足预设的训练结束条件,将满足训练结束条件时的初始网络模型作为神经网络模型,初始网络模型的输入为样本文本信息、以及样本文本信息的样本文本片段,初始网络模型的输出表征了所输入的样本文本片段是否为特定类型的片段。
在本申请实施例中,通过大量训练样本训练初始网络模型,直到满足训练结束条件,得到神经网络模型。这样训练得到的神经网络模型,在使用时,得到的特定类型的片段与用户意图的相关性更高。
本申请的可选实施例中,利用训练样本集对初始网络模型进行训练,包括:
提取各样本文本信息中满足第二预设条件的样本文本片段;
利用各样本文本信息、以及各样本文本信息所对应的满足第二预设条件的样本文本片段对初始网络模型进行训练;
其中,满足第二预设条件的样本文本片段包括以下任一项:
在样本文本信息中文本片段的出现次数大于等于第一设定次数的文本片段;
在样本文本信息中文本片段的出现次数大于等于第二设定次数、且文本片段的长度大于等于预设长度的文本片段;
在样本文本信息中与指定符号的位置关系满足预设位置关系的文本片段。
在实际应用中,利用相应的样本数据对初始网络模型中的模型参数进行训练,直到满足训练结束条件,得到训练好的初始网络模型。
步骤S102,将标记片段所对应的搜索结果提供给用户;
具体的,通过终端设备的显示屏将标记片段对应的搜索结果展示给用户,搜索结果是与用户意图相关的,使用户能够获取到真正想要了解的信息。
本申请的可选实施例中,该方法还包括:获取第一文本信息的文本标识;
将第一文本信息以及第一文本信息的文本标识关联存储到预设数据库中。
在本申请实施例中,将第一文本信息进行片段标记之后,获取第一文本信息的文本标识,将第一文本信息和文本标识相关联,并存储到预设的数据库中,便于后续根据文本标识调用第一文本信息提供给用户。
本申请的可选实施例中,该方法还包括:
当获取到用户的文本浏览操作时,获取所述文本浏览操作中的文本标识,并将对应的第二文本信息提供给所述用户;
在所述预设数据库中查询是否存在所述文本标识,如果存在,则将所述文本标识关联的所述第一文本信息提供给所述用户,其中,所述第二文本信息与所述第一文本信息的文本内容相同,所述第二文本信息中的文本信息为未进行标记的文本信息。在本申请实施例中,当用户浏览文本信息时,根据文本浏览操作中的文本标识,可以先加载不包含标记片段的第二文本信息展示给用户,以使用户能够快速浏览到相应的文本信息,并根据文本标识,查询是否存在关联的第一文本信息,如果存在,则再调用包含标记片段的第一文本信息并进行加载,覆盖第二文本信息,将第一文本信息再提供给用户。如果不存在,则利用神经网络模型确定特定类型的片段,并进行片段标记,标记完成之后,加载包含标记片段的文本信息提供给用户。
例如,当一篇文章首次被用户浏览时,还没有对该文章进行标记,也就是不存在包含标记片段的该文章,则加载不包含标记片段的文章,然后利用神经网络模型确定该文章中的特定类型的片段,并进行标记,然后加载包含标记片段的文章,提供给用户,并存储包含标记片段的文章标识和片段标识。
本申请实施例中,首先向用户展示不含标记片段的文本信息,便于用户快速获取到文本信息,通过异步加载的方式,展示包含标记片段的文本信息,不影响用户浏览文本信息,避免由于片段标记或者查询包含标记片段的文章而产生时间延迟,导致用户无法快速浏览到文本信息的问题,提升了用户体验。本申请的可选实施例中,当标记片段所对应的搜索结果包括至少两个时,将标记片段所对应的搜索结果提供给用户,包括:按照预设规则将搜索结果提供给用户。
在一示例中,第一文本信息为:“东直门附近有很多网红川菜馆”,标记片段可以为:“东直门附近”、“网红川菜馆”,意图信息可以为:“东直门附近的网红川菜馆的具体位置”等,将意图信息对应的搜索结果按照预设规则展示给用户。其中,预设规则可以是根据用户喜好确定的排序规则,例如,搜索结果包括两个相似度较高的餐馆信息,则按照用户历史光顾各个餐馆的频次进行排序,向用户推荐;还可以按照餐馆的热门程度进行排序并向用户推荐;还可以按照餐馆的好评度进行排序并向用户推荐;还可以按照餐馆距离用户当前位置的远近程度进行排序,确定搜索结果推荐给用户等,预设规则还可以包括其他相关的规则,本申请对此不做限定。
本申请实施例提供的信息搜索方法,当获取到用户针对第一文本信息中的标记片段的触发操作时,获取标记片段所对应的搜索结果;将标记片段所对应的搜索结果提供给用户;其中,第一文本信息中的标记片段,是利用神经网络模型确定的第一文本信息中特定类型的片段,搜索结果是基于标记片段所对应的意图确定的。本申请利用神经网络模型确定第一文本信息中特定类型的片段,并对该片段进行标记,基于标记的片段所对应的意图确定搜索结果,提高了搜索结果与用户意图的相关度,从而提升了用户体验。
基于与图1中所示方法相同的原理,本公开的实施例中还提供了一种信息搜索装置20,如图2所示,信息搜索装置20可以包括:获取模块21和提供模块22;
获取模块21,用于当获取到用户针对第一文本信息中的标记片段的触发操作时,获取标记片段所对应的搜索结果;
提供模块22,用于将标记片段所对应的搜索结果提供给用户;
其中,第一文本信息中的标记片段,是利用神经网络模型确定的第一文本信息中特定类型的片段,搜索结果是基于标记片段所对应的意图确定的。
在一种可能的实现方式中,标记片段是通过以下方式确定的:
获取第一文本信息;
确定第一文本信息中的待处理文本片段;
将第一文本信息和各待处理文本片段输入至神经网络模型中,基于神经网络模型的输出,确定各待处理文本片段中的特定类型的片段;
对第一文本信息中各特定类型的片段进行标记,得到标记片段。
在一种可能的实现方式中,神经网络模型的输出为待处理文本片段是特定类型的片段的概率;
基于神经网络模型的输出,确定各待处理文本片段中的特定类型的片段,包括:
若待处理文本片段是特定类型的片段的概率大于等于预设阈值,则将待处理文本片段确定为特定类型的片段;或者,
将各待处理文本片段是特定类型的片段的概率进行排序,根据排序结果确定各待处理文本片段中的特定类型的片段。
在一种可能的实现方式中,确定第一文本信息中的待处理文本片段,包括:
确定第一文本信息中的初始文本片段;
提取满足第一预设条件的初始文本片段作为待处理文本片段;
其中,满足第一预设条件的初始文本片段包括以下任一项:
在第一文本信息中文本片段的出现次数大于等于第一设定次数的文本片段;
在第一文本信息中文本片段的出现次数大于等于第二设定次数、且文本片段的长度大于等于预设长度的文本片段;
在第一文本信息中与指定符号的位置关系满足预设位置关系的文本片段。
在一种可能的实现方式中,神经网络模型是通过以下方式训练得到的:
获取训练样本,训练样本包括样本数据,样本数据包括样本文本信息、以及样本文本信息的各样本文本片段,每个样本文本片段携带有样本标签,样本标签表征样本文本片段是否为特定类型的片段;
利用训练样本集对初始网络模型进行训练,直至满足预设的训练结束条件,将满足训练结束条件时的初始网络模型作为神经网络模型,初始网络模型的输入为样本文本信息、以及样本文本信息的样本文本片段,初始网络模型的输出表征了所输入的样本文本片段是否为特定类型的片段。
在一种可能的实现方式中,利用训练样本集对初始网络模型进行训练,包括:
提取各样本文本信息中满足第二预设条件的样本文本片段;
利用各样本文本信息、以及各样本文本信息所对应的满足第二预设条件的样本文本片段对初始网络模型进行训练;
其中,满足第二预设条件的样本文本片段包括以下任一项:
在样本文本信息中文本片段的出现次数大于等于第一设定次数的文本片段;
在样本文本信息中文本片段的出现次数大于等于第二设定次数、且文本片段的长度大于等于预设长度的文本片段;
在样本文本信息中与指定符号的位置关系满足预设位置关系的文本片段。
在一种可能的实现方式中,装置20还包括存储模块,用于:
获取第一文本信息的文本标识;
将第一文本信息以及第一文本信息的文本标识关联存储到预设数据库中。
在一种可能的实现方式中,装置20还包括加载模块,用于:
当获取到用户的文本浏览操作时,获取文本浏览操作中的文本标识,并将对应的第二文本信息提供给用户;
在预设数据库中查询是否存在文本标识,如果存在,则将文本标识关联的第一文本信息提供给用户,其中,第二文本信息与第一文本信息的文本内容相同,第二文本信息中的文本信息为未进行标记的文本信息。
在一种可能的实现方式中,当标记片段所对应的搜索结果包括至少两个时,提供模块22具体用于:按照预设规则将搜索结果提供给用户。。
本公开实施例的信息搜索装置可执行本公开的实施例所提供的信息搜索方法,其实现原理相类似,本公开各实施例中的信息搜索装置中的各模块所执行的动作是与本公开各实施例中的信息搜索方法中的步骤相对应的,对于信息搜索装置的各模块的详细功能描述具体可以参见前文中所示的对应的信息搜索方法中的描述,此处不再赘述。
本申请实施例提供的信息搜索装置,当获取到用户针对第一文本信息中的标记片段的触发操作时,获取标记片段所对应的搜索结果;将标记片段所对应的搜索结果提供给用户;其中,第一文本信息中的标记片段,是利用神经网络模型确定的第一文本信息中特定类型的片段,搜索结果是基于标记片段所对应的意图确定的。本申请利用神经网络模型确定第一文本信息中特定类型的片段,并对该片段进行标记,基于标记的片段所对应的意图确定搜索结果,提高了搜索结果与用户意图的相关度,从而提升了用户体验。
上述实施例从虚拟模块的角度介绍了信息搜索装置,下述从实体模块的角度介绍一种电子设备,具体如下所示:
本申请实施例提供了一种电子设备,如图3所示,图3所示的电子设备3000包括:处理器3001和存储器3003。其中,处理器3001和存储器3003相连,如通过总线3002相连。可选地,电子设备3000还可以包括收发器3004。需要说明的是,实际应用中收发器3004不限于一个,该电子设备3000的结构并不构成对本申请实施例的限定。
处理器3001可以是CPU,通用处理器,DSP,ASIC,FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器3001也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线3002可包括一通路,在上述组件之间传送信息。总线3002可以是PCI总线或EISA总线等。总线3002可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器3003可以是ROM或可存储静态信息和指令的其他类型的静态存储设备,RAM或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM、CD-ROM或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器3003用于存储执行本申请方案的应用程序代码,并由处理器3001来控制执行。处理器3001用于执行存储器3003中存储的应用程序代码,以实现前述任一方法实施例所示的内容。
本申请实施例提供了一种电子设备,本申请实施例中的电子设备包括:存储器和处理器;至少一个程序,存储于所述存储器中,用于被处理器执行时,当获取到用户针对第一文本信息中的标记片段的触发操作时,获取标记片段所对应的搜索结果;将标记片段所对应的搜索结果提供给用户;其中,第一文本信息中的标记片段,是利用神经网络模型确定的第一文本信息中特定类型的片段,搜索结果是基于标记片段所对应的意图确定的。本申请利用神经网络模型确定第一文本信息中特定类型的片段,并对该片段进行标记,基于标记的片段所对应的意图确定搜索结果,提高了搜索结果与用户意图的相关度,从而提升了用户体验。
本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,当其在计算机上运行时,使得计算机可以执行前述方法实施例中相应内容。在本申请中,当获取到用户针对第一文本信息中的标记片段的触发操作时,获取标记片段所对应的搜索结果;将标记片段所对应的搜索结果提供给用户;其中,第一文本信息中的标记片段,是利用神经网络模型确定的第一文本信息中特定类型的片段,搜索结果是基于标记片段所对应的意图确定的。本申请利用神经网络模型确定第一文本信息中特定类型的片段,并对该片段进行标记,基于标记的片段所对应的意图确定搜索结果,提高了搜索结果与用户意图的相关度,从而提升了用户体验。
本发明实施例还包括:
A1、一种信息搜索方法,包括:
当获取到用户针对第一文本信息中的标记片段的触发操作时,获取所述标记片段所对应的搜索结果;
将所述标记片段所对应的搜索结果提供给所述用户;
其中,所述第一文本信息中的标记片段,是利用神经网络模型确定的第一文本信息中特定类型的片段,所述搜索结果是基于所述标记片段所对应的意图确定的。
A2、根据A1所述的方法,所述标记片段是通过以下方式确定的:
获取所述第一文本信息;
确定所述第一文本信息中的待处理文本片段;
将所述第一文本信息和各所述待处理文本片段输入至所述神经网络模型中,基于所述神经网络模型的输出,确定各所述待处理文本片段中的特定类型的片段;
对所述第一文本信息中各所述特定类型的片段进行标记,得到标记片段。
A3、根据A2所述的方法,所述神经网络模型的输出为所述待处理文本片段是特定类型的片段的概率;
所述基于所述神经网络模型的输出,确定各所述待处理文本片段中的特定类型的片段,包括:
若所述待处理文本片段是特定类型的片段的概率大于等于预设阈值,则将所述待处理文本片段确定为特定类型的片段;或者,
将各所述待处理文本片段是特定类型的片段的概率进行排序,根据排序结果确定各所述待处理文本片段中的特定类型的片段。
A4、根据A2所述的方法,所述确定所述第一文本信息中的待处理文本片段,包括:
确定所述第一文本信息中的初始文本片段;
提取满足第一预设条件的初始文本片段作为待处理文本片段;
其中,所述满足第一预设条件的初始文本片段包括以下任一项:
在第一文本信息中文本片段的出现次数大于等于第一设定次数的文本片段;
在第一文本信息中文本片段的出现次数大于等于第二设定次数、且文本片段的长度大于等于预设长度的文本片段;
在第一文本信息中与指定符号的位置关系满足预设位置关系的文本片段。
A5、根据A2至A4中任一项所述的方法,所述神经网络模型是通过以下方式训练得到的:
获取训练样本,所述训练样本包括样本数据,所述样本数据包括样本文本信息、以及样本文本信息的各样本文本片段,每个样本文本片段携带有样本标签,所述样本标签表征所述样本文本片段是否为特定类型的片段;
利用所述训练样本集对初始网络模型进行训练,直至满足预设的训练结束条件,将满足所述训练结束条件时的初始网络模型作为所述神经网络模型,所述初始网络模型的输入为样本文本信息、以及样本文本信息的样本文本片段,所述初始网络模型的输出表征了所输入的样本文本片段是否为特定类型的片段。
A6、根据A5所述的方法,所述利用所述训练样本集对初始网络模型进行训练,包括:
提取各所述样本文本信息中满足第二预设条件的样本文本片段;
利用各所述样本文本信息、以及各样本文本信息所对应的满足第二预设条件的样本文本片段对所述初始网络模型进行训练;
其中,所述满足第二预设条件的样本文本片段包括以下任一项:
在样本文本信息中文本片段的出现次数大于等于第一设定次数的文本片段;
在样本文本信息中文本片段的出现次数大于等于第二设定次数、且文本片段的长度大于等于预设长度的文本片段;
在样本文本信息中与指定符号的位置关系满足预设位置关系的文本片段。
A7、根据A1所述的方法,所述方法还包括:
获取第一文本信息的文本标识;
将第一文本信息以及第一文本信息的文本标识关联存储到预设数据库中。
A8、根据A7所述的方法,所述方法还包括:
当获取到用户的文本浏览操作时,获取文本浏览操作中的文本标识,并将对应的第二文本信息提供给用户;
在预设数据库中查询是否存在文本标识,如果存在,则将文本标识关联的第一文本信息提供给用户,其中,第二文本信息与第一文本信息的文本内容相同,第二文本信息中的文本信息为未进行标记的文本信息。
A9、根据A1所述的方法,当标记片段所对应的搜索结果包括至少两个时,将标记片段所对应的搜索结果提供给用户,包括:按照预设规则将搜索结果提供给用户。
B10、一种信息搜索装置,所述装置包括:
获取模块,用于当获取到用户针对第一文本信息中的标记片段的触发操作时,获取所述标记片段所对应的搜索结果;
提供模块,用于将所述标记片段所对应的搜索结果提供给所述用户;
其中,所述第一文本信息中的标记片段,是利用神经网络模型确定的第一文本信息中特定类型的片段,所述搜索结果是基于所述标记片段所对应的意图确定的。
B11、根据B10所述的装置,所述标记片段是通过以下方式确定的:
获取所述第一文本信息;
确定所述第一文本信息中的待处理文本片段;
将所述第一文本信息和各所述待处理文本片段输入至所述神经网络模型中,基于所述神经网络模型的输出,确定各所述待处理文本片段中的特定类型的片段;
对所述第一文本信息中各所述特定类型的片段进行标记,得到标记片段。
B12、根据B11所述的装置,所述神经网络模型的输出为所述待处理文本片段是特定类型的片段的概率;
所述基于所述神经网络模型的输出,确定各所述待处理文本片段中的特定类型的片段,包括:
若所述待处理文本片段是特定类型的片段的概率大于等于预设阈值,则将所述待处理文本片段确定为特定类型的片段;或者,
将各所述待处理文本片段是特定类型的片段的概率进行排序,根据排序结果确定各所述待处理文本片段中的特定类型的片段。
B13、根据B11所述的装置,所述确定所述第一文本信息中的待处理文本片段,包括:
确定所述第一文本信息中的初始文本片段;
提取满足第一预设条件的初始文本片段作为待处理文本片段;
其中,所述满足第一预设条件的初始文本片段包括以下任一项:
在第一文本信息中文本片段的出现次数大于等于第一设定次数的文本片段;
在第一文本信息中文本片段的出现次数大于等于第二设定次数、且文本片段的长度大于等于预设长度的文本片段;
在第一文本信息中与指定符号的位置关系满足预设位置关系的文本片段。
B14、根据B11至B13中任一项所述的装置,所述神经网络模型是通过以下方式训练得到的:
获取训练样本,所述训练样本包括样本数据,所述样本数据包括样本文本信息、以及样本文本信息的各样本文本片段,每个样本文本片段携带有样本标签,所述样本标签表征所述样本文本片段是否为特定类型的片段;
利用所述训练样本集对初始网络模型进行训练,直至满足预设的训练结束条件,将满足所述训练结束条件时的初始网络模型作为所述神经网络模型,所述初始网络模型的输入为样本文本信息、以及样本文本信息的样本文本片段,所述初始网络模型的输出表征了所输入的样本文本片段是否为特定类型的片段。
B15、根据B14所述的装置,所述利用所述训练样本集对初始网络模型进行训练,包括:
提取各所述样本文本信息中满足第二预设条件的样本文本片段;
利用各所述样本文本信息、以及各样本文本信息所对应的满足第二预设条件的样本文本片段对所述初始网络模型进行训练;
其中,所述满足第二预设条件的样本文本片段包括以下任一项:
在样本文本信息中文本片段的出现次数大于等于第一设定次数的文本片段;
在样本文本信息中文本片段的出现次数大于等于第二设定次数、且文本片段的长度大于等于预设长度的文本片段;
在样本文本信息中与指定符号的位置关系满足预设位置关系的文本片段。
B16、根据B10所述的装置,所述装置还包括存储模块,用于:
获取第一文本信息的文本标识;
将第一文本信息以及所述第一文本信息的文本标识关联存储到预设数据库中。
B17、根据B10所述的装置,所述装置还包括加载模块,用于:
当获取到用户的文本浏览操作时,获取所述文本浏览操作中的文本标识,并将对应的第二文本信息提供给所述用户;
在所述预设数据库中查询是否存在所述文本标识,如果存在,则将所述文本标识关联的所述第一文本信息提供给所述用户,其中,所述第二文本信息与所述第一文本信息的文本内容相同,所述第二文本信息中的文本信息为未进行标记的文本信息。
B18、根据B10所述的装置,当所述标记片段所对应的搜索结果包括至少两个时,
所述提供模块具体用于:
按照预设规则将所述搜索结果提供给所述用户。
C19、一种电子设备,包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行根据A1~A9任一项所述的信息搜索方法。
D20、一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机指令,当其在计算机上运行时,使得计算机可以执行上述A1~A9中任一项所述的信息搜索方法。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (20)

1.一种信息搜索方法,其特征在于,包括:
当获取到用户针对第一文本信息中的标记片段的触发操作时,获取所述标记片段所对应的意图,并获取基于所述意图所搜索到的搜索结果;
将所述标记片段所对应的搜索结果提供给所述用户;
其中,所述第一文本信息中的标记片段的确定方式,包括:
将所述第一文本信息和所述第一文本信息中的各待处理文本片段输入神经网络模型;
基于所述神经网络模型输出的各待处理文本片段是特定类型的片段的概率,确定所述各待处理文本片段中的特定类型的片段,并将所述特定类型的片段确定为所述标记片段,所述特定类型是符合用户意图的指定类型;
其中,所述神经网络模型是利用各样本文本信息及满足第二预设条件的样本文本片段训练得到的,所述第二预设条件用于判断是否适合作为符合用户意图的特定类型的片段。
2.根据权利要求1所述的方法,其特征在于,所述标记片段是通过以下方式确定的:
获取所述第一文本信息;
确定所述第一文本信息中的待处理文本片段;
将所述第一文本信息和各所述待处理文本片段输入至所述神经网络模型中,基于所述神经网络模型的输出,确定各所述待处理文本片段中的特定类型的片段;
对所述第一文本信息中各所述特定类型的片段进行标记,得到标记片段。
3.根据权利要求2所述的方法,其特征在于,所述神经网络模型的输出为所述待处理文本片段是特定类型的片段的概率;
所述基于所述神经网络模型的输出,确定各所述待处理文本片段中的特定类型的片段,包括:
若所述待处理文本片段是特定类型的片段的概率大于等于预设阈值,则将所述待处理文本片段确定为特定类型的片段;或者,
将各所述待处理文本片段是特定类型的片段的概率进行排序,根据排序结果确定各所述待处理文本片段中的特定类型的片段。
4.根据权利要求2所述的方法,其特征在于,所述确定所述第一文本信息中的待处理文本片段,包括:
确定所述第一文本信息中的初始文本片段;
提取满足第一预设条件的初始文本片段作为待处理文本片段;
其中,所述满足第一预设条件的初始文本片段包括以下任一项:
在第一文本信息中文本片段的出现次数大于等于第一设定次数的文本片段;
在第一文本信息中文本片段的出现次数大于等于第二设定次数、且文本片段的长度大于等于预设长度的文本片段;
在第一文本信息中与指定符号的位置关系满足预设位置关系的文本片段。
5.根据权利要求2至4中任一项所述的方法,其特征在于,所述神经网络模型是通过以下方式训练得到的:
获取训练样本,所述训练样本包括样本数据,所述样本数据包括样本文本信息、以及样本文本信息的各样本文本片段,每个样本文本片段携带有样本标签,所述样本标签表征所述样本文本片段是否为特定类型的片段;
利用所述训练样本集对初始网络模型进行训练,直至满足预设的训练结束条件,将满足所述训练结束条件时的初始网络模型作为所述神经网络模型,所述初始网络模型的输入为样本文本信息、以及样本文本信息的样本文本片段,所述初始网络模型的输出表征了所输入的样本文本片段是否为特定类型的片段。
6.根据权利要求5所述的方法,其特征在于,所述利用所述训练样本集对初始网络模型进行训练,包括:
提取各所述样本文本信息中满足第二预设条件的样本文本片段;
利用各所述样本文本信息、以及各样本文本信息所对应的满足第二预设条件的样本文本片段对所述初始网络模型进行训练;
其中,所述满足第二预设条件的样本文本片段包括以下任一项:
在样本文本信息中文本片段的出现次数大于等于第一设定次数的文本片段;
在样本文本信息中文本片段的出现次数大于等于第二设定次数、且文本片段的长度大于等于预设长度的文本片段;
在样本文本信息中与指定符号的位置关系满足预设位置关系的文本片段。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取第一文本信息的文本标识;
将第一文本信息以及所述第一文本信息的文本标识关联存储到预设数据库中。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
当获取到用户的文本浏览操作时,获取文本浏览操作中的文本标识,并将对应的第二文本信息提供给用户;
在预设数据库中查询是否存在文本标识,如果存在,则将文本标识关联的第一文本信息提供给用户,其中,第二文本信息与第一文本信息的文本内容相同,第二文本信息中的文本信息为未进行标记的文本信息。
9.根据权利要求1所述的方法,其特征在于,当标记片段所对应的搜索结果包括至少两个时,将标记片段所对应的搜索结果提供给用户,包括:按照预设规则将搜索结果提供给用户。
10.一种信息搜索装置,其特征在于,所述装置包括:
获取模块,用于当获取到用户针对第一文本信息中的标记片段的触发操作时,获取所述标记片段所对应的意图,并获取基于所述意图所搜索到的搜索结果;
提供模块,用于将所述标记片段所对应的搜索结果提供给所述用户;
其中,所述第一文本信息中的标记片段的确定方式,包括:
将所述第一文本信息和所述第一文本信息中的各待处理文本片段输入神经网络模型;
基于所述神经网络模型输出的各待处理文本片段是特定类型的片段的概率,确定所述各待处理文本片段中的特定类型的片段,并将所述特定类型的片段确定为所述标记片段,所述特定类型是符合用户意图的指定类型;
其中,所述神经网络模型是利用各样本文本信息及满足第二预设条件的样本文本片段训练得到的,所述第二预设条件用于判断是否适合作为符合用户意图的特定类型的片段。
11.根据权利要求10所述的装置,其特征在于,所述标记片段是通过以下方式确定的:
获取所述第一文本信息;
确定所述第一文本信息中的待处理文本片段;
将所述第一文本信息和各所述待处理文本片段输入至所述神经网络模型中,基于所述神经网络模型的输出,确定各所述待处理文本片段中的特定类型的片段;
对所述第一文本信息中各所述特定类型的片段进行标记,得到标记片段。
12.根据权利要求11所述的装置,其特征在于,所述神经网络模型的输出为所述待处理文本片段是特定类型的片段的概率;
所述基于所述神经网络模型的输出,确定各所述待处理文本片段中的特定类型的片段,包括:
若所述待处理文本片段是特定类型的片段的概率大于等于预设阈值,则将所述待处理文本片段确定为特定类型的片段;或者,
将各所述待处理文本片段是特定类型的片段的概率进行排序,根据排序结果确定各所述待处理文本片段中的特定类型的片段。
13.根据权利要求11所述的装置,其特征在于,所述确定所述第一文本信息中的待处理文本片段,包括:
确定所述第一文本信息中的初始文本片段;
提取满足第一预设条件的初始文本片段作为待处理文本片段;
其中,所述满足第一预设条件的初始文本片段包括以下任一项:
在第一文本信息中文本片段的出现次数大于等于第一设定次数的文本片段;
在第一文本信息中文本片段的出现次数大于等于第二设定次数、且文本片段的长度大于等于预设长度的文本片段;
在第一文本信息中与指定符号的位置关系满足预设位置关系的文本片段。
14.根据权利要求11至13中任一项所述的装置,其特征在于,所述神经网络模型是通过以下方式训练得到的:
获取训练样本,所述训练样本包括样本数据,所述样本数据包括样本文本信息、以及样本文本信息的各样本文本片段,每个样本文本片段携带有样本标签,所述样本标签表征所述样本文本片段是否为特定类型的片段;
利用所述训练样本集对初始网络模型进行训练,直至满足预设的训练结束条件,将满足所述训练结束条件时的初始网络模型作为所述神经网络模型,所述初始网络模型的输入为样本文本信息、以及样本文本信息的样本文本片段,所述初始网络模型的输出表征了所输入的样本文本片段是否为特定类型的片段。
15.根据权利要求14所述的装置,其特征在于,所述利用所述训练样本集对初始网络模型进行训练,包括:
提取各所述样本文本信息中满足第二预设条件的样本文本片段;
利用各所述样本文本信息、以及各样本文本信息所对应的满足第二预设条件的样本文本片段对所述初始网络模型进行训练;
其中,所述满足第二预设条件的样本文本片段包括以下任一项:
在样本文本信息中文本片段的出现次数大于等于第一设定次数的文本片段;
在样本文本信息中文本片段的出现次数大于等于第二设定次数、且文本片段的长度大于等于预设长度的文本片段;
在样本文本信息中与指定符号的位置关系满足预设位置关系的文本片段。
16.根据权利要求10所述的装置,其特征在于,所述装置还包括存储模块,用于:
获取第一文本信息的文本标识;
将第一文本信息以及所述第一文本信息的文本标识关联存储到预设数据库中。
17.根据权利要求10所述的装置,其特征在于,所述装置还包括加载模块,用于:
当获取到用户的文本浏览操作时,获取所述文本浏览操作中的文本标识,并将对应的第二文本信息提供给所述用户;
在所述预设数据库中查询是否存在所述文本标识,如果存在,则将所述文本标识关联的所述第一文本信息提供给所述用户,其中,所述第二文本信息与所述第一文本信息的文本内容相同,所述第二文本信息中的文本信息为未进行标记的文本信息。
18.根据权利要求10所述的装置,其特征在于,当所述标记片段所对应的搜索结果包括至少两个时,
所述提供模块具体用于:
按照预设规则将所述搜索结果提供给所述用户。
19.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器;
一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于:执行根据权利要求1~9任一项所述的信息搜索方法。
20.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机指令,当其在计算机上运行时,使得计算机可以执行上述权利要求1~9中任一项所述的信息搜索方法。
CN201911168422.9A 2019-11-25 2019-11-25 信息搜索方法、装置、电子设备和存储介质 Active CN110866092B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911168422.9A CN110866092B (zh) 2019-11-25 2019-11-25 信息搜索方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911168422.9A CN110866092B (zh) 2019-11-25 2019-11-25 信息搜索方法、装置、电子设备和存储介质

Publications (2)

Publication Number Publication Date
CN110866092A CN110866092A (zh) 2020-03-06
CN110866092B true CN110866092B (zh) 2023-03-14

Family

ID=69655320

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911168422.9A Active CN110866092B (zh) 2019-11-25 2019-11-25 信息搜索方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN110866092B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102929924A (zh) * 2012-09-20 2013-02-13 百度在线网络技术(北京)有限公司 一种基于浏览内容的取词搜索结果生成方法及装置
CN103577596A (zh) * 2013-11-15 2014-02-12 北京奇虎科技有限公司 基于当前浏览页面的关键词搜索方法及装置
CN104462425A (zh) * 2014-12-12 2015-03-25 百度在线网络技术(北京)有限公司 搜索建议的展示方法和装置
CN106919702A (zh) * 2017-02-14 2017-07-04 北京时间股份有限公司 基于文档的关键词推送方法及装置
CN106980700A (zh) * 2013-11-08 2017-07-25 北京奇虎科技有限公司 在浏览器侧进行网络搜索的方法与浏览器
CN108984663A (zh) * 2018-06-28 2018-12-11 上海掌门科技有限公司 一种页面内容搜索、显示的方法及设备
CN109408626A (zh) * 2018-11-09 2019-03-01 苏州思必驰信息科技有限公司 对自然语言进行处理的方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106933809A (zh) * 2017-03-27 2017-07-07 三角兽(北京)科技有限公司 信息处理装置及信息处理方法
CN107071542B (zh) * 2017-04-18 2020-07-28 百度在线网络技术(北京)有限公司 视频片段播放方法及装置
CN107256267B (zh) * 2017-06-19 2020-07-24 北京百度网讯科技有限公司 查询方法和装置
CN110046656B (zh) * 2019-03-28 2023-07-11 南京邮电大学 基于深度学习的多模态场景识别方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102929924A (zh) * 2012-09-20 2013-02-13 百度在线网络技术(北京)有限公司 一种基于浏览内容的取词搜索结果生成方法及装置
CN106980700A (zh) * 2013-11-08 2017-07-25 北京奇虎科技有限公司 在浏览器侧进行网络搜索的方法与浏览器
CN103577596A (zh) * 2013-11-15 2014-02-12 北京奇虎科技有限公司 基于当前浏览页面的关键词搜索方法及装置
CN104462425A (zh) * 2014-12-12 2015-03-25 百度在线网络技术(北京)有限公司 搜索建议的展示方法和装置
CN106919702A (zh) * 2017-02-14 2017-07-04 北京时间股份有限公司 基于文档的关键词推送方法及装置
CN108984663A (zh) * 2018-06-28 2018-12-11 上海掌门科技有限公司 一种页面内容搜索、显示的方法及设备
CN109408626A (zh) * 2018-11-09 2019-03-01 苏州思必驰信息科技有限公司 对自然语言进行处理的方法及装置

Also Published As

Publication number Publication date
CN110866092A (zh) 2020-03-06

Similar Documents

Publication Publication Date Title
CN106649818B (zh) 应用搜索意图的识别方法、装置、应用搜索方法和服务器
CN106202382B (zh) 链接实体方法和系统
US8341150B1 (en) Filtering search results using annotations
CN109726274B (zh) 问题生成方法、装置及存储介质
US9507867B2 (en) Discovery engine
Liu et al. Identifying web spam with the wisdom of the crowds
WO2016000555A1 (zh) 基于社交网络的内容、新闻推荐方法和系统
US20090144240A1 (en) Method and systems for using community bookmark data to supplement internet search results
CN113822067A (zh) 关键信息提取方法、装置、计算机设备及存储介质
US20140149401A1 (en) Per-document index for semantic searching
EP2382534A1 (en) Search engine for refining context-based queries based upon historical user feedback
CN107193987B (zh) 获取与页面相关的搜索词的方法、装置和系统
WO2015149533A1 (zh) 一种基于网页内容分类进行分词处理的方法和装置
CN111259271A (zh) 评论信息的展示方法、装置、电子设备及计算机可读介质
CN107958078A (zh) 信息生成方法和装置
CN110968789B (zh) 电子书推送方法、电子设备及计算机存储介质
CN107273393B (zh) 用于移动设备的图像搜索方法、装置及数据处理系统
JP2007334502A (ja) 検索装置、方法およびプログラム
EP3016003A1 (en) Search method, apparatus and device and non-volatile computer storage medium
US20160299951A1 (en) Processing a search query and retrieving targeted records from a networked database system
CN109952571B (zh) 基于上下文的图像搜索结果
CN105653547A (zh) 一种提取文本关键词的方法和装置
CN107885875B (zh) 检索词的同义变换方法、装置及服务器
CN114330329A (zh) 一种业务内容搜索方法、装置、电子设备及存储介质
CN110245357B (zh) 主实体识别方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200729

Address after: 518057 Nanshan District science and technology zone, Guangdong, Zhejiang Province, science and technology in the Tencent Building on the 1st floor of the 35 layer

Applicant after: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.

Address before: 100029, Beijing, Chaoyang District new East Street, building No. 2, -3 to 25, 101, 8, 804 rooms

Applicant before: Tricorn (Beijing) Technology Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant