CN111597311B - 用于输出信息的方法和装置 - Google Patents

用于输出信息的方法和装置 Download PDF

Info

Publication number
CN111597311B
CN111597311B CN202010034651.8A CN202010034651A CN111597311B CN 111597311 B CN111597311 B CN 111597311B CN 202010034651 A CN202010034651 A CN 202010034651A CN 111597311 B CN111597311 B CN 111597311B
Authority
CN
China
Prior art keywords
entity word
search
entity
word
correct
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010034651.8A
Other languages
English (en)
Other versions
CN111597311A (zh
Inventor
钱璟
郭辰阳
吕继根
邵英杰
张野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010034651.8A priority Critical patent/CN111597311B/zh
Publication of CN111597311A publication Critical patent/CN111597311A/zh
Application granted granted Critical
Publication of CN111597311B publication Critical patent/CN111597311B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了用于输出信息的方法和装置。上述方法的一具体实施方式包括:在接收到用户输入的搜索语句后,可以对搜索语句进行切词,确定搜索语句中包括的搜索实体词。响应于预设的正确实体词集合中不包括搜索实体词,确定是否存在与搜索实体词匹配的正确实体词。在确定不存在与搜索实体词匹配的正确实体词,可以确定与搜索实体词匹配的正确实体词。最后,根据匹配的正确实体词,输出搜索结果。该实施方式可以提高实体词的识别能力,更好的满足用户的需要。

Description

用于输出信息的方法和装置
技术领域
本申请实施例涉及计算机技术领域,具体涉及用于输出信息的方法和装置。
背景技术
在智能问答领域,用户有问答需求的时候,由于输入错误或者其他原因,会输入错误的实体词。由于机器无法理解错误的实体词,针对该实体词的问答能力不能得到体现,从而降低了用户体验。
发明内容
本申请实施例提出了用于输出信息的方法和装置。
第一方面,本申请实施例提供了一种用于输出信息的方法,包括:接收用户输入的搜索语句;对上述搜索语句切词,确定上述搜索语句中包括的搜索实体词;响应于预设的正确实体词集合中不包括上述搜索实体词,确定是否存在与上述搜索实体词匹配的正确实体词;响应于确定不存在与上述搜索实体词匹配的正确实体词,确定与上述搜索实体词匹配的正确实体词;根据匹配的正确实体词,输出搜索结果。
在一些实施例中,上述确定与上述搜索实体词匹配的正确实体词,包括:确定与上述搜索实体词相似的正确实体词为候选实体词;对于每个候选实体词,统计该候选实体词在第一预设周期内被确定为候选实体词的次数;根据统计结果,确定与上述搜索实体词匹配的正确实体词。
在一些实施例中,上述确定与上述搜索实体词相似的正确实体词为候选实体词,包括:确定上述搜索语句的类型;基于上述类型,确定与上述搜索实体词相似的正确实体词;根据相似的正确实体词以及预设的、与上述搜索实体词对应的错误实体词列表,确定候选实体词。
在一些实施例中,上述类型包括第一预设类型;以及上述基于上述类型,确定与上述搜索实体词相似的正确实体词,包括:确定用户在针对上述搜索语句返回的历史搜索结果中首次点击的链接;确定上述链接的标题所包括的实体词以及计算上述实体词与上述搜索实体词的相似度;将相似度大于预设相似度阈值的实体词作为相似的正确实体词。
在一些实施例中,上述类型包括第二预设类型;以及上述基于上述类型,确定与上述搜索实体词相似的正确实体词,包括:计算预设的词库中的各实体词与上述搜索实体词的相似度;将相似度大于预设相似度阈值的实体词作为相似的正确实体词。
在一些实施例中,上述根据相似的正确实体词以及预设的、与上述搜索实体词对应的错误实体词列表,确定候选实体词,包括:将上述相似的正确实体词中不位于上述错误实体词列表中的实体词作为候选实体词。
在一些实施例中,上述根据统计结果,确定与上述搜索实体词匹配的正确实体词,包括:响应于确定存在至少一个候选实体词被确定为候选实体词的次数超过第一预设次数阈值,将次数最多的候选实体词确定为与上述搜索实体词匹配的正确实体词;响应于确定不存在被确定为候选实体词的次数超过第一预设次数阈值的候选实体词,继续对各候选实体词被确定为候选实体词的次数的统计。
在一些实施例中,上述方法还包括:将与上述搜索实体词匹配的正确实体词加入上述错误实体词列表。
在一些实施例中,上述方法还包括:响应于确定当前与上述搜索实体词匹配的正确实体词错误,解除上述匹配,并重新确定与上述搜索实体词匹配的正确实体词。
在一些实施例中,上述方法还包括用于确定当前与上述搜索实体词匹配的正确实体词错误的确定步骤,上述确定步骤包括以下至少一项:用户点击了上述搜索结果中的除预设链接之外的其它链接;用户在上述预设链接所在页面的停留时长小于预设时长;接收到用户对上述预设链接的报错反馈。
在一些实施例中,上述方法还包括:如果在第二预设周期内上述确定步骤的发生次数大于第二预设次数阈值,则确定当前与上述搜索实体词匹配的正确实体词错误。
在一些实施例中,上述方法还包括:响应于与上述搜索实体词匹配的正确实体词的匹配完成,暂停对各上述候选实体词被确定为候选实体词的次数的统计;响应于与上述搜索实体词匹配的正确实体词的匹配解除,继续对各上述候选实体词被确定为候选实体词的次数的统计。
第二方面,本申请实施例提供了一种用于输出信息的装置,包括:搜索语句接收单元,被配置成接收用户输入的搜索语句;搜索实体词确定单元,被配置成对上述搜索语句切词,确定上述搜索语句中包括的搜索实体词;正确实体词判断单元,被配置成响应于预设的正确实体词集合中不包括上述搜索实体词,确定是否存在与上述搜索实体词匹配的正确实体词;匹配实体词确定单元,被配置成响应于确定不存在与上述搜索实体词匹配的正确实体词,确定与上述搜索实体词匹配的正确实体词;搜索结果输出单元,被配置成根据匹配的正确实体词,输出搜索结果。
在一些实施例中,上述匹配实体词确定单元包括:候选实体词确定模块,被配置成确定与上述搜索实体词相似的正确实体词为候选实体词;次数统计模块,被配置成对于每个候选实体词,统计该候选实体词在第一预设周期内被确定为候选实体词的次数;匹配实体词确定模块,被配置成根据统计结果,确定与上述搜索实体词匹配的正确实体词。
在一些实施例中,上述候选实体词确定模块进一步被配置成:确定上述搜索语句的类型;基于上述类型,确定与上述搜索实体词相似的正确实体词;根据相似的正确实体词以及预设的、与上述搜索实体词对应的错误实体词列表,确定候选实体词。
在一些实施例中,上述类型包括第一预设类型;以及上述候选实体词确定模块进一步被配置成:确定用户在针对上述搜索语句返回的历史搜索结果中首次点击的链接;确定上述链接的标题所包括的实体词以及计算上述实体词与上述搜索实体词的相似度;将相似度大于预设相似度阈值的实体词作为相似的正确实体词。
在一些实施例中,上述类型包括第二预设类型;以及上述候选实体词确定模块进一步被配置成:计算预设的词库中的各实体词与上述搜索实体词的相似度;将相似度大于预设相似度阈值的实体词作为相似的正确实体词。
在一些实施例中,上述候选实体词确定模块进一步被配置成:将上述相似的正确实体词中不位于上述错误实体词列表中的实体词作为候选实体词。
在一些实施例中,上述匹配实体词确定模块进一步被配置成:响应于确定存在至少一个候选实体词被确定为候选实体词的次数超过第一预设次数阈值,将次数最多的候选实体词确定为与上述搜索实体词匹配的正确实体词;响应于确定不存在被确定为候选实体词的次数超过第一预设次数阈值的候选实体词,继续对各候选实体词被确定为候选实体词的次数的统计。
在一些实施例中,上述装置还包括:加入单元,被配置成将与上述搜索实体词匹配的正确实体词加入上述错误实体词列表。
在一些实施例中,上述装置还包括:匹配解除单元,被配置成响应于确定当前与上述搜索实体词匹配的正确实体词错误,解除上述匹配,并重新确定与上述搜索实体词匹配的正确实体词。
在一些实施例中,上述装置利用确定步骤确定当前与上述搜索实体词匹配的正确实体词错误,上述确定步骤包括:用户点击了上述搜索结果中的除预设链接之外的其它链接;用户在上述预设链接所在页面的停留时长小于预设时长;接收到用户对上述预设链接的报错反馈。
在一些实施例中,上述装置还包括:错误认定单元,被配置成如果在第二预设周期内上述确定步骤的发生次数大于第二预设次数阈值,则确定当前与上述搜索实体词匹配的正确实体词错误。
在一些实施例中,上述装置还包括统计控制单元,被配置成:响应于与上述搜索实体词匹配的正确实体词的匹配完成,暂停对各上述候选实体词被确定为候选实体词的次数的统计;响应于与上述搜索实体词匹配的正确实体词的匹配解除,继续对各上述候选实体词被确定为候选实体词的次数的统计。
第三方面,本申请实施例提供了一种服务器,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行,使得上述一个或多个处理器实现如第一方面任一实施例所描述的方法。
第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面任一实施例所描述的方法。
本申请的上述实施例提供的用于输出信息的方法和装置,在接收到用户输入的搜索语句后,可以对搜索语句进行切词,确定搜索语句中包括的搜索实体词。响应于预设的正确实体词集合中不包括搜索实体词,确定是否存在与搜索实体词匹配的正确实体词。在确定不存在与搜索实体词匹配的正确实体词,可以确定与搜索实体词匹配的正确实体词。最后,根据匹配的正确实体词,输出搜索结果。本实施例的方法,可以提高实体词的识别能力,更好的满足用户的需要。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请的一个实施例可以应用于其中的示例性系统架构图;
图2是根据本申请的用于输出信息的方法的一个实施例的流程图;
图3是根据本申请的用于输出信息的方法的一个应用场景的示意图;
图4是根据本申请的用于输出信息的方法中确定与搜索实体词匹配的正确实体词的流程图;
图5是根据本申请的用于输出信息的装置的一个实施例的结构示意图;
图6是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的用于输出信息的方法或用于输出信息的装置的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上网页显示的搜索结果提供支持的后台搜索服务器。后台搜索服务器可以对接收到的搜索语句等数据进行分析等处理,并将处理结果(例如搜索结果数据)反馈给终端设备101、102、103。
需要说明的是,服务器105可以是硬件,也可以是软件。当服务器105为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器105为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
需要说明的是,本申请实施例所提供的用于输出信息的方法一般由服务器105执行,相应地,用于输出信息的装置一般设置于服务器105中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的用于输出信息的方法的一个实施例的流程200。本实施例的用于输出信息的方法,包括以下步骤:
步骤201,接收用户输入的搜索语句。
在本实施例中,用于输出信息的方法的执行主体(例如图1所示的服务器105)可以通过有线连接方式或者无线连接方式接收用户输入的搜索语句。用户可以通过终端设备(例如图1所示的终端设备101、102、103)在搜索引擎的输入框中输入搜索语句。这样,执行主体就可以接收到上述搜索语句。
执行主体可以对上述搜索语句进行类型划分,搜索语句的类型可以包括SPO(主体-属性-对象)类型和纠错类型。其中,SPO类型用于询问与主体之间存在属性关系的对象,例如,搜索语句“A电视剧的导演是谁”中,主体为“A电视剧”,属性为“导演”。纠错类型用于确定搜索语句中包括的错误实体词对应的正确实体词。例如,搜索语句“啊娜多姿中的错别字是哪个?”。
步骤202,对搜索语句切词,确定搜索语句中包括的搜索实体词。
执行主体在接收到搜索语句后,可以对搜索语句切词,确定搜索语句中包括的搜索实体词。可以理解的是,执行主体可以采用多种自然语言处理算法来对搜索语句进行切词处理,然后根据各词之间的依存关系和语法关系来确定搜索语句中包括的搜索实体词。
步骤203,响应于预设的正确实体词集合中不包括搜索实体词,确定是否存在与搜索实体词匹配的正确实体词。
执行主体在确定搜索实体词后,可以判断预设的正确实体词集合中是否包括上述搜索实体词。如果包括,则可以直接返回针对上述搜索实体词的搜索结果。如果不包括,则说明上述搜索实体词是一个错误的实体词。则执行主体可以进一步确认当前是否存在与搜索实体词匹配的正确实体词。可以理解的是,执行主体本地或者与执行主体连接的其它电子设备中可以存储有搜索实体词与正确实体词的匹配关系。执行主体可以通过查询上述匹配关系,来确定当前是否存在与搜索实体词匹配的正确实体词。
步骤204,响应于确定不存在与搜索实体词匹配的正确实体词,确定与搜索实体词匹配的正确实体词。
如果执行主体确定当前不存在与搜索实体词匹配的正确实体词,则可以为搜索实体词确定匹配的正确实体词。具体的,执行主体可以通过多种方式来确定与搜索实体词确定匹配的正确实体词。例如,执行主体可以将与搜索实体词最相似的正确实体词作为与搜索实体词确定匹配的正确实体词。
步骤205,根据匹配的正确实体词,输出搜索结果。
本实施例中,执行主体在确定与搜索实体词匹配的正确实体词后,可以根据上述正确实体词,输出搜索结果。具体的,执行主体可以以正确实体词为目标搜索词,得到关于上述正确实体词的搜索结果,并将上述搜索结果作为最终搜索结果。或者,执行主体可以分别以上述搜索实体词和正确实体词为搜索词,将二者的搜索结果进行混合,得到最终的搜索结果。
在本实施例的一些可选的实现方式中,上述方法还可以进一步包括图2中未示出的以下步骤:响应于确定当前与搜索实体词匹配的正确实体词错误,解除上述匹配,并重新确定与搜索实体词匹配的正确实体词。
如果执行主体确定与搜索实体词匹配的正确实体词是错误的,即搜索实体词不能与上述正确实体词匹配,则执行主体可以解除正确实体词与搜索实体词的匹配,并重新确定与搜索实体词匹配的正确实体词。从而能够根据重新确定的正确实体词来确定搜索结果,避免了反复向用户提供错误的实体词的搜索结果。
在本实施例的一些可选的实现方式中,执行主体可以通过图2中未示出的以下至少一个步骤来确定与搜索实体词匹配的正确实体词是错误的:用户点击了搜索结果中的除预设链接之外的其它链接;用户未点击所述搜索结果中的任何链接,并且在预设链接所在页面的停留时长小于预设时长;接收到用户对预设链接的报错反馈。
本实现方式中,执行主体可以在搜索结果中预先设定某一链接。以百度搜索引擎为例,其可以将有百度网站自身生成的搜索结果排在搜索结果的首位。那么排在首位的链接即为预设的链接。如果用户首次点击了该预设链接,说明用户认可其提供的搜索结果。此处,首次点击是指用户在搜索页面上呈现出的10条或多条搜索结果中,用户点击的第一个结果,该首次点击的搜索结果被认为是用户觉得符合需求的搜索结果。
如果用户点击了搜索结果中出上述预设连接之外的其它链接,则认为用户对预设链接的搜索结果并不认同,则认为搜索实体词与正确实体词匹配错误。或者,用户在预设链接所在页面的停留时长小于预设时长,则说明用户对预设链接的搜索结果并不认同。举例来说,预设链接位于搜索结果页面的第一位,用户在浏览搜索结果页面时,快速的向上滑动,以致于在第一位搜索结果的停留时长太短,这种情况下认为用户不认同第一位的搜索结果。相反,如果用户在第一位的搜索结果的停留时长较长,则认为第一位的搜索结果已经给出了用户想要的答案,无需点击任何链接。
如果执行主体接收到用户对预设链接的报错反馈,则直接说明用户不认同预设链接的搜索结果。本实现方式中,预设链接可以设置有用户报错反馈入口,该入口可以是一个按钮或者是一个链接,用户通过点击此按钮或链接可以向执行主体发送报错反馈请求。
在本实施例的一些可选的实现方式中,上述方法还包括图2中未示出的以下步骤:如果在第二预设周期内确定步骤的发生次数大于第二预设次数阈值,则确定当前与所述搜索实体词匹配的正确实体词错误。
本实现方式中,执行主体可以统计在第二预设周期内上述确定步骤的发生次数,即执行主体检测到与搜索实体词匹配的正确实体词被用户认定为错误的次数,如果上述次数大于第二预设次数阈值,则确定当前与搜索实体词匹配的正确实体词错误。
继续参见图3,图3是根据本实施例的用于输出信息的方法的一个应用场景的示意图。在图3的应用场景中,用户在搜索页面30的输入框内输入“啊娜多姿的意思是什么”,执行主体确定与搜索实体词“啊娜多姿”匹配的正确实体词为“婀娜多姿”,则向用户返回“婀娜多姿”的释义的搜索结果31,并将该搜索结果以卡片的形式显示在搜索页面的第一位。
本申请的上述实施例提供的用于输出信息的方法,在接收到用户输入的搜索语句后,可以对搜索语句进行切词,确定搜索语句中包括的搜索实体词。响应于预设的正确实体词集合中不包括搜索实体词,确定是否存在与搜索实体词匹配的正确实体词。在确定不存在与搜索实体词匹配的正确实体词,可以确定与搜索实体词匹配的正确实体词。最后,根据匹配的正确实体词,输出搜索结果。本实施例的方法,可以提高实体词的识别能力,更好的满足用户的需要。
继续参见图4,其示出了根据本申请的用于输出信息的方法中确定与搜索实体词匹配的正确实体词的流程400。如图4所示,本实施例中,在确定与搜索实体词匹配的正确实体词时,可以首先确定与搜索实体词相似的正确实体词为候选实体词。具体的,执行主体可以通过步骤401~403来确定候选实体词。
步骤401,确定搜索语句的类型。
本实施例中,执行主体可以首先确定搜索语句的类型,搜索语句的类型可以包括第一预设类型和第二预设类型。如前所述,第一预设类型可以为SPO类型,第二预设类型可以为纠错类型。执行主体可以对搜索语句进行分词、语义分析以及依存关系分析等多种处理,以确定搜索语句的类型。
步骤402,基于类型,确定与搜索实体词相似的正确实体词。
在确定搜索语句的类型后,执行主体可以基于所确定的类型,确定与搜索实体词相似的正确实体词。
在本实施例的一些可选的实现方式中,上述类型可以包括第一预设类型。上述步骤402具体可以通过图4中未示出的以下步骤来实现:确定用户在针对搜索语句返回的历史搜索结果中首次点击的链接;确定上述链接的标题所包括的实体词以及计算上述实体词与搜索实体词的相似度;将相似度大于预设阈值的实体词作为相似的正确实体词。
本实现方式中,执行主体可以首先确定用户在针对该搜索语句返回的历史搜索结果中首次点击的链接。可以理解的是,执行主体在每次返回搜索结果后,可以检测用户所点击的链接,从而确定首次点击的链接。然后,执行主体可以对上述连接中的标题进行分词等处理,以确定其中包括的实体词。并分别计算各实体词与搜索实体词之间的相似度。最后,执行主体可以将相似度大于预设阈值的实体词作为相似的正确实体词。
在本实施例的一些可选的实现方式中,上述类型可以包括第二预设类型。上述步骤402具体可以通过图4中未示出的以下步骤来实现:计算预设的词库中的各实体词与搜索实体词的相似度;将相似度大于预设阈值的实体词作为相似的正确实体词。
本实现方式中,执行主体可以将预设的词库中的各实体词依次与搜索实体词来计算相似度。并将相似度大于预设阈值的实体词作为相似的正确实体词。上述预设的词库可以是包含各种命名实体词的词库,也可以是其它任意词库。
在上述实现方式中,在计算实体词与搜索实体词之间的相似度时,可以综合考虑二者之间的拼音、笔顺、部首、部件以及编辑距离等属性,以提高计算二者相似性的准确度。因为相似度是确定匹配的正确实体词的前提,因此,相似度的计算至关重要。以搜索实体词为“啊娜多姿”,实体词为“婀娜多姿”为例来说明,二者的拼音只在第一个字有差异,其余三个字均相同,则拼音相似度为3/4=75%。“啊”与“婀”的笔顺相似度为二者的重叠笔顺与二者中最大笔顺的比值,为7/10=70%。同样的,执行主体可以依次计算部首、部件以及编辑距离的相似度。并将得到的各相似度加权叠加,得到最终的相似度。
步骤403,根据相似的正确实体词以及预设的、与搜索实体词对应的错误实体词列表,确定候选实体词。
在确定与搜索实体词相似的正确实体词后,执行主体可以结合预设的、与搜索实体词对应的错误实体词列表,来确定候选实体词。上述错误实体词列表可以相当于一个黑名单,该黑名单与搜索实体词对应。黑名单中的实体词与搜索实体词不能匹配。具体来说,如果搜索实体词为“啊娜多姿”,黑名单中的词为“妖娆多姿”,则即使相似的正确实体词中包括“妖娆多姿”,其也不能作为搜索实体词“啊娜多姿”的候选实体词。
在本实施例的一些可选的实现方式中,执行主体可以将上述相似的正确实体词中不位于错误实体词列表中的实体词作为候选实体词。
步骤404,对于每个候选实体词,统计该候选实体词在预设周期内被确定为候选实体词的次数。
在确定搜索实体词的各候选实体词后,执行主体还可以统计各候选实体词在预设周期内被确定为候选实体词的次数。以周期为7天为例来说,执行主体可以统计在该周期内,包括上述搜索实体词的搜索语句被输入时,通过步骤401~403,所确定的各候选实体词。并分别统计各候选词被确定为候选实体词的次数。
步骤405,根据统计结果,确定与搜索实体词匹配的正确实体词。
最后,执行主体可以根据统计结果,来确定与搜索实体词匹配的正确实体词。具体的,执行主体可以将次数最多的候选实体词为与搜索实体词匹配的正确实体词。
在本实施例的一些可选的实现方式中,上述步骤405可以通过图4中未示出的以下步骤来实现:响应于确定存在至少一个候选实体词被确定为候选实体词的次数超过预设阈值,将次数最多的候选实体词确定为与搜索实体词匹配的正确实体词。响应于确定不存在被确定为候选实体词的次数超过预设阈值的候选实体词,继续对各候选实体词被确定为候选实体词的次数的统计。
本实现方式中,执行主体可以首先获取一个预设阈值,并判断各候选实体词中,哪些候选实体词的统计次数超过了上述预设阈值。如果存在统计次数超过预设阈值的至少一个候选实体词,则执行主体可以将统计次数最多的候选实体词作为与搜索实体词匹配的正确实体词。如果不存在统计次数超过预设阈值的候选实体词,则执行主体可以继续统计该候选实体词在预设周期内被确定为候选实体词的次数,直到统计次数超过预设阈值的候选实体词出现。
在本实施例的一些可选的实现方式中,上述方法还可以进一步包括图4中未示出的以下步骤:将与搜索实体词匹配的正确实体词加入错误实体词列表。
本实现方式中,通过将与搜索实体词匹配的正确实体词加入“黑名单”,可以避免以下情况出现:与搜索实体词匹配的正确实体词不被用户认可,则此时,执行主体会解除搜索实体词与上述正确实体词的匹配。这样,上述搜索实体词又重新进入了寻找匹配的正确实体词的步骤。由于被解除匹配的正确实体词确实与搜索实体词相似,则被解除匹配的正确实体词有可能会再一次被确定为与搜索实体词匹配的正确实体词,这样就形成了一个恶性循环。通过将与搜索实体词匹配的正确实体词加入“黑名单”,则不会出现被解除匹配的正确实体词再一次被确定为与搜索实体词匹配的正确实体词的情况。
在本实施例的一些可选的实现方式中,上述方法还可以进一步包括图4中未示出的以下步骤:响应于与搜索实体词匹配的正确实体词的匹配完成,暂停对各候选实体词被确定为候选实体词的次数的统计;响应于与搜索实体词匹配的正确实体词的匹配解除,继续对各候选实体词被确定为候选实体词的次数的统计。
本实现方式中,如果执行主体确定了与搜索实体词匹配的正确实体词,则执行主体可以暂停对各候选实体词被确定为候选实体词的次数的统计。如果执行主体解除了搜索实体词与正确实体词的匹配,则执行主体需要继续对各候选实体词被确定为候选实体词的次数的统计
本申请的上述实施例提供的用于输出信息的方法,可以有效的识别用户输入的错误实体词,提高实体识别能力,并且能够提高用户对错误实体词的学习能力。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了一种用于输出信息的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例的用于输出信息的装置500包括:搜索语句接收单元501、搜索实体词确定单元502、正确实体词判断单元503、匹配实体词确定单元504和搜索结果输出单元505。
搜索语句接收单元501,被配置成接收用户输入的搜索语句。
搜索实体词确定单元502,被配置成对搜索语句切词,确定搜索语句中包括的搜索实体词。
正确实体词判断单元503,被配置成响应于预设的正确实体词集合中不包括搜索实体词,确定是否存在与搜索实体词匹配的正确实体词。
匹配实体词确定单元504,被配置成响应于确定不存在与搜索实体词匹配的正确实体词,确定与搜索实体词匹配的正确实体词。
搜索结果输出单元505,被配置成根据匹配的正确实体词,输出搜索结果。
在本实施例的一些可选的实现方式中,匹配实体词确定单元504可以进一步包括图5中未示出的:候选实体词确定模块、次数统计模块和匹配实体词确定模块。
候选实体词确定模块,被配置成确定与搜索实体词相似的正确实体词为候选实体词。
次数统计模块,被配置成对于每个候选实体词,统计该候选实体词在第一预设周期内被确定为候选实体词的次数。
匹配实体词确定模块,被配置成根据统计结果,确定与搜索实体词匹配的正确实体词。
在本实施例的一些可选的实现方式中,候选实体词确定模块进一步被配置成:确定搜索语句的类型;基于上述类型,确定与搜索实体词相似的正确实体词;根据相似的正确实体词以及预设的、与搜索实体词对应的错误实体词列表,确定候选实体词。
在本实施例的一些可选的实现方式中,上述类型包括第一预设类型。候选实体词确定模块可以进一步被配置成:确定用户在针对搜索语句返回的历史搜索结果中首次点击的链接;确定上述链接的标题所包括的实体词以及计算实体词与搜索实体词的相似度;将相似度大于预设相似度阈值的实体词作为相似的正确实体词。
在本实施例的一些可选的实现方式中,上述类型包括第二预设类型。候选实体词确定模块可以进一步被配置成:计算预设的词库中的各实体词与搜索实体词的相似度;将相似度大于预设相似度阈值的实体词作为相似的正确实体词。
在本实施例的一些可选的实现方式中,候选实体词确定模块可以进一步被配置成:将相似的正确实体词中不位于错误实体词列表中的实体词作为候选实体词。
在本实施例的一些可选的实现方式中,匹配实体词确定模块进一步被配置成:响应于确定存在至少一个候选实体词被确定为候选实体词的次数超过第一预设次数阈值,将次数最多的候选实体词确定为与所述搜索实体词匹配的正确实体词;响应于确定不存在被确定为候选实体词的次数超过第一预设次数阈值的候选实体词,继续对各候选实体词被确定为候选实体词的次数的统计。
在本实施例的一些可选的实现方式中,装置500还可以进一步包括图5中未示出的加入单元,被配置成将与搜索实体词匹配的正确实体词加入错误实体词列表。
在本实施例的一些可选的实现方式中,装置500还可以进一步包括图5中未示出的匹配解除单元,被配置成响应于确定当前与搜索实体词匹配的正确实体词错误,解除上述匹配,并重新确定与搜索实体词匹配的正确实体词。
在本实施例的一些可选的实现方式中,装置500利用确定步骤确定当前与搜索实体词匹配的正确实体词错误,确定步骤包括:用户点击了搜索结果中的除预设链接之外的其它链接;用户在预设链接所在页面的停留时长小于预设时长;接收到用户对预设链接的报错反馈。
在本实施例的一些可选的实现方式中,装置500还可以进一步包括图5中未示出的错误认定单元,被配置成如果在第二预设周期内确定步骤的发生次数大于第二预设次数阈值,则确定当前与搜索实体词匹配的正确实体词错误。
在本实施例的一些可选的实现方式中,装置500还可以进一步包括图5中未示出的统计控制单元,被配置成:响应于与搜索实体词匹配的正确实体词的匹配完成,暂停对各候选实体词被确定为候选实体词的次数的统计;响应于与搜索实体词匹配的正确实体词的匹配解除,继续对各候选实体词被确定为候选实体词的次数的统计。
应当理解,用于输出信息的装置500中记载的单元501至单元505分别与参考图2中描述的方法中的各个步骤相对应。由此,上文针对用于输出信息的方法描述的操作和特征同样适用于装置500及其中包含的单元,在此不再赘述。
下面参考图6,其示出了适于用来实现本公开的实施例的电子设备(例如图1中的服务器)600的结构示意图。图6示出的服务器仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
如图6所示,电子设备600可以包括处理装置(例如中央处理器、图形处理器等)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储装置608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有电子设备600操作所需的各种程序和数据。处理装置601、ROM 602以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
通常,以下装置可以连接至I/O接口605:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置606;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置607;包括例如磁带、硬盘等的存储装置608;以及通信装置609。通信装置609可以允许电子设备600与其他设备进行无线或有线通信以交换数据。虽然图6示出了具有各种装置的电子设备600,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图6中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置609从网络上被下载和安装,或者从存储装置608被安装,或者从ROM 602被安装。在该计算机程序被处理装置601执行时,执行本公开的实施例的方法中限定的上述功能。需要说明的是,本公开的实施例所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:接收用户输入的搜索语句;对搜索语句切词,确定搜索语句中包括的搜索实体词;响应于预设的正确实体词集合中不包括搜索实体词,确定是否存在与搜索实体词匹配的正确实体词;响应于确定不存在与搜索实体词匹配的正确实体词,确定与搜索实体词匹配的正确实体词;根据匹配的正确实体词,输出搜索结果。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的实施例的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开的实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括搜索语句接收单元、搜索实体词确定单元、正确实体词判断单元、匹配实体词确定单元和搜索结果输出单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,搜索语句接收单元还可以被描述为“接收用户输入的搜索语句的单元”。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开的实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (26)

1.一种用于输出信息的方法,包括:
接收用户输入的搜索语句;
对所述搜索语句切词,确定所述搜索语句中包括的搜索实体词;
响应于预设的正确实体词集合中不包括所述搜索实体词,确定是否存在与所述搜索实体词匹配的正确实体词;
响应于确定不存在与所述搜索实体词匹配的正确实体词,确定与所述搜索实体词匹配的正确实体词;
根据匹配的正确实体词,输出搜索结果。
2.根据权利要求1所述的方法,其中,所述确定与所述搜索实体词匹配的正确实体词,包括:
确定与所述搜索实体词相似的正确实体词为候选实体词;
对于每个候选实体词,统计该候选实体词在第一预设周期内被确定为候选实体词的次数;
根据统计结果,确定与所述搜索实体词匹配的正确实体词。
3.根据权利要求2所述的方法,其中,所述确定与所述搜索实体词相似的正确实体词为候选实体词,包括:
确定所述搜索语句的类型;
基于所述类型,确定与所述搜索实体词相似的正确实体词;
根据相似的正确实体词以及预设的、与所述搜索实体词对应的错误实体词列表,确定候选实体词,其中,所述错误实体词列表中的实体词不能作为所述搜索实体词的候选实体词。
4.根据权利要求3所述的方法,其中,所述类型包括第一预设类型;以及
所述基于所述类型,确定与所述搜索实体词相似的正确实体词,包括:
确定用户在针对所述搜索语句返回的历史搜索结果中首次点击的链接;
确定所述链接的标题所包括的实体词以及计算所述实体词与所述搜索实体词的相似度;
将相似度大于预设相似度阈值的实体词作为相似的正确实体词。
5.根据权利要求3所述的方法,其中,所述类型包括第二预设类型;以及
所述基于所述类型,确定与所述搜索实体词相似的正确实体词,包括:
计算预设的词库中的各实体词与所述搜索实体词的相似度;
将相似度大于预设相似度阈值的实体词作为相似的正确实体词。
6.根据权利要求3所述的方法,其中,所述根据相似的正确实体词以及预设的、与所述搜索实体词对应的错误实体词列表,确定候选实体词,包括:
将所述相似的正确实体词中不位于所述错误实体词列表中的实体词作为候选实体词。
7.根据权利要求2所述的方法,其中,所述根据统计结果,确定与所述搜索实体词匹配的正确实体词,包括:
响应于确定存在至少一个候选实体词被确定为候选实体词的次数超过第一预设次数阈值,将次数最多的候选实体词确定为与所述搜索实体词匹配的正确实体词;
响应于确定不存在被确定为候选实体词的次数超过第一预设次数阈值的候选实体词,继续对各候选实体词被确定为候选实体词的次数的统计。
8.根据权利要求3所述的方法,其中,所述方法还包括:
将与所述搜索实体词匹配的正确实体词加入所述错误实体词列表。
9.根据权利要求1-8任一项所述的方法,其中,所述方法还包括:
响应于确定当前与所述搜索实体词匹配的正确实体词错误,解除所述匹配,并重新确定与所述搜索实体词匹配的正确实体词。
10.根据权利要求9所述的方法,其中,所述方法还包括用于确定当前与所述搜索实体词匹配的正确实体词错误的确定步骤,所述确定步骤包括以下至少一项:
用户点击了所述搜索结果中的除预设链接之外的其它链接;
用户在所述预设链接所在页面的停留时长小于预设时长;
接收到用户对所述预设链接的报错反馈。
11.根据权利要求10所述的方法,其中,所述方法还包括:
如果在第二预设周期内所述确定步骤的发生次数大于第二预设次数阈值,则确定当前与所述搜索实体词匹配的正确实体词错误。
12.根据权利要求2-8任一项所述的方法,其中,所述方法还包括:
响应于与所述搜索实体词匹配的正确实体词的匹配完成,暂停对各所述候选实体词被确定为候选实体词的次数的统计;
响应于与所述搜索实体词匹配的正确实体词的匹配解除,继续对各所述候选实体词被确定为候选实体词的次数的统计。
13.一种用于输出信息的装置,包括:
搜索语句接收单元,被配置成接收用户输入的搜索语句;
搜索实体词确定单元,被配置成对所述搜索语句切词,确定所述搜索语句中包括的搜索实体词;
正确实体词判断单元,被配置成响应于预设的正确实体词集合中不包括所述搜索实体词,确定是否存在与所述搜索实体词匹配的正确实体词;
匹配实体词确定单元,被配置成响应于确定不存在与所述搜索实体词匹配的正确实体词,确定与所述搜索实体词匹配的正确实体词;
搜索结果输出单元,被配置成根据匹配的正确实体词,输出搜索结果。
14.根据权利要求13所述的装置,其中,所述匹配实体词确定单元包括:
候选实体词确定模块,被配置成确定与所述搜索实体词相似的正确实体词为候选实体词;
次数统计模块,被配置成对于每个候选实体词,统计该候选实体词在第一预设周期内被确定为候选实体词的次数;
匹配实体词确定模块,被配置成根据统计结果,确定与所述搜索实体词匹配的正确实体词。
15.根据权利要求14所述的装置,其中,所述候选实体词确定模块进一步被配置成:
确定所述搜索语句的类型;
基于所述类型,确定与所述搜索实体词相似的正确实体词;
根据相似的正确实体词以及预设的、与所述搜索实体词对应的错误实体词列表,确定候选实体词,其中,所述错误实体词列表中的实体词不能作为所述搜索实体词的候选实体词。
16.根据权利要求15所述的装置,其中,所述类型包括第一预设类型;以及
所述候选实体词确定模块进一步被配置成:
确定用户在针对所述搜索语句返回的历史搜索结果中首次点击的链接;
确定所述链接的标题所包括的实体词以及计算所述实体词与所述搜索实体词的相似度;
将相似度大于预设相似度阈值的实体词作为相似的正确实体词。
17.根据权利要求15所述的装置,其中,所述类型包括第二预设类型;以及
所述候选实体词确定模块进一步被配置成:
计算预设的词库中的各实体词与所述搜索实体词的相似度;
将相似度大于预设相似度阈值的实体词作为相似的正确实体词。
18.根据权利要求15所述的装置,其中,所述候选实体词确定模块进一步被配置成:
将所述相似的正确实体词中不位于所述错误实体词列表中的实体词作为候选实体词。
19.根据权利要求14所述的装置,其中,所述匹配实体词确定模块进一步被配置成:
响应于确定存在至少一个候选实体词被确定为候选实体词的次数超过第一预设次数阈值,将次数最多的候选实体词确定为与所述搜索实体词匹配的正确实体词;
响应于确定不存在被确定为候选实体词的次数超过第一预设次数阈值的候选实体词,继续对各候选实体词被确定为候选实体词的次数的统计。
20.根据权利要求15所述的装置,其中,所述装置还包括:
加入单元,被配置成将与所述搜索实体词匹配的正确实体词加入所述错误实体词列表。
21.根据权利要求13-20任一项所述的装置,其中,所述装置还包括:
匹配解除单元,被配置成响应于确定当前与所述搜索实体词匹配的正确实体词错误,解除所述匹配,并重新确定与所述搜索实体词匹配的正确实体词。
22.根据权利要求21所述的装置,其中,所述装置利用确定步骤确定当前与所述搜索实体词匹配的正确实体词错误,所述确定步骤包括:
用户点击了所述搜索结果中的除预设链接之外的其它链接;
用户在所述预设链接所在页面的停留时长小于预设时长;
接收到用户对所述预设链接的报错反馈。
23.根据权利要求22所述的装置,其中,所述装置还包括:
错误认定单元,被配置成如果在第二预设周期内所述确定步骤的发生次数大于第二预设次数阈值,则确定当前与所述搜索实体词匹配的正确实体词错误。
24.根据权利要求14-20任一项所述的装置,其中,所述装置还包括统计控制单元,被配置成:
响应于与所述搜索实体词匹配的正确实体词的匹配完成,暂停对各所述候选实体词被确定为候选实体词的次数的统计;
响应于与所述搜索实体词匹配的正确实体词的匹配解除,继续对各所述候选实体词被确定为候选实体词的次数的统计。
25.一种服务器,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-12中任一所述的方法。
26.一种计算机可读介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如权利要求1-12中任一所述的方法。
CN202010034651.8A 2020-01-14 2020-01-14 用于输出信息的方法和装置 Active CN111597311B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010034651.8A CN111597311B (zh) 2020-01-14 2020-01-14 用于输出信息的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010034651.8A CN111597311B (zh) 2020-01-14 2020-01-14 用于输出信息的方法和装置

Publications (2)

Publication Number Publication Date
CN111597311A CN111597311A (zh) 2020-08-28
CN111597311B true CN111597311B (zh) 2023-04-25

Family

ID=72181372

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010034651.8A Active CN111597311B (zh) 2020-01-14 2020-01-14 用于输出信息的方法和装置

Country Status (1)

Country Link
CN (1) CN111597311B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103399879A (zh) * 2013-07-16 2013-11-20 百度在线网络技术(北京)有限公司 基于用户搜索日志的兴趣实体获得方法及装置
CN107609098A (zh) * 2017-09-11 2018-01-19 北京金堤科技有限公司 搜索方法及装置
CN109243433A (zh) * 2018-11-06 2019-01-18 北京百度网讯科技有限公司 语音识别方法和装置
CN109828981A (zh) * 2017-11-22 2019-05-31 阿里巴巴集团控股有限公司 一种数据处理方法及计算设备
CN110069698A (zh) * 2017-11-01 2019-07-30 北京京东尚科信息技术有限公司 信息推送方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10572881B2 (en) * 2016-03-14 2020-02-25 International Business Machines Corporation Applying entity search techniques to expedite entitlement resolution in support services

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103399879A (zh) * 2013-07-16 2013-11-20 百度在线网络技术(北京)有限公司 基于用户搜索日志的兴趣实体获得方法及装置
CN107609098A (zh) * 2017-09-11 2018-01-19 北京金堤科技有限公司 搜索方法及装置
CN110069698A (zh) * 2017-11-01 2019-07-30 北京京东尚科信息技术有限公司 信息推送方法和装置
CN109828981A (zh) * 2017-11-22 2019-05-31 阿里巴巴集团控股有限公司 一种数据处理方法及计算设备
CN109243433A (zh) * 2018-11-06 2019-01-18 北京百度网讯科技有限公司 语音识别方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
沈玺等.WEB语音检索中查询概念纠错的研究.《计算机仿真》.2006,(02),全文. *

Also Published As

Publication number Publication date
CN111597311A (zh) 2020-08-28

Similar Documents

Publication Publication Date Title
CN108153901B (zh) 基于知识图谱的信息推送方法和装置
US8903809B2 (en) Contextual search history in collaborative archives
JP7301922B2 (ja) 意味検索方法、装置、電子機器、記憶媒体およびコンピュータプログラム
CN109858045B (zh) 机器翻译方法和装置
CN108121814B (zh) 搜索结果排序模型生成方法和装置
CN110807311A (zh) 用于生成信息的方法和装置
US11995088B2 (en) Systems and methods for identifying similar electronic content items
EP4134885A2 (en) Method and apparatus of recommending data, electronic device, and medium
CN111597311B (zh) 用于输出信息的方法和装置
CN114880498B (zh) 事件信息展示方法及装置、设备和介质
KR20210054021A (ko) 확률적 물품 매칭 및 검색
CN113722593B (zh) 事件数据处理方法、装置、电子设备和介质
CN115905497A (zh) 确定答复语句的方法、装置、电子设备和存储介质
CN114048315A (zh) 确定文档标签的方法、装置、电子设备和存储介质
JP6868062B2 (ja) 情報を更新するための方法と装置
CN114385918A (zh) 消息推送方法、装置、计算机设备及存储介质
CN112148751B (zh) 用于查询数据的方法和装置
CN111680508B (zh) 文本的处理方法和装置
EP3407210A1 (en) Apparatus and method for generating a multiple-event pattern query
CN109857838B (zh) 用于生成信息的方法和装置
CN114218431A (zh) 视频搜索方法、装置、电子设备以及存储介质
CN111310016B (zh) 标签挖掘方法、装置、服务器和存储介质
US20210049008A1 (en) Identifying implicit dependencies between code artifacts
CN111625706A (zh) 信息检索方法、装置、设备及存储介质
CN112947984B (zh) 应用程序开发方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant