CN104102721A - 信息推荐方法和装置 - Google Patents

信息推荐方法和装置 Download PDF

Info

Publication number
CN104102721A
CN104102721A CN201410345339.5A CN201410345339A CN104102721A CN 104102721 A CN104102721 A CN 104102721A CN 201410345339 A CN201410345339 A CN 201410345339A CN 104102721 A CN104102721 A CN 104102721A
Authority
CN
China
Prior art keywords
answer
candidate answers
query information
ranking results
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410345339.5A
Other languages
English (en)
Inventor
李国华
刘涛
孙兴武
张伟萌
李超
李兴建
廖梦
韦豪杰
张希娟
忻舟
马艳军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201410345339.5A priority Critical patent/CN104102721A/zh
Publication of CN104102721A publication Critical patent/CN104102721A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种信息推荐方法和装置。其中,信息推荐方法包括:S1、获得来自客户端的查询信息,并对查询信息进行识别,获得识别结果;S2、根据查询信息获得相关资源,根据相关资源提取候选答案,并对候选答案进行排序,获得排序结果;S3、根据排序结果和识别结果获得答案,并向客户端返回答案,以使客户端在搜索结果页上显示答案。本发明实施例通过根据查询信息获得识别结果和相关资源,并对根据相关资源提取的候选答案进行排序,以及根据识别结果和排序结果获得答案,并向客户端返回答案,扩展了搜索结果页面的核心内容的结构化展现的覆盖面,节省了获取精确答案的时间,降低了用户推理成本,提升了用户筛选搜索结果的效率。

Description

信息推荐方法和装置
技术领域
本发明涉及互联网技术领域,尤其涉及一种信息推荐方法和装置。
背景技术
随着互联网技术的不断发展,搜索引擎已成为人们生活中必不可少的部分。用户要查询互联网中的信息时,可通过客户端输入查询信息,搜索引擎可根据查询信息进行搜索,在获得搜索结果后,向客户端返回与查询信息相关的搜索结果。通常情况下,搜索结果可包括:标题、网页摘要、URL(Uniform Resource Locator,统一资源定位符)、时间等信息。用户可通过查看网页摘要或者点击URL进入相关网页,进一步地获取所需的信息。在展现获取的搜索结果时,可通过增加配图、子链接等辅助性内容,对搜索结果的展现进行优化。例如:对于新闻类的搜索结果,可展现新闻来源、时间等辅助性参数;对于问答类的搜索结果,可展现提问者的具体描述、回答数量、提问时间等辅助性参数。同时,对搜索结果页面的核心内容也可进行结构化展现。
但是,在实现本发明的过程中发明人发现现有技术至少存在以下问题:搜索引擎提供的搜索结果不直观,用户需要遍历多个搜索结果寻找相关信息,还需要点击进入搜索结果对应的网页链接,阅读网页的内容才能获取自己所需的答案,不仅耗费时间,用户推理成本高,且有遗漏重要信息的风险。对于辅助性参数的展现和搜索结果页面的核心内容的结构化展现,不够灵活,覆盖面低,对获取用户真正需要的答案帮助不大。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的第一个目的在于提出一种信息推荐方法。该方法能够扩展搜索结果页面的核心内容的结构化展现的覆盖面,节省获取精确答案的时间,降低用户推理成本,提升用户筛选搜索结果的效率。
本发明的第二个目的在于提出另一种信息推荐方法。
本发明的第三个目的在于提出一种信息推荐装置。
本发明的第四个目的在于提出另一种信息推荐装置。
为达上述目的,根据本发明第一方面实施例提出了一种信息推荐方法,包括:S1、获得来自客户端的查询信息,并对所述查询信息进行识别,获得识别结果;S2、根据所述查询信息获得相关资源,根据所述相关资源提取候选答案,并对所述候选答案进行排序,获得排序结果;以及S3、根据所述排序结果和所述识别结果获得答案,并向所述客户端返回所述答案,以使所述客户端在搜索结果页上显示所述答案。
本发明实施例的信息推荐方法,通过根据查询信息获得识别结果和相关资源,并对根据相关资源提取的候选答案进行排序,以及根据识别结果和排序结果获得答案,并向客户端返回答案,扩展了搜索结果页面的核心内容的结构化展现的覆盖面,节省了获取精确答案的时间,降低了用户推理成本,提升了用户筛选搜索结果的效率。
为达上述目的,根据本发明第二方面实施例提出了一种信息推荐方法,包括:S4、接收查询信息,并向搜索引擎发送所述查询信息,以使搜索引擎对所述查询信息进行识别,获得识别结果,并对根据所述查询信息获得的资源进行排序处理,获得排序结果,然后根据所述识别结果和所述排序结果获得答案,并返回所述答案;以及S5、接收来自所述搜索引擎的答案,并在提供的搜索结果页上显示所述答案。
本发明实施例的信息推荐方法,通过接收来自搜索引擎的答案,并在提供的搜索结果页上显示答案,为用户提供了更精准的答案,节省了获取精确答案的时间,降低了用户推理成本,提升了用户筛选搜索结果的效率。
为达上述目的,根据本发明第三方面实施例提出了一种信息推荐装置,包括:识别模块,用于获得来自客户端的查询信息,并对所述查询信息进行识别,获得识别结果;排序模块,用于根据所述查询信息获得相关资源,根据所述相关资源提取候选答案,并对所述候选答案进行排序,获得排序结果;以及获得模块,用于根据所述排序结果和所述识别结果获得答案,并向所述客户端返回所述答案,以使所述客户端在搜索结果页上显示所述答案。
本发明实施例的信息推荐装置,通过根据查询信息获得识别结果和相关资源,并对根据相关资源提取的候选答案进行排序,以及根据识别结果和排序结果获得答案,并向客户端返回答案,扩展了搜索结果页面的核心内容的结构化展现的覆盖面,节省了获取精确答案的时间,降低了用户推理成本,提升了用户筛选搜索结果的效率。
为达上述目的,根据本发明第四方面实施例提出了一种信息推荐装置,包括:处理模块,用于接收查询信息,并向搜索引擎发送所述查询信息,以使搜索引擎对所述查询信息进行识别,获得识别结果,并对根据所述查询信息获得的资源进行排序处理,获得排序结果,然后根据所述识别结果和所述排序结果获得答案,并返回所述答案;以及显示模块,用于接收来自所述搜索引擎的答案,并在提供的搜索结果页上显示所述答案。
本发明实施例的信息推荐装置,通过接收来自搜索引擎的答案,并在提供的搜索结果页上显示答案,为用户提供了更精准的答案,节省了获取精确答案的时间,降低了用户推理成本,提升了用户筛选搜索结果的效率。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
图1是根据本发明一个实施例的信息推荐方法的流程图。
图2是根据本发明另一个实施例的信息推荐方法的流程图。
图3是根据本发明一个实施例的当答案的个数不确定时在搜索结果页上显示答案的效果示意图。
图4是根据本发明一个实施例的当答案的个数为一个时在搜索结果页上显示答案的效果示意图。
图5是根据本发明一个实施例的当答案的个数为预定数量时在搜索结果页上显示答案的效果示意图。
图6是根据本发明一个实施例的信息推荐装置的结构示意图。
图7是根据本发明另一个实施例的信息推荐装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的信息推荐方法和装置。
图1是根据本发明一个实施例的信息推荐方法的流程图,本实施例从搜索引擎侧进行描述。
如图1所示,该信息推荐方法,包括:
S1,获得来自客户端的查询信息,并对查询信息进行识别,获得识别结果。
在本发明的实施例中,搜索引擎可获得用户通过客户端输入的查询信息,然后从查询信息中识别出查询信息对应的问题的焦点和问题的答案类型等信息,并对答案类型进行归一化处理,获得答案类型的归一化结果,同时获得问题的答案个数。
具体地,焦点是问题答案的引用,可以代替答案,用来构成完整的陈述句。对焦点的识别,主要是通过规则进行识别,如具有疑问词的问题,焦点是疑问词;没有疑问词的问题,焦点默认为空。例如:问题为“2013年温网女单冠军是谁”,则焦点为“是谁”。
对问题的答案类型进行识别,即识别用户需要的答案属于哪种类型,主要分为规则和模型学习两种方法。在规则识别的方法中,问题的答案类型为焦点的前一个词。例如:“2013年温网女单冠军是谁”,问题的答案类型为“冠军”。模型学习的方法,则是利用依存句法分析等工具,生成训练语料和训练模型,以此识别答案类型。
在识别出问题的答案类型后,可获得答案类型的归一化结果,即将答案类型映射到固定类别体系中。主要方法通常基于答案规则或答案词表进行归一化。例如:答案类型为“冠军”,则归一化结果为“人物”。
获得问题的答案个数可通过当前问题语境进行判定。例如:问题为“野生动物有哪些”,则该问题的答案个数为成千上万。一般答案个数大于8个的,可定义为泛需求。再例如:问题为“中国古代四大美女”,该问题的答案个数为4个。而对于问题“2013年温网女单冠军是谁”,该问题的答案个数为1个,因为根据当前问题语境,“冠军”只有一个。
此外,还可通过基础词法分析对查询信息进行识别。词法分析可包括:切词、专名识别、重要性计算、依存句法分析等。
S2,根据查询信息获得相关资源,根据相关资源提取候选答案,并对候选答案进行排序,获得排序结果。
在本发明的实施例中,搜索引擎在获得查询信息后,可根据查询信息获得相关资源。其中,相关资源可包括搜索结果、对应的网页文档以及网页文档的点击日志等。具体地,搜索结果可包括摘要、URL等基本信息;通过点击URL,可获取对应的网页文档,网页文档的正文内容可用于深度分析问题和答案;通过网页文档的点击日志,可分析各个网页摘要或正文对于问题的重要程度。
在获得相关资源后,搜索引擎可根据相关资源提取候选答案,并对候选答案进行排序,获得排序结果。
具体地,搜索引擎可基于文档相关性对网页文档进行排序,获得候选文档集合。更具体地,搜索引擎可根据查询信息中的关键词获得网页文档,然后根据网页文档的点击日志的重要程度,结合语义相似度计算等,对网页文档进行相关性排序,从而获得候选文档集合。其中,语义相似度计算主要是通过关键词的重要性、关键词的同义词替换、关键词的改写等,计算出查询信息与网页文档题目的相似度。
在获得候选文档集合后,搜索引擎可从候选文档集合中提取出候选片段,并从候选片段中提取出候选答案。具体地,首先以段落或多个句子为单位对候选文档进行划分,然后获得候选片段,再计算出候选片段与查询信息的相似度、候选片段与查询信息的相关性以及候选文档的相关性权值,根据上述特征提取出候选答案。
在提取出候选答案后,搜索引擎可对候选答案进行预排序,获得第一排序结果。具体地,可基于第一特征计算候选答案置信度,并基于候选答案置信度的计算结果对候选答案进行排序,获得第一排序结果。其中,第一特征可包括但不限于候选答案的来源文档的相关性、候选答案的来源片段的相关性、候选答案与答案类型的匹配度和候选答案在网页文档中出现的次数中的一种或多种。
搜索引擎对候选答案进行预排序,可避免过多的候选答案进入二次排序,对排序结果产生影响。
在获得第一排序结果后,搜索引擎可对第一排序结果进行二次排序处理,获得排序结果。具体地,获得排序结果可通过多种方式实现,例如以下几种方式:
第一种方式,可基于词典对第一排序结果进行过滤,获得排序结果。例如:“金毛犬”属于狗类,“墨龙睛”属于鱼类。若问题类型为狗,则基于词典,可将候选答案“墨龙睛”过滤。其中,词典的构建主要通过定向站点结构化数据挖掘(如小说网站挖掘小说实体)、大规模互联网无结构化/半结构化数据挖掘和校验(如利用知识类社区的分类标签挖掘实体)、查询信息日志挖掘(如查询信息为“天龙八部电影”,可挖掘出电影实体“天龙八部”)等算法进行构建。
第二种方式,还可基于第二特征对第一排序结果进行二次排序,获得排序结果。其中,第二特征可包括候选答案与答案类型的匹配度、候选答案与查询信息的共现度和候选答案在网页文档中出现的次数中的一种或多种。
其中,候选答案与答案类型的匹配度主要用于衡量候选答案与查询信息的匹配度,是通过语料中统计的查询信息的扩展向量与候选答案的扩展向量的匹配度计算获得的。候选答案与查询信息的共现度主要用于衡量查询信息在候选答案的语境中的重要程度。对于实体类的答案,共现度可通过实体库中的信息与查询信息中的关键词进行计算。
另外,还可根据候选答案在网页文档中出现的次数对第一排序结果进行二次排序。例如:每个网页文档可当作一个举证来源,候选答案在一个网页文档中出现过,则该候选答案获得一票。当候选答案在5个网页文档中出现过,则该候选答案获得5票。最终票数越高的候选答案,可信度越高,排序时排名越靠前。
第三种方式,搜索引擎还可将候选答案代入查询信息进行二次检索,根据检索结果生成排序结果。例如,获取更多的与候选答案相关的信息,根据相关的信息提取和计算新的特征,并基于新的特征进行计算和重排序,最终生成新的排序结果。
具体地,可将候选答案替换掉查询信息中的焦点,带入查询信息进行二次检索,然后统计获得的检索结果与候选答案的相关信息。如:查询信息与候选答案在二次检索返回的网页文档中是否连贯出现、查询信息与候选答案的共现信息、查询信息中关键词的命中情况等。如果当前网页文档的标题是问题类标题,则对标题进行焦点识别、答案类型识别;如果查询信息无焦点,则将候选答案加到查询信息的末尾,以分隔符分割后进行二次检索。在进行二次检索获得检索结果后,根据检索结果生成排序结果。
S3,根据排序结果和识别结果获得答案,并向客户端返回答案,以使客户端在搜索结果页上显示答案。
在本发明的实施例中,搜索引擎可根据问题的答案个数从排序结果中选择对应数量的答案,即按照先后顺序获得对应数量的答案,并向客户端返回答案及其对应的网页文档。
本发明实施例的信息推荐方法,通过根据查询信息获得识别结果和相关资源,并对根据相关资源提取的候选答案进行排序,以及根据识别结果和排序结果获得答案,并向客户端返回答案,扩展了搜索结果页面的核心内容的结构化展现的覆盖面,提升了用户筛选搜索结果的效率,节省了获取精确答案的时间,降低了用户推理成本。
图2是根据本发明另一个实施例的信息推荐方法的流程图,本实施例从客户端侧进行描述。
如图2所示,该信息推荐方法包括:
S4,接收查询信息,并向搜索引擎发送查询信息,以使搜索引擎对查询信息进行识别,获得识别结果,并对根据查询信息获得的资源进行排序处理,获得排序结果,然后根据识别结果和排序结果获得答案,并返回答案。
在本发明的实施例中,客户端可接收用户输入的查询信息,并向搜索引擎发送查询信息。搜索引擎在接收到查询信息后,可对该查询信息进行识别,获得识别结果,然后根据查询信息获得的资源进行排序处理,获得排序结果。最后根据识别结果和排序结果获得答案,并向客户端返回答案。
搜索引擎获得答案的过程,可参见搜索引擎侧的实施例,此处不赘述。
S5,接收来自搜索引擎的答案,并在提供的搜索结果页上显示答案。
在本发明的实施例中,在获得搜索引擎返回的答案后,客户端可接收与答案对应的网页文档,并在搜索结果页上显示提供答案的文档的详情信息。该详情信息可包括答案的个数及其对应网页文档的摘要。
当答案的个数不确定时,客户端可在搜索结果页上显示预定数量的答案和用于展开显示剩余答案的扩展按键。如图3所示,查询信息为“夏天吃什么好呢”,经过搜索引擎的检索,在展现对应网页文档的摘要同时,还展现获得的答案“水果”、“茄子”、“西瓜”、“蔬菜”、“萝卜”,剩余的多个答案可通过点击扩展按键“查看详情”进入到中间页面,来进行展现。
当答案的个数为一个时,客户端可在搜索结果页上显示答案及其相关的链接信息。如图4所示,答案为“巴托丽”,并显示获取该答案的链接。
当答案的个数为预定数量时,客户端可在搜索结果页上显示预定数量的答案的链接信息。如图5所示,答案为“曼施坦因”、“隆美尔”、“古德里安”,并显示3个答案分别对应的链接。
本发明实施例的信息推荐方法,通过接收来自搜索引擎的答案,并在提供的搜索结果页上显示答案,为用户提供了更精准的答案,提升了用户筛选搜索结果的效率,节省了获取精确答案的时间,降低了用户推理成本。
为了实现上述实施例,本发明还提出一种信息推荐装置。
图6是根据本发明一个实施例的信息推荐装置的结构示意图。
如图6所示,该信息推荐装置包括:识别模块110、排序模块120和获得模块130。
其中,识别模块110用于获得来自客户端的查询信息,并对查询信息进行识别,获得识别结果。
在本发明的实施例中,识别模块110可获得用户通过客户端输入的查询信息,然后从查询信息中识别出查询信息对应的问题的焦点和问题的答案类型等信息,并对答案类型进行归一化处理,获得答案类型的归一化结果,同时获得问题的答案个数。
具体地,焦点是问题答案的引用,可以代替答案,用来构成完整的陈述句。对焦点的识别,主要是通过规则进行识别,如具有疑问词的问题,焦点是疑问词;没有疑问词的问题,焦点默认为空。例如:问题为“2013年温网女单冠军是谁”,则焦点为“是谁”。
对问题的答案类型进行识别,即识别用户需要的答案属于哪种类型,主要分为规则和模型学习两种方法。在规则识别的方法中,问题的答案类型为焦点的前一个词。例如:“2013年温网女单冠军是谁”,问题的答案类型为“冠军”。模型学习的方法,则是利用依存句法分析等工具,生成训练语料和训练模型,以此识别答案类型。
在识别模块110识别出问题的答案类型后,识别模块110可获得答案类型的归一化结果,即将答案类型映射到固定类别体系中。主要方法通常基于答案规则或答案词表进行归一化。例如:答案类型为“冠军”,则归一化结果为“人物”。
获得问题的答案个数可通过当前问题语境进行判定。例如:问题为“野生动物有哪些”,则该问题的答案个数为成千上万。一般答案个数大于8个的,可定义为泛需求。再例如:问题为“中国古代四大美女”,该问题的答案个数为4个。而对于问题“2013年温网女单冠军是谁”,该问题的答案个数为1个,因为根据当前问题语境,“冠军”只有一个。
此外,识别模块110还可通过基础词法分析对查询信息进行识别。词法分析可包括:切词、专名识别、重要性计算、依存句法分析等。
排序模块120用于根据查询信息获得相关资源,根据相关资源提取候选答案,并对候选答案进行排序,获得排序结果。
在本发明的实施例中,在获得查询信息后,排序模块120可根据查询信息获得相关资源。其中,相关资源可包括搜索结果、对应的网页文档以及网页文档的点击日志等。具体地,搜索结果可包括摘要、URL等基本信息;通过点击URL,可获取对应的网页文档,网页文档的正文内容可用于深度分析问题和答案;通过网页文档的点击日志,可分析各个网页摘要或正文对于问题的重要程度。
在排序模块120获得相关资源后,排序模块120可根据相关资源提取候选答案,并对候选答案进行排序,获得排序结果。
具体地,排序模块120可基于文档相关性对网页文档进行排序,获得候选文档集合。更具体地,排序模块120可根据查询信息中的关键词获得网页文档,然后根据网页文档的点击日志的重要程度,结合语义相似度计算等,对网页文档进行相关性排序,从而获得候选文档集合。其中,语义相似度计算主要是通过关键词的重要性、关键词的同义词替换、关键词的改写等,计算出查询信息与网页文档题目的相似度。
在获得候选文档集合后,排序模块120可从候选文档集合中提取出候选片段,并从候选片段中提取出候选答案。具体地,首先以段落或多个句子为单位对候选文档进行划分,然后获得候选片段,再计算出候选片段与查询信息的相似度、候选片段与查询信息的相关性以及候选文档的相关性权值,根据上述特征提取出候选答案。
在提取出候选答案后,排序模块120可对候选答案进行预排序,获得第一排序结果。具体地,排序模块120可基于第一特征计算候选答案置信度,并基于候选答案置信度的计算结果对候选答案进行排序,获得第一排序结果。其中,第一特征可包括但不限于候选答案的来源文档的相关性、候选答案的来源片段的相关性、候选答案与答案类型的匹配度和候选答案在网页文档中出现的次数中的一种或多种。
排序模块120对候选答案进行预排序,可避免过多的候选答案进入二次排序,对排序结果产生影响。
在获得第一排序结果后,排序模块120可对第一排序结果进行二次排序处理,获得排序结果。具体地,获得排序结果可通过多种方式实现,例如以下几种方式:
第一种方式,可基于词典对第一排序结果进行过滤,获得排序结果。例如:“金毛犬”属于狗类,“墨龙睛”属于鱼类。若问题类型为狗,则基于词典,可将候选答案“墨龙睛”过滤。其中,词典的构建主要通过定向站点结构化数据挖掘(如小说网站挖掘小说实体)、大规模互联网无结构化/半结构化数据挖掘和校验(如利用知识类社区的分类标签挖掘实体)、查询信息日志挖掘(如查询信息为“天龙八部电影”,可挖掘出电影实体“天龙八部”)等算法进行构建。
第二种方式,还可基于第二特征对第一排序结果进行二次排序,获得排序结果。其中,第二特征可包括候选答案与答案类型的匹配度、候选答案与查询信息的共现度和候选答案在网页文档中出现的次数中的一种或多种。
其中,候选答案与答案类型的匹配度主要用于衡量候选答案与查询信息的匹配度,是通过语料中统计的查询信息的扩展向量与候选答案的扩展向量的匹配度计算获得的。候选答案与查询信息的共现度主要用于衡量查询信息在候选答案的语境中的重要程度。对于实体类的答案,共现度可通过实体库中的信息与查询信息中的关键词进行计算。
另外,还可根据候选答案在网页文档中出现的次数对第一排序结果进行二次排序。例如:每个网页文档可当作一个举证来源,候选答案在一个网页文档中出现过,则该候选答案获得一票。当候选答案在5个网页文档中出现过,则该候选答案获得5票。最终票数越高的候选答案,可信度越高,排序时排名越靠前。
第三种方式,搜索引擎还可将候选答案代入查询信息进行二次检索,根据检索结果生成排序结果。例如,获取更多的与候选答案相关的信息,根据相关的信息提取和计算新的特征,并基于新的特征进行计算和重排序,最终生成新的排序结果。
具体地,可将候选答案替换掉查询信息中的焦点,带入查询信息进行二次检索,然后统计获得的检索结果与候选答案的相关信息。如:查询信息与候选答案在二次检索返回的网页文档中是否连贯出现、查询信息与候选答案的共现信息、查询信息中关键词的命中情况等。如果当前网页文档的标题是问题类标题,则对标题进行焦点识别、答案类型识别;如果查询信息无焦点,则将候选答案加到查询信息的末尾,以分隔符分割后进行二次检索。在进行二次检索获得检索结果后,根据检索结果生成排序结果。
获得模块130用于根据排序结果和识别结果获得答案,并向客户端返回答案,以使客户端在搜索结果页上显示答案。
在本发明的实施例中,获得模块130可根据问题的答案个数从排序结果中选择对应数量的答案,即按照先后顺序获得对应数量的答案,并向客户端返回答案及其对应的网页文档。
本发明实施例的信息推荐装置,通过根据查询信息获得识别结果和相关资源,并对根据相关资源提取的候选答案进行排序,以及根据识别结果和排序结果获得答案,并向客户端返回答案,扩展了搜索结果页面的核心内容的结构化展现的覆盖面,提升了用户筛选搜索结果的效率,节省了获取精确答案的时间,降低了用户推理成本。
图7是根据本发明另一个实施例的信息推荐装置的结构示意图。
如图7所示,该信息推荐装置包括:处理模块210和显示模块220。
处理模块210用于接收查询信息,并向搜索引擎发送查询信息,以使搜索引擎对查询信息进行识别,获得识别结果,并对根据查询信息获得的资源进行排序处理,获得排序结果,然后根据识别结果和排序结果获得答案,并返回答案。
在本发明的实施例中,处理模块210可接收用户输入的查询信息,并向搜索引擎发送查询信息。搜索引擎在接收到查询信息后,可对该查询信息进行识别,获得识别结果,然后根据查询信息获得的资源进行排序处理,获得排序结果。最后根据识别结果和排序结果获得答案,并向客户端返回答案。
搜索引擎获得答案的过程,可参见搜索引擎侧的方法实施例,此处不赘述。
显示模块220用于接收来自搜索引擎的答案,并在提供的搜索结果页上显示答案。
在本发明的实施例中,显示模块220可获得搜索引擎返回的答案。
此外,显示模块220还可接收与答案对应的网页文档,并在搜索结果页上显示提供答案的文档的详情信息。该详情信息可包括答案的个数及其对应网页文档的摘要。
当答案的个数不确定时,显示模块220可在搜索结果页上显示预定数量的答案和用于展开显示剩余答案的扩展按键。如图3所示,查询信息为“夏天吃什么好呢”,经过搜索引擎的检索,在展现对应网页文档的摘要同时,还展现获得的答案“水果”、“茄子”、“西瓜”、“蔬菜”、“萝卜”,剩余的多个答案可通过点击扩展按键“查看详情”进入到中间页面,来进行展现。
当答案的个数为一个时,显示模块220可在搜索结果页上显示答案及其相关的链接信息。如图4所示,答案为“巴托丽”,并显示获取该答案的链接。
当答案的个数为预定数量时,显示模块220可在搜索结果页上显示预定数量的答案的链接信息。如图5所示,答案为“曼施坦因”、“隆美尔”、“古德里安”,并显示3个答案分别对应的链接。
本发明实施例的信息推荐装置,通过接收来自搜索引擎的答案,并在提供的搜索结果页上显示答案,为用户提供了更精准的答案,提升了用户筛选搜索结果的效率,节省了获取精确答案的时间,降低了用户推理成本。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (20)

1.一种信息推荐方法,其特征在于,包括:
S1、获得来自客户端的查询信息,并对所述查询信息进行识别,获得识别结果;
S2、根据所述查询信息获得相关资源,根据所述相关资源提取候选答案,并对所述候选答案进行排序,获得排序结果;以及
S3、根据所述排序结果和所述识别结果获得答案,并向所述客户端返回所述答案,以使所述客户端在搜索结果页上显示所述答案。
2.根据权利要求1所述的方法,其特征在于,所述对所述查询信息进行识别,获得识别结果,包括:
从所述查询信息中识别出所述查询信息对应的问题的焦点和所述问题的答案类型,并获得所述答案类型的归一化结果和所述问题的答案个数。
3.根据权利要求1或2所述的方法,其特征在于,所述相关资源包括搜索结果、对应的网页文档以及所述网页文档的点击日志,所述根据所述查询信息获得相关资源,根据所述相关资源提取候选答案,包括:
基于文档相关性对所述网页文档进行排序,获得候选文档集合,从所述候选文档集合中提取出候选片段,并从所述候选片段中提取出候选答案。
4.根据权利要求3所述的方法,其特征在于,所述对所述候选答案进行排序,获得排序结果,包括:
对所述候选答案进行预排序,获得第一排序结果;以及
对所述第一排序结果进行二次排序处理,获得所述排序结果。
5.根据权利要求4所述的方法,其特征在于,所述对所述候选答案进行预排序,获得第一排序结果,包括:
基于第一特征计算候选答案置信度,并基于所述候选答案置信度的计算结果对所述候选答案进行排序,获得所述第一排序结果;其中,所述第一特征包括所述候选答案的来源文档的相关性、所述候选答案的来源片段的相关性、所述候选答案与所述答案类型的匹配度和所述候选答案在所述网页文档中出现的次数中的一种或多种。
6.根据权利要求4所述的方法,其特征在于,所述对所述第一排序结果进行二次排序处理,获得所述排序结果,包括:
基于词典对所述第一排序结果进行过滤,获得所述排序结果;或者
基于第二特征对所述第一排序结果进行二次排序,获得所述排序结果,其中,所述第二特征包括所述候选答案与所述答案类型的匹配度、所述候选答案与所述查询信息的共现度和所述候选答案在所述网页文档中出现的次数中的一种或多种;或者
将所述候选答案代入所述查询信息进行二次检索,根据检索结果生成所述排序结果。
7.根据权利要求5或6所述的方法,其特征在于,所述S3包括:
根据所述问题的答案个数从所述排序结果中选择对应数量的答案,并向所述客户端返回所述答案及其对应的网页文档。
8.一种信息推荐方法,其特征在于,包括:
S4、接收查询信息,并向搜索引擎发送所述查询信息,以使搜索引擎对所述查询信息进行识别,获得识别结果,并对根据所述查询信息获得的资源进行排序处理,获得排序结果,然后根据所述识别结果和所述排序结果获得答案,并返回所述答案;以及
S5、接收来自所述搜索引擎的答案,并在提供的搜索结果页上显示所述答案。
9.根据权利要求8所述的方法,其特征在于,在所述接收来自所述搜索引擎的答案时,还包括:
接收与所述答案对应的网页文档,并在所述搜索结果页上显示提供所述答案的文档的详情信息。
10.根据权利要求8或9所述的方法,其特征在于,当所述答案的个数不确定时,所述S5包括:在所述搜索结果页上显示预定数量的答案和用于展开显示剩余答案的扩展按键;或者
当所述答案的个数为一个时,所述S5包括:在所述搜索结果页上显示所述答案及其相关的链接信息;或者
当所述答案的个数为预定数量时,所述S5包括:在所述搜索结果页上显示所述预定数量的答案的链接信息。
11.一种信息推荐装置,其特征在于,包括:
识别模块,用于获得来自客户端的查询信息,并对所述查询信息进行识别,获得识别结果;
排序模块,用于根据所述查询信息获得相关资源,根据所述相关资源提取候选答案,并对所述候选答案进行排序,获得排序结果;以及
获得模块,用于根据所述排序结果和所述识别结果获得答案,并向所述客户端返回所述答案,以使所述客户端在搜索结果页上显示所述答案。
12.根据权利要求11所述的装置,其特征在于,所述识别模块,具体用于:
从所述查询信息中识别出所述查询信息对应的问题的焦点和所述问题的答案类型,并获得所述答案类型的归一化结果和所述问题的答案个数。
13.根据权利要求11或12所述的装置,其特征在于,所述相关资源包括搜索结果、对应的网页文档以及所述网页文档的点击日志,所述排序模块,具体用于:
基于文档相关性对所述网页文档进行排序,获得候选文档集合,从所述候选文档集合中提取出候选片段,并从所述候选片段中提取出候选答案。
14.根据权利要求13所述的装置,其特征在于,所述排序模块,具体用于:
对所述候选答案进行预排序,获得第一排序结果;以及
对所述第一排序结果进行二次排序处理,获得所述排序结果。
15.根据权利要求14所述的装置,其特征在于,所述排序模块,具体用于:
基于第一特征计算候选答案置信度,并基于所述候选答案置信度的计算结果对所述候选答案进行排序,获得所述第一排序结果;其中,所述第一特征包括所述候选答案的来源文档的相关性、所述候选答案的来源片段的相关性、所述候选答案与所述答案类型的匹配度和所述候选答案在所述网页文档中出现的次数中的一种或多种。
16.根据权利要求14所述的装置,其特征在于,所述排序模块,具体用于:
基于词典对所述第一排序结果进行过滤,获得所述排序结果;或者
基于第二特征对所述第一排序结果进行二次排序,获得所述排序结果,其中,所述第二特征包括所述候选答案与所述答案类型的匹配度、所述候选答案与所述查询信息的共现度和所述候选答案在所述网页文档中出现的次数中的一种或多种;或者
将所述候选答案代入所述查询信息进行二次检索,根据检索结果生成所述排序结果。
17.根据权利要求15或16所述的装置,其特征在于,所述获得模块,具体用于:
根据所述问题的答案个数从所述排序结果中选择对应数量的答案,并向所述客户端返回所述答案及其对应的网页文档。
18.一种信息推荐装置,其特征在于,包括:
处理模块,用于接收查询信息,并向搜索引擎发送所述查询信息,以使搜索引擎对所述查询信息进行识别,获得识别结果,并对根据所述查询信息获得的资源进行排序处理,获得排序结果,然后根据所述识别结果和所述排序结果获得答案,并返回所述答案;以及
显示模块,用于接收来自所述搜索引擎的答案,并在提供的搜索结果页上显示所述答案。
19.根据权利要求18所述的装置,其特征在于,所述显示模块,还用于:
在所述接收来自所述搜索引擎的答案时,接收与所述答案对应的网页文档,并在所述搜索结果页上显示提供所述答案的文档的详情信息。
20.根据权利要求18或19所述的装置,其特征在于,所述显示模块,具体用于:
当所述答案的个数不确定时,在所述搜索结果页上显示预定数量的答案和用于展开显示剩余答案的扩展按键;或者
当所述答案的个数为一个时,在所述搜索结果页上显示所述答案及其相关的链接信息;或者
当所述答案的个数为预定数量时,在所述搜索结果页上显示所述预定数量的答案的链接信息。
CN201410345339.5A 2014-07-18 2014-07-18 信息推荐方法和装置 Pending CN104102721A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410345339.5A CN104102721A (zh) 2014-07-18 2014-07-18 信息推荐方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410345339.5A CN104102721A (zh) 2014-07-18 2014-07-18 信息推荐方法和装置

Publications (1)

Publication Number Publication Date
CN104102721A true CN104102721A (zh) 2014-10-15

Family

ID=51670875

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410345339.5A Pending CN104102721A (zh) 2014-07-18 2014-07-18 信息推荐方法和装置

Country Status (1)

Country Link
CN (1) CN104102721A (zh)

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104573028A (zh) * 2015-01-14 2015-04-29 百度在线网络技术(北京)有限公司 实现智能问答的方法和系统
CN104699845A (zh) * 2015-03-31 2015-06-10 北京奇虎科技有限公司 基于提问类搜索词的搜索结果提供方法及装置
CN104991887A (zh) * 2015-06-18 2015-10-21 北京京东尚科信息技术有限公司 提供信息的方法及装置
CN106168962A (zh) * 2016-06-30 2016-11-30 北京奇虎科技有限公司 基于自然搜索结果提供精确观点的搜索方法及装置
CN106202286A (zh) * 2016-06-30 2016-12-07 北京奇虎科技有限公司 基于自然搜索结果提供实体词的搜索方法及装置
CN106294398A (zh) * 2015-05-21 2017-01-04 富士通株式会社 信息处理装置和信息处理方法
CN106528892A (zh) * 2016-12-23 2017-03-22 北京奇虎科技有限公司 基于搜索的数据推荐方法及装置
CN106649778A (zh) * 2016-12-27 2017-05-10 北京百度网讯科技有限公司 基于深度问答的交互方法和装置
CN106776808A (zh) * 2016-11-23 2017-05-31 百度在线网络技术(北京)有限公司 基于人工智能的资讯数据提供方法及装置
CN106991161A (zh) * 2017-03-31 2017-07-28 北京字节跳动科技有限公司 一种自动生成开放式问题答案的方法
CN108304421A (zh) * 2017-02-24 2018-07-20 腾讯科技(深圳)有限公司 一种信息搜索方法及装置
CN109299250A (zh) * 2018-09-14 2019-02-01 广州神马移动信息科技有限公司 答案的展示方法、装置、存储介质及电子设备
CN109388697A (zh) * 2018-10-10 2019-02-26 成都小多科技有限公司 处理问答语料的方法、装置及电子终端
CN110515921A (zh) * 2019-09-02 2019-11-29 江苏建筑职业技术学院 一种计算机人工智能信息筛选装置
CN110516157A (zh) * 2019-08-30 2019-11-29 盈盛智创科技(广州)有限公司 一种文献检索方法、设备和存储介质
CN110674429A (zh) * 2018-07-03 2020-01-10 百度在线网络技术(北京)有限公司 用于信息检索的方法、装置、设备和计算机可读存储介质
CN110851560A (zh) * 2018-07-27 2020-02-28 杭州海康威视数字技术股份有限公司 信息检索方法、装置及设备
US10642900B2 (en) * 2016-12-27 2020-05-05 Beijing Baidue Netcom Science And Technology Co., Ltd. Method and apparatus for displaying search result based on deep question and answer
CN111210290A (zh) * 2018-11-21 2020-05-29 北京京东尚科信息技术有限公司 排序方法、装置和计算机可读存储介质
CN111291250A (zh) * 2020-03-09 2020-06-16 北京三快在线科技有限公司 发票抬头推荐方法、装置、终端、服务器及存储介质
CN111352687A (zh) * 2020-03-09 2020-06-30 北京三快在线科技有限公司 发票填写方法、装置、终端及存储介质
CN111753221A (zh) * 2020-06-28 2020-10-09 中国银行股份有限公司 一种搜索引擎的智能提示方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577558A (zh) * 2013-10-21 2014-02-12 北京奇虎科技有限公司 一种优化问答对的搜索排名的装置和方法
CN103810218A (zh) * 2012-11-14 2014-05-21 北京百度网讯科技有限公司 一种基于问题簇的自动问答方法和装置
CN103902652A (zh) * 2014-02-27 2014-07-02 深圳市智搜信息技术有限公司 自动问答系统
CN103914548A (zh) * 2014-04-10 2014-07-09 北京百度网讯科技有限公司 信息搜索方法和装置
CN103914543A (zh) * 2014-04-03 2014-07-09 北京百度网讯科技有限公司 搜索结果的展现方法和装置
CN103927354A (zh) * 2014-04-11 2014-07-16 百度在线网络技术(北京)有限公司 交互式搜索及推荐方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103810218A (zh) * 2012-11-14 2014-05-21 北京百度网讯科技有限公司 一种基于问题簇的自动问答方法和装置
CN103577558A (zh) * 2013-10-21 2014-02-12 北京奇虎科技有限公司 一种优化问答对的搜索排名的装置和方法
CN103902652A (zh) * 2014-02-27 2014-07-02 深圳市智搜信息技术有限公司 自动问答系统
CN103914543A (zh) * 2014-04-03 2014-07-09 北京百度网讯科技有限公司 搜索结果的展现方法和装置
CN103914548A (zh) * 2014-04-10 2014-07-09 北京百度网讯科技有限公司 信息搜索方法和装置
CN103927354A (zh) * 2014-04-11 2014-07-16 百度在线网络技术(北京)有限公司 交互式搜索及推荐方法和装置

Cited By (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016112679A1 (zh) * 2015-01-14 2016-07-21 百度在线网络技术(北京)有限公司 实现智能问答的方法、系统和存储介质
US10242049B2 (en) 2015-01-14 2019-03-26 Baidu Online Network Technology (Beijing) Co., Ltd. Method, system and storage medium for implementing intelligent question answering
CN104573028A (zh) * 2015-01-14 2015-04-29 百度在线网络技术(北京)有限公司 实现智能问答的方法和系统
CN104573028B (zh) * 2015-01-14 2019-01-25 百度在线网络技术(北京)有限公司 实现智能问答的方法和系统
JP2017511922A (ja) * 2015-01-14 2017-04-27 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド スマート質問回答の実現方法、システム、および記憶媒体
CN104699845A (zh) * 2015-03-31 2015-06-10 北京奇虎科技有限公司 基于提问类搜索词的搜索结果提供方法及装置
CN104699845B (zh) * 2015-03-31 2016-10-12 北京奇虎科技有限公司 基于提问类搜索词的搜索结果提供方法及装置
CN106294398A (zh) * 2015-05-21 2017-01-04 富士通株式会社 信息处理装置和信息处理方法
CN104991887B (zh) * 2015-06-18 2018-01-19 北京京东尚科信息技术有限公司 提供信息的方法及装置
CN104991887A (zh) * 2015-06-18 2015-10-21 北京京东尚科信息技术有限公司 提供信息的方法及装置
CN106202286A (zh) * 2016-06-30 2016-12-07 北京奇虎科技有限公司 基于自然搜索结果提供实体词的搜索方法及装置
CN106202286B (zh) * 2016-06-30 2019-11-01 北京奇虎科技有限公司 基于自然搜索结果提供实体词的搜索方法及装置
CN106168962A (zh) * 2016-06-30 2016-11-30 北京奇虎科技有限公司 基于自然搜索结果提供精确观点的搜索方法及装置
CN106776808A (zh) * 2016-11-23 2017-05-31 百度在线网络技术(北京)有限公司 基于人工智能的资讯数据提供方法及装置
CN106528892A (zh) * 2016-12-23 2017-03-22 北京奇虎科技有限公司 基于搜索的数据推荐方法及装置
CN106649778A (zh) * 2016-12-27 2017-05-10 北京百度网讯科技有限公司 基于深度问答的交互方法和装置
CN106649778B (zh) * 2016-12-27 2020-03-03 北京百度网讯科技有限公司 基于深度问答的交互方法和装置
US10642900B2 (en) * 2016-12-27 2020-05-05 Beijing Baidue Netcom Science And Technology Co., Ltd. Method and apparatus for displaying search result based on deep question and answer
CN108304421A (zh) * 2017-02-24 2018-07-20 腾讯科技(深圳)有限公司 一种信息搜索方法及装置
CN108304421B (zh) * 2017-02-24 2021-03-23 腾讯科技(深圳)有限公司 一种信息搜索方法及装置
CN106991161B (zh) * 2017-03-31 2019-02-19 北京字节跳动科技有限公司 一种自动生成开放式问题答案的方法
CN106991161A (zh) * 2017-03-31 2017-07-28 北京字节跳动科技有限公司 一种自动生成开放式问题答案的方法
CN110674429B (zh) * 2018-07-03 2022-05-31 百度在线网络技术(北京)有限公司 用于信息检索的方法、装置、设备和计算机可读存储介质
CN110674429A (zh) * 2018-07-03 2020-01-10 百度在线网络技术(北京)有限公司 用于信息检索的方法、装置、设备和计算机可读存储介质
CN110851560B (zh) * 2018-07-27 2023-03-10 杭州海康威视数字技术股份有限公司 信息检索方法、装置及设备
CN110851560A (zh) * 2018-07-27 2020-02-28 杭州海康威视数字技术股份有限公司 信息检索方法、装置及设备
CN109299250A (zh) * 2018-09-14 2019-02-01 广州神马移动信息科技有限公司 答案的展示方法、装置、存储介质及电子设备
CN109388697A (zh) * 2018-10-10 2019-02-26 成都小多科技有限公司 处理问答语料的方法、装置及电子终端
CN111210290A (zh) * 2018-11-21 2020-05-29 北京京东尚科信息技术有限公司 排序方法、装置和计算机可读存储介质
CN110516157B (zh) * 2019-08-30 2022-04-01 盈盛智创科技(广州)有限公司 一种文献检索方法、设备和存储介质
CN110516157A (zh) * 2019-08-30 2019-11-29 盈盛智创科技(广州)有限公司 一种文献检索方法、设备和存储介质
CN110515921B (zh) * 2019-09-02 2021-11-02 江苏建筑职业技术学院 一种计算机人工智能信息筛选装置
CN110515921A (zh) * 2019-09-02 2019-11-29 江苏建筑职业技术学院 一种计算机人工智能信息筛选装置
CN111291250A (zh) * 2020-03-09 2020-06-16 北京三快在线科技有限公司 发票抬头推荐方法、装置、终端、服务器及存储介质
CN111352687A (zh) * 2020-03-09 2020-06-30 北京三快在线科技有限公司 发票填写方法、装置、终端及存储介质
CN111753221A (zh) * 2020-06-28 2020-10-09 中国银行股份有限公司 一种搜索引擎的智能提示方法及装置
CN111753221B (zh) * 2020-06-28 2024-03-26 中国银行股份有限公司 一种搜索引擎的智能提示方法及装置

Similar Documents

Publication Publication Date Title
CN104102721A (zh) 信息推荐方法和装置
CN109189942B (zh) 一种专利数据知识图谱的构建方法及装置
CN106649818B (zh) 应用搜索意图的识别方法、装置、应用搜索方法和服务器
CN110633409B (zh) 一种融合规则与深度学习的汽车新闻事件抽取方法
US9009134B2 (en) Named entity recognition in query
CN106682192B (zh) 一种基于搜索关键词训练回答意图分类模型的方法和装置
Velardi et al. Ontolearn reloaded: A graph-based algorithm for taxonomy induction
US20180349355A1 (en) Artificial Intelligence Based Method and Apparatus for Constructing Comment Graph
CN109726274B (zh) 问题生成方法、装置及存储介质
CN110502621A (zh) 问答方法、问答装置、计算机设备及存储介质
KR101754473B1 (ko) 문서를 이미지 기반 컨텐츠로 요약하여 제공하는 방법 및 시스템
EP3096246A1 (en) Method, system and storage medium for realizing intelligent answering of questions
US11222053B2 (en) Searching multilingual documents based on document structure extraction
CN106202514A (zh) 基于Agent的突发事件跨媒体信息的检索方法及系统
CN104063387A (zh) 在文本中抽取关键词的装置和方法
CN103853824A (zh) 一种基于深度语义挖掘的内文广告发布方法与系统
CN103064956A (zh) 用于搜索电子内容的方法、计算系统和计算机可读介质
CN113392209B (zh) 一种基于人工智能的文本聚类方法、相关设备及存储介质
CN102119385A (zh) 用于在内容检索服务系统内检索媒体内容的方法和子系统
CN109086265B (zh) 一种语义训练方法、短文本中多语义词消歧方法
CN112559684A (zh) 一种关键词提取及信息检索方法
CN112188312A (zh) 用于确定新闻的视频素材的方法和装置
CN111782793A (zh) 智能客服处理方法和系统及设备
Van Atteveldt et al. Studying political decision making with automatic text analysis
CN106897274B (zh) 一种跨语种的点评复述方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20141015