CN103493045B - 对在线问题的自动回答 - Google Patents
对在线问题的自动回答 Download PDFInfo
- Publication number
- CN103493045B CN103493045B CN201180069249.2A CN201180069249A CN103493045B CN 103493045 B CN103493045 B CN 103493045B CN 201180069249 A CN201180069249 A CN 201180069249A CN 103493045 B CN103493045 B CN 103493045B
- Authority
- CN
- China
- Prior art keywords
- answer
- keyword set
- repository
- pair
- received
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
用于提供对问题的自动回答的方法、系统和装置。在一个方面中,方法包括从客户端接收问题,并且对第一储存库查询对应于该问题的回答。如果从第一储存库没有返回结果,则该方法将该问题解析成关键词集,并且对第二储存库查询对应于该关键词集的回答,以及根据排名标准对从第一储存库或第二储存库返回的回答进行排序,并且最后向客户端提供排序的回答的至少子集。
Description
背景技术
本公开涉及自动提供对通过网络提供的问题的回答,以及具体地涉及根据通过网络提供的现有回答提供对问题的回答。
在因特网上的即时聊天和电子布告栏系统(BBS)发帖已在因特网中变得广泛。许多用户将聊天工具或在线电子布告栏用作为与其他用户社交并且通信信息的方式。可以在这些在线工具的不同用户之间迅速交换信息。另外,搜索引擎还通过提供引用在Web上可用的资源的搜索结果来帮助人们找到他们想要的信息。
尽管有这些许多不同的工具和格式,用户仍然可能没有接收到对其问题的回答、或可能没有以及时方式接收到回答。例如,对于特定问题,用户可以在在线聊天室中对问题进行发帖并且等待看该聊天室中的任何其他人是否提供对该问题的回答。用户还可以将问题发帖到电子布告栏并且在数小时或数天后回来看是否任何人已发帖了对该问题的回答。同样地,用户还可以向搜索引擎提交查询,并且查阅搜索结果和搜索结果引用的网页,以试图搜集对问题的任何有价值的信息。类似地,用户可以向询问用户问题并且提供其他人发帖的对问题的回答的专用在线平台提交回答。
这些平台允许用户对问题进行发帖并且从不同背景的宽泛用户群接收响应。然而,如果其他用户尚未提供类似问题,则用户典型地并不以及时方式接收回答。
发明内容
总的来说,在本说明书中描述的主题的一个创新方面涉及提供对问题的自动回答的方法。该方法可以包括从客户端接收问题,并且对第一储存库查询对应于该问题的回答。如果从第一储存库没有返回结果,则该方法将该问题解析成关键词集,并且对第二储存库查询对应于该关键词集的回答。该方法根据排名标准对从第一储存库或第二储存库返回的回答进行排序,并且向客户端提供排序的回答的至少子集。替选地,将问题解析成关键词集并且对第二储存库查询对应于该关键词集的回答的步骤可以与查询第一储存库的步骤同时发生。
在另一个方面中,该方法可以进一步包括通过以下的至少一个使接收的问题规范化的步骤:移除多余的词;校正拼写错误;移除不必要的标点符号;校正不正确的标点符号;以及移除多余的空格。
这些方面中的每一个的其他实施例可以包括对应的系统、装置和记录在计算机存储设备上的计算机程序,其每一个被配置成执行这些方法的动作。
在附图和下面的描述中阐述了一个或多个实施例的细节。根据描述和附图以及权利要求,其他的特征、目的和优势将是显而易见的。
附图说明
图1是用于提供对在线问题的自动回答的系统的图。
图2是图示对用于存储问题回答对和关键词集回答对的数据储存库的创建和维护的流程图。
图3A-3B是问题回答对和关键词集回答对的示例性储存库。
图4是图示提供对在线问题的回答的过程的流程图。
在各附图中相同的参考符号指示相同的元素。
具体实施方式
图1是提供对在线问题的自动回答的系统的图。在该系统中,客户端101可以是桌面应用或呈现用于在线聊天的web应用的web浏览器。该web浏览器或桌面应用从登录用户接收输入,并且将该输入作为消息通信给另一个用户或将该消息广播给登录入同一服务的用户组。客户端还可以是向用户供给与其他用户的异步交互的电子布告栏应用。替选地,客户端101还可以是接受来自用户的问题并且提供对问题的回答的web门户接口。
服务器111位于另一个网络位置处并且通过其处理器115处理来自客户端101的请求。文档语料库114、第一储存库112和第二储存库113与服务器111数据通信。文档语料库114是搜索引擎通过因特网爬取的文档集合。第一储存库112存储问题以及其对应的回答,而第二储存库113被配置成存储从特定问题获取的关键词集以及对应于问题的回答。
在一些实施方式中,服务器111在其存储器116中包括储存库维护模块117和问题处理模块118。问题处理模块118对来自客户端101的与特定问题有关的请求进行处理。储存库维护模块117通过从文档语料库114提取问题和回答数据,对第一储存库112和第二储存库113中的数据进行维护和更新。
在替选实施方式中,可以将储存库维护模块117部署在独立于服务器111的服务器上。在该独立服务器上的储存库维护模块117与第一储存库113和第二储存库114进行通信,并且周期性或持续使用从文档语料库114获取的新的问题和回答数据来对两个储存库中的数据进行更新。
替选地,第一储存库112和第二储存库113以及文档语料库114可以位于不同的网络位置处,并且例如通过诸如LAN或因特网的网络与托管储存库维护模块117的服务器进行通信。
图2是图示对用于存储问题回答对和关键词集回答对的数据储存库的创建和维护的流程图。储存库维护模块117,例如,运行用于维护在两个储存库中的问题回答对和关键词集对的数据的程序,负责从文档语料库114识别问题-回答对。文档语料库可以包括已由搜索引擎爬取并且被存储在索引数据库中的聊天室消息的可用记录文件、网页的内容等。如在此所使用的,用语“聊天室记录文件”包括聊天室记录、记录被存储在其上的网页、以及通过聊天会话提供的数据被存储的其他文件和存储方案。文档语料库114还可以是接收各种用户提交的内容的数据存储。储存库维护模块117可以持续或周期性对文档语料库114查询任何新近添加的数据,并且对这些数据进行分析来识别用户所提交的问题以及其可能的回答。
在一些实施方式中,移除用户的个人识别信息以处理回答,以使问题和对应的回答与用户没有关联。例如,在存储或使用问题和回答之前,可以以一个或多个方式使问题和回答匿名,以使移除个人可识别的信息。同样地,可以使用户的身份匿名,以使不能为用户确定个人可识别的信息,并且使用户问题或回答的任何可识别信息一般化(例如,基于用户人口特征来一般化),而不是与特定用户相关联。可以使获取了位置信息的用户的地理位置一般化(诸如到城市、邮编或州/省份级),以使不能确定用户的特定位置。
下面的示例说明了对数据储存库的创建和维护。假设用户已在在线聊天室中输入了问题“where is world exposition2010held?(在哪里举行世界博览会2010?)”,并且其他人已给出了回答“Shanghai(上海)”,以及搜索引擎已爬取了整个对话的内容。储存库维护模块117可以通过使用一个或多个文本分析例程和/或语言分析例程来识别问题和回答。例如,储存库维护模块117可以通过辨识问号“?”或关键词“where(在哪里)”来识别问题,并且将例如来自另一个用户的在该问题之后的紧邻消息确定为对该问题的回答。储存库维护模块117还可以使用字段分类,诸如“Q”和“A”分类符,例如“Q:where isworldexposition2010held?”和“A:Shanghai”。
在一些实施方式中,可以从现有web文档进一步爬取问题回答对。Web文档可以包括如“问题”和“回答”这样的独特关键词、或诸如字母“Q”和“A”的更简单的分类符。在一个示例中,储存库维护模块117为潜在问题回答对对web文档进行解析。当识别了后紧跟冒号的关键词“问题”的存在时,其可以确定在该关键词之后的文本实际上是问题。其将在冒号之后、直到问号或句号,例如句点等的第一出现为止的文本存储为潜在问题。
储存库维护模块117对文档进一步解析来识别文本串“回答:”的紧接第一出现、读取在该字符串之后直到第一句号为止的文本、并且将该文本存储为对问题的回答。在一些实施方式中,计算在问题的结束直到回答的开始为止之间的距离。如果发现该距离超过阈值,诸如50或100个字符、或如果从没识别字符串“回答:”,则模块117将先前读取的问题丢弃作为无效,并且前进到为可能的字符串“问题:”和“回答:”对,对web文档中的剩余文本进行解析。
在一些实施方式中,为了保持所识别的问题和回答相对简短扼要,将所识别的问题以及其对应的回答的长度限制在最大长度。例如,如果问题包含大于50个字符(或词)、或如果回答包含大于30个字符(或词),则将丢弃问题和回答对。
在进一步实施方式中,为了记录对特定问题的不同回答以及其相应排名,可以以下述形式的结构存储所提取的回答:
struct value{
string answer;
int count;
}
其中参数“answer”存储回答的文本,以及参数“count”示出值“answer”已被储存库维护模块117识别的次数。可以将该计数作为对问题的该特定回答的排名或分值对待。在一些实施方式中,被确定为相似的两个回答的文本可以由字符串中的一个表示。例如,可以忽略连字符,数字拼写和数字可以被认为是相同的等。
可以利用各种其他技术来识别问题以及其对应的回答。
诸如上述的,使用特定技术从文档语料库识别的问题和回答可以是不恰当识别的问题和回答对。不恰当识别的问题和回答对是不满足一个或多个预定义标准或置信阈值的文本。可以利用各种技术来识别不恰当的问题回答对并且将其排除在储存库之外。例如,可以排除包括垃圾词语、不能被解析、看起来是随机词或字符等的问题或回答。另外,在预先确定的时段内具有低于阈值的低分值的对也可以被认为是不恰当的回答对,因为该回答可能是不准确的。系统可以通过使用这些示例错误处理技术来容忍第一储存库112或第二储存库113中的不恰当或不准确的问题和回答信息。
在一些实施方式中,所辨识的问题和回答可以在被存储在两个储存库中之前进一步经受规范化过程以规范化。这样的规范化包括从问题或回答的句子移除多余的词;校正任何拼写错误;移除不必要的标点符号;校正不正确的标点符号;移除多余的空格等。例如,如所获取的原始问题可以是“where is world exxposition2010held?”,其中“exxposition”具有拼写错误,并且在“2010”和“held”之间存在多余空格。规范化过程可以识别该问题中的这样的键入错误,并且将问题自动校正成“where is worldexposition2010held?”的规范形式。
类似地,可以使用上面的规范化过程从对应于问题的回答移除这样的明显键入错误。校正的回答因此更可能被映射到储存库中的现有问题和回答对。
另外,当储存库维护模块117将新的问题和回答对映射到现有问题和回答对时,储存库维护模块117为储存库中的现有对增加分值。该分值指示问题和回答对的置信度或质量,以及分值的增加指示置信度或质量的增加(例如,问题和回答对的准确性的增加)。
例如,在问题回答对已被识别之后,在步骤202,储存库维护模块117可以将该对添加到第一储存库112。储存库维护模块117首先通过对储存库查询具有该问题和回答的条目,来确定该问题回答对是否已存在于第一储存库112中。可以通过文本的精确匹配(或规范化文本的精确匹配)来作出问题回答对是否已存在于第一储存库112中的确定。如果这样的对被确定存在于第一储存库112中,则在第一储存库112中通过使该条目的分值增加1(或取决于所使用的评分方案,一些其他的增值)来完成添加过程。如果发现在第一储存库112中不存在这样的条目(例如,在储存库112中不存在新近识别的对与现有对的匹配),则将该问题和回答对的新条目添加到储存库,并且为该条目存储初始分值(例如,用于所使用的特定评分方案的单位值或最小值)。
也可以使用其他评分技术。例如,在第一储存库中的问题回答对的分值可以是基于一些其他参数的加权分值,所述参数诸如从之提取问题回答对的源的受欢迎度。可以给予从受欢迎的知识库提取的问题回答对比从不那么受欢迎的知识库提取的那些更高的分值。例如,问题回答对的分值是至少受相同问题回答对被包括入第一储存库112中的频率和相同问题回答对的各种源的受欢迎度影响的累积分值,因此,反映了在第一储存库112中的问题回答对自身的受欢迎度。
在将问题回答对添加到第一储存库112的步骤之后,在将关键词集添加到第二储存库113之前,在步骤203,将对问题进行解析来获取关键词集。在一些实施方式中,解析问题的步骤包括使用与编写问题的语言相对应的语言模型来将问题分割成词集。例如,对于“土豆是‘增肥’还是‘减肥’?”(Is potato fattening or not?)的问题,该问题将被识别为用中文编写,并且使用中文语言模型被进一步处理来获取该问题的句子结构,从而将该问题分割成包括主语、动词、谓语部分、连词等的词集。
在一些实施方式中,可以通过使用特定搜索引擎的搜索词语集合来进一步协助将问题分割成语言结构(例如,词、短语等),从而识别最近已变得受欢迎但是不可能仅由对问题的语言或语义分析识别的任何新的词或短语。在上面的示例中,词语“增肥”可能在特定词典中没有被正确辨识为辨识的词,但是可以通过将该词与搜索词语集合相比较来识别。该搜索词语集合可以由搜索引擎维护,对于其,部分搜索词语是新近创造的词。
进一步,可以从如此获取的词列表移除在该语言中最常出现并且没有提供关于问题的性质的特定信息的某些停用词。剩余的词因此形成待被添加到第二储存库113的关键词集。
在一些实施方式中,在将如此获取的关键词集添加到第二储存库113之前,可以确定该关键词集的大小并且将其与预先确定的阈值进行比较。例如,如果该集的大小小于歧义阈值(例如,三个词、四个词等),则不将从问题得到的关键词集以及其对应的回答添加到第二储存库113,因为,可以通过将上面过程用于在语言上不同于该问题的另一个问题来获取相同的关键词集。这减少了在用户输入问题但是得到与不同的问题相对应的回答,因为如从输入的问题获取的关键词集与存储在第二储存库113中的不同问题的关键词集相同的情况下,可能不准确的回答的可能性。
如果如在上面所获取的关键词集的大小被确定成高于阈值(步骤204),则将问题的关键词集和对应于该问题的回答添加到第二储存库113(步骤205)。将关键词集和回答对添加到第二储存库113的特定步骤与如上所述将问题和回答对添加到第一储存库的那些类似。
还可以使用关键词解析来确定问题是否存在于储存库中。在这些实施方式中,首先对问题进行解析,然后对储存库搜索精确匹配或关键词匹配。
图3A-3B是被添加到第一储存库112和第二储存库113的问题回答对和关键词集回答对的示例性储存库。图3A是在第一储存库112中的示例数据的表。在该表中,当确定另一个问题是否与在该列中的这些问题中的一个相同,例如精确匹配时,可以整体使用作为文本字符串的问题。
图3B是在第二储存库113中的示例数据的表。在该表中,列“关键词集”包括在每一个条目的关键词列表。通过使用分号来界定不同的关键词。在关键词之间的定界符替选地可以是冒号、表格空格等。在确定输入问题的关键词集是否与存储在第二储存库113中的关键词集中的一个相同时,可以将输入问题的关键词集中的每一个关键词与该储存库中的现有关键词集中的每一个关键词进行比较,来看存在该关键词的精确匹配。在一些实施方式中,仅当两个关键词集具有完全相同的关键词集,而不管列出这些关键词的顺序时,这两个关键词集才相匹配。例如,考虑输入问题是“world exposition2010,where is it held?”。该问题的关键词集可以是“world exposition;where;held”,其将被确定为与从问题“where is the world exposition2010held?”得到的关键词集“where;worldexposition;held”相同。
还可以使用其他匹配标准,例如其中可以将关键词替代为另一个词(将“shoes”替代为“sneakers”)的广泛匹配、短语匹配等。
还可以为在第一储存库112和第二储存库113两者中的相应问题回答对或关键词集回答对的每一个条目维护其他属性。这些属性可以是最近添加问题回答对或关键词集回答对的时间、在最近过去,例如在过去六个月,添加问题回答对或关键词集回答对的频率等。当试图为问题获取回答时,该信息可以用于为问题回答对或关键词集回答对的受欢迎度赋予权重。
可以对分别将问题回答对和关键词集回答对添加到两个储存库的上面步骤执行替选顺序。
图4是图示提供对在线问题的回答的过程的流程图。在步骤401,问题从用户(请求者)被接收并且通过诸如聊天应用的客户端被提交。在一些实施方式中,在客户端上提供了控件以供用户为在储存库中为匹配的问题存储的答复(回答)向特定服务器提交问题。例如,当用户正在聊天室中与其他用户组聊天并且输入了问题“where is theexposition2010held?”时,用户可以点击在其界面上的、将该消息发送给实现上述模块的服务器以供处理的控件,而不是将该问题发送给用户组。替选地,用户可以将问题输入到网页上的文本域中,并且通过web接口将该问题提交给服务器。
在服务器处接收问题之后,在步骤402,问题处理模块118可以前进到确定在第一储存库112中是否已存在相同的问题。如果在第一储存库112中存在具有相同问题的一个或多个条目,则检索这些条目的每一个中的对应回答以供进一步处理。在一些实施方式中,在将从客户端接收的问题用于查询第一储存库112之前对该问题进一步规范化。该规范化过程可以包括如在上面指定的,从问题的句子移除多余的词;校正任何拼写错误;移除不必要的标点符号;校正不正确的标点符号;移除多余的空格等。
如果在第一储存库112中不能找到带有与所接收的问题相同的问题的条目(例如,没有为该问题返回结果),则问题处理模块118可以对所接收的问题进行解析来获取对应于该问题的关键词集(步骤404)。除将所获取的关键词集的大小与歧义阈值进行比较外,该解析步骤可以与在图2中的步骤203中所述的类似(例如,使用与编写问题的语言相对应的语言模型,以及可选地使用搜索引擎所收集的搜索词语将回答分割成词集)。将所接收的问题的关键词集用作为查询第二储存库113的键。如果在第二储存库113中存在在列“关键词”中具有相同的关键词集的一个或多个条目、或另外与足够的置信度相匹配,则检索在列“回答”中的其对应回答并且将其返回给问题处理模块118(步骤404)。
在步骤405,从第一储存库112或第二储存库113检索到的所接收的问题的回答,如果有的话,根据这些回答的相应分值来排序。替选地,在为结果中的回答中的每一个确定排名分值时,可以使用其他信息,诸如最近添加问题回答对或关键词集回答对的时间、在过去六个月添加问题回答对或关键词集回答对的频率。
最后,在步骤406,问题处理模块118将所接收的问题的排序的回答集发送给问题通过诸如因特网的网络源起的客户端101。在一些实施方式中,根据从发出请求的客户端101与问题一起接收的参数值,仅将排名最高的、所要求数量的回答发送给发出请求的客户端101。例如,发出请求的客户端101可能仅请求对所提交的问题的一个回答。在这种情况下,问题处理模块118将挑选最高排名的回答,并且将其发送给客户端101。
在替选实施方式中,可以在步骤402对第一储存库112查询问题的任何回答之前执行在从发出请求的客户端接收问题之后将该问题解析成关键词集的步骤。替选地,可以与查询第一储存库的步骤同时执行解析步骤和查询第二储存库113的步骤,以节省以顺序地查询两个储存库对所接收的问题进行处理的额外等待时间。
在该实施方式的变体中,即使找到第一储存库中的匹配,也可以查询两个储存库。因此,在该实施方式中,可以返回来自两个储存库的回答,并且从两者为其相应查询返回结果。对两个过程的同时执行可以通过利用诸如多任务中的线程的编程技术来实现。
在本说明书中所述的主题和功能操作的实施例可以以数字电子电路、以有形实现的计算机软件或固件、以硬件,包括在本说明书中公开的结构以及其结构等价物、或以它们中的一个或多个的组合来实现。可以将在本说明书中所述的主题的实施例实现为一个或多个计算机程序,即编码在计算机存储介质上、供数据处理装置执行或控制数据处理装置的操作的一个或多个计算机程序指令模块。替选地或另外,程序指令可以被编码在传播信号上,该传播信号是非自然生成的信号,例如机器生成的电的、光学或电磁信号,其被生成以编码用于传输到适当接收器装置以供数据处理装置执行的信息。计算机存储介质可以是机器可读存储设备、机器可读存储基片、随机或串行存取存储器设备、或以上的一个或多个的组合。
用语“数据处理装置”包含用于处理数据的所有类型的装置、设备以及机器,包括例如可编程处理器、计算机或多个处理器或计算机。装置可以包括专用逻辑电路,例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)。除硬件外,所述装置还可以包括为讨论中的计算机程序创建执行环境的代码,例如构成处理器固件、协议堆栈、数据库管理系统、操作系统或以上一个或多个的组合的代码。
计算机程序(其也可以被称为程序、软件、软件应用、脚本或代码)可以以任何形式的编程语言编写,包括编译或解释语言、或者说明性或过程性语言,并且其可以以任何形式部署,包括作为独立程序或作为模块、组件、子程序或适于在计算环境中使用的其他单元。计算机程序可以但不必对应于文件系统中的文件。可以将程序存储在保持其他程序或数据的文件(例如,存储在标记语言文档中的一个或多个脚本)的一部分、专用于讨论中的程序的单个文件或者多个协调文件(例如,存储一个或多个模块、子程序或部分代码的文件)中。可以将计算机程序部署为在一个计算机上或者在位于一个地点或跨多个地点分布并且由通信网络互连的多个计算机上执行。
在本说明书中所述的过程和逻辑流可以由执行一个或多个计算机程序的一个或多个可编程处理器执行,以通过操作输入数据并且生成输出来执行功能。所述过程和逻辑流还可以由专用逻辑电路执行,以及装置还可以被实现为专用逻辑电路,专用逻辑电路例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
适于执行计算机程序的处理器包括例如通用和专用微处理器两者,以及任何类型的数字计算机的任何一个或多个处理器。通常,处理器将从只读存储器或随机存取存储器或两者接收指令和数据。计算机的主要元件是用于执行或施行指令的处理器和用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括用于存储数据的一个或多个海量存储设备,例如磁的、磁光盘或光盘,或可操作地耦接以从所述一个或多个海量存储设备接收数据或向所述一个或多个海量存储设备传送数据,或两者。然而,计算机不必具有这样的设备。此外,可以将计算机嵌入另一个设备中,例如移动电话、个人数字助理(PDA)、移动音频或视频播放器、游戏控制台、全球定位系统(GPS)接收器或便携式存储设备(例如,通用串行总线(USB)闪存驱动器),仅列出一些。
适于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、介质和存储器设备,包括例如:半导体存储器设备,例如EPROM、EEPROM和闪存设备;磁盘,例如内部硬盘或可移动盘;磁光盘;以及CD-ROM和DVD-ROM盘。处理器和存储器可以由专用逻辑电路补充,或合并入专用逻辑电路。
为了提供与用户的交互,本说明书中所述的主题的实施例可以在具有下述的计算机上实现:用于向用户显示信息的显示设备,例如CRT(阴极射线管)或LCD(液晶显示)监视器;以及,用户通过其可以向计算机提供输入的键盘和指示设备,例如鼠标或跟踪球。也可以使用其他类型的设备来提供与用户的交互;例如,提供给用户的反馈可以是任何形式的感知反馈,例如视觉反馈、听觉反馈或触觉反馈;以及可以以任何形式,包括声学、话音或触觉输入,接收来自用户的输入。另外,计算机可以通过向用户所使用的设备发送文档并且从该设备接收文档来与用户交互;例如,通过响应于从用户的客户端上的web浏览器接收的请求而向该web浏览器发送网页。
虽然本说明书包含许多具体实施方式细节,但是这些细节不应当被解释为对任何发明或可以主张的内容的范围的限制,而应当被解释为对可以具体到特定发明的特定实施例的特征的描述。还可以将在本说明书中在分离的实施例的情境中描述的某些特征组合在单个实施例中实现。相反地,也可以将在单个实施例的情境中描述的各种特征分离地在多个实施例中实现或在任何适当的子组合中实现。此外,尽管可能在上面将特征描述为在某些组合中起作用,甚至最初主张如此,但是可以在一些情况下,将来自所主张的组合的一个或多个特征从该组合中删去,并且所主张的组合可以针对子组合或子组合的变体。
类似地,虽然在附图中按照特定顺序描绘了操作,但是不应当将这理解为需要按照所示的特定顺序或按照连续顺序执行这样的操作、或者需要执行所有图示的操作才能达到期望的结果。在某些情况下,多任务以及并行处理可以是有利的。此外,不应当将在上述实施例中的各种系统组件的分离理解为在所有实施例中均需要这样的分离,而应当理解的是,通常可以将所述程序组件和系统集成到一起成为单个软件产品或封装为多个软件产品。
已描述了本主题的特定实施例。其他实施例在所附权利要求的范围内。例如,可以按照不同的顺序来执行权利要求中记载的动作并且仍然达到期望的结果。作为一个示例,在附图中描绘的过程不必需要所示的特定顺序或连续顺序,才能达到期望的结果。在某些实施方式中,多任务以及并行处理可以是有利的。
Claims (29)
1.一种提供对问题的自动回答的计算机实现的方法,包括:
从客户端接收定义问题的数据,所接收的问题包括多个词;
对第一储存库查询对应于所接收的问题的回答,所述第一储存库存储问题回答对;
基于所述查询确定所述第一储存库不包括具有与所接收的问题匹配的问题的问题回答对,并且作为响应:
将所接收的问题解析成关键词集,并且对第二储存库查询对应于所述关键词集的回答,所述第二储存库存储关键词集回答对,其中每个关键词集回答对:
是从存储在所述第一储存库中的一个或多个问题回答对生成的;
在所述关键词集回答对的关键词集中包括从相对应的问题回答对的问题提取的关键词;以及
具有相应的分值,所述相应的分值基于与所述关键词集回答对匹配的关键词集回答对已被添加到所述第二储存库的次数;
根据排名标准基于包括从所述第二储存库返回的回答的关键词集回答对的分值对所述回答进行排序;以及
向所述客户端提供所排序的回答的至少子集。
2.根据权利要求1所述的方法,进一步包括通过以下的至少一个步骤对所接收的问题进行规范化:移除多余的词;校正拼写错误;移除不必要的标点符号;校正不正确的标点符号;以及移除多余的空格。
3.根据权利要求1所述的方法,其中将所接收的问题解析成关键词集包括:
使用与编写所述问题的语言相对应的语言模型将所接收的问题分割成词集;以及
从所述词集移除停用词。
4.根据权利要求3所述的方法,其中通过以下步骤来精化分割所接收的问题的步骤:将所述问题的至少部分与搜索词语集合进行比较。
5.根据权利要求1所述的方法,其中提供所排序的回答的至少子集包括向所述客户端提供具有最高排名的所述回答。
6.根据权利要求1所述的方法,其中所述客户端包括以下的至少一个:聊天室应用、电子布告栏应用以及到搜索引擎的客户端接口。
7.根据权利要求1所述的方法,其中将所接收的问题解析成关键词集以及对第二储存库查询对应于所述关键词集的回答与查询所述第一储存库同时发生。
8.根据权利要求1所述的方法,其中将所接收的问题解析成关键词集以及对第二储存库查询对应于所述关键词集的回答仅当响应于对所述第一储存库的所述查询而没有接收到回答时才发生。
9.一种提供对问题的自动回答的系统,包括:
第一储存库,其存储问题回答对;
第二储存库,其存储关键词集回答对,其中每个关键词集回答对:
是从存储在所述第一储存库中的一个或多个问题回答对生成的;
在所述关键词集回答对的关键词集中包括从相对应的问题回答对的问题提取的关键词;以及
具有相应的分值,所述相应的分值基于与所述关键词集回答对匹配的关键词集回答对已被添加到所述第二储存库的次数;
问题处理模块,其被配置成:
从客户端接收定义问题的数据,所接收的问题包括多个词;
对所述第一储存库查询对应于所接收的问题的回答;
基于所述查询确定所述第一储存库不包括具有与所接收的问题匹配的问题的问题回答对,并且作为响应:
将所接收的问题解析成关键词集,并且对所述第二储存库查询对应于所述关键词集的回答;
根据排名标准基于包括从所述第二储存库返回的回答的关键词集回答对的分值对所述回答进行排序;
向所述客户端提供所排序的回答的至少子集以供展现。
10.根据权利要求9所述的系统,其中所述问题处理模块被进一步配置成通过以下的至少一个步骤对所接收的问题进行规范化:移除多余的词;校正拼写错误;移除不必要的标点符号;校正不正确的标点符号;以及移除多余的空格。
11.根据权利要求9所述的系统,其中将所接收的问题解析成关键词集的步骤至少包括:
使用与编写所述问题的语言相对应的语言模型将所接收的问题分割成词集;以及
从所述词集移除停用词。
12.根据权利要求11所述的系统,其中通过以下步骤来精化分割所接收的问题的步骤:将所接收的问题的至少部分与搜索词语集合进行比较。
13.根据权利要求9所述的系统,其中将所接收的问题解析成关键词集以及对第二储存库查询对应于所述关键词集的回答与查询所述第一储存库的步骤同时发生。
14.根据权利要求9所述的系统,其中将所接收的问题解析成关键词集以及对第二储存库查询对应于所述关键词集的回答仅当响应于对所述第一储存库的所述查询而没有接收到回答时才发生。
15.根据权利要求9所述的系统,进一步包括用于维护所述第一和第二储存库的储存库维护模块,所述储存库维护模块被配置成:
从在文档语料库之中的文档识别问题-回答对,其中所述回答被映射到所述问题;
将所述问题-回答对添加到所述第一储存库;
解析在所述问题-回答对中的所述问题来获取关键词集;以及
将所述关键词集和所述回答添加到所述第二储存库作为关键词集回答对。
16.根据权利要求15所述的系统,其中所述关键词和所述回答仅在所述关键词集的大小高于阈值时才被添加到所述第二储存库。
17.根据权利要求16所述的系统,其中在所述文档中的所识别的问题-回答对的所述问题的结束和所述回答的开始之间的距离在第一预先确定的阈值内。
18.根据权利要求16或17所述的系统,其中在所识别的问题-回答对中的所述问题的长度在第二预先确定的阈值内,以及所识别的问题-回答对中的所述回答的长度在第三阈值内。
19.根据权利要求15所述的系统,其中将所述问题-回答对添加到所述第一储存库包括:
确定所述问题-回答对是否已存在于所述第一储存库中;
响应于确定所述问题-回答对已存在于所述第一储存库中,增加所述问题-回答对在所述第一储存库中的相应分值;
响应于确定所述问题-回答对不存在于所述第一储存库中,将所述问题-回答对的新条目存储在所述第一储存库中,并且为所述问题回答对初始化分值。
20.根据权利要求15所述的系统,其中将所述关键词集和所述回答添加到所述第二储存库包括:
确定包括所述关键词集和所述回答的关键词集回答对是否已存在于所述第二储存库中;
响应于确定包括所述关键词集和所述回答的所述关键词集回答对已存在于所述第二储存库中,增加包括所述关键词集和所述回答的所述关键词集回答对在所述第二储存库中的相应分值;或
响应于确定包括所述关键词集和所述回答的所述关键词集回答对不存在于所述第二储存库中,将所述关键词集和所述回答的所述对的新条目存储在所述第二储存库中,并且为所述关键词集和所述回答的所述对初始化分值。
21.根据权利要求15所述的系统,其中所述文档语料库包括聊天室记录、电子布告栏数据以及网页。
22.根据权利要求15所述的系统,其中识别问题-回答对的步骤包括通过以下的至少一个步骤对所识别的问题回答对中的所述问题和回答进行规范化:移除多余的词;校正拼写错误;移除不必要的标点符号;校正不正确的标点符号;移除多余的空格。
23.一种计算机实现的方法,包括:
从在文档语料库之中的文档识别问题-回答对,其中所述回答被映射到所述问题;
将所述问题-回答对添加到第一储存库;
为所述问题回答对生成关键词集回答对,包括:
解析在所述问题-回答对中的所述问题来获取关键词集;以及
将所述关键词集与所述回答相关联以形成关键词集回答对;以及
将所述关键词集回答对添加到第二储存库,所述关键词集回答对具有相应的分值,所述相应的分值基于与所述关键词集回答对匹配的关键词集回答对已被添加到所述第二储存库的次数;
其中,响应于确定所述第一储存库不包括具有与所接收的问题匹配的问题的问题回答对,使用所接收的问题的关键词来查询所述第二储存库。
24.根据权利要求23所述的方法,其中所述关键词和所述回答仅在所述关键词集的大小高于阈值时才被添加到所述第二储存库。
25.根据权利要求23所述的方法,其中从在文档语料库之中的文档识别问题-回答对包括仅当在所述文档中的所述问题的结束和所述回答的开始之间的距离在第一预先确定的阈值内时才识别所述问题-回答对。
26.根据权利要求25所述的方法,其中从在文档语料库之中的文档识别问题-回答对包括仅在问题的长度在第二预先确定的阈值内时才识别所述问题,以及仅在所识别的问题-回答对的所述回答的长度在第三阈值内时才识别所述回答。
27.根据权利要求23所述的方法,其中将所述问题-回答对添加到所述第一储存库包括:
确定所述问题-回答对是否已存在于所述第一储存库中;
响应于确定所述问题-回答对已存在于所述第一储存库中,增加所述问题-回答对在所述第一储存库中的排名;以及
响应于确定所述问题-回答对不存在于所述第一储存库中,将所述问题-回答对的新条目存储在所述第一储存库中,并且为所述问题回答对初始化排名。
28.根据权利要求23所述的方法,其中将所述关键词集和所述回答添加到所述第二储存库包括:
确定包括所述关键词集和所述回答的关键词集回答对是否已存在于所述第二储存库中;
响应于确定包括所述关键词集和所述回答的关键词集回答对已存在于所述第二储存库中,增加所述关键词集回答对在所述第二储存库中的排名;以及
响应于确定包括所述关键词集和所述回答的关键词集回答对不存在于所述第二储存库中,将包括所述关键词集和所述回答的所述关键词集回答对的新条目存储在所述第二储存库中,并且为包括所述关键词集和所述回答的所述关键词集回答对初始化分值。
29.根据权利要求23所述的方法,其中所述文档语料库包括聊天室消息、电子布告栏消息和网页。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2011/070363 WO2012097504A1 (en) | 2011-01-18 | 2011-01-18 | Automated answers to online questions |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103493045A CN103493045A (zh) | 2014-01-01 |
CN103493045B true CN103493045B (zh) | 2019-07-30 |
Family
ID=46515084
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201180069249.2A Active CN103493045B (zh) | 2011-01-18 | 2011-01-18 | 对在线问题的自动回答 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20130304730A1 (zh) |
CN (1) | CN103493045B (zh) |
WO (1) | WO2012097504A1 (zh) |
Families Citing this family (77)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5556711B2 (ja) * | 2011-03-18 | 2014-07-23 | 富士通株式会社 | カテゴリ分類処理装置、カテゴリ分類処理方法、カテゴリ分類処理プログラム記録媒体、カテゴリ分類処理システム |
JP5831951B2 (ja) * | 2011-11-28 | 2015-12-09 | Necソリューションイノベータ株式会社 | 対話システム、冗長メッセージ排除方法および冗長メッセージ排除プログラム |
US9270749B2 (en) * | 2013-11-26 | 2016-02-23 | International Business Machines Corporation | Leveraging social media to assist in troubleshooting |
US9460085B2 (en) * | 2013-12-09 | 2016-10-04 | International Business Machines Corporation | Testing and training a question-answering system |
US20150186527A1 (en) * | 2013-12-26 | 2015-07-02 | Iac Search & Media, Inc. | Question type detection for indexing in an offline system of question and answer search engine |
US9495457B2 (en) | 2013-12-26 | 2016-11-15 | Iac Search & Media, Inc. | Batch crawl and fast crawl clusters for question and answer search engine |
CN104866488B (zh) * | 2014-02-24 | 2019-02-05 | 联想(北京)有限公司 | 一种消息回复方法及电子设备 |
US20150278264A1 (en) * | 2014-03-31 | 2015-10-01 | International Business Machines Corporation | Dynamic update of corpus indices for question answering system |
US9471689B2 (en) | 2014-05-29 | 2016-10-18 | International Business Machines Corporation | Managing documents in question answering systems |
US20150363473A1 (en) * | 2014-06-17 | 2015-12-17 | Microsoft Corporation | Direct answer triggering in search |
US10268763B2 (en) * | 2014-07-25 | 2019-04-23 | Facebook, Inc. | Ranking external content on online social networks |
US9619513B2 (en) * | 2014-07-29 | 2017-04-11 | International Business Machines Corporation | Changed answer notification in a question and answer system |
US9703840B2 (en) | 2014-08-13 | 2017-07-11 | International Business Machines Corporation | Handling information source ingestion in a question answering system |
US9720962B2 (en) | 2014-08-19 | 2017-08-01 | International Business Machines Corporation | Answering superlative questions with a question and answer system |
US9690862B2 (en) * | 2014-10-18 | 2017-06-27 | International Business Machines Corporation | Realtime ingestion via multi-corpus knowledge base with weighting |
US10331673B2 (en) * | 2014-11-24 | 2019-06-25 | International Business Machines Corporation | Applying level of permanence to statements to influence confidence ranking |
US9330084B1 (en) * | 2014-12-10 | 2016-05-03 | International Business Machines Corporation | Automatically generating question-answer pairs during content ingestion by a question answering computing system |
US10475043B2 (en) * | 2015-01-28 | 2019-11-12 | Intuit Inc. | Method and system for pro-active detection and correction of low quality questions in a question and answer based customer support system |
US10366107B2 (en) | 2015-02-06 | 2019-07-30 | International Business Machines Corporation | Categorizing questions in a question answering system |
US20160284011A1 (en) * | 2015-03-25 | 2016-09-29 | Facebook, Inc. | Techniques for social messaging authorization and customization |
US10795921B2 (en) * | 2015-03-27 | 2020-10-06 | International Business Machines Corporation | Determining answers to questions using a hierarchy of question and answer pairs |
US9684876B2 (en) | 2015-03-30 | 2017-06-20 | International Business Machines Corporation | Question answering system-based generation of distractors using machine learning |
US10083213B1 (en) | 2015-04-27 | 2018-09-25 | Intuit Inc. | Method and system for routing a question based on analysis of the question content and predicted user satisfaction with answer content before the answer content is generated |
US10755294B1 (en) | 2015-04-28 | 2020-08-25 | Intuit Inc. | Method and system for increasing use of mobile devices to provide answer content in a question and answer based customer support system |
US10134050B1 (en) | 2015-04-29 | 2018-11-20 | Intuit Inc. | Method and system for facilitating the production of answer content from a mobile device for a question and answer based customer support system |
US12056131B2 (en) * | 2015-05-11 | 2024-08-06 | Microsoft Technology Licensing, Llc | Ranking for efficient factual question answering |
US9912736B2 (en) | 2015-05-22 | 2018-03-06 | International Business Machines Corporation | Cognitive reminder notification based on personal user profile and activity information |
US10169326B2 (en) | 2015-05-22 | 2019-01-01 | International Business Machines Corporation | Cognitive reminder notification mechanisms for answers to questions |
US10447777B1 (en) | 2015-06-30 | 2019-10-15 | Intuit Inc. | Method and system for providing a dynamically updated expertise and context based peer-to-peer customer support system within a software application |
US10152534B2 (en) | 2015-07-02 | 2018-12-11 | International Business Machines Corporation | Monitoring a corpus for changes to previously provided answers to questions |
US10147037B1 (en) | 2015-07-28 | 2018-12-04 | Intuit Inc. | Method and system for determining a level of popularity of submission content, prior to publicizing the submission content with a question and answer support system |
US10475044B1 (en) | 2015-07-29 | 2019-11-12 | Intuit Inc. | Method and system for question prioritization based on analysis of the question content and predicted asker engagement before answer content is generated |
US10268956B2 (en) | 2015-07-31 | 2019-04-23 | Intuit Inc. | Method and system for applying probabilistic topic models to content in a tax environment to improve user satisfaction with a question and answer customer support system |
US10394804B1 (en) | 2015-10-08 | 2019-08-27 | Intuit Inc. | Method and system for increasing internet traffic to a question and answer customer support system |
US10769185B2 (en) | 2015-10-16 | 2020-09-08 | International Business Machines Corporation | Answer change notifications based on changes to user profile information |
US10795878B2 (en) * | 2015-10-23 | 2020-10-06 | International Business Machines Corporation | System and method for identifying answer key problems in a natural language question and answering system |
US10242093B2 (en) | 2015-10-29 | 2019-03-26 | Intuit Inc. | Method and system for performing a probabilistic topic analysis of search queries for a customer support system |
CN105677764B (zh) * | 2015-12-30 | 2020-05-08 | 百度在线网络技术(北京)有限公司 | 信息提取方法和装置 |
JP6649582B2 (ja) * | 2016-02-23 | 2020-02-19 | 富士通株式会社 | 検索制御プログラム、検索制御装置及び検索制御方法 |
JP2017167659A (ja) * | 2016-03-14 | 2017-09-21 | 株式会社東芝 | 機械翻訳装置、方法、およびプログラム |
CN105893552B (zh) * | 2016-03-31 | 2020-05-05 | 成都晓多科技有限公司 | 数据处理方法及装置 |
US10599699B1 (en) | 2016-04-08 | 2020-03-24 | Intuit, Inc. | Processing unstructured voice of customer feedback for improving content rankings in customer support systems |
US10162734B1 (en) | 2016-07-20 | 2018-12-25 | Intuit Inc. | Method and system for crowdsourcing software quality testing and error detection in a tax return preparation system |
US10467541B2 (en) | 2016-07-27 | 2019-11-05 | Intuit Inc. | Method and system for improving content searching in a question and answer customer support system by using a crowd-machine learning hybrid predictive model |
US10460398B1 (en) | 2016-07-27 | 2019-10-29 | Intuit Inc. | Method and system for crowdsourcing the detection of usability issues in a tax return preparation system |
US10445332B2 (en) | 2016-09-28 | 2019-10-15 | Intuit Inc. | Method and system for providing domain-specific incremental search results with a customer self-service system for a financial management system |
US10572954B2 (en) | 2016-10-14 | 2020-02-25 | Intuit Inc. | Method and system for searching for and navigating to user content and other user experience pages in a financial management system with a customer self-service system for the financial management system |
US10733677B2 (en) | 2016-10-18 | 2020-08-04 | Intuit Inc. | Method and system for providing domain-specific and dynamic type ahead suggestions for search query terms with a customer self-service system for a tax return preparation system |
US10552843B1 (en) | 2016-12-05 | 2020-02-04 | Intuit Inc. | Method and system for improving search results by recency boosting customer support content for a customer self-help system associated with one or more financial management systems |
US10748157B1 (en) | 2017-01-12 | 2020-08-18 | Intuit Inc. | Method and system for determining levels of search sophistication for users of a customer self-help system to personalize a content search user experience provided to the users and to increase a likelihood of user satisfaction with the search experience |
CN106878819B (zh) * | 2017-01-20 | 2019-07-26 | 合一网络技术(北京)有限公司 | 一种网络直播中信息交互的方法、系统及装置 |
US10275515B2 (en) * | 2017-02-21 | 2019-04-30 | International Business Machines Corporation | Question-answer pair generation |
CN108509463B (zh) * | 2017-02-28 | 2022-03-29 | 华为技术有限公司 | 一种问题的应答方法及装置 |
US11651246B2 (en) * | 2017-05-02 | 2023-05-16 | Ntt Docomo, Inc. | Question inference device |
US10922367B2 (en) | 2017-07-14 | 2021-02-16 | Intuit Inc. | Method and system for providing real time search preview personalization in data management systems |
CN107463699A (zh) * | 2017-08-15 | 2017-12-12 | 济南浪潮高新科技投资发展有限公司 | 一种基于seq2seq模型的实现问答机器人的方法 |
US11144602B2 (en) | 2017-08-31 | 2021-10-12 | International Business Machines Corporation | Exploiting answer key modification history for training a question and answering system |
US11093951B1 (en) | 2017-09-25 | 2021-08-17 | Intuit Inc. | System and method for responding to search queries using customer self-help systems associated with a plurality of data management systems |
US11238075B1 (en) * | 2017-11-21 | 2022-02-01 | InSkill, Inc. | Systems and methods for providing inquiry responses using linguistics and machine learning |
US11436642B1 (en) | 2018-01-29 | 2022-09-06 | Intuit Inc. | Method and system for generating real-time personalized advertisements in data management self-help systems |
CN108491378B (zh) * | 2018-03-08 | 2021-11-09 | 国网福建省电力有限公司 | 电力信息运维智能应答系统 |
US11269665B1 (en) | 2018-03-28 | 2022-03-08 | Intuit Inc. | Method and system for user experience personalization in data management systems using machine learning |
US10878193B2 (en) * | 2018-05-01 | 2020-12-29 | Kyocera Document Solutions Inc. | Mobile device capable of providing maintenance information to solve an issue occurred in an image forming apparatus, non-transitory computer readable recording medium that records an information processing program executable by the mobile device, and information processing system including the mobile device |
CN108763494B (zh) * | 2018-05-30 | 2020-02-21 | 苏州思必驰信息科技有限公司 | 对话系统间的知识分享方法、对话方法及装置 |
CN109147800A (zh) * | 2018-08-30 | 2019-01-04 | 百度在线网络技术(北京)有限公司 | 应答方法和装置 |
CN109213847A (zh) * | 2018-09-14 | 2019-01-15 | 广州神马移动信息科技有限公司 | 答案的分层方法及其装置、电子设备、计算机可读介质 |
US11822588B2 (en) * | 2018-10-24 | 2023-11-21 | International Business Machines Corporation | Supporting passage ranking in question answering (QA) system |
US10831989B2 (en) | 2018-12-04 | 2020-11-10 | International Business Machines Corporation | Distributing updated communications to viewers of prior versions of the communications |
US10861022B2 (en) | 2019-03-25 | 2020-12-08 | Fmr Llc | Computer systems and methods to discover questions and answers from conversations |
CN110309378B (zh) * | 2019-06-28 | 2023-06-09 | 深圳前海微众银行股份有限公司 | 一种问题答复的处理方法、装置及系统 |
US11782962B2 (en) | 2019-08-12 | 2023-10-10 | Nec Corporation | Temporal context-aware representation learning for question routing |
US11379670B1 (en) * | 2019-09-30 | 2022-07-05 | Splunk, Inc. | Automatically populating responses using artificial intelligence |
US12001801B2 (en) * | 2019-11-15 | 2024-06-04 | Salesforce, Inc. | Question answering using dynamic question-answer database |
JP7448350B2 (ja) | 2019-12-18 | 2024-03-12 | トヨタ自動車株式会社 | エージェント装置、エージェントシステム、及びエージェントプログラム |
JP7268149B2 (ja) * | 2020-03-26 | 2023-05-02 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 問い合わせ情報の処理方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム |
CN114331470A (zh) * | 2021-12-20 | 2022-04-12 | 上海盈溪电子商务有限公司 | 一种电子商务线上咨询服务系统 |
CN117407515B (zh) * | 2023-12-15 | 2024-04-30 | 湖南三湘银行股份有限公司 | 一种基于人工智能的答题系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101046869A (zh) * | 2006-03-31 | 2007-10-03 | 周乃统 | 一种基于手机、pda等手持设备用户端与网络平台相对接的问答系统 |
CN101105815A (zh) * | 2007-09-06 | 2008-01-16 | 腾讯科技(深圳)有限公司 | 互联网音乐文件排序方法、系统和搜索方法及搜索引擎 |
CN101169797A (zh) * | 2007-11-30 | 2008-04-30 | 朱廷劭 | 一种对搜索结果优化的方法 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5870755A (en) * | 1997-02-26 | 1999-02-09 | Carnegie Mellon University | Method and apparatus for capturing and presenting digital data in a synthetic interview |
US7707245B2 (en) * | 2000-02-22 | 2010-04-27 | Harvey Lunenfeld | Metasearching a client's request for displaying different order books on the client |
US7043439B2 (en) * | 2000-03-29 | 2006-05-09 | Canon Kabushiki Kaisha | Machine interface |
US8340955B2 (en) * | 2000-11-15 | 2012-12-25 | International Business Machines Corporation | System and method for finding the most likely answer to a natural language question |
JP2003030224A (ja) * | 2001-07-17 | 2003-01-31 | Fujitsu Ltd | 文書クラスタ作成装置、文書検索システムおよびfaq作成システム |
US8566102B1 (en) * | 2002-03-28 | 2013-10-22 | At&T Intellectual Property Ii, L.P. | System and method of automating a spoken dialogue service |
US8606860B2 (en) * | 2003-03-31 | 2013-12-10 | Affini, Inc. | System and method for providing filtering email messages |
US7051014B2 (en) * | 2003-06-18 | 2006-05-23 | Microsoft Corporation | Utilizing information redundancy to improve text searches |
US7814096B1 (en) * | 2004-06-08 | 2010-10-12 | Yahoo! Inc. | Query based search engine |
US7958115B2 (en) * | 2004-07-29 | 2011-06-07 | Yahoo! Inc. | Search systems and methods using in-line contextual queries |
WO2006085661A1 (ja) * | 2005-02-08 | 2006-08-17 | Nec Corporation | 質問応答データ編集装置、質問応答データ編集方法、質問応答データ編集プログラム |
US8930282B2 (en) * | 2006-03-20 | 2015-01-06 | Amazon Technologies, Inc. | Content generation revenue sharing |
US7890860B1 (en) * | 2006-09-28 | 2011-02-15 | Symantec Operating Corporation | Method and apparatus for modifying textual messages |
US7809664B2 (en) * | 2007-12-21 | 2010-10-05 | Yahoo! Inc. | Automated learning from a question and answering network of humans |
US10332054B2 (en) * | 2009-02-09 | 2019-06-25 | Mandometer Ab | Method, generator device, computer program product and system for generating medical advice |
JP5284990B2 (ja) * | 2010-01-08 | 2013-09-11 | インターナショナル・ビジネス・マシーンズ・コーポレーション | キーワードの時系列解析のための処理方法、並びにその処理システム及びコンピュータ・プログラム |
US8769417B1 (en) * | 2010-08-31 | 2014-07-01 | Amazon Technologies, Inc. | Identifying an answer to a question in an electronic forum |
-
2011
- 2011-01-18 US US13/980,242 patent/US20130304730A1/en not_active Abandoned
- 2011-01-18 CN CN201180069249.2A patent/CN103493045B/zh active Active
- 2011-01-18 WO PCT/CN2011/070363 patent/WO2012097504A1/en active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101046869A (zh) * | 2006-03-31 | 2007-10-03 | 周乃统 | 一种基于手机、pda等手持设备用户端与网络平台相对接的问答系统 |
CN101105815A (zh) * | 2007-09-06 | 2008-01-16 | 腾讯科技(深圳)有限公司 | 互联网音乐文件排序方法、系统和搜索方法及搜索引擎 |
CN101169797A (zh) * | 2007-11-30 | 2008-04-30 | 朱廷劭 | 一种对搜索结果优化的方法 |
Also Published As
Publication number | Publication date |
---|---|
US20130304730A1 (en) | 2013-11-14 |
WO2012097504A1 (en) | 2012-07-26 |
CN103493045A (zh) | 2014-01-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103493045B (zh) | 对在线问题的自动回答 | |
CN106663125B (zh) | 提问句生成装置以及记录介质 | |
US10783156B1 (en) | Scoring candidate answer passages | |
US12026194B1 (en) | Query modification based on non-textual resource context | |
KR101895249B1 (ko) | 지능 문답 구현 방법, 시스템 및 저장 매체 | |
US11487744B2 (en) | Domain name generation and searching using unigram queries | |
JP5731250B2 (ja) | 情報ストリーム中の興味深いコンテンツを推奨するためのシステムおよび方法 | |
US9009134B2 (en) | Named entity recognition in query | |
US8554540B2 (en) | Topic map based indexing and searching apparatus | |
US9547690B2 (en) | Query rewriting using session information | |
US8688727B1 (en) | Generating query refinements | |
US20140006012A1 (en) | Learning-Based Processing of Natural Language Questions | |
US20100185691A1 (en) | Scalable semi-structured named entity detection | |
US8359326B1 (en) | Contextual n-gram analysis | |
US11086866B2 (en) | Method and system for rewriting a query | |
US10180964B1 (en) | Candidate answer passages | |
WO2015175931A1 (en) | Language modeling for conversational understanding domains using semantic web resources | |
US20180181544A1 (en) | Systems for Automatically Extracting Job Skills from an Electronic Document | |
US11531928B2 (en) | Machine learning for associating skills with content | |
US10019513B1 (en) | Weighted answer terms for scoring answer passages | |
US8793120B1 (en) | Behavior-driven multilingual stemming | |
US10592514B2 (en) | Location-sensitive ranking for search and related techniques | |
CN109952571B (zh) | 基于上下文的图像搜索结果 | |
WO2007124430A2 (en) | Search techniques using association graphs | |
US10585960B2 (en) | Predicting locations for web pages and related techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: American California Applicant after: Google limited liability company Address before: American California Applicant before: Google Inc. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |