CN108595619A - 一种问答方法及设备 - Google Patents
一种问答方法及设备 Download PDFInfo
- Publication number
- CN108595619A CN108595619A CN201810367034.2A CN201810367034A CN108595619A CN 108595619 A CN108595619 A CN 108595619A CN 201810367034 A CN201810367034 A CN 201810367034A CN 108595619 A CN108595619 A CN 108595619A
- Authority
- CN
- China
- Prior art keywords
- term vector
- question
- candidate
- question sentence
- answer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Abstract
本申请实施例公开了一种问答方法及设备,涉及语义理解技术领域,解决了由于用户的输入方式多样化导致服务器不能对用户的问句进行精确语义匹配的问题。具体方案为:接收用户输入的问句,并获取该问句的关键词;根据关键词,从预存的问答对中获取候选问答对集合,该候选问答对集合中包括至少一个候选问题和每个候选问题对应的答案;计算问句与候选问题的主题相似度,并将至少一个候选问题中,主题相似度最大的候选问题确定为目标问题;向客户端返回目标问题对应的答案。本申请实施例用于问答系统中,能够提高语义匹配的准确性。
Description
技术领域
本申请实施例涉及语义理解技术领域,尤其涉及一种问答方法及设备。
背景技术
随着自然语言处理和人工智能相关技术的发展,已经衍生出不同种类的问答系统,问答系统一般包括问题分析(语义解析)、文档片段检索和答案抽取。其中,问题解析即分析用户的意图,仍是本领域的关键性难题。
在现有技术中,问答系统可以包括客户端和服务器,且问答过程为:当用户在客户端输入问句(Query)之后,客户端可以将该问句携带在查询请求中发送至服务器,服务器便可以通过语义匹配,从存储有问答对的常用问答库中获取用户想要了解的问题,然后将所有问题中的一个问题对应的答案发送至客户端,以便客户端进行显示,供用户查看。具体的,服务器可以通过意图分析方法来进行语义匹配,例如,假设问句为:“今天天气怎么样”,则服务器可以采集意图分析方法中的模板,将问句转化为[日期]、[实体:天气]、[询问词:怎么样],并根据这些词获取用户想要了解的问题。
现有技术中至少存在以下技术问题:由于意图分析方法仅对规则性强的问句有辨识度,在用户的输入方式多样化的情况下,可能会导致服务器不能对用户的问句进行精确语义匹配,从而获得不符合用户意图的答案。
发明内容
本申请提供一种问答方法及设备,解决了由于用户的输入方式多样化导致服务器不能对用户的问句进行精确语义匹配的问题。
为达到上述目的,本申请采用如下技术方案:
第一方面,本申请提供一种问答方法,该方法可以包括:接收用户输入的问句,并获取所述问句的关键词;根据所述关键词,从预存的问答对中获取候选问答对集合,所述候选问答对集合中包括至少一个候选问题和每个所述候选问题对应的答案;计算所述问句与所述候选问题的主题相似度,并将所述至少一个候选问题中,所述主题相似度最大的候选问题确定为目标问题;向客户端返回所述目标问题对应的答案。
结合第一方面,在一种可能的实现方式中,所述将所述至少一个候选问题中,所述主题相似度最大的候选问题确定为目标问题,包括:将所述至少一个候选问题中,所述主题相似度大于第一预设值的候选问题确定为第一问题,得到第一问答对集合;根据所述问句的主题的词向量和焦点的词向量,以及所述第一问题的主题的词向量和焦点的词向量,计算所述问句与所述第一问题的词向量相似度;将所述第一问题中,所述词向量相似度最大的第一问题确定为所述目标问题。
结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,所述将所述第一问题中,所述词向量相似度最大的第一问题确定为所述目标问题,包括:将所述第一问题中,所述词向量相似度大于第二预设值的第一问题确定为第二问题,得到第二问答对集合;根据编辑距离算法,计算所述问句与所述第二问题的距离相似度,并将所述第二问题中,所述距离相似度最大的第二问题确定为所述目标问题。
结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,所述计算所述问句与所述候选问题的主题相似度,包括:根据文档主题生成模型(Latent DirichletAllocation,LDA)生成的主题词,确定所述问句包含主题词的概率,以及所述候选问题包含主题词的概率;根据所述问句包含主题词的概率和所述候选问题包含主题词的概率,计算所述问句与所述候选问题的主题相似度。
结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,在所述根据所述问句的主题的词向量和焦点的词向量,以及所述第一问题的主题的词向量和焦点的词向量,计算所述问句与所述第一问题的词向量相似度之前,还包括:对所述第一问题进行分词、去除停用词处理;根据主题(Topic)与焦点(Focus)模型包括的预设规则,对所述问句和所述第一问题的分词结果进行排序;根据排序后的所述问句和所述第一问题的分词结果,生成问题树;采用至少一种切割方式切割所述问题树,并计算每种切割方式对应的描述长度(Description Length),根据最小描述长度(Minimum Description Length)对应的切割方式,获取所述问句的主题和焦点,以及所述第一问题的主题和焦点;根据词向量语言(Word2vec)算法,获取所述问句的主题的词向量和焦点的词向量,以及所述第一问题的主题的词向量和焦点的词向量。
结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,所述根据所述问句的主题的词向量和焦点的词向量,以及所述第一问题的主题的词向量和焦点的词向量,计算所述问句与所述第一问题的词向量相似度,包括:计算所述问句的主题的词向量与所述第一问题的主题的词向量的第一相似度,并计算所述问句的焦点的词向量与所述第一问题的焦点的词向量的第二相似度;根据所述第一相似度和所述第二相似度,得到所述问句与所述第一问题的词向量相似度。
结合第一方面和上述可能的实现方式,在另一种可能的实现方式中,在所述获取所述问句的关键词之后,还包括:根据预存的同义词库,确定所述关键词的同义词;所述根据所述关键词,从预存的问答对中获取候选问答对集合,包括:根据所述关键词和所述同义词,从所述问答对中获取所述候选问答对集合。
第二方面,本申请提供一种服务器,该服务器可以包括:接收单元、获取单元、计算单元、确定单元和发送单元;所述接收单元,用于接收用户输入的问句;所述获取单元,用于获取所述接收单元接收的所述问句的关键词;根据所述关键词,从预存的问答对中获取候选问答对集合,所述候选问答对集合中包括至少一个候选问题和每个所述候选问题对应的答案;所述计算单元,用于计算所述问句与所述获取单元获取的所述候选问题的主题相似度;所述确定单元,用于将所述至少一个候选问题中,所述主题相似度最大的候选问题确定为目标问题;所述发送单元,用于向所述客户端返回所述目标问题对应的答案。
结合第二方面,在一种可能的实现方式中,所述确定单元,具体用于:将所述至少一个候选问题中,所述主题相似度大于第一预设值的候选问题确定为第一问题,得到第一问答对集合;根据所述问句的主题的词向量和焦点的词向量,以及所述第一问题的主题的词向量和焦点的词向量,计算所述问句与所述第一问题的词向量相似度;将所述第一问题中,所述词向量相似度最大的第一问题确定为所述目标问题。
结合第二方面和上述可能的实现方式,在另一种可能的实现方式中,所述确定单元,具体用于:将所述第一问题中,所述词向量相似度大于第二预设值的第一问题确定为第二问题,得到第二问答对集合;根据编辑距离算法,计算所述问句与所述第二问题的距离相似度,并将所述第二问题中,所述距离相似度最大的第二问题确定为所述目标问题。
结合第二方面和上述可能的实现方式,在另一种可能的实现方式中,计算单元具体用于:根据LDA生成的主题词,确定问句包含主题词的概率,以及候选问题包含主题词的概率;根据问句包含主题词的概率和候选问题包含主题词的概率,计算问句与候选问题的主题相似度。
结合第二方面和上述可能的实现方式,在另一种可能的实现方式中,服务器还可以包括:处理单元、排序单元和生成单元。处理单元,用于对第一问题进行分词、去除停用词处理。排序单元,用于根据主题与焦点模型包括的预设规则,对问句和第一问题的分词结果进行排序。生成单元,用于根据排序后的问句和第一问题的分词结果,生成问题树。处理单元,还用于采用至少一种切割方式切割问题树。计算单元,还用于计算每种切割方式对应的描述长度。获取单元,还用于根据最小描述长度对应的切割方式,获取问句的主题和焦点,以及第一问题的主题和焦点;根据词向量语言算法,获取问句的主题的词向量和焦点的词向量,以及第一问题的主题的词向量和焦点的词向量。
结合第二方面和上述可能的实现方式,在另一种可能的实现方式中,计算单元具体用于:计算问句的主题的词向量与第一问题的主题的词向量的第一相似度,并计算问句的焦点的词向量与第一问题的焦点的词向量的第二相似度;根据第一相似度和第二相似度,得到问句与第一问题的词向量相似度。
结合第二方面和上述可能的实现方式,在另一种可能的实现方式中,确定单元,还用于根据预存的同义词库,确定关键词的同义词。获取单元,具体用于根据关键词和同义词,从问答对中获取候选问答对集合。
具体的实现方式可以参考第一方面或第一方面的可能的实现方式提供的问答方法中服务器的行为功能。
第三方面,提供一种服务器,该服务器包括:至少一个处理器、存储器、通信接口和通信总线。处理器与存储器、通信接口通过通信总线连接,存储器用于存储计算机执行指令,当服务器运行时,处理器执行存储器存储的计算机执行指令,以使服务器执行如第一方面或第一方面的可能的实现方式中任意一项的问答方法。
第四方面,提供一种计算机存储介质,其上存储有计算机执行指令,当计算机执行指令在计算机上运行时,使得计算机执行如第一方面或第一方面的可能的实现方式中任意一项的问答方法。
本申请提供的问答方法,在获取到问句的关键词之后,根据问句的关键词筛选预存的问答对,得到候选问答对集合,并计算问句与候选问题的主题相似度,从主题层面筛选候选问答对集合,从而确定最终的目标问题,并将目标问题对应的答案返回至客户端。这样,在用户的输入方式多样化的情况下,通过两次筛选来对问句进行语义匹配,且由于主题层面的筛选容许很多词汇层面不一致的词,因此与现有技术中采用意图分析方法中的模板进行语义匹配相比,提高了语义匹配的准确性。
附图说明
图1为本申请实施例提供的一种可以应用本申请实施例的系统架构的简化示意图;
图2为本申请实施例提供的一种服务器的组成示意图;
图3为本申请实施例提供的一种问答方法的流程图;
图4为本申请实施例提供的另一种问答方法的流程图;
图5为本申请实施例提供的一种问题树;
图6为本申请实施例提供的一种问题树的切割方式;
图7为本申请实施例提供的另一种问答方法的流程图;
图8为本申请实施例提供的另一种服务器的组成示意图;
图9为本申请实施例提供的另一种服务器的组成示意图;
图10为本申请实施例提供的另一种服务器的组成示意图。
具体实施方式
本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
下面将结合附图对本申请实施例的实施方式进行详细描述。
图1为本申请实施例提供的一种可以应用本申请实施例的系统架构的简化示意图,如图1所示,该系统架构可以包括:客户端11和服务器12。
其中,客户端11,用于接收用户输入的问句,并将该问句携带在查询请求中发送至服务器12,还用于接收并显示服务器12返回的答案,供用户查看。
服务器12,用于接收客户端11发送的包括有用户输入的问句的查询请求,并根据用户输入的问句从预存的问答对中确定目标问题,且向客户端11返回目标问题对应的答案。在具体的实现中,服务器12可以为协同工作的多台服务器。
图2为本申请实施例提供的一种服务器的组成示意图,如图2所示,该服务器可以包括:至少一个处理器21、存储器22、通信接口23和通信总线24。
下面结合图2对服务器的各个构成部件进行具体的介绍:
其中,处理器21是服务器的控制中心,可以是一个处理器,也可以是多个处理元件的统称。例如,处理器21是一个中央处理器(Central Processing Unit,CPU),也可以是特定集成电路(Application Specific Integrated Circuit,ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路,例如:一个或多个数字信号处理器(Digital SignalProcessor,DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,FPGA)。
在具体的实现中,作为一种实施例,处理器21可以包括一个或多个CPU,例如图2中所示的CPU0和CPU1。且,作为一种实施例,服务器可以包括多个处理器,例如图2中所示的处理器21和处理器25。这些处理器中的每一个可以是一个单核处理器(Single-CPU),也可以是一个多核处理器(Multi-CPU)。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。
存储器22可以是只读存储器(Read-Only Memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(Random Access Memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(ElectricallyErasable Programmable Read-Only Memory,EEPROM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器22可以是独立存在,通过通信总线24与处理器21相连接。存储器22也可以和处理器21集成在一起。
在具体的实现中,存储器22,用于存储本申请中的数据和执行本申请的软件程序。处理器21可以通过运行或执行存储在存储器22内的软件程序,以及调用存储在存储器22内的数据,执行服务器的各种功能。
通信接口23,使用任何收发器一类的装置,用于与其他设备或通信网络通信,如客户端、无线接入网(Radio Access Network,RAN),无线局域网(Wireless Local AreaNetworks,WLAN)等。通信接口23可以包括接收单元实现接收功能,以及发送单元实现发送功能。
通信总线24,可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component Interconnect,PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图2中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
为了解决由于用户输入的方式多样化导致服务器不能对用户的问句进行精确语义匹配的问题,本申请实施例提供了一种问答方法,如图3所示,该方法可以包括:
301、接收用户输入的问句,并获取问句的关键词。
其中,当用户在客户端输入问句后,客户端便可以根据用户的输入将问句携带在查询请求中发送至服务器,这样,服务器便可以接收客户端发送的包括有用户输入的问句的查询请求。服务器在接收到用户输入的问句之后,可以根据分词系统将问句自动切分成一个一个单独的词,这些单独的词可以为名词、动词、形容词、助词等,然后从切分后的词中去除停用词,剩余的词便为问句的关键词,该关键词包括至少一个词语,且该停用词指的是形容词、语气词、助词等不太重要的词语。
示例性的,假设查询请求包括的用户输入的问句为:“空调漏水怎么办”,那么服务器可以先对该问句进行分词处理,得到的分词结果为“空调”、“漏水”、“怎么办”,并将这些词中的怎么办去除,得到该问句的关键词为“空调”和“漏水”。
302、根据关键词,从预存的问答对中获取候选问答对集合。
其中,候选问答对集合可以包括至少一个候选问题和与每个候选问题对应的答案。服务器在得到问句的关键词之后,可以根据该关键词,从常用问答(Frequently AskedQuestions,FAQ)库的问答对中获取候选问答对集合,具体的:服务器可以判断是否能够从关键词中提取到设备名,若确定能够从关键词中提取到设备名,则服务器可以根据设备名进行聚合,并根据相关的索引从FAQ库中获取对应的问答对,且服务器可以根据问句的关键词,通过BM25算法,计算问句与每一个获取到的问题的相似度,并将所有获取到的问题,按照相似度从高到低进行排序,从相似度最高的问题开始,选取预设数量的相似度较高的问题作为候选问题,这样便得到候选问答对集合。若确定未从关键词中提取到设备名,则服务器可以直接根据问句的关键词,计算问句与每个问题的相似度,并获取预设数量的相似度较高的问题作为候选问题,得到候选问答对集合。
示例性的,按照步骤301的例子,假设服务器得到的关键词为“空调”和“漏水”,则从关键词中提取到的设备名为“空调”。
303、计算问句与候选问题的主题相似度,并将至少一个候选问题中,主题相似度最大的候选问题确定为目标问题。
其中,服务器在获取到候选问答对集合之后,可以根据预存的LDA生成的主题词,分别计算问句与每个候选问题的主题相似度,本申请实施例在此以计算问句与一个候选问题的相似度为例进行说明。具体的,服务器可以先根据LDA生成的主题词,确定问句包含主题词的概率,以及候选问题中包含主题词的概率,然后根据问句包含主题词的概率和候选问题中包含主题词的概率,计算问句与候选问题的主题相似度。这样,服务器便可以将至少一个候选问题中,主题相似度最大的候选问题确定为目标问题。
304、向客户端返回目标问题对应的答案。
其中,服务器在确定出目标问题之后,可以向客户端返回目标问题对应的答案,以便客户端显示该答案,供用户查看。
进一步的,在本申请实施例中,为了更加精确的对问句进行语义匹配,步骤301服务器在获取到问句的关键词之后,可以根据预存的同义词库,确定关键词包括的每个词语的同义词,以便根据关键词和同义词进行筛选,这样,通过确定关键词的同义词,扩充了筛选范围,支持了更多的泛化说法,能够提高对问句语义匹配的精确性。
示例性的,按照步骤301的例子,服务器可以根据同义词库,确定“空调”的同义词为“室内机”、“室外机”,确定“漏水”的同义词为“滴水”。
且,在服务器确定出关键词的同义词之后,步骤302中服务器根据关键词,从预存的问答对中获取候选问答对集合,具体的可以为:服务器根据关键词和同义词,从预存的问答对中获取候选问答对集合,具体描述与步骤302中服务器根据关键词获取候选问答对集合的描述类似,本申请在此不再赘述。
进一步的,在本申请实施例中,为了更加精确的对问句进行语义匹配,结合图3,如图4所示,上述步骤303具体的可以包括以下步骤3031-步骤3033:
3031、计算问句与候选问题的主题相似度,将至少一个候选问题中,主题相似度大于第一预设值的候选问题确定为第一问题,得到第一问答对集合。
其中,服务器在计算出问句与候选问题的主题相似度之后,可以将主题相似度大于第一预设值的候选问题确定为第一问题,从而得到第一问答对集合,该第一问答对集合中包括至少一个第一问题,以及与每个第一问题对应的答案。
3032、根据问句的主题的词向量和焦点的词向量,以及第一问题的主题的词向量和焦点的词向量,计算问句与第一问题的词向量相似度。
其中,服务器在得到第一问答对集合之后,可以根据词向量计算问句与每个第一问题的词向量相似度,以便从问句的语义层面筛选第一问答对集合。具体的,服务器可以先根据分词系统将每个第一问题切分成一个一个单独的词,并去除停用词,且根据主题与焦点模型包括的预设规则,对问句的分词结果进行排序,并对每个第一问题的分词结果进行排序。然后服务器可以根据排序后的问句的分词结果,以及排序后的每个第一问题的分词结果,生成问题树,该问题树的根节点(Root)为逻辑节点,即不代表任何含义的节点,该问题树的每个子树为切分后得到的一个词,且该问题树的每个分支的词可以组成一个问句或一个问题。这样,服务器便可以采用至少一种切割方式切割该问题树,并根据主题与焦点模型的规则,计算每种切割方式对应的描述长度,且将所有描述长度中最小的值作为最小描述长度,并根据最小描述长度对应的切割方式,获取问句的主题和焦点,以及每个第一问题的主题和焦点。最后,服务器可以根据词向量语言算法,获取问句的主题的词向量和焦点的词向量,以及第一问题的主题的词向量和焦点的词向量,并计算问句的主题的词向量、问句的焦点的词向量、第一问题的主题的词向量和第一问题的焦点的词向量的相似度,得到问句与第一问题的词向量相似度。
进一步的,服务器可以采用以下公式(1)计算问句与第一问题的词向量相似度。
Sim(A,B)=αSim(TopicA,TopicB)+(1-α)Sim(FocusA,FocusB) (1)
其中,Sim(A,B)表示A和B的词向量相似度,A和B分别为问句和第一问题,Sim(TopicA,TopicB)表示问句的主题的词向量与第一问题的主题的词向量的词向量相似度,即第一相似度,Sim(FocusA,FocusB)表示问句的焦点的词向量与第一问题的焦点的词向量的词向量相似度,即第二相似度,也就是说,服务器可以根据第一相似度和第二相似度,得到问句与第一问题的词向量相似度。且在具体的实现中,可以根据实际应用调整α的大小,以调整主题的词向量相似度所占的比例。这样,服务器通过分别计算问句的主题的词向量与第一问题的主题的词向量的相似度和问句的焦点的词向量与第一问题的焦点的词向量的相似度来得到问句与第一主题的词向量相似度,与计算问句的主题的词向量、问句的焦点的词向量、第一问题的主题的词向量和第一问题的焦点的词向量的相似度来得到问句与第一主题的词向量相似度相比,计算结果更加准确,使得识别的用户的意图更加正确。
示例性的,假设第一问答对集合中包括3个第一问题,分别为:1、“室内机漏水怎么办”;2、“室内机漏水原因”;3、“室外机阀门漏水是否正常”,那么服务器对第一问题1进行分词、去除停用词处理,得到的分词结果为:“室内机”、“漏水”,对第一问题2进行分词、去除停用词处理,得到的分词结果为:“室内机”、“漏水”、“原因”,对第一问题3进行分词、去除停用词处理,得到的分词结果为:“室外机”、“阀门”、“漏水”、“是否”、“正常”,如表1所示。
表1
然后服务器根据主题与焦点模型,得到的排序后的问句的分词结果为:“漏水”、“空调”,排序后的第一问题1的分词结果为:“漏水”、“室内机”,排序后的第一问题2的分词结果为:“漏水”、“室内机”、“原因”,排序后的第一问题3的分词结果为:“阀门”、“漏水”、“室外机”、“是否”、“正常”,如表2所示。
表2
这样,服务器便可以根据所有排序后的分词结果,生成图5所示的问题树。
结合图5,假设服务器分别采用图6中的A和B所示的切割线对图5的问题树进行切割,那么服务器可以根据主题与焦点模型的规则,计算A中的切割方式对应的描述长度,假设计算得到的描述长度为1,并根据主题与焦点模型的规则,计算B中的切割方式对应的描述长度,假设计算得到的描述长度为3,则服务器可以确定1为最小描述长度,并按照A中的切割方式,确定切割线上方的为主题,切割线下方的为焦点,也就是说,问句的主题为:“漏水”,焦点为:“空调”,第一问题1的主题为:“漏水”,焦点为:“室内机”,第一问题2的主题为:“漏水”,焦点为:“室内机”、“原因”,第一问题3的主题为:“阀门”、“漏水”,焦点为:“室外机”、“是否”、“正常”。
3033、将第一问题中,词向量相似度最大的第一问题确定为目标问题。
进一步的,在本申请实施例中,为了更加精确的对问句进行语义匹配,结合图4,如图7所示,上述步骤3033具体的可以包括以下步骤305-步骤306:
305、将第一问题中,词向量相似度大于第二预设值的第一问题确定为第二问题,得到第二问答对集合。
其中,服务器可以将词向量相似度大于第二预设值的第一问题确定为第二问题,从而得到第二问答对集合,该第二问答对集合中包括至少一个第二问题,以及与每个第二问题对应的答案。
需要说明的是,第二预设值可以与步骤3031中的第一预设值相同,也可以不同,本申请实施例在此不做具体限定。
306、根据编辑距离算法,计算问句与第二问题的距离相似度,并将第二问题中,距离相似度最大的第二问题确定为目标问题。
其中,服务器在得到第二问答对集合之后,可以采用编辑距离算法,计算问句与每个第二问题的距离相似度,并将距离相似度最大的第二问题确定为目标问题。
本申请提供的问答方法,在获取到问句的关键词之后,根据问句的关键词筛选预存的问答对,得到候选问答对集合,并计算问句与候选问题的主题相似度,从主题层面筛选候选问答对集合,从而确定最终的目标问题,并将目标问题对应的答案返回至客户端。这样,在用户的输入方式多样化的情况下,通过两次筛选来对问句进行语义匹配,且由于主题层面的筛选容许很多词汇层面不一致的词,因此与现有技术中采用意图分析方法中的模板进行语义匹配相比,提高了语义匹配的准确性。
上述主要从服务器的角度对本申请实施例提供的方案进行了介绍。可以理解的是,服务器为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的算法步骤,本发明能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
本申请实施例可以根据上述方法示例对服务器进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
在采用对应各个功能划分各个功能模块的情况下,图8示出了上述实施例中涉及的服务器的另一种可能的组成示意图,如图8所示,该服务器可以包括:接收单元41、获取单元42、计算单元43、确定单元44和发送单元45。
其中,接收单元41,用于支持服务器执行图3所示的问答方法中的步骤301所述的接收用户输入的问句。
获取单元42,用于支持服务器执行图3所示的问答方法中的步骤301所述的获取问句的关键词、步骤302。
计算单元43,用于支持服务器执行图3所示的问答方法中的步骤303所述的计算问句与候选问题的主题相似度,图4所示的问答方法中的步骤3032,图7所示的问答方法中的步骤306所述的根据编辑距离算法,计算问句与第二问题的距离相似度。
确定单元44,用于支持服务器执行图3所示的问答方法中的步骤303所述的将至少一个候选问题中,主题相似度最大的候选问题确定为目标问题,图4所示的问答方法中的步骤3031、步骤3033,图7所示的问答方法中的步骤305、步骤306所述的将第二问题中,距离相似度最大的第二问题确定为目标问题。
发送单元45,用于支持服务器执行图3所示的问答方法中的步骤304。
在本申请实施例中,进一步的,如图9所示,服务器还可以包括:处理单元46、排序单元47和生成单元48。
处理单元46,用于支持服务器执行图4所示的问答方法中的对第一问题进行分词、去除停用词处理,以及采用至少一种切割方式切割问题树。
排序单元47,用于支持服务器执行图4所示的问答方法中的根据主题与焦点模型包括的预设规则,对问句和第一问题的分词结果进行排序。
生成单元48,用于支持服务器执行图4所示的问答方法中的根据排序后的问句和第一问题的分词结果,生成问题树。
需要说明的是,上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述,在此不再赘述。
本申请实施例提供的服务器,用于执行上述问答方法,因此可以达到与上述问答方法相同的效果。
在采用集成的单元的情况下,图10示出了上述实施例中所涉及的服务器的另一种可能的组成示意图。如图10所示,该服务器包括:处理模块51和通信模块52。
处理模块51用于对服务器的动作进行控制管理,例如,处理模块51用于支持服务器执行图3中的步骤302、步骤303,图4中的步骤3031、步骤3032、步骤3033,图7中的步骤305、步骤306,和/或用于本文所描述的技术的其它过程。通信模块52用于支持服务器与其他网络实体,如客户端的通信。例如,通信模块52用于支持服务器执行图3中的步骤304。服务器还可以包括存储模块53,用于存储服务器的程序代码和数据。
其中,处理模块51可以是图2中的处理器。其可以实现或执行结合本发明公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等等。通信模块52可以是图2中的通信接口。存储模块53可以是图2中的存储器。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何在本发明揭露的技术范围内的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种问答方法,其特征在于,所述方法包括:
接收用户输入的问句,并获取所述问句的关键词;
根据所述关键词,从预存的问答对中获取候选问答对集合,所述候选问答对集合中包括至少一个候选问题和每个所述候选问题对应的答案;
计算所述问句与所述候选问题的主题相似度,并将所述至少一个候选问题中,所述主题相似度最大的候选问题确定为目标问题;
向客户端返回所述目标问题对应的答案。
2.根据权利要求1所述的方法,其特征在于,所述将所述至少一个候选问题中,所述主题相似度最大的候选问题确定为目标问题,包括:
将所述至少一个候选问题中,所述主题相似度大于第一预设值的候选问题确定为第一问题,得到第一问答对集合;
根据所述问句的主题的词向量和焦点的词向量,以及所述第一问题的主题的词向量和焦点的词向量,计算所述问句与所述第一问题的词向量相似度;
将所述第一问题中,所述词向量相似度最大的第一问题确定为所述目标问题。
3.根据权利要求2所述的方法,其特征在于,所述将所述第一问题中,所述词向量相似度最大的第一问题确定为所述目标问题,包括:
将所述第一问题中,所述词向量相似度大于第二预设值的第一问题确定为第二问题,得到第二问答对集合;
根据编辑距离算法,计算所述问句与所述第二问题的距离相似度,并将所述第二问题中,所述距离相似度最大的第二问题确定为所述目标问题。
4.根据权利要求1所述的方法,其特征在于,所述计算所述问句与所述候选问题的主题相似度,包括:
根据文档主题生成模型LDA生成的主题词,确定所述问句包含主题词的概率,以及所述候选问题包含主题词的概率;
根据所述问句包含主题词的概率和所述候选问题包含主题词的概率,计算所述问句与所述候选问题的主题相似度。
5.根据权利要求2所述的方法,其特征在于,在所述根据所述问句的主题的词向量和焦点的词向量,以及所述第一问题的主题的词向量和焦点的词向量,计算所述问句与所述第一问题的词向量相似度之前,还包括:
对所述第一问题进行分词、去除停用词处理;
根据主题与焦点模型包括的预设规则,对所述问句和所述第一问题的分词结果进行排序;
根据排序后的所述问句和所述第一问题的分词结果,生成问题树;
采用至少一种切割方式切割所述问题树,并计算每种切割方式对应的描述长度,根据最小描述长度对应的切割方式,获取所述问句的主题和焦点,以及所述第一问题的主题和焦点;
根据词向量语言算法,获取所述问句的主题的词向量和焦点的词向量,以及所述第一问题的主题的词向量和焦点的词向量。
6.根据权利要求2所述的方法,其特征在于,所述根据所述问句的主题的词向量和焦点的词向量,以及所述第一问题的主题的词向量和焦点的词向量,计算所述问句与所述第一问题的词向量相似度,包括:
计算所述问句的主题的词向量与所述第一问题的主题的词向量的第一相似度,并计算所述问句的焦点的词向量与所述第一问题的焦点的词向量的第二相似度;
根据所述第一相似度和所述第二相似度,得到所述问句与所述第一问题的词向量相似度。
7.根据权利要求1-6中任一项所述的方法,其特征在于,在所述获取所述问句的关键词之后,还包括:
根据预存的同义词库,确定所述关键词的同义词;
所述根据所述关键词,从预存的问答对中获取候选问答对集合,包括:
根据所述关键词和所述同义词,从所述问答对中获取所述候选问答对集合。
8.一种服务器,其特征在于,所述服务器包括:接收单元、获取单元、计算单元、确定单元和发送单元;
所述接收单元,用于接收用户输入的问句;
所述获取单元,用于获取所述接收单元接收的所述问句的关键词;根据所述关键词,从预存的问答对中获取候选问答对集合,所述候选问答对集合中包括至少一个候选问题和每个所述候选问题对应的答案;
所述计算单元,用于计算所述问句与所述获取单元获取的所述候选问题的主题相似度;
所述确定单元,用于将所述至少一个候选问题中,所述主题相似度最大的候选问题确定为目标问题;
所述发送单元,用于向所述客户端返回所述目标问题对应的答案。
9.根据权利要求8所述的服务器,其特征在于,所述确定单元,具体用于:
将所述至少一个候选问题中,所述主题相似度大于第一预设值的候选问题确定为第一问题,得到第一问答对集合;
根据所述问句的主题的词向量和焦点的词向量,以及所述第一问题的主题的词向量和焦点的词向量,计算所述问句与所述第一问题的词向量相似度;
将所述第一问题中,所述词向量相似度最大的第一问题确定为所述目标问题。
10.根据权利要求9所述的服务器,其特征在于,所述确定单元,具体用于:
将所述第一问题中,所述词向量相似度大于第二预设值的第一问题确定为第二问题,得到第二问答对集合;
根据编辑距离算法,计算所述问句与所述第二问题的距离相似度,并将所述第二问题中,所述距离相似度最大的第二问题确定为所述目标问题。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810367034.2A CN108595619A (zh) | 2018-04-23 | 2018-04-23 | 一种问答方法及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810367034.2A CN108595619A (zh) | 2018-04-23 | 2018-04-23 | 一种问答方法及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108595619A true CN108595619A (zh) | 2018-09-28 |
Family
ID=63614716
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810367034.2A Pending CN108595619A (zh) | 2018-04-23 | 2018-04-23 | 一种问答方法及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108595619A (zh) |
Cited By (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109299476A (zh) * | 2018-11-28 | 2019-02-01 | 北京羽扇智信息科技有限公司 | 问答方法、装置、电子设备及存储介质 |
CN109492222A (zh) * | 2018-10-31 | 2019-03-19 | 平安科技(深圳)有限公司 | 基于概念树的意图识别方法、装置及计算机设备 |
CN109543014A (zh) * | 2018-11-05 | 2019-03-29 | 腾讯科技(深圳)有限公司 | 人机对话方法、装置、终端及服务器 |
CN109582966A (zh) * | 2018-12-03 | 2019-04-05 | 北京容联易通信息技术有限公司 | 一种信息匹配方法及装置 |
CN109710732A (zh) * | 2018-11-19 | 2019-05-03 | 东软集团股份有限公司 | 信息查询方法、装置、存储介质和电子设备 |
CN109710939A (zh) * | 2018-12-28 | 2019-05-03 | 北京百度网讯科技有限公司 | 用于确定主题的方法和装置 |
CN109800286A (zh) * | 2018-12-17 | 2019-05-24 | 北京百度网讯科技有限公司 | 对话生成方法和装置 |
CN109857846A (zh) * | 2019-01-07 | 2019-06-07 | 阿里巴巴集团控股有限公司 | 用户问句与知识点的匹配方法和装置 |
CN109871437A (zh) * | 2018-11-30 | 2019-06-11 | 阿里巴巴集团控股有限公司 | 用于用户问题语句处理的方法及装置 |
CN110134340A (zh) * | 2019-05-23 | 2019-08-16 | 苏州浪潮智能科技有限公司 | 一种元数据更新的方法、装置、设备以及存储介质 |
CN110232920A (zh) * | 2019-06-21 | 2019-09-13 | 百度在线网络技术(北京)有限公司 | 语音处理方法和装置 |
CN110275946A (zh) * | 2019-05-14 | 2019-09-24 | 闽江学院 | 一种faq自动问答方法和装置 |
CN110275937A (zh) * | 2019-05-14 | 2019-09-24 | 闽江学院 | 一种问答机器人的构建方法和装置 |
CN110287295A (zh) * | 2019-05-14 | 2019-09-27 | 闽江学院 | 基于小程序的问答机器人构建方法和系统 |
CN110413761A (zh) * | 2019-08-06 | 2019-11-05 | 浩鲸云计算科技股份有限公司 | 一种基于知识库的领域性单独对话的方法 |
CN110489740A (zh) * | 2019-07-12 | 2019-11-22 | 深圳追一科技有限公司 | 语义解析方法及相关产品 |
CN110489533A (zh) * | 2019-07-09 | 2019-11-22 | 深圳追一科技有限公司 | 人机对话方法及相关设备 |
CN110543553A (zh) * | 2019-07-31 | 2019-12-06 | 平安科技(深圳)有限公司 | 问题生成方法、装置、计算机设备及存储介质 |
CN110647614A (zh) * | 2019-08-01 | 2020-01-03 | 平安科技(深圳)有限公司 | 智能问答方法、装置、介质及电子设备 |
CN110674272A (zh) * | 2019-09-05 | 2020-01-10 | 科大讯飞股份有限公司 | 一种问题答案确定方法及相关装置 |
CN110727764A (zh) * | 2019-10-10 | 2020-01-24 | 珠海格力电器股份有限公司 | 一种话术生成方法、装置及话术生成设备 |
CN110765247A (zh) * | 2019-09-30 | 2020-02-07 | 支付宝(杭州)信息技术有限公司 | 一种用于问答机器人的输入提示方法及装置 |
CN110825863A (zh) * | 2019-11-11 | 2020-02-21 | 腾讯科技(深圳)有限公司 | 一种文本对融合方法及装置 |
CN110851576A (zh) * | 2019-10-16 | 2020-02-28 | 迈达斯智能(深圳)有限公司 | 问答处理方法、装置、设备及可读介质 |
CN110990541A (zh) * | 2018-09-30 | 2020-04-10 | 北京国双科技有限公司 | 一种实现问答的方法及装置 |
CN111046147A (zh) * | 2018-10-11 | 2020-04-21 | 马上消费金融股份有限公司 | 一种问答方法、装置及终端设备 |
CN111125320A (zh) * | 2018-10-31 | 2020-05-08 | 重庆小雨点小额贷款有限公司 | 数据处理方法、装置、服务器及计算机可读存储介质 |
CN111177349A (zh) * | 2019-12-20 | 2020-05-19 | 厦门快商通科技股份有限公司 | 问答匹配方法、装置、设备及存储介质 |
CN111191465A (zh) * | 2018-10-25 | 2020-05-22 | 中国移动通信有限公司研究院 | 一种问答匹配方法、装置、设备及存储介质 |
CN111382263A (zh) * | 2018-12-27 | 2020-07-07 | 阿里巴巴集团控股有限公司 | 数据处理方法、装置和系统 |
CN111428010A (zh) * | 2019-01-10 | 2020-07-17 | 北京京东尚科信息技术有限公司 | 人机智能问答的方法和装置 |
WO2020186458A1 (zh) * | 2019-03-19 | 2020-09-24 | 京东方科技集团股份有限公司 | 问题生成方法和装置、问诊系统、计算机可读存储介质 |
CN111797214A (zh) * | 2020-06-24 | 2020-10-20 | 深圳壹账通智能科技有限公司 | 基于faq数据库的问题筛选方法、装置、计算机设备及介质 |
CN111966788A (zh) * | 2019-12-31 | 2020-11-20 | 北京来也网络科技有限公司 | 结合rpa及ai的对话问答方法、装置、设备及存储介质 |
CN111966808A (zh) * | 2019-12-31 | 2020-11-20 | 北京来也网络科技有限公司 | 结合rpa和ai的对话问答方法、装置、设备及存储介质 |
CN112035631A (zh) * | 2019-12-31 | 2020-12-04 | 北京来也网络科技有限公司 | 结合rpa及ai的对话问答方法、装置、设备及存储介质 |
CN112052326A (zh) * | 2020-09-30 | 2020-12-08 | 民生科技有限责任公司 | 一种基于长短文本匹配的智能问答方法及系统 |
CN112182190A (zh) * | 2020-10-13 | 2021-01-05 | 深圳壹账通智能科技有限公司 | 智能问答方法、装置、电子设备及存储介质 |
CN113268572A (zh) * | 2020-02-14 | 2021-08-17 | 华为技术有限公司 | 问答方法及装置 |
CN113505593A (zh) * | 2021-07-23 | 2021-10-15 | 北京中科凡语科技有限公司 | 相似语句检索方法、装置、电子设备及可读存储介质 |
CN113836276A (zh) * | 2020-06-24 | 2021-12-24 | 北京字节跳动网络技术有限公司 | 实现智能问答的方法和装置 |
CN114003709A (zh) * | 2021-12-30 | 2022-02-01 | 中国电子科技集团公司第二十八研究所 | 一种基于问句匹配的智能问答系统和方法 |
CN114936272A (zh) * | 2021-04-27 | 2022-08-23 | 华为技术有限公司 | 一种问答方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104899188A (zh) * | 2015-03-11 | 2015-09-09 | 浙江大学 | 一种基于问题主题和焦点的问题相似度计算方法 |
CN106649868A (zh) * | 2016-12-30 | 2017-05-10 | 首都师范大学 | 问答匹配方法及装置 |
CN107153689A (zh) * | 2017-04-29 | 2017-09-12 | 安徽富驰信息技术有限公司 | 一种基于主题相似度的案件检索方法 |
-
2018
- 2018-04-23 CN CN201810367034.2A patent/CN108595619A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104899188A (zh) * | 2015-03-11 | 2015-09-09 | 浙江大学 | 一种基于问题主题和焦点的问题相似度计算方法 |
CN106649868A (zh) * | 2016-12-30 | 2017-05-10 | 首都师范大学 | 问答匹配方法及装置 |
CN107153689A (zh) * | 2017-04-29 | 2017-09-12 | 安徽富驰信息技术有限公司 | 一种基于主题相似度的案件检索方法 |
Non-Patent Citations (3)
Title |
---|
朱旺南: "基于本体的自动问答客服系统研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
汤赛丽: "常识知识问答系统中知识库构建的研究与设计", 《中国优秀博硕士学位论文全文数据库 (硕士) 信息科技辑》 * |
熊大平: "社区问答中问句相似度计算和分类技术的研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (62)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110990541A (zh) * | 2018-09-30 | 2020-04-10 | 北京国双科技有限公司 | 一种实现问答的方法及装置 |
CN111046147A (zh) * | 2018-10-11 | 2020-04-21 | 马上消费金融股份有限公司 | 一种问答方法、装置及终端设备 |
CN111191465B (zh) * | 2018-10-25 | 2023-05-09 | 中国移动通信有限公司研究院 | 一种问答匹配方法、装置、设备及存储介质 |
CN111191465A (zh) * | 2018-10-25 | 2020-05-22 | 中国移动通信有限公司研究院 | 一种问答匹配方法、装置、设备及存储介质 |
CN111125320A (zh) * | 2018-10-31 | 2020-05-08 | 重庆小雨点小额贷款有限公司 | 数据处理方法、装置、服务器及计算机可读存储介质 |
CN109492222A (zh) * | 2018-10-31 | 2019-03-19 | 平安科技(深圳)有限公司 | 基于概念树的意图识别方法、装置及计算机设备 |
CN109492222B (zh) * | 2018-10-31 | 2023-04-07 | 平安科技(深圳)有限公司 | 基于概念树的意图识别方法、装置及计算机设备 |
CN109543014A (zh) * | 2018-11-05 | 2019-03-29 | 腾讯科技(深圳)有限公司 | 人机对话方法、装置、终端及服务器 |
CN109543014B (zh) * | 2018-11-05 | 2021-06-15 | 腾讯科技(深圳)有限公司 | 人机对话方法、装置、终端及服务器 |
CN109710732A (zh) * | 2018-11-19 | 2019-05-03 | 东软集团股份有限公司 | 信息查询方法、装置、存储介质和电子设备 |
CN109710732B (zh) * | 2018-11-19 | 2021-03-05 | 东软集团股份有限公司 | 信息查询方法、装置、存储介质和电子设备 |
CN109299476A (zh) * | 2018-11-28 | 2019-02-01 | 北京羽扇智信息科技有限公司 | 问答方法、装置、电子设备及存储介质 |
CN109299476B (zh) * | 2018-11-28 | 2023-04-18 | 出门问问创新科技有限公司 | 问答方法、装置、电子设备及存储介质 |
CN109871437A (zh) * | 2018-11-30 | 2019-06-11 | 阿里巴巴集团控股有限公司 | 用于用户问题语句处理的方法及装置 |
CN109871437B (zh) * | 2018-11-30 | 2023-04-21 | 阿里巴巴集团控股有限公司 | 用于用户问题语句处理的方法及装置 |
CN109582966A (zh) * | 2018-12-03 | 2019-04-05 | 北京容联易通信息技术有限公司 | 一种信息匹配方法及装置 |
CN109800286A (zh) * | 2018-12-17 | 2019-05-24 | 北京百度网讯科技有限公司 | 对话生成方法和装置 |
CN111382263A (zh) * | 2018-12-27 | 2020-07-07 | 阿里巴巴集团控股有限公司 | 数据处理方法、装置和系统 |
CN111382263B (zh) * | 2018-12-27 | 2023-05-02 | 阿里巴巴集团控股有限公司 | 数据处理方法、装置和系统 |
CN109710939A (zh) * | 2018-12-28 | 2019-05-03 | 北京百度网讯科技有限公司 | 用于确定主题的方法和装置 |
CN109710939B (zh) * | 2018-12-28 | 2023-06-09 | 北京百度网讯科技有限公司 | 用于确定主题的方法和装置 |
CN109857846A (zh) * | 2019-01-07 | 2019-06-07 | 阿里巴巴集团控股有限公司 | 用户问句与知识点的匹配方法和装置 |
CN109857846B (zh) * | 2019-01-07 | 2023-06-20 | 创新先进技术有限公司 | 用户问句与知识点的匹配方法和装置 |
CN111428010A (zh) * | 2019-01-10 | 2020-07-17 | 北京京东尚科信息技术有限公司 | 人机智能问答的方法和装置 |
CN111428010B (zh) * | 2019-01-10 | 2024-01-12 | 北京汇钧科技有限公司 | 人机智能问答的方法和装置 |
US11600389B2 (en) | 2019-03-19 | 2023-03-07 | Boe Technology Group Co., Ltd. | Question generating method and apparatus, inquiring diagnosis system, and computer readable storage medium |
WO2020186458A1 (zh) * | 2019-03-19 | 2020-09-24 | 京东方科技集团股份有限公司 | 问题生成方法和装置、问诊系统、计算机可读存储介质 |
CN110287295A (zh) * | 2019-05-14 | 2019-09-27 | 闽江学院 | 基于小程序的问答机器人构建方法和系统 |
CN110275937A (zh) * | 2019-05-14 | 2019-09-24 | 闽江学院 | 一种问答机器人的构建方法和装置 |
CN110275946A (zh) * | 2019-05-14 | 2019-09-24 | 闽江学院 | 一种faq自动问答方法和装置 |
CN110134340B (zh) * | 2019-05-23 | 2020-03-06 | 苏州浪潮智能科技有限公司 | 一种元数据更新的方法、装置、设备以及存储介质 |
CN110134340A (zh) * | 2019-05-23 | 2019-08-16 | 苏州浪潮智能科技有限公司 | 一种元数据更新的方法、装置、设备以及存储介质 |
CN110232920A (zh) * | 2019-06-21 | 2019-09-13 | 百度在线网络技术(北京)有限公司 | 语音处理方法和装置 |
CN110232920B (zh) * | 2019-06-21 | 2021-11-19 | 阿波罗智联(北京)科技有限公司 | 语音处理方法和装置 |
CN110489533A (zh) * | 2019-07-09 | 2019-11-22 | 深圳追一科技有限公司 | 人机对话方法及相关设备 |
CN110489740A (zh) * | 2019-07-12 | 2019-11-22 | 深圳追一科技有限公司 | 语义解析方法及相关产品 |
CN110489740B (zh) * | 2019-07-12 | 2023-10-24 | 深圳追一科技有限公司 | 语义解析方法及相关产品 |
WO2021017300A1 (zh) * | 2019-07-31 | 2021-02-04 | 平安科技(深圳)有限公司 | 问题生成方法、装置、计算机设备及存储介质 |
CN110543553A (zh) * | 2019-07-31 | 2019-12-06 | 平安科技(深圳)有限公司 | 问题生成方法、装置、计算机设备及存储介质 |
CN110647614B (zh) * | 2019-08-01 | 2023-05-23 | 平安科技(深圳)有限公司 | 智能问答方法、装置、介质及电子设备 |
CN110647614A (zh) * | 2019-08-01 | 2020-01-03 | 平安科技(深圳)有限公司 | 智能问答方法、装置、介质及电子设备 |
CN110413761A (zh) * | 2019-08-06 | 2019-11-05 | 浩鲸云计算科技股份有限公司 | 一种基于知识库的领域性单独对话的方法 |
CN110674272A (zh) * | 2019-09-05 | 2020-01-10 | 科大讯飞股份有限公司 | 一种问题答案确定方法及相关装置 |
CN110765247B (zh) * | 2019-09-30 | 2022-10-25 | 支付宝(杭州)信息技术有限公司 | 一种用于问答机器人的输入提示方法及装置 |
CN110765247A (zh) * | 2019-09-30 | 2020-02-07 | 支付宝(杭州)信息技术有限公司 | 一种用于问答机器人的输入提示方法及装置 |
CN110727764A (zh) * | 2019-10-10 | 2020-01-24 | 珠海格力电器股份有限公司 | 一种话术生成方法、装置及话术生成设备 |
CN110851576A (zh) * | 2019-10-16 | 2020-02-28 | 迈达斯智能(深圳)有限公司 | 问答处理方法、装置、设备及可读介质 |
CN110825863A (zh) * | 2019-11-11 | 2020-02-21 | 腾讯科技(深圳)有限公司 | 一种文本对融合方法及装置 |
CN111177349B (zh) * | 2019-12-20 | 2022-05-17 | 厦门快商通科技股份有限公司 | 问答匹配方法、装置、设备及存储介质 |
CN111177349A (zh) * | 2019-12-20 | 2020-05-19 | 厦门快商通科技股份有限公司 | 问答匹配方法、装置、设备及存储介质 |
CN112035631A (zh) * | 2019-12-31 | 2020-12-04 | 北京来也网络科技有限公司 | 结合rpa及ai的对话问答方法、装置、设备及存储介质 |
CN111966788A (zh) * | 2019-12-31 | 2020-11-20 | 北京来也网络科技有限公司 | 结合rpa及ai的对话问答方法、装置、设备及存储介质 |
CN111966808A (zh) * | 2019-12-31 | 2020-11-20 | 北京来也网络科技有限公司 | 结合rpa和ai的对话问答方法、装置、设备及存储介质 |
CN113268572A (zh) * | 2020-02-14 | 2021-08-17 | 华为技术有限公司 | 问答方法及装置 |
CN113836276A (zh) * | 2020-06-24 | 2021-12-24 | 北京字节跳动网络技术有限公司 | 实现智能问答的方法和装置 |
CN111797214A (zh) * | 2020-06-24 | 2020-10-20 | 深圳壹账通智能科技有限公司 | 基于faq数据库的问题筛选方法、装置、计算机设备及介质 |
CN112052326A (zh) * | 2020-09-30 | 2020-12-08 | 民生科技有限责任公司 | 一种基于长短文本匹配的智能问答方法及系统 |
CN112182190A (zh) * | 2020-10-13 | 2021-01-05 | 深圳壹账通智能科技有限公司 | 智能问答方法、装置、电子设备及存储介质 |
CN114936272A (zh) * | 2021-04-27 | 2022-08-23 | 华为技术有限公司 | 一种问答方法及系统 |
CN113505593A (zh) * | 2021-07-23 | 2021-10-15 | 北京中科凡语科技有限公司 | 相似语句检索方法、装置、电子设备及可读存储介质 |
CN113505593B (zh) * | 2021-07-23 | 2024-03-29 | 北京中科凡语科技有限公司 | 相似语句检索方法、装置、电子设备及可读存储介质 |
CN114003709A (zh) * | 2021-12-30 | 2022-02-01 | 中国电子科技集团公司第二十八研究所 | 一种基于问句匹配的智能问答系统和方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108595619A (zh) | 一种问答方法及设备 | |
CN109408811B (zh) | 一种数据处理方法及服务器 | |
JP7153004B2 (ja) | コミュニティ質問応答データの検証方法、装置、コンピュータ機器、及び記憶媒体 | |
CN108334490A (zh) | 关键词提取方法以及关键词提取装置 | |
JP6756079B2 (ja) | 人工知能に基づく三元組チェック方法、装置及びコンピュータプログラム | |
CN105550206B (zh) | 结构化查询语句的版本控制方法及装置 | |
CN110413738A (zh) | 一种信息处理方法、装置、服务器及存储介质 | |
US11023625B2 (en) | Computational accelerator architecture for change control in model-based system engineering | |
CN111563218B (zh) | 一种页面的修复方法及装置 | |
CN110874528A (zh) | 文本相似度的获取方法及装置 | |
US10922446B2 (en) | Computational accelerator for determination of linkages across disparate works in model-based system engineering | |
CN112417846A (zh) | 文本自动化生成方法、装置、电子设备及存储介质 | |
CN114020892A (zh) | 基于人工智能的答案选取方法、装置、电子设备及介质 | |
CN114050974A (zh) | 一种拓扑准确度的确定方法、装置及计算机可读存储介质 | |
CN112600936A (zh) | 一种云计算系统服务的量化和评估方法 | |
CN114896269A (zh) | 结构化查询语句检测方法、装置、电子设备及存储介质 | |
US11755633B2 (en) | Entity search system | |
CN114757299A (zh) | 文本相似度判断方法、装置及存储介质 | |
CN111144098B (zh) | 扩展问句的召回方法和装置 | |
CN114490390A (zh) | 测试数据生成方法、装置、设备及存储介质 | |
JP7044448B2 (ja) | 領域特化型字句解析 | |
CN112579710A (zh) | 数据仓库管理方法、装置、电子设备及存储介质 | |
CN111259126A (zh) | 基于词语特征的相似度计算方法、装置、设备及存储介质 | |
Ma et al. | Semantic restful service composition using task specification | |
CN112015957A (zh) | 基于es的数据查询方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180928 |
|
RJ01 | Rejection of invention patent application after publication |