CN111666482B - 查询方法及装置、存储介质和处理器 - Google Patents
查询方法及装置、存储介质和处理器 Download PDFInfo
- Publication number
- CN111666482B CN111666482B CN201910168526.3A CN201910168526A CN111666482B CN 111666482 B CN111666482 B CN 111666482B CN 201910168526 A CN201910168526 A CN 201910168526A CN 111666482 B CN111666482 B CN 111666482B
- Authority
- CN
- China
- Prior art keywords
- matrix
- vector
- convolution
- statement
- feature matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 239000011159 matrix material Substances 0.000 claims abstract description 283
- 239000013598 vector Substances 0.000 claims abstract description 219
- 238000012545 processing Methods 0.000 claims abstract description 47
- 238000011176 pooling Methods 0.000 claims description 23
- 230000009467 reduction Effects 0.000 claims description 13
- 238000001914 filtration Methods 0.000 claims description 4
- 230000011218 segmentation Effects 0.000 abstract description 12
- 230000008569 process Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000004378 air conditioning Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种查询方法及装置、存储介质和处理器。其中,该方法包括:获取第一语句的第一向量矩阵,以及第二语句的第二向量矩阵,其中,第一向量矩阵包括第一语句的字向量,第二向量矩阵包括第二语句的字向量;对第一向量矩阵和第二向量矩阵中的字向量分别进行卷积处理,得到第一语句的第一卷积特征矩阵和第二语句的第二卷积特征矩阵;基于第一卷积特征矩阵和第二卷积特征矩阵确定第一语句和第二语句的相似度;基于相似度确定是否将第二语句对应的查询结果作为第一语句的查询结果。本申请解决了相关技术中在对问题语句进行识别时受限于分词的识别方式,不能提供更精确的识别结果的技术问题。
Description
技术领域
本申请涉及智能问答领域,具体而言,涉及一种查询方法及装置、存储介质和处理器。
背景技术
相关技术中,搜索引擎从全文搜索逐渐向精准搜索转变,对于开放域的问答系统较多,例如可以采用模板映射意图(predicate)的方法,寻找用户问题与答案之间的中间映射关系。从而在知识库(Knowledge Base,简称为KB)中寻找到答案的模型,该方法的关键在于用户问题中实体元素的识别,但是对于实体元素的识别往往需要对问题进行切词处理,因此,相关技术中对问题语句的识别方式受限于分词的识别方式,识别结果不够精确。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种查询方法及装置、存储介质和处理器,以至少解决相关技术中在对问题语句进行识别时受限于分词的识别方式,不能提供更精确的识别结果的技术问题。
根据本申请实施例的一个方面,提供了一种查询方法,包括:获取第一语句的第一向量矩阵,以及第二语句的第二向量矩阵,其中,第一向量矩阵包括第一语句的字向量,第二向量矩阵包括第二语句的字向量;对第一向量矩阵和第二向量矩阵中的字向量分别进行卷积处理,得到第一语句的第一卷积特征矩阵和第二语句的第二卷积特征矩阵;基于第一卷积特征矩阵和第二卷积特征矩阵确定第一语句和第二语句的相似度;基于相似度确定是否将第二语句对应的查询结果作为第一语句的查询结果。
可选地,基于第一卷积特征矩阵和第二卷积特征矩阵确定第一语句和第二语句的相似度,包括:获取第一卷积特征矩阵中的向量和第二卷积特征矩阵中的向量之间的相关度指标,其中,该相关度指标用于量化第一卷积特征矩阵中特征向量和第二卷积特征矩阵中特征向量的关联程度;采用相关度指标分别对第一卷积特征矩阵和第二卷积特征矩阵进行池化处理,得到第一目标向量矩阵和第二目标向量矩阵;计算第一目标向量矩阵和第二目标向量矩阵之间的相似度,将第一目标向量矩阵和第二目标向量矩阵之间的相似度作为第一语句和第二语句之间的相似度。
可选地,获取第一卷积特征矩阵中的向量和第二卷积特征矩阵中的向量之间的相关度指标,包括:获取第一卷积特征矩阵中的向量和第二卷积特征矩阵中的向量之间的皮尔森(pearson)相关系数,将该皮尔森相关系数作为相关度指标。
可选地,基于第一卷积特征矩阵和第二卷积特征矩阵确定第一语句和第二语句的相似度之前,方法还包括:对第一卷积特征矩阵和第二卷积特征矩阵进行以下至少之一调整:行数、列数和维数。
可选地,采用相关度指标分别对第一卷积特征矩阵和第二卷积特征矩阵进行池化处理,得到第一目标向量矩阵和第二目标向量矩阵,包括:采用相关度指标分别对第一卷积特征矩阵和第二卷积特征矩阵进行降维处理;对降维处理后的第一卷积特征矩阵和第二卷积特征矩阵进行最大池化处理,得到第一目标向量矩阵和第二目标向量矩阵。
可选地,采用相关度指标分别对第一卷积特征矩阵和第二卷积特征矩阵进行降维处理,包括:确定第一卷积特征矩阵和第二卷积特征矩阵中相关度指标低于第一阈值的特征向量;从第一卷积特征矩阵和第二卷积特征矩阵中滤除相关度指标低于第一阈值的特征向量;并对滤除相关度指标低于第一阈值的特征向量后的第一卷积矩阵和第二卷积矩阵进行池化处理。
可选地,对第一向量矩阵和第二向量矩阵中的字向量分别进行卷积处理,包括:确定对第一向量矩阵和第二向量矩阵进行卷积处理的卷积核尺寸;采用卷积核尺寸的卷积核对第一向量矩阵和第二向量矩阵进行卷积处理。
可选地,基于相似度确定是否将第二语句对应的查询结果作为第一语句的查询结果,包括:在相似度大于第二阈值时,确定将第二语句对应的查询结果作为第一语句的查询结果;在相似度小于第二阈值时,拒绝将第二语句对应的查询结果作为第一语句的查询结果。
根据本申请实施例的另一个方面,提供了一种查询装置,包括:获取模块,用于获取第一语句的第一向量矩阵,以及第二语句的第二向量矩阵,其中,第一向量矩阵包括第一语句的字向量,第二向量矩阵包括第二语句的字向量;卷积模块,用于对第一向量矩阵和第二向量矩阵中的字向量分别进行卷积处理,得到第一语句的第一卷积特征矩阵和第二语句的第二卷积特征矩阵;第一确定模块,用于基于第一卷积特征矩阵和第二卷积特征矩阵确定第一语句和第二语句的相似度;第二确定模块,用于基于相似度确定是否将第二语句对应的查询结果作为第一语句的查询结果。
可选地,第一确定模块,用于获取第一卷积特征矩阵中的向量和第二卷积特征矩阵中的向量之间的相关度指标,其中,该相关度指标用于量化第一卷积特征矩阵中特征向量和第二卷积特征矩阵中特征向量的关联程度;采用相关度指标分别对第一卷积特征矩阵和第二卷积特征矩阵进行池化处理,得到第一目标向量矩阵和第二目标向量矩阵;以及计算第一目标向量矩阵和第二目标向量矩阵之间的相似度,将第一目标向量矩阵和第二目标向量矩阵之间的相似度作为第一语句和第二语句之间的相似度。
根据本申请实施例的再一个方面,提供了一种存储介质,存储介质包括存储的程序,其中,程序运行时控制存储介质所在的设备执行以上的查询方法。
根据本申请实施例的又一个方面,提供了一种处理器,处理器用于运行程序,其中,程序运行时执行以上的查询方法。
在本申请实施例中,利用第一语句和第二语句的字向量进行卷积,得到卷积特征矩阵,并利用卷积特征之间的相似度确定是否将第二语句的查询结果作为第一语句的查询结果,由于采用直接对语句的字向量进行处理,从而得到相应的查询结果的方式代替了对语句进行切词处理的方式,因此,解决了相关技术中在对问题语句进行识别时受限于分词的识别方式,不能提供更精确的识别结果的技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种查询方法的流程示意图;
图2是根据本申请实施例的一种可选的的查询方法的流程示意图;
图3是根据本申请实施例的一种可选的的注意力(attention)机制的流程示意图;
图4是根据本申请实施例的一种查询装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了更好地理解上述实施例,以下将本申请实施例中所涉及的技术术语解释如下:
Pearson相关系数:(Pearson Correlation Coefficient)是用来衡量两个数据集合是否在一条线上面,它用来衡量定距变量间的线性关系。
最大池化处理:在描述一个大的图像时,可以对不同位置的特征进行聚合统计(例如:可以计算图像一个区域上的某个特定特征的平均值或最大值),这种聚合统计的操作称为池化,其中,在某一区域中特定特征的最大值的池化操作称为最大池化处理。
Attention机制:通过保留LSTM编码器对输入序列的中间输出结果,然后训练一个模型来对这些输入进行选择性的学习并且在模型输出时将输出序列与之进行关联。
相关技术中,在对语句进行识别时,往往需要对语句进行切词(或分词)处理,这样,识别结果便会受限于切词的具体实现方式,这样便导致识别结果不是很准确,影响其在特定领域的应用,例如在开放域问答领域,在得到用户输入的问句时,需要和候选语句进行匹配,此时,如果采用切换的实现方式,则如果实现方式使用不当会造成识别结果不准确,从而影响最终的查询结果。
为解决上述问题,本申请构建了基于attention卷积网络问答方案,在该方案中,直接利用字向量,避免了进行切词的导致的问题,利用pearson词向量矩阵对每个卷积特征做attention(由于短句的语义往往在一到两个短语中体现,所以做attention相当于对短语做attention),利用attention之后的向量求句子相似度,来寻找匹配问答。
具体地,本申请实施例通过大量的相关语料以及问答对数据,运用word2vec对字进行训练,得到待查询语句的字向量,基于得到的字向量确定待查询语句对应的向量矩阵,然后分别用不同尺寸(size)的卷积核(filter),对待查询语句和候选语句分别做卷积处理,得到特征图(feature map),形成多维度的特征向量;此时还没有两个句子的相关度信息,因此需要利用两个句子的卷积矩阵中的卷积特征两两计算pearson相关系数,得到pearson矩阵,然后求得每一个卷积特征的pearson综合得分,该pearson综合得分用于指示待查询语句对应的卷积特征与候选语句中卷积特征的关联程度。最后对attention之后的特征进行max_pooling处理,并计算池化后的相似度,从而得到两个语句的匹配相似度。基于该匹配相似度确定是否将候选语句对应的查询结果(例如在语句为问题语句时,该查询结果为答案)作为待查询语句的查询结果,从而能够提高匹配精度。
基于上述原理,根据本申请实施例,提供了一种查询方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本申请实施例的一种查询方法的流程示意图,如图1所示,该方法包括如下步骤:
步骤S102,获取第一语句的第一向量矩阵,以及第二语句的第二向量矩阵,其中,第一向量矩阵包括第一语句的字向量,第二向量矩阵包括第二语句的字向量;
在本申请的一些实施例中,可以采用word2vec工具得到上述第一语句和第二语句的字向量,但不限于此。
步骤S104,对第一向量矩阵和第二向量矩阵中的字向量分别进行卷积处理,得到第一语句的第一卷积特征矩阵和第二语句的第二卷积特征矩阵;
在进行卷积处理时,可以先确定对第一向量矩阵和第二向量矩阵进行卷积处理的卷积核尺寸;采用卷积核尺寸的卷积核对第一向量矩阵和第二向量矩阵进行卷积处理。
例如:一般filter_size可以设置为1,2,3,在1500000单词语料库中,约有25%个三元组没有出现,说明短语语句中的跨度表达语句含义一般也在3个左右。获取卷积特征之后,得到可以理解为不同短语的卷积特征。
步骤S106,基于第一卷积特征矩阵和第二卷积特征矩阵确定第一语句和第二语句的相似度;
在本申请的一些实施例中,可以通过以下方式确定第一语句和第二语句的相似度,但不限于此:获取第一卷积特征矩阵中的向量和第二卷积特征矩阵中的向量之间的相关度指标,其中,该相关度指标用于量化第一卷积特征矩阵中特征向量和第二卷积特征矩阵中特征向量的关联程度;采用相关度指标分别对第一卷积特征矩阵和第二卷积特征矩阵进行池化处理,得到第一目标向量矩阵和第二目标向量矩阵;计算第一目标向量矩阵和第二目标向量矩阵之间的相似度,将第一目标向量矩阵和第二目标向量矩阵之间的相似度作为第一语句和第二语句之间的相似度。
其中,为了体现卷积特征个体之间的关系,可以使用pearson相关系数确定相关度指标,即:获取第一卷积特征矩阵中的向量和第二卷积特征矩阵中的向量之间的皮尔森相关系数,将该皮尔森相关系数作为相关度指标。
为保证匹配效果,在基于第一卷积特征矩阵和第二卷积特征矩阵确定第一语句和第二语句的相似度之前,还需要对卷积特征矩阵进行reshape处理,例如:对第一卷积特征矩阵和第二卷积特征矩阵进行以下至少之一调整:行数、列数和维数。其中,reshape处理是采用reshape函数对矩阵进行处理,reshape函数可以用于调整矩阵的行数、列数和维数。
其中,采用相关度指标分别对第一卷积特征矩阵和第二卷积特征矩阵进行池化处理,可以采用以下方式,例如:采用相关度指标分别对第一卷积特征矩阵和第二卷积特征矩阵进行降维处理;对降维处理后的第一卷积特征矩阵和第二卷积特征矩阵进行最大池化处理,得到第一目标向量矩阵和第二目标向量矩阵。
在对第一卷积特征矩阵和第二卷积特征矩阵进行降维处理时,可以采用多种方式进行降维处理,例如,可以采用每个卷积矩阵中相关度指标相对较大的预设数量个卷积特征作为有效特征,滤除相对较小的卷积特征;也可以采用以下方式:确定第一卷积特征矩阵和第二卷积特征矩阵中相关度指标低于第一阈值的特征向量;从第一卷积特征矩阵和第二卷积特征矩阵中滤除相关度指标低于第一阈值的特征向量;并对滤除相关度指标低于第一阈值的特征向量后的第一卷积矩阵和第二卷积矩阵进行池化处理。
步骤S108,基于相似度确定是否将第二语句对应的查询结果作为第一语句的查询结果。
在本申请的一些实施例中,在相似度大于第二阈值时,确定将第二语句对应的查询结果作为第一语句的查询结果;在相似度小于第二阈值时,拒绝将第二语句对应的查询结果作为第一语句的查询结果。
为更好地理解本申请实施例,以下结合空调领域的问答进行详细说明,如图2所示,该问答流程的实现方式如下:
101:输入待匹配语句sentence1(即实际句子1),例如:“为什么380V电压的柜机不配遥控器?”);
102:输入候选匹配语句sentence2(即实际句子2),例如为了进行语义比较,可以设置有正例:“买的380电压柜机没有遥控机,怎么回事”和负例:“柜机遥控器没有电池”;
103:根据用户输入的短问句,触发根据训练好的字向量M矩阵对句子1和句子2进行向量化处理(feed_vec),得到数值型矩阵句子字向量1,(例如:“为什么380V电压的柜机不配遥控器?”等价于[[0.23,0.56,...,-0.21],...,[0.21,0.32,0.54]])以及句子字向量2(例:“买的380电压柜机没有遥控机,怎么回事”等价于[[0.32,...,-0.54],...,[0.25,...,-0.87]],“柜机遥控器没有电池”等价于[[-0.21,0.25,...,0.98],...,[0.21,0.65,...,0.98]]),作为最终的模型输入向量(embedding)。
进一步地,把训练的feed字向量作为整个字向量的初始化向量,然后采用实际训练进行重新训练过程;
106:根据反馈(feed)的句子字向量,采用不同filter_size的卷积核(即图中的size1)获取不同的卷积特征,其中,卷积特征以及卷积核的深度由实际训练最终确定;
可选地,一般filter_size设置为1,2,3即可,由于短语语句中的跨度表达语句含义一般在3个左右。获取卷积特征之后,可以理解为得到不同短语的卷积特征,执行步骤107;
107:根据不同卷积得到卷积的特征图(map),即卷积特征,重新整理矩阵得到卷积特征矩阵,得到句子语义向量1和句子语义向量2,其中,句子语义向量1和句子语义向量2均为语义向量矩阵,然后执行步骤108;
需要说明的是,107中的过程是对106输出矩阵做了重整形(reshape)处理,以方便108步骤的卷积特征的对应关系;
在得到句子语义向量后,可以对句子语义向量1和2采用attention机制进行处理,具体在后续步骤中详细说明,此处不再赘述。
108:将107获取的整理结果,即对整理后的矩阵中的卷积特征,分别一一对应求解pearson相关系数,从而求得pearson相关矩阵(例:句子1“为什么380V电压的柜机不配遥控器?”与候选句子2“买的380电压柜机没有遥控机,怎么回事”的矩阵以及句子1“为什么380V电压的柜机不配遥控器?”与句子3“柜机遥控器没有电池”的矩阵);执行步骤109;
由于采用余弦相似度不能体现两个句子不相似的表现形式,因此最终求得每一个卷积特征对应的pearson相关系数,该pearson相关系数为此卷积特征对应另一组卷积特征的影响,如果采用相似度那么就偏向相似的语句匹配,容易误导不相似的语句对判断,而pearson相关系数有正负相关,能够很好地表示卷积特征之间的关系,所以很好的表示了特征之间的关系。
109:根据108获取的结果链接107的结果,根据max_pooling获取最后的句子表示(例句子1“为什么380V电压的柜机不配遥控器?”等价于[0.21,0.32,...,0.87],句子2“买的380电压柜机没有遥控机,怎么回事”等价于[0.14,0.30,...,0.75],句子3“柜机遥控器没有电池”等价[-0.21,0.21,...,0.21]);即对107的结果进行池化处理,执行步骤110;
110:采用余弦相似度计算方式获取最终两个句子对的相似度(例:句子1“为什么380V电压的柜机不配遥控器?”与句子2“买的380电压柜机没有遥控机,怎么回事”之间的余弦相似度为0.87,句子1“为什么380V电压的柜机不配遥控器?”与句子3“柜机遥控器没有电池”相似度为0.42);其中,余弦相似度(即图中的Cos数值)计算方式通过计算两个向量的夹角余弦值评估两个向量的相似度。
如图3所示,为了体现句子之间的交互信息,得到比较突出的特征,因此,采用pearson相关系数,来表示向量空间特征关系,图3中每一个空白框代表两个向量代表的pearson系数,即pearson矩阵;
本申请实施例还还提供了一种查询装置,用于实现图1所示方法,如图4所示,该装置包括:获取模块40,用于获取第一语句的第一向量矩阵,以及第二语句的第二向量矩阵,其中,第一向量矩阵包括第一语句的字向量,第二向量矩阵包括第二语句的字向量;卷积模块42,用于对第一向量矩阵和第二向量矩阵中的字向量分别进行卷积处理,得到第一语句的第一卷积特征矩阵和第二语句的第二卷积特征矩阵;第一确定模块44,用于基于第一卷积特征矩阵和第二卷积特征矩阵确定第一语句和第二语句的相似度;第二确定模块46,用于基于相似度确定是否将第二语句对应的查询结果作为第一语句的查询结果。
可选地,第一确定模块44,用于获取第一卷积特征矩阵中的向量和第二卷积特征矩阵中的向量之间的相关度指标,其中,该相关度指标用于量化第一卷积特征矩阵中特征向量和第二卷积特征矩阵中特征向量的关联程度;采用相关度指标分别对第一卷积特征矩阵和第二卷积特征矩阵进行池化处理,得到第一目标向量矩阵和第二目标向量矩阵;以及计算第一目标向量矩阵和第二目标向量矩阵之间的相似度,将第一目标向量矩阵和第二目标向量矩阵之间的相似度作为第一语句和第二语句之间的相似度。
需要说明的是,图4所示实施例的优选实施方式可以参见图1所示实施例的相关描述,此处不再赘述。
根据本申请实施例的再一个方面,还提供了一种存储介质,存储介质包括存储的程序,其中,程序运行时控制存储介质所在的设备执行以上的查询方法。可选地,上述程序运行时上述设备执行以下功能:获取第一语句的第一向量矩阵,以及第二语句的第二向量矩阵,其中,第一向量矩阵包括第一语句的字向量,第二向量矩阵包括第二语句的字向量;对第一向量矩阵和第二向量矩阵中的字向量分别进行卷积处理,得到第一语句的第一卷积特征矩阵和第二语句的第二卷积特征矩阵;基于第一卷积特征矩阵和第二卷积特征矩阵确定第一语句和第二语句的相似度;基于相似度确定是否将第二语句对应的查询结果作为第一语句的查询结果。
根据本申请实施例的又一个方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行以上的查询方法。
可选地,上述程序运行时执行以下功能:获取第一语句的第一向量矩阵,以及第二语句的第二向量矩阵,其中,第一向量矩阵包括第一语句的字向量,第二向量矩阵包括第二语句的字向量;对第一向量矩阵和第二向量矩阵中的字向量分别进行卷积处理,得到第一语句的第一卷积特征矩阵和第二语句的第二卷积特征矩阵;基于第一卷积特征矩阵和第二卷积特征矩阵确定第一语句和第二语句的相似度;基于相似度确定是否将第二语句对应的查询结果作为第一语句的查询结果。
在本申请实施例中,利用第一语句和第二语句的字向量进行卷积,得到卷积特征矩阵,并利用卷积特征之间的相似度确定是否将第二语句的查询结果作为第一语句的查询结果,由于采用直接对语句的字向量进行处理,从而得到相应的查询结果的方式代替了对语句进行切词处理的方式,因此,解决了相关技术中在对问题语句进行识别时受限于分词的识别方式,不能提供更精确的识别结果的技术问题。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种查询方法,其特征在于,包括:
获取第一语句的第一向量矩阵,以及第二语句的第二向量矩阵,其中,所述第一向量矩阵包括所述第一语句的字向量,所述第二向量矩阵包括所述第二语句的字向量;
对所述第一向量矩阵和第二向量矩阵中的字向量分别进行卷积处理,得到所述第一语句的第一卷积特征矩阵和所述第二语句的第二卷积特征矩阵;
基于所述第一卷积特征矩阵和所述第二卷积特征矩阵确定所述第一语句和所述第二语句的相似度;
基于所述相似度确定是否将所述第二语句对应的查询结果作为所述第一语句的查询结果;
采用相关度指标分别对所述第一卷积特征矩阵和所述第二卷积特征矩阵进行池化处理,得到第一目标向量矩阵和第二目标向量矩阵,包括:采用所述相关度指标分别对所述第一卷积特征矩阵和所述第二卷积特征矩阵进行降维处理;对降维处理后的第一卷积特征矩阵和所述第二卷积特征矩阵进行最大池化处理,得到第一目标向量矩阵和第二目标向量矩阵,其中,所述相关度指标用于量化所述第一卷积特征矩阵中特征向量和所述第二卷积特征矩阵中特征向量的关联程度;
采用所述相关度指标分别对所述第一卷积特征矩阵和所述第二卷积特征矩阵进行降维处理,包括:确定所述第一卷积特征矩阵和第二卷积特征矩阵中相关度指标低于第一阈值的特征向量;从所述第一卷积特征矩阵和第二卷积特征矩阵中滤除相关度指标低于第一阈值的特征向量;并对滤除相关度指标低于第一阈值的特征向量后的第一卷积矩阵和第二卷积矩阵进行池化处理。
2.根据权利要求1所述的方法,其特征在于,基于所述第一卷积特征矩阵和所述第二卷积特征矩阵确定所述第一语句和所述第二语句的相似度,包括:
获取所述第一卷积特征矩阵中的向量和所述第二卷积特征矩阵中的向量之间的相关度指标;
采用所述相关度指标分别对所述第一卷积特征矩阵和所述第二卷积特征矩阵进行池化处理,得到第一目标向量矩阵和第二目标向量矩阵;
计算所述第一目标向量矩阵和第二目标向量矩阵之间的相似度,将所述第一目标向量矩阵和第二目标向量矩阵之间的相似度作为所述第一语句和所述第二语句之间的相似度。
3.根据权利要求2所述的方法,其特征在于,获取所述第一卷积特征矩阵中的向量和所述第二卷积特征矩阵中的向量之间的相关度指标,包括:
获取所述第一卷积特征矩阵中的向量和所述第二卷积特征矩阵中的向量之间的皮尔森相关系数,将所述皮尔森相关系数作为所述相关度指标。
4.根据权利要求2所述的方法,其特征在于,基于所述第一卷积特征矩阵和所述第二卷积特征矩阵确定所述第一语句和所述第二语句的相似度之前,所述方法还包括:
对所述第一卷积特征矩阵和所述第二卷积特征矩阵进行以下至少之一调整:行数、列数和维数。
5.根据权利要求1所述的方法,其特征在于,对所述第一向量矩阵和第二向量矩阵中的字向量分别进行卷积处理,包括:
确定对所述第一向量矩阵和所述第二向量矩阵进行卷积处理的卷积核尺寸;
采用所述卷积核尺寸的卷积核对所述第一向量矩阵和所述第二向量矩阵进行卷积处理。
6.根据权利要求1至5中任意一项所述的方法,其特征在于,基于所述相似度确定是否将所述第二语句对应的查询结果作为所述第一语句的查询结果,包括:
在所述相似度大于第二阈值时,确定将所述第二语句对应的查询结果作为所述第一语句的查询结果;在所述相似度小于第二阈值时,拒绝将所述第二语句对应的查询结果作为所述第一语句的查询结果。
7.一种查询装置,其特征在于,包括:
获取模块,用于获取第一语句的第一向量矩阵,以及第二语句的第二向量矩阵,其中,所述第一向量矩阵包括所述第一语句的字向量,所述第二向量矩阵包括所述第二语句的字向量;
卷积模块,用于对所述第一向量矩阵和第二向量矩阵中的字向量分别进行卷积处理,得到所述第一语句的第一卷积特征矩阵和所述第二语句的第二卷积特征矩阵;
第一确定模块,用于基于所述第一卷积特征矩阵和所述第二卷积特征矩阵确定所述第一语句和所述第二语句的相似度;
第二确定模块,用于基于所述相似度确定是否将所述第二语句对应的查询结果作为所述第一语句的查询结果;
所述第一确定模块还用于采用所述相关度指标分别对所述第一卷积特征矩阵和所述第二卷积特征矩阵进行降维处理;对降维处理后的第一卷积特征矩阵和所述第二卷积特征矩阵进行最大池化处理,得到第一目标向量矩阵和第二目标向量矩阵,其中,所述相关度指标用于量化所述第一卷积特征矩阵中特征向量和所述第二卷积特征矩阵中特征向量的关联程度;
所述第一确定模块还用于确定所述第一卷积特征矩阵和第二卷积特征矩阵中相关度指标低于第一阈值的特征向量;从所述第一卷积特征矩阵和第二卷积特征矩阵中滤除相关度指标低于第一阈值的特征向量;并对滤除相关度指标低于第一阈值的特征向量后的第一卷积矩阵和第二卷积矩阵进行池化处理。
8.根据权利要求7所述的装置,其特征在于,所述第一确定模块,用于获取所述第一卷积特征矩阵中的向量和所述第二卷积特征矩阵中的向量之间的相关度指标,其中,所述相关度指标用于量化所述第一卷积特征矩阵中特征向量和所述第二卷积特征矩阵中特征向量的关联程度;采用所述相关度指标分别对所述第一卷积特征矩阵和所述第二卷积特征矩阵进行池化处理,得到第一目标向量矩阵和第二目标向量矩阵;以及计算所述第一目标向量矩阵和第二目标向量矩阵之间的相似度,将所述第一目标向量矩阵和第二目标向量矩阵之间的相似度作为所述第一语句和所述第二语句之间的相似度。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序运行时控制存储介质所在的设备执行权利要求1至6中任意一项所述的查询方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至6中任意一项所述的查询方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910168526.3A CN111666482B (zh) | 2019-03-06 | 2019-03-06 | 查询方法及装置、存储介质和处理器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910168526.3A CN111666482B (zh) | 2019-03-06 | 2019-03-06 | 查询方法及装置、存储介质和处理器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111666482A CN111666482A (zh) | 2020-09-15 |
CN111666482B true CN111666482B (zh) | 2022-08-02 |
Family
ID=72381318
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910168526.3A Active CN111666482B (zh) | 2019-03-06 | 2019-03-06 | 查询方法及装置、存储介质和处理器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111666482B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112101236A (zh) * | 2020-09-17 | 2020-12-18 | 济南大学 | 一种面向老年陪护机器人的智能纠错方法及系统 |
CN112397048B (zh) * | 2020-12-10 | 2023-07-14 | 标贝(北京)科技有限公司 | 语音合成的发音稳定性评价方法、装置和系统及存储介质 |
CN112800183B (zh) * | 2021-02-25 | 2023-09-26 | 国网河北省电力有限公司电力科学研究院 | 内容名称数据处理方法及终端设备 |
CN116340365B (zh) * | 2023-05-17 | 2023-09-08 | 北京创新乐知网络技术有限公司 | 一种缓存数据的匹配方法、匹配装置及终端设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105279552A (zh) * | 2014-06-18 | 2016-01-27 | 清华大学 | 一种基于字的神经网络的训练方法和装置 |
CN106156003A (zh) * | 2016-06-30 | 2016-11-23 | 北京大学 | 一种问答系统中的问句理解方法 |
CN107832326A (zh) * | 2017-09-18 | 2018-03-23 | 北京大学 | 一种基于深层卷积神经网络的自然语言问答方法 |
CN108021555A (zh) * | 2017-11-21 | 2018-05-11 | 浪潮金融信息技术有限公司 | 一种基于深度卷积神经网络的问句相似度度量方法 |
WO2018153217A1 (zh) * | 2017-02-27 | 2018-08-30 | 芋头科技(杭州)有限公司 | 一种句子相似度判断方法 |
CN109145290A (zh) * | 2018-07-25 | 2019-01-04 | 东北大学 | 基于字向量与自注意力机制的语义相似度计算方法 |
-
2019
- 2019-03-06 CN CN201910168526.3A patent/CN111666482B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105279552A (zh) * | 2014-06-18 | 2016-01-27 | 清华大学 | 一种基于字的神经网络的训练方法和装置 |
CN106156003A (zh) * | 2016-06-30 | 2016-11-23 | 北京大学 | 一种问答系统中的问句理解方法 |
WO2018153217A1 (zh) * | 2017-02-27 | 2018-08-30 | 芋头科技(杭州)有限公司 | 一种句子相似度判断方法 |
CN107832326A (zh) * | 2017-09-18 | 2018-03-23 | 北京大学 | 一种基于深层卷积神经网络的自然语言问答方法 |
CN108021555A (zh) * | 2017-11-21 | 2018-05-11 | 浪潮金融信息技术有限公司 | 一种基于深度卷积神经网络的问句相似度度量方法 |
CN109145290A (zh) * | 2018-07-25 | 2019-01-04 | 东北大学 | 基于字向量与自注意力机制的语义相似度计算方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111666482A (zh) | 2020-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111666482B (zh) | 查询方法及装置、存储介质和处理器 | |
CN111427995A (zh) | 基于内部对抗机制的语义匹配方法、装置及存储介质 | |
CN106776545B (zh) | 一种通过深度卷积神经网络进行短文本间相似度计算的方法 | |
CN110516247B (zh) | 基于神经网络的命名实体识别方法及计算机存储介质 | |
US10747961B2 (en) | Method and device for identifying a sentence | |
CN106021364A (zh) | 图片搜索相关性预测模型的建立、图片搜索方法和装置 | |
CN109863487A (zh) | 非事实型问答系统和方法及用于其的计算机程序 | |
CN108804677A (zh) | 结合多层级注意力机制的深度学习问题分类方法及系统 | |
WO2020114100A1 (zh) | 一种信息处理方法、装置和计算机存储介质 | |
CN111782826A (zh) | 知识图谱的信息处理方法、装置、设备及存储介质 | |
CN110990498A (zh) | 一种基于fcm算法的数据融合方法 | |
CN113722512A (zh) | 基于语言模型的文本检索方法、装置、设备及存储介质 | |
CN110083731B (zh) | 图像检索方法、装置、计算机设备及存储介质 | |
CN114416929A (zh) | 实体召回模型的样本生成方法、装置、设备及存储介质 | |
CN110555209A (zh) | 训练词向量模型的方法及装置 | |
CN110334204B (zh) | 一种基于用户记录的习题相似度计算推荐方法 | |
CN110096708B (zh) | 一种定标集确定方法及装置 | |
CN111125329A (zh) | 一种文本信息筛选方法、装置及设备 | |
CN111104422A (zh) | 一种数据推荐模型的训练方法、装置、设备及存储介质 | |
CN106021346B (zh) | 检索处理方法及装置 | |
CN115952269A (zh) | 一种基于检索式的问答方法及装置 | |
CN112329430B (zh) | 一种模型训练方法、文本相似度确定方法及装置 | |
CN115830618A (zh) | 一种文本识别方法、装置、计算机设备及存储介质 | |
CN115640378A (zh) | 工单检索方法、服务器、介质及产品 | |
CN111382246B (zh) | 文本的匹配方法、匹配装置、终端及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |