CN110222737A - 一种基于长短时记忆网络的搜索引擎用户满意度评估方法 - Google Patents

一种基于长短时记忆网络的搜索引擎用户满意度评估方法 Download PDF

Info

Publication number
CN110222737A
CN110222737A CN201910424722.2A CN201910424722A CN110222737A CN 110222737 A CN110222737 A CN 110222737A CN 201910424722 A CN201910424722 A CN 201910424722A CN 110222737 A CN110222737 A CN 110222737A
Authority
CN
China
Prior art keywords
search
behavior
search behavior
search engine
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910424722.2A
Other languages
English (en)
Inventor
陈岭
范阿琳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201910424722.2A priority Critical patent/CN110222737A/zh
Publication of CN110222737A publication Critical patent/CN110222737A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于长短时记忆网络的搜索引擎用户满意度评估方法,包括:首先,搜索引擎日志中提取搜索行为序列,使用基于时间间隔微扰的数据增强策略对搜索行为序列进行数据增强,并引入虚拟停留行为来表示连续行为之间的时间间隔;其次,利用长短时记忆网络学习搜索行为序列的特征表示,并建立搜索引擎用户满意度分类器;最后,利用构建的用户满意度分类器识别给定样本的用户满意度标签。该方法通过端对端学习搜索行为序列的特征表示来更有效的评估搜索引擎用户满意度。

Description

一种基于长短时记忆网络的搜索引擎用户满意度评估方法
技术领域
本发明涉及互联网信息技术领域,尤其涉及一种基于长短时记忆网络的搜索引擎用户满意度评估方法。
背景技术
搜索引擎是用户从互联网海量数据中获取所需资源信息的主要途径之一。随着用户对于高效便捷获取信息资源的要求越来越高,搜索引擎需要不断地进行系统优化从而为用户提供更优质的搜索服务。因此,如何有效评估搜索引擎的质量成为了研究界与产业界关注的焦点。
搜索引擎日志记录了用户与搜索引擎交互过程中发生的一系列行为信息,并且搜索满意度与用户的搜索行为有很强的关联。因此,研究人员通常利用从搜索引擎日志中提取的搜索行为序列来评估用户的搜索满意度,通过对搜索行为序列建模能够捕获用户在满意的搜索体验和不满意的搜索体验中潜在的搜索行为模式。
传统的搜索满意度评估方法通常使用从搜索行为序列中提取的特征来描述用户行为,并用传统的机器学习方法来评估搜索满意度。然而与用户搜索满意度有关的信息可能隐含在序列中,此类方法可能会丢失这些信息。随着深度学习方法的发展,长短时记忆网络凭借其强大的表征能力在序列建模问题上有非常突出的表现。通过端对端的学习搜索行为序列的特征表示,基于长短时记忆网络的搜索满意度评估方法能够更有效的评估搜索引擎用户满意度。由于长短时记忆网络通常只考虑序列中行为之间的顺序关系,而不考虑连续行为之间的时间间隔,因此,直接将搜索行为序列作为长短时记忆网络的输入数据将会丢失序列中连续行为之间的时间间隔信息。
此外,与非深度学习方法相比,深度学习方法需要更多的有标注数据,由于有标注数据的收集过程昂贵且耗时,有可能使训练出的模型因训练数据数量不足而导致过拟合。
发明内容
本发明要解决的问题是如何在少量有标注数据的情况下利用长短时记忆网络学习不等长时间间隔搜索行为序列的特征表示,以用于评估搜索引擎用户满意度。
为解决上述技术问题,本发明提供的技术方案为:
一种基于长短时记忆网络的搜索引擎用户满意度评估方法,包括以下步骤:
训练数据集构建:从搜索引擎日志中提取搜索行为序列,并采用使用基于时间间隔微扰的数据增强策略对搜索行为序列进行数据增强后,再引入虚拟停留行为,构建新搜索行为序列,将新搜索行为序列转化为向量,并与对应的满意度标签作为一个训练样本,以构建训练数据集;
分类器构建:以长短时记忆网络层、全连接层组成的网络作为用于满意度分类的分类器,利用训练数据集对网络进行训练,训练结束后获得训练好的分类器;
搜索引擎用户满意度识别:将待识别的搜索行为序列按照训练集构建步骤转化为向量,并将该向量输入至训练好的分类器中,经计算输出满意度分类结果。
本发明利用长短时记忆网络来学习搜索行为序列的特征表示,以用于评估搜索引擎用户满意度,通过引入虚拟停留行为把连续行为之间的时间间隔信息嵌入到搜索行为序列的特征表示中,并给出一种基于时间间隔微扰的数据增强策略来缓解模型的过拟合问题。本发明的优点包括:
(1)给出一种基于长短时记忆网络的搜索引擎用户满意度评估方法,通过端对端学习搜索行为序列的特征表示来更有效的评估搜索引擎用户满意度。
(2)引入虚拟停留行为把连续行为之间的时间间隔信息嵌入到搜索行为序列的特征表示中,从而有效利用连续行为之间的时间间隔信息。
(3)给出一种基于时间间隔微扰的数据增强策略,从而增加搜索行为序列数据的模式变化,提高长短时记忆网络的泛化能力。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据这些附图获得其他附图。
图1是实施例提供的基于长短时记忆网络的搜索引擎用户满意度评估方法流程图;
图2是实施例提供的训练数据集构建阶段流程图;
图3是实施例提供的分类器构建阶段流程图;
图4是实施例提供的搜索引擎用户满意度识别阶段流程图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。
如图1所示,本实施例提供的基于长短时记忆网络的搜索引擎用户满意度评估方法分为训练数据集构建、分类器构建和搜索引擎用户满意度识别三个阶段。
训练数据集构建阶段
训练数据集构建阶段主要是从搜索引擎日志提取信息,并基于提取的信息构建训练数据集,如图2所示,具体包括以下步骤:
步骤1-1,将搜索引擎日志以信息需求为单位进行划分,并从信息需求所对应的搜索引擎日志中提取出由n个搜索行为a以及连续搜索行为之间的时间间隔t组成搜索行为序列S,其形式化表示为S=<a1,t1,a2,t2,...,an-1,tn-1,an>。
具体的,用户的搜索行为a包括以下四种类型:
1)提交查询词;
2)点击返回的搜索引擎结果页面上的某个结果;
3)点击当前结果页面(非搜索引擎结果页面)的超链接;
4)结束搜索。
步骤1-2,使用基于时间间隔微扰的数据增强策略对搜索行为序列进行数据增强。
具体地,通过随机生成的扰动因子tflu轻微扰动搜索行为序列中连续行为之间的时间间隔,从而生成新的搜索行为序列。
数据增强是一种基于标签保护转换人为扩大数据集的策略,是一种减少过拟合的重要途径。给定搜索行为序列S=<a1,t1,a2,t2,...,an-1,tn-1,an>,利用随机生成的扰动因子tflu∈(0,1)轻微扰动搜索行为序列S中连续搜索行为之间的时间间隔t,可生成新搜索行为序列S′=<a1,(1±tflu)t1,a2,(1±tflu)t2,...,an-1,(1±tflu)tn-1,an>,其中±表示随机加减,且S与S′的标签相同。
应用时,针对提取出的每个搜索行为序列,重复执行m次步骤1-2,以实现对搜索行为序列的扩充。
步骤1-3,根据连续搜索行为之间的时间间隔引入相应数量固定时间间隔tidle的虚拟停留行为,引入虚拟停留行为的搜索行为序列形式化表示为S″=<a1,a2,...,ak-1,ak>,其中k≥n。
在此步骤中,虚拟停留行为表示用户在执行当前搜索行为后停留了一个固定的时长tidle。给定一个包含n个搜索行为的搜索行为序列,用来表示两个连续搜索行为之间时间间隔的虚拟停留行为数量Nidle为:
其中ti表示搜索行为ai和搜索行为ai+1之间的时间间隔。
步骤1-4,使用截断或填充的方式将所有搜索行为序列的长度统一为L。
为了使长短时记忆网络能够处理变长的搜索行为序列,需要预先指定一个统一的序列长度L。如果一个搜索行为序列的长度大于L,则截断其长度超出L的部分;如果一个搜索行为序列的长度小于L,则在该序列的首端用占位符0来填充直至其长度等于L。
步骤1-5,采用word2vec学习所有搜索行为序列中出现过的所有行为类型的向量表示,将每个搜索行为序列中的搜索行为a都转换成对应的向量r,再将每个向量化后的搜索行为序列及其对应的满意度标签作为一个训练样本来构建训练数据集。
一个训练样本可以表示为(x,y),其中y∈{0,1}表示用户满意度的标签,0表示不满意的类,1表示满意的类;x=[r1,r2,...,rl,...,rL],l∈{1,2,...,L},rl是K维行向量。
word2vec是google提出的词向量计算框架,把所有搜索行为序列看作训练文本,搜索行为序列中的行为看作词,可使用word2vec学习出搜索行为序列中出现过的所有行为类型的向量表示,即,每个行为类型都由一个K维行向量来表示,K根据经验人为设定。
分类器构建阶段
如图3所示,分类器构建的具体步骤包括:
步骤2-1,训练分类器前,将训练数据集按照固定的批量大小进行分批,批次总数为N。
在此步骤中,批量大小M根据经验人为设定,批次总数N计算公式如下:
其中Nall为训练数据集中样本总数。
步骤2-2,从训练数据集中顺序选取索引为index的一批训练样本,其中index∈{0,1,...,N}。对于该批次中的每一个训练样本,重复执行步骤2-3。
步骤2-3,利用长短时记忆网络层、全连接层和sigmoid激活函数构成的用户满意度分类器来获取用户满意度的分类结果。
在此步骤中,用户满意度分类器由一层长短时记忆网络层和一层使用sigmoid函数作为激活函数的全连接层组成。长短时记忆网络是一种循环神经网络,其更新公式如下:
it=σi(xtWxi+ht-1Whi+wci·ct-1+bi) (3)
ft=σf(xtWxf+ht-1Whf+wcf·ct-1+bf) (4)
ct=ft·ct-1+it·σc(xtWxc+ht-1Whc+bc) (5)
ot=σo(xtWxo+ht-1Who+wco·ct+bo) (6)
ht=ot·σh(ct) (7)
其中it、ft、ot分别表示第t个对象的输入门、遗忘门、输出;ct表示细胞激活向量;xt和ht分别表示输入特征向量和隐藏输出向量;σi、σf、σo是sigmoid函数;σc和σh是双曲正切函数;Wxi、Wxf、Wxo、Whi、Whf、Who权重参数将不同的输入和门与不同的记忆细胞和输出相连接;bi、bf、bo是相应的偏差;ct的更新公式有两部分:一部分是由ft控制的前一个细胞状态ct-1,另一部分是从it与非线性σc的输出的点乘·创建出的新的输入状态;可选的窥视孔连接权重wci、wcf、wco会对输入门、遗忘门、输出门产生进一步的影响。使用sigmoid函数作为激活函数的全连接层可以得到用户满意度标签的概率分布。满意的类概率y′的计算公式如下:
其中e表示以自然对数为底的指数函数,α是前一层输出的向量,w是权重向量。
步骤2-4,对于该批次所有训练样本,根据上述用户满意度分类结果来计算对应的分类损失,并根据最小化分类损失的目标来调整网络参数。
在此步骤中,训练网络时,以网络的输出的预测满意度与训练样本的满意度标签的交叉熵(Cross Entropy)作为分类损失函数。
步骤2-5,重复步骤2-2~2-4直至训练数据集的所有批次都参与训练。
步骤2-6,若达到指定的训练轮数(epoch)则训练结束,否则返回步骤2-2。
搜索引擎用户满意度识别阶段
如图4所示,搜索引擎用户满意度识别的具体步骤包括:
步骤3-1,从用户提供的需要识别搜索满意度的样本中提取出由n个搜索行为a以及连续搜索行为之间的时间间隔t组成的搜索行为序列其形式化表示为对于提取出的搜索行为序列重复执行m次步骤3-2,可得搜索行为序列集
步骤3-2,使用基于时间间隔微扰的数据增强策略对搜索行为序列进行数据增强。
此步骤的具体实施方式同训练集构建阶段步骤1-2。
步骤3-3,对中的每个搜索行为序列,根据连续行为之间的时间间隔引入相应数量固定时间间隔tidle的虚拟停留行为,一个引入虚拟停留行为的搜索行为序列形式化表示为
此步骤的具体实施方式同训练集构建阶段步骤1-3。
步骤3-4,使用截断或填充的方式将中所有搜索行为序列的长度统一为L。
此步骤的具体实施方式同训练集构建阶段步骤1-4。
步骤3-5,读取在训练数据集构建阶段得到的通过word2vec学习到的所有行为类型的向量表示,将中每个搜索行为序列中的搜索行为a都转换成对应的向量r,一个需要识别搜索满意度的搜索行为序列可以表示为rl是K维行向量。
步骤3-6,通过构建的用户满意度分类器获取中所有搜索行为序列的类概率,得到对应的类概率集
步骤3-7,利用中所有的类概率计算样本的最终分类结果yT
在此步骤中,通过对类概率求平均值的方式来组合中的类概率。样本的最终分类结果yT的计算公式如下:
如果yT=0表示样本的最终分类结果为不满意,如果yT=1则表示样本的最终分类结果为满意。
以上所述的具体实施方式对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的最优选实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种基于长短时记忆网络的搜索引擎用户满意度评估方法,包括以下步骤:
训练数据集构建:从搜索引擎日志中提取搜索行为序列,并采用使用基于时间间隔微扰的数据增强策略对搜索行为序列进行数据增强后,再引入虚拟停留行为,构建新搜索行为序列,将新搜索行为序列转化为向量,并与对应的满意度标签作为一个训练样本,以构建训练数据集;
分类器构建:以长短时记忆网络层、全连接层组成的网络作为用于满意度分类的分类器,利用训练数据集对网络进行训练,训练结束后获得训练好的分类器;
搜索引擎用户满意度识别:将待识别的搜索行为序列按照训练集构建步骤转化为向量,并将该向量输入至训练好的分类器中,经计算输出满意度分类结果。
2.如权利要求1所述的基于长短时记忆网络的搜索引擎用户满意度评估方法,其特征在于,从搜索引擎日志中提取搜索行为序列包括:
将搜索引擎日志以信息需求为单位进行划分,并从信息需求所对应的搜索引擎日志中提取出由n个搜索行为a以及连续搜索行为之间的时间间隔t组成搜索行为序列S,其形式化表示为S=<a1,t1,a2,t2,...,an-1,tn-1,an>。
3.如权利要求2所述的基于长短时记忆网络的搜索引擎用户满意度评估方法,其特征在于,采用使用基于时间间隔微扰的数据增强策略对搜索行为序列进行数据增强包括:
给定搜索行为序列S=<a1,t1,a2,t2,...,an-1,tn-1,an>,利用随机生成的扰动因子tflu∈(0,1)轻微扰动搜索行为序列S中连续搜索行为之间的时间间隔t,可生成搜索行为序列S′=<a1,(1±tflu)t1,a2,(1±tflu)t2,...,an-1,(1±tflu)tn-1,an>,其中±表示随机加减,且S与S′的标签相同。
4.如权利要求3所述的基于长短时记忆网络的搜索引擎用户满意度评估方法,其特征在于,引入虚拟停留行为,构建新搜索行为序列包括:
虚拟停留行为表示用户在执行当前搜索行为后停留了一个固定的时长tidle
给定一个包含n个搜索行为的搜索行为序列,用来表示两个连续搜索行为之间时间间隔的虚拟停留行为数量Nidle为:
其中ti表示搜索行为ai和搜索行为ai+1之间的时间间隔;
则引入虚拟停留行为的搜索行为序列形式化表示为S″=<a1,a2,...,ak-1,ak>,其中k≥n。
5.如权利要求1所述的基于长短时记忆网络的搜索引擎用户满意度评估方法,其特征在于,将新搜索行为序列转化为向量包含:
截断或填充的方式将所有搜索行为序列的长度统一为L;
采用word2vec学习所有搜索行为序列中出现过的所有行为类型的向量表示,将每个搜索行为序列中的搜索行为a都转换成对应的向量r。
6.如权利要求1所述的基于长短时记忆网络的搜索引擎用户满意度评估方法,其特征在于,训练网络时,以网络的输出的预测满意度与训练样本的满意度标签的交叉熵作为分类损失函数。
CN201910424722.2A 2019-05-21 2019-05-21 一种基于长短时记忆网络的搜索引擎用户满意度评估方法 Pending CN110222737A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910424722.2A CN110222737A (zh) 2019-05-21 2019-05-21 一种基于长短时记忆网络的搜索引擎用户满意度评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910424722.2A CN110222737A (zh) 2019-05-21 2019-05-21 一种基于长短时记忆网络的搜索引擎用户满意度评估方法

Publications (1)

Publication Number Publication Date
CN110222737A true CN110222737A (zh) 2019-09-10

Family

ID=67821523

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910424722.2A Pending CN110222737A (zh) 2019-05-21 2019-05-21 一种基于长短时记忆网络的搜索引擎用户满意度评估方法

Country Status (1)

Country Link
CN (1) CN110222737A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110738239A (zh) * 2019-09-20 2020-01-31 浙江大学 一种基于鼠标交互序列区域行为联合建模的搜索引擎用户满意度评估方法
WO2021195830A1 (zh) * 2020-03-30 2021-10-07 深圳市欢太数字科技有限公司 行为分析方法及装置、终端、存储介质
CN114416513A (zh) * 2022-03-25 2022-04-29 百度在线网络技术(北京)有限公司 搜索数据的处理方法、装置、电子设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014235564A (ja) * 2013-06-02 2014-12-15 データ・サイエンティスト株式会社 評価方法、評価装置、およびプログラム
CN105512224A (zh) * 2015-11-30 2016-04-20 清华大学 基于光标位置序列的搜索引擎用户满意度自动评估方法
CN109345263A (zh) * 2018-08-02 2019-02-15 北京天元创新科技有限公司 预测客户满意度的方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014235564A (ja) * 2013-06-02 2014-12-15 データ・サイエンティスト株式会社 評価方法、評価装置、およびプログラム
CN105512224A (zh) * 2015-11-30 2016-04-20 清华大学 基于光标位置序列的搜索引擎用户满意度自动评估方法
CN109345263A (zh) * 2018-08-02 2019-02-15 北京天元创新科技有限公司 预测客户满意度的方法和系统

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ALIN FAN ET AL: "Search Action Sequence Modeling with Long Short-term Memory for Search Task Success Evaluation", 《THE THIRTY-SECOND AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE(AAAI-18)》 *
JAITLY N ET AL: "vocal tract length perturbation improves speech recognition", 《PROCEEDINGS OF THE 30TH INTERNATIONAL CONFERENCE ON MACHINE LEARNING WORKSHOP ON DEEP LEARNING FOR AUDIO ,SPEECH AND LANGUAGE 》 *
YOUNGHO KIM ET AL: "modeling dwell time to predict click-level satisfaction", 《PROCEEDINGS OF THE 7TH ACM INTERNATIONAL CONFERENCE ON WEB SEARCH AND DATA MINING》 *
邓晓妹 等: "基于点击日志的搜索引擎用户满意度评价研究", 《计算机工程与应用》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110738239A (zh) * 2019-09-20 2020-01-31 浙江大学 一种基于鼠标交互序列区域行为联合建模的搜索引擎用户满意度评估方法
WO2021195830A1 (zh) * 2020-03-30 2021-10-07 深圳市欢太数字科技有限公司 行为分析方法及装置、终端、存储介质
CN114416513A (zh) * 2022-03-25 2022-04-29 百度在线网络技术(北京)有限公司 搜索数据的处理方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN110298037B (zh) 基于增强注意力机制的卷积神经网络匹配的文本识别方法
CN109376242B (zh) 基于循环神经网络变体和卷积神经网络的文本分类方法
CN110309514A (zh) 一种语义识别方法及装置
CN108984530A (zh) 一种网络敏感内容的检测方法及检测系统
CN108073677A (zh) 一种基于人工智能的多级文本多标签分类方法及系统
CN110532554A (zh) 一种中文摘要生成方法、系统及存储介质
CN110502753A (zh) 一种基于语义增强的深度学习情感分析模型及其分析方法
CN111666406B (zh) 基于自注意力的单词和标签联合的短文本分类预测方法
CN107871158A (zh) 一种结合序列文本信息的知识图谱表示学习方法及装置
CN112256866B (zh) 一种基于深度学习的文本细粒度情感分析算法
CN103886020B (zh) 一种房地产信息快速搜索方法
CN112507039A (zh) 基于外部知识嵌入的文本理解方法
CN112559734B (zh) 简报生成方法、装置、电子设备及计算机可读存储介质
CN110222737A (zh) 一种基于长短时记忆网络的搜索引擎用户满意度评估方法
CN113806630B (zh) 基于注意力的多视角特征融合跨域推荐方法及装置
CN113220865B (zh) 一种文本相似词汇检索方法、系统、介质及电子设备
CN112328800A (zh) 自动生成编程规范问题答案的系统及方法
CN113051914A (zh) 一种基于多特征动态画像的企业隐藏标签抽取方法及装置
CN106601235A (zh) 一种半监督多任务特征选择的语音识别方法
CN112131345B (zh) 文本质量的识别方法、装置、设备及存储介质
Jiang et al. Boosting facial expression recognition by a semi-supervised progressive teacher
CN110516240A (zh) 一种基于Transformer的语义相似度计算模型DSSM技术
CN115238036A (zh) 一种基于图注意力网络和文本信息的认知诊断方法及装置
CN113408418A (zh) 一种书法字体与文字内容同步识别方法及系统
CN107329951A (zh) 构建命名实体标注资源库方法、装置、存储介质和计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190910

RJ01 Rejection of invention patent application after publication