CN109062893A - 一种基于全文注意力机制的商品名称识别方法 - Google Patents
一种基于全文注意力机制的商品名称识别方法 Download PDFInfo
- Publication number
- CN109062893A CN109062893A CN201810768223.0A CN201810768223A CN109062893A CN 109062893 A CN109062893 A CN 109062893A CN 201810768223 A CN201810768223 A CN 201810768223A CN 109062893 A CN109062893 A CN 109062893A
- Authority
- CN
- China
- Prior art keywords
- layer
- full text
- word
- vector
- attention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 230000007246 mechanism Effects 0.000 title claims abstract description 24
- 239000013598 vector Substances 0.000 claims abstract description 77
- 239000000284 extract Substances 0.000 claims abstract description 10
- 238000003062 neural network model Methods 0.000 claims abstract description 8
- 238000003780 insertion Methods 0.000 claims abstract description 3
- 230000037431 insertion Effects 0.000 claims abstract description 3
- 238000013528 artificial neural network Methods 0.000 claims description 14
- 238000012549 training Methods 0.000 claims description 14
- 238000005516 engineering process Methods 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 5
- 230000006870 function Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 230000002457 bidirectional effect Effects 0.000 claims description 3
- 238000010380 label transfer Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 230000000306 recurrent effect Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 2
- 230000000644 propagated effect Effects 0.000 claims description 2
- 230000001788 irregular Effects 0.000 abstract description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于全文注意力机制的商品名称识别方法,包括:建立加入全文注意力机制的深度神经网络模型,在深度神经网络模型中加入全文注意力层,在全文注意力层当中,将全文的信息用词嵌入向量的方法来表示;接着,对于要标注的每一个词语,计算它们和全文注意力层词向量的相似性,从而让词语获得对全文的“注意力权重”,即让词语关注到文档的上下文信息,利用注意力权重和,计算出每一个词语的额外特征,用以进行商品名称的识别。本发明方法能够有效的从不规则的文本中提取出商品名,并解决了同一种商品在上下文识别不一致的问题,提高了识别的准确率。
Description
技术领域
本发明涉及自然语言处理技术领域,特别涉及一种基于全文注意力机制的商品名称识别方法。
背景技术
命名实体识别是信息抽取的一项子任务,旨在识别出文本中的专有名词,并对它们进行分类。传统的命名实体任务有:人名、地名、机构名等。这是自然语言处理领域中一个相当重要的基础任务,比如:搜索引擎、问答系统、推荐系统、翻译系统等。而近年来,随着电子商务的不断发展,针对电商领域的命名实体识别任务也开始为人们所关注,人们迫切需要从海量的、不规则的文本中提取出商品的名称,并将其用于智能客服、广告推荐等领域。
对于这个问题,经典的研究主要是基于归纳商品字典、完善正则表达式、界定规、构造隐马尔科夫模型、构造最大熵模型和构造条件随机场模型等方法,这些方法的缺点在于,它们无法对词语潜在的语义进行建模,只能通过增加外部特征来达到提升效果的目的。
而近几年来,随着深度学习的不断发展,很多学者开始利用深层神经网络来对文本建模,这些模型能够捕获到文本潜在的语义信息,大大减少了人工提取特征的工作量,具体到商品名称识别,目前较好的模型有BI-LSTM+CRF模型,CNN+CRF模型,这些模型基本上都是用了word-embedding技术,这能解决词典高维稀疏的问题,具有很强的泛化能力,使得我们不必统计完整的商品词典,同时,神经网络和CRF的结合,能够解决商品名识别标注矛盾的问题,提高识别准确率。然而,这些研究忽略了商品名识别不一致的问题,也就是说,同一个商品,在文本中的不同位置,被识别成了不同的类别。比如,“苹果”和“苹果手机”同时都在一篇文档中出现,但是如果应用上面所说的模型,有可能“苹果”被标注成水果,“苹果手机”则被标注成商品,出现这个问题的原因在于,模型并没有考虑到文档全文的信息,如果知道这篇文章是在讲手机相关的内容,那么“苹果”更大概率是一种商品。因此,提供一种基于全文注意力机制的商品名称识别方法,具有重要的现实意义。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种基于全文注意力机制的商品名称识别方法,基于深度学习技术,能够有效的从不规则的文本中提取出商品名,并解决了同一种商品在上下文识别不一致的问题,提高了识别的准确率。
本发明的目的通过以下的技术方案实现:一种基于全文注意力机制的商品名称识别方法,包括:建立加入全文注意力机制的深度神经网络模型,在深度神经网络模型中加入全文注意力层,在全文注意力层当中,将全文的信息用词嵌入向量的方法来表示;接着,对于要标注的每一个词语,计算它们和全文注意力层词向量的相似性,从而让词语获得对全文的“注意力权重”,即让词语关注到文档的上下文信息,利用注意力权重和,计算出每一个词语的额外特征,用以进行商品名称的识别。
优选的,加入全文注意力机制的深度神经网络模型包括:输入层、编码层、全文注意力层、输出层、提取层;
第一层是输入层,首先利用预训练好的词向量,将全文分词后的结果映射为向量矩阵,并将额外的词性信息编码为one-hot特征,拼接在向量矩阵后,形成模型的输入;
第二层是编码层,针对文章中的每一个句子,使用双向循环神经网络来进行编码;
第三层是全文注意力层,由于第二层已经对文中的每一个句子进行了建模,全文注意力层的任务是为每一个词语引入全文的信息,得到蕴含更多信息的编码;
第四层是输出层,考虑相邻标签之间的关系,加入标签转移得分,和全文注意力层输出的分数相结合,预测全局最优的标注序列;
最后一层是提取层,根据上一层输出的标注序列,提取出自定义商品名标注,并将其背后的文本拼接起来,从而识别、得到商品名。
优选的,输入层将词语序列转换成词语的特征向量,以传递给编码层处理,这一层的特征向量是由两种特征向量拼接而成,包括预训练词向量和词性特征向量;其中,预训练词向量的维度为N维,词性特征由NLTK给出,用随机初始化的方法将每种词性映射到指定维度的向量,最终,将词向量和词性特征向量拼接在一起,代表词语的特征向量。
优选的,编码层针对输入层的每一个句子特征向量,进行神经网络的前向传播,这一层使用两个独立的循环神经网络,首先使用前向LSTM学习词语的前向依赖关系,然后使用后向LSTM学习词语的后向依赖关系,最后将它们拼接成词语的总向量,此时词语的总向量就包含了句子内的上下文信息。
优选的,全文注意力层为编码层的每一个词语增加额外的全文特征;在这一层中,对于每一个词语,模型使用欧氏距离相似度函数计算当前词语向量和全文的每一个词语向量的相似性,得到注意力权重,用注意力权重和对应的全文向量相乘,得到当前词语的全局特征向量;最后,将全局特征向量拼接在原有的词语总向量之后,形成最终的词语输出向量。
优选的,输出层根据全文注意力层的输出词语向量,为词语预测对应的标签;这一层是一个标签联合预测的CRF层,借鉴条件随机场模型全局优化的思想,考虑相邻两个输出标签之间的关系,最后得到最优的标签序列。
优选的,在模型的训练过程中,使用dropout技术防止过拟合。
优选的,在模型的训练过程中,使用Adam优化器以自适应地计算每个参数的学习率。
本发明与现有技术相比,具有如下优点和有益效果:
本发明通过结合全文注意力的方法,给出一种基于深度学习技术的商品名识别方法,能够有效的从不规则的文本中提取出商品名,并解决了同一种商品在上下文识别不一致的问题,提高了识别的准确率。
本方法充分利用了神经网络注意力机制的优点,灵活的将全文信息以“注意力”的形式输入神经网络,使得神经网络能够关注到被忽略的重要的商品信息,从而最终输出更加准确的商品名。本发明可以应用到各种电子商务的场景当中,为许多应高级用提供底层基础服务。
附图说明
图1为实施例提供的商品名自动识别模型总体结构图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例1
一种基于全文注意力机制的商品名称识别方法,加入全文注意力机制的深度神经网络模型,将其应用在商品名自动识别当中。
模型的改进思路主要在于全文注意力层。在这一层当中,将全文的信息用词嵌入向量的方法来表示,接着,对于要标注的每一个词语,用欧式距离相似度函数计算它们和全文注意力层词向量的相似性,从而让词语获得对全文的“注意力权重”,即让词语关注到文档的上下文信息。最后,利用注意力权重和,计算出每一个词语的额外特征,传递到输出层。这样一来,每一个词语就能额外获取到全文的信息,从而解决商品名标注不一致的问题。
具体来说,模型分为输入层、编码层、全文注意力层、输出层、提取层。
第一层是输入层,首先利用预训练好的词向量,将全文分词后的结果映射为向量矩阵,并将额外的词性信息编码为one-hot特征,拼接在向量矩阵后,形成模型的输入。
第二层是编码层,针对文章中的每一个句子,使用双向循环神经网络来进行编码,它在前向网络中,让词语获得句子级别的上文信息,在后向网络中,让词语获得句子级别的下文信息。
第三层是全文注意力层,由于第二层已经对文中的每一个句子进行了建模,全文注意力层的任务是为每一个词语引入全文的信息,得到蕴含更多信息的编码,旨在解决商品名识别前后不一致的问题。
第四层是输出层,这一层使用了CRF模型的转移矩阵,考虑了相邻标签之间的关系,加入标签转移得分,和全文注意力层输出的分数相结合,预测全局最优的标注序列。
最后一层是提取层,根据上一层输出的标注序列,提取出自定义商品名标注,并将其背后的文本拼接起来,从而识别、得到商品名。
所提出的商品名自动识别方法包括以下步骤:
步骤1:模型第一层将词语序列转换成词语的特征向量,以传递给编码层处理,这一层的特征向量是由两种特征向量拼接而成,包括预训练词向量和词性特征向量。其中,预训练词向量的维度为100维,词性特征由NLTK给出,用随机初始化的方法将每种词性映射到指定维度的向量。最终,将词向量和词性特征向量拼接在一起,代表词语的特征向量。
步骤2:模型第二层针对第一层的每一个句子特征向量,进行神经网络的前向传播。这一层使用两个独立的循环神经网络,首先使用前向LSTM学习词语的前向依赖关系,然后使用后向LSTM学习词语的后向依赖关系,最后将它们拼接成词语的总向量,此时词语的总向量就包含了句子内的上下文信息。
步骤3:模型第三层为第二层的每一个词语增加额外的全文特征。由于输入层、编码层的处理都是句子级别的,所以它们无法获取全文的信息。而在这一层中,对于每一个词语,模型使用欧氏距离相似度函数计算当前词语向量和全文的每一个词语向量的相似性,得到注意力权重,用注意力权重和对应的全文向量相乘,得到当前词语的全局特征向量。最后,将全局特征向量拼接在原有的词语总向量之后,形成最终的词语输出向量。
步骤4:模型第四层的任务是根据全文注意力层的输出词语向量,为词语预测对应的标签。这一层是一个标签联合预测的CRF层,借鉴了条件随机场模型全局优化的思想,考虑了相邻两个输出标签之间的关系,最后得到最优的标签序列。
在模型的训练过程中,使用了dropout技术防止过拟合,使用了Adam优化器以自适应地计算每个参数的学习率。
步骤5:模型的最后一层用于提取商品名,由步骤4,已经可以得到文本中每一个词语的标签,而这个步骤则是根据自定义商品名背后的标签,提取出原文词语,将这些词语拼接在一起,从而得到商品名。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (8)
1.一种基于全文注意力机制的商品名称识别方法,其特征在于,包括:建立加入全文注意力机制的深度神经网络模型,在深度神经网络模型中加入全文注意力层,在全文注意力层当中,将全文的信息用词嵌入向量的方法来表示;接着,对于要标注的每一个词语,计算它们和全文注意力层词向量的相似性,从而让词语获得对全文的“注意力权重”,即让词语关注到文档的上下文信息,利用注意力权重和,计算出每一个词语的额外特征,用以进行商品名称的识别。
2.根据权利要求1所述的基于全文注意力机制的商品名称识别方法,其特征在于,加入全文注意力机制的深度神经网络模型包括:输入层、编码层、全文注意力层、输出层、提取层;
第一层是输入层,首先利用预训练好的词向量,将全文分词后的结果映射为向量矩阵,并将额外的词性信息编码为one-hot特征,拼接在向量矩阵后,形成模型的输入;
第二层是编码层,针对文章中的每一个句子,使用双向循环神经网络来进行编码;
第三层是全文注意力层,由于第二层已经对文中的每一个句子进行了建模,全文注意力层的任务是为每一个词语引入全文的信息,得到蕴含更多信息的编码;
第四层是输出层,考虑相邻标签之间的关系,加入标签转移得分,和全文注意力层输出的分数相结合,预测全局最优的标注序列;
最后一层是提取层,根据上一层输出的标注序列,提取出自定义商品名标注,并将其背后的文本拼接起来,从而识别、得到商品名。
3.根据权利要求1所述的基于全文注意力机制的商品名称识别方法,其特征在于,输入层将词语序列转换成词语的特征向量,以传递给编码层处理,这一层的特征向量是由两种特征向量拼接而成,包括预训练词向量和词性特征向量;其中,预训练词向量的维度为N维,词性特征由NLTK给出,用随机初始化的方法将每种词性映射到指定维度的向量,最终,将词向量和词性特征向量拼接在一起,代表词语的特征向量。
4.根据权利要求1所述的基于全文注意力机制的商品名称识别方法,其特征在于,编码层针对输入层的每一个句子特征向量,进行神经网络的前向传播,这一层使用两个独立的循环神经网络,首先使用前向LSTM学习词语的前向依赖关系,然后使用后向LSTM学习词语的后向依赖关系,最后将它们拼接成词语的总向量,此时词语的总向量就包含了句子内的上下文信息。
5.根据权利要求1所述的基于全文注意力机制的商品名称识别方法,其特征在于,全文注意力层为编码层的每一个词语增加额外的全文特征;在这一层中,对于每一个词语,模型使用欧氏距离相似度函数计算当前词语向量和全文的每一个词语向量的相似性,得到注意力权重,用注意力权重和对应的全文向量相乘,得到当前词语的全局特征向量;最后,将全局特征向量拼接在原有的词语总向量之后,形成最终的词语输出向量。
6.根据权利要求1所述的基于全文注意力机制的商品名称识别方法,其特征在于,输出层根据全文注意力层的输出词语向量,为词语预测对应的标签;这一层是一个标签联合预测的CRF层,借鉴条件随机场模型全局优化的思想,考虑相邻两个输出标签之间的关系,最后得到最优的标签序列。
7.根据权利要求1所述的基于全文注意力机制的商品名称识别方法,其特征在于,在模型的训练过程中,使用dropout技术防止过拟合。
8.根据权利要求1所述的基于全文注意力机制的商品名称识别方法,其特征在于,在模型的训练过程中,使用Adam优化器以自适应地计算每个参数的学习率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810768223.0A CN109062893B (zh) | 2018-07-13 | 2018-07-13 | 一种基于全文注意力机制的商品名称识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810768223.0A CN109062893B (zh) | 2018-07-13 | 2018-07-13 | 一种基于全文注意力机制的商品名称识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109062893A true CN109062893A (zh) | 2018-12-21 |
CN109062893B CN109062893B (zh) | 2021-09-21 |
Family
ID=64816366
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810768223.0A Expired - Fee Related CN109062893B (zh) | 2018-07-13 | 2018-07-13 | 一种基于全文注意力机制的商品名称识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109062893B (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109710762A (zh) * | 2018-12-26 | 2019-05-03 | 南京云问网络技术有限公司 | 一种融合多种特征权重的短文本聚类方法 |
CN109871538A (zh) * | 2019-02-18 | 2019-06-11 | 华南理工大学 | 一种中文电子病历命名实体识别方法 |
CN109948604A (zh) * | 2019-02-01 | 2019-06-28 | 北京捷通华声科技股份有限公司 | 不规则排列文本的识别方法、装置、电子设备及存储介质 |
CN110008469A (zh) * | 2019-03-19 | 2019-07-12 | 桂林电子科技大学 | 一种多层次命名实体识别方法 |
CN110334339A (zh) * | 2019-04-30 | 2019-10-15 | 华中科技大学 | 一种基于位置感知自注意力机制的序列标注模型与标注方法 |
CN110362681A (zh) * | 2019-06-19 | 2019-10-22 | 平安科技(深圳)有限公司 | 问答系统重复问题识别方法、装置及存储介质 |
CN110457682A (zh) * | 2019-07-11 | 2019-11-15 | 新华三大数据技术有限公司 | 电子病历词性标注方法、模型训练方法及相关装置 |
CN110459282A (zh) * | 2019-07-11 | 2019-11-15 | 新华三大数据技术有限公司 | 序列标注模型训练方法、电子病历处理方法及相关装置 |
CN110472229A (zh) * | 2019-07-11 | 2019-11-19 | 新华三大数据技术有限公司 | 序列标注模型训练方法、电子病历处理方法及相关装置 |
CN110619124A (zh) * | 2019-09-19 | 2019-12-27 | 成都数之联科技有限公司 | 一种结合注意力机制与双向lstm的命名实体识别方法及系统 |
CN111522964A (zh) * | 2020-04-17 | 2020-08-11 | 电子科技大学 | 一种藏医药文献核心概念挖掘方法 |
CN111538761A (zh) * | 2020-04-21 | 2020-08-14 | 中南大学 | 基于注意力机制的点击率预测方法 |
CN111625634A (zh) * | 2020-05-25 | 2020-09-04 | 泰康保险集团股份有限公司 | 词槽识别方法及装置、计算机可读存储介质、电子设备 |
CN111782768A (zh) * | 2020-06-30 | 2020-10-16 | 首都师范大学 | 基于双曲空间表示和标签文本互动的细粒度实体识别方法 |
CN112016325A (zh) * | 2020-09-04 | 2020-12-01 | 北京声智科技有限公司 | 语音合成方法及电子设备 |
CN113157918A (zh) * | 2021-03-23 | 2021-07-23 | 浙江工业大学 | 一种基于注意力机制的商品名称短文本分类方法和系统 |
CN115422939A (zh) * | 2022-10-14 | 2022-12-02 | 重庆邮电大学 | 一种基于大数据的细粒度商品命名实体识别方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101187921A (zh) * | 2007-12-20 | 2008-05-28 | 腾讯科技(深圳)有限公司 | 一种中文复合词的提取方法及提取系统 |
CN105045909A (zh) * | 2015-08-11 | 2015-11-11 | 北京京东尚科信息技术有限公司 | 从文本中识别商品名称的方法和装置 |
CN106503192A (zh) * | 2016-10-31 | 2017-03-15 | 北京百度网讯科技有限公司 | 基于人工智能的命名实体识别方法及装置 |
CN107783960A (zh) * | 2017-10-23 | 2018-03-09 | 百度在线网络技术(北京)有限公司 | 用于抽取信息的方法、装置和设备 |
US20180082183A1 (en) * | 2011-02-22 | 2018-03-22 | Thomson Reuters Global Resources | Machine learning-based relationship association and related discovery and search engines |
-
2018
- 2018-07-13 CN CN201810768223.0A patent/CN109062893B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101187921A (zh) * | 2007-12-20 | 2008-05-28 | 腾讯科技(深圳)有限公司 | 一种中文复合词的提取方法及提取系统 |
US20180082183A1 (en) * | 2011-02-22 | 2018-03-22 | Thomson Reuters Global Resources | Machine learning-based relationship association and related discovery and search engines |
CN105045909A (zh) * | 2015-08-11 | 2015-11-11 | 北京京东尚科信息技术有限公司 | 从文本中识别商品名称的方法和装置 |
CN106503192A (zh) * | 2016-10-31 | 2017-03-15 | 北京百度网讯科技有限公司 | 基于人工智能的命名实体识别方法及装置 |
CN107783960A (zh) * | 2017-10-23 | 2018-03-09 | 百度在线网络技术(北京)有限公司 | 用于抽取信息的方法、装置和设备 |
Non-Patent Citations (3)
Title |
---|
KATHERINE C.MOEN 等: "Selective attention meets spontaneous recognition memory: Evidence for effects at retrieval", 《ELSEVIER SCIENCE》 * |
冯伟: "社交媒体中内容的标注与排序", 《中国博士学位论文全文数据库》 * |
王宝鑫: "基于深度神经网络的文本蕴含识别及应用研究", 《万方数据库》 * |
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109710762A (zh) * | 2018-12-26 | 2019-05-03 | 南京云问网络技术有限公司 | 一种融合多种特征权重的短文本聚类方法 |
CN109710762B (zh) * | 2018-12-26 | 2023-08-01 | 南京云问网络技术有限公司 | 一种融合多种特征权重的短文本聚类方法 |
CN109948604A (zh) * | 2019-02-01 | 2019-06-28 | 北京捷通华声科技股份有限公司 | 不规则排列文本的识别方法、装置、电子设备及存储介质 |
CN109871538A (zh) * | 2019-02-18 | 2019-06-11 | 华南理工大学 | 一种中文电子病历命名实体识别方法 |
CN110008469A (zh) * | 2019-03-19 | 2019-07-12 | 桂林电子科技大学 | 一种多层次命名实体识别方法 |
CN110008469B (zh) * | 2019-03-19 | 2022-06-07 | 桂林电子科技大学 | 一种多层次命名实体识别方法 |
CN110334339A (zh) * | 2019-04-30 | 2019-10-15 | 华中科技大学 | 一种基于位置感知自注意力机制的序列标注模型与标注方法 |
CN110362681B (zh) * | 2019-06-19 | 2023-09-22 | 平安科技(深圳)有限公司 | 问答系统重复问题识别方法、装置及存储介质 |
CN110362681A (zh) * | 2019-06-19 | 2019-10-22 | 平安科技(深圳)有限公司 | 问答系统重复问题识别方法、装置及存储介质 |
CN110459282A (zh) * | 2019-07-11 | 2019-11-15 | 新华三大数据技术有限公司 | 序列标注模型训练方法、电子病历处理方法及相关装置 |
CN110472229A (zh) * | 2019-07-11 | 2019-11-19 | 新华三大数据技术有限公司 | 序列标注模型训练方法、电子病历处理方法及相关装置 |
CN110457682A (zh) * | 2019-07-11 | 2019-11-15 | 新华三大数据技术有限公司 | 电子病历词性标注方法、模型训练方法及相关装置 |
CN110472229B (zh) * | 2019-07-11 | 2022-09-09 | 新华三大数据技术有限公司 | 序列标注模型训练方法、电子病历处理方法及相关装置 |
CN110457682B (zh) * | 2019-07-11 | 2022-08-09 | 新华三大数据技术有限公司 | 电子病历词性标注方法、模型训练方法及相关装置 |
CN110619124A (zh) * | 2019-09-19 | 2019-12-27 | 成都数之联科技有限公司 | 一种结合注意力机制与双向lstm的命名实体识别方法及系统 |
CN111522964A (zh) * | 2020-04-17 | 2020-08-11 | 电子科技大学 | 一种藏医药文献核心概念挖掘方法 |
CN111538761A (zh) * | 2020-04-21 | 2020-08-14 | 中南大学 | 基于注意力机制的点击率预测方法 |
CN111625634A (zh) * | 2020-05-25 | 2020-09-04 | 泰康保险集团股份有限公司 | 词槽识别方法及装置、计算机可读存储介质、电子设备 |
CN111625634B (zh) * | 2020-05-25 | 2023-08-22 | 泰康保险集团股份有限公司 | 词槽识别方法及装置、计算机可读存储介质、电子设备 |
WO2022001333A1 (zh) * | 2020-06-30 | 2022-01-06 | 首都师范大学 | 基于双曲空间表示和标签文本互动的细粒度实体识别方法 |
CN111782768A (zh) * | 2020-06-30 | 2020-10-16 | 首都师范大学 | 基于双曲空间表示和标签文本互动的细粒度实体识别方法 |
CN112016325A (zh) * | 2020-09-04 | 2020-12-01 | 北京声智科技有限公司 | 语音合成方法及电子设备 |
CN113157918B (zh) * | 2021-03-23 | 2022-07-22 | 浙江工业大学 | 一种基于注意力机制的商品名称短文本分类方法和系统 |
CN113157918A (zh) * | 2021-03-23 | 2021-07-23 | 浙江工业大学 | 一种基于注意力机制的商品名称短文本分类方法和系统 |
CN115422939A (zh) * | 2022-10-14 | 2022-12-02 | 重庆邮电大学 | 一种基于大数据的细粒度商品命名实体识别方法 |
CN115422939B (zh) * | 2022-10-14 | 2024-04-02 | 芽米科技(广州)有限公司 | 一种基于大数据的细粒度商品命名实体识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109062893B (zh) | 2021-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109062893A (zh) | 一种基于全文注意力机制的商品名称识别方法 | |
CN109146610B (zh) | 一种智能保险推荐方法、装置及智能保险机器人设备 | |
Mathews et al. | Semstyle: Learning to generate stylised image captions using unaligned text | |
CN110717017B (zh) | 一种处理语料的方法 | |
CN109933664B (zh) | 一种基于情感词嵌入的细粒度情绪分析改进方法 | |
CN107315737A (zh) | 一种语义逻辑处理方法及系统 | |
CN111325571B (zh) | 一种多任务学习的商品评论标签自动生成方法、装置及系统 | |
CN111368548A (zh) | 语义识别方法及装置、电子设备和计算机可读存储介质 | |
CN109697239B (zh) | 用于生成图文信息的方法 | |
CN104462064A (zh) | 一种移动终端信息通讯提示输入内容的方法和系统 | |
CN110188346A (zh) | 一种基于信息抽取的网络安全法案件智能研判方法 | |
CN116821307B (zh) | 内容交互方法、装置、电子设备和存储介质 | |
CN116958997B (zh) | 一种基于异质图神经网络的图文摘要方法及系统 | |
CN113392179A (zh) | 文本标注方法及装置、电子设备、存储介质 | |
CN112434142A (zh) | 一种标记训练样本的方法、服务器、计算设备及存储介质 | |
CN115238691A (zh) | 基于知识融合的嵌入的多意图识别与槽位填充模型 | |
CN117313728A (zh) | 实体识别方法、模型训练方法、装置、设备和存储介质 | |
CN113741759B (zh) | 评论信息的展示方法、装置、计算机设备和存储介质 | |
CN113869054B (zh) | 一种基于深度学习的电力领域项目特征识别方法 | |
CN117851871A (zh) | 一种境外互联网社交阵地多模态数据识别方法 | |
CN112949284A (zh) | 一种基于Transformer模型的文本语义相似度预测方法 | |
CN114547435B (zh) | 内容质量的识别方法、装置、设备及可读存储介质 | |
CN114328820A (zh) | 信息搜索方法以及相关设备 | |
CN112749553A (zh) | 视频文件的文本信息处理方法、装置和服务器 | |
CN112287690A (zh) | 基于条件句子生成和跨模态重排的手语翻译方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210921 |