CN111581474B - 基于多头注意力机制的涉案微博评论的评价对象抽取方法 - Google Patents

基于多头注意力机制的涉案微博评论的评价对象抽取方法 Download PDF

Info

Publication number
CN111581474B
CN111581474B CN202010254118.2A CN202010254118A CN111581474B CN 111581474 B CN111581474 B CN 111581474B CN 202010254118 A CN202010254118 A CN 202010254118A CN 111581474 B CN111581474 B CN 111581474B
Authority
CN
China
Prior art keywords
microblog
case
vector
speech
vectors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010254118.2A
Other languages
English (en)
Other versions
CN111581474A (zh
Inventor
余正涛
赵培莲
毛存礼
相艳
郭军军
黄于欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN202010254118.2A priority Critical patent/CN111581474B/zh
Publication of CN111581474A publication Critical patent/CN111581474A/zh
Application granted granted Critical
Publication of CN111581474B publication Critical patent/CN111581474B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及基于多头注意力机制的涉案微博评论的评价对象抽取方法,首先收集涉案微博正文和微博评论;标记涉案微博评论的评价对象;获取涉案微博评论的字符向量、获取词向量、名词词性相关的词性向量、上下文向量和案件要素向量;将获取的字符向量和词向量进行拼接,并采用多头注意力机制获取词性向量和上下文向量的相关性,同时计算最大的案件要素和词性向量的相似概率权重;将获取得到的拼接向量、相关性权重和最大相似度概率权重进行点乘,得到的结果作为BiLSTM模型的输入,然后经过条件随机场CRF得到最后的序列标签,即抽取结果。本发明取得了较好的抽取效果,在两个典型的涉案微博评论数据集比基线模型分别提高了1%和1.9%。

Description

基于多头注意力机制的涉案微博评论的评价对象抽取方法
技术领域
本发明涉及基于多头注意力机制的涉案微博评论的评价对象抽取方法,属于数据挖掘技术领域。
背景技术
随着自媒体时代的到来、我国新媒体的蓬勃发展和网络舆情的深入,部分法院所审理的焦点案件在网络上迅速发酵,引发社会的广泛争议,甚至左右司法审判,严重影响社会稳定。在此背景下,国家也在推行智慧法院的建设,司法部门通过实时有效的掌握并正确引导网络舆情有助于确保法院依法独立行使审判权,维护社会公平正义。而微博作为社会大众自由评论的社交媒体之一,其用户量庞大,发展较快,其中不少司法相关的案件会在微博中引起激烈讨论。因此本文采用微博中的涉案事件,即涉案微博作为本文的研究重点。故涉案微博评论的评价对象抽取旨在:针对于案件相关的微博话题评论,将评论中的评价对象抽取出来,为涉案舆情的发展趋势预测做基础性工作。
发明内容
本发明提供了基于多头注意力机制的涉案微博评论的评价对象抽取方法,以用于解决目前涉案微博评论中大众评论的评价对象与涉案不相关的问题和大众在对涉案微博评论的评价对象进行评论时表述不一致的问题。
本发明的技术方案是:基于多头注意力机制的涉案微博评论的评价对象抽取方法,所述方法的具体步骤如下:
Step1、收集涉案微博正文和微博评论,对微博评论进行去重、筛选;
作为本发明的优选方案,所述Step1中,使用Scrapy作为爬取工具,模仿用户操作,登录微博,根据页面数据的XPath路径制定模板获取涉及案件的微博正文和微博评论。
此优选方案设计是本发明的重要组成部分,主要为本发明收集语料过程,为本发明抽取微博评论中的评价对象提供了数据支撑。
Step2、根据微博正文所涉及的案件,对筛选后的微博评论设置该案件的案件要素,标记涉案微博评论的评价对象,将标记好的微博评论语料按比例分为训练语料、测试语料和验证语料;
Step3、获取涉案微博评论的字符向量,并通过jieba工具对标记后的微博评论进行分词和词性标注,然后获取词向量、名词词性相关的词性向量、上下文向量和案件要素向量;
Step4、将获取的字符向量和词向量进行拼接,并采用多头注意力机制获取词性向量和上下文向量的相关性,同时计算最大的案件要素和词性向量的相似概率权重;
Step5、将获取得到的拼接向量、相关性权重和最大相似度概率权重进行点乘,得到的结果作为BiLSTM模型的输入,然后经过条件随机场CRF得到最后的序列标签,即抽取结果。
作为本发明的优选方案,所述Step2的具体步骤为:
Step2.1、涉案微博评论的评价对象的标注体系采用了json格式的标记文本,通过json格式的文件,对涉案微博评论进行B(begin)、I(inside)和O(outside)序列标注,其中B(begin)表示评价对象的起始位置,I(inside)表示评价对象的内容,O(outside)表示微博评论中的其他部分,即标记出评价对象,并保存成json格式的文件;
Step2.2、将标记的数据集按照8:1:1的比例切分为训练集、测试集和验证集;
其中,涉及到的案件要素包括何事、何时、何地、何物和何人。
作为本发明的优选方案,所述Step3的具体步骤为:
Step3.1、采用jieba工具对标记后的微博评论进行分词,并进行词性标注,通过分词后,根据已有的微博词向量,将微博的一句评论用微博词向量进行表征。同时,对于需要抽取的评价对象一般是一些名词性实体,因此通过jieba根据对名词性相关的实体选择出来,然后通过微博将选择出来的名词性相关的词性表征出来;
Step3.2、根据目前现有的微博词向量,获取得到字符向量,以及分词后的词向量,名词词性相关的词性向量和上下文向量;
Step3.3、根据已有的微博向量获取案件要素的向量。
由图2可以看出,给定一句涉案微博评论的评论C={c1,c2...cm}(S={w1,w2...wT}),和案件要素A={a1,a2...an},其中ci表示一句评论中的第i个字,wi表示一句评论中第i个词,ai表示评论涉及的第i个案件要素。通过中文分词工具jieba可以将一句话切分成若干个词,同时利用其词性标注功能,将每句评论中名词相关的词标记出来,得到词性ePOS={n1,n2...np}。字符嵌入和词嵌入分别将构成评论的字和词表征到高维向量空间中,获得微博评论的最终表征X={x1,x2,...xT},其中字和字符都用已经预训练好的微博中文词向量来表征,POS是词性标记的简称,part of speech。
此优选方案设计是本发明的重要组成部分,主要为本发明提供向量编码的过程,结合微博词向量,进而提升模型的性能。
本发明利用双向长短记忆神经网络预测抽取评价对象,通过多头注意力机制计算词性向量和上下文的相关性,通过最大相似度概率权重计算案件要素和词向量的相似度,再输入到双向长短记忆神经网络,最后经过条件随机场预测出评价对象;其中:
作为本发明的优选方案,所述Step4的具体步骤为:
Step4.1、将得到的字符向量和词性向量通过两个高速网络分别输出两个长度相同的序列,然后再进行拼接;
Step4.2、将得到上下文向量和词性向量根据多头注意力机制的定义,即把上下文与词性表征作为输入,且都有自己的原始Value,将名词词性特征作为Query,上下文作为Key,并将Query与各个Key的相似性作为权重,计算出多头注意力机制的相关性权重;
结合词性特征以及上下文的语义信息,可以有效的缓解抽取任务中的带有前缀或者后缀的问题,而导致抽取不准确的问题。
Step4.3、根据Step3获取得到的案件要素向量和微博评论的词向量根据相似度计算公式,得到相似度概率权重,并选择出最大的概率权重。
所述Step5中,将通过词性向量和字符向量拼接后得到向量与最大相似概率权重和相关性权重进行点乘后作为BiLSTM模型的输入G={g1,g2,...gm},模型首先进入一个LSTM层,通过公式(1)计算得到遗忘门,输入门和输出门。
Figure BDA0002436598750000031
其中W是输入层到隐藏层的参数矩阵,U是隐藏层到隐藏层的自循环参数矩阵,b为偏置参数矩阵,σ为sigmoid函数。然后通过遗忘门ft和输入门it来控制忘记多少历史信息和保存多少新信息
Figure BDA0002436598750000032
从而更新内部记忆细胞状态
Figure BDA0002436598750000033
其计算公式(2)所示:
Figure BDA0002436598750000034
接着通过输出门控制输出的结果,从而得隐状态ht,如公式(3)所示:
Figure BDA0002436598750000041
在完成LSTM后,本文还从后向运行了LSTM来生成后向隐向量
Figure BDA0002436598750000042
并将前向和后向隐向量进行了拼接,记为ht,如公式(4)所示:
Figure BDA0002436598750000043
最后进入条件随机场进行抽取,其中条件随机场对模型的输出起到条件约束的作用,最后得到抽取的结果。
本发明的有益效果是:
1、本发明的基于多头注意力机制的涉案微博评论的评价对象抽取方法,利用案件要素与涉案微博评论中的评价对象的相干性,解决在涉案微博评论中,大众对于评价对象与案件不相关的问题;
2、本发明的基于多头注意力机制的涉案微博评论的评价对象抽取方法,使用多头注意力机制将词性特征与其上下文的关联性,解决了由于大众在评价中的前缀或后缀对于评价对象抽取不准确的问题。
3、本发明的基于多头注意力机制的涉案微博评论的评价对象抽取方法,结合词性、字符、词、上下文及案件要素的特征,利用BiLSTM和CRF对微博的评价对象进行抽取任务。
4、本发明的基于多头注意力机制的涉案微博评论的评价对象抽取方法,解决了涉案微博的微博评论中对于评价对象的抽取任务,且抽取效果好。
附图说明
图1为本发明评价对象抽取流程图;
图2为本发明提出的融入案件要素的评价对象抽取模型图。
具体实施方式
实施例1:如图1-2所示,基于多头注意力机制的涉案微博评论的评价对象抽取方法,所述方法的具体步骤如下:
Step1、使用Scrapy作为爬取工具,模仿用户操作,登录微博,根据页面数据的XPath路径制定模板获取涉及案件的微博正文和微博评论,例如爬取微博评论的“奔驰女车主维权案件”9万多条和“重庆坠江案件”近2.5万条进行实验研究,对微博评论进行去重、筛选;
Step2、根据微博正文所涉及的案件,对筛选后的微博评论设置该案件的案件要素,标记涉案微博评论的评价对象,将标记好的微博评论语料按比例分为训练语料、测试语料和验证语料;
Step3、获取涉案微博评论的字符向量,并通过jieba(https://github.com/fxsjy/jieba)工具对标记后的微博评论进行分词和词性标注,然后获取词向量、名词词性相关的词性向量、上下文向量和案件要素向量;
Step4、将获取的字符向量和词向量进行拼接,并采用多头注意力机制获取词性向量和上下文向量的相关性,同时计算最大的案件要素和词性向量的相似概率权重;
Step5、将获取得到的拼接向量、相关性权重和最大相似度概率权重进行点乘,得到的结果作为BiLSTM模型的输入,然后经过条件随机场CRF得到最后的序列标签,即抽取结果。
作为本发明的优选方案,所述Step2的具体步骤为:
Step2.1、涉案微博评论的评价对象的标注体系采用了json格式的标记文本,通过json格式的文件,对涉案微博评论进行B(begin)、I(inside)和O(outside)序列标注,其中B(begin)表示评价对象的起始位置,I(inside)表示评价对象的内容,O(outside)表示微博评论中的其他部分,即标记出评价对象,并保存成json格式的文件;
Step2.2、将标记的数据集按照8:1:1的比例切分为训练集、测试集和验证集;
其中,涉及到的案件要素包括何事、何时、何地、何物和何人。
作为本发明的优选方案,所述Step3的具体步骤为:
Step3.1、采用jieba工具对标记后的微博评论进行分词,并进行词性标注,通过分词后,根据已有的微博词向量,将微博的一句评论用微博词向量进行表征。同时,对于需要抽取的评价对象一般是一些名词性实体,因此通过jieba根据对名词性相关的实体选择出来,然后通过微博将选择出来的名词性相关的词性表征出来;
Step3.2、根据目前现有的微博词向量,获取得到字符向量,以及分词后的词向量,名词词性相关的词性向量和上下文向量;
Step3.3、根据选择出来的案件要素及已有的微博向量获取案件要素的向量。
以本实施例中获取得到的涉案的微博评论的典型案例,可以整理和归纳得到表1所示的案件要素:
表1案件要素表
Figure BDA0002436598750000051
Figure BDA0002436598750000061
不难看出,除了何时(时)以外,其他案件要素主要以名词相关形式(名词、动名词)出现,正是涉案微博评论中的主要评价对象,也正是监控舆情中最为关心的对象。因此本发明也可以将除了何时(时)的其他案件要素作为外部知识引导神经网络抽取出评价对象。
由图2可以看出,给定一句涉案微博评论的评论C={c1,c2...cm}(S={w1,w2...wT}),和案件要素A={a1,a2...an},其中ci表示一句评论中的第i个字,wi表示一句评论中第i个词,ai表示评论涉及的第i个案件要素。通过中文分词工具jieba可以将一句话切分成若干个词,同时利用其词性标注功能,将每句评论中名词相关的词标记出来,得到词性ePOS={n1,n2...np}。字符嵌入和词嵌入分别将构成评论的字和词表征到高维向量空间中,获得微博评论的最终表征X={x1,x2,...xT},其中字和字符都用已经预训练好的微博中文词向量来表征,POS是词性标记的简称,part of speech。
此优选方案设计是本发明的重要组成部分,主要为本发明提供向量编码的过程,结合微博词向量,进而提升模型的性能。
本发明利用双向长短记忆神经网络预测抽取评价对象,通过多头注意力机制计算词性向量和上下文的相关性,通过最大相似度概率权重计算案件要素和词向量的相似度,再输入到双向长短记忆神经网络,最后经过条件随机场预测出评价对象;其中:
作为本发明的优选方案,所述Step4的具体步骤为:
Step4.1、将得到的字符向量和词性向量通过两个高速网络分别输出两个长度相同的序列,然后再进行拼接;
Step4.2、将得到上下文向量和词性向量根据多头注意力机制的定义,即把上下文与词性表征作为输入,且都有自己的原始Value,将名词词性特征作为Query,上下文作为Key,并将Query与各个Key的相似性作为权重,计算出多头注意力机制的相关性权重;其中把上下文各个字的Value融入词性特征的原始Value中,因此通过公式(2)和公式(3)得到注意力机制输出,记为公式(1).
headi=Attention(qi,K,V) (1)
Figure BDA0002436598750000071
Figure BDA0002436598750000072
然后根据上述多头注意力机制的定义,将得到的注意力机制的结果进行拼接,如公式(4):
Multi-Head=Concat(head1,head2,...,headh)WO (4)
其中,
Figure BDA0002436598750000073
是需要学习的参数,因此上下文与词性表征进行多头注意力机制后的输出表示为公式(5):
contextpos=MHA(ePOS,econtext) (5)
其中,econtext表示上下文嵌入,ePOS表示名词相关的词性嵌入。
结合词性特征以及上下文的语义信息,可以有效的缓解抽取任务中的带有前缀或者后缀的问题,而导致抽取不准确的问题。
Step4.3、根据Step3获取得到的案件要素向量和微博评论的词向量根据相似度计算公式,得到相似度概率权重,并选择出最大的概率权重。
首先利用词嵌入和案件要素嵌入进行相似度计算,如公式(6)所示:
Figure BDA0002436598750000074
其中,S={w1,w2...wT}表示一句涉案微博的评论,A={a1,a2...an}表示涉案的案件要素。不同于注意力机制,本文直接获取涉案微博的微博评论中每个词与所有案件要素的相似度得分的最大值作为该词的概率权重,如公式(7)所示:
osim=max(similarity(S,A)) (7)
其中max表示在计算词嵌入和要素嵌入概率权重的最大值。
所述Step5中,将通过词性向量和字符向量拼接后得到向量与最大相似概率权重和相关性权重进行点乘后作为BiLSTM模型的输入G={g1,g2,...gm},模型首先进入一个LSTM层,通过公式(8)计算得到遗忘门,输入门和输出门。
Figure BDA0002436598750000081
其中W是输入层到隐藏层的参数矩阵,U是隐藏层到隐藏层的自循环参数矩阵,b为偏置参数矩阵,σ为sigmoid函数。然后通过遗忘门ft和输入门it来控制忘记多少历史信息和保存多少新信息
Figure BDA0002436598750000082
从而更新内部记忆细胞状态
Figure BDA0002436598750000083
其计算公式(9)所示:
Figure BDA0002436598750000084
接着通过输出门控制输出的结果,从而得隐状态ht,如公式(10)所示:
Figure BDA0002436598750000085
在完成LSTM后,本文还从后向运行了LSTM来生成后向隐向量
Figure BDA0002436598750000086
并将前向和后向隐向量进行了拼接,记为ht,如公式(11)所示:
Figure BDA0002436598750000087
最后进入条件随机场进行抽取,其中条件随机场对模型的输出起到条件约束的作用,最后得到抽取的结果。
为了探究本发明抽取涉案微博评论的评价对象方法的有效性,本文采用了五个模型进行比较,包括传统的机器学习方法:隐马尔科夫模型(HMM)和条件随机场模型(CRF),基于深度学习的方法:迭代扩张卷积神经网络模型(IDCNN)、双向Long-Short-Term网络(BiLSTM)和双向Long-Short-Term网络加条件随机场模型(BiLSTM_CRF)。其中,实验采用准确率(Pre)、召回率(Rec)、和F1值(F1_score)作为评价指标进行对比实验。实验结果如表2所示。
表2不同方法的实验结果
Figure BDA0002436598750000088
从表2中可以看出,本文提出的方法在两个数据集分别较基线模型BiLSTM-CRF提高了1%和1.9%。其中不管是在“重庆坠江案”,还是在“奔驰维权案”中基于隐马尔可夫模型方法的效果都不是很理想,而条件随机场的模型则取得了不错的效果,甚至比目前基于卷积神经网络的模型(迭代扩张卷积神经网络和卷积神经网络)方法还好。本文认为主要的原因可能是虽然卷积神经网络在提取局部特征中的效果较好,但是针对某些涉案微博中的评价对象的表述不同所导致的提取的特征不全。而基于长短时记忆网络的方法的优势在于能够最大化表征短文本的特征,从实验结果中也能看出双向长短时记忆网络的模型效果要优于基于卷积神经网络的方法。且本文的方法则在双向长短时记忆网络基础上加入词性特征和案件要素的表征,更加突出涉案微博的数据集中评价对象的特征,因此比基线模型的效果有所提高。
同时为了验证文本所提出的两层模型,本文也分别做了各层的有效性实验,具体实验结果如表3所示,其中MHA-表示将多头注意力机制层去掉后的实验结果,同理,CE-表示将案件知识融入层去掉的实验结果。
表3模型各层有效性实验结果
Figure BDA0002436598750000091
从表3可知,本文提出的多头注意力机制层和案件要素层均有不错的效果。在基线模型BiLSTM-CRF的基础上,仅加入案件知识融入层(MHA-),在两个涉案微博的评论数据集中比基线模型分别提高了0.5%和1%。而仅加入多头注意力层(CE-),在两个涉案微博的评论数据集中分别提高了0.4%和1.5%。因此,本文提出的两个方法对涉案微博评论的评价对象抽取任务均有提升作用,且将方法结合后,对于评价对象的抽取更加有效,分别提高了1%和1.9%。
上面结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims (5)

1.基于多头注意力机制的涉案微博评论的评价对象抽取方法,其特征在于:
所述方法的具体步骤如下:
Step1、收集涉案微博正文和微博评论,对微博评论进行去重、筛选;
Step2、根据微博正文所涉及的案件,对筛选后的微博评论设置该案件的案件要素,标记涉案微博评论的评价对象,将标记好的微博评论语料按比例分为训练语料、测试语料和验证语料;
Step3、获取涉案微博评论的字符向量,并通过jieba工具对标记后的微博评论进行分词和词性标注,然后获取词向量、名词词性相关的词性向量、上下文向量和案件要素向量;
Step4、将获取的字符向量和词向量进行拼接,并采用多头注意力机制获取词性向量和上下文向量的相关性,同时计算案件要素和词向量的最大相似概率权重;
Step5、将获取得到的拼接向量、相关性权重和最大相似度概率权重进行点乘,得到的结果作为BiLSTM模型的输入,然后经过条件随机场CRF得到最后的序列标签,即抽取结果。
2.根据权利要求1所述的基于多头注意力机制的涉案微博评论的评价对象抽取方法,其特征在于:所述Step1中,使用Scrapy作为爬取工具,模仿用户操作,登录微博,根据页面数据的XPath路径制定模板获取涉及案件的微博正文和微博评论。
3.根据权利要求1所述的基于多头注意力机制的涉案微博评论的评价对象抽取方法,其特征在于:所述Step2的具体步骤为:
Step2.1、涉案微博评论的评价对象的标注体系采用了json格式的标记文本,分别针对涉案微博评论的评价对象,涉及的案件要素进行标记,并保存成json格式的文件;
Step2.2、将标记的数据集按照8:1:1的比例切分为训练集、测试集和验证集;
其中,涉及到的案件要素包括何事、何时、何地、何物和何人。
4.根据权利要求1所述的基于多头注意力机制的涉案微博评论的评价对象抽取方法,其特征在于:所述Step3的具体步骤为:
Step3.1、采用jieba工具对标记后的微博评论进行分词,并进行词性标注,同时将名词和名词性相关的实体选择出来;
Step3.2、根据目前现有的微博词向量,获取得到字符向量,以及分词后的词向量,名词词性相关的词性向量和上下文向量;
Step3.3、根据目前现有的微博词向量获取案件要素的向量。
5.根据权利要求1所述的基于多头注意力机制的涉案微博评论的评价对象抽取方法,其特征在于:所述Step4的具体步骤为:
Step4.1、将得到的字符向量和词向量通过两个高速网络分别输出两个长度相同的序列,然后再进行拼接;
Step4.2、将得到的上下文向量和词性向量根据多头注意力机制的定义,即把上下文与词性表征作为输入,且都有自己的原始Value,将名词词性向量作为Query,上下文作为Key,并将Query与各个Key的相似性作为权重,计算出多头注意力机制的相关性权重;
Step4.3、根据Step3获取得到的案件要素向量和微博评论的词向量根据相似度计算公式,得到相似度概率权重,并选择出最大的概率权重。
CN202010254118.2A 2020-04-02 2020-04-02 基于多头注意力机制的涉案微博评论的评价对象抽取方法 Active CN111581474B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010254118.2A CN111581474B (zh) 2020-04-02 2020-04-02 基于多头注意力机制的涉案微博评论的评价对象抽取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010254118.2A CN111581474B (zh) 2020-04-02 2020-04-02 基于多头注意力机制的涉案微博评论的评价对象抽取方法

Publications (2)

Publication Number Publication Date
CN111581474A CN111581474A (zh) 2020-08-25
CN111581474B true CN111581474B (zh) 2022-07-29

Family

ID=72111494

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010254118.2A Active CN111581474B (zh) 2020-04-02 2020-04-02 基于多头注意力机制的涉案微博评论的评价对象抽取方法

Country Status (1)

Country Link
CN (1) CN111581474B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112287197B (zh) * 2020-09-23 2022-07-19 昆明理工大学 动态记忆案件描述的涉案微博评论讽刺句检测方法
CN112256866B (zh) * 2020-09-25 2021-09-03 东北大学 一种基于深度学习的文本细粒度情感分析算法
CN112561718A (zh) * 2020-11-16 2021-03-26 昆明理工大学 基于BiLSTM权重共享的案件微博评价对象情感倾向性分析方法
CN112541340B (zh) * 2020-12-18 2021-11-23 昆明理工大学 基于变分双主题表征的弱监督涉案微博评价对象识别方法
CN112800229B (zh) * 2021-02-05 2022-12-20 昆明理工大学 基于知识图嵌入的涉案领域的半监督方面级情感分析方法
CN112926336A (zh) * 2021-02-05 2021-06-08 昆明理工大学 基于正文评论交互式注意力的微博案件方面级观点识别方法
CN112905777B (zh) * 2021-03-19 2023-10-17 北京百度网讯科技有限公司 一种扩展问推荐方法、装置、电子设备及存储介质
CN113901210B (zh) * 2021-09-15 2022-12-13 昆明理工大学 利用局部多头注意力机制融合词-音节对的泰文和缅甸文词性标注方法
CN113901172B (zh) * 2021-09-16 2024-04-26 昆明理工大学 基于关键词结构编码的涉案微博评价对象抽取方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104268160A (zh) * 2014-09-05 2015-01-07 北京理工大学 一种基于领域词典和语义角色的评价对象抽取方法
CN104915443A (zh) * 2015-06-29 2015-09-16 北京信息科技大学 一种中文微博评价对象的抽取方法
WO2015192734A1 (en) * 2014-06-18 2015-12-23 Tencent Technology (Shenzhen) Company Limited Information processing method and apparatus
CN106569998A (zh) * 2016-10-27 2017-04-19 浙江大学 一种基于Bi‑LSTM、CNN和CRF的文本命名实体识别方法
CN109086340A (zh) * 2018-07-10 2018-12-25 太原理工大学 基于语义特征的评价对象识别方法
CN110516067A (zh) * 2019-08-23 2019-11-29 北京工商大学 基于话题检测的舆情监控方法、系统及存储介质
CN110619124A (zh) * 2019-09-19 2019-12-27 成都数之联科技有限公司 一种结合注意力机制与双向lstm的命名实体识别方法及系统
CN110866401A (zh) * 2019-11-18 2020-03-06 山东健康医疗大数据有限公司 基于注意力机制的中文电子病历命名实体识别方法及系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015192734A1 (en) * 2014-06-18 2015-12-23 Tencent Technology (Shenzhen) Company Limited Information processing method and apparatus
CN104268160A (zh) * 2014-09-05 2015-01-07 北京理工大学 一种基于领域词典和语义角色的评价对象抽取方法
CN104915443A (zh) * 2015-06-29 2015-09-16 北京信息科技大学 一种中文微博评价对象的抽取方法
CN106569998A (zh) * 2016-10-27 2017-04-19 浙江大学 一种基于Bi‑LSTM、CNN和CRF的文本命名实体识别方法
CN109086340A (zh) * 2018-07-10 2018-12-25 太原理工大学 基于语义特征的评价对象识别方法
CN110516067A (zh) * 2019-08-23 2019-11-29 北京工商大学 基于话题检测的舆情监控方法、系统及存储介质
CN110619124A (zh) * 2019-09-19 2019-12-27 成都数之联科技有限公司 一种结合注意力机制与双向lstm的命名实体识别方法及系统
CN110866401A (zh) * 2019-11-18 2020-03-06 山东健康医疗大数据有限公司 基于注意力机制的中文电子病历命名实体识别方法及系统

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Bidirectional LSTM-CRF Models for Sequence Tagging;Zhiheng Huang 等;《arXiv.org/pdf/1508.01991v1.pdf》;20150809;1-10 *
Character-based BiLSTM-CRF incorporating POS and Dictionaries for Chinese opinion target extraction;Yanzeng Li 等;《Proceedings.mlr.press/v95/li18d.pdf》;20181231;1-16 *
opinion target extraction in Chinese news comments;Ma T 等;《aclanthology.org/C10-2090.pdf》;20101231;1-9 *
Towards open intent discovery for conversational text;Nikhita Vedula 等;《arXiv.org/pdf/1904.08524.pdf》;20190101;1-11 *
基于双嵌入卷积神经网络的涉案微博评价对象抽取;王晓涵 等;《计算机科学》;20211209;第48卷(第12期);319-323 *
面向案件相关微博评论的细粒度情感分析;王晓涵;《中国优秀硕士学位论文全文数据库 (信息科技辑)》;20210715;I138-726 *

Also Published As

Publication number Publication date
CN111581474A (zh) 2020-08-25

Similar Documents

Publication Publication Date Title
CN111581474B (zh) 基于多头注意力机制的涉案微博评论的评价对象抽取方法
AU2019263758B2 (en) Systems and methods for generating a contextually and conversationally correct response to a query
CN107229610B (zh) 一种情感数据的分析方法及装置
CN111241294B (zh) 基于依赖解析和关键词的图卷积网络的关系抽取方法
CN106649260B (zh) 基于评论文本挖掘的产品特征结构树构建方法
CN109800310B (zh) 一种基于结构化表达的电力运维文本分析方法
CN114020862B (zh) 一种面向煤矿安全规程的检索式智能问答系统及方法
CN112183094B (zh) 一种基于多元文本特征的中文语法查错方法及系统
CN110765277B (zh) 一种基于知识图谱的移动端的在线设备故障诊断方法
CN104765769A (zh) 一种基于词矢量的短文本查询扩展及检索方法
CN111914062B (zh) 一种基于关键词的长文本问答对生成系统
CN107180026B (zh) 一种基于词嵌入语义映射的事件短语学习方法及装置
WO2024131111A1 (zh) 一种智能写作方法、装置、设备及非易失性可读存储介质
Saravanan et al. Improving legal document summarization using graphical models
CN113377897B (zh) 基于深度对抗学习的多语言医疗术语规范标准化系统及方法
Shekhawat Sentiment classification of current public opinion on BREXIT: Naïve Bayes classifier model vs Python’s TextBlob approach
CN115017903A (zh) 文档层次结构联合全局局部信息抽取关键短语方法及系统
CN115422371A (zh) 一种基于软件测试知识图谱的检索方法
CN113934835A (zh) 结合关键词和语义理解表征的检索式回复对话方法及系统
CN112597768B (zh) 文本审核方法、装置、电子设备、存储介质及程序产品
CN110110137A (zh) 一种确定音乐特征的方法、装置、电子设备及存储介质
CN114943216B (zh) 基于图注意力网络的案件微博属性级观点挖掘方法
CN113901172B (zh) 基于关键词结构编码的涉案微博评价对象抽取方法
CN115840815A (zh) 基于指针关键信息的自动摘要生成方法
CN116108840A (zh) 一种文本细粒度情感分析方法、系统、介质和计算设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant