CN106095746B - 文字情感辨识系统及方法 - Google Patents

文字情感辨识系统及方法 Download PDF

Info

Publication number
CN106095746B
CN106095746B CN201610382003.5A CN201610382003A CN106095746B CN 106095746 B CN106095746 B CN 106095746B CN 201610382003 A CN201610382003 A CN 201610382003A CN 106095746 B CN106095746 B CN 106095746B
Authority
CN
China
Prior art keywords
text
data
layer
linear
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610382003.5A
Other languages
English (en)
Other versions
CN106095746A (zh
Inventor
谢维容
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intelligent Technology (shanghai) Co Ltd
Original Assignee
Intelligent Technology (shanghai) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intelligent Technology (shanghai) Co Ltd filed Critical Intelligent Technology (shanghai) Co Ltd
Priority to CN201610382003.5A priority Critical patent/CN106095746B/zh
Publication of CN106095746A publication Critical patent/CN106095746A/zh
Application granted granted Critical
Publication of CN106095746B publication Critical patent/CN106095746B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种文字情感辨识系统及方法,其中,系统包括:文字接收装置,用于接收被测文字,并将被测文字转换为文字向量;神经网络层,用于对文字向量进行处理,以获得文字抽象表征数据;线性层,用于对文字抽象表征数据进行线性化,以获得线性数据;情感分析装置,用于根据线性数据计算被测文字所对应的情感标签数据,并通过情感标签数据对被测文字进行情感辨识。本发明提供的文字情感辨识系统及方法,能够使得当被测文字中不包含有情感关键词时,依旧可以对被测文字进行情感辨识。

Description

文字情感辨识系统及方法
技术领域
本发明涉及机器学习领域,尤其涉及一种文字情感辨识系统及方法。
背景技术
随着计算机技术的不断发展,情感辨识已然成为人机交互领域的重要研究内容。目前,文字情感辨识系统通常是通过先提取被测的某段文字中的情感关键词,然后再对所提取的情感关键词进行情感匹配,进而对该段文字的情感进行辨识。但是,现有的文字情感辨识系统的缺点在于,当被测的某段文字中不包含有情感关键词时,则无法判断出该段文字所呈现的情感。
发明内容
本发明要解决的技术问题是提供一种文字情感辨识系统及方法,使得当被测文字中不包含有情感关键词时,依旧可以对被测文字进行情感辨识。
为解决上述技术问题,本发明的技术方案是,
一方面,本发明提供一种文字情感辨识系统,包括:文字接收装置,用于接收被测文字,并将被测文字转换为文字向量;神经网络层,用于对文字向量进行处理,以获得文字抽象表征数据;线性层,用于对文字抽象表征数据进行线性化,以获得线性数据;情感分析装置,用于根据线性数据计算被测文字所对应的情感标签数据,并通过情感标签数据对被测文字进行情感辨识。
进一步地,神经网络层包括依次连接的第一层神经网络和第二层神经网络;第一层神经网络,接收文字向量,并对文字向量进行抽象表征,以获得第一文字抽象表征数据;第二层神经网络,接收第一文字抽象表征数据,并对第一文字抽象表征数据进行进一步抽象表征,以获得文字抽象表征数据。
进一步地,第一层神经网络为长短期记忆人工神经网络;第二层神经网络为细胞式类神经网络。
进一步地,系统采用文字抽象表征数据进行自学习。
进一步地,线性层至少有一层。
进一步地,线性层有三层,分别为第一线性层,第二线性层和第三线性层;第一线性层,接收文字抽象表征数据,并对文字抽象表征数据进行线性化处理,以获得第一线性数据;第二线性层,接收第一线性数据,并对第一线性数据进行线性化处理,以获得第二线性数据;第三线性层,接收第二线性数据,并对第二线性数据进行线性化处理,以获得线性数据。
另一方面,本发明提供一种文字情感辨识方法,包括:文字接收装置接收被测文字,并将被测文字转换为文字向量;神经网络层对文字向量进行处理,以获得文字抽象表征数据;线性层对文字抽象表征数据进行线性化,以获得线性数据;情感分析装置根据线性数据计算被测文字所对应的情感标签数据,并通过情感标签数据对被测文字进行情感辨识。
进一步地,神经网络层包括依次连接的第一层神经网络和第二层神经网络;第一层神经网络,接收文字向量,并对文字向量进行抽象表征,以获得第一文字抽象表征数据;第二层神经网络,接收第一文字抽象表征数据,并对第一文字抽象表征数据进行进一步抽象表征,以获得文字抽象表征数据。
进一步地,第一层神经网络为长短期记忆人工神经网络;第二层神经网络为细胞式类神经网络。
本发明提供的文字情感辨识系统及方法,在接收到被测文字之后,先将该被测文字转换成文字向量,再将该文字向量输入到神经网络层中进行处理以获得对应于被测文字的文字抽象表征数据,之后再将文字抽象表征数据输入到线性层中,通过线性层对文字抽象表征数据进行线性化以降低文字抽象表征数据的维度,从而获得线性数据;最后再根据线性数据计算出对应于被测文字的情感标签数据,并通过该情感标签数据与预设的情感数据进行匹配,从而实现对被测文字进行情感辨识。
本发明的文字情感辨识系统及方法,采用神经网络层和线性层对被测文字进行情感辨识,其中,神经网络层使用神经网络算法对文字向量进行处理,获得可有助于进行机器自学习的文字抽象表征数据;线性层则是对文字抽象表征数据进行线性化处理,以降低数据维度,从而降低计算复杂度。在神经网络层和线性层的共同作用下,本发明的文字情感辨识系统及方法,利用神经网络的自学习功能,无论被测文字中是否包含有情感关键词,都可以对被测文字进行情感辨识。
附图说明
图1是本发明实施例提供的一种文字情感辨识系统的框图;
图2是本发明实施例提供的一种文字情感辨识方法的流程图。
具体实施方式
下面通过具体的实施例进一步说明本发明,但是,应当理解为,这些实施例仅仅是用于更详细具体地说明之用,而不应理解为用于以任何形式限制本发明。
实施例一
结合图1,本实施例提供的文字情感辨识系统,包括:
文字接收装置1:用于接收被测文字,并将被测文字转换为文字向量;
神经网络层2:用于对文字向量进行处理,以获得文字抽象表征数据;
线性层3:用于对文字抽象表征数据进行线性化,以获得线性数据;
情感分析装置4:用于根据线性数据计算被测文字所对应的情感标签数据,并通过情感标签数据对被测文字进行情感辨识。
本发明实施例提供的文字情感辨识系统,在接收到被测文字之后,先将该被测文字转换成文字向量,再将该文字向量输入到神经网络层2中进行处理以获得对应于被测文字的文字抽象表征数据,之后再将文字抽象表征数据输入到线性层3中,通过线性层3对文字抽象表征数据进行线性化以降低文字抽象表征数据的维度,从而获得线性数据;最后再根据线性数据计算出对应于被测文字的情感标签数据,并通过该情感标签数据与预设的情感数据进行匹配,从而实现对被测文字进行情感辨识。
本发明实施例的文字情感辨识系统,采用神经网络层2和线性层3对被测文字进行情感辨识,其中,神经网络层2使用神经网络算法对文字向量进行处理,获得可有助于进行机器自学习的文字抽象表征数据;线性层3则是对文字抽象表征数据进行线性化处理,以降低数据维度,从而降低计算复杂度。在神经网络层2和线性层3的共同作用下,本发明实施例的文字情感辨识系统,利用神经网络算法的自学习功能,无论被测文字中是否包含有情感关键词,都可以对被测文字进行情感辨识。
优选地,神经网络层2包括依次连接的第一层神经网络和第二层神经网络;第一层神经网络,接收文字向量,并对文字向量进行抽象表征,以获得第一文字抽象表征数据;第二层神经网络,接收第一文字抽象表征数据,并对第一文字抽象表征数据进行进一步抽象表征,以获得文字抽象表征数据。
进一步优选地,第一层神经网络为长短期记忆人工神经网络(Long-Short TermMemory,LSTM);第二层神经网络为细胞式类神经网络(Cellular neural network,CNN)。长短期记忆人工神经网络是机器学习架构的一种,其作用在于,将文字向量转换成抽象的表征;细胞式类神经网络也是属于机器学习架构的一种,其作用在于,将通过长短期记忆人工神经网络所获得的抽象的表征再更进一步地转换成更抽象的表征。本实施采用第一层神经网络和第二层神经网络共同作用,能够更加准确地对被测文字的情感进行辨识。
优选地,系统采用文字抽象表征数据进行自学习。本实施例的系统,在对被测文字的情感进行辨识的同时,也是在进行自学习,本实施例采用长短期记忆人工神经网络获得的第一文字抽象表征数据进行自学习,同时再采用细胞式类神经网络获得的更抽象的文字抽象表征数据进行进一步的自学习,通过双重的自学习之后,能够提高整个网络层的机器自学习能力,也就是说,通过不断地对系统进行测试之后,整个系统能够准确地对被测文字的情感进行辨识。
进一步地,线性层3至少有一层。线性层3的作用在于对获得的庞大数据进行线性化,从而降低数据维度,从而降低计算复杂度。本实施例中,线性层3至少有一层,线性层3的数量越多可以将数据的维度降得更低,但是越多的线性层3则意味着在对数据进行线性化的过程具有比较大的计算量。
优选地,线性层3有三层,分别为第一线性层,第二线性层和第三线性层;第一线性层,接收文字抽象表征数据,并对文字抽象表征数据进行线性化处理,以获得第一线性数据;第二线性层,接收第一线性数据,并对第一线性数据进行线性化处理,以获得第二线性数据;第三线性层,接收第二线性数据,并对第二线性数据进行线性化处理,以获得线性数据。三个线性层既能够将数据维度降低到系统需要的维度上,又能够不因为线性化而增加过多的计算量。
实施例二
结合图2,本实施例提供的文字情感辨识方法,包括:
步骤S1:文字接收装置1接收被测文字,并将被测文字转换为文字向量;
步骤S2:神经网络层2对文字向量进行处理,以获得文字抽象表征数据;
步骤S3:线性层3对文字抽象表征数据进行线性化,以获得线性数据;
步骤S4:情感分析装置4根据线性数据计算被测文字所对应的情感标签数据,并通过情感标签数据对被测文字进行情感辨识。
本发明实施例提供的文字情感辨识方法,在接收到被测文字之后,先将该被测文字转换成文字向量,再将该文字向量输入到神经网络层2中进行处理以获得对应于被测文字的文字抽象表征数据,之后再将文字抽象表征数据输入到线性层3中,通过线性层3对文字抽象表征数据进行线性化以降低文字抽象表征数据的维度,从而获得线性数据;最后再根据线性数据计算出对应于被测文字的情感标签数据,并通过该情感标签数据与预设的情感数据进行匹配,从而实现对被测文字进行情感辨识。
本发明实施例的文字情感辨识方法,采用神经网络层2和线性层3对被测文字进行情感辨识,其中,神经网络层2使用神经网络算法对文字向量进行处理,获得可有助于进行机器自学习的文字抽象表征数据;线性层3则是对文字抽象表征数据进行线性化处理,以降低数据维度,从而降低计算复杂度。在神经网络层2和线性层3的共同作用下,本发明实施例的文字情感辨识方法,利用神经网络算法的自学习功能,无论被测文字中是否包含有情感关键词,都可以对被测文字进行情感辨识。
优选地,神经网络层2包括依次连接的第一层神经网络和第二层神经网络;第一层神经网络,接收文字向量,并对文字向量进行抽象表征,以获得第一文字抽象表征数据;第二层神经网络,接收第一文字抽象表征数据,并对第一文字抽象表征数据进行进一步抽象表征,以获得文字抽象表征数据。
进一步优选地,第一层神经网络为长短期记忆人工神经网络(Long-Short TermMemory,LSTM);第二层神经网络为细胞式类神经网络(Cellular neural network,CNN)。长短期记忆人工神经网络是机器学习架构的一种,其作用在于,将文字向量转换成抽象的表征;细胞式类神经网络也是属于机器学习架构的一种,其作用在于,将通过长短期记忆人工神经网络所获得的抽象的表征再更进一步地转换成更抽象的表征。本实施采用第一层神经网络和第二层神经网络共同作用,能够更加准确地对被测文字的情感进行辨识。
优选地,采用文字抽象表征数据进行自学习。本实施例在对被测文字的情感进行辨识的同时,也是在进行自学习,本实施例采用长短期记忆人工神经网络获得的第一文字抽象表征数据进行自学习,同时再采用细胞式类神经网络获得的更抽象的文字抽象表征数据进行进一步的自学习,通过双重的自学习之后,能够提高整个网络层的机器自学习能力,也就是说,通过不断地进行测试之后,本实施例的方法能够准确地对被测文字的情感进行辨识。
进一步地,线性层3至少有一层。线性层3的作用在于对获得的庞大数据进行线性化,从而降低数据维度,从而降低计算复杂度。本实施例中,线性层3至少有一层,线性层3的数量越多可以将数据的维度降得更低,但是越多的线性层3则意味着在对数据进行线性化的过程具有比较大的计算量。
优选地,线性层3有三层,分别为第一线性层,第二线性层和第三线性层;第一线性层,接收文字抽象表征数据,并对文字抽象表征数据进行线性化处理,以获得第一线性数据;第二线性层,接收第一线性数据,并对第一线性数据进行线性化处理,以获得第二线性数据;第三线性层,接收第二线性数据,并对第二线性数据进行线性化处理,以获得线性数据。三个线性层既能够将数据维度降低到需要的维度上,又能够不因为线性化而增加过多的计算量。
尽管本发明已进行了一定程度的描述,明显地,在不脱离本发明的精神和范围的条件下,可进行各个条件的适当变化。可以理解,本发明不限于所述实施方案,而归于权利要求的范围,其包括所述每个因素的等同替换。

Claims (7)

1.一种文字情感辨识系统,其特征在于,包括:
文字接收装置:用于接收被测文字,并将所述被测文字转换为文字向量;
神经网络层:用于对所述文字向量进行处理,以获得文字抽象表征数据;所述神经网络层包括依次连接的第一层神经网络和第二层神经网络;
所述第一层神经网络,接收所述文字向量,并对所述文字向量进行抽象表征,以获得第一文字抽象表征数据;
所述第二层神经网络,接收所述第一文字抽象表征数据,并对所述第一文字抽象表征数据进行进一步抽象表征,以获得所述文字抽象表征数据;
线性层:用于对所述文字抽象表征数据进行线性化,以获得线性数据;
情感分析装置:用于根据所述线性数据计算所述被测文字所对应的情感标签数据,并通过所述情感标签数据对所述被测文字进行情感辨识。
2.根据权利要求1所述的文字情感辨识系统,其特征在于,
所述第一层神经网络为长短期记忆人工神经网络;
所述第二层神经网络为细胞式类神经网络。
3.根据权利要求1所述的文字情感辨识系统,其特征在于,所述系统采用所述文字抽象表征数据进行自学习。
4.根据权利要求1所述的文字情感辨识系统,其特征在于,所述线性层至少有一层。
5.根据权利要求4所述的文字情感辨识系统,其特征在于,所述线性层有三层,分别为第一线性层,第二线性层和第三线性层;
所述第一线性层,接收所述文字抽象表征数据,并对所述文字抽象表征数据进行线性化处理,以获得第一线性数据;
所述第二线性层,接收所述第一线性数据,并对所述第一线性数据进行线性化处理,以获得第二线性数据;
所述第三线性层,接收所述第二线性数据,并对所述第二线性数据进行线性化处理,以获得所述线性数据。
6.一种文字情感辨识方法,其特征在于,包括:
步骤S1:文字接收装置接收被测文字,并将所述被测文字转换为文字向量;
步骤S2:神经网络层对所述文字向量进行处理,以获得文字抽象表征数据;所述神经网络层包括依次连接的第一层神经网络和第二层神经网络;
所述第一层神经网络,接收所述文字向量,并对所述文字向量进行抽象表征,以获得第一文字抽象表征数据;
所述第二层神经网络,接收所述第一文字抽象表征数据,并对所述第一文字抽象表征数据进行进一步抽象表征,以获得所述文字抽象表征数据;
步骤S3:线性层对所述文字抽象表征数据进行线性化,以获得线性数据;
步骤S4:情感分析装置根据所述线性数据计算所述被测文字所对应的情感标签数据,并通过所述情感标签数据对所述被测文字进行情感辨识。
7.根据权利要求6所述的文字情感辨识方法,其特征在于,
所述第一层神经网络为长短期记忆人工神经网络;
所述第二层神经网络为细胞式类神经网络。
CN201610382003.5A 2016-06-01 2016-06-01 文字情感辨识系统及方法 Active CN106095746B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610382003.5A CN106095746B (zh) 2016-06-01 2016-06-01 文字情感辨识系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610382003.5A CN106095746B (zh) 2016-06-01 2016-06-01 文字情感辨识系统及方法

Publications (2)

Publication Number Publication Date
CN106095746A CN106095746A (zh) 2016-11-09
CN106095746B true CN106095746B (zh) 2019-05-10

Family

ID=57446908

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610382003.5A Active CN106095746B (zh) 2016-06-01 2016-06-01 文字情感辨识系统及方法

Country Status (1)

Country Link
CN (1) CN106095746B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106779817A (zh) * 2016-11-29 2017-05-31 竹间智能科技(上海)有限公司 基于多维度信息的意图识别方法及系统
TWI661319B (zh) 2017-11-30 2019-06-01 財團法人資訊工業策進會 根據文本產生控制指令之裝置、方法及其電腦程式產品
CN108763216A (zh) * 2018-06-01 2018-11-06 河南理工大学 一种基于中文数据集的文本情感分析方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7627475B2 (en) * 1999-08-31 2009-12-01 Accenture Llp Detecting emotions using voice signal analysis
CN102831184A (zh) * 2012-08-01 2012-12-19 中国科学院自动化研究所 根据对社会事件的文字描述来预测社会情感的方法及系统
CN104573046A (zh) * 2015-01-20 2015-04-29 成都品果科技有限公司 一种基于词向量的评论分析方法及系统
CN105512687A (zh) * 2015-12-15 2016-04-20 北京锐安科技有限公司 训练情感分类模型和文本情感极性分析的方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102289514B (zh) * 2011-09-07 2016-03-30 中国科学院计算技术研究所 社会标签自动标注的方法以及社会标签自动标注器
US9263060B2 (en) * 2012-08-21 2016-02-16 Marian Mason Publishing Company, Llc Artificial neural network based system for classification of the emotional content of digital music
CN103729459A (zh) * 2014-01-10 2014-04-16 北京邮电大学 一种构建情感分类模型的方法
CN105740349B (zh) * 2016-01-25 2019-03-08 重庆邮电大学 一种结合Doc2vec和卷积神经网络的情感分类方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7627475B2 (en) * 1999-08-31 2009-12-01 Accenture Llp Detecting emotions using voice signal analysis
CN102831184A (zh) * 2012-08-01 2012-12-19 中国科学院自动化研究所 根据对社会事件的文字描述来预测社会情感的方法及系统
CN104573046A (zh) * 2015-01-20 2015-04-29 成都品果科技有限公司 一种基于词向量的评论分析方法及系统
CN105512687A (zh) * 2015-12-15 2016-04-20 北京锐安科技有限公司 训练情感分类模型和文本情感极性分析的方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
数据降维方法分析与研究;吴晓婷 等;《计算机应用研究》;20090831;第26卷(第8期);第2832页

Also Published As

Publication number Publication date
CN106095746A (zh) 2016-11-09

Similar Documents

Publication Publication Date Title
CN104503891B (zh) 对jvm线程进行在线监控的方法和装置
CN106095746B (zh) 文字情感辨识系统及方法
CN106970912A (zh) 中文语句相似度计算方法、计算装置以及计算机存储介质
CN110263009A (zh) 日志分类规则的生成方法、装置、设备及可读存储介质
CN104252531B (zh) 一种文件类型识别方法及装置
CN108171191A (zh) 用于检测人脸的方法和装置
Machado et al. A side-sensitive synthetic chart combined with an X chart
CN106600213B (zh) 一种个人简历智能管理系统及方法
CN112069787A (zh) 一种基于词嵌入的日志参数异常检测方法
CN104268289B (zh) 链接url的失效检测方法和装置
Costa et al. Monitoring the process mean and variance using a synthetic control chart with two-stage testing
Du et al. Global asymptotic stability of Markovian jumping stochastic Cohen–Grossberg BAM neural networks with discrete and distributed time-varying delays
CN107168635A (zh) 信息呈现方法和装置
Wu et al. A novel electronic nose classification prediction method based on TETCN
Hu et al. Multi-stage extreme learning machine for fault diagnosis on hydraulic tube tester
CN110275820A (zh) 页面兼容性测试方法、系统及设备
CN103163406A (zh) 基于can网络汽车仪表耐久试验台
Justo et al. Measuring the quality of annotations for a subjective crowdsourcing task
CN104980442A (zh) 一种基于元样本稀疏表示的网络入侵检测方法
CN104415976A (zh) 冷轧生产线跨机组产品质量关联分析方法
de Oliveira et al. Clustering by Similarity of Brazilian Legal Documents Using Natural Language Processing Approaches
Ahmad et al. Prediction of absorption and stripping factors in natural gas processing industries using feedforward artificial neural network
Zeng et al. Time domain subspace method for fractional order system identification
Li et al. An improved text similarity calculation algorithm based on vsm
Hu et al. A quality control approach of PVC gloves based on the integration of SPC and EPC

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant