CN105740224A - 一种基于文本分析的用户心理预警方法与装置 - Google Patents
一种基于文本分析的用户心理预警方法与装置 Download PDFInfo
- Publication number
- CN105740224A CN105740224A CN201410755787.2A CN201410755787A CN105740224A CN 105740224 A CN105740224 A CN 105740224A CN 201410755787 A CN201410755787 A CN 201410755787A CN 105740224 A CN105740224 A CN 105740224A
- Authority
- CN
- China
- Prior art keywords
- user
- emotion
- sentence
- text
- psychology
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于文本分析的用户心理预警方法,包括获取用户相关的所有言论文本内容;然后对该文本采用基于句级情绪分析方法计算该用户的情绪指数;同时也对该用户的文本内容采用基于文本余弦相似度的方法对用户心理情绪分类;然后根据用户情绪指数和情绪类型进行心理评估和预警;最后展示用户心理评估和预警结果。本发明还公开了与上述方法相应的用户心理预警装置。本发明能够自动从用户大量散乱的文字信息中定量分析用户情绪,并综合用户情绪类型两方面因素,从而为实现提早干预有严重心理问题的用户提供指引和决策支持。
Description
技术领域
本方面涉及互联网应用与心理学应用两方面领域,特别是涉及一种基于文本分析的用户心理预警方法与及其相应的装置。
背景技术
心理健康问题目前正广泛的影响所有人的工作和生活,据统计目前70%的人都处于心理亚健康状况,严重的甚至出现了各种极端的事件,比如跳楼、自杀,然后实际上出现这些情况的人在事件发生前都会相应的症状表现,比如情绪低落等。
前广泛应用的博客、公众微博、微信、论坛、企业内部微博的社交平台都真实的记录大众用户的表现,针对这些内容做深度文本分析处理,及时发现问题用户,或者对可能发生问题的用户做预警处理具有明显的现实意义。比如2011年10月23日北京一位女模特微博上直播吞药自杀,最后在众多网友和警方的介入下成功获救。
传统的计算机辅助心理咨询的研宄大多建立专家系统基础上,以人机互动的模式开展,即研宄对象在被告知的情况下主动配合心理工作者在系统上输入症状,经过系统判断产生文字结果,然而现实不允许这样,这样也不能主动的发现有问题的用户。
基于网络文本的情感分析,也被称为观点挖掘、观点分析、主客观分析等,情感分析的目的是从文本中挖掘用户表达的观点以及情感极性。情感分析目前主要的研究技术分为两个方向:一类是采用情感词典与规则相结合的方法;另一类是采用机器学习的方法,使用朴素贝叶斯、最大摘、支持向量机等分类器来进行情感分类。一般将两类研究结合使用的比较少。
另一方面,目前基于情感词典进行情感极性判断基本只是考虑通用情绪词,有部分研究考虑句式的,但是其对句式的理解表达有误,尚未有研究考虑到句子的完整结构:情绪词、程度词、否定词,以及句子的句型、句式对情绪的影响。
发明内容
本发明实施方式提出一种基于文本分析的用户心理预警方法,能够自动从用户大量散乱的文字信息中定量的分析用户的情绪,并综合用户情绪类型两方面因素,从而为实现提早干预有严重心理问题的用户提供指引和决策支持。
本发明实施方式还提出一种基于文本分析的用户心理预警方法的装置,能够自动从用户大量散乱的文字信息中定量的分析用户的情绪,并综合用户情绪类型两方面因素,从而为实现提早干预有严重心理问题的用户提供指引和决策支持。本发明实施方式的具体方案如下:
一种基于文本分析的用户心理预警方法,该方法包括:
获取用户相关的所有言论文本内容;
然后对用户文本采用基于句级情绪分析方法计算该用户的情绪指数,其特征在于从三个维度考虑用户的言论文本内容情绪指数,整合以后得到用户的情绪指数;
同时也对该用户的文本内容采用基于文本余弦相似度的方法对用户心理情绪分类;
然后根据用户情绪指数和情绪类型进行心理评估和预警;
最后展示用户心理评估和预警结果。
一种用户心理预警装置,其特征在于,该装置包括:获取用户文本内容单元、用户情绪指数计算单元、用户心理情绪分类单元、用户进行心理评估与预警单元、结果展示单元、公共词典库,其中:
获取用户文本内容单元,用于通过爬虫、接口或者数据库直接得到等方式获取用户相关的所有文本内容,其来源可以是博客、微博、微信、论坛等各种环境;
用户情绪指数计算单元,用于基于句级情绪分析方法,从三个维度考虑用户的言论文本内容情绪指数,整合以后得到用户的情绪指数;
用户心理情绪分类单元,用于基于用户情绪关键词向量和基本情绪关键词向量的余弦相似度方法判断该用户的情绪类别;
用户心理评估与预警单元,基于用户的情绪指数和情绪类别,判断用户的心理状态,得到用于心理评估结果,并判断是否进行心理预警;
结果展示单元,用于展示用户的心理评估结果;
公共词典库,用于存储以上单元需要使用的极性词典、否定词典、程度词典、分词词典、停用词词典等词典信息。
从上述技术方案可以看出,在发明实施方案中,首先是获取用户的言论文本内容;对于此用户文本内容,分别采用基于句级情绪分析方法计算该用户的情绪指数和采用文本余弦相似度计算方式对该用户进行心理情绪分类,然后根据用户情绪指数和情绪类型进行心理评估和预警,最后将结果呈现给用户。由此可见,应用本实施方案方式以后,实现了对用户的心理预警和评估的自动化,避免了用户的主动参与,能及早发现问题。
本发明的实施方式,综合了情绪分类的定性判定和情绪指数的定量判定两种模式,并且在情绪指数的定量计算中从三个维度整合用户情绪指数,实现了高精度的自动情绪分析,提高了用户心理预警的准确度。
附图说明
图1为根据本发明实施方式的基于文本分析的用户心理预警方法流程图;
图2为根据本发明实施方式的获取用户的文本内容流程图;
图3为根据本发明实施方式的基于句级情绪分析方法计算该用户的情绪指数流程图;
图4为根据本发明实施方式的程度词分级及权重示例图;
图5为根据本发明实施方式的句基础情感指数计算规则;
图6为根据本发明实施方式的各类复合句类型的关键词示例;
图7为根据本发明实施方式的基于文本余弦相似度的判断用户心理情绪分类流程图;
图8为根据本发明实施方式的用户心理评估与预警流程图;
图9为根据本发明实施方式的基于文本分析的用户心理预警的装置结构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步
的详细描述。
在本发明实施方式中,从心理预警实现模式和自然语言处理算法方面,对现有实现技术方案进行改进。
请参阅图1,图1为根据本发明的基于文本分析的用户心理预警方法的流程图。
如图1所示,该方法包括:
步骤101:获取用户文本内容;
步骤102:基于句级情绪分析情绪指数计算方法计算用户情绪指数;
步骤103:基于文本余弦相似度的判断用户心理情绪分类;
步骤104:综合用户的情绪指数和情绪类型,对用户进行心理评估与预警;
步骤105:展示用户心理评估和预警结果。
在一个实施方式中,获取用户文本内容具体包括:获取用户相关的所有言论文本内容,这个来源可以是微博或者微信或者论坛等各种途径的文本数据,其来源方式可以是爬虫或者来源于数据库或者来源于API调用获取。然后建立该用户的时间-文档列表,最后输出用户的文本内容。
在一个实施方式中,基于句级情绪分析情绪指数计算方法计算用户情绪指数包括:对用户文本内容分句;对句子进行分词处理,建立句-词矩阵;对句-词矩阵进行处理,构建句-词频矩阵;基于情绪词典,对句-词频矩阵进行情绪词匹配,计算句基础情绪指数;基于句-词频矩阵,通过关键字分析句子句型,计算句-基于句型的基础情绪指数;基于句-词频矩阵,通过标点符号,分析句子句类,计算句-情绪指数;综合各个句子的情绪指数,依据篇章情感值计算规则计算该用户的情绪指数。
在一个实施方式中,基于文本余弦相似度的判断用户心理情绪分类包括,本分类方法原理是首先用TF-IDF方法提取用户文档情绪关键词,然后再用文本余弦相似度方法来判断用户的情绪类型。具体过程包括:获取用户时间-文档列表;对用户时间-文档文本数据进行预处理;执行文本特征项选择与加权处理,建立每个时间文档的TF-IDF向量;选取每个时间文档的TF-IDF向量中值最高的前5个构成集合作为用户情感关键字;建立用户情感关键字词频向量;计算用户情感关键字词频向量与基准情绪类型词频向量的余弦相似度;判断用户的情绪类型
在一个实施方式中,综合用户的情绪分类和情绪指数,对用户进行心理评估与预警包括:获取用户的情绪指数;获取用户的情绪分类;根据用户的情绪指数和分类进行心理预警,如果用户的情绪属于愤怒、悲伤、恐惧、厌恶,且情绪指数为负数时,则对该用户进行心理预警。
在一个实施方式中,展示用户心理评估和预警结果包括通过图形界面的方式展示用户的心理预警情况和情绪指数,如果要对用户做出心理预警,则给出相应的建议。
图2为根据本发明实施方式的获取用户的文本内容流程图。
如图2所示,该方法包括:
步骤201:选定用户。
步骤202:获取用户文本内容。
在这里用户文本内容的来源可以是博客或者微博或者微信或者论坛等各种途径的文本数据,其来源方式可以是爬虫或者来源于数据库或者来源于API调用获取。本发明不做具体的限制。
步骤203:建立该用户的时间-文档列表;
这里的时间单位可以是日、周、月。
步骤204:输出用户的文档数据。
图3为根据本发明实施方式基于句级情绪分析情绪指数计算方法计算用户情绪指数流程图。
如图3所示,该方法包括:
步骤301:输入用户文本内容。
步骤302:文本分句处理。
在这里,主要是依据标点符号对文本段落进行分句处理,形成一句的话,为后续的句级情绪指数计算做准备。在这里进行分句的依据的标点符号主要是考虑指句号,感叹号,问号三种过这三种符号进行断句。如果一句话内存在逗号的情况,在每一句内在再依据逗号分句,并建立这两句话之间的关联关系。
步骤303:对句子进行分词处理,建立句-词矩阵;
在这里,利用汉语词法分析系统ICTCLAS的分词方法进行文本进行分词操作,建立句-词矩阵,特别要注意的是这里每句话中的标点符号都要记录在矩阵中,不得删除。
步骤304:对句-词矩阵进行处理,得到句-词频矩阵;
在这里,主要是对句-词矩阵做统计操作,得到句-词频矩阵。
步骤305:基于情绪词典,进行情感词匹配,计算句基础情绪指数;
本发明所述情绪词典包括极性词典、副词词典和否定词词典,其中极性词典是指本发明综合台湾大学整理的NTUSD中文情感极性词典、大连理工大学徐琳宏和林鸿飞等构建的情感本体词汇、以及知网Hownet情感极性词典三种词典,将三种词典整合在一起,形成了本发明的正面和负面情绪极性词典;以上建立的词典称为极性词典,较少考虑修饰词典,实际上中文中的修饰词对情感结果又很大的影响,主要包括否定副词和程度副词。为此本发明在知网Howne词典和中国现代汉语词典的基础上自建了程度词词库和否定词词库。本发明所述否定词的权重定为-1,常见的否定词有:不、没有、不要、不必、不曾、没、莫、勿、不用、不是等。本发明所述程度词根据对情感强化的程度不一样,分为I、II、III、IV级,I级表示强化程度最高,IV级表示强化程度最低,每级指定不同的权重系数,如图4所示。
本发明所述进行情感词匹配包括分词后的极性词匹配、程度词匹配、副词匹配,匹配方式采用完全一致匹配模式,即句-词频矩阵里面的词与三种词典的词完全匹配。
本发明所述的计算句基础情绪指数时的主要依据是本发明所制定的句基础情感指数计算规则,具体规则模式如图5所示。规则认为中文句子主要有5种模式,在这里用P表示极性词,D表示程度词,N表示否定词,5种模式分别表示为P,DP,NP,DNP,NNP,这样在计算句基础情绪指数时就可以依据这5中模式计算,在这里用表示极性词的权重指数,用表示否定词的权重指数,用表示程度词的权重指数。那么对于P模式的句基础情绪指数就为,对于DP模式的句基础情绪指数为,对于NP模式的句基础情绪指数为,对于DNP模式的句基础情绪指数为,对于DDP模式的句情绪指数为。
步骤306:基于句-频矩阵,分析句子句型,计算句-基于句型的基础情绪指数。
本发明所述句型指的是句子的结构,可以分为单句和复句。其中单句是指不包含分句的句子,常由一个主谓短语构成,也可由一个词或其他短语构成;复句是由两个或者以上的单句组成,通常包含一些关联词如“虽然...但是..."、“如果”、"假如”等等。本发明认为常用的影响句子的情绪指数的复句类型有:并列关系、递进关系、转折关系、假设关系、因果关系、选择关系、条件关系。其中递进关系会增强情绪,而条件和假设关系则会削弱情绪指数。
本发明所述分析句子句型主要是根据在步骤302所述的基础上,考虑两个有关联之间的子句,然后依据5种类型的关键字进行复合句类型判断。各类的复合句类型的关键词如图6所示。
本发明所述计算句-基于句型的基础情绪指数是指在单句的句基础情绪指数的基础上,依据复合句情绪指数计算规则计算句-基于句型的基础情绪指数。复合句情绪指数计算规则表述如下:
设表示复合句内单句1和单句2的情感指数,设由单句1和单句2组成的复合句的情感指数表示为,那么如果复合句为并列、因果关系类型的话,则有;如果复合句类型为递进关系的话,那么;如果复合句类型为条件或假设关系的话,那么;如果复合句类型为转折关系的话,那么。
步骤307:基于句-词频矩阵,分析句子句类,计算句-情绪指数;
本发明所述句子句类指的是句子的语气,常见句类有陈述句、疑问句、感叹句、祈使句等,本发明认定句类其对句子情绪的影响是:对于陈述句句子整体的情绪倾向不会发生变化;疑问句系统将直接判断其情绪倾向为负;感叹句有加强语气的作用,所以在句子整体的情绪倾向上有加倍的作用。
本发明所述分析句子句类,指的是在句-词频矩阵中,依据标点符号判断句子句类,如果标点符号是“!”则判定为感叹句;如果标点符号是“?”则判定为疑问句;对于陈述句由于对句子整体情绪倾向不改变,因此不做判断。
本发明所述计算句-情绪指数是在句-基于句型的基础情绪指数上,先判断句子的句类,如果句类为疑问句,则句-情绪指数=-句-基于句型的基础情绪指数;如果句类为感叹句,则句-情绪指数=2*句-基于句型的基础情绪指数。
步骤308:依据篇章情感值计算规则计算该用户的情绪指数。
本发明所述篇章情感值计算规则是指在句-情绪指数基础上计算整个文档的情绪指数,而这里的整个文档情绪指数即为用户的情绪指数。篇章情感值计算规则如下公式所列。
图7为根据本发明实施方式的基于文本余弦相似度的判断用户心理情绪分类流程图。
如图7所示,该方法包括:
步骤701:获取用户时间-文档列表。
本步骤的输入来源步骤203所述的用户的时间-文档列表,在这里所有了用户的所有相关文本文档。
步骤702:对用户时间-文档文本数据进行预处理。
本发明所述对用户文本数据进行预处理具体包括分词和去停用词。在这里,利用汉语词法分析系统ICTCLAS的分词方法进行文本进行分词操作,然后按照停用词表中的词语将语料中对文本内容识别意义不大但出现频率很高的词、符号、标点及乱码等去掉。其操作过程为查看每一个分词后的词语,看其是否位于停用词列表中,如果是则将其从词条串中删除。本发明所述停用词语料库即采用ICTCLAS所提供的语料库。
步骤703:执行文本特征项选择与加权处理,建立每个时间文档的TF-IDF向量;
本发明所述执行文本特征项选择与加权处理主要是指根据步骤702中剩余的词的频度确定若干关键词,频度计算参照TF公式,而加权是针对每个关键词对文本特征的体现效果大小不同而设置的机制,权值计算参照IDF公式。在这里词频(TF)指的是某一个给定的词语在该文件中出现的频率。逆向文件频率(IDF)是一个词语普遍重要性的度量。某一特定词语的IDF,可以由总文件数目除以包含该词语之文件的数目,再将得到的商取对数得到。
在这里用表示词语i在文档j中的词频,计算如下
式中表示即词语i在文档j中出现次数和表示文档j中总词数。
在这里用表示词语i的逆向文件频率IDF,计算如下
式中N表示文档的数量,表示在所有文档中包括词语i的文档数量。
基于以上分析,对文档j中词语i的tf-idf计算如下:
本发明所述建立每个时间文档的TF-IDF向量是指在分别计算TF和IDF的值之后,将这两个值执行乘法操作,得到每一个词的TF-IDF值,从而得到一个与每个时间段的TF-IDF向量。
步骤704:选取每个时间文档的TF-IDF向量中值最高的前5个构成集合作为用户情感关键字。
步骤705:建立用户情感关键字词频向量。
本步骤是在步骤704所构建的用户情感关键字集合的基础上做词频统计,建立用户情感关键字词频向量。
步骤706:计算用户情感关键字词频向量与基准情绪类型词频向量的余弦相似度
本发明所述基准情绪类型主要借鉴Ekman所提出的6种基本情感(包括:高兴、愤怒、厌恶、恐惧、悲伤、惊奇),并加上“平静”类型构成本发明所述的7种基准情绪类型。
本发明所述基准情绪类型词频向量是指对7种基准情绪构建其所属的关键词,然后针对关键词建立每种基准情绪的词频向量。具体示例参考以下表格
本发明所述计算用户情感关键字词频向量与基准情绪类型词频向量的余弦相似度指的是依据以下公式计算用户情感关键字词频向量与7中基准情绪类型词频向量的余弦相似度。
假定A和B是表示两个文档的n维向量,A是[A1,A2,...,An],B是[B1,B2,...,Bn],则A与B的夹角θ的余弦等于:
余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似。
步骤707:判断用户的情绪类型;
本发明所述判断用户的情绪类型是指基于步骤706所得到的用户情感关键字词频向量与其他7种基准情绪类型词频向量的余弦值,将这7个余弦值进行排序,本发明判定余弦值最小对于的基准情绪类型为该用户的情绪类型。
综上,本发明所述的用户心理情绪分类采用的原理是首先用TF-IDF提取用户文档情绪关键词,然后再用文本余弦相似度方法来判断用户的情绪类型。
图8为根据本发明实施方式的用户心理评估与预警流程图。
如图8所示,该方法包括:
步骤801:获取用户的情绪指数;
本发明所述获取用户的情绪指数是指获取步骤308得到的用户的情绪指数。
步骤802:获取用户的情绪类型;
本发明所述获取用户的情绪类型是指获取步骤707得到的用户情绪类型。
步骤803:根据用户的情绪指数和类型进行心理评估和预警,如果用户的情绪属于愤怒、悲伤、恐惧、厌恶,且情绪指数为负数时,则对该用户进行心理预警。
本发明方法所述心理评估和预警主要是综合用户的情绪指数和情绪类型两方面的因素进行用户的心理判断。
本发明方法所述的评估和预警准则叙述如下:
如果用户的情绪指数为正,表明用户近段时间属于正面情绪,指数越高,表示正面情绪越大;如果用户的情绪指数为负,表明用户近段时间属于负面情绪,指数越高,表示负面情绪越严重。
在这里,本发明将7种基本情绪分成两大类,一类是正面情绪,一类是负面情绪,其中高兴、惊奇、平静属于正面情绪,愤怒、厌恶、恐惧、悲伤属于负面情绪。
在对用户进行心理评估时:
首先判断用户的情绪指数正负情况,如果为正,且情绪类型也是高兴、惊奇、平静三种之一,表明用户的心理状态正常,不需要额外关注。
判断用户的情绪指数正负情况,如果为正,但情绪类型为愤怒、厌恶、恐惧、悲伤四种之一,表明用户的心理状态不正常,则继续关注用户情绪指数大小,如果值接近于0,表明该用户需要关注,否则不需要额外关注。
判断用户的情绪指数正负情况,如果为负,但情绪类型为高兴、惊奇、平静三种之一,则继续关注用户情绪指数值大小,如果值接近于0,表明该用户不需要关注,否则需要关注。
判断用户的情绪指数正负情况,如果为负,但情绪类型为愤怒、厌恶、恐惧、悲伤四种之一,表明该用户的心理状态不正常,需要密切关注,如果情绪指数负值越大,则需要关注度越高。
图9为根据本发明实施方式的基于文本分析的用户心理预警的装置结构图。
该装置包括:获取用户文本内容单元901、用户情绪指数计算单元902、用户心理情绪分类单元903、用户心理评估与预警单元904、结果展示单元905、公共词典库906,其中:
获取用户文本内容单元901,用于通过爬虫、接口或者数据直接得到等方式获取用户相关的所有文本内容,其来源可以是微博、微信、论坛等各种环境;
用户情绪指数计算单元902,用于基于句级情绪分析方法计算该用户的情绪指数;
用户心理情绪分类单元903,用于基于用户情绪关键词向量和基本情绪关键词向量的余弦相似度方法判断该用户的情绪类别;
用户心理评估与预警单元904,用于进行心理评估与预警单元,基于用户的情绪指数和情绪类别,判断用户的心理状态,得到用于心理评估结果,并判断是否进行心理预警;
结果展示单元905,用于展示用户的心理评估结果;
公共词典库906,用于存储以上单元需要使用的极性词典、否定词典、程度词典、分词词典、停用词词典等词典信息。
在一个实施方式中,获取用户文本内容单元901用于获取用户相关的所有言论文本内容,这个来源可以是微博或者微信或者论坛等各种途径的文本数据,其来源方式可以是爬虫或者来源于数据库或者来源于API调用获取。然后建立该用户的时间-文档列表,最后输出用户的文本内容。
在另一个实施方式中,用户情绪指数计算单元902用于基于句级情绪分析方法计算该用户的情绪指数。首先对用户文本内容分句;对句子进行分词处理,建立句-词矩阵;对句-词矩阵进行处理,构建句-词频矩阵;基于情绪词典,对句-词频矩阵进行情绪词匹配,计算句基础情绪指数;基于句-词频矩阵,通过关键字分析句子句型,计算句-基于句型的基础情绪指数;基于句-词频矩阵,通过标点符号,分析句子句类,计算句-情绪指数;综合各个句子的情绪指数,依据篇章情感值计算规则计算该用户的情绪指数。
在另一个实施方式中,用户心理情绪分类单元903,用于基于用户情绪关键词向量和基本情绪关键词向量的余弦相似度方法判断该用户的情绪类别。本模块首先用TF-IDF方法提取用户文档情绪关键词,然后再用文本余弦相似度方法来判断用户的情绪类型。具体过程包括:获取用户时间-文档列表;对用户时间-文档文本数据进行预处理;执行文本特征项选择与加权处理,建立每个时间文档的TF-IDF向量;选取每个时间文档的TF-IDF向量中值最高的前5个构成集合作为用户情感关键字;建立用户情感关键字词频向量;计算用户情感关键字词频向量与基准情绪类型词频向量的余弦相似度;判断用户的情绪类型。
在另一个实施方式中,用户心理评估与预警单元904,用于进行心理评估与预警单元,基于用户的情绪指数和情绪类别,判断用户的心理状态,得到用于心理评估结果,并判断是否进行心理预警;具体实施过程为:获取用户的情绪指数;获取用户的情绪分类;根据用户的情绪指数和分类进行心理预警,依据评估和预警准则,如果用户的情绪属于愤怒、悲伤、恐惧、厌恶,且情绪指数为负数时,则对该用户进行心理预警,要求重点关注该用户。
在另一个实施方式中,结果展示单元905,用于展示用户心理评估和预警结果包括通过图形界面的方式展示用户的心理预警情况和情绪指数,如果要对用户做出心理预警,则给出相应的建议。
综上所述,在本发明实施方式中,首先是获取用户的言论文本内容;对于此用户文本内容,分别采用基于句级情绪分析方法计算该用户的情绪指数和采用文本余弦相似度计算方式对该用户进行心理情绪分类,然后根据用户情绪指数和情绪分类进行心理评估和预警,最后将结果呈现给用户。
由此可见,应用本实施方案方式以后,实现了对用户的心理预警和评估的自动化,避免了用户的主动参与,能及早发现问题。
本发明的实施方式,综合了情绪分类的定性判定和情绪指数的定量判定两种模式,并且在情绪指数的定量计算中从三个维度整合用户情绪指数,实现了高精度的自动情绪分析,提高了用户心理预警的准确度。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于文本分析的用户心理预警方法,其特征在于,包括:
获取用户相关的所有言论文本内容;
然后对用户文本采用基于句级情绪分析方法计算该用户的情绪指数;
同时也对该用户的文本内容采用基于文本余弦相似度的方法对用户心理情绪分类;
然后根据用户情绪指数和情绪类型进行心理评估和预警;
最后展示用户心理评估和预警结果。
2.根据权利要求1所述的方法,其特征在于,所述包括获取用户相关的所有言论文本内容包括来自于微博、微信、论坛等各种途径的文本数据,其来源可以是爬虫或者来源于数据库或者来源于API调用获取,然后建立该用户的时间-文档列表,最后输出用户的文本内容。
3.根据权利要求1所述的方法,其特征在于,所述对用户文本采用基于句级情绪分析方法计算该用户的情绪指数的步骤具体为:
对文本分句;
对句子进行分词处理,建立句-词矩阵;
对句-词矩阵进行处理,构建句-词频矩阵;
基于情绪词典,对句-词频矩阵进行情绪词匹配,计算句基础情绪指数;
基于句-词频矩阵,分析句子句型,计算句-基于句型的基础情绪指数;
基于句-词频矩阵,分析句子句类,计算句-情绪指数;
基于句-情绪指数得到用户的情绪指数。
4.根据权利要求1所述的方法,其特征在于,所述对该用户的文本内容采用基于文本余弦相似度的方法对用户心理情绪分类的步骤具体为:
获取用户时间-文档列表;
对用户时间-文档文本数据进行预处理;
执行文本特征项选择与加权处理,建立每个时间文档的TF-IDF向量;
选取每个时间文档的TF-IDF向量中值最高的前5个构成集合作为用户情感关键字;建立用户情感关键字词频向量;
计算用户情感关键字词频向量与基准情绪类型词频向量的余弦相似度;
判断用户的情绪类型。
5.根据权利要求1所述的方法,其特征在于,所述综合用户的情绪分类和情绪指数,对用户进行心理评估与预警的步骤具体为:
获取用户的情绪指数;
获取用户的情绪类型;
根据用户的情绪指数和类型进行心理评估和预警,如果用户的情绪属于愤怒、悲伤、恐惧、厌恶,且情绪指数为负数时,则对该用户进行心理预警。
6.一种用户心理预警装置,其特征在于,该装置包括:获取用户文本内容单元、用户情绪指数计算单元、用户心理情绪分类单元、用户进行心理评估与预警单元、结果展示单元、公共词典库,其中:
获取用户文本内容单元,用于通过爬虫、接口或者数据直接得到等方式获取用户相关的所有文本内容,其来源可以是微博、微信、论坛等各种环境;
用户情绪指数计算单元,用于基于句级情绪分析方法计算该用户的情绪指数;
用户心理情绪分类单元,用于通过计算用户情绪关键词向量和基本情绪关键词向量的余弦相似度方法判断该用户的情绪类别;
用户心理评估与预警单元,基于用户的情绪指数和情绪类别,判断用户的心理状态,得到用于心理评估结果,并判断是否进行心理预警;
结果展示单元,用于展示用户的心理评估结果;
公共词典库,用于存储以上单元需要使用的极性词典、否定词典、程度词典、分词词典、停用词词典等词典信息。
7.根据权利要求6所述的用户心理预警装置,其特征在于,
用户情绪指数计算单元,用于从三个维度考虑用户的言论文本内容情绪指数,整合以后得到用户的情绪指数,所述三个维度包括:基本词频的基础情绪、句型影响的情绪、句类影响的情绪,得到句子的情绪指数后,通过加权平均的方式,得到用户的情绪指数。
8.根据权利要求6所述的用户心理预警装置,其特征在于,
用户心理情绪分类单元,用于判断该用户的情绪类型,本单元采用TF-IDF方法提取用户文档情绪关键词,然后构建用户情绪关键词词频向量,再用文本余弦相似度方法来判断用户的情绪类型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410755787.2A CN105740224A (zh) | 2014-12-11 | 2014-12-11 | 一种基于文本分析的用户心理预警方法与装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410755787.2A CN105740224A (zh) | 2014-12-11 | 2014-12-11 | 一种基于文本分析的用户心理预警方法与装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105740224A true CN105740224A (zh) | 2016-07-06 |
Family
ID=56240182
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410755787.2A Pending CN105740224A (zh) | 2014-12-11 | 2014-12-11 | 一种基于文本分析的用户心理预警方法与装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105740224A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106510736A (zh) * | 2016-12-06 | 2017-03-22 | 山东瀚岳智能科技股份有限公司 | 基于多维心理状态指标的心理状态判定方法与系统 |
CN106708805A (zh) * | 2016-12-30 | 2017-05-24 | 深圳天珑无线科技有限公司 | 基于文本统计的心理分析方法及装置 |
CN108021609A (zh) * | 2017-11-01 | 2018-05-11 | 深圳市牛鼎丰科技有限公司 | 文本情感分类方法、装置、计算机设备和存储介质 |
CN108095740A (zh) * | 2017-12-20 | 2018-06-01 | 姜涵予 | 一种用户情绪评估方法和装置 |
CN108509418A (zh) * | 2018-03-20 | 2018-09-07 | 合肥工业大学 | 基于对话内容的用户异常情绪检测方法 |
CN108511071A (zh) * | 2018-04-18 | 2018-09-07 | 广东惠禾科技发展有限公司 | 心理健康评估方法及装置 |
CN109903851A (zh) * | 2019-01-24 | 2019-06-18 | 暨南大学 | 一种基于社交网络的心理异常变化的自动观测技术 |
CN109979592A (zh) * | 2019-03-25 | 2019-07-05 | 广东邮电职业技术学院 | 心理健康预警方法、用户终端、服务器与系统 |
CN109994207A (zh) * | 2019-03-25 | 2019-07-09 | 广东邮电职业技术学院 | 心理健康预警方法、服务器与系统 |
CN110570941A (zh) * | 2019-07-17 | 2019-12-13 | 北京智能工场科技有限公司 | 一种基于文本语义向量模型评估心理状态的系统和装置 |
CN110693507A (zh) * | 2019-08-30 | 2020-01-17 | 中国民用航空飞行学院 | 一种民航飞行学员心理健康测试和心理援助系统 |
CN112596405A (zh) * | 2020-12-17 | 2021-04-02 | 深圳市创维软件有限公司 | 家用电器的控制方法、装置、设备以及计算机可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663046A (zh) * | 2012-03-29 | 2012-09-12 | 中国科学院自动化研究所 | 一种面向微博短文本的情感分析方法 |
CN103440235A (zh) * | 2013-08-20 | 2013-12-11 | 中国科学院自动化研究所 | 一种基于认知结构模型的文本情感类型识别方法及装置 |
CN103699626A (zh) * | 2013-12-20 | 2014-04-02 | 华南理工大学 | 一种微博用户个性化情感倾向分析方法及系统 |
-
2014
- 2014-12-11 CN CN201410755787.2A patent/CN105740224A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663046A (zh) * | 2012-03-29 | 2012-09-12 | 中国科学院自动化研究所 | 一种面向微博短文本的情感分析方法 |
CN103440235A (zh) * | 2013-08-20 | 2013-12-11 | 中国科学院自动化研究所 | 一种基于认知结构模型的文本情感类型识别方法及装置 |
CN103699626A (zh) * | 2013-12-20 | 2014-04-02 | 华南理工大学 | 一种微博用户个性化情感倾向分析方法及系统 |
Non-Patent Citations (2)
Title |
---|
张金伟: ""基于心理预警模型的微博情感识别研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
彭蔚喆: ""面向中文微博文本的情感识别与分类技术研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106510736B (zh) * | 2016-12-06 | 2019-06-28 | 山东瀚岳智能科技股份有限公司 | 基于多维心理状态指标的心理状态判定方法与系统 |
CN106510736A (zh) * | 2016-12-06 | 2017-03-22 | 山东瀚岳智能科技股份有限公司 | 基于多维心理状态指标的心理状态判定方法与系统 |
CN106708805A (zh) * | 2016-12-30 | 2017-05-24 | 深圳天珑无线科技有限公司 | 基于文本统计的心理分析方法及装置 |
CN108021609A (zh) * | 2017-11-01 | 2018-05-11 | 深圳市牛鼎丰科技有限公司 | 文本情感分类方法、装置、计算机设备和存储介质 |
CN108021609B (zh) * | 2017-11-01 | 2020-08-18 | 深圳市牛鼎丰科技有限公司 | 文本情感分类方法、装置、计算机设备和存储介质 |
CN108095740A (zh) * | 2017-12-20 | 2018-06-01 | 姜涵予 | 一种用户情绪评估方法和装置 |
CN108509418A (zh) * | 2018-03-20 | 2018-09-07 | 合肥工业大学 | 基于对话内容的用户异常情绪检测方法 |
CN108511071A (zh) * | 2018-04-18 | 2018-09-07 | 广东惠禾科技发展有限公司 | 心理健康评估方法及装置 |
CN109903851A (zh) * | 2019-01-24 | 2019-06-18 | 暨南大学 | 一种基于社交网络的心理异常变化的自动观测技术 |
CN109903851B (zh) * | 2019-01-24 | 2023-05-23 | 暨南大学 | 一种基于社交网络的心理异常变化的自动观测方法 |
CN109979592A (zh) * | 2019-03-25 | 2019-07-05 | 广东邮电职业技术学院 | 心理健康预警方法、用户终端、服务器与系统 |
CN109994207A (zh) * | 2019-03-25 | 2019-07-09 | 广东邮电职业技术学院 | 心理健康预警方法、服务器与系统 |
CN109994207B (zh) * | 2019-03-25 | 2021-08-03 | 广东邮电职业技术学院 | 心理健康预警方法、服务器与系统 |
CN110570941A (zh) * | 2019-07-17 | 2019-12-13 | 北京智能工场科技有限公司 | 一种基于文本语义向量模型评估心理状态的系统和装置 |
CN110693507A (zh) * | 2019-08-30 | 2020-01-17 | 中国民用航空飞行学院 | 一种民航飞行学员心理健康测试和心理援助系统 |
CN112596405A (zh) * | 2020-12-17 | 2021-04-02 | 深圳市创维软件有限公司 | 家用电器的控制方法、装置、设备以及计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105740224A (zh) | 一种基于文本分析的用户心理预警方法与装置 | |
Dhamala et al. | Bold: Dataset and metrics for measuring biases in open-ended language generation | |
Huang et al. | Detecting suicidal ideation in Chinese microblogs with psychological lexicons | |
US10496756B2 (en) | Sentence creation system | |
EP2711849A2 (en) | Learning opinion-related patterns for contextual and domain-dependent opinion detection | |
CN108491377A (zh) | 一种基于多维度信息融合的电商产品综合评分方法 | |
CN108038725A (zh) | 一种基于机器学习的电商产品客户满意度分析方法 | |
WO2018152261A1 (en) | Systems and methods for using machine learning and rules-based algorithms to create a patent specification based on human-provided patent claims such that the patent specification is created without human intervention | |
US20120158400A1 (en) | Methods and systems for knowledge discovery | |
CN104731770A (zh) | 基于规则和统计模型的中文微博情感分析方法 | |
CN107305539A (zh) | 一种基于Word2Vec网络情感新词发现的文本倾向性分析方法 | |
US8443008B2 (en) | Cooccurrence dictionary creating system, scoring system, cooccurrence dictionary creating method, scoring method, and program thereof | |
Al-Ghadhban et al. | Arabic sarcasm detection in Twitter | |
Jang et al. | Metaphor detection in discourse | |
Maslowski et al. | In-the-wild chatbot corpus: from opinion analysis to interaction problem detection | |
CN110321561A (zh) | 一种关键词提取方法和装置 | |
EP4046054A1 (en) | Automatic summarization of transcripts | |
Diwali et al. | Arabic sentiment analysis using dependency-based rules and deep neural networks | |
Bölücü et al. | Hate Speech and Offensive Content Identification with Graph Convolutional Networks. | |
Sidorenko | Sentiment Analysis of German Twitter | |
Liu et al. | Depression tendency detection for microblog users based on SVM | |
Huang et al. | An unsupervised method for short-text sentiment analysis based on analysis of massive data | |
Shahbaz et al. | Sentiment miner: A prototype for sentiment analysis of unstructured data and text | |
CN110825824B (zh) | 基于语义化直观/非直观用户性格表示的用户关系画像方法 | |
Hu et al. | Depression tendency detection model for Weibo users based on Bi-LSTM |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20160706 |