CN109903851A - 一种基于社交网络的心理异常变化的自动观测技术 - Google Patents
一种基于社交网络的心理异常变化的自动观测技术 Download PDFInfo
- Publication number
- CN109903851A CN109903851A CN201910066022.0A CN201910066022A CN109903851A CN 109903851 A CN109903851 A CN 109903851A CN 201910066022 A CN201910066022 A CN 201910066022A CN 109903851 A CN109903851 A CN 109903851A
- Authority
- CN
- China
- Prior art keywords
- microblogging
- emotion
- psychological abnormality
- similarity
- microblog
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于社交网络的心理异常变化的自动观测技术,具体涉及心理异常检测技术领域,包括以下观察分析步骤:数据收集、数据处理、构造目标对象心理行为轮廓、构造心理异常观测器和心理异常检测判别共五个步骤,提供了基于微博内容的心理异常观测器、基于微博情感的心理异常观测器、基于微博发布时间的心理异常观测器和基于微博互动情况的心理异常观测器。本发明通过长期不断采集目标的微博内容并从内容、时间、情绪表达、互动情况等多方面深入的进行量化分析,及时把握其心理变化的异常情况,为及时进行必须的疏导和介入提供依据,实现了整个分析过程的自动化,降低了分析的成本,减轻了有关人员的工作负担,提高了分析判断的准确度。
Description
技术领域
本发明涉及心理异常检测技术领域,更具体地说,本发明涉及一种基于社交网络的心理异常变化的自动观测技术。
背景技术
心理异常的实质,就是异常心理的原因、机理和心理结构问题。心理异常是大脑的结构或机能失调或者人对客观现实反映的紊乱和歪曲,既反映了个人自我概念和某些能力的异常,也反映为社会人际关系和个人生活上的适应障碍。心理异常有很多的类别,中华医学会精神疾病分类中心理异常共分为10类:脑器质性精神障碍与躯体疾病所致的精神障碍;精神活性物质与非依赖性精神物质所致的精神障碍;精神分裂症及其它非器质性精神病性障碍;与心理社会因素相关的生理和行为障碍;人格障碍、冲动控制障碍与性行为障碍;精神发育迟滞;儿童青少年精神障碍;其它精神障碍及与心理卫生密切相关的几种情况。
要清晰的判别异常心理不容易,原因在于:a)异常心理与正常心理之间的差别常常是相对的,两者之间可能有本质的差别;但在更多的情况下又可能只有程度的不同;b)异常心理受多种因素的影响,诸如生物因素、心理状态、社会环境等;c)靠专业人员的临床经验进行主观判断。判断心理异常的三个原则性是:1)统计学原则:某一种心理现象或心理体验,如果绝大多数人在同样的情况下都曾出现或都有可能出现,那么这种心理现象或体验便很可能是正常。从理论上来说,几乎所有的人都曾一度出现过异常的心理现象,事实上只有异常的心理现象持续一定的时间或按一定的频度出现,才会被认为是病态。很显然,这里所说的异常和病态者是有区别的,异常并不一定是病态,而病态则肯定是异常的,也就是说病态要比异常严重。2)功能性原则:只有异常的心理现象或体验明显导致其社会功能的损害,或出现适应不良的行为,才有可能被认为是病态。3)心理学原则:人类心理是人类大脑和周围环境相互作用的产物,因此几乎都是和周围环境协调一致的。如果某一个人的行为表现或心理体验与其所处的环境明显不一致甚至相反,则这种行为表现或心理体验有可能是异常的。个性心理特征出现了明显的变化也是心理异常的标志之一,因为人的心理特征具有相对的稳定性。性格的变化便是心理障碍中躁狂发作的表现之一。
目前最常用的区分心理正常与异常的标准主要有:1)自我评价标准:心理基本上正常的人,完全可以察觉到自己心理活动和自己以前的差别、自己的心理表现和别人的差别等等。2)心理测验标准:通过有代表性的取样、成立常模样本、检测信度、检测效度和方法的标准化,形成测评量表,一定程度上可避免主观看法,但也存在误差,并不能代替医生诊断。3)病因病理学分类:如果一个人身上表现的某种心理现象或行为可以找到病理解剖或病理生理变化的依据,则认为此人有精神疾病。其产生原因则归结为脑功能失调。这一标准广泛采用于临床,但诊断范围狭小,对神经症和人格障碍则无能为力。4)外部评价标准:人的心理活动总是表现在生活的各个方面,如果大家都认为某个人有问题,一般就是正确的。即使旁边人没有看出来,专业人员也可以通过各种表现判断当事人是不是有问题,专家对症状的分析就形成症状学分类标准。5)社会适应性标准:正常人的行为符合社会的准则,能根据社会要求和道德规范行事,亦即其行为符合社会常模。如果由于器质的和或功能的缺陷使得个体能力受损,不能按照社会认可的方式行事,致使其行为后果对本人或社会是不适应的时候,则认为此人有心理异常。
专利申请公布号CN 103902566 B的发明专利公开了一种基于微博用户行为的人格预测方法,包括步骤1,获取微博活跃用户的id列表,根据活跃用户的id列表,通过微博的“对他说”功能,获取被试用户在线填写的人格问卷;步骤2,根据填写人格问卷的被试名单,下载该用户的微博数据,根据建立的微博网络行为体系,从微博数据中提取相应的静态行为特征以及动态的行为特征;步骤3,利用时间序列分析方法,对提取的用户动态行为特征进行数值化,形成完整的微博特征,该发明以社交网络(微博和人人网)用户为研究对象,采集他们线上行为记录并从中提取行为特征,以作为预测变量;同时,对研究对象施测人格问卷,获取其在各人格维度上的得分,以此作为结果变量,利用朴素贝叶斯、支持向量机、决策树与Pace回归等算法训练基于社交网络行为的人格特征预测模型,在此基础上,其开发了“文心(TextMind)”中文心理分析系统,系统采用大五人格量表进行性格分析,为用户提供从简体中文自动分词,到语言心理分析的一揽子分析解决方案,另外,他们还利用相关成果开发了一个高自杀风险用户筛查系统。
但是上述技术方案中提供的一种基于微博用户行为的人格预测方法在实际运用时,仍旧存在较多缺点,如其更倾向于情感分析和兴趣识别而非性格心理分析,与相当较稳定的性格相比,情感和心理变化会表现出更多短期性的特点,表现在情感经常变换,心理异常者经常出现情绪的剧烈起伏变化,需要从内容等多个维度综合进行判断,并且长期观察。
发明内容
为了克服现有技术的上述缺陷,本发明的实施例提供一种基于社交网络的心理异常变化的自动观测技术,通过长期不断采集目标的微博内容并从内容、时间、情绪表达、互动情况等多方面深入的进行量化分析,及时把握其心理变化的异常情况,为及时进行必须的疏导和介入提供依据,实现了整个分析过程的自动化,降低了分析的成本,减轻了有关人员的工作负担,提高了分析判断的准确度。
为实现上述目的,本发明提供如下技术方案:一种基于社交网络的心理异常变化的自动观测技术,具体包括以下观察分析步骤:
步骤一:数据收集,首先通过网络爬虫采集个人微博账户的历史数据,采集的数据包括目标对象的微博内容、发表时间、相关评论、转发的原微博和使用的表情符号,并将收集到的数据存入数据库;
步骤二:数据处理,对步骤一收集到的微博数据分门别类,对微博内容分析,并根据内容概要,结合词库和关键字对微博体现的兴趣爱好进行标注,并使用基于规则的文本分类方法打标签,得到用户微博内容中体现的兴趣爱好,其中主题标签包括视频、音乐、游戏、美食、旅游、购物、IT数码、搞笑幽默、摄影、小说、星座运势、情感生活、宠物图集、图片、互联网、英语、读书、设计、家居、美容、时尚、美女、八卦杂谈、女人、减肥瘦身、本地生活、名人明星、新闻趣事、体育资讯、职场招聘、财经资讯、房产、车世界、其他34个标签;
根据微博内容和语义分析情感,并给相应的微博打上情绪标签,情绪标签分为7大类和21小类,7大类标签计为m0…m67类不同情绪,21小类标签计为e0,e1…e20标记21种不同情绪;
步骤三:构造目标对象心理行为轮廓,针对采集的目标的历史微博,以每周、每月和每三个月这三个不同大小的时间窗口对个人历史微博进行统计分析,以构建目标对象心理行为轮廓作为异常变化检测的参考,分析内容包括情感、程度、发布时间和互动情况四个方面,最终得到情感、程度、发布时间和互动情况四个方面的各项指标,并将其划入微博心理行为轮廓,将其它未被纳入的指标,相应的维度的轮廓值设为0,考虑历史数据中可能存在的异常,筛选数据中占大部分(阈值设为85%)的数据描绘目标对象的心理行为轮廓;
根据统计的时间窗口大小不同,可得到profile_week、profile_month和profile_quarter三个心理行为轮廓,各轮廓均可以表示为profile=(e,m,c,t,f),具体如下:
e:e0,…e20标记21种不同情绪;
m:m0,…m6标记7类不同情绪;
c:c0,…c33标记34类不同主题;
t:t0,…t5标记6个不同的微博发布时间段;
f:f0,…f3标记4类不同程度的微博互动情况;
其中ei、mi、ci、ti和fi的值或者为零,或者为相应的百分比;
步骤四:构造心理异常观测器,分别构造基于微博情感的心理异常观测器、基于微博内容的心理异常观测器、基于微博发布时间的心理异常观测器和基于互动情况的心理异常观测器,计算目标对象心理行为轮廓与最近的微博之间的相似度,其中基于微博情感的心理异常观测器采用两者的四个情感分量e和e’,m和m’的夹角的余弦来定义两者间的相似度,基于微博内容的心理异常观测采用两个微博内容主题分量的夹角的余弦来定义两者间的相似度,基于微博发布时间的心理异常观测器采用两个微博发布时间分量的夹角的余弦来定义两者间的相似度,基于微博互动情况的心理异常观测器采用两个微博互动情况分量的夹角的余弦来定义两者间的相似度;
步骤五:心理异常检测判别,获得目标最近一周的微博数据之后,遵循步骤三的筛选方式得到该时间段内的微博心理活动profile’=(e’,m’,c’,t’,f’),其中e’、m’、c’、t’和f’各分量并不采用上述阈值过滤,而是将全部的值纳入考虑范围内,通过步骤四中构建的微博情感、内容、发布时间和互动情况等四个方面的异常观测器计算目标在过去一周内的社交网络(微博)上的行为和目标行为轮廓间的差异,并建立基于多维度的心理异常判别器,得到一个总相似度,并与设定阈值对比,当检测到的总相似度低于设定阈值时,发出提示。
在一个优选的实施方式中,步骤二中对微博内容打上情绪标签,考虑到心理异常分析的需要,除了上述积极、消极和中性三种情感标签之外,还需要对表达的情感进行更细的划分,以便分辨出快乐、愤怒、悲痛、恐惧、惊奇、接受、狂喜、警惕、憎恨等情感,根据大连理工大学信息检索研究室研发的情感词汇本体库,将情感共分为7大类21小类,并根据目标对象的微博中出现的这些词汇对其情感类别、强度和极性进行分析判断,算法如下:
(1)文本切割转换
将段落用中文里常用的句号、分号、问号、感叹号等划分句意的符号,切割成不同的句子L,然后用逗号划分出句子里的意群(表示情感的最小单元)调用在线分词工具或者本地分词函数,对意群进行分词;
(2)情感定位
文本的情感分析是从发现句中的情感词开始,通过情感词的倾向和倾向度,来决定句子的情感,从而决定整个文本的情感;
在对文本进行中文分词处理后,将处理后得到的单词依次与预先根据中文情感词库构建好的情感词表逐个查找,若能找到,则是情感词,并读取情感极性及相应权值,否则,不是情感词,则进入下一个候选单词,直至整句话判断结束;
考虑到否定词会使情感词语的情感极性发生改变,算法设定当否定词出现奇数次时,表示否定意思;当否定词出现偶数次时,表示肯定意思,单独构建一个否定词典notDict,并设置其权值为-1,常见的否定词如:不、没、无、非、莫、弗、毋、勿、未、否、别、無、休,对否定词的处理过程如下:
当程度副词修饰情感词,该情感词的情感倾向程度发生了变化,为了准确表达文本的情感倾向需做相应的权值调整,采用来源于知网的情感程度副词共219个,为每个程度副词定义了一个权重,被程度副词修饰后的情感词其权值应做相应调整,过程如下:
(3)情感计算
在上述结果的基础上,本发明先求出意群的情感值:
意群情感值=否定词-1*程度词权重*情感词权重
句子是由意群组成,故句子的情感我们可以简单记做:
句子情感值=sum(意群情感值1,意群情感值2……)
微博由多个句子组成,本发明定义其情感值为:
微博情感值=average(句子1情感值,句子2情感值……)。
在一个优选的实施方式中,步骤三中以Total表示在该时间窗内的微博总数,则情感和程度、内容、发布时间和互动情况四个方面的心理行为轮廓构建方法具体如下:
a)情感和程度方面,统计目标对象在该时间窗口内的每条微博的情绪和强度,分别统计各种情绪强度的出现次数,以此计算各强度情绪的百分比,算法如下:
Ei,1=ei,1/Total
Ei,3=ei,3/Total
Ei,5=ei,5/Total
Ei,7=ei,7/Total
Ei,9=ei,9/Total
各类情绪的百分比为该类中各情绪的百分比之和,即可得到七类情绪的百分比M0…M6,算法如下:
Ei=Ei,1+Ei,3+Ei,5+Ei,7+Ei,9
b)内容方面,类似的,分别统计不同时间窗口内不同内容主题的百分比,目标对象发布的涉及该类内容主题的微博的数目为ci,则34种内容主题的百分比C0…C33的算法如下:
Ci=ci/Total
c)发布时间方面,统计目标对象在该时间窗口内每天的微博发布的时间,以人的大致生活规律将每天24小时分段进行统计,得到t0…t5,分别表示11pm-7am,7am-9am,9am-12am,12am-2pm,2pm-6pm,6pm-11pm,用Ti表示该时间段内发布微博的条数,ti各时间窗口内微博发布的个数,在此基础上即可得到相应的百分比为T0…T5,算法如下:
Ti=ti/Total
d)互动情况方面,统计目标对象在该事件窗口内在微博与人互动的次数(即在自身的微博的评论中发言的次数),得到f0、f1、f2和f3,分别是互动次数为0、在1-5次之内,6-10次之内和11次及以上的次数,在此基础上,得到相应的百分比F0,F1,F2和F3,具体如下:
F0=f0/Total
F1=f1/Total
F2=f2/Total
F3=f3/Total
在一个优选的实施方式中,步骤三中筛选过程如下:
1)将上述各指标项按照百分比由高到低排序;
2)将结果集Res设置为空集;
3)设i=0,设total为0%;
4)取排序结果中的第i项,将该项加入Res;
5)取得到相应的百分比per;
6)total=total+per;
7)如果total<85%,则i=i+1并转回步骤4);
8)得到最终结果Res;
在一个优选的实施方式中,步骤四中基于微博情感的心理异常观测器具体如下:
Similaritye,e’=e·e’/|e||e’|
Similaritym,m’=m·m’/|m||m’|
在一个优选的实施方式中,步骤四中基于微博内容的心理异常观测器具体如下:
Similarityc,c’=c·c’/|c||c’|
在一个优选的实施方式中,步骤四中基于微博发布时间的心理异常观测器具体如下:
Similarityt,t’=t·t’/|t||t’|
在一个优选的实施方式中,步骤四中基于互动情况的心理异常观测器具体如下:
Similarityf,f’=f·f’/|f||f’|
在一个优选的实施方式中,步骤五中基于多维度的心理异常判别器具体如下:
Similarity=Similaritye,e’+Similaritym,m’+Similarityc,c’+Similarityt,t’+Similarityf,f’
其中设定阈值取值为4。
本发明的技术效果和优点:
1、本发明通过长期不断采集目标的社交网络(微博)内容并从内容、时间、情绪表达、互动情况等多方面深入的进行量化分析,及时把握其心理变化的异常情况,为及时进行必须的疏导和介入提供依据,用信息技术实现了整个分析过程的自动化,大大降低了分析的时间成本,减轻了有关人员的工作负担,并能通过案例的不断积累不断提高分析判断的准确度;
2、本发明从微博的内容、情感表达、发布时间和互动情况四方面观测和分析目标心理行为,针对心理异常识别,为发现心理异常提供了一种可量化的测量识别方法,可以及时性的发现并向用户发出预报心理异常预警,提示目标对象可能出现心理异常,以便进行及时干预;
3、本发明基于现在中国人常用的社交网络(微博)进行分析,具有很强的实用性,能以目标对象无知觉的方式不断的、长期的进行分析观测,不对目标造成滋扰。
附图说明
图1为本发明的整体流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:
根据图1所示的一种基于社交网络的心理异常变化的自动观测技术,具体包括以下观察分析步骤:
步骤一:数据收集,首先通过网络爬虫采集个人微博账户的历史数据,采集的数据包括目标对象的微博内容、发表时间、相关评论、转发的原微博和使用的表情符号,并将收集到的数据存入数据库;
步骤二:数据处理,对步骤一收集到的微博数据分门别类,对微博内容分析,并根据内容概要,结合词库和关键字对微博体现的兴趣爱好进行标注,并使用基于规则的文本分类方法打标签,得到用户微博内容中体现的兴趣爱好,其中主题标签包括视频、音乐、游戏、美食、旅游、购物、IT数码、搞笑幽默、摄影、小说、星座运势、情感生活、宠物图集、图片、互联网、英语、读书、设计、家居、美容、时尚、美女、八卦杂谈、女人、减肥瘦身、本地生活、名人明星、新闻趣事、体育资讯、职场招聘、财经资讯、房产、车世界、其他34个标签;
根据微博内容和语义分析情感,并给相应的微博打上情绪标签,情绪标签分为7大类和21小类,7大类标签计为m0…m67类不同情绪,21小类标签计为e0,e1…e20标记21种不同情绪;
考虑到心理异常分析的需要,除了上述积极、消极和中性三种情感标签之外,还需要对表达的情感进行更细的划分,以便分辨出快乐、愤怒、悲痛、恐惧、惊奇、接受、狂喜、警惕、憎恨等情感,根据大连理工大学信息检索研究室研发的情感词汇本体库,将情感共分为7大类21小类,并根据目标对象的微博中出现的这些词汇对其情感类别、强度和极性进行分析判断,算法如下:
(1)文本切割转换
将段落用中文里常用的句号、分号、问号、感叹号等划分句意的符号,切割成不同的句子L,然后用逗号划分出句子里的意群(表示情感的最小单元)调用在线分词工具或者本地分词函数,对意群进行分词;
(2)情感定位
文本的情感分析是从发现句中的情感词开始,通过情感词的倾向和倾向度,来决定句子的情感,从而决定整个文本的情感;
在对文本进行中文分词处理后,将处理后得到的单词依次与预先根据中文情感词库构建好的情感词表逐个查找,若能找到,则是情感词,并读取情感极性及相应权值,否则,不是情感词,则进入下一个候选单词,直至整句话判断结束;
考虑到否定词会使情感词语的情感极性发生改变,算法设定当否定词出现奇数次时,表示否定意思;当否定词出现偶数次时,表示肯定意思,单独构建一个否定词典notDict,并设置其权值为-1,常见的否定词如:不、没、无、非、莫、弗、毋、勿、未、否、别、無、休,对否定词的处理过程如下:
当程度副词修饰情感词,该情感词的情感倾向程度发生了变化,为了准确表达文本的情感倾向需做相应的权值调整,采用来源于知网的情感程度副词共219个,为每个程度副词定义了一个权重,被程度副词修饰后的情感词其权值应做相应调整,过程如下:
(3)情感计算
在上述结果的基础上,本发明先求出意群的情感值:
意群情感值=否定词-1*程度词权重*情感词权重
句子是由意群组成,故句子的情感我们可以简单记做:
句子情感值=sum(意群情感值1,意群情感值2……)
微博由多个句子组成,本发明定义其情感值为:
微博情感值=average(句子1情感值,句子2情感值……)
步骤三:构造目标对象心理行为轮廓,针对采集的目标的历史微博,以每周、每月和每三个月这三个不同大小的时间窗口对个人历史微博进行统计分析,以构建目标对象心理行为轮廓作为异常变化检测的参考,分析内容包括情感、程度、发布时间和互动情况四个方面,最终得到情感、程度、发布时间和互动情况四个方面的各项指标,并将其划入微博心理行为轮廓,将其它未被纳入的指标,相应的维度的轮廓值设为0,考虑历史数据中可能存在的异常,筛选数据中占大部分(阈值设为85%)的数据描绘目标对象的心理行为轮廓;
根据统计的时间窗口大小不同,可得到profile_week、profile_month和profile_quarter三个心理行为轮廓,各轮廓均可以表示为profile=(e,m,c,t,f),具体如下:
e:e0,…e20标记21种不同情绪;
m:m0,…m6标记7类不同情绪;
c:c0,…c33标记34类不同主题;
t:t0,…t5标记6个不同的微博发布时间段;
f:f0,…f3标记4类不同程度的微博互动情况;
其中ei、mi、ci、ti和fi的值或者为零,或者为相应的百分比;
以Total表示在该时间窗内的微博总数,则情感和程度、内容、发布时间和互动情况四个方面的心理行为轮廓构建方法具体如下:
a)情感和程度方面,统计目标对象在该时间窗口内的每条微博的情绪和强度,分别统计各种情绪强度的出现次数,以此计算各强度情绪的百分比,算法如下:
Ei,1=ei,1/Total
Ei,3=ei,3/Total
Ei,5=ei,5/Total
Ei,7=ei,7/Total
Ei,9=ei,9/Total
各类情绪的百分比为该类中各情绪的百分比之和,即可得到七类情绪的百分比M0…M6,算法如下:
Ei=Ei,1+Ei,3+Ei,5+Ei,7+Ei,9
b)内容方面,类似的,分别统计不同时间窗口内不同内容主题的百分比,目标对象发布的涉及该类内容主题的微博的数目为ci,则34种内容主题的百分比C0…C33的算法如下:
Ci=ci/Total
c)发布时间方面,统计目标对象在该时间窗口内每天的微博发布的时间,以人的大致生活规律将每天24小时分段进行统计,得到t0…t5,分别表示11pm-7am,7am-9am,9am-12am,12am-2pm,2pm-6pm,6pm-11pm,用Ti表示该时间段内发布微博的条数,ti各时间窗口内微博发布的个数,在此基础上即可得到相应的百分比为T0…T5,算法如下:
Ti=ti/Total
d)互动情况方面,统计目标对象在该事件窗口内在微博与人互动的次数(即在自身的微博的评论中发言的次数),得到f0、f1、f2和f3,分别是互动次数为0、在1-5次之内,6-10次之内和11次及以上的次数,在此基础上,得到相应的百分比F0,F1,F2和F3,具体如下:
F0=f0/Total
F1=f1/Total
F2=f2/Total
F3=f3/Total
步骤四:构造心理异常观测器,分别构造基于微博情感的心理异常观测器、基于微博内容的心理异常观测器、基于微博发布时间的心理异常观测器和基于互动情况的心理异常观测器,计算目标对象心理行为轮廓与最近的微博之间的相似度,其中基于微博情感的心理异常观测器采用两者的四个情感分量e和e’,m和m’的夹角的余弦来定义两者间的相似度,基于微博内容的心理异常观测采用两个微博内容主题分量的夹角的余弦来定义两者间的相似度,基于微博发布时间的心理异常观测器采用两个微博发布时间分量的夹角的余弦来定义两者间的相似度,基于微博互动情况的心理异常观测器采用两个微博互动情况分量的夹角的余弦来定义两者间的相似度,分别为:
Similaritye,e’=e·e’/|e||e’|
Similaritym,m’=m·m’/|m||m’|
Similarityc,c’=c·c’/|c||c’|
Similarityt,t’=t·t’/|t||t’|
Similarityf,f’=f·f’/|f||f’|
步骤五:心理异常检测判别,获得目标最近一周的微博数据之后,遵循步骤三的筛选方式得到该时间段内的微博心理活动profile’=(e’,m’,c’,t’,f’),其中e’、m’、c’、t’和f’各分量并不采用上述阈值过滤,而是将全部的值纳入考虑范围内,通过步骤四中构建的微博情感、内容、发布时间和互动情况等四个方面的异常观测器计算目标在过去一周内的社交网络(微博)上的行为和目标行为轮廓间的差异,并建立基于多维度的心理异常判别器,具体如下:
Similarity=Similaritye,e’+Similaritym,m’+Similarityc,c’+Similarityt,t’+Similarityf,f’
得到一个总相似度,并与设定阈值对比,设定阈值取值为4,当检测到的总相似度低于设定阈值4时,发出提示;
通过长期不断采集目标的社交网络(微博)内容并从内容、时间、情绪表达、互动情况等多方面深入的进行量化分析,及时把握其心理变化的异常情况,为及时进行必须的疏导和介入提供依据,用信息技术实现了整个分析过程的自动化,大大降低了分析的时间成本,减轻了有关人员的工作负担,并能通过案例的不断积累不断提高分析判断的准确度。
实施例2:
描绘心理行为轮廓的筛选过程如下:
1)将上述各指标项按照百分比由高到低排序;
2)将结果集Res设置为空集;
3)设i=0,设total为0%;
4)取排序结果中的第i项,将该项加入Res;
5)取得到相应的百分比per;
6)total=total+per;
7)如果total<85%,则i=i+1并转回步骤4);
8)得到最终结果Res。
最后应说明的是:
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种基于社交网络的心理异常变化的自动观测技术,其特征在于:具体包括以下观察分析步骤:
步骤一:数据收集,首先通过网络爬虫采集个人微博账户的历史数据,采集的数据包括目标对象的微博内容、发表时间、相关评论、转发的原微博和使用的表情符号,并将收集到的数据存入数据库;
步骤二:数据处理,对步骤一收集到的微博数据分门别类,对微博内容分析,并根据内容概要,结合词库和关键字对微博体现的兴趣爱好进行标注,并使用基于规则的文本分类方法打标签,得到用户微博内容中体现的兴趣爱好,其中主题标签包括视频、音乐、游戏、美食、旅游、购物、IT数码、搞笑幽默、摄影、小说、星座运势、情感生活、宠物图集、图片、互联网、英语、读书、设计、家居、美容、时尚、美女、八卦杂谈、女人、减肥瘦身、本地生活、名人明星、新闻趣事、体育资讯、职场招聘、财经资讯、房产、车世界、其他34个标签;
根据微博内容和语义分析情感,并给相应的微博打上情绪标签,情绪标签分为7大类和21小类,7大类标签计为m0…m67类不同情绪,21小类标签计为e0,e1…e20标记21种不同情绪;
步骤三:构造目标对象心理行为轮廓,针对采集的目标的历史微博,以每周、每月和每三个月这三个不同大小的时间窗口对个人历史微博进行统计分析,以构建目标对象心理行为轮廓作为异常变化检测的参考,分析内容包括情感、程度、发布时间和互动情况四个方面,最终得到情感、程度、发布时间和互动情况四个方面的各项指标,并将其划入微博心理行为轮廓,将其它未被纳入的指标,相应的维度的轮廓值设为0,考虑历史数据中可能存在的异常,筛选数据中占大部分(阈值设为85%)的数据描绘目标对象的心理行为轮廓;
根据统计的时间窗口大小不同,可得到profile_week、profile_month 和profile_quarter三个心理行为轮廓,各轮廓均可以表示为profile=(e,m,c,t,f),具体如下:
e:e0,…e20标记21种不同情绪;
m:m0,…m6标记7类不同情绪;
c:c0,…c33标记34类不同主题;
t:t0,…t5标记6个不同的微博发布时间段;
f:f0,…f3标记4类不同程度的微博互动情况;
其中ei、mi、ci、ti和fi的值或者为零,或者为相应的百分比;
步骤四:构造心理异常观测器,分别构造基于微博情感的心理异常观测器、基于微博内容的心理异常观测器、基于微博发布时间的心理异常观测器和基于互动情况的心理异常观测器,计算目标对象心理行为轮廓与最近的微博之间的相似度,其中基于微博情感的心理异常观测器采用两者的四个情感分量e和e’,m和m’的夹角的余弦来定义两者间的相似度,基于微博内容的心理异常观测采用两个微博内容主题分量的夹角的余弦来定义两者间的相似度,基于微博发布时间的心理异常观测器采用两个微博发布时间分量的夹角的余弦来定义两者间的相似度,基于微博互动情况的心理异常观测器采用两个微博互动情况分量的夹角的余弦来定义两者间的相似度;
步骤五:心理异常检测判别,获得目标最近一周的微博数据之后,遵循步骤三的筛选方式得到该时间段内的微博心理活动profile’=(e’,m’,c’,t’,f’),其中e’、m’、c’、t’和f’各分量并不采用上述阈值过滤,而是将全部的值纳入考虑范围内,通过步骤四中构建的微博情感、内容、发布时间和互动情况等四个方面的异常观测器计算目标在过去一周内的社交网络(微博)上的行为和目标行为轮廓间的差异,并建立基于多维度的心理异常判别器,得到一个总相似度,并与设定阈值对比,当检测到的总相似度低于设定阈值时,发出提示。
2.根据权利要求1所述的一种基于社交网络的心理异常变化的自动观测技术,其特征在于:步骤二中对微博内容打上情绪标签,考虑到心理异常分析的需要,除了上述积极、消极和中性三种情感标签之外,还需要对表达的情感进行更细的划分,以便分辨出快乐、愤怒、悲痛、恐惧、惊奇、接受、狂喜、警惕、憎恨等情感,根据大连理工大学信息检索研究室研发的情感词汇本体库,将情感共分为7大类21小类,并根据目标对象的微博中出现的这些词汇对其情感类别、强度和极性进行分析判断,算法如下:
(1)文本切割转换
将段落用中文里常用的句号、分号、问号、感叹号等划分句意的符号,切割成不同的句子L,然后用逗号划分出句子里的意群(表示情感的最小单元)调用在线分词工具或者本地分词函数,对意群进行分词;
(2)情感定位
文本的情感分析是从发现句中的情感词开始,通过情感词的倾向和倾向度,来决定句子的情感,从而决定整个文本的情感;
在对文本进行中文分词处理后,将处理后得到的单词依次与预先根据中文情感词库构建好的情感词表逐个查找,若能找到,则是情感词,并读取情感极性及相应权值,否则,不是情感词,则进入下一个候选单词,直至整句话判断结束;
考虑到否定词会使情感词语的情感极性发生改变,算法设定当否定词出现奇数次时,表示否定意思;当否定词出现偶数次时,表示肯定意思,单独构建一个否定词典notDict,并设置其权值为-1,常见的否定词如:不、没、无、非、莫、弗、毋、勿、未、否、别、無、休,对否定词的处理过程如下:
当程度副词修饰情感词,该情感词的情感倾向程度发生了变化,为了准确表达文本的情感倾向需做相应的权值调整,采用来源于知网的情感程度副词共219个,为每个程度副词定义了一个权重,被程度副词修饰后的情感词其权值应做相应调整,过程如下:
(3)情感计算
在上述结果的基础上,本发明先求出意群的情感值:
意群情感值=否定词-1*程度词权重*情感词权重
句子是由意群组成,故句子的情感我们可以简单记做:
句子情感值=sum(意群情感值1,意群情感值2……)
微博由多个句子组成,本发明定义其情感值为:
微博情感值=average(句子1情感值,句子2情感值……)
3.根据权利要求1所述的一种基于社交网络的心理异常变化的自动观测技术,其特征在于:步骤三中以Total表示在该时间窗内的微博总数,则情感和程度、内容、发布时间和互动情况四个方面的心理行为轮廓构建方法具体如下:
a)情感和程度方面,统计目标对象在该时间窗口内的每条微博的情绪和强度,分别统计各种情绪强度的出现次数,以此计算各强度情绪的百分比,算法如下:
Ei,1=ei,1/Total
Ei,3=ei,3/Total
Ei,5=ei,5/Total
Ei,7=ei,7/Total
Ei,9=ei,9/Total
各类情绪的百分比为该类中各情绪的百分比之和,即可得到七类情绪的百分比M0…M6,算法如下:
Ei=Ei,1+Ei,3+Ei,5+Ei,7+Ei,9
b)内容方面,类似的,分别统计不同时间窗口内不同内容主题的百分比,目标对象发布的涉及该类内容主题的微博的数目为ci,则34种内容主题的百分比C0…C33的算法如下:
Ci=ci/Total
c)发布时间方面,统计目标对象在该时间窗口内每天的微博发布的时间,以人的大致生活规律将每天24小时分段进行统计,得到t0…t5,分别表示11pm-7am,7am-9am,9am-12am,12am-2pm,2pm-6pm,6pm-11pm,用Ti表示该时间段内发布微博的条数,ti各时间窗口内微博发布的个数,在此基础上即可得到相应的百分比为T0…T5,算法如下:
Ti=ti/Total
d)互动情况方面,统计目标对象在该事件窗口内在微博与人互动的次数(即在自身的微博的评论中发言的次数),得到f0、f1、f2和f3,分别是互动次数为0、在1-5次之内,6-10次之内和11次及以上的次数,在此基础上,得到相应的百分比F0,F1,F2和F3,具体如下:
F0=f0/Total
F1=f1/Total
F2=f2/Total
F3=f3/Total
4.根据权利要求1所述的一种基于社交网络的心理异常变化的自动观测技术,其特征在于:步骤三中筛选过程如下:
1)将上述各指标项按照百分比由高到低排序;
2)将结果集Res设置为空集;
3)设i=0,设total为0%;
4)取排序结果中的第i项,将该项加入Res;
5)取得到相应的百分比per;
6)total=total+per;
7)如果total<85%,则i=i+1并转回步骤4);
8)得到最终结果Res。
5.根据权利要求1所述的一种基于社交网络的心理异常变化的自动观测技术,其特征在于:步骤四中基于微博情感的心理异常观测器具体如下:
Similaritye,e’=e·e’/|e||e’|
Similaritym,m’=m·m’/|m||m’|
6.根据权利要求1所述的一种基于社交网络的心理异常变化的自动观测技术,其特征在于:步骤四中基于微博内容的心理异常观测器具体如下:
Similarityc,c’=c·c’/|c||c’|
7.根据权利要求1所述的一种基于社交网络的心理异常变化的自动观测技术,其特征在于:步骤四中基于微博发布时间的心理异常观测器具体如下:
Similarityt,t’=t·t’/|t||t’|
8.根据权利要求1所述的一种基于社交网络的心理异常变化的自动观测技术,其特征在于:步骤四中基于互动情况的心理异常观测器具体如下:
Similarityf,f’=f·f’/|f||f’|
9.根据权利要求1所述的一种基于社交网络的心理异常变化的自动观测技术,其特征在于:步骤五中基于多维度的心理异常判别器具体如下:
Similarity=Similaritye,e’+Similaritym,m’+Similarityc,c’
+Similarityt,t’+Similarityf,f’
其中设定阈值取值为4。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910066022.0A CN109903851B (zh) | 2019-01-24 | 2019-01-24 | 一种基于社交网络的心理异常变化的自动观测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910066022.0A CN109903851B (zh) | 2019-01-24 | 2019-01-24 | 一种基于社交网络的心理异常变化的自动观测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109903851A true CN109903851A (zh) | 2019-06-18 |
CN109903851B CN109903851B (zh) | 2023-05-23 |
Family
ID=66944041
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910066022.0A Active CN109903851B (zh) | 2019-01-24 | 2019-01-24 | 一种基于社交网络的心理异常变化的自动观测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109903851B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110706786A (zh) * | 2019-09-23 | 2020-01-17 | 湖南检信智能科技有限公司 | 非接触式心理参数智能分析与评测系统 |
CN110867250A (zh) * | 2019-10-28 | 2020-03-06 | 西安交通大学 | 一种基于强鲁棒性特征选择的社交媒体自残行为检测方法 |
CN111160696A (zh) * | 2019-11-21 | 2020-05-15 | 国政通科技有限公司 | 一种基于大数据的被检人员分级方法 |
CN111477328A (zh) * | 2020-03-31 | 2020-07-31 | 北京智能工场科技有限公司 | 一种非接触式的心理状态预测方法 |
CN111466931A (zh) * | 2020-04-24 | 2020-07-31 | 云南大学 | 基于eeg和食物图片数据集的情感识别方法 |
CN113345590A (zh) * | 2021-06-29 | 2021-09-03 | 安徽大学 | 一种基于异质图的用户心理健康监测方法及系统 |
CN113761146A (zh) * | 2021-01-05 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 识别顾客情绪波动的方法和装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104462480A (zh) * | 2014-12-18 | 2015-03-25 | 刘耀强 | 基于典型性的评论大数据挖掘方法 |
CN105740224A (zh) * | 2014-12-11 | 2016-07-06 | 仲恺农业工程学院 | 一种基于文本分析的用户心理预警方法与装置 |
CN108021660A (zh) * | 2017-12-04 | 2018-05-11 | 中国人民解放军国防科技大学 | 一种基于迁移学习的话题自适应的微博情感分析方法 |
CN108470065A (zh) * | 2018-03-22 | 2018-08-31 | 北京航空航天大学 | 一种异常评论文本的确定方法及装置 |
CN108508290A (zh) * | 2018-03-13 | 2018-09-07 | 北京润科通用技术有限公司 | 一种噪声故障模拟方法及装置 |
-
2019
- 2019-01-24 CN CN201910066022.0A patent/CN109903851B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105740224A (zh) * | 2014-12-11 | 2016-07-06 | 仲恺农业工程学院 | 一种基于文本分析的用户心理预警方法与装置 |
CN104462480A (zh) * | 2014-12-18 | 2015-03-25 | 刘耀强 | 基于典型性的评论大数据挖掘方法 |
CN108021660A (zh) * | 2017-12-04 | 2018-05-11 | 中国人民解放军国防科技大学 | 一种基于迁移学习的话题自适应的微博情感分析方法 |
CN108508290A (zh) * | 2018-03-13 | 2018-09-07 | 北京润科通用技术有限公司 | 一种噪声故障模拟方法及装置 |
CN108470065A (zh) * | 2018-03-22 | 2018-08-31 | 北京航空航天大学 | 一种异常评论文本的确定方法及装置 |
Non-Patent Citations (1)
Title |
---|
王铭等: "情绪障碍及其干预:心理表象的视角", 《心理科学进展》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110706786A (zh) * | 2019-09-23 | 2020-01-17 | 湖南检信智能科技有限公司 | 非接触式心理参数智能分析与评测系统 |
CN110867250A (zh) * | 2019-10-28 | 2020-03-06 | 西安交通大学 | 一种基于强鲁棒性特征选择的社交媒体自残行为检测方法 |
CN110867250B (zh) * | 2019-10-28 | 2022-10-25 | 西安交通大学 | 一种基于强鲁棒性特征选择的社交媒体自残行为检测方法 |
CN111160696A (zh) * | 2019-11-21 | 2020-05-15 | 国政通科技有限公司 | 一种基于大数据的被检人员分级方法 |
CN111477328A (zh) * | 2020-03-31 | 2020-07-31 | 北京智能工场科技有限公司 | 一种非接触式的心理状态预测方法 |
CN111466931A (zh) * | 2020-04-24 | 2020-07-31 | 云南大学 | 基于eeg和食物图片数据集的情感识别方法 |
CN113761146A (zh) * | 2021-01-05 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 识别顾客情绪波动的方法和装置 |
CN113345590A (zh) * | 2021-06-29 | 2021-09-03 | 安徽大学 | 一种基于异质图的用户心理健康监测方法及系统 |
CN113345590B (zh) * | 2021-06-29 | 2022-12-16 | 安徽大学 | 一种基于异质图的用户心理健康监测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109903851B (zh) | 2023-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109903851A (zh) | 一种基于社交网络的心理异常变化的自动观测技术 | |
Al Asad et al. | Depression detection by analyzing social media posts of user | |
Aljarah et al. | Intelligent detection of hate speech in Arabic social network: A machine learning approach | |
Aldarwish et al. | Predicting depression levels using social media posts | |
Joshi et al. | Depression detection using emotional artificial intelligence and machine learning: A closer review | |
KR102216768B1 (ko) | 심리상담 데이터를 이용한 텍스트 내 감정분석을 위한 시스템 및 방법 | |
KR102075788B1 (ko) | 빅 데이터를 활용한 건강정보 콘텐츠 추천 서비스 시스템 | |
Aragon et al. | Detecting mental disorders in social media through emotional patterns-the case of anorexia and depression | |
Ntracha et al. | Detection of mild cognitive impairment through natural language and touchscreen typing processing | |
Sihwi et al. | Twitter sentiment analysis of movie reviews using information gain and naïve bayes classifier | |
Syarif et al. | Study on mental disorder detection via social media mining | |
KR20120108095A (ko) | 소셜 데이터 분석 시스템 | |
CN110263169A (zh) | 一种基于卷积神经网络和关键词聚类的热点事件检测方法 | |
Chatterjee et al. | Suicide ideation detection using multiple feature analysis from Twitter data | |
Bentz | Adaptive languages: An information-theoretic account of linguistic diversity | |
Takano et al. | Computerized scoring algorithms for the Autobiographical Memory Test. | |
Sakib et al. | Analysis of suicidal tweets from twitter using ensemble machine learning methods | |
Basile et al. | You write like you eat: Stylistic variation as a predictor of social stratification | |
KR20090103171A (ko) | 댓글 자동 필터링 방법 | |
Alsubhi et al. | AraBig5: The big five personality traits prediction using machine learning algorithm on Arabic Tweets | |
Joshi et al. | Modeling and detecting change in user behavior through his social media posting using cluster analysis | |
Ananthakrishnan et al. | Suicidal intention detection in tweets using BERT-based transformers | |
Ceyhan et al. | Health service quality measurement from patient reviews in Turkish by opinion mining | |
Du | Lexical features and psychological states: A quantitative linguistic approach | |
Sitompul et al. | Template-based Natural Language generation in interpreting laboratory blood test |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |