CN109192276A - 一种基于社交网络平台的情感分析方法、装置及系统 - Google Patents
一种基于社交网络平台的情感分析方法、装置及系统 Download PDFInfo
- Publication number
- CN109192276A CN109192276A CN201810909550.3A CN201810909550A CN109192276A CN 109192276 A CN109192276 A CN 109192276A CN 201810909550 A CN201810909550 A CN 201810909550A CN 109192276 A CN109192276 A CN 109192276A
- Authority
- CN
- China
- Prior art keywords
- user
- data
- platform
- assistance
- social network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 108
- 238000012549 training Methods 0.000 claims abstract description 102
- 230000003340 mental effect Effects 0.000 claims abstract description 51
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 46
- 230000003993 interaction Effects 0.000 claims abstract description 39
- 238000010801 machine learning Methods 0.000 claims abstract description 31
- 238000013475 authorization Methods 0.000 claims abstract description 10
- 238000004590 computer program Methods 0.000 claims description 11
- 230000002452 interceptive effect Effects 0.000 claims description 9
- 230000003542 behavioural effect Effects 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 7
- 238000003066 decision tree Methods 0.000 claims description 4
- 238000007477 logistic regression Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 2
- 235000013399 edible fruits Nutrition 0.000 claims 1
- 238000000034 method Methods 0.000 abstract description 29
- 230000003211 malignant effect Effects 0.000 abstract description 6
- 230000009286 beneficial effect Effects 0.000 abstract description 4
- 230000008451 emotion Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 10
- 241001269238 Data Species 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 206010010144 Completed suicide Diseases 0.000 description 6
- 230000006399 behavior Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000011273 social behavior Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000035479 physiological effects, processes and functions Effects 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 230000008255 psychological mechanism Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000002147 killing effect Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004630 mental health Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000505 pernicious effect Effects 0.000 description 1
- 230000003449 preventive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 230000003997 social interaction Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/70—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to mental therapies, e.g. psychological therapy or autogenous training
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Primary Health Care (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Medical Informatics (AREA)
- Epidemiology (AREA)
- Entrepreneurship & Innovation (AREA)
- Social Psychology (AREA)
- Public Health (AREA)
- Quality & Reliability (AREA)
- Psychology (AREA)
- Psychiatry (AREA)
- Hospice & Palliative Care (AREA)
- Developmental Disabilities (AREA)
- Child & Adolescent Psychology (AREA)
- Computing Systems (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本申请公开了一种基于社交网络平台的情感分析方法,包括根据用户的授权信息采集所述用户基于社交网络平台的交互信息数据;通过机器学习算法对应的训练模型对所述交互信息数据进行分析处理,获得分析结果;根据所述分析结果判断是否提供心理援助;当提供所述心理援助时,采集所述用户基于所述心理援助的援助交互数据;根据所述援助交互数据确定所述用户的消极情感等级。该方法可通过关注用户在社交网络平台的社交关系、内容及互动,对其进行情感分析,能够及时发现有自杀倾向的用户并为之提供心理援助,有效避免了恶性事件的发生。本申请还公开了一种基于社交网络平台的情感分析装置、系统及计算机可读存储介质,也具有上述有益效果。
Description
技术领域
本申请涉及计算机网络技术领域,特别涉及一种基于社交网络平台的情感分析方法,还涉及一种基于社交网络平台的情感分析装置、系统及计算机可读存储介质。
背景技术
随着科学技术的飞速发展,移动互联网技术使社交网络平台进入了一个以人为本的全新社交形式阶段:更多元的社交关系、更丰富的社交内容、更多彩的社交互动。这一方面这意味着人们在社交网络平台上的“言行”不再仅是一种虚拟形象行为,而是真切地反应了他们的生活侧面或是情绪状态;另一方面也说明社交网络平台对于用户个体的心理研究更具社会现实意义。
近年来,用户由于种种原因会在社交网络平台而非现实生活中发泄负面情绪,袒露自杀倾向,虽经网友劝导和警方干预,但终以悲剧结束的事件时有发生。研究表明,自杀者在社交网络平台的行为实际上是在发出求救信号,如果能被及时发现并为之提供有效的心理援助,也许能够避免悲剧发生。
因此,如何通过关注用户在社交网络平台的社交关系、内容及互动,对其进行情感分析,及时发现有自杀倾向的用户并为之提供心理援助,避免恶性时间发生是本领域技术人员亟待解决的问题。
发明内容
本申请的目的是提供一种基于社交网络平台的情感分析方法,该方法可通过关注用户在社交网络平台的社交关系、内容及互动,对其进行情感分析,能够及时发现有自杀倾向的用户并为之提供心理援助,有效避免了恶性事件的发生;本申请的另一目的是提供一种基于社交网络平台的情感分析装置、系统及计算机可读存储介质,也具有上述有益效果。
为解决上述技术问题,本申请提供了一种基于社交网络平台的情感分析方法,所述方法包括:
根据用户的授权信息采集所述用户基于社交网络平台的交互信息数据;
通过机器学习算法对应的训练模型对所述交互信息数据进行分析处理,获得分析结果;
根据所述分析结果判断是否提供心理援助;
当提供所述心理援助时,采集所述用户基于所述心理援助的援助交互数据;
根据所述援助交互数据确定所述用户的消极情感等级。
优选的,所述采集用户基于社交网络平台的交互信息数据之前,还包括:
采集预定数量的已确定分析结果的训练集;
通过所述机器学习算法对所述训练集进行训练,获得所述训练模型。
优选的,所述机器学习算法为逻辑回归算法,或决策树,或贝叶斯分类算法。
优选的,所述交互信息数据包括:发布信息数据,互动信息数据,行为信息数据以及体征信息数据。
优选的,所述基于社交网络平台的情感分析方法还包括:
判断所述消极情感等级是否高于预设等级;
当高于所述预设等级时,发出援救警报。
优选的,所述基于社交网络平台的情感分析方法还包括:
采集所述援救警报对应的援救数据;
利用所述援救数据更新所述训练模型,获得更新训练模型。
优选的,所述利用所述援救数据更新所述训练模型,获得更新训练模型,包括:
根据所述援救数据对所述训练集进行修正处理,获得更新训练集;
通过所述机器学习算法对所述更新训练集进行训练,获得所述更新训练模型。
为解决上述技术问题,本申请提供了一种基于社交网络平台的情感分析装置,所述装置包括:
信息采集模块,用于根据用户的授权信息采集所述用户基于社交网络平台的交互信息数据;
信息分析模块,用于通过机器学习算法对所述交互信息数据进行分析处理,获得分析结果;
结果分析模块,用于根据所述分析结果判断是否提供心理援助;
心理援助模块,用于当提供所述心理援助时,采集所述用户基于所述心理援助的援助交互数据;
情感分析模块,用于根据所述援助交互数据确定所述用户的消极情感等级。
为解决上述技术问题,本申请提供了一种基于社交网络平台的情感分析系统,所述系统包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现上述任意一种基于社交网络平台的情感分析方法的步骤。
为解决上述技术问题,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一种基于社交网络平台的情感分析方法的步骤。
本申请所提供的一种基于社交网络平台的情感分析方法,包括根据用户的授权信息采集所述用户基于社交网络平台的交互信息数据;通过机器学习算法对应的训练模型对所述交互信息数据进行分析处理,获得分析结果;根据所述分析结果判断是否提供心理援助;当提供所述心理援助时,采集所述用户基于所述心理援助的援助交互数据;根据所述援助交互数据确定所述用户的消极情感等级。
可见,本申请所提供的基于社交网络平台的情感分析方法,通过机器学习算法对用户在社交网络平台的社交关系、内容及互动等相关信息数据进行情感分析处理,能够及时发现有消极情感甚至有自杀倾向的用户并为之提供心理援助,有效避免了恶性事件的发生。此外,基于社交网络平台的情感分析,一方面对于相关数据信息的采集难度较小,快捷方便,可有效保证数据源的个体代表性;另一方面也可免于给用户带来现实意义上的生理及心理负担,提高情感分析结果准确率。
本申请所提供的一种基于社交网络平台的情感分析装置、系统及计算机可读存储介质,也具有上述有益效果,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请所提供的一种基于社交网络平台的情感分析方法的流程示意图;
图2为本申请所提供的另一种基于社交网络平台的情感分析方法的流程示意图;
图3为本申请所提供的一种基于社交网络平台的情感分析装置的示意图;
图4为本申请所提供的另一种基于社交网络平台的情感分析装置的示意图;
图5为本申请所提供的一种基于社交网络平台的情感分析系统的结构示意图。
具体实施方式
本申请的核心是提供一种基于社交网络平台的情感分析方法,该方法可通过关注用户在社交网络平台的社交关系、内容及互动,对其进行情感分析,能够及时发现有自杀倾向的用户并为之提供心理援助,有效避免了恶性事件的发生;本申请的另一核心是提供一种基于社交网络平台的情感分析装置、系统及计算机可读存储介质,也具有上述有益效果。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
情感分析是指对具有主观情感倾向的文本进行提取、分析、处理、归纳和推理的过程,具体由三个递进关系的子任务组成:情感信息抽取、情感信息分类、情感信息检索和归纳。情感信息抽取是情感分析的底层任务,其结果主要用于上层的情感信息分类,而经过分类的情感信息可进一步建立与分类结果的索引关系,从而服务于情感信息检索和归纳。
现有技术中,通过情感分析实现自杀倾向预测的方法多种多样,如基于心理普查数据的分析方法,基于临床医学数据的分析方法以及基于用户行为的分析方法等。
其中,基于心理普查数据的分析方法是以问卷调查或心理咨询的形式收集用户数据,以心理学理论作为指导人工完成自杀风险评估。然而,该方法需要依赖于专业、全面、符合实际的问卷或心理咨询的内容定制,更依赖于受试用户的理解能力、作答效果,需要投入大量人工成本,数据收集难度大。此外,该方法对于疑似具有自杀倾向的受试用户的回访难度大,效率低,且对于因种种原因抗拒或违心作答的自杀倾向者无任何帮助;同时,由于信息滞后的原因,该方法也无法给真正存在自杀倾向的用户提供及时的专业心理援助。
基于临床医学数据的分析方法一般包括两个方面,其中一方面是根据相关医学指标对用户的各种入院记录信息进行分析预测,但是该方法涉及复杂的风险组合理论和算法,对入院记录的分析难度较大。另一方面则是通过医疗设备研发对特定人群,如病患、抑郁患者等,进行自杀倾向预测,但是该方法需要用户本人到场,会给用户带来一定程度的心理或生理负担,且医疗设备的使用也造成了成本的增加。
基于用户行为的分析方法也包括两个方面,其中一方面是利用可穿戴设备实时监控并分析用户的静息数据,对判定为处于危险状态的用户采取相关的策略进行保护,但是,外设的使用也在一定程度上增加了测试成本,同样也会给用户带来直接现实意义上的心理及生理负担。另一方面则是通过监测和分析用户网络设备接口上的数据包,判断用户使用互联网行为的危险性,进而根据相关模板匹配判断用户的人群特征类别,对判定为“具有自杀倾向的人”类的用户实施预警干预,但是基于模板匹配的互联网用户行为分析方法需人工制定复杂的匹配模板,预测系统复杂度较高。
为解决上述问题,本申请提供了一种基于社交网络平台的情感分析方法,以实现对被测用户的自杀倾向预测。请参考图1,图1为本申请所提供的一种基于社交网络平台的情感分析方法的流程示意图,该方法可以包括:
S101:根据用户的授权信息采集用户基于社交网络平台的交互信息数据;
具体的,在用户确认授权的前提下进入情感分析阶段,可先对该用户在社交网络平台上的各类交互信息数据进行采集,以开启对该用户的自杀倾向预测功能。而对于上述交互信息数据的具体内容及其种类,根据实际需要进行设定即可,本申请不做具体限定。
优选的,上述交互信息数据可以包括发布信息数据,互动信息数据,行为信息数据以及体征信息数据。
本申请提供了更为具体的用户基于社交网络平台的交互信息数据,可包括发布信息数据,互动信息数据,行为信息数据以及体征信息数据。其中,发布信息数据可包括用户在社交网络平台上发布的各类信息,如个人信息、内容信息以及图像信息等;互动信息数据可包括用户在社交网络平台上的各类社交行为信息以及搜索信息等;行为信息数据可包括用户的上线时间、离线时间、位置标识信息等行为信息;体征信息数据可包括用户与社交网络平台共享的心率、步数、睡眠等体征信息。
S102:通过机器学习算法对应的训练模型对交互信息数据进行分析处理,获得分析结果;
具体的,在采集获得用户基于社交网络平台的交互信息数据后,即可通过机器学习算法对应的训练模型进行分析处理,以获得对应的分析结果。其中,机器学习是指从数据中挖掘出有价值的信息的过程,本申请则是通过机器学习中的分类算法对待处理的交互信息数据进行类别预测。
具体而言,在确定使用某个机器学习算法进行分类后,首先要进行算法训练,即让算法学习如何分类,通常的做法是为算法输入大量类别已知的数据作为算法的训练集,由算法学习和表达特征与类别间的关系,得到一个称为分类器的预测模型,最后将类别未知的测试集输入到预测模型中,得到测试集中每个样本的预测类别。其中,样本通常是指一条数据记录,其特征是指数据记录的描述关键字,关键字的具体内容称为特征值;训练集是指类别已知的样本的集合,用于训练机器学习算法;测试集是指类别未知的样本的集合,用于输入到预测模型中进行类别判断,即测试集除类别未知以外,其数据结构与训练集完全相同。
因此,作为一种优选实施例,上述采集用户基于社交网络平台的交互信息数据之前,还可包括:采集预定数量的已确定分析结果的训练集;通过机器学习算法对训练集进行训练,获得训练模型。
具体的,在对交互信息数据进行分析处理之前,可先完成算法选择,以及训练集的定义,该训练集即为上述交互信息数据对应的训练集,进一步即可通过已确定的机器学习算法对预定数量的训练集进行训练,获得所需的训练模型。
首先,对上述各类交互信息数据对应的训练集进行采集,采集完毕后提取其相应的特征。此处,可对应于本申请提供的上述各类交互信息数据,在上述发布信息数据中,对于个人信息,可读取用户在社交网络平台上填写的性别、年龄、职业、所在地等个人数据,以及社交网络平台为该用户生成的注册时间、用户等级等历史数据作为特征使用;对于内容信息,可以基于情感分析技术读取用户在社交网络平台发布的内容信息,并转换为情感倾向等情感信息作为特征使用;对于图像信息,可以基于图像分析技术读取用户在社交网络平台发布的配图,并通过绘制颜色直方图的方式提取颜色熵、亮度、整体色调、主要色系、次要色系等信息作为特征使用。进一步,在上述互动信息数据中,对于社交行为信息,可读取用户的转发、评论、点赞等信息,计算其频率、次数等统计数据作为特征使用;对于搜索信息,则可以通过情感分析技术对上述各类社交行为信息提取情感信息作为特征使用。再者,在上述行为信息数据中,可直接根据读取的用户的上线时间、离线时间、位置标识信息等行为信息,计算其上线频率及时段、活跃时长、自杀频发区域识别等统计数据作为特征使用。最后,在上述体征信息数据中,也可直接根据读取的用户在社交网络平台共享的心率、步数、睡眠等体征信息,计算用户近期的平均心率、最高/低心率、心率陡增的频率、日均步数、睡眠日均时长、浅/深度睡眠平均时长等统计数据作为特征使用。
作为一种优选的实施方式,在对训练集进行采集的过程中,其中的各个已知样本可对应于用户在特定时间窗口内基于社交网络平台的交互信息数据,如对于体征信息数据,可以为用户在特定时间窗口内的生命体征数据。其中,上述时间窗口决定了训练集中各个已知样本采自多长时间范围内的用户基于社交网络平台的交互信息数据,其具体时长可根据实际需要进行设定,时间窗口越大训练集越丰富,分析难度也会越大。
当然,对于上述提供的各类交互信息数据对应的训练集及相应的特征选择,仅为本申请所提供的一种实施方式,可根据实际情况对其进行增减,均不影响本技术方案的实施。
进一步,对训练集中的各类已知样本进行取值定义,可定义为“是否提供心理援助”,其对应取值为“是”或“否”,而对于该取值选择,一方面可根据用户的心理援助历史,进行自动标注或由专业心理机构人工标注,另一方面,对于采样获得的发生过自杀行为的案例用户的社交网络平台数据,可直接将其对应的样本类别默认标注为“是”。相应的,基于该训练集获得的训练模型在对采集的交互信息数据进行分析处理时,其对应的输出同样为“是否提供心理援助”的二类判断。
需要说明的是,对于上述训练模型的获取时间,本申请所选择的是在S101之前,由于训练集的采集及训练是需要一定时间的,即训练模型的获取是需要一定时间的,因此,在用户接受情感分析之前,训练模型就已经获取完毕,可有效节省情感分析时间,提高效率。当然,也可以选择在S102之前,同样不影响本技术方案的实施。
优选的,上述机器学习算法可以为逻辑回归算法,或决策树,或贝叶斯分类算法。
具体的,本申请提供了集中较为具体的可用于实现上述分类学习功能的机器学习算法,如逻辑回归算法,决策树,贝叶斯分类算法等,当然,也可以选择其它算法,如SVM算法、集成学习算法等,均可实现上述功能。
S103:根据分析结果判断是否提供心理援助;
具体的,在获得相应的分析结果后,即可根据该分析结果判断是否需要提供心理援助,如果不需要心理援助,则说明该用户情感正常,心理健康;如果判断结果为需要心理援助,则说明该用户存在一定的消极情感,此时即可为其提供心理援助,该心理援助是基于社交网络平台展示给用户的,可称为心理援助提示,即在检测到用户存在心理危机时提供的一种及时的前期心理援助,对于其具体内容本技术方案不做硬性规定。
S104:当提供心理援助时,采集用户基于心理援助的援助交互数据;
S105:根据援助交互数据确定用户的消极情感等级。
具体的,在对判定为具有消极情感的用户提供心理援助时,可实时采集用户接收该心理援助时产生的数据信息,即上述援助交互数据;进一步,即可根据该援助交互数据确定用户的消极情感等级。
其中,上述援助交互数据可以包括用户的实际需求数据,即用户是否真正接受心理援助提示的数据,以及心理援助互动数据,即用户接受心理援助提示的过程数据,如完成度、完成时长等数据。而对于消极情感等级的级数,由技术人员基于实际情况进行设定即可,并不唯一,消极情感等级越高,用户的自杀倾向越高。
进一步,在上述根据援助交互数据确定用户的消极情感等级时,同样可基于机器学习算法实现。以用户的消极情感等级分为“具有自杀倾向”和“不具有自杀倾向”为例,首先,可预先采集上述援助交互数据对应的训练集,该训练集中的各个样本即为已知类别的用户的援助交互数据。其中,对于其特征选取,可选择根据上述援助交互数据计算获得的用户接受心理援助次数、拒绝心理援助次数、接受时段分布及频率、平均完成度、平均完成时长等统计数据;对于训练集中的各类已知样本的取值定义,可定义为“是否具有自杀倾向”,其对应取值为“是”或“否”,而对于该取值选择,可参照上述交互信息数据对应训练集的样本取值过程。进一步,即可基于已经确定的机器学习算法对该训练集进行训练获得相应的训练模型,相应的,该训练模型对应的输出同样为“是否具有自杀倾向”的二类判断。由此,当获得上述援助交互数据后,即可通过训练模型对其进行分析处理,以确定用户是否具有自杀倾向。
此外,在上述基于机器学习算法实现对用户消极情感等级的确定的过程中,其对应的训练集以及测试集(即上述援助交互数据)存在“多条样本对应同一用户”的情况,即训练集中的各个已知类别样本对应于不同的交互信息数据,获得的援助交互数据也对应于不同的交互信息数据。因此,为保证情感分析结果的准确性,本技术方案对不同类别的交互信息数据产生的样本数据设置了样本权重,来自相同类别的交互信息数据的样本其样本权重相等。样本权重的设置使得训练模型更加关注于高权值的样本的预测类别的准确性,从整体上达到更好的预测效果,其具体定义请参照表1,表1为本申请所提供的一种基于不同类别的交互信息数据的样本权重设置表。
样本权重 | 样本来源 | 初始化值 |
α | 发布信息数据 | 1 |
β | 互动信息数据 | 1 |
γ | 行为信息数据 | 1 |
δ | 体征信息数据 | 1 |
表1样本权重设置表
记上述交互信息数据对应的训练模型的准确率为accuracy,那么:
则权重更新公式为(以α为例,其他同理可得):
其中,accuracyα表示发布信息数据对应的训练模型的准确率,其余标记同理,且更新后的各类样本权重满足:
α+β+γ+δ=1。
因此,对于其自杀倾向的预测结果,可取决于对多条援助交互数据的预测类别的“多票表决”结果,即对于某用户,假设与其对应的样本共有n个,其中预测类别为“是”的样本总数超过n/2,则认为该用户具有自杀倾向,否则认为用户不具有自杀倾向。
本申请所提供的基于社交网络平台的情感分析方法,通过机器学习算法对用户在社交网络平台的社交关系、内容及互动等相关信息数据进行情感分析处理,能够及时发现有消极情感甚至有自杀倾向的用户并为之提供心理援助,有效避免了恶性事件的发生。此外,基于社交网络平台的情感分析,一方面对于相关数据信息的采集难度较小,快捷方便,可有效保证数据源的个体代表性;另一方面也可免于给用户带来现实意义上的生理及心理负担,提高情感分析结果准确率。
在上述实施例的基础上,请参考图2,图2为本申请所提供的另一种基于社交网络平台的情感分析方法的流程示意图。
作为一种优选实施例,该基于社交网络平台的情感分析方法还可以包括:
S206:判断消极情感等级是否高于预设等级;
S207:当高于预设等级时,发出援救警报。
具体的,在确定用户的消极情感等级后,即可判断该等级是否高于预设等级,如若高于预设等级,则说明该用户有自杀倾向,为避免恶性事件的发生,可立即发出援救警报,以便对该用户及时进行心理援救,心理援救即为当最终判定用户具有自杀倾向时提供的一种及时的援救工作,可包括联系专业心理机构、警方、用户的亲友等方式。此外,对于上述预设等级的设定,本申请不进行唯一限定。
优选的,该基于社交网络平台的情感分析方法还可以包括:
S208:采集援救警报对应的援救数据;
S209:利用援救数据更新训练模型,获得更新训练模型。
具体的,在执行援救警报时,可实时采集其对应的援救数据,即用户是否真正接受心理援救的数据,进一步,即可根据该救援数据对之前的训练模型进行更新,以获取增强后的训练模型,即上述更新训练模型。由此,通过不断地根据用户实际反馈的数据进行自我学习、自我完善,有效增强了情感分析系统整体的健壮性和普适性,更易于达到更优的情感分析效果。
优选的,上述利用援救数据更新训练模型,获得更新训练模型,可以包括:根据援救数据对训练集进行修正处理,获得更新训练集;通过机器学习算法对更新训练集进行训练,获得更新训练模型。
具体的,根据采集的上述援救数据,即用户经心理援救或相关专业心理机构确认是否真正具有自杀倾向,修正对应训练集中所有样本的预测类别,修正方法如下:当训练集中样本的类别与用户实际需求数据类别不同时,修改样本的类别为用户实际需求数据的类别,其余情况不作修改;同时,可进一步根据上述各个公式更新样本权重,将修正后的训练集作为新的训练集,输入到机器学习算法重新进行训练,得到新的、修正的、增强后的训练模型,即更新训练模型。
此外,对应于上述救援数据对应的训练模型的更新过程,还可对交互信息数据对应的训练模型进行修正,根据采集的用户实际需求数据,即用户实际上是否接受了心理援助提示,修正对应训练集中所有样本的预测类别,其修证方法可参照上述救援数据对应的训练模型的更新过程,本申请在此不再赘述。
为解决上述问题,请参考图3,图3为本申请所提供的一种基于社交网络平台的情感分析装置的示意图,该装置可包括:
信息采集模块10,用于根据用户的授权信息采集用户基于社交网络平台的交互信息数据;
信息分析模块20,用于通过机器学习算法对交互信息数据进行分析处理,获得分析结果;
结果分析模块30,用于根据分析结果判断是否提供心理援助;
心理援助模块40,用于当提供心理援助时,采集用户基于心理援助的援助交互数据;
情感分析模块50,用于根据援助交互数据确定用户的消极情感等级。
在上述实施例的基础上,请参考图4,图4为本申请所提供的另一种基于社交网络平台的情感分析装置的示意图。
作为一种优选实施例,该基于社交网络平台的情感分析装置在上述信息采集模块10之前还可以包括:
训练模型获取模块60,用于采集预定数量的已确定分析结果的训练集;并通过机器学习算法对训练集进行训练,获得训练模型。
作为一种优选实施例,该基于社交网络平台的情感分析装置还可以包括:
报警模块70,用于判断消极情感等级是否高于预设等级;当高于预设等级时,发出援救警报。
作为一种优选实施例,该基于社交网络平台的情感分析装置还可以包括:
训练模型更新模块80,用于采集援救警报对应的援救数据;并利用援救数据更新训练模型,获得更新训练模型。
作为一种优选实施例,上述训练模型更新模块80可以包括:
援救数据采集子模块,用于采集援救警报对应的援救数据;
训练集修正子模块,用于根据援救数据对训练集进行修正处理,获得更新训练集;
训练集训练子模块,用于通过机器学习算法对更新训练集进行训练,获得更新训练模型。
对于本申请提供的装置的介绍请参照上述方法实施例,本申请在此不做赘述。
为解决上述问题,请参考图5,图5为本申请所提供的一种基于社交网络平台的情感分析系统的结构示意图,该系统可包括:
存储器1,用于存储计算机程序;
处理器2,用于执行计算机程序时可实现如下步骤:
根据用户的授权信息采集用户基于社交网络平台的交互信息数据;通过机器学习算法对应的训练模型对交互信息数据进行分析处理,获得分析结果;根据分析结果判断是否提供心理援助;当提供心理援助时,采集用户基于心理援助的援助交互数据;根据援助交互数据确定用户的消极情感等级。
对于本申请提供的系统的介绍请参照上述方法实施例,本申请在此不做赘述。
为解决上述问题,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时可实现如下步骤:
根据用户的授权信息采集用户基于社交网络平台的交互信息数据;通过机器学习算法对应的训练模型对交互信息数据进行分析处理,获得分析结果;根据分析结果判断是否提供心理援助;当提供心理援助时,采集用户基于心理援助的援助交互数据;根据援助交互数据确定用户的消极情感等级。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
对于本申请提供的计算机可读存储介质的介绍请参照上述方法实施例,本申请在此不做赘述。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本申请所提供的基于社交网络平台的情感分析方法、装置、系统及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围要素。
Claims (10)
1.一种基于社交网络平台的情感分析方法,其特征在于,包括:
根据用户的授权信息采集所述用户基于社交网络平台的交互信息数据;
通过机器学习算法对应的训练模型对所述交互信息数据进行分析处理,获得分析结果;
根据所述分析结果判断是否提供心理援助;
当提供所述心理援助时,采集所述用户基于所述心理援助的援助交互数据;
根据所述援助交互数据确定所述用户的消极情感等级。
2.如权利要求1所述的情感分析方法,其特征在于,所述采集用户基于社交网络平台的交互信息数据之前,还包括:
采集预定数量的已确定分析结果的训练集;
通过所述机器学习算法对所述训练集进行训练,获得所述训练模型。
3.如权利要求2所述的情感分析方法,其特征在于,所述机器学习算法为逻辑回归算法,或决策树,或贝叶斯分类算法。
4.如权利要求1所述的情感分析方法,其特征在于,所述交互信息数据包括:发布信息数据,互动信息数据,行为信息数据以及体征信息数据。
5.如权利要求1至4任意一项所述的情感分析方法,其特征在于,还包括:
判断所述消极情感等级是否高于预设等级;
当高于所述预设等级时,发出援救警报。
6.如权利要求5所述的情感分析方法,其特征在于,还包括:
采集所述援救警报对应的援救数据;
利用所述援救数据更新所述训练模型,获得更新训练模型。
7.如权利要求6所述的情感分析方法,其特征在于,所述利用所述援救数据更新所述训练模型,获得更新训练模型,包括:
根据所述援救数据对所述训练集进行修正处理,获得更新训练集;
通过所述机器学习算法对所述更新训练集进行训练,获得所述更新训练模型。
8.一种基于社交网络平台的情感分析装置,其特征在于,包括:
信息采集模块,用于根据用户的授权信息采集所述用户基于社交网络平台的交互信息数据;
信息分析模块,用于通过机器学习算法对所述交互信息数据进行分析处理,获得分析结果;
结果分析模块,用于根据所述分析结果判断是否提供心理援助;
心理援助模块,用于当提供所述心理援助时,采集所述用户基于所述心理援助的援助交互数据;
情感分析模块,用于根据所述援助交互数据确定所述用户的消极情感等级。
9.一种基于社交网络平台的情感分析系统,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任意一项所述的基于社交网络平台的情感分析方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任意一项所述的基于社交网络平台的情感分析方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810909550.3A CN109192276A (zh) | 2018-08-10 | 2018-08-10 | 一种基于社交网络平台的情感分析方法、装置及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810909550.3A CN109192276A (zh) | 2018-08-10 | 2018-08-10 | 一种基于社交网络平台的情感分析方法、装置及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109192276A true CN109192276A (zh) | 2019-01-11 |
Family
ID=64920979
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810909550.3A Pending CN109192276A (zh) | 2018-08-10 | 2018-08-10 | 一种基于社交网络平台的情感分析方法、装置及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109192276A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112085386A (zh) * | 2020-09-09 | 2020-12-15 | 浙江连信科技有限公司 | 用于风险行为预测的模型训练方法和装置 |
CN112669936A (zh) * | 2021-01-04 | 2021-04-16 | 上海海事大学 | 一种基于文本和图像社交网络抑郁检测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104239288A (zh) * | 2014-09-18 | 2014-12-24 | 清华大学 | 基于微博的青少年心理压力检测和疏导的方法及系统 |
US20150112753A1 (en) * | 2013-10-17 | 2015-04-23 | Adobe Systems Incorporated | Social content filter to enhance sentiment analysis |
CN106776982A (zh) * | 2016-12-02 | 2017-05-31 | 深圳市唯特视科技有限公司 | 一种采用机器学习的社交媒体情感分析方法 |
-
2018
- 2018-08-10 CN CN201810909550.3A patent/CN109192276A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150112753A1 (en) * | 2013-10-17 | 2015-04-23 | Adobe Systems Incorporated | Social content filter to enhance sentiment analysis |
CN104239288A (zh) * | 2014-09-18 | 2014-12-24 | 清华大学 | 基于微博的青少年心理压力检测和疏导的方法及系统 |
CN106776982A (zh) * | 2016-12-02 | 2017-05-31 | 深圳市唯特视科技有限公司 | 一种采用机器学习的社交媒体情感分析方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112085386A (zh) * | 2020-09-09 | 2020-12-15 | 浙江连信科技有限公司 | 用于风险行为预测的模型训练方法和装置 |
CN112669936A (zh) * | 2021-01-04 | 2021-04-16 | 上海海事大学 | 一种基于文本和图像社交网络抑郁检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zebrowitz et al. | Older and younger adults' first impressions from faces: similar in agreement but different in positivity. | |
US9508360B2 (en) | Semantic-free text analysis for identifying traits | |
US9861308B2 (en) | Method and system for monitoring stress conditions | |
US10376197B2 (en) | Diagnosing system for consciousness level measurement and method thereof | |
Cocos et al. | Crowd control: Effectively utilizing unscreened crowd workers for biomedical data annotation | |
CN108780663A (zh) | 数字个性化医学平台和系统 | |
JPWO2019187933A1 (ja) | 健康支援システム、情報提供シート出力装置、方法およびプログラム | |
US20170316180A1 (en) | Behavior prediction apparatus, behavior prediction apparatus controlling method, and behavior prediction apparatus controlling program | |
CN107180283A (zh) | 一种基于最优特征组合的再住院行为预测系统及方法 | |
Rebelo et al. | The impact of artificial intelligence on the tasks of mental healthcare workers: A scoping review | |
CN109192276A (zh) | 一种基于社交网络平台的情感分析方法、装置及系统 | |
CN113434651A (zh) | 话术推荐方法、装置及相关设备 | |
US20230154583A1 (en) | Means for categorizing and treating disordered situations | |
JP7133207B2 (ja) | 情報処理装置及びプログラム | |
KR20130026845A (ko) | 설문 정보를 이용한 건강 상태 판단 장치 및 방법, 건강 분류 함수 생성 장치 및 그 방법 | |
US10820851B2 (en) | Diagnosing system for consciousness level measurement and method thereof | |
Pedro et al. | Mobile decision support for triage in emergency departments | |
Palmer et al. | Risk perception and ethnicity | |
Oliveira-Barra et al. | Serious games application for memory training using egocentric images | |
Sulak et al. | Analysis of Depression, Anxiety, Stress Scale (DASS‐42) With Methods of Data Mining | |
Sudha et al. | Stress detection based on human parameters using machine learning algorithms | |
Weber | THIS ARTICLE HAS BEEN RETRACTED Critical care nurse practitioners and clinical nurse specialists interface patterns with computer-based decision support systems | |
Rigor Hayag Jr et al. | LOCALIZED KNOWLEDGE BASED SYSTEM FOR DIAGNOSIS AND TREATMENT OF PEDIATRIC PNEUMONIA: THE CASE OF TIGRAI CENTRAL ZONE IN ETHIOPIA. | |
Sriramulugari et al. | The opinion based analysis for stressed adults using sentimental mining model | |
Radhakrishnan et al. | Stress Evaluation in Veteran Population Using BRFSS Data with Machine Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190111 |
|
RJ01 | Rejection of invention patent application after publication |