CN109524106A - 一种通过聊天内容分析自杀倾向的心理模型 - Google Patents
一种通过聊天内容分析自杀倾向的心理模型 Download PDFInfo
- Publication number
- CN109524106A CN109524106A CN201811286196.XA CN201811286196A CN109524106A CN 109524106 A CN109524106 A CN 109524106A CN 201811286196 A CN201811286196 A CN 201811286196A CN 109524106 A CN109524106 A CN 109524106A
- Authority
- CN
- China
- Prior art keywords
- sentence
- clue
- collection
- indirect
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Public Health (AREA)
- Data Mining & Analysis (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种通过聊天内容分析自杀倾向的心理模型,包括:步骤1,数据收集平台向业务系统要求聊天数据;步骤2,数据收集平台根据关键词库,筛选合适的语句;步骤3,确定语句的对象;步骤4,确定语句的类别;步骤5,划分对象等级。本发明具有如下优点:通过筛选聊天工具的聊天数据,分析出聊天对象的自杀倾向等级,当对象被标识极高风险对象后,即可移交给执政者,对该对象进行重点关注,避免对象自杀事件的产生。
Description
技术领域
本发明涉及大数据分析,具体涉及一种通过聊天内容分析自杀倾向的心理模型。
背景技术
自杀是指个体在复杂心理活动作用下,蓄意或自愿采取各种手段结束自己性命的危险行为。自杀作为一种复杂的社会现象,学者们对其分类有不同的看法。
19世纪末,法国社会学家涂尔干因其对自杀原因的解释和分类信受学者的重视。涂尔干认为,自杀并不是一种简单的个人行为,而是对正在解体的社会的反应。由于社会的动乱和衰退造成了社会、文化的不稳定状态,破坏了对个体非常重要的社会支持和交往。因而就削弱了生存的能力、信心和意志,导致自杀率明显增高。
现代化的社会,生活节奏加快,个体的压力加大,个体自杀案例逐渐增加,容易产生社会恐慌,所以也是执政者需要解决的问题,很多案例中,死者都有在聊天工具中留下遗言,如可以尽早发现端倪,可能会解救将要自杀的人。
发明内容
本发明的目的在于提供一种通过聊天内容分析自杀倾向的心理模型,用以解决现有自杀个体有在聊天工具中留下遗言,但无法快速识别的问题。
为实现上述目的,本发明的技术方案为一种通过聊天内容分析自杀倾向的心理模型,包括以下步骤:
步骤1:数据收集平台与业务系统进行通信,向业务系统要求聊天数据,业务系统将聊天数据发送至数据收集平台;
步骤2:数据收集平台对收到的聊天数据进行筛选,筛选出涵盖关键词的语句,筛选出各涵盖关键词的语句所对应的对象,
步骤3:数据收集平台中建立倾向对象库和语句库,将筛选对象都存入倾向对象库,筛选语句都存入语句库,所有的筛选语句都对应有一个筛选对象,所有的筛选对象都对应有一个或多个筛选语句;
步骤4:进一步筛选语句库中的语句,将语句进行分类;
步骤5:进一步筛选倾向对象库中的对象,根据对象对应语句的种类,划分对象的等级。
所述的步骤2中,数据收集平台中建立有关键词库,关键词库中的关键词可增加或删除。
步骤4中语句的分类是指:分离出含有直接线索的语句、含有间接线索的语句、含有自杀手段的语句和含有负面情感的语句,语句库中建立直接线索集、间接线索集、自杀手段集和负面情感集,将含有直接线索的语句存入到直接线索集;含有间接线索的语句存入到间接线索集;含有自杀手段的语句存入到自杀手段集;含有负面情感的语句存入负面情感集。
步骤5中对象等级划分方法为:分析对象对应语句所在集,如对象对应语句中含有直接线索集或间接线索集中的语句,并且含有自杀手段集中的语句,则标识该对象为极高风险对象;如对象对应语句中含有直接线索集中的语句,但无自杀手段集中的语句,则标识该对象为高风险对象;如对象对应语句中含有间接线索集中语句,但无直接线索集和自杀手段集中的语句,则标识该对象为中风险对象;如对象对应语句中只含有情感语句集中的语句,则标识对象为低风险对象。
所述的直接线索语句通过直接线索关键词进行筛选,间接线索语句通过间接线索关键词进行筛选,自杀手段语句通过自杀手段关键词进行筛选,负面情感语句通过负面情感关键词进行筛选,上述关键词都存入在数据收集平台中的关键词库中,该关键词库中含有直接线索关键词组、间接线索关键词组、自杀手段关键词组和负面情感关键词组。
步骤2中,数据接收平台收到聊天数据中筛选完后,剩余的对象都存放在无倾向对象库,无倾向对象库中的对象都标识为无风险对象。
本发明具有如下优点:
通过筛选聊天工具的聊天数据,分析出聊天对象的自杀倾向等级,当对象被标识极高风险对象后,即可移交给执政者,对该对象进行重点关注,避免对象自杀事件的产生。
附图说明
图1为本发明的流程图。
具体实施方式
以下实施例用于说明本发明,但不用来限制本发明的范围。
实施例1
如图1所示,一种通过聊天内容分析自杀倾向的心理模型,包括以下步骤:
步骤1:数据收集平台与业务系统进行通信,向业务系统要求聊天数据,业务系统将聊天数据发送至数据收集平台;
步骤2:数据收集平台对收到的聊天数据进行筛选,筛选出涵盖关键词的语句,筛选出各涵盖关键词的语句所对应的对象,
步骤3:数据收集平台中建立倾向对象库和语句库,将筛选对象都存入倾向对象库,筛选语句都存入语句库,所有的筛选语句都对应有一个筛选对象,所有的筛选对象都对应有一个或多个筛选语句;
步骤4:进一步筛选语句库中的语句,将语句进行分类;
步骤5:进一步筛选倾向对象库中的对象,根据对象对应语句的种类,划分对象的等级。
所述的步骤2中,数据收集平台中建立有关键词库,关键词库中的关键词可增加或删除。
步骤4中语句的分类是指:分离出含有直接线索的语句、含有间接线索的语句、含有自杀手段的语句和含有负面情感的语句,语句库中建立直接线索集、间接线索集、自杀手段集和负面情感集,将含有直接线索的语句存入到直接线索集;含有间接线索的语句存入到间接线索集;含有自杀手段的语句存入到自杀手段集;含有负面情感的语句存入负面情感集。
步骤5中对象等级划分方法为:分析对象对应语句所在集,如对象对应语句中含有直接线索集或间接线索集中的语句,并且含有自杀手段集中的语句,则标识该对象为极高风险对象;如对象对应语句中含有直接线索集中的语句,但无自杀手段集中的语句,则标识该对象为高风险对象;如对象对应语句中含有间接线索集中语句,但无直接线索集和自杀手段集中的语句,则标识该对象为中风险对象;如对象对应语句中只含有情感语句集中的语句,则标识对象为低风险对象。
所述的直接线索语句通过直接线索关键词进行筛选,间接线索语句通过间接线索关键词进行筛选,自杀手段语句通过自杀手段关键词进行筛选,负面情感语句通过负面情感关键词进行筛选,上述关键词都存入在数据收集平台中的关键词库中,该关键词库中含有直接线索关键词组、间接线索关键词组、自杀手段关键词组和负面情感关键词组。
步骤2中,数据接收平台收到聊天数据中筛选完后,剩余的对象都存放在无倾向对象库,无倾向对象库中的对象都标识为无风险对象。
本发明的关键词库中,直接线索关键词包括如:我不想活下去、我想自杀、真希望我死了算了、如果不如何我就自杀等等;间接线索关键词包括如:生活没有意义了、我的问题解决不了、死了比活着好、没有我大家会更好、我再也无法忍受、我看不到任何希望、现在没有人能帮助我等等;自杀手段关键词包括如:约死、不怕死、离世、约着一起走、某年某月某日死、那种方法不痛苦、自缢、服毒、枪击、割腕、安眠药、跳楼等;负面情感关键词包括如:失恋、离婚、身体健康问题、不公正对待问题、一些负面情绪(绝望、愤怒、孤独、难过、内疚、无望)等等。
我们的软件搜索时,根据关键词来筛选语句,但会搜索的关键词不仅仅是限定的,可以是与关键词相似和类似的,以保障搜索的准确性。
本发明还具有深度学习能力,我们工作人员在考察某个对象,如该对象是极高风险对象,其包含了线索语句和手段语句,线索语句是我的问题解决不了,手段语句是约着一起走,但对象的聊天内容是由一个工作问题无法解决需要加班,与人约定一起延迟回家,这个情况工作人员会将对象剔除出极高风险对象,系统则会自动学习该处理手段,自动剔除对象。
本发明中的聊天数据主要来源于QQ、微信和论坛。
Claims (6)
1.一种通过聊天内容分析自杀倾向的心理模型,其特征在于,包括以下步骤:
步骤1:数据收集平台与业务系统进行通信,向业务系统要求聊天数据,业务系统将聊天数据发送至数据收集平台;
步骤2:数据收集平台对收到的聊天数据进行筛选,筛选出涵盖关键词的语句,筛选出各涵盖关键词的语句所对应的对象,
步骤3:数据收集平台中建立倾向对象库和语句库,将筛选对象都存入倾向对象库,筛选语句都存入语句库,所有的筛选语句都对应有一个筛选对象,所有的筛选对象都对应有一个或多个筛选语句;
步骤4:进一步筛选语句库中的语句,将语句进行分类;
步骤5:进一步筛选倾向对象库中的对象,根据对象对应语句的种类,划分对象的等级。
2.如权利要求1所述的一种心理模型,其特征在于,所述的步骤2中,数据收集平台中建立有关键词库,关键词库中的关键词可增加或删除。
3.如权利要求1所述的一种心理模型,其特征在于,步骤4中语句的分类是指:分离出含有直接线索的语句、含有间接线索的语句、含有自杀手段的语句和含有负面情感的语句,语句库中建立直接线索集、间接线索集、自杀手段集和负面情感集,将含有直接线索的语句存入到直接线索集;含有间接线索的语句存入到间接线索集;含有自杀手段的语句存入到自杀手段集;含有负面情感的语句存入负面情感集。
4.如权利要求3所述的一种心理模型,其特征在于,步骤5中对象等级划分方法为:分析对象对应语句所在集,如对象对应语句中含有直接线索集或间接线索集中的语句,并且含有自杀手段集中的语句,则标识该对象为极高风险对象;如对象对应语句中含有直接线索集中的语句,但无自杀手段集中的语句,则标识该对象为高风险对象;如对象对应语句中含有间接线索集中语句,但无直接线索集和自杀手段集中的语句,则标识该对象为中风险对象;如对象对应语句中只含有情感语句集中的语句,则标识对象为低风险对象。
5.如权利要求3所述的一种心理模型,其特征在于,所述的直接线索语句通过直接线索关键词进行筛选,间接线索语句通过间接线索关键词进行筛选,自杀手段语句通过自杀手段关键词进行筛选,负面情感语句通过负面情感关键词进行筛选,上述关键词都存入在数据收集平台中的关键词库中,该关键词库中含有直接线索关键词组、间接线索关键词组、自杀手段关键词组和负面情感关键词组。
6.如权利要求1所述的一种心理模型,其特征在于,步骤2中,数据接收平台收到聊天数据中筛选完后,剩余的对象都存放在无倾向对象库,无倾向对象库中的对象都标识为无风险对象。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811286196.XA CN109524106A (zh) | 2018-10-31 | 2018-10-31 | 一种通过聊天内容分析自杀倾向的心理模型 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811286196.XA CN109524106A (zh) | 2018-10-31 | 2018-10-31 | 一种通过聊天内容分析自杀倾向的心理模型 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109524106A true CN109524106A (zh) | 2019-03-26 |
Family
ID=65772804
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811286196.XA Pending CN109524106A (zh) | 2018-10-31 | 2018-10-31 | 一种通过聊天内容分析自杀倾向的心理模型 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109524106A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110489552A (zh) * | 2019-07-17 | 2019-11-22 | 清华大学 | 一种微博用户自杀风险检测方法及装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102521220A (zh) * | 2011-11-29 | 2012-06-27 | 华中师范大学 | 一种网络自杀遗书的识别方法 |
CN103150374A (zh) * | 2013-03-11 | 2013-06-12 | 中国科学院信息工程研究所 | 一种识别微博异常用户的方法和系统 |
CN103699626A (zh) * | 2013-12-20 | 2014-04-02 | 华南理工大学 | 一种微博用户个性化情感倾向分析方法及系统 |
CN103763124A (zh) * | 2013-12-26 | 2014-04-30 | 孙伟力 | 一种互联网用户行为分析预警系统及方法 |
CN103955614A (zh) * | 2014-04-29 | 2014-07-30 | 北京盛世光明软件股份有限公司 | 一种心理危机预测方法及系统 |
CN105378730A (zh) * | 2013-05-13 | 2016-03-02 | 卡塔尔基金会 | 社交媒体分析与输出 |
CN106294532A (zh) * | 2016-05-18 | 2017-01-04 | 广东电网有限责任公司信息中心 | 基于微博情感分析的形象评价算法 |
CN107145524A (zh) * | 2017-04-12 | 2017-09-08 | 清华大学 | 基于微博和模糊认知图的自杀风险检测方法及系统 |
-
2018
- 2018-10-31 CN CN201811286196.XA patent/CN109524106A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102521220A (zh) * | 2011-11-29 | 2012-06-27 | 华中师范大学 | 一种网络自杀遗书的识别方法 |
CN103150374A (zh) * | 2013-03-11 | 2013-06-12 | 中国科学院信息工程研究所 | 一种识别微博异常用户的方法和系统 |
CN105378730A (zh) * | 2013-05-13 | 2016-03-02 | 卡塔尔基金会 | 社交媒体分析与输出 |
CN103699626A (zh) * | 2013-12-20 | 2014-04-02 | 华南理工大学 | 一种微博用户个性化情感倾向分析方法及系统 |
CN103763124A (zh) * | 2013-12-26 | 2014-04-30 | 孙伟力 | 一种互联网用户行为分析预警系统及方法 |
CN103955614A (zh) * | 2014-04-29 | 2014-07-30 | 北京盛世光明软件股份有限公司 | 一种心理危机预测方法及系统 |
CN106294532A (zh) * | 2016-05-18 | 2017-01-04 | 广东电网有限责任公司信息中心 | 基于微博情感分析的形象评价算法 |
CN107145524A (zh) * | 2017-04-12 | 2017-09-08 | 清华大学 | 基于微博和模糊认知图的自杀风险检测方法及系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110489552A (zh) * | 2019-07-17 | 2019-11-22 | 清华大学 | 一种微博用户自杀风险检测方法及装置 |
CN110489552B (zh) * | 2019-07-17 | 2021-09-21 | 清华大学 | 一种微博用户自杀风险检测方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yin et al. | Detecting topic and sentiment dynamics due to COVID-19 pandemic using social media | |
Cetto et al. | Graphene: Semantically-linked propositions in open information extraction | |
CN101799849A (zh) | 采用计算机实现的非障碍性自动心理咨询方法 | |
CN107066514A (zh) | 老年人的情绪识别方法和系统 | |
CN106446018B (zh) | 基于人工智能的查询信息处理方法和装置 | |
CN110489513A (zh) | 一种智能机器人社交信息处理方法及与人的社交系统 | |
CN109829042A (zh) | 一种基于生物医学文献的知识问答系统及方法 | |
Grover et al. | Design for emotion detection of punjabi text using hybrid approach | |
Vercellotti et al. | A classification of compounds in American Sign Language: an evaluation of the Bisetto and Scalise framework | |
CN108363699A (zh) | 一种基于百度贴吧的网民学业情绪分析方法 | |
Mudalige et al. | SigmaLaw-ABSA: dataset for aspect-based sentiment analysis in legal opinion texts | |
CN109524106A (zh) | 一种通过聊天内容分析自杀倾向的心理模型 | |
Branz et al. | Sentiment analysis of twitter data: towards filtering, analyzing and interpreting social network data | |
Rajput et al. | Making a case for social media corpus for detecting depression | |
Vosoughi et al. | A semi-automatic method for efficient detection of stories on social media | |
Biswas et al. | Drug Usage Analysis by VADER Sentiment Analysis on Leading Countries. | |
Hegde et al. | Employee sentiment analysis towards remote work during COVID-19 using Twitter data | |
CN111639494A (zh) | 案件事理关系确定方法及系统 | |
Sykora et al. | Twitter based analysis of public, fine-grained emotional reactions to significant events | |
CN107133226A (zh) | 一种区分主题的方法及装置 | |
CN116189851A (zh) | 一种基于自然语言处理的运动员心理咨询服务系统及方法 | |
Li et al. | Product ontology construction for crowdfunding projects | |
Di Pietro et al. | Semantic crawling: an approach based on named entity recognition | |
CN113590768B (zh) | 一种文本关联度模型的训练方法及装置、问答方法及装置 | |
Devi et al. | Location Based Twitter Emotion Classification for Disaster Management |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190326 |
|
RJ01 | Rejection of invention patent application after publication |