CN113869356A - 一种基于贝叶斯分类的人员脱逃倾向性判断方法 - Google Patents
一种基于贝叶斯分类的人员脱逃倾向性判断方法 Download PDFInfo
- Publication number
- CN113869356A CN113869356A CN202110944244.5A CN202110944244A CN113869356A CN 113869356 A CN113869356 A CN 113869356A CN 202110944244 A CN202110944244 A CN 202110944244A CN 113869356 A CN113869356 A CN 113869356A
- Authority
- CN
- China
- Prior art keywords
- text
- model
- data
- management
- collecting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 12
- 239000000463 material Substances 0.000 claims abstract description 8
- 238000012544 monitoring process Methods 0.000 claims abstract description 8
- 238000012360 testing method Methods 0.000 claims abstract description 7
- 238000012549 training Methods 0.000 claims description 9
- 239000013598 vector Substances 0.000 claims description 8
- 230000000694 effects Effects 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 4
- 238000004140 cleaning Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 2
- 230000002354 daily effect Effects 0.000 description 9
- 230000006399 behavior Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000013480 data collection Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000000454 anti-cipatory effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Tourism & Hospitality (AREA)
- Life Sciences & Earth Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Probability & Statistics with Applications (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Signal Processing (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Alarm Systems (AREA)
Abstract
本发明公开了一种基于贝叶斯分类的人员脱逃倾向性判断方法,包括以下步骤:步骤1、通过数据采集上报系统采集上报目标人员日常数据;目标人员在日常作业时,收集其日常填写的心理测试、监控收集的谈话语音以及管理人员对其行为表现的评估文字材料;步骤2、将步骤一中的文字材料进行汇总整理,将语音转化成文字,同时利用文本切割手段对文本进行分割和语意提取。本发明能提前判断目标人员脱逃倾向性心理,能提前协助管理人员进行告警,从而采取不同的管理措施杜绝相应的事件发生,可以帮助监管地管理人员实施更好的精确化管理,大大提高管理效率和管理准确度。
Description
技术领域
本发明涉及计算机数据处理技术领域,具体涉及一种基于贝叶斯分类的人员脱逃倾向性判断方法。
背景技术
目前对于人员脱逃倾向性心理的判断主要包括个人谈话、监控管理,这些方法使用时候往往具有滞后性,无法提前预知目标人员的后续行为,考虑到有大部分目标人员是提前有预谋,有征兆的行为,同时单纯的监控分析以及人工谈话往往需要耗费大量的人力,效果也不一定好,因此需要设计一种人员脱逃倾向性判断方法来解决上述问题。
发明内容
本发明的目的在于提出一种基于贝叶斯分类的人员脱逃倾向性判断方法,预测目标人员在日常作业中的脱逃倾向性。本发明主要是通过以下技术方案来实现的:
一种基于贝叶斯分类的人员脱逃倾向性判断方法,包括以下步骤:
步骤1、通过数据采集上报系统采集上报目标人员日常数据;目标人员在日常作业时,收集其日常填写的心理测试、监控收集的谈话语音以及管理人员对其行为表现的评估文字材料;
步骤2、将步骤一中的文字材料进行汇总整理,将语音转化成文字,同时利用文本切割手段对文本进行分割和语意提取;并对分割后的文本语意进行脏数据过滤,剔除对分析无帮助的语气助词以及语音重复度比较高的文本;
步骤3、对文本数据进行特征转化,通过bag-of-words词袋模型计算文本向量,得到每一个文本的向量表示;
步骤4、对样本进行标注;基于上报的目标人员日常数据,标注其后续的脱逃倾向性情况作为样本分类标签,所述脱逃倾向性情况分为高、中、低;
步骤5、重复步骤1-步骤4,积累训练样本数据和标签,从而用于训练模型;
步骤7、基于步骤6训练得到模型结果,并对后续测试样本进行检测,验证模型效果;
步骤8、重复步骤6和步骤7构建完成贝叶斯模型;
步骤9、通过docker镜像对步骤8的模型服务进行部署上线,对于后续采集的目标人员日常数据经过清洗后进入贝叶斯模型,进行目标人员脱逃倾向性预测,并给出监控建议。
本发明的有益效果是:能提前判断目标人员脱逃倾向性心理,能提前协助管理人员进行告警,从而采取不同的管理措施杜绝相应的事件发生,可以帮助监管地管理人员实施更好的精确化管理,大大提高管理效率和管理准确度。
附图说明
图1是本发明的数据采集上报系统的示意图;
图2是本发明的模型服务系统的示意图;
图3是本发明的模型处理流程的示意图;
图4是本发明实施例中入模数据特征示例;
具体实施方式
下面详细描述本发明的实施例,下面的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
一种基于贝叶斯分类的人员脱逃倾向性判断方法,包括以下步骤:
步骤1、如图1所示,通过数据采集系统采集上报目标人员日常数据,目标人员在日常作业时,收集其日常填写的心理测试、监控可及的谈话语音以及管理人员对其行为表现的评估文字材料等。
步骤2、如图1所示,将这些文字材料收集后在信息采集系统上进行汇总整理,将语音转化成文字,同时利用文本切割手段对文本进行分割和语意提取,并对分割后的文本语意进行脏数据过滤,剔除对分析无帮助的语气助词以及语音重复度比较高的文本,最终将数据整理成合适的数据结构进行存储。文本分割方式如下,如原始文本“监管地待的太压抑了,十分想走”,经过切割后得到“监管地/待/的/太/压抑/了/十分/想/走”,过滤有效信息后为“监管地/待/太/压抑/十分/想/走”。
步骤3、对文本数据进行特征转化,通过bag-of-words词袋模型计算文本向量,得到每一个文本的向量表示,如文档1:“监管地待的太压抑了,十分想走”,文档2:“监管地劳动太压抑”,两个文档分词后汇总构建词典={1:“监管地”,2:“待”,3:“太”, 4:“压抑”,5:“十分”,6:“想”,7:“劳动”},这个词典一共包含7个词语,按照出现数量可转化成向量:文档1:[1,1,1,1,1,1,0],文档2:[1,0,1,1,0,0, 1]。
步骤4、对所有样本进行标注,基于上报的目标人员日常数据,标注其后续的脱逃倾向性情况,作为样本分类标签,所述脱逃倾向性情况分为高、中、低。
步骤5、重复步骤1-步骤4的数据,积累训练样本数据和标签,从而用于训练模型。
步骤7、基于步骤6训练得到模型结果,并对后续测试样本进行检测,验证模型效果。
步骤8、如图3所示,重复步骤6和步骤7构建完成贝叶斯模型,模型训练效果良好,如表1所示;
表1
步骤9、如图2所示,通过docker镜像对步骤8的模型服务进行部署上线,对于后续采集的目标人员信息经过清洗后进入贝叶斯模型,并进行预测其脱逃倾向性,并给出监控建议,每天采集对应样本的数据,经过加工后调用模型接口,然后返回模型预测结果,给出脱逃倾向预测,如果达到一定值就发生报警。
以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。
Claims (1)
1.一种基于贝叶斯分类的人员脱逃倾向性判断方法,其特征在于,包括以下步骤:
步骤1、通过数据采集上报系统采集上报目标人员日常数据;目标人员在日常作业时,收集其日常填写的心理测试、监控收集的谈话语音以及管理人员对其行为表现的评估文字材料;
步骤2、将步骤一中的文字材料进行汇总整理,将语音转化成文字,同时利用文本切割手段对文本进行分割和语意提取;并对分割后的文本语意进行脏数据过滤,剔除对分析无帮助的语气助词以及语音重复度比较高的文本;
步骤3、对文本数据进行特征转化,通过bag-of-words词袋模型计算文本向量,得到每一个文本的向量表示;
步骤4、对样本进行标注;基于上报的目标人员日常数据,标注其后续的脱逃倾向性情况作为样本分类标签,所述脱逃倾向性情况分为高、中、低;
步骤5、重复步骤1-步骤4,积累训练样本数据和标签,从而用于训练模型;
步骤7、基于步骤6训练得到模型结果,并对后续测试样本进行检测,验证模型效果;
步骤8、重复步骤6和步骤7构建完成贝叶斯模型;
步骤9、通过docker镜像对步骤8的模型服务进行部署上线,对于后续采集的目标人员日常数据经过清洗后进入贝叶斯模型,进行目标人员脱逃倾向性预测,并给出监控建议。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110944244.5A CN113869356A (zh) | 2021-08-17 | 2021-08-17 | 一种基于贝叶斯分类的人员脱逃倾向性判断方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110944244.5A CN113869356A (zh) | 2021-08-17 | 2021-08-17 | 一种基于贝叶斯分类的人员脱逃倾向性判断方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113869356A true CN113869356A (zh) | 2021-12-31 |
Family
ID=78990537
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110944244.5A Pending CN113869356A (zh) | 2021-08-17 | 2021-08-17 | 一种基于贝叶斯分类的人员脱逃倾向性判断方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113869356A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109165294A (zh) * | 2018-08-21 | 2019-01-08 | 安徽讯飞智能科技有限公司 | 一种基于贝叶斯分类的短文本分类方法 |
CN109299357A (zh) * | 2018-08-31 | 2019-02-01 | 昆明理工大学 | 一种老挝语文本主题分类方法 |
CN110826852A (zh) * | 2019-09-27 | 2020-02-21 | 安徽四创电子股份有限公司 | 一种强制隔离戒毒人员风险评估方法及系统 |
-
2021
- 2021-08-17 CN CN202110944244.5A patent/CN113869356A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109165294A (zh) * | 2018-08-21 | 2019-01-08 | 安徽讯飞智能科技有限公司 | 一种基于贝叶斯分类的短文本分类方法 |
CN109299357A (zh) * | 2018-08-31 | 2019-02-01 | 昆明理工大学 | 一种老挝语文本主题分类方法 |
CN110826852A (zh) * | 2019-09-27 | 2020-02-21 | 安徽四创电子股份有限公司 | 一种强制隔离戒毒人员风险评估方法及系统 |
Non-Patent Citations (1)
Title |
---|
梅晓晴;: "朴素贝叶斯分类法在考试管理中的应用", 数字技术与应用, no. 03 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106886580B (zh) | 一种基于深度学习的图片情感极性分析方法 | |
CN109189767B (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN110969130A (zh) | 一种基于yolov3司机危险动作识别方法及系统 | |
CN110188047A (zh) | 一种基于双通道卷积神经网络的重复缺陷报告检测方法 | |
KR20210075511A (ko) | 재난대응 추천방법 및 그 장치 | |
CN112768070A (zh) | 一种基于对话交流的精神健康评测方法和系统 | |
Aliman et al. | Sentiment analysis using logistic regression | |
CN116756688A (zh) | 一种基于多模态融合算法的舆情风险发现方法 | |
CN113658174A (zh) | 基于深度学习和图像处理算法的微核组学图像检测方法 | |
CN110689447A (zh) | 一种基于深度学习的社交软件用户发布内容的实时检测方法 | |
CN111160438A (zh) | 一种采用一维卷积神经网络的声学垃圾分类方法 | |
CN116844080A (zh) | 疲劳程度多模态融合检测方法、电子设备及存储介质 | |
CN113869356A (zh) | 一种基于贝叶斯分类的人员脱逃倾向性判断方法 | |
CN116864128A (zh) | 基于身体活动行为模式监测的心理状态评估系统及其方法 | |
CN116595987A (zh) | 一种基于神经网络模型的扬言文本分类方法、装置及存储介质 | |
WO2022262013A1 (zh) | 一种车辆状态信息采集监控方法及系统 | |
CN111341404B (zh) | 一种基于ernie模型的电子病历数据组解析方法及系统 | |
CN110674269A (zh) | 一种线索信息管控方法及系统 | |
CN110633754A (zh) | 一种基于神经网络的智能病案文字识别的方法 | |
Sun et al. | Airbirds: A large-scale challenging dataset for bird strike prevention in real-world airports | |
CN113590804B (zh) | 视频主题生成的方法、装置及电子设备 | |
CN112559731B (zh) | 市场情绪监测方法和系统 | |
CN115618003A (zh) | 一种文学人物关系识别方法和系统 | |
CN117788136A (zh) | 一种基于区块链和舆情的金融风控系统 | |
CN117076613A (zh) | 一种基于互联网大数据的电数字数据处理系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20211231 |
|
RJ01 | Rejection of invention patent application after publication |