CN113869356A - 一种基于贝叶斯分类的人员脱逃倾向性判断方法 - Google Patents

一种基于贝叶斯分类的人员脱逃倾向性判断方法 Download PDF

Info

Publication number
CN113869356A
CN113869356A CN202110944244.5A CN202110944244A CN113869356A CN 113869356 A CN113869356 A CN 113869356A CN 202110944244 A CN202110944244 A CN 202110944244A CN 113869356 A CN113869356 A CN 113869356A
Authority
CN
China
Prior art keywords
text
model
data
management
collecting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110944244.5A
Other languages
English (en)
Inventor
施政
金晓东
张子权
王强
戴志朋
张富睿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hua Ting Technology Co ltd
Original Assignee
Hangzhou Hua Ting Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hua Ting Technology Co ltd filed Critical Hangzhou Hua Ting Technology Co ltd
Priority to CN202110944244.5A priority Critical patent/CN113869356A/zh
Publication of CN113869356A publication Critical patent/CN113869356A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Tourism & Hospitality (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Probability & Statistics with Applications (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Signal Processing (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Alarm Systems (AREA)

Abstract

本发明公开了一种基于贝叶斯分类的人员脱逃倾向性判断方法,包括以下步骤:步骤1、通过数据采集上报系统采集上报目标人员日常数据;目标人员在日常作业时,收集其日常填写的心理测试、监控收集的谈话语音以及管理人员对其行为表现的评估文字材料;步骤2、将步骤一中的文字材料进行汇总整理,将语音转化成文字,同时利用文本切割手段对文本进行分割和语意提取。本发明能提前判断目标人员脱逃倾向性心理,能提前协助管理人员进行告警,从而采取不同的管理措施杜绝相应的事件发生,可以帮助监管地管理人员实施更好的精确化管理,大大提高管理效率和管理准确度。

Description

一种基于贝叶斯分类的人员脱逃倾向性判断方法
技术领域
本发明涉及计算机数据处理技术领域,具体涉及一种基于贝叶斯分类的人员脱逃倾向性判断方法。
背景技术
目前对于人员脱逃倾向性心理的判断主要包括个人谈话、监控管理,这些方法使用时候往往具有滞后性,无法提前预知目标人员的后续行为,考虑到有大部分目标人员是提前有预谋,有征兆的行为,同时单纯的监控分析以及人工谈话往往需要耗费大量的人力,效果也不一定好,因此需要设计一种人员脱逃倾向性判断方法来解决上述问题。
发明内容
本发明的目的在于提出一种基于贝叶斯分类的人员脱逃倾向性判断方法,预测目标人员在日常作业中的脱逃倾向性。本发明主要是通过以下技术方案来实现的:
一种基于贝叶斯分类的人员脱逃倾向性判断方法,包括以下步骤:
步骤1、通过数据采集上报系统采集上报目标人员日常数据;目标人员在日常作业时,收集其日常填写的心理测试、监控收集的谈话语音以及管理人员对其行为表现的评估文字材料;
步骤2、将步骤一中的文字材料进行汇总整理,将语音转化成文字,同时利用文本切割手段对文本进行分割和语意提取;并对分割后的文本语意进行脏数据过滤,剔除对分析无帮助的语气助词以及语音重复度比较高的文本;
步骤3、对文本数据进行特征转化,通过bag-of-words词袋模型计算文本向量,得到每一个文本的向量表示;
步骤4、对样本进行标注;基于上报的目标人员日常数据,标注其后续的脱逃倾向性情况作为样本分类标签,所述脱逃倾向性情况分为高、中、低;
步骤5、重复步骤1-步骤4,积累训练样本数据和标签,从而用于训练模型;
步骤6、基于步骤5样本构建贝叶斯模型,利用贝叶斯公式
Figure RE-GDA0003368323650000011
构建分类概率;
步骤7、基于步骤6训练得到模型结果,并对后续测试样本进行检测,验证模型效果;
步骤8、重复步骤6和步骤7构建完成贝叶斯模型;
步骤9、通过docker镜像对步骤8的模型服务进行部署上线,对于后续采集的目标人员日常数据经过清洗后进入贝叶斯模型,进行目标人员脱逃倾向性预测,并给出监控建议。
本发明的有益效果是:能提前判断目标人员脱逃倾向性心理,能提前协助管理人员进行告警,从而采取不同的管理措施杜绝相应的事件发生,可以帮助监管地管理人员实施更好的精确化管理,大大提高管理效率和管理准确度。
附图说明
图1是本发明的数据采集上报系统的示意图;
图2是本发明的模型服务系统的示意图;
图3是本发明的模型处理流程的示意图;
图4是本发明实施例中入模数据特征示例;
具体实施方式
下面详细描述本发明的实施例,下面的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
一种基于贝叶斯分类的人员脱逃倾向性判断方法,包括以下步骤:
步骤1、如图1所示,通过数据采集系统采集上报目标人员日常数据,目标人员在日常作业时,收集其日常填写的心理测试、监控可及的谈话语音以及管理人员对其行为表现的评估文字材料等。
步骤2、如图1所示,将这些文字材料收集后在信息采集系统上进行汇总整理,将语音转化成文字,同时利用文本切割手段对文本进行分割和语意提取,并对分割后的文本语意进行脏数据过滤,剔除对分析无帮助的语气助词以及语音重复度比较高的文本,最终将数据整理成合适的数据结构进行存储。文本分割方式如下,如原始文本“监管地待的太压抑了,十分想走”,经过切割后得到“监管地/待/的/太/压抑/了/十分/想/走”,过滤有效信息后为“监管地/待/太/压抑/十分/想/走”。
步骤3、对文本数据进行特征转化,通过bag-of-words词袋模型计算文本向量,得到每一个文本的向量表示,如文档1:“监管地待的太压抑了,十分想走”,文档2:“监管地劳动太压抑”,两个文档分词后汇总构建词典={1:“监管地”,2:“待”,3:“太”, 4:“压抑”,5:“十分”,6:“想”,7:“劳动”},这个词典一共包含7个词语,按照出现数量可转化成向量:文档1:[1,1,1,1,1,1,0],文档2:[1,0,1,1,0,0, 1]。
步骤4、对所有样本进行标注,基于上报的目标人员日常数据,标注其后续的脱逃倾向性情况,作为样本分类标签,所述脱逃倾向性情况分为高、中、低。
步骤5、重复步骤1-步骤4的数据,积累训练样本数据和标签,从而用于训练模型。
步骤6、基于步骤5样本构建贝叶斯模型,利用贝叶斯公式
Figure RE-GDA0003368323650000031
构建分类概率,如图4所示,每个样本词袋向量表达了样本的好坏,通过贝叶斯概率即可预测得到预测结果。
步骤7、基于步骤6训练得到模型结果,并对后续测试样本进行检测,验证模型效果。
步骤8、如图3所示,重复步骤6和步骤7构建完成贝叶斯模型,模型训练效果良好,如表1所示;
表1
Figure RE-GDA0003368323650000032
步骤9、如图2所示,通过docker镜像对步骤8的模型服务进行部署上线,对于后续采集的目标人员信息经过清洗后进入贝叶斯模型,并进行预测其脱逃倾向性,并给出监控建议,每天采集对应样本的数据,经过加工后调用模型接口,然后返回模型预测结果,给出脱逃倾向预测,如果达到一定值就发生报警。
以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。

Claims (1)

1.一种基于贝叶斯分类的人员脱逃倾向性判断方法,其特征在于,包括以下步骤:
步骤1、通过数据采集上报系统采集上报目标人员日常数据;目标人员在日常作业时,收集其日常填写的心理测试、监控收集的谈话语音以及管理人员对其行为表现的评估文字材料;
步骤2、将步骤一中的文字材料进行汇总整理,将语音转化成文字,同时利用文本切割手段对文本进行分割和语意提取;并对分割后的文本语意进行脏数据过滤,剔除对分析无帮助的语气助词以及语音重复度比较高的文本;
步骤3、对文本数据进行特征转化,通过bag-of-words词袋模型计算文本向量,得到每一个文本的向量表示;
步骤4、对样本进行标注;基于上报的目标人员日常数据,标注其后续的脱逃倾向性情况作为样本分类标签,所述脱逃倾向性情况分为高、中、低;
步骤5、重复步骤1-步骤4,积累训练样本数据和标签,从而用于训练模型;
步骤6、基于步骤5样本构建贝叶斯模型,利用贝叶斯公式
Figure RE-FDA0003350414960000011
构建分类概率;
步骤7、基于步骤6训练得到模型结果,并对后续测试样本进行检测,验证模型效果;
步骤8、重复步骤6和步骤7构建完成贝叶斯模型;
步骤9、通过docker镜像对步骤8的模型服务进行部署上线,对于后续采集的目标人员日常数据经过清洗后进入贝叶斯模型,进行目标人员脱逃倾向性预测,并给出监控建议。
CN202110944244.5A 2021-08-17 2021-08-17 一种基于贝叶斯分类的人员脱逃倾向性判断方法 Pending CN113869356A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110944244.5A CN113869356A (zh) 2021-08-17 2021-08-17 一种基于贝叶斯分类的人员脱逃倾向性判断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110944244.5A CN113869356A (zh) 2021-08-17 2021-08-17 一种基于贝叶斯分类的人员脱逃倾向性判断方法

Publications (1)

Publication Number Publication Date
CN113869356A true CN113869356A (zh) 2021-12-31

Family

ID=78990537

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110944244.5A Pending CN113869356A (zh) 2021-08-17 2021-08-17 一种基于贝叶斯分类的人员脱逃倾向性判断方法

Country Status (1)

Country Link
CN (1) CN113869356A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109165294A (zh) * 2018-08-21 2019-01-08 安徽讯飞智能科技有限公司 一种基于贝叶斯分类的短文本分类方法
CN109299357A (zh) * 2018-08-31 2019-02-01 昆明理工大学 一种老挝语文本主题分类方法
CN110826852A (zh) * 2019-09-27 2020-02-21 安徽四创电子股份有限公司 一种强制隔离戒毒人员风险评估方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109165294A (zh) * 2018-08-21 2019-01-08 安徽讯飞智能科技有限公司 一种基于贝叶斯分类的短文本分类方法
CN109299357A (zh) * 2018-08-31 2019-02-01 昆明理工大学 一种老挝语文本主题分类方法
CN110826852A (zh) * 2019-09-27 2020-02-21 安徽四创电子股份有限公司 一种强制隔离戒毒人员风险评估方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
梅晓晴;: "朴素贝叶斯分类法在考试管理中的应用", 数字技术与应用, no. 03 *

Similar Documents

Publication Publication Date Title
CN106886580B (zh) 一种基于深度学习的图片情感极性分析方法
CN109189767B (zh) 数据处理方法、装置、电子设备及存储介质
CN110969130A (zh) 一种基于yolov3司机危险动作识别方法及系统
CN110188047A (zh) 一种基于双通道卷积神经网络的重复缺陷报告检测方法
KR20210075511A (ko) 재난대응 추천방법 및 그 장치
CN112768070A (zh) 一种基于对话交流的精神健康评测方法和系统
Aliman et al. Sentiment analysis using logistic regression
CN116756688A (zh) 一种基于多模态融合算法的舆情风险发现方法
CN113658174A (zh) 基于深度学习和图像处理算法的微核组学图像检测方法
CN110689447A (zh) 一种基于深度学习的社交软件用户发布内容的实时检测方法
CN111160438A (zh) 一种采用一维卷积神经网络的声学垃圾分类方法
CN116844080A (zh) 疲劳程度多模态融合检测方法、电子设备及存储介质
CN113869356A (zh) 一种基于贝叶斯分类的人员脱逃倾向性判断方法
CN116864128A (zh) 基于身体活动行为模式监测的心理状态评估系统及其方法
CN116595987A (zh) 一种基于神经网络模型的扬言文本分类方法、装置及存储介质
WO2022262013A1 (zh) 一种车辆状态信息采集监控方法及系统
CN111341404B (zh) 一种基于ernie模型的电子病历数据组解析方法及系统
CN110674269A (zh) 一种线索信息管控方法及系统
CN110633754A (zh) 一种基于神经网络的智能病案文字识别的方法
Sun et al. Airbirds: A large-scale challenging dataset for bird strike prevention in real-world airports
CN113590804B (zh) 视频主题生成的方法、装置及电子设备
CN112559731B (zh) 市场情绪监测方法和系统
CN115618003A (zh) 一种文学人物关系识别方法和系统
CN117788136A (zh) 一种基于区块链和舆情的金融风控系统
CN117076613A (zh) 一种基于互联网大数据的电数字数据处理系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20211231

RJ01 Rejection of invention patent application after publication