CN109191354A - 一种基于自然语言处理的全民社管任务分发方法 - Google Patents

一种基于自然语言处理的全民社管任务分发方法 Download PDF

Info

Publication number
CN109191354A
CN109191354A CN201810951662.5A CN201810951662A CN109191354A CN 109191354 A CN109191354 A CN 109191354A CN 201810951662 A CN201810951662 A CN 201810951662A CN 109191354 A CN109191354 A CN 109191354A
Authority
CN
China
Prior art keywords
ajms
data
model
word
files
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810951662.5A
Other languages
English (en)
Inventor
水新莹
张宇光
黄亚坤
苏洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Xunfei Intelligent Technology Co Ltd
Original Assignee
Anhui Xunfei Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Xunfei Intelligent Technology Co Ltd filed Critical Anhui Xunfei Intelligent Technology Co Ltd
Priority to CN201810951662.5A priority Critical patent/CN109191354A/zh
Publication of CN109191354A publication Critical patent/CN109191354A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于自然语言处理的全民社管任务分发方法,涉及智慧城市与电子政务领域,该方法包括以下主要步骤:(1)数据预处理;(2)分词操作;(3)采用贝叶斯算法对步骤1和步骤2进行模型训练,并得出贝叶斯分类器模型;(4)将上报信息进行分类,并分发到相关的部门进行处理,相关部门对分类的准确性做标记,并将标记和处理过程反馈到日志数据库中;(5)贝叶斯分类器的修正,全民社管的有效运用,对于增强市民自主管理意识,提升市民对政府服务的满意度,促进社会和谐稳定正在产生重大的意义。

Description

一种基于自然语言处理的全民社管任务分发方法
技术领域
本发明涉及智慧城市与电子政务领域,具体涉及一种基于自然语言处理的全民社管任务分发方法。
背景技术:
数字城管化管理是建设智慧城市的重要组成部分,数字化的城市管理通过自动化采集用户的上报信息,并对能够根据用户上报的异构化数据信息,分析上报任务所属的负责部分,及时通过自动分发系统向相关部门进行任务传达,从而,使用户反馈或上报的信息能够得到及时、高效的处理,能够有效提升电子政务的服务质量与用户体验。现有的任务分发系统主要是根据用户上报过程中的选择所属的部门进行分类,通常,用户对上报的内容所属领域并不熟悉,用户的选择比较模糊,不利于任务的精准分发。
因此,通过采集数字城管的历史上报数据,基于自然语言处理和贝叶斯段文本分类算法,一方面,深度挖掘用户上报信息的含义,并通过相关历史标签数据训练结果有效对上报任务进行分类;另一方面,上报任务的自动分发有效代理了人工任务分类,不仅提高了效率,节约了成本,而且提升了用户体验。“全民社管”运行以来,一些群众高度关注的问题及时得到了有效解决。互联网爆料的便捷正在提升市民参与城市治理的热情,数据业务化的协同机制不断倒逼部门转变工作方式提升工作水平,市民的反馈评价也持续优化城市运行问题的精准发现和有效处理。全民社管的有效运用,对于增强市民自主管理意识,提升市民对政府服务的满意度,促进社会和谐稳定正在产生重大的意义
如申请号为CN201310688203.X公开了一种任务分发方法及扫描器,该方法包括:节点类型为管理节点的扫描器需要分发任务时,针对所管理的各扫描器,分别执行下述操作:确定该扫描器执行待分发任务时的资源消耗指标以及该扫描器的当前剩余负载,所述资源消耗指标表征了扫描器执行任务时的资源消耗情况;根据所述资源消耗指标和当前剩余负载,确定该扫描器执行所述待分发任务时的负载均衡因子;根据确定出的负载均衡因子,在所管理的各扫描器中选择出满足预设的分发条件的扫描器,并将所述待分发任务分发给选择出的扫描器。但是该种任务分发方法及扫描器并未公开如何根据用户上报信息的含义,并通过相关历史标签数据训练结果有效对上报任务进行分类的技术方案。
如申请号为CN201310302794.2公开了一种任务分发方法、分发节点及系统,包括:第一分发节点接收客户端发送的任务请求;第一分发节点根据第一DHT环的信息,将任务请求发送给位于第一DHT环上且与任务请求匹配的业务节点,以便于与任务请求匹配的业务节点对任务请求进行处理,且第一分发节点通过与任务请求匹配的业务节点对应的布隆过滤器记录客户端与业务节点的会话信息。还提供了一种分发节点及系统。但是该种任务分发方法、分发节点及系统并未公开如何根据用户上报信息的含义,并通过相关历史标签数据训练结果有效对上报任务进行分类的技术方案。
发明内容
本发明的目的在于提供一种基于自然语言处理的全民社管任务分发方法,以解决现有技术中导致的上述多项缺陷。
一种基于自然语言处理的全民社管任务分发方法,其特征在于,该方法包括以下主要步骤:
(1)数据预处理:用于抽取数字城管历史数据,对数据进行数据清洗、数据规则化处理,提高数据质量,同时也利于后续数据处理工作;
(2)分词操作:用于对数字城管历史数据的案卷描述内容进行分词操作,同时对错别字、近义词做相对应的识别;
(3)采用贝叶斯算法对步骤1和步骤2进行模型训练,并得出贝叶斯分类器模型;
(4)将上报信息进行分类,并分发到相关的部门进行处理,相关部门对分类的准确性做标记,并将标记和处理过程反馈到日志数据库中;
(5)贝叶斯分类器的修正:系统定期抽取数字城管历史记录和日志数据库中的反馈信息,贝叶斯分类器根据信息和记录进行离线学习和训练,并对其进行十折交叉学习,将新训练的贝叶斯模型与现在正在使用的模型进行准确性对比,若新的模型准确性高于现有模型,则进行模型更新。
优选的,所述数字城管历史数据包括案卷编码、案卷类型、案卷大类编码、案卷小类、案卷描述和位置描述,并采用公式描述来定义为H={ajbm,ajlx,ajdl,ajxl,ajms,ajwzms}。
优选的,所述数字城管历史数据对其进行异常数据处理,包括案卷编码重复、案卷大类或小类编码超过定义范围,令处理之后为H′。
优选的,将H′中的ajdl,ajxl,ajms抽离出来,对ajms做分词处理,使ajms→ajms″={w1,w2,…,wi},其中ajms′表示经过分词处理之后的案卷描述信息,wi是分词之后的第i个词;在分词过程中需要注意停用词与错别字的问题,有以下步骤:
步骤一、根据停用词库去除ajms里的敏感词、脏话、语气叹词以及停用词后得到ajms′;
步骤二、根据错别字库将ajms′中存在错别字纠正为正确的词语,得到ajms″;
将ajdl,ajxl进行融合,得到新的案卷类别编码ajlxbm,将ajlxbm与ajms″组和成新的二元组S=<ajms″,ajlxbm>。
优选的,采用TF-IDF算法对S进行关键词提取,对每个ajms″中的wi,分别统计其TFi、IDFi,然后按以下公式计算其TF-IDF值,
计算ajms″中的平均TF-IDF值
其中,|ajms″|是ajms″中的词语个数,
将ajms″中TF-IDF值大于等于的词语作为关键词,得到新的ajms″′,对二元组进行S更新,得到新的二元组S′=<ajms″′,ajlxbm>。
优选的,所述贝叶斯分类器可由以下方式得到:首先贝叶斯公式为:
p(x|y)=p(x,y)/p(y) (1)
p(y|x)=p(x,y)/p(x) (2)
p(x,y)=p(y|x)p(x) (3)
p(x|y)=p(y|x)p(x)/p(y) (4)
其次将S′对其中的数据,按照<ajms″′,ajlxbm>,分别计算整个ajlxbm中出现的所有词语分别对应每个类别的概率,其计算公式如公式(5)所示:
其中分子加1与分母加n是做拉普拉斯平滑操作,防止分子中出现为1的情况,在计算完所有的p(wk|classi)之后,便得到了贝叶斯分类器。
优选的,所述贝叶斯分类器的修正的方式为:将数字城管历史记录与步骤4的日志数据库数据处理按步骤1、步骤2和步骤3处理之后,对其进行随机十等分,每次取其中九份进行第四步贝叶斯模型训练,并使用第十份数据进行模型准确性验证,重复十次,记录新的贝叶斯分类器的准确性,将新训练的贝叶斯模型与现在正在使用的模型进行准确性对比,若新的模型准确性高于现有模型,则进行模型更新。
本发明的优点在于:该种基于自然语言处理的全民社管任务分发方法,通过采集数字城管的历史上报数据,基于自然语言处理和贝叶斯段文本分类算法,一方面,深度挖掘用户上报信息的含义,并通过相关历史标签数据训练结果有效对上报任务进行分类;另一方面,上报任务的自动分发有效代理了人工任务分类,不仅提高了效率,节约了成本,而且提升了用户体验,对于增强市民自主管理意识,提升市民对政府服务的满意度,促进社会和谐稳定正在产生重大的意义。
附图说明
图1为本发明的分发流程图。
图2为本发明的中贝叶斯分类器训练流程图。
具体实施方式
为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体实施方式,进一步阐述本发明。
如图1和图2所示,一种基于自然语言处理的全民社管任务分发方法,其特征在于,该方法包括以下主要步骤:
(1)数据预处理:用于抽取数字城管历史数据,对数据进行数据清洗、数据规则化处理,提高数据质量,同时也利于后续数据处理工作;
(2)分词操作:用于对数字城管历史数据的案卷描述内容进行分词操作,同时对错别字、近义词做相对应的识别;
(3)采用贝叶斯算法对步骤1和步骤2进行模型训练,并得出贝叶斯分类器模型;
(4)将上报信息进行分类,并分发到相关的部门进行处理,相关部门对分类的准确性做标记,并将标记和处理过程反馈到日志数据库中;
(5)贝叶斯分类器的修正:系统定期抽取数字城管历史记录和日志数据库中的反馈信息,贝叶斯分类器根据信息和记录进行离线学习和训练,并对其进行十折交叉学习,将新训练的贝叶斯模型与现在正在使用的模型进行准确性对比,若新的模型准确性高于现有模型,则进行模型更新。
值得注意的是,所述数字城管历史数据包括案卷编码、案卷类型、案卷大类编码、案卷小类、案卷描述和位置描述,并采用公式描述来定义为H={ajbm,ajlx,ajdl,ajxl,ajms,ajwzms}。
在本实施例中,所述数字城管历史数据对其进行异常数据处理,包括案卷编码重复、案卷大类或小类编码超过定义范围,令处理之后为H′,由于数字城管系统的特性,不存在空字段问题。需要对H做异常数据处理,包括案卷编码重复、案卷大类或小类编码超过定义范围。
在本实施例中,将H′中的ajdl,ajxl,ajms抽离出来,对ajms做分词处理,使ajms→ajms″={w1,w2,…,wi},其中ajms′表示经过分词处理之后的案卷描述信息,wi是分词之后的第i个词;在分词过程中需要注意停用词与错别字的问题,有以下步骤:
步骤一、根据停用词库去除ajms里的敏感词、脏话、语气叹词以及停用词后得到ajms′;
步骤二、根据错别字库将ajms′中存在错别字纠正为正确的词语,得到ajms″;
将ajdl,ajxl进行融合,得到新的案卷类别编码ajlxbm,将ajlxbm与ajms″组和成新的二元组S=<ajms″,ajlxbm>。
在本实施例中,采用TF-IDF算法对S进行关键词提取,对每个ajms″中的wi,分别统计其TFi、IDFi,然后按以下公式计算其TF-IDF值,
计算ajms″中的平均TF-IDF值
其中,|ajms″|是ajms″中的词语个数,
将ajms″中TF-IDF值大于等于的词语作为关键词,得到新的ajms″′,对二元组进行S更新,得到新的二元组S′=<ajms″′,ajlxbm>,TF-IDF的主要思想就是:如果某个词在一篇文档中出现的频率高,即它的词频(TF)高;并且在语料库中其他文档中很少出现,即逆文档频频(IDF)高,则认为这个词具有很好的类别区分能力。
在本实施例中,所述贝叶斯分类器可由以下方式得到:首先贝叶斯公式为:
p(x|y)=p(x,y)/p(y) (1)
p(y|x)=p(x,y)/p(x) (2)
p(x,y)=p(y|x)p(x) (3)
p(x|y)=p(y|x)p(x)/p(y) (4)
其次将S′对其中的数据,按照<ajms″′,ajlxbm>,分别计算整个ajlxbm中出现的所有词语分别对应每个类别的概率,其计算公式如公式(5)所示:
其中分子加1与分母加n是做拉普拉斯平滑操作,防止分子中出现为1的情况,在计算完所有的p(wk|classi)之后,便得到了贝叶斯分类器。
得到贝叶斯分类器之后便可进行全民社管任务分发工作。设新上报得到信息为shxx,首先对shxx做分词操作,包括近义词、敏感词处理,然后对其进行关键词提取,得到上报信息关键词列表shxx′={w1,w2,…,wk},对于shxx′中的每一个词分别计算器所属类别,最后将类别概率中最大的类别作为贝叶斯分类的分类结果,并向相关部门进行分发,同时由相关部门对本次分发准确性做标记,并将本次处理过程存入日志数据库中。
此外,所述贝叶斯分类器的修正的方式为:将数字城管历史记录与步骤4的日志数据库数据处理按步骤1、步骤2和步骤3处理之后,对其进行随机十等分,每次取其中九份进行第四步贝叶斯模型训练,并使用第十份数据进行模型准确性验证,重复十次,记录新的贝叶斯分类器的准确性,将新训练的贝叶斯模型与现在正在使用的模型进行准确性对比,若新的模型准确性高于现有模型,则进行模型更新。
基于上述,该种基于自然语言处理的全民社管任务分发方法,该方法包括以下主要步骤:(1)数据预处理;(2)分词操作;(3)采用贝叶斯算法对步骤1和步骤2进行模型训练,并得出贝叶斯分类器模型;(4)将上报信息进行分类,并分发到相关的部门进行处理,相关部门对分类的准确性做标记,并将标记和处理过程反馈到日志数据库中;(5)贝叶斯分类器的修正,通过采集数字城管的历史上报数据,基于自然语言处理和贝叶斯段文本分类算法,一方面,深度挖掘用户上报信息的含义,并通过相关历史标签数据训练结果有效对上报任务进行分类;另一方面,上报任务的自动分发有效代理了人工任务分类,不仅提高了效率,节约了成本,而且提升了用户体验,对于增强市民自主管理意识,提升市民对政府服务的满意度,促进社会和谐稳定正在产生重大的意义。
由技术常识可知,本发明可以通过其它的不脱离其精神实质或必要特征的实施方案来实现。因此,上述公开的实施方案,就各方面而言,都只是举例说明,并不是仅有的。所有在本发明范围内或在等同于本发明的范围内的改变均被本发明包含。

Claims (7)

1.一种基于自然语言处理的全民社管任务分发方法,其特征在于,该方法包括以下主要步骤:
(1)数据预处理:用于抽取数字城管历史数据,对数据进行数据清洗、数据规则化处理,提高数据质量,同时也利于后续数据处理工作;
(2)分词操作:用于对数字城管历史数据的案卷描述内容进行分词操作,同时对错别字、近义词做相对应的识别;
(3)采用贝叶斯算法对步骤1和步骤2进行模型训练,并得出贝叶斯分类器模型;
(4)将上报信息进行分类,并分发到相关的部门进行处理,相关部门对分类的准确性做标记,并将标记和处理过程反馈到日志数据库中;
(5)贝叶斯分类器的修正:系统定期抽取数字城管历史记录和日志数据库中的反馈信息,贝叶斯分类器根据信息和记录进行离线学习和训练,并对其进行十折交叉学习,将新训练的贝叶斯模型与现在正在使用的模型进行准确性对比,若新的模型准确性高于现有模型,则进行模型更新。
2.根据权利要求1所述的一种基于自然语言处理的全民社管任务分发方法,其特征在于:所述数字城管历史数据包括案卷编码、案卷类型、案卷大类编码、案卷小类、案卷描述和位置描述,并采用公式描述来定义为H={ajbm,ajlx,ajdl,ajxl,ajms,ajwzms}。
3.根据权利要求1所述的一种基于自然语言处理的全民社管任务分发方法,其特征在于:所述数字城管历史数据对其进行异常数据处理,包括案卷编码重复、案卷大类或小类编码超过定义范围,令处理之后为H′。
4.根据权利要求3所述的一种基于自然语言处理的全民社管任务分发方法,其特征在于:将H′中的ajdl,ajxl,ajms抽离出来,对ajms做分词处理,使ajms→ajms″={w1,w2,…,wi},其中ajms′表示经过分词处理之后的案卷描述信息,wi是分词之后的第i个词;在分词过程中需要注意停用词与错别字的问题,有以下步骤:
步骤一、根据停用词库去除ajms里的敏感词、脏话、语气叹词以及停用词后得到ajms′;
步骤二、根据错别字库将ajms′中存在错别字纠正为正确的词语,得到ajms″;
将ajdl,ajxl进行融合,得到新的案卷类别编码ajlxbm,将ajlxbm与ajms″组和成新的二元组S=<ajms″,ajlxbm>。
5.根据权利要求4所述的一种基于自然语言处理的全民社管任务分发方法,其特征在于:采用TF-IDF算法对S进行关键词提取,对每个ajms″中的wi,分别统计其TFi、IDFi,然后按以下公式计算其TF-IDF值,
计算ajms″中的平均TF-IDF值
其中,|ajms″是ajms″中的词语个数,
将ajms″中TF-IDF值大于等于的词语作为关键词,得到新的ajms″′,对二元组进行S更新,得到新的二元组S′=<ajms″′,ajlxbm>。
6.根据权利要求5所述的一种基于自然语言处理的全民社管任务分发方法,其特征在于:所述贝叶斯分类器可由以下方式得到:首先贝叶斯公式为:
p(x|y)=p(x,y)/p(y) (1)
p(y|x)=p(x,y)/p(x) (2)
p(x,y)=p(y|x)p(x) (3)
p(x|y)=p(y|x)p(x)/p(y) (4)
其次将S′对其中的数据,按照<ajms″′,ajlxbm>,分别计算整个ajlxbm中出现的所有词语分别对应每个类别的概率,其计算公式如公式(5)所示:
其中分子加1与分母加n是做拉普拉斯平滑操作,防止分子中出现为1的情况,在计算完所有的p(wk|classi)之后,便得到了贝叶斯分类器。
7.根据权利要求1所述的一种基于自然语言处理的全民社管任务分发方法,其特征在于:所述贝叶斯分类器的修正的方式为:将数字城管历史记录与步骤4的日志数据库数据处理按步骤1、步骤2和步骤3处理之后,对其进行随机十等分,每次取其中九份进行第四步贝叶斯模型训练,并使用第十份数据进行模型准确性验证,重复十次,记录新的贝叶斯分类器的准确性,将新训练的贝叶斯模型与现在正在使用的模型进行准确性对比,若新的模型准确性高于现有模型,则进行模型更新。
CN201810951662.5A 2018-08-21 2018-08-21 一种基于自然语言处理的全民社管任务分发方法 Pending CN109191354A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810951662.5A CN109191354A (zh) 2018-08-21 2018-08-21 一种基于自然语言处理的全民社管任务分发方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810951662.5A CN109191354A (zh) 2018-08-21 2018-08-21 一种基于自然语言处理的全民社管任务分发方法

Publications (1)

Publication Number Publication Date
CN109191354A true CN109191354A (zh) 2019-01-11

Family

ID=64918659

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810951662.5A Pending CN109191354A (zh) 2018-08-21 2018-08-21 一种基于自然语言处理的全民社管任务分发方法

Country Status (1)

Country Link
CN (1) CN109191354A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109785595A (zh) * 2019-02-26 2019-05-21 成都古河云科技有限公司 一种基于机器学习的车辆异常轨迹实时识别方法
CN112241847A (zh) * 2020-10-26 2021-01-19 浪潮云信息技术股份公司 一种基于网格化管理的问题自动分发方法及平台

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105912576A (zh) * 2016-03-31 2016-08-31 北京外国语大学 情感分类方法及系统
CN107086952A (zh) * 2017-04-19 2017-08-22 中国石油大学(华东) 一种基于tf‑idf中文分词的贝叶斯垃圾邮件过滤方法
CN107423438A (zh) * 2017-08-04 2017-12-01 逸途(北京)科技有限公司 一种基于pgm的问题分类方法
CN107608999A (zh) * 2017-07-17 2018-01-19 南京邮电大学 一种适用于自动问答系统的问句分类方法
CN107992902A (zh) * 2017-12-22 2018-05-04 北京工业大学 一种基于监督学习的地面公交扒窃个体自动检测方法
CN108062331A (zh) * 2016-11-08 2018-05-22 南京理工大学 基于终生学习的增量式朴素贝叶斯文本分类方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105912576A (zh) * 2016-03-31 2016-08-31 北京外国语大学 情感分类方法及系统
CN108062331A (zh) * 2016-11-08 2018-05-22 南京理工大学 基于终生学习的增量式朴素贝叶斯文本分类方法
CN107086952A (zh) * 2017-04-19 2017-08-22 中国石油大学(华东) 一种基于tf‑idf中文分词的贝叶斯垃圾邮件过滤方法
CN107608999A (zh) * 2017-07-17 2018-01-19 南京邮电大学 一种适用于自动问答系统的问句分类方法
CN107423438A (zh) * 2017-08-04 2017-12-01 逸途(北京)科技有限公司 一种基于pgm的问题分类方法
CN107992902A (zh) * 2017-12-22 2018-05-04 北京工业大学 一种基于监督学习的地面公交扒窃个体自动检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张志诚: "基于LBS的网格化社区管理系统的设计与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109785595A (zh) * 2019-02-26 2019-05-21 成都古河云科技有限公司 一种基于机器学习的车辆异常轨迹实时识别方法
CN112241847A (zh) * 2020-10-26 2021-01-19 浪潮云信息技术股份公司 一种基于网格化管理的问题自动分发方法及平台

Similar Documents

Publication Publication Date Title
CN104281882B (zh) 基于用户特征的预测社交网络信息流行度的方法及系统
CN107958317A (zh) 一种众包项目中选取众包参与人的方法和装置
CN111768244A (zh) 一种广告投放的推荐方法及装置
CN108664515B (zh) 一种搜索方法及装置,电子设备
CN102708130A (zh) 计算用户微细分以用于要约匹配的可扩展引擎
CN104111925B (zh) 项目推荐方法和装置
GB2558718A (en) Search engine
CN107577724A (zh) 一种大数据处理方法
CN103116582A (zh) 一种信息检索方法及相关系统和装置
US20190244094A1 (en) Machine learning driven data management
CN110597796B (zh) 基于全生命周期的大数据实时建模方法及系统
CN108027814A (zh) 停用词识别方法与装置
CN109214454A (zh) 一种面向微博的情感社区分类方法
CN111813946A (zh) 医疗信息反馈方法、装置、设备及可读存储介质
CN109191354A (zh) 一种基于自然语言处理的全民社管任务分发方法
CN111078859B (zh) 一种基于引用次数的作者推荐方法
Tu et al. Crowdwt: Crowdsourcing via joint modeling of workers and tasks
CN112200674B (zh) 一种证券市场情绪指数智能计算信息系统
CN117764227A (zh) 一种用于加油站的客户流失预测装置
US11698811B1 (en) Machine learning-based systems and methods for predicting a digital activity and automatically executing digital activity-accelerating actions
CN112818223A (zh) 用户画像的查询处理方法、装置、设备、程序产品及介质
US20200050999A1 (en) Systems and methods for efficiently distributing alert messages
CN109460506B (zh) 一种用户需求驱动的资源匹配推送方法
CN115544250A (zh) 一种数据处理方法及系统
CN111125486B (zh) 一种基于多特征的微博用户属性分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190111