CN108573031A - 一种基于内容的投诉分类方法和系统 - Google Patents

一种基于内容的投诉分类方法和系统 Download PDF

Info

Publication number
CN108573031A
CN108573031A CN201810252500.2A CN201810252500A CN108573031A CN 108573031 A CN108573031 A CN 108573031A CN 201810252500 A CN201810252500 A CN 201810252500A CN 108573031 A CN108573031 A CN 108573031A
Authority
CN
China
Prior art keywords
text
complaint
machine learning
demand part
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810252500.2A
Other languages
English (en)
Inventor
陈汝烨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Wan Xing Mdt Infotech Ltd
Original Assignee
Shanghai Wan Xing Mdt Infotech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Wan Xing Mdt Infotech Ltd filed Critical Shanghai Wan Xing Mdt Infotech Ltd
Priority to CN201810252500.2A priority Critical patent/CN108573031A/zh
Publication of CN108573031A publication Critical patent/CN108573031A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于内容的投诉分类方法和系统,包括如下步骤:获取历史诉求件、历史案例文本,并根据内容进行分类,打上标签;对文本进行学习模型训练,生成机器学习分类模型;训练决策树机器学习模型,再进行细分,随后分配到各部门。本发明实现对大量的诉求件的准确识别以及精确分类,使得投诉工作流程系统化,自动化,智能化,大大节约了人工成本,并且降低了人员流动对工作效率产生影响的风险。

Description

一种基于内容的投诉分类方法和系统
技术领域
本发明涉及公共信息服务业务支撑领域和计算机软件领域,具体涉及一种基于内容的投诉分类方法和系统。
背景技术
随着社会的发展,市民的维权意识不断的增强,政府为了顺应人民群众的需求也相应增加了各种各样的在线投诉渠道,比如投诉热线,便民服务平台等等。但是目前受理诉求件、咨询的交办工作完全依赖人工完成,已经面临非常大的压力。
当前,解决市民投诉问题的关键是投诉的识别定位和具体职能部门的准确分发。目前投诉的一般处理流程为:
1、首先,接线人员根据市民来电进行沟通,记录诉求件内容。
2、建好后诉求件后系统流转到交办处,交办员阅读诉求件内容,根据内容交办到各个职能部门。
3、职能部门接收后进行实际办理,然后再从系统中反馈到平台。
4、最后,接线人员根据系统回访显示进行回访。
存在的问题和不足:
1、交办工作完全依赖人工完成(即人工分类、交办)。随着人民群众维权和参与市政建设的意识的不断增强,诉求需求必会迅速增加。诉求件交办如仍依赖人工,工作量必将明显增大,所消耗的人力资源也必将增多。
2、诉求件交办需要业务能手。由于诉求件必须交办到上百个职能部门去办理,需要交办人员对部门职能非常熟悉,需要长时间的学习和积累经验,当目前的交办人员发生岗位变动或休息时,容易造成交办诉求件积压。
3、处理速度受限。由于人工处理需要一个一个的阅读,判断,在诉求件处理速度上,依赖于阅读速度、业务熟悉程度,无法快速的进行批量处理。
CN201310288121.6号专利申请公开了一种投诉处理的方法和系统,该方法包括输入投诉文本;分析投诉文本与投诉解决方案数据的相关性,确定样本数据;训练神经网络对投诉文本的识别;识别系统结果与实际结果,进行误差分析,并修改对应的权值。该技术方案由于采用文本空间向量表示将投诉文本可以准确分类,避免了由于文本语言表达问题,更能方便工作人员对于投诉情况进行归类、分析,具有投诉定位快、问题修正快、完全自动化的优势。
发明内容
本发明为解决现有的问题,旨在提供一种基于内容的投诉分类方法和系统。为了达到上述目的,本发明采用的技术方案是其特征在于包括如下步骤:
步骤一,获取历史诉求件、历史案例文本,并根据内容进行分类,打上标签;
步骤二,对文本进行朴素贝叶斯机器学习模型训练,生成机器学习分类模型;
步骤三,训练决策树机器学习模型,并使用决策树模型对诉求件再进行细分,随后分配到各部门。
其中,步骤一完成后,对历史诉求件、历史案例文本分词、去除停用词,把每一个文本转化为词袋数据,然后使用词袋数据进行模型训练。
其中,步骤二中,有新诉求件进入后,则使用机器学习模型对新的诉求件进行分类。
其中,还包括步骤四,当新的诉求件积累后,用新增的诉求件和历史数据再次进行机器学习模型训练,更新分类模型。
步骤三中,当诉求件分类错误时,由职能部门反馈给交办人员,由交办人员进行人工纠错。
本发明还提供一种对投诉事件自动分类和交办系统,包括文本采集存储模块、数据处理模块、机器学习模块和反馈模块,所述文本采集存储模块、数据处理模块、机器学习模块和反馈模块依次接入总线,且和若干终端进行数据连接,并接通历史诉求件、历史案例文本,其中:文本采集存储模块,用于获取每个投诉事件的投诉文本,并进行存储,并能根据标签和时间对投诉文本进行准确的查找;数据处理模块,用于对投诉文本进行数据处理,具体包括分词,去除停用词,把投诉文本数据转化为词袋数据;机器学习模块,用于训练机器学习模块,生成分类模型;反馈模块,用于接线人员了解诉求件进展情况,并根据实际情况进行回访。
和现有技术相比,本发明实现对大量的诉求件的准确识别以及精确分类,使得投诉工作流程系统化,自动化,智能化,加快了分类的速度,节约了人工成本,并且降低了人员流动对工作效率产生影响的风险;使用朴素贝叶斯模型和决策树模型相结合的方式,诉求件得以更加准确的分发到各个职能部门;模型定期进行重新训练,可以不断修正模型,使得分类模型可以一直保持较高的分类准确率。
附图说明
图1为本发明实施例的流程示意图;
图2为对投诉事件自动分类和交办系统的结构示意图;
图3为本发明实施例中,决策树分类器分类示例图;
图4为本发明实施例中,机器学习模型训练和进行分类的流程示意图。
具体实施方式
现结合附图对本发明作进一步地说明。
参见图1至图4,为本发明提供的一种投诉事件的投诉内容分类判定方法流程图,图2为对投诉事件自动分类和交办系统的结构示意图,包括步骤:
步骤一:获取历史诉求件和历史案例文本,进行人工分类判定,存储到MongoDB数据库中。这里选取MongoDB数据库是因为:诉求件文本主要为文档型数据,而MongoDB数据库是优秀的文档型数据库,它是基于分布式文件存储的数据库,非常适合在分布式的情况下存储数据,从而在数据库级别保证了数据服务的稳定性和扩展性,为服务数据的一致性和安全性提供有力保障。
步骤二:使用数据处理模块,对投诉文本进行数据处理,具体包括:
使用分词算法对投诉文本进行分词;
使用正则表达式去除投诉内容分词后的中文标点符号和停用词(例如:你、我、他、的、是等),把文本数据转化为词袋数据。
步骤三:使用上述词袋数据,进行朴素贝叶斯机器学习模型训练,具体包括:设投诉分类有n种,分别为分类1、分类2…分类n;
设训练词袋数据中有m个词,分别为词1、词2…词m;
计算P(分类i)=分类i的诉求件数/总的诉求件数;
计算P(词j|分类i)=(分类i中每个诉求件中出现词j的次数的总和+1)/(分类i中所有词出现次数+n)
把上述步骤计算出的每个P(分类i)和每个P(词j|分类i)取对数(本示例一律取底数为2)转化为log P(分类i)和log P(词j|分类i)存到hash表中,完成朴素贝叶斯机器学习模型训练。
步骤四:使用上述朴素贝叶斯分类器对历史诉求件进行分类,在这个基础上用每个分类训练决策树模型,用于细分诉求件到具体职能部门。具体包括:
使用卡方特征词选取法构建特征词词表:
χ2用来衡量特征词条t和类别ci之间的统计相关性。假设特征t和类别ci之间是符合一阶自由度的χ2分布,则特征词t对于类别ci的χ2统计公式定义如上式。其中,A表示属于ci类且包含t的文档频数,B表示不属于ci类但是包含t的文档频数,C表示属于ci类但是不包含t的文档频数,D表示不属于ci类且不包含t的文档频数。
分别计算t对于每个类别的卡方统计值,用下面的公式计算特征t对于整个样本的卡方统计值:
其中P(ci)为每个类别的概率值,n为类别数。
计算每个词t的χ2卡方统计值,排序,取前m个组成特征词表。
对诉求件向量化:
对于每个诉求件,计算特征词表中每个词的TF-IDF值,把每个诉求件文本向量化为m维的向量。
TF为词汇频率(Term-Frequency),其中,N表示文本的总词汇数,Nw表示词w在文本中出现的次数,TF的值越大,词w与文本的相关性就越强。
IDF为逆文档频率(Inverse Document Frequency),其中,Dw表示包含词w的文档数,D表示语料库中的总文档数目,IDF值越大,该词与文档的相关性越低。
TF-IDF=TF*IDF
用向量化后的数据集进行决策树模型训练,生成决策树分类器:
使用ID3算法生成决策树模型,即在决策树各个节点上应用信息增益准则选择特征,递归的构建决策树。
步骤五:用生成的机器学习模型对新的诉求件进行分类,具体包括:
使用数据处理模块对新的诉求件文本进行处理,分词,去除中文标点和停用词,把文本数据转化为词袋数据。
根据条件独立假设和朴素贝叶斯公式计算新诉求件为各个类别的概率值。
比较新诉求件为各个类别概率的大小,取概率最大值的类别即为新诉求件的判定类别。
假如投诉分为三类,{交通、市容、环境};
新诉求内容,“XX街有小贩乱摆摊行为。”
对新诉求文本进行分词去中文标点,{XX街、有、小贩、乱、摆摊、行为};计算
log P(交通|XX街,有,小贩,乱,摆摊,行为)
=log P(XX街|交通)+log P(有|交通)+log P(小贩|交通)…
+log P(乱|交通)+log P(摆摊|交通)+log P(行为|交通)…
+log P(交通)
log P(市容|XX街,有,小贩,乱,摆摊,行为)
=log P(XX街|市容)+log P(有|市容)+log P(小贩|市容)…
+log P(乱|市容)+log P(摆摊|市容)+log P(行为|市容)…
+log P(市容)
log P(环境|XX街,有,小贩,乱,摆摊,行为)
=log P(XX街|环境)+log P(有|环境)+log P(小贩|环境)…
+log P(乱|环境)+log P(摆摊|环境)+log P(行为|环境)…
+log P(环境)
随后,比较上述三个概率对数值,最大值为log P(市容|XX街,…),则新投诉“XX街有小贩乱摆摊行为。”分类为市容。
参见图3,根据分类为市容的决策树分类器,对诉求件进一步进行细分。细分结果为,城管大队。
步骤六:当诉求件分类错误时,由职能部门通过系统的反馈模块反馈给交办人员,由交办人员进行人工纠错。
步骤七:当新的诉求件积累到一定数量时,用新增的诉求件和历史数据再次进行机器学习模型训练,更新分类模型。
本实施例将传统的市民投诉工作流程系统化,自动化,智能化,大大节约了人工成本。其中技术优点有:
使用训练的机器学习模型进行分类,大大加快了分类的速度。
模型定期进行重新训练,可以不断修正模型,使得分类模型可以一直保持较高的分类准确率。
创造性的使用朴素贝叶斯模型和决策树模型相结合的方式,使得诉求件更加准确的分发到各个职能部门。
上面结合附图及实施例描述了本发明的实施方式,实施例给出的结构并不构成对本发明的限制,本领域内熟练的技术人员可依据需要做出调整,在所附权利要求的范围内做出各种变形或修改均在保护范围内。

Claims (6)

1.一种基于内容的投诉分类方法,其特征在于包括如下步骤:
步骤一,获取历史诉求件、历史案例文本,并根据内容进行分类,打上标签;
步骤二,对文本进行朴素贝叶斯机器学习模型训练,生成机器学习分类模型;
步骤三,训练决策树机器学习模型,并使用决策树模型对诉求件再进行细分,随后分配到各部门。
2.根据权利要求1所述的一种基于内容的投诉分类方法,其特征在于:步骤一完成后,对历史诉求件、历史案例文本进行分词、去除停用词,把每一个文本转化为词袋数据,然后使用词袋数据进行模型训练。
3.根据权利要求1所述的一种基于内容的投诉分类方法,其特征在于:步骤三中,有新诉求件进入后,则使用机器学习模型对新的诉求件进行分类。
4.根据权利要求1、2或3所述的一种基于内容的投诉分类方法,其特征在于:还包括步骤四,当新的诉求件积累后,用新增的诉求件和历史数据再次进行机器学习模型训练,更新分类模型。
5.根据权利要求1所述的一种基于内容的投诉分类方法,其特征在于:步骤三中,当诉求件分类错误时,由职能部门反馈给交办人员,由交办人员进行人工纠错。
6.一种对投诉事件自动分类和交办系统,其特征在于:包括文本采集存储模块、数据处理模块、机器学习模块和反馈模块,所述文本采集存储模块、数据处理模块、机器学习模块和反馈模块依次接入总线,且和若干终端进行数据连接,并接通历史诉求件、历史案例文本,
其中:
文本采集存储模块,用于获取每个投诉事件的投诉文本,并进行存储,并能根据标签和时间对投诉文本进行准确的查找;
数据处理模块,用于对投诉文本进行数据处理,具体包括分词,去除停用词,把投诉文本数据转化为词袋数据;
机器学习模块,用于训练机器学习模块,生成分类模型;
反馈模块,用于接线人员了解诉求件进展情况,并根据实际情况进行回访。
CN201810252500.2A 2018-03-26 2018-03-26 一种基于内容的投诉分类方法和系统 Pending CN108573031A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810252500.2A CN108573031A (zh) 2018-03-26 2018-03-26 一种基于内容的投诉分类方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810252500.2A CN108573031A (zh) 2018-03-26 2018-03-26 一种基于内容的投诉分类方法和系统

Publications (1)

Publication Number Publication Date
CN108573031A true CN108573031A (zh) 2018-09-25

Family

ID=63574672

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810252500.2A Pending CN108573031A (zh) 2018-03-26 2018-03-26 一种基于内容的投诉分类方法和系统

Country Status (1)

Country Link
CN (1) CN108573031A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255499A (zh) * 2018-10-25 2019-01-22 阿里巴巴集团控股有限公司 投诉、投诉案件处理方法、装置及设备
CN109558489A (zh) * 2018-12-03 2019-04-02 南京中孚信息技术有限公司 文本分类方法及装置
CN109685336A (zh) * 2018-12-10 2019-04-26 深圳市小牛普惠投资管理有限公司 催收任务分配方法、装置、计算机设备及存储介质
CN109858869A (zh) * 2018-12-21 2019-06-07 厦门市美亚柏科信息股份有限公司 用于处理事件信息的方法和装置
CN109872162A (zh) * 2018-11-21 2019-06-11 阿里巴巴集团控股有限公司 一种处理用户投诉信息的风控分类识别方法及系统
CN110275956A (zh) * 2019-06-24 2019-09-24 成都数之联科技有限公司 一种人员识别方法及系统
CN110347840A (zh) * 2019-07-18 2019-10-18 携程计算机技术(上海)有限公司 投诉文本类别的预测方法、系统、设备和存储介质
CN110827040A (zh) * 2019-10-31 2020-02-21 支付宝(杭州)信息技术有限公司 一种消费者诉求解决方法和系统
CN111045847A (zh) * 2019-12-18 2020-04-21 Oppo广东移动通信有限公司 事件审计方法、装置、终端设备以及存储介质
CN111831286A (zh) * 2019-04-12 2020-10-27 中国移动通信集团河南有限公司 一种用户投诉处理方法和设备
CN112183068A (zh) * 2020-09-30 2021-01-05 深圳供电局有限公司 一种客户投诉事件差异化处理方法及系统
CN112381167A (zh) * 2020-11-20 2021-02-19 北京百度网讯科技有限公司 训练任务分类模型的方法、任务分类方法和装置
CN112541351A (zh) * 2020-12-08 2021-03-23 济南市城乡建设数字化中心 一种住建领域政务热线工单派发方法及系统
CN113094567A (zh) * 2021-03-31 2021-07-09 四川新网银行股份有限公司 一种基于文本聚类的恶意投诉识别方法及系统
CN115169979A (zh) * 2022-08-08 2022-10-11 航天神舟智慧系统技术有限公司 一种基于语义分析的事件自动处置方法、装置及系统
CN115345229A (zh) * 2022-08-08 2022-11-15 航天神舟智慧系统技术有限公司 一种消防风险维度确定方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050097436A1 (en) * 2003-10-31 2005-05-05 Takahiko Kawatani Classification evaluation system, method, and program
EP1736901A2 (en) * 2005-06-20 2006-12-27 Xerox Corporation Method for classifying sub-trees in semi-structured documents
CN101251855A (zh) * 2008-03-27 2008-08-27 腾讯科技(深圳)有限公司 一种互联网网页清洗方法、系统及设备
JP2010108265A (ja) * 2008-10-30 2010-05-13 Kddi Corp コンテンツ分類装置およびプログラム
CN102096703A (zh) * 2010-12-29 2011-06-15 北京新媒传信科技有限公司 短消息的过滤方法和设备
CN106156809A (zh) * 2015-04-24 2016-11-23 阿里巴巴集团控股有限公司 用于更新分类模型的方法及装置
CN106250398A (zh) * 2016-07-19 2016-12-21 北京京东尚科信息技术有限公司 一种投诉事件的投诉内容分类判定方法及装置
CN106484873A (zh) * 2016-10-13 2017-03-08 成都东方盛行电子有限责任公司 一种大数据分类处理方法
CN107391772A (zh) * 2017-09-15 2017-11-24 国网四川省电力公司眉山供电公司 一种基于朴素贝叶斯的文本分类方法
CN107403198A (zh) * 2017-07-31 2017-11-28 广州探迹科技有限公司 一种基于级联分类器的官网识别方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050097436A1 (en) * 2003-10-31 2005-05-05 Takahiko Kawatani Classification evaluation system, method, and program
EP1736901A2 (en) * 2005-06-20 2006-12-27 Xerox Corporation Method for classifying sub-trees in semi-structured documents
CN101251855A (zh) * 2008-03-27 2008-08-27 腾讯科技(深圳)有限公司 一种互联网网页清洗方法、系统及设备
JP2010108265A (ja) * 2008-10-30 2010-05-13 Kddi Corp コンテンツ分類装置およびプログラム
CN102096703A (zh) * 2010-12-29 2011-06-15 北京新媒传信科技有限公司 短消息的过滤方法和设备
CN106156809A (zh) * 2015-04-24 2016-11-23 阿里巴巴集团控股有限公司 用于更新分类模型的方法及装置
CN106250398A (zh) * 2016-07-19 2016-12-21 北京京东尚科信息技术有限公司 一种投诉事件的投诉内容分类判定方法及装置
CN106484873A (zh) * 2016-10-13 2017-03-08 成都东方盛行电子有限责任公司 一种大数据分类处理方法
CN107403198A (zh) * 2017-07-31 2017-11-28 广州探迹科技有限公司 一种基于级联分类器的官网识别方法
CN107391772A (zh) * 2017-09-15 2017-11-24 国网四川省电力公司眉山供电公司 一种基于朴素贝叶斯的文本分类方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LI-MIN WANG 等: "Combining decision tree and Naive Bayes for classification", 《KNOWLEDGE-BASED SYSTEMS》 *
刘靖雯: "基于SVM决策树的增量式文本层次分类研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
黄宇达 等: "基于朴素贝叶斯与ID3算法的决策树分类", 《计算机工程》 *

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255499B (zh) * 2018-10-25 2021-12-07 创新先进技术有限公司 投诉、投诉案件处理方法、装置及设备
CN109255499A (zh) * 2018-10-25 2019-01-22 阿里巴巴集团控股有限公司 投诉、投诉案件处理方法、装置及设备
CN109872162A (zh) * 2018-11-21 2019-06-11 阿里巴巴集团控股有限公司 一种处理用户投诉信息的风控分类识别方法及系统
CN109558489A (zh) * 2018-12-03 2019-04-02 南京中孚信息技术有限公司 文本分类方法及装置
CN109685336A (zh) * 2018-12-10 2019-04-26 深圳市小牛普惠投资管理有限公司 催收任务分配方法、装置、计算机设备及存储介质
CN109858869A (zh) * 2018-12-21 2019-06-07 厦门市美亚柏科信息股份有限公司 用于处理事件信息的方法和装置
CN111831286A (zh) * 2019-04-12 2020-10-27 中国移动通信集团河南有限公司 一种用户投诉处理方法和设备
CN111831286B (zh) * 2019-04-12 2023-11-14 中国移动通信集团河南有限公司 一种用户投诉处理方法和设备
CN110275956A (zh) * 2019-06-24 2019-09-24 成都数之联科技有限公司 一种人员识别方法及系统
CN110347840A (zh) * 2019-07-18 2019-10-18 携程计算机技术(上海)有限公司 投诉文本类别的预测方法、系统、设备和存储介质
CN110827040A (zh) * 2019-10-31 2020-02-21 支付宝(杭州)信息技术有限公司 一种消费者诉求解决方法和系统
CN111045847A (zh) * 2019-12-18 2020-04-21 Oppo广东移动通信有限公司 事件审计方法、装置、终端设备以及存储介质
CN111045847B (zh) * 2019-12-18 2023-07-21 Oppo广东移动通信有限公司 事件审计方法、装置、终端设备以及存储介质
CN112183068A (zh) * 2020-09-30 2021-01-05 深圳供电局有限公司 一种客户投诉事件差异化处理方法及系统
CN112381167A (zh) * 2020-11-20 2021-02-19 北京百度网讯科技有限公司 训练任务分类模型的方法、任务分类方法和装置
CN112541351A (zh) * 2020-12-08 2021-03-23 济南市城乡建设数字化中心 一种住建领域政务热线工单派发方法及系统
CN112541351B (zh) * 2020-12-08 2023-09-05 济南市城乡建设数字化中心 一种住建领域政务热线工单派发方法及系统
CN113094567A (zh) * 2021-03-31 2021-07-09 四川新网银行股份有限公司 一种基于文本聚类的恶意投诉识别方法及系统
CN115169979A (zh) * 2022-08-08 2022-10-11 航天神舟智慧系统技术有限公司 一种基于语义分析的事件自动处置方法、装置及系统
CN115345229A (zh) * 2022-08-08 2022-11-15 航天神舟智慧系统技术有限公司 一种消防风险维度确定方法

Similar Documents

Publication Publication Date Title
CN108573031A (zh) 一种基于内容的投诉分类方法和系统
CN111222305B (zh) 一种信息结构化方法和装置
US11429810B2 (en) Question answering method, terminal, and non-transitory computer readable storage medium
CN109872162B (zh) 一种处理用户投诉信息的风控分类识别方法及系统
CN112163424B (zh) 数据的标注方法、装置、设备和介质
CN109086265B (zh) 一种语义训练方法、短文本中多语义词消歧方法
CN115002200B (zh) 基于用户画像的消息推送方法、装置、设备及存储介质
CN109086355B (zh) 基于新闻主题词的热点关联关系分析方法及系统
CN104834651A (zh) 一种提供高频问题回答的方法和装置
CN110807086A (zh) 文本数据标注方法及装置、存储介质、电子设备
CN111026870A (zh) 一种综合文本分类和图像识别的ict系统故障分析方法
CN112883730B (zh) 相似文本匹配方法、装置、电子设备及存储介质
CN110717040A (zh) 词典扩充方法及装置、电子设备、存储介质
CN110929119A (zh) 数据标注方法、装置、设备及计算机存储介质
CN111428480A (zh) 简历识别方法、装置、设备及存储介质
CN111191614A (zh) 一种单据分类方法和装置
CN111538859B (zh) 一种动态更新视频标签的方法、装置及电子设备
CN115544348A (zh) 一种基于互联网大数据的海量信息智能搜索系统
CN111754208A (zh) 一种招聘简历自动筛选方法
CN111143517A (zh) 人选标签预测方法、装置、设备和存储介质
CN112579784B (zh) 一种基于深度强化学习的云边协同文档分类系统及方法
CN117034949A (zh) 咨询工单的分类方法、装置、电子设备及存储介质
CN113806538B (zh) 标签提取模型训练方法、装置、设备与存储介质
CN116342137A (zh) 客户数据回收再分配方法、装置、计算机设备及存储介质
CN113095073B (zh) 语料标签生成方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180925