CN108197178A - 一种企业风险评估方法 - Google Patents
一种企业风险评估方法 Download PDFInfo
- Publication number
- CN108197178A CN108197178A CN201711400594.5A CN201711400594A CN108197178A CN 108197178 A CN108197178 A CN 108197178A CN 201711400594 A CN201711400594 A CN 201711400594A CN 108197178 A CN108197178 A CN 108197178A
- Authority
- CN
- China
- Prior art keywords
- enterprise
- text
- data
- father
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Educational Administration (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及大数据技术领域,尤其是一种企业风险评估方法。本发明所述的方法包括数据采集、风险评分和风险评分校正;所述的数据采集是在互联网上采集企业相关的文本数据;所述的风险评分是先根据企业网络数据进行文本倾向性识别,然后根据企业公安、人力资源、社保、供水、供电、国税、地税、司法、外资数据以及网络数据分析结果做Lasso回归模型得到初始分数;所述的评分校正充分考虑到企业之间的关系,根据相关企业的初步评分以及企业关系对该企业进行分数校正;根据获得的评分判断企业的风险。本发明实现了对企业风险的全面分析、评估。
Description
技术领域
本发明涉及大数据技术领域,尤其是一种企业风险评估方法。
背景技术
随着信息技术的飞速发展尤其是互联网大数据的发展以及普及,人类进入了瞬息万变的信息时代。任何企业都处在一个信息庞大的环境中,企业周围充斥着互联网数据、政府数据、内部系统数据等各种各样的数据。在企业发展过程中欠薪、倒闭等问题时有发生,这对企业的生产经营以及社会环境造成不良影响。
发明内容
本发明解决的技术问题在于一种基于多模型融合的企业风险评估方法;实现对企业存在风险进行全面的分析、评估。
本发明解决上述技术问题的技术方案是:
所述的方法包括数据采集、风险评分和风险评分校正;
所述的数据采集是在互联网上采集企业相关的文本数据;
所述的风险评分是先根据企业网络数据进行文本倾向性识别,然后根据企业公安、人力资源、社保、供水、供电、国税、地税、司法、外资数据以及网络数据分析结果做Lasso回归模型得到初始分数;
所述的评分校正充分考虑到企业之间的关系,根据相关企业的初步评分以及企业关系对该企业进行分数校正;根据获得的评分判断企业的风险。
所述的文本数据的采集流程是:
第一步,获取待采集的URL;
第二步,解析DNS找到服务器的IP;
第三步,抓取网页数据获取网页html代码;
第四步,解析页面html代码获取文本内容;
第五步,对抓取的数据进行文本抽取,链接抽取,把抽取的链接加入待采集URL队列;
第六步,进行文本特征提取,生成网页指纹;
第七步,判断内容是否重复;
第八步,如果已有相同文章则放弃抓取返回第一步,否则对正文文本进行分词操作;
第九步,使用crf命名识别找出文章相关联的企业;
第十步,把文章文本内容以及相关的企业存储数据库。
所述的文本倾向性识别流程是:
第一步,人工标注训练样本集;
第二步,对训练样本进行自动分词;
第三步,利用情感词表标识文本中的情感特征词;
第四步,利用TF-IDF公式和情感词本身的情感权重对特征权重进行计算;
第五步,根据文本情感特征和权重得到文档情感向量的特征空间;
第六步,根据企业名称查找相关的文本;
第七步,遍历所有文本进行分词以及特征权重计算,得到文本的情感向量的特征空间;
第八步,利用逻辑分类器对文本进行分类;
第九步,得到文本的倾向性分类结果;
第十步,取企业相关所有文本的情感分析结果的均值作为最后结果。
所述的做线性回归模型得到初始分数是:
第一步,抽取各类数据一级特征,公安数据抽取有无刑事案件以及案件个数作为特征,人力资源数据抽取连续6个月员工人数,社保、供水、供电、国税、地税数据抽取连续6个月缴费数据,把是否欠费、欠费月数作为特征,司法数据抽取有无诉讼以及诉讼个数作为特征,外资数据抽取最近6个月有无外资撤资作为特征;
第二步,抽取二级特征,人力资源、社保、供水、供电、国税、地税连续6个月的环比数、环比率;
第三步,特征处理,对布尔型特征采取{0,1}表示,数值型特征进行归一化;
第四步,人工标注一批数据集作为训练集;
第五步,模型训练,使用Lasso回归,采用梯度下降法进行模型训练;
第六步,根据训练得到的参数对企业进行评分。
所述的对企业进行分数校正流程是:
第一步,构建企业投资关系图;
第二步,采用广度优先搜索方法搜索父节点f、父节点的父节点ff、子节点s、子节点的子节点ss;
第三步,计算最终分数,公式如下:
其中nf、nff、ns、nss分别为父节点、父父节点、子节点、子子节点个数,λfi、λffi、λsi、λssi为第i个父节点、父父节点、子节点、子子节点的投资比例,αfi、αffi、αsi、αssi为第i个父节点、父父节点、子节点、子子节点的参数,设置为1/10;Rfi、Rffi、Rsi、Rssi为第i个父节点、父父节点、子节点、子子节点的初始分数,R为当前节点的初始分数。
本发明使用文本分类模型先对企业相关的互联网数据进行情感倾向分析,再利用企业的政府数据以及互联网数据结果多个维度对企业进行Lasso回归分析得出初始分数,最后考虑到企业之间的关联性对企业评分进行纠正得到最终的评分。经过多个模型融合后提高了企业评测的准确度。
本发明充分利用了互联网数据、政府数据,首先对企业资讯数据做情感倾向性分析,然后使用企业各维度数据做Lasso回归,最后又充分考虑企业之间的关系做最终的分数校正,提高了企业风险评测的准确性。
附图说明
下面结合附图对本发明进一步说明:
图1是本发明分析逻辑流程框图;
图2是本发明数据采集流程图;
图3是本发明风险评分流程图;
图4是本发明企业关系图。
具体实施方式
如图1-4所示,本发明包括数据采集、风险评分、风险评分校正。数据采集负责在互联网上采集企业相关的文本数据;风险评分先根据企业网络数据进行文本倾向性识别,然后根据企业公安、人力资源、社保、供水、供电、国税、地税、司法、外资数据以及网络数据分析结果做Lasso回归模型得到初始分数;评分校正充分考虑到企业之间的关系,根据相关企业的初步评分以及企业关系对该企业进行分数校正。
如图2所示:所述的数据采集负责在互联网上采集企业相关的文本数据,包括如下步骤:
第一步,在URL待采集队列中获取待采集的URL;
第二步,解析DNS找到服务器的IP;
第三步,通过java中URLConnection获取网页数据的html文本内容;
第四步,通过自动或者模板的方式解析页面html代码获取文本内容;
第五步,对抓取的数据进行文本抽取,链接抽取,把本链接加入到已采集列表Visited表,把抽取的链接加入待采集URL队列;
第六步,自动文本特征提取,生成网页SimpleHash指纹;
第七步,计算网页指纹的余弦距离d,如果d>0.9则表示内容重复否则不重复;
第八步,如果已有相同文章则放弃抓取返回第一步,否则对正文文本进行分词操作;
第九步,使用crf命名实体识别找出文章相关联的企业;
第十步,把文章文本内容以及相关的企业存储数据库。
如图3所示:所述的风险评分先根据企业网络数据进行文本倾向性识别,其特征在于:
第一步,人工标注训练样本集;
第二步,对训练样本进行自动分词;
第三步,利用情感词表标识文本中的情感特征词;
第四步,利用TF-IDF公式和情感词本身的情感权重对特征权重进行计算;
第五步,根据文本情感特征和权重得到文档情感向量的特征空间;
第六步,根据企业名称查找相关的文本;
第七步,遍历所有文本进行分词以及特征权重计算,得到文本的情感向量的特征空间;
第八步,利用逻辑分类器对文本进行分类;
第九步,得到文本的倾向性分类结果;
第十步,取企业相关所有文本的情感分析结果的均值做为最后结果。
所述的根据企业公安、人力资源、社保、供水、供电、国税、地税、司法、外资数据以及网络数据分析结果做线性回归模型得到初始分数,包括如下步骤:
第一步,抽取各类数据一级特征,公安数据抽取有无刑事案件以及案件个数作为特征,人力资源数据抽取连续6个月员工人数,社保、供水、供电、国税、地税数据抽取连续6个月缴费数据,把是否欠费、欠费月数作为特征,司法数据抽取有无诉讼以及诉讼个数作为特征,外资数据抽取最近6个月有无外资撤资作为特征;
第二步,抽取二级特征,人力资源、社保、供水、供电、国税、地税连续6个月的环比数、环比率;
第三步,特征处理,对布尔型特征采取{0,1}表示,数值型特征进行归一化;
第四步,人工标注一批数据集作为训练集;
第五步,模型训练,使用Lasso回归,采用梯度下降法进行模型训练;
第六步,根据训练得到的参数对企业进行评分。
如图4所示,评分校正充分考虑到企业之间的关系,根据相关企业的初步评分以及企业关系对该企业进行分数校正,包括如下步骤:
第一步,构建企业投资关系图;
第二步,采用广度优先搜索方法搜索父节点f、父节点的父节点ff、子节点s、子节点的子节点ss;
第三步,计算最终分数,公式如下
其中nf、nff、ns、nss分别为父节点、父父节点、子节点、子子节点个数,λfi、λffi、λsi、λssj为第i个父节点、父父节点、子节点、子子节点的投资比例,αfi、αffi、αsi、αssj为第i个父节点、父父节点、子节点、子子节点的超参数设置为1/10,Rfi、Rffi、Rsi、Rssj为第i个父节点、父父节点、子节点、子子节点的初始分数,R为当前节点的初始分数。
Claims (7)
1.一种企业风险评估方法,其特征在于:所述的方法包括数据采集、风险评分和风险评分校正;
所述的数据采集是在互联网上采集企业相关的文本数据;
所述的风险评分是先根据企业网络数据进行文本倾向性识别,然后根据企业公安、人力资源、社保、供水、供电、国税、地税、司法、外资数据以及网络数据分析结果做Lasso回归模型得到初始分数;
所述的评分校正充分考虑到企业之间的关系,根据相关企业的初步评分以及企业关系对该企业进行分数校正;根据获得的评分判断企业的风险。
2.根据权利要求1所述的方法,其特征在于:所述的文本数据的采集流程是:
第一步,获取待采集的URL;
第二步,解析DNS找到服务器的IP;
第三步,抓取网页数据获取网页html代码;
第四步,解析页面html代码获取文本内容;
第五步,对抓取的数据进行文本抽取,链接抽取,把抽取的链接加入待采集URL队列;
第六步,进行文本特征提取,生成网页指纹;
第七步,判断内容是否重复;
第八步,如果已有相同文章则放弃抓取返回第一步,否则对正文文本进行分词操作;
第九步,使用crf命名识别找出文章相关联的企业;
第十步,把文章文本内容以及相关的企业存储数据库。
3.根据权利要求1所述的方法,其特征在于:所述的文本倾向性识别流程是:
第一步,人工标注训练样本集;
第二步,对训练样本进行自动分词;
第三步,利用情感词表标识文本中的情感特征词;
第四步,利用TF-IDF公式和情感词本身的情感权重对特征权重进行计算;
第五步,根据文本情感特征和权重得到文档情感向量的特征空间;
第六步,根据企业名称查找相关的文本;
第七步,遍历所有文本进行分词以及特征权重计算,得到文本的情感向量的特征空间;
第八步,利用逻辑分类器对文本进行分类;
第九步,得到文本的倾向性分类结果;
第十步,取企业相关所有文本的情感分析结果的均值作为最后结果。
4.根据权利要求2所述的方法,其特征在于:所述的文本倾向性识别流程是:
第一步,人工标注训练样本集;
第二步,对训练样本进行自动分词;
第三步,利用情感词表标识文本中的情感特征词;
第四步,利用TF-IDF公式和情感词本身的情感权重对特征权重进行计算;
第五步,根据文本情感特征和权重得到文档情感向量的特征空间;
第六步,根据企业名称查找相关的文本;
第七步,遍历所有文本进行分词以及特征权重计算,得到文本的情感向量的特征空间;
第八步,利用逻辑分类器对文本进行分类;
第九步,得到文本的倾向性分类结果;
第十步,取企业相关所有文本的情感分析结果的均值作为最后结果。
5.根据权利要求1至4任一项所述的方法,其特征在于:所述的做线性回归模型得到初始分数是:
第一步,抽取各类数据一级特征,公安数据抽取有无刑事案件以及案件个数作为特征,人力资源数据抽取连续6个月员工人数,社保、供水、供电、国税、地税数据抽取连续6个月缴费数据,把是否欠费、欠费月数作为特征,司法数据抽取有无诉讼以及诉讼个数作为特征,外资数据抽取最近6个月有无外资撤资作为特征;
第二步,抽取二级特征,人力资源、社保、供水、供电、国税、地税连续6个月的环比数、环比率;
第三步,特征处理,对布尔型特征采取{0,1}表示,数值型特征进行归一化;
第四步,人工标注一批数据集作为训练集;
第五步,模型训练,使用Lasso回归,采用梯度下降法进行模型训练;
第六步,根据训练得到的参数对企业进行评分。
6.根据权利要求1至4任一项所述的方法,其特征在于:所述的对企业进行分数校正流程是:
第一步,构建企业投资关系图;
第二步,采用广度优先搜索方法搜索父节点f、父节点的父节点ff、子节点s、子节点的子节点ss;
第三步,计算最终分数,公式如下:
其中nf、nff、ns、nss分别为父节点、父父节点、子节点、子子节点个数,λfi、λffi、λsi、λssi为第i个父节点、父父节点、子节点、子子节点的投资比例,αfi、αffi、αsi、αssi为第i个父节点、父父节点、子节点、子子节点的参数,设置为1/10;Rfi、Rffi、Rsi、Rssi为第i个父节点、父父节点、子节点、子子节点的初始分数,R为当前节点的初始分数。
7.根据权利要求5所述的方法,其特征在于:所述的对企业进行分数校正流程是:
第一步,构建企业投资关系图;
第二步,采用广度优先搜索方法搜索父节点f、父节点的父节点ff、子节点s、子节点的子节点ss;
第三步,计算最终分数,公式如下:
其中nf、nff、ns、nss分别为父节点、父父节点、子节点、子子节点个数,λfi、λffi、λsi、λssi为第i个父节点、父父节点、子节点、子子节点的投资比例,αfi、αffi、αsi、αssi为第i个父节点、父父节点、子节点、子子节点的参数,设置为1/10;Rfi、Rffi、Rsi、Rssi为第i个父节点、父父节点、子节点、子子节点的初始分数,R为当前节点的初始分数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711400594.5A CN108197178A (zh) | 2017-12-22 | 2017-12-22 | 一种企业风险评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711400594.5A CN108197178A (zh) | 2017-12-22 | 2017-12-22 | 一种企业风险评估方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108197178A true CN108197178A (zh) | 2018-06-22 |
Family
ID=62583534
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711400594.5A Pending CN108197178A (zh) | 2017-12-22 | 2017-12-22 | 一种企业风险评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108197178A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109636242A (zh) * | 2019-01-03 | 2019-04-16 | 深圳壹账通智能科技有限公司 | 企业评分方法、装置、介质及电子设备 |
CN109670724A (zh) * | 2018-12-29 | 2019-04-23 | 重庆誉存大数据科技有限公司 | 风险评估方法及装置 |
CN109740044A (zh) * | 2018-12-24 | 2019-05-10 | 东华大学 | 一种基于时间序列智能预测的企业异动预警方法 |
CN110888930A (zh) * | 2019-12-23 | 2020-03-17 | 武汉大学 | 基于知识图谱的金融知识查询服务接口设计与实现方法 |
WO2020073727A1 (zh) * | 2018-10-11 | 2020-04-16 | 平安科技(深圳)有限公司 | 风险预测方法、装置、计算机设备和存储介质 |
WO2020107872A1 (zh) * | 2018-11-29 | 2020-06-04 | 平安科技(深圳)有限公司 | 企业风险分析方法、装置、计算机设备和存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103886501A (zh) * | 2014-04-08 | 2014-06-25 | 苏州大学 | 一种基于语义情感分析的贷后风险预警系统 |
CN105913195A (zh) * | 2016-04-29 | 2016-08-31 | 浙江汇信科技有限公司 | 基于全行业数据的企业金融风险评分方法 |
CN107392456A (zh) * | 2017-07-14 | 2017-11-24 | 武汉理工大学 | 一种融合互联网信息的多角度企业信用评估建模方法 |
US20170352089A1 (en) * | 2014-11-10 | 2017-12-07 | 0934781 B.C. Ltd. | Recommendation Engine |
CN107451710A (zh) * | 2017-04-27 | 2017-12-08 | 北京鼎泰智源科技有限公司 | 一种信息风险等级五级分类方法及系统 |
US10268840B2 (en) * | 2015-12-04 | 2019-04-23 | Xor Data Exchange, Inc. | Systems and methods of determining compromised identity information |
-
2017
- 2017-12-22 CN CN201711400594.5A patent/CN108197178A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103886501A (zh) * | 2014-04-08 | 2014-06-25 | 苏州大学 | 一种基于语义情感分析的贷后风险预警系统 |
US20170352089A1 (en) * | 2014-11-10 | 2017-12-07 | 0934781 B.C. Ltd. | Recommendation Engine |
US10268840B2 (en) * | 2015-12-04 | 2019-04-23 | Xor Data Exchange, Inc. | Systems and methods of determining compromised identity information |
CN105913195A (zh) * | 2016-04-29 | 2016-08-31 | 浙江汇信科技有限公司 | 基于全行业数据的企业金融风险评分方法 |
CN107451710A (zh) * | 2017-04-27 | 2017-12-08 | 北京鼎泰智源科技有限公司 | 一种信息风险等级五级分类方法及系统 |
CN107392456A (zh) * | 2017-07-14 | 2017-11-24 | 武汉理工大学 | 一种融合互联网信息的多角度企业信用评估建模方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020073727A1 (zh) * | 2018-10-11 | 2020-04-16 | 平安科技(深圳)有限公司 | 风险预测方法、装置、计算机设备和存储介质 |
WO2020107872A1 (zh) * | 2018-11-29 | 2020-06-04 | 平安科技(深圳)有限公司 | 企业风险分析方法、装置、计算机设备和存储介质 |
CN109740044A (zh) * | 2018-12-24 | 2019-05-10 | 东华大学 | 一种基于时间序列智能预测的企业异动预警方法 |
CN109740044B (zh) * | 2018-12-24 | 2023-03-21 | 东华大学 | 一种基于时间序列智能预测的企业异动预警方法 |
CN109670724A (zh) * | 2018-12-29 | 2019-04-23 | 重庆誉存大数据科技有限公司 | 风险评估方法及装置 |
CN109636242A (zh) * | 2019-01-03 | 2019-04-16 | 深圳壹账通智能科技有限公司 | 企业评分方法、装置、介质及电子设备 |
CN110888930A (zh) * | 2019-12-23 | 2020-03-17 | 武汉大学 | 基于知识图谱的金融知识查询服务接口设计与实现方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108197178A (zh) | 一种企业风险评估方法 | |
CN102411563B (zh) | 一种识别目标词的方法、装置及系统 | |
CN105912625B (zh) | 一种面向链接数据的实体分类方法和系统 | |
CN106874378B (zh) | 基于规则模型的实体抽取与关系挖掘构建知识图谱的方法 | |
CN106250412B (zh) | 基于多源实体融合的知识图谱构建方法 | |
TWI424325B (zh) | 使用有機物件資料模型來組織社群智慧資訊的系統及方法 | |
CN105447206B (zh) | 基于word2vec算法的新评论对象识别方法及系统 | |
CN105426354B (zh) | 一种句向量的融合方法和装置 | |
CN110263166A (zh) | 基于深度学习的舆情文本分类方法 | |
CN108256104A (zh) | 基于多维特征的互联网网站综合分类方法 | |
CN107403017A (zh) | 一种智能分析实时新闻对金融市场影响的方法 | |
CN111767725B (zh) | 一种基于情感极性分析模型的数据处理方法及装置 | |
CN105824959A (zh) | 舆情监控方法及系统 | |
CN105260356A (zh) | 基于多任务学习的中文交互文本情感与话题识别方法 | |
CN108536756A (zh) | 基于双语信息的情绪分类方法及系统 | |
CN109918648B (zh) | 一种基于动态滑动窗口特征评分的谣言深度检测方法 | |
US20160170993A1 (en) | System and method for ranking news feeds | |
CN103092975A (zh) | 基于主题共识覆盖率的网络社区垃圾信息检测与过滤方法 | |
CN107194617A (zh) | 一种app软件工程师软技能分类系统及方法 | |
CN112307153A (zh) | 一种产业知识库自动构建方法、装置及存储介质 | |
CN111597331A (zh) | 一种基于贝叶斯网络的裁判文书分类方法 | |
CN115952292B (zh) | 多标签分类方法、装置及计算机可读介质 | |
CN104794209B (zh) | 基于马尔科夫逻辑网络的中文微博情绪分类方法及系统 | |
CN112051986A (zh) | 基于开源知识的代码搜索推荐装置及方法 | |
CN105068986A (zh) | 基于双向迭代和自动构建更新语料库的垃圾评论过滤方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20180622 |