CN108960772A - 基于深度学习的企业评审辅助方法及系统 - Google Patents
基于深度学习的企业评审辅助方法及系统 Download PDFInfo
- Publication number
- CN108960772A CN108960772A CN201810680253.6A CN201810680253A CN108960772A CN 108960772 A CN108960772 A CN 108960772A CN 201810680253 A CN201810680253 A CN 201810680253A CN 108960772 A CN108960772 A CN 108960772A
- Authority
- CN
- China
- Prior art keywords
- enterprise
- text
- natural language
- relevant
- evaluated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Abstract
本发明公开了一种基于深度学习的企业评审辅助方法及系统,该方法包括:步骤S1:获取用户端提交的企业评审辅助请求;步骤S2:根据企业的身份标识信息进行网络数据采集;步骤S3:将每一个与待评审企业相关的文本进行分词后利用word2vec工具生成词向量;步骤S4:对于每一个与待评审企业相关的文本,将其词向量输入采用自然语言文本库中的数据训练好的卷积神经网络模型中,实现文本分类;步骤S5:生成市场分析报告以及竞品分析报告;步骤S6:将市场分析报告以及竞品分析报告发送用户端。本发明能够帮助评审人员收集和整理信息,有利于提高评审人员的工作效率和工作质量,降低评审人员的撰写评审的门槛。
Description
技术领域
本发明涉及自然语言处理技术领域,具体涉及一种基于深度学习的企业评审辅助方法及系统。
背景技术
企业评审报告是采用外部信息对企业多指标多维度的进行投资价值分析的报告,精准、有效的企业评审报告对投资人,企业关联方和企业内部管理人员都有积极的参考作用,然而,目前企业评审报告主要由专业的评审人员采用人工方式撰写得到,其存在以下问题:1、对评审人员要求较高:全面、客观、有效的评审报告对评审人员的思维方式及知识面的广阔程度有一定的要求,从而避免评审人员难以就行业信息、数据进行分析研究的窘境;2、投入时间过长:受制于个人专业领域的局限性,在搜索资料方面上,评审人员对自己不了解的行业及细分领域需要花费大量的时间,搜索耗时过长导致评审人员需要耗费大量时间才能完成企业评审报告;3、信息采集不精准:评审报告对于信息的精准性有着较高的要求,但精准的信息分布在大量的具有无效信息的网络中,这导致一篇评审报告存在具有参考价值的资料选择不全面以及无效信息被摘入评审报告的问题,此外,评审人员有摘取信息个人偏好,难以将有效信息全面覆盖,这也导致不同的评审人员对于同一企业的看法存在多个版本的解读。
发明内容
本发明的目的在于提供一种基于深度学习的企业评审辅助方法及系统,有利于提高评审人员的工作效率和工作质量。
为实现上述目的,本发明的技术方案提供了一种基于深度学习的企业评审辅助方法,包括:
步骤S1:获取用户端提交的企业评审辅助请求,所述企业评审辅助请求包括待评审企业的身份标识信息;
步骤S2:根据所述企业的身份标识信息进行网络数据采集,获取若干个与所述待评审企业相关的文本;
步骤S3:将每一个所述与所述待评审企业相关的文本进行分词后利用word2vec工具生成词向量;
步骤S4:对于每一个所述与所述待评审企业相关的文本,将其词向量输入采用自然语言文本库中的数据训练好的卷积神经网络模型中,实现文本分类,其中,所述自然语言文本库包括若干个已标注分类的自然语言文本,且所述若干个自然语言文本的种类包括无关类、市场数据类、竞品分析类三种类型;
步骤S5:根据市场数据类的与所述待评审企业相关的文本生成市场分析报告,根据竞品分析类的与所述待评审企业相关的文本生成竞品分析报告;
步骤S6:将所述市场分析报告以及所述竞品分析报告发送所述用户端。
进一步地,所述身份标识信息包括行业关键词以及企业名称。
进一步地,所述步骤S2包括:
根据所述企业的身份标识信息在多个媒体来源中进行搜索;
按照预设的网址过滤规则对搜索得到的网址进行过滤;
对过滤保留下的网址进行解析并提取正文,得到若干个与所述待评审企业相关的文本。
进一步地,所述训练好的卷积神经网络模型采用以下方式得到:
构建卷积神经网络模型;
将所述自然语言文本库中每一个已标注分类的自然语言文本进行分词后利用word2vec工具生成词向量;
对于每一个已标注分类的自然语言文本,利用其词向量对所述构建的卷积神经网络模型进行训练。
为实现上述目的,本发明的技术方案还提供了一种基于深度学习的企业评审辅助系统,包括:
获取模块,用于获取用户端提交的企业评审辅助请求,所述企业评审辅助请求包括待评审企业的身份标识信息;
数据采集模块,用于根据所述企业的身份标识信息进行网络数据采集,获取若干个与所述待评审企业相关的文本;
处理模块,用于将每一个所述与所述待评审企业相关的文本进行分词后利用word2vec工具生成词向量;
分类模块,用于对于每一个所述与所述待评审企业相关的文本,将其词向量输入采用自然语言文本库中的数据训练好的卷积神经网络模型中,实现文本分类,其中,所述自然语言文本库包括若干个已标注分类的自然语言文本,且所述若干个自然语言文本的种类包括无关类、市场数据类、竞品分析类三种类型;
报告生成模块,用于根据市场数据类的与所述待评审企业相关的文本生成市场分析报告,根据竞品分析类的与所述待评审企业相关的文本生成竞品分析报告;
发送模块,用于将所述市场分析报告以及所述竞品分析报告发送所述用户端。
进一步地,所述身份标识信息包括行业关键词以及企业名称。
进一步地,所述数据采集模块包括:
搜索单元,用于根据所述企业的身份标识信息在多个媒体来源中进行搜索;
过滤单元,用于按照预设的网址过滤规则对搜索得到的网址进行过滤;
解析单元,用于对过滤保留下的网址进行解析并提取正文,得到若干个与所述待评审企业相关的文本。
进一步地,所述训练好的卷积神经网络模型采用以下方式得到:
构建卷积神经网络模型;
将所述自然语言文本库中每一个已标注分类的自然语言文本进行分词后利用word2vec工具生成词向量;
对于每一个已标注分类的自然语言文本,利用其词向量对所述构建的卷积神经网络模型进行训练。
本发明提供的基于深度学习的企业评审辅助方法,能够帮助评审人员收集和整理信息,有利于提高评审人员的工作效率和工作质量,降低评审人员的撰写评审的门槛。
附图说明
图1是本发明实施方式提供的一种基于深度学习的企业评审辅助方法的流程图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
参见图1,图1是本发明实施方式提供的一种基于深度学习的企业评审辅助方法的流程图,该方法包括步骤S1~步骤S6;
步骤S1:获取用户端提交的企业评审辅助请求,所述企业评审辅助请求包括待评审企业的身份标识信息;
例如,上述用户端可以为手机、笔记本电脑、台式电脑或笔记本电脑电能,待评审企业的身份标识信息可以包括待评审企业的行业关键词以及企业名称(如公司名称);
步骤S2:根据所述企业的身份标识信息进行网络数据采集,获取若干个与所述待评审企业相关的文本,其中,该步骤可以采用多进程网络数据采集技术,具体可以包括:
根据所述企业的身份标识信息在多个媒体来源中进行搜索;
按照预设的网址过滤规则对搜索得到的网址进行过滤;
对过滤保留下的网址进行解析并提取正文,得到若干个与所述待评审企业相关的文本;
例如,在接收到用户通过用户端提交的企业评审辅助请求后,可以根据其中的行业关键词(keyword)和公司名称在各个媒体来源中搜索并采集与待评审企业相关的财经信息,为保证速度,可以按照预设的网址过滤规则对搜索得到的网址进行过滤,以过滤url相同的网址以及内容雷同的网址,之后进行文本清洗与语料准备过程:即对通过数据采集技术得到的网址进行解析并提取正文,得到相应的文本;
步骤S3:将每一个所述与所述待评审企业相关的文本进行分词后利用word2vec工具生成词向量;
例如,可以利用jieba工具对待评审企业相关的文本进行分词,并用训练好的word2vec模型(即word2vec工具)得到其词向量,其中,word2vec模型的功能是使用低维度的稠密向量来表示中文词汇,这样做的优点是可以抽象地表示一个词的"意义",该模块的具体实现可以采用gensim库中的Word2Vec-CBOW模型,其以中文百科和大量财经著作作为训练数据;
步骤S4:对于每一个所述与所述待评审企业相关的文本,将其词向量输入采用自然语言文本库中的数据训练好的卷积神经网络模型中,实现文本分类,其中,所述自然语言文本库包括若干个已标注分类的自然语言文本,且所述若干个自然语言文本的种类包括无关类、市场数据类、竞品分析类三种类型;
即以待评审企业相关的文本的词向量为输入,通过训练好的卷积神经网络模型(即分类器模型),对文本进行分类,保留市场数据类和竞品分析类的文本;
其中,本发明中,上述训练好的卷积神经网络模型采用以下方式得到:
构建卷积神经网络模型,例如,该卷积神经网络可由如下几个部分组成:嵌入层(embedding layer),激活函数,卷积层(convolution layer),归一化层(normalizationlayer),池化层(pooling layer),全连接层(fully connected layer),dropout模块,误差与准确度计算模块;
将所述自然语言文本库中每一个已标注分类的自然语言文本进行分词后利用word2vec工具生成词向量,例如,可以预先收集大量自然语言文本,并将其分为三类,分别为无关类,市场数据类和竞品分析类,之后进行分词与语料准备:如利用python的jieba库对自然语言文本库中分类标注好的自然语言材料进行分词,然后将分词后的自然语言材料用word2vec表示,作为训练语料,其中,word2vec工具可以采用gensim库中的Word2Vec-CBOW模型,其以中文百科和大量财经著作作为训练数据;
对于每一个已标注分类的自然语言文本,利用其词向量对所述构建的卷积神经网络模型进行训练,即利用上述自然语言文本库得到的训练语料对构建的卷积神经网络模型进行训练,训练之后的结果是一个自然语言分类模型。
步骤S5:根据市场数据类的与所述待评审企业相关的文本生成市场分析报告,根据竞品分析类的与所述待评审企业相关的文本生成竞品分析报告;
即根据步骤S4得到的分类结果,将市场数据类的文本归集整理,得到市场分析报告,将竞品分析类的文本归集整理,得到竞品分析报告;
步骤S6:将所述市场分析报告以及所述竞品分析报告发送所述用户端,用户端接收到后将其呈现给用户,通过该市场分析报告以及竞品分析报告可以使用户对待评审企业有更精确、全面的了解,可以帮助用户进一步完成企业评审报告。
例如,本发明中基于深度学习的企业评审辅助方法可以采用web技术实现,用户可以在其用户端上输入要查找的行业关键词(keyword)和公司名称,用户端将这些信息以企业评审辅助请求的方式发送至后台服务端,后台服务端接收到企业评审辅助请求后采用上述方法,首先根据用户输入的关键词和公司名称去各个媒体多进程采集数据,然后这些内容经过一些预处理后以词向量的形式输入到训练好的CNN分类器(即训练好的卷积神经网络模型)中,之后根据分类器输出的分类结果(三类)选择性的将内容通过网页方式呈现给用户。
本发明实施方式提供的基于深度学习的企业评审辅助方法,能够帮助评审人员收集和整理信息,有利于提高评审人员的工作效率和工作质量,降低评审人员的撰写评审的门槛。
此外,本发明实施方式还提供了一种基于深度学习的企业评审辅助系统,包括:
获取模块,用于获取用户端提交的企业评审辅助请求,所述企业评审辅助请求包括待评审企业的身份标识信息;
数据采集模块,用于根据所述企业的身份标识信息进行网络数据采集,获取若干个与所述待评审企业相关的文本;
处理模块,用于将每一个所述与所述待评审企业相关的文本进行分词后利用word2vec工具生成词向量;
分类模块,用于对于每一个所述与所述待评审企业相关的文本,将其词向量输入采用自然语言文本库中的数据训练好的卷积神经网络模型中,实现文本分类,其中,所述自然语言文本库包括若干个已标注分类的自然语言文本,且所述若干个自然语言文本的种类包括无关类、市场数据类、竞品分析类三种类型;
报告生成模块,用于根据市场数据类的与所述待评审企业相关的文本生成市场分析报告,根据竞品分析类的与所述待评审企业相关的文本生成竞品分析报告;
发送模块,用于将所述市场分析报告以及所述竞品分析报告发送所述用户端。
其中,在本发明实施方式中,所述身份标识信息包括行业关键词以及企业名称。
其中,在本发明实施方式中,所述数据采集模块包括:
搜索单元,用于根据所述企业的身份标识信息在多个媒体来源中进行搜索;
过滤单元,用于按照预设的网址过滤规则对搜索得到的网址进行过滤;
解析单元,用于对过滤保留下的网址进行解析并提取正文,得到若干个与所述待评审企业相关的文本。
其中,在本发明实施方式中,所述训练好的卷积神经网络模型采用以下方式得到:
构建卷积神经网络模型;
将所述自然语言文本库中每一个已标注分类的自然语言文本进行分词后利用word2vec工具生成词向量;
对于每一个已标注分类的自然语言文本,利用其词向量对所述构建的卷积神经网络模型进行训练。
虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
Claims (8)
1.一种基于深度学习的企业评审辅助方法,其特征在于,包括:
步骤S1:获取用户端提交的企业评审辅助请求,所述企业评审辅助请求包括待评审企业的身份标识信息;
步骤S2:根据所述企业的身份标识信息进行网络数据采集,获取若干个与所述待评审企业相关的文本;
步骤S3:将每一个所述与所述待评审企业相关的文本进行分词后利用word2vec工具生成词向量;
步骤S4:对于每一个所述与所述待评审企业相关的文本,将其词向量输入采用自然语言文本库中的数据训练好的卷积神经网络模型中,实现文本分类,其中,所述自然语言文本库包括若干个已标注分类的自然语言文本,且所述若干个自然语言文本的种类包括无关类、市场数据类、竞品分析类三种类型;
步骤S5:根据市场数据类的与所述待评审企业相关的文本生成市场分析报告,根据竞品分析类的与所述待评审企业相关的文本生成竞品分析报告;
步骤S6:将所述市场分析报告以及所述竞品分析报告发送所述用户端。
2.根据权利要求1所述的基于深度学习的企业评审辅助方法,其特征在于,所述身份标识信息包括行业关键词以及企业名称。
3.根据权利要求1所述的基于深度学习的企业评审辅助方法,其特征在于,所述步骤S2包括:
根据所述企业的身份标识信息在多个媒体来源中进行搜索;
按照预设的网址过滤规则对搜索得到的网址进行过滤;
对过滤保留下的网址进行解析并提取正文,得到若干个与所述待评审企业相关的文本。
4.根据权利要求1所述的基于深度学习的企业评审辅助方法,其特征在于,所述训练好的卷积神经网络模型采用以下方式得到:
构建卷积神经网络模型;
将所述自然语言文本库中每一个已标注分类的自然语言文本进行分词后利用word2vec工具生成词向量;
对于每一个已标注分类的自然语言文本,利用其词向量对所述构建的卷积神经网络模型进行训练。
5.一种基于深度学习的企业评审辅助系统,其特征在于,包括:
获取模块,用于获取用户端提交的企业评审辅助请求,所述企业评审辅助请求包括待评审企业的身份标识信息;
数据采集模块,用于根据所述企业的身份标识信息进行网络数据采集,获取若干个与所述待评审企业相关的文本;
处理模块,用于将每一个所述与所述待评审企业相关的文本进行分词后利用word2vec工具生成词向量;
分类模块,用于对于每一个所述与所述待评审企业相关的文本,将其词向量输入采用自然语言文本库中的数据训练好的卷积神经网络模型中,实现文本分类,其中,所述自然语言文本库包括若干个已标注分类的自然语言文本,且所述若干个自然语言文本的种类包括无关类、市场数据类、竞品分析类三种类型;
报告生成模块,用于根据市场数据类的与所述待评审企业相关的文本生成市场分析报告,根据竞品分析类的与所述待评审企业相关的文本生成竞品分析报告;
发送模块,用于将所述市场分析报告以及所述竞品分析报告发送所述用户端。
6.根据权利要求5所述的基于深度学习的企业评审辅助系统,其特征在于,所述身份标识信息包括行业关键词以及企业名称。
7.根据权利要求5所述的基于深度学习的企业评审辅助系统,其特征在于,所述数据采集模块包括:
搜索单元,用于根据所述企业的身份标识信息在多个媒体来源中进行搜索;
过滤单元,用于按照预设的网址过滤规则对搜索得到的网址进行过滤;
解析单元,用于对过滤保留下的网址进行解析并提取正文,得到若干个与所述待评审企业相关的文本。
8.根据权利要求5所述的基于深度学习的企业评审辅助系统,其特征在于,所述训练好的卷积神经网络模型采用以下方式得到:
构建卷积神经网络模型;
将所述自然语言文本库中每一个已标注分类的自然语言文本进行分词后利用word2vec工具生成词向量;
对于每一个已标注分类的自然语言文本,利用其词向量对所述构建的卷积神经网络模型进行训练。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810680253.6A CN108960772A (zh) | 2018-06-27 | 2018-06-27 | 基于深度学习的企业评审辅助方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810680253.6A CN108960772A (zh) | 2018-06-27 | 2018-06-27 | 基于深度学习的企业评审辅助方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108960772A true CN108960772A (zh) | 2018-12-07 |
Family
ID=64487278
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810680253.6A Pending CN108960772A (zh) | 2018-06-27 | 2018-06-27 | 基于深度学习的企业评审辅助方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108960772A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110427675A (zh) * | 2019-07-23 | 2019-11-08 | 江西博微新技术有限公司 | 一种用于三维设计评审的数据检测方法 |
CN111626331A (zh) * | 2020-04-23 | 2020-09-04 | 南京辰阔网络科技有限公司 | 一种自动化行业分类装置及其工作方法 |
CN112257029A (zh) * | 2020-10-21 | 2021-01-22 | 网娱互动科技(北京)股份有限公司 | 一种帮助企业快速确定市场推广问题的评估方法 |
CN117708351A (zh) * | 2024-02-06 | 2024-03-15 | 国泰新点软件股份有限公司 | 基于深度学习的技术标辅助评审方法、系统及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102376023A (zh) * | 2010-11-17 | 2012-03-14 | 苏州德融嘉信信用管理技术有限公司 | 信用评审用评审材料的集成化方法 |
US20120123961A1 (en) * | 2010-11-15 | 2012-05-17 | Sphere E, LLC | Performance reporting for products and services using web-based portals |
CN104573016A (zh) * | 2015-01-12 | 2015-04-29 | 武汉泰迪智慧科技有限公司 | 一种基于行业的垂直舆情分析系统及方法 |
CN106067094A (zh) * | 2016-06-14 | 2016-11-02 | 华北电力大学 | 一种动态评估方法及系统 |
CN106202330A (zh) * | 2016-07-01 | 2016-12-07 | 北京小米移动软件有限公司 | 垃圾信息的判断方法及装置 |
CN107193915A (zh) * | 2017-05-15 | 2017-09-22 | 北京因果树网络科技有限公司 | 一种企业信息分类方法及装置 |
CN107577792A (zh) * | 2017-09-18 | 2018-01-12 | 前海梧桐(深圳)数据有限公司 | 一种企业数据自动聚类的方法及其系统 |
-
2018
- 2018-06-27 CN CN201810680253.6A patent/CN108960772A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120123961A1 (en) * | 2010-11-15 | 2012-05-17 | Sphere E, LLC | Performance reporting for products and services using web-based portals |
CN102376023A (zh) * | 2010-11-17 | 2012-03-14 | 苏州德融嘉信信用管理技术有限公司 | 信用评审用评审材料的集成化方法 |
CN104573016A (zh) * | 2015-01-12 | 2015-04-29 | 武汉泰迪智慧科技有限公司 | 一种基于行业的垂直舆情分析系统及方法 |
CN106067094A (zh) * | 2016-06-14 | 2016-11-02 | 华北电力大学 | 一种动态评估方法及系统 |
CN106202330A (zh) * | 2016-07-01 | 2016-12-07 | 北京小米移动软件有限公司 | 垃圾信息的判断方法及装置 |
CN107193915A (zh) * | 2017-05-15 | 2017-09-22 | 北京因果树网络科技有限公司 | 一种企业信息分类方法及装置 |
CN107577792A (zh) * | 2017-09-18 | 2018-01-12 | 前海梧桐(深圳)数据有限公司 | 一种企业数据自动聚类的方法及其系统 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110427675A (zh) * | 2019-07-23 | 2019-11-08 | 江西博微新技术有限公司 | 一种用于三维设计评审的数据检测方法 |
CN110427675B (zh) * | 2019-07-23 | 2023-01-03 | 江西博微新技术有限公司 | 一种用于三维设计评审的数据检测方法 |
CN111626331A (zh) * | 2020-04-23 | 2020-09-04 | 南京辰阔网络科技有限公司 | 一种自动化行业分类装置及其工作方法 |
CN111626331B (zh) * | 2020-04-23 | 2023-10-20 | 南京辰阔网络科技有限公司 | 一种自动化行业分类装置及其工作方法 |
CN112257029A (zh) * | 2020-10-21 | 2021-01-22 | 网娱互动科技(北京)股份有限公司 | 一种帮助企业快速确定市场推广问题的评估方法 |
CN117708351A (zh) * | 2024-02-06 | 2024-03-15 | 国泰新点软件股份有限公司 | 基于深度学习的技术标辅助评审方法、系统及存储介质 |
CN117708351B (zh) * | 2024-02-06 | 2024-04-30 | 国泰新点软件股份有限公司 | 基于深度学习的技术标辅助评审方法、系统及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2017166912A1 (zh) | 商品短文本核心词提取方法和装置 | |
CN108960772A (zh) | 基于深度学习的企业评审辅助方法及系统 | |
Alamsyah et al. | Dynamic large scale data on twitter using sentiment analysis and topic modeling | |
CN109299865A (zh) | 基于语义分析的心理测评系统及方法、信息数据处理终端 | |
CN110334343B (zh) | 一种合同中个人隐私信息抽取的方法和系统 | |
CN104573030A (zh) | 一种文本情绪预测方法及装置 | |
CN111626050A (zh) | 基于表情词典与情感常识的微博情感分析方法 | |
Morris et al. | Slideimages: a dataset for educational image classification | |
Brantner et al. | Content analysis of Twitter: Big data, big studies | |
CN108399238A (zh) | 一种融合文本概念化和网络表示的观点检索系统及方法 | |
CN114239579A (zh) | 基于正则表达式和crf模型的电力可研文档提取方法及装置 | |
CN113360647B (zh) | 一种基于聚类的5g移动业务投诉溯源分析方法 | |
Philemon et al. | A machine learning approach to multi-scale sentiment analysis of amharic online posts | |
Samsir et al. | BERTopic Modeling of Natural Language Processing Abstracts: Thematic Structure and Trajectory | |
CN110019556A (zh) | 一种话题新闻获取方法、装置及其设备 | |
Nguyen et al. | Analyzing customer experience in hotel services using topic modeling | |
Al-Sultany et al. | Enriching tweets for topic modeling via linking to the wikipedia | |
CN109858035A (zh) | 一种情感分类方法、装置、电子设备和可读存储介质 | |
CN115238709A (zh) | 一种政策公告网络评论情感分析方法、系统及设备 | |
CN115269816A (zh) | 基于信息处理方法的核心人员挖掘方法、装置和存储介质 | |
CN111753540B (zh) | 一种对于文本数据进行收集以进行自然语言处理nlp的方法及系统 | |
Xu et al. | Research on Tibetan hot words, sensitive words tracking and public opinion classification | |
Olesen et al. | From Text Mining to Visual Classification: Rethinking Computational New Cinema History with Jean Desmet’s Digitised Business Archive | |
CN115619443A (zh) | 一种基于上市公司年度报告进行情感分析的公司经营预测方法及系统 | |
CN112818122A (zh) | 一种面向对话文本的事件抽取方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181207 |