CN112559752A - 一种通用型互联网信息数据挖掘方法 - Google Patents
一种通用型互联网信息数据挖掘方法 Download PDFInfo
- Publication number
- CN112559752A CN112559752A CN202011645558.7A CN202011645558A CN112559752A CN 112559752 A CN112559752 A CN 112559752A CN 202011645558 A CN202011645558 A CN 202011645558A CN 112559752 A CN112559752 A CN 112559752A
- Authority
- CN
- China
- Prior art keywords
- information
- data
- mining
- user
- internet information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及互联网技术领域,尤其为一种通用型互联网信息数据挖掘方法,包括以下步骤:A、建立数据挖掘人机交互模板:预设挖掘需求的关键词输入模板、分类选择项以及自由输入框,然后与互联网信息通用摘要数据库的结构标签相互映射;B、分步检索;C、分步挖掘;D、数据输出:①将获得的热点数据挖掘结果列表输出给用户,②将获得的情感分析结果采用降序方式反馈给用户,将获得的信息有害性判断结果通过数据模型输出给用户。本发明不仅提高了数据挖掘效率,而且同时获得热点数据挖掘结果、情感分析结果以及信息有害性判断结果,并将三种数据分别通过列表、降序反馈、数据模型输出给用户,从而提高了数据挖掘的全面性和安全性。
Description
技术领域
本发明涉及互联网技术领域,具体为一种通用型互联网信息数据挖掘方法。
背景技术
随着移动互联网技术的快速发展,承载在互联网上的信息越来越多,而随着人类对互联网信息和互联网应用的逐渐依赖,人们对于互联网数据挖掘功能(即从大量数据或数据库中提取有用信息)也越来越重视,从而不断改善和提高海量互联网信息的应用效率
但现有的通用型互联网信息数据挖掘方法依然存在一定的问题,具体问题有以下几点:
1、常规的数据挖掘技术是对数据库中的大量数据直接进行抽取、转换、分析等处理,然后从中提取辅助用户决策的关键性数据,但在海量的互联网文字信息中,虽然结构化数据的价值密度最大,但数据量最小;而半结构化网页信息、非结构化(纯文本)信息虽然价值密度最小,但数据量却最大;
2、目前,互联网信息数据中充斥着大量附加信息,例如包括含个人感情倾向的评论信息、无用信息及少量有害信息(黄赌毒等),由于缺乏有效的分析鉴别方法,使得信息挖掘的结果存在片面性和一定的安全隐患。
发明内容
本发明的目的在于提供一种通用型互联网信息数据挖掘方法,具备数据挖掘效率高、全面、安全的优点,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种通用型互联网信息数据挖掘方法,包括以下步骤:
A、建立数据挖掘人机交互模板:预设挖掘需求的关键词输入模板、分类选择项以及自由输入框,然后与互联网信息通用摘要数据库的结构标签相互映射;
B、分步检索:①从关键词输入模板中检索获得所需数据的主题关键词、语用关键词以及语用关键词项下的普通关键词,②从分类选择项中选择用户所需的相关需求或直接向自由输入框中输入特殊需求;
C、分步挖掘:①根据获得的数据挖掘需求关键词和用户选择的挖掘需求,结合互联网信息通用摘要数据库,组成热点主题关键词词典库,②获取评论数据源,对每条评论过滤热点主题关键词对,③对热点主题关键词和相关评论输入相应的情感分析模型,得到不同的情感分析结果,④将热点主题关键词和相关评论输入相应的有害信息分析模型,得到信息有害性判断结果;
D、数据输出:①将获得的热点数据挖掘结果列表输出给用户,②将获得的情感分析结果采用降序方式反馈给用户,将获得的信息有害性判断结果通过数据模型输出给用户。
优选的,所述步骤A中数据挖掘的操作方式包括但不限于数据检索、统计、抽取、分析和相关模型化的自动处理,以及根据历史用户对信息挖掘结果的自动整理。
优选的,所述步骤A中互联网信息通用摘要数据库的结构标签具体指:①统计互联网信息任意主题关键词的常用顶层及下层摘要结构标签及分类集成结果,自动生成包括详细信息链接地址的互联网信息通用摘要数据库结构标签和信息发布通用模板,②在信息发布通用模板上获得由用户自主添加的适用于互联网信息任意主题关键词的顶层及下层摘要结构标签,③根据系统用户使用频率自动调整互联网信息通用摘要数据库及信息发布通用模板结构标签。
优选的,所述步骤C-③中情感分析的步骤如下:
①在热点主题关键词的基础上,加入用户的情感表述规则,评论信息在句子粒度级别的情感分类,②通过对词典库进行统计,针对每个数据特征建立一个情感极性动态变化的子词典,通过对评论信息的上下文语境分析,送代地推断出了评论信息针对对应数据特征的情感分类。
优选的,所述步骤C-④中有害信息分析的步骤如下:
①检索互联网信息通用摘要数据库中的有害信息样本,人工选取若干条作为正样本,再选取若干条其它无害信息的文本作为负样,②对正、负样本进行分词,得到一系列不重复的词汇,③通过MI、IG以及PCA对词汇进行筛选,选取和有害信息分类相关性较大的词汇,④通过反文档词频,计算每个文本在N个词汇上的一个取值,从而得到一个N维的向量,通过M个各自的向量,构建一个N维的数据模型,④在N维空间的数据模型中,使用支持向量机方法在正样本和负样本之间生成一个N-1维的超平面,使得在超平面一侧的为正样本,另外一侧的为负样本,当有一个待判定点在此N维空间中着的时,即可通过判断此点和超平面的位置关系来判断此待测样本是正样本还是负样本。
实施例二
从互联网上获取产品信息和对应的评论热点主题关键词,组成产品-热点主题关键词词典;
获取评论数据源,对每条评论过滤热点主题关键词对,并通过稀疏表示,同时对稀疏矩阵进行热点主题关键词的更新;
对获得的热点主题关键词进行相应的情感分析,得到不同的情感分析;
将得到的情感分析对应相关热点主题关键词通过降序的方式反馈给用户。
进一步,所述步骤(1)的具体步骤如下:
获取产品信息;
对应获取的产品信息,从互联网上获取相关的产品评论热点主题关键词;
将从互联网上获取的相关产品评论热点主题关键词与产品构成产品-热点主题关键词词典。
进一步,所述步骤(2)的具体步骤如下:
从互联网上获取所有的关于相关产品的评论信息;
对每条评论进行过滤,提取出所有评论信息中出现的名词、形容词以及相相应的名词短语;
将提取的名词、形容词以及相应的名词短语在通过稀疏表示;
将提取的名词、形容词以及相应的名词短语对稀疏矩阵进行热点主题关键词的更新。
进一步,所述步骤(23)的具体步骤如下:
获取名词、形容词以及相应的名词短语。
对获取的名词、形容词以及相应的名词短语进行降维处理。
设定误差上界,根据公式x2=argmin||x||1 s.t.||Ax-y||2<=e进行求解。
根据公式min r(y)=||y-A*di(x2)||2进行分类,输出计算后的分类。
进一步,所述步骤(3)的具体步骤如下:
获取热点主题关键词;
在热点主题关键词的基础上,加入用户的情感表述规则,进行评论信息在句子粒度级别的情感分类;
通过对词典库进行统计,针对每个产品特征建立一个情感极性动态变化的词典,通过对评论信息的上下文语境分析,迭代地推断出了所述评论信息针对对应的所述产品特征的情感分类。
实施例三
从运营商核心网采集数据后经过还原、存储得到用户的全量信息;
将移动互联网上的信息中的某一类(例如毒品)文本,进行人工选取若干条作为正样本,再选取若干条其它信息的文本作为负样本;
对已知的信息进行建模,再通过数据挖掘方法对待定信息进行判断。
与现有技术相比,本发明的有益效果如下:
1、通过建立数据挖掘人机交互模板,将挖掘需求与互联网信息通用摘要数据库的结构标签相互映射,便于分步检索,从而提高了数据挖掘效率;
2、通过组建热点主题关键词词典库,获得热点数据挖掘结果,并从评论数据源中过滤热点主题关键词对,再分别输入情感分析模型、有害信息分析模型中获得情感分析结果、信息有害性判断结果,最后将三种数据分别通过列表、降序反馈、数据模型输出给用户,从而提高了数据挖掘的全面性和安全性。
附图说明
图1为本发明的系统流程示意图。
具体实施方式
下面将结合本发明中的实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:
一种通用型互联网信息数据挖掘方法,包括以下步骤:
A、建立数据挖掘人机交互模板:预设挖掘需求的关键词输入模板、分类选择项以及自由输入框,然后与互联网信息通用摘要数据库的结构标签相互映射;
B、分步检索:①从关键词输入模板中检索获得所需数据的主题关键词、语用关键词以及语用关键词项下的普通关键词,②从分类选择项中选择用户所需的相关需求或直接向自由输入框中输入特殊需求;
C、分步挖掘:①根据获得的数据挖掘需求关键词和用户选择的挖掘需求,结合互联网信息通用摘要数据库,组成热点主题关键词词典库,②获取评论数据源,对每条评论过滤热点主题关键词对,③对热点主题关键词和相关评论输入相应的情感分析模型,得到不同的情感分析结果,④将热点主题关键词和相关评论输入相应的有害信息分析模型,得到信息有害性判断结果;
D、数据输出:①将获得的热点数据挖掘结果列表输出给用户,②将获得的情感分析结果采用降序方式反馈给用户,将获得的信息有害性判断结果通过数据模型输出给用户。
步骤A中数据挖掘的操作方式包括但不限于数据检索、统计、抽取、分析和相关模型化的自动处理,以及根据历史用户对信息挖掘结果的自动整理。
步骤A中互联网信息通用摘要数据库的结构标签具体指:①统计互联网信息任意主题关键词的常用顶层及下层摘要结构标签及分类集成结果,自动生成包括详细信息链接地址的互联网信息通用摘要数据库结构标签和信息发布通用模板,②在信息发布通用模板上获得由用户自主添加的适用于互联网信息任意主题关键词的顶层及下层摘要结构标签,③根据系统用户使用频率自动调整互联网信息通用摘要数据库及信息发布通用模板结构标签。
步骤C-③中情感分析的步骤如下:
①在热点主题关键词的基础上,加入用户的情感表述规则,评论信息在句子粒度级别的情感分类,②通过对词典库进行统计,针对每个数据特征建立一个情感极性动态变化的子词典,通过对评论信息的上下文语境分析,送代地推断出了评论信息针对对应数据特征的情感分类。
步骤C-④中有害信息分析的步骤如下:
①检索互联网信息通用摘要数据库中的有害信息样本,人工选取若干条作为正样本,再选取若干条其它无害信息的文本作为负样,②对正、负样本进行分词,得到一系列不重复的词汇,③通过MI、IG以及PCA对词汇进行筛选,选取和有害信息分类相关性较大的词汇,④通过反文档词频,计算每个文本在N个词汇上的一个取值,从而得到一个N维的向量,通过M个各自的向量,构建一个N维的数据模型,④在N维空间的数据模型中,使用支持向量机方法在正样本和负样本之间生成一个N-1维的超平面,使得在超平面一侧的为正样本,另外一侧的为负样本,当有一个待判定点在此N维空间中着的时,即可通过判断此点和超平面的位置关系来判断此待测样本是正样本还是负样本。
实施例二
从互联网上获取产品信息和对应的评论热点主题关键词,组成产品-热点主题关键词词典;
获取评论数据源,对每条评论过滤热点主题关键词对,并通过稀疏表示,同时对稀疏矩阵进行热点主题关键词的更新;
对获得的热点主题关键词进行相应的情感分析,得到不同的情感分析;
将得到的情感分析对应相关热点主题关键词通过降序的方式反馈给用户。
进一步,所述步骤(1)的具体步骤如下:
获取产品信息;
对应获取的产品信息,从互联网上获取相关的产品评论热点主题关键词;
将从互联网上获取的相关产品评论热点主题关键词与产品构成产品-热点主题关键词词典。
进一步,所述步骤(2)的具体步骤如下:
从互联网上获取所有的关于相关产品的评论信息;
对每条评论进行过滤,提取出所有评论信息中出现的名词、形容词以及相相应的名词短语;
将提取的名词、形容词以及相应的名词短语在通过稀疏表示;
将提取的名词、形容词以及相应的名词短语对稀疏矩阵进行热点主题关键词的更新。
进一步,所述步骤(23)的具体步骤如下:
获取名词、形容词以及相应的名词短语。
对获取的名词、形容词以及相应的名词短语进行降维处理。
设定误差上界,根据公式x2=argmin||x||1 s.t.||Ax-y||2<=e进行求解。
根据公式min r(y)=||y-A*di(x2)||2进行分类,输出计算后的分类。
进一步,所述步骤(3)的具体步骤如下:
获取热点主题关键词;
在热点主题关键词的基础上,加入用户的情感表述规则,进行评论信息在句子粒度级别的情感分类;
通过对词典库进行统计,针对每个产品特征建立一个情感极性动态变化的词典,通过对评论信息的上下文语境分析,迭代地推断出了所述评论信息针对对应的所述产品特征的情感分类。
实施例三
从运营商核心网采集数据后经过还原、存储得到用户的全量信息;
将移动互联网上的信息中的某一类(例如毒品)文本,进行人工选取若干条作为正样本,再选取若干条其它信息的文本作为负样本;
对已知的信息进行建模,再通过数据挖掘方法对待定信息进行判断。
通过建立数据挖掘人机交互模板,将挖掘需求与互联网信息通用摘要数据库的结构标签相互映射,便于分步检索,从而提高了数据挖掘效率;
通过组建热点主题关键词词典库,获得热点数据挖掘结果,并从评论数据源中过滤热点主题关键词对,再分别输入情感分析模型、有害信息分析模型中获得情感分析结果、信息有害性判断结果,最后将三种数据分别通过列表、降序反馈、数据模型输出给用户,从而提高了数据挖掘的全面性和安全性。
最后:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (5)
1.一种通用型互联网信息数据挖掘方法,其特征在于:包括以下步骤:
A、建立数据挖掘人机交互模板:预设挖掘需求的关键词输入模板、分类选择项以及自由输入框,然后与互联网信息通用摘要数据库的结构标签相互映射;
B、分步检索:①从关键词输入模板中检索获得所需数据的主题关键词、语用关键词以及语用关键词项下的普通关键词,②从分类选择项中选择用户所需的相关需求或直接向自由输入框中输入特殊需求;
C、分步挖掘:①根据获得的数据挖掘需求关键词和用户选择的挖掘需求,结合互联网信息通用摘要数据库,组成热点主题关键词词典库,②获取评论数据源,对每条评论过滤热点主题关键词对,③对热点主题关键词和相关评论输入相应的情感分析模型,得到不同的情感分析结果,④将热点主题关键词和相关评论输入相应的有害信息分析模型,得到信息有害性判断结果;
D、数据输出:①将获得的热点数据挖掘结果列表输出给用户,②将获得的情感分析结果采用降序方式反馈给用户,将获得的信息有害性判断结果通过数据模型输出给用户。
2.根据权利要求1所述的一种通用型互联网信息数据挖掘方法,其特征在于:所述步骤A中数据挖掘的操作方式包括但不限于数据检索、统计、抽取、分析和相关模型化的自动处理,以及根据历史用户对信息挖掘结果的自动整理。
3.根据权利要求1所述的一种通用型互联网信息数据挖掘方法,其特征在于:所述步骤A中互联网信息通用摘要数据库的结构标签具体指:①统计互联网信息任意主题关键词的常用顶层及下层摘要结构标签及分类集成结果,自动生成包括详细信息链接地址的互联网信息通用摘要数据库结构标签和信息发布通用模板,②在信息发布通用模板上获得由用户自主添加的适用于互联网信息任意主题关键词的顶层及下层摘要结构标签,③根据系统用户使用频率自动调整互联网信息通用摘要数据库及信息发布通用模板结构标签。
4.根据权利要求1所述的一种通用型互联网信息数据挖掘方法,其特征在于:所述步骤C-③中情感分析的步骤如下:
①在热点主题关键词的基础上,加入用户的情感表述规则,评论信息在句子粒度级别的情感分类,②通过对词典库进行统计,针对每个数据特征建立一个情感极性动态变化的子词典,通过对评论信息的上下文语境分析,送代地推断出了评论信息针对对应数据特征的情感分类。
5.根据权利要求1所述的一种通用型互联网信息数据挖掘方法,其特征在于:所述步骤C-④中有害信息分析的步骤如下:
①检索互联网信息通用摘要数据库中的有害信息样本,人工选取若干条作为正样本,再选取若干条其它无害信息的文本作为负样,②对正、负样本进行分词,得到一系列不重复的词汇,③通过MI、IG以及PCA对词汇进行筛选,选取和有害信息分类相关性较大的词汇,④通过反文档词频,计算每个文本在N个词汇上的一个取值,从而得到一个N维的向量,通过M个各自的向量,构建一个N维的数据模型,④在N维空间的数据模型中,使用支持向量机方法在正样本和负样本之间生成一个N-1维的超平面,使得在超平面一侧的为正样本,另外一侧的为负样本,当有一个待判定点在此N维空间中着的时,即可通过判断此点和超平面的位置关系来判断此待测样本是正样本还是负样本。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011645558.7A CN112559752A (zh) | 2020-12-29 | 2020-12-29 | 一种通用型互联网信息数据挖掘方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011645558.7A CN112559752A (zh) | 2020-12-29 | 2020-12-29 | 一种通用型互联网信息数据挖掘方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112559752A true CN112559752A (zh) | 2021-03-26 |
Family
ID=75035113
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011645558.7A Pending CN112559752A (zh) | 2020-12-29 | 2020-12-29 | 一种通用型互联网信息数据挖掘方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112559752A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103116647A (zh) * | 2013-02-27 | 2013-05-22 | 武汉虹旭信息技术有限责任公司 | 基于移动互联网有害信息的数据挖掘系统及其方法 |
CN103970848A (zh) * | 2014-05-01 | 2014-08-06 | 刘莎 | 一种通用型互联网信息数据挖掘方法 |
CN104731946A (zh) * | 2015-04-01 | 2015-06-24 | 成都金税电子技术有限公司 | 一种互联网信息数据挖掘方法 |
US20150319119A1 (en) * | 2014-05-02 | 2015-11-05 | Samsung Electronics Co., Ltd. | Data processing device and data processing method based on user emotion activity |
WO2017092574A1 (zh) * | 2015-12-01 | 2017-06-08 | 慧科讯业有限公司 | 一种基于混合数据类型数据的挖掘方法 |
-
2020
- 2020-12-29 CN CN202011645558.7A patent/CN112559752A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103116647A (zh) * | 2013-02-27 | 2013-05-22 | 武汉虹旭信息技术有限责任公司 | 基于移动互联网有害信息的数据挖掘系统及其方法 |
CN103970848A (zh) * | 2014-05-01 | 2014-08-06 | 刘莎 | 一种通用型互联网信息数据挖掘方法 |
US20150319119A1 (en) * | 2014-05-02 | 2015-11-05 | Samsung Electronics Co., Ltd. | Data processing device and data processing method based on user emotion activity |
CN104731946A (zh) * | 2015-04-01 | 2015-06-24 | 成都金税电子技术有限公司 | 一种互联网信息数据挖掘方法 |
WO2017092574A1 (zh) * | 2015-12-01 | 2017-06-08 | 慧科讯业有限公司 | 一种基于混合数据类型数据的挖掘方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107229610B (zh) | 一种情感数据的分析方法及装置 | |
CN106886580B (zh) | 一种基于深度学习的图片情感极性分析方法 | |
US20180267958A1 (en) | Information extraction from logical document parts using ontology-based micro-models | |
Al-Rubaiee et al. | Identifying Mubasher software products through sentiment analysis of Arabic tweets | |
US20200057810A1 (en) | Information object extraction using combination of classifiers | |
Chawla et al. | Product opinion mining using sentiment analysis on smartphone reviews | |
JP2001075966A (ja) | データ分析システム | |
CN112860896A (zh) | 语料泛化方法及用于工业领域的人机对话情感分析方法 | |
Şeker et al. | Extending a CRF-based named entity recognition model for Turkish well formed text and user generated content 1 | |
Haque et al. | Opinion mining from bangla and phonetic bangla reviews using vectorization methods | |
Hasan et al. | Sentiment classification in bangla textual content: A comparative study | |
Wijayanti et al. | Ensemble approach for sentiment polarity analysis in user-generated Indonesian text | |
Shahade et al. | Multi-lingual opinion mining for social media discourses: An approach using deep learning based hybrid fine-tuned smith algorithm with adam optimizer | |
Fouadi et al. | Applications of deep learning in arabic sentiment analysis: Research perspective | |
CN113361252B (zh) | 基于多模态特征和情感词典的文本抑郁倾向检测系统 | |
CN112632272B (zh) | 基于句法分析的微博情感分类方法和系统 | |
CN113392183A (zh) | 一种儿童范畴图谱知识的表征与计算方法 | |
Agbesi et al. | Multichannel 2D-CNN Attention-Based BiLSTM Method for Low-Resource Ewe Sentiment Analysis | |
Rahman et al. | A dynamic strategy for classifying sentiment from Bengali text by utilizing Word2vector model | |
JP6483789B1 (ja) | 情報解析システム | |
Deshors | Structuring subjectivity in Asian Englishes: Multivariate approaches to mental predicates across genres and functional uses | |
CN112559752A (zh) | 一种通用型互联网信息数据挖掘方法 | |
Sahu et al. | An Emotion based Sentiment Analysis on Twitter Dataset | |
CN109388800B (zh) | 一种基于加窗词向量特征的短文本情感分析方法 | |
Pugsee et al. | Opinion mining for laptop reviews using naïve bayes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |