CN109977414B - 一种互联网金融平台用户评论主题分析系统及方法 - Google Patents
一种互联网金融平台用户评论主题分析系统及方法 Download PDFInfo
- Publication number
- CN109977414B CN109977414B CN201910256768.8A CN201910256768A CN109977414B CN 109977414 B CN109977414 B CN 109977414B CN 201910256768 A CN201910256768 A CN 201910256768A CN 109977414 B CN109977414 B CN 109977414B
- Authority
- CN
- China
- Prior art keywords
- comment
- user
- financial
- theme
- impression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种互联网金融平台用户评论主题分析系统及方法,涉及自然语言处理领域;分析系统包括数据采集模块、金融词向量学习模块、评论主题生成模块、用户评论分类模块和评论主题更新模块;分析方法所述方法利用金融论坛中平台用户印象聚类生成用户评论主题,基于用户评论主题对互联网金融平台相关用户评论进行分析,并定期对评论主题进行更新。本发明不需要进行长期人工干预,借助互联网中易于获取的用户知识实现稳定的互联网金融平台评论分析及主题提取,分析获得的评论主题较有代表性,从而可以通过分析结果帮助用户更直观了解该互联网金融平台。
Description
技术领域
本发明涉及自然语言处理领域,尤其涉及一种基于用户印象的互联网金融平台用户评论主题分析系统及方法。
背景技术
近年来随着互联网技术的发展和普及,传统金融机构与互联网企业结合,利用互联网技术提供金融相关服务,以互联网为平台开展各类金融活动,各类p2p,众筹,第三方支付,网贷,理财等金融平台相继涌现。“门槛低、收益高、投资周期短、风险小等”铺天盖地的营销文案吸引普通投资者纷纷投入到互联网金融的浪潮中。这些金融平台丰富了大众投资渠道的同时,也相应的带来了极大的风险。许多问题平台注销、跑路,致使普通投资者血本无归,给社会造成巨大不良影响。
通过对互联网金融平台的用户评论分析,可以帮助投资者对平台情况有更加全面公正的了解,辅助投资者进行决策,降低投资风险。
目前常见的评论分析技术有情感分析、评论观点提取分析等。情感分析通过情感词典或机器学习等算法分析用户评论内容的情感极性,通常分为正面、负面、中立三类情感极性,无法给出对平台情况的描述。评论观点提取分析方法主要有基于规则的提取、基于LDA模型的主题分析、基于聚类的算法等。在基于规则的观点提取方法中,归纳观点陈述句的固定的句式结构规则,通过句法分析工具以及规则可以简单有效地抽取到评论观点。但人工总结规则的方式,无法涵盖所有的观点表述方式。并且,这种方法仅对陈述句有效,而中文中有多种句式表达方式。对于以LDA为代表的主题模型和以K-means为代表的传统聚类方法,方法比较成熟,效果也得到了很多场景的验证。但是这类方法直接从用户评论中挖掘主题,主题受评论数据的影响较大,得到的主题没有直观的主题含义,且不能涵盖有助于全面有效了解金融平台整体情况的主题视角。
因此如何高效地对金融平台用户评论进行分析,提取有代表性的用户评论主题是目前需要解决的问题。
发明内容
本发明的目的在于提供一种互联网金融平台用户评论主题分析系统和方法,从而解决现有技术中存在的前述问题。
为了实现上述目的,本发明采用的技术方案如下:
一种互联网金融平台用户评论主题分析系统,包括数据采集模块、金融词向量学习模块、评论主题生成模块、用户评论分类模块和评论主题更新模块,所述数据采集模块采集金融类新闻报道、用户评论和用户印象,并将其汇总后入库;
所述金融词向量学习模块是基于金融平台评论和金融新闻等数据学习金融领域词向量,并定期更新,为金融平台用户评论分析提供基础支撑;
所述评论主题生成模块主要基于用户印象采集模块采集到的用户印象进行相似聚类后得到一系列类簇,作为评论主题t,主题下的用户印象集合记为M;
所述用户评论分类模块主要负责对用户评论进行依存句法分析,对每条评论提取评论的代表短语集合,利用集合中的短语计算评论与每个主题的相似度,发现评论内容所属主题;
所述评论主题更新模块主要负责定期采集金融论坛上新增用户印象,与已有主题去重后,聚类生成新的评论主题,并将其添加到评论主题生成模块中得到的主题集合中。
本发明的另一个目的是提供一种互联网金融平台用户评论主题分析方法,包括以下步骤:
S1,使用金融平台评论和金融新闻等数据学习金融领域词向量,并定期更新,为金融平台用户评论分析提供基础支撑;
S2,采集互联网金融平台用户印象,聚类相似印象生成评论主题;
S3,基于步骤S2所得评论主题,对互联网金融平台用户评论进行分类分析;
S4,定期采集金融论坛上新增用户印象,聚类生成新的用户评论主题集合Dnew(ti,Mi),更新用户评论主题集合D(ti,Mi),并对“其它”主题下评论重新分类。
优选地,步骤S1具体包括:
S101,利用网络爬虫采集金融论坛上用户对于金融平台的评论数据、互联网中的金融相关的文本数据;
S102,将S101采集的文本数据进行分词后作为数据集,使用词向量模型学习得到词语在金融领域的分布式词向量集合V;
S103,定期使用词向量模型重新学习更新词向量,已有的词向量集合V可作为初始值和金融数据一起输入到模型中进行学习。
优选地,步骤S2具体包括:
S201,利用网络爬虫采集金融论坛上用户对于平台的用户印象数据;
S202,将S201所述采集到的用户印象进行数据清洗;
S203,将所有用户印象进行相似聚类,得到多个用户印象类簇,作为评论主题;
S204,为S203中得到的评论主题或用户印象类簇选取一个用户印象作为评论主题的代表印象。
优选地,步骤S202中所述数据清洗主要是清除用户印象中包含的无用的字符、表情符以及特殊字符。
优选地,步骤S203中所述聚类的方法包括但不限于层次聚类、k均值聚类和single-pass聚类。
优选地,步骤S3具体包括:
S301,利用自然语言处理工具对采集得到的金融平台的用户评论进行依存句法分析,得到评论文本中词语间的依赖关系类型;选定特定依存关系类型的词语组合作为评论的代表短语,从而得到每条评论di的代表短语集合Ci
优选地,步骤S302中具体包括:
优选地,步骤S4具体包括:
S401,利用网络爬虫,定期采集金融论坛上新增用户印象,记为新增用户印象集合Mnew;
S402,对步骤S401采集到的新增用户印象去重,并更新新增用户印象集合Mnew;
S403,对Mnew进行相似聚类,得到多个用户印象类簇,生成新的评论主题Dnew(ti,Mi),具体算法步骤按照步骤S203、S204执行;
S404,将新的评论主题Dnew(ti,Mi)添加到评论主题集合D(ti,Mi)中;
S405,基于Dnew(ti,Mi),重新对“其它”主题下的用户评论进行分类,具体算法过程按照步骤S301、S302、S303执行。
优选地,步骤S4具体包括:采用余弦相似度,计算新增用户印象ml与已有评论主题集合D(ti,Mi)中的所有主题ti的相似度sli,若max(sli)大于设定阈值,则删除该用户印象。
本发明的有益效果是:
本发明给出的用户评论主题分析方法不需要进行长期人工干预,借助互联网中易于获取的用户知识(即用户印象)实现稳定的互联网金融平台评论分析及主题提取,分析获得的评论主题较有代表性,从而可以通过分析结果帮助用户更直观了解该互联网金融平台。
附图说明
图1是基于用户印象的互联网金融平台用户评论主题分析方法流程示意图;
图2是根据采集的用户印象生成评论主题的流程示意图;
图3是基于评论主题的金融平台用户评论分类流程示意图;
图4是评论主题更新及未分类评论重新分类流程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不用于限定本发明。
实施例1
本实施例提供一种互联网金融平台用户评论主题分析系统,包括数据采集模块、金融词向量学习模块、评论主题生成模块、用户评论分类模块和评论主题更新模块,所述数据采集模块采集金融类新闻报道、用户评论和用户印象,并将其汇总后入库;
所述金融词向量学习模块是基于金融平台评论和金融新闻等数据学习金融领域词向量,并定期更新,为金融平台用户评论分析提供基础支撑;
所述评论主题生成模块主要基于用户印象采集模块采集到的用户印象进行相似聚类后得到一系列类簇,作为评论主题t,主题下的用户印象集合记为M;
所述用户评论分类模块主要负责对用户评论进行依存句法分析,对每条评论提取评论的代表短语集合,利用集合中的短语计算评论与每个主题的相似度,发现评论内容所属主题;
所述评论主题更新模块主要负责定期采集金融论坛上新增用户印象,与已有主题去重后,聚类生成新的评论主题,并将其添加到评论主题生成模块中得到的主题集合中。
实施例2
本实施例提供一种互联网金融平台用户评论主题分析方法,包括以下步骤:
S1,使用金融平台评论和金融新闻等数据学习金融领域词向量,并定期更新,为金融平台用户评论分析提供基础支撑;
S2,采集互联网金融平台用户印象,聚类相似印象生成评论主题;
S3,基于S204所得评论主题,对互联网金融平台用户评论进行分类分析;
S4,定期采集金融论坛上新增用户印象,聚类生成新的用户评论主题集合Dnew(ti,Mi),更新用户评论主题集合D(ti,Mi),并对“其它”主题下评论重新分类。
具体的,步骤S1包括:
S101,利用网络爬虫采集金融论坛上用户对于金融平台的评论数据、互联网中的金融相关的文本数据等;
S102,将S101所述文本进行分词后作为数据集,使用词向量模型(word2vec、GloVe、hyperwords等)学习得到词语在金融领域的分布式词向量集合V;
S103,定期使用词向量模型重新学习更新词向量,已有的词向量集合V可作为初始值和金融数据一起输入到模型中进行学习。
具体的,步骤S2包括:
S201,利用网络爬虫采集网贷之家、网贷天眼等金融论坛上用户对于平台的用户印象数据;
S202,将S201所述采集到的用户印象进行数据清洗。步骤S202所述数据清洗主要是清除用户印象中包含的无用的字符、表情符以及特殊字符;
通常会有大量的相似用户印象,比如“收益比较低”、“收益率低”和“利率低”等,可采用多种常用成熟的聚类方法,如层次聚类、k均值聚类、single-pass聚类等,采用余弦距离计算用户印象两两之间和聚类过程中类簇之间的相似度,用户印象使用其包含的全部词语的词向量的均值进行表示。
S204,为S203中得到的评论主题(用户印象类簇)选取一个用户印象作为评论主题的代表印象。
对采集的所有用户印象进行统计,选取每个主题下出现次数最多的用户印象作为评论主题的代表印象。从而得到D(ti,Mi)集合,其中ti为第i个评论主题,Mi为第i个评论主题下的用户印象集合。此步的目的是为了使评价主题更为直观易于理解,可辅助人工进行简单筛选;
本实施例中的聚类方法采用层次聚类的方法,步骤如下:
开始:用户印象mi,可i=1,…,N,将每个用户印象mi视为一个的类簇ui,相似度集合S中存放类簇之间的相似度和相似度所关联的类簇标识。
算法步骤:
1.计算每个类簇两两之间的余弦相似度,加入相似度集合S中;
2.若S中相似度的最大值大于设定阈值,那么将其对应的两个类簇合并为一个新的类簇,将与这两个类簇与其他所有类簇之间的相似度从集合S中删除;否则,执行步骤5。
3.计算上一步骤中生成的新类簇与其他类簇之间的相似度,加入集合S中。返回步骤2,停止聚类过程,将聚类得到的类簇作为评论主题输出。
算法中类簇之间的相似度计算分为两种情况:
a,若类簇中只有一个用户印象,那么将两个印象之间的相似度作为类簇之间的相似度;
b,若类簇中有多个用户印象,那么将两个簇中用户印象之间的相似度的均值作为簇之间的相似度。
具体的,步骤S3具体为:
步骤S301,利用自然语言处理工具对从论坛、贴吧等渠道采集得到的金融平台的用户评论进行依存句法分析,得到评论文本中词语间的依赖关系类型。选定几种特定依存关系类型,若两个词语之间存在该依存关系,则将其组合作为评论的一个代表短语c,从而得到每条评论di的代表短语集合Ci。可使用多种工具对评论进行依存句法分析,因每种工具对依存关系的定义略有不同,以Stanford CoreNLP为例,选取nsubj(名词主语)、advmod(副词修饰)、amod(形容词修饰)、prep(介词修饰)、nn(名词组合形式)、dep(依赖关系)、dobj(直接宾语)等依存关系,使用其他分析工具时根据依存关系的含义进行选取。
具体的,步骤S4包括:
S401,利用网络爬虫,定期采集金融论坛上新增用户印象,记为新增用户印象集合Mnew;
S402,对S401采集到的新增用户印象去重,并更新新增用户印象集合Mnew;采用余弦相似度,计算新增用户印象ml与已有评论主题集合D(ti,Mi)中的所有主题ti的相似度sli,若max(sli)大于设定阈值,则删除该用户印象;
S403,对Mnew进行相似聚类,得到多个用户印象类簇,生成新的评论主题Dnew(ti,Mi),具体算法步骤按照步骤S203、S204执行;
S404,将新的评论主题Dnew(ti,Mi)添加到评论主题集合D(ti,Mi)中;
S405,基于Dnew(ti,Mi),重新对“其它”主题下的用户评论进行分类,具体算法过程按照步骤S301、S302、S303执行。
通过采用本发明公开的上述技术方案,得到了如下有益的效果:
本发明给出的用户评论主题分析方法不需要进行长期人工干预,借助互联网中易于获取的用户知识(即用户印象)实现稳定的互联网金融平台评论分析及主题提取,分析获得的评论主题较有代表性,从而可以通过分析结果帮助用户更直观了解该互联网金融平台。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。
Claims (8)
1.一种互联网金融平台用户评论主题分析方法,其特征在于,基于互联网金融平台用户评论主题分析系统实现,包括数据采集模块、金融词向量学习模块、评论主题生成模块、用户评论分类模块和评论主题更新模块,所述数据采集模块采集金融类新闻报道、用户评论和用户印象,并将其汇总后入库;
所述金融词向量学习模块是基于金融平台评论和金融新闻数据学习金融领域词向量,并定期更新,为金融平台用户评论分析提供基础支撑;
所述评论主题生成模块主要基于用户印象采集模块采集到的用户印象进行相似聚类后得到一系列类簇,作为评论主题,主题下的用户印象集合记为;
所述用户评论分类模块主要负责对用户评论进行依存句法分析,对每条评论提取评论的代表短语集合利用集合中的短语计算评论与每个主题的相似度,发现评论内容所属主题;
所述评论主题更新模块主要负责定期采集金融论坛上新增用户印象,与已有主题去重后,聚类生成新的评论主题,并将其添加到评论主题生成模块中得到的主题集合中;
互联网金融平台用户评论主题分析方法包括以下步骤:
S1,使用金融平台评论和金融新闻数据学习金融领域词向量,并定期更新,为金融平台用户评论分析提供基础支撑;
S2,采集互联网金融平台用户印象,聚类相似印象生成评论主题;
S3,基于步骤S2所得评论主题,对互联网金融平台用户评论进行分类分析;
S4,定期采集金融论坛上新增用户印象,聚类生成新的用户评论主题集合Dnew(ti,Mi),更新用户评论主题集合D(ti,Mi),并对“其它”主题下评论重新分类;其中ti为第i个评论主题,Mi为第i个评论主题下的用户印象集合;
步骤S1具体包括:
S101,利用网络爬虫采集金融论坛上用户对于金融平台的评论数据、互联网中的金融相关的文本数据;
S102,将S101采集的文本数据进行分词后作为数据集,使用词向量模型学习得到词语在金融领域的分布式词向量集合V;
S103,定期使用词向量模型重新学习更新词向量,已有的词向量集合V可作为初始值和金融数据一起输入到模型中进行学习。
2.根据权利要求1所述的互联网金融平台用户评论主题分析方法,其特征在于,步骤S2具体包括:
S201,利用网络爬虫采集金融论坛上用户对于平台的用户印象数据;
S202,将S201所述采集到的用户印象进行数据清洗;
S203,将所有用户印象进行相似聚类,得到多个用户印象类簇,作为评论主题;
S204,为S203中得到的评论主题或用户印象类簇选取一个用户印象作为评论主题的代表印象。
3.根据权利要求2所述的互联网金融平台用户评论主题分析方法,其特征在于,步骤S202中所述数据清洗主要是清除用户印象中包含的无用的字符、表情符以及特殊字符。
4.根据权利要求2所述的互联网金融平台用户评论主题分析方法,其特征在于,步骤S203中所述聚类的方法包括但不限于层次聚类、k均值聚类和single-pass聚类。
7.根据权利要求1所述的互联网金融平台用户评论主题分析方法,其特征在于,步骤S4具体包括:
S401,利用网络爬虫,定期采集金融论坛上新增用户印象,记为新增用户印象集合Mnew;
S402,对步骤S401采集到的新增用户印象去重,并更新新增用户印象集合Mnew;
S403,对Mnew进行相似聚类,得到多个用户印象类簇,生成新的评论主题Dnew(ti,Mi),具体算法步骤按照步骤S203、S204执行;
S404,将新的评论主题Dnew(ti,Mi)添加到评论主题集合D(ti,Mi)中;
S405,基于Dnew(ti,Mi),重新对“其它”主题下的用户评论进行分类,具体算法过程按照步骤S301、S302、S303执行。
8.根据权利要求7所述的互联网金融平台用户评论主题分析方法,其特征在于,步骤S4具体包括:
采用余弦相似度,计算新增用户印象ml与已有评论主题集合D(ti,Mi)中的所有主题ti的相似度sli,若max(sli)大于设定阈值,则删除该用户印象。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910256768.8A CN109977414B (zh) | 2019-04-01 | 2019-04-01 | 一种互联网金融平台用户评论主题分析系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910256768.8A CN109977414B (zh) | 2019-04-01 | 2019-04-01 | 一种互联网金融平台用户评论主题分析系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109977414A CN109977414A (zh) | 2019-07-05 |
CN109977414B true CN109977414B (zh) | 2023-03-14 |
Family
ID=67082139
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910256768.8A Active CN109977414B (zh) | 2019-04-01 | 2019-04-01 | 一种互联网金融平台用户评论主题分析系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109977414B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009187522A (ja) * | 2008-01-11 | 2009-08-20 | Nikon Systems Inc | コンテンツ評価装置 |
CN103399916A (zh) * | 2013-07-31 | 2013-11-20 | 清华大学 | 基于产品特征的互联网评论观点挖掘方法及系统 |
CN103778207A (zh) * | 2014-01-15 | 2014-05-07 | 杭州电子科技大学 | 基于lda的新闻评论的话题挖掘方法 |
CN104199846A (zh) * | 2014-08-08 | 2014-12-10 | 杭州电子科技大学 | 基于维基百科的评论主题词聚类方法 |
CN104268200A (zh) * | 2013-09-22 | 2015-01-07 | 中科嘉速(北京)并行软件有限公司 | 一种基于深度学习的非监督命名实体语义消歧方法 |
CN107229610A (zh) * | 2017-03-17 | 2017-10-03 | 咪咕数字传媒有限公司 | 一种情感数据的分析方法及装置 |
CN108009148A (zh) * | 2017-11-16 | 2018-05-08 | 天津大学 | 基于深度学习的文本情感分类表示方法 |
CN108062304A (zh) * | 2017-12-19 | 2018-05-22 | 北京工业大学 | 一种基于机器学习的商品评论数据的情感分析方法 |
CN108628828A (zh) * | 2018-04-18 | 2018-10-09 | 国家计算机网络与信息安全管理中心 | 一种基于自注意力的观点及其持有者的联合抽取方法 |
CN109284381A (zh) * | 2018-09-27 | 2019-01-29 | 南通大学 | 融合表情符号库和主题模型的方面观点褒贬态度挖掘方法 |
CN109461037A (zh) * | 2018-12-17 | 2019-03-12 | 北京百度网讯科技有限公司 | 评论观点聚类方法、装置和终端 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140379719A1 (en) * | 2013-06-24 | 2014-12-25 | Tencent Technology (Shenzhen) Company Limited | System and method for tagging and searching documents |
-
2019
- 2019-04-01 CN CN201910256768.8A patent/CN109977414B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009187522A (ja) * | 2008-01-11 | 2009-08-20 | Nikon Systems Inc | コンテンツ評価装置 |
CN103399916A (zh) * | 2013-07-31 | 2013-11-20 | 清华大学 | 基于产品特征的互联网评论观点挖掘方法及系统 |
CN104268200A (zh) * | 2013-09-22 | 2015-01-07 | 中科嘉速(北京)并行软件有限公司 | 一种基于深度学习的非监督命名实体语义消歧方法 |
CN103778207A (zh) * | 2014-01-15 | 2014-05-07 | 杭州电子科技大学 | 基于lda的新闻评论的话题挖掘方法 |
CN104199846A (zh) * | 2014-08-08 | 2014-12-10 | 杭州电子科技大学 | 基于维基百科的评论主题词聚类方法 |
CN107229610A (zh) * | 2017-03-17 | 2017-10-03 | 咪咕数字传媒有限公司 | 一种情感数据的分析方法及装置 |
CN108009148A (zh) * | 2017-11-16 | 2018-05-08 | 天津大学 | 基于深度学习的文本情感分类表示方法 |
CN108062304A (zh) * | 2017-12-19 | 2018-05-22 | 北京工业大学 | 一种基于机器学习的商品评论数据的情感分析方法 |
CN108628828A (zh) * | 2018-04-18 | 2018-10-09 | 国家计算机网络与信息安全管理中心 | 一种基于自注意力的观点及其持有者的联合抽取方法 |
CN109284381A (zh) * | 2018-09-27 | 2019-01-29 | 南通大学 | 融合表情符号库和主题模型的方面观点褒贬态度挖掘方法 |
CN109461037A (zh) * | 2018-12-17 | 2019-03-12 | 北京百度网讯科技有限公司 | 评论观点聚类方法、装置和终端 |
Non-Patent Citations (3)
Title |
---|
"基于改进K-means聚类的在线新闻评论主题抽取";夏火松;《情报学报》;20160124;第35卷(第1期);第55-65页 * |
"政府数据开放平台用户评论情感差异分析";刘桂琴;《数字图书馆论坛》;20190225(第2期);第18-23页 * |
"社会信息化情境下用户在线评论数据挖掘模型构建研究――以汽车行业负面观点评论自动抽取系统为例";姜霖;《情报科学》;20160805;第34卷(第8期);第145-149页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109977414A (zh) | 2019-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Arora et al. | Character level embedding with deep convolutional neural network for text normalization of unstructured data for Twitter sentiment analysis | |
Qi et al. | Sentiment analysis using Twitter data: a comparative application of lexicon-and machine-learning-based approach | |
Zhang et al. | Syntax encoding with application in authorship attribution | |
CN109670039B (zh) | 基于三部图和聚类分析的半监督电商评论情感分析方法 | |
Singh et al. | Language identification and named entity recognition in hinglish code mixed tweets | |
CN113962293B (zh) | 一种基于LightGBM分类与表示学习的姓名消歧方法和系统 | |
CN107423440A (zh) | 一种基于情感分析的问答上下文切换与强化选择方法 | |
CN111026866B (zh) | 一种面向领域的文本信息抽取聚类方法、设备和存储介质 | |
Sarkar | Using character n-gram features and multinomial naïve bayes for sentiment polarity detection in Bengali tweets | |
CN109086355A (zh) | 基于新闻主题词的热点关联关系分析方法及系统 | |
Li et al. | Combining sentiment analysis with socialization bias in social networks for stock market trend prediction | |
Murshed et al. | Enhancing big social media data quality for use in short-text topic modeling | |
Remus et al. | Three knowledge-free methods for automatic lexical chain extraction | |
Adler et al. | Real-time claim detection from news articles and retrieval of semantically-similar factchecks | |
Singh et al. | Writing Style Change Detection on Multi-Author Documents. | |
Rehman et al. | User-aware multilingual abusive content detection in social media | |
Boulouard et al. | Machine learning for hate speech detection in arabic social media | |
Pandey et al. | Various aspects of sentiment analysis: a review | |
CN109977414B (zh) | 一种互联网金融平台用户评论主题分析系统及方法 | |
Kaur et al. | News classification using neural networks | |
Ogutu et al. | Target sentiment analysis model with naïve Bayes and support vector machine for product review classification | |
Shahbaz et al. | Sentiment miner: A prototype for sentiment analysis of unstructured data and text | |
Skenduli et al. | Classification and clustering of emotive microblogs in albanian: Two user-oriented tasks | |
Outahajala et al. | Using confidence and informativeness criteria to improve POS-tagging in amazigh | |
Sirajzade et al. | The LuNa Open Toolbox for the Luxembourgish Language |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |