CN109947951B - 一种可自动更新的用于金融文本分析的情感字典构建方法 - Google Patents
一种可自动更新的用于金融文本分析的情感字典构建方法 Download PDFInfo
- Publication number
- CN109947951B CN109947951B CN201910209985.1A CN201910209985A CN109947951B CN 109947951 B CN109947951 B CN 109947951B CN 201910209985 A CN201910209985 A CN 201910209985A CN 109947951 B CN109947951 B CN 109947951B
- Authority
- CN
- China
- Prior art keywords
- emotion
- dictionary
- words
- word
- negative
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 204
- 238000010276 construction Methods 0.000 title claims abstract description 24
- 238000004458 analytical method Methods 0.000 title claims abstract description 23
- 238000000034 method Methods 0.000 claims abstract description 21
- 230000002996 emotional effect Effects 0.000 claims description 32
- 238000011156 evaluation Methods 0.000 claims description 18
- 230000011218 segmentation Effects 0.000 claims description 18
- 239000003086 colorant Substances 0.000 claims description 7
- 238000012216 screening Methods 0.000 claims description 5
- 230000010354 integration Effects 0.000 claims description 4
- 230000009849 deactivation Effects 0.000 claims description 3
- 241000283690 Bos taurus Species 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 abstract description 8
- 238000000605 extraction Methods 0.000 abstract description 2
- 238000005457 optimization Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 3
- 230000001149 cognitive effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Abstract
本发明公开了一种可自动更新的用于金融文本分析的情感字典构建方法,包括利用知识库中的现有情感词典构成基础词典Dinitial,通过机器添加以及人工添加的方式扩展基础情感词典,得到扩展情感词典Dextend,通过计算前后缀信息熵提高提取新词的准确性,然后利用朴素贝叶斯分类器和情感倾向概率对语料库中提取的新词进行概率计算,通过设置阀值将满足条件的具有正向或负向情感的情感词添加到情感词典中。同现有技术相比有如下优点:(1)新词提取更为准确,减少噪音和后续计算量;(2)情感分析计算量小,通过参数优化,可以得到更为准确的情感分析结果;(3)情感词典可根据需要不断更新,从而提高了基于情感词典的金融文本情感分析方法的准确性。
Description
技术领域
本发明属于文本情感分析和观点挖掘技术领域,具体是一种用于金融文本分析的情感词典构建方法。
背景技术
投资者的情绪变化对其投资决策的影响巨大。大部分中小投资者的投资情绪易受社会舆论以及其他投资者的言论所左右。因此量化地计算分析投资者对个股以及各个板块的情绪值显得尤其重要,它能为投资者进行投资决策提供参考,亦能作为选股因子构建模型进行量化交易。因此,分析投资者情绪成为日前日趋重要的一个研究领域。
通过分析互联网上各种对有关金融市场的评论文本,可以有效地获得投资者对当下市场的看法,当前情感分析技术可以分为两类,一类是基于机器学习的方法,另一类是基于情感词典的方法。现有技术中中文情感词典的构建方法大致可以分为三类,一是基于知识库的构建方法,主要是在当前普遍认可的知网(Hownet)情感词典、台湾大学简体中文情感极性词典(NTUSD)等中文情感词典的基础上,通过词语扩展、统计词频等方法进行构建;二是基于语料库方法,常见的有SO-PMI法等;三是知识库与语料库结合方法。然而,由于中文与英文的先天差异、中文语言分析工具不够成熟,以及生硬地照搬英文分析模型等原因,中文情感词典质量较差。此外,金融领域发展迅猛,大量新词、热词不断涌现,这使得基于传统情感词典的文本分析结果缺少准确性。因此为了更好地分析互联网上金融相关的语料,构建一个包含金融领域特定词语,并且可以准确分析新词,自动更新的情感词典必不可少。本发明提供一种可自动更新的用于金融文本分析的情感词典构建方法。
发明内容
本发明的目的是提供一种可自动更新的用于金融文本分析的情感字典构建方法,其构建的词典可以用于金融文本语料的情感分析。
本发明所提供的情感词典构建方法具体如下:
步骤1、构建基础情感词典。整合现有的情感词典,本发明采用目前得到广泛认可的知网(Hownet)情感词典和台湾大学简体中文情感极性词典(NTUSD)。其中知网(Hownet)情感词典包含的中文情感词典有:正面情感词语、正面评价词语、负面情感词语、负面评价词语、程度级别词语和主张词语。台湾大学简体中文情感极性词典包括:ntusd-negative和ntusd-positive两个情感词典。具体整合方法为将知网(Hownet)里面的正面评价词语、正面情感词语和ntusd的positive词典合并去重得到正向情感词典,将知网(Hownet)里面的负面评价词语、负面情感词语和ntusd的negative词典合并去重得到负向情感词典,由上述正向情感词典和负向情感词典构成基础情感词典Dinitial。
步骤2、扩展基础情感词典。一是利用现有同义词词库对基础情感词典中情感词进行同义词扩展,现有同义词词库可以是《同义词词林》和/或《哈工大同义词词林拓展版》;二是人工添加具有情感色彩的网络新兴词汇;三是人工添加金融领域具有情感色彩的非情感词,如“三只乌鸦”、“直线拉升”等,得到扩展情感词典Dextend。
步骤3、提取待分析词语Nword。运用互联网工具抓取一定量金融文本语料。(1)运用互联网工具进行分词、去停用词、去噪等,得到分词语段库,去除扩展情感词典Dextend中已经包含的词语、转折词、程度词以及非中文字符,采用词频法对所有词汇统计词频,并按词频由高到低排序,选取词频数大于N(N>0)的词语,然后,利用公式1计算每个语段的前缀和后缀的信息熵,设定信息熵阈值I,保留前缀和后缀信息熵都大于该阈值的语段,作为待分析词语Nword;
其中w为语块,a为其前(后)缀,c为频数,然后根据具体计算结果,选取筛选效果理想(即识别为自然词汇相对准确)的数值作为信息熵阈值,优选信息熵阈值I>0.8。
(2)在语料库中对Nword的邻近词(语段距离<m,0<m<8)进行频率排序,提取k个频率最高的词语,利用扩展情感词典Dextend。确定k个频率最高词语中正向情感词的个数k正,负向情感词的个数k负。
上述分词工具可以是中国科学院的ICTCLAS汉语分词系统、盘古分词、庖丁解牛、Jie分词等中的一种;m优选范围为[4,8]。
步骤4、建立正向语料库和负向语料库。基于现有情感词典,对步骤3收集的金融文本语料进行情感分析,创建正向语料库和负向语料库,其中现有情感词典为扩展情感词典或上次更新的情感词典Dhistory。
步骤5、计算待分析词语Nword的情感概率S。首先利用公式2、3计算待分析词语Nword同正向语料库的相关性概率Pa正,同负向语料库的相关性概率Pa负;然后利用公式4、5计算待分析词语Nword的情感倾向概率Pb正和Pb负;利用公式6、7分别计算待分析词Nword的正向情感P正和负向情感的概率P负;最后利用公式8计算待分析词语Nword的情感概率S。
P正=α*Pa正+β*Pb正 公式6
P负=α*Pa负+β*Pb负 公式7
S=P正-P负 公式8
其中,α+β=1,α≥0,β≥0。α、β的取值范围为[0.2,0.8],优选为α=[0.55,0.75],β=[0.25,0.45]。
步骤6、筛选结果,更新情感词典。
当S>0并且时,确定该待分析词Nword为正向情感词,当S<0并且时,确定该待分析词Nword为负向情感词,将上述满足条件的情感词词语自动添加到情感词典中,完成情感词典的自动更新,得到最新的情感词典Dupdate。
本发明所述情感词典构建方法利用知识库中的现有情感词典构成基础词典Dinitial,通过机器添加以及人工添加的方式扩展基础情感词典,得到扩展情感词典Dextend,通过计算前后缀信息熵提高提取新词的准确性,然后利用朴素贝叶斯分类器和情感倾向概率对语料库中提取的新词进行概率计算,通过设置阀值将满足条件的具有正向或负向情感的情感词添加到情感词典中。结果表明,同现有技术已有的情感词典构建方法相比有如下优点:(1)新词提取更为准确,减少噪音和后续计算量;(2)情感分析计算量小,通过参数优化,可以得到更为准确的情感分析结果;(3)情感词典可根据需要不断更新,从而提高了基于情感词典的金融文本情感分析方法的准确性。
附图说明
图1是本发明情感词典构建流程示意图;
图2是本发明情感词典构建程序中识别词汇部分程序。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干调整和改进。这些都属于本发明的保护范围。
图1、图2分别是本发明情感词典构建流程示意图和本发明情感词典构建程序中识别词汇部分程序。基于本发明的技术框架,现提供以下三个实施例加以进一步说明:
实施例1
步骤1、构建基础情感词典。整合现有的情感词典,本发明采用目前得到广泛认可的知网(Hownet)情感词典和台湾大学简体中文情感极性词典(NTUSD)。其中知网(Hownet)情感词典包含的中文情感词典有:正面情感词语、正面评价词语、负面情感词语、负面评价词语、程度级别词语和主张词语。台湾大学简体中文情感极性词典包括:ntusd-negative和ntusd-positive两个情感词典。具体整合方法为将知网(Hownet)里面的正面评价词语、正面情感词语和ntusd的positive词典合并去重得到正向情感词典,将知网(Hownet)里面的负面评价词语、负面情感词语和ntusd的negative词典合并去重得到负向情感词典,由上述正向情感词典和负向情感词典构成基础情感词典Dinitial。
步骤2、扩展基础情感词典。一是利用现有同义词词库对基础情感词典中情感词进行同义词扩展,现有同义词词库可以是《同义词词林》和/或《哈工大同义词词林拓展版》;二是人工添加具有情感色彩的网络新兴词汇;三是人工添加金融领域具有情感色彩的非情感词,如“三只乌鸦”、“直线拉升”等,得到扩展情感词典Dextend。
步骤3、提取待分析词语Nword。运用爬虫工具从股吧随机抓取2000篇2017年1月1日至2017年12月31日公布的金融文本语料,构成语料库C。(1)运用中国科学院的ICTCLAS汉语分词系统进行分词、去停用词、去噪等,得到分词语段库,去除扩展情感词典Dextend中已经包含的词语、转折词、程度词以及非中文字符,采用词频法对所有词汇统计词频,并按词频由高到低排序,选取词频数大于5的词语,然后,利用公式1计算每个语段的前缀和后缀的信息熵,设定信息熵阈值I,保留前缀和后缀信息熵都大于该阈值的语段,作为待分析词语Nword;
其中w为语块,a为其前(后)缀,c为频数,信息熵阈值I=1.1。
(2)在语料库C中对Nword的邻近词(语段距离≤6)进行频率排序,提取k个频率最高的词语,利用扩展情感词典Dextend。确定k个频率最高词语中正向情感词的个数k正,负向情感词的个数k负。
步骤4、建立正向语料库和负向语料库。基于现有情感词典,对步骤3收集的金融文本语料库C进行情感分析,创建正向语料库C正和负向语料库C负,其中现有情感词典为扩展情感词典Dextend。
步骤5、计算待分析词语Nword的情感概率S。首先利用公式2、3计算待分析词语Nword同正向语料库的相关性概率Pa正,同负向语料库的相关性概率Pa负;然后利用公式4、5计算待分析词语Nword的情感倾向概率Pb正和Pb负;利用公式6、7分别计算待分析词Nword的正向情感P正和负向情感的概率P负;最后利用公式8计算待分析词语Nword的情感概率S。
P正=α*Pa正+β*Pb正 公式6
P负=α*Pa负+β*Pb负 公式7
S=P正-P负 公式8
其中,α=0.5,β=0.5。
步骤6、筛选结果,更新情感词典。
当S>0并且时,确定该待分析词Nword为正向情感词,当S<0并且时,确定该待分析词Nword为负向情感词,将上述满足条件的情感词词语自动添加到情感词典中,完成情感词典的自动更新,得到更新后的情感词典Dupdate-1。
实施例2
采用与实施例1同样的流程构建情感词典,不同之处在于α=0.6,β=0.4,最终得到情感词典Dupdate-2。
实施例3
步骤1、构建基础情感词典。整合现有的情感词典,本发明采用目前得到广泛认可的知网(Hownet)情感词典和台湾大学简体中文情感极性词典(NTUSD)。其中知网(Hownet)情感词典包含的中文情感词典有:正面情感词语、正面评价词语、负面情感词语、负面评价词语、程度级别词语和主张词语。台湾大学简体中文情感极性词典包括:ntusd-negative和ntusd-positive两个情感词典。具体整合方法为将知网(Hownet)里面的正面评价词语、正面情感词语和ntusd的positive词典合并去重得到正向情感词典,将知网(Hownet)里面的负面评价词语、负面情感词语和ntusd的negative词典合并去重得到负向情感词典,由上述正向情感词典和负向情感词典构成基础情感词典Dinitial。
步骤2、扩展基础情感词典。一是利用现有同义词词库对基础情感词典中情感词进行同义词扩展,现有同义词词库可以是《同义词词林》和/或《哈工大同义词词林拓展版》;二是人工添加具有情感色彩的网络新兴词汇;三是人工添加金融领域具有情感色彩的非情感词,如“三只乌鸦”、“直线拉升”等,得到扩展情感词典Dextend。
步骤3、提取待分析词语Nword。运用爬虫工具从股吧随机抓取2000篇2017年1月1日至2017年12月31日公布的金融文本语料,构成语料库C。运用中国科学院的ICTCLAS汉语分词系统进行分词、去停用词、去噪等,得到分词语段库,去除扩展情感词典Dextend中已经包含的词语、转折词、程度词以及非中文字符,采用词频法对所有词汇统计词频,并按词频由高到低排序,选取词频数大于5的词语,然后,利用公式1计算每个语段的前缀和后缀的信息熵,设定信息熵阈值I,保留前缀和后缀信息熵都大于该阈值的语段,作为待分析词语Nword;
其中w为语块,a为其前(后)缀,c为频数,信息熵阈值I=1.1。
步骤4、建立正向语料库和负向语料库。基于现有情感词典,对步骤3收集的金融文本语料库C进行情感分析,创建正向语料库C正和负向语料库C负,其中现有情感词典为扩展情感词典Dextend。
步骤5、计算待分析词语Nword的情感概率S。首先利用公式2、3计算待分析词语Nword同正向语料库的相关性概率Pa正,同负向语料库的相关性概率Pa负;然后利用公式9计算待分析词语Nword的情感概率S。
S=Pa正-Pa负 公式9
步骤6、筛选结果,更新情感词典。
当S>0并且时,确定该待分析词Nword为正向情感词,当S<0并且时,确定该待分析词Nword为负向情感词,将上述满足条件的情感词词语自动添加到情感词典中,完成情感词典的自动更新,得到更新后的情感词典Dupdate-3。
本发明采用准确率Rp、召回率Rr、F值对上文所述构建方法进行。其中准确率是衡量情感判断的正确率,召回率是对于整体语料库样本的,表示的是语料库样本中正确情感词被预测到的比例,具体计算方法如下:
评价结果如表1所示:
表1基于实施例1~3所述算法词语情感倾向判断
由此可见,本发明所述构建方法对新词判断的准确性得到了提高。
Claims (9)
1.一种可自动更新的用于金融文本分析的情感字典构建方法,其特征在于采用以下步骤:
步骤1、构建基础情感词典:整合现有的情感词典,将现有词典中的正面评价词语、正面情感词语合并去重分别得到正向情感词典和负向情感词典,由上述正向情感词典和负向情感词典构成基础情感词典Dinitial;
步骤2、扩展基础情感词典:一是利用现有同义词词库对基础情感词典中情感词进行同义词扩展,二是人工添加具有情感色彩的网络新兴词汇,三是人工添加金融领域具有情感色彩的非情感词,得到扩展情感词典Dextend;
步骤3、提取待分析词语Nword:运用互联网工具抓取一定量金融文本语料,(1)运用互联网工具进行分词、去停用词、去噪,得到分词语段库,去除扩展情感词典Dextend中已经包含的词语、转折词、程度词以及非中文字符,采用词频法对所有词汇统计词频,并按词频由高到低排序,选取词频数大于N的词语,然后,利用公式1计算每个语段的前缀和后缀的信息熵,设定信息熵阈值I,保留前缀和后缀信息熵都大于该阈值的语段,作为待分析词语Nword;
其中w为语块,a为其前缀或后缀,c为频数,n为待分析语块w出现的总频数,ai为第i个前缀或后缀;
(2)在语料库中对Nword的邻近词进行频率排序,所述邻近词指的是语段距离<m,其中0<m<8,提取k个频率最高的词语,利用扩展情感词典Dextend,确定k个频率最高词语中正向情感词的个数k正,负向情感词的个数k负;
步骤4、建立正向语料库和负向语料库:基于现有情感词典,对步骤3收集的金融文本语料进行情感分析,创建正向语料库和负向语料库,其中现有情感词典为扩展情感词典或上次更新的情感词典Dhistory;
步骤5、计算待分析词语Nword的情感概率S:首先利用公式2、3计算待分析词语Nword同正向语料库的相关性概率Pa正,同负向语料库的相关性概率Pa负;然后利用公式4、5计算待分析词语Nword的情感倾向概率Pb正和Pb负;利用公式6、7分别计算待分析词Nword的正向情感P正和负向情感的概率P负;最后利用公式8计算待分析词语Nword的情感概率S;
P正=α*Pa正+β*Pb,正 公式6
P负=α*Pa负+β*Pb负 公式7
S=P正-P负 公式8
其中,α+β=1,α≥0,β≥0;
2.根据权利要求1所述情感字典构建方法,其特征在于:步骤1所用现有情感词典为知网(Hownet)情感词典和台湾大学简体中文情感极性词典(NTUSD),其中知网(Hownet)情感词典包含的中文情感词典有:正面情感词语、正面评价词语、负面情感词语、负面评价词语、程度级别词语和主张词语;台湾大学简体中文情感极性词典包括:ntusd-negative和ntusd-positive两个情感词典;具体整合方法为将知网(Hownet)里面的正面评价词语、正面情感词语和ntusd的positive词典合并去重得到正向情感词典,将知网(Hownet)里面的负面评价词语、负面情感词语和ntusd的negative词典合并去重得到负向情感词典。
3.根据权利要求1所述情感字典构建方法,其特征在于:步骤2中现有同义词词库可以是《同义词词林》和/或《哈工大同义词词林拓展版》。
4.根据权利要求1所述情感字典构建方法,其特征在于:步骤3中分词工具是中国科学院的ICTCLAS汉语分词系统、盘古分词、庖丁解牛、Jie分词中的一种。
5.根据权利要求4所述情感字典构建方法,其特征在于:步骤3中信息熵阈值I>0.8,m范围为[4,8]。
6.根据权利要求1所述情感字典构建方法,其特征在于:步骤5中α、β的取值范围为[0.2,0.8]。
7.根据权利要求6所述情感字典构建方法,其特征在于:α=[0.55,0.75],β=[0.25,0.45]。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910209985.1A CN109947951B (zh) | 2019-03-19 | 2019-03-19 | 一种可自动更新的用于金融文本分析的情感字典构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910209985.1A CN109947951B (zh) | 2019-03-19 | 2019-03-19 | 一种可自动更新的用于金融文本分析的情感字典构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109947951A CN109947951A (zh) | 2019-06-28 |
CN109947951B true CN109947951B (zh) | 2020-12-22 |
Family
ID=67010405
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910209985.1A Expired - Fee Related CN109947951B (zh) | 2019-03-19 | 2019-03-19 | 一种可自动更新的用于金融文本分析的情感字典构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109947951B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110069780B (zh) * | 2019-04-19 | 2021-11-19 | 中译语通科技股份有限公司 | 一种基于特定领域文本的情感词识别方法 |
CN110399595B (zh) * | 2019-07-31 | 2024-04-05 | 腾讯科技(成都)有限公司 | 一种文本信息标注的方法以及相关装置 |
CN110991167B (zh) * | 2019-12-05 | 2021-10-08 | 北京理工大学 | 一种基于情感层次体系的情感词典构建方法 |
CN111767399B (zh) * | 2020-06-30 | 2022-12-06 | 深圳平安智慧医健科技有限公司 | 一种基于不均衡文本集的情感分类器构建方法、装置、设备和介质 |
CN112417256A (zh) * | 2020-10-20 | 2021-02-26 | 中国环境科学研究院 | 一种基于互联网的自然保护地认知评价系统及方法 |
CN113326694B (zh) * | 2021-05-18 | 2022-09-30 | 西华大学 | 基于情感传播的隐式情感词典生成方法 |
CN115269852A (zh) * | 2022-08-08 | 2022-11-01 | 浙江浙蕨科技有限公司 | 一种舆情分析方法、系统及存储介质 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007018234A (ja) * | 2005-07-07 | 2007-01-25 | National Institute Of Information & Communication Technology | 感情表現語句辞書自動生成方法及び装置、並びにテキストに対する感情尺度評価値自動付与方法及び装置 |
JP5717549B2 (ja) * | 2011-06-10 | 2015-05-13 | 株式会社野村総合研究所 | 感性分析システム及びプログラム |
KR101346115B1 (ko) * | 2012-02-09 | 2013-12-31 | 고민수 | 감정 어휘 사전 생성 및 이를 이용한 문서의 감정 강도 계산 시스템 및 방법 |
CN102663139B (zh) * | 2012-05-07 | 2013-04-03 | 苏州大学 | 一种情感词典构建方法及系统 |
JP6289989B2 (ja) * | 2014-04-28 | 2018-03-07 | Kddi株式会社 | 商品に対するユーザの感情分析装置及びプログラム |
JP2016197292A (ja) * | 2015-04-02 | 2016-11-24 | 日本電信電話株式会社 | 感情特定方法、感情特定装置、及びプログラム |
CN105138506B (zh) * | 2015-07-09 | 2018-07-03 | 天云融创数据科技(北京)有限公司 | 一种金融文本情感分析方法 |
CN105022725B (zh) * | 2015-07-10 | 2018-04-20 | 河海大学 | 一种应用于金融Web领域的文本情感倾向分析方法 |
CN105893582B (zh) * | 2016-04-01 | 2019-06-28 | 深圳市未来媒体技术研究院 | 一种社交网络用户情绪判别方法 |
CN107169142A (zh) * | 2017-06-15 | 2017-09-15 | 厦门快商通科技股份有限公司 | 一种自动更新的文档情感分析系统及方法 |
-
2019
- 2019-03-19 CN CN201910209985.1A patent/CN109947951B/zh not_active Expired - Fee Related
Non-Patent Citations (2)
Title |
---|
"产生式规则库的求精研究";孙运传、别荣芳;《北京师范大学学报(自然科学版)》;20030830;第39卷(第4期);第435-443页 * |
"语义网络求精方法研究";孙运传、别荣芳;《北京大学学报(自然科学版)》;20050228;第41卷(第1期);第18-20页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109947951A (zh) | 2019-06-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109947951B (zh) | 一种可自动更新的用于金融文本分析的情感字典构建方法 | |
CN109299480B (zh) | 基于上下文语境的术语翻译方法及装置 | |
CN107092596B (zh) | 基于attention CNNs和CCR的文本情感分析方法 | |
CN110297988B (zh) | 基于加权LDA和改进Single-Pass聚类算法的热点话题检测方法 | |
CN108845982B (zh) | 一种基于词的关联特征的中文分词方法 | |
CN109670041A (zh) | 一种基于双通道文本卷积神经网络的带噪非法短文本识别方法 | |
CN107239439A (zh) | 基于word2vec的舆情倾向性分析方法 | |
CN105095190B (zh) | 一种基于中文语义结构和细分词库结合的情感分析方法 | |
CN107688630B (zh) | 一种基于语义的弱监督微博多情感词典扩充方法 | |
CN102063424A (zh) | 一种中文分词方法 | |
CN108363784A (zh) | 一种基于文本机器学习的舆情走向预测方法 | |
CN112307153A (zh) | 一种产业知识库自动构建方法、装置及存储介质 | |
CN104850617A (zh) | 短文本处理方法及装置 | |
CN108363691A (zh) | 一种用于电力95598工单的领域术语识别系统及方法 | |
CN108335210A (zh) | 一种基于舆论数据的股票异动分析方法 | |
CN110674296A (zh) | 一种基于关键词的资讯摘要提取方法及系统 | |
CN105718444B (zh) | 基于新闻语料的金融概念对应股票关联方法及其装置 | |
CN107967337A (zh) | 一种基于情感极性增强语义的跨领域情感分析方法 | |
CN107451116A (zh) | 一种移动应用内生大数据统计分析方法 | |
CN112632969B (zh) | 一种增量式行业词典更新方法和系统 | |
CN111339753B (zh) | 一种自适应中文新词识别方法与系统 | |
CN111460147B (zh) | 一种基于语义增强的标题短文本分类方法 | |
CN111339403B (zh) | 一种基于商品评论新词提取方法 | |
CN115858787B (zh) | 一种基于公路运输中问题诉求信息的热点提取和挖掘方法 | |
CN103886097A (zh) | 基于自适应提升算法的中文微博观点句识别特征的提取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20201222 |
|
CF01 | Termination of patent right due to non-payment of annual fee |