CN109472470A - 结合深度学习和逻辑规则的企业新闻数据风险分类方法 - Google Patents
结合深度学习和逻辑规则的企业新闻数据风险分类方法 Download PDFInfo
- Publication number
- CN109472470A CN109472470A CN201811239861.XA CN201811239861A CN109472470A CN 109472470 A CN109472470 A CN 109472470A CN 201811239861 A CN201811239861 A CN 201811239861A CN 109472470 A CN109472470 A CN 109472470A
- Authority
- CN
- China
- Prior art keywords
- news
- classification
- sentence
- training
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Entrepreneurship & Innovation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Development Economics (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Educational Administration (AREA)
- Bioinformatics & Computational Biology (AREA)
- Game Theory and Decision Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种结合深度学习和逻辑规则的企业新闻数据风险分类方法,包括如下步骤:从新闻材料中提取出含有确定企业相关属性的句子;将含有相关属性的句子输入CNN句子分类模型中,得到每个句子的句子分类;将每个句子分类分别进行加权处理,得到当前新闻的新闻分类;将新闻材料以篇为单位输入Bi‑LSTM文章情感分类模型中,得到每篇新闻的情感倾向值;结合每篇新闻的新闻分类和情感倾向值,得到每篇新闻的新闻风险类别;本发明通过结合CNN句子分类模型与Bi‑LSTM文章情感分类模型对新闻数据风险类别进行预测,可更加准确地预测新闻中企业主体的风险信息,准确性更高。
Description
技术领域
本发明属于数据处理技术领域,具体涉及一种结合深度学习和逻辑规则的企业新闻数据风险分类方法。
背景技术
目前,最新技术有大量的文本分类模型和情感分析模型,其算法都相对较为成熟。现有的文本分类模型和情感分析模型为相互独立的算法。其中文本分类模型采用的主流算法有Bi-LSTM算法和CNN、FastText算法,都可以是基于字符、基于词的针对整篇新闻作为训练语料数据,由于其针对全文作为训练语料,那么对于特定的一篇新闻文章只有一个分类,但是当新闻中出现多个公司主体时,在事实上对于不同的公司主体来说可能具有不同的分类。例如,某篇新闻内容描述了公司A的负面信息和公司B的正面信息,如果针对全文进行分类,始终只能得出一个类别,该分类可能针对公司A的类别是对的,但是在公司A和公司B的类别不一样的情况下(公司A为负面类别,公司B为正面类别),现有分类思路始终无法满足在同一篇新闻中针对不同主体打标分类。而情感分析较多采用Bi-LSTM算法,情感分析通常只输出整篇文章情感倾向,包括正面概率,负面概率;没有更加具体的情感类别区分。因此,完全依赖一个模型预测,其准确度高度依赖于新闻语料数据的准备,鉴于新闻样式繁多,同样的新闻出自不同的撰写人可能风格完全不同,因此具有局限性。
发明内容
为了解决现有技术存在的上述问题,本发明目的在于提供一种可针对某一特定主体进行分类的结合深度学习和逻辑规则的企业新闻数据风险分类方法。
本发明所采用的技术方案为:
一种结合深度学习和逻辑规则的企业新闻数据风险分类方法,包括如下步骤:
根据确定企业的公司名称获取该确定企业的相关属性,将所述相关属性两两组合并以此为关键词进行搜索,获取与该确定企业相关的新闻材料,并从所述新闻材料中提取出含有所述相关属性的句子;
将含有所述相关属性的句子输入CNN句子分类模型中,得到每个句子的句子分类,所述句子分类为正面类别或负面类别;
将每个所述句子分类分别进行加权处理,取加权处理后的句子分类值大者作为当前新闻的新闻分类,所述新闻分类为正面类别或负面类别;
将所述新闻材料以篇为单位输入Bi-LSTM文章情感分类模型中,得到每篇新闻的情感倾向值,所述情感倾向值为正面概率和负面概率;
当情感倾向值的正面概率为0.6~1.0且新闻分类为正面类别时,则该新闻风险类别为正面类别;当情感倾向值的负面概率为0.6~1.0且新闻分类为负面类别时,则该新闻风险类别为负面类别;其余为相关提及。
进一步,所述相关属性包括但不限于法人名、高管名、公司简称、股票简称、公司历史名和产品名。
更进一步,所述CNN句子分类模型是采用CNN算法训练而成的企业新闻分类模型。
更进一步,所述Bi-LSTM文章情感分类模型采用Bi-LSTM算法训练而成。
更进一步,所述CNN句子分类模型采用如下方法训练而成:
准备训练语料数据;
将训练语料数据中的句子输入CNN句子分类训练模型中,训练得到CNN句子分类模型。
更进一步,所述Bi-LSTM文章情感分类模型采用如下方法训练而成:
准备训练语料数据;
将训练语料数据以篇为单位输入Bi-LSTM文章情感分类训练模型中,训练得到Bi-LSTM文章情感分类模型。
更进一步,所述准备训练语料数据包括如下步骤:
使用网络爬虫在新闻数据来源中抓取企业类新闻材料,并将该企业类新闻材料以文本的形式存储在数据库中;
根据企业关注的新闻焦点,总结统计所需新闻类别;
针对不同的新闻类别自定义一系列的强规则;
根据所述自定义的强规则,在数据库中筛选出与该强规则相匹配的新闻材料作为备用语料数据;
采用人工对强规则筛出来的备用语料数据进行核对,筛选出第一训练语料数据;
采用人工从各大网站获取不同新闻类别的数据,作为第二训练语料数据;
将第一语料数据和第二语料数据融合,得到训练语料数据。
本发明的有益效果为:
本发明通过结合CNN句子分类模型与Bi-LSTM文章情感分类模型对新闻数据风险类别进行预测,可更加准确地预测新闻中企业主体的风险信息,准确性更高。
附图说明
图1为本发明流程图。
图2为本发明中准备训练语料数据的流程图。
具体实施方式
下面结合附图及具体实施例对本发明作进一步阐述。以下实施例仅用于更加清楚地说明本发明的产品,因此只是作为示例,而不能以此来限制本发明的保护范围。
实施例:
本发明实施例提供的一种结合深度学习和逻辑规则的企业新闻数据风险分类方法,如图1所示,包括如下步骤:
S101、根据确定企业的公司名称获取该确定企业的相关属性,将所述相关属性两两组合并以此为关键词进行搜索,获取与该确定企业相关的新闻材料,并从所述新闻材料中提取出含有所述相关属性的句子。
确定企业为需要进行新闻数据风险分析的企业,根据该确定企业的公司名称获取该确定企业的相关属性,相关属性包括但不限于法人名、高管名、公司简称、股票简称、公司历史名和产品名。
两两组合的意思为两个相关属性是and的关系。以两两组合的相关属性为关键词进行新闻材料的搜索,其准确性更高,可防止因不同公司相同属性值的出现而搜索到与该确定企业不相关的新闻材料,影响后续计算。例如,重庆誉存大数据科技有限公司和北京誉存大数据科技有限公司的公司简称均有可能为誉存大数据,如果仅以单个的相关属性进行搜索,则无法准确定位搜索结果中的新闻材料是关于重庆誉存大数据科技有限公司还是北京誉存大数据科技有限公司。
将确定企业的相关属性两两组合,并以此为关键词在互联网上进行搜索,获取与该确定企业相关的新闻材料,并从该新闻材料中提取出含有该确定企业相关属性(关键词)的句子。
S102、将含有所述相关属性的句子输入CNN句子分类模型中,得到每个句子的句子分类,所述句子分类为正面类别或负面类别。
CNN句子分类模型是采用CNN算法训练而成的企业新闻分类模型,该模型可采用现有文本分类模型训练方法训练而成。通过CNN句子分类模型对每个句子类别进行预测,得到每个句子的分类,该分类为正面类别或负面类别。由于每个句子含有确定企业的相关属性,因此,该句子分类的预测是针对该确定企业进行的预测。
S103、将每个所述句子分类分别进行加权处理,取加权处理后的句子分类值大者作为当前新闻的新闻分类,所述新闻分类为正面类别或负面类别。
本实施例中,将新闻标题权重赋予3,其余均权重赋予1,因为新闻标题往往更多的代表作者的情感倾向。将新闻材料中每个句子类别分别加权处理后相加,取值大者作为该新闻材料的新闻分类。即将正面类别的句子和负面类别的句子分别加权处理后相加,若正面类别的值大,则该新闻分类为正面类别,若负面类别的值大,则该新闻分类为负面类别。
本发明根据企业主体进行句子提取,通过对句子分类进行预测,进而实现针对于该主体的新闻材料的类别预测。由于每个句子均包含确定企业的相关属性,因此预测结果必然是针对于该确定企业的。若同一篇新闻材料中涉及多个企业主体,采用本发明方法,可根据不同主体提取出不同的句子,得到针对于不同企业主体的新闻分类,其分类更加准确。
为了进一步提高新闻风险分类的准确性,本发明还包括如下步骤:
S104、将新闻材料以篇为单位输入Bi-LSTM文章情感分类模型中,得到每篇新闻的情感倾向值,所述情感倾向值为正面概率和负面概率。
Bi-LSTM文章情感分类模型采用Bi-LSTM算法训练而成。将每篇新闻材料输入Bi-LSTM文章情感分类模型中进行预测,得到每篇新闻的情感倾向值,情感倾向值为正面概率和负面概率。如某篇新闻材料预测结果为:正面概率为0.75,负面概率为0.25,同一篇新闻材料,其正面概率与负面概率之和为1.0。
S105、当情感倾向值的正面概率为0.6~1.0且新闻分类为正面类别时,则该新闻风险类别为正面类别;当情感倾向值的负面概率为0.6~1.0且新闻分类为负面类别时,则该新闻风险类别为负面类别;其余为相关提及。
在具体实施例中,新闻风险类别为相关提及有如下几种情况:
第一种:情感倾向值的正面概率在0.6~1.0之间,且新闻分类为负面类别。
第二种:情感倾向值的负面概率在0.6~1.0之间,且新闻分类为正面类别。
第三种:情感倾向值的正面概率和负面概率均为0.5,且新闻分类为正面类别。
第四种:情感倾向值的正面概率和负面概率均为0.5,且新闻分类为负面类别。
本发明仅针对企业类新闻(如新闻的财经板块、公司板块等)进行预测,通过结合CNN句子分类模型与Bi-LSTM文章情感分类模型对新闻数据风险类别进行预测,可更加准确地预测新闻中企业主体的风险信息,准确性更高。
训练CNN句子分类模型和Bi-LSTM文章情感分类模型离不开训练语料,参见图2:本发明中,训练语料数据准备方法包括如下步骤:
S201、使用网络爬虫在新闻数据来源中抓取尽可能多的企业类新闻材料,并将该企业类新闻材料以文本的形式存储在数据库中。
新闻数据来源包括全国各大门户网站的公司新闻和财经新闻板块以及与财经、企业等相关的各个中小型网站。
S202、根据企业关注的新闻焦点,总结统计所需新闻类别。
新闻类别包括但不限于“偷税漏税”、“政策监管”、“失信风险”、“违法犯罪”、“事故信息”、“股权变动”、“产品问题”、“合作共赢”、“业务变动”、“抄袭侵权”、“法务纠纷”、“违反规定”、“工资拖欠”、“产品升级”、“高管离职”、“投资融资”、“运营风险”、“畏罪潜逃”、“贪污贿赂”、“欺诈骗局”、“成果奖项”、“裁员降薪”、“上市失利”、“股票利好”、“破产倒闭”、“战略风险”、“披露有误”、“公告公示”、“抵押质押”、“停业整改”、“股票利空”、“债务信息”、“业绩亏损”、“财务风险”、“业务欠款”、“其他”、“合作风险”。
多数新闻类别为风险性类别,比如偷税漏税,直观体现了新闻描述了主体公司的负面信息,使得用户对主体企业有一个基本的认识。
S203、针对不同的新闻类别自定义一系列的强规则。
强规则根据实际情况进行设置,例如针对成果奖项,设定规则为:'赞.*成果|(年度|福布斯).*(榜|人物|集体|经理人)|(获得|荣获|授予|入选).*(单位"|单位”|企业"|企业”|公司”|公司"|专利|奖(?!金)|称号|荣誉|”学位|博士|人物|经理人|集体)|(年?!报|中国|企业|全球|世界).*(强?<!强|榜单|名?!公司|最佳|纳税排行)|(进入|跻身).*(世界|中国|地区).*强|(人力资源|强).*排行榜|”蝉联|获.*最佳|入围.*(强|榜)|跃.*首位|价值榜.*发布|入.*榜|全球.*最大.*平台|发布.*独角兽名单|卖地.*第一|荣膺年度|财富.*改变世界的公司|’超过.*登顶|净利润.*行业榜首|身家暴涨.*登首富|亮点突出|媒.*评.*最美|成功.*最大|获.*(季军|冠军|亚军)|保持.*稳健.*扩张|大赛.*奖金|赢得.*好评|'创.*项第一'。
S204、根据步骤S203自定义的强规则,在数据库中筛选出与该强规则相匹配的新闻材料作为备用语料数据。
S205、采用人工对强规则筛出来的备用语料数据进行核对,筛选出第一训练语料数据。
在具体实施例中,人工根据需要对指定强规则筛选出来的备用语料数据进行核对,以确定筛选出来的备用语料是否属于所指定的新闻类别,防止强规则出错。因为新闻型式变化万千,受撰写人的影响相当大,有时候强规则筛选出的数据并不完全都是我们想要拿到的数据。增加人工核对的步骤,使训练语料数据更加准确,从而保证训练的模型准确率更高。
S206、采用人工从各大网站获取不同新闻类别的数据,作为第二训练语料数据。
S207、将第一语料数据和第二语料数据融合,得到训练语料数据。
训练语料数据中,每个新闻类别的训练语料数据不少于5000条。
第一训练语料数据和第二训练语料数据按1:1比例准备。并且第一训练语料数据与第二训练语料数据不重复。
将训练语料中的句子输入CNN句子分类训练模型中,采用开源CNN算法,训练得到CNN句子分类模型。
将句子所对应的新闻文本输入Bi-LSTM文章情感分类训练模型中,采用开源Bi-LSTM算法,训练得到Bi-LSTM文章情感分类模型。
本发明不局限于上述可选实施方式,任何人在本发明的启示下都可得出其他各种形式的产品,但不论在其形状或结构上作任何变化,凡是落入本发明权利要求界定范围内的技术方案,均落在本发明的保护范围之内。
Claims (7)
1.结合深度学习和逻辑规则的企业新闻数据风险分类方法,其特征在于,包括如下步骤:
根据确定企业的公司名称获取所述确定企业的相关属性,将所述相关属性两两组合并以此为关键词进行搜索,获取与所述确定企业相关的新闻材料,并从所述新闻材料中提取出含有所述相关属性的句子;
将含有所述相关属性的句子输入CNN句子分类模型中,得到每个句子的句子分类,所述句子分类为正面类别或负面类别;
将每个所述句子分类分别进行加权处理,取加权处理后的句子分类值大者作为当前新闻的新闻分类,所述新闻分类为正面类别或负面类别;
将所述新闻材料以篇为单位输入Bi-LSTM文章情感分类模型中,得到每篇新闻的情感倾向值,所述情感倾向值为正面概率和负面概率;
当情感倾向值的正面概率为0.6~1.0且新闻分类为正面类别时,则所述新闻风险类别为正面类别,其余情况对应的新闻风险类别状态为相关提及;当情感倾向值的负面概率为0.6~1.0且新闻分类为负面类别时,则所述新闻风险类别为负面类别,其余情况对应的新闻风险类别状态为相关提及。
2.根据权利要求1所述的结合深度学习和逻辑规则的企业新闻数据风险分类方法,其特征在于,
所述相关属性包括但不限于法人名、高管名、公司简称、股票简称、公司历史名和产品名。
3.根据权利要求1所述的结合深度学习和逻辑规则的企业新闻数据风险分类方法,其特征在于,
所述CNN句子分类模型是采用CNN算法训练而成的企业新闻分类模型。
4.根据权利要求1所述的结合深度学习和逻辑规则的企业新闻数据风险分类方法,其特征在于,所述Bi-LSTM文章情感分类模型采用Bi-LSTM算法训练而成。
5.根据权利要求3所述的结合深度学习和逻辑规则的企业新闻数据风险分类方法,其特征在于,所述CNN句子分类模型采用如下方法训练而成:
准备训练语料数据;
将训练语料数据中的句子输入CNN句子分类训练模型中,训练得到CNN句子分类模型。
6.根据权利要求4所述的结合深度学习和逻辑规则的企业新闻数据风险分类方法,其特征在于,所述Bi-LSTM文章情感分类模型采用如下方法训练而成:
准备训练语料数据;
将训练语料数据以篇为单位输入Bi-LSTM文章情感分类训练模型中,训练得到Bi-LSTM文章情感分类模型。
7.根据权利要求5或6所述的结合深度学习和逻辑规则的企业新闻数据风险分类方法,其特征在于,所述准备训练语料数据包括如下步骤:
使用网络爬虫在新闻数据来源中抓取企业类新闻材料,并将所述企业类新闻材料以文本的形式存储在数据库中;
根据企业关注的新闻焦点,总结统计所需新闻类别;
针对不同的新闻类别自定义一系列的强规则;
根据所述自定义的强规则,在数据库中筛选出与所述强规则相匹配的新闻材料作为备用语料数据;
采用人工对强规则筛出来的备用语料数据进行核对,筛选出第一训练语料数据;
采用人工从各大网站获取不同新闻类别的数据,作为第二训练语料数据;
将第一语料数据和第二语料数据融合,得到训练语料数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811239861.XA CN109472470A (zh) | 2018-10-23 | 2018-10-23 | 结合深度学习和逻辑规则的企业新闻数据风险分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811239861.XA CN109472470A (zh) | 2018-10-23 | 2018-10-23 | 结合深度学习和逻辑规则的企业新闻数据风险分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109472470A true CN109472470A (zh) | 2019-03-15 |
Family
ID=65664413
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811239861.XA Pending CN109472470A (zh) | 2018-10-23 | 2018-10-23 | 结合深度学习和逻辑规则的企业新闻数据风险分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109472470A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110516242A (zh) * | 2019-08-26 | 2019-11-29 | 北京亚联之星信息技术有限公司 | 基于机器学习算法识别负面金融资讯的方法和装置 |
CN111475646A (zh) * | 2020-03-17 | 2020-07-31 | 赵志杰 | 环境形象的评估方法、装置和设备 |
CN111782907A (zh) * | 2020-07-01 | 2020-10-16 | 北京知因智慧科技有限公司 | 新闻分类方法、装置及电子设备 |
CN113689299A (zh) * | 2021-05-10 | 2021-11-23 | 深圳价值在线信息科技股份有限公司 | 新闻信息指数模型的构建方法及新闻信息分析方法 |
CN114021941A (zh) * | 2021-11-01 | 2022-02-08 | 航天科工网络信息发展有限公司 | 一种使用非结构化数据进行风险评估的方法 |
CN117077628A (zh) * | 2023-08-16 | 2023-11-17 | 平安科技(深圳)有限公司 | 舆情应对预案生成方法、装置、服务器及存储介质 |
CN117196293A (zh) * | 2023-08-16 | 2023-12-08 | 平安科技(深圳)有限公司 | 基于人工智能的舆情风险确定方法、装置、服务器及介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107229612A (zh) * | 2017-05-24 | 2017-10-03 | 重庆誉存大数据科技有限公司 | 一种网络信息语义倾向分析方法及系统 |
CN107301246A (zh) * | 2017-07-14 | 2017-10-27 | 河北工业大学 | 基于超深卷积神经网络结构模型的中文文本分类方法 |
CN107403017A (zh) * | 2017-08-09 | 2017-11-28 | 上海数旦信息技术有限公司 | 一种智能分析实时新闻对金融市场影响的方法 |
CN108062300A (zh) * | 2016-11-08 | 2018-05-22 | 中移(苏州)软件技术有限公司 | 一种基于中文文本进行情感倾向分析的方法及装置 |
CN108363753A (zh) * | 2018-01-30 | 2018-08-03 | 南京邮电大学 | 评论文本情感分类模型训练与情感分类方法、装置及设备 |
CN108388544A (zh) * | 2018-02-10 | 2018-08-10 | 桂林电子科技大学 | 一种基于深度学习的图文融合微博情感分析方法 |
CN108399230A (zh) * | 2018-02-13 | 2018-08-14 | 上海大学 | 一种基于卷积神经网络的中文财经新闻文本分类方法 |
-
2018
- 2018-10-23 CN CN201811239861.XA patent/CN109472470A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108062300A (zh) * | 2016-11-08 | 2018-05-22 | 中移(苏州)软件技术有限公司 | 一种基于中文文本进行情感倾向分析的方法及装置 |
CN107229612A (zh) * | 2017-05-24 | 2017-10-03 | 重庆誉存大数据科技有限公司 | 一种网络信息语义倾向分析方法及系统 |
CN107301246A (zh) * | 2017-07-14 | 2017-10-27 | 河北工业大学 | 基于超深卷积神经网络结构模型的中文文本分类方法 |
CN107403017A (zh) * | 2017-08-09 | 2017-11-28 | 上海数旦信息技术有限公司 | 一种智能分析实时新闻对金融市场影响的方法 |
CN108363753A (zh) * | 2018-01-30 | 2018-08-03 | 南京邮电大学 | 评论文本情感分类模型训练与情感分类方法、装置及设备 |
CN108388544A (zh) * | 2018-02-10 | 2018-08-10 | 桂林电子科技大学 | 一种基于深度学习的图文融合微博情感分析方法 |
CN108399230A (zh) * | 2018-02-13 | 2018-08-14 | 上海大学 | 一种基于卷积神经网络的中文财经新闻文本分类方法 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110516242A (zh) * | 2019-08-26 | 2019-11-29 | 北京亚联之星信息技术有限公司 | 基于机器学习算法识别负面金融资讯的方法和装置 |
CN111475646A (zh) * | 2020-03-17 | 2020-07-31 | 赵志杰 | 环境形象的评估方法、装置和设备 |
CN111782907A (zh) * | 2020-07-01 | 2020-10-16 | 北京知因智慧科技有限公司 | 新闻分类方法、装置及电子设备 |
CN111782907B (zh) * | 2020-07-01 | 2024-03-01 | 北京知因智慧科技有限公司 | 新闻分类方法、装置及电子设备 |
CN113689299A (zh) * | 2021-05-10 | 2021-11-23 | 深圳价值在线信息科技股份有限公司 | 新闻信息指数模型的构建方法及新闻信息分析方法 |
CN113689299B (zh) * | 2021-05-10 | 2023-10-20 | 深圳价值在线信息科技股份有限公司 | 新闻信息指数模型的构建方法及新闻信息分析方法 |
CN114021941A (zh) * | 2021-11-01 | 2022-02-08 | 航天科工网络信息发展有限公司 | 一种使用非结构化数据进行风险评估的方法 |
CN117077628A (zh) * | 2023-08-16 | 2023-11-17 | 平安科技(深圳)有限公司 | 舆情应对预案生成方法、装置、服务器及存储介质 |
CN117196293A (zh) * | 2023-08-16 | 2023-12-08 | 平安科技(深圳)有限公司 | 基于人工智能的舆情风险确定方法、装置、服务器及介质 |
CN117196293B (zh) * | 2023-08-16 | 2024-09-10 | 平安科技(深圳)有限公司 | 基于人工智能的舆情风险确定方法、装置、服务器及介质 |
CN117077628B (zh) * | 2023-08-16 | 2024-09-10 | 平安科技(深圳)有限公司 | 舆情应对预案生成方法、装置、服务器及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109472470A (zh) | 结合深度学习和逻辑规则的企业新闻数据风险分类方法 | |
Li et al. | DP-LSTM: Differential privacy-inspired LSTM for stock prediction using financial news | |
Hájek et al. | Forecasting corporate financial performance using sentiment in annual reports for stakeholders’ decision-making | |
CN110334212A (zh) | 一种基于机器学习的领域性审计知识图谱构建方法 | |
CN109492097A (zh) | 一种企业新闻数据风险分类方法 | |
US11257161B2 (en) | Methods and systems for predicting market behavior based on news and sentiment analysis | |
CN106960063A (zh) | 一种针对招商引资领域的互联网情报抓取和推荐系统 | |
CN107704512A (zh) | 基于社交数据的金融产品推荐方法、电子装置及介质 | |
CN112419029B (zh) | 类金融机构风险监控方法、风险模拟系统及存储介质 | |
CN110309508A (zh) | 一种基于投资者情绪的vwap量化交易系统及方法 | |
KR102121901B1 (ko) | 정책자금 온라인 심사평가 시스템 | |
CN110096631B (zh) | 一种基于股票论坛的发帖文本分析的股市情绪报告生成方法 | |
CN105205163B (zh) | 一种科技新闻的增量学习多层次二分类方法 | |
CN112307153A (zh) | 一种产业知识库自动构建方法、装置及存储介质 | |
Bhat et al. | Automated stock price prediction and trading framework for Nifty intraday trading | |
Lee et al. | Esg discourse analysis through bertopic: comparing news articles and academic papers | |
CN112862182A (zh) | 一种投资预测方法、装置、电子设备及存储介质 | |
Chen et al. | Analysis of the impact of investor sentiment on stock price using the latent dirichlet allocation topic model | |
Jing | Big data analysis and empirical research on the financing and investment decision of companies after COVID-19 epidemic situation based on deep learning | |
CN105405051A (zh) | 金融事件预测方法和装置 | |
CN109885695A (zh) | 资产建议生成方法、装置、计算机设备和存储介质 | |
Lee et al. | Crudeoilnews: An annotated crude oil news corpus for event extraction | |
CN110222180A (zh) | 一种文本数据分类与信息挖掘方法 | |
CN116615723A (zh) | 数据提供装置、数据提供系统、数据提供程序、数据提供方法、数据分析设备、数据管理系统、数据管理方法和数据记录介质 | |
Suwa et al. | Develop method to predict the increase in the Nikkei VI index |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190315 |