CN109583738A - 一种用于债券风险控制的装置及方法 - Google Patents
一种用于债券风险控制的装置及方法 Download PDFInfo
- Publication number
- CN109583738A CN109583738A CN201811400220.8A CN201811400220A CN109583738A CN 109583738 A CN109583738 A CN 109583738A CN 201811400220 A CN201811400220 A CN 201811400220A CN 109583738 A CN109583738 A CN 109583738A
- Authority
- CN
- China
- Prior art keywords
- public
- module
- bond
- market
- enterprise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Finance (AREA)
- Game Theory and Decision Science (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Educational Administration (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Technology Law (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及风险控制技术领域,特别涉及一种用于债券风险控制的装置及方法,包括债券信息配置模块、数据获取模块、数据预处理模块、算法分析模块、预警配置模块、舆情信息检索模块、监控告警模块,数据获取模块与数据预处理模块相连接,数据预处理模块与算法分析模块相连接,算法分析模块与舆情信息检索模块相连接,债券信息配置模块与预警配置模块相连接,预警配置模块与舆情信息检索模块相连接,舆情信息检索模块与监控告警模块相连接。与现有技术相比,本发明的用于债券风险控制的装置及方法舆情信息预警更具穿透深度,可灵活配置舆情深度和广度以及情感倾向,实现更具针对性的企业舆情监控流程,大大提升了金融产品的安全性。
Description
【技术领域】
本发明涉及风险控制技术领域,特别涉及一种用于债券风险控制的装置及方法。
【背景技术】
目前,债券投资中,债券违约是常见的债券风险事件之一,故及时监控发债企业的风险变化至关重要。风险控制一般从风险回避、损失控制、风险转移、风险保留这四个方面进行,其中影响债券风险的主要因素是发债人和担保人,由于债券期限一般周期较长,尽管发债前期有充分的尽调,但由于存续期间,存在企业经营能力变化,市场竞争变化,政策导向变化的影响,导致发债企业存在信用风险,及时获取并分析债券的发债人和担保人舆情信息,对提高风险控制水平至关重要。
传统投研人员对发债企业的舆情监控来源于人工从各大新闻网站获取,并分析债券相关的舆情动向来防范风险。然而,目前的新闻、舆情、资讯网站、自媒体等信息源以及信息量都浩如烟海,导致投研人员无法充分及时监控到发债企业的舆情动向,可能造成重大投资损失。而现有风控控制中的舆情监控方式仅仅监控企业主体自身的舆情,此种监控方式存在以下几点缺陷:1.监控舆情过于局限,没有发掘出与企业存在关联关系的企业和个人的舆情影响,不足以发掘隐藏风险;2.缺乏对宏观和行业板块的分析,无法监控宏观或者行业新闻对企业的影响。
有鉴于此,需要设计一种风险控制装置和方法使得投研人员可以全天候获取发债企业的舆情,并及时分析舆情风险,从而及时规避风险。
【发明内容】
为了克服上述问题,本发明提出一种可有效解决上述问题的用于债券风险控制的装置及方法。
本发明解决上述技术问题提供的一种技术方案是:提供一种用于债券风险控制的装置及方法,包括债券信息配置模块,用于获取债券的发债人和担保人;数据获取模块,用于获取市场媒体的舆情信息;数据预处理模块,用于市场舆情预处理;算法分析模块,用于分析市场舆情;预警配置模块,用于预设债券发债人和担保人的预警参数,根据预设的预警参数,通过企业知识图谱实体和关系获取发债人和担保人的关联实体,召回发债人和担保人以及相关的关联实体;舆情信息检索模块,用于检索市场舆情分析结果;监控告警模块,用于推送预警舆情到用户侧;所述数据获取模块与数据预处理模块相连接,数据预处理模块与算法分析模块相连接,算法分析模块与舆情信息检索模块相连接,所述债券信息配置模块与预警配置模块相连接,预警配置模块与舆情信息检索模块相连接,所述舆情信息检索模块与监控告警模块相连接。
优选地,所述用于债券风险控制的方法,包括如下步骤:
步骤S1,获取债券的发债人和担保人;
步骤S2,获取市场媒体的舆情信息;
步骤S3,市场舆情预处理;
步骤S4,分析市场舆情;
步骤S5,预设债券发债人和担保人的预警参数;
步骤S6,根据预设预警参数,通过企业知识图谱实体和关系获取发债人和担保人的关联实体,召回发债人和担保人以及相关的关联实体;
步骤S7,检索市场舆情分析结果。
优选地,所述步骤S2包括以下步骤:
步骤S21,从结构化数据库中获取企业统一社会信用代码、企业名称、企业简称、企业市场舆情文本信息、舆情信息源、舆情更新时间、舆情获取时间、舆情获取链接;
步骤S22,从非结构化数据源中获取企业市场舆情文本信息、舆情信息源、舆情更新时间、舆情获取时间、舆情获取链接。
优选地,所述步骤S4包括以下步骤:
步骤S41,获取整合后的市场舆情信息中的标题、内容;
步骤S42,对舆情内容进行分词、向量化,广告类和市场软文类识别,tf-idf,simhash内容去重;
步骤S43,对舆情内容进行分词、向量化,用BLSTM进行企业主体识别,事件分类,产品板块划分,情感倾向分析,预警分类,应用tf-idf关键词发现。
优选地,所述步骤S7包括以下步骤:
步骤S71,从市场舆情分析结果提取企业主体名称;
步骤S72,在企业知识图谱上找到企业主体的节点,在知识图谱上根据预设信息,获取关联节点;
步骤S73,检索并获取企业主体和关联节点主体的舆情分析结果,将结果告警给用户。
优选地,所述舆情信息源包括主流财经网站、财经新闻移动客户端、微博财经大V、微信财经公众号;
所述非结构化数据源数据采集方式采用爬虫技术实现,爬虫采用市场主流的爬虫技术,针对债券信息源的特殊性要求,爬虫技术支持反爬机制处理,账号登录抓取,图形验证码处理,动态页面抓取,微信公众号信息抓取,移动新闻客户端信息抓取。
优选地,所述步骤S42中,中文分词基于采用jieba分词,采用word2vec算法将分词结果进行向量化,Word2vec采用skip-gram模型构建。
优选地,所述步骤S43中,企业主体识别采用BLSTM+CRF算法,BLSTM是双端长短期记忆网络,CRF是条件随机场算法。
优选地,所述步骤S72中,预设信息包括关联深度,关联关系类型,关联深度表示的是与企业节点直接关联还是间接关联,间接关联是通过多少层关系间接关联,与企业节点关联层数越多,影响面越小;关联关系类型为监控告警信息不一样,方便用户检索出重点关注的关联关系。
优选地,所述步骤S3中,市场舆情预处理包括重复性过滤,数据格式校验,结构化和非机构化信息源整合。
与现有技术相比,本发明的一种用于债券风险控制的装置及方法具有以下有益效果:
1.舆情信息预警更具穿透深度。通过构建的企业知识图谱和自然语言处理,从而形成一个存在多重复杂关系的企业舆情知识图谱体系。从而更全面,更深度的覆盖企业舆情信息。
2.可灵活配置舆情深度和广度以及情感倾向,实现更具针对性的企业舆情监控流程。
3.可以更好,更高效,更全面的提高投研人员的风险防范水平,以及投资盈利水平,大大提升了金融产品的安全性。
【附图说明】
图1为本发明一种用于债券风险控制的装置的结构框图;
图2为适于实现本发明一种用于债券风险控制的装置服务器的计算机系统结构框图;
图3为本发明一种用于债券风险控制方法的企业知识图谱结构示意图;
图4为本发明一种用于债券风险控制方法的分析市场舆情流程图;
图5为本发明一种用于债券风险控制方法的检索市场舆情分析结果流程图;
图6为本发明一种用于债券风险控制方法的实施例流程图。
【具体实施方式】
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施实例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明。
需要说明,本发明实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅限于指定视图上的相对位置,而非绝对位置。
另外,在本发明中如涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
请参阅图1,本发明的一种用于债券风险控制的装置,包括:
债券信息配置模块,用于获取债券的发债人和担保人;
数据获取模块,用于获取市场媒体的舆情信息;
数据预处理模块,用于市场舆情预处理;
算法分析模块,用于分析市场舆情;
预警配置模块,用于预设债券发债人和担保人的预警参数,根据预设的预警参数,通过企业知识图谱实体和关系获取发债人和担保人的关联实体,召回发债人和担保人以及相关的关联实体;
舆情信息检索模块,用于检索市场舆情分析结果;
监控告警模块,用于推送预警舆情到用户侧。
所述数据获取模块与数据预处理模块相连接,数据预处理模块与算法分析模块相连接,算法分析模块与舆情信息检索模块相连接;所述债券信息配置模块与预警配置模块相连接,预警配置模块与舆情信息检索模块相连接;所述舆情信息检索模块与监控告警模块相连接。
请参阅图2,适于实现本发明用于债券风险控制的装置的计算机系统,包括处理器和存储器,处理器可以根据存储在存储器中的程序执行各种适当的动作和处理。在存储器中,还存储有计算机系统操作所需的各种程序和数据。处理器、存储器通过总线彼此相连。输入输出接口也连接至总线。
以下部件连接至输入输出接口:输入设备;输出设备;包括硬盘等的存储装置;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信装置。通信装置经由因特网的网络执行通信处理。
一种用于债券风险控制的方法,包括如下步骤:
步骤S1,获取债券的发债人和担保人;
步骤S2,获取市场媒体的舆情信息;
所述步骤S2中,包括步骤S21,从结构化数据库中获取企业统一社会信用代码、企业名称、企业简称、企业市场舆情文本信息、舆情信息源、舆情更新时间、舆情获取时间、舆情获取链接。
所述的舆情信息源包括主流财经网站、财经新闻移动客户端、微博财经大V、微信财经公众号。
步骤S22,从非结构化数据源中获取企业市场舆情文本信息、舆情信息源、舆情更新时间、舆情获取时间、舆情获取链接。
所述的非结构化数据源数据采集方式采用爬虫技术实现,爬虫采用市场主流的爬虫技术,针对债券信息源的特殊性要求,爬虫技术支持反爬机制处理,账号登录抓取,图形验证码处理,动态页面抓取,微信公众号信息抓取,移动新闻客户端信息抓取。
请参阅图3,企业A与企业B和企业C存在投融资关系,企业A的主营产品为产品板块A,企业A的董监高之一为人物A。在图2的步骤S203中,将企业A以及与企业A关联的企业B、企业C、人物A、产品板块A的舆情的分析召回,推送到用户侧,完成预警和检索。
步骤S3,市场舆情预处理;
所述市场舆情预处理包括重复性过滤,数据格式校验,结构化和非机构化信息源整合。
步骤S4,分析市场舆情;
请参阅图4,步骤S4中包括以下步骤:步骤S41,获取整合后的市场舆情信息中的标题、内容;
步骤S42,对舆情内容进行分词、向量化,广告类和市场软文类识别,tf-idf,simhash内容去重;
中文分词基于采用jieba分词,词库除了jieba自带的词库外,引入金融词库和情感词库。引入金融词库是强化在金融领域的分词效果,引入情感词库是强化在情感识别的分析效果。引入词库格式要求是词典格式要求:一个词占一行;每一行分三部分,一部分为词语,另一部分为词频,最后为词性(可省略),用空格隔开。
采用word2vec算法将分词结果进行向量化,Word2vec采用skip-gram模型构建。
采用众包的方法获取一定数量的市场舆情,并标签化市场舆情是否为广告或市场软文,组成训练预测集。
将训练预测集随机抽样2/3的样本进行训练,训练样本通过word2vec向量化后,应用GBDT+LR训练,生成训练模型。将剩余的1/3的样本构成预测集生成预测,应用F1-SCORE评估算法优劣,不断重复该步骤生成理想的预测模型。
将整合的市场舆情通过广告软文模型识别出是否为广告软文,将市场舆情中的广告软文进行过滤。
将过滤广告软文后的市场舆情信息进行内容去重。多渠道市场舆情由内部市场舆情数据库和外部爬虫抓取数据,外部爬虫数据会从新浪财经、网易财经新闻抓取。为减少下舆情的重复分析,将舆情信息进行在内容上进行去重。去重算法采用tf-idf+simhash实施。
tf-idf是计算词汇的权重,来计算文中的关键词。将权重为前20的词汇进行simhash,hash后的结果超过3为不相似,小于等于3为相似。
将重复的市场舆情进行随机选取保留,并计数重复次数。
步骤S43,对舆情内容进行分词、向量化,用BLSTM进行企业主体识别,事件分类,产品板块划分,情感倾向分析,预警分类,应用tf-idf关键词发现。
对步骤S42的市场舆情进行企业主体识别。企业主体识别采用BLSTM+CRF算法实施。BLSTM是双端长短期记忆网络,CRF是条件随机场算法。本领域技术人员应当理解,本发明中所构建是债券风险控制的企业主体识别,具备较强的领域先验知识。
对市场舆情进行事件分类为公司治理、经营状况、财务、重大事件四个类型。通过众包的方式,将市场舆情进行标签化建立事件分类的训练预测集。将训练预测集随机抽样2/3的样本进行训练,训练样本通过word2vec向量化后,应用GBDT+softmax训练,生成训练模型。将剩余的1/3的样本构成预测集生成预测,应用F1-SCORE评估算法优劣,不断重复该步骤生成理想的事件分类的预测模型。
对市场舆情进行行业板块分类为制造业、采矿业、建筑业、金融业、农林牧渔业、医疗卫生等多类型。通过众包的方式,将市场舆情进行标签化建立事件分类的训练预测集。将训练预测集随机抽样2/3的样本进行训练,训练样本通过word2vec向量化后,应用GBDT+softmax训练,生成训练模型。将剩余的1/3的样本构成预测集生成预测,应用F1-SCORE评估算法优劣,不断重复该步骤生成理想的事件分类的预测模型。
对市场舆情进行情感分类为正向、负向、中性等多类型。通过众包的方式,将市场舆情进行标签化建立事件分类的训练预测集。将训练预测集随机抽样2/3的样本进行训练,训练样本通过word2vec向量化后,应用GBDT+softmax训练,生成训练模型。将剩余的1/3的样本构成预测集生成预测,应用F1-SCORE评估算法优劣,不断重复该步骤生成理想的情感分类的预测模型。
对负向舆情进行告警分类为兑付风险、偿债专户冻结、暂停上市、抵质押风险等多类型。通过众包的方式,将市场舆情进行标签化建立事件分类的训练预测集。将训练预测集随机抽样2/3的样本进行训练,训练样本通过word2vec向量化后,应用GBDT+softmax训练,生成训练模型。将剩余的1/3的样本构成预测集生成预测,应用F1-SCORE评估算法优劣,不断重复该步骤生成理想的情感分类的预测模型。
进一步地,对市场舆情进行关键词发现,采用tf-idf计算词汇的权重,来计算文中的关键词,返回重要性前5的关键词
步骤S5,预设债券发债人和担保人的预警参数;
步骤S6,根据预设预警参数,通过企业知识图谱实体和关系获取发债人和担保人的关联实体,召回发债人和担保人以及相关的关联实体;
步骤S7,检索市场舆情分析结果。
请参阅图5,所述步骤S7包括以下步骤:步骤S71,从市场舆情分析结果提取企业主体名称;
诸如提取企业名为“第一创业”,将企业名在企业名称表所检索出企业的标准名称“第一创业证券股份有限公司”。
步骤S72,在企业知识图谱上找到企业主体的节点,在知识图谱上根据预设信息,获取关联节点;
诸如在企业知识图谱上检索出“第一创业证券有限公司”的节点,检索出预设信息相关的关联节点,组成节点列表。预设信息包括关联深度,关联关系类型。
关联深度表示的是与企业节点直接关联还是间接关联,间接关联是通过多少层关系间接关联。与企业节点关联层数越多,影响面越小。
关联关系类型为监控告警信息不一样,方便用户检索出重点关注的关联关系。比如重点关注“第一创业证券有限公司”的投资企业的舆情,预设条件为投资关系。
对检索信息进行预设限制的目的是防止舆情信息爆炸,导致用户无法关注到重点舆情信息。
步骤S73,检索并获取企业主体和关联节点主体的舆情分析结果,将结果告警给用户。
通过邮件、短信、微信的多重方式,及时通知用户关注的舆情信息。
请参阅图6,一种用于债券风险控制方法的实施例,市场舆情信息的获取,获取用于舆情分析的信息,并将多渠道的市场舆情信息进行整合,清洗,结构化存储;
市场舆情信息的获取的数据源是由内部舆情数据库和外部舆情网站以及新闻源构成。其中内部舆情数据库依据为万得资讯,东方财富等数据库,并从内部舆情数据库中提取企业名,标题,正文,摘要,更新时间,信息源等。外部舆情获取依托爬虫技术抓取财经网站,债券评级机构,微信公众号,微博大v的。外部舆情获取的信息包括但不局限于标题,正文,摘要,发布时间,信息源。
爬虫技术框架依据债券新闻源的特点,具备了动态网页抓取,登录抓取机制,微信公众号消息抓取,移动端抓取技术,反爬机制。
多渠道市场信息整合是将内外部市场舆情信息进行整合和清洗,重复信息进行过滤后整合成统一的数据源并结构化存储,以便进行后续的分析处理流程。
将整合后的市场舆情信息进行自然语言处理,将处理结果通过过滤、分类、分析得出情感识别结果,主体识别结果,事件类别结果,关键词;
舆情信息的过滤是分析的前置步骤,目的是将步骤S21后的舆情数据进行广告和市场软文过滤,然后分别进行舆情事件分类划分,行业板块划分,告警分类划分,情感分类划分,企业主体识别,关键词提取。
舆情事件划分是将债权舆情事件划分为公司治理、经营状况、财务、重大事件四个类型,行业板块划分为制造业、采矿业、建筑业、金融业、农林牧渔业、医疗卫生等等,情感类别是正向、负向以及中性情感,告警分类划分是将情感类别是负面的舆情划分为兑付风险、偿债专户冻结、暂停上市、抵质押风险等等。
企业主体识别用来识别舆情涉及的企业主体,关键词提取是提取舆情内容中最重要的词汇,词汇根据可以通过预设参数返回。
如“8月22日,由《中国基金报》、《证券时报》主办的“2017上市公司价值投资·中国资产管理高峰论坛暨颁奖典礼”在杭州举办。会上,“2017英华奖中国最佳券商资管”评选结果正式揭晓。凭借突出的资产管理能力,第一创业证券(以下简称“第一创业”、“公司”)资产管理团队荣膺“中国券商资管成长奖”,为获此殊荣的8家券商之一。”
该舆情新闻的企业主体为“第一创业证券”,情感为正向情感,关键词为“资产管理”、“英华奖”,事件分类为经营状况,行业板块为金融业
将分析结果,根据监控预设信息推送提供给用户侧。
分析结果将结合企业知识图谱,在企业知识图谱中将分析结果中的企业名称的关联实体召回,根据预设参数的获取指定关联实体的舆情,构建更具穿透的舆情分析结果,使债券风险控制具备潜在风险发掘的能力
与现有技术相比,本发明的一种用于债券风险控制的装置及方法具有以下有益效果:
1.舆情信息预警更具穿透深度。通过构建的企业知识图谱和自然语言处理,从而形成一个存在多重复杂关系的企业舆情知识图谱体系。从而更全面,更深度的覆盖企业舆情信息。
2.可灵活配置舆情深度和广度以及情感倾向,实现更具针对性的企业舆情监控流程。
3.可以更好,更高效,更全面的提高投研人员的风险防范水平,以及投资盈利水平,大大提升了金融产品的安全性。
以上所述仅为本发明的较佳实施例,并非因此限制本发明的专利范围,凡是在本发明的构思之内所作的任何修改,等同替换和改进等均应包含在本发明的专利保护范围内。
Claims (10)
1.一种用于债券风险控制的装置,其特征在于,包括债券信息配置模块,用于获取债券的发债人和担保人;
数据获取模块,用于获取市场媒体的舆情信息;
数据预处理模块,用于市场舆情预处理;
算法分析模块,用于分析市场舆情;
预警配置模块,用于预设债券发债人和担保人的预警参数,根据预设的预警参数,通过企业知识图谱实体和关系获取发债人和担保人的关联实体,召回发债人和担保人以及相关的关联实体;
舆情信息检索模块,用于检索市场舆情分析结果;
监控告警模块,用于推送预警舆情到用户侧;
所述数据获取模块与数据预处理模块相连接,数据预处理模块与算法分析模块相连接,算法分析模块与舆情信息检索模块相连接,所述债券信息配置模块与预警配置模块相连接,预警配置模块与舆情信息检索模块相连接,所述舆情信息检索模块与监控告警模块相连接。
2.一种用于债券风险控制的方法,其特征在于,包括如下步骤:
步骤S1,获取债券的发债人和担保人;
步骤S2,获取市场媒体的舆情信息;
步骤S3,市场舆情预处理;
步骤S4,分析市场舆情;
步骤S5,预设债券发债人和担保人的预警参数;
步骤S6,根据预设预警参数,通过企业知识图谱实体和关系获取发债人和担保人的关联实体,召回发债人和担保人以及相关的关联实体;
步骤S7,检索市场舆情分析结果。
3.如权利要求2所述的用于债券风险控制的方法,其特征在于,所述步骤S2包括以下步骤:
步骤S21,从结构化数据库中获取企业统一社会信用代码、企业名称、企业简称、企业市场舆情文本信息、舆情信息源、舆情更新时间、舆情获取时间、舆情获取链接;
步骤S22,从非结构化数据源中获取企业市场舆情文本信息、舆情信息源、舆情更新时间、舆情获取时间、舆情获取链接。
4.如权利要求2所述的用于债券风险控制的方法,其特征在于,所述步骤S4包括以下步骤:
步骤S41,获取整合后的市场舆情信息中的标题、内容;
步骤S42,对舆情内容进行分词、向量化,广告类和市场软文类识别,tf-idf,simhash内容去重;
步骤S43,对舆情内容进行分词、向量化,用BLSTM进行企业主体识别,事件分类,产品板块划分,情感倾向分析,预警分类,应用tf-idf关键词发现。
5.如权利要求2所述的用于债券风险控制的方法,其特征在于,所述步骤S7包括以下步骤:
步骤S71,从市场舆情分析结果提取企业主体名称;
步骤S72,在企业知识图谱上找到企业主体的节点,在知识图谱上根据预设信息,获取关联节点;
步骤S73,检索并获取企业主体和关联节点主体的舆情分析结果,将结果告警给用户。
6.如权利要求3所述的用于债券风险控制的方法,其特征在于,所述舆情信息源包括主流财经网站、财经新闻移动客户端、微博财经大V、微信财经公众号;
所述非结构化数据源数据采集方式采用爬虫技术实现,爬虫采用市场主流的爬虫技术,针对债券信息源的特殊性要求,爬虫技术支持反爬机制处理,账号登录抓取,图形验证码处理,动态页面抓取,微信公众号信息抓取,移动新闻客户端信息抓取。
7.如权利要求4所述的用于债券风险控制的方法,其特征在于,所述步骤S42中,中文分词基于采用jieba分词,采用word2vec算法将分词结果进行向量化,Word2vec采用skip-gram模型构建。
8.如权利要求4所述的用于债券风险控制的方法,其特征在于,所述步骤S43中,企业主体识别采用BLSTM+CRF算法,BLSTM是双端长短期记忆网络,CRF是条件随机场算法。
9.如权利要求5所述的用于债券风险控制的方法,其特征在于,所述步骤S72中,预设信息包括关联深度,关联关系类型,关联深度表示的是与企业节点直接关联还是间接关联,间接关联是通过多少层关系间接关联,与企业节点关联层数越多,影响面越小;关联关系类型为监控告警信息不一样,方便用户检索出重点关注的关联关系。
10.如权利要求2所述的用于债券风险控制的方法,其特征在于,所述步骤S3中,市场舆情预处理包括重复性过滤,数据格式校验,结构化和非机构化信息源整合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811400220.8A CN109583738A (zh) | 2018-11-22 | 2018-11-22 | 一种用于债券风险控制的装置及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811400220.8A CN109583738A (zh) | 2018-11-22 | 2018-11-22 | 一种用于债券风险控制的装置及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109583738A true CN109583738A (zh) | 2019-04-05 |
Family
ID=65923438
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811400220.8A Pending CN109583738A (zh) | 2018-11-22 | 2018-11-22 | 一种用于债券风险控制的装置及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109583738A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110866057A (zh) * | 2019-11-12 | 2020-03-06 | 北京明略软件系统有限公司 | 一种实现数据处理的方法、装置、计算机存储介质及终端 |
CN111091454A (zh) * | 2019-11-05 | 2020-05-01 | 新华智云科技有限公司 | 一种基于知识图谱的金融舆情推荐方法 |
CN111105311A (zh) * | 2019-12-19 | 2020-05-05 | 第一创业证券股份有限公司 | 债券主体的动态信用评级方法及装置 |
CN111127213A (zh) * | 2019-11-19 | 2020-05-08 | 泰康保险集团股份有限公司 | 信息处理方法与装置、存储介质、电子设备 |
CN111583012A (zh) * | 2020-03-23 | 2020-08-25 | 北京航空航天大学 | 融合文本信息的信用债发债主体违约风险评估方法 |
CN111695033A (zh) * | 2020-04-29 | 2020-09-22 | 平安科技(深圳)有限公司 | 企业舆情分析方法、装置、电子设备及介质 |
WO2021098651A1 (zh) * | 2019-11-22 | 2021-05-27 | 深圳前海微众银行股份有限公司 | 一种风险实体获取方法及装置 |
CN113222471A (zh) * | 2021-06-04 | 2021-08-06 | 西安交通大学 | 一种基于新媒体数据的资产风控方法及设备 |
CN114612239A (zh) * | 2022-03-11 | 2022-06-10 | 刘星 | 基于算法、大数据、人工智能的股票舆情监测和风控系统 |
CN116611696A (zh) * | 2023-07-19 | 2023-08-18 | 北京大学 | 一种基于时间序列分析的数字资产市场风险预测系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107527288A (zh) * | 2017-06-16 | 2017-12-29 | 兴业数字金融服务(上海)股份有限公司 | 一种债券存续期风险预警系统 |
CN108596439A (zh) * | 2018-03-29 | 2018-09-28 | 北京中兴通网络科技股份有限公司 | 一种基于知识图谱的企业风险预测方法及系统 |
-
2018
- 2018-11-22 CN CN201811400220.8A patent/CN109583738A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107527288A (zh) * | 2017-06-16 | 2017-12-29 | 兴业数字金融服务(上海)股份有限公司 | 一种债券存续期风险预警系统 |
CN108596439A (zh) * | 2018-03-29 | 2018-09-28 | 北京中兴通网络科技股份有限公司 | 一种基于知识图谱的企业风险预测方法及系统 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111091454A (zh) * | 2019-11-05 | 2020-05-01 | 新华智云科技有限公司 | 一种基于知识图谱的金融舆情推荐方法 |
CN110866057A (zh) * | 2019-11-12 | 2020-03-06 | 北京明略软件系统有限公司 | 一种实现数据处理的方法、装置、计算机存储介质及终端 |
CN111127213A (zh) * | 2019-11-19 | 2020-05-08 | 泰康保险集团股份有限公司 | 信息处理方法与装置、存储介质、电子设备 |
WO2021098651A1 (zh) * | 2019-11-22 | 2021-05-27 | 深圳前海微众银行股份有限公司 | 一种风险实体获取方法及装置 |
CN111105311A (zh) * | 2019-12-19 | 2020-05-05 | 第一创业证券股份有限公司 | 债券主体的动态信用评级方法及装置 |
CN111583012A (zh) * | 2020-03-23 | 2020-08-25 | 北京航空航天大学 | 融合文本信息的信用债发债主体违约风险评估方法 |
CN111695033A (zh) * | 2020-04-29 | 2020-09-22 | 平安科技(深圳)有限公司 | 企业舆情分析方法、装置、电子设备及介质 |
WO2021217843A1 (zh) * | 2020-04-29 | 2021-11-04 | 平安科技(深圳)有限公司 | 企业舆情分析方法、装置、电子设备及介质 |
CN111695033B (zh) * | 2020-04-29 | 2023-06-27 | 平安科技(深圳)有限公司 | 企业舆情分析方法、装置、电子设备及介质 |
CN113222471A (zh) * | 2021-06-04 | 2021-08-06 | 西安交通大学 | 一种基于新媒体数据的资产风控方法及设备 |
CN113222471B (zh) * | 2021-06-04 | 2023-06-06 | 西安交通大学 | 一种基于新媒体数据的资产风控方法及设备 |
CN114612239A (zh) * | 2022-03-11 | 2022-06-10 | 刘星 | 基于算法、大数据、人工智能的股票舆情监测和风控系统 |
CN116611696A (zh) * | 2023-07-19 | 2023-08-18 | 北京大学 | 一种基于时间序列分析的数字资产市场风险预测系统 |
CN116611696B (zh) * | 2023-07-19 | 2024-01-26 | 北京大学 | 一种基于时间序列分析的数字资产市场风险预测系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109583738A (zh) | 一种用于债券风险控制的装置及方法 | |
US11494648B2 (en) | Method and system for detecting fake news based on multi-task learning model | |
CN108733816B (zh) | 一种微博突发事件检测方法 | |
CN108596439A (zh) | 一种基于知识图谱的企业风险预测方法及系统 | |
CN107451710A (zh) | 一种信息风险等级五级分类方法及系统 | |
CN102946331B (zh) | 一种社交网络僵尸用户检测方法及装置 | |
CN110689438A (zh) | 企业类金融风险评分方法、装置、计算机设备及存储介质 | |
CN113297283A (zh) | 用于企业风险预警的舆情分析方法及系统 | |
CN107851097A (zh) | 数据分析系统、数据分析方法、数据分析程序及存储介质 | |
CN109543110A (zh) | 一种微博情感分析方法及系统 | |
CN109859052A (zh) | 一种投资策略的智能推荐方法、装置、存储介质和服务器 | |
CN110442728A (zh) | 基于word2vec汽车产品领域的情感词典构建方法 | |
CN110880142B (zh) | 一种风险实体获取方法及装置 | |
CN107807941A (zh) | 信息处理方法和装置 | |
CN109300042A (zh) | 一种基于大数据的风控系统 | |
CN110633316A (zh) | 一种多场景融合双随机市场监管方法 | |
CN111105311A (zh) | 债券主体的动态信用评级方法及装置 | |
CN113723737A (zh) | 一种基于企业画像的政策匹配方法、装置、设备及介质 | |
CN113722433A (zh) | 一种信息推送方法、装置、电子设备及计算机可读介质 | |
CN110851611A (zh) | 一种隐患数据知识图谱的构建方法及装置、设备、介质 | |
CN117611335A (zh) | 金融风险识别方法、装置、电子设备和存储介质 | |
Song | Construction of event knowledge graph based on semantic analysis | |
Tilly et al. | Macroeconomic forecasting with statistically validated knowledge graphs | |
CN110222180A (zh) | 一种文本数据分类与信息挖掘方法 | |
CN113449108A (zh) | 一种基于层级化聚类的金融新闻流突发检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190405 |