CN103218744A - 一种基于swot模型的行业投资信息及数据处理系统 - Google Patents

一种基于swot模型的行业投资信息及数据处理系统 Download PDF

Info

Publication number
CN103218744A
CN103218744A CN2012102537854A CN201210253785A CN103218744A CN 103218744 A CN103218744 A CN 103218744A CN 2012102537854 A CN2012102537854 A CN 2012102537854A CN 201210253785 A CN201210253785 A CN 201210253785A CN 103218744 A CN103218744 A CN 103218744A
Authority
CN
China
Prior art keywords
information
industry
swot
data
automatically
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012102537854A
Other languages
English (en)
Other versions
CN103218744B (zh
Inventor
付强
李涛
卢顺喜
王赛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI GREAT WISDOM CO Ltd
Original Assignee
SHANGHAI GREAT WISDOM CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI GREAT WISDOM CO Ltd filed Critical SHANGHAI GREAT WISDOM CO Ltd
Priority to CN201210253785.4A priority Critical patent/CN103218744B/zh
Publication of CN103218744A publication Critical patent/CN103218744A/zh
Application granted granted Critical
Publication of CN103218744B publication Critical patent/CN103218744B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于SWOT模型的行业投资信息及数据处理系统,包括信息采集分类服务器中的互联网上行业信息自动采集模块和行业信息手工补录模块;信息及数据处理服务器中的信息筛选加工模块、SWOT分析模块、影响力量化模块、SWOT指数处理模块;信息及数据输出终端。行业信息自动采集模块自动抓取互联网上的行业信息,信息筛选加工模块自动筛选去重和统一格式;SWOT分析模块将各子行业信息分成S、W、O、T部分;SWOT指数处理模块对信息设定影响概率系数并得到SWOT分析投资指数。本发明能自动搜索、抓取、筛选和加工行业投资信息,生成按子行业分类的信息和投资指数,实现信息和指数S、W、O、T类别的归类、存储和输出。

Description

一种基于SWOT模型的行业投资信息及数据处理系统
技术领域
本发明涉及的是一种行业投资信息及数据处理系统,具体地说,涉及的是一种基于SWOT模型的行业投资信息及数据处理系统。
背景技术
行业投资信息是投资信息平台提供给用户的一类重要信息,用户通过参考该类信息进行不同行业的投资配置,配置内容包括不同行业的公司股票、公司债券、商品期货等各类投资对象。投资信息平台目前广泛采用互联网智能信息采集(通常被称为网络爬虫)和信息搜索(通常被称为搜索引擎)技术来实现各类投资信息的搜集和保存,再加以人工筛选和简单分析,最终通过软件终端提供给用户。
虽然投资信息平台通过预先设定搜索对象及关键词来限定了信息范围,但从互联网上搜集到的行业投资信息仍然很多。为了避免用户接收到的信息繁多、杂乱,目前大部分投资信息平台将信息按行业进行了分类。虽然分类后的信息分布到了各个行业,解决了信息杂乱无章的问题,但是,一方面,用户仍需要在终端上点击所有行业去主动查找出某个行业的投资价值或风险相关的重要信息,另一方面,用户查看的信息是较原始的未经加工和量化分析的,该类信息不能对投资提供高效的帮助。
现有软件信息平台中常见的上述“资讯信息简单罗列展示”形式之所以没有突破和创新,就是因为缺乏一种能够通过人工简单设定一些参数就可以实现信息自动详细归类、自动关联行业数据和股票数据、自动计算相关投资指数的处理系统。因此,目前投资信息平台普遍存在缺少信息详细分类、缺少辅助分析数据、缺少关联股票数据、缺少具有索引作用的投资指数的问题,导致用户在阅读和分析行业信息时浪费了大量时间在一些非重要行业及其信息上,不能快速挑选出热点行业的关键信息进行阅览和分析,从而错失投资或避险时机。
SWOT分析模型目前广泛应用于公司的战略研究与竞争分析,已成为公司战略管理和竞争情报的重要分析工具。常见的SWOT分析模型是将公司的内部发展条件和外部发展环境分别划分为有利的和不利的两个方面,由此得到四个分析象限,分别是S(Strengths,优势)、W(Weaknesses,劣势)、O(Opportunities,机会)、T(Threats,威胁),可以用表格表示如下:
表1 SWOT分析模型的一般分类方法
Figure BDA00001913383200021
但是,将上述SWOT分析方法用于行业投资分析的案例极少,投资研究报告出现过的个别应用案例都是以文字图表形式对信息进行简单的S、W、O、T分类,用户通过一篇报告的SWOT分析文字图表只能对某一个(子)行业有所了解,行业覆盖面很小,而且报告撰写和发布花费的时间导致其时效性很差。因此,目前缺乏一种基于上述SWOT模型的综合运用信息网络搜集、信息分类处理、数据调用分析等多项技术的行业信息及数据处理系统。
发明内容
本发明针对现有技术存在的上述不足,提供一种基于SWOT模型的行业投资信息及数据处理系统,以解决目前投资信息平台无法将信息进行快速SWOT分类处理、数据分析和指数量化的技术问题。
本发明是通过以下技术方案实现的,本发明包括:信息采集分类服务器,信息及数据处理服务器,以及信息及数据输出终端,其中:
所述信息采集分类服务器包括互联网上行业信息自动采集模块和行业信息手工补录模块;
所述信息及数据处理服务器包括信息筛选加工模块、SWOT分析模块、影响力量化模块、SWOT指数处理模块;
所述信息及数据输出终端包括主机、显示器;
上述组成中:
所述行业信息自动采集模块采用互联网智能信息采集技术定向搜集并存储互联网上的行业信息,宏观行业和每个子行业分别预先设定多个搜集对象的域名,域名具体到某个互联网站的某个栏目,本模块自动搜集到的信息按照上述宏观及子行业自动分类和存储在信息采集处理服务器的存储器中,并利用信息内容的相似性自动进行重复判断,排除多余的重复信息;
所述行业信息手工补录模块仅在行业信息自动采集模块未能搜集到某条行业信息的情况下,才利用行业信息手工补录模块补录并存储该条信息,另外也可以通过本模块输入自有的原创信息内容;
所述信息筛选加工模块将信息采集分类服务器采集后分类存储的信息进行进一步的筛选和加工,将经过筛选留下的信息自动进行“格式清除”和“样式统一”,生成按照子行业分类的统一格式的信息,这些信息分行业存储在信息及数据处理服务器中;
所述SWOT分析模块将信息及数据处理服务器的存储器中的各个子行业信息分成S、W、O、T四个部分,划分过程将会调用两个数据库服务器:行业经济数据库服务器和行业股票数据库服务器;行业经济数据库服务器中存有相关行业数据的代码、名称、单位、数值等多个互相具有逻辑关系的字段,为每条信息匹配行业数据时,系统首先将信息内容中提到的行业数据与服务器中的行业数据名称字段根据相同文字关联程度进行自动匹配,其他字段信息将自动被调取并最终输出到终端显示给用户;行业股票数据库服务器中存有行业数据指标代码与该数据指标相关股票的逻辑关系,同时存有每个股票的股票代码、行情数据、估值数据及财务数据之间建有逻辑关系的字段;本模块再根据行业股票数据库服务器中已有的逻辑关系自动调用上述行业数据指标已关联的股票并将这些内容输出到终端显示给用户;上述S、W、O、T四个部分的各条信息及其调用的各类数据将存储在行业SWOT分析内容库服务器中,最终通过终端的第二显示器以多种形式的可视化图表提供给用户查看;
所述影响力量化模块是在上述SWOT分析和分类的基础上,将上述信息按照影响力预估标准进行影响力量化,量化标准根据影响程度不同设定了多个档次,每条信息的影响力值也存储在信息及数据处理服务器中,最终通过终端的第二显示器提供给用户查看,同时该值也是下一步SWOT指数处理模块的数据基础之一;
所述SWOT指数处理模块对不同时间的信息分别设定了影响概率系数,再通过系统自动计算得到S、W、O、T四类SWOT分析投资指数,这些指数经系统进一步自动计算后得到SWOT分析综合投资指数,上述指数结果存储在行业SWOT分析指数库服务器中,最终将输出到终端第一显示器中提供给用户使用。
进一步的,所述行业信息自动采集模块,包括信息定向采集子模块、信息自动去重子模块、信息自动分类子模块。其中,信息定向采集子模块将预先设定的所有信息源的资讯信息进行采集存储,存储内容包括信息标题、来源、日期、作者、内容等项目;信息自动去重子模块利用信息内容的相似性自动进行重复判断,可以预设重复的标准,比如自动删除与已有信息80%内容相同的信息;信息自动分类子模块可以实现对所采集信息的自动初步归类,主要是将各个子行业预先设定的所有网站信息初步归类到该子行业中。
进一步的,所述信息筛选加工模块包括信息筛选子模块和编辑加工子模块。其中,信息筛选子模块将信息采集分类服务器采集后分类存储的信息在前一模块自动去重的基础上进行进一步的筛选,自动删除一些不需要的信息;编辑加工子模块将经过筛选留下的信息自动进行“格式清除”和“样式统一”;再将这些信息提供给编辑人员进行快速地发布前核查筛选;本模块最后生成按照子行业分类的统一格式的信息,这些信息分行业存储在信息及数据处理服务器中。
进一步的,所述SWOT分析模块包括信息属性确定子模块和相关数据调用子模块,其中,信息属性确定子模块在专业行业人员对每条信息确定内部或外部、利好或利空两个属性的基础上实现对信息的自动S、W、O、T归类(S为子行业内部的利好信息,W为子行业内部的利空信息,O为子行业外部即所属大行业、上下游行业及宏观的利好信息,T为子行业外部即所属大行业、上下游行业及宏观的利空信息);相关数据调用子模块首先将信息内容中提到的行业数据类文字与服务器中的行业数据名称字段根据文字重复程度进行自动匹配,其他字段信息将自动被调取并最终输出到终端显示给用户,然后根据行业股票数据库服务器中已有的逻辑关系自动调用上述行业数据指标已关联的股票,并最终将这些内容输出到终端显示给用户。
进一步的,所述SWOT指数处理模块,包括时效性系数设定子模块、SWOT分析分类投资指数处理子模块、SWOT分析综合投资指数处理子模块。其中,时效性系数设定子模块为一次性的参数设定工作,为后面自动计算指数提供数据基础,具体是对不同时间的信息分别设定了时效性系数,取最近n天的信息划定计算范围,每天的时效性系数随着时间的推移而递减,n天的时效性系数之和为1,这里的“天”根据不同国家和地区证券市场收盘时间的不同进行不同的规定。SWOT分析分类投资指数处理子模块是在上述影响力值、时效性系数两个数据基础上分别得到S、W、O、T四类信息的影响力“期望值”,即为S、W、O、T四类SWOT分析投资指数,具体过程是首先取当天所有已有资讯的影响力最大值,然后求每天的“最大影响力×时效性系数”,最后将n天的上述结果加和,得出“∑最大影响力×概率”即为SWOT分析分类投资指数。SWOT分析综合投资指数处理子模块是将S、W、O、T四类SWOT分析投资指数进行加减运算,得到综合投资指数结果,具体是“SWOT分析综合投资指数=SWOT分析S指数-SWOT分析W指数+SWOT分析O指数-SWOT分析T指数”。上述三个子模块自动计算出的指数结果存储在行业SWOT分析指数库服务器中,最终将输出到终端第一显示器中提供给用户使用。
与现有技术中常见的“资讯信息简单罗列展示”相比,本发明可以实现以下多项功能:
(1)本发明能自动对行业投资信息搜索、抓取、筛选和加工,最后生成按照子行业分类的统一格式的信息。然后在简单快速地设定的信息属于子行业内部或外部、利好或利空两个属性的基础上自动实现信息S、W、O、T类别的归类、存储和输出。
(2)本发明能将信息内容中提到的行业数据类文字与服务器中的行业数据名称字段根据文字重复程度进行自动匹配,匹配到的行业数据将自动被调取并最终输出到终端显示给用户。
(3)本发明能根据行业股票数据库服务器中已有的逻辑关系自动调用上述行业数据指标已关联的股票,并最终将这些内容输出到终端显示给用户。
(4)本发明能自动根据各条信息的发布时间获取信息的时效性系数(表2),并在简单快速地划定信息影响力等级的基础上自动获取影响力预估系数(表3),本发明能自动在上述两个数据基础上分别计算出S、W、O、T四类信息的影响力“期望值”,即为S、W、O、T四类SWOT分析投资指数,实现各类投资分析指数的自动计算、存储和输出。
用户可以根据本发明在终端上输出的内容和指数进行科学的行业分析研究,从而及时发现有投资价值或风险的行业,使投资变得更加理性。具体地,本发明最后在输出终端提供给用户的信息具备以下特色:
(1)SWOT投资指数。本发明通过科学合理的数学模型计算得到的SWOT投资指数,具体每个子行业包括一项SWOT分析综合投资指数和四项SWOT分析分类投资指数。上述指数在终端第一显示器上按大小排列显示,方便用户查看指数排在前后几名的子行业,从而可以及时发现投资价值或风险。SWOT投资指数在终端的显示形式不仅包括数据本身的列表平铺,还包括指数历史数据走势图形式。
(2)分析综合全面。本发明处理后的行业投资资讯信息分成了S、W、O、T四个部分,包括了行业内部情况和外部环境的各种利好与利空信息。信息在终端第二显示器上显示,具体包括标题、来源、日期、作者、具体文段等。
(3)数据明确清晰。本发明可以自动调用、保存和输出信息包含或有关的多个行业数据指标,数据指标在终端第二显示器上以走势图及具体值等形式进行展示。
(4)股票一目了然。本发明通过行业数据指标代码自动关联到信息相关的股票,并从数据库中自动调用、存储和输出股票名称、股价、估值数据及财务数据等字段,这些字段在终端第二显示器上以走势图及具体值等多种形式进行展示。
附图说明
图1是本发明系统的信息及数据处理流程和硬件结构图;
图2是本发明系统信息及数据处理服务器的工作原理框图;
图3是本发明实施例中信息对行业证券影响力的时效性特点曲线图;
图4是本发明实施例中各个子行业SWOT分析投资指数的输出样式图;
图5是本发明实施例中每个子行业SWOT分析简要内容的输出样式图;
图6是本发明实施例中每条信息的具体内容及相关行业数据、股票数据输出样式图。
具体实施方式
下面结合附图对本发明的实施例作详细说明:本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
如图1所示,本发明系统的信息及数据经过了多个硬件处理流程:
首先本发明系统通过多端口以太网接口与互联网相连,自动抓取互联网上的行业信息,同时通过输入设备由人工补录个别行业信息。上述两部分信息输入并存储在信息采集分类服务器中,该服务器能够利用信息内容的相似性对来自多个网站的信息自动进行重复判断,可以预设重复的标准,通过删除与已有信息80%内容相同的信息来排除多余的重复信息。输入设备和该服务器中的人工补录子模块共同实现对信息定向采集子模块采集的信息进行人工查漏补缺,防止因为遗漏重要信息而对后面的SWOT分析及指数计算造成影响。
然后,信息传输到信息及数据处理服务器中,该服务器包括信息筛选加工模块、SWOT分析模块、影响力量化模块、SWOT指数处理模块四个主要模块。该服务器能够自动调用行业经济数据库服务器中的行业数据和行业股票数据库中服务器中的股票数据,并将调用的这些数据与行业信息一起输出并存储在行业SWOT分析内容库服务器中,另外该服务器计算出的各类行业SWOT分析指数结果输出和存储在行业SWOT分析指数库服务器中。
最后,行业SWOT分析指数库服务器中的行业SWOT分析指数和行业SWOT分析内容库服务器中的行业信息、行业数据、股票数据等内容通过多端口以太网接口传输到用户的信息及数据输出终端上。所有子行业的各类行业SWOT分析指数显示在终端的第一显示器上,行业信息、行业数据、股票数据等内容显示在终端的第二显示器上。
如图2所示,信息传输到信息及数据处理服务器包括信息筛选加工模块、SWOT分析模块、影响力量化模块、SWOT指数处理模块四个主要模块。所述信息筛选加工模块将信息采集分类服务器采集后分类存储的信息在前一模块自动去重的基础上进行进一步的筛选,自动删除一些不需要的信息,例如:自动删除含有“一周综述”、“月度点评”、“季度总结”等关键词的非实时性的信息,这些信息大多描述的是滞后的信息,不符合投资信息的时效性要求;自动删除含有“公司长期提供……产品”、“联系方式……”等关键词的广告类信息等;然后本模块将经过筛选留下的信息自动进行“格式清除”和“样式统一”,即将文字字体、字形、字号、字符间距、行距、段间距、对齐方式等项目进行自动统一;本模块最后生成按照子行业分类的统一格式的信息,这些信息分行业存储在信息及数据处理服务器中。
如图2所示,所述SWOT分析模块将信息及数据处理服务器的存储器中的各个子行业信息分成S、W、O、T四个部分,SWOT分析模块对每条信息确定两个属性:一是确定该条信息属于子行业内部还是外部,二是确定该条信息属于利好还是利空。本模块根据这两个属性的命令自动将信息划分为S、W、O、T四个部分,比如,如果一条信息的上述两个属性被定为子行业内部且利好,则该信息自动归类为S;如果被定为子行业内部且利空,则该信息自动归类为W;如果被定为子行业外部且利好,则该信息自动归类为O;如果被定为子行业外部且利空,则该信息自动归类为T。分析过程将会调用两个数据库服务器:行业经济数据库服务器和行业股票数据库服务器。调用的目的一是方便专业人员分析信息,二是调用结果最终将输出到终端提供给用户分析使用。行业经济数据库服务器中存有相关行业数据的代码、名称、单位、数值等多个互相具有逻辑关系的字段,为每条信息匹配行业数据时,系统首先将信息内容中提到的行业数据与服务器中的行业数据名称字段根据相同文字关联程度进行自动匹配,其他字段信息将自动被调取并最终输出到终端显示给用户(例如某条信息中含有“2012年5月份中国居民消费价格指数CPI同比增幅为3%”的内容,系统会自动搜索并匹配服务器中名称与该信息字词吻合度大于一定程度(如50%)的行业数据,即“中国居民消费价格指数CPI”,该数据名称、单位、数值等将随同信息一起输出到终端提供给用户);行业股票数据库服务器中存有行业数据指标代码与该数据指标相关股票的逻辑关系,同时存有每个股票的股票代码、行情数据、估值数据及财务数据之间建有逻辑关系的字段;本模块再根据行业股票数据库服务器中已有的逻辑关系自动调用上述行业数据指标已关联的股票(行业经济数据库服务器中的每条行业数据已关联多个股票,例如“女装销售额”数据已经与多个女装类股票提前建立了关联关系)并将这些内容输出到终端显示给用户;上述S、W、O、T四个部分的各条信息及其调用的各类数据将存储在行业SWOT分析内容库服务器中,最终通过终端的第二显示器以多种形式的可视化图表提供给用户查看。
如图2所示,所述影响力量化模块是在上述SWOT分析和分类的基础上,将上述信息提供给各个行业的专业人员按照影响力预估标准(表3)进行影响力量化,量化标准根据影响程度不同设定了多个档次(例如表2设定了5个档次),每条信息的影响力值也存储在信息及数据处理服务器中,最终通过终端的第二显示器提供给用户查看,同时该值也是下一步SWOT指数处理模块的数据基础之一。
如图2所示,所述SWOT指数处理模块对不同时间的信息分别设定了影响概率系数,再通过系统自动计算得到S、W、O、T四类SWOT分析投资指数,这些指数经系统进一步自动计算后得到SWOT分析综合投资指数,上述指数结果存储在行业SWOT分析指数库服务器中,最终将输出到终端第一显示器中提供给用户使用。
如图2所示,进一步的,所述行业信息自动采集模块,包括信息定向采集子模块、信息自动去重子模块、信息自动分类子模块。其中,信息定向采集子模块将预先设定的所有信息源的资讯信息进行采集存储,存储内容包括信息标题、来源、日期、作者、内容等项目;信息自动去重子模块利用信息内容的相似性自动进行重复判断,可以预设重复的标准,比如自动删除与已有信息80%内容相同的信息;信息自动分类子模块可以实现对所采集信息的自动初步归类,主要是将各个子行业预先设定的所有网站信息初步归类到该子行业中。
如图2所示,进一步的,所述信息筛选加工模块包括信息筛选子模块和编辑加工子模块。其中,信息筛选子模块将信息采集分类服务器采集后分类存储的信息在前一模块自动去重的基础上进行进一步的筛选,自动删除一些不需要的信息,例如:自动删除含有“一周综述”、“月度点评”、“季度总结”等关键词的非实时性的信息,这些信息大多描述的是滞后的信息,不符合投资信息的时效性要求;自动删除含有“公司长期提供……产品”、“联系方式……”等关键词的广告类信息等;编辑加工子模块将经过筛选留下的信息自动进行“格式清除”和“样式统一”,即将文字字体、字形、字号、字符间距、行距、段间距、对齐方式等项目进行自动统一;最后本模块再将这些信息提供给编辑人员进行快速地发布前核查筛选,包括类别、内容和格式等;本模块最后生成按照子行业分类的统一格式的信息,这些信息分行业存储在信息及数据处理服务器中。
如图2所示,进一步的,所述SWOT分析模块包括信息属性确定子模块和相关数据调用子模块,其中,信息属性确定子模块在专业行业人员对每条信息确定内部或外部、利好或利空两个属性的基础上实现对信息的自动S、W、O、T归类(S为子行业内部的利好信息,W为子行业内部的利空信息,O为子行业外部即所属大行业、上下游行业及宏观的利好信息,T为子行业外部即所属大行业、上下游行业及宏观的利空信息);相关数据调用子模块首先将信息内容中提到的行业数据类文字与服务器中的行业数据名称字段根据文字重复程度进行自动匹配,其他字段信息将自动被调取并最终输出到终端显示给用户,然后根据行业股票数据库服务器中已有的逻辑关系自动调用上述行业数据指标已关联的股票,并最终将这些内容输出到终端显示给用户。
如图2所示,进一步的,所述SWOT指数处理模块,包括时效性系数设定子模块、SWOT分析分类投资指数处理子模块、SWOT分析综合投资指数处理子模块。其中,时效性系数设定子模块为一次性的参数设定工作,为后面自动计算指数提供数据基础,具体是对不同时间的信息分别设定了时效性系数,取最近n天的信息划定计算范围,每天的时效性系数随着时间的推移而递减,n天的时效性系数之和为1,这里的“天”根据不同国家和地区证券市场收盘时间的不同进行不同的规定。例如取n=6近6天的时效性系数可按表2设定。SWOT分析分类投资指数处理子模块是在上述影响力值、时效性系数两个数据基础上分别得到S、W、O、T四类信息的影响力“期望值”,即为S、W、O、T四类SWOT分析投资指数,具体计算过程是首先取当天所有已有资讯的影响力最大值,然后求每天的“最大影响力×时效性系数”,最后将n天的上述结果加和,得出“∑最大影响力×概率”即为SWOT分析分类投资指数。例如取n=6,按照表2设定的时效性系数计算,表4是影响力及指数计算结果举例。SWOT分析综合投资指数处理子模块是将S、W、O、T四类SWOT分析投资指数进行加减运算,得到综合投资指数结果,具体运算公式是“SWOT分析综合投资指数=SWOT分析S指数-SWOT分析W指数+SWOT分析O指数-SWOT分析T指数”。上述三个子模块自动计算出的指数结果存储在行业SWOT分析指数库服务器中,最终将输出到终端第一显示器中提供给用户使用。
如图3所示,上述SWOT指数处理模块对不同时间的信息设定影响概率系数类似图中曲线,该曲线描述了“信息对行情的影响力会随着时间的推移而逐渐降低”的时效性原理,反映了信息对行业证券影响力的时效性特点。根据该曲线原理,系统对不同时间的信息分别设定了影响概率系数,取最近n天的信息划定计算范围,每天的时效性系数随着时间的推移而递减,n天的时效性系数之和为1。这里的“天”根据不同国家和地区证券市场收盘时间的不同进行不同的规定,以15:00收盘为例,则前一个交易日15:00开始,到当天或下一个(用于节假日休市情况)交易日15:00结束的这个时间段为“0天前”,对应的时效性系数最大,其他天数的时效性规定以此类推。
表2 不同日期时间信息的影响力概率
Figure BDA00001913383200101
※这里的“当天”是指前一交易日收盘3点开始到当天收盘3点结束的时间(除节假日休市后第一个交易日特殊外,一般周二到周五均为24个小时),其他天数规定原理相同。
※※指数的计算参数,系统根据信息日期时间自动取得相应值参与计算,该值可以定期根据系统实际应用情况进行校验和调整。
表3 不同信息的影响力值预估标准
Figure BDA00001913383200102
※指数的计算参数,系统根据预估程度等级自动取得相应值参与计算,该值可以定期根据系统实际应用情况进行校验和调整。
表4 期望值法求四类(S/W/O/T)投资指数举例
Figure BDA00001913383200103
Figure BDA00001913383200111
※这里仅用每日1-2条信息作举例,实际信息数量一般更多;
※※同一天有多条资讯信息时,只取不同资讯的影响力最大值;某天无资讯信息时,当天影响力最大值计作0。
※※※将表2、表3中的具体值代入后,系统能够自动计算得出该举例结果为72.24。
如图4所示,行业SWOT分析指数库服务器中的所有行业各类SWOT分析指数以该图所展示的形式通过信息及数据输出终端的第一显示器提供给用户。所有子行业默认按照SWOT综合分析指数的大小排序,用户可以选择按照第一行的其他任意一个项目进行排序,方便监测出各类指数值的前几名或后几名子行业。
如图5所示,行业SWOT分析内容库服务器中单个行业的主要行业信息标题、行业数据指标名称、当期数值、涨跌幅等简要内容以该图所展示的形式通过信息及数据输出终端的第二显示器提供给用户。该图是用户点击图4中的某一个子行业后进入的页面,为用户展示了某个子行业最新的S、W、O、T四个方面(即表1所示四个方面)的资讯信息,并附上了与每条信息有关的供投资分析使用的行业数据。
如图6所示,行业SWOT分析内容库服务器中单条信息的更加详细的具体信息来源、时间、文字内容以及相关行业数据和股票数据以该图所展示的形式通过信息及数据输出终端的第二显示器提供给用户。左侧部分是信息及数据处理器筛选、分类、编辑后存储在行业SWOT分析内容库中的行业信息,具体包括信息标题、来源、时间和内容等;中间部分是从行业经济数据库自动调取的信息相关指标的名称、当期数值、涨跌幅等多项内容,该部分下方为多个行业数据指标的数据走势叠加对比图;右侧部分是从行业股票数据库自动调取的信息相关股票名称、最新价格、涨跌幅等多项内容,该部分下方为多个股票的股价走势叠加对比图。
以上是本发明应用于股票投资信息和数据处理的实施例,由以上实施例可以看出:
本发明能自动对行业投资信息搜索、抓取、筛选和加工,最后生成按照子行业分类的统一格式的信息。然后在设定的信息属于子行业内部或外部、利好或利空两个属性的基础上自动实现信息S、W、O、T类别的归类、存储和输出。本发明处理后的行业投资资讯信息分成了S、W、O、T四个部分,包括了行业内部情况和外部环境的各种利好与利空信息。信息在终端第二显示器上显示,具体包括标题、来源、日期、作者、具体文段等。
本发明能将信息内容中提到的行业数据类文字与服务器中的行业数据名称字段根据文字重复程度进行自动匹配,匹配到的行业数据将自动被调取并最终输出到终端显示给用户。本发明可以调用、保存和输出信息包含或有关的多个行业数据指标,数据指标在终端第二显示器上以走势图及具体值等形式进行展示。
本发明能根据行业股票数据库服务器中已有的逻辑关系自动调用上述行业数据指标已关联的股票,并从数据库中自动调用、存储和输出股票名称、股价、估值数据及财务数据等字段,这些字段在终端第二显示器上以走势图及具体值等多种形式进行展示。
本发明能自动根据各条信息的发布时间获取信息的时效性系数,并在划定信息影响力等级的基础上自动获取影响力预估系数,本发明能自动在上述两个数据基础上分别计算出S、W、O、T四类信息的影响力“期望值”,即为S、W、O、T四类SWOT分析投资指数,实现各类投资分析指数的自动计算、存储和输出。具体每个子行业包括一项SWOT分析综合投资指数和四项SWOT分析分类投资指数,上述指数在终端第一显示器上按大小排列显示,方便用户查看指数排在前后几名的子行业,从而可以及时发现投资价值或风险。SWOT投资指数在终端的显示形式不仅包括数据本身的列表平铺,还包括指数历史数据走势图形式。用户可以根据本发明在终端上输出的指数进行科学的行业分析研究,从而及时发现有投资价值或风险的子行业,使投资变得更加理性。
尽管本发明的内容已经通过上述优选实施例作了详细介绍,但应当认识到上述的描述不应被认为是对本发明的限制,本发明还可以应用于其他方面。在本领域技术人员阅读了上述内容后,对于本发明的多种修改和替代都将是显而易见的。因此,本发明的保护范围应由所附的权利要求来限定。

Claims (5)

1.一种基于SWOT模型的行业投资信息及数据处理系统,其特征在于包括:信息采集分类服务器,信息及数据处理服务器,以及信息及数据输出终端,其中:
所述信息采集分类服务器包括互联网上行业信息自动采集模块和行业信息手工补录模块;
所述信息及数据处理服务器包括信息筛选加工模块、SWOT分析模块、影响力量化模块、SWOT指数处理模块;
所述信息及数据输出终端包括主机、显示器;
上述组成中:
所述行业信息自动采集模块采用互联网智能信息采集技术定向搜集并存储互联网上的行业信息,自动搜集到的信息按照上述宏观及子行业自动分类和存储在信息采集处理服务器的存储器中,并利用信息内容的相似性自动进行重复判断,排除多余的重复信息;
所述行业信息手工补录模块仅在行业信息自动采集模块未能搜集到某条行业信息的情况下,才利用行业信息手工补录模块补录并存储该条信息,另外也可以通过本模块输入自有的原创信息内容;
所述信息筛选加工模块将信息采集分类服务器采集后分类存储的信息进行进一步的筛选和加工,将经过筛选留下的信息自动进行“格式清除”和“样式统一”,生成按照子行业分类的统一格式的信息,这些信息分行业存储在信息及数据处理服务器中;
所述SWOT分析模块将信息及数据处理服务器的存储器中的各个子行业信息分成S、W、O、T四个部分,划分过程将会调用两个数据库服务器:行业经济数据库服务器和行业股票数据库服务器;行业经济数据库服务器中存有相关行业数据的代码、名称、单位、数值等多个互相具有逻辑关系的字段,为每条信息匹配行业数据时,系统首先将信息内容中提到的行业数据与服务器中的行业数据名称字段根据相同文字关联程度进行自动匹配,其他字段信息将自动被调取并最终输出到终端显示给用户;行业股票数据库服务器中存有行业数据指标代码与该数据指标相关股票的逻辑关系,同时存有每个股票的股票代码、行情数据、估值数据及财务数据之间建有逻辑关系的字段;本模块再根据行业股票数据库服务器中已有的逻辑关系自动调用上述行业数据指标已关联的股票并将这些内容输出到终端显示给用户;上述S、W、O、T四个部分的各条信息及其调用的各类数据将存储在行业SWOT分析内容库服务器中,最终通过终端的第二显示器以多种形式的可视化图表提供给用户查看;
所述影响力量化模块是在上述SWOT分析和分类的基础上,将上述信息按照影响力预估标准进行影响力量化,量化标准根据影响程度不同设定了多个档次,每条信息的影响力值也存储在信息及数据处理服务器中,最终通过终端的第二显示器提供给用户查看,同时该值也是下一步SWOT指数处理模块的数据基础之一;
所述SWOT指数处理模块对不同时间的信息分别设定了影响概率系数,再通过系统自动计算得到S、W、O、T四类SWOT分析投资指数,这些指数经系统进一步自动计算后得到SWOT分析综合投资指数,上述指数结果存储在行业SWOT分析指数库服务器中,最终将输出到终端第一显示器中提供给用户使用。
2.根据权利要求1所述的基于SWOT模型的行业信息及数据处理系统,其特征是:所述行业信息自动采集模块,包括信息定向采集子模块、信息自动去重子模块以及信息自动分类子模块;其中:
信息定向采集子模块将预先设定的所有信息源的资讯信息进行采集存储,存储内容包括信息标题、来源、日期、作者、内容项目;信息自动去重子模块利用信息内容的相似性自动进行重复判断,可以预设重复的标准,自动删除与已有信息内容相同的信息;
信息自动分类子模块可以实现对所采集信息的自动初步归类,将各个子行业预先设定的所有网站信息初步归类到该子行业中。
3.根据权利要求2所述的基于SWOT模型的行业信息及数据处理系统,其特征是:所述信息筛选加工模块包括信息筛选子模块和编辑加工子模块;其中:
信息筛选子模块将信息采集分类服务器采集后分类存储的信息在前一模块自动去重的基础上进行进一步的筛选,自动删除一些不需要的信息;
编辑加工子模块将经过筛选留下的信息自动进行“格式清除”和“样式统一”;再将这些信息提供给编辑人员进行快速地发布前核查筛选;本模块最后生成按照子行业分类的统一格式的信息,这些信息分行业存储在信息及数据处理服务器中。
4.根据权利要求1-3任一项所述的基于SWOT模型的行业信息及数据处理系统,其特征是:所述SWOT分析模块包括信息属性确定子模块和相关数据调用子模块;其中:
信息属性确定子模块在对每条信息确定内部或外部、利好或利空两个属性的基础上实现对信息的自动S、W、O、T归类,S为子行业内部的利好信息,W为子行业内部的利空信息,O为子行业外部即所属大行业、上下游行业及宏观的利好信息,T为子行业外部即所属大行业、上下游行业及宏观的利空信息;
相关数据调用子模块首先将信息内容中提到的行业数据类文字与服务器中的行业数据名称字段根据文字重复程度进行自动匹配,其他字段信息将自动被调取并最终输出到终端显示给用户,然后根据行业股票数据库服务器中已有的逻辑关系自动调用上述行业数据指标已关联的股票,并最终将这些内容输出到终端显示给用户。
5.根据权利要求1-3任一项所述的基于SWOT模型的行业信息及数据处理系统,其特征是:所述SWOT指数处理模块,包括时效性系数设定子模块、SWOT分析分类投资指数处理子模块以及SWOT分析综合投资指数处理子模块;其中:
时效性系数设定子模块为一次性的参数设定工作,为后面自动计算指数提供数据基础,具体是对不同时间的信息分别设定了时效性系数,取最近n天的信息划定计算范围,每天的时效性系数随着时间的推移而递减,n天的时效性系数之和为1,这里的“天”根据不同国家和地区证券市场收盘时间的不同进行不同的规定;
SWOT分析分类投资指数处理子模块是在上述影响力值、时效性系数两个数据基础上分别得到S、W、O、T四类信息的影响力“期望值”,即为S、W、O、T四类SWOT分析投资指数,具体过程是首先取当天所有已有资讯的影响力最大值,然后求每天的“最大影响力×时效性系数”,最后将n天的上述结果加和,得出“∑最大影响力×概率”即为SWOT分析分类投资指数;
SWOT分析综合投资指数处理子模块是将S、W、O、T四类SWOT分析投资指数进行加减运算,得到综合投资指数结果,即“SWOT分析综合投资指数=SWOT分析S指数-SWOT分析W指数+SWOT分析O指数-SWOT分析T指数”;
上述三个子模块自动得出的指数结果存储在行业SWOT分析指数库服务器中,最终将输出到终端第一显示器中提供给用户使用。
CN201210253785.4A 2012-07-20 2012-07-20 一种基于swot模型的行业投资信息及数据处理系统 Active CN103218744B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210253785.4A CN103218744B (zh) 2012-07-20 2012-07-20 一种基于swot模型的行业投资信息及数据处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210253785.4A CN103218744B (zh) 2012-07-20 2012-07-20 一种基于swot模型的行业投资信息及数据处理系统

Publications (2)

Publication Number Publication Date
CN103218744A true CN103218744A (zh) 2013-07-24
CN103218744B CN103218744B (zh) 2016-08-31

Family

ID=48816501

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210253785.4A Active CN103218744B (zh) 2012-07-20 2012-07-20 一种基于swot模型的行业投资信息及数据处理系统

Country Status (1)

Country Link
CN (1) CN103218744B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104123668A (zh) * 2014-03-30 2014-10-29 广州天策软件科技有限公司 基于标准量化参数动态筛选海量数据的方法及其在金融证券领域的应用
CN104935528A (zh) * 2015-06-10 2015-09-23 柳州市智融科技有限公司 互联网大数据处理平台
CN104933124A (zh) * 2015-06-10 2015-09-23 柳州市智融科技有限公司 互联网大数据处理系统
CN104980254A (zh) * 2015-06-10 2015-10-14 柳州市智融科技有限公司 因特网信息处理系统
CN105007237A (zh) * 2015-06-10 2015-10-28 柳州市智融科技有限公司 网络信息处理平台
CN105007232A (zh) * 2015-06-10 2015-10-28 柳州市智融科技有限公司 网络大数据处理平台
CN105007236A (zh) * 2015-06-10 2015-10-28 柳州市智融科技有限公司 网络大数据处理系统
CN105022664A (zh) * 2015-06-10 2015-11-04 柳州市智融科技有限公司 互联网信息处理系统
CN105049371A (zh) * 2015-06-10 2015-11-11 柳州市智融科技有限公司 网络信息处理系统
CN105447130A (zh) * 2015-11-18 2016-03-30 北京奇虎科技有限公司 网络小说新章节的获取方法及装置
CN106156358A (zh) * 2016-07-29 2016-11-23 苏州商信宝信息科技有限公司 一种基于搜索企业时的福利信息展现方法
CN107180298A (zh) * 2017-04-26 2017-09-19 北京望远迅杰科技有限公司 一种投资项目的推荐方法
CN107292744A (zh) * 2017-06-07 2017-10-24 前海梧桐(深圳)数据有限公司 基于机器学习的投资趋势分析方法及其系统
CN109597936A (zh) * 2018-11-30 2019-04-09 成都数联铭品科技有限公司 一种新用户筛选系统及方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107958386A (zh) * 2017-11-09 2018-04-24 安徽创瑞信息技术有限公司 一种投资信息咨询管理系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101566987A (zh) * 2008-04-23 2009-10-28 北京六所和瑞科技发展有限公司 二次信息资源数据库系统及其资源处理方法
CN101582133A (zh) * 2008-05-14 2009-11-18 北京六所和瑞科技发展有限公司 一种方案评审系统及评审方法
CN102508856A (zh) * 2011-09-28 2012-06-20 广东启明科技发展有限公司 数据统计分析平台系统
CN102502565A (zh) * 2011-11-01 2012-06-20 江苏新泰材料科技有限公司 一种制备六氟磷酸锂的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101566987A (zh) * 2008-04-23 2009-10-28 北京六所和瑞科技发展有限公司 二次信息资源数据库系统及其资源处理方法
CN101582133A (zh) * 2008-05-14 2009-11-18 北京六所和瑞科技发展有限公司 一种方案评审系统及评审方法
CN102508856A (zh) * 2011-09-28 2012-06-20 广东启明科技发展有限公司 数据统计分析平台系统
CN102502565A (zh) * 2011-11-01 2012-06-20 江苏新泰材料科技有限公司 一种制备六氟磷酸锂的方法

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104123668A (zh) * 2014-03-30 2014-10-29 广州天策软件科技有限公司 基于标准量化参数动态筛选海量数据的方法及其在金融证券领域的应用
CN105049371A (zh) * 2015-06-10 2015-11-11 柳州市智融科技有限公司 网络信息处理系统
CN105022664A (zh) * 2015-06-10 2015-11-04 柳州市智融科技有限公司 互联网信息处理系统
CN104980254A (zh) * 2015-06-10 2015-10-14 柳州市智融科技有限公司 因特网信息处理系统
CN105007237A (zh) * 2015-06-10 2015-10-28 柳州市智融科技有限公司 网络信息处理平台
CN105007232A (zh) * 2015-06-10 2015-10-28 柳州市智融科技有限公司 网络大数据处理平台
CN105007236A (zh) * 2015-06-10 2015-10-28 柳州市智融科技有限公司 网络大数据处理系统
CN104933124A (zh) * 2015-06-10 2015-09-23 柳州市智融科技有限公司 互联网大数据处理系统
CN104935528A (zh) * 2015-06-10 2015-09-23 柳州市智融科技有限公司 互联网大数据处理平台
CN105447130A (zh) * 2015-11-18 2016-03-30 北京奇虎科技有限公司 网络小说新章节的获取方法及装置
CN105447130B (zh) * 2015-11-18 2018-12-25 北京奇虎科技有限公司 网络小说新章节的获取方法及装置
CN106156358A (zh) * 2016-07-29 2016-11-23 苏州商信宝信息科技有限公司 一种基于搜索企业时的福利信息展现方法
CN107180298A (zh) * 2017-04-26 2017-09-19 北京望远迅杰科技有限公司 一种投资项目的推荐方法
CN107292744A (zh) * 2017-06-07 2017-10-24 前海梧桐(深圳)数据有限公司 基于机器学习的投资趋势分析方法及其系统
CN109597936A (zh) * 2018-11-30 2019-04-09 成都数联铭品科技有限公司 一种新用户筛选系统及方法
CN109597936B (zh) * 2018-11-30 2023-09-05 成都数联铭品科技有限公司 一种新用户筛选系统及方法

Also Published As

Publication number Publication date
CN103218744B (zh) 2016-08-31

Similar Documents

Publication Publication Date Title
CN103218744A (zh) 一种基于swot模型的行业投资信息及数据处理系统
CN110751371B (zh) 基于统计四分位距的商品库存风险预警方法、系统及计算机可读存储介质
CN103154991B (zh) 信用风险采集
CN107145586B (zh) 一种基于电力营销数据的标签产出方法和装置
CN108960627A (zh) 一种基于科研项目的全进度监控管理系统及方法
CN104077407B (zh) 一种智能数据搜索系统及方法
CN110399363B (zh) 一种问题数据全生命周期数据质量管理方法及系统
Cao et al. Research on Python data visualization technology
CN114048892A (zh) 一种基于大数据的中小企业风险预警系统及方法
CN110619462A (zh) 一种基于ai模型的项目质量评估方法
CN109754187A (zh) 工程造价指标分类与测算数据治理系统
AU2017356848A1 (en) Technological emergence scoring and analysis platform
KR100853022B1 (ko) 기사 자동 생성 방법 및 그 장치
CN113590607A (zh) 一种基于报表因子的电力营销报表实现方法和系统
CN103473305A (zh) 一种在统计分析中进行决策流程展示的方法及系统
Zou et al. Cross-correlation analysis between energy and carbon markets in China based on multifractal theory
Chen et al. Analysis the impact of XBRL in China’s capital market using methods of empirical research
Aue et al. Predicting Companies' ESG Ratings from News Articles Using Multivariate Timeseries Analysis
CN116228402A (zh) 一种金融征信特征仓库技术支持系统
Lopata et al. Financial data preprocessing Issues
CN113537758A (zh) 基于大数据技术的制造业高质量发展综合评价方法和系统
CN111815453A (zh) 一种电力交易运营系统
Felden et al. Web farming and data warehousing for energy tradefloors
Sodiqovich ISSUES OF ACCOUNTING AND ANALYTICAL SUPPORT OF PRODUCTION PROCESSES OF TRANSPORT ENTERPRISES
CN115409297B (zh) 一种政务服务流程优化方法、系统及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant