CN111612601A - 基于服务机构的上市公司的财务风险识别方法及装置 - Google Patents

基于服务机构的上市公司的财务风险识别方法及装置 Download PDF

Info

Publication number
CN111612601A
CN111612601A CN202010306646.8A CN202010306646A CN111612601A CN 111612601 A CN111612601 A CN 111612601A CN 202010306646 A CN202010306646 A CN 202010306646A CN 111612601 A CN111612601 A CN 111612601A
Authority
CN
China
Prior art keywords
information
service
annual
annual report
listed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010306646.8A
Other languages
English (en)
Other versions
CN111612601B (zh
Inventor
部慧
吴俊杰
唐文金
姚磊
王岸汀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhixindu Technology Co ltd
Original Assignee
Beijing Zhixindu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhixindu Technology Co ltd filed Critical Beijing Zhixindu Technology Co ltd
Priority to CN202010306646.8A priority Critical patent/CN111612601B/zh
Publication of CN111612601A publication Critical patent/CN111612601A/zh
Application granted granted Critical
Publication of CN111612601B publication Critical patent/CN111612601B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/125Finance or payroll
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Technology Law (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种基于服务机构的上市公司的财务风险识别方法,包括:步骤一、提取上市公司各年度报告的信息数据;步骤二、建立以公司信息为实体节点,以服务机构信息和年度报告年份等为属性节点的关联关系;步骤三、构建机构黑名单,其为经中国证券监督管理委员会作出过行政处罚的服务机构和/或涉及过财务造假或财务舞弊的舆情信息的服务机构;步骤四、以机构黑名单上的服务机构名称为关键词,输出与该服务机构关联的上市公司信息和年度报告年份等;步骤五、计算问题公司占比和问题年度报告占比。本方法具有识别上市公司的财务风险的有益效果。还提供了一种基于服务机构的上市公司的财务风险识别装置,本装置具有识别上市公司的财务风险的作用。

Description

基于服务机构的上市公司的财务风险识别方法及装置
技术领域
本发明涉及数据挖掘和商务智能领域。更具体地说,本发明涉及一种基于服务机构的上市公司的财务风险识别方法及装置。
背景技术
自资本市场创立以来,上市公司财务造假的现象就一直层出不穷。部分上市公司为了达到监管部门对业绩的相关要求,采用种种方法粉饰其财务报表,甚至出现严重造假的情况。近年来这种状况呈现出了愈演愈烈的态势。对于持有财务爆雷公司股票的投资者而言,其投资损失非常惨重。可以说,上市公司的财务造假已经严重威胁到了投资者的财产安全和投资情绪。
当前,对于上市公司财务造假的分析研究更多着眼于从爆雷公司财务报表数据的异常中寻找统一的造假逻辑,并通过建立分类模型筛选出有较高财务造假风险的公司,随后对其进行重点调查分析。但同时,在针对上市公司财务造假的调查中,许多监管机构也注意到了上市公司财务问题背后的各种服务机构所起到的巨大助推作用。在近年来密集出现的财务造假大案中,部分会计师事务所被频频点名,引发了公众的广泛质疑。尤其是会计师事务所需要对上市公司的财务报表进行审计并出具审计意见,此审计意见将是公众及监管部门判断公司是否存在财务风险的重要参考,对投资者的投资意向和具体行为选择也会产生导向性作用。一旦会计师事务所出现工作上的失误,无论其主观故意与否,所带来的影响将难以估量。另外,除会计师事务所以外,与上市公司相关的律师事务所、保荐机构等服务机构同样值得关注。不过,由于服务机构的失察具有调查取证不易、隐蔽性强、后果比较严重等特点,确实为监管和执法增添了难度和压力。如何通过监管此类服务机构以寻找财务舞弊的蛛丝马迹,对监管部门来说仍是不小的挑战。
发明内容
本发明的一个目的是解决至少上述问题,并提供至少后面将说明的优点。
本发明还有一个目的是提供一种基于服务机构的上市公司的财务风险识别方法,通过提供基于服务机构的问题上市公司占比和问题年度报告占比数据,有助于分析人员识别各上市公司可能的财务风险。对信用不良、频出问题的服务机构进行重点分析,以助于识别具有潜在财务风险的上市公司。
还提供了一种基于服务机构的上市公司的财务风险识别装置,本装置具有识别上市公司的财务风险的作用。
为了实现根据本发明的这些目的和其它优点,提供了一种基于服务机构的上市公司的财务风险识别方法,包括以下步骤:
步骤一、获取上市公司的多个年度报告,提取各年度报告中的信息数据,该信息数据至少包括上市公司信息、服务机构信息、年度报告年份、意见信息四类;
步骤二、以步骤一提取的信息数据建立关联关系,建立以上市公司信息为实体节点,以服务机构信息、年度报告年份、意见信息为属性节点的关联关系;
步骤三、构建机构黑名单,所述机构黑名单为经中国证券监督管理委员会作出过行政处罚的服务机构和/或涉及过财务造假或财务舞弊的舆情信息的服务机构,所述机构黑名单中各服务机构至少包括该服务机构名称、该行政处罚和/或舆情信息涉及的上市公司名称、该行政处罚和/或舆情信息涉及的年度报告年份,并统计各服务机构对应的上市公司数量和年度报告数量;
步骤四、以步骤三中的机构黑名单上的服务机构名称为关键词,根据步骤二建立的关联关系查询,输出得到与该服务机构关联的上市公司信息、年度报告年份、意见信息,并统计各服务机构对应的上市公司数量和年度报告数量;
步骤五、分别计算步骤三中的上市公司数量与步骤四中的上市公司数量的比值和步骤三中年度报告数量与步骤四中年度报告数量的比值,并且按降序的顺序分别对上市公司数量比值和年度报告比值排序,并同时列出上市公司数量和年度报告数量。
优选的是,步骤一中获取上市公司的多个年度报告的具体方法为:
创建年度报告下载列表,并设置该年度报告下载列表包括的各年度报告的存储路径,所述年度报告下载列表至少包括上市公司名称和股票代码、年度报告年份、年度报告下载链接三个属性;
读取年度报告下载列表中的多个属性作为字段向Elasticsearch数据库请求查询,并将查询结果中对应的字段内容按属性填入下载列表内;
按创建的多个进程,根据年度报告下载列表中的下载链接下载资源,并按照预设的存储路径存储年度报告,直至年度报告下载列表中所有元组下载完成。
优选的是,还包括在提取各年度报告的信息数据前,过滤掉无法打开的年度报告和年度报告的文件大小小于文件大小阈值的年度报告。
优选的是,提取各年度报告的信息数据的方法具体为:提取年度报告的目录页,提取目录页中与服务机构相关的目录页,根据该目录页的页码获取对应页码的文本内容,从该文本内容中提取上市公司信息、服务机构信息、意见信息,并写入新建的csv文件中。
提供一种基于服务机构的上市公司的财务风险识别装置,包括:
存储模块,其用于存储上市公司的多个年度报告和机构黑名单,其中,所述机构黑名单为经中国证券监督管理委员会作出过行政处罚的服务机构和/或涉及过财务造假或财务舞弊的舆情信息的服务机构,所述机构黑名单中各服务机构至少包括该服务机构名称、该行政处罚和/或舆情信息涉及的上市公司名称、该行政处罚和/或舆情信息涉及的年度报告年份,并统计各服务机构对应的上市公司数量和年度报告数量;
提取模块,其用于读取所述存储模块存储的年度报告,并提取各年度报告的信息数据,该信息数据至少包括上市公司信息、服务机构信息、年度报告年份、意见信息四类;
处理模块,其用于采用提取模块提取到的信息数据建立关联关系,建立以上市公司信息为实体节点,以服务机构信息、年度报告年份、意见信息为属性节点的关联关系;
筛选模块,其用于读取存储模块存储的机构黑名单,以机构黑名单上的服务机构名称为关键词,根据处理模块建立的关联关系,输出得到与该服务机构关联的上市公司信息、年度报告年份、意见信息,并统计各服务机构对应的上市公司数量和年度报告数量;
输出模块,其用于分别计算步骤三中的上市公司数量与步骤四中的上市公司数量的比值和步骤三中年度报告数量与步骤四中年度报告数量的比值,并且按降序的顺序分别对上市公司数量比值和年度报告比值排序,并同时显示上市公司数量和年度报告数量。
优选的是,还包括:
获取模块,其用于创建年度报告下载列表,所述年度报告下载列表至少包括上市公司名称和股票代码、年度报告年份、年度报告下载链接三个属性;
所述获取模块与Elasticsearch数据库建立通讯连接,所述获取模块用于读取年度报告下载列表中的多个属性作为字段向Elasticsearch数据库请求查询,并将查询结果中对应的字段内容按属性填入下载列表内;
下载模块,其与Elasticsearch数据库建立通讯连接,所述下载模块用于按创建的多个进程,根据年度报告下载列表中的下载链接下载资源,并按照预设的存储路径存储年度报告,直至年度报告下载列表中所有元组下载完成。
优选的是,所述提取模块在提取各年度报告的信息数据前,还用于读取所述存储模块存储的年度报告,并过滤掉无法打开的年度报告和年度报告的文件大小小于文件大小阈值的年度报告。
优选的是,所述提取模块提取各年度报告的信息数据的方法具体为:提取年度报告的目录页,提取目录页中与服务机构相关的目录页,根据该目录页的页码获取对应页码的文本内容,从该文本内容中提取上市公司信息、服务机构信息、意见信息,并写入新建的csv文件中。
提供一种电子设备,包括:
一个或多个处理器;
存储器;以及
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括用于执行上述所述的指令。
提供一种计算机可读存储介质,存储于具有一种电子设备结合使用的计算机程序,所述计算机程序可被处理器执行以实现上述所述的方法。
本发明至少包括以下有益效果:
第一、可以运用于各个行业各个板块的上市公司,能够作为常见的分类模型式财务风险识别方法的有力补充,使判断结果更精确。
第二、不仅关注会计师事务所和相应注册会计师,同时也对上市公司合作的律师事务所、保荐机构等第三方中介机构进行关键信息提取,旨在做到全面考察各类服务机构。同时,信息提取过程采用计算机程序处理,提高效率的同时降低了人力成本。
第三、从服务机构(如首先从会计师事务所)入手,统计其审核后仍然出现问题的年度报告比例,从而抓取出表现不佳的服务机构,以供分析人员重点考察分析,能够有更大概率捕捉到上市公司的疑似财务风险。
本发明的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本发明的研究和实践而为本领域的技术人员所理解。
附图说明
图1为本发明其中一种技术方案的所述财务风险识别方法的框架图。
具体实施方式
下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
如图1所示,本发明提供一种基于服务机构的上市公司的财务风险识别方法,包括以下步骤:
步骤一、获取上市公司的多个年度报告,提取各年度报告中的信息数据,该信息数据至少包括上市公司信息、服务机构信息、年度报告年份、意见信息四类;由于上市公司每年都需要向外界以年度报告的形式公开财务情况,因此,可以通过搜集上市公司公开年度报告的渠道,搜集上市公司历年的年度报告,为更好的利用年度报告,采用提取年度报告中的信息数据,比如上市公司信息,包括上市公司名称、股票名称、公司简介等,可用于标识一个上市公司的特性,比如服务机构信息,包括服务于该上市公司的服务机构名称、审计该份年度报告的服务机构的责任人、该服务机构简介等,可用于标识一个服务机构的特性,比如年度报告年份,由于年度报告是按年度出具的,因此,只需识别到年份即可,比如意见信息,是服务机构针对当前年份上市公司的财务状况给出的专业性结论,以及作出该意见信息的责任人。提取上述信息数据可以精准全面的反映某一年度报告所体现的各类信息。如此,当采用步骤二中建立的关联关系后,可以以每一个属性节点为标签,输出对应的信息数据,方便分析人员从各个属性节点了解上市公司的相关信息。
步骤二、以步骤一提取的信息数据建立关联关系,建立以上市公司信息为实体节点,以服务机构信息、年度报告年份、意见信息为属性节点的关联关系;由于上市公司数量多,每个上市公司选择的服务机构在每年也可能发生变化,如果仅仅是将提取的信息数据进行普通的储存,那么对于后期分析人员而言,如果要利用上述提取的信息数据做为参考以评估识别某一上市公司是否存在财务风险及财务风险跟其它上市公司相比财务风险有多大,都是一个工作量巨大,且难于做到全面,精准的工作,因此,采用将上述各项信息数据以实体节点和属性节点的方式建立关联关系,可便于分析人员从众多繁杂的信息数据中精准快捷的找到目标信息数据。
步骤三、构建机构黑名单,所述机构黑名单为经中国证券监督管理委员会作出过行政处罚的服务机构和/或涉及过财务造假或财务舞弊的舆情信息的服务机构,所述机构黑名单中各服务机构至少包括该服务机构名称、该行政处罚和/或舆情信息涉及的上市公司名称、该行政处罚和/或舆情信息涉及的年度报告年份,并统计各服务机构对应的上市公司数量和年度报告数量;采用构建机构黑名单的方式,可以直观的知晓某一服务机构是否在之前出现过对财务造假或财务舞弊失察行为,若出现过,说明该服务机构出具的意见信息存在一定的不可信度,但针对海量的服务机构和上市公司,分析人员难于快速便捷精准的找出对应的年度报告、上市公司、服务机构,因此,步骤三通过搜集中国证券监督管理委员会和各大互联网媒体发布的海量信息,采用信息提取技术提取能够标识出服务机构、上市公司、年度报告对应的字段,构建机构黑名单,以备分析人员使用,互联网媒体包括但不限于微信公众号、综合门户网站财经频道、第三方专业金融财经门户、金融在线论坛、新浪微博、知乎网等,通过机构黑名单,分析人员可以快速了解查询到每个存在失察行为的服务机构(之后简称问题服务机构)所服务过的存在财务造假或财务舞弊的行为的上市公司(之后简称问题上市公司)和涉及财务造假或财务舞弊的年度报告(之后简称问题年度报告),并可以通过数量排序的方式,直观快捷的得知问题上市公司数量较多的问题服务机构和问题年度报告数量较多的问题服务机构。
步骤四、以步骤三中的机构黑名单上的服务机构名称为关键词,根据步骤二建立的关联关系查询,输出得到与该服务机构关联的上市公司信息、年度报告年份、意见信息,并统计各服务机构对应的上市公司数量和年度报告数量;虽然知晓了一个问题服务机构服务过的问题上市公司的数量和出具过问题年度报告的数量众多,但还不足于全面反映问题机构的可信度信息,比如,一家问题服务机构,虽然出具过多个问题年度报告(比如5个),但是经该问题服务机构出具的总的年度报告的数量盘大(比如5000个),而另一问题服务机构出具过的问题年度报告的数量比如1个,但是经该问题服务机构出具过的总的年度报告的数量小,比如5个,显然只采用步骤二中建立的机构黑名单不能全面反应问题服务机构的全貌,因此,采用步骤四的方法可以快速准确的输出某一服务机构服务过的上市公司数量和出具过的年度报告数量,以便分析人员进一步参考。
步骤五、分别计算步骤三中的上市公司数量与步骤四中的上市公司数量的比值和步骤三中年度报告数量与步骤四中年度报告数量的比值,并且按降序的顺序分别对上市公司数量比值和年度报告比值排序,并同时列出上市公司数量和年度报告数量。通过计算每一问题服务机构所服务过的问题上市公司的占比和出具过的问题年度报告的占比可以更精准的知晓问题服务机构的情况,给予分析人员更全面的基础数据,并且同时列出各类上市公司数量和年度报告数量,进一步提供了分析数据,有助于分析人员重点关注一些问题服务机构,及该问题服务机构服务的上市公司,从而精准全面识别上市公司的财务风险。
在上述技术方案中,通过获取上市公司的年度报告,提取各年度报告中的信息数据,构建以上市公司信息为实体节点,以服务机构信息、年度报告年份、意见信息为属性节点的关联关系,可以用于提供盘大的服务机构、上市公司、年度报告、意见信息网络,以供分析人员查询,利用从中国证券监督管理委员会官网以及公开互联网各个渠道中获得的问题上市公司、问题年度报告、问题服务机构等关键材料,搭建机构黑名单,利用服务机构与问题上市公司之间的对应关系,以供分析人员查询具有财务风险的服务机构、上市公司、年度报告,综合两个信息数据,可供分析人员用以识别各上市公司可能的财务风险。对信用不良、频出问题的服务机构进行重点分析,以助于识别具有潜在财务风险的上市公司。
本方法基于服务机构的信用记录构建了上市公司、服务机构、年度报告(年度报告审计负责人)网络系统,全面考察各类服务机构,补充了常见的分类式财务风险识别法,能够更迅速而准确地捕捉到上市公司可能的财务风险。
在另一种技术方案中,步骤一中获取上市公司的多个年度报告的具体方法为:
创建年度报告下载列表,并设置该年度报告下载列表包括的各年度报告的存储路径,所述年度报告下载列表至少包括上市公司名称和股票代码、年度报告年份、年度报告下载链接三个属性;年度报告优选用PDF格式的;
读取年度报告下载列表中的多个属性作为字段向Elasticsearch数据库请求查询,并将查询结果中对应的字段内容按属性填入下载列表内;
按创建的多个进程,根据年度报告下载列表中的下载链接下载资源,并按照预设的存储路径存储年度报告,直至年度报告下载列表中所有元组下载完成。
在上述技术方案中,利用现有的Elasticsearch数据库,采用创建年度报告下载列表的方式,可以实现下载列表中各属性的自动填充,以及建立属性之间的关联关系,并通过以各属性为字段向Elasticsearch数据库请求查询,可以实现自动将各属性数据关联至各属性,以及通过创建多进程,可以同时下载多个资源,提高下载效率,节约下载时间。
在另一种技术方案中,还包括在提取各年度报告的信息数据前,过滤掉无法打开的年度报告和年度报告的文件大小小于文件大小阈值的年度报告。为避免年度报告中各信息数据的提取出现问题,在提取信息数据前,先对年度报告进行不合格过滤。
在另一种技术方案中,提取各年度报告的信息数据的方法具体为:提取年度报告的目录页,提取目录页中与服务机构相关的目录页,根据该目录页的页码获取对应页码的文本内容,从该文本内容中提取上市公司信息、服务机构信息、意见信息,并写入新建的csv文件中。通常采用相关关键字词的文本利用匹配的方法进行直接提取,比如,设定一些关键字词,“会计师事务所”、“注册会计师”、“签字会计师”、“保荐”、“保荐机构”、“保荐代表”、“持续督导”、“审计意见类型”等,在文本内容中迭代寻找这些关键字词。若匹配成功(即成功找到关键字词)则将对应信息提取出来,从而获得服务机构信息。因为年度报告的特有的格式,通过目录页提取方式可以更全面、快速、精准的提取到所需要信息数据。
提供一种基于服务机构的上市公司的财务风险识别装置,包括:
存储模块,其用于存储上市公司的多个年度报告和机构黑名单,其中,所述机构黑名单为经中国证券监督管理委员会作出过行政处罚的服务机构和/或涉及过财务造假或财务舞弊的舆情信息的服务机构,所述机构黑名单中各服务机构至少包括该服务机构名称、该行政处罚和/或舆情信息涉及的上市公司名称、该行政处罚和/或舆情信息涉及的年度报告年份,并统计各服务机构对应的上市公司数量和年度报告数量;
提取模块,其用于读取所述存储模块存储的年度报告,并提取各年度报告的信息数据,该信息数据至少包括上市公司信息、服务机构信息、年度报告年份、意见信息四类;
处理模块,其用于采用提取模块提取到的信息数据建立关联关系,建立以上市公司信息为实体节点,以服务机构信息、年度报告年份、意见信息为属性节点的关联关系;
筛选模块,其用于读取存储模块存储的机构黑名单,以机构黑名单上的服务机构名称为关键词,根据处理模块建立的关联关系,输出得到与该服务机构关联的上市公司信息、年度报告年份、意见信息,并统计各服务机构对应的上市公司数量和年度报告数量;
输出模块,其用于分别计算步骤三中的上市公司数量与步骤四中的上市公司数量的比值和步骤三中年度报告数量与步骤四中年度报告数量的比值,并且按降序的顺序分别对上市公司数量比值和年度报告比值排序,并同时显示上市公司数量和年度报告数量。
在上述技术方案中,通过存储模块存储获取的上市公司的年度报告,提取模块提取的各年度报告中的信息数据,处理模块构建的以上市公司信息为实体节点,以服务机构信息、年度报告年份、意见信息为属性节点的关联关系,可以用于提供盘大的服务机构、上市公司、年度报告、意见信息网络,以供分析人员查询,存储模块存储利用从中国证券监督管理委员会官网以及公开互联网各个渠道中获得的问题上市公司、问题年度报告、问题服务机构等关键材料,搭建机构黑名单,利用服务机构与问题上市公司之间的对应关系,以供分析人员查询具有财务风险的服务机构、上市公司、年度报告,输出模块综合两个信息数据,可供分析人员用以识别各上市公司可能的财务风险。对信用不良、频出问题的服务机构进行重点分析,以助于识别具有潜在财务风险的上市公司。
在另一种技术方案中,还包括:
获取模块,其用于创建年度报告下载列表,所述年度报告下载列表至少包括上市公司名称和股票代码、年度报告年份、年度报告下载链接三个属性;
所述获取模块与Elasticsearch数据库建立通讯连接,所述获取模块用于读取年度报告下载列表中的多个属性作为字段向Elasticsearch数据库请求查询,并将查询结果中对应的字段内容按属性填入下载列表内;
下载模块,其与Elasticsearch数据库建立通讯连接,所述下载模块用于按创建的多个进程,根据年度报告下载列表中的下载链接下载资源,并按照预设的存储路径存储年度报告,直至年度报告下载列表中所有元组下载完成。
在上述技术方案中,获取模块利用现有的Elasticsearch数据库,采用创建年度报告下载列表的方式,可以实现下载列表中各属性的自动填充,以及建立属性之间的关联关系,并通过以各属性为字段向Elasticsearch数据库请求查询,可以实现自动将各属性数据关联至各属性,以及下载模块通过创建多进程,可以同时下载多个资源,提高下载效率,节约下载时间。
在另一种技术方案中,所述提取模块在提取各年度报告的信息数据前,还用于读取所述存储模块存储的年度报告,并过滤掉无法打开的年度报告和年度报告的文件大小小于文件大小阈值的年度报告。为避免年度报告中各信息数据的提取出现问题,提取模块在提取信息数据前,先对年度报告进行不合格过滤。
在另一种技术方案中,所述提取模块提取各年度报告的信息数据的方法具体为:提取年度报告的目录页,提取目录页中与服务机构相关的目录页,根据该目录页的页码获取对应页码的文本内容,从该文本内容中提取上市公司信息、服务机构信息、意见信息,并写入新建的csv文件中。因为年度报告的特有的格式,提取模块通过目录页提取方式可以更全面、快速、精准的提取到所需要信息数据。
提供一种电子设备,包括:
一个或多个处理器;
存储器;以及
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括用于执行上述方法所述的指令。
提供一种计算机可读存储介质,存储于具有一种电子设备结合使用的计算机程序,所述计算机程序可被处理器执行以实现上述方法所述的方法。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。

Claims (10)

1.基于服务机构的上市公司的财务风险识别方法,其特征在于,包括以下步骤:
步骤一、获取上市公司的多个年度报告,提取各年度报告中的信息数据,该信息数据至少包括上市公司信息、服务机构信息、年度报告年份、意见信息四类;
步骤二、以步骤一提取的信息数据建立关联关系,建立以上市公司信息为实体节点,以服务机构信息、年度报告年份、意见信息为属性节点的关联关系;
步骤三、构建机构黑名单,所述机构黑名单为经中国证券监督管理委员会作出过行政处罚的服务机构和/或涉及过财务造假或财务舞弊的舆情信息的服务机构,所述机构黑名单中各服务机构至少包括该服务机构名称、该行政处罚和/或舆情信息涉及的上市公司名称、该行政处罚和/或舆情信息涉及的年度报告年份,并统计各服务机构对应的上市公司数量和年度报告数量;
步骤四、以步骤三中的机构黑名单上的服务机构名称为关键词,根据步骤二建立的关联关系查询,输出得到与该服务机构关联的上市公司信息、年度报告年份、意见信息,并统计各服务机构对应的上市公司数量和年度报告数量;
步骤五、分别计算步骤三中的上市公司数量与步骤四中的上市公司数量的比值和步骤三中年度报告数量与步骤四中年度报告数量的比值,并且按降序的顺序分别对上市公司数量比值和年度报告比值排序,并同时列出上市公司数量和年度报告数量。
2.如权利要求1所述的基于服务机构的上市公司的财务风险识别方法,其特征在于,
步骤一中获取上市公司的多个年度报告的具体方法为:
创建年度报告下载列表,并设置该年度报告下载列表包括的各年度报告的存储路径,所述年度报告下载列表至少包括上市公司名称和股票代码、年度报告年份、年度报告下载链接三个属性;
读取年度报告下载列表中的多个属性作为字段向Elasticsearch数据库请求查询,并将查询结果中对应的字段内容按属性填入下载列表内;
按创建的多个进程,根据年度报告下载列表中的下载链接下载资源,并按照预设的存储路径存储年度报告,直至年度报告下载列表中所有元组下载完成。
3.如权利要求1所述的基于服务机构的上市公司的财务风险识别方法,其特征在于,还包括在提取各年度报告的信息数据前,过滤掉无法打开的年度报告和年度报告的文件大小小于文件大小阈值的年度报告。
4.如权利要求1所述的基于服务机构的上市公司的财务风险识别方法,其特征在于,
提取各年度报告的信息数据的方法具体为:提取年度报告的目录页,提取目录页中与服务机构相关的目录页,根据该目录页的页码获取对应页码的文本内容,从该文本内容中提取上市公司信息、服务机构信息、意见信息,并写入新建的csv文件中。
5.基于服务机构的上市公司的财务风险识别装置,其特征在于,包括:
存储模块,其用于存储上市公司的多个年度报告和机构黑名单,其中,所述机构黑名单为经中国证券监督管理委员会作出过行政处罚的服务机构和/或涉及过财务造假或财务舞弊的舆情信息的服务机构,所述机构黑名单中各服务机构至少包括该服务机构名称、该行政处罚和/或舆情信息涉及的上市公司名称、该行政处罚和/或舆情信息涉及的年度报告年份,并统计各服务机构对应的上市公司数量和年度报告数量;
提取模块,其用于读取所述存储模块存储的年度报告,并提取各年度报告的信息数据,该信息数据至少包括上市公司信息、服务机构信息、年度报告年份、意见信息四类;
处理模块,其用于采用提取模块提取到的信息数据建立关联关系,建立以上市公司信息为实体节点,以服务机构信息、年度报告年份、意见信息为属性节点的关联关系;
筛选模块,其用于读取存储模块存储的机构黑名单,以机构黑名单上的服务机构名称为关键词,根据处理模块建立的关联关系,输出得到与该服务机构关联的上市公司信息、年度报告年份、意见信息,并统计各服务机构对应的上市公司数量和年度报告数量;
输出模块,其用于分别计算步骤三中的上市公司数量与步骤四中的上市公司数量的比值和步骤三中年度报告数量与步骤四中年度报告数量的比值,并且按降序的顺序分别对上市公司数量比值和年度报告比值排序,并同时显示上市公司数量和年度报告数量。
6.如权利要求5所述的基于服务机构的上市公司的财务风险识别装置,其特征在于,还包括:
获取模块,其用于创建年度报告下载列表,所述年度报告下载列表至少包括上市公司名称和股票代码、年度报告年份、年度报告下载链接三个属性;
所述获取模块与Elasticsearch数据库建立通讯连接,所述获取模块用于读取年度报告下载列表中的多个属性作为字段向Elasticsearch数据库请求查询,并将查询结果中对应的字段内容按属性填入下载列表内;
下载模块,其与Elasticsearch数据库建立通讯连接,所述下载模块用于按创建的多个进程,根据年度报告下载列表中的下载链接下载资源,并按照预设的存储路径存储年度报告,直至年度报告下载列表中所有元组下载完成。
7.如权利要求5所述的基于服务机构的上市公司的财务风险识别装置,其特征在于,
所述提取模块在提取各年度报告的信息数据前,还用于读取所述存储模块存储的年度报告,并过滤掉无法打开的年度报告和年度报告的文件大小小于文件大小阈值的年度报告。
8.如权利要求5所述的基于服务机构的上市公司的财务风险识别装置,其特征在于,
所述提取模块提取各年度报告的信息数据的方法具体为:提取年度报告的目录页,提取目录页中与服务机构相关的目录页,根据该目录页的页码获取对应页码的文本内容,从该文本内容中提取上市公司信息、服务机构信息、意见信息,并写入新建的csv文件中。
9.电子设备,其特征在于,包括:
一个或多个处理器;
存储器;以及
一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括用于执行权利要求1~4任一项所述的指令。
10.计算机可读存储介质,其特征在于,存储于具有一种电子设备结合使用的计算机程序,所述计算机程序可被处理器执行以实现权利要求1~4任一项所述的方法。
CN202010306646.8A 2020-04-17 2020-04-17 基于服务机构的上市公司的财务风险识别方法及装置 Active CN111612601B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010306646.8A CN111612601B (zh) 2020-04-17 2020-04-17 基于服务机构的上市公司的财务风险识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010306646.8A CN111612601B (zh) 2020-04-17 2020-04-17 基于服务机构的上市公司的财务风险识别方法及装置

Publications (2)

Publication Number Publication Date
CN111612601A true CN111612601A (zh) 2020-09-01
CN111612601B CN111612601B (zh) 2023-05-09

Family

ID=72199648

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010306646.8A Active CN111612601B (zh) 2020-04-17 2020-04-17 基于服务机构的上市公司的财务风险识别方法及装置

Country Status (1)

Country Link
CN (1) CN111612601B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040117283A1 (en) * 2002-07-17 2004-06-17 Germack Victor F.. Methods and systems for rating financial reporting of public companies and rating the performance of accounting firms
US20050222928A1 (en) * 2004-04-06 2005-10-06 Pricewaterhousecoopers Llp Systems and methods for investigation of financial reporting information
JP2007115110A (ja) * 2005-10-21 2007-05-10 Research Organization Of Information & Systems 信用リスク計量化モデルの寛厳性評価方法、その実施プログラム及び記録媒体
US20120303494A1 (en) * 2011-05-23 2012-11-29 Future Route Ltd Methods and apparatus for on-line analysis of financial accounting data
CN104063767A (zh) * 2014-07-07 2014-09-24 许蔚蔚 一种上市公司财务安全状况评价方法
US20140289098A1 (en) * 2004-09-15 2014-09-25 Rebecca B. Walzak System and Method for Analyzing Financial Risk
MX2014003926A (es) * 2014-03-31 2015-09-30 Héctor San Román Rivera Sistema y procedimiento para el control y seguimiento de obligaciones normativo-legales.
CN105678451A (zh) * 2016-01-04 2016-06-15 宁宇新 基于财务数据自动识别财务舞弊的方法及装置
CN109214904A (zh) * 2018-10-11 2019-01-15 平安科技(深圳)有限公司 财务造假线索的获取方法、装置、计算机设备和存储介质
CN110675078A (zh) * 2019-09-30 2020-01-10 上海烨睿信息科技有限公司 上市公司风险诊断方法、系统、计算机终端及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040117283A1 (en) * 2002-07-17 2004-06-17 Germack Victor F.. Methods and systems for rating financial reporting of public companies and rating the performance of accounting firms
US20050222928A1 (en) * 2004-04-06 2005-10-06 Pricewaterhousecoopers Llp Systems and methods for investigation of financial reporting information
US20140289098A1 (en) * 2004-09-15 2014-09-25 Rebecca B. Walzak System and Method for Analyzing Financial Risk
JP2007115110A (ja) * 2005-10-21 2007-05-10 Research Organization Of Information & Systems 信用リスク計量化モデルの寛厳性評価方法、その実施プログラム及び記録媒体
US20120303494A1 (en) * 2011-05-23 2012-11-29 Future Route Ltd Methods and apparatus for on-line analysis of financial accounting data
MX2014003926A (es) * 2014-03-31 2015-09-30 Héctor San Román Rivera Sistema y procedimiento para el control y seguimiento de obligaciones normativo-legales.
CN104063767A (zh) * 2014-07-07 2014-09-24 许蔚蔚 一种上市公司财务安全状况评价方法
CN105678451A (zh) * 2016-01-04 2016-06-15 宁宇新 基于财务数据自动识别财务舞弊的方法及装置
CN109214904A (zh) * 2018-10-11 2019-01-15 平安科技(深圳)有限公司 财务造假线索的获取方法、装置、计算机设备和存储介质
CN110675078A (zh) * 2019-09-30 2020-01-10 上海烨睿信息科技有限公司 上市公司风险诊断方法、系统、计算机终端及存储介质

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
刘亚莉等: "注册会计师的注意领域与审计质量———基于对我国资本市场审计意见及证监会处罚公告的调查" *
刘晓燕: "会计师事务所受证监会处罚的影响因素的实证研究" *
史金艳等: "金融中介机构声誉对IPO公司财务报告舞弊的影响———以万福生科为例" *
朱君: "上市公司舞弊性财务报告的防范与监管——基于证监会处罚公告的研究" *
袁春生等: "审计独立性、行业专长与财务舞弊行为———基于证监会处罚公告的经验证据" *

Also Published As

Publication number Publication date
CN111612601B (zh) 2023-05-09

Similar Documents

Publication Publication Date Title
CN108572967B (zh) 一种创建企业画像的方法及装置
Zhang et al. Applying data mining in investigating money laundering crimes
US9324087B2 (en) Method, system, and computer program product for linking customer information
CN112182246B (zh) 通过大数据分析建立企业画像的方法、系统、介质及应用
CN108563783B (zh) 一种基于大数据的财务分析管理系统及方法
CN111680073A (zh) 一种基于用户数据的金融服务平台政策资讯推荐方法
CN110880142B (zh) 一种风险实体获取方法及装置
CN114202755A (zh) 基于ocr和nlp技术的交易背景真实性审核方法和系统
Chen et al. [Retracted] Audit Data Analysis and Application Based on Correlation Analysis Algorithm
CN111353716A (zh) 一种非法集资检测方法、系统及计算机可读存储介质
Beltzung et al. Real-time detection of fake-shops through machine learning
CN108734021B (zh) 一种基于去隐私数据的金融贷款大数据风险评估方法与系统
CN111191046A (zh) 一种实现信息搜索的方法、装置、计算机存储介质及终端
Vogler et al. Tackling the information overload: Using automated content analysis for crisis communication research
CN112464670A (zh) 识别方法、识别模型的训练方法、装置、设备、存储介质
CN111612601A (zh) 基于服务机构的上市公司的财务风险识别方法及装置
CN112581268A (zh) 海量资金交易数据情报分析方法及系统
CN115187122A (zh) 一种企业政策推演方法、装置、设备及介质
CN113961929A (zh) 一种安全专项脆弱性扫描方法及系统
CN111815150A (zh) 基于用户数据的金融服务平台用户评分系统及方法
CN111292179A (zh) 柜面业务的处理系统、方法、设备及存储介质
CN111125345A (zh) 数据应用方法和装置
CN110956445A (zh) 用于生成风险文件的方法和装置
CN113971592B (zh) 一种推广信息发布主体的监管评定方法、系统以及装置
CN112348714B (zh) 证据链构建方法、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant