CN110096568A - 用于上市公司业绩预警的方法、装置、设备及存储介质 - Google Patents

用于上市公司业绩预警的方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110096568A
CN110096568A CN201910219796.2A CN201910219796A CN110096568A CN 110096568 A CN110096568 A CN 110096568A CN 201910219796 A CN201910219796 A CN 201910219796A CN 110096568 A CN110096568 A CN 110096568A
Authority
CN
China
Prior art keywords
achievement
performance index
extracted
listed
decimation rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910219796.2A
Other languages
English (en)
Other versions
CN110096568B (zh
Inventor
崔勇
杨光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taikang Asset Management Co Ltd
Taikang Insurance Group Co Ltd
Original Assignee
Taikang Asset Management Co Ltd
Taikang Insurance Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taikang Asset Management Co Ltd, Taikang Insurance Group Co Ltd filed Critical Taikang Asset Management Co Ltd
Priority to CN201910219796.2A priority Critical patent/CN110096568B/zh
Publication of CN110096568A publication Critical patent/CN110096568A/zh
Application granted granted Critical
Publication of CN110096568B publication Critical patent/CN110096568B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明的实施例提供了用于上市公司业绩预警的方法、装置、设备及存储介质,其包括实时监控并自动抓取上市公司发布的业绩公告信息;根据设定的抽取规则从获取的业绩公告信息中抽取相应的业绩指标;以及基于所抽取的业绩指标判断上市公司业绩状况并生成业绩预警信息。本发明实施例的技术方案可以实时自动地从上市公司发布的相关公告信息中发现其业绩预亏预减或预盈预增的情况,并进行及时预警或风险提示。

Description

用于上市公司业绩预警的方法、装置、设备及存储介质
技术领域
本发明涉及数据处理技术,尤其涉及用于对上市公司业绩进行预警的方法、装置、设备及存储介质。
背景技术
股票的涨跌与公司的业绩、盈利情况是密切相关的。如果上市公司业绩与去年同期业绩相比,业绩变差或出现亏损,须向投资者提前进行预亏预减的风险提示信息。反之如果公司业绩与去年同期业绩相比出现了增长,则可发布预盈预增的公告。通常,上市公司通过发布业绩预告来预计公司本报告期或未来报告期业绩将出现亏损、实现扭亏为盈或者与上年同期相比业绩出现大幅变动等情况。业绩报告的发布常常对公司的股票的价格产生直接的影响,因此投资者需要及时掌握和了解相关的业绩报告,以尽可能在市场反应的前期进行相关操作来规避风险,争取利益最大化。
然而,各上市公司发布业绩预告的时间不同,并且随着股票数量的增多,各种业绩报告的数量成倍增长,监控业绩报告的发布并整理和分析这些报告需要花费很多时间成本和人力成本,难免延误股票的操作时机。
发明内容
因此,本发明实施例的目的在于克服上述现有技术的缺陷,提供一种用于上市公司业绩预警的方法、装置、设备及存储介质,能自动抓取并分析上市公司业绩公告的信息,从中及时发现预亏预减或预盈预增情况以进行实时预警或提示。
上述目的是通过以下技术方案实现的:
根据本发明实施例的第一方面,提供了一种用于上市公司业绩预警的方法,其包括:实时监控并自动抓取上市公司发布的业绩公告信息;根据设定的抽取规则从获取的业绩公告信息中抽取相应的业绩指标;以及基于所抽取的业绩指标判断上市公司业绩状况并生成业绩预警信息。
在本发明的一些实施例中,所述抽取规则可以包括表格抽取规则、模式抽取规则和文本抽取规则,其中表格抽取规则被设定为利用特定的表格标记抽取相应的业绩指标,模式抽取规则被设定为利用特定的模式标记抽取相应的业绩指标,文本抽取规则被设定为利用特定的关键词抽取相应的业绩指标。
在本发明的一些实施例中,所述表格抽取规则优先级最高,其次为模式抽取规则,文本抽取规则的优先级最低。
在本发明的一些实施例中,所述抽取规则的设定包括:
取一定数量的已知上市公司业绩公告信息作为样本集,对其中待抽取的每个业绩指标进行标记并设置用于抽取每个所标记的业绩指标的一个或多个抽取规则;
利用所设置的抽取规则从样本集的上市公司业绩公告信息中抽取相应的业绩指标;
将所抽取的业绩指标与先前标记的业绩指标进行比对,计算抽取正确率;
若抽取正确率没有达到预定目标,则重新调整并设置样本集中未被正确抽取业绩指标对应的抽取规则,直至抽取正确率达到预定目标。
在本发明的一些实施例中,业绩指标可以包括用于指示业绩预亏预减或预盈预增的指标,例如净利润、每股收益等。
在本发明的一些实施例中,所述基于所抽取的业绩指标判断上市公司业绩状况可以包括根据所抽取的业绩指标在多个业绩公告期的数据走势来判断上市公司的业绩状况趋势。
在本发明的一些实施例中,所述实时监控并自动抓取上市公司发布的业绩公告信息可以包括:定时抓取用于上市公司发布业绩公告信息的网站的网页;将新抓取的网页与上一次抓取的网页进行对比,从中判断是否有新的内容或新的链接出现;若出现新的内容或新的链接,则提取该新发布的内容或依据该新的链接提取其对应文档。
根据本发明实施例的第二方面,提供了一种用于上市公司业绩预警的装置,其包括数据获取模块、指标抽取模块和业绩分析模块。其中数据获取模块用于实时监控并自动抓取上市公司发布的业绩公告信息;指标抽取模块用于根据设定的抽取规则从获取的业绩公告信息中抽取相应的业绩指标;业绩分析模块,用于基于所抽取的业绩指标判断上市公司业绩状况并生成业绩预警信息。
根据本发明实施例的第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被执行时实现如上述实施例第一方面所述的方法。
根据本发明实施例的第四方面,提供了一种电子设备,包括处理器和存储器,其中存储器用于存储可执行指令;所述处理器被配置为经由执行所述可执行指令来实现如上述实施例第一方面所述的方法。
本发明实施例提供的技术方案可以包括以下有益效果:
本发明实施例的技术方案通过实时监控自动抓取分析上市公司业绩公告的信息,根据设定的抽取规则快速准确地抽取相关的业绩指标,从而及时发现业绩预亏、预盈等情况,使得投资者能够及时掌握和了解上市公司业绩状况,并尽可能在市场反应的前期进行相关操作来规避风险,争取利益最大化。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示出了根据本发明一个实施例的用于上市公司业绩预警的方法的流程示意图。
图2示出了根据本发明一个实施例的设置抽取规则的方法的流程示意图。
图3示出了根据本发明一个实施例的用于上市公司业绩预警的装置的功能模块示意图。
具体实施方式
为了使本发明的目的,技术方案及优点更加清楚明白,以下结合附图通过具体实施例对本发明进一步详细说明。应当理解,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动下获得的所有其他实施例,都属于本发明保护的范围。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本发明的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
图1给出了根据本发明一个实施例的用于上市公司业绩预警的方法的流程示意图。概况而言,该方法包括:步骤S101,实时监控并自动抓取上市公司发布的业绩公告信息;步骤S102,根据设定的抽取规则从获取的业绩公告信息中抽取相关的业绩指标;步骤S103,基于所抽取的业绩指标判断上市公司业绩状况并生成业绩预警信息。该方法的执行主体可以是服务器,或者可以是用于为企业或个人提供诸如信息监控、数据处理之类的服务的任何一个或多个计算装置及其组合。
更具体地,在步骤S101,实时监控并自动抓取上市公司发布的业绩公告信息。上市公司每隔一段时间会将与业绩相关的公告信息以业绩预告、季度报告、年报等等形式进行发布。这些与业绩相关的公告信息例如为在每个季度、半年度、前三季度、全年度中公司净利润、同比变化、同比或与最近一期相比出现盈亏变化、期末净资产等,以及最新预计的业绩或财务状况变动方向与已披露的业绩预告的变动方向不一致的情况等。以业绩预告为例,其中可以包括净利润、每股收益等等。各上市公司发布业绩相关的公告信息的时间不同,为及时了解和掌握业绩公告状况,需要对所监控的各个上市公司用于发布公告信息的网站进行实时监控,以便在发现新的公告信息时,及时抓取所发布的公告信息。
在一个实施例中,监控网站新发布的信息包括定时抓取该网站的网页,将新抓取的网页与上一次抓取的网页进行对比,以从中判断是否有新的内容或新的链接出现。如果发现上市公司的相关网站出现新的内容或新的链接,则抓取该新发布的内容或获取该新链接对应的文档。在又一个实施例中,监控网站新发布的信息包括根据时间标记与关键词,定期从上市公司的相关网站抓取在该时间标记之后发布的与题目或文档中包含该关键词的相关网页或文档。通常可以采用例如网络爬虫之类的工具来从特定的网站抓取相关信息。
在步骤S102,根据设定的抽取规则从获取的业绩公告信息中抽取相关的业绩指标。为方便描述,下文以从上市公司公告的“业绩预告”信息中抽取诸如净利润、每股收益之类的用于衡量业绩的业绩指标为例来进行说明,但应理解,本发明实施例的方法也可以适用于其他与业绩相关信息的抽取与分析。不同的上市公司可能采用不同的形式来发布其业绩预告,例如含有表格的PDF文档,不含表格的PDF文档,HTML或XML页面等形式。对于PDF文档,首先将其转换成文本格式的文档,然后在进行相应指标的抽取。常见的业绩公告文档内容通常包括业绩预告基本情况、原因、明细数据对比等几个部分,其中业绩预告基本情况通常又可分为业绩走势预告、报告期、业绩比对等部分。常用的业绩指标描述词包括净利润、同比上升、同比下降、同比变化、预计亏损、预计盈利、继续亏损、营业收入、净资产、股票收益等等。因此,在一个实施例中,可以通过根据上市公司常见的业绩公告内容和术语来设置关键词,建立关键词与相应业绩指标之间的匹配关系来设定抽取规则。但不同上市公司对于同一业绩指标可能采用多种描述方式,因此这种基于文本的抽取规则,抽取的效率和准确性有待改善。
在又一个实施例中,所述抽取规则包括优先级不同的三类抽取规则:表格抽取规则、模式抽取规则和文本抽取规则。其中表格抽取规则具有最高的优先级,用于根据特定的表格标记来抽取相应的业绩指标。在上市公司发布的业绩预告中所采用的表格通常可分为普通预告类、重组类、修正类等不同类型,每种表格类型具有不同的格式,可以按照常见类型表格的格式设置表格抽取规则。通过这些表格抽取规则从业绩预告中抽取表格各字段,可以获取比较准确的业绩指标值,因此表格抽取规则的优先级最高。其次是模式抽取规则,用于根据某些特定的模式标记来抽取相应的业绩指标。在上市公司发布的业绩预告中也常采用某些特定的模式标记来指示各种业绩指标,例如提供业绩勾选项,通过勾选指示净利润同比上升、净利润同比下降等的选项框或标签等来发布业绩信息。通过找到这些业绩勾选项可以快速定位相应的业绩指标。因此,可以按照常见的模式标记来设置模式抽取规则。通过这些模式抽取规则从业绩预告中快速定位特定的模式标记,以准确地抽取相应业绩指标。优先级最低的是上文提及到的文本抽取规则,如果业绩预告中既没有表格标记,也没有特定的模式标记,则适用于文本抽取规则,利用关键词匹配来遍历整个文本以抽取业绩指标。在该实施例的技术方案中通过对不同形式的公告信息设置不同的优先级的抽取规则,既兼顾了公告信息的差异化,又提高了业绩指标的抽取速度和效率。
在一些实施例中,为改善业绩指标抽取的准确率,可以根据已获取的业绩公告信息来动态调整和重新设置所设定的抽取规则。图2给出了根据本发明一个实施例的设置抽取规则的流程示意图。如图2所示,在步骤S201,取一定数量的已知上市公司业绩公告信息作为样本集,对其中待抽取的每个业绩指标进行标记,并且设置用于抽取每个所标记的业绩指标的一个或多个抽取规则。在步骤S202,利用所设置的抽取规则从样本集的上市公司业绩公告信息中抽取相应的业绩指标。在步骤S203,将所抽取的业绩指标与先前标记的业绩指标进行比对,以判断每个标记的业绩指标是否被与其对应的抽取规则正确抽取,从而统计抽取正确率。在步骤S204,判断当前的抽取正确率是否达到预先设定的目标,例如85%-95%的正确率。如果达到预设的目标,则结束。若当前的抽取正确率没有达到该预定目标,至继续至步骤S205,重新调整并设置样本集中未被正确抽取的业绩指标对应的抽取规则,并返回至步骤S202重复执行上述过程,直至抽取正确率达到预定目标为止。另外,也可以响应于对于抽取正确率的预定目标的变化或者样本集中样本数量的变化来重新执行上述步骤以对抽取规则进行调整。在该实施例的技术方案中通过将依据抽取规则获得的业绩指标与先前标记的业绩指标进行比对,可以快速定位存在问题或准确率不高的抽取规则,并进行相关调整,可以有效改善业绩指标抽取的准确率。
继续参考图1,在步骤S103,基于所抽取的业绩指标判断上市公司业绩状况并生成业绩预警信息。上市公司业绩状况基本可以分为三类:预亏、基本持恒和预盈三类,而预亏中又可包括扭亏、同向上升、略减和预减(下降幅度超过50%)等情况,预盈中也可包括同向下降、略盈、预增(上升幅度超过50%)等等情况,其中业绩的预减和预增尤其需要重点关注。通常上述的业绩状况可以通过净利润的上升或下降直观地表征,由此所抽取的业绩指标可以为净利润。通过净利润指标可以直观快速地确定上市公司的基本业绩状况,从而及时生成与业绩预亏预减或预盈预增等相关的业绩预警信息,以便及时提示投资人对该上市公司的股票进行相应操作,例如减持或增持等。除了净利润之外,上市公司业绩状况还受很多因素紧密关联,例如净资产、预计亏损、营业收入、每股收益等等。因此,在又一个实施例中,为了更准确地把握企业业绩的走向,不受短期波动的影响,可以结合所抽取的多个业绩指标综合衡量和评价上市公司业绩状况,例如对多个业绩指标进行加权平均。在又一个实施例中,还可以将当前抽取的业绩指标与之前多次抽取的业绩指标相结合,根据所抽取的业绩指标在多个业绩公告期的数据走势来判断上市公司的业绩状况趋势。
在前述实施例的技术方案中,通过实时监控上市公司公告信息,根据设定的抽取规则快速准确地抽取相关的业绩指标,从而及时发现业绩预亏、预盈等情况,使得投资者能够及时掌握和了解上市公司业绩状况,并尽可能在市场反应的前期进行相关操作来规避风险,争取利益最大化,并尽量避免由于延误股票操作时机带来的利益损失。另外,针对不同形式的公告采用不同的抽取规则,并通过已知大量样本集对抽取规则进行不断更新和调整,可以快速准确地从公告信息中提取相应的业绩指标,改善了对上市公司业绩自动预警的速度和效率。
图3为根据本发明一个实施例的用于上市公司业绩预警的装置300的功能模块示意图功能框图。尽管该框图以功能上分开的方式来描述组件,但这样的描述仅为了说明的目的。图中所示的组件可以任意地进行组合或被分为独立的软件、固件和/或硬件组件。而且,无论这样的组件是如何被组合或划分的,它们都可以在同一主机或多个主机上执行,其中多个主机可以是由一个或多个网络连接。
如图3所示,该装置300包括数据获取模块301、指标抽取模块302和业绩分析模块303。其中数据获取模块301用于实时监控并自动抓取上市公司发布的业绩公告信息。指标抽取模块301用于如上文结合步骤S102所介绍的,根据设定的抽取规则从获取的业绩公告信息中抽取相应的业绩指标;业绩分析模块303用于基于所抽取的业绩指标判断上市公司业绩状况并生成业绩预警信息。
在一些实施例中,数据获取模块301可以被配置为定时抓取用于上市公司发布业绩公告信息的网站的网页;将新抓取的网页与上一次抓取的网页进行对比,从中判断是否有新的内容或新的链接出现;若出现新的内容或新的链接,则提取该新发布的内容或依据该新的链接提取其对应文档。
在一些实施例中,指标抽取模块302所采用的抽取规则可以包括表格抽取规则、模式抽取规则和文本抽取规则,其中表格抽取规则被设定为利用特定的表格标记抽取相应的业绩指标,模式抽取规则被设定为利用特定的模式标记抽取相应的业绩指标,文本抽取规则被设定为利用特定的关键词抽取相应的业绩指标。在一些实施例中,表格抽取规则优先级最高,其次为模式抽取规则,文本抽取规则的优先级最低。在一些实施例中,业绩指标可以包括用于指示业绩预亏预减或预盈预增的指标,例如净利润、每股收益等。
在一些实施例中,指标抽取模块302所采用的抽取规则可以是通过下面的步骤来设定的:A1)取一定数量的已知上市公司业绩公告信息作为样本集,对其中待抽取的每个业绩指标进行标记并设置用于抽取每个所标记的业绩指标的一个或多个抽取规则;A2)利用所设置的抽取规则从样本集的上市公司业绩公告信息中抽取相应的业绩指标;A3)将所抽取的业绩指标与先前标记的业绩指标进行比对,计算抽取正确率;A4)若抽取正确率没有达到预定目标,则重新调整并设置样本集中未被正确抽取业绩指标对应的抽取规则,返回至步骤A2)继续执行,直至抽取正确率达到预定目标。
在一些实施例中,业绩分析模块303还可以将指标抽取模块302当前抽取的业绩指标与之前多次抽取的业绩指标相结合,根据所抽取的业绩指标在多个业绩公告期的数据走势来判断上市公司的业绩状况趋势。
在本发明的又一个实施例中,还提供了一种计算机可读存储介质,其上存储有计算机程序或可执行指令,当所述计算机程序或可执行指令被执行时实现如前述实施例中所述的技术方案,其实现原理类似,此处不再赘述。在本发明的实施例中,计算机可读存储介质可以是任何能够存储数据且可以被计算装置读取的有形介质。计算机可读存储介质的实例包括硬盘驱动器、网络附加存储器(NAS)、只读存储器、随机存取存储器、CD-ROM、CD-R、CD-RW、磁带以及其它光学或非光学数据存储装置。计算机可读存储介质也可以包括分布在网络耦合计算机系统上的计算机可读介质,以便可以分布式地存储和执行计算机程序或指令。
在本发明的又一个实施例中,还提供了一种电子设备,包括处理器和存储器,其中所述存储器用于存储可由处理器执行的可执行指令,其中所述处理器被配置为执行存储器上存储的可执行指令,所述可执行指令被执行时实现前述任一实施例中介绍的技术方案,其实现原理类似,此处不再赘述。
本说明书中针对“各个实施例”、“一些实施例”、“一个实施例”、或“实施例”等的参考指代的是结合所述实施例所描述的特定特征、结构、或性质包括在至少一个实施例中。因此,短语“在各个实施例中”、“在一些实施例中”、“在一个实施例中”、或“在实施例中”等在整个说明书中各地方的出现并非必须指代相同的实施例。此外,特定特征、结构、或性质可以在一个或多个实施例中以任何合适方式组合。因此,结合一个实施例中所示出或描述的特定特征、结构或性质可以整体地或部分地与一个或多个其他实施例的特征、结构、或性质无限制地组合,只要该组合不是非逻辑性的或不能工作。
本说明书中“包括”和“具有”以及类似含义的术语表达,意图在于覆盖不排他的包含,例如包含了一系列步骤或单元的过程、方法、系统、装置、产品或设备并不限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。“一”或“一个”也不排除多个的情况。另外,本申请附图中的各个元素仅仅为了示意说明,并非按比例绘制。
虽然本发明已经通过上述实施例进行了描述,然而本发明并非局限于这里所描述的实施例,在不脱离本发明范围的情况下还包括所做出的各种改变以及变化。

Claims (10)

1.一种用于上市公司业绩预警的方法,包括:
实时监控并自动抓取上市公司发布的业绩公告信息;
根据设定的抽取规则从获取的业绩公告信息中抽取相应的业绩指标;
基于所抽取的业绩指标判断上市公司业绩状况并生成业绩预警信息。
2.根据权利要求1所述的方法,其特征在于,其中所述抽取规则包括表格抽取规则、模式抽取规则和文本抽取规则,其中表格抽取规则被设定为利用特定的表格标记抽取相应的业绩指标,模式抽取规则被设定为利用特定的模式标记抽取相应的业绩指标,文本抽取规则被设定为利用特定的关键词抽取相应的业绩指标。
3.根据权利要求2所述的方法,其特征在于,其中所述表格抽取规则优先级最高,其次为模式抽取规则,文本抽取规则的优先级最低。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述抽取规则的设定包括:
取一定数量的已知上市公司业绩公告信息作为样本集,对其中待抽取的每个业绩指标进行标记并设置用于抽取每个所标记的业绩指标的一个或多个抽取规则;
利用所设置的抽取规则从样本集的上市公司业绩公告信息中抽取相应的业绩指标;
将所抽取的业绩指标与先前标记的业绩指标进行比对,计算抽取正确率;
若抽取正确率没有达到预定目标,则重新调整并设置样本集中未被正确抽取业绩指标对应的抽取规则,直至抽取正确率达到预定目标。
5.根据权利要求1所述的方法,其特征在于,其中业绩指标包括用于指示业绩预亏预减或预盈预增的指标。
6.根据权利要求1所述的方法,其特征在于,所述基于所抽取的业绩指标判断上市公司业绩状况包括:
根据所抽取的业绩指标在多个业绩公告期的数据走势来判断上市公司的业绩状况趋势。
7.根据权利要求1所述的方法,其特征在于,所述实时监控并自动抓取上市公司发布的业绩公告信息包括:
定时抓取用于上市公司发布业绩公告信息的网站的网页;
将新抓取的网页与上一次抓取的网页进行对比,从中判断是否有新的内容或新的链接出现;
若出现新的内容或新的链接,则提取该新发布的内容或依据该新的链接提取其对应文档。
8.一种用于上市公司业绩预警的装置,包括:
数据获取模块,用于实时监控并自动抓取上市公司发布的业绩公告信息;
指标抽取模块,用于根据设定的抽取规则从获取的业绩公告信息中抽取相应的业绩指标;
业绩分析模块,用于基于所抽取的业绩指标判断上市公司业绩状况并生成业绩预警信息。
9.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,所述程序被执行时实现权利要求1-7中任一项所述的方法。
10.一种电子设备,包括处理器和存储器,其中存储器用于存储可执行指令;所述处理器被配置为经由执行所述可执行指令来实现权利要求1-7中任一项所述的方法。
CN201910219796.2A 2019-03-22 2019-03-22 用于上市公司业绩预警的方法、装置、设备及存储介质 Active CN110096568B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910219796.2A CN110096568B (zh) 2019-03-22 2019-03-22 用于上市公司业绩预警的方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910219796.2A CN110096568B (zh) 2019-03-22 2019-03-22 用于上市公司业绩预警的方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN110096568A true CN110096568A (zh) 2019-08-06
CN110096568B CN110096568B (zh) 2022-12-06

Family

ID=67443993

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910219796.2A Active CN110096568B (zh) 2019-03-22 2019-03-22 用于上市公司业绩预警的方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN110096568B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112612937A (zh) * 2020-12-07 2021-04-06 深圳价值在线信息科技股份有限公司 一种关联信息获取方法及设备
CN115330279A (zh) * 2022-10-14 2022-11-11 北京师范大学 一种基于股票走势图相似性检测的公司选取方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101101600A (zh) * 2007-07-10 2008-01-09 北京大学 网络搜索中基于多种规则的元数据自动抽取方法
CN105303349A (zh) * 2015-10-28 2016-02-03 中国铁路信息技术中心 一种铁路货运业务预警方法
CN106682150A (zh) * 2016-12-22 2017-05-17 北京锐安科技有限公司 一种信息处理的方法及装置
CN107403375A (zh) * 2017-04-19 2017-11-28 北京文因互联科技有限公司 一种基于深度学习的上市公司公告分类及摘要生成方法
CN108846592A (zh) * 2018-07-11 2018-11-20 北京神州泰岳软件股份有限公司 一种基于大数据的企业评价报告生成方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101101600A (zh) * 2007-07-10 2008-01-09 北京大学 网络搜索中基于多种规则的元数据自动抽取方法
CN105303349A (zh) * 2015-10-28 2016-02-03 中国铁路信息技术中心 一种铁路货运业务预警方法
CN106682150A (zh) * 2016-12-22 2017-05-17 北京锐安科技有限公司 一种信息处理的方法及装置
CN107403375A (zh) * 2017-04-19 2017-11-28 北京文因互联科技有限公司 一种基于深度学习的上市公司公告分类及摘要生成方法
CN108846592A (zh) * 2018-07-11 2018-11-20 北京神州泰岳软件股份有限公司 一种基于大数据的企业评价报告生成方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112612937A (zh) * 2020-12-07 2021-04-06 深圳价值在线信息科技股份有限公司 一种关联信息获取方法及设备
CN115330279A (zh) * 2022-10-14 2022-11-11 北京师范大学 一种基于股票走势图相似性检测的公司选取方法
CN115330279B (zh) * 2022-10-14 2023-01-24 北京师范大学 一种基于股票走势图相似性检测的公司选取方法

Also Published As

Publication number Publication date
CN110096568B (zh) 2022-12-06

Similar Documents

Publication Publication Date Title
Brander et al. Creative accounting: A critical perspective on the market-based method for reporting purchased electricity (scope 2) emissions
JP6703031B2 (ja) キーワードと資産価格との関連性評価方法及びその装置及び資産情報のディスプレイ方法
Zhao Do the stock returns of clean energy corporations respond to oil price shocks and policy uncertainty?
US8850263B1 (en) Streaming and sampling in real-time log analysis
Alonso et al. Detecting uninteresting content in text streams
Adamu Risk reporting: A study of risk disclosures in the annual reports of listed companies in Nigeria
CN110096568A (zh) 用于上市公司业绩预警的方法、装置、设备及存储介质
CN110401660A (zh) 虚假流量的识别方法、装置、处理设备及存储介质
CN103793418A (zh) 一种针对证券行业的实时垂直搜索引擎的搜索方法
Wei et al. Corporate accidents, media coverage, and stock market responses: empirical study of the Chinese listed firms
CN111861255A (zh) 企业风险监控方法和装置、以及存储介质和电子设备
Ames et al. Using nonfinancial measures to improve fraud risk assessments
CN111724185A (zh) 用户维护方法和装置
CN114971481A (zh) 物流对象运输时效监控方法、装置、设备和存储介质
Yu et al. Market power and farm‐retail price transmission: The case of US fluid milk markets
CN109409091B (zh) 检测Web页面的方法、装置、设备以及计算机存储介质
US10586046B1 (en) Automated security feed analysis for threat assessment
CN113034076B (zh) 物流承运对象推荐方法、装置、电子设备和存储介质
CN110472827B (zh) 系统策略预警方法、装置、服务器及可读存储介质
CN115660451A (zh) 基于rpa的供应商风险预警方法、装置、设备及介质
CN112258095A (zh) 基于标准正态分布的评分方法、装置、设备及存储介质
US20090327278A1 (en) System and method for ranking web content
Wang Bank Rating Gaps as Proxies for Systemic Risk
de Oliveira et al. A Study on the Anatomy of Losses in Electric Energy Distribution: Un estudio sobre la anatomía de las pérdidas en la distribución de energía eléctrica
CN115484186B (zh) 数据监控方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant