CN110928928B - 投资主体的数据统计方法、装置、电子设备及存储介质 - Google Patents

投资主体的数据统计方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN110928928B
CN110928928B CN201911255073.4A CN201911255073A CN110928928B CN 110928928 B CN110928928 B CN 110928928B CN 201911255073 A CN201911255073 A CN 201911255073A CN 110928928 B CN110928928 B CN 110928928B
Authority
CN
China
Prior art keywords
main body
field
label
data
field data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911255073.4A
Other languages
English (en)
Other versions
CN110928928A (zh
Inventor
刘翰宇
肖月亮
叶振栋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp filed Critical China Construction Bank Corp
Priority to CN201911255073.4A priority Critical patent/CN110928928B/zh
Publication of CN110928928A publication Critical patent/CN110928928A/zh
Application granted granted Critical
Publication of CN110928928B publication Critical patent/CN110928928B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Computational Linguistics (AREA)
  • Human Resources & Organizations (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Fuzzy Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Operations Research (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了一种投资主体的数据统计方法、装置、电子设备及存储介质,其中该方法包括:响应于选取指令,从数据库中选取至少一张数据表的至少一个字段的字段数据,并将相同主体实例的字段数据进行关联;根据各主体实例对应的字段数据,对各主体实例设置标签;响应于标签树生成指令,根据至少一个预设标签组构建标签树模型;根据各主体实例的标签,将各主体实例关联至标签树模型中相应的分支节点;响应于统计指令,确定标签树模型中的待统计节点,对待统计节点对应的主体实例进行统计,并根据统计结果生成统计表,从而实现了对各投资主体的全方位数据统计。

Description

投资主体的数据统计方法、装置、电子设备及存储介质
技术领域
本发明实施例涉及投资领域中数据统计技术,尤其涉及一种投资主体的数据统计方法、装置、电子设备及存储介质。
背景技术
本发明实施例公开的投资主体,可以认为是投资领域中的各种主体,比如投资产品(例如理财、股票和基金产品等)、交易账户和交易记录等主体。
现有的投资主体的数据统计方法主要为,通过预先定义的投资主体的预设标签,对投资主体的相关数据进行统计分析。
现有方法的不足之处至少包括:1.支持标签管理的投资主体需在统计系统开发时确定,不支持在统计过程中对投资主体进行动态扩展;2.对某一特定投资主体,同样不支持在统计过程中对其对应的标签进行动态扩展;3.且按预设标签统计投资主体的相关数据时,不支持自定义的标签统计维度。上述不足为各种投资主体的全方位数据分析带来了阻碍,从而降低了资产管理从业者的统计效率,且不利于对各投资主体的研究分析。
发明内容
有鉴于此,本发明实施例提供了一种投资主体的数据统计方法、装置、电子设备及存储介质,实现了对各投资主体的全方位数据统计。
第一方面,本发明实施例提供了一种投资主体的数据统计方法,包括:
响应于选取指令,从数据库中选取至少一张数据表的至少一个字段的字段数据,并将相同主体实例的字段数据进行关联;
根据各主体实例对应的字段数据,对所述各主体实例设置标签;其中,所述标签响应于标签更新指令进行更新,且所述标签从属于至少一个预设标签组;
响应于标签树生成指令,根据所述至少一个预设标签组构建标签树模型;其中,所述标签树模型的根节点为投资主体,至少一层分支节点与至少一个预设标签组相对应,且各层中分支节点为对应的预设标签组中的标签;
根据所述各主体实例的标签,将所述各主体实例关联至所述标签树模型中相应的分支节点;
响应于统计指令,确定所述标签树模型中的待统计节点,对所述待统计节点对应的主体实例进行统计,并根据统计结果生成统计表。
第二方面,本发明实施例还提供了一种投资主体的数据统计装置,包括:
数据选取模块,用以响应于选取指令,从数据库中选取至少一张数据表的至少一个字段的字段数据,并将相同主体实例的字段数据进行关联;
标签设置模块,用于根据各主体实例对应的字段数据,对所述各主体实例设置标签;其中,所述标签响应于标签更新指令进行更新,且所述标签从属于至少一个预设标签组;
标签树模型构建模块,用以响应于标签树生成指令,根据所述至少一个预设标签组构建标签树模型;其中,所述标签树模型的根节点为投资主体,至少一层分支节点与至少一个预设标签组相对应,且各层中分支节点为对应的预设标签组中的标签;
主体实例关联模块,用于根据所述各主体实例的标签,将所述各主体实例关联至所述标签树模型中相应的分支节点;
统计模块,用以响应于统计指令,确定所述标签树模型中的待统计节点,对所述待统计节点对应的主体实例进行统计,并根据统计结果生成统计表。
第三方面,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本申请任意实施例提供的投资主体的数据统计方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如本申请任意实施例提供的投资主体的数据统计方法。
本发明实施例提供的一种投资主体的数据统计方法、装置、电子设备及存储介质,电子设备响应于选取指令,从数据库中选取至少一张数据表的至少一个字段的字段数据,并将相同主体实例的字段数据进行关联,实现了自定义投资主体,即实现了投资主体的扩展。电子设备根据各主体实例对应的字段数据,对各主体实例设置标签;其中,标签响应于标签更新指令进行更新,实现了标签扩展。电子设备响应于标签树生成指令,根据至少一个预设标签组构建标签树模型;其中,标签树模型的根节点为投资主体,至少一层分支节点与至少一个预设标签组相对应,且各层中分支节点为对应的预设标签组中的标签;根据各主体实例的标签,将各主体实例关联至标签树模型中相应的分支节点;响应于统计指令,确定标签树模型中的待统计节点,对待统计节点对应的主体实例进行统计,并根据统计结果生成统计表,实现了自定义维度的数据统计。从而实现了对各投资主体的全方位数据统计,提高了资产管理从业者的统计效率,有利于对各投资主体的研究分析。
附图说明
图1是本发明实施例一提供的一种投资主体的数据统计方法的流程示意图;
图2是本发明实施例一提供的一种投资主体的数据统计方法中标签树模型的结构示意图;
图3是本发明实施例二提供的一种投资主体的数据统计装置的结构示意图;
图4是本发明实施例三提供的一种电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,以下将参照本发明实施例中的附图,通过实施方式清楚、完整地描述本发明的技术方案,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。下述各实施例中,每个实施例中同时提供了可选特征和示例,实施例中记载的各个特征可进行组合,形成多个可选方案,不应将每个编号的实施例仅视为一个技术方案。
实施例一
图1为本发明实施例一提供的一种投资主体的数据统计方法的流程示意图,本实施例可适用于对投资主体进行相关数据统计的情况。该方法可以由本发明实施例提供的投资主体的数据统计装置来执行,且投资主体的数据统计装置可配置于本发明实施例提供的电子设备中。
参见图1,投资主体的数据统计方法,具体包括如下步骤:
S110、响应于选取指令,从数据库中选取至少一张数据表的至少一个字段的字段数据,并将相同主体实例的字段数据进行关联。
若将投资主体理解为投资领域中的各种主体,比如投资产品(例如理财、股票和基金产品等)、交易账户和交易记录等,则主体实例可以理解为是投资主体的具体实例对象。例如,当投资主体为“股票”时,则“股票600000”为股票的一个具体实例对象。每个主体实例可对应多个字段,例如“股票600000”可对应的字段“所属地域”、“总股本”和“上市日期”等,且每个字段对应有字段数据,即每个主体实例对应多个字段数据。
电子设备通过输入装置(例如鼠标、键盘或触控屏等)可接收用户输入的指令,例如可以接收本步骤中的选取指令,还可以接收下述步骤中的标签树生成指令、统计指令和打标指令等。电子设备根据接收的选取指令可从数据库中选取一张或多张数据表,并从选取的数据表中选取一个或多个字段,将相同主体实例的字段数据进行关联,可生成自定义投资主体的表单,表单中的各主体实例即为打标对象。
通过选取指令自定义投资主体,从而实现了对投资主体进行动态扩展。可选的,从数据库中选取至少一张数据表的至少一个字段的字段数据,并将相同主体实例的字段数据进行关联,包括:
从数据库中选取主表,并从主表中选取至少一个第一字段的字段数据;判断是否关联从表;若是,则从数据库中选取从表,并从从表中选取至少一个第二字段的字段数据,并将相同主体实例的第一字段的字段数据与第二字段的字段数据进行关联,直至所有从表关联完毕;若否,则将相同主体实例的第一字段的字段数据进行关联。
当主表需要关联至少一张从表时,选取指令中需要指定主表的至少一个第一字段,与至少一张从表中至少一个第二字段的关联关系。根据上述关联关系,可实现主表与所有从表中被选取的字段数据的关联。其中,数据库中同一数据表可作为定义不同投资主体时的主表或从表,且若投资主体中的字段不完全相同,则投资主体不同。
除了通过多张数据表中多个字段数据定义投资主体外,还可以通过缩减一个数据表数据定义投资主体。示例性的,数据库中可包括“股票基本信息表”,表中的字段可包括:股票的代码、名称、简称、所属地域、总股本、录入系统时间、录入系统操作员、修改时间和修改操作员等。可只选取其中的“股票代码、名称、简称、所属地域、总股本、上市日期、交易市场、交易板块和行业代码”字段来定义投资主体“股票”,即通过对单个表的缩减定义投资主体。
此外,当投资主体定义完毕后,还可以接收用户的更新投资主体指令,并根据更新投资主体指令增加、删除或替换字段的字段数据。
S120、根据各主体实例对应的字段数据,对各主体实例设置标签;其中,标签响应于标签更新指令进行更新,且标签从属于至少一个预设标签组。
针对不同的投资主体,电子设备可提供标签定义接口,以使用户通过标签定义接口对投资主体对应的标签进行定义,例如针对投资主体“股票”,用户可定义与“股票”对应的“股票标签”;又如针对投资主体“债券”,用户可定义与“债券”对应的“债券标签”。当投资主体对应的标签定义完毕后,可选取投资主体对应的标签对各主体实例打标,而不用遍历全部标签,从而提高了打标效率。此外,电子设备还可通过标签定义接口,接收标签更新指令,根据标签更新指令不仅可对已定义的标签进行删除或修改,还可以定义新的标签。
在投资主体对应的标签定义完毕后,还可以对投资主体对应的标签进行分组,且单一标签可以唯一对应一组,也可以同时属于不同分组。示例性的,当投资主体为“股票”时,“股票标签”可以包括大市值、小市值、沪市、深市、北京、上海、天津等中国省市标签等。对股票标签进行分组,例如可以将大市值、小市值划分到“市值标签组”;将沪市、深市划分到“交易场所标签组”;将北京、上海、天津等中国省市标签划分到“地域标签组”;且北京、上海、深圳还可以划分到“特大城市组”。此外,电子设备还可响应于标签组更新指令,对标签组内标签进行更新(例如新增、删除或修改标签等)。
通过预先设置至少一个标签组,可便于标签树模型的构建。示例性的,当股票标签的标签组分为“市值标签组”、“交易场所标签组”和“地域标签组”组时,可根据“交易场所标签组”构建标签树模型的第一层分支节点,根据“地域标签组”构建标签树模型的第二层分支节点,根据“市值标签组”构建标签树模型的第三层分支点,以快速构建标签树模型。
可选的,对各主体实例设置标签,包括:基于预设的标签设置规则,对各主体实例设置标签;或者,响应于打标指令,查询目标主体实例,并对目标主体实例设置标签。
在预先成功定义投资主体和投资主体对应的标签,且对标签进行分组后,还可以定义标签设置规则。电子设备可根据预设的标签设置规则,自动对各主体实例设置标签。此外,标签设置规则还可以根据用户需求进行更新。当标签设置规则更新时,可根据更新后的标签设置规则,对各主体实例设置标签。
同时,电子设备还可以提供标签设置接口,并通过标签设置接口接收用户输入的打标指令;根据打标指令中携带的主体实例名称、主体实例包含的字段和/或主体实例已有标签等参数,查询到目标主体实例;根据打标指令中携带的标签设置参数,对查询得到的目标主体实例设置标签,从而实现目标主体实例的手动打标。
可选的,基于预设的标签设置规则,对各主体实例设置标签,包括:根据预设的标签设置规则,确定各主体实例的目标字段;确定目标字段的字段数据所从属的取值范围,并根据所从属的取值范围设置各主体实例的标签。
在预设的标签设置规则中,任一标签可对应至少一个目标字段,且各目标字段对应一个取值范围。且在预设的标签设置规则中,不同标签对应的至少一个目标字段可存在重叠,且各目标字段对应的取值范围可存在重叠,但不同标签对应的至少一个目标字段不完全相同,和/或各目标字段对应的取值范围不完全相同。其中,预设的取值范围,例如可以用等于、大于、小于、不等于、包含、不包含等符号,以及字符串或数字来定义。示例性的,目标字段为“股票市值”时,可以将字段数据大于100亿的取值范围对应“大市值”标签,将字段数据小于5亿的取值范围对应“小市值”标签。其中,预设取值范围中的字符串或数据可根据具体业务场景进行设置,在此不做具体限定。
当电子设备根据预设的标签规则为主体实例打标时,可先选取待打标的标签,再确定待打标的标签对应的目标字段,然后读取各主体实例的目标字段的字段数据,并判断字段数据是否属于预设的取值范围,若是则对主体实例设置待打标的标签,若否则不对主体实例设置该待打标的标签。
进一步的,投资主体的数据统计方法,还包括:当主体实例更新时,根据预设的标签设置规则,确定更新后主体实例的目标字段;确定更新后的目标字段的字段数据所从属的取值范围,并根据所从属的取值范围设置更新后主体实例的标签。
主体实例更新可以包括新增主体实例,也可以包括对原主体实例的字段数据进行更新。其中,对原主体实例的字段数据进行更新,例如可以是对单个字段数据的更新,且若变化的单个字段数据为其他一个或多个字段的因变量时,其他一个或多个字段数据也会相应进行更新。电子设备可通过分析数据库日志(例如MySQL的binlog日志或Oracle的归档日志等),判断主体实例是否更新。当主体实例更新时,可根据预设的标签设置规则,确定更新后主体实例的目标字段,并根据更新后的目标字段的字段数据所从属的取值范围,对更新后主体实例进行标签更新,从而实现了标签的自动更新。
示例性的,当主体实例为“股票1”时,字段数据“每日收盘价”和“总股本”为字段数据“股票市值”因变量,在对“每日收盘价”和/或“总股本”字段数据进行更新后,“股票市值”字段数据会随之更新。当“股票市值”字段数据更新后,可根据预设的“市值标签组”的标签设置规则,确定更新后的“股票市值”为大市值还是小市值,并对主体实例“股票1”进行市值标签更新。进一步的,当目标字段为日期字段时,确定目标字段的字段数据所从属的取值范围,包括:当日期变更时,确定当前日期与日期字段的字段数据的差值,并确定差值所从属的取值范围。
当待打标的标签(例如“成立小于1年”标签)对应的目标字段为日期字段时,电子设备可在日期变更时,确定当前日期与日期字段的字段数据的差值,并确定差值所从属的取值范围;根据日期变更后的差值所从属的取值范围,为各主体实例更新标签,从而实现了日期类标签的自动更新。
S130、响应于标签树生成指令,根据至少一个预设标签组构建标签树模型;其中,标签树模型的根节点为投资主体,至少一层分支节点与至少一个预设标签组相对应,且各层中分支节点为对应的预设标签组中的标签。
标签树生成指令中可携带选取的标签组,标签组对应层级以及选取标签组中选取的标签等参数。电子设备可根据指令中携带的标签组以及标签组对应的层级,构建标签树模型的分支节点层级;可根据选取标签组中的选取的标签,设置标签树模型对应的分支节点层中的分支节点。
通过自定义的标签组,以及标签组中的标签来构建标签树模型,可以实现对投资主体自定义统计维度。根据构建的标签树模型,可方便进行各层的分支节对应的主体实例的统计分析。
示例性的,图2是本发明实施例一提供的一种投资主体的数据统计方法中标签树模型的结构示意图。参见图2,构建好的标签树模型的结构可以为:第零层为根节点,可表示投资主体;第一层到第N层为分支节点层,每一层对应一标签组,且每层中每个分支节点可表示一标签。其中,根节点的编号可以为1,第一层分支节点的编号可以依次为11、12…19、1a、1b…1z、1A、1B…1Z,第二层分支节点的编号可以为111、112…199、1a1、1a2...1zz、1A1、1A2…1ZZ,依次类推,即分支节点的编码可以是以父节点编码为前缀,并在之后按1-9,a-z,A-Z顺序依次拼接而成的编码。此外,拼接内容除上述字母和数字外,还可以为符号等,且拼接顺序并不限于上述顺序。
S140、根据各主体实例的标签,将各主体实例关联至标签树模型中相应的分支节点。
根据各主体实例的标签,将各主体实例关联至标签树模型中相应的分支节点,例如可以是,从根节点到当前分支节点经过的所有标签,与主体实例的被设置标签相同,则将该主体实例关联至当前分支节点。其中,可以根据标签树模型中当前分支节点的编号,以及标签树各层各节点对应标签,确定从根节点到当前分支节点的所有标签。
由于各主体实例被设置的标签的数量、内容不完全相同,各主体实例可关联至标签树模型中不同层的不同分支节点处。示例性的,若主体实例1被设置为标签1,该标签在标签树模型的节点编号为11,则主体实例1关联至编号为11的分支节点;若主体实例2被设置为标签1和标签2,其中标签1和标签2分别对应父节点11和子节点111,则将主体实例2与距离根节点更远的分支节点111关联。
S150、响应于统计指令,确定标签树模型中的待统计节点,对待统计节点对应的主体实例进行统计,并根据统计结果生成统计表。
统计指令中可携带有待统计节点的节点编号,根据节点编号可确定签树模型中的待统计节点。其中,对待统计节点对应的主体实例,可以是对待统计节点,以及待统计节点的全部子节点对应的主体实例。
可选的,对待统计节点对应的主体实例进行统计,并根据统计结果生成统计表,包括:确定待统计节点对应的主体实例的待统计字段,并对待统计字段的字段数据进行汇总;根据由根节点到待统计节点的标签、待统计节点对应的主体实例、待统计字段的字段数据,以及字段数据的汇总结果,生成统计表。
统计指令中还可以携带有待统计字段,电子设备根据统计指令可以提取待统计的主体实例的待统计字段的字段数据,并对提取的字段数据进行汇总。电子设备可将由根节点到待统计节点的标签、待统计节点对应的主体实例、待统计字段的字段数据,以及字段数据的汇总结果插入统计表预设位置,以生成统计表。统计表生成后,可通过表格视图进行展示,以使用户直观了解到针对待统计节点维度的统计结果。
示例性的,表1为投资主体“中国A股”对应的标签树模型。参见表1,根节点为中国A股(节点编号为1),第一层分支节点按沪市(节点编号为11)、深市(节点编号为12)进行划分,第二层分支节点按省市地域进行划分(节点编号请参见表1),第三层分支节点按市值进行划分(节点编号请参见表1)。表1中的标签树模型可用于进行投资研究分析,例如,当待统计节点为沪市节点下的北京节点(即统计节点编号为111)时,电子设备可将北京节点,以及北京节点下的大市值和小市值对应的主体实例皆作为待统计主体实例(即统计节点编号前几个数字为111的全部主体实例),且可将待统计主体实例插入表格对应位置;可将待统计实例的“市值”、“当日成交量”和“当月成交量”作为待统计字段,可将待统计字段对应的字段数据插入表格对应位置;此外,可将字段数据的汇总值插入表格中“汇总值”位置。从而实现了投资主体“中国A股”在沪市节点下的北京节点的维度的展示和统计,并有利于后续的研究分析。
表1
Figure BDA0002308565890000131
表1中标签树模型的构建,待统计节点的选取以及待统计字段的选取皆可根据实际场景进行自定义设置,例如可选取一个或多个待统计节点,选取一个或多个待统计字段,而并不限于上述表格内容。投资领域相关从业人员可以利用本实施例提供的数据统计方法,自定义投资主体、自主进行标签扩展,自定义标签树模型,以及自定义统计节点(即自定义统计维度),从而实现了对各投资主体的全方位数据统计,提高了资产管理从业者的统计效率,有利于对各投资主体的研充分析。
本发明实施例提供的一种投资主体的数据统计方法、装置、电子设备及存储介质,电子设备响应于选取指令,从数据库中选取至少一张数据表的至少一个字段的字段数据,并将相同主体实例的字段数据进行关联,实现了自定义投资主体,即实现了投资主体的扩展。电子设备根据各主体实例对应的字段数据,对各主体实例设置标签;其中,标签响应于标签更新指令进行更新,实现了标签扩展。电子设备响应于标签树生成指令,根据至少一个预设标签组构建标签树模型;其中,标签树模型的根节点为投资主体,至少一层分支节点与至少一个预设标签组相对应,且各层中分支节点为对应的预设标签组中的标签;根据各主体实例的标签,将各主体实例关联至标签树模型中相应的分支节点;响应于统计指令,确定标签树模型中的待统计节点,对待统计节点对应的主体实例进行统计,并根据统计结果生成统计表,实现了自定义维度的数据统计。
实施例二
图3是本发明实施例二提供的一种投资主体的数据统计装置的结构示意图。应用该计量装置可以实现本发明任一实施例所提供的投资主体的数据统计方法。
参见图3,投资主体的数据统计装置包括:
数据选取模块310,用以响应于选取指令,从数据库中选取至少一张数据表的至少一个字段的字段数据,并将相同主体实例的字段数据进行关联;
标签设置模块320,用于根据各主体实例对应的字段数据,对各主体实例设置标签;其中,标签响应于标签更新指令进行更新,且标签从属于至少一个预设标签组;
标签树模型构建模块330,用以响应于标签树生成指令,根据至少一个预设标签组构建标签树模型;其中,标签树模型的根节点为投资主体,至少一层分支节点与至少一个预设标签组相对应,且各层中分支节点为对应的预设标签组中的标签;
主体实例关联模块340,用于根据各主体实例的标签,将各主体实例关联至标签树模型中相应的分支节点;
统计模块350,用以响应于统计指令,确定标签树模型中的待统计节点,对待统计节点对应的主体实例进行统计,并根据统计结果生成统计表。
可选的,数据选取模块,具体用于:从数据库中选取主表,并从主表中选取至少一个第一字段的字段数据;判断是否关联从表;若是,则从数据库中选取从表,并从从表中选取至少一个第二字段的字段数据,并将相同主体实例的第一字段的字段数据与第二字段的字段数据进行关联,直至所有从表关联完毕;若否,则将相同主体实例的第一字段的字段数据进行关联。
可选的,标签设置模块,包括:
自动打标子模块,用以基于预设的标签设置规则,对各主体实例设置标签;
手工打标子模块,用以响应于打标指令,查询目标主体实例,并对目标主体实例设置标签。
可选的,自动打标子模块,具体用于:根据预设的标签设置规则,确定各主体实例的目标字段;确定目标字段的字段数据所从属的取值范围,并根据所从属的取值范围设置各主体实例的标签。
可选的,自动打标子模块,还用于:当主体实例更新时,根据预设的标签设置规则,确定更新后主体实例的目标字段;确定更新后的目标字段的字段数据所从属的取值范围,并根据所从属的取值范围设置更新后主体实例的标签。
可选的,当目标字段为日期字段时,自动打标子模块,还用于:当日期变更时,确定当前日期与日期字段的字段数据的差值,并确定差值所从属的取值范围。
可选的,统计模块,具体用于:确定待统计节点对应的主体实例的待统计字段,并对待统计字段的字段数据进行汇总;根据由根节点到待统计节点的标签、待统计节点对应的主体实例、待统计字段的字段数据,以及字段数据的汇总结果,生成统计表。
本发明实施例所提供的投资主体的数据统计装置可执行本发明任一实施例所提供的投资主体的数据统计方法,具备执行方法相应的功能模块和有益效果。未详尽描述的技术细节,可参见本发明任一实施例所提供的投资主体的数据统计方法。
实施例三
图4是本发明实施例三提供的一种电子设备的结构示意图。图4示出了适于用来实现本发明实施方式的示例性电子设备12的框图。图4显示的电子设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。设备12典型的是承担投资主体的数据统计功能的电子设备。
如图4所示,电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,存储器28,连接不同组件(包括存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture,ISA)总线,微通道体系结构(Micro Channel Architecture,MCA)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及外围组件互连(Peripheral Component Interconnect,PCI)总线。
电子设备12典型地包括多种计算机可读介质。这些介质可以是任何能够被电子设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机装置可读介质,例如随机存取存储器(Random Access Memory,RAM)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如只读光盘(Compact Disc-Read Only Memory,CD-ROM)、数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品40,该程序产品40具有一组程序模块42,这些程序模块被配置以执行本发明各实施例的功能。程序产品40,可以存储在例如存储器28中,这样的程序模块42包括但不限于一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
电子设备12也可以与一个或多个外部设备14(例如键盘、鼠标、摄像头等和显示器)通信,还可与一个或者多个使得用户能与该电子设备12交互的设备通信,和/或与使得该电子设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local Area Network,LAN),广域网WideArea Network,WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与电子设备12的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of Independent Disks,RAID)装置、磁带驱动器以及数据备份存储装置等。
处理器16通过运行存储在存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明上述实施例所提供的投资主体的数据统计方法,该方法包括:
响应于选取指令,从数据库中选取至少一张数据表的至少一个字段的字段数据,并将相同主体实例的字段数据进行关联;根据各主体实例对应的字段数据,对各主体实例设置标签;其中,标签响应于标签更新指令进行更新,且标签从属于至少一个预设标签组;响应于标签树生成指令,根据至少一个预设标签组构建标签树模型;其中,标签树模型的根节点为投资主体,至少一层分支节点与至少一个预设标签组相对应,且各层中分支节点为对应的预设标签组中的标签;根据各主体实例的标签,将各主体实例关联至标签树模型中相应的分支节点;响应于统计指令,确定标签树模型中的待统计节点,对待统计节点对应的主体实例进行统计,并根据统计结果生成统计表。
当然,本领域技术人员可以理解,处理器还可以实现本发明任一实施例所提供的投资主体的数据统计方法的技术方案。
实施例四
本发明实施例四还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例所提供的投资主体的数据统计方法,该方法包括:
响应于选取指令,从数据库中选取至少一张数据表的至少一个字段的字段数据,并将相同主体实例的字段数据进行关联;根据各主体实例对应的字段数据,对各主体实例设置标签;其中,标签响应于标签更新指令进行更新,且标签从属于至少一个预设标签组;响应于标签树生成指令,根据至少一个预设标签组构建标签树模型;其中,标签树模型的根节点为投资主体,至少一层分支节点与至少一个预设标签组相对应,且各层中分支节点为对应的预设标签组中的标签;根据各主体实例的标签,将各主体实例关联至标签树模型中相应的分支节点;响应于统计指令,确定标签树模型中的待统计节点,对待统计节点对应的主体实例进行统计,并根据统计结果生成统计表。
当然,本发明实施例所提供的一种计算机可读存储介质,其上存储的计算机程序不限于如上的方法指令,还可以执行本发明任一实施例所提供的投资主体的数据统计方法。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的装置、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行装置、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行装置、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明指令的计算机程序代码,程序设计语言包括面向对象的程序设计语言-诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言-诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)-连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (9)

1.一种投资主体的数据统计方法,其特征在于,包括:
响应于选取指令,从数据库中选取至少一张数据表的至少一个字段的字段数据,并将相同主体实例的字段数据进行关联;
根据各主体实例对应的字段数据,对所述各主体实例设置标签;其中,所述标签响应于标签更新指令进行更新,且所述标签从属于至少一个预设标签组;
响应于标签树生成指令,根据所述至少一个预设标签组构建标签树模型;其中,所述标签树模型的根节点为投资主体,至少一层分支节点与至少一个预设标签组相对应,且各层中分支节点为对应的预设标签组中的标签;
根据所述各主体实例的标签,将所述各主体实例关联至所述标签树模型中相应的分支节点;
响应于统计指令,确定所述标签树模型中的待统计节点,对所述待统计节点对应的主体实例进行统计,并根据统计结果生成统计表;
其中,所述从数据库中选取至少一张数据表的至少一个字段的字段数据,并将相同主体实例的字段数据进行关联,包括:
从数据库中选取主表,并从所述主表中选取至少一个第一字段的字段数据;
判断是否关联从表;
若是,则从数据库中选取从表,并从所述从表中选取至少一个第二字段的字段数据,并将相同主体实例的第一字段的字段数据与第二字段的字段数据进行关联,直至所有从表关联完毕;
若否,则将相同主体实例的第一字段的字段数据进行关联。
2.根据权利要求1所述的方法,其特征在于,所述对所述各主体实例设置标签,包括:
基于预设的标签设置规则,对所述各主体实例设置标签;
或者,响应于打标指令,查询目标主体实例,并对所述目标主体实例设置标签。
3.根据权利要求2所述的方法,其特征在于,所述基于预设的标签设置规则,对所述各主体实例设置标签,包括:
根据预设的标签设置规则,确定各主体实例的目标字段;
确定所述目标字段的字段数据所从属的取值范围,并根据所述所从属的取值范围设置所述各主体实例的标签。
4.根据权利要求3所述的方法,其特征在于,还包括:
当所述主体实例更新时,根据预设的标签设置规则,确定更新后主体实例的目标字段;
确定更新后的目标字段的字段数据所从属的取值范围,并根据所述所从属的取值范围设置更新后主体实例的标签。
5.根据权利要求3所述的方法,其特征在于,当目标字段为日期字段时,所述确定所述目标字段的字段数据所从属的取值范围,包括:
当日期变更时,确定当前日期与所述日期字段的字段数据的差值,并确定所述差值所从属的取值范围。
6.根据权利要求1所述的方法,其特征在于,所述对所述待统计节点对应的主体实例进行统计,并根据统计结果生成统计表,包括:
确定待统计节点对应的主体实例的待统计字段,并对待统计字段的字段数据进行汇总;
根据由根节点到待统计节点的标签、所述待统计节点对应的主体实例、所述待统计字段的字段数据,以及字段数据的汇总结果,生成统计表。
7.一种投资主体的数据统计装置,其特征在于,包括:
数据选取模块,用以响应于选取指令,从数据库中选取至少一张数据表的至少一个字段的字段数据,并将相同主体实例的字段数据进行关联;
标签设置模块,用于根据各主体实例对应的字段数据,对所述各主体实例设置标签;其中,所述标签响应于标签更新指令进行更新,且所述标签从属于至少一个预设标签组;
标签树模型构建模块,用以响应于标签树生成指令,根据所述至少一个预设标签组构建标签树模型;其中,所述标签树模型的根节点为投资主体,至少一层分支节点与至少一个预设标签组相对应,且各层中分支节点为对应的预设标签组中的标签;
主体实例关联模块,用于根据所述各主体实例的标签,将所述各主体实例关联至所述标签树模型中相应的分支节点;
统计模块,用以响应于统计指令,确定所述标签树模型中的待统计节点,对所述待统计节点对应的主体实例进行统计,并根据统计结果生成统计表;
其中,数据选取模块,用于:从数据库中选取主表,并从所述主表中选取至少一个第一字段的字段数据;判断是否关联从表;若是,则从数据库中选取从表,并从所述从表中选取至少一个第二字段的字段数据,并将相同主体实例的第一字段的字段数据与第二字段的字段数据进行关联,直至所有从表关联完毕;若否,则将相同主体实例的第一字段的字段数据进行关联。
8.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-6中任一所述的投资主体的数据统计方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的投资主体的数据统计方法。
CN201911255073.4A 2019-12-09 2019-12-09 投资主体的数据统计方法、装置、电子设备及存储介质 Active CN110928928B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911255073.4A CN110928928B (zh) 2019-12-09 2019-12-09 投资主体的数据统计方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911255073.4A CN110928928B (zh) 2019-12-09 2019-12-09 投资主体的数据统计方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN110928928A CN110928928A (zh) 2020-03-27
CN110928928B true CN110928928B (zh) 2023-03-14

Family

ID=69858001

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911255073.4A Active CN110928928B (zh) 2019-12-09 2019-12-09 投资主体的数据统计方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN110928928B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113761839A (zh) * 2021-04-30 2021-12-07 中科天玑数据科技股份有限公司 一种多层分组的多维统计分析方法
CN115757400B (zh) * 2022-11-07 2023-06-13 北京国电通网络技术有限公司 数据表处理方法、装置、电子设备和计算机可读介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105550270A (zh) * 2015-12-09 2016-05-04 百度在线网络技术(北京)有限公司 数据库查询方法和装置
CN110309496A (zh) * 2019-06-24 2019-10-08 招商局金融科技有限公司 数据汇总方法、电子装置及计算机可读存储介质
CN110362585A (zh) * 2019-06-19 2019-10-22 东软集团股份有限公司 数据分析方法、装置,存储介质及电子设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7694216B2 (en) * 2000-12-19 2010-04-06 International Business Machines Corporation Automatic assignment of field labels
GB2507095A (en) * 2012-10-19 2014-04-23 Ibm Generating synthetic data from a decision tree model of a dataset

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105550270A (zh) * 2015-12-09 2016-05-04 百度在线网络技术(北京)有限公司 数据库查询方法和装置
CN110362585A (zh) * 2019-06-19 2019-10-22 东软集团股份有限公司 数据分析方法、装置,存储介质及电子设备
CN110309496A (zh) * 2019-06-24 2019-10-08 招商局金融科技有限公司 数据汇总方法、电子装置及计算机可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Table structure analysis based on cell classification and cell modification for XML document transformation;Y. Ishitani等;《Eighth International Conference on Document Analysis and Recognition (ICDAR"05)》;20060116;1-6页 *
分布式数据库聚合计算性能优化;肖子达等;《计算机应用》;20170531;1231-1256 *

Also Published As

Publication number Publication date
CN110928928A (zh) 2020-03-27

Similar Documents

Publication Publication Date Title
CN108027818B (zh) 基于图的查询
CN110019616B (zh) 一种poi现势状态获取方法及其设备、存储介质、服务器
CN111177231A (zh) 报表生成方法和报表生成装置
CN106326438B (zh) 一种人员信息的关联方法
CN113064897B (zh) 一种业务指标模型的生成方法、装置、设备及存储介质
US20160246705A1 (en) Data fabrication based on test requirements
CN110928928B (zh) 投资主体的数据统计方法、装置、电子设备及存储介质
CN107515866B (zh) 一种数据操作方法、装置和系统
CN111553556A (zh) 业务数据分析方法、装置、计算机设备及存储介质
CN114925143A (zh) 逻辑模型血缘关系的描述方法、装置、设备、介质及产品
CN115203435A (zh) 基于知识图谱的实体关系生成方法及数据查询方法
CN116304236A (zh) 一种用户画像生成方法、装置、电子设备和存储介质
CN115309747A (zh) 基于空间网格数据的消防管理方法、平台及电子设备
US20150170067A1 (en) Determining analysis recommendations based on data analysis context
CN113806556A (zh) 基于电网数据的知识图谱的构建方法、装置、设备及介质
CN109542986B (zh) 网络数据的要素归一化方法、装置、设备及存储介质
CN113127574A (zh) 基于知识图谱的业务数据展示方法、系统、设备及介质
US9208224B2 (en) Business content hierarchy
JPH0477869A (ja) データベースシステムのマルチメデイアデータ処理方法
CN115952174B (zh) 一种数据表联接方法、系统、终端及存储介质
CN113297255B (zh) 一种数据处理方法和装置
CN114625757B (zh) 基于领域特定语言的任务执行方法及装置、介质、设备
CN114064942A (zh) 一种作品内容池的确定方法、装置、设备及存储介质
CN114925060A (zh) 指标体系网络关系的处理方法和装置
CN117688939A (zh) 一种实体关系提取的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220920

Address after: 25 Financial Street, Xicheng District, Beijing 100033

Applicant after: CHINA CONSTRUCTION BANK Corp.

Address before: 25 Financial Street, Xicheng District, Beijing 100033

Applicant before: CHINA CONSTRUCTION BANK Corp.

Applicant before: Jianxin Financial Science and Technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant