CN112767183B - 保险产品的数据解析方法、装置及存储介质 - Google Patents

保险产品的数据解析方法、装置及存储介质 Download PDF

Info

Publication number
CN112767183B
CN112767183B CN202110076820.9A CN202110076820A CN112767183B CN 112767183 B CN112767183 B CN 112767183B CN 202110076820 A CN202110076820 A CN 202110076820A CN 112767183 B CN112767183 B CN 112767183B
Authority
CN
China
Prior art keywords
target
factor
calculation
data table
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110076820.9A
Other languages
English (en)
Other versions
CN112767183A (zh
Inventor
罗滨滨
韩志华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Datong Insurance Sales Service Co ltd
Original Assignee
Datong Insurance Sales Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Datong Insurance Sales Service Co ltd filed Critical Datong Insurance Sales Service Co ltd
Priority to CN202110076820.9A priority Critical patent/CN112767183B/zh
Publication of CN112767183A publication Critical patent/CN112767183A/zh
Application granted granted Critical
Publication of CN112767183B publication Critical patent/CN112767183B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请公开了一种保险产品的数据解析方法、装置及存储介质。其中,该方法包括:获取与保险产品相关的数据文件,其中数据文件包括影响保险产品的保险费或现金价值计算的计算因子、与计算因子对应的因子值以及费率值或现价值;根据预设的表格模板和数据文件,确定待解析的目标数据表格,其中目标数据表格包括影响保险产品的保险费或现金价值计算的作为表头的经规范定义的目标计算因子、与目标计算因子对应的目标因子批注信息、与目标计算因子对应的目标因子值以及对应的费率值或现价值;以及根据目标数据表格中的目标因子批注信息,对目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格。

Description

保险产品的数据解析方法、装置及存储介质
技术领域
本申请涉及数据处理技术领域,特别是涉及一种保险产品的数据解析方法、装置及存储介质。
背景技术
当保险公司推出新的保险产品时,保险代理服务平台需要及时将新的保险产品的数据信息(例如费率表和现金价值表)录入到保险代理服务平台的数据系统中。保险公司的保险产品的数据信息为PDF格式或WORD格式,通常如图4所示那样布置的,但是,保险代理服务平台最终需要录入数据系统的数据,需要与数据库的存储格式相匹配,通常为按照CSV格式来进行存储的。由于保险公司公布的保险产品的数据信息的格式与最终存储的格式存在很大差别,因此在实际的录入工作中,需要工作人员将原始的数据信息中的各个数据单元的数据逐一拷贝到最终存储的表格中,从而给数据录入工作带来了很大不便。
针对上述的现有技术中存在的由于保险公司公布的保险产品的数据信息的格式与保险代理服务平台最终存储的格式存在较大差别,因此在实际的录入工作中需要工作人员将原始的数据信息中的各个数据单元的数据逐一拷贝到最终存储的表格中,从而给数据录入工作带来了很大不便的技术问题,目前尚未提出有效的解决方案。
发明内容
本公开的实施例提供了一种保险产品的数据解析方法、装置及存储介质,以至少解决现有技术中存在的由于保险公司公布的保险产品的数据信息的格式与保险代理服务平台最终存储的格式存在较大差别,因此在实际的录入工作中需要工作人员将原始的数据信息中的各个数据单元的数据逐一拷贝到最终存储的表格中,从而给数据录入工作带来了很大不便的技术问题。
根据本公开实施例的一个方面,提供了一种保险产品的数据解析方法,包括:获取与保险产品相关的数据文件,其中数据文件包括影响保险产品的保险费或现金价值计算的计算因子、与计算因子对应的因子值以及费率值或现价值;根据预设的表格模板和数据文件,确定待解析的目标数据表格,其中表格模板包括影响不同保险的不同保险产品的保险费或现金价值计算的作为表头的经规范定义的各个计算因子以及与各个计算因子对应的因子批注信息,因子批注信息用于指示对应的计算因子的解析算法,并且目标数据表格包括影响保险产品的保险费或现金价值计算的作为表头的经规范定义的目标计算因子、与目标计算因子对应的目标因子批注信息、与目标计算因子对应的目标因子值以及对应的费率值或现价值;以及根据目标数据表格中的目标因子批注信息,对目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格。
根据本公开实施例的另一个方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时由处理器执行以上任意一项所述的方法。
根据本公开实施例的另一个方面,还提供了一种保险产品的数据解析装置,包括:数据文件获取模块,用于获取与保险产品相关的数据文件,其中数据文件包括影响保险产品的保险费或现金价值计算的计算因子、与计算因子对应的因子值以及费率值或现价值;目标数据表格确定模块,用于根据预设的表格模板和数据文件,确定待解析的目标数据表格,其中表格模板包括影响不同保险的不同保险产品的保险费或现金价值计算的作为表头的经规范定义的各个计算因子以及与各个计算因子对应的因子批注信息,因子批注信息用于指示对应的计算因子的解析算法,并且目标数据表格包括影响保险产品的保险费或现金价值计算的作为表头的经规范定义的目标计算因子、与目标计算因子对应的目标因子批注信息、与目标计算因子对应的目标因子值以及对应的费率值或现价值;以及解析模块,用于根据目标数据表格中的目标因子批注信息,对目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格。
根据本公开实施例的另一个方面,还提供了一种保险产品的数据解析装置,包括:处理器;以及存储器,与处理器连接,用于为处理器提供处理以下处理步骤的指令:获取与保险产品相关的数据文件,其中数据文件包括影响保险产品的保险费或现金价值计算的计算因子、与计算因子对应的因子值以及费率值或现价值;根据预设的表格模板和数据文件,确定待解析的目标数据表格,其中表格模板包括影响不同保险的不同保险产品的保险费或现金价值计算的作为表头的经规范定义的各个计算因子以及与各个计算因子对应的因子批注信息,因子批注信息用于指示对应的计算因子的解析算法,并且目标数据表格包括影响保险产品的保险费或现金价值计算的作为表头的经规范定义的目标计算因子、与目标计算因子对应的目标因子批注信息、与目标计算因子对应的目标因子值以及对应的费率值或现价值;以及根据目标数据表格中的目标因子批注信息,对目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格。
在本公开实施例中,首先获取与保险产品相关的数据文件,由于该数据文件的格式与保险代理服务平台最终存储至数据库的数据信息的格式存在很大差别,因此需要根据预设的表格模板和获取到的数据文件,确定待解析的目标数据表格,最后根据目标数据表格中的目标因子批注信息,对目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格。通过上述方式,最终生成一个符合预设的数据库的存储格式相匹配的目标存储表格,能够成功地将目标存储表格存入保险代理服务平台预设的数据库中。从而,工作人员在将保险公司公布的保险产品的数据信息录入系统时,不必再逐个的将数据单元进行拷贝,而是基于预设的表格模板,读取保险公司的发布的数据信息中的因子值、费率值和现价值数值并导入表格模板的对应的单元格中,生成待解析的目标数据表格,从而能够根据该目标数据表格中的因子批注信息,对目标数据表格进行解析,最终生成与预设的数据库的存储格式相匹配的目标存储表格,从而可以大大提高数据的录入效率。进而解决了现有技术中存在的由于保险公司公布的保险产品的数据信息的格式与保险代理服务平台最终存储的格式存在较大差别,因此在实际的录入工作中需要工作人员将原始的数据信息中的各个数据单元的数据逐一拷贝到最终存储的表格中,从而给数据录入工作带来了很大不便的技术问题。
附图说明
此处所说明的附图用来提供对本公开的进一步理解,构成本申请的一部分,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。在附图中:
图1是用于实现根据本公开实施例1所述的方法的计算设备的硬件结构框图;
图2是根据本公开实施例1所述的保险代理服务平台的示意图;
图3是根据本公开实施例1的第一个方面所述的保险产品的数据解析方法的流程示意图;
图4是根据本公开实施例1所述的保险公司向保险代理服务平台提供的保险产品的数据信息的示意图;
图5是根据本公开实施例1所述的现金价值表的示意图;
图6是根据本公开实施例1所述的表格模板的示意图;
图7是根据本公开实施例1所述的根据图5所示的现金价值表和图6所述的表格模板生成的目标数据表格的示意图;
图8A是根据本公开实施例1所述的对目标数据表格进行解析后得到的目标存储表格的示意图;
图8B是根据本公开实施例1所述的图8A所示的目标存储表格的字段说明的示意图;
图9A是根据本公开实施例1所述的根据表格模板生成的坐标系型的目标数据表格的一个示意图;
图9B是根据本公开实施例1所述的根据表格模板生成的坐标系型的目标数据表格的另一个示意图;
图10是根据本公开实施例1所述的因子规范定义和因子解析批注定义的流程示意图;
图11是根据本公开实施例2所述的保险产品的数据解析装置的示意图;以及
图12是根据本公开实施例3所述的保险产品的数据解析装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本公开的技术方案,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本公开一部分的实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本公开保护的范围。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本实施例,提供了一种保险产品的数据解析方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本实施例所提供的方法实施例可以在服务器或者类似的计算设备中执行。图1示出了一种用于实现保险产品的数据解析方法的计算设备的硬件结构框图。如图1所示,计算设备可以包括一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器、以及用于通信功能的传输装置。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算设备还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算设备中的其他元件中的任意一个内。如本公开实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器可用于存储应用软件的软件程序以及模块,如本公开实施例中的保险产品的数据解析方法对应的程序指令/数据存储装置,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的保险产品的数据解析方法。存储器可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算设备的通信供应商提供的无线网络。在一个实例中,传输装置包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算设备的用户界面进行交互。
此处需要说明的是,在一些可选实施例中,上述图1所示的计算设备可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是,图1仅为特定具体实例的一个实例,并且旨在示出可存在于上述计算设备中的部件的类型。
图2是根据本实施例所述的保险代理服务平台的示意图。参照图2所示,该平台包括:平台的服务器300以及各个保险公司的终端设备(例如:保险公司110~130的终端设备210~230)。其中,在各个保险公司需要将新推出的保险产品的数据信息(例如,费率表和现金价值表)在保险代理服务平台进行发布的情况下,可以通过各自的终端设备将对应的保险产品的数据信息发送至保险代理服务平台的服务器300。由服务器300对从不同保险公司接收到的不同数据格式的保险产品的数据信息进行数据解析,生成具有统一的、符合数据库的存储格式的表格,并进行存储后发布。需要说明的是,系统中的服务器300、终端设备210~230均可适用上面所述的硬件结构。
在上述运行环境下,根据本实施例的第一个方面,提供了一种保险产品的数据解析方法,该方法由图2中所示的服务器300实现。图3示出了该方法的流程示意图,参考图3所示,该方法包括:
S302:获取与保险产品相关的数据文件,其中数据文件包括影响保险产品的保险费或现金价值计算的计算因子、与计算因子对应的因子值以及费率值或现价值;
S304:根据预设的表格模板和数据文件,确定待解析的目标数据表格;以及
S306:根据目标数据表格中的目标因子批注信息,对目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格。
其中,表格模板包括影响不同保险的不同保险产品的保险费或现金价值计算的作为表头的经规范定义的各个计算因子以及与各个计算因子对应的因子批注信息,因子批注信息用于指示对应的计算因子的解析算法,并且目标数据表格包括影响保险产品的保险费或现金价值计算的作为表头的经规范定义的目标计算因子、与目标计算因子对应的目标因子批注信息、与目标计算因子对应的目标因子值以及对应的费率值或现价值。
正如上述背景技术所述的,当保险公司推出新的保险产品时,保险代理服务平台需要及时将新的保险产品的数据信息(例如费率表和现金价值表)录入到保险代理服务平台的数据系统中。保险公司的保险产品的数据信息为PDF格式或WORD格式,通常如图1所示那样布置的,但是,保险代理服务平台最终需要录入数据系统的数据,需要与数据库的存储格式相匹配,通常为按照CSV格式来进行存储的。由于保险公司公布的保险产品的数据信息的格式与最终存储的格式存在很大差别,因此在实际的录入工作中,需要工作人员将原始的数据信息中的各个数据单元的数据逐一拷贝到最终存储的表格中,从而给数据录入工作带来了很大不便。
有鉴于此,在本实施例中,参照图2所示,在保险公司(例如保险公司110)需要将新推出的保险产品的数据信息(例如,费率表或者现金价值表)在保险代理服务平台进行发布的情况下,可以通过终端设备210将对应的保险产品的数据信息发送至保险代理服务平台的服务器300。在此应用场景下,服务器300首先从保险公司110的终端设备210获取与保险产品相关的数据文件。其中,数据文件包括影响保险产品的保险费或现金价值计算的计算因子、与计算因子对应的因子值以及费率值或现价值。示例性的,参照图4所示,保险公司110新推出的保险产品可以为恒大附加恒顺意外伤害医疗保险产品(下文简称:恒大意外医疗保险产品),与该保险产品相关的数据文件例如为PDF格式的费率表,此费率表中包括影响恒大意外医疗保险产品的保险费的计算因子为投保年龄、职业类别和意外医疗保险金额,与投保年龄这一计算因子对应的因子值为0~65和66~80,与职业类别这一计算因子对应的因子值为1-4类、5类和6类,与意外医疗保险金额这一计算因子对应的因子值为≤5000元和高于5000元以上的部分,并且包括的费率值有10.26、7.11、27.67、19.29、35.89、24.88、31.54、21.86、34.7、24.05、41和28.42。
此外,参照图5所示,保险公司110新推出的保险产品还可以为长城吉康人生(2021)重大疾病保险产品(下文简称:吉康重大疾病保险产品),与该保险产品相关的数据文件例如为PDF格式的现金价值表,此现金价值表中包括影响吉康重大疾病保险产品的现金价值的计算因子为性别、投保年龄、交易类型、交费期间、保障类型、保险期间、保单年度末,与性别这一计算因子对应的因子值例如为M(男)和F(女),与投保年龄这一计算因子对应的因子值为1、2、3和4,与其他计算因子对应的因子值可以参见图5所示,此处不再赘述,并且包括的现金价值有49.7、51.5、......、63.8等。
进一步地,保险代理服务平台最终存储至数据库的数据信息的格式通常为CSV格式,由于保险公司110公布的保险产品的数据信息的格式与最终存储的格式存在很大差别,因此服务器300需要根据预设的表格模板和数据文件,确定待解析的目标数据表格。其中,表格模板包括影响不同保险的不同保险产品的保险费或现金价值计算的作为表头的经规范定义的各个计算因子以及与各个计算因子对应的因子批注信息,因子批注信息用于指示对应的计算因子的解析算法。图6示例性的示出了与现金价值表对应的表格模板,参照图6所示,该表格模板包括影响保险产品的现金价值计算的作为表头的经规范定义的各个计算因子(例如但不限于:性别、投保年龄、交易类型、交费期间、保障类型、保险期间、保单年度末、计划档次、主险保障期间和附加险保障期间等,)以及与各个计算因子对应的因子批注信息。例如:与投保年龄对应的因子批注信息为:{"axis":"Y","factorCode":"age"},与性别对应的因子批注信息为:{"axis":"Y","factorCode":"gender"},与保单年度末的因子批注信息为:{"axis":"Y","factorCode":"policyYear"}等等。图6仅示例性的示出了与现金价值表对应的列表型的表格模板,在本实施例中,表格模板还可以为坐标系类型。在坐标系类型中,与投保年龄对应的因子批注信息为:{"axis":"X","factorCode":"age"},与性别对应的因子批注信息为:{"axis":"X","factorCode":"gender"},与保单年度末的因子批注信息为:{"axis":"Y","factorCode":"policyYear"}等等。此外,预设的表格模板还包括与费率表对应的坐标系类型或者列表型的表格模板,该表格模板的表格结构可以参照上述的与现金价值表对应的表格模板具体结构。
进一步地,服务器300根据预设的表格模板和数据文件,所确定的待解析的目标数据表格包括影响保险产品的保险费或现金价值计算的作为表头的经规范定义的目标计算因子、与目标计算因子对应的目标因子批注信息、与目标计算因子对应的目标因子值以及对应的费率值或现价值。其中,图7示例性的示出了根据图6所示的表格模板以及图5所示的现金价值表确定得到的与现金价值表对应的待解析的目标数据表格,参见图7所示,由于图6所示的表格模板包括不同保险产品的各个计算因子以及对应的因子批注信息,因此服务器300需要将与影响吉康重大疾病保险产品的现金价值计算无关的计算因子(例如:计划档次、主险保障期间和附加险保障期间)进行删除,并且读取图5所示的现金价值表中的与各个计算因子对应的因子值和与现金价值对应的现金价值的数值,并将读取到的数值存入表格模板对应的单元格中,从而生成图7所示的待解析的目标数据表格。
进一步地,由于不同的保险公司对不同保险产品的计算因子的定义不一致,为了利于后期进行数据聚合操作,服务器300需要预先对不同保险公司的不同保险产品的计算因子(例如:费率因子和现价因子)进行统一规范定义。其中,服务器300可以使用唯一的产品代码来定义各个计算因子,例如:使用产品代码为“gender”来定义“性别”这一计算因子,使用产品代码为“age”来定义“投保年龄”这一计算因子,等等。由于目标因子批注信息用于指示目标计算因子的解析算法,即目标因子批注信息定义有的对应的计算因子的读取方向,例如,axis":"X"指示该计算因子的读取方向为横向进行数据读取解析,axis":"Y"指示该计算因子的读取方向为纵向进行数据读取解析,因此服务器300可以根据目标数据表格中的目标因子批注信息,对目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格(参见图8A和图8B所示)。
从而,在本实施例中,服务器300首先获取与保险产品相关的数据文件,由于该数据文件的格式与保险代理服务平台最终存储至数据库的数据信息的格式存在很大差别,因此服务器300需要根据预设的表格模板和获取到的数据文件,确定待解析的目标数据表格,最后服务器300根据目标数据表格中的目标因子批注信息,对目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格。通过上述方式,最终生成一个符合预设的数据库的存储格式相匹配的目标存储表格,能够成功地将目标存储表格存入保险代理服务平台预设的数据库中。从而,工作人员在将保险公司公布的保险产品的数据信息录入系统时,不必再逐个的将数据单元进行拷贝,而是由服务器300基于预设的表格模板,读取保险公司的发布的数据信息中的因子值、费率值和现价值数值并导入表格模板的对应的单元格中,生成待解析的目标数据表格,使得服务器300能够根据该目标数据表格中的因子批注信息,对目标数据表格进行解析,最终生成与预设的数据库的存储格式相匹配的目标存储表格,从而可以大大提高数据的录入效率。进而解决了现有技术中存在的由于保险公司公布的保险产品的数据信息的格式与保险代理服务平台最终存储的格式存在较大差别,因此在实际的录入工作中需要工作人员将原始的数据信息中的各个数据单元的数据逐一拷贝到最终存储的表格中,从而给数据录入工作带来了很大不便的技术问题。
可选地,根据目标数据表格中的目标因子批注信息,对目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格的操作,包括:根据目标数据表格的表格类型,确定用于对目标数据表格进行解析的表格解析算法;以及根据表格解析算法和目标数据表格中的目标因子批注信息,对目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格。
具体地,目标数据表格的表格类型大致分为坐标系类型和列表类型,其中坐标系类型又可以细分为常规坐标系型、含职业等级坐标系型、范围坐标系型等,列表类型同样也可以细分为常规列表型、含职业等级列表型、范围列表型等。并且,服务器300为不同类型的目标数据表格预先配置有不同的表格解析算法。在该系统中支持两种类型的表格解析导入,可以根据原始表格来选择相应的方式。其中,坐标系型表格的特征为类似课程表,表头分别出现于顶部前几行和左侧的前几列,在表格中的数值部分,每一条值都是横列的表头和纵列的表头交叉选择的结果。因此,服务器300解析此类型表格时,会通过因子批注信息中定义的因子读取方向:X(横向)或Y(纵向)进行相应的解析,再将横列的表头和纵列的表头临时存储,再解析数值部分时,关联到其表头进行存储。列表型表格的表头只存在于第一行,类似于考勤表,服务器300解析此类表格时,会先解析表头,再逐行解析表格,将数据和表头进行关联存储。
因此,在该应用场景下,服务器300需要根据目标数据表格的表格类型,确定用于对目标数据表格进行解析的表格解析算法,然后根据表格解析算法和目标数据表格中的目标因子批注信息,对目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格。即,服务器300需要根据表格解析算法,结合因子解析算法实现将目标数据表格中的数据解析并进行提取。通过这种方式,可以针对不同的表格类型的目标数据表格,使用不同的解析算法对其进行数据解析,进一步提高数据的录入效率。
可选地,参照图9A和图9B所示,在目标数据表格的表格类型为坐标系类型的情况下,根据表格解析算法和目标数据表格中的目标因子批注信息,对目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格的操作,包括:
S1:获取目标数据表格的总行数、总列数和Sheet数量。具体为,参见图9A所示,获取到的总行数为9行、总列数为7列,Sheet数量为1。
S2:在目标数据表格的单一Sheet表中,逐行读取目标数据表格的第一列的目标计算因子以及对应的目标因子批注信息,判定第一列中的目标因子批注信息是否符合规范,并在符合规范的情况下将第一列的目标计算因子以及目标计算因子在单一Sheet表中的位置信息进行临时存储。具体为,参见图9A所示,服务器300逐行读取到该目标数据表格的第一列的目标计算因子依次为保障类型、保障期间、缴费类型、缴费期间、保额、0-60和66-80。此时服务器300会判断第一列中表头批注是否符合规范,若不符合,则会弹出提示错误的信息,并要求重新导入,若符合,则会将计算因子的因子编码和其在表格中的位置信息临时存储起来。
S3:根据所读取的目标因子批注信息,确定对应的目标计算因子的读取方向,并根据读取方向判定单一Sheet表中的第二列至最后一列的数值是否为因子值或费率。具体为,服务器300读取目标因子批注信息时会读取目标计算因子的读取方向。当目标计算因子的读取方向为X轴时,则证明该行的第二列到最后一列的数值均为因子值,当目标计算因子的读取方向为Y轴时,则证明从该行的第二列到最后一列的数值均为费率值。例如:参见图9A所示,保障类型的因子批注信息为{"axis":"X","factorCode":"coverageType"},服务器300读取的目标计算因子的读取方向为X轴,此时服务器300将该行的第二列到最后一列的数值均确定为因子值,即服务器300将第一行的的第二列到第七列的数值“1”均确定为保障类型这一计算因子的因子值。此外,参见图9B所示,0-65这一计算因子的因子批注信息为{"axis":"Y","factorCode":"age","type":3},服务器300读取的目标计算因子的读取方向为Y轴,此时服务器300将该行的第二列到最后一列的数值均确定为费率值,即服务器300将第一行的的第二列到第七列的数值“10.26、7.11、...、24.88”均确定为0-65这一计算因子的费率值。
S4:逐行读取单一Sheet表中的第二列至最后一列的数值。具体为,服务器300参照上述步骤S2和S3中描述的逐行读取目标数据表格的第一列的操作步骤,逐行读取单一Sheet表中的第二列至最后一列的数值。
S5:根据临时存储的目标计算因子、目标计算因子在目标数据表格中的位置信息、判定的结果以及所读取的数值,进行数据组装,从而得到已组装好目标计算因子、对应的因子值以及对应的费率值的一组数据。具体为,服务器300在上述步骤中已经可以获取到各行的数值为因子值或费率值,同时结合每一个单元格的X轴和Y轴的坐标位置,进行数据组装,并且处理合并单元格的情况。读取到最后一行时,表格已经读取完毕,同时可以得到已经组装好计算因子、对应的因子值和费率值的一组数据。以及
S6:创建与预设的数据库存储格式相匹配的数据表,将一组数据存入数据表中,并将数据表确定为目标存储表格。
从而,通过上述操作步骤,可以快速、准确地得到与预设的数据库的存储格式相匹配的目标存储表格,从而可以直接将该目标存储表格存入数据库中,有效提高了数据的录入效率。
可选地,参照图7所示,在目标数据表格的表格类型为列表类型的情况下,根据表格解析算法和目标数据表格中的目标因子批注信息,对目标数据表格进行解析,生成与预设的数据库存储格式相匹配的目标存储表格的操作,包括:
S1:获取目标数据表格的总行数、总列数和Sheet数量。具体为,参见图7所示,获取到的总行数为16行、总列数为8列,Sheet数量为1。
S2:在目标数据表格的单一Sheet表中,逐列读取目标数据表格的第一行的目标计算因子以及对应的目标因子批注信息,判定第一行中的目标因子批注信息是否符合规范,并在符合规范的情况下将第一行的目标计算因子以及目标计算因子在单一Sheet表中的位置信息进行临时存储。具体为,参见图7所示,服务器300逐列读取到该目标数据表格的第一行的目标计算因子依次为性别、投保年龄、交易类型、交费期间、保障类型、保险期间、保单年度末和现金价值。此时服务器300会判断第一行中表头批注是否符合规范,若不符合,则会弹出提示错误的信息,并要求重新导入,若符合,则会将计算因子的因子编码和其在表格中的位置信息临时存储起来。
S3:在读取到第一行的最后一列的目标计算因子不具备对应的目标因子批注信息的情况下,判定最后一列的第二行至最后一行的数值均为现价值,判定第一列至倒数第二列的第二行至最后一行的数值均为因子值。具体为,参照图7所示,服务器300读取第一行的“现金价值”这一目标计算因子不具备对应的目标因子批注信息,此时服务器300判定第一行的最后一列(即图7中的第八列)的第二行至第十六行的数值(即,49.7、51.5、...、63.8)均为现价值,判定第一列至第七列的第二行至第十六行的数值均为因子值。
S4:从第二行开始逐行读取单一Sheet表中的各个列的数值。具体为,服务器300参照上述步骤S2和S3中描述的逐列读取目标数据表格的第一行的操作步骤,从第二行开始逐行读取单一Sheet表中的各个列的数值。
S5:根据临时存储的目标计算因子、目标计算因子在目标数据表格中的位置信息、判定的结果以及所读取的数值,进行数据组装,从而得到已组装好目标计算因子、对应的因子值以及对应的现价值的一组数据。具体为,服务器300在上述步骤中已经可以获取到各行的数值为因子值或现价值,同时结合每一个单元格的X轴和Y轴的坐标位置,进行数据组装。读取到最后一行时,表格已经读取完毕,同时可以得到已经组装好计算因子、对应的因子值和现价值的一组数据。以及
S6:创建与预设的数据库存储格式相匹配的数据表,将一组数据存入数据表中,并将数据表确定为目标存储表格。
从而,通过上述操作步骤,可以快速、准确地得到与预设的数据库的存储格式相匹配的目标存储表格,从而可以直接将该目标存储表格存入数据库中,有效提高了数据的录入效率。
可选地,该方法还包括:S7:在根据Sheet数量判定目标数据表格包括多个Sheet表的情况下,重复上述的S2至S5,从而得到与多个Sheet表分别对应的多组数据;S8:分别将多组数据存入目标存储表格的多个Sheet表中。
具体地,当目标数据表格存在多个Sheet表时,服务器300重复上述的S2至S5,获取所有的数据,从而得到与多个Sheet表分别对应的多组数据,然后通过唯一标识生成数据表,分别将多组数据存入目标存储表格的多个Sheet表中。通过上述方式,服务器300不仅可以具有单一Sheet表的目标数据表格进行数据解析,还能够对具有多个Sheet表的目标数据表格进行数据解析。
可选地,该方法还包括:将与不同的保险产品相关的目标存储表格存储至数据库中的不同位置。服务器300对不同保险产品相关的目标存储表格进行数据隔离存储,并在有限的产品级范围内可弹性扩展,实现了数据的弹性矩阵存储。
可选地,该方法通过以下步骤制作预设的表格模板:对影响不同保险的不同保险产品的相关费用计算的各个计算因子进行规范定义;为经规范定义的各个计算因子定义解析批注;以及将经规范定义的各个计算因子配置为表格模板的表头,并且将对应的解析批注分别配置为各个计算因子的因子批注信息。
具体地,参照图10所示,由于不同的保险公司对不同保险产品的计算因子的定义不一致,为了利于后期进行数据聚合操作,服务器300在制作预设的表格模板的过程中,需要对各个计算因子进行规范定义。其中,保险产品的费率表中包括各个费率因子,其中费率因子影响保险费计算的因素,常见的有投保年龄、性别、交费期间及保险期限等,与保险费成正比关系,即保险金额越大,保险费率越高,或保险期限越长,则应缴纳的保险费就越多。其中任何一个因素的变化,都会引起保险费的增减变动。保险金额单位一般为1000元或100元,所以保险费率通常用千分率或百分率来表示,实际保险费需要通过保额进行换算。因此,服务器300可以通过一个唯一的英文词汇来对不同的费率名称定义为经规范化的费率因子(参照下表1所示)。
表1
Figure BDA0002907564740000121
Figure BDA0002907564740000131
此外,保险产品的现金价值表中包括各个现价因子,其中现价因子影响现金价价值计算的因素,分期交付保险费的人寿保险单,交费满一年或二年后,可随时提出退保领取保险金,这类保险单在退保时能够领取的退保金数额,就是该保险单的现金价值。因此,服务器300可以通过一个唯一的英文词汇来对不同的现价名称定义为经规范化的现价因子(参照下表2所示)。
表2
现价因子 现价名称
gender 性别
age 投保年龄
coverageType 保障类型
coveragePeriod 保障期间
payPeriodType 缴费类型
payPeriod 缴费期间
annStartYear 约定年金领取周岁
policyYear 保单年度
warrantyType 保证类型
warranty 保证年限
insurePlan 计划档次
mainCoveragePeriod 主险保障期间
riderCoveragePeriod 附加险保障期间
wishLongevityYear 祝寿金领取周岁
annStartType 年金领取年龄类型
annGetType 约定年金领取方式
进一步地,服务器300为经规范定义的各个计算因子定义解析批注,下表3示例性的示出了服务器300为费率因子定义的解析批注,下表4示例性的示出了服务器300为坐标系型的现价因子定义的解析批注,以及下表5示例性的示出了服务器300为坐列表型的现价因子定义的解析批注。最后,服务器300将经规范定义的各个计算因子配置为表格模板的表头,并且将对应的解析批注分别配置为各个计算因子的因子批注信息,从而完成表格模板的制作。
表3
Figure BDA0002907564740000141
表4
Figure BDA0002907564740000151
表5
Figure BDA0002907564740000152
此外,参考图1所示,根据本实施例的第二个方面,提供了一种存储介质。存储介质包括存储的程序,其中,在程序运行时由处理器执行以上任意一项所述的方法。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
图11示出了根据本实施例所述的保险产品的数据解析装置1100,该装置1100与根据实施例1的第一个方面所述的方法相对应。参考图11所示,该装置1100包括:数据文件获取模块1110,用于获取与保险产品相关的数据文件,其中数据文件包括影响保险产品的保险费或现金价值计算的计算因子、与计算因子对应的因子值以及费率值或现价值;目标数据表格确定模块1120,用于根据预设的表格模板和数据文件,确定待解析的目标数据表格,其中表格模板包括影响不同保险的不同保险产品的保险费或现金价值计算的作为表头的经规范定义的各个计算因子以及与各个计算因子对应的因子批注信息,因子批注信息用于指示对应的计算因子的解析算法,并且目标数据表格包括影响保险产品的保险费或现金价值计算的作为表头的经规范定义的目标计算因子、与目标计算因子对应的目标因子批注信息、与目标计算因子对应的目标因子值以及对应的费率值或现价值;以及解析模块1130,用于根据目标数据表格中的目标因子批注信息,对目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格。
可选地,解析模块1130,包括:表格解析算法确定子模块,用于根据目标数据表格的表格类型,确定用于对目标数据表格进行解析的表格解析算法;以及解析子模块,用于根据表格解析算法和目标数据表格中的目标因子批注信息,对目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格。
可选地,在目标数据表格的表格类型为坐标系类型的情况下,解析子模块执行以下操作步骤:S1:获取目标数据表格的总行数、总列数和Sheet数量;S2:在目标数据表格的单一Sheet表中,逐行读取目标数据表格的第一列的目标计算因子以及对应的目标因子批注信息,判定第一列中的目标因子批注信息是否符合规范,并在符合规范的情况下将第一列的目标计算因子以及目标计算因子在单一Sheet表中的位置信息进行临时存储;S3:根据所读取的目标因子批注信息,确定对应的目标计算因子的读取方向,并根据读取方向判定单一Sheet表中的第二列至最后一列的数值是否为因子值或费率值;S4:逐行读取单一Sheet表中的第二列至最后一列的数值;S5:根据临时存储的目标计算因子、目标计算因子在目标数据表格中的位置信息、判定的结果以及所读取的数值,进行数据组装,从而得到已组装好目标计算因子、对应的因子值以及对应的费率值的一组数据;以及S6:创建与预设的数据库存储格式相匹配的数据表,将一组数据存入数据表中,并将数据表确定为目标存储表格。
可选地,在目标数据表格的表格类型为列表类型的情况下,根据表格解析算法和目标数据表格中的目标因子批注信息,解析子模块执行以下操作步骤:S1:获取目标数据表格的总行数、总列数和Sheet数量;S2:在目标数据表格的单一Sheet表中,逐列读取目标数据表格的第一行的目标计算因子以及对应的目标因子批注信息,判定第一行中的目标因子批注信息是否符合规范,并在符合规范的情况下将第一行的目标计算因子以及目标计算因子在单一Sheet表中的位置信息进行临时存储;S3:在读取到第一行的最后一列的目标计算因子不具备对应的目标因子批注信息的情况下,判定最后一列的第二行至最后一行的数值均为现价值,判定第一列至倒数第二列的第二行至最后一行的数值均为因子值;S4:从第二行开始逐行读取单一Sheet表中的各个列的数值;S5:根据临时存储的目标计算因子、目标计算因子在目标数据表格中的位置信息、判定的结果以及所读取的数值,进行数据组装,从而得到已组装好目标计算因子、对应的因子值以及对应的现价值的一组数据;以及S6:创建与预设的数据库存储格式相匹配的数据表,将一组数据存入数据表中,并将数据表确定为目标存储表格。
可选地,解析子模块还执行以下操作步骤:S7:在根据Sheet数量判定目标数据表格包括多个Sheet表的情况下,重复上述的S2至S5,从而得到与多个Sheet表分别对应的多组数据;以及S8:分别将多组数据存入目标存储表格的多个Sheet表中。
可选地,装置1100还包括:弹性矩阵存储模块,用于将与不同的保险产品相关的目标存储表格存储至数据库中的不同位置。
可选地,装置1100还包括表格模板制作模块,用于通过以下步骤制作预设的表格模板:对影响不同保险的不同保险产品的相关费用计算的各个计算因子进行规范定义;为经规范定义的各个计算因子定义解析批注;以及将经规范定义的各个计算因子配置为表格模板的表头,并且将对应的解析批注分别配置为各个计算因子的因子批注信息。
从而根据本实施例,首先获取与保险产品相关的数据文件,由于该数据文件的格式与保险代理服务平台最终存储至数据库的数据信息的格式存在很大差别,因此需要根据预设的表格模板和获取到的数据文件,确定待解析的目标数据表格,最后根据目标数据表格中的目标因子批注信息,对目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格。通过上述方式,最终生成一个符合预设的数据库的存储格式相匹配的目标存储表格,能够成功地将目标存储表格存入保险代理服务平台预设的数据库中。从而,工作人员在将保险公司公布的保险产品的数据信息录入系统时,不必再逐个的将数据单元进行拷贝,而是基于预设的表格模板,读取保险公司的发布的数据信息中的因子值、费率值和现价值数值并导入表格模板的对应的单元格中,生成待解析的目标数据表格,从而能够根据该目标数据表格中的因子批注信息,对目标数据表格进行解析,最终生成与预设的数据库的存储格式相匹配的目标存储表格,从而可以大大提高数据的录入效率。进而解决了现有技术中存在的由于保险公司公布的保险产品的数据信息的格式与保险代理服务平台最终存储的格式存在较大差别,因此在实际的录入工作中需要工作人员将原始的数据信息中的各个数据单元的数据逐一拷贝到最终存储的表格中,从而给数据录入工作带来了很大不便的技术问题。
实施例3
图12示出了根据本实施例所述的保险产品的数据解析装置1200,该装置1200与根据实施例1的第一个方面所述的方法相对应。参考图12所示,该装置1200包括:处理器1210;以及存储器1220,与处理器1210连接,用于为处理器1210提供处理以下处理步骤的指令:获取与保险产品相关的数据文件,其中数据文件包括影响保险产品的保险费或现金价值计算的计算因子、与计算因子对应的因子值以及费率值或现价值;根据预设的表格模板和数据文件,确定待解析的目标数据表格,其中表格模板包括影响不同保险的不同保险产品的保险费或现金价值计算的作为表头的经规范定义的各个计算因子以及与各个计算因子对应的因子批注信息,因子批注信息用于指示对应的计算因子的解析算法,并且目标数据表格包括影响保险产品的保险费或现金价值计算的作为表头的经规范定义的目标计算因子、与目标计算因子对应的目标因子批注信息、与目标计算因子对应的目标因子值以及对应的费率值或现价值;以及根据目标数据表格中的目标因子批注信息,对目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格。
可选地,根据目标数据表格中的目标因子批注信息,对目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格的操作,包括根据目标数据表格的表格类型,确定用于对目标数据表格进行解析的表格解析算法;以及根据表格解析算法和目标数据表格中的目标因子批注信息,对目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格。
可选地,在目标数据表格的表格类型为坐标系类型的情况下,根据表格解析算法和目标数据表格中的目标因子批注信息,对目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格的操作,包括:S1:获取目标数据表格的总行数、总列数和Sheet数量;S2:在目标数据表格的单一Sheet表中,逐行读取目标数据表格的第一列的目标计算因子以及对应的目标因子批注信息,判定第一列中的目标因子批注信息是否符合规范,并在符合规范的情况下将第一列的目标计算因子以及目标计算因子在单一Sheet表中的位置信息进行临时存储;S3:根据所读取的目标因子批注信息,确定对应的目标计算因子的读取方向,并根据读取方向判定单一Sheet表中的第二列至最后一列的数值是否为因子值或费率值;S4:逐行读取单一Sheet表中的第二列至最后一列的数值;以及S5:根据临时存储的目标计算因子、目标计算因子在目标数据表格中的位置信息、判定的结果以及所读取的数值,进行数据组装,从而得到已组装好目标计算因子、对应的因子值以及对应的费率值的一组数据;S6:创建与预设的数据库存储格式相匹配的数据表,将一组数据存入数据表中,并将数据表确定为目标存储表格。
可选地,在目标数据表格的表格类型为列表类型的情况下,根据表格解析算法和目标数据表格中的目标因子批注信息,对目标数据表格进行解析,生成与预设的数据库存储格式相匹配的目标存储表格的操作,包括:S1:获取目标数据表格的总行数、总列数和Sheet数量;S2:在目标数据表格的单一Sheet表中,逐列读取目标数据表格的第一行的目标计算因子以及对应的目标因子批注信息,判定第一行中的目标因子批注信息是否符合规范,并在符合规范的情况下将第一行的目标计算因子以及目标计算因子在单一Sheet表中的位置信息进行临时存储;S3:在读取到第一行的最后一列的目标计算因子不具备对应的目标因子批注信息的情况下,判定最后一列的第二行至最后一行的数值均为现价值,判定第一列至倒数第二列的第二行至最后一行的数值均为因子值;S4:从第二行开始逐行读取单一Sheet表中的各个列的数值;S5:根据临时存储的目标计算因子、目标计算因子在目标数据表格中的位置信息、判定的结果以及所读取的数值,进行数据组装,从而得到已组装好目标计算因子、对应的因子值以及对应的现价值的一组数据;S6:创建与预设的数据库存储格式相匹配的数据表,将一组数据存入数据表中,并将数据表确定为目标存储表格。
可选地,存储器1220还用于为处理器1210提供处理以下处理步骤的指令:还包括:S7:在根据Sheet数量判定目标数据表格包括多个Sheet表的情况下,重复上述的S2至S5,从而得到与多个Sheet表分别对应的多组数据;S8:分别将多组数据存入目标存储表格的多个Sheet表中。
可选地,存储器1220还用于为处理器1210提供处理以下处理步骤的指令:将与不同的保险产品相关的目标存储表格存储至数据库中的不同位置。
可选地,存储器1220还用于为处理器1210提供处理以下处理步骤的指令:通过以下步骤制作预设的表格模板:对影响不同保险的不同保险产品的相关费用计算的各个计算因子进行规范定义;为经规范定义的各个计算因子定义解析批注;以及将经规范定义的各个计算因子配置为表格模板的表头,并且将对应的解析批注分别配置为各个计算因子的因子批注信息。
从而根据本实施例,首先获取与保险产品相关的数据文件,由于该数据文件的格式与保险代理服务平台最终存储至数据库的数据信息的格式存在很大差别,因此需要根据预设的表格模板和获取到的数据文件,确定待解析的目标数据表格,最后根据目标数据表格中的目标因子批注信息,对目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格。通过上述方式,最终生成一个符合预设的数据库的存储格式相匹配的目标存储表格,能够成功地将目标存储表格存入保险代理服务平台预设的数据库中。从而,工作人员在将保险公司公布的保险产品的数据信息录入系统时,不必再逐个的将数据单元进行拷贝,而是基于预设的表格模板,读取保险公司的发布的数据信息中的因子值、费率值和现价值数值并导入表格模板的对应的单元格中,生成待解析的目标数据表格,从而能够根据该目标数据表格中的因子批注信息,对目标数据表格进行解析,最终生成与预设的数据库的存储格式相匹配的目标存储表格,从而可以大大提高数据的录入效率。进而解决了现有技术中存在的由于保险公司公布的保险产品的数据信息的格式与保险代理服务平台最终存储的格式存在较大差别,因此在实际的录入工作中需要工作人员将原始的数据信息中的各个数据单元的数据逐一拷贝到最终存储的表格中,从而给数据录入工作带来了很大不便的技术问题。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (8)

1.一种保险产品的数据解析方法,其特征在于,包括:
获取与保险产品相关的数据文件,其中所述数据文件包括影响所述保险产品的保险费或现金价值计算的计算因子、与所述计算因子对应的因子值以及费率值或现价值;
根据预设的表格模板和所述数据文件,确定待解析的目标数据表格,其中所述表格模板包括影响不同保险的不同保险产品的保险费或现金价值计算的作为表头的经规范定义的各个计算因子以及与所述各个计算因子对应的因子批注信息,所述因子批注信息用于指示对应的计算因子的解析算法,并且所述目标数据表格包括影响所述保险产品的保险费或现金价值计算的作为表头的经规范定义的目标计算因子、与所述目标计算因子对应的目标因子批注信息、与所述目标计算因子对应的目标因子值以及对应的费率值或现价值;以及
根据所述目标数据表格中的目标因子批注信息,对所述目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格,其中
根据所述目标数据表格中的目标因子批注信息,对所述目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格的操作,包括:根据所述目标数据表格的表格类型,确定用于对所述目标数据表格进行解析的表格解析算法;以及根据所述表格解析算法和所述目标数据表格中的目标因子批注信息,对所述目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格,并且其中
在所述目标数据表格的表格类型为坐标系类型的情况下,根据所述表格解析算法和所述目标数据表格中的目标因子批注信息,对所述目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格的操作,包括:
S1:获取所述目标数据表格的总行数、总列数和Sheet数量;
S2:在所述目标数据表格的单一Sheet表中,逐行读取所述目标数据表格的第一列的目标计算因子以及对应的目标因子批注信息,判定所述第一列中的目标因子批注信息是否符合规范,并在符合规范的情况下将所述第一列的目标计算因子以及所述目标计算因子在所述单一Sheet表中的位置信息进行临时存储;
S3:根据所读取的目标因子批注信息,确定对应的目标计算因子的读取方向,并根据所述读取方向判定所述单一Sheet表中的第二列至最后一列的数值是否为因子值或费率值;
S4:逐行读取所述单一Sheet表中的第二列至最后一列的数值;
S5:根据临时存储的目标计算因子、所述目标计算因子在所述目标数据表格中的位置信息、所述判定的结果以及所读取的数值,进行数据组装,从而得到已组装好所述目标计算因子、对应的因子值以及对应的费率值的一组数据;以及
S6:创建与预设的数据库存储格式相匹配的数据表,将所述一组数据存入所述数据表中,并将所述数据表确定为所述目标存储表格。
2.根据权利要求1所述的方法,其特征在于,在所述目标数据表格的表格类型为列表类型的情况下,根据所述表格解析算法和所述目标数据表格中的目标因子批注信息,对所述目标数据表格进行解析,生成与预设的数据库存储格式相匹配的目标存储表格的操作,包括:
S1:获取所述目标数据表格的总行数、总列数和Sheet数量;
S2:在所述目标数据表格的单一Sheet表中,逐列读取所述目标数据表格的第一行的目标计算因子以及对应的目标因子批注信息,判定所述第一行中的目标因子批注信息是否符合规范,并在符合规范的情况下将所述第一行的目标计算因子以及所述目标计算因子在所述单一Sheet表中的位置信息进行临时存储;
S3:在读取到所述第一行的最后一列的目标计算因子不具备对应的目标因子批注信息的情况下,判定所述最后一列的第二行至最后一行的数值均为现价值,判定第一列至倒数第二列的第二行至最后一行的数值均为因子值;
S4:从第二行开始逐行读取所述单一Sheet表中的各个列的数值;
S5:根据临时存储的目标计算因子、所述目标计算因子在所述目标数据表格中的位置信息、所述判定的结果以及所读取的数值,进行数据组装,从而得到已组装好所述目标计算因子、对应的因子值以及对应的现价值的一组数据;以及
S6:创建与预设的数据库存储格式相匹配的数据表,将所述一组数据存入所述数据表中,并将所述数据表确定为所述目标存储表格。
3.根据权利要求2所述的方法,其特征在于,还包括:
S7:在根据所述Sheet数量判定所述目标数据表格包括多个Sheet表的情况下,重复上述的S2至S5,从而得到与所述多个Sheet表分别对应的多组数据;
S8:分别将所述多组数据存入所述目标存储表格的多个Sheet表中。
4.根据权利要求1所述的方法,其特征在于,还包括:将与不同的保险产品相关的目标存储表格存储至所述数据库中的不同位置。
5.根据权利要求1所述的方法,其特征在于,通过以下步骤制作所述预设的表格模板:
对影响不同保险的不同保险产品的相关费用计算的各个计算因子进行规范定义;
为经规范定义的所述各个计算因子定义解析批注;以及
将经规范定义的所述各个计算因子配置为所述表格模板的表头,并且将对应的解析批注分别配置为所述各个计算因子的因子批注信息。
6.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时由处理器执行权利要求1至5中任意一项所述的方法。
7.一种保险产品的数据解析装置,其特征在于,包括:
数据文件获取模块,用于获取与保险产品相关的数据文件,其中所述数据文件包括影响所述保险产品的保险费或现金价值计算的计算因子、与所述计算因子对应的因子值以及费率值或现价值;
目标数据表格确定模块,用于根据预设的表格模板和所述数据文件,确定待解析的目标数据表格,其中所述表格模板包括影响不同保险的不同保险产品的保险费或现金价值计算的作为表头的经规范定义的各个计算因子以及与所述各个计算因子对应的因子批注信息,所述因子批注信息用于指示对应的计算因子的解析算法,并且所述目标数据表格包括影响所述保险产品的保险费或现金价值计算的作为表头的经规范定义的目标计算因子、与所述目标计算因子对应的目标因子批注信息、与所述目标计算因子对应的目标因子值以及对应的费率值或现价值;以及
解析模块,用于根据所述目标数据表格中的目标因子批注信息,对所述目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格,其中
解析模块包括:表格解析算法确定子模块,用于根据目标数据表格的表格类型,确定用于对目标数据表格进行解析的表格解析算法;以及解析子模块,用于根据表格解析算法和目标数据表格中的目标因子批注信息,对目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格,并且其中
在目标数据表格的表格类型为坐标系类型的情况下,解析子模块执行以下操作步骤:S1:获取目标数据表格的总行数、总列数和Sheet数量;S2:在目标数据表格的单一Sheet表中,逐行读取目标数据表格的第一列的目标计算因子以及对应的目标因子批注信息,判定第一列中的目标因子批注信息是否符合规范,并在符合规范的情况下将第一列的目标计算因子以及目标计算因子在单一Sheet表中的位置信息进行临时存储;S3:根据所读取的目标因子批注信息,确定对应的目标计算因子的读取方向,并根据读取方向判定单一Sheet表中的第二列至最后一列的数值是否为因子值或费率值;S4:逐行读取单一Sheet表中的第二列至最后一列的数值;S5:根据临时存储的目标计算因子、目标计算因子在目标数据表格中的位置信息、判定的结果以及所读取的数值,进行数据组装,从而得到已组装好目标计算因子、对应的因子值以及对应的费率值的一组数据;以及S6:创建与预设的数据库存储格式相匹配的数据表,将一组数据存入数据表中,并将数据表确定为目标存储表格。
8.一种保险产品的数据解析装置,其特征在于,包括:
处理器;以及
存储器,与所述处理器连接,用于为所述处理器提供处理以下处理步骤的指令:
获取与保险产品相关的数据文件,其中所述数据文件包括影响所述保险产品的保险费或现金价值计算的计算因子、与所述计算因子对应的因子值以及费率值或现价值;
根据预设的表格模板和所述数据文件,确定待解析的目标数据表格,其中所述表格模板包括影响不同保险的不同保险产品的保险费或现金价值计算的作为表头的经规范定义的各个计算因子以及与所述各个计算因子对应的因子批注信息,所述因子批注信息用于指示对应的计算因子的解析算法,并且所述目标数据表格包括影响所述保险产品的保险费或现金价值计算的作为表头的经规范定义的目标计算因子、与所述目标计算因子对应的目标因子批注信息、与所述目标计算因子对应的目标因子值以及对应的费率值或现价值;以及
根据所述目标数据表格中的目标因子批注信息,对所述目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格,其中
根据所述目标数据表格中的目标因子批注信息,对所述目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格的操作,包括:根据所述目标数据表格的表格类型,确定用于对所述目标数据表格进行解析的表格解析算法;以及根据所述表格解析算法和所述目标数据表格中的目标因子批注信息,对所述目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格,并且其中
在所述目标数据表格的表格类型为坐标系类型的情况下,根据所述表格解析算法和所述目标数据表格中的目标因子批注信息,对所述目标数据表格进行解析,生成与预设的数据库的存储格式相匹配的目标存储表格的操作,包括:
S1:获取所述目标数据表格的总行数、总列数和Sheet数量;
S2:在所述目标数据表格的单一Sheet表中,逐行读取所述目标数据表格的第一列的目标计算因子以及对应的目标因子批注信息,判定所述第一列中的目标因子批注信息是否符合规范,并在符合规范的情况下将所述第一列的目标计算因子以及所述目标计算因子在所述单一Sheet表中的位置信息进行临时存储;
S3:根据所读取的目标因子批注信息,确定对应的目标计算因子的读取方向,并根据所述读取方向判定所述单一Sheet表中的第二列至最后一列的数值是否为因子值或费率值;
S4:逐行读取所述单一Sheet表中的第二列至最后一列的数值;
S5:根据临时存储的目标计算因子、所述目标计算因子在所述目标数据表格中的位置信息、所述判定的结果以及所读取的数值,进行数据组装,从而得到已组装好所述目标计算因子、对应的因子值以及对应的费率值的一组数据;以及
S6:创建与预设的数据库存储格式相匹配的数据表,将所述一组数据存入所述数据表中,并将所述数据表确定为所述目标存储表格。
CN202110076820.9A 2021-01-20 2021-01-20 保险产品的数据解析方法、装置及存储介质 Active CN112767183B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110076820.9A CN112767183B (zh) 2021-01-20 2021-01-20 保险产品的数据解析方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110076820.9A CN112767183B (zh) 2021-01-20 2021-01-20 保险产品的数据解析方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN112767183A CN112767183A (zh) 2021-05-07
CN112767183B true CN112767183B (zh) 2022-04-05

Family

ID=75703604

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110076820.9A Active CN112767183B (zh) 2021-01-20 2021-01-20 保险产品的数据解析方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN112767183B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8355931B1 (en) * 2008-06-11 2013-01-15 Allstate Insurance Company Mortality progression methods and systems
CN108959618A (zh) * 2018-07-18 2018-12-07 北京欣欣苹果网络科技有限公司 互联网信息收集及处理方法和装置
CN109635252A (zh) * 2018-10-25 2019-04-16 北京中关村科金技术有限公司 一种基于pdf格式的保险产品关键信息解析方法、装置及系统
CN110377604A (zh) * 2019-07-23 2019-10-25 北京小米移动软件有限公司 一种提取表格信息的方法、装置及介质
CN111476015A (zh) * 2020-04-10 2020-07-31 北京字节跳动网络技术有限公司 一种文档处理方法、装置、电子设备及存储介质
CN111626146A (zh) * 2020-05-08 2020-09-04 西安工业大学 一种基于模板匹配的合并单元格表格分割识别方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002300278A (ja) * 2001-03-29 2002-10-11 Ntt Comware Corp メッセージ解析方法、そのプログラム、そのプログラムが記録された記録媒体及びその装置、メッセージ解析命令が記録された記録媒体、メッセージ解析のための処理テーブルが記録された記録媒体
CN110134922A (zh) * 2018-02-02 2019-08-16 鼎复数据科技(北京)有限公司 一种通过浏览器直接获取pdf中表格内容的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8355931B1 (en) * 2008-06-11 2013-01-15 Allstate Insurance Company Mortality progression methods and systems
CN108959618A (zh) * 2018-07-18 2018-12-07 北京欣欣苹果网络科技有限公司 互联网信息收集及处理方法和装置
CN109635252A (zh) * 2018-10-25 2019-04-16 北京中关村科金技术有限公司 一种基于pdf格式的保险产品关键信息解析方法、装置及系统
CN110377604A (zh) * 2019-07-23 2019-10-25 北京小米移动软件有限公司 一种提取表格信息的方法、装置及介质
CN111476015A (zh) * 2020-04-10 2020-07-31 北京字节跳动网络技术有限公司 一种文档处理方法、装置、电子设备及存储介质
CN111626146A (zh) * 2020-05-08 2020-09-04 西安工业大学 一种基于模板匹配的合并单元格表格分割识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
The relationship between insurance sector and economic growth: An econometric analysis;Ilhan EGE,;《International Journal of Economic Research》;20111231;第2卷(第2期);全文 *
建筑工程一切险的分类费率模型应用研究;胡昊等;《科技进步与对策》;20081025(第10期);全文 *

Also Published As

Publication number Publication date
CN112767183A (zh) 2021-05-07

Similar Documents

Publication Publication Date Title
CN110245220B (zh) 电子文件签署方法、装置及服务器、存储介质
CN106780045B (zh) 保单信息批改方法和装置
CN108376364B (zh) 一种支付系统对账的方法、设备及终端设备
CN107688591A (zh) 一种精算处理方法和装置
CN108829466A (zh) 一种数据处理方法、装置、电子设备及存储介质
WO2022134583A1 (zh) 一种保险数据信息的生成方法、装置、服务器及存储介质
CN107862425A (zh) 风控数据采集方法、设备、系统及可读存储介质
CN108648091A (zh) 保单风险评估方法、装置、设备和计算机存储介质
CN112767183B (zh) 保险产品的数据解析方法、装置及存储介质
CN109450963A (zh) 消息推送方法及终端设备
US10628767B2 (en) Encounter management
CN109324963B (zh) 自动测试收益结果的方法及终端设备
CN112614579A (zh) 医院预约挂号方法、装置、计算机设备
CN111340911A (zh) 确定k线图中的连线的方法、装置以及存储介质
CN111161088A (zh) 票据处理方法、装置和设备
CN108805725B (zh) 风险事件确认方法、服务器及计算机可读存储介质
CN108733784B (zh) 一种教学课件推荐方法、装置及设备
CN107784572B (zh) 发票的票面内容处理方法及终端设备
CN116050359A (zh) 一种保单托管录入方法、系统、终端设备及存储介质
CN110278565A (zh) 一种基站设计方法及装置
CN112270537B (zh) 一种多渠道账单的入库方法、系统及存储介质
CN114745452A (zh) 设备管理方法、装置及电子设备
CN113888340A (zh) 配置化保险产品的对接处理方法、装置、设备和存储介质
CN107071553A (zh) 一种修改视频语音的方法、装置和计算机可读存储介质
CN110728138A (zh) 新闻文本识别的方法、装置以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant