WO2022193415A1 - 数据生成方法、装置、计算机设备和存储介质 - Google Patents

数据生成方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
WO2022193415A1
WO2022193415A1 PCT/CN2021/091701 CN2021091701W WO2022193415A1 WO 2022193415 A1 WO2022193415 A1 WO 2022193415A1 CN 2021091701 W CN2021091701 W CN 2021091701W WO 2022193415 A1 WO2022193415 A1 WO 2022193415A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
product
information
time period
target
Prior art date
Application number
PCT/CN2021/091701
Other languages
English (en)
French (fr)
Inventor
周艳丽
周年
Original Assignee
平安科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 平安科技(深圳)有限公司 filed Critical 平安科技(深圳)有限公司
Publication of WO2022193415A1 publication Critical patent/WO2022193415A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2477Temporal data queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Definitions

  • the present application relates to the technical field of data processing, and in particular, to a data generation method, apparatus, computer device and storage medium.
  • the main purpose of the present application is to provide a data generation method, device, computer equipment and storage medium, aiming to solve the problem that the existing data generation method based on manual processing to generate a quotation data list will require a lot of human resources and spend a lot of money. time, resulting in a technical problem that the generation efficiency of the quotation data list is low.
  • a first acquisition module used for acquiring product data information within a preset time period
  • the second classification module is configured to acquire the target information, and classify the target information according to a preset product classification factor to obtain a plurality of corresponding data sets, wherein the data sets include at least one characteristic data, and the product Classification factors include product information and place order information;
  • a screening module used for classifying the data of the data attachments according to the product classification factor to obtain the classified data type data, and screening out the specified data type data with the largest number of distributions from the data type data;
  • a generating module configured to generate a quotation data list corresponding to the product classification factor based on the first characteristic data, the second characteristic data and the specified data type data.
  • the present application also provides a computer device, including a memory and a processor, where a computer program is stored in the memory, and the processor implements a data generation method when executing the computer program, wherein the data generation method includes the following step:
  • the target information classify the target information according to a preset product classification factor to obtain a plurality of corresponding data sets, wherein the data set includes at least one feature data, and the product classification factor includes product information and output. single geographic information;
  • the data generation method, device, computer equipment and storage medium provided in this application can save a lot of human resources and time, effectively improve the generation efficiency of the quotation data list, and ensure the accuracy of the generated quotation data list.
  • FIG. 1 is a schematic flowchart of a data generation method according to an embodiment of the present application.
  • FIG. 3 is a schematic structural diagram of a computer device according to an embodiment of the present application.
  • a data generation method includes:
  • S3 Acquire the target information, and classify the target information according to a preset product classification factor to obtain a plurality of corresponding data sets, wherein the data set includes at least one characteristic data, and the product classification factor includes product information and place order information;
  • S6 Classify the data of the data attachment according to the product classification factor to obtain the classified data type data, and select the specified data type data with the largest distribution from the data type data;
  • S7 Generate a quotation data list corresponding to the product classification factor based on the first feature data, the second feature data, and the specified data type data.
  • the execution body of this embodiment of the method is a data generating apparatus.
  • the above-mentioned data generation device can be implemented by a virtual device, such as software code, or can be implemented by a physical device written or integrated with relevant execution codes, and can communicate with the user through a keyboard, mouse, remote control, touchpad or Human-computer interaction by means of voice-activated devices.
  • the data generating device (may be referred to as the device for short) in this embodiment can effectively improve the generation efficiency of the quotation data list, and ensure the accuracy of the generated quotation data list. Specifically, first obtain product data information within a preset time period.
  • step S3 a process of calculating the first degree of influence of the specified data set on the claim settlement data, and screening out a first quantity of first characteristic data from the specified data set based on the first degree of influence (step S4), and for acquiring the pricing data, calculating a second degree of influence of the specified data set on the pricing data, and filtering out a second quantity of second feature data from the specified data set based on the second degree of influence
  • the execution sequence of the process is not limited, and the change of the sequence of the above three step processes belongs to the protection scope of the present application and does not cause any limitation to the present application.
  • the second calculation module 5 is configured to acquire the pricing data, calculate a second degree of influence of the specified data set on the pricing data, and filter out a second degree of influence from the specified data set based on the second degree of influence quantity of second characteristic data;
  • a screening unit configured to screen out a first total amount of network traffic that is greater than a preset flow threshold from the total amount of network traffic
  • the implementation process of the functions and functions of the first storage module, the judgment module, the analysis module, the query module, the second acquisition module, and the sending module in the above-mentioned data generation device are detailed in the corresponding step S700 in the above-mentioned data generation method.
  • the implementation process up to S705 will not be repeated here.
  • the above-mentioned data generation device includes:
  • An embodiment of the present application further provides a computer-readable storage medium, the computer-readable storage medium may be non-volatile or volatile, and a computer program is stored thereon, and the computer program is implemented when executed by a processor
  • the data generation method shown in any one of the above-mentioned exemplary embodiments, the data generation method includes the following steps:
  • a quotation data list corresponding to the product classification factor is generated.
  • any reference to memory, storage, database or other medium provided in this application and used in the embodiments may include non-volatile and/or volatile memory.
  • Nonvolatile memory may include read only memory (ROM), programmable ROM (PROM), electrically programmable ROM (EPROM), electrically erasable programmable ROM (EEPROM), or flash memory.
  • Volatile memory may include random access memory (RAM) or external cache memory.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Remote Sensing (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及数据处理领域,提供一种数据生成方法、装置、计算机设备和存储介质,方法包括:获取产品数据信息;对产品数据信息分类得到标的信息、定价数据、理赔数据及资料附件数据;按照产品分类因子对标的信息分类得到数据集合;计算指定数据集合对理赔数据的第一影响度并筛选第一特征数据;计算指定数据集合对定价数据的第二影响度并筛选第二特征数据;将资料附件数据按照产品分类因子分类得到资料类型数据并筛选指定资料类型数据;基于第一特征数据、第二特征数据及指定资料类型数据,生成与产品分类因子对应的报价资料清单。本申请提高了报价资料清单的生成效率。本申请还可以应用于区块链领域,上述报价资料清单等数据可以存储于区块链上。

Description

数据生成方法、装置、计算机设备和存储介质
本申请要求于2021年03月15日提交中国专利局、申请号为2021102776337,发明名称为“数据生成方法、装置、计算机设备和存储介质”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及数据处理技术领域,具体涉及一种数据生成方法、装置、计算机设备和存储介质。
背景技术
由于不同产品的标的信息存在较大的差异性,故对不同产品进行报价时所需要的信息也会不一样。在展业过程中,需要提前提供与产品相关的报价资料清单供业务员使用,使得业务员可以依据报价资料清单与客户进行沟通并收集相应的投保信息,之后将投保信息提交至核保人以进行对于产品的报价。现有的产品的报价资料清单是采用人工对采集到的产品数据信息进行数据分析,并基于产品数据信息对每个产品进行逐一梳理的方式进行处理后生成的。然而发明人意识到,当需要生成报价资料清单的产品的数量较多时,这种基于人工处理的数据生成方式则会需要占用大量的人力资源和花费大量的时间,从而造成报价资料清单的生成效率较低。
技术问题
本申请的主要目的为提供一种数据生成方法、装置、计算机设备和存储介质,旨在解决现有的基于人工处理来生成报价资料清单的数据生成方式会需要占用大量的人力资源和花费大量的时间,从而造成报价资料清单的生成效率较低的技术问题。
技术解决方案
本申请提出一种数据生成方法,所述方法包括步骤:
获取预设时间段内的产品数据信息;
对所述产品数据信息进行分类处理,得到标的信息、定价数据、理赔数据以及资料附件数据;
获取所述标的信息,按照预设的产品分类因子对所述标的信息进行分类得到对应的多个数据集合,其中,所述数据集合至少包括一个特征数据,所述产品分类因子包括产品信息与出单地域信息;
获取所述理赔数据,计算指定数据集合对所述理赔数据的第一影响度,并基于所述第一影响度从所述指定数据集合中筛选出第一数量的第一特征数据,其中,所述指定数据集合为所有所述数据集合中的任意一个集合;以及,
获取所述定价数据,计算所述指定数据集合对所述定价数据的第二影响度,并基于所述第二影响度从所述指定数据集合中筛选出第二数量的第二特征数据;
将所述资料附件数据按照所述产品分类因子进行分类得到分类后的资料类型数据,从所述资料类型数据中筛选出分布数量最多的指定资料类型数据;
基于所述第一特征数据、所述第二特征数据以及所述指定资料类型数据,生成与所述产品分类因子对应的报价资料清单。
本申请还提供一种数据生成装置,包括:
第一获取模块,用于获取预设时间段内的产品数据信息;
第一分类模块,用于对所述产品数据信息进行分类处理,得到标的信息、定价数据、理赔数据以及资料附件数据;
第二分类模块,用于获取所述标的信息,按照预设的产品分类因子对所述标的信息进行分类得到对应的多个数据集合,其中,所述数据集合至少包括一个特征数据,所述产品分类因子包括产品信息与出单地域信息;
第一计算模块,用于获取所述理赔数据,计算指定数据集合对所述理赔数据的第一影响度,并基于所述第一影响度从所述指定数据集合中筛选出第一数量的第一特征数据,其中,所述指定数据集合为所有所述数据集合中的任意一个集合;以及,
第二计算模块,用于获取所述定价数据,计算所述指定数据集合对所述定价数据的第二影响度,并基于所述第二影响度从所述指定数据集合中筛选出第二数量的第二特征数据;
筛选模块,用于将所述资料附件数据按照所述产品分类因子进行分类得到分类后的资料类型数据,从所述资料类型数据中筛选出分布数量最多的指定资料类型数据;
生成模块,用于基于所述第一特征数据、所述第二特征数据以及所述指定资料类型数据,生成与所述产品分类因子对应的报价资料清单。
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现一种数据生成方法,其中,所述数据生成方法包括以下步骤:
获取预设时间段内的产品数据信息;
对所述产品数据信息进行分类处理,得到标的信息、定价数据、理赔数据以及资料附件数据;
获取所述标的信息,按照预设的产品分类因子对所述标的信息进行分类得到对应的多个数据集合,其中,所述数据集合至少包括一个特征数据,所述产品分类因子包括产品信息与出单地域信息;
获取所述理赔数据,计算指定数据集合对所述理赔数据的第一影响度,并基于所述第一影响度从所述指定数据集合中筛选出第一数量的第一特征数据,其中,所述指定数据集合为所有所述数据集合中的任意一个集合;以及,
获取所述定价数据,计算所述指定数据集合对所述定价数据的第二影响度,并基于所述第二影响度从所述指定数据集合中筛选出第二数量的第二特征数据;
将所述资料附件数据按照所述产品分类因子进行分类得到分类后的资料类型数据,从所述资料类型数据中筛选出分布数量最多的指定资料类型数据;
基于所述第一特征数据、所述第二特征数据以及所述指定资料类型数据,生成与所述产品分类因子对应的报价资料清单。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现一种数据生成方法,其中,所述数据生成方法包括以下步骤:
获取预设时间段内的产品数据信息;
对所述产品数据信息进行分类处理,得到标的信息、定价数据、理赔数据以及资料附件数据;
获取所述标的信息,按照预设的产品分类因子对所述标的信息进行分类得到对应的多个数据集合,其中,所述数据集合至少包括一个特征数据,所述产品分类因子包括产品信息与出单地域信息;
获取所述理赔数据,计算指定数据集合对所述理赔数据的第一影响度,并基于所述第一影响度从所述指定数据集合中筛选出第一数量的第一特征数据,其中,所述指定数据集合为所有所述数据集合中的任意一个集合;以及,
获取所述定价数据,计算所述指定数据集合对所述定价数据的第二影响度,并基于所述第二影响度从所述指定数据集合中筛选出第二数量的第二特征数据;
将所述资料附件数据按照所述产品分类因子进行分类得到分类后的资料类型数据,从所述资料类型数据中筛选出分布数量最多的指定资料类型数据;
基于所述第一特征数据、所述第二特征数据以及所述指定资料类型数据,生成与所述产品分类因子对应的报价资料清单。
有益效果
本申请中提供的数据生成方法、装置、计算机设备和存储介质,可以节省大量的人力资源和花费时间,有效地提高了报价资料清单的生成效率,保证了生成的报价资料清单的准确性。
附图说明
图1是本申请一实施例的数据生成方法的流程示意图;
图2是本申请一实施例的数据生成装置的结构示意图;
图3是本申请一实施例的计算机设备的结构示意图。
本发明的最佳实施方式
应当理解,此处所描述的具体实施例仅仅用于解释本申请,并不用于限定本申请。
参照图1,本申请一实施例的数据生成方法,包括:
S1:获取预设时间段内的产品数据信息;
S2:对所述产品数据信息进行分类处理,得到标的信息、定价数据、理赔数据以及资料附件数据;
S3:获取所述标的信息,按照预设的产品分类因子对所述标的信息进行分类得到对应的多个数据集合,其中,所述数据集合至少包括一个特征数据,所述产品分类因子包括产品信息与出单地域信息;
S4:获取所述理赔数据,计算指定数据集合对所述理赔数据的第一影响度,并基于所述第一影响度从所述指定数据集合中筛选出第一数量的第一特征数据,其中,所述指定数据集合为所有所述数据集合中的任意一个集合;以及,
S5:获取所述定价数据,计算所述指定数据集合对所述定价数据的第二影响度,并基于所述第二影响度从所述指定数据集合中筛选出第二数量的第二特征数据;
S6:将所述资料附件数据按照所述产品分类因子进行分类得到分类后的资料类型数据,从所述资料类型数据中筛选出分布数量最多的指定资料类型数据;
S7:基于所述第一特征数据、所述第二特征数据以及所述指定资料类型数据,生成与所述产品分类因子对应的报价资料清单。
如上述步骤S1至S7所述,本方法实施例的执行主体为一种数据生成装置。在实际应用中,上述数据生成装置可以通过虚拟装置,例如软件代码实现,也可以通过写入或集成有相关执行代码的实体装置实现,且可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。本实施例中的 数据生成装置(可简称为装置),能够有效地提高了报价资料清单的生成效率,保证了生成的报价资料清单的准确性。具体地,首先获取预设时间段内的产品数据信息。其中,对于上述预设时间周期可根据实际需求进行设置,例如可为距离当前时间的前5年内包括的所有时间段。另外,上述产品数据信息可包括公司/机构内部的报价单信息、保单数据、理赔数据以及风控数据等数据。具体的,上述报价单信息可包括定价数据,上述保单数据主要是标的信息(标的的种类总体上包括财产和行为,其中财产又包括物和财产权利,具体表现为动产、不动产、债权、物权等;行为又包括作为、不作为等,标的信息为与产品的标的相关的所有信息,例如可包括地址、房屋建筑类型、车辆信息等数据)、资料附件数据(如被保险人证件、机器清单、产品清单等数据),上述理赔数据包括赔付信息、赔付原因以及赔付涉及责任数据等。然后对上述产品数据信息进行分类处理,得到标的信息、定价数据、理赔数据以及资料附件数据。其中,可以标的类、定价类、理赔类以及资料附件类作为分类信息来对上述产品数据信息进行分类处理,进而得到所需的标的信息、定价数据、理赔数据以及资料附件数据。在完成对于产品数据信息的分类处理后,获取上述标的信息,按照预设的产品分类因子对上述标的信息进行分类得到对应的多个数据集合,其中,上述产品分类因子包括产品信息与出单地域信息。上述数据集合至少包括一个特征数据,且每一个上述数据集合为以产品、出单地域作为分类类别的包含标的信息的集合。之后获取上述理赔数据,计算指定数据集合对上述理赔数据的第一影响度,并基于上述第一影响度从上述指定数据集合中筛选出第一数量的第一特征数据,其中,上述指定数据集合为所有上述数据集合中的任意一个集合。另外,可采用相似度来表征影响度,具体的,对于相似度的计算方式不作具体限定。具体的,上述相似度的计算公式可为
Figure PCTCN2021091701-appb-000001
S表示相似度,M表示指定特征数据,即指定数据集合中包含的所有特征数据中的任意一个数据,N表示上述理赔数据中的任意一个目标数据,M i为上述指定特征数据的第i个分向量,N i为上述目标数据的第i个分向量,n表示分向量的数量。此外,对于上述第一数量的数值不作具体限定,只需保证第一数量的数值小于第一影响度的数量数值即可,可基于影响度从大到小的顺序依次筛选出第一数量的目标影响度,再从指定数据集合中筛选出与该目标影响度对应的特征数据作为上述第一特征数据。以及获取上述定价数据,计算上述指定数据集合对上述定价数据的第二影响度,并基于上述第二影响度从上述指定数据集合中筛选出第二数量的第二特征数据。其中,上述第二影响度的计算方式参照上述第一影响度的计算方式,在此暂不作过多叙述,上述第二特征数据的筛选方式同样也可参照上述第一特征数据的筛选生成方式,在此也暂不作过多叙述。通过基于上述指定数据集合对上述定价数据的第二影响度,从指定数据集合中筛选出与产品分类因子的关联度较高的特征数据来作为上述第二特征数据,有利于后续能够基于该第二特征数据快速智能地生成与产品分类因子对应的报价资料清单。进一步地,在其他实施例中,本申请对获取所述标的信息,按照预设的产品分类因子对所述标的信息进行分类得到对应的多个数据集合的过程、对获取所述理赔数据(步骤S3),计算指定数据集合对所述理赔数据的第一影响度,并基于所述第一影响度从所述指定数据集合中筛选出第一数量的第一特征数据的过程(步骤S4),以及对获取所述定价数据,计算所述指定数据集合对所述定价数据的第二影响度,并基于所述第二影响度从所述指定数据集合中筛选出第二数量的第二特征数据的过程(步骤S5)的执行先后顺序不作限定,上述三个步骤过程的先后顺序的变化均属于本申请的保护范围,不对本申请造成任何限制。后续将上述资料附件数据按照上述产品分类因子进行分类得到分类后的资料类型数据,从上述资料类型数据中筛选出分布数量最多的指定资料类型数据。其中,上述资料附件数据可包括被保险人证件数据、机器清单数据、产品清单数据等数据。另外,在完成了对于资料附件数据的分类得到资料类型数据后,可通过统计每一种资料类型数据在所有资料附件数据中的出现次数,再将出现次数最多的资料类型数据作为上述指定资料类型数据。通过从上述资料类型数据中筛选出分布数量最多的指定资料类型数据作为上述指定数据集合中与产品分类因子的关联度较高的特征数据,有利于后续能够基于该指定资料类型数据智能准确地生成与产品分类因子对应的报价资料清单。最后基于上述第一特征数据、上述第二特征数据以及上述指定资料类型数据,生成与上述产品分类因子对应的报价资料清单。其中,上述报价资料清单为包括上述第一特征数据、上述第二特征数据以及上述指定资料类型数据的数据,可通过将第一特征数据、第二特征数据以及指定资料类型数据进行数据整合处理,经过整合处理后得到的整合数据即为所需生成的与上述产品分类因子对应的报价资料清单。不同于现有的通过人工处理生成报价资料清单的方式,本实施例通过获取预设时间段内的产品数据信息并进行分类得到标的物息、定价数据、理赔数据以及资料附件数据,之后按照预设的产品分类因子对标的信息进行分类得到对应的多个数据集合,并基于标的信息对应的数据集合对于理赔数据的影响度筛选出与产品分类因子的关联度较高的第一特征数据,基于标的信息对应的数据集合对于定价数据的影响度筛选出与产品分类因子的关联度较高的第二特征数据,最后利用第一特征数据、第二特征数据以及资料附件数据来实现自动智能地生成 与产品分类因子对应的报价资料清单。整个报价资料清单的数据生成过程是自动化进行的,无需人工参与,从而可以节省大量的人力资源和花费时间,有效地提高了报价资料清单的生成效率,保证了生成的报价资料清单的准确性。
进一步地,本申请一实施例中,上述步骤S4,包括:
S400:基于预设的数据并行处理指令,分别计算指定特征数据与所述理赔数据中每一个数据之间的第一相似度,其中,所述指定特征数据为所述指定数据集合中包含的所有特征数据中的任意一个数据;
S401:将所述第一相似度作为所述第一影响度;
S402:将所有所述第一影响度按照数值从大到小的顺序进行排序,得到对应的第一排序结果;
S403:从所述第一排序结果中排在首位的第一影响度开始,依次获取第一数量的目标影响度;
S404:基于所述目标影响度,从所述指定数据集合中筛选出与所述目标影响度对应的目标特征数据,并将所述目标特征数据作为所述第一特征数据。
如上述步骤S400至S404所述,上述计算指定数据集合对上述理赔数据的第一影响度,并基于上述第一影响度从上述指定数据集合中筛选出第一数量的第一特征数据的步骤,具体可包括:首先基于预设的数据并行处理指令,分别计算指定特征数据与上述理赔数据中每一个数据之间的第一相似度,其中,上述指定特征数据为上述指定数据集合中包含的所有特征数据中的任意一个数据。另外,上述数据并行处理指令具体可为单指令流多数据流(single instruction multiple data,SIMD)指令。通过利用SIMD指令的并行计算能力来同时分别计算指定特征数据与上述理赔数据中每一个数据之间的第一相似度,能够提高指定特征数据与上述理赔数据之间的数据比对处理速率,进而有效提高第一特征数据的生成速率。此外,对于上述第一相似度的计算方式不作具体限定。具体的,上述第一相似度的计算公式可为
Figure PCTCN2021091701-appb-000002
S表示相似度,M表示上述指定特征数据,N表示上述理赔数据中的任意一个目标数据,M i为上述指定特征数据的第i个分向量,N i为上述目标数据的第i个分向量,n表示分向量的数量。然后将上述第一相似度作为上述第一影响度。之后将所有上述第一影响度按照数值从大到小的顺序进行排序,得到对应的第一排序结果。在得到了上述第一排序结果后,从上述第一排序结果中排在首位的第一影响度开始,依次获取第一数量的目标影响度。其中,对于上述第一数量可根据实际需求进行设置,只需保证第一数量的数值小于第一影响度的数量数值即可。最后基于上述目标影响度,从上述指定数据集合中筛选出与上述目标影响度对应的目标特征数据,并将上述目标特征数据作为上述第一特征数据。本实施例通过基于上述指定数据集合对上述理赔数据的第一影响度,从指定数据集合中筛选出与产品分类因子的关联度较高的特征数据来作为上述第一特征数据,有利于后续能够基于该第一特征数据快速智能地生成与产品分类因子对应的报价资料清单,有效地提高了生成的报价资料清单的数据准确性。
进一步地,本申请一实施例中,上述步骤S1,包括:
S100:获取当前时间;以及,
S101:获取预设的业务繁忙时间段;
S102:判断所述当前时间是否处于所述业务繁忙时间段内;
S103:若所述当前时间不处于所述业务繁忙时间段内,获取预设时间段内的产品数据信息。
如上述步骤S100至S103所述,上述获取预设时间段内的产品数据信息的步骤,具体可包括:首先获取当前时间;以及获取预设的业务繁忙时间段。其中,上述预设的业务繁忙时间段的生成规则不作具体限定,可以根据实际需求采用多种方式进行生成,例如可以基于对装置在一定时间段内的内存使用量进行分析统计处理后生成,也可以基于装置在一定时间段内的网络流量数据进行分析统计处理后生成,等等。然后判断上述当前时间是否处于上述业务繁忙时间段内。如果上述当前时间不处于上述业务繁忙时间段内,获取预设时间段内的产品数据信息。本实施例通过只有在当前时间不处于上述业务繁忙时间段内,才会执行获取预设时间段内的产品数据信息的获取步骤,以及后续开始进行关于与上述产品分类因子对应的报价资料清单的生成处理过程,而不会在业务繁忙时间段内进行报价资料清单的生成处理,避免报价资料清单的生成处理会对当前的系统运作造成更大的负荷,减小了对于装置的正常运作的影响,保证了系统资源的合理利用,且将报价资料清单的生成处理放置于业务空闲时间段内执行,能够提高数据生成的处理效率。
进一步地,本申请一实施例中,上述步骤S101之前,包括:
S1010:通过预设的JAVA内存监控程序获取在第一预设时间周期的目标时间段内的内存使用量;
S1011:对所述第一预设时间周期、所述目标时间段以及所述内存使用量进行统计分析,生成对应的内存使用数据记录表;
S1012:基于所述内存使用数据记录表,分别获取在所述第一预设时间周期内每一天中的内存占用量大于预设的内存使用阈值的第一时间段;
S1013:对所有所述第一时间段进行交集计算处理,得到对应的第二时间段;
S1014:将所述第二时间段作为所述业务繁忙时间段。
如上述步骤S1010至S1014所述,上述获取预设的业务繁忙时间段的步骤之前,还可包括生成上述业务繁忙时间段的生成步骤。具体地,首先通过预设的JAVA内存监控程序获取在第一预设时间周期的目标时间段内的内存使用量。其中,上述JAVA内存监控程序可为开发人员根据实际的内存监控需求编写生成的,通过该JAVA内存监控程序可以调用装置提供的数据获取接口,进而实现快速便捷地获取到装置的内存使用量。然后对上述第一预设时间周期、上述目标时间段以及上述内存使用量进行统计分析,生成对应的内存使用数据记录表。其中,对于上述第一预设时间周期与上述目标时间段不作具体限定,可根据实际需求进行设置。举例地,上述第一预设时间周期可为与当前时间相邻的上一个月,上述目标时间段为由人工或装置自动粗略确定的装置的初始业务繁忙时间段,例如该目标时间段可设为9:00-21:00。之后基于上述内存使用数据记录表,分别获取在上述第一预设时间周期内每一天中的内存占用量大于预设的内存使用阈值的第一时间段。其中,对于上述内存使用阈值不作具体限定,可根据实际需求进行设置,例如可将内存使用阈值设置为75%。在得到了上述第一时间段后,对所有上述第一时间段进行交集计算处理,得到对应的第二时间段。其中,在得到了上述第一时间段后,通过对所有上述第一时间段进行交集计算处理,使得得到的上述第二时间段为装置在上述第一预设时间周期中每一天的内存使用量均大于上述内存使用阈值的相同时间段,即装置在上述第一预设时间周期内的任意一天的第二时间段均为内存使用超出正常工作状态下的内存使用阈值的业务高峰时间段,进而可将该第二时间段用作上述业务繁忙时间段。最后在得到了上述第二时间段时,将上述第二时间段作为上述业务繁忙时间段。本实施例通过对装置的历史内存使用量数据进行分析统计处理,并基于分析结果来智能地确定出装置的业务繁忙时间段,有效地保证了生成的业务繁忙时间段的准确性,且后续不会在该业务繁忙时间段内进行相应的数据生成处理,而是会在避开了该业务繁忙时间段的其他空闲时间段内进行后续的数据生成处理,有效地减小了对于装置的正常运作的影响,保证了系统资源的合理利用,提高了数据生成的处理速度与效率。
进一步地,本申请一实施例中,上述步骤S101之前,包括:
S1020:基于预设的划分数值,将一天的时间段划分为多个单位处理时段;
S1021:基于预设的流量统计数据库,统计每个所述单位处理时段在第二预设时间周期内的网络流量总量;
S1022:从所述网络流量总量中筛选出大于预设的流量阈值的第一网络流量总量;
S1023:基于各所述第一网络流量总量分别对应的数值,按照数值从大到小的顺序对所有所述第一网络流量总量进行排序,得到对应的第二排序结果;
S1024:从所述第二排序结果中排在首位的第一网络流量总量开始,依次获取第二数量的目标网络流量总量;
S1025:从所有所述单位处理时段中获取与所述目标网络流量总量对应的目标单位处理时段;
S1026:将所述目标单位处理时段作为所述业务繁忙时间段。
如上述步骤S1020至S1026所述,上述获取预设的业务繁忙时间段的步骤之前,还可包括生成上述业务繁忙时间段的生成步骤。具体地,首先基于预设的划分数值,将一天的时间段划分为多个单位处理时段。其中,对于上述划分数值不作具体限定,例如可设为6小时,即使用6小时作为一个单位处理时段的时间长度,则可从0时开始可将一天包含的24小时划分为4个单位处理时段,即0:00-6:00,6:00-12:00,12:00-18:00,18:00-24:00。然后基于预设的流量统计数据库,统计每个上述单位处理时段在第二预设时间周期内的网络流量总量。其中,对于上述第二预设时间周期不作具体限定,可根据实际需求进行设置。举例地,上述第二预设时间周期可为与当前时间相邻的上一个月。举例地,如果某个单位处理时段为6:00-12:00,则该数据处理时段6:00-12:00在一个月内的网络流量总量即是该月内时段6:00-12:00所对应的网络流量的和值。之后从上述网络流量总量中筛选出大于预设的流量阈值的第一网络流量总量。其中,对于上述流量阈值不作具体限定,可根据实际需求进行设置,例如可设置为20g。在得到了上述第一网络流量总量后,再基于各上述第一网络流量总量分别对应的数值,按照数值从大到小的顺序对所有上述第一网络流量总量进行排序,得到对应的第二排序结果。在得到了上述第二排序结果后,从上述第二排序结果中排在首位的第一网络流量总量开始,依次获取第二数量的目标网络流量总量。其中,对于上述第二数量不作具体限定,可根据实际需求进行设置,只需保证该第二数量的数值不大于上述第一网络流量总量的数量数值即可。最后从所有上述单位处理时段中获取与上述目标网络流量总量对应的目标单位处理时段,并将上述目标单位处理时段作为上述业务繁忙时间段。本实施例通过对装置的历史网络流量数据进行分析统计处理,并基于分析结果来智能地确定出装置的业务繁忙时间段,有效地保证了生成的业务繁忙时间段的准确性,且后续不会在该业务繁忙时间段内进行相应的数据生成处理,而是会在避开了该业务繁忙时间段的其他空闲时间段内进行后续的数据生成处理,有效 地减小了对于装置的正常运作的影响,保证了系统资源的合理利用,提高了数据生成的处理速度与效率。
进一步地,本申请一实施例中,上述步骤S7之后,包括:
S700:存储所述报价资料清单;
S701:判断是否接收到输入的产品报价获取请求,其中,所述产品报价获取请求携带有目标产品信息;
S702:若接收到所述产品报价获取请求,从所述产品报价获取请求中解析出所述目标产品信息;
S703:基于所述目标产品信息对所述报价资料清单进行查询处理,从所述报价资料清单中查找出与所述目标产品信息对应的目标报价资料清单;
S704:获取与所述产品报价获取请求对应的地址信息;
S705:将所述目标报价资料清单发送至与所述地址信息对应的地址。
如上述步骤S700至S705所述,上述基于上述第一特征数据、上述第二特征数据以及上述指定资料类型数据,生成与上述产品分类因子对应的报价资料清单的步骤之后,还可包括对于报价资料清单的存储过程与信息查询过程。具体地,首先存储上述报价资料清单。其中,对于报价资料清单的具体存储方式不作具体限定,可根据实际需求进行相应设置,例如可将报价资料清单存储于区块链上,通过使用区块链来对上述报价资料清单进行存储和管理,能够有效地保证上述报价资料清单的安全性与不可篡改性;或者还可将报价资料清单存储于本地,通过使用本地存储的方式可以有效避免网络不稳定或断开等情况导致报价资料清单的查询成功率低的问题,提高报价资料清单的存储适应性。然后判断是否接收到输入的产品报价获取请求,其中,上述产品报价获取请求携带有目标产品信息。另外,上述目标产品信息为与上述产品分类因子对应的信息,即可基于产品分类因子将上述目标产品信息进一步分解为目标产品与目标出单地域的两类信息。如果接收到上述产品报价获取请求,从上述产品报价获取请求中解析出上述目标产品信息。之后基于上述目标产品信息对上述报价资料清单进行查询处理,从上述报价资料清单中查找出与上述目标产品信息对应的目标报价资料清单。最后获取与上述产品报价获取请求对应的地址信息。并在得到了上述地址信息后,将上述目标报价资料清单发送至与上述地址信息对应的地址。本实施例通过对上述报价资料清单进行存储后,有利于后续在接收到输入的产品报价获取请求时,能够智能自动地从预存储的报价资料清单中查找出与上述目标产品信息对应的目标报价资料清单,由于清单数据的查找过程是自动化进行的,无需人工参与,可以节省大量的人力资源和花费时间,而且数据查找速度快、准确度高,有利于提高用户使用体验。
进一步地,本申请一实施例中,上述步骤S1之后,包括:
S110:对所述产品数据信息进行筛选处理,筛选出不符合预设条件的异常产品数据信息;
S111:从所述产品数据信息中删除所述异常产品数据信息,得到处理后的产品数据信息;
S112:存储处理后的所述产品数据信息。
如上述步骤S110至S112所述,上述获取预设时间段内的产品数据信息的步骤之后,还可包括对于该产品数据信息的数据清理处理。具体地,首先对上述产品数据信息进行筛选处理,筛选出不符合预设条件的异常产品数据信息。其中,对上述预设条件不作具体限定,可根据实际需求进行相应设置,例如该预设条件可为数据饱和度低于预设的饱和度阈值。然后从上述产品数据信息中删除上述异常产品数据信息,得到处理后的产品数据信息。最后存储处理后的上述产品数据信息。其中,对于处理后的上述产品数据信息的具体存储方式不作具体限定,如可将处理后的上述产品数据信息存储于区块链上,通过使用区块链来对处理后的上述产品数据信息进行存储和管理,能够有效地保证处理后的上述产品数据信息的安全性与不可篡改性。且通过将该处理后的产品数据信息存储在区块链而不用存储在本地,可以有效地节省本地的存储空间,能够有效避免处理后的产品数据信息会对装置的本地运作流畅性造成影响。本实施例通过对采集得到的产品数据信息进行数据清除处理以删除掉其所包含的异常数据,进而使用处理后的产品数据信息来作为后续生成的与上述产品分类因子对应的报价资料清单的源数据,能够有效地减少原始的产品数据信息中的异常数据对后续生成的报价资料清单造成的影响,有利于提高生成的报价资料清单的数据准确性。
本申请实施例中的数据生成方法还可以应用于区块链领域,如将上述报价资料清单等数据存储于区块链上。通过使用区块链来对上述报价资料清单进行存储和管理,能够有效地保证上述报价资料清单的安全性与不可篡改性。
上述区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中,用户管理模块负责所有区块链参与者的身份信息管理,包括维护公私钥生成(账户管理)、密钥管理以及用户真 实身份和区块链地址对应关系维护(权限管理)等,并且在授权的情况下,监管和审计某些真实身份的交易情况,提供风险控制的规则配置(风控审计);基础服务模块部署在所有区块链节点设备上,用来验证业务请求的有效性,并对有效请求完成共识后记录到存储上,对于一个新的业务请求,基础服务先对接口适配解析和鉴权处理(接口适配),然后通过共识算法将业务信息加密(共识管理),在加密之后完整一致的传输至共享账本上(网络通信),并进行记录存储;智能合约模块负责合约的注册发行以及合约触发和合约执行,开发人员可以通过某种编程语言定义合约逻辑,发布到区块链上(合约注册),根据合约条款的逻辑,调用密钥或者其它的事件触发执行,完成合约逻辑,同时还提供对合约升级注销的功能;运营监控模块主要负责产品发布过程中的部署、配置的修改、合约设置、云适配以及产品运行中的实时状态的可视化输出,例如:告警、监控网络情况、监控节点设备健康状态等。
参照图2,本申请一实施例中还提供了一种数据生成装置,包括:
第一获取模块1,用于获取预设时间段内的产品数据信息;
第一分类模块2,用于对所述产品数据信息进行分类处理,得到标的信息、定价数据、理赔数据以及资料附件数据;
第二分类模块3,用于获取所述标的信息,按照预设的产品分类因子对所述标的信息进行分类得到对应的多个数据集合,其中,所述数据集合至少包括一个特征数据,所述产品分类因子包括产品信息与出单地域信息;
第一计算模块4,用于获取所述理赔数据,计算指定数据集合对所述理赔数据的第一影响度,并基于所述第一影响度从所述指定数据集合中筛选出第一数量的第一特征数据,其中,所述指定数据集合为所有所述数据集合中的任意一个集合;以及,
第二计算模块5,用于获取所述定价数据,计算所述指定数据集合对所述定价数据的第二影响度,并基于所述第二影响度从所述指定数据集合中筛选出第二数量的第二特征数据;
筛选模块6,用于将所述资料附件数据按照所述产品分类因子进行分类得到分类后的资料类型数据,从所述资料类型数据中筛选出分布数量最多的指定资料类型数据;
生成模块7,用于基于所述第一特征数据、所述第二特征数据以及所述指定资料类型数据,生成与所述产品分类因子对应的报价资料清单。
本实施例中,上述数据生成装置中的第一获取模块、第一分类模块、第二分类模块、第一计算模块、第二计算模块、筛选模块与生成模块的功能和作用的实现过程具体详见上述数据生成方法中对应步骤S1至S7的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述第一计算模块,包括:
计算单元,用于基于预设的数据并行处理指令,分别计算指定特征数据与所述理赔数据中每一个数据之间的第一相似度,其中,所述指定特征数据为所述指定数据集合中包含的所有特征数据中的任意一个数据;
第一确定单元,用于将所述第一相似度作为所述第一影响度;
第一排序单元,用于将所有所述第一影响度按照数值从大到小的顺序进行排序,得到对应的第一排序结果;
第一获取单元,用于从所述第一排序结果中排在首位的第一影响度开始,依次获取第一数量的目标影响度;
第二确定单元,用于基于所述目标影响度,从所述指定数据集合中筛选出与所述目标影响度对应的目标特征数据,并将所述目标特征数据作为所述第一特征数据。
本实施例中,上述数据生成装置中的计算单元、第一确定单元、第一排序单元、第一获取单元与第二确定单元的功能和作用的实现过程具体详见上述数据生成方法中对应步骤S400至S404的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述第一获取模块,包括:
第二获取单元,用于获取当前时间;以及,
第三获取单元,用于获取预设的业务繁忙时间段;
判断单元,用于判断所述当前时间是否处于所述业务繁忙时间段内;
第四获取单元,用于若所述当前时间不处于所述业务繁忙时间段内,获取预设时间段内的产品数据信息。
本实施例中,上述数据生成装置中的第二获取单元、第三获取单元、判断单元与第四获取单元的功能和作用的实现过程具体详见上述数据生成方法中对应步骤S100至S103的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述第一获取模块,包括:
第五获取单元,用于通过预设的JAVA内存监控程序获取在第一预设时间周期的目标时间段内的内存使用量;
生成单元,用于对所述第一预设时间周期、所述目标时间段以及所述内存使用量进行统计分析,生成对应的内存使用数据记录表;
第六获取单元,用于基于所述内存使用数据记录表,分别获取在所述第一预设时间周期内每一天中的内存占用量大于预设的内存使用阈值的第一时间段;
处理单元,用于对所有所述第一时间段进行交集计算处理,得到对应的第二时间段;
第三确定单元,用于将所述第二时间段作为所述业务繁忙时间段。
本实施例中,上述数据生成装置中的第五获取单元、生成单元、第六获取单元、处理单元与第三确定单元的功能和作用的实现过程具体详见上述数据生成方法中对应步骤S1010至S1014的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述第一获取模块,包括:
划分单元,用于基于预设的划分数值,将一天的时间段划分为多个单位处理时段;
统计单元,用于基于预设的流量统计数据库,统计每个所述单位处理时段在第二预设时间周期内的网络流量总量;
筛选单元,用于从所述网络流量总量中筛选出大于预设的流量阈值的第一网络流量总量;
第二排序单元,用于基于各所述第一网络流量总量分别对应的数值,按照数值从大到小的顺序对所有所述第一网络流量总量进行排序,得到对应的第二排序结果;
第七获取单元,用于从所述第二排序结果中排在首位的第一网络流量总量开始,依次获取第二数量的目标网络流量总量;
第八获取单元,用于从所有所述单位处理时段中获取与所述目标网络流量总量对应的目标单位处理时段;
第四确定单元,用于将所述目标单位处理时段作为所述业务繁忙时间段。
本实施例中,上述数据生成装置中的划分单元、统计单元、筛选单元、第二排序单元、第七获取单元、第八获取单元与第四确定单元的功能和作用的实现过程具体详见上述数据生成方法中对应步骤S1020至S1026的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述数据生成装置,包括:
第一存储模块,用于存储所述报价资料清单;
判断模块,用于判断是否接收到输入的产品报价获取请求,其中,所述产品报价获取请求携带有目标产品信息;
解析模块,用于若接收到所述产品报价获取请求,从所述产品报价获取请求中解析出所述目标产品信息;
查询模块,用于基于所述目标产品信息对所述报价资料清单进行查询处理,从所述报价资料清单中查找出与所述目标产品信息对应的目标报价资料清单;
第二获取模块,用于获取与所述产品报价获取请求对应的地址信息;
发送模块,用于将所述目标报价资料清单发送至与所述地址信息对应的地址。
本实施例中,上述数据生成装置中的第一存储模块、判断模块、解析模块、查询模块、第二获取模块与发送模块的功能和作用的实现过程具体详见上述数据生成方法中对应步骤S700至S705的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述数据生成装置,包括:
第一处理模块,用于对所述产品数据信息进行筛选处理,筛选出不符合预设条件的异常产品数据信息;
第二处理模块,用于从所述产品数据信息中删除所述异常产品数据信息,得到处理后的产品数据信息;
第二存储模块,用于存储处理后的所述产品数据信息。
本实施例中,上述数据生成装置中的第一处理模块、第二处理模块与第二存储模块的功能和作用的实现过程具体详见上述数据生成方法中对应步骤S110至S112的实现过程,在此不再赘述。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏、输入装置和数据库。其中,该计算机设备设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括存储介质、内存储器。该存储介质存储有操作系统、计算机程序和数据库。该内存储器为存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储标的信息、定价数据、理赔数据、资料附件数据、数据集合、产品信息、出单地域信息、第一影响度、第二影响度以及报价资料清单等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机设备的显示屏是计算机中必不可少的一种图文输出设备,用于将数字信号转换为光信号,使文字与图形在显示屏的屏幕上显示出 来。该计算机设备的输入装置是计算机与用户或其他设备之间进行信息交换的主要装置,用于把数据、指令及某些标志信息等输送到计算机中去。该计算机程序被处理器执行时以实现一种数据生成方法。
上述处理器执行上述数据生成方法的步骤:
获取预设时间段内的产品数据信息;
对所述产品数据信息进行分类处理,得到标的信息、定价数据、理赔数据以及资料附件数据;
获取所述标的信息,按照预设的产品分类因子对所述标的信息进行分类得到对应的多个数据集合,其中,所述数据集合至少包括一个特征数据,所述产品分类因子包括产品信息与出单地域信息;
获取所述理赔数据,计算指定数据集合对所述理赔数据的第一影响度,并基于所述第一影响度从所述指定数据集合中筛选出第一数量的第一特征数据,其中,所述指定数据集合为所有所述数据集合中的任意一个集合;以及,
获取所述定价数据,计算所述指定数据集合对所述定价数据的第二影响度,并基于所述第二影响度从所述指定数据集合中筛选出第二数量的第二特征数据;
将所述资料附件数据按照所述产品分类因子进行分类得到分类后的资料类型数据,从所述资料类型数据中筛选出分布数量最多的指定资料类型数据;
基于所述第一特征数据、所述第二特征数据以及所述指定资料类型数据,生成与所述产品分类因子对应的报价资料清单。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的装置、计算机设备的限定。
本申请一实施例还提供一种计算机可读存储介质,所述计算机可读存储介质可以是非易失性,也可以是易失性,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一个示例性实施例所示出的数据生成方法,所述数据生成方法包括以下步骤:
获取预设时间段内的产品数据信息;
对所述产品数据信息进行分类处理,得到标的信息、定价数据、理赔数据以及资料附件数据;
获取所述标的信息,按照预设的产品分类因子对所述标的信息进行分类得到对应的多个数据集合,其中,所述数据集合至少包括一个特征数据,所述产品分类因子包括产品信息与出单地域信息;
获取所述理赔数据,计算指定数据集合对所述理赔数据的第一影响度,并基于所述第一影响度从所述指定数据集合中筛选出第一数量的第一特征数据,其中,所述指定数据集合为所有所述数据集合中的任意一个集合;以及,
获取所述定价数据,计算所述指定数据集合对所述定价数据的第二影响度,并基于所述第二影响度从所述指定数据集合中筛选出第二数量的第二特征数据;
将所述资料附件数据按照所述产品分类因子进行分类得到分类后的资料类型数据,从所述资料类型数据中筛选出分布数量最多的指定资料类型数据;
基于所述第一特征数据、所述第二特征数据以及所述指定资料类型数据,生成与所述产品分类因子对应的报价资料清单。
综上所述,不同于现有的通过人工处理生成报价资料清单的方式,本申请实施例中提供的数据生成方法、装置、计算机设备和存储介质,可以节省大量的人力资源和花费时间,有效地提高了报价资料清单的生成效率,保证了生成的报价资料清单的准确性。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM通过多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (20)

  1. 一种数据生成方法,其中,包括:
    获取预设时间段内的产品数据信息;
    对所述产品数据信息进行分类处理,得到标的信息、定价数据、理赔数据以及资料附件数据;
    获取所述标的信息,按照预设的产品分类因子对所述标的信息进行分类得到对应的多个数据集合,其中,所述数据集合至少包括一个特征数据,所述产品分类因子包括产品信息与出单地域信息;
    获取所述理赔数据,计算指定数据集合对所述理赔数据的第一影响度,并基于所述第一影响度从所述指定数据集合中筛选出第一数量的第一特征数据,其中,所述指定数据集合为所有所述数据集合中的任意一个集合;以及,
    获取所述定价数据,计算所述指定数据集合对所述定价数据的第二影响度,并基于所述第二影响度从所述指定数据集合中筛选出第二数量的第二特征数据;
    将所述资料附件数据按照所述产品分类因子进行分类得到分类后的资料类型数据,从所述资料类型数据中筛选出分布数量最多的指定资料类型数据;
    基于所述第一特征数据、所述第二特征数据以及所述指定资料类型数据,生成与所述产品分类因子对应的报价资料清单。
  2. 根据权利要求1所述的数据生成方法,其中,所述计算指定数据集合对所述理赔数据的第一影响度,并基于所述第一影响度从所述指定数据集合中筛选出第一数量的第一特征数据的步骤,包括:
    基于预设的数据并行处理指令,分别计算指定特征数据与所述理赔数据中每一个数据之间的第一相似度,其中,所述指定特征数据为所述指定数据集合中包含的所有特征数据中的任意一个数据;
    将所述第一相似度作为所述第一影响度;
    将所有所述第一影响度按照数值从大到小的顺序进行排序,得到对应的第一排序结果;
    从所述第一排序结果中排在首位的第一影响度开始,依次获取第一数量的目标影响度;
    基于所述目标影响度,从所述指定数据集合中筛选出与所述目标影响度对应的目标特征数据,并将所述目标特征数据作为所述第一特征数据。
  3. 根据权利要求1所述的数据生成方法,其中,所述获取预设时间段内的产品数据信息的步骤,包括:
    获取当前时间;以及,
    获取预设的业务繁忙时间段;
    判断所述当前时间是否处于所述业务繁忙时间段内;
    若所述当前时间不处于所述业务繁忙时间段内,获取预设时间段内的产品数据信息。
  4. 根据权利要求3所述的数据生成方法,其中,所述获取预设的业务繁 忙时间段的步骤之前,包括:
    通过预设的JAVA内存监控程序获取在第一预设时间周期的目标时间段内的内存使用量;
    对所述第一预设时间周期、所述目标时间段以及所述内存使用量进行统计分析,生成对应的内存使用数据记录表;
    基于所述内存使用数据记录表,分别获取在所述第一预设时间周期内每一天中的内存占用量大于预设的内存使用阈值的第一时间段;
    对所有所述第一时间段进行交集计算处理,得到对应的第二时间段;
    将所述第二时间段作为所述业务繁忙时间段。
  5. 根据权利要求3所述的数据生成方法,其中,所述获取预设的业务繁忙时间段的步骤之前,包括:
    基于预设的划分数值,将一天的时间段划分为多个单位处理时段;
    基于预设的流量统计数据库,统计每个所述单位处理时段在第二预设时间周期内的网络流量总量;
    从所述网络流量总量中筛选出大于预设的流量阈值的第一网络流量总量;
    基于各所述第一网络流量总量分别对应的数值,按照数值从大到小的顺序对所有所述第一网络流量总量进行排序,得到对应的第二排序结果;
    从所述第二排序结果中排在首位的第一网络流量总量开始,依次获取第二数量的目标网络流量总量;
    从所有所述单位处理时段中获取与所述目标网络流量总量对应的目标单位处理时段;
    将所述目标单位处理时段作为所述业务繁忙时间段。
  6. 根据权利要求1所述的数据生成方法,其中,所述基于所述第一特征数据、所述第二特征数据以及所述指定资料类型数据,生成与所述产品分类因子对应的报价资料清单的步骤之后,包括:
    存储所述报价资料清单;
    判断是否接收到输入的产品报价获取请求,其中,所述产品报价获取请求携带有目标产品信息;
    若接收到所述产品报价获取请求,从所述产品报价获取请求中解析出所述目标产品信息;
    基于所述目标产品信息对所述报价资料清单进行查询处理,从所述报价资料清单中查找出与所述目标产品信息对应的目标报价资料清单;
    获取与所述产品报价获取请求对应的地址信息;
    将所述目标报价资料清单发送至与所述地址信息对应的地址。
  7. 根据权利要求1所述的数据生成方法,其中,所述获取预设时间段内的产品数据信息的步骤之后,包括:
    对所述产品数据信息进行筛选处理,筛选出不符合预设条件的异常产品数据信息;
    从所述产品数据信息中删除所述异常产品数据信息,得到处理后的产品数 据信息;
    存储处理后的所述产品数据信息。
  8. 一种数据生成装置,其中,包括:
    第一获取模块,用于获取预设时间段内的产品数据信息;
    第一分类模块,用于对所述产品数据信息进行分类处理,得到标的信息、定价数据、理赔数据以及资料附件数据;
    第二分类模块,用于获取所述标的信息,按照预设的产品分类因子对所述标的信息进行分类得到对应的多个数据集合,其中,所述数据集合至少包括一个特征数据,所述产品分类因子包括产品信息与出单地域信息;
    第一计算模块,用于获取所述理赔数据,计算指定数据集合对所述理赔数据的第一影响度,并基于所述第一影响度从所述指定数据集合中筛选出第一数量的第一特征数据,其中,所述指定数据集合为所有所述数据集合中的任意一个集合;以及,
    第二计算模块,用于获取所述定价数据,计算所述指定数据集合对所述定价数据的第二影响度,并基于所述第二影响度从所述指定数据集合中筛选出第二数量的第二特征数据;
    筛选模块,用于将所述资料附件数据按照所述产品分类因子进行分类得到分类后的资料类型数据,从所述资料类型数据中筛选出分布数量最多的指定资料类型数据;
    生成模块,用于基于所述第一特征数据、所述第二特征数据以及所述指定资料类型数据,生成与所述产品分类因子对应的报价资料清单。
  9. 一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其中,所述处理器执行所述计算机程序时实现一种数据生成方法:其中,所述数据生成方法包括:
    获取预设时间段内的产品数据信息;
    对所述产品数据信息进行分类处理,得到标的信息、定价数据、理赔数据以及资料附件数据;
    获取所述标的信息,按照预设的产品分类因子对所述标的信息进行分类得到对应的多个数据集合,其中,所述数据集合至少包括一个特征数据,所述产品分类因子包括产品信息与出单地域信息;
    获取所述理赔数据,计算指定数据集合对所述理赔数据的第一影响度,并基于所述第一影响度从所述指定数据集合中筛选出第一数量的第一特征数据,其中,所述指定数据集合为所有所述数据集合中的任意一个集合;以及,
    获取所述定价数据,计算所述指定数据集合对所述定价数据的第二影响度,并基于所述第二影响度从所述指定数据集合中筛选出第二数量的第二特征数据;
    将所述资料附件数据按照所述产品分类因子进行分类得到分类后的资料类型数据,从所述资料类型数据中筛选出分布数量最多的指定资料类型数据;
    基于所述第一特征数据、所述第二特征数据以及所述指定资料类型数据, 生成与所述产品分类因子对应的报价资料清单。
  10. 根据权利要求9所述的计算机设备,其中,所述计算指定数据集合对所述理赔数据的第一影响度,并基于所述第一影响度从所述指定数据集合中筛选出第一数量的第一特征数据的步骤,包括:
    基于预设的数据并行处理指令,分别计算指定特征数据与所述理赔数据中每一个数据之间的第一相似度,其中,所述指定特征数据为所述指定数据集合中包含的所有特征数据中的任意一个数据;
    将所述第一相似度作为所述第一影响度;
    将所有所述第一影响度按照数值从大到小的顺序进行排序,得到对应的第一排序结果;
    从所述第一排序结果中排在首位的第一影响度开始,依次获取第一数量的目标影响度;
    基于所述目标影响度,从所述指定数据集合中筛选出与所述目标影响度对应的目标特征数据,并将所述目标特征数据作为所述第一特征数据。
  11. 根据权利要求9所述的计算机设备,其中,所述获取预设时间段内的产品数据信息的步骤,包括:
    获取当前时间;以及,
    获取预设的业务繁忙时间段;
    判断所述当前时间是否处于所述业务繁忙时间段内;
    若所述当前时间不处于所述业务繁忙时间段内,获取预设时间段内的产品数据信息。
  12. 根据权利要求11所述的计算机设备,其中,述获取预设的业务繁忙时间段的步骤之前,包括:
    通过预设的JAVA内存监控程序获取在第一预设时间周期的目标时间段内的内存使用量;
    对所述第一预设时间周期、所述目标时间段以及所述内存使用量进行统计分析,生成对应的内存使用数据记录表;
    基于所述内存使用数据记录表,分别获取在所述第一预设时间周期内每一天中的内存占用量大于预设的内存使用阈值的第一时间段;
    对所有所述第一时间段进行交集计算处理,得到对应的第二时间段;
    将所述第二时间段作为所述业务繁忙时间段。
  13. 根据权利要求11所述的计算机设备,其中,所述获取预设的业务繁忙时间段的步骤之前,包括:
    基于预设的划分数值,将一天的时间段划分为多个单位处理时段;
    基于预设的流量统计数据库,统计每个所述单位处理时段在第二预设时间周期内的网络流量总量;
    从所述网络流量总量中筛选出大于预设的流量阈值的第一网络流量总量;
    基于各所述第一网络流量总量分别对应的数值,按照数值从大到小的顺序对所有所述第一网络流量总量进行排序,得到对应的第二排序结果;
    从所述第二排序结果中排在首位的第一网络流量总量开始,依次获取第二数量的目标网络流量总量;
    从所有所述单位处理时段中获取与所述目标网络流量总量对应的目标单位处理时段;
    将所述目标单位处理时段作为所述业务繁忙时间段。
  14. 根据权利要求9所述的计算机设备,其中,所述基于所述第一特征数据、所述第二特征数据以及所述指定资料类型数据,生成与所述产品分类因子对应的报价资料清单的步骤之后,包括:
    存储所述报价资料清单;
    判断是否接收到输入的产品报价获取请求,其中,所述产品报价获取请求携带有目标产品信息;
    若接收到所述产品报价获取请求,从所述产品报价获取请求中解析出所述目标产品信息;
    基于所述目标产品信息对所述报价资料清单进行查询处理,从所述报价资料清单中查找出与所述目标产品信息对应的目标报价资料清单;
    获取与所述产品报价获取请求对应的地址信息;
    将所述目标报价资料清单发送至与所述地址信息对应的地址。
  15. 根据权利要求9所述的计算机设备,其中,所述获取预设时间段内的产品数据信息的步骤之后,包括:
    对所述产品数据信息进行筛选处理,筛选出不符合预设条件的异常产品数据信息;
    从所述产品数据信息中删除所述异常产品数据信息,得到处理后的产品数据信息;
    存储处理后的所述产品数据信息。
  16. 一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现一种数据生成方法,其中,所述数据生成方法包括以下步骤:
    获取预设时间段内的产品数据信息;
    对所述产品数据信息进行分类处理,得到标的信息、定价数据、理赔数据以及资料附件数据;
    获取所述标的信息,按照预设的产品分类因子对所述标的信息进行分类得到对应的多个数据集合,其中,所述数据集合至少包括一个特征数据,所述产品分类因子包括产品信息与出单地域信息;
    获取所述理赔数据,计算指定数据集合对所述理赔数据的第一影响度,并基于所述第一影响度从所述指定数据集合中筛选出第一数量的第一特征数据,其中,所述指定数据集合为所有所述数据集合中的任意一个集合;以及,
    获取所述定价数据,计算所述指定数据集合对所述定价数据的第二影响度,并基于所述第二影响度从所述指定数据集合中筛选出第二数量的第二特征数据;
    将所述资料附件数据按照所述产品分类因子进行分类得到分类后的资料类型数据,从所述资料类型数据中筛选出分布数量最多的指定资料类型数据;
    基于所述第一特征数据、所述第二特征数据以及所述指定资料类型数据,生成与所述产品分类因子对应的报价资料清单。
  17. 根据权利要求16所述的计算机可读存储介质,其中,所述计算指定数据集合对所述理赔数据的第一影响度,并基于所述第一影响度从所述指定数据集合中筛选出第一数量的第一特征数据的步骤,包括:
    基于预设的数据并行处理指令,分别计算指定特征数据与所述理赔数据中每一个数据之间的第一相似度,其中,所述指定特征数据为所述指定数据集合中包含的所有特征数据中的任意一个数据;
    将所述第一相似度作为所述第一影响度;
    将所有所述第一影响度按照数值从大到小的顺序进行排序,得到对应的第一排序结果;
    从所述第一排序结果中排在首位的第一影响度开始,依次获取第一数量的目标影响度;
    基于所述目标影响度,从所述指定数据集合中筛选出与所述目标影响度对应的目标特征数据,并将所述目标特征数据作为所述第一特征数据。
  18. 根据权利要求16所述的计算机可读存储介质,其中,所述获取预设时间段内的产品数据信息的步骤,包括:
    获取当前时间;以及,
    获取预设的业务繁忙时间段;
    判断所述当前时间是否处于所述业务繁忙时间段内;
    若所述当前时间不处于所述业务繁忙时间段内,获取预设时间段内的产品数据信息。
  19. 根据权利要求18所述的计算机可读存储介质,其中,所述获取预设的业务繁忙时间段的步骤之前,包括:
    通过预设的JAVA内存监控程序获取在第一预设时间周期的目标时间段内的内存使用量;
    对所述第一预设时间周期、所述目标时间段以及所述内存使用量进行统计分析,生成对应的内存使用数据记录表;
    基于所述内存使用数据记录表,分别获取在所述第一预设时间周期内每一天中的内存占用量大于预设的内存使用阈值的第一时间段;
    对所有所述第一时间段进行交集计算处理,得到对应的第二时间段;
    将所述第二时间段作为所述业务繁忙时间段。
  20. 根据权利要求16所述的计算机可读存储介质,其中,所述获取预设时间段内的产品数据信息的步骤之后,包括:
    对所述产品数据信息进行筛选处理,筛选出不符合预设条件的异常产品数据信息;
    从所述产品数据信息中删除所述异常产品数据信息,得到处理后的产品数 据信息;
    存储处理后的所述产品数据信息。
PCT/CN2021/091701 2021-03-15 2021-04-30 数据生成方法、装置、计算机设备和存储介质 WO2022193415A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202110277633.7 2021-03-15
CN202110277633.7A CN112988824B (zh) 2021-03-15 2021-03-15 数据生成方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
WO2022193415A1 true WO2022193415A1 (zh) 2022-09-22

Family

ID=76335555

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2021/091701 WO2022193415A1 (zh) 2021-03-15 2021-04-30 数据生成方法、装置、计算机设备和存储介质

Country Status (2)

Country Link
CN (1) CN112988824B (zh)
WO (1) WO2022193415A1 (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8577699B1 (en) * 2007-09-03 2013-11-05 United Services Automobile Association (Usaa) Quoting insurance premiums
CN107909494A (zh) * 2017-12-08 2018-04-13 中国平安财产保险股份有限公司 保险数据信息的配置方法、装置、计算机设备和存储介质
CN108230156A (zh) * 2016-12-14 2018-06-29 平安科技(深圳)有限公司 投保信息处理方法和装置
CN110308875A (zh) * 2019-06-27 2019-10-08 深信服科技股份有限公司 数据读写方法、装置、设备及计算机可读存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108776936A (zh) * 2018-06-05 2018-11-09 中国平安人寿保险股份有限公司 保险理赔方法、装置、计算机设备和存储介质
CN109493158B (zh) * 2018-09-26 2024-07-02 平安国际融资租赁有限公司 产品报价测算方法、装置、计算机设备和存储介质
CN109859059A (zh) * 2019-01-17 2019-06-07 深圳壹账通智能科技有限公司 保险理赔方法、装置、计算机设备及存储介质
CN110138837B (zh) * 2019-04-15 2021-12-28 平安科技(深圳)有限公司 请求处理方法、装置、计算机设备和存储介质
CN110136011A (zh) * 2019-05-09 2019-08-16 泰康保险集团股份有限公司 保险智能报价方法、装置、介质及电子设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8577699B1 (en) * 2007-09-03 2013-11-05 United Services Automobile Association (Usaa) Quoting insurance premiums
CN108230156A (zh) * 2016-12-14 2018-06-29 平安科技(深圳)有限公司 投保信息处理方法和装置
CN107909494A (zh) * 2017-12-08 2018-04-13 中国平安财产保险股份有限公司 保险数据信息的配置方法、装置、计算机设备和存储介质
CN110308875A (zh) * 2019-06-27 2019-10-08 深信服科技股份有限公司 数据读写方法、装置、设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN112988824A (zh) 2021-06-18
CN112988824B (zh) 2023-09-26

Similar Documents

Publication Publication Date Title
CN111831636B (zh) 一种数据处理方法、装置、计算机系统及可读存储介质
US10885591B1 (en) Pre-calculated insurance premiums with wildcarding
CN110288193B (zh) 任务监控处理方法、装置、计算机设备及存储介质
US20120259753A1 (en) System and method for managing collaborative financial fraud detection logic
CN105556552A (zh) 欺诈探测和分析
CN104134092A (zh) 一种医保报销行为监控系统及监控方法
CN111652280B (zh) 基于行为的目标物数据分析方法、装置及存储介质
CN112364004B (zh) 基于数据仓库的保单数据处理方法、装置及存储介质
CN103493076B (zh) 用于优化重复的搜索请求的改进预订系统的方法和系统
WO2020164269A1 (zh) 基于用户群组的消息推送方法、装置及计算机设备
CN111881158B (zh) 一种管理报表数据处理方法、装置、计算机系统及可读存储介质
CN111861716B (zh) 一种基于软件系统的贷中监控预警等级生成方法
CN111625809A (zh) 数据授权方法及装置、电子设备、存储介质
US11455323B2 (en) Data processing method and system
CN110728301A (zh) 一种个人用户的信用评分方法、装置、终端及存储介质
CN110135815A (zh) 差旅订单监控方法、装置、计算机设备和存储介质
CN102870110A (zh) 文档登记系统
CN111415067A (zh) 企业及个人信用评级系统
CN114186275A (zh) 隐私保护方法、装置、计算机设备及存储介质
CN113869602A (zh) 核电厂备件需求预测方法、系统、计算机设备和存储介质
WO2022193415A1 (zh) 数据生成方法、装置、计算机设备和存储介质
CN116228431A (zh) 一种异常交易账户确定方法、装置及电子设备
US11663658B1 (en) Assessing the presence of selective omission via collaborative counterfactual interventions
CN116167870A (zh) 一种用于保险业务的费用管理系统
CN116228402A (zh) 一种金融征信特征仓库技术支持系统

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21931001

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21931001

Country of ref document: EP

Kind code of ref document: A1