CN116523478B - 一种保单数据管理方法、系统、设备及存储介质 - Google Patents
一种保单数据管理方法、系统、设备及存储介质 Download PDFInfo
- Publication number
- CN116523478B CN116523478B CN202310816034.7A CN202310816034A CN116523478B CN 116523478 B CN116523478 B CN 116523478B CN 202310816034 A CN202310816034 A CN 202310816034A CN 116523478 B CN116523478 B CN 116523478B
- Authority
- CN
- China
- Prior art keywords
- information
- policy
- insurance
- algorithm
- rule
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000013523 data management Methods 0.000 title claims abstract description 30
- 238000012545 processing Methods 0.000 claims abstract description 27
- 238000004422 calculation algorithm Methods 0.000 claims description 103
- 230000015654 memory Effects 0.000 claims description 16
- 238000001514 detection method Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 10
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 8
- 238000012937 correction Methods 0.000 claims description 3
- 102100032202 Cornulin Human genes 0.000 claims 1
- 101000920981 Homo sapiens Cornulin Proteins 0.000 claims 1
- 238000007726 management method Methods 0.000 abstract description 11
- 238000004364 calculation method Methods 0.000 description 8
- 238000013461 design Methods 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 210000001503 joint Anatomy 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Strategic Management (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Artificial Intelligence (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Bioethics (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Technology Law (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Computing Systems (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明属于信息管理技术领域,具体公开了一种保单数据管理方法、系统、设备及存储介质,通过OCR文字识别技术对电子保单进行内容识别,得到保单数据内容,将保单数据内容的各项信息关联相应的结构化标识生成结构化数据表,然后从保单号提取流水编号来确定相应编排规则和加密算法,依据编排规则利用保单号和投保人身份证号编排出加密密钥,再利用加密密钥和加密算法对结构化数据表进行加密处理,得到保单数据加密包来存入数据库相应存档单元。本发明可以提升保单数据的管理效率和质量,减少人力成本,能有效提升保单数据管理的安全性和规范性,便于后续进行保单数据的高效解密处理和溯源查询。
Description
技术领域
本发明属于信息管理技术领域,具体涉及一种保单数据管理方法、系统、设备及存储介质。
背景技术
在保险行业中,电子保单(如寿险、车险等电子保单)的信息提取及归档管理向来都是业务环节的重要组成部分,往往需要将非结构化的保单数据信息录入到相应的系统中,进行结构化的电子档备份和信息管理。目前,各类电子保单的信息管理主要还是依靠人工来提取保单数据,然后直接将提取的数据录入到相应系统中进行存档,这种人工处理方式处理速度慢,效率低,容易出错,并且数据的处理和保存管理过程安全性较低,存在数据泄露的风险。因此,针对当前保险行业信息量庞大且信息多样的保单数据管理需求,亟需一种更加高效、可靠且安全的保单数据管理手段。
发明内容
本发明的目的是提供一种保单数据管理方法、系统、设备及存储介质,用以解决现有技术中存在的上述问题。
为了实现上述目的,本发明采用以下技术方案:
第一方面,提供一种保单数据管理方法,包括:
获取目标电子保单;
对目标电子保单进行OCR文字识别,得到目标电子保单的保单数据内容,所述保单数据内容包括保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息;
分别将保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息关联对应的结构化标识;
根据保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息及其各自关联的结构化标识,生成结构化数据表;
从保单号信息中提取保单号,从投保人信息中提取投保人身份证号,并提取保单号的后六位数字作为流水编号,提取投保人身份证号的前六位数字作为区划编号;
采用设定的计算方式对流水编号进行计算,得到规则号和算法号,并根据规则号从规则库中调取对应的数据编排规则,根据算法号从算法库中调取对应的加密算法,所述规则库中预存有若干数据编排规则,各数据编排规则均关联有相应的规则号,所述算法库中预存有若干加密算法,各加密算法均关联有相应的算法号;
根据数据编排规则分别对保单号和投保人身份证号进行数据编排处理,得到第一字符串和第二字符串,并将第一字符串与第二字符串组合,形成加密密钥;
根据加密密钥以及调取的加密算法对结构化数据表进行加密处理,得到保单数据加密包;
根据区划编号将保单数据加密包存入数据库中对应的存档单元,所述数据库中设有若干存档单元,各存档单元分别关联相应的区划编号。
在一个可能的设计中,所述对目标电子保单进行OCR文字识别,得到目标电子保单的保单数据内容,包括:
依次对目标电子保单进行二值化处理、噪声去除处理和倾斜较正处理,得到预处理图像;
采用Faster RCNN算法对预处理图像进行文本检测,得到文本检测结果;
采用CRNN算法对文本检测结果进行文本识别,并提取出目标电子保单的保单数据内容。
在一个可能的设计中,所述分别将保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息关联对应的结构化标识,包括:将保单号信息关联保单号标识,将保险起止时间信息关联保险时间标识,将保险业务类型信息关联业务类型标识,将保险公司信息关联保险公司标识,将投保人信息关联投保人标识,将受益人信息关联受益人标识,将险种信息关联险种标识。
在一个可能的设计中,所述结构化数据表为二维数据表,结构化数据表中包含纵向排列的保单号标识、保险时间标识、业务类型标识、保险公司标识、投保人标识、受益人标识和险种标识,且在保单号标识侧面横向罗列保单号信息,在保险时间标识侧面横向罗列保险起止时间信息,在业务类型标识侧面横向罗列保险业务类型信息,在保险公司标识侧面横向罗列保险公司信息,在投保人标识侧面横向罗列投保人信息,在受益人标识侧面横向罗列受益人信息,在险种标识侧面横向罗列险种信息。
在一个可能的设计中,所述采用设定的计算方式对流水编号进行计算,得到规则号和算法号,包括:
提取流水编号的前三位数作为第一数组,提取流水编号的后三位数作为第二数组;
将第一数组中的各位数迭代相加求和,得到一位数的规则号,将第二数组中的各位数迭代相加求和,得到一位数的算法号。
在一个可能的设计中,在根据规则号从规则库中调取对应的数据编排规则,根据算法号从算法库中调取对应的加密算法前,所述方法还包括:
获取第一编辑指令和第二编辑指令;
根据第一编辑指令编辑构建各数据编排规则,并将构建好的各数据编排规则关联相应的规则号,根据第二编辑指令编辑构建各加密算法,并将构建好的各加密算法关联相应的算法号;
将关联相应规则号的各数据编排规则存入规则库中,将关联相应算法号的各加密算法存入算法库中。
在一个可能的设计中,所述将第一字符串与第二字符串组合,形成加密密钥,包括:
将第一字符串与第二字符串交叉组合,形成加密密钥,使加密密钥中的奇数位字符来源于第一字符串,加密密钥中的偶数位字符来源于第二字符串。
第二方面,提供一种保单数据管理系统,包括获取单元、识别单元、标识单元、生成单元、提取单元、调取单元、组合单元、加密单元和存档单元,其中:
获取单元,用于获取目标电子保单;
识别单元,用于对目标电子保单进行OCR文字识别,得到目标电子保单的保单数据内容,所述保单数据内容包括保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息;
标识单元,用于分别将保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息关联对应的结构化标识;
生成单元,用于根据保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息及其各自关联的结构化标识,生成结构化数据表;
提取单元,用于从保单号信息中提取保单号,从投保人信息中提取投保人身份证号,并提取保单号的后六位数字作为流水编号,提取投保人身份证号的前六位数字作为区划编号;
调取单元,用于采用设定的计算方式对流水编号进行计算,得到规则号和算法号,并根据规则号从规则库中调取对应的数据编排规则,根据算法号从算法库中调取对应的加密算法,所述规则库中预存有若干数据编排规则,各数据编排规则均关联有相应的规则号,所述算法库中预存有若干加密算法,各加密算法均关联有相应的算法号;
组合单元,用于根据数据编排规则分别对保单号和投保人身份证号进行数据编排处理,得到第一字符串和第二字符串,并将第一字符串与第二字符串组合,形成加密密钥;
加密单元,用于根据加密密钥以及调取的加密算法对结构化数据表进行加密处理,得到保单数据加密包;
存档单元,用于根据区划编号将保单数据加密包存入数据库中对应的存档单元,所述数据库中设有若干存档单元,各存档单元分别关联相应的区划编号。
第三方面,提供一种保单数据管理设备,包括:
存储器,用于存储指令;
处理器,用于读取所述存储器中存储的指令,并根据指令执行上述第一方面中任意一种所述的方法。
第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,当所述指令在计算机上运行时,使得所述计算机执行第一方面中任意一种所述的方法。同时,还提供一种包含指令的计算机程序产品,当所述指令在计算机上运行时,使所述计算机执行第一方面中任意一种所述的方法。
有益效果:本发明通过OCR文字识别技术对电子保单进行内容识别,得到保单数据内容,将保单数据内容的各项信息关联相应的结构化标识生成结构化数据表,然后从保单号提取流水编号来确定相应编排规则和加密算法,依据编排规则利用保单号和投保人身份证号编排出加密密钥,再利用加密密钥和加密算法对结构化数据表进行加密处理,得到保单数据加密包来存入数据库相应存档单元,可以高效率、智能化地实现电子保单数据的自动提取和结构化存档管理。本发明可以替代传统人工录入保单数据的方式,提升保单数据的管理效率和质量,减少人力成本,且利用保单号和投保人身份证号来进行保单数据的加密处理和分区存档,能有效提升保单数据管理的安全性和规范性,便于后续进行保单数据的高效解密处理和溯源查询。本发明可适用于保单数据的归档、登记、托管、跨系统传输等场景,可驱动保单业务管理的智能化发展。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中方法的步骤示意图;
图2为本发明实施例中系统的构成示意图;
图3为本发明实施例中设备的构成示意图。
具体实施方式
在此需要说明的是,对于这些实施例方式的说明用于帮助理解本发明,但并不构成对本发明的限定。本文公开的特定结构和功能细节仅用于描述本发明的示例实施例。然而,可用很多备选的形式来体现本发明,并且不应当理解为本发明限制在本文阐述的实施例中。
应当理解,除非另有明确的规定和限定,术语“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在实施例中的具体含义。
在下面的描述中提供了特定的细节,以便于对示例实施例的完全理解。然而,本领域普通技术人员应当理解可以在没有这些特定细节的情况下实现示例实施例。例如可以在框图中示出系统,以避免用不必要的细节来使得示例不清楚。在其他实施例中,可以不以非必要的细节来示出众所周知的过程、结构和技术,以避免使得实施例不清楚。
实施例1:
本实施例提供一种保单数据管理方法,可应用于相应的保单数据管理服务器,如图1所示,方法包括以下步骤:
S1.获取目标电子保单。
具体实施时,服务器可从相应的信息前端获取目标电子保单,所述目标电子保单可为图像形式的保单。
S2.对目标电子保单进行OCR文字识别,得到目标电子保单的保单数据内容,所述保单数据内容包括保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息。
具体实施时,在获取到目标电子保单后,可对目标电子保单进行OCR文字识别,得到目标电子保单的保单数据内容,OCR文字识别处理过程包括:先依次对目标电子保单进行二值化处理、噪声去除处理和倾斜较正处理,得到预处理图像。然后采用Faster RCNN算法对预处理图像进行文本检测,得到文本检测结果,Faster RCNN算法设计有区域生成网络,即RPN(Region Proposal Networks)网络,整个算法结构分为两个部分,先由RPN网络判断候选框是否为目标,再经分类定位的多任务损失判断目标类型,二者共享卷积神经网络提取的特征信息,快速生成有效候选框,降低计算成本又同时保证检测精度。最后采用CRNN算法对文本检测结果进行文本识别,并提取出目标电子保单的保单数据内容;CRNN(Convolutional Recurrent Neural Network)是一种卷积循环神经网络结构,主要用于端到端地对不定长的文本序列进行识别,不用先对单个文字进行切割,而是将文本识别转化为时序依赖的序列学习问题,就是基于图像的序列识别;CRNN可识别较长的文本序列,包含CNN(卷积神经网络)特征提取层和BLSTM(双向长短期记忆网络)序列特征提取层,其利用BLSTM和CTC(Connectionist Temporal Classification)部件学习字符图像中的上下文关系,从而有效提升文本识别的准确率;在预测过程中,CRNN先使用CNN网络提取图像特征向量,利用BLSTM将特征向量融合以提取字符系列的上下文特征,然后得到每序列特征的概率分布,最后通过转录层(CTC rule)进行预测得到相应的文本序列。
最终识别出的保单数据内容包括保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息等,保单号信息即对应的保单号或保险合同号,保险起止时间信息包括保险起始时间和保险截止时间,保险业务类型信息包括车险、寿险或商业险等,保险公司信息包括保险公司的名称、代码等,投保人信息包括投保人的姓名、身份证号和手机号等,受益人信息包括受益人的姓名、身份证号和手机号等,险种信息包括险种名称、保费和保额等。
S3.分别将保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息关联对应的结构化标识。
具体实施时,在识别得到保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息后,服务器可分别将保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息关联对应的结构化标识,包括:将保单号信息关联保单号标识,将保险起止时间信息关联保险时间标识,将保险业务类型信息关联业务类型标识,将保险公司信息关联保险公司标识,将投保人信息关联投保人标识,将受益人信息关联受益人标识,将险种信息关联险种标识。所述保单号标识可以为文字“保单号”,也可以为设定的唯一编号,如“A”;所述保险时间标识可以为文字“保险时间”,也可以为设定的唯一编号,如“B”;所述业务类型标识可以为文字“业务类型”,也可以为设定的唯一编号,如“C”;所述保险公司标识可以为文字“保险公司”,也可以为设定的唯一编号,如“D”;所述投保人标识可以为文字“投保人”,也可以为设定的唯一编号,如“E”;所述受益人标识可以为文字“受益人”,也可以为设定的唯一编号,如“F”;所述险种标识可以为文字“险种”,也可以为设定的唯一编号,如“G”;各标识同步采用文字标识或者编号标识,具体可根据实际情况选取。
S4.根据保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息及其各自关联的结构化标识,生成结构化数据表。
具体实施时,服务器生成的结构化数据表二维数据表,结构化数据表中包含纵向排列的保单号标识、保险时间标识、业务类型标识、保险公司标识、投保人标识、受益人标识和险种标识,且在保单号标识侧面横向罗列保单号信息,在保险时间标识侧面横向罗列保险起止时间信息,在业务类型标识侧面横向罗列保险业务类型信息,在保险公司标识侧面横向罗列保险公司信息,在投保人标识侧面横向罗列投保人信息,在受益人标识侧面横向罗列受益人信息,在险种标识侧面横向罗列险种信息,示例性地,结构化数据表可如下表一所示:
表一 结构化数据表
其中,第一列为纵向排列的各标识,第二列即为各标识对应的保单数据内容。
S5.从保单号信息中提取保单号,从投保人信息中提取投保人身份证号,并提取保单号的后六位数字作为流水编号,提取投保人身份证号的前六位数字作为区划编号。
具体实施时,服务器可从保单号信息中提取保单号,从投保人信息中提取投保人身份证号,并将保单号的后六位数字提取出来作为流水编号,将投保人身份证号的前六位数字提取出来作为区划编号。
S6.采用设定的计算方式对流水编号进行计算,得到规则号和算法号,并根据规则号从规则库中调取对应的数据编排规则,根据算法号从算法库中调取对应的加密算法,所述规则库中预存有若干数据编排规则,各数据编排规则均关联有相应的规则号,所述算法库中预存有若干加密算法,各加密算法均关联有相应的算法号。
具体实施时,在得到流水编号后,可提取流水编号的前三位数作为第一数组,提取流水编号的后三位数作为第二数组;然后将第一数组中的各位数迭代相加求和,得到一位数的规则号,将第二数组中的各位数迭代相加求和,得到一位数的算法号,示例性地,如第一数组为123,则各位数相加等于6,规则号即为6,如第一数组为678,则各位数相加等于21,此时再将两位数21的2和1迭代相加,得到3,规则号即为3,以此类推,第二数组的计算方式与第一数组相同。
在计算得到规则号和算法号后,根据规则号从规则库中调取对应的数据编排规则,根据算法号从算法库中调取对应的加密算法,所述规则库中预存有若干数据编排规则,各数据编排规则均关联有相应的规则号,所述算法库中预存有若干加密算法,如AES、RC4、DES、3DES、RC5、RC6等加密算法,各加密算法均关联有相应的算法号。
在此之前,需要预先在规则库中存储若干编辑好的数据编排规则,在算法库中存储若干编辑好的加密算法,过程包括:获取第一编辑指令和第二编辑指令;然后根据第一编辑指令编辑构建各数据编排规则,并将构建好的各数据编排规则关联相应的规则号,根据第二编辑指令编辑构建各加密算法,并将构建好的各加密算法关联相应的算法号;最后将关联相应规则号的各数据编排规则存入规则库中,将关联相应算法号的各加密算法存入算法库中。
S7.根据数据编排规则分别对保单号和投保人身份证号进行数据编排处理,得到第一字符串和第二字符串,并将第一字符串与第二字符串组合,形成加密密钥。
具体实施时,在调取出相应的数据编排规则后,服务器根据数据编排规则分别对保单号和投保人身份证号进行数据编排处理,包括分别对保单号和投保人身份证号进行相应数据移位、数据剔除和/或数据编码转换处理,得到第一字符串和第二字符串,所述第一字符串和第二字符串的字符数量相同,总位数相同。然后再将第一字符串与第二字符串交叉组合,形成加密密钥,使加密密钥中的奇数位字符来源于第一字符串,加密密钥中的偶数位字符来源于第二字符串。
S8.根据加密密钥以及调取的加密算法对结构化数据表进行加密处理,得到保单数据加密包。
具体实施时,在确定好相应的加密算法并得到加密密钥后,服务器即可根据加密算法及加密密钥对结构化数据表进行加密处理,得到保单数据加密包。
S9.根据区划编号将保单数据加密包存入数据库中对应的存档单元,所述数据库中设有若干存档单元,各存档单元分别关联相应的区划编号。
具体实施时,在得到保单数据加密包后,服务器即可根据区划编号将保单数据加密包存入数据库中对应的存档单元,所述数据库中设有若干存档单元,各存档单元分别关联相应的区划编号。
通过本实施例方法可以替代传统人工录入保单数据的方式,提升保单数据的管理效率和质量,减少人力成本,且能有效提升保单数据管理的安全性和规范性,便于后续进行保单数据的高效解密处理和溯源查询。本实施例方法可适用于保单数据的归档、登记、托管、跨系统传输等场景,可驱动保单业务管理的智能化发展。
实施例2:
本实施例提供一种保单数据管理系统,如图2所示,包括获取单元、识别单元、标识单元、生成单元、提取单元、调取单元、组合单元、加密单元和存档单元,其中:
获取单元,用于获取目标电子保单;
识别单元,用于对目标电子保单进行OCR文字识别,得到目标电子保单的保单数据内容,所述保单数据内容包括保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息;
标识单元,用于分别将保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息关联对应的结构化标识;
生成单元,用于根据保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息及其各自关联的结构化标识,生成结构化数据表;
提取单元,用于从保单号信息中提取保单号,从投保人信息中提取投保人身份证号,并提取保单号的后六位数字作为流水编号,提取投保人身份证号的前六位数字作为区划编号;
调取单元,用于采用设定的计算方式对流水编号进行计算,得到规则号和算法号,并根据规则号从规则库中调取对应的数据编排规则,根据算法号从算法库中调取对应的加密算法,所述规则库中预存有若干数据编排规则,各数据编排规则均关联有相应的规则号,所述算法库中预存有若干加密算法,各加密算法均关联有相应的算法号;
组合单元,用于根据数据编排规则分别对保单号和投保人身份证号进行数据编排处理,得到第一字符串和第二字符串,并将第一字符串与第二字符串组合,形成加密密钥;
加密单元,用于根据加密密钥以及调取的加密算法对结构化数据表进行加密处理,得到保单数据加密包;
存档单元,用于根据区划编号将保单数据加密包存入数据库中对应的存档单元,所述数据库中设有若干存档单元,各存档单元分别关联相应的区划编号。
实施例3:
本实施例提供一种保单数据管理设备,如图3所示,在硬件层面,包括:
数据接口,用于建立处理器与相应数据端的数据对接;
存储器,用于存储指令;
处理器,用于读取所述存储器中存储的指令,并根据指令执行实施例1中的保单数据管理方法。
可选地,该设备还包括内部总线。处理器与存储器和数据接口可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(Extended Industry Standard Architecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。
所述存储器可以但不限于包括随机存取存储器(Random Access Memory,RAM)、只读存储器(Read Only Memory,ROM)、闪存(Flash Memory)、先进先出存储器(First InputFirst Output,FIFO)和/或先进后出存储器(First In Last Out,FILO)等。所述处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
实施例4:
本实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,当所述指令在计算机上运行时,使得所述计算机执行实施例1中的保单数据管理方法。其中,所述计算机可读存储介质是指存储数据的载体,可以但不限于包括软盘、光盘、硬盘、闪存、优盘和/或记忆棒(Memory Stick)等,所述计算机可以是通用计算机、专用计算机、计算机网络或者其他可编程系统。
本实施例还提供一种包含指令的计算机程序产品,当所述指令在计算机上运行时,使所述计算机执行实施例1中的保单数据管理方法。其中,所述计算机可以是通用计算机、专用计算机、计算机网络或者其他可编程系统。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种保单数据管理方法,其特征在于,包括:
获取目标电子保单;
对目标电子保单进行OCR文字识别,得到目标电子保单的保单数据内容,所述保单数据内容包括保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息;
分别将保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息关联对应的结构化标识;
根据保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息及其各自关联的结构化标识,生成结构化数据表;
从保单号信息中提取保单号,从投保人信息中提取投保人身份证号,并提取保单号的后六位数字作为流水编号,提取投保人身份证号的前六位数字作为区划编号;
提取流水编号的前三位数作为第一数组,提取流水编号的后三位数作为第二数组,将第一数组中的各位数迭代相加求和,得到一位数的规则号,将第二数组中的各位数迭代相加求和,得到一位数的算法号,并根据规则号从规则库中调取对应的数据编排规则,根据算法号从算法库中调取对应的加密算法,所述规则库中预存有若干数据编排规则,各数据编排规则均关联有相应的规则号,所述算法库中预存有若干加密算法,各加密算法均关联有相应的算法号;
根据数据编排规则分别对保单号和投保人身份证号进行数据编排处理,得到第一字符串和第二字符串,并将第一字符串与第二字符串组合,形成加密密钥;
根据加密密钥以及调取的加密算法对结构化数据表进行加密处理,得到保单数据加密包;
根据区划编号将保单数据加密包存入数据库中对应的存档单元,所述数据库中设有若干存档单元,各存档单元分别关联相应的区划编号。
2.根据权利要求1所述的一种保单数据管理方法,其特征在于,所述对目标电子保单进行OCR文字识别,得到目标电子保单的保单数据内容,包括:
依次对目标电子保单进行二值化处理、噪声去除处理和倾斜较正处理,得到预处理图像;
采用Faster RCNN算法对预处理图像进行文本检测,得到文本检测结果;
采用CRNN算法对文本检测结果进行文本识别,并提取出目标电子保单的保单数据内容。
3.根据权利要求1所述的一种保单数据管理方法,其特征在于,所述分别将保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息关联对应的结构化标识,包括:将保单号信息关联保单号标识,将保险起止时间信息关联保险时间标识,将保险业务类型信息关联业务类型标识,将保险公司信息关联保险公司标识,将投保人信息关联投保人标识,将受益人信息关联受益人标识,将险种信息关联险种标识。
4.根据权利要求3所述的一种保单数据管理方法,其特征在于,所述结构化数据表为二维数据表,结构化数据表中包含纵向排列的保单号标识、保险时间标识、业务类型标识、保险公司标识、投保人标识、受益人标识和险种标识,且在保单号标识侧面横向罗列保单号信息,在保险时间标识侧面横向罗列保险起止时间信息,在业务类型标识侧面横向罗列保险业务类型信息,在保险公司标识侧面横向罗列保险公司信息,在投保人标识侧面横向罗列投保人信息,在受益人标识侧面横向罗列受益人信息,在险种标识侧面横向罗列险种信息。
5.根据权利要求1所述的一种保单数据管理方法,其特征在于,在根据规则号从规则库中调取对应的数据编排规则,根据算法号从算法库中调取对应的加密算法前,所述方法还包括:
获取第一编辑指令和第二编辑指令;
根据第一编辑指令编辑构建各数据编排规则,并将构建好的各数据编排规则关联相应的规则号,根据第二编辑指令编辑构建各加密算法,并将构建好的各加密算法关联相应的算法号;
将关联相应规则号的各数据编排规则存入规则库中,将关联相应算法号的各加密算法存入算法库中。
6.根据权利要求1所述的一种保单数据管理方法,其特征在于,所述将第一字符串与第二字符串组合,形成加密密钥,包括:
将第一字符串与第二字符串交叉组合,形成加密密钥,使加密密钥中的奇数位字符来源于第一字符串,加密密钥中的偶数位字符来源于第二字符串。
7.一种保单数据管理系统,其特征在于,包括获取单元、识别单元、标识单元、生成单元、提取单元、调取单元、组合单元、加密单元和存档单元,其中:
获取单元,用于获取目标电子保单;
识别单元,用于对目标电子保单进行OCR文字识别,得到目标电子保单的保单数据内容,所述保单数据内容包括保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息;
标识单元,用于分别将保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息关联对应的结构化标识;
生成单元,用于根据保单号信息、保险起止时间信息、保险业务类型信息、保险公司信息、投保人信息、受益人信息和险种信息及其各自关联的结构化标识,生成结构化数据表;
提取单元,用于从保单号信息中提取保单号,从投保人信息中提取投保人身份证号,并提取保单号的后六位数字作为流水编号,提取投保人身份证号的前六位数字作为区划编号;
调取单元,用于提取流水编号的前三位数作为第一数组,提取流水编号的后三位数作为第二数组,将第一数组中的各位数迭代相加求和,得到一位数的规则号,将第二数组中的各位数迭代相加求和,得到一位数的算法号,并根据规则号从规则库中调取对应的数据编排规则,根据算法号从算法库中调取对应的加密算法,所述规则库中预存有若干数据编排规则,各数据编排规则均关联有相应的规则号,所述算法库中预存有若干加密算法,各加密算法均关联有相应的算法号;
组合单元,用于根据数据编排规则分别对保单号和投保人身份证号进行数据编排处理,得到第一字符串和第二字符串,并将第一字符串与第二字符串组合,形成加密密钥;
加密单元,用于根据加密密钥以及调取的加密算法对结构化数据表进行加密处理,得到保单数据加密包;
存档单元,用于根据区划编号将保单数据加密包存入数据库中对应的存档单元,所述数据库中设有若干存档单元,各存档单元分别关联相应的区划编号。
8.一种保单数据管理设备,其特征在于,包括:
存储器,用于存储指令;
处理器,用于读取所述存储器中存储的指令,并根据指令执行权利要求1-6任意一项所述的保单数据管理方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有指令,当所述指令在计算机上运行时,使得所述计算机执行权利要求1-6任意一项所述的保单数据管理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310816034.7A CN116523478B (zh) | 2023-07-05 | 2023-07-05 | 一种保单数据管理方法、系统、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310816034.7A CN116523478B (zh) | 2023-07-05 | 2023-07-05 | 一种保单数据管理方法、系统、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116523478A CN116523478A (zh) | 2023-08-01 |
CN116523478B true CN116523478B (zh) | 2023-09-01 |
Family
ID=87392613
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310816034.7A Active CN116523478B (zh) | 2023-07-05 | 2023-07-05 | 一种保单数据管理方法、系统、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116523478B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106104572A (zh) * | 2014-03-19 | 2016-11-09 | 柯法克斯公司 | 用于识别文档处理和业务工作流整合的系统和方法 |
CN110070448A (zh) * | 2019-03-08 | 2019-07-30 | 阿里巴巴集团控股有限公司 | 一种电子保单的处理方法及服务器 |
CN114138781A (zh) * | 2021-11-29 | 2022-03-04 | 中国平安财产保险股份有限公司 | 保单数据更新方法、装置、计算机设备及可读存储介质 |
CN114757789A (zh) * | 2022-04-06 | 2022-07-15 | 浙江数秦科技有限公司 | 基于区块链的保险理赔系统 |
CN115222544A (zh) * | 2022-06-24 | 2022-10-21 | 中银金融科技有限公司 | 保险认证信息的获取方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8933889B2 (en) * | 2005-07-29 | 2015-01-13 | Nokia Corporation | Method and device for augmented reality message hiding and revealing |
JP7065498B2 (ja) * | 2018-02-03 | 2022-05-12 | アレグロスマート株式会社 | データオーケストレーションプラットフォーム管理 |
-
2023
- 2023-07-05 CN CN202310816034.7A patent/CN116523478B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106104572A (zh) * | 2014-03-19 | 2016-11-09 | 柯法克斯公司 | 用于识别文档处理和业务工作流整合的系统和方法 |
CN110070448A (zh) * | 2019-03-08 | 2019-07-30 | 阿里巴巴集团控股有限公司 | 一种电子保单的处理方法及服务器 |
CN114138781A (zh) * | 2021-11-29 | 2022-03-04 | 中国平安财产保险股份有限公司 | 保单数据更新方法、装置、计算机设备及可读存储介质 |
CN114757789A (zh) * | 2022-04-06 | 2022-07-15 | 浙江数秦科技有限公司 | 基于区块链的保险理赔系统 |
CN115222544A (zh) * | 2022-06-24 | 2022-10-21 | 中银金融科技有限公司 | 保险认证信息的获取方法及装置 |
Non-Patent Citations (1)
Title |
---|
基于混合式结构的保险业客户管理系统设计;汪旭;;电脑知识与技术(第28期);27-29 * |
Also Published As
Publication number | Publication date |
---|---|
CN116523478A (zh) | 2023-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107835496B (zh) | 一种垃圾短信的识别方法、装置和服务器 | |
CN112199375A (zh) | 跨模态的数据处理方法、装置、存储介质以及电子装置 | |
CN107025239B (zh) | 敏感词过滤的方法和装置 | |
CN110737818B (zh) | 网络发布数据处理方法、装置、计算机设备和存储介质 | |
CN111723943B (zh) | 一种基于多标签的联邦学习方法、装置和系统 | |
CN110929125A (zh) | 搜索召回方法、装置、设备及其存储介质 | |
CN113918993A (zh) | 一种基于人工智能的用户隐私保护方法及系统 | |
CN113094742A (zh) | 数据脱敏方法、数据脱敏装置、电子设备及存储介质 | |
CN111177421A (zh) | 一种面向数字人文的电子邮件历史事件轴生成方法及装置 | |
CN116523478B (zh) | 一种保单数据管理方法、系统、设备及存储介质 | |
CN113449816A (zh) | 网址分类模型训练、网址分类方法、装置、设备及介质 | |
CN116055067B (zh) | 一种弱口令检测的方法、装置、电子设备及介质 | |
CN109510904B (zh) | 呼叫中心外呼录音的检测方法及系统 | |
CN110705258A (zh) | 文本实体识别方法及装置 | |
CN115620039A (zh) | 一种图像标注方法、装置、设备、介质和程序产品 | |
CN113688240A (zh) | 威胁要素提取方法、装置、设备及存储介质 | |
CN114398887A (zh) | 一种文本分类方法、装置及电子设备 | |
CN115883111A (zh) | 一种钓鱼网站识别方法、装置、电子设备及存储介质 | |
CN114338058A (zh) | 一种信息处理方法、装置和存储介质 | |
CN114268480B (zh) | 图片传输的监控方法及装置、存储介质、终端 | |
CN106649427B (zh) | 一种信息识别的方法及装置 | |
CN113518118B (zh) | 基于物联网安全服务的信息处理方法及系统 | |
CN116775889B (zh) | 基于自然语言处理的威胁情报自动提取方法、系统、设备和存储介质 | |
CN115759038B (zh) | 法律诉讼案由识别方法及装置 | |
CN116542787A (zh) | 一种保险业务信息查询方法、系统、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |