CN112150298B - 数据处理方法、系统、设备及可读介质 - Google Patents

数据处理方法、系统、设备及可读介质 Download PDF

Info

Publication number
CN112150298B
CN112150298B CN202011045135.1A CN202011045135A CN112150298B CN 112150298 B CN112150298 B CN 112150298B CN 202011045135 A CN202011045135 A CN 202011045135A CN 112150298 B CN112150298 B CN 112150298B
Authority
CN
China
Prior art keywords
data
underwriting
model
user
disease
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011045135.1A
Other languages
English (en)
Other versions
CN112150298A (zh
Inventor
戚桂凤
陶军
程君华
来源
刘研
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ccb Life Insurance Co ltd
Original Assignee
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CCB Finetech Co Ltd filed Critical CCB Finetech Co Ltd
Priority to CN202011045135.1A priority Critical patent/CN112150298B/zh
Publication of CN112150298A publication Critical patent/CN112150298A/zh
Application granted granted Critical
Publication of CN112150298B publication Critical patent/CN112150298B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/20ICT specially adapted for the handling or processing of patient-related medical or healthcare data for electronic clinical trials or questionnaires
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Finance (AREA)
  • Artificial Intelligence (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Primary Health Care (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明提供了一种数据处理方法、系统、设备及可读介质,所述方法包括通过交互式健康问卷获取用户的健康数据;对用户的证明文件进行信息提取得到证明文件数据;根据用户的历史投保信息、健康数据、证明文件数据和知识库数据形成基础数据,将基础数据输入预设的核保风险模型对用户风险进行检测得到检测结果并反馈给管理人员,本发明可对客户风险进行智能检测,提高客户风险检测的准确度。

Description

数据处理方法、系统、设备及可读介质
技术领域
本发明涉及数据处理技术领域,尤其涉及一种数据处理方法、系统、设备及可读介质。
背景技术
目前,保险公司核心业务系统中的自动核保规则管理不够合理,对投保人的风险校验效率低。并且规则多以代码形式体现,改动难度大,周期长,不利于灵活化配置。同时,现有自动核保流程也不尽合理,网销等自助渠道客户自动核保不通过直接拒保,客户没有选择的权利,只能通过代理人完成投保,费时费力,降低客户体验。
发明内容
本发明的一个目的在于提供一种数据处理方法,对客户风险进行智能检测,提高客户风险检测的准确度。本发明的另一个目的在于提供一种数据处理系统。本发明的再一个目的在于提供一种计算机设备。本发明的还一个目的在于提供一种可读介质。
为了达到以上目的,本发明一方面公开了一种数据处理方法,包括:
通过交互式健康问卷获取用户的健康数据;
对用户的证明文件进行信息提取得到证明文件数据;
根据用户的历史投保信息、健康数据、证明文件数据和知识库数据形成基础数据,将基础数据输入预设的核保风险模型对用户风险进行检测得到检测结果并反馈给管理人员。
优选的,所述通过交互式健康问卷获取用户的健康数据具体包括:
向用户展示交互式健康问卷,接收用户基于交互式健康问卷输入的健康告知信息;
若所述健康告知信息包括预设的疾病,向用户展示与所述疾病对应的疾病问卷以接收用户输入的疾病信息;
根据所述健康告知信息和所述疾病信息形成所述健康数据。
优选的,所述对用户的证明文件进行信息提取得到证明文件数据具体包括:
对用户的证明文件通过OCR识别技术进行旋转校正、倾斜校正、表与文字框检测、文字识别和AI纠错得到识别图像;
对识别图像进行图像去噪、文字排版处理和表格的处理识别得到文字信息;
对所述文字信息进行实体要素抽取得到证明文件数据。
优选的,所述基础数据包括客户信息表、被保人体检记录、被保人体检详情表、被保人病史记录、被保人家庭成员病史记录、理赔记录、投保记录、核保记录、保险产品表、医疗机构表、疾病库、疾病分类表、疾病信息表和疾病因果关系表。
优选的,进一步包括预先构建所述核保风险模型的步骤。
优选的,所述构建所述核保风险模型具体包括:
对历史用户对应的数据进行处理得到历史基础数据;
对历史用户的风险类型进行人工标记;
将历史基础数据和对应的风险类型输入机器学习模型中对模型进行训练得到所述核保风险模型。
优选的,进一步包括:
对基础数据进行实体和关系提取;
将实体与关系进行关联形成核保知识模型;
对所述核保知识模型的实体进行整合分析构建核保知识图谱。
优选的,对所述核保知识模型进行实体整合分析构建核保知识图谱具体包括:
通过实体消歧、实体链接和知识合并对核保知识模型的实体进行整合分析以构建核保知识图谱。
本发明还公开了一种数据处理系统,包括:
用户交互模块,用于通过交互式健康问卷获取用户的健康数据;
文件获取模块,用于对用户的证明文件进行信息提取得到证明文件数据;
风险检测模块,用于根据用户的历史投保信息、健康数据、证明文件数据和知识库数据形成基础数据,将基础数据输入预设的核保风险模型对用户风险进行检测得到检测结果并反馈给管理人员。
优选的,所述用户交互模块具体用于向用户展示交互式健康问卷,接收用户基于交互式健康问卷输入的健康告知信息;若所述健康告知信息包括预设的疾病,向用户展示与所述疾病对应的疾病问卷以接收用户输入的疾病信息;根据所述健康告知信息和所述疾病信息形成所述健康数据。
优选的,所述文件获取模块具体用于对用户的证明文件通过OCR识别技术进行旋转校正、倾斜校正、表与文字框检测、文字识别和AI纠错得到识别图像;对识别图像进行图像去噪、文字排版处理和表格的处理识别得到文字信息;对所述文字信息进行实体要素抽取得到证明文件数据。
优选的,所述基础数据包括客户信息表、被保人体检记录、被保人体检详情表、被保人病史记录、被保人家庭成员病史记录、理赔记录、投保记录、核保记录、保险产品表、医疗机构表、疾病库、疾病分类表、疾病信息表和疾病因果关系表。
优选的,进一步包括模型构建模块,用于预先构建所述核保风险模型。
优选的,所述模型构建模块具体用于对历史用户对应的数据进行处理得到历史基础数据;对历史用户的风险类型进行人工标记;将历史基础数据和对应的风险类型输入机器学习模型中对模型进行训练得到所述核保风险模型。
优选的于,进一步包括知识图谱构建模块,用于对基础数据进行实体和关系提取;将实体与关系进行关联形成核保知识模型;对所述核保知识模型的实体进行整合分析构建核保知识图谱。
本发明还公开了一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,
所述处理器执行所述程序时实现如上所述方法。
本发明还公开了一种计算机可读介质,其上存储有计算机程序,
该程序被处理器执行时实现如上所述方法。
本发明通过交互式健康问卷、用户的证明文件得到用户的健康数据和证明文件数据。进一步根据用户的历史投保信息和知识库数据形成基础数据,并通过核保风险模型对用户信息进行检测,检测用户是否存在虚假信息等风险,得到用户的智能化核保结论,为人工核保提供核保建议。本发明综合多方面信息对用户对风险进行智能检测,提高客户风险检测的准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本发明数据处理方法一个具体实施例的流程图;
图2示出本发明数据处理方法一个具体实施例S100的流程图;
图3示出本发明数据处理方法一个具体实施例交互式健康问卷的示意图;
图4示出本发明数据处理方法一个具体实施例疾病问卷的示意图;
图5示出本发明数据处理方法一个具体实施例S200的流程图;
图6示出本发明数据处理方法一个具体实施例收入证明的示意图;
图7示出本发明数据处理方法一个具体实施例S000的流程图;
图8示出本发明数据处理方法一个具体实施例S400的流程图;
图9示出本发明数据处理系统一个具体实施例的结构图;
图10示出本发明数据处理系统一个具体实施例包括模型构建模块的结构图;
图11示出本发明数据处理系统一个具体实施例包括知识图谱构建模块的结构图;
图12示出适于用来实现本发明实施例的计算机设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
传统的保险行业,在核保过程中,大多是通过已配置在系统中的核保规则对用户风险进行校验和检测。例如,现有技术中,基于已配置的核保规则,前端进件系统将投保数据提交至核心系统后,核心系统结合数据库中客户历史保单、理赔、保全数据,通过规则引擎或数据库中的核保规则进行规则校验,确定投保数据对应的客户是否存在健康或财产的风险。现有核保流程中,自动核保功能仅可识别出投保申请中的风险,无法给出实际结论,核保结论更多依赖于审核人员的经验。自核结论较为单一,大多非标准体的自核结论仅告知违反哪些规则,无法为人工核保提供更多帮助与提示。核保流程简单粗暴,网销渠道如自动核保不通过,直接拒保,影响客户体验,降低客户黏性。
由此,现有的客户风险检测所用的核保规则大多为通用规则,并未针对特殊场景、客户等维度进行特殊处理,且自动核保结论仅仅告知已配置的返回话术,无法为人工核保提供更多帮助,大部分专业化的核保结论仍旧主要依靠人工借助线下手段和既往经验进行主观判断。同时在线上化投保过程中,出现客户不完全符合健康告知的场景时,因没有有效的后续处理手段,导致通常的处理方式为一刀切式的拒保,极易影响客户体验,造成客户流失。基于此,本发明通过构建风险数据库和核保知识图谱智能核保决策模型,借用交互式健康问卷和ICR(AI+OCR)图像识别技术,综合多方面数据对客户风险进行智能评估,给出核保建议。
在本发明的一个或多个实施方式中,核保又称为风险选择,是对投保的保险标的或被保险人的风险程度进行评估与分类,并作出是否承保,适用何种费率或采取什么限制措施的决定。核保工作的目的在于辨别投保风险的优劣,从而保证业务质量,保证保险公司的稳健经营。
在本发明的一个或多个实施方式中,光学字符识别(OCR)是指针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。
在本发明的一个或多个实施方式中,智能字符识别(ICR)是在OCR的基础上,植入了计算机深度学习的人工智能技术。提升识别精度;采用基于NLP等AI技术的纠错模型及领域词典,对于OCR未识别的字符进行字符信息补全,解决OCR技术缺陷。
在本发明的一个或多个实施方式中,智能核保是指保险公司通过人工智能技术赋能核保系统,问卷流程及其它渠道对投保人的信息进行采集,形成个人健康数据库及个人健康知识图谱,结合多源数据分析及数据核保模型,输出影响核保结论的风险因子,然后得出客户风险评估结果。
在本发明的一个或多个实施方式中,知识图谱是指将实体、关系进行抓取,分析,关联,融合后形成的可视化知识结构。
在本发明的一个或多个实施方式中,交互式健康问卷是指部署在客户应用端的调查问卷,当客户存在健康告知时,可对应已配置好的疾病问卷库,指引客户填写问卷,从而获取客户健康信息。
在本发明的一个或多个实施方式中,智能核保风险模型是通过机器学习形成的模型,实现客户核保风险监测、固定场景下的业务辅助判别(次标准体的类别确定、具体类别下的核保标准建议)等一体化智能监测与甄别,对现有基于专家经验或基于规则的核保模型系统进行替代,甄别出可投被保人和不可投保人,以及可投保人中次标准体的投保条件,提高核保工作的效率。
根据本发明的一个方面,本实施例公开了一种数据处理方法。如图1所示,本实施例中,所述方法包括:
S100:通过交互式健康问卷获取用户的健康数据。
S200:对用户的证明文件进行信息提取得到证明文件数据。
S300:根据用户的历史投保信息、健康数据、证明文件数据和知识库数据形成基础数据,将基础数据输入预设的核保风险模型对用户风险进行检测得到检测结果并反馈给管理人员。
本发明通过交互式健康问卷、用户的证明文件得到用户的健康数据和证明文件数据。进一步根据用户的历史投保信息和知识库数据形成基础数据,并通过核保风险模型对用户信息进行检测,检测用户将来是否会出现投保项目对应的风险,得到用户的智能化核保结论,为人工核保提供核保建议。本发明综合多方面信息对用户对风险进行智能检测,提高客户风险检测的准确度。
在优选的实施方式中,如图2所示,所述S100通过交互式健康问卷获取用户的健康数据具体包括:
S110:向用户展示交互式健康问卷,接收用户基于交互式健康问卷输入的健康告知信息。
S120:若所述健康告知信息包括预设的疾病,向用户展示与所述疾病对应的疾病问卷以接收用户输入的疾病信息。
S130:根据所述健康告知信息和所述疾病信息形成所述健康数据。
具体的,交互式健康问卷的数据采集方式适用于电子渠道投保的场景,如图3和图4所示。在客户线上投保过程中,健康告知中如勾选了某一疾病,则系统根据已配置的疾病问卷库,展开详细的疾病问卷,并一步步引导客户完成健康告知,并在必要时可要求客户上传体检报告、健康证明、病例等资料,作为智能核保模型的输入数据。不同险种可配置差异化的交互式健康问卷,部分风险较低的险种亦可在客户完成交互式问卷后,形成初步的核保结论。这种处理方式可解决既往传统电子投保时“一刀切”拒保的核保结论,保留临界可保客户的正常投保诉求,增加客户粘性,提升客户体验。
在优选的实施方式中,如图5所示,所述S200对用户的证明文件进行信息提取得到证明文件数据具体包括:
S210:对用户的证明文件通过OCR识别技术进行旋转校正、倾斜校正、表与文字框检测、文字识别和AI纠错得到识别图像。
S220:对识别图像进行图像去噪、文字排版处理和表格的处理识别得到文字信息。
S230:对所述文字信息进行实体要素抽取得到证明文件数据。
具体的,非标准体客户投保时,保险公司可能会要求提供健康证明、体检报告、体检报告和收入证明等单据作为证明文件。在整个投保过程中,会有大量非结构化数据的录入工作。由此,可对视智能ICR数据提取的功能,在OCR的基础上,植入深度学习,通过旋转矫正、偏斜矫正等功能提升识别精度,采用基于NLP等AI技术,的纠错模型及领域词典,对于OCR未识别的字符进行字符信息补全,解决OCR技术缺陷。同时,通过人工智能NLP、CV、知识图谱等技术的应用,解决体检报告、收入证明等无固定格式的影像资料的业务要素智能提取的难题,使得影像结构化,数据资产增值。
在该优选的实施方式中,S210中OCR识别主要包括旋转校正、倾斜校正、表与文字框检测、文字识别和AI纠错等步骤。具体的,(1)旋转校正。作为证明文件的单据图片上传时可能会出现旋转的情况,此时就需要检测出图片是否是旋转的,为了保证文字的识别效果,需要将图片先进行旋转校正。(2)倾斜校正。单据上传的图片文字块可能会出现倾斜的情况,为了文字框检测、文字识别更加准确,需要在这之前对文字块进行倾斜校正。本方案对文字的方向进行识别,在得到文本的倾斜角度后,对图片进行倾斜校正。(3)表格与文字框检测。投保单、体检报告单、收入证明单据格式多样,本方案选用了对复杂单据文字框检测表现优异的深度学习模型进行检测,对密集表格内的文字检测率超过99.5%。(4)文字识别。将纸质单据中的文字信息准确识别并转换成电子版本文本。对于每次OCR识别的文字信息,提供本次识别的置信率。优选的,可采用对文字识别表现优异的识别模型,对文字内容进行识别。为提高投保单、体检报告、收入证明文字的识别准确率,可将客户提供的单据数据加入识别模型的训练集进行训练,提升识别模型识别水平。(5)融入AI纠错的OCR。在OCR的基础上,植入深度学习,提升识别精度。采用基于NLP等AI技术的纠错模型及领域词典,对于OCR未识别的字符进行字符信息补全,解决OCR技术缺陷。
在该优选的实施方式中,S220中对识别图像进行图像去噪、文字排版处理和表格的处理识别得到文字信息。具体的,图像去噪可包括对无关污渍进行剔除、对返底现象进行处理、表格错格的处理以及其他干扰因素的排除等步骤。在后期进行图像结构化的过程中,经过OCR识别过后的文档需要保持原有的位置关系以及文字特征,文字特征包括文字相对大小、文字颜色等。表格的处理识别可以正确的反应表格之间以及表格内部的位置与包含关系,尽可能的还原表格的真实面貌。
在该优选的实施方式中,对所述文字信息进行实体要素抽取得到的证明文件数据优选的为HTML文件格式。为保留原始图片的特征信息,可将抽取的实体要素的特征信息保存在html文件中。特征信息可包含文字框位置信息(左上角点坐标和文字框的宽高)、文字内容、文字置信度、文字高度和文字颜色等。
其中,实体要素抽取时,单据格式多样,在单据结构化时,需要对每类单据包含的业务要素进行实体定义,方便在单据要素抽取语义理解时的概念映射。例如,如图6所示的收入证明,要素实体可定义为如表1所示。
表1
实体名称 实体值
Staff 张三
Sex
IdNumber 123456789012230226
Job 财务
Total_income 8000.00
Wage_income 7000.00
Other_income 1000.00
在一个优选的实施方式中,可基于机器学习技术进行无固定模板要素抽取。例如,对业务涉及到的各类票据进行系统的研究分析,针对不同的票据制定不同的抽取策略,训练不同的抽取模型。机器学习模型没有抽取到的要素,可配置规则模型再次进行抽取。
在其他优选的实施方式中,当代的信息抽取AI方法通常基于计算机视觉角度或自然语言处理角度,或两者结合的的深度神经网络。大多数先前的方法由两个限制:依赖于一些人工标记的训练样本,然而没有充分探索使用大规模未标记的训练样本的可能性。其取决于预训练的CV模型与NLP模型,但没有考虑文本与布局信息的联合训练。因此需要研究如何自监督的预训练文本与布局将有助于信息抽取AI领域。
进一步的,通过要素抽取模型抽取后的结果,格式较多。为减少业务人员审核工作量,需对一些要素抽取后的结果进行标准化处理,例如,可进行标准化处理的要素可如表2所示。
表2
要素名 要素值 标准化后结果
日期 2020/4/1 20200401
金额 123323.2 123,323.20
在优选的实施方式中,如果通过抽取模型及规则模型存在未抽出的要素,或者存在抽取错误的情况,在核保人员检查的过程中,可以通过ICR联机的方式进行抽取,减少核保人员手动输入,即将需抽取的要素在图片上框中,便可直接进行抽取并且标准化。对从收入证明、投保单、体检报告中抽取的客户名称、保险产品名称、疾病名称等信息进行实体链接,完成链接的标记颜色,未链接上的标记另一种颜色,用以提升票据要素抽取的置信度。
在优选的实施方式中,所述基础数据包括客户信息表、被保人体检记录、被保人体检详情表、被保人病史记录、被保人家庭成员病史记录、理赔记录、投保记录、核保记录、保险产品表、医疗机构表、疾病库、疾病分类表、疾病信息表和疾病因果关系表。
可以理解的是,构建核保风险基础数据是建设智能核保模型的核心与根基,通过底层数据库以及库与库之间的关联,构建起企业级核保风险数据库原型,并形成智能核保风险模型的数据源。风险数据库中的基础数据可以表的形式存储,例如,基础数据包括客户信息表、被保人体检记录、被保人体检详情表、被保人病史记录、被保人家庭成员病史记录、理赔记录、投保记录、核保记录、保险产品表、医疗机构表、疾病库、疾病分类表、疾病信息表和疾病因果关系表。
其中,客户信息表可包括客户标识号、姓名、证件类型、证件号、性别、出生日期、国籍、居民类型、居住地、职业、工作单位、所属行业、联系电话和年收入金额等数据。被保人体检记录可包括体检报告标识号、被保险人姓名、身份证号、体检机构、体检日期、报告日期和报告结论等数据。被保人体检详情表可包括检查指标标识号、体检报告标识号、检查项、指标名、指标值和检查医师等数据。被保人病史记录可包括记录标识号、被保人、治疗日期、疾病、治疗机构和治疗方式等数据。被保人家庭成员病史记录可包括记录标识号、被保人、家庭关系、记录日期和病名等数据。理赔记录可包括理赔记录标识号、保单号、客户标识号、疾病、出险险种、理赔日期和理赔金额等数据。投保记录可包括投保记录标识号、投保单号、投保人、被保人、投保人与被保人社会关系、被保人体检报告识别号、投保险种、投保日期、投保金额和代理人等数据。核保记录可包括核保记录标识号、核保日期、投保单号、是否标体承保、加费比例、限额和责任免除项等数据。保险产品表可包括产品名称、产品编号、险种、高保额和产品政策等数据。医疗机构表可包括机构识别号、机构名称、机构类型和机构地址等数据。疾病分类表可包括疾病类型名和疾病上位分类等数据。疾病信息表可包括疾病识别号、疾病名称、疾病英文名、别名和疾病描述等数据。疾病因果关系表可包括疾病名称和病因等数据。
在优选的实施方式中,所述方法进一步包括预先构建所述核保风险模型的步骤。可以理解的是,当前的核保系统仍然是基于固定核保规则的。这些核保规则虽然能够帮助实现核保功能,但毕竟大多是根据历史数据总结出来的,过于依赖人工经验,难免疏漏,对于次标准体的准保附加条件,往往凭借专业人员的主观意识,缺乏直观的解释。除此之外,由于核保条件涉及投保人信息,财务状况以及个人身体健康状态,信息维度太大,给核保工作也带来了一定的挑战。
为了解决核保系统中所遇到的难题,本发明结合人工智能技术,以现有核保系统中的大数据资源和现有核保数据,构建人工智能核保模型,通过机器学习的模型,构建智能核保系统体系来解决传统业务专家在逐步审核过程中存在的核保周期过长、操作复杂度较高、人为主观性强等等痛点,实现客户核保风险监测、固定场景下的业务辅助判别(次标准体的类别确定、具体类别下的核保标准建议)等一体化智能监测与甄别,对现有基于专家经验或基于规则的核保模型系统进行替代,甄别出可投被保人和不可投被保人,以及可投被保人中次标准体的投保条件,提高核保工作的效率,减少人工成本,提高核保的准确性,降低投保风险。同时,与传统的核保标准相比,通过机器学习进行数据分析具有更强的稳定性和标准一致性。通过持续的学习,核保风险模型可以高效稳定地提高核保自动化能力,从而规避人员流动的风险。
在优选的实施方式中,如图7所示,所述S000具体可包括:
S010:对历史用户对应的数据进行处理得到历史基础数据。
S020:对历史用户的风险类型进行人工标记。其中,可以理解的是,风险类型可以可能存在大病风险、骗保风险和隐瞒病情风险等类型,在实际应用中,可根据业务实践确定不同的风险类型,本发明对此并不作限定。
S030:将历史基础数据和对应的风险类型输入机器学习模型中对模型进行训练得到所述核保风险模型。
可以理解的是,可通过对历史用户的风险类型进行人工标记,并根据相关历史基础数据进行机器学习建模,来实现新投保客户的健康风险评估,以此来提高核保人员的工作效率,降低投保风险,并通过不断学习来提升评估精度,使其不受核保专家的高流动性的影响。模型可输出所有风险等级的评分,得到对应的风险类别,还可输出决定性的风险因子。
在一个具体例子中,智能核保风险模型的构建过程主要包括数据准备、特征工程、模型构建三个环节。首先,将内部数据与外部数据整合(格式、字段统一、非结构化数据整理等等),再通过不同场景下的所需数据进行下一步获取。数据准备主要有以下要点:外部数据重构:针对类似医保数据、医院体检报告等外部信息进行结构化整合。内部数据:历史存量客户的相关信息表。场景下标签标注:客户的健康风险评级为模型的标签。
然后,特征工程包括数据预处理、特征衍生、特定场景业务补充、特征选择和形成特征库。其中,数据预处理对应用于特征工程的数据集进行数据格式统一(比如时间格式统一,码值格式统一等),数据呈现形式规范(标准接口形式制定等),必要时进行缺失数据补充,脏数据清理等。特征衍生是基于数据集进行的工程化的,生成更多具有明显统计意义的特征变量衍生过程。特定场景业务补充为业务方参与的,在通用特征变量集的基础上进行的,符合特定业务特点的业务特征构建过程。特征选择包括对生成的特征进行空值率分析、相关性分析和主成分分析。然后从特征集中发现出具有统计意义与业务可解释性意义,能够影响模型决策的特征子集,进行特征筛选的过程。形成特征库为形成用于人工智能核保的特征变量库。
模型构建包括模型选择和模型训练。其中,模型选择过程中,基于智能核保的监测模型(包括B模型:投保风险类别监测模型、C模型:固定场景下的投保策略模型),算法选型依据及标准如下:问题定位:投保风险类别监测、固定场景下的投保策略,可定位为基于有监督学习的多分类问题。数据集的规模及维度:针对不同数据集的规模及维度,挑选合适的机器学习算法。模型对计算性能的要求:针对核保场景对于模型性能的接受程度,选择合适的机器学习算法。模型的可解释性:针对核保场景对于模型可解释性的要求,选择合适的机器学习算法。模型成本:不同的机器学习模型开发、部署、维护成本不同,基于硬件配置、网络架构等环境要求选择合适的机器学习算法。模型算法选用当前较先进的几种机器学习算法,构建智能核保监测模型,通过模型训练、模型测试、模型验证的表现,最终确定应用于模型构建的机器学习算法。
模型训练包括数据划分、训练模型、数据测试、模型评估和模型封板或再训练。其中,数据划分包括根据不同应用场景将准备好的数据集,根据不同时段划分成两部。训练模型包括将训练集数据投入至已备选的多个模型中,通过模型总体效果进行模型选择,使用最优模型并通过网格搜索的形式选择最优模型参数进行自学习,通过多次迭代直至目标函数最优化。数据测试包括利用测试集数据,对已训练好的模型进行初步测试,使其在训练集与测试集上的效果相对契合,防止过拟合。模型评估需要使用验证集来验证需要对模型再次评测,查看模型在不同时段的效果,并进行稳定性评估,确保模型相对稳定。模型封板或再训练根据模型在训练集、测试集、验证集的效果,整体评估模型的效果与稳定性,最后决定是否重新训练或确定模型。
其中,模型评估可包括以下过程:获取某个时间节点的客户;通过已训练好的智能模型进行预测;获取智能模型的预测结果,契合场景目标,计算相关业务参数,并与现有传统规则模型的结果进行对比。其预期效果为:利用历史存在健康风险的客户建模,通过模型的训练、测试,评估,使其在准确率、AUC等指标上有显著的效果,并实现线上应用。输出相应结果的风险因子(特征判定评分)、风险评分、所属类别。
在优选的实施方式中,如图8所示,所述方法进一步包括S400:
S410:对基础数据进行实体和关系提取。其中,实体可以为从基础数据中提取的相关实体,如客户,代理人,国家,体检项目等。
S420:将实体与关系进行关联形成核保知识模型。
S430:对所述核保知识模型的实体进行整合分析构建核保知识图谱。
可以理解的是,构建核保知识图谱是建设智能核保模型的关键。核保知识图谱构建的核心理念是将基础数据中的客户信息、体检记录、病史、投保记录和理赔记录等与保险产品、医疗机构和疾病库等进行抓取整合,抽取出投保人,被保险人,受益人,健康指标,保险机构,疾病,保险产品等核保实体,以及亲属关系,投保关系,理赔关系,诊疗关系,体检关系等核保关系,进行核保知识建模,并将抽取出的实体和关系进行实体消歧,实体链接和知识合并,最终形成有关核保的知识图谱,呈现用户的健康风险及相关风险因子,辅助核保员合理评估投保风险。
在优选的实施方式中,对S430所述核保知识模型进行实体整合分析构建核保知识图谱具体包括:
S431:通过实体消歧、实体链接和知识合并对核保知识模型的实体进行整合分析以构建核保知识图谱。
本发明从核保规则梳理、风险模型建立、风险因子展示等角度出发,针对现有技术方案中存在的问题与不足提供完整的解决方案,实现如下几个智能核保的目标:对各渠道的核保规则进行管理,建立核保规则流,实现不同投保场景下的差异化的核保规则校验;建立风险模型,依托投保信息收集,结合多数据分析及数据核保模型,输出影响核保结论的风险因子,最终得出专业化健康类、财务类的核保结论。本发明通过智能核保模型的自动化,智能化的核保方式,降低核保人工成本,减少高峰期核保等待时间,提升核保效率。并且,通过减少人员依赖,统一流程、标准和工具,确保核保质量稳定,降低投保风险,统一采集和数据建模,形成标准知识库并构建知识图谱,使得风险数据可识别、可触达、可交互和可沉淀。这种高度自动化和智能化的核保业务模式,压缩流程和业务办理时间,差异化和精准的核保方案,提升客户体验,降低客户流失风险。
基于相同原理,本实施例还公开了一种数据处理系统。如图9所示,本实施例中,所述系统包括用户交互模块11、文件获取模块12和风险检测模块13。
其中,用户交互模块11用于通过交互式健康问卷获取用户的健康数据。
文件获取模块12用于对用户的证明文件进行信息提取得到证明文件数据。
风险检测模块13用于根据用户的历史投保信息、健康数据、证明文件数据和知识库数据形成基础数据,将基础数据输入预设的核保风险模型对用户风险进行检测得到检测结果并反馈给管理人员。
在优选的实施方式中,所述用户交互模块11具体用于向用户展示交互式健康问卷,接收用户基于交互式健康问卷输入的健康告知信息;若所述健康告知信息包括预设的疾病,向用户展示与所述疾病对应的疾病问卷以接收用户输入的疾病信息;根据所述健康告知信息和所述疾病信息形成所述健康数据。
在优选的实施方式中,所述文件获取模块12具体用于对用户的证明文件通过OCR识别技术进行旋转校正、倾斜校正、表与文字框检测、文字识别和AI纠错得到识别图像;对识别图像进行图像去噪、文字排版处理和表格的处理识别得到文字信息;对所述文字信息进行实体要素抽取得到证明文件数据。
在优选的实施方式中,所述基础数据包括客户信息表、被保人体检记录、被保人体检详情表、被保人病史记录、被保人家庭成员病史记录、理赔记录、投保记录、核保记录、保险产品表、医疗机构表、疾病库、疾病分类表、疾病信息表和疾病因果关系表。
在优选的实施方式中,如图10所示,所述系统进一步包括模型构建模块10。模型构建模块10用于预先构建所述核保风险模型。
在优选的实施方式中,所述模型构建模块10具体用于对历史用户对应的数据进行处理得到历史基础数据;对历史用户的风险类型进行人工标记;将历史基础数据和对应的风险类型输入机器学习模型中对模型进行训练得到所述核保风险模型。
在优选的实施方式中,如图11所示,所述系统进一步包括知识图谱构建模块14。知识图谱构建模块14用于对基础数据进行实体和关系提取;将实体与关系进行关联形成核保知识模型;对所述核保知识模型的实体进行整合分析构建核保知识图谱。
由于该系统解决问题的原理与以上方法类似,因此本系统的实施可以参见方法的实施,在此不再赘述。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机设备,具体的,计算机设备例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
在一个典型的实例中计算机设备具体包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述的由客户端执行的方法,或者,所述处理器执行所述程序时实现如上所述的由服务器执行的方法。
下面参考图12,其示出了适于用来实现本申请实施例的计算机设备600的结构示意图。
如图12所示,计算机设备600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM))603中的程序而执行各种适当的工作和处理。在RAM603中,还存储有系统600操作所需的各种程序和数据。CPU601、ROM602、以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶反馈器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡,调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装如存储部分608。
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包括用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (14)

1.一种数据处理方法,其特征在于,包括:
通过交互式健康问卷获取用户的健康数据;
对用户的证明文件进行信息提取得到证明文件数据;
根据用户的历史投保信息、健康数据、证明文件数据和知识库数据形成基础数据,将基础数据输入预设的核保风险模型对用户风险进行检测得到检测结果并反馈给管理人员;
进一步包括:
对基础数据进行实体和关系提取;
将实体与关系进行关联形成核保知识模型;
对所述核保知识模型的实体进行整合分析构建核保知识图谱,辅助核保员合理评估投保风险;
对所述核保知识模型进行实体整合分析构建核保知识图谱具体包括:
通过实体消歧、实体链接和知识合并对核保知识模型的实体进行整合分析以构建核保知识图谱。
2.根据权利要求1所述的数据处理方法,其特征在于,所述通过交互式健康问卷获取用户的健康数据具体包括:
向用户展示交互式健康问卷,接收用户基于交互式健康问卷输入的健康告知信息;
若所述健康告知信息包括预设的疾病,向用户展示与所述疾病对应的疾病问卷以接收用户输入的疾病信息;
根据所述健康告知信息和所述疾病信息形成所述健康数据。
3.根据权利要求1所述的数据处理方法,其特征在于,所述对用户的证明文件进行信息提取得到证明文件数据具体包括:
对用户的证明文件通过OCR识别技术进行旋转校正、倾斜校正、表与文字框检测、文字识别和AI纠错得到识别图像;
对识别图像进行图像去噪、文字排版处理和表格的处理识别得到文字信息;
对所述文字信息进行实体要素抽取得到证明文件数据。
4.根据权利要求1所述的数据处理方法,其特征在于,所述基础数据包括客户信息表、被保人体检记录、被保人体检详情表、被保人病史记录、被保人家庭成员病史记录、理赔记录、投保记录、核保记录、保险产品表、医疗机构表、疾病库、疾病分类表、疾病信息表和疾病因果关系表。
5.根据权利要求1所述的数据处理方法,其特征在于,进一步包括预先构建所述核保风险模型的步骤。
6.根据权利要求5所述的数据处理方法,其特征在于,所述构建所述核保风险模型具体包括:
对历史用户对应的数据进行处理得到历史基础数据;
对历史用户的风险类型进行人工标记;
将历史基础数据和对应的风险类型输入机器学习模型中对模型进行训练得到所述核保风险模型。
7.一种数据处理系统,其特征在于,包括:
用户交互模块,用于通过交互式健康问卷获取用户的健康数据;
文件获取模块,用于对用户的证明文件进行信息提取得到证明文件数据;
风险检测模块,用于根据用户的历史投保信息、健康数据、证明文件数据和知识库数据形成基础数据,将基础数据输入预设的核保风险模型对用户风险进行检测得到检测结果并反馈给管理人员;
进一步包括知识图谱构建模块,用于对基础数据进行实体和关系提取;将实体与关系进行关联形成核保知识模型;对所述核保知识模型的实体进行整合分析构建核保知识图谱,辅助核保员合理评估投保风险;
对所述核保知识模型进行实体整合分析构建核保知识图谱具体包括:
通过实体消歧、实体链接和知识合并对核保知识模型的实体进行整合分析以构建核保知识图谱。
8.根据权利要求7所述的数据处理系统,其特征在于,所述用户交互模块具体用于向用户展示交互式健康问卷,接收用户基于交互式健康问卷输入的健康告知信息;若所述健康告知信息包括预设的疾病,向用户展示与所述疾病对应的疾病问卷以接收用户输入的疾病信息;根据所述健康告知信息和所述疾病信息形成所述健康数据。
9.根据权利要求7所述的数据处理系统,其特征在于,所述文件获取模块具体用于对用户的证明文件通过OCR识别技术进行旋转校正、倾斜校正、表与文字框检测、文字识别和AI纠错得到识别图像;对识别图像进行图像去噪、文字排版处理和表格的处理识别得到文字信息;对所述文字信息进行实体要素抽取得到证明文件数据。
10.根据权利要求7所述的数据处理系统,其特征在于,所述基础数据包括客户信息表、被保人体检记录、被保人体检详情表、被保人病史记录、被保人家庭成员病史记录、理赔记录、投保记录、核保记录、保险产品表、医疗机构表、疾病库、疾病分类表、疾病信息表和疾病因果关系表。
11.根据权利要求7所述的数据处理系统,其特征在于,进一步包括模型构建模块,用于预先构建所述核保风险模型。
12.根据权利要求11所述的数据处理系统,其特征在于,所述模型构建模块具体用于对历史用户对应的数据进行处理得到历史基础数据;对历史用户的风险类型进行人工标记;将历史基础数据和对应的风险类型输入机器学习模型中对模型进行训练得到所述核保风险模型。
13.一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,
所述处理器执行所述程序时实现如权利要求1-6任一项所述方法。
14.一种计算机可读介质,其上存储有计算机程序,其特征在于,
该程序被处理器执行时实现如权利要求1-6任一项所述方法。
CN202011045135.1A 2020-09-28 2020-09-28 数据处理方法、系统、设备及可读介质 Active CN112150298B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011045135.1A CN112150298B (zh) 2020-09-28 2020-09-28 数据处理方法、系统、设备及可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011045135.1A CN112150298B (zh) 2020-09-28 2020-09-28 数据处理方法、系统、设备及可读介质

Publications (2)

Publication Number Publication Date
CN112150298A CN112150298A (zh) 2020-12-29
CN112150298B true CN112150298B (zh) 2022-12-09

Family

ID=73894636

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011045135.1A Active CN112150298B (zh) 2020-09-28 2020-09-28 数据处理方法、系统、设备及可读介质

Country Status (1)

Country Link
CN (1) CN112150298B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11803792B2 (en) * 2020-08-18 2023-10-31 Nb Ventures, Inc. Risk management
CN112801806A (zh) * 2021-04-12 2021-05-14 北京肇祺信息科技有限公司 一种基于知识图谱的理赔方法及系统
CN113077353B (zh) * 2021-04-22 2024-02-02 北京十一贝科技有限公司 用于生成核保结论的方法、装置、电子设备和介质
CN113240531A (zh) * 2021-05-11 2021-08-10 建信金融科技有限责任公司 一种数据处理方法和装置
CN114170031A (zh) * 2021-12-10 2022-03-11 金科览智科技(北京)有限公司 一种保险投保单的风险评估方法以及系统
CN114983385B (zh) * 2022-05-27 2023-03-10 北京四海汇智科技有限公司 一种通过人体成分检测提供智能营养管理的系统

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108460692A (zh) * 2018-03-23 2018-08-28 深圳市慧择保险经纪有限公司 一种基于健康险的线上核保方法、装置、设备和存储介质
CN109285076A (zh) * 2018-02-07 2019-01-29 中国平安人寿保险股份有限公司 智能核保处理方法、服务器及存储介质
CN109360111A (zh) * 2018-09-26 2019-02-19 中国平安人寿保险股份有限公司 问卷数据修正方法、装置、计算机设备和存储介质
CN110647809A (zh) * 2019-08-15 2020-01-03 中国平安人寿保险股份有限公司 基于图像分析的ai核保系统、方法及计算机可读存储介质
CN110766558A (zh) * 2019-10-23 2020-02-07 泰康保险集团股份有限公司 核保数据处理方法、装置、设备及计算机可读存储介质
CN110852894A (zh) * 2019-11-04 2020-02-28 泰康保险集团股份有限公司 保险核保方法及装置、计算机存储介质、电子设备
CN110889556A (zh) * 2019-11-28 2020-03-17 福建亿榕信息技术有限公司 一种企业经营风险预测方法和系统
CN111179095A (zh) * 2018-11-09 2020-05-19 天津幸福生命科技有限公司 基于健康风险评估的核保方法、系统、设备及存储介质
CN111382275A (zh) * 2018-12-28 2020-07-07 医渡云(北京)技术有限公司 医疗知识图谱的构建方法、装置、介质及电子设备
CN111626885A (zh) * 2020-06-01 2020-09-04 北京妙医佳健康科技集团有限公司 核保方法、装置、电子设备及计算机可读存储介质
CN111652746A (zh) * 2020-05-29 2020-09-11 泰康保险集团股份有限公司 信息生成方法、装置、电子设备及存储介质
CN111680693A (zh) * 2020-05-28 2020-09-18 泰康保险集团股份有限公司 理赔业务批量处理方法及装置

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109285076A (zh) * 2018-02-07 2019-01-29 中国平安人寿保险股份有限公司 智能核保处理方法、服务器及存储介质
CN108460692A (zh) * 2018-03-23 2018-08-28 深圳市慧择保险经纪有限公司 一种基于健康险的线上核保方法、装置、设备和存储介质
CN109360111A (zh) * 2018-09-26 2019-02-19 中国平安人寿保险股份有限公司 问卷数据修正方法、装置、计算机设备和存储介质
CN111179095A (zh) * 2018-11-09 2020-05-19 天津幸福生命科技有限公司 基于健康风险评估的核保方法、系统、设备及存储介质
CN111382275A (zh) * 2018-12-28 2020-07-07 医渡云(北京)技术有限公司 医疗知识图谱的构建方法、装置、介质及电子设备
CN110647809A (zh) * 2019-08-15 2020-01-03 中国平安人寿保险股份有限公司 基于图像分析的ai核保系统、方法及计算机可读存储介质
CN110766558A (zh) * 2019-10-23 2020-02-07 泰康保险集团股份有限公司 核保数据处理方法、装置、设备及计算机可读存储介质
CN110852894A (zh) * 2019-11-04 2020-02-28 泰康保险集团股份有限公司 保险核保方法及装置、计算机存储介质、电子设备
CN110889556A (zh) * 2019-11-28 2020-03-17 福建亿榕信息技术有限公司 一种企业经营风险预测方法和系统
CN111680693A (zh) * 2020-05-28 2020-09-18 泰康保险集团股份有限公司 理赔业务批量处理方法及装置
CN111652746A (zh) * 2020-05-29 2020-09-11 泰康保险集团股份有限公司 信息生成方法、装置、电子设备及存储介质
CN111626885A (zh) * 2020-06-01 2020-09-04 北京妙医佳健康科技集团有限公司 核保方法、装置、电子设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN112150298A (zh) 2020-12-29

Similar Documents

Publication Publication Date Title
CN112150298B (zh) 数据处理方法、系统、设备及可读介质
US20160225076A1 (en) System and method for building and validating a credit scoring function
US8930295B2 (en) Systems and methods for monitoring and analyzing transactions
US20230004888A1 (en) Ai-augmented auditing platform including techniques for applying a composable assurance integrity framework
CN108648074A (zh) 基于支持向量机的贷款评估方法、装置及设备
CN113011973B (zh) 基于智能合约数据湖的金融交易监管模型的方法及设备
CN110807700A (zh) 一种基于政府数据的无监督融合模型个人信用评分方法
US10762472B1 (en) Methods, systems and computer program products for generating notifications of benefit qualification change
CN111180065A (zh) 保险用户评估方法、装置、电子设备及计算机可读介质
CN110223182A (zh) 一种理赔风控方法、装置及计算机可读存储介质
WO2021174699A1 (zh) 用户筛选方法、装置、设备及存储介质
CN110399473A (zh) 为用户问题确定答案的方法和装置
CN113159796A (zh) 一种贸易合同验证方法及装置
CN114971294A (zh) 数据采集方法、装置、设备及存储介质
CN113221762B (zh) 代价平衡决策方法、保险理赔决策方法、装置和设备
Aly et al. Machine Learning Algorithms and Auditor’s Assessments of the Risks Material Misstatement: Evidence from the Restatement of Listed London Companies
CN113240531A (zh) 一种数据处理方法和装置
CN113449819A (zh) 一种基于胶囊网络的信用评估模型方法及其存储介质
WO2022249927A1 (ja) 分類システム
Srivastava et al. Hyperautomation in transforming underwriting operation in the life insurance industry
CN113724068A (zh) 基于知识图谱构建债务人决策策略的方法及相关设备
CN113240513A (zh) 一种用户授信额度的确定方法和相关装置
CN114202428A (zh) 基于图卷积神经网络的资产数据处理方法、装置及设备
CN118115281A (zh) 一种银行金融客户的风险等级评估方法
US20230024707A1 (en) System and method for classifying a user to apply for a microloan using ml model

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information

Inventor after: Zheng Zhiyuan

Inventor after: Qi Guifeng

Inventor after: Yao Qin

Inventor after: Tao Jun

Inventor after: Cheng Junhua

Inventor after: Lai Yuan

Inventor after: Liu Yan

Inventor after: Zuo Juanfeng

Inventor after: Yang Yanlin

Inventor before: Qi Guifeng

Inventor before: Tao Jun

Inventor before: Cheng Junhua

Inventor before: Lai Yuan

Inventor before: Liu Yan

CB03 Change of inventor or designer information
TR01 Transfer of patent right

Effective date of registration: 20230526

Address after: 200120, 29th to 33rd floors, China Construction Bank Building, No. 99 Yincheng Road, Pudong New Area Free Trade Pilot Zone, Shanghai

Patentee after: CCB Life Insurance Co.,Ltd.

Address before: 12 / F, 15 / F, No. 99, Yincheng Road, Shanghai pilot Free Trade Zone, 200120

Patentee before: Jianxin Financial Science and Technology Co.,Ltd.

TR01 Transfer of patent right
CI03 Correction of invention patent

Correction item: Inventor

Correct: Zheng Zhiyuan|Qi Guifeng|Yao Qin|Tao Jun|Cheng Junhua|source|Liu Yan|Zuo Junfeng|Yang Yanlin

False: Zheng Zhiyuan|Qi Guifeng|Yao Qin|Tao Jun|Cheng Junhua|source|Liu Yan|Zuo Junfeng|Yang Yanlin

Number: 23-02

Volume: 39

CI03 Correction of invention patent