CN116612475A - 一种车险数据中车型名称智能校正方法和设备 - Google Patents

一种车险数据中车型名称智能校正方法和设备 Download PDF

Info

Publication number
CN116612475A
CN116612475A CN202310639265.5A CN202310639265A CN116612475A CN 116612475 A CN116612475 A CN 116612475A CN 202310639265 A CN202310639265 A CN 202310639265A CN 116612475 A CN116612475 A CN 116612475A
Authority
CN
China
Prior art keywords
target
vehicle
template
insurance
model name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310639265.5A
Other languages
English (en)
Other versions
CN116612475B (zh
Inventor
王辉
王桂元
周瑞先
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kaitaiming Beijing Technology Co ltd
Original Assignee
Kaitaiming Beijing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kaitaiming Beijing Technology Co ltd filed Critical Kaitaiming Beijing Technology Co ltd
Priority to CN202310639265.5A priority Critical patent/CN116612475B/zh
Publication of CN116612475A publication Critical patent/CN116612475A/zh
Application granted granted Critical
Publication of CN116612475B publication Critical patent/CN116612475B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/12Detection or correction of errors, e.g. by rescanning the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明提供了一种车险数据中车型名称智能校正方法和设备,涉及数据处理技术领域,通过在车险合同模板库随机提取获得第一模板和第一模板特征信息,对第一模板特征信息进行分析得到定位输出结果,确定车险合同的车型名称位置并截取图片识别文字得到车型名称,对车型名称识别进行校正得到校正结果。解决了现有技术中车险合同信息校正检查基于人工,存在疏漏车型名称,导致车型名称错误合同无效,影响投保理赔的技术问题。达到了自动化进行车险合同中车型名称检查校正,保障车险合同正常生效的技术效果。

Description

一种车险数据中车型名称智能校正方法和设备
技术领域
本发明涉及数据处理技术领域,具体涉及一种车险数据中车型名称智能校正方法和设备。
背景技术
车险合同是投保人和保险公司之间签订的协议,它涉及到驾驶人行车安全、交通违法等各个方面。在车险合同中,车型名称信息的准确性至关重要,因为这直接关系到保险金额的计算以及理赔的处理流程。当前车险合同校验采用人工进行,人工校正需要在大量复杂的车险合同中寻找可能存在错误的信息,不仅费时费力,而且容易出现疏漏。
在实际应用中,由于车型名称普遍比较复杂,且不同地区、不同厂商的命名方式也存在差异,所以当人工校正车型名称时,很容易出现漏判或误判。尤其是对于一些新品牌、新车型或者非常规车型,人工校正的难度更加大,容易出现漏洞,进而导致保单的无效。
现有技术中车险合同信息校正检查基于人工,存在疏漏车型名称,导致车型名称错误合同无效,影响投保理赔的技术问题。
发明内容
本申请提供了一种车险数据中车型名称智能校正方法和设备,用于针对解决现有技术中车险合同信息校正检查基于人工,存在疏漏车型名称,导致车型名称错误合同无效,影响投保理赔的技术问题。
鉴于上述问题,本申请提供了一种车险数据中车型名称智能校正方法和设备。
本申请的第一个方面,提供了一种车险数据中车型名称智能校正方法,所述方法包括:构建车险合同模板库,其中,所述车险合同模板库包括M个模板的M个模板特征信息,M为大于等于1的整数;随机提取所述M个模板中任意一个模板,记作第一模板,并在所述M个模板特征信息中匹配所述第一模板的第一模板特征信息;通过智能定位模型对所述第一模板特征信息进行分析,得到定位输出结果,其中,所述定位输出结果包括第一投保车型名称位置;读取目标车险合同,并根据所述第一投保车型名称位置确定所述目标车险合同的目标车型名称位置;截取所述目标车型名称位置的目标图片,并对所述目标图片进行文字识别,得到目标车型名称识别结果;通过智能校正模型对所述目标车型名称识别结果进行校正分析,得到目标校正结果。
本申请的第二个方面,提供了一种车险数据中车型名称智能校正设备,所述设备包括:合同模板建库模块,用于构建车险合同模板库,其中,所述车险合同模板库包括M个模板的M个模板特征信息,M为大于等于1的整数;模板随机提取模块,用于随机提取所述M个模板中任意一个模板,记作第一模板,并在所述M个模板特征信息中匹配所述第一模板的第一模板特征信息;定位模型分析模块,用于通过智能定位模型对所述第一模板特征信息进行分析,得到定位输出结果,其中,所述定位输出结果包括第一投保车型名称位置;车险合同读取模块,用于读取目标车险合同,并根据所述第一投保车型名称位置确定所述目标车险合同的目标车型名称位置;文字识别执行模块,用于截取所述目标车型名称位置的目标图片,并对所述目标图片进行文字识别,得到目标车型名称识别结果;识别结果校正模块,用于通过智能校正模型对所述目标车型名称识别结果进行校正分析,得到目标校正结果。
本申请中提供的一个或多个技术方案,至少具有如下技术效果或优点:
本申请实施例提供的方法通过构建车险合同模板库,其中,所述车险合同模板库包括M个模板的M个模板特征信息,M为大于等于1的整数;随机提取所述M个模板中任意一个模板,记作第一模板,并在所述M个模板特征信息中匹配所述第一模板的第一模板特征信息;通过智能定位模型对所述第一模板特征信息进行分析,得到定位输出结果,其中,所述定位输出结果包括第一投保车型名称位置,获得所述第一投保车型名称位置,为后续判定车型数据中车型名称是否填写正确,从而判断车险合同是否生效提供基础;读取目标车险合同,并根据所述第一投保车型名称位置确定所述目标车险合同的目标车型名称位置;截取所述目标车型名称位置的目标图片,并对所述目标图片进行文字识别,得到目标车型名称识别结果;通过智能校正模型对所述目标车型名称识别结果进行校正分析,得到目标校正结果。达到了自动化进行车险合同中车型名称检查校正,保障车险合同正常生效的技术效果。
附图说明
图1为本申请提供的一种车险数据中车型名称智能校正方法流程示意图;
图2为本申请提供的一种车险数据中车型名称智能校正方法中得到定位输出结果的流程示意图;
图3为本申请提供的一种车险数据中车型名称智能校正方法中得到目标车型名称识别结果的流程示意图;
图4为本申请提供的一种车险数据中车型名称智能校正设备的结构示意图。
附图标记说明:合同模板建库模块1,模板随机提取模块2,定位模型分析模块3,车险合同读取模块4,文字识别执行模块5,识别结果校正模块6。
具体实施方式
本申请提供了一种车险数据中车型名称智能校正方法和设备,用于针对解决现有技术中车险合同信息校正检查基于人工,存在疏漏车型名称,导致车型名称错误合同无效,影响投保理赔的技术问题。达到了自动化进行车险合同中车型名称检查校正,保障车险合同正常生效的技术效果。
本发明技术方案中对数据的获取、存储、使用、处理等均符合相关规定。
下面,将参考附图对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是本发明的全部实施例,应理解,本发明不受这里描述的示例实施例的限制。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部。
实施例一
如图1所示,本申请提供了一种车险数据中车型名称智能校正方法,所述方法包括:
S100:构建车险合同模板库,其中,所述车险合同模板库包括M个模板的M个模板特征信息,M为大于等于1的整数;
S200:随机提取所述M个模板中任意一个模板,记作第一模板,并在所述M个模板特征信息中匹配所述第一模板的第一模板特征信息;
具体而言,在本实施例中,所述车险合同模板库为用于向车险公司提供不同格式车险合同的数据库,所述车险合同模板库中存储有M个车险合同模板,每一车险合同模板都具有不同的模板特征信息。
所述模板特征信息包括车险合同的规则条款、标题等文字信息的字体字号特征,以及投保车辆信息、投保人签名、投保时间等待填写内容在车险合同中的尺寸布局特征。
当用户将车险合同正文以及投保方信息和保险公司信息输入某个车险合同模板时,可实现基于该车险合同模板中的模板特征信息自动化生成一份标准形式的车险合同,从而方便投保参保者直接进行被车辆信息、签名、投保时间等信息填写,提高车险合同生成和签署的效率和便捷性。
本实施例在所述车险合同模板库的所述M个模板中随机提取任意一个车险合同模板,并将其定义为所述第一模板。进一步在所述M个模板特征信息中匹配与所述第一模板具有对应关系的模板特征信息作为所述第一模板特征信息。
S300:通过智能定位模型对所述第一模板特征信息进行分析,得到定位输出结果,其中,所述定位输出结果包括第一投保车型名称位置;
在一个实施例中,如图2所示,所述通过智能定位模型对所述第一模板特征信息进行分析,得到定位输出结果,本申请提供的方法步骤S300还包括:
S310:提取所述第一模板特征信息中的第一文字字号信息,其中,所述第一文字字号信息包括N个字号,N为大于1的整数;
S320:筛选所述N个字号中的最小字号,并得到所述最小字号的最小字号长度;
S330:以所述最小字号长度为约束对所述第一模板进行分割,得到P个分割单元格,P为大于1的整数;
S340:依次对所述P个分割单元格中各分割单元格进行定位分析,得到所述定位输出结果。
在一个实施例中,在所述依次对所述P个分割单元格中各分割单元格进行定位分析,得到所述定位输出结果之后,本申请提供的方法步骤S340还包括:
S341:提取所述第一模板特征信息中的第一尺寸布局信息,其中,所述第一尺寸布局信息包括预设目标尺寸布局;
S342:将所述预设目标尺寸布局在所述定位输出结果中遍历,得到所述第一投保车型名称位置。
具体而言,基于步骤S100可知,本实施例所述模板特征信息包括但不限于合同正文字体字号特征,车辆信息填写区域的尺寸布局特征、投保人签字区域的尺寸布局特征等信息。
所述第一文字字号信息即为所述第一模板特征信息中对于车险合同条款、题目等所有合同组成信息的字体字号要求,所述第一文字字号信息中包括对应于N个合同组成信息的N个字体和字号,N为大于1的整数。例如所述第一文字字号信息中对于合同题目的字号要求为宋体五号,合同条款的字号要求问宋体四号等。
所述第一尺寸布局信息即为所述第一模板特征信息中,N个合同组成信息在第一模板中的尺寸布局特征,例如投保人签字位置限定为1×4cm的区域,投保车辆的车型信息填写位置限定为一个1×3.5cm的区域。
所述定位输出结果为对应于所述合同名词库中名词的若干组拼接结果在第一模板中的布局位置信息,所述定位输出结果中包括但不限于第一车型名称位置、第一投保机动车类型位置、第一投保核定质量位置、第一投保核定载客位置。
所述定位输出结果中,第一车型名称位置、第一投保机动车类型位置、第一投保核定质量位置、第一投保核定载客位置,这类名词具有指示性,用于指示投保人和保险公司在对应位置的预设区域内进行对应内容填写,例如指示投保人在第一投保机动车类型位置处的横线或者框格中填写投保机动车类型(汽车、摩托车、拖拉机、工程车等各种机动车类型)。
在本实施例中,通过智能定位模型对所述第一模板特征信息进行自动化分析,以获得所述得到定位输出结果,所述智能定位模型的运行机制如下:
所述智能定位模型根据字号值大小,对N个文字组成信息进行排序,从而筛选所述N个字号中的最小字号,进一步根据所述最小字号的字体信息,获得所述最小字号在A4纸上打印时的字符长度和宽度,作为所述最小字号长度,所述最小字号长度为容纳所述最小字号的一个字符的矩形框。
以所述最小字号长度为约束对所述第一模板进行分割,得到P个分割单元格,P为大于1的整数,每一分割单元格为所述最小字号长度要求尺寸的矩形框。本实施例通过获得所述最小字符长度作为第一模板分割的分割标准,实现确保对第一模板分割后,每个分割单元格中最多为一个单字符,为后续进行分割单元格拼接获得投保车辆的车型名称提供保障。
预设分割单元格拼接阈值,所述分割单元格拼接阈值为横向相邻单元格拼接的最少个数限制,例如设定为3~7格,从而避免过少数量分割单元格拼接获得无意义词组,例如相邻四个单元格分别为“保”“险”“责”“任”“划”“分”,对于这四个相邻单元格按照2格一组方式拼接所获得的文字无任何实际含义。本实施例设定分割单元格拼接阈值能够避免分割单元格无效拼接,提高第一模板的合同内容定位效率。
预构建合同名词库嵌入所述智能定位模型中,所述合同名词库中包括投保人信息、险种、赔偿限额等合同名词。基于所述预设分割单元格拼接阈值,依次对所述P个分割单元格中具有横向相邻关系的各分割单元格进行拼接,获得单元格数量不等的多组拼接结果,将多组拼接结果的文字内容提取并逐一在所述合同名词库遍历,从而将获得符合所述合同名词库中的名词的若干个拼接结果,并进一步将该若干个拼接结果在第一模板中定位,从而完成所述定位分析,得到所述定位输出结果。
在获得所述定位输出结果的基础上,本实施例进一步提取所述第一模板特征信息中的第一尺寸布局信息,所述第一尺寸布局信息中包括N个合同组成信息的尺寸布局特征。所述预设目标为投保车辆车型信息,本实施例在所述第一尺寸布局信息提取获得所述预设目标尺寸布局,所述预设目标尺寸布局为投保车辆车型信息填写区域的尺寸限定。
基于所述预设目标在所述定位输出结果中遍历获得在第一模板中存在的多个进行投保车辆车型信息填写的指示文字。进一步基于所述预设目标尺寸布局在多个进行投保车辆车型信息填写的指示文字的最后一个字符为起点进行区域划分得到所述第一投保车型名称位置,所述第一投保车型名称位置是在第一模板中的填写投保车型名称的多个填写位置。本实施例通过获得所述第一投保车型名称位置,为后续判定车型数据中车型名称是否填写正确,从而判断车险合同是否生效提供基础。
S400:读取目标车险合同,并根据所述第一投保车型名称位置确定所述目标车险合同的目标车型名称位置;
具体而言,本实施例中所述目标车险合同为采用所述第一模板生成的待生效车险合同,所述目标车险合同优选为电子合同,因而应理解的,所述目标车险合同和所述第一模板的布局设计具有一致性。基于此,本实施例读取所述目标车险合同,基于所述目标车险合同和所述第一模板的布局设计具有一致性,根据所述第一投保车型名称位置直接确定所述目标车险合同的目标车型名称位置,所述目标车型名称位置为所述目标车险合同计划投保的车辆的车型名称信息在目标车险合同中的填写位置。
S500:截取所述目标车型名称位置的目标图片,并对所述目标图片进行文字识别,得到目标车型名称识别结果;
在一个实施例中,如图3所示,所述得到目标车型名称识别结果,本申请提供的方法步骤S500还包括:
S510:对所述目标图片进行预处理,并根据预处理结果得到目标车型名称长度;
S520:获取所述目标车型名称识别结果的目标识别长度,并将其与所述目标车型名称长度进行对比,得到长度对比偏差;
S530:若所述长度对比偏差符合预设偏差阈值,将所述目标车型名称识别结果进行输出。
在一个实施例中,在所述得到长度对比偏差之后,本申请提供的方法步骤S520还包括:
S521:若所述长度对比偏差不符合预设偏差阈值,对所述目标图片进行二次文字识别,得到目标车型名称二次识别结果;
S522:将所述目标车型名称二次识别结果作为所述目标车型名称识别结果进行输出。
在一个实施例中,所述对所述目标图片进行预处理,并根据预处理结果得到目标车型名称长度,本申请提供的方法步骤S510还包括:
S511:基于预设方案划分所述目标图片,并提取第一图片块;
S512:对所述第一图片块进行离散余弦变换,得到第一离散余弦系数,其中,所述第一离散余弦系数包括第一离散余弦直流系数;
S513:获取预设直流系数阈值;
S514:判断所述第一离散余弦直流系数是否符合所述预设直流系数阈值;
S515:若是符合,将所述第一图片块标记为文字块,若是不符合,将所述第一图片块标记为空白块;
S516:统计所述文字块与所述空白块并分析,得到所述目标车型名称长度。
具体而言,在本实施例中,在获得所述目标车型名称位置时,以所述第一尺寸布局信息的尺寸为参考,采用现有图像裁剪技术截取所述目标车型名称位置的目标图片,所述目标图片中包含目标车型的文字内容。
所述预设划分方案为对所述目标图片按照像素格进行列划分的像素格数量要求,例如所述预设划分方案为以三个像素格为单位,将所述目标图片划分为多个图片块。
基于预设方案划分所述目标图片,获得存在相邻关系的H个图片块,H为正整数,每一图片块为三个像素格宽,与所述目标图片等长的狭长图片。
在所述H个图片块中随机提取获得所述第一图片块,按照像素格的尺寸大小,将所述第一图片块划分成X×Y的块为例,对应的系数矩阵共有X×Y个离散余弦系数,X×Y个离散余弦系数统称为所述第一离散余弦系数。
在所述第一离散余弦系数中提取所述第一离散余弦直流系数,所述第一离散余弦直流系数为第一系数,代表第一图片块内存在的所有像素格的像素值平均数,第一离散余弦直流系数反映了第一图片块内像素的整体颜色的基调。
应理解的,当一个图片块中没有文字时,该图片块的所有像素格都为白色,因而该图片块的所有离散余弦系数都为0,所述第一离散余弦直流系数为0。当图片块中有文字时即存在像素格为黑色,则第一离散余弦直流系数不为0。基于此本实施例设定所述预设直流系数阈值X>0,所述预设直流系数阈值用于判断一个图片块中是否存在黑色的像素格。
判断所述第一离散余弦直流系数是否符合所述预设直流系数阈值,若是符合,则表明第一图片块中存在黑色像素格即存在文字,将所述第一图片块标记为文字块,若是不符合,则表明第一图片块为纯白色,将所述第一图片块标记为空白块。
采用确定所述第一图片块为空白块还是文字块相同方法,对所述H个图片块进行处理,获得H个标记结果。从所述H个图片块的H个标记结果中提取获得目标图片中第一个标记为文字块和最后一个标记为文字块的两个图片块,计算两个图片块的间隔长度在所述目标图片的长度占比,并将占比计算结果与所述第一尺寸布局信息进行乘积计算,获得所述目标车型名称长度,所述目标车型名称长度为当前填写在目标车险合同中的车型名称信息的字符总长度。
截取所述目标车型名称位置的目标图片,并采用现有文字识别技术对所述目标图片进行文字识别提取,得到所述目标车型名称识别结果,所述目标车型名称识别结果为待投保的车辆的车型名称。
采用所述第一模板特征信息对所述目标车型名称识别结果进行处理,以使所述目标车型识别结果以第一模板设定的字体字符格式显示,进一步基于处理所获显示结果进行字符长度采集,获得所述目标标识别长度。
将所述目标标识别长度与所述目标车型名称长度进行对比,以判断基于文字识别获得的车型名称是否正确。将所述目标标识别长度与所述目标车型名称长度进行长度差计算,得到长度对比偏差,判断所述长度对比偏差是否符合预设偏差阈值,若所述长度对比偏差符合预设偏差阈值,则表明当前识别获得目标车型名称识别结果正确,将所述目标车型名称识别结果进行输出。本实施例中所述预设偏差阈值为小于所述最小字号长度的一个长度值,当所述长度对比偏差小于预设偏差阈值时,则说明目标车型名称识别结果中不存在多识别出的字符,只是多识别出了空格。
若所述长度对比偏差不符合预设偏差阈值,则表明当前识别获得目标车型名称识别结果错误,可能多识别出了字符,对所述目标图片进行二次文字识别,得到目标车型名称二次识别结果,获取所述目标车型名称二次识别结果的目标二次识别长度,并将其与所述目标车型名称长度进行对比,得到长度对比偏差;若所述长度对比偏差符合预设偏差阈值,将所述目标车型名称二次识别结果作为所述目标车型名称识别结果进行输出。
本实施例通过获取目标车型名称长度对目标车型名称识别结果的正确性进行验证,实现了避免单一采用文字识别所获目标车型名称识别结果为错误结果,提高所获目标车型名称识别结果的准确度的技术效果,间接实现了为后续进行车型名称校正准确提供基础的目的。
S600:通过智能校正模型对所述目标车型名称识别结果进行校正分析,得到目标校正结果。
在一个实施例中,所述通过智能校正模型对所述目标车型名称识别结果进行校正分析,得到目标校正结果,本申请提供的方法步骤S600还包括:
S610:所述智能校正模型中内嵌有车型样本数据库;
S620:基于所述目标车型名称识别结果对所述车型样本数据库进行遍历,得到目标遍历结果;
S630:所述定位输出结果包括第一投保机动车类型位置、第一投保核定质量位置、第一投保核定载客位置;
S640:基于所述第一投保机动车类型位置得到所述目标车险合同的目标机动车类型识别结果,基于所述第一投保核定质量位置得到所述目标车险合同的目标核定质量识别结果,基于所述第一投保核定载客位置得到所述目标车险合同的目标核定载客识别结果;
S650:将所述目标机动车类型识别结果、所述目标核定质量识别结果和所述目标核定载客识别结果与所述目标遍历结果进行对比,车信息对比结果;
S660:根据所述车信息对比结果对所述目标车型名称识别结果进行校正分析,得到所述目标校正结果。
在一个实施例中,所述智能校正模型中内嵌有车型样本数据库,本申请提供的方法步骤S610还包括:
S611:获取第一车型名称的第一机动车;
S612:获取所述第一机动车的第一机动车信息,其中,所述第一机动车信息包括第一机动车类型、第一核定质量、第一核定载客;
S613:建立所述第一车型名称与所述第一机动车信息的第一映射关系;
S614:根据所述第一映射关系构建所述车型样本数据库,并存储至所述智能校正模型。
具体而言,在本实施例中,构建车型样本数据库,基于保险公司的投保车型数据库以及各大车厂生产车型数据库,获得若干个样本车型名称以及对应于若干个样本车型的若干个样本机动车。基于若干个样本车型名称随机提取第一车型名称,以及对应于第一车型名称的第一机动车的第一机动车信息,所述第一机动车信息包括第一机动车类型、第一核定质量、第一核定载客。所述第一机动车类型包括但不限于汽车、摩托车、拖拉机、工程车等各种机动车类型,所述第一核定质量为第一机动车最大载重限制,所述第一核定载客为第一机动车最多可承载乘客数量,建立所述第一车型名称与所述第一机动车信息的第一映射关系。采用相同方法获取并建立若干个样本车型名称与若干个样本机动车信息的若干组映射关系。
基于若干组样本车型名称-样本机动车信息,优选采用知识图谱,构建获得所述车型样本数据库,将所述车型样本数据库存储至所述智能校正模型中。
所述智能校正模型为判断所述目标车险合同中车型名称是否正确的数据处理模型,所述智能校正模型的数据处理机制如下:
所述目标车型名称通过所述智能校正模型的输入端进入模型后,所述目标车型名称识别结果在所述车型样本数据库中进行遍历比对,得到目标遍历结果,所述目标遍历结果为与所述目标车型名称识别结果具有一致性的样本车型名称-样本机动车信息,进一步基于目标遍历结果提取获得样本机动车类型、样本核定质量、样本核定载客。
基于步骤S300可知,所述定位输出结果还包括第一投保机动车类型位置、第一投保核定质量位置、第一投保核定载客位置,基于所述定位输出结果的第一投保机动车类型位置、第一投保核定质量位置、第一投保核定载客位置在所述目标车险合同中定位获得目标机动车类型识别结果、目标核定质量识别结果和目标核定载客识别结果。
将所述目标机动车类型识别结果、所述目标核定质量识别结果和所述目标核定载客识别结果与所述目标遍历结果中的样本机动车类型、样本核定质量、样本核定载客进行对应比对,判断样本信息和识别结果是否具有一致性,获得所述车信息比对结果。
若所述车信息比对结果为样本信息和识别结果具有一致性,则表明目标车险合同中车型信息填写正确,无需校正,若所述车信息比对结果为样本信息和识别结果不具有一致性,则基于所述目标机动车类型识别结果生成检索指令,在所述车型样本数据库中进行遍历比对获得同系列相似车型的若干组样本机动车类型-样本核定质量-样本核定载客。
由于同系列相似车型的核定载客和核定质量的差异性,本实施例在获得同系列相似车型的若干组样本机动车类型-样本核定质量-样本核定载客的基础上,基于所述目标核定载客识别结果以及所述目标核定质量识别结果进行遍历比对,获得与所述目标核定载客识别结果一致的一个样本机动车,将该样本机动车的车型名称作为所述目标校正结果,替代所述目标车型名称识别结果,完成对目标车险合同的车型名称自动化校正。
本实施例通过在目标车险合同生效前进行车型名称自动化检验校正,实现了确保目标车险合同信息正确,保障车险合同正常生效的技术效果。
实施例二
基于与前述实施例中一种车险数据中车型名称智能校正方法相同的发明构思,如图4所示,本申请提供了一种车险数据中车型名称智能校正设备,其中,所述设备包括:
合同模板建库模块1,用于构建车险合同模板库,其中,所述车险合同模板库包括M个模板的M个模板特征信息,M为大于等于1的整数;
模板随机提取模块2,用于随机提取所述M个模板中任意一个模板,记作第一模板,并在所述M个模板特征信息中匹配所述第一模板的第一模板特征信息;
定位模型分析模块3,用于通过智能定位模型对所述第一模板特征信息进行分析,得到定位输出结果,其中,所述定位输出结果包括第一投保车型名称位置;
车险合同读取模块4,用于读取目标车险合同,并根据所述第一投保车型名称位置确定所述目标车险合同的目标车型名称位置;
文字识别执行模块5,用于截取所述目标车型名称位置的目标图片,并对所述目标图片进行文字识别,得到目标车型名称识别结果;
识别结果校正模块6,用于通过智能校正模型对所述目标车型名称识别结果进行校正分析,得到目标校正结果。
在一个实施例中,所述系统还包括:
字号信息提取单元,用于提取所述第一模板特征信息中的第一文字字号信息,其中,所述第一文字字号信息包括N个字号,N为大于1的整数;
最小字号筛选单元,用于筛选所述N个字号中的最小字号,并得到所述最小字号的最小字号长度;
模板分割执行单元,用于以所述最小字号长度为约束对所述第一模板进行分割,得到P个分割单元格,P为大于1的整数;
定位分析执行单元,用于依次对所述P个分割单元格中各分割单元格进行定位分析,得到所述定位输出结果。
在一个实施例中,所述系统还包括:
布局信息提取单元,用于提取所述第一模板特征信息中的第一尺寸布局信息,其中,所述第一尺寸布局信息包括预设目标尺寸布局;
名称位置定位单元,用于将所述预设目标尺寸布局在所述定位输出结果中遍历,得到所述第一投保车型名称位置。
在一个实施例中,所述系统还包括:
车型名称获得单元,用于对所述目标图片进行预处理,并根据预处理结果得到目标车型名称长度;
长度比对偏差单元,用于获取所述目标车型名称识别结果的目标识别长度,并将其与所述目标车型名称长度进行对比,得到长度对比偏差;
车型名称输出单元,用于若所述长度对比偏差符合预设偏差阈值,将所述目标车型名称识别结果进行输出。
在一个实施例中,所述系统还包括:
文字识别执行单元,用于若所述长度对比偏差不符合预设偏差阈值,对所述目标图片进行二次文字识别,得到目标车型名称二次识别结果;
识别结果输出单元,用于将所述目标车型名称二次识别结果作为所述目标车型名称识别结果进行输出。
在一个实施例中,所述系统还包括:
目标图片划分单元,用于基于预设方案划分所述目标图片,并提取第一图片块;
余弦变换执行单元,用于对所述第一图片块进行离散余弦变换,得到第一离散余弦系数,其中,所述第一离散余弦系数包括第一离散余弦直流系数;
预设阈值获取单元,用于获取预设直流系数阈值;
系数比对判断单元,用于判断所述第一离散余弦直流系数是否符合所述预设直流系数阈值;
判断结果处理单元,用于若是符合,将所述第一图片块标记为文字块,若是不符合,将所述第一图片块标记为空白块;
名称长度分析单元,用于统计所述文字块与所述空白块并分析,得到所述目标车型名称长度。
在一个实施例中,所述系统还包括:
数据库嵌入单元,用于所述智能校正模型中内嵌有车型样本数据库;
识别结果匹配单元,用于基于所述目标车型名称识别结果对所述车型样本数据库进行遍历,得到目标遍历结果;
输出结果生成单元,用于所述定位输出结果包括第一投保机动车类型位置、第一投保核定质量位置、第一投保核定载客位置;
识别结果生成单元,用于基于所述第一投保机动车类型位置得到所述目标车险合同的目标机动车类型识别结果,基于所述第一投保核定质量位置得到所述目标车险合同的目标核定质量识别结果,基于所述第一投保核定载客位置得到所述目标车险合同的目标核定载客识别结果;
信息比对执行单元,用于将所述目标机动车类型识别结果、所述目标核定质量识别结果和所述目标核定载客识别结果与所述目标遍历结果进行对比,车信息对比结果;
校正分析执行单元,用于根据所述车信息对比结果对所述目标车型名称识别结果进行校正分析,得到所述目标校正结果。
在一个实施例中,所述系统还包括:
车型名称获取单元,用于获取第一车型名称的第一机动车;
车机信息获取单元,用于获取所述第一机动车的第一机动车信息,其中,所述第一机动车信息包括第一机动车类型、第一核定质量、第一核定载客;
映射关系构建单元,用于建立所述第一车型名称与所述第一机动车信息的第一映射关系;
校正模型生成单元,用于根据所述第一映射关系构建所述车型样本数据库,并存储至所述智能校正模型。
综上所述的任意一项方法或者步骤可作为计算机指令或程序存储在各种不限类型的计算机存储器中,通过各种不限类型的计算机处理器识别计算机指令或程序,进而实现上述任一项方法或者步骤。
基于本发明的上述具体实施例,本技术领域的技术人员在不脱离本发明原理的前提下,对本发明所作的任何改进和修饰,皆应落入本发明的专利保护范围。

Claims (9)

1.一种车险数据中车型名称智能校正方法,其特征在于,包括:
构建车险合同模板库,其中,所述车险合同模板库包括M个模板的M个模板特征信息,M为大于等于1的整数;
随机提取所述M个模板中任意一个模板,记作第一模板,并在所述M个模板特征信息中匹配所述第一模板的第一模板特征信息;
通过智能定位模型对所述第一模板特征信息进行分析,得到定位输出结果,其中,所述定位输出结果包括第一投保车型名称位置;
读取目标车险合同,并根据所述第一投保车型名称位置确定所述目标车险合同的目标车型名称位置;
截取所述目标车型名称位置的目标图片,并对所述目标图片进行文字识别,得到目标车型名称识别结果;
通过智能校正模型对所述目标车型名称识别结果进行校正分析,得到目标校正结果。
2.根据权利要求1所述的方法,其特征在于,所述通过智能定位模型对所述第一模板特征信息进行分析,得到定位输出结果,包括:
提取所述第一模板特征信息中的第一文字字号信息,其中,所述第一文字字号信息包括N个字号,N为大于1的整数;
筛选所述N个字号中的最小字号,并得到所述最小字号的最小字号长度;
以所述最小字号长度为约束对所述第一模板进行分割,得到P个分割单元格,P为大于1的整数;
依次对所述P个分割单元格中各分割单元格进行定位分析,得到所述定位输出结果。
3.根据权利要求2所述的方法,其特征在于,在所述依次对所述P个分割单元格中各分割单元格进行定位分析,得到所述定位输出结果之后,包括:
提取所述第一模板特征信息中的第一尺寸布局信息,其中,所述第一尺寸布局信息包括预设目标尺寸布局;
将所述预设目标尺寸布局在所述定位输出结果中遍历,得到所述第一投保车型名称位置。
4.根据权利要求1所述的方法,其特征在于,所述得到目标车型名称识别结果,包括:
对所述目标图片进行预处理,并根据预处理结果得到目标车型名称长度;
获取所述目标车型名称识别结果的目标识别长度,并将其与所述目标车型名称长度进行对比,得到长度对比偏差;
若所述长度对比偏差符合预设偏差阈值,将所述目标车型名称识别结果进行输出。
5.根据权利要求4所述的方法,其特征在于,在所述得到长度对比偏差之后,还包括:
若所述长度对比偏差不符合预设偏差阈值,对所述目标图片进行二次文字识别,得到目标车型名称二次识别结果;
将所述目标车型名称二次识别结果作为所述目标车型名称识别结果进行输出。
6.根据权利要求5所述的方法,其特征在于,所述对所述目标图片进行预处理,并根据预处理结果得到目标车型名称长度,包括:
基于预设方案划分所述目标图片,并提取第一图片块;
对所述第一图片块进行离散余弦变换,得到第一离散余弦系数,其中,所述第一离散余弦系数包括第一离散余弦直流系数;
获取预设直流系数阈值;
判断所述第一离散余弦直流系数是否符合所述预设直流系数阈值;
若是符合,将所述第一图片块标记为文字块,若是不符合,将所述第一图片块标记为空白块;
统计所述文字块与所述空白块并分析,得到所述目标车型名称长度。
7.根据权利要求1所述的方法,其特征在于,所述通过智能校正模型对所述目标车型名称识别结果进行校正分析,得到目标校正结果,包括:
所述智能校正模型中内嵌有车型样本数据库;
基于所述目标车型名称识别结果对所述车型样本数据库进行遍历,得到目标遍历结果;
所述定位输出结果包括第一投保机动车类型位置、第一投保核定质量位置、第一投保核定载客位置;
基于所述第一投保机动车类型位置得到所述目标车险合同的目标机动车类型识别结果,基于所述第一投保核定质量位置得到所述目标车险合同的目标核定质量识别结果,基于所述第一投保核定载客位置得到所述目标车险合同的目标核定载客识别结果;
将所述目标机动车类型识别结果、所述目标核定质量识别结果和所述目标核定载客识别结果与所述目标遍历结果进行对比,车信息对比结果;
根据所述车信息对比结果对所述目标车型名称识别结果进行校正分析,得到所述目标校正结果。
8.根据权利要求7所述的方法,其特征在于,所述智能校正模型中内嵌有车型样本数据库,包括:
获取第一车型名称的第一机动车;
获取所述第一机动车的第一机动车信息,其中,所述第一机动车信息包括第一机动车类型、第一核定质量、第一核定载客;
建立所述第一车型名称与所述第一机动车信息的第一映射关系;
根据所述第一映射关系构建所述车型样本数据库,并存储至所述智能校正模型。
9.一种车险数据中车型名称智能校正设备,其特征在于,所述设备包括:
合同模板建库模块,用于构建车险合同模板库,其中,所述车险合同模板库包括M个模板的M个模板特征信息,M为大于等于1的整数;
模板随机提取模块,用于随机提取所述M个模板中任意一个模板,记作第一模板,并在所述M个模板特征信息中匹配所述第一模板的第一模板特征信息;
定位模型分析模块,用于通过智能定位模型对所述第一模板特征信息进行分析,得到定位输出结果,其中,所述定位输出结果包括第一投保车型名称位置;
车险合同读取模块,用于读取目标车险合同,并根据所述第一投保车型名称位置确定所述目标车险合同的目标车型名称位置;
文字识别执行模块,用于截取所述目标车型名称位置的目标图片,并对所述目标图片进行文字识别,得到目标车型名称识别结果;
识别结果校正模块,用于通过智能校正模型对所述目标车型名称识别结果进行校正分析,得到目标校正结果。
CN202310639265.5A 2023-06-01 2023-06-01 一种车险数据中车型名称智能校正方法和设备 Active CN116612475B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310639265.5A CN116612475B (zh) 2023-06-01 2023-06-01 一种车险数据中车型名称智能校正方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310639265.5A CN116612475B (zh) 2023-06-01 2023-06-01 一种车险数据中车型名称智能校正方法和设备

Publications (2)

Publication Number Publication Date
CN116612475A true CN116612475A (zh) 2023-08-18
CN116612475B CN116612475B (zh) 2024-01-23

Family

ID=87674458

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310639265.5A Active CN116612475B (zh) 2023-06-01 2023-06-01 一种车险数据中车型名称智能校正方法和设备

Country Status (1)

Country Link
CN (1) CN116612475B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU3335095A (en) * 1994-09-05 1996-03-27 Mikoh Technology Limited Diffraction surfaces and methods for the manufacture thereof
US20130297353A1 (en) * 2008-01-18 2013-11-07 Mitek Systems Systems and methods for filing insurance claims using mobile imaging
CN107909299A (zh) * 2017-12-11 2018-04-13 凯泰铭科技(北京)有限公司 人伤理赔数据风险检测方法和系统
CN109919014A (zh) * 2019-01-28 2019-06-21 平安科技(深圳)有限公司 Ocr识别方法及其电子设备
CN113971615A (zh) * 2021-10-27 2022-01-25 泰康保险集团股份有限公司 车险报案方法、装置、电子设备和介质
CN115100670A (zh) * 2022-07-21 2022-09-23 中国平安人寿保险股份有限公司 保单信息处理方法及其系统、电子设备、存储介质
CN115294592A (zh) * 2022-08-09 2022-11-04 中国平安人寿保险股份有限公司 理赔信息采集方法和采集装置、计算机设备、存储介质
WO2023006974A1 (en) * 2021-07-30 2023-02-02 Swiss Reinsurance Company Ltd. Optical fraud detector for automated detection of fraud in digital imaginary-based automobile claims, automated damage recognition, and method thereof
CN115965478A (zh) * 2023-03-17 2023-04-14 北京鲸鹳科技有限公司 一种理赔案件的自动核赔方法、设备及介质
CN116029326A (zh) * 2023-01-05 2023-04-28 凯泰铭科技(北京)有限公司 一种便于ai图像识别的车险定损码的建立方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU3335095A (en) * 1994-09-05 1996-03-27 Mikoh Technology Limited Diffraction surfaces and methods for the manufacture thereof
US20130297353A1 (en) * 2008-01-18 2013-11-07 Mitek Systems Systems and methods for filing insurance claims using mobile imaging
CN107909299A (zh) * 2017-12-11 2018-04-13 凯泰铭科技(北京)有限公司 人伤理赔数据风险检测方法和系统
CN109919014A (zh) * 2019-01-28 2019-06-21 平安科技(深圳)有限公司 Ocr识别方法及其电子设备
WO2023006974A1 (en) * 2021-07-30 2023-02-02 Swiss Reinsurance Company Ltd. Optical fraud detector for automated detection of fraud in digital imaginary-based automobile claims, automated damage recognition, and method thereof
CN113971615A (zh) * 2021-10-27 2022-01-25 泰康保险集团股份有限公司 车险报案方法、装置、电子设备和介质
CN115100670A (zh) * 2022-07-21 2022-09-23 中国平安人寿保险股份有限公司 保单信息处理方法及其系统、电子设备、存储介质
CN115294592A (zh) * 2022-08-09 2022-11-04 中国平安人寿保险股份有限公司 理赔信息采集方法和采集装置、计算机设备、存储介质
CN116029326A (zh) * 2023-01-05 2023-04-28 凯泰铭科技(北京)有限公司 一种便于ai图像识别的车险定损码的建立方法
CN115965478A (zh) * 2023-03-17 2023-04-14 北京鲸鹳科技有限公司 一种理赔案件的自动核赔方法、设备及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
韦煜琳: ""大数据技术在互联网保险领域的应用研究——以W财产保险公司机动车辆保险为例"", 《中国优秀硕士学位论文全文数据库 信息科技辑》, pages 138 - 1090 *

Also Published As

Publication number Publication date
CN116612475B (zh) 2024-01-23

Similar Documents

Publication Publication Date Title
JP4829920B2 (ja) フォーム自動埋込方法及び装置、グラフィカルユーザインターフェース装置
EP3848888A1 (en) Method and apparatus for generating vehicle damage image based on gan network
CN110490181B (zh) 一种基于ocr识别技术的表单填写审核方法、装置、设备以及计算机存储介质
WO2020151340A1 (zh) 一种目标细胞标记方法、装置、存储介质及终端设备
CN111985202A (zh) 基于模板生成pdf电子签章的方法、设备及存储介质
CN113569863B (zh) 一种单据稽查的方法、系统、电子设备及存储介质
CN115688733B (zh) 标准文档编写的方法和系统
CN114038004A (zh) 一种证件信息提取方法、装置、设备及存储介质
CN112712014A (zh) 表格图片结构解析方法、系统、设备和可读存储介质
CN112749649A (zh) 一种智能识别并生成电子合同的方法及系统
CN112149401A (zh) 一种基于ocr的文档对比识别方法和系统
CN112200193A (zh) 基于多属性融合的分布式车牌识别方法、系统、装置
CN112396047A (zh) 训练样本生成方法、装置、计算机设备和存储介质
CN116612475B (zh) 一种车险数据中车型名称智能校正方法和设备
CN112784220A (zh) 一种纸质合同防篡改校验方法及系统
CN113723063A (zh) 一种rtf转html并在pdf文件实现效果的方法
CN113283231A (zh) 获取签章位的方法、设置系统、签章系统及存储介质
CN111898544B (zh) 文字图像匹配方法、装置和设备及计算机存储介质
CN112990142A (zh) 一种基于ocr的视频导图生成方法、装置、设备及存储介质
CN114821513B (zh) 一种基于多层网络的图像处理方法及装置、电子设备
CN116402130A (zh) 模型训练方法、信息抽取方法、装置、电子设备及介质
CN115116069A (zh) 文本处理方法、装置、电子设备及存储介质
CN114706886A (zh) 一种评测方法和装置、计算机设备、存储介质
KR100957508B1 (ko) 광학 문자 인식 시스템 및 방법
CN110717314B (zh) 一种文献著录格式转换方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant