CN112613319A - 一种车辆配件名称自动标准化方法和装置 - Google Patents

一种车辆配件名称自动标准化方法和装置 Download PDF

Info

Publication number
CN112613319A
CN112613319A CN201910881128.6A CN201910881128A CN112613319A CN 112613319 A CN112613319 A CN 112613319A CN 201910881128 A CN201910881128 A CN 201910881128A CN 112613319 A CN112613319 A CN 112613319A
Authority
CN
China
Prior art keywords
vehicle accessory
standardized
name
vehicle
names
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910881128.6A
Other languages
English (en)
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Lianbao Zhixin Technology Co ltd
Original Assignee
Hangzhou Lianbao Zhixin Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Lianbao Zhixin Technology Co ltd filed Critical Hangzhou Lianbao Zhixin Technology Co ltd
Priority to CN201910881128.6A priority Critical patent/CN112613319A/zh
Publication of CN112613319A publication Critical patent/CN112613319A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种车辆配件名称自动标准化方法和装置,所述方法包括:当获取到待标准化的车辆配件名称时,从待标准的车辆配件名称中提取关键词;根据关键词划分待标准化的车辆配件名称,得到待标准化车辆配件名称的分词;将所述车辆配件名称分词与预设车辆配件名称库对比,得到对比结果;根据所述对比结果修正所述待标准化的车辆配件名称,使待标准的车辆配件名称转化成标准化车辆配件名称。本发明还公开了一种车辆配件名称自动标准化装置。本发明实现了车辆保险领域由于许多供应商命名不规范所导致的车辆配件名称不匹配问题,提高了车辆理赔中车辆配件定损的准确性。

Description

一种车辆配件名称自动标准化方法和装置
技术领域
本发明实例涉及车辆理赔领域,尤其涉及一种车辆配件名称自动标准化方法和装置。
背景技术
随着中国经济水平的飞速发展,我国人民生活水平不断提高,汽车已经成为每个家庭的必需品,我国汽车保有量近年来不断攀升,2017年底每100个人有14个人拥有机动车,虽然未达到世界平均水平,但仍有很大的发展空间。机动车辆保险是财产保险企业的主要业务,在财产保险公司中有着举足轻重的地位,是我国财产保险公司保费收入的主要来源,在车辆理赔过程中,一个很重要的环节就是车辆配件定损,由于车辆配件供应商对同一配件的名称界定不同,导致车辆定损的准确性有待商榷,严重影响了用户的理赔体验,因此,对车辆配件名称的标准化有利于车辆理赔企业提高工作效率,现有的车辆配件名称标准化技术主要通过Excel进行简易整理和搜索,俨然已经成为车辆理赔中的痛点。
发明内容
本发明实例涉及车辆理赔领域,尤其涉及一种车辆配件名称自动标准化方法和装置,旨在解决由于许多供应商命名不规范所导致的车辆配件名称不匹配问题,可提高车辆理赔中车辆配件定损的准确性。
一种车辆配件名称自动标准化方法包括:
当获取到待标准化的车辆配件名称时,对待标准化的车辆配件名称进行预处理;将待标准的车辆配件名称文本删除多余空格,标准化字母、数字和符号的格式,统一转换成英文状态下的字母、数字和符号;将待标准的车辆配件名称文本中的停顿词进行处理,如“哦”、“呢”,“的”等停顿词;根据车辆配件名称标准化词库,将待标准的车辆配件名称文本中的歧义词进行处理,消除歧义;
利用分词工具划分待标准化的车辆配件名称,得到待标准化车辆配件名称的分词;配置ICTCLAS分词工具的语义库,语义库中主要包含车辆配件名称相关的词语;对预处理的车辆配件名称使用ICTCLAS分词工具进行分词,提取待标准的车辆配件名称中的分词;
将所述车辆配件名称分词与预设车辆配件名称库对比,得到对比结果;根据关键词的优先级,依次与预先设定的关键词库,利用词向量Word2vec进行对比,得到待标准车辆配件名称每个分词的匹配;对匹配到关键词的分词,根据阈值决定是否替换,大于阈值的分词进行替换,小于阈值的分词不做处理;
根据对比结果修正待标准化的车辆配件名称,使待标准化的车辆配件名称转化成标准化车辆配件名称;根据关键词替换分词,实现对所述待标准化车辆名称的修正;合并分词形成待标准化的车辆配件名称,将其与预设车辆配件名称库进行检索,采用词向量Word2vec的方式,通过欧式距离计算待标准化车辆配件名称与预设车辆配件名称的相似度;达到相似度阈值的待标准化车辆配件名称直接转化成标准化车辆配件名称,达不到相似度阈值的待标准化车辆配件名称转化成与预设车辆配件名称欧式距离最接近的标准化车辆配件名称。
一种车辆配件名称自动标准化装置包括:
车辆配件名称提取模块,用于获取到待标准化的车辆配件名称时,从待标准的车辆配件名称中提取关键词;
车辆配件名称划分模块,用于划分待标准化的车辆配件名称,得到待标准化车辆配件名称的分词;
车辆配件名称对比模块,用于车辆配件名称分词与预设车辆配件名称库对比,得到对比结果;
车辆配件名称补全模块,用于修正所述待标准化的车辆配件名称,使待标准的车辆配件名称转化成标准化车辆配件名称;
附图说明
图1为本发明方法的流程图
图2为本发明的装置图
具体实施方式
下面结合附图说明进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所述。
如图1所示,一种车辆配件名称自动标准化方法,它包含如下步骤:
步骤1:当获取到待标准化的车辆配件名称时,对待标准化的车辆配件名称进行预处理;将待标准的车辆配件名称文本删除多余空格,标准化字母、数字和符号的格式,统一转换成英文状态下的字母、数字和符号;将待标准的车辆配件名称文本中的停顿词进行处理,如“哦”、“呢”,“的”等停顿词;根据车辆配件名称标准化词库,将待标准的车辆配件名称文本中的歧义词进行处理,消除歧义;
步骤2:利用分词工具划分待标准化的车辆配件名称,得到待标准化车辆配件名称的分词;配置ICTCLAS分词工具的语义库,语义库中主要包含车辆配件名称相关的词语;对预处理的车辆配件名称使用ICTCLAS分词工具进行分词,提取待标准的车辆配件名称中的分词;
步骤3:将所述车辆配件名称分词与预设车辆配件名称库对比,得到对比结果;根据关键词的优先级,依次与预先设定的关键词库,利用词向量Word2vec进行对比,得到待标准车辆配件名称每个分词的匹配;对匹配到关键词的分词,根据阈值决定是否替换,大于阈值的分词进行替换,小于阈值的分词不做处理;
步骤4:根据对比结果修正待标准化的车辆配件名称,使待标准化的车辆配件名称转化成标准化车辆配件名称;根据关键词替换分词,实现对所述待标准化车辆名称的修正;合并分词形成待标准化的车辆配件名称,将其与预设车辆配件名称库进行检索,采用词向量Word2vec的方式,通过欧式距离计算待标准化车辆配件名称与预设车辆配件名称的相似度;达到相似度阈值的待标准化车辆配件名称直接转化成标准化车辆配件名称,达不到相似度阈值的待标准化车辆配件名称转化成与预设车辆配件名称欧式距离最接近的标准化车辆配件名称。
如图2所示,一种车辆配件名称自动标准化装置,它包含四个模块:
模块1:车辆配件名称提取模块,用于获取到待标准化的车辆配件名称时,从待标准的车辆配件名称中提取关键词;
模块2:车辆配件名称划分模块,用于划分待标准化的车辆配件名称,得到待标准化车辆配件名称的分词;
模块3:车辆配件名称对比模块,用于车辆配件名称分词与预设车辆配件名称库对比,得到对比结果;
模块4:车辆配件名称补全模块,用于修正所述待标准化的车辆配件名称,使待标准的车辆配件名称转化成标准化车辆配件名称;
对具体实施方案的描述仅仅是为了帮助解释本发明,而不是用来限制本发明的。任何本领域的技术人员均可利用本发明的思想进行一些改动和变化,只要其技术手段没有脱离本发明的思想和要点,仍在本发明的保护范围之内。

Claims (2)

1.一种车辆配件名称自动标准化方法和装置,其特征在于,所述的车辆配件名称自动标准化方法包括:
当获取到待标准化的车辆配件名称时,对待标准化的车辆配件名称进行预处理;
利用分词工具划分待标准化的车辆配件名称,得到待标准化车辆配件名称的分词;
将所述车辆配件名称分词与预设车辆配件名称库对比,得到对比结果;
根据对比结果修正待标准化的车辆配件名称,使待标准化的车辆配件名称转化成标准化车辆配件名称。
2.如权利要求书1所述的车辆配件名称自动标准化方法,其特征在于,当获取到待标准化的车辆配件名称时,对待标准的车辆配件名称预处理的步骤包括:
将待标准的车辆配件名称文本删除多余空格,标准化字母、数字和符号的格式,统一转换成英文状态下的字母、数字和符号;
将待标准的车辆配件名称文本中的停顿词进行处理,如“哦”、“呢”,“的”等停顿词;
根据车辆配件名称标准化词库,将待标准的车辆配件名称文本中的歧义词进行处理,消除歧义;
如权利要求书1所述的车辆配件名称自动标准化方法,其特征在于,根据分词工具划分待标准化的车辆配件名称,得到待标准化车辆配件名称分词的步骤包括:
配置ICTCLAS分词工具的语义库,语义库中主要包含车辆配件名称相关的词语;
对预处理的车辆配件名称使用ICTCLAS分词工具进行分词,提取待标准的车辆配件名称中的分词;
如权利要求书1所述的车辆配件名称自动标准化方法,其特征在于,将所述车辆配件名称分词与预设车辆配件名称库对比,得到对比结果的步骤包括:
根据权利要求书3中关键词的优先级,依次与预先设定的关键词库,利用词向量Word2vec进行对比,得到待标准车辆配件名称每个分词的匹配;
对匹配到关键词的分词,根据阈值决定是否替换,大于阈值的分词进行替换,小于阈值的分词不做处理;
如权利要求书1所述的车辆配件名称自动标准化方法,其特征在于,根据所述对比结果修正所述待标准化的车辆配件名称,使待标准的车辆配件名称转化成标准化车辆配件名称的步骤包括;
根据权利要求书4,根据关键词替换分词,实现对所述待标准化车辆名称的修正;
合并分词形成待标准化的车辆配件名称,将其与预设车辆配件名称库进行检索,采用词向量Word2vec的方式,通过欧式距离计算待标准化车辆配件名称与预设车辆配件名称的相似度;
达到相似度阈值的待标准化车辆配件名称直接转化成标准化车辆配件名称,达不到相似度阈值的待标准化车辆配件名称转化成与预设车辆配件名称欧式距离最接近的标准化车辆配件名称;
一种车辆配件名称自动标准化装置,其特征在于,所述的车辆配件名称自动标准化装置包括:
车辆配件名称提取模块,用于获取到待标准化的车辆配件名称时,从待标准的车辆配件名称中提取关键词;
车辆配件名称划分模块,用于划分待标准化的车辆配件名称,得到待标准化车辆配件名称的分词;
车辆配件名称对比模块,用于车辆配件名称分词与预设车辆配件名称库对比,得到对比结果;
车辆配件名称补全模块,用于修正所述待标准化的车辆配件名称,使待标准的车辆配件名称转化成标准化车辆配件名称。
CN201910881128.6A 2019-09-18 2019-09-18 一种车辆配件名称自动标准化方法和装置 Pending CN112613319A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910881128.6A CN112613319A (zh) 2019-09-18 2019-09-18 一种车辆配件名称自动标准化方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910881128.6A CN112613319A (zh) 2019-09-18 2019-09-18 一种车辆配件名称自动标准化方法和装置

Publications (1)

Publication Number Publication Date
CN112613319A true CN112613319A (zh) 2021-04-06

Family

ID=75224234

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910881128.6A Pending CN112613319A (zh) 2019-09-18 2019-09-18 一种车辆配件名称自动标准化方法和装置

Country Status (1)

Country Link
CN (1) CN112613319A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116089729A (zh) * 2023-03-31 2023-05-09 浙江口碑网络技术有限公司 搜索推荐方法、设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007044434A2 (en) * 2005-10-05 2007-04-19 Piper Communications, Inc. Systems and methods for electronic searching of automotive parts database
US20140379386A1 (en) * 2013-06-25 2014-12-25 Arthur Paul Drennan, III System and method for evaluating text to support multiple insurance applications
CN106055650A (zh) * 2016-05-31 2016-10-26 深圳市永兴元科技有限公司 地址标准化方法和装置
CN108874769A (zh) * 2018-05-16 2018-11-23 深圳开思时代科技有限公司 配件名称标准化方法及装置、电子设备和介质
CN109165291A (zh) * 2018-06-29 2019-01-08 厦门快商通信息技术有限公司 一种文本匹配方法及电子设备
CN109740166A (zh) * 2019-01-17 2019-05-10 杭州联保致新科技有限公司 一种车型数据名称标准化治理方法
CN109960795A (zh) * 2019-02-18 2019-07-02 平安科技(深圳)有限公司 一种地址信息标准化方法、装置、计算机设备及存储介质
CN110032728A (zh) * 2019-02-01 2019-07-19 阿里巴巴集团控股有限公司 疾病名称标准化的转换方法和装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007044434A2 (en) * 2005-10-05 2007-04-19 Piper Communications, Inc. Systems and methods for electronic searching of automotive parts database
US20140379386A1 (en) * 2013-06-25 2014-12-25 Arthur Paul Drennan, III System and method for evaluating text to support multiple insurance applications
CN106055650A (zh) * 2016-05-31 2016-10-26 深圳市永兴元科技有限公司 地址标准化方法和装置
CN108874769A (zh) * 2018-05-16 2018-11-23 深圳开思时代科技有限公司 配件名称标准化方法及装置、电子设备和介质
CN109165291A (zh) * 2018-06-29 2019-01-08 厦门快商通信息技术有限公司 一种文本匹配方法及电子设备
CN109740166A (zh) * 2019-01-17 2019-05-10 杭州联保致新科技有限公司 一种车型数据名称标准化治理方法
CN110032728A (zh) * 2019-02-01 2019-07-19 阿里巴巴集团控股有限公司 疾病名称标准化的转换方法和装置
CN109960795A (zh) * 2019-02-18 2019-07-02 平安科技(深圳)有限公司 一种地址信息标准化方法、装置、计算机设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116089729A (zh) * 2023-03-31 2023-05-09 浙江口碑网络技术有限公司 搜索推荐方法、设备及存储介质
CN116089729B (zh) * 2023-03-31 2023-07-18 浙江口碑网络技术有限公司 搜索推荐方法、设备及存储介质

Similar Documents

Publication Publication Date Title
US8014604B2 (en) OCR of books by word recognition
WO2021012570A1 (zh) 数据录入方法、装置、设备及存储介质
CN109446885B (zh) 一种基于文本的元器件识别方法、系统、装置和存储介质
CN110704633A (zh) 命名实体识别方法、装置、计算机设备及存储介质
US8391614B2 (en) Determining near duplicate “noisy” data objects
CN108763380B (zh) 商标识别检索方法、装置、计算机设备和存储介质
CN1571980A (zh) 字符串识别
CN111814463B (zh) 国际疾病分类编码推荐方法、系统及相应设备和存储介质
CN103778185A (zh) 一种用于数据库审计系统的sql语句解析方法和系统
WO2003012685A2 (en) A data quality system
CN111177375B (zh) 一种电子文档分类方法及装置
CN106484677B (zh) 一种基于最小信息量的汉语快速分词系统及方法
CN117390214B (zh) 一种基于ocr技术的文件检索方法及系统
US7406201B2 (en) Correcting segmentation errors in OCR
US9773047B2 (en) Foreign organization name matching
CN112613319A (zh) 一种车辆配件名称自动标准化方法和装置
CN114579693B (zh) 一种nlp文本安全审核多级检索系统
CN115953123A (zh) 机器人自动化流程的生成方法、装置、设备及存储介质
CN111815108A (zh) 一种电网工程设计变更与现场签证审批单的评价方法
CN116522872A (zh) 一种基于相似度计算的元数据字段中文名补全方法、存储介质及系统
Ford et al. Pattern matching techniques for correcting low-confidence OCR words in a known context
US20040114803A1 (en) Method of stricken-out character recognition in handwritten text
CN114117031A (zh) 名单筛查方法、装置、设备及计算机存储介质
CN109614621B (zh) 一种校正文本的方法、装置及设备
CN114385794A (zh) 企业知识图谱的生成方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination