CN116662476A - 基于数据字典的车险案件压缩管理方法及系统 - Google Patents
基于数据字典的车险案件压缩管理方法及系统 Download PDFInfo
- Publication number
- CN116662476A CN116662476A CN202310956190.3A CN202310956190A CN116662476A CN 116662476 A CN116662476 A CN 116662476A CN 202310956190 A CN202310956190 A CN 202310956190A CN 116662476 A CN116662476 A CN 116662476A
- Authority
- CN
- China
- Prior art keywords
- accessory
- identifier
- label
- information
- short
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007906 compression Methods 0.000 title claims abstract description 67
- 230000006835 compression Effects 0.000 title claims abstract description 67
- 238000007726 management method Methods 0.000 title claims abstract description 31
- 238000000034 method Methods 0.000 claims description 19
- 230000010354 integration Effects 0.000 claims description 12
- 238000010276 construction Methods 0.000 claims description 5
- 238000011084 recovery Methods 0.000 claims 1
- 238000012545 processing Methods 0.000 abstract description 19
- 238000013144 data compression Methods 0.000 abstract description 2
- 238000013507 mapping Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/374—Thesaurus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Finance (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Accounting & Taxation (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Technology Law (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明提供了基于数据字典的车险案件压缩管理方法及系统,涉及数据压缩技术领域,包括:遍历提取车险案件中的所有配件,去重获取配件基础信息列表,构建数据字典,包括标识符字典和短标签字典,在标识符字典里查找标识符获取配件标识符,将配件基础信息替换为配件标识符,获得配件压缩信息,遍历提取标签信息,去重获取标签信息列表,在短标签字典中获取短标签,将标签信息替换为短标签获得标签压缩信息,在车险案件使用前进行标签还原,再进行配件还原,获取车险案件。本发明解决了传统的车险案件管理系统存储大量重复的配件基础信息和标签信息,导致数据冗余,使得存在存储空间需求大、存储成本高、查询和处理效率低的技术问题。
Description
技术领域
本发明涉及数据压缩技术领域,具体涉及基于数据字典的车险案件压缩管理方法及系统。
背景技术
随着保险行业的发展,每一个车辆都会投保车辆保险,在日常的生活中,车辆事故总有发生,随着全球汽车保有量的增加,汽车保险需求也相应增长,人们购买汽车后通过汽车保险来保障自身权益,如车辆损失、第三者责任等,这使得车险案件数量呈现上升趋势,保险公司需要有效管理和处理这些案件,包括报案、调查、理赔等流程,确保公正、高效的索赔服务,因此对于车险案件的高效管理就显得尤为重要。
而现今常用的车险案件管理方法还存在着一定的弊端,传统的车险案件管理系统存储大量重复的配件基础信息和标签信息,导致数据冗余,并且存储这些信息需要大量的存储空间,查询和处理操作消耗大量的时间和计算资源,使得存在存储空间需求大、存储成本高、查询和处理效率低的技术问题。因此,对于车险案件管理还存在着一定的可提升空间。
发明内容
本申请通过提供了基于数据字典的车险案件压缩管理方法及系统,旨在解决传统的车险案件管理系统存储大量重复的配件基础信息和标签信息,导致数据冗余,并且存储这些信息需要大量的存储空间,查询和处理操作消耗大量的时间和计算资源,使得存在存储空间需求大、存储成本高、查询和处理效率低的技术问题。
鉴于上述问题,本申请提供了基于数据字典的车险案件压缩管理方法及系统。
本申请公开的第一个方面,提供了基于数据字典的车险案件压缩管理方法,所述方法包括:遍历提取车险案件中的所有配件,去重获取配件基础信息列表;构建数据字典,所述数据字典包括标识符字典和短标签字典;根据所述配件基础信息列表在所述标识符字典里查找标识符,获取配件标识符;将所述配件基础信息列表中的配件基础信息替换为所述配件标识符,获得配件压缩信息;遍历提取所述车险案件中的所有标签信息,去重获取标签信息列表;基于所述标签信息列表在所述短标签字典中查询获取短标签,并将所述标签信息列表中的标签信息替换为所述短标签,获得标签压缩信息;在车险案件使用前对所述标签压缩信息进行标签还原,再对所述配件压缩信息进行配件还原,获取所述车险案件。
本申请公开的另一个方面,提供了基于数据字典的车险案件压缩管理系统,所述系统用于上述方法,所述系统包括:基础信息获取模块,所述基础信息获取模块用于遍历提取车险案件中的所有配件,去重获取配件基础信息列表;数据字典构建模块,所述数据字典构建模块用于构建数据字典,所述数据字典包括标识符字典和短标签字典;配件标识符获取模块,所述配件标识符获取模块用于根据所述配件基础信息列表在所述标识符字典里查找标识符,获取配件标识符;配件标识符替换模块,所述配件标识符替换模块用于将所述配件基础信息列表中的配件基础信息替换为所述配件标识符,获得配件压缩信息;标签信息获取模块,所述标签信息获取模块用于遍历提取所述车险案件中的所有标签信息,去重获取标签信息列表;压缩信息获取模块,所述压缩信息获取模块用于基于所述标签信息列表在所述短标签字典中查询获取短标签,并将所述标签信息列表中的标签信息替换为所述短标签,获得标签压缩信息;配件还原模块,所述配件还原模块用于在车险案件使用前对所述标签压缩信息进行标签还原,再对所述配件压缩信息进行配件还原,获取所述车险案件。
本申请中提供的一个或多个技术方案,至少具有如下技术效果或优点:
遍历提取车险案件中的所有配件,去重获取配件基础信息列表,构建数据字典,包括标识符字典和短标签字典,在标识符字典里查找标识符,获取配件标识符,将配件基础信息替换为配件标识符,获得配件压缩信息,遍历提取车险案件中的所有标签信息,去重获取标签信息列表,在短标签字典中查询获取短标签,并将标签信息替换为短标签,获得标签压缩信息,对标签压缩信息进行标签还原,再对配件压缩信息进行配件还原,获取车险案件。解决了传统的车险案件管理系统存储大量重复的配件基础信息和标签信息,导致数据冗余,并且存储这些信息需要大量的存储空间,查询和处理操作消耗大量的时间和计算资源,使得存在存储空间需求大、存储成本高、查询和处理效率低的技术问题,实现了通过使用标识符和短标签替代重复信息,有效减少了数据冗余,并将配件基础信息和标签信息转换为相应的标识符和短标签,以字典方式存储和压缩管理,大幅降低了存储空间的需求,达到节省存储成本、提升配件和标签的查询和处理效率。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
图1为本申请实施例提供了基于数据字典的车险案件压缩管理方法流程示意图;
图2为本申请实施例提供了基于数据字典的车险案件压缩管理方法中生成标识符字典的流程示意图;
图3为本申请实施例提供了基于数据字典的车险案件压缩管理方法中获取配件标识符的流程示意图;
图4为本申请实施例提供了基于数据字典的车险案件压缩管理系统的结构示意图。
附图标记说明:基础信息获取模块10,数据字典构建模块20,配件标识符获取模块30,配件标识符替换模块40,标签信息获取模块50,压缩信息获取模块60,配件还原模块70。
具体实施方式
本申请实施例通过提供基于数据字典的车险案件压缩管理方法,解决了传统的车险案件管理系统存储大量重复的配件基础信息和标签信息,导致数据冗余,并且存储这些信息需要大量的存储空间,查询和处理操作消耗大量的时间和计算资源,使得存在存储空间需求大、存储成本高、查询和处理效率低的技术问题,实现了通过使用标识符和短标签替代重复信息,有效减少了数据冗余,并将配件基础信息和标签信息转换为相应的标识符和短标签,以字典方式存储和压缩管理,大幅降低了存储空间的需求,达到节省存储成本、提升配件和标签的查询和处理效率。
在介绍了本申请基本原理后,下面将结合说明书附图来具体介绍本申请的各种非限制性的实施方式。
实施例一
如图1所示,本申请实施例提供了基于数据字典的车险案件压缩管理方法,所述方法包括:
步骤S100:遍历提取车险案件中的所有配件,去重获取配件基础信息列表;
具体而言,从车险案件的数据源中获取所有配件信息,对于每个配件,提取其基本信息,如品牌、型号、规格等,并将这些信息组成一个配件基础信息对象,对配件基础信息对象进行去重操作,例如,通过比较各个属性值是否相同或使用唯一标识符,来判断两个配件是否相同,以此去除重复的配件基础信息,得到一个配件基础信息列表,其中包含了所有不重复的配件的基本信息。
步骤S200:构建数据字典,所述数据字典包括标识符字典和短标签字典;
进一步而言,如图2所示,本申请步骤S200包括:
步骤S210:获取车辆配件基础信息集合,对所述车辆配件基础信息集合进行特征分类,获取配件分类特征信息;
步骤S220:将所述车辆配件基础信息集合按照所述配件分类特征信息进行整合,获得车辆配件整合基础信息集合;
步骤S230:根据所述车辆配件整合基础信息集合,生成标识符编码规则;
步骤S240:基于所述标识符编码规则对所述车辆配件整合基础信息集合中的配件基础信息进行编码,获得车辆配件标识符集合;
步骤S250:基于所述车辆配件标识符集合,组成所述标识符字典。
具体而言,从车辆数据库中获取车辆配件的基础信息集合,这些基础信息包括配件的品牌、车系、车型、规格等,根据配件基础信息集合的内容对配件进行分类,例如采用聚类算法,自动识别配件之间的相似性,并将其归为不同的分类,根据分类结果提取出相关的配件分类特征信息,例如配件名称(包括外尾灯、内尾灯、后保险杠支架等)、车辆部分编号、原始设备制造商等分类特征信息进行配件分类,这些配件分类特征信息用于标识和描述每个配件分类。
将车辆配件基础信息按照设定的配件分类特征进行分组,在每个分组内,通过合并相同分类特征的配件基础信息,将属于同一分类特征的配件基础信息进行整合,整合后,每个分组都有一个对应的整合的配件基础信息对象。从各个分组的整合结果中提取出整合的车辆配件整合基础信息集合,这个集合包含了按照配件分类特征进行整合后的配件基础信息数据。
对车辆配件整合基础信息集合进行分析,获取每个配件所包含的属性和特征,根据整合基础信息的特点和需求,确定标识符编码规则,包括编码长度、编码前缀、编码规则和约束条件等,基于标识符编码规则,设计方便实施和管理的编码方案,该方案涉及如何生成位移的标识符、如何跟踪已分配的标识符,并确保其在系统中的唯一性和一致性。
遍历车辆配件整合基础信息集合,对于集合中的每个配件基础信息,根据确定的标识符编码规则,为配件基础信息自动生成并转换为相应的配件标识符,这些标识符将代表原始的配件基础信息,并与其建立了唯一的映射关系,这样可以实现对配件信息的压缩和管理,将生成的配件标识符记录下来,存储到配件标识符集合中,重复该步骤,直到遍历完所有的配件基础信息。
准备一个数据结构,例如采用关联数组的数据结构来存储标识符字典,遍历车辆配件标识符集合,对于每个配件的标识符,将配件标识符作为键(key)添加到标识符字典中,并将其与配件基础信息相关联作为值(value),这样就建立了配件标识符与配件基础信息之间的映射关系,重复以上步骤,直到遍历完所有的配件标识符。
通过以上步骤,可将车辆配件的标识符集合与相应的配件基础信息组成一个完整的标识符字典,该字典用于存储配件标识符和其对应的配件基础信息之间的映射关系,这样能够方便地通过配件标识符查找对应的配件基础信息,并为后续的配件压缩和还原提供支持和参考。
进一步而言,本申请步骤S200还包括:
步骤S260:获取车险案件标签信息集合;
步骤S270:根据所述车险案件标签信息集合,生成短标签编码规则;
步骤S280:基于所述短标签编码规则对所述车险案件标签信息集合中的标签信息进行编码,获得车险案件短标签集合;
步骤S290:基于所述车险案件短标签集合,生成所述短标签字典。
具体而言,从车险案件数据中获取每个案件的相关信息,对于每个车险案件,提取其中的标签信息,所述标签信息可以是用于描述车辆、事故、损失等方面的关键词或短语,将提取到的标签信息整理成一个标签信息集合,这个集合可以使用列表、数组或其他适当的数据结构来存储,用于后续的配件分类、压缩操作。
对车险案件的标签信息集合进行分析,提取标签的语义、长度、重复度等方面的特征,确定标签的特点、属性和分布情况。根据分析的结果,确定短标签编码规则,这些规则包括编码长度、编码方式、特殊字符定义和约束条件等,基于短标签编码规则,设计方便实施和管理的编码方案,该方案涉及保证短标签的唯一性、可读性和易于处理。
遍历车险案件标签信息集合,对于集合中的每个标签信息,根据确定的短标签编码规则,将标签信息转换为相应的短标签编码,将生成的短标签记录下来,并存储到短标签集合中,重复以上步骤,直到遍历完所有的标签信息。通过以上步骤,可将车险案件标签信息集合中的每个标签信息,根据短标签编码规则,转化为相应的短标签编码,这些短标签编码可以作为车险案件的短标签集合,用于后续的存储、压缩或其他处理操作,短标签编码能在一定程度上减少数据存储空间,并提高数据处理效率。
准备一个数据结构,例如关联数组,用于存储短标签字典,遍历车险案件的短标签集合,对于集合中的每个短标签,验证当前短标签是否已经存在于短标签字典中,如果当前短标签不存在于字典中,将其添加到短标签字典中,可以将短标签作为键(key)使用,并添加一些与该短标签相关的信息作为值(value),例如原始标签、计数等,重复以上步骤,直到遍历完所有的短标签集合。
通过以上步骤,成功基于车险案件的短标签集合生成了短标签字典,该字典包含了所有的短标签并保留了与之相关的信息,短标签字典用于存储短标签和其相关信息之间的映射关系,方便后续标签压缩和还原操作的使用。
步骤S300:根据所述配件基础信息列表在所述标识符字典里查找标识符,获取配件标识符;
进一步而言,如图3所示,本申请步骤S300包括:
步骤S310:判断所述配件基础信息列表是否在标识符字典里查找到标识符,若查找到,则匹配获取所述配件标识符;
步骤S320:若未查找到,基于所述标识符编码规则生成新配件标识符;
步骤S330:将所述新配件标识符写入到所述标识符字典中,并返回所述新配件标识符作为所述配件标识符。
具体而言,遍历配件基础信息列表,使用配件基础信息作为关键字,在标识符字典中进行查找操作,尝试找到配件基础信息对应的标识符,如果在标识符字典中找到了匹配的标识符,则表示成功匹配,并获得该配件的标识符,继续处理下一个配件基础信息,重复以上步骤,直到遍历完所有的配件基础信息或找到所有匹配的标识符。
如果在标识符字典中未找到配件基础信息的标识符,根据所确定的标识符编码规则,使用相应的算法或规则来生成新的配件标识符,将生成的新配件标识符记录下来,这样确保了每个配件都有一个唯一的标识符,并满足标识符的编码规则要求。
将新生成的配件标识符作为键(key),与相应的配件基础信息作为值(value),添加到标识符字典中,这样建立了配件标识符与配件基础信息之间的映射关系,将新生成的配件标识符作为结果返回,并且获得该新配件标识符作为配件的标识符,这样确保了每个配件都有一个唯一的标识符,并满足标识符的编码规则要求。
步骤S400:将所述配件基础信息列表中的配件基础信息替换为所述配件标识符,获得配件压缩信息;
具体而言,遍历配件基础信息列表,根据当前配件基础信息,在建立的配件标识符字典中查找相应的配件标识符,将当前配件基础信息替换为所得到的配件标识符,这样就将原本的配件基础信息转化为压缩后的配件标识符,重复以上步骤,直到遍历完所有的配件基础信息列表,每个配件的基础信息都被替换为对应的配件标识符,从而获得配件压缩信息。通过使用配件标识符代替详细的配件基础信息,可以实现更高效的车险案件管理和存储,减少存储空间和提升数据处理效率。
步骤S500:遍历提取所述车险案件中的所有标签信息,去重获取标签信息列表;
具体而言,遍历车险案件,从车险案件数据中获取每个案件的相关信息,对于每个车险案件,提取其中的标签信息,包括描述车辆、事故、损失等方面的关键词或短语,对提取到的标签信息列表进行去重操作,例如有比较字符串的内容,来判断两个标签是否相同,进而去除重复的标签信息,整理去重后的标签信息,得到标签信息列表,其中包含了所有不重复的标签信息。
步骤S600:基于所述标签信息列表在所述短标签字典中查询获取短标签,并将所述标签信息列表中的标签信息替换为所述短标签,获得标签压缩信息;
进一步而言,本申请步骤S600包括:
步骤S610:判断所述标签信息列表在所述短标签字典中是否查询到短标签,若查询到,则匹配获取所述短标签;
步骤S620:若未查询到,基于所述短标签编码规则生成新短标签;
步骤S630:将所述新短标签写入到所述短标签字典中,并返回所述新短标签作为所述短标签。
具体而言,遍历标签信息列表,使用当前标签信息作为关键字,在短标签字典中进行查询操作,尝试找到标签信息对应的短标签,如果在短标签字典中找到了匹配的短标签,则表示成功匹配,并获得该短标签,继续处理下一个标签信息,重复以上步骤,直到遍历完所有的标签信息或找到所有匹配的短标签。
如果在短标签字典中未找到匹配的短标签,则根据所确定的短标签编码规则,使用相应的算法或规则来生成新的短标签,将生成的新短标签记录下来。将新生成的短标签作为键(key)添加到短标签字典中,并将其关联的其他信息作为值(value)存储,作为结果,将新生成的短标签作为所述短标签返回,以便后续使用。通过该步骤,成功将新生成的短标签写入到短标签字典中,并且获得了该新短标签作为所述短标签。这样确保了短标签字典中包含了所有标签的唯一短标签,并建立了短标签与其相关信息的映射关系。
将当前标签信息替换为对应的短标签,这样就将原始的标签信息转化为压缩后的短标签形式,重复以上步骤,直到遍历完所有的标签信息列表,通过这个过程,每个标签信息都会被替换为相应的短标签,从而获得了标签的压缩信息,使用短标签能够显著减少数据存储空间,并提高数据处理效率。
步骤S700:在车险案件使用前对所述标签压缩信息进行标签还原,再对所述配件压缩信息进行配件还原,获取所述车险案件。
进一步而言,本申请步骤S700包括:
步骤S710:提取所述标签压缩信息里的所述短标签,去重生成短标签列表;
步骤S720:基于所述短标签列表在所述短标签字典中查询标签信息,若查询到,将所述短标签列表中的短标签替换为标签信息,获得所述标签信息列表;
步骤S730:如果未查询到,则返回所述短标签。
具体而言,遍历标签压缩信息,针对每条压缩信息,提取其中包含的短标签,将提取到的短标签加入一个临时的集合,如哈希集合,使短标签自动去重,将去重后的短标签从临时集合转化为列表形式。
使用当前短标签作为关键字,在短标签字典中进行查询操作,尝试找到与之匹配的标签信息,如果在短标签字典中找到匹配的标签信息,将找到的标签信息替换掉原始的短标签,得到最终的标签信息列表,该列表含有从短标签转换而来的详细、可读性的标签信息。
如果在短标签字典中未找到匹配的标签信息,则保留原始的短标签,并返回原始的短标签作为结果。这样就能够得到一个包含标签信息或原始短标签的列表,即标签还原信息,用于后续的数据处理和分析。
进一步而言,本申请步骤S700还包括:
步骤S740:提取所述配件压缩信息里的所述配件标识符,去重生成配件标识符列表;
步骤S750:基于所述配件标识符列表在所述标识符字典中查询配件基础信息,若查询到,将所述配件标识符列表中的配件标识符替换为配件基础信息,获得所述配件基础信息列表;
步骤S760:如果未查询到,则返回所述配件标识符。
具体而言,遍历配件压缩信息,针对每条压缩信息,提取其中包含的配件标识符,将提取到的配件标识符加入一个临时的集合,如哈希集合,使配件标识符自动去重,将去重后的配件标识符从临时集合转化为列表形式,生成配件标识符列表。
对于列表中的每个配件标识符,使用当前配件标识符作为关键字,在标识符字典中进行查询操作,尝试找到与之匹配的配件基础信息,判断是否找到配件基础信息,如果在标识符字典中找到匹配的配件基础信息,则将找到的配件基础信息替换掉原始的配件标识符,得到最终的配件基础信息列表,其中包含了从配件标识符转换而来的详细、可读性的配件基础信息。
如果在标识符字典中未找到匹配的配件基础信息,则保留原始的配件标识符,并返回原始的配件标识符作为结果。这样能够得到一个含有配件基础信息或原始配件标识符的列表,即配件还原信息,用于后续的数据处理和分析。
最终合并还原的标签和配件信息,得到完整的车险案件。通过这个过程,可以将标签压缩信息还原为原始的标签信息,同时将配件压缩信息还原为原始的配件基础信息,从而获取完整的车险案件数据。这样能够保留原始的信息内容,方便后续的分析、处理和管理。
综上所述,本申请实施例所提供的基于数据字典的车险案件压缩管理方法及系统具有如下技术效果:
遍历提取车险案件中的所有配件,去重获取配件基础信息列表,构建数据字典,包括标识符字典和短标签字典,在标识符字典里查找标识符,获取配件标识符,将配件基础信息替换为配件标识符,获得配件压缩信息,遍历提取车险案件中的所有标签信息,去重获取标签信息列表,在短标签字典中查询获取短标签,并将标签信息替换为短标签,获得标签压缩信息,对标签压缩信息进行标签还原,再对配件压缩信息进行配件还原,获取车险案件。
解决了传统的车险案件管理系统存储大量重复的配件基础信息和标签信息,导致数据冗余,并且存储这些信息需要大量的存储空间,查询和处理操作消耗大量的时间和计算资源,使得存在存储空间需求大、存储成本高、查询和处理效率低的技术问题,实现了通过使用标识符和短标签替代重复信息,有效减少了数据冗余,并将配件基础信息和标签信息转换为相应的标识符和短标签,以字典方式存储和压缩管理,大幅降低了存储空间的需求,达到节省存储成本、提升配件和标签的查询和处理效率。
实施例二
基于与前述实施例中基于数据字典的车险案件压缩管理方法相同的发明构思,如图4所示,本申请提供了基于数据字典的车险案件压缩管理系统,所述系统包括:
基础信息获取模块10,所述基础信息获取模块10用于遍历提取车险案件中的所有配件,去重获取配件基础信息列表;
数据字典构建模块20,所述数据字典构建模块20用于构建数据字典,所述数据字典包括标识符字典和短标签字典;
配件标识符获取模块30,所述配件标识符获取模块30用于根据所述配件基础信息列表在所述标识符字典里查找标识符,获取配件标识符;
配件标识符替换模块40,所述配件标识符替换模块40用于将所述配件基础信息列表中的配件基础信息替换为所述配件标识符,获得配件压缩信息;
标签信息获取模块50,所述标签信息获取模块50用于遍历提取所述车险案件中的所有标签信息,去重获取标签信息列表;
压缩信息获取模块60,所述压缩信息获取模块60用于基于所述标签信息列表在所述短标签字典中查询获取短标签,并将所述标签信息列表中的标签信息替换为所述短标签,获得标签压缩信息;
配件还原模块70,所述配件还原模块70用于在车险案件使用前对所述标签压缩信息进行标签还原,再对所述配件压缩信息进行配件还原,获取所述车险案件。
进一步而言,所述系统还包括:
特征分类模块,用于获取车辆配件基础信息集合,对所述车辆配件基础信息集合进行特征分类,获取配件分类特征信息;
整合模块,用于将所述车辆配件基础信息集合按照所述配件分类特征信息进行整合,获得车辆配件整合基础信息集合;
编码规则生成模块,用于根据所述车辆配件整合基础信息集合,生成标识符编码规则;
编码模块,用于基于所述标识符编码规则对所述车辆配件整合基础信息集合中的配件基础信息进行编码,获得车辆配件标识符集合;
标识符字典生成模块,用于基于所述车辆配件标识符集合,组成所述标识符字典。
进一步而言,所述系统还包括:
判断模块,用于判断所述配件基础信息列表是否在标识符字典里查找到标识符,若查找到,则匹配获取所述配件标识符;
新标识符生成模块,用于若未查找到,基于所述标识符编码规则生成新配件标识符;
标识符获取模块,用于将所述新配件标识符写入到所述标识符字典中,并返回所述新配件标识符作为所述配件标识符。
进一步而言,所述系统还包括:
标签信息获取模块,用于获取车险案件标签信息集合;
短标签编码规则生成模块,用于根据所述车险案件标签信息集合,生成短标签编码规则;
短标签集合获取模块,用于基于所述短标签编码规则对所述车险案件标签信息集合中的标签信息进行编码,获得车险案件短标签集合;
短标签字典生成模块,用于基于所述车险案件短标签集合,生成所述短标签字典。
进一步而言,所述系统还包括:
短标签匹配模块,用于判断所述标签信息列表在所述短标签字典中是否查询到短标签,若查询到,则匹配获取所述短标签;
新短标签生成模块,用于若未查询到,基于所述短标签编码规则生成新短标签;
短标签获取模块,用于将所述新短标签写入到所述短标签字典中,并返回所述新短标签作为所述短标签。
进一步而言,所述系统还包括:
短标签提取模块,用于提取所述标签压缩信息里的所述短标签,去重生成短标签列表;
短标签替换模块,用于基于所述短标签列表在所述短标签字典中查询标签信息,若查询到,将所述短标签列表中的短标签替换为标签信息,获得所述标签信息列表;
第一返回模块,用于如果未查询到,则返回所述短标签。
进一步而言,所述系统还包括:
配件标识符提取模块,用于提取所述配件压缩信息里的所述配件标识符,去重生成配件标识符列表;
配件基础信息查询模块,用于基于所述配件标识符列表在所述标识符字典中查询配件基础信息,若查询到,将所述配件标识符列表中的配件标识符替换为配件基础信息,获得所述配件基础信息列表;
第二返回模块,用于如果未查询到,则返回所述配件标识符。
本说明书通过前述对基于数据字典的车险案件压缩管理方法的详细描述,本领域技术人员可以清楚得知道本实施例中基于数据字典的车险案件压缩管理方法及系统,对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述得比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其他实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (8)
1.基于数据字典的车险案件压缩管理方法,其特征在于,所述方法包括:
遍历提取车险案件中的所有配件,去重获取配件基础信息列表;
构建数据字典,所述数据字典包括标识符字典和短标签字典;
根据所述配件基础信息列表在所述标识符字典里查找标识符,获取配件标识符;
将所述配件基础信息列表中的配件基础信息替换为所述配件标识符,获得配件压缩信息;
遍历提取所述车险案件中的所有标签信息,去重获取标签信息列表;
基于所述标签信息列表在所述短标签字典中查询获取短标签,并将所述标签信息列表中的标签信息替换为所述短标签,获得标签压缩信息;
在车险案件使用前对所述标签压缩信息进行标签还原,再对所述配件压缩信息进行配件还原,获取所述车险案件。
2.如权利要求1所述的方法,其特征在于,所述方法包括:
获取车辆配件基础信息集合,对所述车辆配件基础信息集合进行特征分类,获取配件分类特征信息;
将所述车辆配件基础信息集合按照所述配件分类特征信息进行整合,获得车辆配件整合基础信息集合;
根据所述车辆配件整合基础信息集合,生成标识符编码规则;
基于所述标识符编码规则对所述车辆配件整合基础信息集合中的配件基础信息进行编码,获得车辆配件标识符集合;
基于所述车辆配件标识符集合,组成所述标识符字典。
3.如权利要求2所述的方法,其特征在于,所述获取配件标识符,包括:
判断所述配件基础信息列表是否在标识符字典里查找到标识符,若查找到,则匹配获取所述配件标识符;
若未查找到,基于所述标识符编码规则生成新配件标识符;
将所述新配件标识符写入到所述标识符字典中,并返回所述新配件标识符作为所述配件标识符。
4.如权利要求1所述的方法,其特征在于,所述方法包括:
获取车险案件标签信息集合;
根据所述车险案件标签信息集合,生成短标签编码规则;
基于所述短标签编码规则对所述车险案件标签信息集合中的标签信息进行编码,获得车险案件短标签集合;
基于所述车险案件短标签集合,生成所述短标签字典。
5.如权利要求4所述的方法,其特征在于,所述基于所述标签信息列表在所述短标签字典中查询获取短标签,包括:
判断所述标签信息列表在所述短标签字典中是否查询到短标签,若查询到,则匹配获取所述短标签;
若未查询到,基于所述短标签编码规则生成新短标签;
将所述新短标签写入到所述短标签字典中,并返回所述新短标签作为所述短标签。
6.如权利要求1所述的方法,其特征在于,所述对所述标签压缩信息进行标签还原,包括:
提取所述标签压缩信息里的所述短标签,去重生成短标签列表;
基于所述短标签列表在所述短标签字典中查询标签信息,若查询到,将所述短标签列表中的短标签替换为标签信息,获得所述标签信息列表;
如果未查询到,则返回所述短标签。
7.如权利要求1所述的方法,其特征在于,所述对所述配件压缩信息进行配件还原,包括:
提取所述配件压缩信息里的所述配件标识符,去重生成配件标识符列表;
基于所述配件标识符列表在所述标识符字典中查询配件基础信息,若查询到,将所述配件标识符列表中的配件标识符替换为配件基础信息,获得所述配件基础信息列表;
如果未查询到,则返回所述配件标识符。
8.基于数据字典的车险案件压缩管理系统,其特征在于,用于实施权利要求1-7任一项所述的基于数据字典的车险案件压缩管理方法,包括:
基础信息获取模块,所述基础信息获取模块用于遍历提取车险案件中的所有配件,去重获取配件基础信息列表;
数据字典构建模块,所述数据字典构建模块用于构建数据字典,所述数据字典包括标识符字典和短标签字典;
配件标识符获取模块,所述配件标识符获取模块用于根据所述配件基础信息列表在所述标识符字典里查找标识符,获取配件标识符;
配件标识符替换模块,所述配件标识符替换模块用于将所述配件基础信息列表中的配件基础信息替换为所述配件标识符,获得配件压缩信息;
标签信息获取模块,所述标签信息获取模块用于遍历提取所述车险案件中的所有标签信息,去重获取标签信息列表;
压缩信息获取模块,所述压缩信息获取模块用于基于所述标签信息列表在所述短标签字典中查询获取短标签,并将所述标签信息列表中的标签信息替换为所述短标签,获得标签压缩信息;
配件还原模块,所述配件还原模块用于在车险案件使用前对所述标签压缩信息进行标签还原,再对所述配件压缩信息进行配件还原,获取所述车险案件。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310956190.3A CN116662476A (zh) | 2023-08-01 | 2023-08-01 | 基于数据字典的车险案件压缩管理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310956190.3A CN116662476A (zh) | 2023-08-01 | 2023-08-01 | 基于数据字典的车险案件压缩管理方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116662476A true CN116662476A (zh) | 2023-08-29 |
Family
ID=87710120
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310956190.3A Pending CN116662476A (zh) | 2023-08-01 | 2023-08-01 | 基于数据字典的车险案件压缩管理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116662476A (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5151697A (en) * | 1990-10-15 | 1992-09-29 | Board Of Regents Of The University Of Washington | Data structure management tagging system |
US20090019362A1 (en) * | 2006-03-10 | 2009-01-15 | Avri Shprigel | Automatic Reusable Definitions Identification (Rdi) Method |
US20110246741A1 (en) * | 2010-04-01 | 2011-10-06 | Oracle International Corporation | Data deduplication dictionary system |
US20150012698A1 (en) * | 2013-07-08 | 2015-01-08 | Dell Products L.P. | Restoring temporal locality in global and local deduplication storage systems |
CN108897882A (zh) * | 2018-07-05 | 2018-11-27 | 北京精友时代信息技术发展有限公司 | 一种服务于车险的配件基础数据管理系统 |
CN109120272A (zh) * | 2018-07-16 | 2019-01-01 | 南京航空航天大学 | 一种面向离散制造车间的rfid标签数据压缩方法 |
CN110147433A (zh) * | 2019-05-21 | 2019-08-20 | 北京鸿联九五信息产业有限公司 | 一种基于字典树的文本模板提取方法 |
US20200241962A1 (en) * | 2019-01-25 | 2020-07-30 | International Business Machines Corporation | Methods and systems for metadata tag inheritance for data backup |
CN114579571A (zh) * | 2022-03-01 | 2022-06-03 | 珠海金山数字网络科技有限公司 | 数据处理方法及装置 |
US20220197755A1 (en) * | 2020-12-17 | 2022-06-23 | EMC IP Holding Company LLC | Efficient dictionary data structure to find similar backup clients |
-
2023
- 2023-08-01 CN CN202310956190.3A patent/CN116662476A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5151697A (en) * | 1990-10-15 | 1992-09-29 | Board Of Regents Of The University Of Washington | Data structure management tagging system |
US20090019362A1 (en) * | 2006-03-10 | 2009-01-15 | Avri Shprigel | Automatic Reusable Definitions Identification (Rdi) Method |
US20110246741A1 (en) * | 2010-04-01 | 2011-10-06 | Oracle International Corporation | Data deduplication dictionary system |
US20150012698A1 (en) * | 2013-07-08 | 2015-01-08 | Dell Products L.P. | Restoring temporal locality in global and local deduplication storage systems |
CN108897882A (zh) * | 2018-07-05 | 2018-11-27 | 北京精友时代信息技术发展有限公司 | 一种服务于车险的配件基础数据管理系统 |
CN109120272A (zh) * | 2018-07-16 | 2019-01-01 | 南京航空航天大学 | 一种面向离散制造车间的rfid标签数据压缩方法 |
US20200241962A1 (en) * | 2019-01-25 | 2020-07-30 | International Business Machines Corporation | Methods and systems for metadata tag inheritance for data backup |
CN110147433A (zh) * | 2019-05-21 | 2019-08-20 | 北京鸿联九五信息产业有限公司 | 一种基于字典树的文本模板提取方法 |
US20220197755A1 (en) * | 2020-12-17 | 2022-06-23 | EMC IP Holding Company LLC | Efficient dictionary data structure to find similar backup clients |
CN114579571A (zh) * | 2022-03-01 | 2022-06-03 | 珠海金山数字网络科技有限公司 | 数据处理方法及装置 |
Non-Patent Citations (2)
Title |
---|
刘旭辉: "基于知识图谱的图书馆电子资源自动去重方法研究", 电子设计工程, vol. 28, no. 12 * |
梁捷;蒋雯倩;李金瑾;: "基于动态字典和差分编码的计量数据压缩研究", 信息技术, no. 10 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103733195A (zh) | 管理用于基于范围的搜索的数据的存储 | |
CN101019121A (zh) | 对存储在数据库中的文档编制索引和进行检索的方法和系统 | |
CN104769585A (zh) | 递归地遍历因特网和其他源以识别、收集、管理、评判和鉴定企业身份及相关数据的系统和方法 | |
EP1358578A2 (en) | An improved system for storing and retrieving data | |
CN104392005A (zh) | 一种汽车快速定损方法 | |
CN110866018A (zh) | 一种基于标签及标识解析的汽摩行业数据录入及检索方法 | |
CN111782595A (zh) | 海量文件管理方法、装置、计算机设备和可读存储介质 | |
CN111680043B (zh) | 一种针对海量数据进行快速检索方法 | |
CN110837555A (zh) | 海量文本去重筛选的方法、设备和存储介质 | |
CN111291152A (zh) | 案例文书的推荐方法、装置、设备及存储介质 | |
CN108829851A (zh) | 一种车辆零部件信息的获取方法和装置 | |
CN110222015B (zh) | 一种文件数据的读取、查询方法、装置及可读存储介质 | |
CN117390214B (zh) | 一种基于ocr技术的文件检索方法及系统 | |
CN109886618B (zh) | 一种优化物流作业的方法及装置 | |
CN116662476A (zh) | 基于数据字典的车险案件压缩管理方法及系统 | |
CN113642327A (zh) | 一种标准知识库的构建方法及装置 | |
CN113190651A (zh) | 基于定额知识图谱技术的电力数据全局知识图谱补全方法 | |
CN110532362B (zh) | 基于产品使用手册的问答方法、装置及计算设备 | |
US8805820B1 (en) | Systems and methods for facilitating searches involving multiple indexes | |
Zhou et al. | Adaptive subspace symbolization for content-based video detection | |
CN115858939A (zh) | 一种同行召回方法、系统及存储介质 | |
CN114610744A (zh) | 一种数据查询方法、装置及计算机可读存储介质 | |
CN113032439A (zh) | 一种分库分表结构数据库的查询方法、装置及系统 | |
CN111639151A (zh) | 一种全文检索的高效保存倒排索引方法 | |
CN111488327A (zh) | 一种数据标准管理方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |