CN117252555A - 一种基于车险场景的半自动化特征工程方法、系统和介质 - Google Patents
一种基于车险场景的半自动化特征工程方法、系统和介质 Download PDFInfo
- Publication number
- CN117252555A CN117252555A CN202311507842.1A CN202311507842A CN117252555A CN 117252555 A CN117252555 A CN 117252555A CN 202311507842 A CN202311507842 A CN 202311507842A CN 117252555 A CN117252555 A CN 117252555A
- Authority
- CN
- China
- Prior art keywords
- field
- features
- feature
- data table
- class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012407 engineering method Methods 0.000 title claims abstract description 17
- 230000002776 aggregation Effects 0.000 claims abstract description 74
- 238000004220 aggregation Methods 0.000 claims abstract description 74
- 238000009795 derivation Methods 0.000 claims abstract description 23
- 238000007781 pre-processing Methods 0.000 claims abstract description 12
- 238000012549 training Methods 0.000 claims abstract description 8
- 238000000034 method Methods 0.000 claims description 38
- 238000004590 computer program Methods 0.000 claims description 16
- 238000003860 storage Methods 0.000 claims description 10
- 230000004931 aggregating effect Effects 0.000 claims description 8
- 238000001212 derivatisation Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 17
- 238000004891 communication Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Accounting & Taxation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Technology Law (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本申请涉及一种基于车险场景的半自动化特征工程方法、系统和介质,其中,基于车险场景的半自动化特征工程方法包括:对各所述数据表中各字段进行分类,并基于所述字段类型确定对应的特征衍生策略以及特征聚合策略;基于所述字段类型,生成各所述数据表之间的表连接关系;基于所述特征衍生策略对各所述数据表中的字段进行特征衍生,得到衍生特征;并基于所述表连接关系以及所述特征聚合策略将各所述从表中的原始特征和所述衍生特征聚合到所述主表上,得到聚合后的主表;基于所述字段类型对所述聚合后的主表中的特征进行预处理,将预处理后的特征输入至模型中进行训练,获得识别模型;基于所述识别模型对数据表记录的车险事件进行识别,获得识别结果,提高了车险事件识别的精确度。
Description
技术领域
本申请涉及数据处理技术领域,特别是涉及一种基于车险场景的半自动化特征工程方法、系统和介质。
背景技术
车险行业的数据以结构化数据为主,不同保险公司的车险数据格式不统一,数据形式以多张表为主,不同数据表之间互相独立存储。如何通过特征工程生成高质量的用于机器学习和深度模型的特征,也成了关键的一步。
目前已有的自动化特征工程方法大多针对单表数据集,且不具备字段自动分类功能,或字段自动分类效果差。而对于车险场景下的多表数据集,如何通过特征工程将多张数据表生成符合模型的输入特征,以实现车险事件的有效识别,目前尚未提出有效的解决方案。
发明内容
基于此,有必要针对上述技术问题,提供一种基于车险场景的半自动化特征工程方法、系统和介质。
第一方面,本申请实施例提供了一种基于车险场景的半自动化特征工程方法,所述方法包括:
获取各数据表中各字段的统计特征;其中,所述数据表包括一张主表和多张从表;
根据各所述数据表中各字段的统计特征和字段信息对各所述字段进行分类,得到各所述字段对应的字段类型,并基于所述字段类型确定对应的特征衍生策略以及特征聚合策略;
基于所述字段类型,生成各所述数据表之间的表连接关系;
基于所述特征衍生策略对各所述数据表中的字段进行特征衍生,得到衍生特征;并基于所述表连接关系以及所述特征聚合策略将各所述从表中的原始特征和所述衍生特征聚合到所述主表上,得到聚合后的主表;
基于所述字段类型对所述聚合后的主表中的特征进行预处理,将预处理后的特征输入至模型中进行训练,获得识别模型;
基于所述识别模型对数据表记录的车险事件进行识别,获得识别结果。
在其中一个实施例中,所述基于所述表连接关系以及所述特征聚合策略将各所述从表中的原始特征和所述衍生特征聚合到所述主表上,得到聚合后的主表包括:
基于所述表连接关系,确定当前从表所对应的上一层数据表;
基于所述上一层数据表和所述特征聚合策略对所述当前从表的所有特征进行特征聚合,生成所述当前从表的聚合特征;
将所述当前从表的聚合特征与所述上一层数据表的原始特征和所述衍生特征进行拼接;并判断所述上一层数据表是否为主表,直至所述上一层数据表为所述主表,得到聚合后的主表。
在其中一个实施例中,所述基于所述上一层数据表和所述特征聚合策略对所述当前从表的所有特征进行特征聚合,生成所述当前从表的聚合特征包括:
基于所述表连接关系,确定所述上一层数据表中唯一ID字段对应的所述当前从表中的多行记录;
基于所述特征聚合策略对各字段的所述多行记录进行聚合,获得所述上一层数据表中唯一ID对应的一行记录,生成所述当前从表的聚合特征。
在其中一个实施例中,所述字段类型包括:ID类、分类对象类、数值类、日期类、文本类、布尔类;基于所述字段类型生成对应的特征衍生策略包括:
对ID类字段进行判断,生成布尔类字段;
对分类对象类字段进行判断,生成布尔类字段;以及统计各分类对象出现的次数,生成数值类字段;
对数值类字段进行算术运算,生成数值类字段;
对日期类字段进行信息提取,生成数值类字段;以及对日期类字段进行判断,生成布尔类字段;
对文本类字段进行信息提取,生成分类对象类字段;
对布尔类字段进行布尔运算,生成布尔类字段。
在其中一个实施例中,基于所述字段类型生成对应的特征聚合策略包括:
若所述字段类型为分类对象类、数值类或日期类,则对所述多行记录中各字段进行统计,得到所述上一层数据表中唯一ID对应的一行记录,生成所述当前从表的聚合特征;
若所述字段类型为布尔类,则对所述多行记录中各字段进行布尔运算,得到所述上一层数据表中唯一ID对应的一行记录,生成所述当前从表的聚合特征。
在其中一个实施例中,所述基于所述字段类型,生成各所述数据表之间的表连接关系包括:
获取各所述数据表中的唯一ID类字段;
基于各所述数据表中唯一ID类字段将各所述数据表进行连接,生成各所述数据表之间的表连接关系。
在其中一个实施例中,所述基于所述字段类型对所述聚合后的主表中的特征进行预处理包括:
对分类对象类字段和布尔类字段进行编码处理;
对数值类字段进行归一化处理;
对日期类字段和文本类字段进行剔除。
第二方面,本申请实施例还提供了一种基于车险场景的半自动化特征工程系统,所述系统包括:
统计模块,用于获取各数据表中各字段的统计特征;其中,所述数据表包括一张主表和多张从表;
分类模块,用于根据各所述数据表中各字段的统计特征和字段信息对各所述字段进行分类,得到各所述字段对应的字段类型,并基于所述字段类型确定对应的特征衍生策略以及特征聚合策略;
生成模块,用于基于所述字段类型,生成各所述数据表之间的表连接关系;
聚合模块,用于基于所述特征衍生策略对各所述数据表中的字段进行特征衍生,得到衍生特征;并基于所述表连接关系以及所述特征聚合策略将各所述从表中的原始特征和所述衍生特征聚合到所述主表上,得到聚合后的主表;
处理模块,用于基于所述字段类型对所述聚合后的主表中的特征进行预处理,将预处理后的特征输入至模型中进行训练,获得识别模型;基于所述识别模型对数据表记录的车险事件进行识别,获得识别结果。
第三方面,本申请实施例还提供了一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行如上述第一方面所述的方法。
第四方面,本申请实施例还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现如上述第一方面所述的方法。
上述基于车险场景的半自动化特征工程方法、系统和介质,通过获取各数据表中各字段的统计特征;其中,所述数据表包括一张主表和多张从表;根据各所述数据表中各字段的统计特征和字段信息对各所述字段进行分类,得到各所述字段对应的字段类型,并基于所述字段类型确定对应的特征衍生策略以及特征聚合策略;基于所述字段类型,生成各所述数据表之间的表连接关系;基于所述特征衍生策略对各所述数据表中的字段进行特征衍生,得到衍生特征;并基于所述表连接关系以及所述特征聚合策略将各所述从表中的原始特征和所述衍生特征聚合到所述主表上,得到聚合后的主表;基于所述字段类型对所述聚合后的主表中的特征进行预处理,将预处理后的特征输入至模型中进行训练,获得识别模型;基于所述识别模型对数据表记录的车险事件进行识别,获得识别结果。本发明解决了对于车险场景下结构复杂的多表数据集,通过特征工程将多张数据表生成符合模型的输入特征,以实现车险事件的有效识别,提高了车险事件识别的精确度。
本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的基于车险场景的半自动化特征工程方法的终端的硬件结构框图;
图2是根据本申请实施例的基于车险场景的半自动化特征工程方法的流程示意图;
图3是根据本申请实施例的获得聚合后的主表方法的流程示意图;
图4是根据本申请实施例的各数据表间的表连接关系的示意图;
图5是根据本申请实施例的对述当前从表的特征进行特征聚合的流程示意图;
图6是根据本申请实施例的表2和表3聚合至主表4的示意图;
图7是根据本申请实施例的表2聚合至表3的示意图;
图8是根据本申请实施例的新表3聚合至主表4的示意图;
图9是根据本申请实施例的基于车险场景的半自动化特征工程系统的结构框图;
图10是根据本申请实施例的计算机设备结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本申请所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。
在本实施例中提供的方法实施例可以在终端、计算机或者类似的运算装置中执行。比如在终端上运行,图1是本实施例的基于车险场景的半自动化特征工程方法的终端的硬件结构框图。如图1所示,终端可以包括一个或多个(图1中仅示出一个)处理器102和用于存储数据的存储器104,其中,处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置。上述终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述终端的结构造成限制。例如,终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示出的不同配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如在本实施例中的基于车险场景的半自动化特征工程方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输设备106用于经由一个网络接收或者发送数据。上述的网络包括终端的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(NetworkInterface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
本申请实施例提供了一种基于车险场景的半自动化特征工程方法,如图2所示,所述方法包括以下步骤:
S201,获取各数据表中各字段的统计特征;其中,所述数据表包括一张主表和多张从表;
具体的,本申请中各数据表为车险场景数据集,各数据表可以为json文件、csv文件、xlsx文件等多种类型,本申请将各数据表处理为统一格式的文件,例如统一处理为xlsx文件。在获取各数据表中各字段的统计特征之前,对各数据表进行数据清洗,包括对异常数据、重复数据进行剔除,对异常数据的剔除包括剔除乱码数据。然后对进行清洗后的各数据表中的各字段进行统计,获得各字段的统计特征,所述统计特征包括但不限于唯一值数量、空值比例、高频次出现值数量统计、信息价值(Information value,IV)等,并对空值比例大于50%的列进行剔除。
由于在车险场景下对车险事件的识别分析需要从报案层面进行分析,因此本申请设置报案信息表为主表,车险场景下其他的数据表为从表。
S202,根据各所述数据表中各字段的统计特征和字段信息对各所述字段进行分类,得到各所述字段对应的字段类型,并基于所述字段类型确定对应的特征衍生策略以及特征聚合策略;
具体的,由于车险场景下,不同保险公司的字段存储格式不同,具有其复杂性,因此自动化字段分类的结果与实际情况存在一定偏差。本实施例还通过可视化界面向用户展示自动化字段分类结果,以及各字段得到的各项统计特征,由用户对字段分类结果进行确认,对于错误分类可由用户进行手动修改。由于车险场景下字段数目大,因此设计用户可批量勾选确认分类正确的字段。
S203,基于所述字段类型,生成各所述数据表之间的表连接关系;
S204,基于所述特征衍生策略对各所述数据表中的字段进行特征衍生,得到衍生特征;并基于所述表连接关系以及所述特征聚合策略将各所述从表中的原始特征和所述衍生特征聚合到所述主表上,得到聚合后的主表;
本实施例结合数据表中各字段的统计特征和字段信息进行自动化字段分类,得到各字段对应的字段类型。对于不同字段类型的字段本申请采用对应的特征衍生策略,特征衍生策略是指基于数据表中的原始特征衍生出新特征的方法,进行特征衍生后的各所述数据表中包含了原始特征和衍生特征。本申请根据各数据表中字段对应的字段类型,可以自动生成各数据表之间的表连接关系,并根据表连接关系和特征聚合策略将各从表的原始特征和衍生特征最终聚合到进行特征衍生后的主表上,得到聚合后的主表。
S205,基于所述字段类型对所述聚合后的主表中的特征进行预处理,将预处理后的特征输入至模型中进行训练,获得识别模型;
S206,基于所述识别模型对数据表记录的车险事件进行识别,获得识别结果。
通过上述S201至S206,通过获取各数据表中各字段的统计特征;其中,所述数据表包括一张主表和多张从表;根据各所述数据表中各字段的统计特征和字段信息对各所述字段进行分类,得到各所述字段对应的字段类型,并基于所述字段类型确定对应的特征衍生策略以及特征聚合策略;基于所述字段类型,生成各所述数据表之间的表连接关系;基于所述特征衍生策略对各所述数据表中的字段进行特征衍生,得到衍生特征;并基于所述表连接关系以及所述特征聚合策略将各所述从表中的原始特征和所述衍生特征聚合到所述主表上,得到聚合后的主表;基于所述字段类型对所述聚合后的主表中的特征进行预处理,将预处理后的特征输入至模型中进行训练,获得识别模型;基于所述识别模型对数据表记录的车险事件进行识别,获得识别结果。本发明解决了对于车险场景下结构复杂的多表数据集,通过特征工程将多张数据表生成符合模型的输入特征,以实现车险事件的有效识别,提高了车险事件识别的精确度。
在其中一个实施例中,如图3所示,所述基于所述表连接关系以及所述特征聚合策略将各所述从表中的原始特征和所述衍生特征聚合到所述主表上,得到聚合后的主表包括以下步骤:
S301,基于所述表连接关系,确定当前从表所对应的上一层数据表;
示例性的,报案信息表为主表,以从表是车辆表和部件清单表为例,图4展示了各数据表间的表连接关系,通过表连接关系,可以确定当前从表所对应的上一层数据表,从图4可知当前从表为部件清单表,则对应的上一层数据表为车辆表;若当前从表为车辆表,则对应的上一层数据表为报案信息表。需要说明的是在实际车险场景中,会存在其他的若干个从表。
S302,基于所述上一层数据表和所述特征聚合策略对所述当前从表的所有特征进行特征聚合,生成所述当前从表的聚合特征;
S303,将所述当前从表的聚合特征与所述上一层数据表的原始特征和所述衍生特征进行拼接;并判断所述上一层数据表是否为主表;若否,则继续执行上述步骤,直至所述上一层数据表为所述主表,得到聚合后的主表。
上述S301至S303,从初始层从表开始,基于表连接关系确定当前从表所对应的上一层数据表,并基于特征聚合策略将当前从表的所有特征包括原始特征和衍生特征聚合到上一层数据表上。需要说明的是,车险场景中各数据表的行数并不相同,无法直接基于表连接关系将当前层的数据表的特征直接拼接到上一层数据表上,因此需要结合上一层数据表和特征聚合策略将当前从表的所有特征进行特征聚合,生成所述当前从表的聚合特征,此时当前从表的聚合特征的行数与上一层数据表上的行数相同,将所述当前从表的聚合特征与所述上一层数据表的原始特征和所述衍生特征进行拼接,此时上一层数据表包括原始特征、衍生特征和聚合特征;再继续执行上述步骤,即将此时得到的新的上一层数据表作为当前从表,再基于所述表连接关系确定当前从表所对应的上一层数据表;根据上一层数据表,基于特征聚合策略将当前从表的所有特征进行特征聚合,生成所述当前从表的聚合特征,直到上一层数据表为主表;实现了将进行特征衍生后的各所述从表中的原始特征和所述衍生特征最终聚合到所述主表上,聚合后的主表中的特征可以在各类机器学习、深度学习模型中使用以实现车险事件的识别。
在其中一个实施例中,如图5所示,所述基于所述特征聚合策略对所述当前从表的所有特征进行特征聚合,生成所述当前从表的聚合特征包括:
S401,基于所述表连接关系,确定所述上一层数据表中唯一ID字段对应的所述当前从表中的多行记录;
S402,基于所述特征聚合策略对各字段的所述多行记录进行聚合,获得所述上一层数据表中唯一ID对应的一行记录,生成所述当前从表的聚合特征。
在其中一个实施例中,基于所述字段类型生成对应的特征聚合策略包括:若所述字段类型为分类对象类、数值类或日期类,则对所述多行记录中各字段进行统计,得到所述上一层数据表中唯一ID对应的一行记录,生成所述当前从表的聚合特征;若所述字段类型为布尔类,则对所述多行记录中各字段进行布尔运算,得到所述上一层数据表中唯一ID对应的一行记录,生成所述当前从表的聚合特征。
基于所述字段类型生成对应的特征聚合策略具体为:对于分类对象类Categorical字段可以计算唯一值数目,计算出现最多的元素等;对数值类Numeric字段可以根据字段类型通过至少下述一种操作进行特征聚合,并最终将特征聚合到主表上:求和、求平均、求最大值、求最小值等;对日期类Datetime字段可以计算最早时间与最晚时间差,计算平均时间等;对文本类Text字段需要先通过特征衍生转换成分类对象类Categorical字段再进行聚合操作;对布尔类Bool字段,可进行与、或等操作。示例性的,部分特征聚合方法清单如表1所示。
在一示例实施例中,以报案信息表为主表,从表示车辆表和部件清单表为例,结合图4的表连接关系进行特征聚合操作示例说明,其中,表2为部件清单表,表3为车辆表,表4为报案信息表。参见图6,首先根据表连接关系可知表2部件清单表的上一层数据表为表3车辆表,因此由表2部件清单表往表3车辆表上聚合,表3车辆表的唯一ID字段为车牌号,因此表2部件清单表需要以车牌号字段聚合至表3车辆表上;表3车辆表的上一层数据表为表4报案信息表,因此由表3车辆表往表4报案信息表上聚合,表4报案信息表的唯一ID字段为报案号,因此在表3车辆表需要以报案号字段聚合至表4报案信息表。例如对于表3车辆表中车牌号为浙A12345的一条数据,共对应表2部件清单表中的车牌号为浙A12345的部件清单编号BJ001、BJ002、BJ003共三条数据,部件名称共出现了大灯和保险杠支架两类,所以部件名称的唯一值数目为2,其中“大灯”为出现最多的元素,金额求和为8100;同理可以求得其他车辆的情况。图7展示了表2聚合至表3获得新表3的示意图,由于车险分析需要从报案层面进行分析,因此各表的聚合,需要最终聚合至报案信息表上,部件清单表通过聚合至车辆表后新生成的特征,可以和车辆表一起最终聚合至报案表上,图8展示了根据上述步骤获得的新表3聚合至主表4的示意图。
在其中一个实施例中,所述字段类型包括:ID类、分类对象(Categorical)类、数值(Numeric)类、日期(Datetime)类、文本(Text)类、布尔(Bool)类;本实施例在进行字段分类还包括根据车险场景数据结构的特点,对于车险场景的字段根据其物理含义进行初步分类,例如:事故类型、车辆品牌、车辆部件名称、车辆工时类型等为分类对象(Categorical)类;报案号、报案人姓名、行驶证编号、车牌号等为ID类;定损金额、配件数目等为数值(Numeric)类;报案时间、查勘时间、定损时间等为日期(Datetime)类;事故地点、事故描述、备注、其他说明等为文本Text类。在不同车险公司中,上述名称会有不同,设置自动匹配功能,对于文本相似度进行匹配,在字段名称不同时,仍然能正确匹配该字段的类型。此外,对于字段下具体的内容,根据其物理含义进行预处理。以“事故类型”字段为例,该字段下可能存在的数据包括“单车事故”、“双车事故”、“多车事故”、“单车”、“双车”、“多车”等,其中:“单车事故”和“单车”是相同含义,可以进行合并。
基于所述字段类型生成对应的特征衍生策略包括:对ID类字段进行判断,生成布尔类字段;对分类对象类字段进行判断,生成布尔类字段;以及统计各分类对象出现的次数,生成数值类字段;对数值类字段进行算术运算,生成数值类字段;对日期类字段进行信息提取,生成数值类字段;以及对日期类字段进行判断,生成布尔类字段;对文本类字段进行信息提取,生成分类对象类字段;对布尔类字段进行布尔运算,生成布尔类字段。
本实施例在确定各所述数据表中各字段对应的字段类型后,根据各字段对应的字段类型生成对应的特征衍生策略。具体为,根据字段类型通过至少下述一种操作进行特征衍生:对分类对象类(Categorical)字段可计算两列元素是否相等,计算元素出现次数等;对数值类(Numeric)字段可计算两列元素间大小关系,计算元素绝对值、倒数等;对日期类(Datetime)字段可计算时间对应的年份、月份、日期,计算时间是否属于工作日等;对文本类(Text)字段,可根据车险场景特点抽取关键信息,例如事故发生的地点、事故发生的原因等;对布尔类(Bool)字段,可进行与、或等操作。示例性的,部分特征衍生方法清单如表5所示,除常规特征衍生方法外,还根据车险场景的特点,形成了车险场景下特定的特征衍生方法,部分车险场景特定特征衍生方法如表6所示。
以上仅描述了部分针对车险场景特定的特征衍生方法,其它与上述特征衍生方法具有相似原理的特征衍生方法,均在本申请的保护范围内。
在其中一个实施例中,所述基于所述字段类型,生成各所述数据表之间的表连接关系包括:获取各所述数据表中的唯一ID类字段;基于各所述数据表中唯一ID类字段将各所述数据表进行连接,生成各所述数据表之间的表连接关系。
具体的,所述多表关系生成流程具体为,根据车险场景的特点,设置报案信息表为主表,设置报案号为主键。其他从表设置唯一ID为主键,连接方式如下:若表A中存在主键以外的ID,该ID为表B中的主键,则可以将表A连接至表B。按以上方法自动检索,获取多表间连接关系。在车险场景下,由于多表间可能存在多种连接关系,且不同自动可能有相同命名导致连接关系获取异常,因此需要对多表连接结果进行手动确认。通过可视化界面向用户展示自动生成的多表关系结果,由用户进行手动调整和确认。所述报案信息表在不同车险公司表名不同,根据车险场景下该表的基本特征,来确定报案信息表,确保不同名称下均能准确识别到报案信息表。
在其中一个实施例中,所述基于所述字段类型对所述聚合后的主表中的特征进行预处理包括:对分类对象类字段和布尔类字段进行编码处理;对数值类字段进行归一化处理;对日期类字段和文本类字段进行剔除。
具体的,本实施例根据进行特征聚合后的主表中特征对应的字段类型和后续输入的模型类型,对各字段的数据进行相应的归一化操作或编码操作。其中,对分类对象(Categorical)类字段的特征进行编码,其中若后续模型为树模型,则采用one-hot编码(一位有效编码),若后续模型为深度学习模型,则采用label-encoder(标签编码器)进行编码;对布尔(Bool)类字段的特征采用label-encoder(标签编码器)进行编码;对数值(Numeric)类字段的特征进行归一化处理;对其余类型字段的数据进行剔除。
需要说明的是,在上述流程中或者附图的流程图中示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例还提供了一种基于车险场景的半自动化特征工程系统,如图9所示,所述系统包括:
统计模块510,用于获取各数据表中各字段的统计特征;其中,所述数据表包括一张主表和多张从表;
分类模块520,用于根据各所述数据表中各字段的统计特征和字段信息对各所述字段进行分类,得到各所述字段对应的字段类型,并基于所述字段类型确定对应的特征衍生策略以及特征聚合策略;
生成模块530,用于基于所述字段类型,生成各所述数据表之间的表连接关系;
聚合模块540,用于基于所述特征衍生策略对各所述数据表中的字段进行特征衍生,得到衍生特征;并基于所述表连接关系以及所述特征聚合策略将各所述从表中的原始特征和所述衍生特征聚合到所述主表上,得到聚合后的主表;
处理模块550,用于基于所述字段类型对所述聚合后的主表中的特征进行预处理,将预处理后的特征输入至模型中进行训练,获得识别模型;基于所述识别模型对数据表记录的车险事件进行识别,获得识别结果。
需要说明的是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件来实现,也可以通过硬件来实现。对于通过硬件来实现的模块而言,上述各个模块可以位于同一处理器中;或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种基于车险场景的半自动化特征工程方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一项基于车险场景的半自动化特征工程方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(RandomAccess Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种基于车险场景的半自动化特征工程方法,其特征在于,所述方法包括:
获取各数据表中各字段的统计特征;其中,所述数据表包括一张主表和多张从表;
根据各所述数据表中各字段的统计特征和字段信息对各所述字段进行分类,得到各所述字段对应的字段类型,并基于所述字段类型确定对应的特征衍生策略以及特征聚合策略;
基于所述字段类型,生成各所述数据表之间的表连接关系;
基于所述特征衍生策略对各所述数据表中的字段进行特征衍生,得到衍生特征;并基于所述表连接关系以及所述特征聚合策略将各所述从表中的原始特征和所述衍生特征聚合到所述主表上,得到聚合后的主表;
基于所述字段类型对所述聚合后的主表中的特征进行预处理,将预处理后的特征输入至模型中进行训练,获得识别模型;
基于所述识别模型对数据表记录的车险事件进行识别,获得识别结果。
2.根据权利要求1所述的方法,其特征在于,所述基于所述表连接关系以及所述特征聚合策略将各所述从表中的原始特征和所述衍生特征聚合到所述主表上,得到聚合后的主表包括:
基于所述表连接关系,确定当前从表所对应的上一层数据表;
基于所述上一层数据表和所述特征聚合策略对所述当前从表的所有特征进行特征聚合,生成所述当前从表的聚合特征;
将所述当前从表的聚合特征与所述上一层数据表的原始特征和所述衍生特征进行拼接;并判断所述上一层数据表是否为主表,直至所述上一层数据表为所述主表,得到聚合后的主表。
3.根据权利要求2所述的方法,其特征在于,所述基于所述上一层数据表和所述特征聚合策略对所述当前从表的所有特征进行特征聚合,生成所述当前从表的聚合特征包括:
基于所述表连接关系,确定所述上一层数据表中唯一ID字段对应的所述当前从表中的多行记录;
基于所述特征聚合策略对各字段的所述多行记录进行聚合,获得所述上一层数据表中唯一ID对应的一行记录,生成所述当前从表的聚合特征。
4.根据权利要求1所述的方法,其特征在于,所述字段类型包括:ID类、分类对象类、数值类、日期类、文本类、布尔类;基于所述字段类型生成对应的特征衍生策略包括:
对ID类字段进行判断,生成布尔类字段;
对分类对象类字段进行判断,生成布尔类字段;以及统计各分类对象出现的次数,生成数值类字段;
对数值类字段进行算术运算,生成数值类字段;
对日期类字段进行信息提取,生成数值类字段;以及对日期类字段进行判断,生成布尔类字段;
对文本类字段进行信息提取,生成分类对象类字段;
对布尔类字段进行布尔运算,生成布尔类字段。
5.根据权利要求3所述的方法,其特征在于,基于所述字段类型生成对应的特征聚合策略包括:
若所述字段类型为分类对象类、数值类或日期类,则对所述多行记录中各字段进行统计,得到所述上一层数据表中唯一ID对应的一行记录,生成所述当前从表的聚合特征;
若所述字段类型为布尔类,则对所述多行记录中各字段进行布尔运算,得到所述上一层数据表中唯一ID对应的一行记录,生成所述当前从表的聚合特征。
6.根据权利要求1所述的方法,其特征在于,所述基于所述字段类型,生成各所述数据表之间的表连接关系包括:
获取各所述数据表中的唯一ID类字段;
基于各所述数据表中唯一ID类字段将各所述数据表进行连接,生成各所述数据表之间的表连接关系。
7.根据权利要求1所述的方法,其特征在于,所述基于所述字段类型对所述聚合后的主表中的特征进行预处理包括:
对分类对象类字段和布尔类字段进行编码处理;
对数值类字段进行归一化处理;
对日期类字段和文本类字段进行剔除。
8.一种基于车险场景的半自动化特征工程系统,其特征在于,所述系统包括:
统计模块,用于获取各数据表中各字段的统计特征;其中,所述数据表包括一张主表和多张从表;
分类模块,用于根据各所述数据表中各字段的统计特征和字段信息对各所述字段进行分类,得到各所述字段对应的字段类型,并基于所述字段类型确定对应的特征衍生策略以及特征聚合策略;
生成模块,用于基于所述字段类型,生成各所述数据表之间的表连接关系;
聚合模块,用于基于所述特征衍生策略对各所述数据表中的字段进行特征衍生,得到衍生特征;并基于所述表连接关系以及所述特征聚合策略将各所述从表中的原始特征和所述衍生特征聚合到所述主表上,得到聚合后的主表;
处理模块,用于基于所述字段类型对所述聚合后的主表中的特征进行预处理,将预处理后的特征输入至模型中进行训练,获得识别模型;基于所述识别模型对数据表记录的车险事件进行识别,获得识别结果。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至权利要求7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至权利要求7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311507842.1A CN117252555B (zh) | 2023-11-14 | 2023-11-14 | 一种基于车险场景的半自动化特征工程方法、系统和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311507842.1A CN117252555B (zh) | 2023-11-14 | 2023-11-14 | 一种基于车险场景的半自动化特征工程方法、系统和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117252555A true CN117252555A (zh) | 2023-12-19 |
CN117252555B CN117252555B (zh) | 2024-04-09 |
Family
ID=89131611
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311507842.1A Active CN117252555B (zh) | 2023-11-14 | 2023-11-14 | 一种基于车险场景的半自动化特征工程方法、系统和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117252555B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111400305A (zh) * | 2020-02-20 | 2020-07-10 | 深圳市魔数智擎人工智能有限公司 | 基于特征工程血缘关系的可回溯、可视化方法 |
CN111627552A (zh) * | 2020-04-08 | 2020-09-04 | 湖南长城医疗科技有限公司 | 一种医疗流式数据血缘关系分析、存储方法及装置 |
US20200394455A1 (en) * | 2019-06-15 | 2020-12-17 | Paul Lee | Data analytics engine for dynamic network-based resource-sharing |
CN113360517A (zh) * | 2021-06-02 | 2021-09-07 | 北京自如信息科技有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN113378710A (zh) * | 2021-06-10 | 2021-09-10 | 平安科技(深圳)有限公司 | 图像文件的版面分析方法、装置、计算机设备和存储介质 |
CN114443639A (zh) * | 2020-11-02 | 2022-05-06 | 第四范式(北京)技术有限公司 | 处理数据表及自动训练机器学习模型的方法和系统 |
CN114741402A (zh) * | 2022-04-07 | 2022-07-12 | 中国建设银行股份有限公司 | 业务特征池的处理方法、装置、计算机设备和存储介质 |
CN115858569A (zh) * | 2022-10-26 | 2023-03-28 | 之江实验室 | 一种基于图搜索技术的数据表关联关系分类方法和装置 |
CN115936763A (zh) * | 2022-12-13 | 2023-04-07 | 上海评驾科技有限公司 | 一种基于特征衍生与特征筛选的车机用户流失预测方法 |
CN115953172A (zh) * | 2022-12-16 | 2023-04-11 | 之江实验室 | 一种基于图神经网络的欺诈风险识别方法和装置 |
CN116108115A (zh) * | 2023-03-03 | 2023-05-12 | 上海琢学科技有限公司 | 一种面向银行交易流水数据的自动特征生成featuretools数据处理方法 |
CN116563028A (zh) * | 2023-05-31 | 2023-08-08 | 盛宝金融科技有限公司 | 基于ai的报送数据校验方法、系统及存储介质 |
-
2023
- 2023-11-14 CN CN202311507842.1A patent/CN117252555B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200394455A1 (en) * | 2019-06-15 | 2020-12-17 | Paul Lee | Data analytics engine for dynamic network-based resource-sharing |
CN111400305A (zh) * | 2020-02-20 | 2020-07-10 | 深圳市魔数智擎人工智能有限公司 | 基于特征工程血缘关系的可回溯、可视化方法 |
CN111627552A (zh) * | 2020-04-08 | 2020-09-04 | 湖南长城医疗科技有限公司 | 一种医疗流式数据血缘关系分析、存储方法及装置 |
CN114443639A (zh) * | 2020-11-02 | 2022-05-06 | 第四范式(北京)技术有限公司 | 处理数据表及自动训练机器学习模型的方法和系统 |
CN113360517A (zh) * | 2021-06-02 | 2021-09-07 | 北京自如信息科技有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN113378710A (zh) * | 2021-06-10 | 2021-09-10 | 平安科技(深圳)有限公司 | 图像文件的版面分析方法、装置、计算机设备和存储介质 |
CN114741402A (zh) * | 2022-04-07 | 2022-07-12 | 中国建设银行股份有限公司 | 业务特征池的处理方法、装置、计算机设备和存储介质 |
CN115858569A (zh) * | 2022-10-26 | 2023-03-28 | 之江实验室 | 一种基于图搜索技术的数据表关联关系分类方法和装置 |
CN115936763A (zh) * | 2022-12-13 | 2023-04-07 | 上海评驾科技有限公司 | 一种基于特征衍生与特征筛选的车机用户流失预测方法 |
CN115953172A (zh) * | 2022-12-16 | 2023-04-11 | 之江实验室 | 一种基于图神经网络的欺诈风险识别方法和装置 |
CN116108115A (zh) * | 2023-03-03 | 2023-05-12 | 上海琢学科技有限公司 | 一种面向银行交易流水数据的自动特征生成featuretools数据处理方法 |
CN116563028A (zh) * | 2023-05-31 | 2023-08-08 | 盛宝金融科技有限公司 | 基于ai的报送数据校验方法、系统及存储介质 |
Non-Patent Citations (3)
Title |
---|
NEUMANN L ET AL: "Machine Learning-Based Predictions of Customers’ Decisions in Car Insurance", APPLIED ARTIFICIAL INTELLIGENCE, vol. 33, no. 9, pages 817 - 828 * |
卢冰洁 等: "机器学习模型在车险欺诈检测的研究进展", 计算机工程与应用, vol. 58, no. 5, pages 34 - 49 * |
张连增 等: "车险索赔概率影响因素的Logistic模型分析", 保险研究, no. 07, pages 16 - 25 * |
Also Published As
Publication number | Publication date |
---|---|
CN117252555B (zh) | 2024-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111506559B (zh) | 数据存储方法、装置、电子设备及存储介质 | |
CN105550756A (zh) | 一种基于模拟车辆受损的汽车快速定损方法 | |
CN112541745A (zh) | 用户行为数据分析方法、装置、电子设备及可读存储介质 | |
CN110634021A (zh) | 基于大数据的车辆估值方法、系统、设备及可读存储介质 | |
CN105653398A (zh) | 一种智能分配操作系统镜像方法 | |
CN112115145A (zh) | 数据采集方法、装置、电子设备及存储介质 | |
CN115329556A (zh) | 变电站cad图纸审核方法及设备 | |
CN112613627A (zh) | 车辆维修信息推送方法、装置、系统、设备及存储介质 | |
CN111460232A (zh) | 功能模块的查找方法、装置、终端和计算机可读存储介质 | |
CN112346775A (zh) | 指标数据通用处理方法、电子设备和存储介质 | |
CN113611104A (zh) | 货运车辆的风险识别方法、装置、存储介质及终端 | |
CN117252555B (zh) | 一种基于车险场景的半自动化特征工程方法、系统和介质 | |
CN112905677A (zh) | 数据处理方法及装置、业务处理系统和计算机设备 | |
CN112069269B (zh) | 基于大数据和多维特征的数据溯源方法及大数据云服务器 | |
CN110276013A (zh) | 一种维修技师的推荐方法、装置及存储介质 | |
CN114003731A (zh) | 异构数据处理方法、装置、服务器及存储介质 | |
CN117785918A (zh) | 数据处理方法、装置、存储介质、程序产品及电子设备 | |
CN113094415B (zh) | 数据抽取方法、装置、计算机可读介质及电子设备 | |
CN107844520A (zh) | 电子装置、车辆数据导入方法及存储介质 | |
CN111046632B (zh) | 一种数据提取转换方法、系统、存储介质及电子设备 | |
CN112597192A (zh) | 数据查询方法、装置、服务器及介质 | |
CN117874224A (zh) | 一种数据处理方法、装置、存储介质及电子设备 | |
CN111260384B (zh) | 服务订单处理方法、装置、电子设备及存储介质 | |
CN113093702B (zh) | 故障数据的预测方法和装置、电子设备和存储介质 | |
CN111291019B (zh) | 数据模型的相似判别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |