CN116628536B - 一种汽车在线交易数据处理系统 - Google Patents

一种汽车在线交易数据处理系统 Download PDF

Info

Publication number
CN116628536B
CN116628536B CN202310920765.6A CN202310920765A CN116628536B CN 116628536 B CN116628536 B CN 116628536B CN 202310920765 A CN202310920765 A CN 202310920765A CN 116628536 B CN116628536 B CN 116628536B
Authority
CN
China
Prior art keywords
transaction data
vectors
vector
data vector
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310920765.6A
Other languages
English (en)
Other versions
CN116628536A (zh
Inventor
吴建芳
高超
邵炜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Yiliang Haoche Internet Technology Co ltd
Original Assignee
Hangzhou Yiliang Haoche Internet Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Yiliang Haoche Internet Technology Co ltd filed Critical Hangzhou Yiliang Haoche Internet Technology Co ltd
Priority to CN202310920765.6A priority Critical patent/CN116628536B/zh
Publication of CN116628536A publication Critical patent/CN116628536A/zh
Application granted granted Critical
Publication of CN116628536B publication Critical patent/CN116628536B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/27Regression, e.g. linear or logistic regression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Business, Economics & Management (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Probability & Statistics with Applications (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及汽车在线交易数据处理技术领域,具体涉及一种汽车在线交易数据处理系统。该系统采集汽车在线交易数据,获取交易数据向量集合;计算各交易数据属性的交易数据种类在各交易数据向量中的支持度,并根据不同交易数据属性下各交易数据向量支持度矩阵得到各交易数据向量之间的相似度;对交易数据向量进行合并得到新的交易数据向量,迭代更新交易数据向量集合;并构建交易数据向量集合更新截止条件,自适应获取交易数据向量集合的各初始聚类中心点;对交易数据向量集合进行聚类分析,获取各交易数据向量的类别,完成汽车在线交易数据的处理。本发明实现了汽车在线交易数据的分类处理,具有较高的数据处理精度。

Description

一种汽车在线交易数据处理系统
技术领域
本发明涉及汽车在线交易数据处理技术领域,具体涉及一种汽车在线交易数据处理系统。
背景技术
在高速发展的当前,随着对车辆需求的逐渐增加,车辆交易逐渐增大,汽车交易方式大多采用线上交易,线上交易快捷方便,给用户以及销售商提供了方便。汽车在线交易包括电子交易市场、网络营销、在线事务处理、电子数据交换以及自动数据收集系统等方面,车辆从拍卖到商户买到车,车辆需要进行过户、办证等后续多种操作,需要对车辆进行各个流程的数据管理。
在汽车在线交易过程中,数据类别较为多样,不方便后期汽车在线交易数据的分类管理,为提高汽车在线交易数据管理效率,保证汽车在线交易效率,需要对汽车在线交易过程中的交易数据进行类别划分,以便汽车在线交易数据的分类高效管理。
综上所述,本发明提出一种汽车在线交易数据处理系统,获取各汽车在线交易数据向量,结合各交易数据向量之间的关系自适应获取交易数据向量集合聚类分析的初始聚类中心点,提高聚类精度,结合改进聚类算法对汽车在线交易数据向量进行聚类分析,完成汽车在线交易数据的处理,以便相关人员对汽车在线交易数据的分类管理。
发明内容
为了解决上述技术问题,本发明的目的在于提供一种汽车在线交易数据处理系统,所采用的技术方案具体如下:
本发明提出了一种汽车在线交易数据处理系统,所述系统包括:
数据采集模块、数据处理模块;
数据采集模块,用于采集汽车在线交易数据;每笔汽车在线交易数据均作为一个交易数据向量,每个交易数据向量均包括多种交易数据属性,每种交易数据属性对应多种交易数据类别,将所有交易数据向量作为交易数据向量集合;
数据处理模块,用于根据k-均值聚类算法对交易数据向量集合进行聚类分析,设定聚类类别数,根据各交易数据属性的交易数据种类在各交易数据向量中的归属情况得到各交易数据属性的交易数据种类在各交易数据向量中的支持度;根据汽车交易过程中各交易数据属性的交易数据种类在各交易数据向量中的支持度得到各交易数据属性下的交易数据向量支持度矩阵;根据不同交易数据属性下各交易数据向量支持度矩阵得到各交易数据向量之间的相似度;
根据相似度最大对应的两个交易数据向量进行合并操作得到新的交易数据向量;根据新的交易数据向量对交易数据向量集合进行更新,迭代更新交易数据向量集合;设定相似度阈值,根据交易数据向量集合中各交易数据向量之间的相似度及相似度阈值得到交易数据向量集合更新截止条件,结合交易数据向量集合更新截止条件完成交易数据向量集合的更新;
选取最后迭代合并操作得到的k个新的交易数据向量作为交易数据向量集合的各初始聚类中心点;根据各交易数据向量与各初始聚类中心点的关系得到聚类距离;结合各初始聚类中心点以及聚类距离采用k-均值聚类算法对交易数据向量集合进行聚类分析,获取各交易数据向量的类别,完成汽车在线交易数据的处理。
进一步地,所述根据各交易数据属性的交易数据种类在各交易数据向量中的归属情况得到各交易数据属性的交易数据种类在各交易数据向量中的支持度,具体步骤包括:
对于各交易数据属性的交易数据种类在各交易数据向量中的支持度;
将交易数据属性i的交易数据种类t在交易数据向量n的支持度记为,当交易数据向量n中的交易数据属性i的交易数据种类为t时,则交易数据属性i的交易数据种类t在交易数据向量n的支持度为1,记为:/>;当交易数据向量n中的交易数据属性i的交易数据种类不为t时,则交易数据属性i的交易数据种类t在交易数据向量n的支持度为0,记为:/>
进一步地,所述根据汽车交易过程中各交易数据属性的交易数据种类在各交易数据向量中的支持度得到各交易数据属性下的交易数据向量支持度矩阵,表达式为:
式中,为交易数据属性i的交易数向量支持度矩阵,分别为交易数据属性i的交易数据种类1、2、t在交易数据向量1的支持度,/>分别为交易数据属性i的交易数据种类1、2、t在交易数据向量n的支持度,t为交易数据种类数,M为交易数据属性数量。
进一步地,所述根据不同交易数据属性下各交易数据向量支持度矩阵得到各交易数据向量之间的相似度,表达式为:
式中,为取交集操作,其中/>取值为0或者1,当且仅当/>均为1时,/>取值为1,为取并集操作,其中/>取值为0或者1,当且仅当/>均为0时,取值为0,t为交易数据种类数,M为交易数据属性个数,/>为交易数据向量u、v之间的相似度。
进一步地,所述根据相似度最大对应的两个交易数据向量进行合并操作得到新的交易数据向量,具体步骤包括:
选取相似度最大对应的两个交易数据向量,当两个交易数据向量中交易数据属性的交易数据种类对应相同时,将该相同的交易数据种类作为新的交易数据向量中交易数据属性的交易数据种类;否则,分别统计两个交易数据向量中交易数据属性的交易数据种类在所有交易数据向量的交易数据属性中所出现的频次,将频次较高对应的交易数据种类作为新的交易数据向量中交易数据属性的交易数据种类。
进一步地,所述根据新的交易数据向量对交易数据向量集合进行更新,具体步骤包括:
删除相似度最大的两个交易数据向量,并将相似度最大的两个交易数据向量合并操作得到的新的交易数据向量添加到交易数据向量集合中,完成交易数据向量集合的更新。
进一步地,所述根据交易数据向量集合中各交易数据向量之间的相似度及相似度阈值得到交易数据向量集合更新截止条件,包括:
设定相似度阈值,当任意两个交易数据向量之间的相似度均低于相似度阈值时,停止交易数据向量的合并操作,将任意两个交易数据向量之间的相似度均低于相似度阈值作为交易数据向量集合更新截止条件。
进一步地,所述根据各交易数据向量与各初始聚类中心点的关系得到聚类距离,具体表达式为:
式中,为交易数据向量/>与初始聚类中心点/>之间的相似度,/>为避免分母为零的极小值,/>为聚类距离。
本发明具有如下有益效果:
本发明主要通过对汽车在线交易数据进行采集,并构建各交易数据向量,结合改进聚类算法对交易数据向量集合进行聚类划分,实现交易数据向量的分类,完成汽车在线交易数据的处理,便于汽车在线交易数据的分类高效管理;
考虑到传统聚类算法中初始聚类中心点的选取大多为人为随机选取,随机选取初始聚类中心的做法会导致算法的不稳定性,有可能陷入局部最优的情况,本发明结合汽车交易过程中各交易数据属性的交易数据种类在各交易数据向量中的支持度构建各交易数据属性下的交易数据向量支持度矩阵,可准确检测各交易数据向量之间的相关性;结合各交易数据向量之间的相似度对交易数据向量集合进行迭代更新,提高初始聚类中心点的选取精度,进而提高聚类效果,保证交易数据向量的类别划分准确性,提高汽车在线交易数据处理的有效性,便于汽车在线交易数据的分类高效管理。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例所提供的一种汽车在线交易数据处理系统框图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种汽车在线交易数据处理系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种汽车在线交易数据处理系统的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种汽车在线交易数据处理系统框图,该系统包括:数据采集模块101、数据处理模块102。
数据采集模块101,在汽车在线交易平台上获取各汽车在线交易数据。
本实施例主要根据汽车在线交易数据的数据特征对各汽车在线交易数据进行聚类分析,获取各汽车在线交易数据类别,便于对汽车在线交易数据的分类管理,进而实现提高汽车在线交易效率。首先在汽车在线交易平台上获取各汽车在线交易数据,每笔汽车在线交易均包含多种交易数据,需要说明的是,汽车在线交易数据包括很多属性,包括但不限于汽车型号、汽车价位、汽车款式、车牌号、交易双方信息等交易数据属性,实施者可自行设定,本实施例中将汽车在线交易包含的交易数据属性数量记为M。需要说明的是,本实施例中所述交易数据属性即为交易过程中所包含的汽车型号、汽车价位、汽车款式、车牌号、交易双方信息等各种数据属性,而每种交易数据属性将包含多种交易数据种类,比如交易数据属性汽车款式,其包含微型车、中型车、SUV、MVP、跑车、皮卡、微面等多种交易数据种类,具体的交易数据种类根据所采集的汽车在线交易数据来进行设定。
为便于对汽车在线交易数据的分析,本实施例将每笔汽车在线交易数据均作为一个交易数据向量,获取各汽车在线交易所对应的交易数据向量,所有的交易数据向量记为交易数据向量集合,作为汽车在线交易数据处理的基础,本实施例将所提取处理的交易数据向量总数记为n。汽车在线交易数据可以通过在汽车在线交易平台上进行下载等获取方式,可通过现有技术实现,不在本实施例保护范围内,不做相关详细阐述。
根据本实施例上述方法获取汽车在线交易所对应的交易数据向量集合,用于对汽车在线交易数据进行分析处理。
数据处理模块102,对汽车在线交易数据向量集合进行自适应聚类,获取各交易数据向量的数据类别,完成汽车在线交易数据的分类处理。
考虑到汽车在线交易数据多种多样,在进行汽车交易数据管理时,一般对数据进行分类管理,以便提高数据管理效率,方便相关管理人员根据不同类别的汽车在线交易数据对各类别的数据特征进行分析。因此,本实施例对汽车在线交易数据进行类别划分,以完成对汽车在线交易数据的分类,实现对汽车在线交易数据的高效处理。
对于交易数据向量集合,本实施例将采用聚类算法对交易数据向量集合进行聚类分析,聚类算法有很多,本实施例采用k-均值聚类算法对各交易数据向量进行分类,其中聚类类别数量k实施者可根据汽车在线交易数据经验类别进行自行设定,本实施例将聚类类别数量设定为k=10;
传统K-均值聚类算法的初始聚类中心点的选取是人为随机设定,具有较强的主观性且过于随机,将会导致聚类结果不稳定的问题,影响交易数据向量的聚类精度,针对该问题,本实施例将对初始聚类中心点进行自适应选取,避免局部最优情况,保证各交易数据向量的类别划分精度。首先根据汽车交易过程中各交易数据属性的交易数据种类在各交易数据向量中的支持度构建各交易数据属性下的交易数据向量支持度矩阵,表达式为:
式中,为交易数据属性i的交易数向量支持度矩阵,分别为交易数据属性i的交易数据种类1、2、t在交易数据向量1的支持度,/>分别为交易数据属性i的交易数据种类1、2、t在交易数据向量n的支持度,t为交易数据种类数,M为交易数据属性数量;
需要说明的是,对于上述支持度本实施例以交易数据向量n中的交易数据属性i为例,也即以为例进行详细说明本实施例中的支持度定义:当交易数据向量n中的交易数据属性i的交易数据种类为t时,则/>,也即交易数据属性i的交易数据种类t在交易数据向量n的支持度为1;当交易数据向量n中的交易数据属性i的交易数据种类不为t时,则/>,也即交易数据属性i的交易数据种类t在交易数据向量n的支持度为0。本实施例所述支持度用于表征交易数据种类在交易数据向量的交易数据属性中的归属情况,作为后续分析交易数据向量之间相似程度的基准特征;
重复上述方法,获取不同交易数据属性下各交易数据向量支持度矩阵;
根据不同交易数据属性下各交易数据向量支持度矩阵得到各交易数据向量之间的相似度,表达式具体为:
式中,为取交集操作,其中/>取值为0或者1,当且仅当/>均为1时,/>取值为1,否则取值为0;/>为取并集操作,其中/>取值为0或者1,当且仅当/>均为0时,取值为0,否则取值为1,t为交易数据种类数,M为交易数据属性个数,/>为交易数据向量u、v之间的相似度,相似度越大,则两个交易数据向量之间的交易越一致;
选取相似度最大对应的两个交易数据向量,将两个交易数据向量进行合并操作作为一个新的交易数据向量。本实施例中合并操作为当两个交易数据向量中交易数据属性的交易数据种类相同时,将该相同的交易数据种类作为新的交易数据向量中交易数据属性的交易数据种类;否则,分别统计两个交易数据向量中交易数据属性的交易数据种类在所有交易数据向量的交易数据属性中所出现的频次,例如交易数据向量u中汽车款式(交易数据属性)为皮卡(交易数据种类),交易数据向量v中汽车款式(交易数据属性)为SUV(交易数据种类),两个交易数据向量中汽车款式所对应的种类不同,分别统计皮卡和SUV在所有交易数据向量的汽车款式中出现的频次,将频次较高对应的交易数据种类作为新的交易数据向量中交易数据属性的交易数据种类。至此,根据本实施例上述合并操作方法可获取新的交易数据向量,根据新的交易数据向量以及各交易数据向量得到交易数据向量集合的更新,本实施例中删除相似度最大的两个交易数据向量,将新的交易数据向量添加到交易数据向量集合中,对交易数据向量集合进行更新;
进一步根据本实施例上述方法迭代计算交易数据向量集合中各交易数据向量之间的相似度,同样的将相似度最大对应的两个交易数据向量进行合并,迭代更新交易数据向量集合,并设定交易数据向量更新截止条件:本实施例将对各交易数据向量之间的相似度进行归一化处理,保证任意两个交易数据向量的相似度均处于(0,1),然后设定相似度阈值,当交易数据向量之间的最大相似度低于相似度阈值时,将停止交易数据向量的合并操作,需要说明的是,每次迭代过程均得到对应的一个新的交易数据向量,对交易数据向量集合进行迭代更新。相似度阈值的取值实施者可自行设定,本实施例设置为0.5;
考虑到新的交易数据向量能够对相似度较高的两个交易数据向量的特征进行表征,因此,当交易数据向量的合并操作满足停止条件时,选取最后合并得到的k个新的交易数据向量作为交易数据向量集合聚类的初始聚类中心点,本实施例中k=10。至此,根据本实施例上述方法即可得到交易数据向量集合聚类分析的初始聚类中心点,可实现对交易数据向量集合聚类过程中初始聚类中心点的自适应选取,提高聚类精度,避免聚类类别中数据过少等问题,保证聚类效果;
获取初始聚类中心点后,根据各交易数据向量与各初始聚类中心点的关系得到聚类距离,表达式为:
式中,为交易数据向量/>与初始聚类中心点/>之间的相似度,/>为聚类距离,/>为避免分母为零的极小值,实施者可自行设定,本实施例设定为/>
至此,结合各初始聚类中心点以及聚类距离采用k-均值聚类算法对交易数据向量集合进行聚类分析,获取各交易数据向量的类别,以实现交易数据向量的类别划分,便于汽车交易数据的分类管理。需要说明的是,k-均值聚类算法的具体聚类过程为现有公知技术,不在本实施例保护范围内,在此不做相关详细一一阐述。
至此,根据本实施例上述方法可实现对汽车在线交易数据的分类处理,可获取各汽车在线交易数据类别,完成汽车在线交易数据的有效处理,以便后续对汽车在线交易数据的分类高效管理。
综上所述,本发明实施例主要通过对汽车在线交易数据进行采集,并构建各交易数据向量,结合改进聚类算法对交易数据向量集合进行聚类划分,实现交易数据向量的分类,完成汽车在线交易数据的处理,便于汽车在线交易数据的分类高效管理;
考虑到传统聚类算法中初始聚类中心点的选取大多为人为随机选取,随机选取初始聚类中心的做法会导致算法的不稳定性,有可能陷入局部最优的情况,本发明实施例结合汽车交易过程中各交易数据属性的交易数据种类在各交易数据向量中的支持度构建各交易数据属性下的交易数据向量支持度矩阵,可准确检测各交易数据向量之间的相关性;结合各交易数据向量之间的相似度对交易数据向量集合进行迭代更新,提高初始聚类中心点的选取精度,进而提高聚类效果,保证交易数据向量的类别划分准确性,提高汽车在线交易数据处理的有效性,便于汽车在线交易数据的分类高效管理。
综上所述,本发明实施例通过对汽车在线交易数据进行采集,并构建各交易数据向量,结合改进聚类算法对交易数据向量集合进行聚类划分,实现交易数据向量的分类,完成汽车在线交易数据的处理,便于汽车在线交易数据的分类高效管理;
考虑到传统聚类算法中初始聚类中心点的选取大多为人为随机选取,随机选取初始聚类中心的做法会导致算法的不稳定性,有可能陷入局部最优的情况,本发明实施例结合汽车交易过程中各交易数据属性的交易数据种类在各交易数据向量中的支持度构建各交易数据属性下的交易数据向量支持度矩阵,可准确检测各交易数据向量之间的相关性;结合各交易数据向量之间的相似度对交易数据向量集合进行迭代更新,提高初始聚类中心点的选取精度,进而提高聚类效果,保证交易数据向量的类别划分准确性,提高汽车在线交易数据处理的有效性,便于汽车在线交易数据的分类高效管理。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种汽车在线交易数据处理系统,其特征在于,所述系统包括:
数据采集模块、数据处理模块;
数据采集模块,用于采集汽车在线交易数据;每笔汽车在线交易数据均作为一个交易数据向量,每个交易数据向量均包括多种交易数据属性,每种交易数据属性对应多种交易数据类别,将所有交易数据向量作为交易数据向量集合;
数据处理模块,用于根据k-均值聚类算法对交易数据向量集合进行聚类分析,设定聚类类别数,根据各交易数据属性的交易数据种类在各交易数据向量中的归属情况得到各交易数据属性的交易数据种类在各交易数据向量中的支持度;根据汽车交易过程中各交易数据属性的交易数据种类在各交易数据向量中的支持度得到各交易数据属性下的交易数据向量支持度矩阵;根据不同交易数据属性下各交易数据向量支持度矩阵得到各交易数据向量之间的相似度;
根据相似度最大对应的两个交易数据向量进行合并操作得到新的交易数据向量;根据新的交易数据向量对交易数据向量集合进行更新,迭代更新交易数据向量集合;设定相似度阈值,根据交易数据向量集合中各交易数据向量之间的相似度及相似度阈值得到交易数据向量集合更新截止条件,结合交易数据向量集合更新截止条件完成交易数据向量集合的更新;
选取最后迭代合并操作得到的k个新的交易数据向量作为交易数据向量集合的各初始聚类中心点;根据各交易数据向量与各初始聚类中心点的关系得到聚类距离;结合各初始聚类中心点以及聚类距离采用k-均值聚类算法对交易数据向量集合进行聚类分析,获取各交易数据向量的类别,完成汽车在线交易数据的处理;
所述根据各交易数据属性的交易数据种类在各交易数据向量中的归属情况得到各交易数据属性的交易数据种类在各交易数据向量中的支持度,具体步骤包括:
对于各交易数据属性的交易数据种类在各交易数据向量中的支持度;
将交易数据属性i的交易数据种类t在交易数据向量n的支持度记为,当交易数据向量n中的交易数据属性i的交易数据种类为t时,则交易数据属性i的交易数据种类t在交易数据向量n的支持度为1,记为:/>;当交易数据向量n中的交易数据属性i的交易数据种类不为t时,则交易数据属性i的交易数据种类t在交易数据向量n的支持度为0,记为:/>
所述根据汽车交易过程中各交易数据属性的交易数据种类在各交易数据向量中的支持度得到各交易数据属性下的交易数据向量支持度矩阵,表达式为:
式中,为交易数据属性i的交易数向量支持度矩阵,分别为交易数据属性i的交易数据种类1、2、t在交易数据向量1的支持度,/>分别为交易数据属性i的交易数据种类1、2、t在交易数据向量n的支持度,t为交易数据种类数,M为交易数据属性数量;
所述根据不同交易数据属性下各交易数据向量支持度矩阵得到各交易数据向量之间的相似度,表达式为:
式中,为取交集操作,其中取值为0或者1,当且仅当/>均为1时,/>取值为1,/>为取并集操作,其中/>取值为0或者1,当且仅当均为0时,取值为0,t为交易数据种类数,M为交易数据属性个数,/>为交易数据向量u、v之间的相似度。
2.根据权利要求1所述的一种汽车在线交易数据处理系统,其特征在于,所述根据相似度最大对应的两个交易数据向量进行合并操作得到新的交易数据向量,具体步骤包括:
选取相似度最大对应的两个交易数据向量,当两个交易数据向量中交易数据属性的交易数据种类对应相同时,将该相同的交易数据种类作为新的交易数据向量中交易数据属性的交易数据种类;否则,分别统计两个交易数据向量中交易数据属性的交易数据种类在所有交易数据向量的交易数据属性中所出现的频次,将频次较高对应的交易数据种类作为新的交易数据向量中交易数据属性的交易数据种类。
3.根据权利要求1所述的一种汽车在线交易数据处理系统,其特征在于,所述根据新的交易数据向量对交易数据向量集合进行更新,具体步骤包括:
删除相似度最大的两个交易数据向量,并将相似度最大的两个交易数据向量合并操作得到的新的交易数据向量添加到交易数据向量集合中,完成交易数据向量集合的更新。
4.根据权利要求1所述的一种汽车在线交易数据处理系统,其特征在于,所述根据交易数据向量集合中各交易数据向量之间的相似度及相似度阈值得到交易数据向量集合更新截止条件,包括:
设定相似度阈值,当任意两个交易数据向量之间的相似度均低于相似度阈值时,停止交易数据向量的合并操作,将任意两个交易数据向量之间的相似度均低于相似度阈值作为交易数据向量集合更新截止条件。
5.根据权利要求1所述的一种汽车在线交易数据处理系统,其特征在于,所述根据各交易数据向量与各初始聚类中心点的关系得到聚类距离,具体表达式为:
式中,为交易数据向量/>与初始聚类中心点/>之间的相似度,/>为避免分母为零的极小值,/>为聚类距离。
CN202310920765.6A 2023-07-26 2023-07-26 一种汽车在线交易数据处理系统 Active CN116628536B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310920765.6A CN116628536B (zh) 2023-07-26 2023-07-26 一种汽车在线交易数据处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310920765.6A CN116628536B (zh) 2023-07-26 2023-07-26 一种汽车在线交易数据处理系统

Publications (2)

Publication Number Publication Date
CN116628536A CN116628536A (zh) 2023-08-22
CN116628536B true CN116628536B (zh) 2023-10-31

Family

ID=87610269

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310920765.6A Active CN116628536B (zh) 2023-07-26 2023-07-26 一种汽车在线交易数据处理系统

Country Status (1)

Country Link
CN (1) CN116628536B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6049797A (en) * 1998-04-07 2000-04-11 Lucent Technologies, Inc. Method, apparatus and programmed medium for clustering databases with categorical attributes
CN101777126A (zh) * 2010-02-10 2010-07-14 华中科技大学 一种多维特征向量的聚类方法
CN105809508A (zh) * 2016-03-01 2016-07-27 成都市泰象网络科技有限公司 一种汽车电商交易管理系统及方法
CN110378607A (zh) * 2019-07-24 2019-10-25 青岛鲁诺金融电子技术有限公司 一种基于算法的汽车金融服务系统
CN113111935A (zh) * 2021-04-07 2021-07-13 东南大学 一种大宗商品电子商务市场中基于交易数据实时聚类的相同交易主体判定方法
CN114035883A (zh) * 2021-11-26 2022-02-11 中国银行股份有限公司 一种基于聚类分析的终端界面设置方法及系统
CN116484247A (zh) * 2023-06-21 2023-07-25 北京点聚信息技术有限公司 一种签署数据智能处理系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6049797A (en) * 1998-04-07 2000-04-11 Lucent Technologies, Inc. Method, apparatus and programmed medium for clustering databases with categorical attributes
CN101777126A (zh) * 2010-02-10 2010-07-14 华中科技大学 一种多维特征向量的聚类方法
CN105809508A (zh) * 2016-03-01 2016-07-27 成都市泰象网络科技有限公司 一种汽车电商交易管理系统及方法
CN110378607A (zh) * 2019-07-24 2019-10-25 青岛鲁诺金融电子技术有限公司 一种基于算法的汽车金融服务系统
CN113111935A (zh) * 2021-04-07 2021-07-13 东南大学 一种大宗商品电子商务市场中基于交易数据实时聚类的相同交易主体判定方法
CN114035883A (zh) * 2021-11-26 2022-02-11 中国银行股份有限公司 一种基于聚类分析的终端界面设置方法及系统
CN116484247A (zh) * 2023-06-21 2023-07-25 北京点聚信息技术有限公司 一种签署数据智能处理系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
An agglomerative hierarchical clustering using partial maximum array and incremental similarity computation method;SungYoung Jung et al;《 Proceedings 2001 IEEE International Conference on Data Mining》;265-272 *
一种分类数据聚类算法及其高效并行实现;丁祥武等;《计算机应用与软件》;第34卷(第7期);249-256 *

Also Published As

Publication number Publication date
CN116628536A (zh) 2023-08-22

Similar Documents

Publication Publication Date Title
CN107563757B (zh) 数据风险识别的方法及装置
CN110111113B (zh) 一种异常交易节点的检测方法及装置
CN109344998A (zh) 一种基于医疗美容场景的客户违约概率预测方法
CN110020866B (zh) 一种识别模型的训练方法、装置及电子设备
CN105825192A (zh) 一种人脸表情识别方法及系统
CN110400215A (zh) 面向企业家族的小微企业信用评估模型构建方法及系统
CN113159922A (zh) 一种数据的流向识别方法、装置、设备及介质
CN110727740B (zh) 关联分析方法及装置、计算机设备与可读介质
CN116628536B (zh) 一种汽车在线交易数据处理系统
CN116596570A (zh) 一种基于大数据分析算法的同产品在不同电商平台中的信息对比系统
CN112634246A (zh) 一种口腔图像识别方法及相关设备
CN110348516B (zh) 数据处理方法、装置、存储介质及电子设备
CN109191185A (zh) 一种客群分类方法及系统
CN111309770B (zh) 一种基于无监督机器学习的自动生成规则系统及方法
CN116205488A (zh) 风险商户识别方法、装置、设备、介质及产品
CN115409863A (zh) 工件焊缝提取方法、装置、计算机可读介质及电子设备
CN115167965A (zh) 交易进度条的处理方法及装置
CN112488825A (zh) 基于区块链的对象交易方法及装置
Dogan et al. Fuzzy RFM analysis in car rental sector
CN115170310A (zh) 购付汇交易的风险控制方法及装置
CN113886448B (zh) 一种账目数据处理方法、装置及存储介质
CN110675878A (zh) 一种车商识别的方法、装置、存储介质及电子设备
CN109783559A (zh) 房产交易数据的获取方法、装置、电子设备以及存储介质
CN110782342B (zh) 基于二分类模型验证新渠道特征工程正确性的方法及装置
CN117710243A (zh) 点云去噪方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant