CN113988890A - 一种跨境电商企业评估方法、装置及设备 - Google Patents
一种跨境电商企业评估方法、装置及设备 Download PDFInfo
- Publication number
- CN113988890A CN113988890A CN202111314326.8A CN202111314326A CN113988890A CN 113988890 A CN113988890 A CN 113988890A CN 202111314326 A CN202111314326 A CN 202111314326A CN 113988890 A CN113988890 A CN 113988890A
- Authority
- CN
- China
- Prior art keywords
- data information
- training
- cleaned
- cross
- border
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000011156 evaluation Methods 0.000 claims abstract description 76
- 239000000203 mixture Substances 0.000 claims abstract description 34
- 238000013210 evaluation model Methods 0.000 claims abstract description 27
- 238000007781 pre-processing Methods 0.000 claims abstract description 27
- 238000004140 cleaning Methods 0.000 claims abstract description 18
- 238000012549 training Methods 0.000 claims description 102
- 238000012545 processing Methods 0.000 claims description 18
- 238000012795 verification Methods 0.000 claims description 16
- 238000010606 normalization Methods 0.000 claims description 6
- 230000003068 static effect Effects 0.000 abstract description 5
- 230000006399 behavior Effects 0.000 description 23
- 238000011161 development Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 230000009471 action Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000013468 resource allocation Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 206010000117 Abnormal behaviour Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000035605 chemotaxis Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 238000002759 z-score normalization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/018—Certifying business or products
- G06Q30/0185—Product, service or business identity fraud
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Economics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Entrepreneurship & Innovation (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Evolutionary Computation (AREA)
- Finance (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Life Sciences & Earth Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例公开了一种跨境电商企业评估方法、装置及设备,该方法包括:首先获取待评估的目标跨境电商企业的基本数据信息和交易数据信息;并对基本数据信息和交易数据信息进行清洗,得到清洗后的基本数据信息和清洗后的交易数据信息,然后,对清洗后的基本数据信息和清洗后的交易数据信息进行预处理,并为预处理后的数据分配对应的权重,得到目标输入数据,进而可以将目标输入数据输入预先构建的高斯混合评估模型,对目标跨境电商企业进行评估,得到评估结果。可见,本申请实施例是通过动静结合的数据充分挖掘企业在跨境电商市场中所表现出的行为模式,更加客观和准确的对跨境电商企业的评估,有效提高了评估结果的准确性。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种企业评估方法、装置及设备。
背景技术
随着互联网技术的高速发展,跨境电商以“外贸+互联网”的新模式,有效地优化了外贸行业的资源配置,促进了贸易产业的发展。
目前虽然跨境电商行业发展处于迅猛势头,但依然存在着制约跨境电商发展的因素。比如:跨境电商平台对跨境电商企业的评价、管理、扶持等做的还不够完善。跨境电商平台试图通过提供稳定、安全的交易平台给企业开展跨境电商业务,但目前依然存在着虚假交易等不良行为。这些行为对于跨境电商平台往往是后知后觉,当事件纰漏后追根溯源才能找到问题,存在一定的滞后性,因此需要提前对跨境电商企业进行有效评估,但当前对跨境电商企业评估时一遍是通过指标体系进行评估,比如,通过退款率、好评率等指标进行评估。这样的评价结果往往较为单一,无法挖掘有价值的企业行为特征,会大大降低评估结果的准确性。因此,如何提高对于跨境电商企业评估的准确性是目前亟待解决的问题。
发明内容
有鉴于此,本申请实施例的主要目的在于提供一种跨境电商企业评估方法、装置及设备,能够实现对跨境电商企业的准确评估。
为解决上述问题,本申请实施例提供的技术方案如下:
第一方面,本申请实施例提供了一种跨境电商企业评估方法,包括:
获取待评估的目标跨境电商企业的基本数据信息和交易数据信息;并对所述基本数据信息和交易数据信息进行清洗,得到清洗后的基本数据信息和清洗后的交易数据信息;
对所述清洗后的基本数据信息和清洗后的交易数据信息进行预处理,并为预处理后的数据分配对应的权重,得到目标输入数据;
将目标输入数据输入预先构建的高斯混合评估模型,对所述目标跨境电商企业进行评估,得到评估结果。
可选的,所述对所述清洗后的基本数据信息和清洗后的交易数据信息进行预处理,并对预处理后的数据分配对应的权重,得到目标输入数据,包括:
对所述清洗后的基本数据信息和清洗后的交易数据信息中的定性指标的离散数据进行量化处理,以及对所述清洗后的基本数据信息和清洗后的交易数据信息中的定量指标的连续数据进行归一化处理,得到处理后的数据;
对处理后的数据案子按照相关程度划分为预设等级,并分别赋予预设的权重,得到目标输入数据。
可选的,所述对处理后的数据案子按照相关程度划分预设等级,并分别赋予预设的权重,得到目标输入数据,包括:
对处理后的数据案子按照相关程度划分为三级,并分别赋予1.5、1.2和1的权重,得到目标输入数据。
可选的,所述高斯混合评估模型的构建方式如下:
获取训练跨境电商企业的训练数据信息;
对所述训练数据信息进行预处理,并为预处理后的训练数据信息分配对应的权重,得到训练输入数据;
将所述训练输入数据输入初始高斯混合评估模型,得到初始评估结果;
通过GINI校验及负面样本验证所述初始评估结果的准确性,并利用验证结果,调整所述初始高斯混合评估模型的参数,以达到最优评估结果。
可选的,所述获取训练跨境电商企业的训练数据信息,包括:
获取训练跨境电商企业的训练基本数据信息和训练交易数据信息;并对所述训练基本数据信息和训练交易数据信息进行清洗,得到清洗后的训练基本数据信息和清洗后的训练交易数据信息,作为所述训练跨境电商企业的训练数据信息。
第二方面,本申请提供一种跨境电商企业评估装置,包括:
第一获取单元,用于获取待评估的目标跨境电商企业的基本数据信息和交易数据信息;并对所述基本数据信息和交易数据信息进行清洗,得到清洗后的基本数据信息和清洗后的交易数据信息;
第一预处理单元,用于对所述清洗后的基本数据信息和清洗后的交易数据信息进行预处理,并为预处理后的数据分配对应的权重,得到目标输入数据;
评估单元,用于将目标输入数据输入预先构建的高斯混合评估模型,对所述目标跨境电商企业进行评估,得到评估结果。
可选的,所述第一预处理单元包括:
处理子单元,用于对所述清洗后的基本数据信息和清洗后的交易数据信息中的定性指标的离散数据进行量化处理,以及对所述清洗后的基本数据信息和清洗后的交易数据信息中的定量指标的连续数据进行归一化处理,得到处理后的数据;
划分子单元,用于对处理后的数据案子按照相关程度划分为预设等级,并分别赋予预设的权重,得到目标输入数据。
可选的,所述划分子单元具体用于:
对处理后的数据案子按照相关程度划分为三级,并分别赋予1.5、1.2和1的权重,得到目标输入数据。
可选的,所述装置还包括:
第二获取单元,用于获取训练跨境电商企业的训练数据信息;
第二预处理单元,用于对所述训练数据信息进行预处理,并为预处理后的训练数据信息分配对应的权重,得到训练输入数据;
输入单元,用于将所述训练输入数据输入初始高斯混合评估模型,得到初始评估结果;
调整单元,用于通过GINI校验及负面样本验证所述初始评估结果的准确性,并利用验证结果,调整所述初始高斯混合评估模型的参数,以达到最优评估结果。
可选的,所述第二获取单元具体用于:
获取训练跨境电商企业的训练基本数据信息和训练交易数据信息;并对所述训练基本数据信息和训练交易数据信息进行清洗,得到清洗后的训练基本数据信息和清洗后的训练交易数据信息,作为所述训练跨境电商企业的训练数据信息。
本申请实施例还提供了一种跨境电商企业评估设备,包括:处理器、存储器、系统总线;
所述处理器以及所述存储器通过所述系统总线相连;
所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行上述跨境电商企业评估方法中的任意一种实现方式。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行上述跨境电商企业评估方法中的任意一种实现方式。
本申请实施例在进行跨境电商企业评估时,首先获取待评估的目标跨境电商企业的基本数据信息和交易数据信息;并对基本数据信息和交易数据信息进行清洗,得到清洗后的基本数据信息和清洗后的交易数据信息,然后,对清洗后的基本数据信息和清洗后的交易数据信息进行预处理,并为预处理后的数据分配对应的权重,得到目标输入数据,进而可以将目标输入数据输入预先构建的高斯混合评估模型,对目标跨境电商企业进行评估,得到评估结果。可见,本申请实施例是通过动静结合的数据充分挖掘企业在跨境电商市场中所表现出的行为模式,更加客观和准确的对跨境电商企业的评估,有效提高了评估结果的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种跨境电商企业评估方法的流程示意图;
图2为本申请实施例提供的通过GINI验证的示例图;
图3为本申请实施例提供的一种跨境电商企业评估装置的组成示意图。
具体实施方式
随着互联网技术的高速发展,越来越多的传统外贸易企业也开始开展线上业务。跨境电商以“外贸+互联网”的新模式,有效地优化了外贸行业的资源配置,促进了贸易产业发展。
目前虽然跨境电商行业发展处于迅猛势头,但依然存在着制约跨境电商发展的因素。比如:跨境电商平台对跨境电商企业的评价、管理、扶持等做的还不够完善。跨境电商平台试图通过提供稳定、安全的交易平台给企业开展跨境电商业务,但目前依然存在着虚假交易等不良行为。这些行为对于跨境电商平台往往是后知后觉,当事件纰漏后追根溯源才能找到问题,存在一定的滞后性,因此需要提前对跨境电商企业进行有效评估,但当前对跨境电商企业评估时一遍是通过指标体系进行评估,比如,通过退款率、好评率等指标进行评估。这样的评价结果往往较为单一,无法挖掘有价值的企业行为特征,会大大降低评估结果的准确性。因此,如何提高对于跨境电商企业评估的准确性是目前亟待解决的问题。
为解决上述缺陷,本申请实施例提供了一种跨境电商企业评估方法,在进行跨境电商企业评估时,首先获取待评估的目标跨境电商企业的基本数据信息和交易数据信息;并对基本数据信息和交易数据信息进行清洗,得到清洗后的基本数据信息和清洗后的交易数据信息,然后,对清洗后的基本数据信息和清洗后的交易数据信息进行预处理,并为预处理后的数据分配对应的权重,得到目标输入数据,进而可以将目标输入数据输入预先构建的高斯混合评估模型,对目标跨境电商企业进行评估,得到评估结果。可见,本申请实施例是通过动静结合的数据充分挖掘企业在跨境电商市场中所表现出的行为模式,更加客观和准确的对跨境电商企业的评估,有效提高了评估结果的准确性。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
第一实施例
参见图1,为本实施例提供的一种跨境电商企业评估方法的流程示意图,该方法包括以下步骤:
S101:获取待评估的目标跨境电商企业的基本数据信息和交易数据信息;并对基本数据信息和交易数据信息进行清洗,得到清洗后的基本数据信息和清洗后的交易数据信息。
在本实施例中,将需要进行评估的跨境电商企业定义为目标跨境电商企业。为了对目标跨境电商企业进行有效评估,首先需要获取待评估的目标跨境电商企业的基本数据信息和交易数据信息;并对基本数据信息和交易数据信息进行清洗,得到清洗后的基本数据信息和清洗后的交易数据信息,实现数据的结构化存储,用以执行后续步骤S102。
其中,目标跨境电商企业的基本数据信息包括但不限于包含企业成立时间、注册资本、行业、股权架构、经营风险等,且这些数据的具体获取方式不做限定,比如可以将玛尔斯大数据平台玛尔斯大数据平台的企业基本信息等结构化数据提取并存入Mysql关系型数据库中。目标跨境电商企业的交易数据信息包括但不限于订单、财务、仓储、物流等模块数据,且这些数据的具体获取方式不做限定,比如可以通过预先搭建的全自动数据对接系统,从电商平台获取电商企业各维度数据,需要说明的是,所调取的数据均获得用户的店铺授权,数据来源也是符合相关规定的。
并且,由于数据存在异常值、空值等脏数据,通过编写数据清洗程序,自动化对数据进行处理。如用默认值填充缺失值,删除非必要数据,将数据做结构化调整,得到清洗后的基本数据信息和清洗后的交易数据信息,用以执行后续步骤S102。
S102:对清洗后的基本数据信息和清洗后的交易数据信息进行预处理,并为预处理后的数据分配对应的权重,得到目标输入数据。
在本实施例中,通过步骤S101得到清洗后的基本数据信息和清洗后的交易数据信息后,进一步可以对清洗后的基本数据信息和清洗后的交易数据信息进行预处理,并为预处理后的数据分配对应的权重,得到目标输入数据,用以执行后续步骤S103。
具体来讲,,一种可选的实现方式是,本步骤S102的具体实现过程可以包括下述步骤A1-A2:
步骤A1:对清洗后的基本数据信息和清洗后的交易数据信息中的定性指标的离散数据进行量化处理,以及对清洗后的基本数据信息和清洗后的交易数据信息中的定量指标的连续数据进行归一化处理,得到处理后的数据。
需要说明的是,由于清洗后的基本数据信息和清洗后的交易数据信息中有的指标是可以直接量化的,比如商品数量,交易金额等。但是定量指标不能全面反应目标跨境电商企业的行为特征,比如电商所属的行业景气度,就没有确定的数据可以依据,此时就需要定性指标来补充此类指标,首先制定一个确定的时间来截取数据,据此数据制定一个评分级别,满分100,以此标准依次来对中小电商的定性指标进行打分。
因此,在本实现方式中,为了对目标跨境电商企业进行准确评估,本申请实施例提出对清洗后的基本数据信息和清洗后的交易数据信息进行标准化处理,使指标中的各个数据构成作用同趋化。本文采用z-score标准化法进行数据处理,标准化公式如下:
步骤A2:对处理后的数据案子按照相关程度划分为预设等级,并分别赋予预设的权重,得到目标输入数据。
在本实现方式中,通过步骤A1得到处理后的数据后,进一步可以对处理后的数据案子按照相关程度划分为预设等级,并分别赋予预设的权重,得到目标输入数据。
具体来讲,一种可选的实现方式是,可以对处理后的数据案子按照相关程度划分为三级,并分别赋予1.5、1.2和1的权重,得到目标输入数据,用以执行后续步骤S103。
其中,所有指标按照相关程度分别归为一级指标、二级指标和三级指标,分别赋予1.5、1.2、1的权重。划分权重的目的在于,根据业务经验,有些指标特征对企业行为模式的影响比较大。比如:库存周转、品类变化。区别特征后在企业行为模式的探索过程中更能突出重要变量所起的变化作用。通过梳理相关字段及对字段特征与企业特征的相关程度进行业务经验分析,最终选取处理好的47个变量做为目标输入数据。
S103:将目标输入数据输入预先构建的高斯混合评估模型,对目标跨境电商企业进行评估,得到评估结果。
在本实施例中,通过步骤S102得到目标输入数据后,进一步可以将目标输入数据输入预先构建的高斯混合评估模型,对目标跨境电商企业进行评估,得到评估结果。
其中,一种可选的实现方式是,高斯混合评估模型的构建过程具体可以包括下述步骤B1-B4:
步骤B1:获取训练跨境电商企业的训练数据信息。
在本实现方式中,为了构建高斯混合评估模型,首先需要部署开发环境,本申请不限定开发环境类型,比如可以选取python3.9做为训练模型的开发环境。这是因为它具有强大的数据处理、数据挖掘、人工智能训练的能力。适用于进行企业行为模型的应用探索。
然后,获取训练跨境电商企业的训练基本数据信息和训练交易数据信息;并对所述训练基本数据信息和训练交易数据信息进行清洗,得到清洗后的训练基本数据信息和清洗后的训练交易数据信息,作为所述训练跨境电商企业的训练数据信息。
步骤B2:对训练数据信息进行预处理,并为预处理后的训练数据信息分配对应的权重,得到训练输入数据。
通过步骤B1获取到训练跨境电商企业的训练数据信息后,进一步可以对训练数据信息进行预处理,并为预处理后的训练数据信息分配对应的权重,得到训练输入数据,用以执行后续步骤B3。
步骤B3:将训练输入数据输入初始高斯混合评估模型,得到初始评估结果。
在本实现方式中,通过步骤B2得到训练输入数据后,进一步可以采用高斯混合模型用多个高斯函数去描述不同的元素分布。通过EM方法来迭代生成不同的高斯模型的各个参数。具体模型思路如下:
设有随机变量X,则初始高斯混合评估模型可以用下式表示:
其中,N(x|μk,∑k)表示混合模型中的第k个分量,且满足如下公式:
0≤πk≤1 (4)
其中,EM(Expectation-Maximization algorithm)算法的思想是对于数据集Y,假设这些数据独立同分布于已知的模型,在已知参数的情况下,可以推算出数据归类于各个成分的概率,然后修改成分值,重复该过程直至收敛到条件结束。
EM算法可以分为两步:第一步先求出要估计参数的粗略值;第二步使用第一步的值最大化似然函数。
核心代码如下:
步骤B4:通过GINI校验及负面样本验证所述初始评估结果的准确性,并利用验证结果,调整所述初始高斯混合评估模型的参数,以达到最优评估结果。
在本实现方式中,通过步骤B3得到模型输出的初始评估结果后,进一步可以通过GINI校验及负面样本验证初始评估结果的准确性,并利用验证结果,调整初始高斯混合评估模型的参数,以达到最优评估结果,进而可以保存模型参数,用以计算新分类结果进行场景应用。
具体来讲,可以将每次输出的初始评估结果都通过GINI验证及负样本校验来验证模型的有效性。GINI验证说明:通过比对随机分布与该模型输出的结果差异,差异越大,表明模型效果越好。同时,根据收集的负样本(某一场景)的结果对模型分布进行验证,当该结果集中在某一行为特征分组结果下证明该分组模型的效果。不断迭代B2步骤,直至最终选取了3个模型中的15个场景的行为特征。其中,GINI的验证示例图如图3所示。
进一步的,在得到最优分组结果,保存3个模型的最终参数,并记录15个场景所分属的模型及分类结果后,当新样本进入时,可以依次将3个模型的参数带入,检验其所属的行为模型。在15个行为模型分组结果中,发现有刷单异常行为模式的卖家、积极进取类型的卖家等等。电商平台可以根据这些跨境电商企业的行为模式对企业进行有效管理,对于优质企业可以做为标杆企业对中小卖家提供帮助辅导等。
这样,本申请通过采用先进的无监督聚类算法在一定程度上可以避免人为主观影响,深入挖掘了企业行为特征,使得对中小电商的研究更加客观和准确。除了模型的选择上,在最终模型定义上,并不是单一的选择一个模型结果。而是通过GINI有效性检验和样本检验,选择3组模型分类结果的15个类别。通过无监督模型探索加有监督学习验证得到了企业最终的行为模式结果。同时,在数据选择上,不仅使用了企业的基本数据信息,还包含了企业实时的动态的交易数据信息,每个周期的交易变化都会影响到企业行为模式的表现。客观动态的对跨境电商企业行为模式进行跟踪研究,可以更加准确的了解企业的经营表现,评估的准确性更高。
综上,本实施例提供的一种跨境电商企业评估方法,在进行跨境电商企业评估时,首先获取待评估的目标跨境电商企业的基本数据信息和交易数据信息;并对基本数据信息和交易数据信息进行清洗,得到清洗后的基本数据信息和清洗后的交易数据信息,然后,对清洗后的基本数据信息和清洗后的交易数据信息进行预处理,并为预处理后的数据分配对应的权重,得到目标输入数据,进而可以将目标输入数据输入预先构建的高斯混合评估模型,对目标跨境电商企业进行评估,得到评估结果。可见,本申请实施例是通过动静结合的数据充分挖掘企业在跨境电商市场中所表现出的行为模式,更加客观和准确的对跨境电商企业的评估,有效提高了评估结果的准确性。
第二实施例
本实施例将对一种跨境电商企业评估装置进行介绍,相关内容请参见上述方法实施例。
参见图3,为本实施例提供的一种跨境电商企业评估装置的组成示意图,该装置包括:
第一获取单元301,用于获取待评估的目标跨境电商企业的基本数据信息和交易数据信息;并对所述基本数据信息和交易数据信息进行清洗,得到清洗后的基本数据信息和清洗后的交易数据信息;
第一预处理单元302,用于对所述清洗后的基本数据信息和清洗后的交易数据信息进行预处理,并为预处理后的数据分配对应的权重,得到目标输入数据;
评估单元303,用于将目标输入数据输入预先构建的高斯混合评估模型,对所述目标跨境电商企业进行评估,得到评估结果。
在本实施例的一种实现方式中,所述第一预处理单元302包括:
处理子单元,用于对所述清洗后的基本数据信息和清洗后的交易数据信息中的定性指标的离散数据进行量化处理,以及对所述清洗后的基本数据信息和清洗后的交易数据信息中的定量指标的连续数据进行归一化处理,得到处理后的数据;
划分子单元,用于对处理后的数据案子按照相关程度划分为预设等级,并分别赋予预设的权重,得到目标输入数据。
在本实施例的一种实现方式中,所述划分子单元具体用于:
对处理后的数据案子按照相关程度划分为三级,并分别赋予1.5、1.2和1的权重,得到目标输入数据。
在本实施例的一种实现方式中,所述装置还包括:
第二获取单元,用于获取训练跨境电商企业的训练数据信息;
第二预处理单元,用于对所述训练数据信息进行预处理,并为预处理后的训练数据信息分配对应的权重,得到训练输入数据;
输入单元,用于将所述训练输入数据输入初始高斯混合评估模型,得到初始评估结果;
调整单元,用于通过GINI校验及负面样本验证所述初始评估结果的准确性,并利用验证结果,调整所述初始高斯混合评估模型的参数,以达到最优评估结果。
在本实施例的一种实现方式中,所述第二获取单元具体用于:
获取训练跨境电商企业的训练基本数据信息和训练交易数据信息;并对所述训练基本数据信息和训练交易数据信息进行清洗,得到清洗后的训练基本数据信息和清洗后的训练交易数据信息,作为所述训练跨境电商企业的训练数据信息。
综上,本实施例提供的一种跨境电商企业评估装置,在进行跨境电商企业评估时,首先获取待评估的目标跨境电商企业的基本数据信息和交易数据信息;并对基本数据信息和交易数据信息进行清洗,得到清洗后的基本数据信息和清洗后的交易数据信息,然后,对清洗后的基本数据信息和清洗后的交易数据信息进行预处理,并为预处理后的数据分配对应的权重,得到目标输入数据,进而可以将目标输入数据输入预先构建的高斯混合评估模型,对目标跨境电商企业进行评估,得到评估结果。可见,本申请实施例是通过动静结合的数据充分挖掘企业在跨境电商市场中所表现出的行为模式,更加客观和准确的对跨境电商企业的评估,有效提高了评估结果的准确性。
进一步地,本申请实施例还提供了一种跨境电商企业评估设备,包括:处理器、存储器、系统总线;
所述处理器以及所述存储器通过所述系统总线相连;
所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行上述跨境电商企业评估方法的任一种实现方法。
进一步地,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行上述跨境电商企业评估方法的任一种实现方法。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者诸如媒体网关等网络通信设备,等等)执行本申请各个实施例或者实施例的某些部分所述的方法。
需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (12)
1.一种跨境电商企业评估方法,其特征在于,包括:
获取待评估的目标跨境电商企业的基本数据信息和交易数据信息;并对所述基本数据信息和交易数据信息进行清洗,得到清洗后的基本数据信息和清洗后的交易数据信息;
对所述清洗后的基本数据信息和清洗后的交易数据信息进行预处理,并为预处理后的数据分配对应的权重,得到目标输入数据;
将目标输入数据输入预先构建的高斯混合评估模型,对所述目标跨境电商企业进行评估,得到评估结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述清洗后的基本数据信息和清洗后的交易数据信息进行预处理,并对预处理后的数据分配对应的权重,得到目标输入数据,包括:
对所述清洗后的基本数据信息和清洗后的交易数据信息中的定性指标的离散数据进行量化处理,以及对所述清洗后的基本数据信息和清洗后的交易数据信息中的定量指标的连续数据进行归一化处理,得到处理后的数据;
对处理后的数据案子按照相关程度划分为预设等级,并分别赋予预设的权重,得到目标输入数据。
3.根据权利要求2所述的方法,其特征在于,所述对处理后的数据案子按照相关程度划分预设等级,并分别赋予预设的权重,得到目标输入数据,包括:
对处理后的数据案子按照相关程度划分为三级,并分别赋予1.5、1.2和1的权重,得到目标输入数据。
4.根据权利要求1所述的方法,其特征在于,所述高斯混合评估模型的构建方式如下:
获取训练跨境电商企业的训练数据信息;
对所述训练数据信息进行预处理,并为预处理后的训练数据信息分配对应的权重,得到训练输入数据;
将所述训练输入数据输入初始高斯混合评估模型,得到初始评估结果;
通过GINI校验及负面样本验证所述初始评估结果的准确性,并利用验证结果,调整所述初始高斯混合评估模型的参数,以达到最优评估结果。
5.根据权利要求4所述的方法,其特征在于,所述获取训练跨境电商企业的训练数据信息,包括:
获取训练跨境电商企业的训练基本数据信息和训练交易数据信息;并对所述训练基本数据信息和训练交易数据信息进行清洗,得到清洗后的训练基本数据信息和清洗后的训练交易数据信息,作为所述训练跨境电商企业的训练数据信息。
6.一种跨境电商企业评估装置,其特征在于,包括:
第一获取单元,用于获取待评估的目标跨境电商企业的基本数据信息和交易数据信息;并对所述基本数据信息和交易数据信息进行清洗,得到清洗后的基本数据信息和清洗后的交易数据信息;
第一预处理单元,用于对所述清洗后的基本数据信息和清洗后的交易数据信息进行预处理,并为预处理后的数据分配对应的权重,得到目标输入数据;
评估单元,用于将目标输入数据输入预先构建的高斯混合评估模型,对所述目标跨境电商企业进行评估,得到评估结果。
7.根据权利要求6所述的装置,其特征在于,所述第一预处理单元包括:
处理子单元,用于对所述清洗后的基本数据信息和清洗后的交易数据信息中的定性指标的离散数据进行量化处理,以及对所述清洗后的基本数据信息和清洗后的交易数据信息中的定量指标的连续数据进行归一化处理,得到处理后的数据;
划分子单元,用于对处理后的数据案子按照相关程度划分为预设等级,并分别赋予预设的权重,得到目标输入数据。
8.根据权利要求7所述的装置,其特征在于,所述划分子单元具体用于:
对处理后的数据案子按照相关程度划分为三级,并分别赋予1.5、1.2和1的权重,得到目标输入数据。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第二获取单元,用于获取训练跨境电商企业的训练数据信息;
第二预处理单元,用于对所述训练数据信息进行预处理,并为预处理后的训练数据信息分配对应的权重,得到训练输入数据;
输入单元,用于将所述训练输入数据输入初始高斯混合评估模型,得到初始评估结果;
调整单元,用于通过GINI校验及负面样本验证所述初始评估结果的准确性,并利用验证结果,调整所述初始高斯混合评估模型的参数,以达到最优评估结果。
10.根据权利要求9所述的装置,其特征在于,所述第二获取单元具体用于:
获取训练跨境电商企业的训练基本数据信息和训练交易数据信息;并对所述训练基本数据信息和训练交易数据信息进行清洗,得到清洗后的训练基本数据信息和清洗后的训练交易数据信息,作为所述训练跨境电商企业的训练数据信息。
11.一种跨境电商企业评估设备,其特征在于,包括:处理器、存储器、系统总线;
所述处理器以及所述存储器通过所述系统总线相连;
所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行权利要求1-5任一项所述的方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行权利要求1-5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111314326.8A CN113988890A (zh) | 2021-11-08 | 2021-11-08 | 一种跨境电商企业评估方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111314326.8A CN113988890A (zh) | 2021-11-08 | 2021-11-08 | 一种跨境电商企业评估方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113988890A true CN113988890A (zh) | 2022-01-28 |
Family
ID=79747154
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111314326.8A Pending CN113988890A (zh) | 2021-11-08 | 2021-11-08 | 一种跨境电商企业评估方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113988890A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107103460A (zh) * | 2017-03-27 | 2017-08-29 | 杭州呯嘭智能技术有限公司 | 基于信用大数据的跨境支付快速结算方法 |
CN108564286A (zh) * | 2018-04-19 | 2018-09-21 | 天合泽泰(厦门)征信服务有限公司 | 一种基于大数据征信的人工智能金融风控授信评定方法和系统 |
CN108564465A (zh) * | 2018-05-03 | 2018-09-21 | 上海第二工业大学 | 一种企业信用管理方法 |
CN110955866A (zh) * | 2019-11-29 | 2020-04-03 | 卓尔智联(武汉)研究院有限公司 | 跨境交易风险评估装置、方法及可读存储介质 |
CN112231533A (zh) * | 2020-10-14 | 2021-01-15 | 深圳前海微众银行股份有限公司 | 数据处理方法、装置、设备及存储介质 |
CN113256409A (zh) * | 2021-07-12 | 2021-08-13 | 广州思迈特软件有限公司 | 基于机器学习的银行零售客户流失预测方法 |
-
2021
- 2021-11-08 CN CN202111314326.8A patent/CN113988890A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107103460A (zh) * | 2017-03-27 | 2017-08-29 | 杭州呯嘭智能技术有限公司 | 基于信用大数据的跨境支付快速结算方法 |
WO2018176179A1 (zh) * | 2017-03-27 | 2018-10-04 | 杭州呯嘭智能技术有限公司 | 基于信用大数据的跨境支付快速结算方法 |
CN108564286A (zh) * | 2018-04-19 | 2018-09-21 | 天合泽泰(厦门)征信服务有限公司 | 一种基于大数据征信的人工智能金融风控授信评定方法和系统 |
CN108564465A (zh) * | 2018-05-03 | 2018-09-21 | 上海第二工业大学 | 一种企业信用管理方法 |
CN110955866A (zh) * | 2019-11-29 | 2020-04-03 | 卓尔智联(武汉)研究院有限公司 | 跨境交易风险评估装置、方法及可读存储介质 |
CN112231533A (zh) * | 2020-10-14 | 2021-01-15 | 深圳前海微众银行股份有限公司 | 数据处理方法、装置、设备及存储介质 |
CN113256409A (zh) * | 2021-07-12 | 2021-08-13 | 广州思迈特软件有限公司 | 基于机器学习的银行零售客户流失预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107193876B (zh) | 一种基于最近邻knn算法的缺失数据填补方法 | |
TWI789345B (zh) | 機器學習模型的建模方法及裝置 | |
CN107563757B (zh) | 数据风险识别的方法及装置 | |
CN109711955B (zh) | 基于当前订单的差评预警方法、系统、黑名单库建立方法 | |
KR20180041174A (ko) | 위험 평가 방법 및 시스템 | |
CN110991474A (zh) | 一种机器学习建模平台 | |
CN111985937A (zh) | 交易商价值信息评估方法、系统、存储介质、计算机设备 | |
CN113988459A (zh) | 一种基于电力营销数据的中小企业成长性评估方法及系统 | |
CN112990989A (zh) | 价值预测模型输入数据生成方法、装置、设备和介质 | |
CN117114689A (zh) | 一种欺诈检测模型构建方法、装置、设备及存储介质 | |
CN117132383A (zh) | 一种信贷数据处理方法、装置、设备及可读存储介质 | |
CN117196630A (zh) | 交易风险预测方法、装置、终端设备以及存储介质 | |
KR102000519B1 (ko) | 유사 성향 고객의 투자 패턴을 이용한 주식 종목 추천 방법 및 이를 이용한 시스템 | |
CN115952186A (zh) | 一种问题数据及其链路追溯方法及装置 | |
CN113988890A (zh) | 一种跨境电商企业评估方法、装置及设备 | |
CN113177733B (zh) | 基于卷积神经网络的中小微企业数据建模方法及系统 | |
CN114154556A (zh) | 样本预测模型的训练方法、装置、电子设备及存储介质 | |
CN113052512A (zh) | 风险预测方法、装置和电子设备 | |
CN113298641A (zh) | 诚信程度认知方法及装置 | |
CN113034264A (zh) | 客户流失预警模型的建立方法、装置、终端设备及介质 | |
CN110570301A (zh) | 风险识别方法、装置、设备及介质 | |
CN111752985A (zh) | 一种主体画像生成的方法、装置和存储介质 | |
CN112801563B (zh) | 风险评估方法和装置 | |
CN110782342B (zh) | 基于二分类模型验证新渠道特征工程正确性的方法及装置 | |
CN113052689B (zh) | 一种基于决策树的产品推荐方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |