CN109389426A - 商品价格层次的获取方法、系统、计算机设备和存储介质 - Google Patents
商品价格层次的获取方法、系统、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN109389426A CN109389426A CN201811122765.7A CN201811122765A CN109389426A CN 109389426 A CN109389426 A CN 109389426A CN 201811122765 A CN201811122765 A CN 201811122765A CN 109389426 A CN109389426 A CN 109389426A
- Authority
- CN
- China
- Prior art keywords
- data
- price
- predicted
- history
- enterprise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0206—Price or cost determination based on market factors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
Abstract
本申请涉及一种商品价格层次的获取方法、系统、计算机设备和存储介质。该方法包括:获取预设商品类型在预设时间段内的发票数据,并从发票数据提取特征变量;根据特征变量生成与发票数据对应的待预测数据;将待预测数据输入至预先构建的随机森林分类模型中获取输出值,根据输出值获取待预测数据的价格层次类型;统计价格层次类型中待预测数据的数量,将统计数量最多的待预测数据对应的价格层次类型确定为预设商品类型的价格在预设时间段内的价格层次。本方法基于大数据的智能计算对商品类型的价格层次类型进行分类,由于发票数据具有真实性以及可靠性,能够提供真实、准确的成交价格数据,实现对该商品类型的成交价格的价格层次类型的准确分类。
Description
技术领域
本申请涉及数据挖掘技术领域,特别是涉及一种商品价格层次的获取方法、系统、计算机设备和存储介质。
背景技术
一件商品的市场成交价格往往会受到多种不同因素而发生波动,而商品的成交价格是企业的经营决策的重要参考指标。传统技术中,目前商品价格所处的价格层次通常是通过人工经验逐一对商品在市面上标售的零售价格进行分析给出,但是,市面上标售的商品价格往往是不真实、不准确的,与该商品真正的成交价格不相等,其可靠性低,根据市面上标售的商品价格难以准确分析出目前商品价格所处的价格层次,为企业的发展经营提供决策依据。
发明内容
基于此,有必要针对上述市面上标售的零售价格与商品真正的成交价格不相等难以准确分析出目前商品价格所处的价格层次,为企业的发展经营提供决策依据技术问题,提供一种商品价格层次的获取方法、系统、计算机设备和存储介质。
一种商品价格层次的获取方法,所述方法包括:
获取预设商品类型在预设时间段内的发票数据,并从所述发票数据中提取特征变量;
根据各所述特征变量生成与所述发票数据对应的待预测数据;
将所述待预测数据输入至预先构建的随机森林分类模型中获取输出值,根据所述输出值获取所述待预测数据的价格层次类型;
统计所述价格层次类型中所述待预测数据的数量,将统计数量最多的所述待预测数据对应的价格层次类型确定为所述预设商品类型的价格在预设时间段内的价格层次。
在其中一个实施例中,所述将所述待预测数据输入至预先构建的随机森林分类模型中获取输出值的步骤之前,包括:
获取所述预设商品类型的历史发票数据,并从所述历史发票数据提取特征变量;
根据所述特征变量生成与所述历史发票数据对应的训练数据;
根据所述历史发票数据中商品单价的价格层次类型对所述训练数据进行标注,根据训练数据以及对应的价格层次类型生成训练样本,并形成训练样本集;
多次从所述训练样本集中随机挑选若干个所述训练样本生成训练样本子集,得到若干个训练样本子集;
利用所述训练样本子集构建决策树,得到由若干个决策树形成随机森林分类模型。
在其中一个实施例中,所述根据所述历史发票数据中商品单价的价格层次类型对所述训练数据进行标注的步骤,包括:
获取所述历史发票数据中的商品单价,根据所述商品单价以及所述历史发票数据的数量计算所述预设商品类型的历史平均单价;
若所述历史发票数据中的商品单价与所述历史平均单价的差值大于预设阈值,且所述商品单价大于所述历史平均单价,则将所述历史发票数据对应的训练数据的价格层次类型标注为价格偏高类型;
若所述历史发票数据中的商品单价与所述历史平均价的差值大于所述预设阈值,且所述商品单价小于所述历史平均单价,则将所述历史发票数据对应的训练数据的价格层次类型标注为价格偏低类型;
若所述历史发票数据中的商品单价与所述历史平均单价的差值小于所述预设阈值,则将所述历史发票数据对应的训练数据的价格层次标记为价格适中类型。
在其中一个实施例中,所述根据各所述特征变量生成与所述发票数据对应的待预测数据的步骤,包括:
根据所述发票数据中对应的数据字段的字段信息确定各所述特征变量的特征值;
将各所述特征变量作为所述待预测数据的数据字段,将所述特征变量的特征值作为所述待预测数据的数据字段,生成待预测数据。
在其中一个实施例中,所述特征变量包括购买方企业信用指标以及销售方企业信用指标;所述根据所述发票数据中对应的数据字段的字段信息确定各所述特征变量的特征值的步骤,包括:
获取所述发票数据中的购买方企业税号以及销售方企业税号;
根据所述购买方企业税号以及所述销售方税号分别查找对应的购买方企业信用等级以及所述销售方企业信用等级;
将所述购买方企业信用等级以及所述销售方企业信用等级量化生成购买方企业信用指标值以及销售方企业信用指标值;
将所述购买方企业信用指标值以及所述销售方企业信用指标值分别确定为所述购买方企业信用指标的特征值以及所述销售方企业信用指标的特征值。
在其中一个实施例中,所述特征变量包括购买方企业地区以及销售方企业地区;所述根据所述发票数据中对应的数据字段的字段信息确定各所述特征变量的特征值的步骤,包括:
获取所述发票数据中的购买方企业地址信息以及销售方企业地址信息;
根据所述购买方企业地址信息以及所述销售方企业地址信息获取购买方企业地区编号以及销售方企业地区编号;
将所述购买方企业地区编号以及所述销售方企业地区编号分别确定为所述购买方企业地区的特征值以及所述销售方企业地区的特征值。
一种商品价格层次的获取系统,所述系统包括:
特征变量获取模块,用于获取预设商品类型在预设时间段内的发票数据,并从所述发票数据中提取特征变量;
待预测数据获取模块,用于根据各所述特征变量生成与所述发票数据对应的待预测数据;
价格层次分类模块,用于将所述待预测数据输入至预先构建的随机森林分类模型中获取输出值,根据所述输出值获取所述待预测数据的价格层次类型;
价格层次确定模块,用于统计所述价格层次类型中所述待预测数据的数量,将统计数量最多的所述待预测数据对应的价格层次类型确定为所述预设商品类型的价格在预设时间段内的价格层次。
在其中一个实施例中,所述系统还包括随机森林分类模型创建模块;
随机森林分类模型创建模块用于获取所述预设商品类型的历史发票数据,并从所述历史发票数据提取特征变量;根据所述特征变量生成与所述历史发票数据对应的训练数据;根据所述历史发票数据中商品单价的价格层次类型对所述训练数据进行标注,根据训练数据以及对应的价格层次类型生成训练样本,并形成训练样本集;多次从所述训练样本集中随机挑选若干个所述训练样本生成训练样本子集,得到若干个训练样本子集;利用所述训练样本子集构建决策树,得到由若干个决策树形成随机森林分类模型。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取预设商品类型在预设时间段内的发票数据,并从所述发票数据中提取特征变量;
根据各所述特征变量生成与所述发票数据对应的待预测数据;
将所述待预测数据输入至预先构建的随机森林分类模型中获取输出值,根据所述输出值获取所述待预测数据的价格层次类型;
统计所述价格层次类型中所述待预测数据的数量,将统计数量最多的所述待预测数据对应的价格层次类型确定为所述预设商品类型的价格在预设时间段内的价格层次。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取预设商品类型在预设时间段内的发票数据,并从所述发票数据中提取特征变量;
根据各所述特征变量生成与所述发票数据对应的待预测数据;
将所述待预测数据输入至预先构建的随机森林分类模型中获取输出值,根据所述输出值获取所述待预测数据的价格层次类型;
统计所述价格层次类型中所述待预测数据的数量,将统计数量最多的所述待预测数据对应的价格层次类型确定为所述预设商品类型的价格在预设时间段内的价格层次。
上述商品价格层次的获取方法、系统、计算机设备和存储介质中,通过获取最近一段时间段内的某一商品类型的发票数据,实现对该商品类型的成交价格的价格层次的预测分类,由于发票数据的真实性以及可靠性,为该商品类型的价格层次类型的分类提供真实、准确的成交价格数据,提高该商品类型的价格所处价格层次分析结果的准确性,为企业的发展经营提供决策依据。
附图说明
图1为一个实施例中商品价格层次的获取方法的应用场景图;
图2为一个实施例中商品价格层次的获取方法的流程示意图;
图3为一个实施例中随机森林分类模型的构建步骤的流程示意图;
图4为一个实施例中商品价格层次的获取系统的结构框图;
图5为另一个实施例中商品价格层次的获取系统的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的商品价格层次的获取方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。服务器104预先获取商品类型的历史发票数据,利用这些历史发票数据创建基于随机森林模型的价格层次分类器,在企业用户通过终端102将该商品类型的近期的多张发票数据发送至服务器104后,服务器104将发票数据依次输入至价格层次分类器中,获取每张发票数据的价格层次类型,从而获取该商品类型近期的价格层次结果,并将该价格层次结果返回至终端102中,使得企业用户能够根据该商品类型的近期的价格层次,为企业经营决策提供参考指标。其中,终端102可以但不限于是个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种商品价格层次的获取方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤S210:获取预设商品类型在预设时间段内的发票数据,并从发票数据中提取特征变量。
本步骤中,服务器可以从税务局获取到发票数据,发票数据记载着各种数据字段,包括但不限于发票号码、开票日期、购买方信息、销售方信息、销货明细数据等;特征变量是指影响商品价格变化的因素所对应的数据字段,例如预设商品类型的交易时间,交易地区、交易时预设商品类型的数量等;具体的,服务器获取交易商品为预设商品类型、开票日期在预设时间段内的多张发票数据,并从各发票数据中提取出影响商品价格变化的特征变量。
步骤S220:根据各特征变量生成与发票数据对应的待预测数据。
具体的,服务器获得影响商品价格变化的特征变量后,将该这些特征变量作为不同的数据字段,生成待预测数据,其中,待预测数据与发票数据一一对应,实现避免发票数据中与商品价格变化无关的数据字段对价格层次类型分类结果的影响,同时减少数据的处理量,提高数据的处理速度。
步骤S230:将待预测数据输入至预先构建的随机森林分类模型中获取输出值,根据输出值获取待预测数据的价格层次类型。
本步骤中,对于预先构建好的随机森林分类模型,已经将包含特征变量的待预测数据设置为随机森林分类模型的输入项,将价格层次类型设置为随机森林分类模型的输出项,因此,将待预测数据输入至随机森林分类模型,随机森林分类模型输出该待预测数据对应的价格层次类型。可选的,价格层次类型可以设置为3类,分别是价格偏高类型、价格偏低类型以及价格适中类型。
步骤S240:统计价格层次类型中待预测数据的数量,将统计数量最多的待预测数据对应的价格层次类型确定为预设商品类型的价格在预设时间段内的价格层次。
具体的,服务器统计不同价格层次类型中待预测数据的数量,将待预测数据数量最多的价格层次类型确定为预设商品类型的价格层次;例如,价格层次类型可以设置为价格偏高类型、价格偏低类型以及价格适中类型3种类型,在最近1周内的100个待预测数据中,70个待预测数据对应的价格层次类型为价格偏高类型,24个待预测数据对应的价格层次类型为价格适中类型,6个待预测数据对应的价格层次类型为价格偏低类型,则该商品价格在最近1周内的价格是偏高的。
上述商品价格层次的获取方法中,通过获取最近一段时间段内的某一商品类型的发票数据,实现对该商品类型的成交价格的价格层次的预测分类,由于发票数据的真实性以及可靠性,为该商品类型的价格层次类型的分类提供真实、准确的成交价格数据,提高该商品类型的价格所处价格层次分析结果的准确性,为企业的发展经营提供决策依据。
进一步地,在一个实施例中,在获取预设商品在预设时间段内的发票数据后,服务器可以对获得的发票数据进行预处理。具体的,服务器对发票数据进行的预处理包括将作废的发票数据删除,服务器读取发票数据中“是否作废”的字段数据,若发票数据时作废的发票数据,则服务器将该发票数据删除,以免作废的发票数据影响商品价格层次的分类准确性。
在一个实施例中,如图3所示,将待预测数据输入至预先构建的随机森林分类模型中获取输出值的步骤之前,包括:
步骤310:获取预设商品类型的历史发票数据,并从历史发票数据提取特征变量。
步骤320:根据特征变量生成与历史发票数据对应的训练数据。
步骤330:根据历史发票数据中商品单价的价格层次类型对训练数据进行标注,根据训练数据以及对应的价格层次类型生成训练样本,并形成训练样本集。
步骤340:多次从训练样本集中随机挑选若干个训练样本生成训练样本子集,得到若干个训练样本子集。
步骤350:利用训练样本子集构建决策树,得到由若干个决策树形成随机森林分类模型。
本实施例中,服务器获取预设商品类型的历史发票数据后,从历史发票数据中提取影响商品价格变化的特征变量,然后利用特征变量生成与历史发票数据一一对应的训练数据,并根据历史发票数据中的商品单价所处的价格层次对各训练数据进行标注,获得训练样本,形成训练样本集;服务器利用训练样本构建随机森林分类模型。
构建随机森林分类模型的过程就是构建决策树的过程,具体的,服务器先从训练样本集中随机选择K个训练样本形成一个训练样本子集;每个训练样本的样本数据中都具有N个特征变量,对选出的训练样本子集中的训练样本,从其训练数据中随机选择n个特征变量,根据这n个特征变量计算决策树的最佳分裂方式,生成决策树,其中n<<N;重复上述决策树生成的步骤,生成M棵决策树,从而形成随机森林分类模型。上述K、N、n以及M的取值都可以根据实际情况设置。通过建立随机森林分类模型,利用随机森林分类模型对待预测数据的价格层次类型进行分类,提高对商品价格所处价格层次分析结果的准确性,为企业的发展经营提供决策依据。
在一个实施例中,根据历史发票数据中商品单价的价格层次类型对训练数据进行标注的步骤,包括:获取历史发票数据中的商品单价,根据商品单价以及历史发票数据的数量计算预设商品类型的历史平均单价;若历史发票数据中的商品单价与历史平均单价的差值大于预设阈值,且商品单价大于历史平均单价,则将历史发票数据对应的训练数据的价格层次类型标注为价格偏高类型;若历史发票数据中的商品单价与历史平均价的差值大于预设阈值,且商品单价小于历史平均单价,则将历史发票数据对应的训练数据的价格层次类型标注为价格偏低类型;若历史发票数据中的商品单价与历史平均单价的差值小于预设阈值,则将历史发票数据对应的训练数据的价格层次标记为价格适中类型。
本实施例中,计算多张历史发票数据中商品单价的平均值,获得历史平均单价,利用历史平均单价与历史发票数据中的商品单价间的差值对历史发票数据对应的训练数据标注价格层次类型,提高了训练样本的价格层次类型的准确性,同时提高了随机森林分类模型分析商品价格所处的价格层次的准确性。
在一个实施例中,根据各特征变量生成与发票数据对应的待预测数据的步骤,包括:根据发票数据中对应的数据字段的字段信息确定各特征变量的特征值;将各特征变量作为待预测数据的数据字段,将特征变量的特征值作为待预测数据的数据字段,生成待预测数据。
本实施例中,特征变量是指影响商品价格变化的因素所对应的数据字段,并根据发票数据中相应数据字段的信息确定特征变量的特征值,从而利用各个特征变量以及其对应的特征值生成与多张发票数据一一对应的待预测数据,即如下表1所示。在一个实施例中,特征变量包括购买方企业信用指标、销售方企业信用指标、购买方企业地区、销售方企业地区、开票日期、交易数量以及商品价格。将影响商品价格变化的因素所对应的数据字段生成待预测数据,有效提高商品类型的价格所处价格层次分析结果的准确性,为企业的发展经营提供决策依据。
表1
进一步的,发票数据中往往记载着各种数据字段,哪一些数据字段对价格波动影响较大,哪一些数据字段对价格波动影响较较小,哪一些数据字段对价格波形无影响,可以通过随机森林模型计算发票数据中各个数据字段对价格波动影响的大小;所以,在一个实施例中,基于随机森林模型从发票数据中的数据字段选择影响商品价格变化的目标数据字段,将目标数据字段确定为特征变量。
具体的,获取历史发票数据,每一个历史发票数据对应生成一个样本数据,其中,样本数据中包括历史发票数据的所有数据字段,并根据历史发票数据中的商品单价所处的价格层次对各特征数据进行标注获得特征样本,形成特征样本集;从特征样本集中选取一部分特征样本作为训练集,特征样本集剩余的特征样本作为测试集,共获得多个训练集以及与之对应的测试集;利用这些训练集构建随机森林模型;对于随机森林模型中每一棵决策树,利用构建该决策树的训练集所对应的测试集中对该决策树进行测试,获取该决策树的价格层次分类结果的第一误差率errA;随机的对测试集中的特征样本的某一个的数据字段加入噪声干扰,利用加入噪声干扰后的测试集对该决策树进行测试,获取所有决策树的价格层次分类结果的第二误差率errB,并计算第一平均误差率与第二平均误差率的误差差值(errA-errB);统计随机森林中有M棵决策树中,该数据字段的平均误差差值s=∑(errA-errB)÷M,若平均误差差值s大于阈值,则将该数据字段选取为特征变量。
在一个实施例中,特征变量包括购买方企业信用指标以及销售方企业信用指标;根据发票数据中对应的数据字段的字段信息确定各特征变量的特征值的步骤,包括:获取发票数据中的购买方企业税号以及销售方企业税号;根据购买方企业税号以及销售方税号分别查找对应的购买方企业信用等级以及销售方企业信用等级;将购买方企业信用等级以及销售方企业信用等级量化生成购买方企业信用指标值以及销售方企业信用指标值;将购买方企业信用指标值以及销售方企业信用指标值分别确定为购买方企业信用指标的特征值以及销售方企业信用指标的特征值。
具体的,发票数据中记录着购买方企业税号以及销售方企业税号,服务器根据发票数据中的购买方企业税号以及销售方企业税号查找对应的企业信用等级,并将企业信用等级量化为企业信用指标值,从而获得购买方企业信用指标以及销售方企业信用指标的特征值。
例如,企业信用等级可以是国家开发银行企业信用等级,其中包括AAA级、AA级、A级、BBB级、BB级、B级、C级共7级,服务器将这7个国家开发银行企业信用等级对应量化为1至7,服务器在获得购买方企业以及销售方企业的国家开发银行企业信用等级,根据国家开发银行企业信用等级对应的量化值获取购买方企业信用指标值以及销售方企业信用指标值。
在一个实施例中,特征变量包括购买方企业地区以及销售方企业地区;根据发票数据中对应的数据字段的字段信息确定各特征变量的特征值的步骤,包括:获取发票数据中的购买方企业地址信息以及销售方企业地址信息;根据购买方企业地址信息以及销售方企业地址信息获取购买方企业地区编号以及销售方企业地区编号;将购买方企业地区编号以及销售方企业地区编号分别确定为购买方企业地区的特征值以及销售方企业地区的特征值。
具体的,发票数据中记录着购买方企业所在地区以及销售方企业所在地区这两个数据字段,服务器根据这两个数据字段获取买方企业地区编号以及卖方企业地区编号,例如可以将购买方企业所在地区以及销售方企业所在地区对应的电话区号作为买方企业地区编号以及卖方企业地区编号。
应该理解的是,虽然图2以及图3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2以及图3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图4所示,提供了一种商品价格层次的获取系统,包括:特征变量获取模块410、待预测数据获取模块420、价格层次分类模块430和价格层次确定模块440,其中:
特征变量获取模块410,用于获取预设商品类型在预设时间段内的发票数据,并从发票数据中提取特征变量;
待预测数据获取模块420,用于根据各特征变量生成与发票数据对应的待预测数据;
价格层次分类模块430,用于将待预测数据输入至预先构建的随机森林分类模型中获取输出值,根据输出值获取待预测数据的价格层次类型;
价格层次确定模块440,用于统计价格层次类型中待预测数据的数量,将统计数量最多的待预测数据对应的价格层次类型确定为预设商品类型的价格在预设时间段内的价格层次。
在一个实施例中,如图5所示,提供了一种商品价格层次的获取系统,该系统还包括随机森林分类模型创建模块450;
随机森林分类模型创建模块450用于获取预设商品类型的历史发票数据,并从历史发票数据提取特征变量;根据特征变量生成与历史发票数据对应的训练数据;根据历史发票数据中商品单价的价格层次类型对训练数据进行标注,根据训练数据以及对应的价格层次类型生成训练样本,并形成训练样本集;多次从训练样本集中随机挑选若干个训练样本生成训练样本子集,得到若干个训练样本子集;利用训练样本子集构建决策树,得到由若干个决策树形成随机森林分类模型。
在一个实施例中,随机森林分类模型创建模块450用于获取历史发票数据中的商品单价,根据商品单价以及历史发票数据的数量计算预设商品类型的历史平均单价;若历史发票数据中的商品单价与历史平均单价的差值大于预设阈值,且商品单价大于历史平均单价,则将历史发票数据对应的训练数据的价格层次类型标注为价格偏高类型;若历史发票数据中的商品单价与历史平均价的差值大于预设阈值,且商品单价小于历史平均单价,则将历史发票数据对应的训练数据的价格层次类型标注为价格偏低类型;若历史发票数据中的商品单价与历史平均单价的差值小于预设阈值,则将历史发票数据对应的训练数据的价格层次标记为价格适中类型。
在一个实施例中,待预测数据获取模块420用于根据发票数据中对应的数据字段的字段信息确定各特征变量的特征值;将各特征变量作为待预测数据的数据字段,将特征变量的特征值作为待预测数据的数据字段,生成待预测数据。
在一个实施例中,特征变量包括购买方企业信用指标以及销售方企业信用指标,待预测数据获取模块420用于获取发票数据中的购买方企业税号以及销售方企业税号;根据购买方企业税号以及销售方税号分别查找对应的购买方企业信用等级以及销售方企业信用等级;将购买方企业信用等级以及销售方企业信用等级量化生成购买方企业信用指标值以及销售方企业信用指标值;将购买方企业信用指标值以及销售方企业信用指标值分别确定为购买方企业信用指标的特征值以及销售方企业信用指标的特征值。
在一个实施例中,特征变量包括购买方企业地区以及销售方企业地区,待预测数据获取模块420用于获取发票数据中的购买方企业地址信息以及销售方企业地址信息;根据购买方企业地址信息以及销售方企业地址信息获取购买方企业地区编号以及销售方企业地区编号,将购买方企业地区编号以及销售方企业地区编号分别确定为购买方企业地区的特征值以及销售方企业地区的特征值。
关于商品价格层次的获取系统的具体限定可以参见上文中对于商品价格层次的获取方法的限定,在此不再赘述。上述商品价格层次的获取系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储发票数据以及随机森林分类模型。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种商品价格层次的获取方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取预设商品类型在预设时间段内的发票数据,并从发票数据中提取特征变量;
根据各特征变量生成与发票数据对应的待预测数据;
将待预测数据输入至预先构建的随机森林分类模型中获取输出值,根据输出值获取待预测数据的价格层次类型;
统计价格层次类型中待预测数据的数量,将统计数量最多的待预测数据对应的价格层次类型确定为预设商品类型的价格在预设时间段内的价格层次。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取预设商品类型的历史发票数据,并从历史发票数据提取特征变量;根据特征变量生成与历史发票数据对应的训练数据;根据历史发票数据中商品单价的价格层次类型对训练数据进行标注,根据训练数据以及对应的价格层次类型生成训练样本,并形成训练样本集;多次从训练样本集中随机挑选若干个训练样本生成训练样本子集,得到若干个训练样本子集;利用训练样本子集构建决策树,得到由若干个决策树形成随机森林分类模型。
在一个实施例中,处理器执行计算机程序时实现根据历史发票数据中商品单价的价格层次类型对训练数据进行标注的步骤时,具体实现以下步骤:获取历史发票数据中的商品单价,根据商品单价以及历史发票数据的数量计算预设商品类型的历史平均单价;若历史发票数据中的商品单价与历史平均单价的差值大于预设阈值,且商品单价大于历史平均单价,则将历史发票数据对应的训练数据的价格层次类型标注为价格偏高类型;若历史发票数据中的商品单价与历史平均价的差值大于预设阈值,且商品单价小于历史平均单价,则将历史发票数据对应的训练数据的价格层次类型标注为价格偏低类型;若历史发票数据中的商品单价与历史平均单价的差值小于预设阈值,则将历史发票数据对应的训练数据的价格层次标记为价格适中类型。
在一个实施例中,处理器执行计算机程序时实现根据各特征变量生成与发票数据对应的待预测数据的步骤时,具体实现以下步骤:根据发票数据中对应的数据字段的字段信息确定各特征变量的特征值;将各特征变量作为待预测数据的数据字段,将特征变量的特征值作为待预测数据的数据字段,生成待预测数据。
在一个实施例中,特征变量包括购买方企业信用指标以及销售方企业信用指标,处理器执行计算机程序时实现根据发票数据中对应的数据字段的字段信息确定各特征变量的特征值的步骤时,具体实现以下步骤:获取发票数据中的购买方企业税号以及销售方企业税号;根据购买方企业税号以及销售方税号分别查找对应的购买方企业信用等级以及销售方企业信用等级;将购买方企业信用等级以及销售方企业信用等级量化生成购买方企业信用指标值以及销售方企业信用指标值;将购买方企业信用指标值以及销售方企业信用指标值分别确定为购买方企业信用指标的特征值以及销售方企业信用指标的特征值。
在一个实施例中,特征变量包括购买方企业地区以及销售方企业地区处理器执行计算机程序时实现根据发票数据中对应的数据字段的字段信息确定各特征变量的特征值的步骤时,具体实现以下步骤:获取发票数据中的购买方企业地址信息以及销售方企业地址信息;根据购买方企业地址信息以及销售方企业地址信息获取购买方企业地区编号以及销售方企业地区编号;将购买方企业地区编号以及销售方企业地区编号分别确定为购买方企业地区的特征值以及销售方企业地区的特征值。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取预设商品类型在预设时间段内的发票数据,并从发票数据中提取特征变量;
根据各特征变量生成与发票数据对应的待预测数据;
将待预测数据输入至预先构建的随机森林分类模型中获取输出值,根据输出值获取待预测数据的价格层次类型;
统计价格层次类型中待预测数据的数量,将统计数量最多的待预测数据对应的价格层次类型确定为预设商品类型的价格在预设时间段内的价格层次。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取预设商品类型的历史发票数据,并从历史发票数据提取特征变量;根据特征变量生成与历史发票数据对应的训练数据;根据历史发票数据中商品单价的价格层次类型对训练数据进行标注,根据训练数据以及对应的价格层次类型生成训练样本,并形成训练样本集;多次从训练样本集中随机挑选若干个训练样本生成训练样本子集,得到若干个训练样本子集;利用训练样本子集构建决策树,得到由若干个决策树形成随机森林分类模型。
在一个实施例中,计算机程序被处理器执行时实现根据历史发票数据中商品单价的价格层次类型对训练数据进行标注的步骤时,具体实现以下步骤:获取历史发票数据中的商品单价,根据商品单价以及历史发票数据的数量计算预设商品类型的历史平均单价;若历史发票数据中的商品单价与历史平均单价的差值大于预设阈值,且商品单价大于历史平均单价,则将历史发票数据对应的训练数据的价格层次类型标注为价格偏高类型;若历史发票数据中的商品单价与历史平均价的差值大于预设阈值,且商品单价小于历史平均单价,则将历史发票数据对应的训练数据的价格层次类型标注为价格偏低类型;若历史发票数据中的商品单价与历史平均单价的差值小于预设阈值,则将历史发票数据对应的训练数据的价格层次标记为价格适中类型。
在一个实施例中,计算机程序被处理器执行时实现根据各特征变量生成与发票数据对应的待预测数据的步骤时,具体实现以下步骤:根据发票数据中对应的数据字段的字段信息确定各特征变量的特征值;将各特征变量作为待预测数据的数据字段,将特征变量的特征值作为待预测数据的数据字段,生成待预测数据。
在一个实施例中,特征变量包括购买方企业信用指标以及销售方企业信用指标,计算机程序被处理器执行时实现根据发票数据中对应的数据字段的字段信息确定各特征变量的特征值的步骤时,具体实现以下步骤:获取发票数据中的购买方企业税号以及销售方企业税号;根据购买方企业税号以及销售方税号分别查找对应的购买方企业信用等级以及销售方企业信用等级;将购买方企业信用等级以及销售方企业信用等级量化生成购买方企业信用指标值以及销售方企业信用指标值;将购买方企业信用指标值以及销售方企业信用指标值分别确定为购买方企业信用指标的特征值以及销售方企业信用指标的特征值。
在一个实施例中,特征变量包括购买方企业地区以及销售方企业地区,计算机程序被处理器执行时实现根据发票数据中对应的数据字段的字段信息确定各特征变量的特征值的步骤时,具体实现以下步骤:获取发票数据中的购买方企业地址信息以及销售方企业地址信息;根据购买方企业地址信息以及销售方企业地址信息获取购买方企业地区编号以及销售方企业地区编号;将购买方企业地区编号以及销售方企业地区编号分别确定为购买方企业地区的特征值以及销售方企业地区的特征值。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种商品价格层次的获取方法,所述方法包括:
获取预设商品类型在预设时间段内的发票数据,并从所述发票数据中提取特征变量;
根据各所述特征变量生成与所述发票数据对应的待预测数据;
将所述待预测数据输入至预先构建的随机森林分类模型中获取输出值,根据所述输出值获取所述待预测数据的价格层次类型;
统计所述价格层次类型中所述待预测数据的数量,将统计数量最多的所述待预测数据对应的价格层次类型确定为所述预设商品类型的价格在预设时间段内的价格层次。
2.根据权利要求1所述的方法,其特征在于,所述将所述待预测数据输入至预先构建的随机森林分类模型中获取输出值的步骤之前,包括:
获取所述预设商品类型的历史发票数据,并从所述历史发票数据提取特征变量;
根据所述特征变量生成与所述历史发票数据对应的训练数据;
根据所述历史发票数据中商品单价的价格层次类型对所述训练数据进行标注,根据训练数据以及对应的价格层次类型生成训练样本,并形成训练样本集;
多次从所述训练样本集中随机挑选若干个所述训练样本生成训练样本子集,得到若干个训练样本子集;
利用所述训练样本子集构建决策树,得到由若干个决策树形成随机森林分类模型。
3.根据权利要求2所述的方法,其特征在于,所述根据所述历史发票数据中商品单价的价格层次类型对所述训练数据进行标注的步骤,包括:
获取所述历史发票数据中的商品单价,根据所述商品单价以及所述历史发票数据的数量计算所述预设商品类型的历史平均单价;
若所述历史发票数据中的商品单价与所述历史平均单价的差值大于预设阈值,且所述商品单价大于所述历史平均单价,则将所述历史发票数据对应的训练数据的价格层次类型标注为价格偏高类型;
若所述历史发票数据中的商品单价与所述历史平均价的差值大于所述预设阈值,且所述商品单价小于所述历史平均单价,则将所述历史发票数据对应的训练数据的价格层次类型标注为价格偏低类型;
若所述历史发票数据中的商品单价与所述历史平均单价的差值小于所述预设阈值,则将所述历史发票数据对应的训练数据的价格层次标记为价格适中类型。
4.根据权利要求1所述的方法,其特征在于,所述根据各所述特征变量生成与所述发票数据对应的待预测数据的步骤,包括:
根据所述发票数据中对应的数据字段的字段信息确定各所述特征变量的特征值;
将各所述特征变量作为所述待预测数据的数据字段,将所述特征变量的特征值作为所述待预测数据的数据字段,生成待预测数据。
5.根据权利要求4所述的方法,其特征在于,所述特征变量包括购买方企业信用指标以及销售方企业信用指标;所述根据所述发票数据中对应的数据字段的字段信息确定各所述特征变量的特征值的步骤,包括:
获取所述发票数据中的购买方企业税号以及销售方企业税号;
根据所述购买方企业税号以及所述销售方税号分别查找对应的购买方企业信用等级以及所述销售方企业信用等级;
将所述购买方企业信用等级以及所述销售方企业信用等级量化生成购买方企业信用指标值以及销售方企业信用指标值;
将所述购买方企业信用指标值以及所述销售方企业信用指标值分别确定为所述购买方企业信用指标的特征值以及所述销售方企业信用指标的特征值。
6.根据权利要求4所述的方法,其特征在于,所述特征变量包括购买方企业地区以及销售方企业地区;所述根据所述发票数据中对应的数据字段的字段信息确定各所述特征变量的特征值的步骤,包括:
获取所述发票数据中的购买方企业地址信息以及销售方企业地址信息;
根据所述购买方企业地址信息以及所述销售方企业地址信息获取购买方企业地区编号以及销售方企业地区编号;
将所述购买方企业地区编号以及所述销售方企业地区编号分别确定为所述购买方企业地区的特征值以及所述销售方企业地区的特征值。
7.一种商品价格层次的获取系统,其特征在于,所述系统包括:
特征变量获取模块,用于获取预设商品类型在预设时间段内的发票数据,并从所述发票数据中提取特征变量;
待预测数据获取模块,用于根据各所述特征变量生成与所述发票数据对应的待预测数据;
价格层次分类模块,用于将所述待预测数据输入至预先构建的随机森林分类模型中获取输出值,根据所述输出值获取所述待预测数据的价格层次类型;
价格层次确定模块,用于统计所述价格层次类型中所述待预测数据的数量,将统计数量最多的所述待预测数据对应的价格层次类型确定为所述预设商品类型的价格在预设时间段内的价格层次。
8.根据权利要求7所述的系统,其特征在于,还包括随机森林分类模型创建模块;
随机森林分类模型创建模块用于获取所述预设商品类型的历史发票数据,并从所述历史发票数据提取特征变量;根据所述特征变量生成与所述历史发票数据对应的训练数据;根据所述历史发票数据中商品单价的价格层次类型对所述训练数据进行标注,根据训练数据以及对应的价格层次类型生成训练样本,并形成训练样本集;多次从所述训练样本集中随机挑选若干个所述训练样本生成训练样本子集,得到若干个训练样本子集;利用所述训练样本子集构建决策树,得到由若干个决策树形成随机森林分类模型。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的商品价格层次的获取方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的商品价格层次的获取方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811122765.7A CN109389426A (zh) | 2018-09-26 | 2018-09-26 | 商品价格层次的获取方法、系统、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811122765.7A CN109389426A (zh) | 2018-09-26 | 2018-09-26 | 商品价格层次的获取方法、系统、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109389426A true CN109389426A (zh) | 2019-02-26 |
Family
ID=65418167
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811122765.7A Pending CN109389426A (zh) | 2018-09-26 | 2018-09-26 | 商品价格层次的获取方法、系统、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109389426A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112801436A (zh) * | 2019-11-13 | 2021-05-14 | 阿里巴巴集团控股有限公司 | 商品对象资源数据信息处理方法、装置及计算机系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020042765A1 (en) * | 2000-10-09 | 2002-04-11 | Dawson Brian T. | Apparatus and methods for handling trading data |
US20050004894A1 (en) * | 2002-12-27 | 2005-01-06 | Honda Motor Co., Ltd. | Harmonized tariff schedule classification using decision tree database |
US20150332414A1 (en) * | 2014-05-13 | 2015-11-19 | Mastercard International Incorporated | System and method for predicting items purchased based on transaction data |
US20170236136A1 (en) * | 2016-02-12 | 2017-08-17 | Fujitsu Limited | Probabilistic price and spike forecasting |
CN107369049A (zh) * | 2017-07-28 | 2017-11-21 | 国信优易数据有限公司 | 一种商品价格预测方法以及装置 |
CN107798604A (zh) * | 2017-09-28 | 2018-03-13 | 平安科技(深圳)有限公司 | 基于机器学习的择时入股方法及终端设备 |
CN107818344A (zh) * | 2017-10-31 | 2018-03-20 | 上海壹账通金融科技有限公司 | 用户行为进行分类和预测的方法和系统 |
CN107871144A (zh) * | 2017-11-24 | 2018-04-03 | 税友软件集团股份有限公司 | 发票商品名分类方法、系统、设备及计算机可读存储介质 |
CN108537382A (zh) * | 2018-04-09 | 2018-09-14 | 成都易商商盟数据服务有限公司 | 一种电商价格趋势预测方法及系统 |
-
2018
- 2018-09-26 CN CN201811122765.7A patent/CN109389426A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020042765A1 (en) * | 2000-10-09 | 2002-04-11 | Dawson Brian T. | Apparatus and methods for handling trading data |
US20050004894A1 (en) * | 2002-12-27 | 2005-01-06 | Honda Motor Co., Ltd. | Harmonized tariff schedule classification using decision tree database |
US20150332414A1 (en) * | 2014-05-13 | 2015-11-19 | Mastercard International Incorporated | System and method for predicting items purchased based on transaction data |
US20170236136A1 (en) * | 2016-02-12 | 2017-08-17 | Fujitsu Limited | Probabilistic price and spike forecasting |
CN107369049A (zh) * | 2017-07-28 | 2017-11-21 | 国信优易数据有限公司 | 一种商品价格预测方法以及装置 |
CN107798604A (zh) * | 2017-09-28 | 2018-03-13 | 平安科技(深圳)有限公司 | 基于机器学习的择时入股方法及终端设备 |
CN107818344A (zh) * | 2017-10-31 | 2018-03-20 | 上海壹账通金融科技有限公司 | 用户行为进行分类和预测的方法和系统 |
CN107871144A (zh) * | 2017-11-24 | 2018-04-03 | 税友软件集团股份有限公司 | 发票商品名分类方法、系统、设备及计算机可读存储介质 |
CN108537382A (zh) * | 2018-04-09 | 2018-09-14 | 成都易商商盟数据服务有限公司 | 一种电商价格趋势预测方法及系统 |
Non-Patent Citations (2)
Title |
---|
林进宁;湛社玲;: "农副产品价格波动预警评估模型初探", 市场经济与价格, no. 12 * |
谷萧君;: "基于改进KNN算法的价格预测模型研究", 电脑知识与技术, no. 33 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112801436A (zh) * | 2019-11-13 | 2021-05-14 | 阿里巴巴集团控股有限公司 | 商品对象资源数据信息处理方法、装置及计算机系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20170372234A1 (en) | Predicting a consumer selection preference based on estimated preference and environmental dependence | |
CN108564386A (zh) | 商户识别方法及装置、计算机设备及存储介质 | |
CN112559900B (zh) | 产品推荐方法、装置、计算机设备和存储介质 | |
CN109583682A (zh) | 企业财务造假风险的识别方法、装置以及计算机设备 | |
CN105096152A (zh) | 一种基于商品热度的操作执行方法及装置 | |
CN109214904A (zh) | 财务造假线索的获取方法、装置、计算机设备和存储介质 | |
Sakib | Restaurant sales prediction using machine learning | |
Mathews | Innovation portfolio architecture—Part 2: Attribute selection and valuation | |
CN112613997A (zh) | 货币基金的组合投资预测方法和预测装置 | |
CN109615153B (zh) | 商家风险评估方法、装置、设备及存储介质 | |
CN111932044A (zh) | 一种基于机器学习的钢铁产品价格预测系统和方法 | |
CN109614982A (zh) | 产品分析方法、装置、计算机设备以及存储介质 | |
CN107798410B (zh) | 一种品类规划方法、装置及电子设备 | |
Saputra | Technical efficiency and export performance: evidence for self-selection hypothesis from Indonesian manufacturing sector-level data | |
CN111680213B (zh) | 信息推荐方法、数据处理方法及装置 | |
CN109389426A (zh) | 商品价格层次的获取方法、系统、计算机设备和存储介质 | |
CN112836742A (zh) | 系统资源调整方法、装置及设备 | |
CN112364919A (zh) | 数据处理方法、装置、设备及存储介质 | |
Ulkhaq et al. | Predicting customer churn: A comparison of eight machine learning techniques: A case study in an Indonesian telecommunication company | |
Elrefai et al. | Using artificial intelligence in enhancing banking services | |
Cantú-Bazaldúa | Nowcasting global trade in goods and services | |
KR102091791B1 (ko) | 합성 특징 생성을 이용한 기업의 부도 예측 방법 및 장치 | |
Vieira et al. | Insolvency prediction in the Portuguese construction industry | |
CN110992091A (zh) | 一种基于分类模型评估投放权益的方法和装置 | |
Leippold et al. | Is active investing a zero-sum game |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |