CN111210071A - 业务对象预测方法、装置、设备及可读存储介质 - Google Patents
业务对象预测方法、装置、设备及可读存储介质 Download PDFInfo
- Publication number
- CN111210071A CN111210071A CN202010009409.5A CN202010009409A CN111210071A CN 111210071 A CN111210071 A CN 111210071A CN 202010009409 A CN202010009409 A CN 202010009409A CN 111210071 A CN111210071 A CN 111210071A
- Authority
- CN
- China
- Prior art keywords
- prediction
- target
- service
- business
- business object
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000004458 analytical method Methods 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 2
- 238000000638 solvent extraction Methods 0.000 claims 1
- 238000004422 calculation algorithm Methods 0.000 description 20
- 235000015278 beef Nutrition 0.000 description 10
- 235000015277 pork Nutrition 0.000 description 10
- 241000220225 Malus Species 0.000 description 9
- 238000004891 communication Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 241000234295 Musa Species 0.000 description 5
- 235000021016 apples Nutrition 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 3
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 235000021015 bananas Nutrition 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 235000011430 Malus pumila Nutrition 0.000 description 1
- 235000015103 Malus silvestris Nutrition 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Operations Research (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种业务对象预测方法、装置、设备及可读存储介质,方法包括:将多个业务对象类别进行聚类,得到多个类簇;对各个类簇的历史业务数据分别在至少两个的业务预测模型下进行分析,以获得各个类簇分别对应的预测结果;将各个类簇的历史业务数据分别和对应的预测结果相比较,并根据比较结果确定用于预测各个类簇的业务预测目标模型;确定目标业务对象所在的目标类簇,并基于目标类簇所对应的业务预测目标模型对目标业务对象进行预测。这样,确定目标业务对象所在的类簇,并基于该类簇所对应的业务预测目标模型进行预测,从而不必将目标业务对象分别在多个业务预测模型下运算分析以获得预测结果并选择恰当的业务预测模型,节省了时间。
Description
技术领域
本发明涉及金融科技(Fintech)领域,尤其涉及一种业务对象预测方法、装置、设备及可读存储介质。
背景技术
伴随着金融科技(Fitech),尤其是互联网金融科技的快速发展,已经有越来越多的技术应用于金融领域,例如可以通过许多模型算法帮助人们进行业务对象的预测。
随着零售行业的发展,零售行业中的业务对象预测问题成为热点,即基于历史业务对象销量数据预测未来一段时间内的业务对象的销量。目前,有许多模型算法可以帮助人们进行业务对象的预测,如基于时间序列的预测算法Arima、Arimax以及Prophet等,基于机器学习模型的算法XGB、RandomForest等,基于深度学习模型的算法如LSTM等。在实际使用这些模型算法会发现,同一个模型算法,它的预测准确度值对于不同的业务对象,其预测准确度值的差异较大,而不同的模型算法,对于同一类业务对象,它们的预测准确度值差异也较大。因此,业务人员难以根据某一类业务对象而选择最恰当的模型算法,进而无法快速地对业务对象作出针对性的预测分析的技术问题。
发明内容
本发明的主要目的在于提供一种业务对象预测方法、装置、设备及可读存储介质,旨在解决业务人员难以根据某一类业务对象而选择最恰当的模型算法,进而无法快速地对业务对象作出针对性的预测分析的技术问题。
为实现上述目的,本发明提供一种业务对象预测方法,所述方法包括:
将多个业务对象类别进行聚类,得到多个类簇;
对各个所述类簇的历史业务数据分别在至少两个的业务预测模型下进行分析,以获得各个所述类簇分别对应的预测结果;
将各个所述类簇的历史业务数据分别和对应的所述预测结果相比较,并根据比较结果确定用于预测各个所述类簇的业务预测目标模型;
确定目标业务对象所在的目标类簇,并基于所述目标类簇所对应的所述业务预测目标模型对所述目标业务对象进行预测。
进一步地所述将多个业务对象类别进行聚类,得到多个类簇的步骤,包括:
获取多个所述业务对象类别的历史业务数据,并将多个所述业务对象类别的历史业务数据分别构建成相对应的多个时间序列特征数据;
计算各个所述时间序列特征数据之间的第一相似度,基于所述第一相似度将多个所述业务对象类别划分为多个所述类簇。
进一步地,所述计算各个所述时间序列特征数据之间的第一相似度,基于所述第一相似度将所述多个业务对象类别划分为多个所述类簇的步骤之后,包括:
将多个所述类簇进行降维,并在二维平面进行显示。
进一步地所述对各个所述类簇的历史业务数据分别在至少两个的业务预测模型下进行分析,以获得各个所述类簇分别对应的预测结果的步骤,包括:
根据多个所述业务对象类别的历史业务数据分别构建至少两个的所述业务预测模型,其中所述业务预测模型是用于对所述业务对象类别进行预测;
将各个所述类簇的历史业务数据分别输入至至少两个的所述业务预测模型以进行运算分析,以获得各个所述类簇分别对应的预测结果。
进一步地,所述将各个所述类簇的历史业务数据分别和对应的所述预测结果相比较,并根据比较结果确定用于预测各个所述类簇的业务预测目标模型的步骤,包括:
将各个所述类簇的历史业务数据分别和对应的所述预测结果进行第二相似度计算,并将所述第二相似度作为所述比较结果;
将所述比较结果中所述第二相似度最高相对应的所述业务预测模型作为所述业务预测目标模型。
进一步地,所述确定目标业务对象所在的所述类簇的步骤,包括:
将所述目标业务对象的历史业务数据分别与多个所述业务对象类别的历史业务数据进行第三相似度计算;
将所述目标业务对象划分至与所述目标业务对象第三相似度最高的业务对象类别所在的所述类簇。
进一步地,所述将所述目标业务对象的历史业务数据分别与多个所述业务对象类别的历史业务数据进行第三相似度计算的步骤,包括:
将所述目标业务对象的历史业务数据构建成相对应的目标时间序列特征数据;
通过计算所述目标时间序列特征数据分别与多个所述时间序列特征数据的所述第三相似度。
本发明还提供一种业务对象预测装置,所述装置包括:
聚类模块,用于将多个业务对象类别进行聚类,得到多个类簇;
分析模块,用于各个所述类簇的历史业务数据在至少两个的业务预测模型下分析,以获得相对应的多个预测结果;
比较模块,用于将各个所述类簇的历史业务数据分别和多个所述预测结果相比较,并根据比较结果确定用于预测各个所述类簇的业务预测目标模型;
确定模块,用于确定目标业务对象所在的所述类簇,并基于所述类簇所对应的所述业务预测目标模型对所述目标业务对象进行预测。
本发明还提供一种业务对象预测设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的业务对象预测程序,所述业务对象预测程序被所述处理器执行时实现如上述的业务对象预测方法的步骤。
本发明还提供一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的业务对象预测方法的步骤。
本发明提出的业务对象预测方法,通过将多个业务对象类别进行聚类,得到多个类簇;各个类簇的历史业务数据在至少两个的业务预测模型下分析,以获得各个类簇分别对应的预测结果;将各个类簇的历史业务数据分别和多个预测结果相比较,并根据比较结果确定用于预测各个类簇的业务预测目标模型;确定目标业务对象所在的类簇,并基于类簇所对应的业务预测目标模型对目标业务对象进行预测。这样,在为目标业务对象选择恰当的业务预测模型的过程中,确定目标业务对象所在的类簇,并基于该类簇所对应的业务预测目标模型进行预测,从而不必将目标业务对象分别在多个业务预测模型下运算分析以获得预测结果并选择恰当的业务预测模型,从而节省了时间。另外地,基于多个业务预测模型,并针对不同的类簇而选择恰当的业务预测模型,从而使得预测具有针对性,以提高预测结果的准确性和稳定性。
附图说明
图1是本发明实施例方案涉及的硬件运行的业务对象预测设备的结构示意图;
图2是本发明业务对象预测方法第一实施例的流程示意图;
图3是本发明业务对象预测装置一实施例的框架结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的业务对象预测设备结构示意图。
如图1所示,该业务对象预测设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,业务对象预测设备还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示屏的亮度,接近传感器可在业务对象预测设备移动到耳边时,关闭显示屏和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别业务对象预测设备姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;当然,业务对象预测设备还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的业务对象预测设备结构并不构成对业务对象预测设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作装置、网络通信模块、用户接口模块以及业务对象预测程序。
在图1所示的业务对象预测设备中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的业务对象预测程序,并执行以下操作:
将多个业务对象类别进行聚类,得到多个类簇;
对各个所述类簇的历史业务数据分别在至少两个的业务预测模型下进行分析,以获得各个所述类簇分别对应的预测结果;
将各个所述类簇的历史业务数据分别和对应的所述预测结果相比较,并根据比较结果确定用于预测各个所述类簇的业务预测目标模型;
确定目标业务对象所在的目标类簇,并基于所述目标类簇所对应的所述业务预测目标模型对所述目标业务对象进行预测。
进一步地,获取多个所述业务对象类别的历史业务数据,并将多个所述业务对象类别的历史业务数据分别构建成相对应的多个时间序列特征数据;
计算各个所述时间序列特征数据之间的第一相似度,基于所述第一相似度将多个所述业务对象类别划分为多个所述类簇。
进一步地,处理器1001可以调用存储器1005中存储的业务对象预测程序,还执行以下操作:
将多个所述类簇进行降维,并在二维平面进行显示。
进一步地,根据多个所述业务对象类别的历史业务数据分别构建至少两个的所述业务预测模型,其中所述业务预测模型是用于对所述业务对象类别进行预测;
将各个所述类簇的历史业务数据分别输入至至少两个的所述业务预测模型以进行运算分析,以获得各个所述类簇分别对应的预测结果。
进一步地,将各个所述类簇的历史业务数据分别和对应的所述预测结果进行第二相似度计算,并将所述第二相似度作为所述比较结果;
将所述比较结果中所述第二相似度最高相对应的所述业务预测模型作为所述业务预测目标模型。
进一步地,将所述目标业务对象的历史业务数据分别与多个所述业务对象类别的历史业务数据进行第三相似度计算;
将所述目标业务对象划分至与所述目标业务对象第三相似度最高的业务对象类别所在的所述类簇。
进一步地,将所述目标业务对象的历史业务数据构建成相对应的目标时间序列特征数据;
通过计算所述目标时间序列特征数据分别与多个所述时间序列特征数据的所述第三相似度。
参照图2,本发明基于上述业务对象预测设备硬件结构,提出本发明方法各个实施例。
本发明提供一种业务对象预测方法,业务对象预测方法应用于业务对象预测设备,在业务对象预测方法第一实施例中,参照图2,该方法包括:
步骤S10,将多个业务对象类别进行聚类,得到多个类簇;
将多个业务对象类别进行聚类,得到多个类簇。其中,业务对象类别是指商场提供给消费者的相关商品,例如,在商场中出售的苹果、香蕉、猪肉、牛肉等等。
在本实施例中,将多个业务对象类别进行聚类,从而获得多个类簇。例如,多个业务对象类别包括苹果、香蕉、猪肉和牛肉。在一些聚类方法中,可划分为两个类簇,即将苹果和香蕉规划为一个类簇,猪肉和牛肉归划为另一个类簇。另外,在另一些聚类方法中,可划分为四个类簇,即各个类簇分别对应着苹果、香蕉、猪肉和牛肉。
步骤S20,对各个类簇的历史业务数据在至少两个的业务预测模型下进行分析,以获得各个类簇分别对应的预测结果;
将各个类簇的历史业务数据在至少两个的业务预测模型下进行分析,以获得各个类簇分别对应的预测结果。其中,业务预测模型是可以帮助人们进行业务对象的预测,例如,基于Arima、Arimax、LinearRegression、XGBoost,Random Forest,Facebook Prophet,或LSTM等模型算法,可对业务对象进行预测分析。该历史业务数据是业务对象历史销量数据。
在本实施例中,基于已经训练构建的至少两个的业务预测模型,对各个类簇进行运算分析,以获得预测结果。例如,一个类簇中只包括有苹果时,则将苹果的历史业务数据作为业务预测模型的输入值,从而能够对苹果的未来销量作出预测分析,并获得预测结果。可以理解地是,当业务预测模型具有N个时(N指的是自然数),则对苹果未来销量的预测结果就相对应地具有N个。例如,根据苹果的历史业务数据在5个业务预测模型下分析出明年1月份的销量,并获得相对应的5个预测结果,具体地,在Arima模型算法下对应计算出第一个预测结果为100个,在Arimax模型算法下对应计算出第二个预测结果为200个,在LinearRegression模型算法下对应计算出第三个预测结果为50个,在XGBoost模型算法下对应计算出第四个预测结果为20个,在Random Forest模型算法下对应计算出第五个预测结果为300个。
在另一些实施例中,当一个类簇中包括有多种业务对象类别时,则计算该类簇内的多个业务对象类别的历史业务数据的平均值,并以这一平均值作为该类簇的历史业务数据。
步骤S30,将各个类簇的历史业务数据分别和对应的预测结果相比较,并根据比较结果确定用于预测各个类簇的业务预测目标模型;
将各个类簇的历史业务数据分别和多个预测结果相比较,并根据比较结果确定用于预测各个类簇的业务预测目标模型。在本实施例中,将各个类簇的历史业务数据在至少两个的业务预测模型下分析,以获得相对应的多个预测结果之后,将各个类簇的历史业务数据分别和多个预测结果相比较,并根据比较结果确定用于预测各个类簇的业务预测目标模型。例如,一个类簇在预设时间段的历史业务数据在10个不同的业务预测模型下运算分析,从而获得10个预测结果,将该类簇在预设时间段的历史业务数据分别与这10个预测结果相比较,从而获得比较结果。可选地,在比较结果中该类簇在预设时间段的历史业务数据和其中的一个预测结果符合性好,则将该预测结果所对应的业务预测模型确定为用于预测该类簇的业务预测目标模型。
步骤S40,确定目标业务对象所在的类簇,并基于类簇所对应的业务预测目标模型对目标业务对象进行预测。
确定目标业务对象所在的类簇,并基于类簇所对应的业务预测目标模型对应的业务预测目标模型对目标业务对象进行预测。在本实施例中,若需要对目标业务对象进行销量分析时,则将目标业务对象与系统中的多个业务对象类别相比较,通过聚类的方法,从而确定目标业务对象所在的类簇。通过聚类的方法,确定出目标业务对象所在的类簇后,则根据giant类簇所对应的业务预测目标模型对目标业务对象进行销量分析。
在本实施例中,将多个业务对象类别进行聚类,得到多个类簇;各个类簇的历史业务数据在至少两个的业务预测模型下进行分析,以获得各个类簇分别对应的预测结果;将各个类簇的历史业务数据分别和多个预测结果相比较,并根据比较结果确定用于预测各个类簇的业务预测目标模型;确定目标业务对象所在的类簇,并基于类簇所对应的业务预测目标模型对目标业务对象进行预测。这样,在为目标业务对象选择恰当的业务预测模型的过程中,确定目标业务对象所在的类簇,并基于该类簇所对应的业务预测目标模型进行预测,从而不必将目标业务对象分别在多个业务预测模型下运算分析以获得预测结果并选择恰当的业务预测模型,从而节省了时间。另外地,基于多个业务预测模型,并针对不同的类簇而选择恰当的业务预测模型,从而使得预测具有针对性,以提高预测结果的准确性和稳定性。
基于第一实施例,提出本发明方法的第二实施例,在本实施例中,所述步骤S10,包括:
步骤S11,获取多个业务对象类别的历史业务数据,并将多个业务对象类别的历史业务数据分别构建成相对应的多个时间序列特征数据;
步骤S12,计算各个时间序列特征数据之间的第一相似度,基于所述第一相似度将多个业务对象类别划分为多个类簇。
获取多个业务对象类别的历史业务数据,并将多个业务对象类别的历史业务数据分别构建成相对应的多个时间序列特征数据,计算各个时间序列特征数据之间的第一相似度,基于第一相似度将多个业务对象类别划分为多个类簇。其中,时间序列是指将某种现象某一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成的序列。其中,时间序列特征数据是指按时间先后顺序进行排布的数据。例如以周期为一年的销量数据为例,在1月份至12月份的时间序列上,各个月份都对应着当月的销量数据。
在本实施例中,获取多个业务对象类别的历史业务数据,并按照时间序列,分别将多个业务对象类别的历史业务数据构建相对应的多个时间序列特征数据。通过计算各个时间序列特征数据之间的第一相似度,从而可将多个业务对象类别划分为多个类簇,例如当两个时间序列特征数据之间的第一相似度大于某一个预设值时,则可将这两个时间序列特征数据所对应的两个业务对象类别划分为同一个类簇。可选地,通过DTW模型算法或HMM模型算法可计算出两个时间序列特征数据的第一相似度。
进一步地,在计算各个所述时间序列特征数据之间的第一相似度,基于所述第一相似度将所述多个业务对象类别划分为多个所述类簇的步骤之后,包括:
步骤S121,将多个类簇进行降维,并在二维平面进行显示。
将多个业务对象类别进行聚类,得到多个类簇,并将多个类簇可以通过TSNE(t-distributedstochasticneighborembedding,是用于降维的一种机器学习算法)或者PCA(Principal Component Analysis,主成分分析)等技术进行降维,并在二维平面进行显示。在本实施例中,将多个类簇进行降维,并在二维平面进行显示,从而提供一个人机交互窗口,并使得用户可对聚类情况进行可视化分析判断。
基于第一实施例或第二实施例,提出本发明方法的第三实施例,在本实施例中,步骤S20可具体包括以下步骤:
步骤S21,根据多个业务对象类别的历史业务数据分别构建至少两个的业务预测模型,其中业务预测模型是用于对业务对象类别进行预测;
步骤S22,将各个类簇的历史业务数据分别输入至至少两个的业务预测模型以进行运算分析,以获得各个类簇分别对应的预测结果。
根据多个业务对象类别的历史业务数据分别构建至少两个的业务预测模型,其中,业务预测模型是用于对业务对象类别进行预测;将各个类簇的历史业务数据分别输入至至少两个的业务预测模型以进行运算分析,从而获得相对应的多个预测结果。在本实施例中,根据多个业务对象类别的历史业务数据分别构建至少两个的业务预测模型,其中,业务预测模型是用于对业务对象类别进行预测。在另一些实施例中,可以将已训练成的业务预测模型作为可选的业务预测模型。可以理解地是,可通过多种方法构建至少两个的业务预测模型,例如,通过多个业务对象类别的历史数据训练构建业务预测模型,或者使用已经训练完成的业务预测模型。
在本实施例中,通过获取多个业务对象类别的历史业务数据,并将多个业务对象类别的历史业务数据分别构建成相对应的多个时间序列特征数据,计算各个时间序列特征数据之间的第一相似度,基于第一相似度将多个业务对象类别划分为多个类簇,将多个类簇进行降维,并在二维平面进行显示,将各个类簇的历史业务数据分别输入至至少两个的业务预测模型以进行运算分析,从而获得相对应的多个预测结果。
基于第一实施例、第二实施例或第三实施例,提出本发明方法的第四实施例,在本实施例中,步骤S30可具体包括以下步骤:
步骤S31,将各个类簇的历史业务数据分别和对应的预测结果进行第二相似度计算,并将第二相似度作为比较结果;
步骤S32,将比较结果中第二相似度最高相对应的业务预测模型作为业务预测目标模型。
将各个类簇的历史业务数据分别和多个预测结果进行第二相似度计算,并将第二相似度作为比较结果,将比较结果中第二相似度最高相对应的业务预测模型作为业务预测目标模型。在本实施例中,将各个类簇的历史业务数据分别和多个预测结果进行第二相似度计算,可以将其中一个预测结果相似度最高所对应的业务预测模型作为该类簇的业务预测目标模型。
基于第一实施例、第二实施例、第三实施例或第四实施例,提出本发明方法的第五实施例,在本实施例中,步骤S40可具体包括以下步骤:
步骤S41,将目标业务对象的历史业务数据分别与多个业务对象类别的历史业务数据进行相似度计算;
步骤S42,将目标业务对象划分至目标业务对象第三相似度最高的业务对象类别所在的类簇。
将目标业务对象的历史业务数据分别与多个业务对象类别的历史业务数据进行第三相似度计算,将目标业务对象划分至目标业务对象相似度最高的业务对象类别所在的类簇。在本实施例中,将目标业务对象的历史业务数据分别与系统中的多个业务对象类别的历史业务数据进行相似度计算,从而确定出目标业务对象与哪一个业务对象类别最相似,从而将目标业务对象划分至与目标业务对象相似度最高的业务对象类别所在的类簇。
具体地,相同或相近的业务对象,在同一地点,同一时间段内,他们之间的历史业务数据是相关的。例如,系统内存储有评估、香蕉和猪肉的历史业务数据,当目标业务对象是牛肉时,牛肉与猪肉同属于肉类,且属于日常食材。因此,通过相似度计算,可以得知牛肉的历史业务数据与猪肉的历史业务数据是相似的,牛肉与猪肉之间的相似度是最高的。从而将牛肉划分至与猪肉所在的类簇,并基于猪肉所在的类簇所对应的业务预测目标模型对牛肉进行销量分析。
进一步地,步骤S41具体包括:
步骤S411,将目标业务对象的历史业务数据构建成相对应的目标时间序列特征数据;
步骤S412,通过计算目标时间序列特征数据分别与多个时间序列特征数据的第三相似度。
将目标业务对象的历史业务数据构建成相对应的目标事件序列,通过计算目标时间序列分别与多个时间序列的第三相似度。在本实施例中,将目标业务对象的历史业务数据构建成相对应的目标时间序列特征数据,并且将多个业务对象类别的历史业务数据构建成相对应的目标时间序列特征数据,并且将多个业务对象类别的历史业务数据分别构建成相对应的多个时间序列特征数据,从而可将目标是业务对象和多个业务对象类别进行第三相似度计算。例如,可以通过滑动窗口生成子序列,总结子序列特征或是基于DTW模型算法或HMM模型算法可计算出目标时间序列特征数据分别与多个时间序列特征数据之间的第三相似度。
在一个实施例中,如图3所示,图3是本发明一种业务对象预测装置一实施例的框架结构示意图,包括:获取模块、分析模块、比较模块以及确定模块,其中:
聚类模块,用于将多个业务对象类别进行聚类,得到多个类簇;
分析模块,用于对各个所述类簇的历史业务数据分别在至少两个的业务预测模型下进行分析,以获得各个所述类簇分别对应的预测结果;
比较模块,用于将各个所述类簇的历史业务数据分别和对应的所述预测结果相比较,并根据比较结果确定用于预测各个所述类簇的业务预测目标模型;
确定模块,用于确定目标业务对象所在的目标类簇,并基于所述目标类簇所对应的所述业务预测目标模型对所述目标业务对象进行预测。
关于业务对象预测装置的具体限定可以参见上文中对于业务对象预测方法的限定,在此不再赘述。上述业务对象预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
此外,本发明实施例还提出一种可读存储介质(即计算机可读存储器),所述可读存储介质上存储有业务对象预测程序,所述业务对象预测程序被处理器执行时实现如下操作:
将多个业务对象类别进行聚类,得到多个类簇;
对各个所述类簇的历史业务数据分别在至少两个的业务预测模型下进行分析,以获得各个所述类簇分别对应的预测结果;
将各个所述类簇的历史业务数据分别和对应的所述预测结果相比较,并根据比较结果确定用于预测各个所述类簇的业务预测目标模型;
确定目标业务对象所在的目标类簇,并基于所述目标类簇所对应的所述业务预测目标模型对所述目标业务对象进行预测。
进一步地,获取多个所述业务对象类别的历史业务数据,并将多个所述业务对象类别的历史业务数据分别构建成相对应的多个时间序列特征数据;
计算各个所述时间序列特征数据之间的第一相似度,基于所述第一相似度将多个所述业务对象类别划分为多个所述类簇。
进一步地,所述业务对象预测程序被处理器执行时还实现如下操作:
将多个所述类簇进行降维,并在二维平面进行显示。
进一步地,根据多个所述业务对象类别的历史业务数据分别构建至少两个的所述业务预测模型,其中所述业务预测模型是用于对所述业务对象类别进行预测;
将各个所述类簇的历史业务数据分别输入至至少两个的所述业务预测模型以进行运算分析,以获得各个所述类簇分别对应的预测结果。
进一步地,将各个所述类簇的历史业务数据分别和对应的所述预测结果进行第二相似度计算,并将所述第二相似度作为所述比较结果;
将所述比较结果中所述第二相似度最高相对应的所述业务预测模型作为所述业务预测目标模型。
进一步地,将所述目标业务对象的历史业务数据分别与多个所述业务对象类别的历史业务数据进行第三相似度计算;
将所述目标业务对象划分至与所述目标业务对象第三相似度最高的业务对象类别所在的所述类簇。
进一步地,将所述目标业务对象的历史业务数据构建成相对应的目标时间序列特征数据;
通过计算所述目标时间序列特征数据分别与多个所述时间序列特征数据的所述第三相似度。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台业务对象预测设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明每一个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种业务对象预测方法,其特征在于,所述方法包括:
将多个业务对象类别进行聚类,得到多个类簇;
对各个所述类簇的历史业务数据分别在至少两个的业务预测模型下进行分析,以获得各个所述类簇分别对应的预测结果;
将各个所述类簇的历史业务数据分别和对应的所述预测结果相比较,并根据比较结果确定用于预测各个所述类簇的业务预测目标模型;
确定目标业务对象所在的目标类簇,并基于所述目标类簇所对应的所述业务预测目标模型对所述目标业务对象进行预测。
2.如权利要求1所述的业务对象预测方法,其特征在于,所述将多个业务对象类别进行聚类,得到多个类簇的步骤,包括:
获取多个所述业务对象类别的历史业务数据,并将多个所述业务对象类别的历史业务数据分别构建成相对应的多个时间序列特征数据;
计算各个所述时间序列特征数据之间的第一相似度,基于所述第一相似度将多个所述业务对象类别划分为多个所述类簇。
3.如权利要求2所述的业务对象预测方法,其特征在于,所述计算各个所述时间序列特征数据之间的第一相似度,基于所述第一相似度将所述多个业务对象类别划分为多个所述类簇的步骤之后,包括:
将多个所述类簇进行降维,并在二维平面进行显示。
4.如权利要求1所述的业务对象预测方法,其特征在于,所述对各个所述类簇的历史业务数据分别在至少两个的业务预测模型下进行分析,以获得各个所述类簇分别对应的预测结果的步骤,包括:
根据多个所述业务对象类别的历史业务数据分别构建至少两个的所述业务预测模型,其中所述业务预测模型是用于对所述业务对象类别进行预测;
将各个所述类簇的历史业务数据分别输入至至少两个的所述业务预测模型以进行运算分析,以获得各个所述类簇分别对应的预测结果。
5.如权利要求1所述的业务对象预测方法,其特征在于,所述将各个所述类簇的历史业务数据分别和对应的所述预测结果相比较,并根据比较结果确定用于预测各个所述类簇的业务预测目标模型的步骤,包括:
将各个所述类簇的历史业务数据分别和对应的所述预测结果进行第二相似度计算,并将所述第二相似度作为所述比较结果;
将所述比较结果中所述第二相似度最高相对应的所述业务预测模型作为所述业务预测目标模型。
6.如权利要求1所述的业务对象预测方法,其特征在于,所述确定目标业务对象所在的所述类簇的步骤,包括:
将所述目标业务对象的历史业务数据分别与多个所述业务对象类别的历史业务数据进行第三相似度计算;
将所述目标业务对象划分至与所述目标业务对象第三相似度最高的业务对象类别所在的所述类簇。
7.如权利要求6所述的业务对象预测方法,其特征在于,所述将所述目标业务对象的历史业务数据分别与多个所述业务对象类别的历史业务数据进行第三相似度计算的步骤,包括:
将所述目标业务对象的历史业务数据构建成相对应的目标时间序列特征数据;
通过计算所述目标时间序列特征数据分别与多个所述时间序列特征数据的所述第三相似度。
8.一种业务对象预测装置,其特征在于,所述装置包括:
聚类模块,用于将多个业务对象类别进行聚类,得到多个类簇;
分析模块,用于对各个所述类簇的历史业务数据分别在至少两个的业务预测模型下进行分析,以获得各个所述类簇分别对应的预测结果;
比较模块,用于将各个所述类簇的历史业务数据分别和对应的所述预测结果相比较,并根据比较结果确定用于预测各个所述类簇的业务预测目标模型;
确定模块,用于确定目标业务对象所在的目标类簇,并基于所述目标类簇所对应的所述业务预测目标模型对所述目标业务对象进行预测。
9.一种业务对象预测设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的业务对象预测程序,所述业务对象预测程序被所述处理器执行时实现如权利要求1至7中任一项所述的业务对象预测方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的业务对象预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010009409.5A CN111210071B (zh) | 2020-01-03 | 2020-01-03 | 业务对象预测方法、装置、设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010009409.5A CN111210071B (zh) | 2020-01-03 | 2020-01-03 | 业务对象预测方法、装置、设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111210071A true CN111210071A (zh) | 2020-05-29 |
CN111210071B CN111210071B (zh) | 2023-11-24 |
Family
ID=70789468
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010009409.5A Active CN111210071B (zh) | 2020-01-03 | 2020-01-03 | 业务对象预测方法、装置、设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111210071B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113506138A (zh) * | 2021-07-16 | 2021-10-15 | 瑞幸咖啡信息技术(厦门)有限公司 | 业务对象的数据预估方法、装置、设备及存储介质 |
CN113780675A (zh) * | 2021-09-23 | 2021-12-10 | 北方健康医疗大数据科技有限公司 | 一种消耗预测方法、装置、存储介质及电子设备 |
CN114417964A (zh) * | 2021-12-10 | 2022-04-29 | 中国卫通集团股份有限公司 | 卫星运营商分类方法、装置及电子设备 |
CN116931530A (zh) * | 2023-09-15 | 2023-10-24 | 山东星科智能科技股份有限公司 | 一种炼铁炼钢轧钢生产过程动态预测系统及动态预测方法 |
CN113506138B (zh) * | 2021-07-16 | 2024-06-07 | 瑞幸咖啡信息技术(厦门)有限公司 | 业务对象的数据预估方法、装置、设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160117457A1 (en) * | 2014-10-27 | 2016-04-28 | Samsung Sds Co., Ltd. | Method and apparatus for analyzing patient's constitutional peculiarity |
US20170053208A1 (en) * | 2015-08-17 | 2017-02-23 | Adobe Systems Incorporated | Behavioral Prediction for Targeted End Users |
CN106650784A (zh) * | 2016-11-04 | 2017-05-10 | 许继集团有限公司 | 一种基于特征聚类比较的光伏电站功率预测方法及装置 |
CN106971348A (zh) * | 2016-01-14 | 2017-07-21 | 阿里巴巴集团控股有限公司 | 一种基于时间序列的数据预测方法和装置 |
US20180150609A1 (en) * | 2016-11-29 | 2018-05-31 | Electronics And Telecommunications Research Institute | Server and method for predicting future health trends through similar case cluster based prediction models |
CN109171754A (zh) * | 2018-07-27 | 2019-01-11 | 清华-伯克利深圳学院筹备办公室 | 血糖预测模型的训练方法、装置、终端及存储介质 |
CN110019420A (zh) * | 2018-05-10 | 2019-07-16 | 华为技术有限公司 | 一种数据序列预测方法及计算设备 |
-
2020
- 2020-01-03 CN CN202010009409.5A patent/CN111210071B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160117457A1 (en) * | 2014-10-27 | 2016-04-28 | Samsung Sds Co., Ltd. | Method and apparatus for analyzing patient's constitutional peculiarity |
CN105808906A (zh) * | 2014-10-27 | 2016-07-27 | 三星Sds株式会社 | 患者个人特性的分析方法及其装置 |
US20170053208A1 (en) * | 2015-08-17 | 2017-02-23 | Adobe Systems Incorporated | Behavioral Prediction for Targeted End Users |
CN106971348A (zh) * | 2016-01-14 | 2017-07-21 | 阿里巴巴集团控股有限公司 | 一种基于时间序列的数据预测方法和装置 |
CN106650784A (zh) * | 2016-11-04 | 2017-05-10 | 许继集团有限公司 | 一种基于特征聚类比较的光伏电站功率预测方法及装置 |
US20180150609A1 (en) * | 2016-11-29 | 2018-05-31 | Electronics And Telecommunications Research Institute | Server and method for predicting future health trends through similar case cluster based prediction models |
CN110019420A (zh) * | 2018-05-10 | 2019-07-16 | 华为技术有限公司 | 一种数据序列预测方法及计算设备 |
CN109171754A (zh) * | 2018-07-27 | 2019-01-11 | 清华-伯克利深圳学院筹备办公室 | 血糖预测模型的训练方法、装置、终端及存储介质 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113506138A (zh) * | 2021-07-16 | 2021-10-15 | 瑞幸咖啡信息技术(厦门)有限公司 | 业务对象的数据预估方法、装置、设备及存储介质 |
CN113506138B (zh) * | 2021-07-16 | 2024-06-07 | 瑞幸咖啡信息技术(厦门)有限公司 | 业务对象的数据预估方法、装置、设备及存储介质 |
CN113780675A (zh) * | 2021-09-23 | 2021-12-10 | 北方健康医疗大数据科技有限公司 | 一种消耗预测方法、装置、存储介质及电子设备 |
CN113780675B (zh) * | 2021-09-23 | 2024-01-09 | 北方健康医疗大数据科技有限公司 | 一种消耗预测方法、装置、存储介质及电子设备 |
CN114417964A (zh) * | 2021-12-10 | 2022-04-29 | 中国卫通集团股份有限公司 | 卫星运营商分类方法、装置及电子设备 |
CN114417964B (zh) * | 2021-12-10 | 2023-09-12 | 中国卫通集团股份有限公司 | 卫星运营商分类方法、装置及电子设备 |
CN116931530A (zh) * | 2023-09-15 | 2023-10-24 | 山东星科智能科技股份有限公司 | 一种炼铁炼钢轧钢生产过程动态预测系统及动态预测方法 |
CN116931530B (zh) * | 2023-09-15 | 2023-12-26 | 山东星科智能科技股份有限公司 | 一种炼铁炼钢轧钢生产过程动态预测系统及动态预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111210071B (zh) | 2023-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111210071B (zh) | 业务对象预测方法、装置、设备及可读存储介质 | |
US8751972B2 (en) | Collaborative gesture-based input language | |
US20170200205A1 (en) | Method and system for analyzing user reviews | |
US20210256310A1 (en) | Machine learning platform | |
US10073908B2 (en) | Functional space-time trajectory clustering | |
CN109214421B (zh) | 一种模型训练方法、装置、及计算机设备 | |
JP2020515983A (ja) | 対象人物の検索方法および装置、機器、プログラム製品ならびに媒体 | |
EP3333757B1 (en) | Predictive anomaly detection | |
CN110276382B (zh) | 基于谱聚类的人群分类方法、装置及介质 | |
CN112070076B (zh) | 文本段落结构还原方法、装置、设备及计算机存储介质 | |
CN114385869A (zh) | 检测数据异常的方法、装置、存储介质及计算机设备 | |
CN110825611A (zh) | 异常程序的分析方法及装置和计算机可读存储介质 | |
US20210374778A1 (en) | User experience management system | |
US20240086424A1 (en) | Information processing system, information processing method, and computer program | |
CN112115182A (zh) | 时序数据的处理方法、装置、设备及存储介质 | |
CN111242695A (zh) | 数据处理方法、装置、设备及计算机可读存储介质 | |
CN111476144A (zh) | 行人属性识别模型确定方法、装置及计算机可读存储介质 | |
CN111368045A (zh) | 用户意图识别方法、装置、设备及计算机可读存储介质 | |
CN115496420A (zh) | 新用户质量评估方法、装置、计算机设备及存储介质 | |
US11055620B2 (en) | Distributable clustering model training system | |
CN113515701A (zh) | 信息推荐方法及装置 | |
CN110674994A (zh) | 数据价值评估方法、终端、装置及可读存储介质 | |
CN110879821A (zh) | 评分卡模型衍生标签生成方法、装置、设备及存储介质 | |
CN112669142B (zh) | 高维行为数据的建模方法、装置、设备及可读存储介质 | |
CN113112497B (zh) | 一种基于零样本学习的工业外观缺陷检测方法、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |