CN109933749A - 用于生成信息的方法和装置 - Google Patents
用于生成信息的方法和装置 Download PDFInfo
- Publication number
- CN109933749A CN109933749A CN201711371189.5A CN201711371189A CN109933749A CN 109933749 A CN109933749 A CN 109933749A CN 201711371189 A CN201711371189 A CN 201711371189A CN 109933749 A CN109933749 A CN 109933749A
- Authority
- CN
- China
- Prior art keywords
- data matrix
- missing
- interpolation
- predicted
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 239000011159 matrix material Substances 0.000 claims abstract description 596
- 230000004044 response Effects 0.000 claims description 15
- 238000000354 decomposition reaction Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 238000007405 data analysis Methods 0.000 claims description 4
- 238000004458 analytical method Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 230000006854 communication Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000013144 data compression Methods 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 230000005291 magnetic effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:获取目标物品的属性的第一数据矩阵,其中,第一数据矩阵包括具有待预测值的待预测数据矩阵和不具有待预测值的非待预测数据矩阵;获取目标物品相关联的物品的属性的第二数据矩阵,其中,第二数据矩阵包括缺失数据矩阵以及非缺失数据矩阵,缺失数据矩阵包括非缺失值和缺失值;基于缺失数据矩阵所包括的非缺失值、缺失值和非缺失数据矩阵,生成插补值,并将所生成插补值插补于缺失数据矩阵中,生成插补后的缺失数据矩阵;基于插补后的缺失数据矩阵、非缺失数据矩阵、待预测数据矩阵以及非待预测数据矩阵,生成用于预测待预测值的预测值。该实施方式提高了信息预测的准确性。
Description
技术领域
本申请实施例涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及用于生成信息的方法和装置。
背景技术
随着科技的发展,市场上的各类物品都在不断地推陈出新。对于待上架的物品,在上架前,往往需要预测它的属性(例如价格、销量等)。目前,通常采用与待上架物品相关联的历史物品(例如A1型手机)的属性(例如销量)来预测待上架物品(例如A2型手机)的待预测属性(例如销量),其中,用于预测的、历史物品的属性与待上架物品的待预测属性相同。
发明内容
本申请实施例提出了用于生成信息的方法和装置。
第一方面,本申请实施例提供了一种用于输出信息的方法,该方法包括:获取目标物品的至少两个属性分别对应的第一数据矩阵,其中,第一数据矩阵包括具有待预测值的待预测数据矩阵以及不具有待预测值的非待预测数据矩阵;获取目标物品相关联的物品的至少两个属性分别对应的第二数据矩阵,其中,第二数据矩阵包括缺失数据矩阵以及非缺失数据矩阵,缺失数据矩阵包括非缺失值和至少一个缺失值;对于至少一个缺失值中的每个缺失值,基于缺失数据矩阵所包括的非缺失值、至少一个缺失值和非缺失数据矩阵,生成用于插补该缺失值的插补值,并将所生成插补值插补于缺失数据矩阵中,生成插补后的缺失数据矩阵;基于插补后的缺失数据矩阵、非缺失数据矩阵、待预测数据矩阵以及非待预测数据矩阵,生成用于预测所述待预测值的预测值。
在一些实施例中,对于至少一个缺失值中的每个缺失值,基于缺失数据矩阵所包括的非缺失值、至少一个缺失值和非缺失数据矩阵,生成用于插补该缺失值的插补值,并将所生成插补值插补于缺失数据矩阵中,生成插补后的缺失数据矩阵,包括:执行以下插补步骤:基于缺失数据矩阵所包括的非缺失值、至少一个缺失值和非缺失数据矩阵,生成用于插补缺失值的插补值;将所生成插补值插补于缺失数据矩阵中,生成插补后的缺失数据矩阵;
响应于确定插补后的缺失数据矩阵具有缺失值,则将插补后的缺失数据矩阵作为缺失数据矩阵继续执行所述插补步骤。
在一些实施例中,基于缺失数据矩阵所包括的缺失值、至少一个缺失值和非缺失数据矩阵,生成用于插补缺失值的插补值,包括:将缺失数据矩阵划分为包括缺失值的目标向量以及包括非缺失值的缺失数据子矩阵,其中,目标向量为缺失数据矩阵的列向量;将目标向量、缺失数据子矩阵和非缺失数据矩阵作为输入,基于正交非负矩阵分解法,生成缺失值所对应的基矩阵和系数矩阵;将所生成的基矩阵与系数矩阵相乘,生成用于插补缺失值的插补值。
在一些实施例中,基于插补后的缺失数据矩阵、非缺失数据矩阵、待预测数据矩阵以及非待预测数据矩阵,生成用于预测待预测值的预测值,包括:将插补后的缺失数据矩阵、非缺失数据矩阵、待预测数据矩阵以及非待预测数据矩阵作为输入,基于正交非负矩阵分解法,生成待预测值所对应的基矩阵以及系数矩阵;将所生成的基矩阵与系数矩阵相乘,生成用于预测待预测值的预测值。
在一些实施例中,基于插补后的缺失数据矩阵、非缺失数据矩阵、待预测数据矩阵以及非待预测数据矩阵,生成用于预测待预测值的预测值,包括:对插补后的缺失数据矩阵和非缺失数据矩阵进行数据分析,确定用于预测待预测值的预测值的取值范围;基于插补后的缺失数据矩阵、非缺失数据矩阵、待预测数据矩阵以及非待预测数据矩阵,生成用于预测待预测值的初始预测值;确定初始预测值是否属于取值范围;响应于确定初始预测值属于取值范围,将初始预测值确定为用于预测待预测值的预测值。
第二方面,本申请提供了一种用于输出信息的装置,该装置包括:第一获取单元,配置用于获取目标物品的至少两个属性分别对应的第一数据矩阵,第一数据矩阵包括具有待预测值的待预测数据矩阵以及不具有待预测值的非待预测数据矩阵;第二获取单元,配置用于获取目标物品相关联的物品的至少两个属性分别对应的第二数据矩阵,其中,第二数据矩阵包括缺失数据矩阵以及非缺失数据矩阵,缺失数据矩阵包括非缺失值和至少一个缺失值;插补单元,配置用于对于至少一个缺失值中的每个缺失值,基于缺失数据矩阵所包括的非缺失值、至少一个缺失值和非缺失数据矩阵,生成用于插补该缺失值的插补值,并将所生成插补值插补于缺失数据矩阵中,生成插补后的缺失数据矩阵;生成单元,配置用于基于插补后的缺失数据矩阵、非缺失数据矩阵、待预测数据矩阵以及非待预测数据矩阵,生成用于预测待预测值的预测值。
在一些实施例中,插补单元包括:第一执行模块,配置用于执行以下插补步骤:基于缺失数据矩阵所包括的非缺失值、至少一个缺失值和非缺失数据矩阵,生成用于插补缺失值的插补值;将所生成插补值插补于缺失数据矩阵中,生成插补后的缺失数据矩阵;第二执行模块,配置用于响应于确定插补后的缺失数据矩阵具有缺失值,则将插补后的缺失数据矩阵作为缺失数据矩阵继续执行所述插补步骤。
在一些实施例中,基于缺失数据矩阵所包括的非缺失值、至少一个缺失值和非缺失数据矩阵,生成用于插补缺失值的插补值,包括:将缺失数据矩阵划分为包括缺失值的目标向量以及包括非缺失值的缺失数据子矩阵,其中,目标向量为缺失数据矩阵的列向量;将目标向量、缺失数据子矩阵和非缺失数据矩阵作为输入,基于正交非负矩阵分解法,生成缺失值所对应的基矩阵和系数矩阵;将所生成的基矩阵与系数矩阵相乘,生成用于插补缺失值的插补值。
在一些实施例中,生成单元包括:第一生成模块,配置用于将插补后的缺失数据矩阵、非缺失数据矩阵、待预测数据矩阵以及非待预测数据矩阵作为输入,基于正交非负矩阵分解法,生成待预测值所对应的基矩阵以及系数矩阵;第二生成模块,配置用于将所生成的基矩阵与系数矩阵相乘,生成用于预测待预测值的预测值。
在一些实施例中,生成单元包括:第一确定模块,配置用于对插补后的缺失数据矩阵和非缺失数据矩阵进行数据分析,确定用于预测待预测值的预测值的取值范围;第三生成模块,配置用于基于插补后的缺失数据矩阵、非缺失数据矩阵、待预测数据矩阵以及非待预测数据矩阵,生成用于预测待预测值的初始预测值;第二确定模块,配置用于确定初始预测值是否属于取值范围;第三确定模块,配置用于响应于确定初始预测值属于取值范围,将初始预测值确定为用于预测待预测值的预测值。
第三方面,本申请实施例提供了一种服务器,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述用于输出信息的方法中任一实施例的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述用于输出信息的方法中任一实施例的方法。
本申请实施例提供的用于输出信息的方法和装置,通过获取目标物品的至少两个属性分别对应的第一数据矩阵,其中,目第一数据矩阵包括具有待预测值的待预测数据矩阵以及不具有待预测值的非待预测数据矩阵,接着获取与目标物品相关联的物品的至少两个属性分别对应的第二数据矩阵,其中,第二数据矩阵包括缺失数据矩阵以及非缺失数据矩阵,缺失数据矩阵包括非缺失值和至少一个缺失值,接着对于至少一个缺失值中的每个缺失值,基于缺失数据矩阵所包括的非缺失值、至少一个缺失值和非缺失数据矩阵,生成用于插补该缺失值的插补值,并将所生成插补值插补于缺失数据矩阵中,生成插补后的缺失数据矩阵,最后基于插补后的缺失数据矩阵、非缺失数据矩阵、待预测数据矩阵以及非待预测数据矩阵,生成用于预测待预测值的预测值,在这一过程中,采用了非缺失数据预测缺失数据,并将预测后的缺失数据与非缺失数据作为源数据,预测目标物品的属性的预测值,从而有效采用了更为全面的源数据来预测目标物品的属性的预测值,提高了信息预测的准确性。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性系统架构图;
图2是根据本申请的用于输出信息的方法的一个实施例的流程图;
图3是根据本申请的用于输出信息的方法的一个应用场景的示意图;
图4是根据本申请的用于输出信息的方法的又一个实施例的流程图;
图5是根据本申请的用于输出信息的装置的一个实施例的结构示意图;
图6是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的用于输出信息的方法或用于输出信息的装置的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏并且支持信息接收的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture ExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的信息提供支持的信息处理服务器。信息处理服务器可以对物品的属性等数据进行分析等处理,并将处理结果(例如预测信息)反馈给终端设备。
需要说明的是,本申请实施例所提供的用于输出信息的方法一般由服务器105执行,相应地,用于输出信息的装置一般设置于服务器105中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的用于输出信息的方法的一个实施例的流程200。该用于输出信息的方法,包括以下步骤:
步骤201,获取目标物品的至少两个属性分别对应的第一数据矩阵。
在本实施例中,用于输出信息的方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式获取目标物品的至少两个属性分别对应的第一数据矩阵。其中,目标物品可以为预先存储在上述电子设备上的物品信息或者客户端(例如图1所示的终端设备)输入的物品信息所对应的物品。目标物品的至少两个属性可以为目标物品的至少两个相关的属性,例如目标物品的销量和库存,也可以为目标物品的至少两个不相关的属性,例如目标物品的外形尺寸和价格。第一数据矩阵可以为将数据作为矩阵中的元素的矩阵。在这里,第一数据矩阵可以具有任意数目的行以及任意数目的列。目标物品的至少两个属性分别对应的第一数据矩阵可以包括具有待预测值的待预测数据矩阵以及不具有待预测值的非待预测数据矩阵。需要说明的是,在这里,目标物品的属性所对应的数据矩阵中,空值即为待预测值。
步骤202,获取与目标物品相关联的物品的至少两个属性分别对应的第二数据矩阵。
在本实施例中,用于输出信息的方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式获取与目标物品相关联的物品的至少两个属性分别对应的第二数据矩阵。
在本实施例中,与目标物品相关联的物品可以为与目标物品同类型的物品,例如,目标物品为A型手机,与目标物品相关联的物品为B型手机;或者,与目标物品相关联的物品可以为与目标物品同系列的物品,例如,目标物品为A1型手机,与目标物品相关联的物品为A2型手机;或者,与目标物品相关联的物品可以为目标物品的配件,例如,目标物品为A型手机,与目标物品相关联的物品为A型手机的充电器。在这里,与目标物品相关联的物品的至少两个属性与目标物品的上述至少两个属性相同。与目标物品相关联的物品的至少两个属性分别对应的第二数据矩阵包括缺失数据矩阵以及非缺失数据矩阵,缺失数据矩阵包括非缺失值和至少一个缺失值,非缺失数据矩阵包括非缺失值。需要说明的是,在这里,与目标物品相关联的物品的属性所对应的数据矩阵中,空值即为缺失值,数值即为非缺失值。
示例性的,目标物品为A型手机,与目标物品相关联的物品可以为B型手机。至少两个属性为销量和库存。获取的A型手机的销量所对应的数据矩阵可以为[88,],库存所对应的数据矩阵可以为[100,80]。获取的与A型手机相关联的B型手机的销量所对应的数据矩阵可以为[99,70],库存所对应的数据矩阵可以为[100,]。其中,销量的数据矩阵的第一列可以用于表示第一期的销量,第二列可以用于表示第二期的销量,第一期与第二期相隔预设时间段。同理,库存的数据矩阵的第一列可以用于表示第一期未销售前的库存,第二列可以用于表示第二期未销售前的库存。在这里,A型手机的销量的数据矩阵的第一行第二列的值为空,为待预测值,A型手机的销量所对应的数据矩阵[88,]为待预测数据矩阵。A型手机的库存所对应的数据矩阵[100,80]不具有待预测值,A型手机的库存所对应的数据矩阵[100,80]为非待预测数据矩阵。B型手机的销量所对应的数据矩阵[99,70]为非缺失数据矩阵,矩阵中的数值“99”和数值“70”均为非缺失值。B型手机的库存所对应的数据矩阵[100,]为缺失数据矩阵,数据矩阵中的数值“100”为非缺失值,数据矩阵的第一行第二列的值为空,为缺失值。需要说明的是,数据矩阵中,用“,”分隔的两个元素在矩阵的同一行,用“;”分隔的两个元素在矩阵的相邻行。
步骤203,对于至少一个缺失值中的每个缺失值,基于缺失数据矩阵所包括的非缺失值、至少一个缺失值和非缺失数据矩阵,生成用于插补该缺失值的插补值,并将所生成插补值插补于缺失数据矩阵中,生成插补后的缺失数据矩阵。
在本实施例中,基于步骤201中得到的缺失数据矩阵所包括的至少一个缺失值,上述电子设备(例如图1所示的服务器)可以对于至少一个缺失值中的每个缺失值,基于缺失数据矩阵所包括的非缺失值、至少一个缺失值和非缺失数据矩阵,生成用于插补该缺失值的插补值,并将所生成插补值插补于缺失数据矩阵中,生成插补后的缺失数据矩阵。
示例性的,可以根据缺失数据矩阵中的非缺失值与非缺失数据矩阵中的非缺失值的比例关系确定用于插补缺失值的插补值。例如,获取的与A型手机相关联的B型手机的销量所对应的数据矩阵可以为[99,70],库存所对应的数据矩阵可以为[100,]。其中,销量的数据矩阵的第一列可以用于表示第一期的销量,第二列可以用于表示第二期的销量,第一期与第二期相隔预设时间段。同理,库存的数据矩阵的第一列可以用于表示第一期未销售前的库存,第二列可以用于表示第二期未销售前的库存。用销量的数据矩阵的第一行第一列上的数值“99”除以库存的数据矩阵的第一行第一列上的数值“100”得到比值99/100。将该比值作为销量的数据矩阵的第一行第二列的元素与库存的数据矩阵的第一行第二列的元素比值,进而确定出用于插补缺失值的插补值。即根据70/插补值=99/100,求得插补值=70*100/99=71(结果取整数)。
步骤204,基于插补后的缺失数据矩阵、非缺失数据矩阵、待预测数据矩阵以及非待预测数据矩阵,生成用于预测待预测值的预测值。
在本实施例中,基于步骤203得到的插补后的缺失数据矩阵、步骤202得到的非缺失数据矩阵和步骤201得到的待预测数据矩阵以及非待预测数据矩阵,上述电子设备可以生成用于预测待预测值的预测值。
作为示例,上述电子设备可以确定插补后的缺失数据矩阵与非缺失数据矩阵之间的比例关系,进而根据所确定的插补后的缺失数据矩阵与非缺失数据矩阵之间的比例关系,确定待预测数据矩阵和非待预测数据矩阵之间的比例关系,最后,确定出用于预测待预测值的预测值。其中,数据矩阵间的比例关系可以用数据矩阵中元素的均值的比值来表征。例如,基于步骤201获取的A型手机的销量所对应的数据矩阵可以为[88,],库存所对应的数据矩阵可以为[100,80],获取的与A型手机相关联的B型手机的销量所对应的数据矩阵可以为[99,70],库存所对应的数据矩阵可以为[100,]。基于步骤202生成的插补后的缺失数据矩阵为[100,71]。接着,上述电子设备可以对插补后的缺失数据矩阵[100,71]的元素进行均值计算,得到均值“86”,同理,对非缺失数据矩阵[99,70]的元素进行均值计算,得到均值“85”(结果取整数),进而,将得到的两个均值相除,得到用于表征插补后的缺失数据矩阵与非缺失数据矩阵之间的比例关系的比值,即86/85。将比值“86/85”确定为用于表征待预测数据矩阵和非待预测数据矩阵之间的比例关系的比值,进而计算求得用于预测待预测值的预测值,即86/85=[(100+80)/2]/[(88+预测值)/2],预测值=[(100+80)*84/85]-88=90(结果取整数)。需要说明的是,在将用于表征缺失数据矩阵与非缺失数据矩阵之间的比例关系的比值确定为用于表征待预测数据矩阵和非待预测数据矩阵之间的比例关系的比值时,“等号”两侧的“除数”与“被除数”所对应的属性相同。例如,对于86/85=[(100+80)/2]/[(88+预测值)/2],除数“86”对应的属性为库存,被除数“85”对应的属性为销量,则除数“[(100+80)/2]”对应的属性也为库存,被除数“[(88+预测值)/2]”对应的属性为销量。
在本实施例的一些可选的实现方式中,基于插补后的缺失数据矩阵、非缺失数据矩阵、待预测数据矩阵以及非待预测数据矩阵,上述电子设备还可以通过如下步骤生成用于预测待预测值的预测值:将插补后的缺失数据矩阵、非缺失数据矩阵、待预测属性的数据矩阵以及非待预测数据矩阵作为输入,基于正交非负矩阵分解法,生成待预测值所对应的基矩阵以及系数矩阵;将所生成的基矩阵与系数矩阵相乘,生成用于预测待预测值的预测值。其中,非负矩阵分解是将结构化数据分解成两个低秩非负矩阵乘积的技术,属于无监督学习方法,它既可以用于降维,也可以用于数据压缩。相对于非负矩阵分解法,正交非负矩阵分解法对各数据源的基矩阵施加了正交性约束。上述基矩阵可以用于表征待预测数据矩阵与非待预测数据矩阵间具有差异性的部分。上述系数矩阵可以代表待预测数据矩阵与非待预测数据矩阵间共有的系数,可以用于表征待预测数据矩阵与非待预测数据矩阵间相同的部分。需要说明的是,正交非负矩阵分解法是目前广泛应用和研究的公知技术,在此不再赘述。
在本实施例的一些可选的实现方式中,基于插补后的缺失数据矩阵、非缺失数据矩阵、待预测数据矩阵以及非待预测数据矩阵,上述电子设备可以通过如下步骤生成用于预测所述待预测值的预测值:首先对插补后的缺失数据矩阵和非缺失数据矩阵进行数据分析,确定用于预测待预测值的预测值的取值范围;然后基于插补后的缺失数据矩阵、非缺失数据矩阵、待预测数据矩阵以及非待预测数据矩阵,生成用于预测待预测值的初始预测值;接着确定初始预测值是否属于取值范围;响应于确定初始预测值属于取值范围,将初始预测值确定为用于预测待预测值的预测值。
作为示例,上述电子设备可以采用如下方案确定用于预测待预测值的预测值的取值范围:
方案一:首先,上述电子设备可以确定待预测值所在数据矩阵所对应的属性;然后获取插补后的缺失数据矩阵或者非缺失数据矩阵,其中,所获取的插补后的缺失数据矩阵或者非缺失数据矩阵所对应的属性与所确定的属性相同;提取所获取的插补后的缺失数据矩阵或者非缺失数据矩阵所包括的非缺失值中的最大值以及最小值,进而将上述取值范围确定为小于所提取的最大值且大于所提取的最小值。
方案二:首先,上述电子设备可以确定待预测值所在数据矩阵所对应的属性;然后获取插补后的缺失数据矩阵或者非缺失数据矩阵,其中,所获取的插补后的缺失数据矩阵或者非缺失数据矩阵所对应的属性与所确定的属性相同;最后将所获取的插补后的缺失数据矩阵或者非缺失数据矩阵所包括的非缺失值由小到大排列,生成非缺失值序列;接着基于预先设置的两个四分位数对非缺失值序列进行截断处理,进而确定出取值范围。例如,预设的四分位数为第一分位数以及第三分位数,非缺失值序列为“70,84,88,99”,共四个数值,则序列的第一分位数为“4*25%=1”,即序列的第一个数值“70”,第三分位数为“4*75%=3”,即序列的第三个数值“88”,则确定出取值范围为“大于70且小于88”。
继续参见图3,图3是根据本实施例的用于输出信息的方法的应用场景的一个示意图。在图3的应用场景中,服务器301可以首先获取目标物品例如A1型手机的销量的第一数据矩阵[99,]和库存的第一数据矩阵[100,80],其中,A1型手机的销量的第一数据矩阵[99,]为具有待预测值的待预测数据矩阵,A1型手机的库存的第一数据矩阵[100,80]为不具有待预测值的非待预测数据矩阵;接着,服务器301可以获取与A1型手机同系列的物品A2型手机的销量的第二数据矩阵[80,]和库存的第二数据矩阵[90,100],其中,A2型手机的销量的第二数据矩阵[80,]为具有缺失值和非缺失值的缺失数据矩阵,A2型手机的库存的第二数据矩阵[90,100]为具有非缺失值的非缺失数据矩阵;接着对于A2型手机的销量的数据矩阵[80,]中第一行第二列的缺失值,基于缺失数据矩阵所包括的非缺失值、至少一个缺失值和非缺失数据矩阵,服务器301可以生成用于插补该缺失值的插补值“89”(插补值=8*100/9=89),并将插补值“89”插补于缺失数据矩阵中,生成插补后的缺失数据矩阵[80,89];最后,服务器301可以基于插补后的缺失数据矩阵[80,89]、非缺失数据矩阵[90,100]、待预测数据矩阵[99,]以及非待预测数据矩阵[100,80],生成用于预测待预测值的预测值“61”(预测值=[(80+89)/2]*180/[(90+100)/2]-99=61)。
本申请的上述实施例提供的方法通过获取目标物品的至少两个属性分别对应的第一数据矩阵,其中,第一数据矩阵包括具有待预测值的待预测数据矩阵以及不具有待预测值的非待预测数据矩阵,接着获取与目标物品相关联的物品的至少两个属性分别对应的第二数据矩阵,其中,第二数据矩阵包括缺失数据矩阵以及非缺失数据矩阵,缺失数据矩阵包括非缺失值和至少一个缺失值,接着对于至少一个缺失值中的每个缺失值,基于缺失数据矩阵和非缺失数据矩阵,生成用于插补该缺失值的插补值,并将所生成插补值插补于缺失数据矩阵中,生成插补后的缺失数据矩阵,最后基于插补后的缺失数据矩阵、非缺失数据矩阵、待预测数据矩阵以及非待预测数据矩阵,生成用于预测待预测值的预测值,从而有效利用了物品的属性的缺失数据,提高了信息预测的准确性。
进一步参考图4,其示出了用于输出信息的方法的又一个实施例的流程400。该用于输出信息的方法的流程400,包括以下步骤:
步骤401,获取目标物品的至少两个属性分别对应的第一数据矩阵。
在本实施例中,步骤401与图2对应实施例中的步骤201基本一致,这里不再赘述。
步骤402,获取与目标物品相关联的物品的至少两个属性分别对应的数据矩阵。
在本实施例中,步骤402与图2对应实施例中的步骤202基本一致,这里不再赘述。
步骤403,执行以下插补步骤:基于缺失数据矩阵所包括的非缺失值、至少一个缺失值和非缺失数据矩阵,生成用于插补缺失值的插补值;将所生成插补值插补于缺失数据矩阵中,生成插补后的缺失数据矩阵;响应于确定插补后的缺失数据矩阵具有缺失值,则将插补后的缺失数据矩阵作为缺失数据矩阵继续执行插补步骤。
在本实施例中,上述电子设备(例如图1所示的服务器)可以执行以下插补步骤:基于缺失数据矩阵所包括的非缺失值、至少一个缺失值和非缺失数据矩阵,生成用于插补缺失值的插补值;将所生成插补值插补于缺失数据矩阵中,生成插补后的缺失数据矩阵;响应于确定插补后的缺失数据矩阵具有缺失值,则将插补后的缺失数据矩阵作为缺失数据矩阵继续执行插补步骤。
示例性的,基于步骤401获取的A型手机的销量所对应的第一数据矩阵可以为[88,],库存所对应的第一数据矩阵可以为[100,80],获取的与A型手机相关联的B型手机的销量所对应的第二数据矩阵可以为[99,70,80],库存所对应的第二数据矩阵可以为[100,,]。其中,B型手机的库存所对应的数据矩阵可以为[100,,]为缺失数据矩阵。上述电子设备可以执行以下插补步骤:基于缺失数据矩阵[100,,]和非缺失数据矩阵[99,70,80],生成用于插补缺失数据矩阵[100,,]的第一行第二列的缺失值的插补值“71”,并将所生成插补值“71”插补于缺失数据矩阵[100,,]中,生成插补后的缺失数据矩阵[100,71,];接着,上述电子设备可以响应于确定插补后的缺失数据矩阵[100,71,]具有缺失值,则将插补后的缺失数据矩阵作为缺失数据矩阵继续执行插补步骤。即基于缺失数据矩阵[100,71,]和非缺失数据矩阵[99,70,80],生成用于插补缺失数据矩阵[100,71,]的第一行第三列的缺失值的插补值“81”,并将所生成插补值“81”插补于缺失数据矩阵[100,71,]中,生成插补后的缺失数据矩阵[100,71,81];接着,上述电子设备可以响应于确定缺失数据矩阵[100,71,81]不具有缺失值,退出插补步骤。在这里,生成的插补后的缺失数据矩阵即为[100,71,81]。
在本实施例的一些可选的实现方式中,基于缺失数据矩阵所包括的非缺失值、至少一个缺失值和非缺失数据矩阵,上述电子设备可以通过如下步骤生成用于插补缺失值的插补值:将缺失数据矩阵划分为包括缺失值的目标向量和包括非缺失值的缺失子矩阵;其中,目标向量为缺失数据矩阵的列向量;将目标向量、缺失数据子矩阵和非缺失数据矩阵作为输入,基于正交非负矩阵分解法,生成缺失值所对应的基矩阵和系数矩阵;将所生成的基矩阵与系数矩阵相乘,生成用于插补缺失值的插补值。其中,缺失数据子矩阵为缺失数据矩阵中,除目标向量以外的数据矩阵。非负矩阵分解是将结构化数据分解成两个低秩非负矩阵乘积的技术,属于无监督学习方法,它既可以用于降维,也可以用于数据压缩。相对于非负矩阵分解法,正交非负矩阵分解法对各数据源的基矩阵施加了正交性约束。上述基矩阵可以用于表征缺失数据矩阵与非缺失数据矩阵间具有差异性的部分。上述系数矩阵可以代表缺失数据矩阵与非缺失数据矩阵间共有的系数,可以用于表征缺失数据矩阵与非缺失数据矩阵间相同的部分。需要说明的是,正交非负矩阵分解法是目前广泛应用和研究的公知技术,在此不再赘述。
步骤404,基于插补后的缺失数据矩阵、非缺失数据矩阵、待预测数据矩阵以及非待预测数据矩阵,生成用于预测待预测值的预测值。
在本实施例中,步骤404与图2对应实施例中的步骤204基本一致,这里不再赘述。
从图4中可以看出,与图2对应的实施例相比,本实施例中的用于输出信息的方法的流程400突出了对缺失数据矩阵的至少一个缺失值进行循环插补的步骤。由此,本实施例描述的方案可以引入全面的数据,从而实现更准确的信息预测。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了一种用于生成信息的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例的用于生成信息的装置500包括:第一获取单元501,配置用于获取目标物品的至少两个属性分别对应的第一数据矩阵,其中,第一数据矩阵包括具有待预测值的待预测数据矩阵以及不具有待预测值的非待预测数据矩阵;第二获取单元502,配置用于获取与目标物品相关联的物品的至少两个属性分别对应的第二数据矩阵,其中,第二数据矩阵包括缺失数据矩阵以及非缺失数据矩阵,缺失数据矩阵包括非缺失值和至少一个缺失值;插补单元503,配置用于对于至少一个缺失值中的每个缺失值,基于缺失数据矩阵所包括的非缺失值、至少一个缺失值和非缺失数据矩阵,生成用于插补该缺失值的插补值,并将所生成插补值插补于缺失数据矩阵中,生成插补后的缺失数据矩阵;生成单元503,配置用于基于插补后的缺失数据矩阵、非缺失数据矩阵、待预测数据矩阵以及非待预测数据矩阵,生成用于预测待预测值的预测值。
在本实施例中,第一获取单元501可以通过有线连接方式或者无线连接方式获取目标物品的至少两个属性分别对应的第一数据矩阵,其中,目标物品可以为预先存储在上述电子设备上的物品或者为客户端(例如图1所示的终端设备)输入的物品。目标物品的至少两个属性可以为目标物品的至少两个相关的属性,例如目标物品的销量和库存,也可以为目标物品的至少两个不相关的属性,例如目标物品的外形尺寸和价格。第一数据矩阵可以为将数据作为矩阵中的元素的矩阵。在这里,第一数据矩阵可以具有任意数目的行以及任意数目的列。目标物品的至少两个属性分别对应的第一数据矩阵可以包括具有待预测值的待预测数据矩阵以及不具有待预测值的非待预测数据矩阵。需要说明的是,在这里,目标物品的属性所对应的第一数据矩阵中,空值即为待预测值。
在本实施例中,第二获取单元502可以通过有线连接方式或者无线连接方式获取与目标物品相关联的物品的至少两个属性分别对应的数据矩阵。
在本实施例中,与目标物品相关联的物品可以为与目标物品同类型的物品,例如,目标物品为A型手机,与目标物品相关联的物品为B型手机;或者,与目标物品相关联的物品可以为与目标物品同系列的物品,例如,目标物品为A1型手机,与目标物品相关联的物品为A2型手机;或者,与目标物品相关联的物品可以为目标物品的配件,例如,目标物品为A型手机,与目标物品相关联的物品为A型手机的充电器。在这里,与目标物品相关联的物品的至少两个属性与目标物品的上述至少两个属性相同。与目标物品相关联的物品的至少两个属性分别对应的第二数据矩阵包括缺失数据矩阵以及非缺失数据矩阵,缺失数据矩阵包括非缺失值和至少一个缺失值,非缺失数据矩阵包括非缺失值。需要说明的是,在这里,与目标物品相关联的物品的属性所对应的第二数据矩阵中,空值即为缺失值,数值即为非缺失值。
在本实施例中,基于第二获取单元502得到的缺失数据矩阵所包括的至少一个缺失值,插补单元503可以对于至少一个缺失值中的每个缺失值,基于缺失数据矩阵所包括的非缺失值、至少一个缺失值和非缺失数据矩阵,生成用于插补该缺失值的插补值,并将所生成插补值插补于缺失数据矩阵中,生成插补后的缺失数据矩阵。
在本实施例中,基于插补单元503得到的插补后的缺失数据矩阵、第二获取单元502得到的非缺失数据矩阵以及第一获取单元501得到的待预测数据矩阵以及非待预测数据矩阵,生成单元504可以生成用于预测待预测值的预测值。
在本实施例的一些可选的实现方式中,插补单元503可以包括:第一执行模块(图中未示出),配置用于基于缺失数据矩阵所包括的非缺失值、至少一个缺失值和非缺失数据矩阵,生成用于插补缺失值的插补值;将所生成插补值插补于缺失数据矩阵中,生成插补后的缺失数据矩阵;第二执行模块(图中未示出),配置用于响应于确定插补后的缺失数据矩阵具有缺失值,则将插补后的缺失数据矩阵作为缺失数据矩阵继续执行插补步骤。
在本实施例的一些可选的实现方式中,上述基于缺失数据矩阵所包括的非缺失值、至少一个缺失值和非缺失数据矩阵,生成用于插补缺失值的插补值的步骤可以包括:将缺失数据矩阵划分为包括缺失值的目标向量和包括非缺失值的缺失数据子矩阵,其中,目标向量为缺失数据矩阵的列向量;将目标向量、缺失数据子矩阵和非缺失数据矩阵作为输入,基于正交非负矩阵分解法,生成缺失值所对应的基矩阵和系数矩阵;将所生成的基矩阵与系数矩阵相乘,生成用于插补缺失值的插补值。
在本实施例的一些可选的实现方式中,生成单元504可以包括:第一生成模块(图中未示出),配置用于将插补后的缺失数据矩阵、非缺失数据矩阵、待预测数据矩阵以及非待预测数据矩阵作为输入,基于正交非负矩阵分解法,生成待预测值所对应的基矩阵以及系数矩阵;第二生成模块(图中未示出),配置用于将所生成的基矩阵与系数矩阵相乘,生成用于预测待预测值的预测值。
在本实施例的一些可选的实现方式中,生成单元504可以包括:第一确定模块(图中未示出),配置用于对插补后的缺失数据矩阵和非缺失数据矩阵进行数据分析,确定用于预测待预测值的预测值的取值范围;第三生成模块(图中未示出),配置用于基于插补后的缺失数据矩阵、非缺失数据矩阵、待预测数据矩阵以及非待预测数据矩阵,生成用于预测待预测值的初始预测值;第二确定模块,配置用于确定初始预测值是否属于所述取值范围;第三确定模块(图中未示出),配置用于响应于确定初始预测值属于取值范围,将初始预测值确定为用于预测待预测值的预测值。
本申请的上述实施例提供的装置通过第一获取单元501获取目标物品的至少两个属性分别对应的第一数据矩阵,其中,第一数据矩阵包括具有待预测值的待预测数据矩阵以及不具有待预测值的非待预测数据矩阵,接着第二获取单元502获取与目标物品相关联的物品的至少两个属性分别对应的第二数据矩阵,其中,第二数据矩阵包括缺失数据矩阵以及非缺失数据矩阵,缺失数据矩阵包括非缺失值和至少一个缺失值,接着插补单元503对于至少一个缺失值中的每个缺失值,基于缺失数据矩阵所包括的非缺失值、至少一个缺失值和非缺失数据矩阵,生成用于插补该缺失值的插补值,并将所生成插补值插补于缺失数据矩阵中,生成插补后的缺失数据矩阵,最后生成单元504基于插补后的缺失数据矩阵、非缺失数据矩阵、待预测数据矩阵以及非待预测数据矩阵,生成用于预测待预测值的预测值,从而有效利用了物品的属性的缺失数据,提高了信息预测的准确性。
下面参考图6,其示出了适于用来实现本申请实施例的服务器的计算机系统600的结构示意图。图6示出的服务器仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括第一获取单元、第二获取单元插补单元生成单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,生成单元还可以被描述为“生成预测值的单元”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时,使得该装置:获取目标物品的至少两个属性分别对应的第一数据矩阵,其中,第一数据矩阵包括具有待预测值的待预测数据矩阵以及不具有待预测值的非待预测数据矩阵;获取与目标物品相关联的物品的至少两个属性分别对应的第二数据矩阵,其中,第二数据矩阵包括缺失数据矩阵以及非缺失数据矩阵,缺失数据矩阵包括非缺失值和至少一个缺失值;对于至少一个缺失值中的每个缺失值,基于缺失数据矩阵所包括的非缺失值、至少一个缺失值和非缺失数据矩阵,生成用于插补该缺失值的插补值,并将所生成插补值插补于缺失数据矩阵中,生成插补后的缺失数据矩阵;基于插补后的缺失数据矩阵、非缺失数据矩阵、待预测数据矩阵以及非待预测数据矩阵,生成用于预测待预测值的预测值。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (12)
1.一种用于生成信息的方法,包括:
获取目标物品的至少两个属性分别对应的第一数据矩阵,其中,所述第一数据矩阵包括具有待预测值的待预测数据矩阵以及不具有待预测值的非待预测数据矩阵;
获取所述目标物品相关联的物品的所述至少两个属性分别对应的第二数据矩阵,其中,所述第二数据矩阵包括缺失数据矩阵以及非缺失数据矩阵,所述缺失数据矩阵包括非缺失值和至少一个缺失值;
对于所述至少一个缺失值中的每个缺失值,基于所述缺失数据矩阵所包括的非缺失值、至少一个缺失值和所述非缺失数据矩阵,生成用于插补该缺失值的插补值,并将所生成插补值插补于所述缺失数据矩阵中,生成插补后的缺失数据矩阵;
基于插补后的缺失数据矩阵、所述非缺失数据矩阵、所述待预测数据矩阵以及所述非待预测数据矩阵,生成用于预测所述待预测值的预测值。
2.根据权利要求1所述的方法,其中,所述对于所述至少一个缺失值中的每个缺失值,基于所述缺失数据矩阵所包括的非缺失值、至少一个缺失值和所述非缺失数据矩阵,生成用于插补该缺失值的插补值,并将所生成插补值插补于所述缺失数据矩阵中,生成插补后的缺失数据矩阵,包括:
执行以下插补步骤:基于缺失数据矩阵所包括的非缺失值、至少一个缺失值和所述非缺失数据矩阵,生成用于插补缺失值的插补值;将所生成插补值插补于缺失数据矩阵中,生成插补后的缺失数据矩阵;
响应于确定插补后的缺失数据矩阵具有缺失值,则将插补后的缺失数据矩阵作为缺失数据矩阵继续执行所述插补步骤。
3.根据权利要求2所述的方法,其中,所述基于缺失数据矩阵所包括的非缺失值、至少一个缺失值和所述非缺失数据矩阵,生成用于插补缺失值的插补值,包括:
将所述缺失数据矩阵划分为包括缺失值的目标向量以及包括非缺失值的缺失数据子矩阵,其中,所述目标向量为所述缺失数据矩阵的列向量;
将所述目标向量、所述缺失数据子矩阵和所述非缺失数据矩阵作为输入,基于正交非负矩阵分解法,生成缺失值所对应的基矩阵和系数矩阵;
将所生成的基矩阵与系数矩阵相乘,生成用于插补缺失值的插补值。
4.根据权利要求1所述的方法,其中,所述基于插补后的缺失数据矩阵、所述非缺失数据矩阵、所述待预测数据矩阵以及所述非待预测数据矩阵,生成用于预测所述待预测值的预测值,包括:
将插补后的缺失数据矩阵、所述非缺失数据矩阵、所述待预测属性的数据矩阵以及所述非待预测数据矩阵作为输入,基于正交非负矩阵分解法,生成所述待预测值所对应的基矩阵以及系数矩阵;
将所生成的基矩阵与系数矩阵相乘,生成用于预测所述待预测值的预测值。
5.根据权利要求1-4之一所述的方法,其中,所述基于插补后的缺失数据矩阵、所述非缺失数据矩阵、所述待预测数据矩阵以及所述非待预测数据矩阵,生成用于预测所述待预测值的预测值,包括:
对插补后的缺失数据矩阵和所述非缺失数据矩阵进行数据分析,确定用于预测所述待预测值的预测值的取值范围;
基于插补后的缺失数据矩阵、所述非缺失数据矩阵、所述待预测数据矩阵以及所述非待预测数据矩阵,生成用于预测所述待预测值的初始预测值;
确定所述初始预测值是否属于所述取值范围;
响应于确定所述初始预测值属于所述取值范围,将所述初始预测值确定为用于预测所述待预测值的预测值。
6.一种用于输出信息的装置,包括:
第一获取单元,配置用于获取目标物品的至少两个属性分别对应的第一数据矩阵,其中,所述第一数据矩阵包括具有待预测值的待预测数据矩阵以及不具有待预测值的非待预测数据矩阵;
第二获取单元,配置用于获取所述目标物品相关联的物品的所述至少两个属性分别对应的第二数据矩阵,其中,所述第二数据矩阵包括缺失数据矩阵以及非缺失数据矩阵,所述缺失数据矩阵包括非缺失值和至少一个缺失值;
插补单元,配置用于对于所述至少一个缺失值中的每个缺失值,基于所述缺失数据矩阵所包括的非缺失值、至少一个缺失值和所述非缺失数据矩阵,生成用于插补该缺失值的插补值,并将所生成插补值插补于所述缺失数据矩阵中,生成插补后的缺失数据矩阵;
生成单元,配置用于基于插补后的缺失数据矩阵、所述非缺失数据矩阵、所述待预测数据矩阵以及所述非待预测数据矩阵,生成用于预测所述待预测值的预测值。
7.根据权利要求6所述的装置,其中,所述插补单元包括:
第一执行模块,配置用于执行以下插补步骤:基于缺失数据矩阵所包括的非缺失值、至少一个缺失值和所述非缺失数据矩阵,生成用于插补缺失值的插补值;将所生成插补值插补于缺失数据矩阵中,生成插补后的缺失数据矩阵;
第二执行模块,配置用于响应于确定插补后的缺失数据矩阵具有缺失值,则将插补后的缺失数据矩阵作为缺失数据矩阵继续执行所述插补步骤。
8.根据权利要求7所述的装置,其中,所述基于缺失数据矩阵所包括的非缺失值、至少一个缺失值和所述非缺失数据矩阵,生成用于插补缺失值的插补值,包括:
将所述缺失数据矩阵划分为包括缺失值的目标向量以及包括非缺失值的缺失数据子矩阵,其中,所述目标向量为所述缺失数据矩阵的列向量;
将所述目标向量、所述缺失数据子矩阵和所述非缺失数据矩阵作为输入,基于正交非负矩阵分解法,生成缺失值所对应的基矩阵和系数矩阵;
将所生成的基矩阵与系数矩阵相乘,生成用于插补缺失值的插补值。
9.根据权利要求6所述的装置,其中,所述生成单元包括:
第一生成模块,配置用于将插补后的缺失数据矩阵、所述非缺失数据矩阵、所述待预测数据矩阵以及所述非待预测数据矩阵作为输入,基于正交非负矩阵分解法,生成所述待预测值所对应的基矩阵以及系数矩阵;
第二生成模块,配置用于将所生成的基矩阵与系数矩阵相乘,生成用于预测所述待预测值的预测值。
10.根据权利要求6-9之一所述的装置,其中,所述生成单元包括:
第一确定模块,配置用于对插补后的缺失数据矩阵和所述非缺失数据矩阵进行数据分析,确定用于预测所述待预测值的预测值的取值范围;
第三生成模块,配置用于基于插补后的缺失数据矩阵、所述非缺失数据矩阵、所述待预测数据矩阵以及所述非待预测数据矩阵,生成用于预测所述待预测值的初始预测值;
第二确定模块,配置用于确定所述初始预测值是否属于所述取值范围;
第三确定模块,配置用于响应于确定所述初始预测值属于所述取值范围,将所述初始预测值确定为用于预测所述待预测值的预测值。
11.一种服务器,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如权利要求1-5中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711371189.5A CN109933749B (zh) | 2017-12-19 | 2017-12-19 | 用于生成信息的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711371189.5A CN109933749B (zh) | 2017-12-19 | 2017-12-19 | 用于生成信息的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109933749A true CN109933749A (zh) | 2019-06-25 |
CN109933749B CN109933749B (zh) | 2024-03-05 |
Family
ID=66983379
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711371189.5A Active CN109933749B (zh) | 2017-12-19 | 2017-12-19 | 用于生成信息的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109933749B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112348423A (zh) * | 2019-11-07 | 2021-02-09 | 北京沃东天骏信息技术有限公司 | 用于调整库存量的方法和装置 |
CN114677174A (zh) * | 2022-03-25 | 2022-06-28 | 北京京东尚科信息技术有限公司 | 一种计算未上架物品销量的方法和装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012194741A (ja) * | 2011-03-16 | 2012-10-11 | Nec Corp | 行列形データの欠損値予測装置、欠損値予測計算方法および欠損値予測プログラム |
CN102792327A (zh) * | 2010-02-04 | 2012-11-21 | 宝洁公司 | 用于进行消费者调查的方法 |
CN105117988A (zh) * | 2015-10-14 | 2015-12-02 | 国家电网公司 | 一种电力系统中缺失数据插补的方法 |
CN105550901A (zh) * | 2015-12-21 | 2016-05-04 | 上海交通大学 | 基于少量用户评价的物品流行度与喜好度联合预测系统 |
CN106649832A (zh) * | 2016-12-29 | 2017-05-10 | 北京奇艺世纪科技有限公司 | 一种基于缺失数据的预估方法及装置 |
-
2017
- 2017-12-19 CN CN201711371189.5A patent/CN109933749B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102792327A (zh) * | 2010-02-04 | 2012-11-21 | 宝洁公司 | 用于进行消费者调查的方法 |
JP2012194741A (ja) * | 2011-03-16 | 2012-10-11 | Nec Corp | 行列形データの欠損値予測装置、欠損値予測計算方法および欠損値予測プログラム |
CN105117988A (zh) * | 2015-10-14 | 2015-12-02 | 国家电网公司 | 一种电力系统中缺失数据插补的方法 |
CN105550901A (zh) * | 2015-12-21 | 2016-05-04 | 上海交通大学 | 基于少量用户评价的物品流行度与喜好度联合预测系统 |
CN106649832A (zh) * | 2016-12-29 | 2017-05-10 | 北京奇艺世纪科技有限公司 | 一种基于缺失数据的预估方法及装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112348423A (zh) * | 2019-11-07 | 2021-02-09 | 北京沃东天骏信息技术有限公司 | 用于调整库存量的方法和装置 |
CN114677174A (zh) * | 2022-03-25 | 2022-06-28 | 北京京东尚科信息技术有限公司 | 一种计算未上架物品销量的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109933749B (zh) | 2024-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108520324A (zh) | 用于生成信息的方法和装置 | |
CN107944481B (zh) | 用于生成信息的方法和装置 | |
CN109460513A (zh) | 用于生成点击率预测模型的方法和装置 | |
CN109472523A (zh) | 用于分拣货物的方法和装置 | |
CN109840648A (zh) | 用于输出储位信息的方法和装置 | |
CN108595628A (zh) | 用于推送信息的方法和装置 | |
CN107451785B (zh) | 用于输出信息的方法和装置 | |
CN109214730A (zh) | 信息推送方法和装置 | |
CN108595448A (zh) | 信息推送方法和装置 | |
CN109710507A (zh) | 一种自动化测试的方法和装置 | |
CN113743971A (zh) | 一种数据处理方法和装置 | |
CN109902986A (zh) | 用于输出信息的方法和装置 | |
CN109688086A (zh) | 用于终端设备的权限控制方法和装置 | |
CN112258104A (zh) | 调拨信息生成方法、物品调拨方法、装置、设备和介质 | |
CN109933749A (zh) | 用于生成信息的方法和装置 | |
CN110675176B (zh) | 用于生成属性预测模型的方法和装置 | |
CN109978594B (zh) | 订单处理方法、装置及介质 | |
CN112749323A (zh) | 一种构建用户画像的方法和装置 | |
CN110197317A (zh) | 目标用户确定方法及装置、电子设备及存储介质 | |
CN109255563A (zh) | 物品的储位区域的确定方法和装置 | |
CN109840724A (zh) | 用于输出信息的方法和装置 | |
CN108509179A (zh) | 用于生成模型的方法和装置 | |
CN111125502B (zh) | 用于生成信息的方法和装置 | |
CN113326203B (zh) | 一种信息推荐方法、设备及存储介质 | |
CN109492687A (zh) | 用于处理信息的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |