具体实施方式
为了使本技术领域的人员更好地理解本公开的技术方案,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本公开一部分的实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本公开保护的范围。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本实施例,提供了一种对项目进行拆分的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本实施例所提供的方法实施例可以在服务器或者类似的计算设备中执行。图1示出了一种用于实现对项目进行拆分的方法的计算设备的硬件结构框图。如图1所示,计算设备可以包括一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器、以及用于通信功能的传输装置。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算设备还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算设备中的其他元件中的任意一个内。如本公开实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器可用于存储应用软件的软件程序以及模块,如本公开实施例中的对项目进行拆分的方法对应的程序指令/数据存储装置,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的对项目进行拆分的方法。存储器可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算设备的通信供应商提供的无线网络。在一个实例中,传输装置包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算设备的用户界面进行交互。
此处需要说明的是,在一些可选实施例中,上述图1所示的计算设备可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是,图1仅为特定具体实例的一个实例,并且旨在示出可存在于上述计算设备中的部件的类型。
图2是根据本实施例所述的对项目进行拆分的系统的应用场景的示意图。参照图2所示,该应用场景中包括:项目拆分系统200和用户的终端设备,例如终端设备100。用户的终端设备100例如可以通过网络与项目拆分系统200进行通信连接,从而用户可以通过终端设备100向项目拆分系统200发送对项目进行拆分的请求,进而项目拆分系统200可以对项目进行拆分得到多个子项目。其中,终端设备100例如但不限于是智能手机、平板、pad以及个人电脑等终端,项目拆分系统200例如可以由多个服务器构成。其中,该项目拆分系统200例如可以由某个单位(例如:某个工厂、某个数据分析公司)独立运营,用户例如可以是该单位的项目负责人员,该用户可以通过终端设备100连接到该项目拆分系统200,利用该项目拆分系统200对项目进行拆分。此外,该项目拆分系统200例如还可以是第三方平台系统,并且该系统还可以设置有对应的客户端程序,其中客户端程序例如但不限于是网页、小程序以及APP应用程序等。终端设备100例如安装有该客户端程序,用户可以作为需求方,通过终端设备100上的客户端程序访问该项目拆分系统200,然后向项目拆分系统200发送对项目进行拆分的请求,然后该项目拆分系统200可以根据用户的请求对项目进行拆分。需要说明的是,图2中的项目拆分系统200、终端设备100均可适用上面所述的硬件结构。
在上述运行环境下,根据本实施例的第一个方面,提供了一种对项目进行拆分的方法,该方法由图2中所示的项目拆分系统200实现。图3示出了该方法的流程示意图,参考图3所示,该方法包括:
S302:利用预先训练的需求分类模型确定第一项目对应的需求分类信息,其中需求分类信息用于指示第一项目对应的对象所属的分类类别;以及
S304:基于需求分类信息,利用预先训练的项目拆分模型确定与第一项目相关的多个第二项目作为第一项目的子项目。
正如背景技术中所述的,在工业互联网领域,为了能够快速处理用户的不同需求(或者项目),因此需要对各种需求进行分类。然而,现有的需求分类方法主要采用人工进行标注,因此面对大量的需求会浪费大量的人力,并且效率低,容易出错。进一步地,在实际处理需求(或者项目)的过程中,为了提升效率可以对项目进行拆分,即:将一个完整的项目拆分成多个子项目同时进行处理。然而,现有技术需要大量的专业人员对项目进行分析,然后进行判断,从而做出对项目拆分。基于专业人员的技术及经验的不同,对项目的拆分也是不同的,而且也会浪费大量的人力。
针对背景技术中存在的技术问题,本实施例技术方案在步骤S302中,在项目负责人员需要对项目进行拆分的情况下,项目拆分系统200首先利用预先训练的需求分类模型确定第一项目(即,项目负责人员需要拆分的项目)对应的需求分类信息,其中需求分类信息用于指示第一项目对应的对象所属的分类类别。在一个具体实例中,项目负责人员需要拆分的第一项目例如是:设计一款放置于桌子上的电扇。在这种情况下,项目拆分系统200可以调用需求分类模型对第一项目进行识别,确定第一项目的需求分类信息,本实施例中第一项目的需求分类信息例如是:设计台式电扇,即第一项目对应的对象所属的分类类别为台式电扇。其中,该需求分类模型为预先训练的,在训练过程中可以利用不同的需求文本作为训练数据,对需求文本进行词法分析并建立分词库,然后以每条需求文本的分词以及预设的权重作为模型的输入,以分类类别作为模型的输出,然后通过大量的数据对模型进行训练,直至模型可以对不同的对象进行分类。在本实施例中,该需求分类模型例如但不限于可以应用到工业制造领域中,可以对工业产品(例如:汽车、手机、机器等)进行分类。并且分类类别可以根据实际需求进行细分,以电扇为例,台式电扇、挂扇、手持电扇、散热扇在本实施例中对应不同的分类类别。此外,本实施例的需求分类模型还可以应用到其他的领域,例如:对软件、药品进行分类,关于需求分类模型可以根据实际要求而进行模型训练,进而可以识别不同的对象,此处关于需求分类模型不做具体限定。在模型训练完成之后可以对项目(此处的项目也可以理解为需求)进行识别,确定项目的需求分类信息,即:确定项目对应的对象所属的分类类别。从而,通过需求分类模型可以自动化的确定第一项目对应的需求分类信息。
进一步地,在确定第一项目对应的需求分类信息的情况下,本实施例还需要进一步地对第一项目进行拆分。具体地,在步骤S304中,项目拆分系统200可以基于需求分类信息,利用预先训练的项目拆分模型确定与第一项目相关的多个第二项目作为第一项目的子项目。在实际应用中,项目拆分系统200可以调用项目拆分模型,然后将第一项目的需求分类信息作为模型的输入,然后通过项目拆分模型的识别计算,确定与第一项目相关的多个第二项目作为第一项目的子项目。此处的第二项目可以理解为第一项目的组成结构(或者模块),在一个具体实例中,第一项目的需求分类信息为设计台式电扇,确定的第二项目例如包括:台式电扇电路设计、台式电扇扇叶设计、台式电扇外形设计、台式电扇扇罩设计等多个第二项目,多个第二项目作为第一项目的子项目,即:项目拆分模型可以确定组成第一项目的多个子项目。为了清楚地对本方案进行说明,在另一个实例中,第一项目的需求分类信息例如是设计自行车,通过项目拆分模型得到的第二项目例如包括:自行车车轮设计、自行车车架设计等。本方案中的项目拆分模型可以基于不同的需求分类信息对项目进行拆分,进而针对不同的项目得到不同的子项目。从而,通过项目拆分模型可以自动化将第一项目拆分为多个子项目。
从而通过这种方式,首先利用需求分类模型确定第一项目对应的需求分类信息,然后基于需求分类信息,利用预先训练的项目拆分模型确定与第一项目相关的多个第二项目作为第一项目的子项目。从而与现有技术相比,本方案可以利用需求分类模型自动化的确定第一项目对应的需求分类信息,并且通过项目拆分模型自动化的对项目进行拆分确定多个子项目。从而,达到了自动化的确定项目的需求类型以及对项目进行拆分的目的,实现了减少人力、提升效率以及精准率的技术效果。进而解决了现有技术中存在的确定项目的需求类型以及进一步地进行项目拆分主要采用人工的方式进行,因此浪费大量的人力并且效率低下的技术问题。
可选地,利用预先训练的需求分类模型确定第一项目对应的需求分类信息,包括:接收与第一项目对应的需求文本;对需求文本进行词法分析,确定需求文本包含的单词序列;以及利用需求分类模型,根据单词序列确定第一项目对应的需求分类信息。
具体地,在利用预先训练的需求分类模型确定第一项目对应的需求分类信息的操作中,用户可以通过终端设备100上的客户端输入与第一项目对应的需求文本,其中需求文本例如是“设计一款放置于桌子上的电扇”。在这种情况下,项目拆分系统200首先接收该需求文本,进一步地项目拆分系统200可以对需求文本进行词法分析,确定需求文本包含的单词序列,即:对需求文本进行分词操作,得到单词序列。其中,词法分析例如可以是现有技术中的词法分析方法,此处不做具体限定。最终,项目拆分系统200调用需求分类模型,根据单词序列确定第一项目对应的需求分类信息。从而,可以根据需求文本确定项目的需求分类信息,因此需求分类信息更加准确。此外本方案的项目拆分系统还可以作为第三方平台为用户提供服务,因此用户不需要进行系统开发,节省资源提升效率。
可选地,利用预先训练的需求分类模型确定第一项目对应的需求分类信息,包括:利用预先训练的需求分类模型,根据单词序列分别确定第一项目对应于每个分类类别的概率值;以及根据概率值确定第一项目对应的需求分类信息。
具体地,在利用预先训练的需求分类模型确定第一项目对应的需求分类信息的操作中,项目拆分系统200首先利用预先训练的需求分类模型,根据单词序列分别确定第一项目对应于每个分类类别的概率值,即需求分类模型可以计算该第一项目对应于每个分类类别的概率值。在一个具体实例中,上述的第一项目对应于台式电扇、挂扇、手持电扇、散热扇等的概率值分别为15%、8%、10%、2%.....。进一步地,根据概率值确定第一项目对应的需求分类信息。在实际操作中,例如根据概率值对各个分类类别进行排序,最终选择概率值最大的分类类别(例如,台式电扇)作为第一项目的需求分类信息。从而,根据概率值可以直观快速地确定需求分类信息。
可选地,利用预先训练的需求分类模型确定第一项目对应的需求分类信息,包括:利用基于随机森林算法的需求分类模型确定第一项目对应的需求分类信息。
具体地,需求分类模型例如是基于决策算法构建的模型,在一个优选实例中,该需求分类模型可以基于随机森林算法或者ID3(数学期望)算法,并且模型设计过程中采用aX+b=y结构,X为输入数据(即单词序列),y对应于分类类别,随机森林算法的每个叶子节点对应于每个分类类别。然后通过大量的正确的数据对模型进行训练。在模型训练完成之后,利用该基于随机森林算法的需求分类模型确定第一项目对应的需求分类信息。
可选地,该方法还包括:根据以下步骤训练基于随机森林算法的需求分类模型:利用聚类算法对训练数据进行聚类计算,确定训练数据包含的分类类别;对聚类计算的结果进行交叉验证,判断训练数据包含的分类类别是否准确;以及在分类类别准确的情况下利用随机森林算法表示分类类别,确定需求分类模型。
具体地,参考图4A所示,在训练基于随机森林算法的需求分类模型的过程中,首先利用聚类算法对训练数据进行聚类计算,确定训练数据包含的分类类别。其中,训练数据可以是大量的需求数据,聚类算法例如采用K-means算法,但不限于是K-means算法,还可以采用其他的聚类算法,此处不做具体限定。通过聚类计算,可以将训练数据划分为不同的分类类别。
进一步地,为了保证分类类别的准确性,本方案还可以对聚类计算的结果进行交叉验证,判断训练数据包含的分类类别是否准确。即,判断确定分类是否准确。其中,交叉验证的方法例如可以采用现有技术中的交叉验证算法,此处关于交叉验证采用的算法不做具体限定。
最终,在确定分类类别准确的情况下,利用随机森林算法表示分类类别(也可以理解为将分类类别挂到随机森林算法),即:随机森林的每个叶子节点例如对应于一种分类类别。最终使用C4.5算法计算需求与类别之间距离来判断类别,最终得到需求分类模型。
从而通过这种方式,在训练需求分类模型的过程中首先利用聚类算法确定分类类别,然后通过交叉算法进一步地对分类准确性进行验证,最终通过随机森林算法表示分类类别得到需求分类模型。因此,需求分类模型更加精准,并且可以快速的确定需求的类别。
可选地,利用预先训练的项目拆分模型确定与第一项目相关的多个第二项目,包括:利用基于卷积神经网络结构的项目拆分模型确定多个第二项目。
具体地,项目拆分模型例如是基于神经网络结构的模型,在一个优选实例中,该项目拆分模型可以基于卷积神经网络结构(CNN),在模型训练过程中可以结合上述的需求分类模型,在C4.5算法之后连接CNN卷积神经网络,从而训练拆分模型。在利用预先训练的项目拆分模型确定与第一项目相关的多个第二项目的操作中,项目拆分系统200利用基于卷积神经网络结构的项目拆分模型确定多个第二项目。此外,该项目拆分模型还可以基于其他算法结构,此处不做具体限定。
可选地,该方法还包括:根据以下步骤训练基于卷积神经网络结构的项目拆分模型:从用于存储项目数据的数据仓库中获取维度模型的模型数据,其中维度模型的模型数据分别包括每个类别的项目的组成结构;以及根据模型数据对基于卷积神经网络结构的项目拆分模型进行训练。
具体地,参考图4B所示,图4B中的拆分模型例如对应于本方案的项目拆分模型,本实施例中的基于卷积神经网络结构的项目拆分模型例如是以数据仓库中的模型数据作为训练数据训练的,其中该数据仓库例如是利用HIVE数据仓库工具创建的,并且用于存储项目数据(也可以称为需求数据),例如:各种型号的手机设计数据、各种类型的电扇设计数据等工业制造数据。此外,项目数据中还可以包含图像数据等(例如:手机外观图片),因此本方案可以采用能够处理图像的卷积神经网络结构作为项目拆分模型。在对基于卷积神经网络结构的项目拆分模型进行训练的过程中,项目拆分系统200首先从数据仓库中获取维度模型的模型数据,其中该数据仓库中的维度模型例如可以采用星型模型、雪花模型以及星座模型等构建,此处不做具体限定。每个维度模型对应于一个项目,例如:台式电扇和吊扇的数据分别对应于不同的维度模型。模型数据例如包括事实表和维度表,通过事实表和维度表可以确定每个类别的项目的组成结构,例如:台式电扇的维度模型的模型数据包括台式电扇的组成结构,例如包括:扇叶、扇罩、电路、电机等。进一步地,项目拆分系统200根据模型数据对基于卷积神经网络结构的项目拆分模型进行训练。从而通过这种方式,利用数据仓库中的模型数据作为训练数据训练项目拆分模型,由于数据仓库中针对每个类别的项目分别建模,因此每个模型对应于一个项目分类,从而训练得到的项目拆分模型更加精准。
可选地,该方法还包括:将第二项目的信息存储至预设的关系型数据库;以及对关系型数据库中的第二项目的信息进行可视化展示。
具体地,参考图4B所示,在对第一项目拆分得到多个第二项目之后,项目拆分系统200还可以将第二项目的信息存储至预设的关系型数据库(对应于图4B中的MySQL DB)。进一步地,项目拆分系统200对关系型数据库中的第二项目的信息进行可视化展示,例如通过echart进行可视化展示。从而便于项目负责人员查看拆分后的子项目。
可选地,还包括根据以下步骤构建数据仓库:从业务系统采集项目数据并发送至大数据平台进行保存;从大数据平台获取项目数据,并利用并行处理方式对项目数据进行数据清洗操作;以及利用维度建模构建数据仓库模型,并将清洗过的项目数据存储至数据仓库。
具体地,参考图4B所示,本方案还包括构建数据仓库。首先,项目拆分系统200从业务系统采集项目数据并发送至大数据平台进行保存,其中例如可以采用Flume系统采集项目数据,Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统,通过日志系统中定制的各类数据发送方(对应于业务系统)来采集数据。同时,Flume还可以对数据进行简单处理,并写到数据接受方(对应于本方案的大数据平台,例如:HDFS文件系统)。进一步地,从大数据平台获取项目数据,并利用并行处理方式对项目数据进行数据清洗操作(对应于图4B中的ETL数据处理)。在实际操作中,ETL是数据抽取(Extract)、清洗(Cleaning)、转换(Transform)、装载(Load)的过程。在本实施例中,从数据源(HDFS中)抽取出所需的项目数据,然后进行数据清洗、数据转换等操作。其中,可以利用storm并行方式对HDFS上的项目数据进行数据清洗。最终,利用维度建模构建数据仓库模型,参考图4B所示,即:将清洗的项目数据构建成数据存储模型(例如:星型模型、雪花模型、星座模型等维度模型),此处构建模型的项目数据主要是针对工业需求数据。在数据存储模型构建完成的情况下存储至数据仓库。
还需要补充说明的是,基于Storm的数据清洗方案设计包括:
1、使用通用的Spout来处理各类抽取HDFS中的源数据;
2、使用通用的Bolt来处理各类校验:空值、超长、过短、数据类型、正则表达式、关联校验等处理;
3、使用通用的Bolt来处理各类数据拆分与合并:字符串处理(拆分、合并)、数学运算处理、日期时间处理、集合数据处理(计数、平均、求和、分组、排序等)。
此外,上述的需求分类模型和项目拆分模型例如采用Python语言实现,并且项目拆分系统200还应用到了springboot技术。
此外,参考图1所示,根据本实施例的第二个方面,提供了一种存储介质。所述存储介质包括存储的程序,其中,在所述程序运行时由处理器执行以上任意一项所述的方法。
从而根据本实施例,首先利用需求分类模型确定第一项目对应的需求分类信息,然后基于需求分类信息,利用预先训练的项目拆分模型确定与第一项目相关的多个第二项目作为第一项目的子项目。从而与现有技术相比,本方案可以利用需求分类模型自动化的确定第一项目对应的需求分类信息,并且通过项目拆分模型自动化的对项目进行拆分确定多个子项目。从而,达到了自动化的确定项目的需求类型以及对项目进行拆分的目的,实现了减少人力、提升效率以及精准率的技术效果。进而解决了现有技术中存在的确定项目的需求类型以及进一步地进行项目拆分主要采用人工的方式进行,因此浪费大量的人力并且效率低下的技术问题。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
图5示出了根据本实施例所述的对项目进行拆分的装置500,该装置500与根据实施例1的第一个方面所述的方法相对应。参考图5所示,该装置500包括:类别确定模块510,用于利用预先训练的需求分类模型确定第一项目对应的需求分类信息,其中需求分类信息用于指示第一项目对应的对象所属的分类类别;以及项目拆分模块520,用于基于需求分类信息,利用预先训练的项目拆分模型确定与第一项目相关的多个第二项目作为第一项目的子项目。
可选地,类别确定模块510,包括:文本接收子模块,用于接收与第一项目对应的需求文本;词法分析子模块,用于对需求文本进行词法分析,确定需求文本包含的单词序列;以及类别确定子模块,用于利用需求分类模型,根据单词序列确定第一项目对应的需求分类信息。
可选地,类别确定子模块,包括:概率值确定单元,用于利用预先训练的需求分类模型,根据单词序列分别确定第一项目对应于每个分类类别的概率值;以及分类确定单元,用于根据概率值确定第一项目对应的需求分类信息。
可选地,类别确定模块510,包括:随机森林计算子模块,用于利用基于随机森林算法的需求分类模型确定第一项目对应的需求分类信息。
可选地,装置500还包括:需求分类模型训练模块,用于根据以下步骤训练基于随机森林算法的需求分类模型:利用聚类算法对训练数据进行聚类计算,确定训练数据包含的分类类别;对聚类计算的结果进行交叉验证,判断训练数据包含的分类类别是否准确;以及在分类类别准确的情况下利用随机森林算法表示分类类别,确定需求分类模型。
可选地,项目拆分模块520,包括:卷积神经计算子模块,用于利用基于卷积神经网络结构的项目拆分模型确定多个第二项目。
可选地,装置500还包括:项目拆分模型训练模块,用于根据以下步骤训练基于卷积神经网络结构的项目拆分模型:从用于存储项目数据的数据仓库中获取维度模型的模型数据,其中维度模型的模型数据分别包括每个类别的项目的组成结构;以及根据模型数据对基于卷积神经网络结构的项目拆分模型进行训练。
可选地,装置500还包括:数据存储模块,用于将第二项目的信息存储至预设的关系型数据库;以及数据展示模块,用于对关系型数据库中的第二项目的信息进行可视化展示。
可选地,装置500还包括:数据仓库构建模块,用于根据以下步骤构建数据仓库:从业务系统采集项目数据并发送至大数据平台进行保存;从大数据平台获取项目数据,并利用并行处理方式对项目数据进行数据清洗操作;以及利用维度建模构建数据仓库模型,并将清洗过的项目数据存储至数据仓库。
从而根据本实施例,首先利用需求分类模型确定第一项目对应的需求分类信息,然后基于需求分类信息,利用预先训练的项目拆分模型确定与第一项目相关的多个第二项目作为第一项目的子项目。从而与现有技术相比,本方案可以利用需求分类模型自动化的确定第一项目对应的需求分类信息,并且通过项目拆分模型自动化的对项目进行拆分确定多个子项目。从而,达到了自动化的确定项目的需求类型以及对项目进行拆分的目的,实现了减少人力、提升效率以及精准率的技术效果。进而解决了现有技术中存在的确定项目的需求类型以及进一步地进行项目拆分主要采用人工的方式进行,因此浪费大量的人力并且效率低下的技术问题。
实施例3
图6示出了根据本实施例所述的对项目进行拆分的装置600,该装置600与根据实施例1的第一个方面所述的方法相对应。参考图6所示,该装置600包括:处理器610;以及存储器620,与处理器610连接,用于为处理器610提供处理以下处理步骤的指令:利用预先训练的需求分类模型确定第一项目对应的需求分类信息,其中需求分类信息用于指示第一项目对应的对象所属的分类类别;以及基于需求分类信息,利用预先训练的项目拆分模型确定与第一项目相关的多个第二项目作为第一项目的子项目。
可选地,利用预先训练的需求分类模型确定第一项目对应的需求分类信息,包括:接收与第一项目对应的需求文本;对需求文本进行词法分析,确定需求文本包含的单词序列;以及利用需求分类模型,根据单词序列确定第一项目对应的需求分类信息。
可选地,利用预先训练的需求分类模型确定第一项目对应的需求分类信息,包括:利用预先训练的需求分类模型,根据单词序列分别确定第一项目对应于每个分类类别的概率值;以及根据概率值确定第一项目对应的需求分类信息。
可选地,利用预先训练的需求分类模型确定第一项目对应的需求分类信息,包括:利用基于随机森林算法的需求分类模型确定第一项目对应的需求分类信息。
存储器620还用于为处理器610提供根据以下步骤训练基于随机森林算法的需求分类模型的指令:利用聚类算法对训练数据进行聚类计算,确定训练数据包含的分类类别;对聚类计算的结果进行交叉验证,判断训练数据包含的分类类别是否准确;以及在分类类别准确的情况下利用随机森林算法表示分类类别,确定需求分类模型。
可选地,利用预先训练的项目拆分模型确定与第一项目相关的多个第二项目,包括:利用基于卷积神经网络结构的项目拆分模型确定多个第二项目。
可选地,存储器620还用于为处理器610提供根据以下步骤训练基于卷积神经网络结构的项目拆分模型的指令:从用于存储项目数据的数据仓库中获取维度模型的模型数据,其中维度模型的模型数据分别包括每个类别的项目的组成结构;以及根据模型数据对基于卷积神经网络结构的项目拆分模型进行训练。
可选地,存储器620还用于为处理器610提供处理以下处理步骤的指令:将第二项目的信息存储至预设的关系型数据库;以及对关系型数据库中的第二项目的信息进行可视化展示。
可选地,存储器620还用于为处理器610提供根据以下步骤构建数据仓库的指令:从业务系统采集项目数据并发送至大数据平台进行保存;从大数据平台获取项目数据,并利用并行处理方式对项目数据进行数据清洗操作;以及利用维度建模构建数据仓库模型,并将清洗过的项目数据存储至数据仓库。
从而根据本实施例,首先利用需求分类模型确定第一项目对应的需求分类信息,然后基于需求分类信息,利用预先训练的项目拆分模型确定与第一项目相关的多个第二项目作为第一项目的子项目。从而与现有技术相比,本方案可以利用需求分类模型自动化的确定第一项目对应的需求分类信息,并且通过项目拆分模型自动化的对项目进行拆分确定多个子项目。从而,达到了自动化的确定项目的需求类型以及对项目进行拆分的目的,实现了减少人力、提升效率以及精准率的技术效果。进而解决了现有技术中存在的确定项目的需求类型以及进一步地进行项目拆分主要采用人工的方式进行,因此浪费大量的人力并且效率低下的技术问题。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。