具体实施方式
本申请实施例提供一种类目目录确定方法及装置、自动分类方法及装置。
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
要保证资源处理记录分类结果准确,需要确定分类准确的类目目录,根据分类准确的类目目录进行分类,可以得到准确的分类结果。
下面介绍本申请类目目录确定方法的实施例。
图1是本申请类目目录确定方法第一实施例的流程图。如图1所述类目确定方法可以包括:
S101:根据资源处理记录中的处理方信息、所述处理方信息与类目之间预设的第一对应关系,确定第一类目目录。
根据资源处理记录中的处理方信息、所述处理方信息与类目之间预设的第一对应关系,确定第一类目目录。所述处理方信息可以包括:处理资源的系统方名称、处理资源的系统方的属性等信息。
所述处理方信息与类目之间的第一对应关系可以预先设置。
所述第一对应关系可以根据分析处理方信息来确定。所述第一对应关系可以根据处理方信息对应的处理方来确定,也可以根据处理方信息对应的处理方的属性来确定。
例如,资源系统A中包括子系统A1和A2,则第一对应关系中,内容为A1或A2的处理方信息都可以与类目名称为A的类目相对应。再例如,资源系统B与资源系统C都是关于交通的资源处理系统,则第一对应关系中,内容为B或C的处理方信息都可以与类目名称为“交通”的类目相对应。
所述第一对应关系还可以根据对所述处理方信息进行关键字分析来进行确定。例如,所述处理方信息为“刘德华的歌曲”,则通过对该处理方信息进行关键字分析,所述“刘德华”与所述“歌曲”都属于音乐这一领域,可以将所述处理方信息“刘德华的歌曲”与类目名称为“音乐”的类目建立对应关系。
所述的第一对应关系可以是:一个或多个资源处理方信息对应一个类目。
根据资源处理记录中的处理方信息与类目之间的第一对应关系,可以确定第一类目目录。所述类目目录可以包括一个或多个类目的类目标识(类目ID)以及与所述类目ID对应的类目名称。所述类目目录还可以包括处理方信息与类目之间的第一对应关系。
S102:接收用户更改类目的消息,并生成包含类目更改内容的类目更改标识。
类目目录确定装置可以接收用户更改某个资源处理记录所属类目的消息。所述更改资源处理记录所属类目的消息可以包括:用户标识符(用户ID)、资源处理记录中的处理方信息、类目更改时间、更改前类目ID和更改后类目ID。所述用户更改类目的消息,可以在用户更改类目划分时自动生成,并发送给类目目录确定装置。
类目目录确定装置可以根据所述更改类目划分的消息生成类目更改标识。所述类目更改标识可以包括:类目更改内容、用户ID、类目更改时间。所述类目更改内容可以包括:处理方信息、更改前类目ID和更改后类目ID。
S103:确定与所述类目更改标识中的第一类目标识对应的统计起始时间,根据所述统计起始时间确定与所述第一类目标识对应的第一时间间隔。
类目目录确定装置可以确定与所述类目更改标识中的第一类目标识(第一类目ID)对应的统计起始时间。所述第一类目ID可以是所述类目更改标识中的任意一个更改前类目ID。
确定第一类目ID对应的统计起始时间可以包括:将第一类目ID所在目录最近对第一类目进行更改的时间作为第一类目ID对应的统计起始时间。
所述确定统计起始时间的操作可以每隔预设的时间间隔进行一次。所述预设的时间间隔可以又用户预先设置在类目目录确定装置中。
根据所述统计起始时间,可以确定与所述第一类目ID相对应的第一时间间隔。具体地,与第一类目ID对应的统计起始时间与当前时间的时间差可以作为与第一类目ID相对应的第一时间间隔。
S104:对第一时间间隔内包含第一类目标识的类目更改标识进行统计,得到第一统计结果。
类目目录确定装置可以对第一时间间隔内包含第一类目标识的类目更改标识进行统计,得到第一统计结果。具体地,可以统计第一时间间隔内所述更改前类目ID与第一类目ID相同的第一候选类目更改标识的第一总数量,第一候选类目更改标识中用户ID种类的第二总数量,第一候选类目更改标识中更改后类目ID与第二类目ID相同的第二候选类目更改标识的第三总数量,以及所述第二候选类目更改标识中用户ID种类的第四总数量。所述第二类目ID与第一类目ID不相同。所述第一统计结果可以包括:第一总数量、第二总数量、第三总数量和第四总数量。
例如,第一类目ID为“A”,第二类目ID为“B”。可以统计类目更改标识中更改前类目ID为“A”的第一候选类目更改标识的总个数,并将该总个数作为第一总数量。可以统计第一候选类目更改标识中用户ID的种类数,并将该种类数作为第二总数量。可以第一候选类目更改标识中更改后类目ID为“B”的第二候选类目更改标识的总个数,并将该总个数作为第三总数量。可以统计所述第二候选类目更改标识中用户ID的种类数,并将该种类数作为第四总数量。
S105:所述第一统计结果满足第一预设规则的,更改包含第一对应关系的第一类目目录为包含第二对应关系的第二类目目录,并将所述第二类目设置为基础类目目录;若不满足,将所述第一类目目录设置为基础类目目录。
比较所述第一统计结果与第一预设规则。所述第一预设规则可以用于确定是否需要更改第一类目目录及第一对应关系。
所述第一预设规则可以包括下述中的一个或多个:
第一统计结果中的第一总数量大于或等于第一预设值,所述第一预设值可以小于或等于所述类目更改标识的总个数。
第一统计结果中的第二总数量大于或等于第二预设值,所述第二预设值可以小于或等于所述类目更改标识对应的用户ID种类的总数且小于或等于第一总数量。
第一统计结果中的第三总数量大于或等于第三预设值,所述第三预设值可以小于或等于第一总数量。
第一统计结果中的第四总数量大于或等于第四预设值,所述第四预设值可以小于或等于第三总数量。
所述第一统计结果满足第一预设规则的,可以将第一对应关系中第一类目ID及对应的处理方信息之间的对应关系更改为所述处理方信息与第二类目ID之间的对应关系,并形成第二对应关系。根据所述第二对应关系生成的类目目录可以是第二类目目录。第二类目目录中可以包含一个或多个类目ID,以及该类目ID与处理方信息之间的第二对应关系。可以将所述第二类目目录设置为基础类目目录。
所述第一统计结果不满足第一预设规则的,包含第一对应关系的第一类目目录不改变。可以所述第一类目目录设置为基础类目目录。
所述基础类目目录可以是本申请实施例最终确定的类目目录。
上述实施例公开的类目目录确定方法的第一实施例,根据对处理方信息的分析,确定所述处理方信息与类目的对应关系,从而保证类似的资源处理记录可以对应相同的类目,因此本申请的类目目录确定方法确定的类目目录可以提高分类结果的精确性。同时,接收用户更改类目的消息,并根据所述用户更改类目的消息不断更新当前的类目目录,可以保证确定的类目目录符合用户的需求,进一步提高分类结果的精确性。
下面介绍本申请类目目录确定方法第二实施例。
图2是本申请类目目录确定方法第二实施例的流程图。如图2所示,本实施例与类目目录确定方法第一实施例相比,区别在于,所述类目目录确定方法还可以包括:
S106:对同一用户在第一时间间隔内包含第三类目标识的类目更改标识进行统计,得到第二统计结果。
可以对同一用户在第一时间间隔内包含第三类目标识的类目更改标识进行统计,得到第二统计结果。
具体地,可以包括:该用户在第一时间间隔内,类目更改标识中更改前类目标识与第三类目标识相同的第三候选类目更改标识的第五总数量。以及,该用户在第一时间间隔内,所述第三候选类目更改标识中更改后类目标识与第四类目标识相同的第四候选类目更改标识的第六总数量。
所述第二统计结果可以包括:第五总数量和第六总数量。
S107:所述第二统计结果满足第二预设规则的,更改包含第二对应关系的第二类目目录为包含第三对应关系的第三类目目录,并将所述第三类目设置为用户类目目录。
比较所述第二统计结果与第二预设规则。所述第二预设规则可以用于确定是否需要更改第二类目目录及第二对应关系。
所述第二预设规则可以包括下述中的一个或多个:
第二统计结果中的第五总数量大于或等于第五预设值,所述第五预设值可以小于或等于该用户在第一时间间隔内的类目更改标识的总个数。
第二统计结果中的第六总数量大于或等于第六预设值,所述第六预设值可以小于或等于第五总数量。
所述第二统计结果满足第二预设规则的,可以将第二对应关系中第三类目ID及对应的处理方信息之间的对应关系更改为所述处理方信息与第四类目ID之间的对应关系,并形成第三对应关系。根据所述第三对应关系生成的类目目录可以是第三类目目录。第三类目目录中可以包含一个或多个类目ID,以及该类目ID与处理方信息之间的第三对应关系。可以将所述第三类目目录设置为该用户对应的用户类目目录。
所述第二统计结果不满足第二预设规则的,该用户不存在对应的用户类目目录。
上述实施例公开的类目目录确定方法第二实施例,在类目目录确定方法第一实施例的基础上,可以为用户确定与该用户对应的用户类目目录,可以进一步保证符合用户需求,且可以进一步提高分类结果的准确性。
下面结合一个确定记账类目的应用场景介绍上述类目目录确定方法。
假设,商户A的信息可以包括:商户名称“A”、女装;商户B的信息可以是:商户名称“B”、瓷砖;商户C的信息还可以是:商户名称“C”、沙发。商户D的信息可以是:商户名称“D”、打车软件公司。商户E的信息还可以是:商户名称“E”、“刘德华的歌曲”。
根据预设的第一对应关系,可以确定与所述商户相对应的记账类目。例如,商户A可以与类目“服装”相对应,商户B可以与类目“家装”相对应,商户C可以与类目“家装”相对应,商户D可以与类目“交通”相对应,商户E可以与类目“音乐”相对应。具体的商户与记账类目之间的对应关系可以如表1所示。
表1
商户 |
记账类目 |
A |
服装 |
B |
家装 |
C |
家装 |
D |
交通 |
E |
音乐 |
表1中的记账类目,可以构成第一记账类目目录。
用户对第一记账类目的设立不满意时,可以在记账时更改记账类目。类目目录确定装置可以接收用户更改记账类目的消息。例如,用户更改记账类目的消息可以是:用户“1”、商户“B”、2014年1月1日、更改前类目“家装”、更改后类目“建材”。根据所述用户更改类目的消息,可以生成记账类目更改标识。所述记账类目更改标识可以包括:“B家装建材”、“1”“20140101”。其中“B家装建材”可以是记账类目更改内容。类似地,还可以接收若干用户更改记账类目的消息,并生成对应的记账类目更改标识。
首先确定所述记账类目更改标识中与第一类目标识对应的统计起始时间。例如第一类目标识为“家装”,则可以将最近对“家装”这一记账类目进行更改的时间作为统计起始时间。例如统计起始时间为20130501。假设当前日为20140430。则,第一时间间隔可以为:20130501-20140430。
统计第一时间间隔内,类目更改标识中更改前的记账类目为“家装”的类目更改标识总个数,例如为50000(即为第一总数量),其中,用户id的种类数例如为40000(即为第二总数量)。更改前的记账类目为“家装”,且更改后的记账类目为“建材”的类目更改标识总个数,例如为45000(即为第三总数量),其中用户id的种类数例如为30000(即为第四总数量)。
假设第一预设规则为:第三总数量大于或等于40000,且第四总数量大于或等于20000。根据上述统计结果,满足所述的第一预设规则。则可以将商户B与记账类目“家装”这一对应关系更改为商户B与记账类目“建材”的对应关系。更改后的商户与记账类目之间的对应关系可以如表2所示。
表2
商户 |
记账类目 |
A |
服装 |
B |
建材 |
C |
家装 |
D |
交通 |
E |
音乐 |
表2中的记账类目,可以构成第二记账类目目录。可以将该记账类目目录作为供大众使用的基础记账类目目录。
为满足个别用户的特殊需求,还可以为某一用户定制该用户使用的记账类目目录。例如,可以统计用户“1”在第一时间间隔内,统计类目更改标识中更改前类目为“家装”的标识总数目,例如为1000(即为第五总数量),其中更改后类目为“家具”的标识总数目为800(即为第六总数量)。
假设第二预设规则为:第五总数量大于或等于800,且第六总数量大于或等于600。则上述统计结果满足所述第二预设规则。则可以将商户C与记账类目“家装”这一对应关系更改为商户C与记账类目“家具”的对应关系。更改后的商户与记账类目之间的对应关系可以如表3所示。
表3
商户 |
记账类目 |
A |
服装 |
B |
建材 |
C |
家具 |
D |
交通 |
E |
音乐 |
表3中的记账类目,可以构成第三记账类目目录。可以将该记账类目目录作为仅供用户“1”使用的用户记账类目目录。
下面介绍本申请自动分类方法的实施例。
图3是本申请自动分类方法第一实施例的流程图。图3中示出了根据本申请类目目录确定方法第一实施例确定的类目目录进行自动分类的方法流程。所述自动分类方法可以包括:
S301:接收用户发来的资源处理记录。
可以接收用户发来的资源处理记录,所述资源处理记录中可以包括:用户ID、处理方信息、资源数量以及资源处理时间等信息。
S302:根据基础类目目录中的类目与所述处理方信息的第二对应关系,对所述资源处理记录进行分类并得到分类结果。
根据所述资源处理记录中包含的处理方信息,以及本申请类目目录确定方法第一实施例中的第二对应关系,可以对所述资源处理记录进行分配,得到分类结果。
S303:将所述分类结果反馈给用户。
上述公开的自动分类方法第一实施例与本申请类目目录确定方法第一实施例相对应,按照上述方法分类得到的结果可以提高分类结果的准确性,根据不断更新的类目目录进行分类可以使得分类结果更符合用户的分类需求。
图4是本申请自动分类方法第二实施例的流程图。图3中示出了根据本申请类目目录确定方法第二实施例确定的类目目录进行自动分类的方法流程。所述自动分类方法可以包括:
S401:接收用户发来的资源处理记录。
可以接收用户发来的资源处理记录,所述资源处理记录中可以包括:用户ID、处理方信息、资源数量以及资源处理时间等信息。
S402:查询所述用户是否存在对应的用户类目目录,若存在,根据所述用户类目目录中类目与所述处理方信息的第三对应关系,对所述资源处理记录进行分类并得到分类结果。
查询所述用户是否存在与该用户对应的用户类目目录,若存在,则优先根据所述用户类目目录中类目与所述处理方信息的第三对应关系对所述资源处理记录进行分类,得到分类结果。
S403:若所述用户没有对应的用户类目目录,根据基础类目目录中的类目与所述处理方信息的第二对应关系,对所述资源处理记录进行分类并得到分类结果。
若所述用户不存在与该用户对应的用户类目目录,则可以根据所述基础类目目录中的类目与所述处理方信息的第二对应关系,对所述资源处理记录进行分类,得到分类结果。
S404:将所述根据用户类目目录或基础类目目录进行分类得到的分类结果反馈给用户。
上述公开的自动分类方法第二实施例与本申请类目目录确定方法第二实施例相对应,按照上述方法分类得到的结果可以提高分类结果的准确性,根据与用户对应的用户类目目录进行分类,可以保证得到的分类结果更符合每个用户的分类需求。
下面介绍本申请类目目录确定装置实施例。
图5是本申请类目目录确定装置实施例的模块图。如图5所示,所述类目目录确定装置可以包括:第一类目目录单元501、类目更改标识单元502、第一时间间隔单元503、第一统计单元504和基础类目目录单元505。其中,
所述第一类目目录单元501,可以用于根据资源处理记录中的处理方信息、所述处理方信息与类目之间预设的第一对应关系,确定第一类目目录。
所述类目更改标识单元502,可以用于接收用户更改类目的消息,并生成包含类目更改内容的类目更改标识。
所述第一时间间隔单元503,可以用于确定与所述类目更改标识中的第一类目标识对应的统计起始时间,根据所述统计起始时间确定与所述第一类目标识对应的第一时间间隔。
所述第一统计单元504,可以用于对第一时间间隔内包含第一类目标识的类目更改标识进行统计,得到第一统计结果。
所述基础类目目录单元505,可以用于将所述第一统计结果满足第一预设规则的,更改包含第一对应关系的第一类目目录为包含第二对应关系的第二类目目录,并将所述第二类目设置为基础类目目录;若不满足,将所述第一类目目录设置为基础类目目录。
进一步地,所述类目目录确定装置还可以包括:第二统计单元506和用户类目目录单元507。其中,
所述第二统计单元506,可以用于对同一用户在第一时间间隔内包含第三类目标识的类目更改标识进行统计,得到第二统计结果。
所述用户类目目录单元507,可以用于将所述第二统计结果满足第二预设规则的,更改包含第二对应关系的第二类目目录为包含第三对应关系的第三类目目录,并将所述第三类目设置为用户类目目录。
上述公开的类目目录确定装置实施例与本申请类目目录确定方法实施例相对应,可以实现本申请类目目录确定方法,并达到类目目录确定方法的技术效果。
下面介绍本申请自动分类装置实施例。
图6是本申请自动分类装置实施例的模块图。如图6所示,所述自动分类装置可以包括:接收单元601、基础类目分类结果单元602和反馈单元603。其中,
所述接收单元601,可以用于接收用户发来的资源处理记录。
所述基础类目分类结果单元602,可以用于根据基础类目目录中的类目与所述处理方信息的第二对应关系,对所述资源处理记录进行分类并得到分类结果。
所述反馈单元603,可以用于将所述分类结果反馈给用户。
进一步地,所述自动分类装置还可以包括:用户类目分类结果单元604。
所述用户类目分类结果单元604,可以用于查询接收单元601中的所述用户是否存在对应的用户类目目录。若存在,根据所述用户类目目录中类目与所述处理方信息的第三对应关系,对所述资源处理记录进行分类并得到分类结果,并利用所述反馈单元603将所述分类结果反馈给用户。若不存在,进入所述基础类目分类结果单元602进行处理。
上述公开的自动分类装置实施例与本申请自动分类方法实施例相对应,可以实现本申请自动分类方法,并达到本申请自动分类方法的技术效果。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片2。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog2。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。该计算机软件产品可以包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。该计算机软件产品可以存储在内存中,内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括短暂电脑可读媒体(transitory media),如调制的数据信号和载波。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
虽然通过实施例描绘了本申请,本领域普通技术人员知道,本申请有许多变形和变化而不脱离本申请的精神,希望所附的权利要求包括这些变形和变化而不脱离本申请的精神。