一种处理用户操作信息的方法与设备
技术领域
本申请涉及,尤其涉及一种用于处理用户操作信息的技术。
背景技术
随着社会的发展和互联网的普及,越来越多的应用和网络平台出现在人们的生活中,其中,实现同一种功能或提供同一种服务的应用或平台往往有多个服务商在竞争,用户根据兴趣或者体验的不同会对某个应用或平台产生一定的使用粘度或是流失向竞争对手。因此,服务提供商分析用户在某个应用或平台中的操作信息,可以帮助了解用户的行为倾向,其中,用户具体的喜好或是流失原因,可以有针对性地对用户进行粘度提升或是挽回处理。
然而,现有技术受到基础数据的积累薄弱以及对多样化数据的处理能力底下的限制,多涉及对用户基本属性数据的分析,从而对用户进行粘度或是流失可能性的评估,而无法输出具体操作信息所对应的原因,从一定程度上削弱了对用户倾向的把控,同时无法有针对性的对应用或者平台服务进行提升。
发明内容
本申请的目的是提供一种处理用户操作信息的方法与设备。
根据本申请的一个方面,提供了一种用于处理用户操作信息的方法,其中,该方法包括:
获取待处理的用户动态操作信息;
通过在形态知识库进行查询,获取与所述用户动态操作信息相匹配的一个或多个候选形态信息;
根据所述候选形态信息确定对应用户的变动相关信息。
根据本申请的再一方面,还提供了一种用于处理用户操作信息的设备,其中,该设备包括:
第一装置,获取待处理的用户动态操作信息;
第二装置,通过在形态知识库进行查询,获取与所述用户动态操作信息相匹配的一个或多个候选形态信息;
第三装置,根据所述候选形态信息确定对应用户的变动相关信息。
与现有技术相比,本申请通过获取待处理的用户动态操作信息,并通过形态知识库获取与所述用户动态操作信息相匹配的候选形态信息,由此确定对应用户的变动相关信息,从而有针对性的对应用或者平台进行改进以及及时把握用户变动的具体原因,提升用户粘度挽回流失用户。进一步,本申请还可通过获取训练动态操作信息,并根据形态知识库对所述训练动态操作信息进行切片,将所述切片进行形态拟合与相关变动信息结合,更新所述形态知识库,从而使得形态知识库中的信息更加的精确和详细,帮助获得更准确的用户变动相关信息。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1示出根据本申请一个方面的一种用于处理用户操作信息的设备示意图;
图2示出根据本申请一个优选实施例的一种用于处理用户操作信息的设备示意图;
图3示出根据本申请另一个优选实施例的一种用于处理用户操作信息的设备中的第六装置的示意图;
图4示出根据本申请另一个优选实施例的一种用于处理用户操作信息的设备中动态操作信息的切片信息的示意图;
图5示出根据本申请另一个优选实施例的一种用于处理用户操作信息的设备中第六装置处理动态操作信息的切片信息的效果示意图;
图6示出根据本申请另一个优选实施例的一种用于处理用户操作信息的设备中第六装置处理动态操作信息的切片信息所对应的拟合形态的示意图;
图7示出根据本申请另一个方面的一种用于处理用户操作信息设备的方法流程图;
图8示出根据本申请一个优选实施例的一种用于处理用户操作信息的方法流程图;
图9示出根据本申请一个优选实施例的步骤S6流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本申请作进一步详细描述。
在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
图1示出根据本申请一个方面的一种用于处理用户操作信息的设备1的示意图。其中,所述设备1包括第一装置11、第二装置12和第三装置13。
其中,所述设备1的第一装置11获取待处理的用户动态操作信息;第二装置12通过在形态知识库进行查询,获取与所述用户动态操作信息相匹配的一个或多个候选形态信息;第三装置13根据所述候选形态信息确定对应用户的变动相关信息。
具体地,第一装置11获取待处理的用户动态操作信息。其中,用户动态操作信息包括用户在所使用的应用或者服务平台上所做的一些更新频率较高的操作信息,例如,用户在服务平台中浏览网页的记录,参加线上互动的频率,购买服务或者商品的交易流水数据等等。优选地,用户动态操作信息可以通过从后台数据库中调取用户使用日志等方式进行获取,其中,可以将单个自然客户或者单个自然客户与动态关键事件共同作为主键对用户动态操作信息进行存储,例如在商品交易平台中,数据结构可以是:客户ID、客户端地址、log等,或者是:客户ID、交易号、金额、交易时间、交易银行等。
本领域技术人员应能理解上述获取以及存储用户动态操作信息的方式仅为举例,其他现有的或今后可能出现的获取以及存储用户动态操作信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,第二装置12通过在形态知识库进行查询,获取与所述用户动态操作信息相匹配的一个或多个候选形态信息。
其中,形态知识库是一个以用户变动相关信息为主键,各项指标及形态为特征集(列)的数据库,例如,用户A对某个应用或服务平台的使用频率下降,有逐渐放弃使用的趋势,为了分析用户A的流失原因,需要对该用户A的动态操作信息进行分析,而形态知识库中存储了关于该应用或服务平台一些已知的用户流失的原因,其中,可以将具体原因如付款平台体验不好、用卡转移、对服务不满意等作为主键,将信用卡档期交易次数、用卡投诉量、历史交易变化趋势等作为特征集(列)进行存储。
通过在形态知识库进行查询,将已获取的用户动态操作信息与知识库中的相关信息进行比较和匹配,可以获得一个或多个候选形态信息。其中,候选形态信息是将已获取的用户动态操作信息与知识库中的相关信息进行比较和匹配后,在用户动态操作信息中的所标记的匹配信息。例如,在分析流失A用户的动态操作信息中,有b、c、d、e、f、d、h七段信息与形态知识库中所查询到的已知流失原因u、v、w的特征集中的信息相匹配,其中,b与u相匹配,c、d、e、f与v相匹配,d、h与w相匹配,则被标记后b、c、d、e、f、d、h及其相关特征信息即为候选形态信息。
其中,匹配的过程可以通过比较形态知识库中流失原因特征集之中的形态样本和用户动态操作信息中的形态,将其中差异度小于设定阈值的用户动态操作信息中的形态的相关信息标记为候选形态信息。具体地,对服务不满的用户流失原因,在形态知识库中所对应的历史交易额变化趋势的形态样本是账户余额随着时间的推移先平稳下降,再陡降至一个较低的额度,最后平稳趋于零。基于此,将该形态知识库中所对应的历史交易额变化趋势的形态刻画为一个以x0为形态中心点,r为形态半径的,h为形态区间高度的形态样本,在分析用户A流失原因时,会将A的用户动态操作信息中的所有形态与该历史交易额变化趋势的形态样本进行对比,寻找其中阈值小于(x0,r,h)的形态,并对符合条件的形态进行标记,记录符合条件形态的匹配位置、相似度以及与该历史交易额变化趋势的形态样本匹配的A的用户动态操作信息中符合条件形态的个数等候选形态信息。优选地,为了对用户动态操作信息进行均匀比较,避免短期内的集中的重复原因动态多次统计,可以对与形态知识库中形态样本匹配的动态操作信息中的连续的形态坐标每相距一定的距离再进行统计,例如两个相似匹配形态的坐标中心需要相距2R以上其,其中R为经验设定值。
本领域技术人员应能理解上述获取与所述用户动态操作信息相匹配的一个或多个候选形态信息的方式仅为举例,其他现有的或今后可能出现的获取与所述用户动态操作信息相匹配的一个或多个候选形态信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,第三装置13根据所述候选形态信息确定对应用户的变动相关信息。其中,用户的变动相关信息包括用户对应用或者服务平台使用频繁而产生一定的粘度或是逐渐弃用而产生流失所对应的喜好倾向程度、使用可能性倾向、具体地引发原因等与用户变动相关的信息。因为候选形态信息中包括符合条件候选形态的匹配位置、相似度以及匹配个数等,可以根据这些信息综合进行分析,。例如发现在流失用户A的动态操作信息中,有b、c、d、e、f、d、h七段候选形态信息,综合分析其特征,其中,c、d、e、f的特征基本相似,属于同一类的流失原因;d、h的特征基本相似,属于同一类的流失原因;b可能单独属于一种原因,综合分析情况,可结合已知流失原因信息进行匹配,可得这些候选形态信息与u、v、w这三种已知流失原因特征相匹配的,其中,b与u相匹配,c、d、e、f与v相匹配,d、h与w相匹配,则因为b原因存在的比例太小,A用户流失的最大原因可能是v,其次是w。通过确定对应用户的变动相关信息可以对用户的变动原因进行更准确的研究,从而对应用或服务平台的改进以及用户服务提升都有正向帮助。
本领域技术人员应能理解上述确定对应用户的变动相关信息的方式仅为举例,其他现有的或今后可能出现的确定对应用户的变动相关信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,可根据所述候选形态信息,以及对应用户的静态数据信息,确定对应用户的变动相关信息。其中,用户的静态数据信息为用户在所使用的应用或者服务平台上的所关联的一些变动频率相对较低的属性,如用户的性别,年龄,开通的业务等信息,用户的静态数据同样可以将单个自然用户作为主键进行存储,以商品交易平台为例可以存为如下数据结构,用户ID、性别、年龄、应用使用天数、是否开通水电缴费、是否开通信用卡支付、用户历史评级等。用户的静态数据可以在以候选形态为主要分析对象的情况下,对用户的变动相关信息的确定有协助作用。例如,在用户动态操作信息所反应的候选形态信息只得出该用户在经历一段高交易量后突然消失的原因可能是诈骗但也可能是对应用的某项服务不满,此时可以参考静态数据信息中的用户历史信用评级,若用户历史信用评级比较低可以有更大的把握确定该用户流失的原因是诈骗。结合静态数据信息确定对应用户的变动信息会更加精确,可以帮助服务提供商有针对性的改进应用或服务平台产品,并准确的对用户进行召回。
优选地,所述变动相关信息包括以下至少任一项:
用户流失原因信息;
用户流失可能性信息;
用户粘度信息。
其中,用户流失原因信息包括导致用户放弃或是逐步减少对应用或服务平台使用的各种因素,例如因为对服务不满导致逐渐弃用,因为交易平台用卡转移导致放弃使用,因为诈骗导致不用等等。用户流失可能性信息包括用户减少或放弃使用应用或服务平台的倾向程度,可以用分数将这种倾向表示出来。用户粘度信息包括该用户对所使用的应用或服务平台的满意原因以及喜爱程度的倾向等。上述变动相关信息与用户对应用或服务平台的选择关系密切,可以针对用户的习惯以及好恶给出更详细和明确的分析,从而帮助互联网服务提供商提升应用或服务平台的品质。
更优选地,所述变动相关信息包括用户流失原因信息;其中,所述根据所述候选形态信息确定对应用户的变动相关信息包括:根据所述候选形态信息及其在所述形态知识库中对应的流失原因信息,确定对应用户的变动相关信息。在此,在用户分析所得的候选形态信息覆盖的时间跨度比较大且数据量很大的情况下,可以将候选形态信息为单位,以监督学习的方法将用户流失原因归为形态知识库中已知的原因项,从而得出用户变动相关信息。具体地,在形态知识库是一个以用户变动相关信息为主键,各项指标及形态为特征集(列)的数据库,基于对用户操作信息和形态知识库匹配后所标记的候选形态信息,可以综合所有候选形态信息如符合条件形态的匹配位置、相似度以及匹配个数等对用户的变动相关信息进行分析。例如,接上文的举例分析A用户的流失原因,在A用户的动态操作信息中,有b、c、d、e、f、d、h七段信息与形态知识库中所查询到的已知流失原因u、v、w的特征集中的信息相匹配,其中,b与u相匹配,c、d、e、f与v相匹配,d、h与w相匹配,则因为b原因存在的比例太小,A用户流失的最大原因可能是v,其次是w。由此,结合形态知识库中的已有用户变动相关信息,可以基于用户动态操作信息中的候选形态信息,快速给出某个自然用户的变动原因,提升系统的效率,增强系统的自动性。
本领域技术人员应能理解上述结合形态知识库确定对应用户的变动相关信息的方式仅为举例,其他现有的或今后可能出现的结合形态知识库确定对应用户的变动相关信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
图2示出根据本申请一个优选实施例的一种用于处理用户操作信息的设备1的示意图。其中所述设备1包括第一装置11、第二装置12、第三装置13、第四装置14、第五装置15、第六装置16和第七装置17。
其中,所述设备1的第一装置11获取待处理的用户动态操作信息;第二装置12通过在形态知识库进行查询,获取与所述用户动态操作信息相匹配的一个或多个候选形态信息;第三装置13根据所述候选形态信息确定对应用户的变动相关信息;第四装置14获取一个或多个训练动态操作信息;第五装置15根据所述形态知识库从所述训练动态操作信息截取一个或多个操作切片信息;第六装置16对对应于相关变动信息的所述操作切片信息进行形态拟合处理,以获得与所述相关变动信息相对应的拟合形态信息;第七装置17根据所述拟合形态信息与所述相关变动信息的映射关系,更新所述形态知识库。
具体地,设备1的第一装置11、第二装置12和第三装置13与图1中的相同或相似,在此不再赘述。
第四装置14获取一个或多个训练动态操作信息。其中,训练动态操作信息包括了已知和未知原因的一些用户动态操作信息,可以帮助形态知识库中的流失原因特征集之中的形态样本等特征更加精确和贴合实际。例如,训练动态操作信息中包含用户对于使用某个应用或服务平台的已知流失原因b,通过获取这一训练动态操作信息并对其进行一定的处理,可以使得形态知识库中b流失原因对应的形态样本有一定程度上的修正,通过若干包括流失原因b的训练动态操作信息的修正,可以及时得到准确的形态样本。训练动态操作信息与用户动态操作信息类似,可以通过从后台数据库中调取用户使用日志等方式进行获取,在实际应用时可以跟用户动态操作信息同源,使得每次确定用户变动相关信息之前或之后对形态知识库进行修正,从而使得形态知识库在大量修正和补充的情况下更加全面和准确。
本领域技术人员应能理解上述获取训练动态操作信息的方式仅为举例,其他现有的或今后可能出现的获取训练动态操作信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
第五装置15根据所述形态知识库从所述训练动态操作信息截取一个或多个操作切片信息。
其中,操作切片信息属于由所述训练动态操作信息中分离出来的一部分信息片段,一般情况下,每个操作切片信息中包含一个对变动相关信息,例如,操作切片信息1、2、3、4中包含了用户A的流失原因f,操作切片信息5、6中包含了用户A的流失原因b。对应同一变动相关信息的操作切片信息在形态上有相似之处,接上例,所截取的操作切片信息1、2、3、4如图4所示,所述原因f相关的操作切片信息中的账户余额随着时间的变化趋势均为一开始变化平缓,经历陡降后又逐渐趋于一个较低的平缓期。可以通过比较形态知识库中已有的用户变动相关信息所对应的特征集中的样本形态,通过与上文获取候选形态信息相似的匹配方法对训练动态信息中的操作切片信息进行匹配,在匹配成功后,将成功匹配的信息进行截取,例如复制该信息并存储,从而形成操作切片信息。通过截取操作切片信息,可以更集中地对所述操作切片信息对应的用户变动相关信息进行分析处理,从而更快和准确地得出或修正用户变动相关信息。
优选地,所述训练动态操作信息包括切片标记信息;
其中,所述根据所述形态知识库从所述训练动态操作信息截取一个或多个操作切片信息还包括:
根据所述切片标记信息从所述训练动态操作信息截取一个或多个操作切片信息。
通过与上文获取候选形态信息相似的匹配方法对训练动态信息中的操作切片信息进行匹配,在匹配成功后可对对应的匹配位置进行标记,或是直接在数据中通过人工标记等方式对训练动态操作信息进标记,读取训练动态操作信息中的标记,可对标记所在信息进行复制并存储,从而完成对操作切片信息的截取。例如,训练动态操作信息被存储为一个以单个自然用户为主键的单表,可以将其中与未知流失原因n相关的信息项读取为关键词,如记录“信用卡还款次数”为关键词,将用户一定时间内所有的信用卡还款次数都进行读取和存储,并统一存储在目录n下。若训练动态操作信息为一个长的日志信息,可将其中与未知流失原因n相关的起始和结尾处分别标记start_f和end_f,在处理训练动态操作信息时,对动态操作信息进行扫描,将有start_f和end_f标记的信息都复制并统一存储在目录f下。
更优选地,所述切片标记信息对应于所述训练动态操作信息中新增加的变动信息。
因为新增加的用户相关变动信息在形态知识库中没有记录,所以无法通过对应的特征集中的样本形态对训练动态操作信息进行匹配的方法进行切片标记信息的截取。因此,新增加的变动信息只能通过第三方例如人工等半监督的方式对训练动态操作信息进行标记,从而便于对训练动态操作信息进行截取。例如,训练动态操作信息中包含的是某个未知的原因n,通过获取这一训练动态操作信息并将其中与原因n相关的信息进行标记,可以获取与原因n相关的操作切片信息,从而使得使得形态知识库补充新的流失原因n,从而可以对后续的用户分析产生借鉴作用。
本领域技术人员应能理解上述标记训练动态操作信息和截取操作切片信息的方式仅为举例,其他现有的或今后可能出现的标记训练动态操作信息和截取操作切片信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
第六装置16对对应于相关变动信息的所述操作切片信息进行形态拟合处理,以获得与所述相关变动信息相对应的拟合形态信息。因为相同用户变动信息所对应的操作切片信息具有共同的特征,所以可以通过拟合将这些共同特征进行提取。接上文举例,包含了用户A的流失原因f的操作切片信息1、2、3、4对应的特征形态中的账户余额随着时间的变化趋势具有共同变化特征,若拟合出一个一开始变化平缓,经历陡降后又逐渐趋于一个较低的平缓期的形态,则该形态就是流失原因f所对应的拟合形态信息。在所述操作切片信息不复杂等情况下,可以对其进行平均操作从而得出拟合的形态信息,这种方法所得的拟合形态信息准确度欠佳,因此可以将所述操作切片信息变换为矩阵或按点进行逐点的对齐和更新处理,在此基础上再进行平均操作从而得出更加精确的拟合形态信息。得到拟合形态信息可以在处理新的用户动态操作信息时,在进行候选形态信息进行匹配和记录时提供准确的参考,从而更快更准确的找出用户的变动相关信息。
本领域技术人员应能理解上述对对应于相关变动信息的所述操作切片信息进行形态拟合处理的方式仅为举例,其他现有的或今后可能出现的对对应于相关变动信息的所述操作切片信息进行形态拟合处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
第七装置17根据所述拟合形态信息与所述相关变动信息的映射关系,更新所述形态知识库。根据不同的用户变动相关信息所对应的操作切片信息进行分别拟合,所拟合的形态信息综合了所述操作切片信息的共有特征,而所述操作切片信息都是对应同一个用户变动信息,因此可以将拟合形态信息以及所对应的用户变动信息纳入形态知识库,若用户变动信息是形态知识库中已知的,则结合已有的对应特征样本形态以及新的拟合形态信息进行修正更新,若用户变动信息是未知的,则将其纳入形态知识库中。例如,未知流失原因n所对应的拟合形态信息可以直接补充进形态知识库,记录为形态N1,在第二次有流失原因n对应的拟合形态信息N2出现时,可以将N1和N2一起进行拟合修正,从而使得流失原因n所对应的拟合形态信息更加的准确。
本领域技术人员应能理解上述更新所述形态知识库的方式仅为举例,其他现有的或今后可能出现的更新所述形态知识库的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
图3示出根据本申请另一个优选实施例的一种用于处理用户操作信息的设备1中的第六装置16的示意图。其中,所述第六装置16包括第一单元161、第二单元162和第三单元163。
其中,第一单元161对对应于相关变动信息的所述操作切片信息进行两两最优匹配处理;第二单元162根据所述操作切片信息中的两两最优匹配信息,以及所述操作切片信息中的其他操作切片信息,更新所述操作切片信息中的每一个操作切片信息;第三单元163根据更新后的每一个操作切片信息确定与所述相关变动信息相对应的拟合形态信息。
第一单元161对对应于相关变动信息的所述操作切片信息进行两两最优匹配处理。接上文举例,如图4所示操作切片信息1、2、3、4中包含了用户A的流失原因f,同时所述操作切片信息具有相似的变化趋势,即账户余额随着时间的变化趋势均为一开始变化平缓,经历陡降后又逐渐趋于一个较低的平缓期,但若在拟合时对其直接进行平均操作,所得的拟合形态信息准确度欠佳会导致所得的拟合形态信息部分失真。这些操作切片信息由于发生时间的差异导致放在一个坐标图中时的形态有错位,此时将其对应同一个时间的各点进行平均,会导致变化趋势被弱化,可以将图4中操作切片信息1、2、3、4的位置进行移动,比如将陡降的起始和结束点标注出来,并将中间陡降的这一段的中心点对齐,使得四个图形各点映射的特征对齐,此时会使得拟合的效果更佳。
优选地,所述对对应于相关变动信息的所述操作切片信息进行两两最优匹配处理包括:对于对应于相关变动信息的所述操作切片信息中的任意两个操作切片信息,通过执行反向动态滑动时间窗,获得所述两个操作切片信息在不同动态滑动时间窗下的多个候选匹配信息。根据所述多个候选匹配信息,确定所述两个操作切片信息所对应的两两最优匹配信息。其中,动态滑动时间窗可以比较形态之间的相似性,反向动态滑动时间窗则可以通过移动操作切片信息对应形态在坐标轴上的位置使得形态之间变得相似,即得出在同一坐标中使得形态相似的最佳位置。在坐标轴中实施反向滑动时间窗后,每个操作切片信息对应形态中的点在对应另一个形态中都会得出一个或者多个对齐的点,即与这点连接对齐可得到使得形态相似的最佳位置,接上文举例,如图4对其中切片操作信息形态1和2执行反向动态滑动时间窗,形态1中的点h在形态2中有对应的点h1、h2、h3,形态2中的h1则只对应形态1中的h,h2和h3也对应h。
接着,第二单元162根据所述操作切片信息中的两两最优匹配信息,以及所述操作切片信息中的其他操作切片信息,更新所述操作切片信息中的每一个操作切片信息。假设某个用户变动相关信息所对应的所有操作切片信息为N,在得到某个操作切片信息相对其他所有N-1操作切片信息的两两最佳匹配位置之后,可通过设置的更新公式,对中每两两对齐点进行更新计算,从而分别得出N-1个更新形态,并对N-1个更新形态进行平均操作,得出一个新的操作切片信息,重复上述操作,就可得所剩N-1个新的操作切片信息。接上文举例,形态1所对应的用户变动信息共有4条形态分别为形态1、2、3、4,假设形态1的h点在坐标中的值为2.5,对应的h1为5,带入更新公式为h*(1-x)+h1*x=2.857,x的值根据经验进行设置,这里设为0.15,如此对所有形态1和2中对齐的对应两点都进行这样的操作后会得到一个新的形态1,相应的对形态1所两两对应的剩下的3个形态也分别做同样的操作,从而得到3条新的形态1,对3个新的形态1进行对位平均操作得出最终的形态1,对形态2至形态4重复上述操作,得到所有更新过的4个如图5所示的形态,更新后的四个形态会更加相似和接近,位置也最大程度地对齐,从而可以帮助得到更精确的拟合形态。
本领域技术人员应能理解更新所述操作切片信息中的每一个操作切片信息的方式仅为举例,其他现有的或今后可能出现的更新所述操作切片信息中的每一个操作切片信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着第三单元163根据更新后的每一个操作切片信息确定与所述相关变动信息相对应的拟合形态信息。接上文举例,在所有操作切片信息都更新过后,可以对如图5中的所有4个操作切片信息进行传统的对位平均等操作,从而获得如图6所示的拟合形态信息,从而完善形态知识库帮助更快更准确的找出用户的变动相关信息。
本领域技术人员应能理解上述确定拟合形态信息的方式仅为举例,其他现有的或今后可能出现的确定拟合形态信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
图7示出根据本申请另一个方面的一种用于处理用户操作信息设备的方法流程图。
其中,在步骤S1中设备1获取待处理的用户动态操作信息;在步骤S2中设备1通过在形态知识库进行查询,获取与所述用户动态操作信息相匹配的一个或多个候选形态信息;在步骤S3中设备1根据所述候选形态信息确定对应用户的变动相关信息。
具体地,在步骤S1中设备1获取待处理的用户动态操作信息。其中,用户动态操作信息包括用户在所使用的应用或者服务平台上所做的一些更新频率较高的操作信息,例如,用户在服务平台中浏览网页的记录,参加线上互动的频率,购买服务或者商品的交易流水数据等等。优选地,用户动态操作信息可以通过从后台数据库中调取用户使用日志等方式进行获取,其中,可以将单个自然客户或者单个自然客户与动态关键事件共同作为主键对用户动态操作信息进行存储,例如在商品交易平台中,数据结构可以是:客户ID、客户端地址、log等,或者是:客户ID、交易号、金额、交易时间、交易银行等。
本领域技术人员应能理解上述获取以及存储用户动态操作信息的方式仅为举例,其他现有的或今后可能出现的获取以及存储用户动态操作信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,在步骤S2中设备1通过在形态知识库进行查询,获取与所述用户动态操作信息相匹配的一个或多个候选形态信息。
其中,形态知识库是一个以用户变动相关信息为主键,各项指标及形态为特征集(列)的数据库,例如,用户A对某个应用或服务平台的使用频率下降,有逐渐放弃使用的趋势,为了分析用户A的流失原因,需要对该用户A的动态操作信息进行分析,而形态知识库中存储了关于该应用或服务平台一些已知的用户流失的原因,其中,可以将具体原因如付款平台体验不好、用卡转移、对服务不满意等作为主键,将信用卡档期交易次数、用卡投诉量、历史交易变化趋势等作为特征集(列)进行存储。
通过在形态知识库进行查询,将已获取的用户动态操作信息与知识库中的相关信息进行比较和匹配,可以获得一个或多个候选形态信息。其中,候选形态信息是将已获取的用户动态操作信息与知识库中的相关信息进行比较和匹配后,在用户动态操作信息中的所标记的匹配信息。例如,在分析流失A用户的动态操作信息中,有b、c、d、e、f、d、h七段信息与形态知识库中所查询到的已知流失原因u、v、w的特征集中的信息相匹配,其中,b与u相匹配,c、d、e、f与v相匹配,d、h与w相匹配,则被标记后b、c、d、e、f、d、h及其相关特征信息即为候选形态信息。
其中,匹配的过程可以通过比较形态知识库中流失原因特征集之中的形态样本和用户动态操作信息中的形态,将其中差异度小于设定阈值的用户动态操作信息中的形态的相关信息标记为候选形态信息。具体地,对服务不满的用户流失原因,在形态知识库中所对应的历史交易额变化趋势的形态样本是账户余额随着时间的推移先平稳下降,再陡降至一个较低的额度,最后平稳趋于零。基于此,将该形态知识库中所对应的历史交易额变化趋势的形态刻画为一个以x0为形态中心点,r为形态半径的,h为形态区间高度的形态样本,在分析用户A流失原因时,会将A的用户动态操作信息中的所有形态与该历史交易额变化趋势的形态样本进行对比,寻找其中阈值小于(x0,r,h)的形态,并对符合条件的形态进行标记,记录符合条件形态的匹配位置、相似度以及与该历史交易额变化趋势的形态样本匹配的A的用户动态操作信息中符合条件形态的个数等候选形态信息。优选地,为了对用户动态操作信息进行均匀比较,避免短期内的集中的重复原因动态多次统计,可以对与形态知识库中形态样本匹配的动态操作信息中的连续的形态坐标每相距一定的距离再进行统计,例如两个相似匹配形态的坐标中心需要相距2R以上其,其中R为经验设定值。
本领域技术人员应能理解上述获取与所述用户动态操作信息相匹配的一个或多个候选形态信息的方式仅为举例,其他现有的或今后可能出现的获取与所述用户动态操作信息相匹配的一个或多个候选形态信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,在步骤S3中设备1根据所述候选形态信息确定对应用户的变动相关信息。其中,用户的变动相关信息包括用户对应用或者服务平台使用频繁而产生一定的粘度或是逐渐弃用而产生流失所对应的喜好倾向程度、使用可能性倾向、具体地引发原因等与用户变动相关的信息。因为候选形态信息中包括符合条件候选形态的匹配位置、相似度以及匹配个数等,可以根据这些信息综合进行分析,。例如发现在流失用户A的动态操作信息中,有b、c、d、e、f、d、h七段候选形态信息,综合分析其特征,其中,c、d、e、f的特征基本相似,属于同一类的流失原因;d、h的特征基本相似,属于同一类的流失原因;b可能单独属于一种原因,综合分析情况,可结合已知流失原因信息进行匹配,可得这些候选形态信息与u、v、w这三种已知流失原因特征相匹配的,其中,b与u相匹配,c、d、e、f与v相匹配,d、h与w相匹配,则因为b原因存在的比例太小,A用户流失的最大原因可能是v,其次是w。通过确定对应用户的变动相关信息可以对用户的变动原因进行更准确的研究,从而对应用或服务平台的改进以及用户服务提升都有正向帮助。
本领域技术人员应能理解上述确定对应用户的变动相关信息的方式仅为举例,其他现有的或今后可能出现的确定对应用户的变动相关信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,可根据所述候选形态信息,以及对应用户的静态数据信息,确定对应用户的变动相关信息。其中,用户的静态数据信息为用户在所使用的应用或者服务平台上的所关联的一些变动频率相对较低的属性,如用户的性别,年龄,开通的业务等信息,用户的静态数据同样可以将单个自然用户作为主键进行存储,以商品交易平台为例可以存为如下数据结构,用户ID、性别、年龄、应用使用天数、是否开通水电缴费、是否开通信用卡支付、用户历史评级等。用户的静态数据可以在以候选形态为主要分析对象的情况下,对用户的变动相关信息的确定有协助作用。例如,在用户动态操作信息所反应的候选形态信息只得出该用户在经历一段高交易量后突然消失的原因可能是诈骗但也可能是对应用的某项服务不满,此时可以参考静态数据信息中的用户历史信用评级,若用户历史信用评级比较低可以有更大的把握确定该用户流失的原因是诈骗。结合静态数据信息确定对应用户的变动信息会更加精确,可以帮助服务提供商有针对性的改进应用或服务平台产品,并准确的对用户进行召回。
优选地,所述变动相关信息包括以下至少任一项:
用户流失原因信息;
用户流失可能性信息;
用户粘度信息。
其中,用户流失原因信息包括导致用户放弃或是逐步减少对应用或服务平台使用的各种因素,例如因为对服务不满导致逐渐弃用,因为交易平台用卡转移导致放弃使用,因为诈骗导致不用等等。用户流失可能性信息包括用户减少或放弃使用应用或服务平台的倾向程度,可以用分数将这种倾向表示出来。用户粘度信息包括该用户对所使用的应用或服务平台的满意原因以及喜爱程度的倾向等。上述变动相关信息与用户对应用或服务平台的选择关系密切,可以针对用户的习惯以及好恶给出更详细和明确的分析,从而帮助互联网服务提供商提升应用或服务平台的品质。
更优选地,所述变动相关信息包括用户流失原因信息;其中,所述根据所述候选形态信息确定对应用户的变动相关信息包括:根据所述候选形态信息及其在所述形态知识库中对应的流失原因信息,确定对应用户的变动相关信息。在此,在用户分析所得的候选形态信息覆盖的时间跨度比较大且数据量很大的情况下,可以将候选形态信息为单位,以监督学习的方法将用户流失原因归为形态知识库中已知的原因项,从而得出用户变动相关信息。具体地,在形态知识库是一个以用户变动相关信息为主键,各项指标及形态为特征集(列)的数据库,基于对用户操作信息和形态知识库匹配后所标记的候选形态信息,可以综合所有候选形态信息如符合条件形态的匹配位置、相似度以及匹配个数等对用户的变动相关信息进行分析。例如,接上文的举例分析A用户的流失原因,在A用户的动态操作信息中,有b、c、d、e、f、d、h七段信息与形态知识库中所查询到的已知流失原因u、v、w的特征集中的信息相匹配,其中,b与u相匹配,c、d、e、f与v相匹配,d、h与w相匹配,则因为b原因存在的比例太小,A用户流失的最大原因可能是v,其次是w。由此,结合形态知识库中的已有用户变动相关信息,可以基于用户动态操作信息中的候选形态信息,快速给出某个自然用户的变动原因,提升系统的效率,增强系统的自动性。
本领域技术人员应能理解上述结合形态知识库确定对应用户的变动相关信息的方式仅为举例,其他现有的或今后可能出现的结合形态知识库确定对应用户的变动相关信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
图8示出根据本申请一个优选实施例的一种用于处理用户操作信息的方法流程图。
其中,在步骤S1中设备1获取待处理的用户动态操作信息;在步骤S2中设备1通过在形态知识库进行查询,获取与所述用户动态操作信息相匹配的一个或多个候选形态信息;在步骤S3中设备1根据所述候选形态信息确定对应用户的变动相关信息;在步骤S4中设备1获取一个或多个训练动态操作信息;在步骤S5中设备1根据所述形态知识库从所述训练动态操作信息截取一个或多个操作切片信息;在步骤S6中设备1对对应于相关变动信息的所述操作切片信息进行形态拟合处理,以获得与所述相关变动信息相对应的拟合形态信息;在步骤S7中设备1根据所述拟合形态信息与所述相关变动信息的映射关系,更新所述形态知识库。
具体地,步骤S1、步骤S2和步骤S3与图7中的相同或相似,在此不再赘述。
在步骤S4中设备1获取一个或多个训练动态操作信息。其中,训练动态操作信息包括了已知和未知原因的一些用户动态操作信息,可以帮助形态知识库中的流失原因特征集之中的形态样本等特征更加精确和贴合实际。例如,训练动态操作信息中包含用户对于使用某个应用或服务平台的已知流失原因b,通过获取这一训练动态操作信息并对其进行一定的处理,可以使得形态知识库中b流失原因对应的形态样本有一定程度上的修正,通过若干包括流失原因b的训练动态操作信息的修正,可以及时得到准确的形态样本。训练动态操作信息与用户动态操作信息类似,可以通过从后台数据库中调取用户使用日志等方式进行获取,在实际应用时可以跟用户动态操作信息同源,使得每次确定用户变动相关信息之前或之后对形态知识库进行修正,从而使得形态知识库在大量修正和补充的情况下更加全面和准确。
本领域技术人员应能理解上述获取训练动态操作信息的方式仅为举例,其他现有的或今后可能出现的获取训练动态操作信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤S5中设备1根据所述形态知识库从所述训练动态操作信息截取一个或多个操作切片信息。
其中,操作切片信息属于由所述训练动态操作信息中分离出来的一部分信息片段,一般情况下,每个操作切片信息中包含一个对变动相关信息,例如,操作切片信息1、2、3、4中包含了用户A的流失原因f,操作切片信息5、6中包含了用户A的流失原因b。对应同一变动相关信息的操作切片信息在形态上有相似之处,接上例,所截取的操作切片信息1、2、3、4如图4所示,所述原因f相关的操作切片信息中的账户余额随着时间的变化趋势均为一开始变化平缓,经历陡降后又逐渐趋于一个较低的平缓期。可以通过比较形态知识库中已有的用户变动相关信息所对应的特征集中的样本形态,通过与上文获取候选形态信息相似的匹配方法对训练动态信息中的操作切片信息进行匹配,在匹配成功后,将成功匹配的信息进行截取,例如复制该信息并存储,从而形成操作切片信息。通过截取操作切片信息,可以更集中地对所述操作切片信息对应的用户变动相关信息进行分析处理,从而更快和准确地得出或修正用户变动相关信息。
优选地,所述训练动态操作信息包括切片标记信息;
其中,所述根据所述形态知识库从所述训练动态操作信息截取一个或多个操作切片信息还包括:
根据所述切片标记信息从所述训练动态操作信息截取一个或多个操作切片信息。
通过与上文获取候选形态信息相似的匹配方法对训练动态信息中的操作切片信息进行匹配,在匹配成功后可对对应的匹配位置进行标记,或是直接在数据中通过人工标记等方式对训练动态操作信息进标记,读取训练动态操作信息中的标记,可对标记所在信息进行复制并存储,从而完成对操作切片信息的截取。例如,训练动态操作信息被存储为一个以单个自然用户为主键的单表,可以将其中与未知流失原因n相关的信息项读取为关键词,如记录“信用卡还款次数”为关键词,将用户一定时间内所有的信用卡还款次数都进行读取和存储,并统一存储在目录n下。若训练动态操作信息为一个长的日志信息,可将其中与未知流失原因n相关的起始和结尾处分别标记start_f和end_f,在处理训练动态操作信息时,对动态操作信息进行扫描,将有start_f和end_f标记的信息都复制并统一存储在目录f下。
更优选地,所述切片标记信息对应于所述训练动态操作信息中新增加的变动信息。
因为新增加的用户相关变动信息在形态知识库中没有记录,所以无法通过对应的特征集中的样本形态对训练动态操作信息进行匹配的方法进行切片标记信息的截取。因此,新增加的变动信息只能通过第三方例如人工等半监督的方式对训练动态操作信息进行标记,从而便于对训练动态操作信息进行截取。例如,训练动态操作信息中包含的是某个未知的原因n,通过获取这一训练动态操作信息并将其中与原因n相关的信息进行标记,可以获取与原因n相关的操作切片信息,从而使得使得形态知识库补充新的流失原因n,从而可以对后续的用户分析产生借鉴作用。
本领域技术人员应能理解上述标记训练动态操作信息和截取操作切片信息的方式仅为举例,其他现有的或今后可能出现的标记训练动态操作信息和截取操作切片信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤S6中设备1对对应于相关变动信息的所述操作切片信息进行形态拟合处理,以获得与所述相关变动信息相对应的拟合形态信息。因为相同用户变动信息所对应的操作切片信息具有共同的特征,所以可以通过拟合将这些共同特征进行提取。接上文举例,包含了用户A的流失原因f的操作切片信息1、2、3、4对应的特征形态中的账户余额随着时间的变化趋势具有共同变化特征,若拟合出一个一开始变化平缓,经历陡降后又逐渐趋于一个较低的平缓期的形态,则该形态就是流失原因f所对应的拟合形态信息。在所述操作切片信息不复杂等情况下,可以对其进行平均操作从而得出拟合的形态信息,这种方法所得的拟合形态信息准确度欠佳,因此可以将所述操作切片信息变换为矩阵或按点进行逐点的对齐和更新处理,在此基础上再进行平均操作从而得出更加精确的拟合形态信息。得到拟合形态信息可以在处理新的用户动态操作信息时,在进行候选形态信息进行匹配和记录时提供准确的参考,从而更快更准确的找出用户的变动相关信息。
本领域技术人员应能理解上述对对应于相关变动信息的所述操作切片信息进行形态拟合处理的方式仅为举例,其他现有的或今后可能出现的对对应于相关变动信息的所述操作切片信息进行形态拟合处理的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤S7中设备1根据所述拟合形态信息与所述相关变动信息的映射关系,更新所述形态知识库。根据不同的用户变动相关信息所对应的操作切片信息进行分别拟合,所拟合的形态信息综合了所述操作切片信息的共有特征,而所述操作切片信息都是对应同一个用户变动信息,因此可以将拟合形态信息以及所对应的用户变动信息纳入形态知识库,若用户变动信息是形态知识库中已知的,则结合已有的对应特征样本形态以及新的拟合形态信息进行修正更新,若用户变动信息是未知的,则将其纳入形态知识库中。例如,未知流失原因n所对应的拟合形态信息可以直接补充进形态知识库,记录为形态N1,在第二次有流失原因n对应的拟合形态信息N2出现时,可以将N1和N2一起进行拟合修正,从而使得流失原因n所对应的拟合形态信息更加的准确。
本领域技术人员应能理解上述更新所述形态知识库的方式仅为举例,其他现有的或今后可能出现的更新所述形态知识库的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
图9示出根据本申请一个优选实施例的步骤S6流程图。
其中,在步骤S61中设备1对对应于相关变动信息的所述操作切片信息进行两两最优匹配处理;在步骤S62中设备1根据所述操作切片信息中的两两最优匹配信息,以及所述操作切片信息中的其他操作切片信息,更新所述操作切片信息中的每一个操作切片信息;在步骤S63中设备1根据更新后的每一个操作切片信息确定与所述相关变动信息相对应的拟合形态信息。
在步骤S61中设备1对对应于相关变动信息的所述操作切片信息进行两两最优匹配处理。接上文举例,如图4所示操作切片信息1、2、3、4中包含了用户A的流失原因f,同时所述操作切片信息具有相似的变化趋势,即账户余额随着时间的变化趋势均为一开始变化平缓,经历陡降后又逐渐趋于一个较低的平缓期,但若在拟合时对其直接进行平均操作,所得的拟合形态信息准确度欠佳会导致所得的拟合形态信息部分失真。这些操作切片信息由于发生时间的差异导致放在一个坐标图中时的形态有错位,此时将其对应同一个时间的各点进行平均,会导致变化趋势被弱化,可以将图4中操作切片信息1、2、3、4的位置进行移动,比如将陡降的起始和结束点标注出来,并将中间陡降的这一段的中心点对齐,使得四个图形各点映射的特征对齐,此时会使得拟合的效果更佳。
优选地,所述对对应于相关变动信息的所述操作切片信息进行两两最优匹配处理包括:对于对应于相关变动信息的所述操作切片信息中的任意两个操作切片信息,通过执行反向动态滑动时间窗,获得所述两个操作切片信息在不同动态滑动时间窗下的多个候选匹配信息。根据所述多个候选匹配信息,确定所述两个操作切片信息所对应的两两最优匹配信息。其中,动态滑动时间窗可以比较形态之间的相似性,反向动态滑动时间窗则可以通过移动操作切片信息对应形态在坐标轴上的位置使得形态之间变得相似,即得出在同一坐标中使得形态相似的最佳位置。在坐标轴中实施反向滑动时间窗后,每个操作切片信息对应形态中的点在对应另一个形态中都会得出一个或者多个对齐的点,即与这点连接对齐可得到使得形态相似的最佳位置,接上文举例,如图4对其中切片操作信息形态1和2执行反向动态滑动时间窗,形态1中的点h在形态2中有对应的点h1、h2、h3,形态2中的h1则只对应形态1中的h,h2和h3也对应h。
接着,在步骤S62中设备1根据所述操作切片信息中的两两最优匹配信息,以及所述操作切片信息中的其他操作切片信息,更新所述操作切片信息中的每一个操作切片信息。假设某个用户变动相关信息所对应的所有操作切片信息为N,在得到某个操作切片信息相对其他所有N-1操作切片信息的两两最佳匹配位置之后,可通过设置的更新公式,对中每两两对齐点进行更新计算,从而分别得出N-1个更新形态,并对N-1个更新形态进行平均操作,得出一个新的操作切片信息,重复上述操作,就可得所剩N-1个新的操作切片信息。接上文举例,形态1所对应的用户变动信息共有4条形态分别为形态1、2、3、4,假设形态1的h点在坐标中的值为2.5,对应的h1为5,带入更新公式为h*(1-x)+h1*x=2.857,x的值根据经验进行设置,这里设为0.15,如此对所有形态1和2中对齐的对应两点都进行这样的操作后会得到一个新的形态1,相应的对形态1所两两对应的剩下的3个形态也分别做同样的操作,从而得到3条新的形态1,对3个新的形态1进行对位平均操作得出最终的形态1,对形态2至形态4重复上述操作,得到所有更新过的4个如图5所示的形态,更新后的四个形态会更加相似和接近,位置也最大程度地对齐,从而可以帮助得到更精确的拟合形态。
本领域技术人员应能理解更新所述操作切片信息中的每一个操作切片信息的方式仅为举例,其他现有的或今后可能出现的更新所述操作切片信息中的每一个操作切片信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,在步骤S63中设备1根据更新后的每一个操作切片信息确定与所述相关变动信息相对应的拟合形态信息。接上文举例,在所有操作切片信息都更新过后,可以对如图5中的所有4个操作切片信息进行传统的对位平均等操作,从而获得如图6所示的拟合形态信息,从而完善形态知识库帮助更快更准确的找出用户的变动相关信息。
本领域技术人员应能理解上述确定拟合形态信息的方式仅为举例,其他现有的或今后可能出现的确定拟合形态信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。