WO2021068681A1

WO2021068681A1 - 标签分析方法、装置及计算机可读存储介质

Info

Publication number: WO2021068681A1
Application number: PCT/CN2020/112333
Authority: WO
Inventors: 付昌林; 罗滢川; 陈少梅; 肖良清; 石文富
Original assignee: 平安科技（深圳）有限公司
Priority date: 2019-10-12
Filing date: 2020-08-30
Publication date: 2021-04-15
Also published as: CN110889045B; CN110889045A

Abstract

一种基于用户行为的标签分析方法，包括：接收预先构建的标签集，采集用户的原始交互数据集，将所述原始交互数据集进行预处理得到标准交互数据集(S1)；根据所述标准交互数据集与所述标签集建立用户的标签关系(S2)；根据所述标签关系与预先构建的用户标签模型进行相似度计算得到相似度集合(S3)；根据所述相似度集合计算所述标签关系中的标签得分，并根据所述标签得分进行标签排序得到标签排序集(S4)；根据预设标签个数从所述标签排序集中选择标签得到所述用户的标签分析结果，并输出所述标签分析结果(S5)。还提出一种基于用户行为的标签分析装置以及一种计算机可读存储介质。可以实现快速的基于用户行为的标签分析功能。

Description

标签分析方法、装置及计算机可读存储介质

本申请要求于2019年10月12日提交中国专利局、申请号为201910975812.0、发明名称为“标签分析方法、装置及计算机可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术领域，尤其涉及一种基于用户行为的标签分析方法、装置及计算机可读存储介质。

背景技术

基于用户行为的标签分析作为一种提供决策支持的技术工具，己经应用到社会的各个方面，在很多重要的行业，例如零售、金融和电信等行业，基于用户行为的标签分析都有所应用。发明人意识到，目前主流的基于用户行为的标签分析主要基于协同过滤推荐算法，虽然对于用户标签的分析比较准确，但是由于计算强度大、数据采集众多，所以浪费了大量的计算资源，而且可扩展性也有待提高，因此急需提供一种计算简便、扩展性高的基于用户行为的标签分析方法。

发明内容

本申请提供一种基于用户行为的标签分析方法，包括：

接收预先构建的标签集，采集用户的原始交互数据集，将所述原始交互数据集进行预处理后得到标准交互数据集；

根据所述标准交互数据集与所述标签集建立所述用户的标签关系；

根据所述标签关系与预先构建的用户标签模型进行相似度计算得到相似度集合；

根据所述相似度集合计算所述标签关系中的标签得分，并根据所述标签得分进行标签排序得到标签排序集；

根据预设标签个数从所述标签排序集中选择标签得到所述用户的标签分析结果，并输出所述标签分析结果。

此外，本申请还提供一种电子设备，该电子设备包括存储器和处理器，所述存储器中存储有可在所述处理器上运行的基于用户行为的标签分析程序，所述基于用户行为的标签分析程序被所述处理器执行时实现如下步骤：

此外，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有基于用户行为的标签分析程序，所述基于用户行为的标签分析程序可被一个或者多个处理器执行，以实现如下所述的基于用户行为的标签分析方法的步骤：

此外，本申请还提供一种基于用户行为的标签分析装置，所述装置包括：

数据接收及处理模块，用于接收预先构建的标签集，采集用户的原始交互数据集，将所述原始交互数据集进行预处理后得到标准交互数据集。

标签关系建立模块，用于根据所述标准交互数据集与所述标签集建立所述用户的标签关系。

相似度计算及标签排序模块，用于根据所述标签关系与预先构建的用户标签模型进行相似度计算得到相似度集合，根据所述相似度集合计算所述标签关系中的标签得分，并根据所述标签得分进行标签排序得到标签排序集。

标签分析结果输出模块，用于根据预设标签个数从所述标签排序集中选择标签得到所述用户的标签分析结果，并输出所述标签分析结果。

附图说明

图1为本申请一实施例提供的基于用户行为的标签分析方法的流程示意图；

图2为一实施例中用户-标签的示意图；

图3为本申请一实施例提供的电子设备的内部结构示意图；

图4为本申请一实施例提供的基于用户行为的标签分析装置的模块示意图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供一种基于用户行为的标签分析方法。参照图1所示，为本申请一实施例提供的基于用户行为的标签分析方法的流程示意图。该方法可以由一个装置执行，该装置可以由软件和/或硬件实现。

在本实施例中，基于用户行为的标签分析方法包括：

S1、接收预先构建的标签集，采集用户的原始交互数据集，将所述原始交互数据集进行预处理后得到标准交互数据集。

优选地，所述标签集是预先构建的包括多种类型的标签，如年龄类型：70后、80后、90后等；宠物：不喜欢宠物、爱狗、爱猫等；追剧类型：武侠、都市青春、恐怖等；游戏类型：不玩游戏、角色扮演、格斗、射击类等；音乐类型：DJ、民谣、流行等；所居住地区：一线发达地区、二线地区、欠发展地区等。

较佳地，所述原始交互数据集包括常规交互数据和请求交互数据。所述常规交互数据包括采集用户的地理位置、用户平台操作系统，用户平台版本，用户应用进程或网页等启动哪些等，如用户在手机上进行一系列操作时，所述常规交互数据包括手机系统(如IOS、MIUI、Flyme等)以及所述手机系统的版本、用户的应用进程启动了如微信、QQ、淘宝、京东、网易云音乐等。

进一步地，所述请求交互数据是用户通过所述平台操作系统、所述应用进程进行请求操作的一系列数据，包括所述应用程序(网页)的启动次数、用户登录次数、用户在所述应用程序(网页)等的搜索内容，浏览内容等。如用户启动购物网站，并基于购物网站搜索了金庸武侠小说，则所述基于购物网站搜索了金庸武侠小说则为所述请求交互数据。

较佳地，为了节约计算资源，所述常规交互数据不需要频繁采集，可采用定时采集方法，如预设每12个小时采集一次所述常规交互数据。所述请求交互数据可进行实时监控的方法。

进一步地，所述交互数据集的采集方法可基于预先构建的代码内嵌入所述用户平台操作系统中，如在安卓平台操作系统预先调用所述安卓平台操作系统自带的Alarm Manager方法进行采集等。

优选地，所述预处理是为了清理在所述采集过程中出现的异常原始交互数据，包括空白数据、乱码等，如采集所述基于购物网站搜索了金庸武侠小说是乱码，则所述预处理可进行转码为正确格式或剔除等方式。

S2、根据所述标准交互数据集与所述标签集建立所述用户的标签关系。

优选地，所述建立所述用户的标签关系，包括：提取出所述标准交互数据集的关键字并进行去重处理后得到关键字集，根据所述关键字集从所述标签集提取出相关标签得到所述用户的标签关系。

所述标准交互数据集包括了用户地理位置、用户平台操作系统、应用进程等常规交互数据，同时包括各类请求交互数据。本申请从所述常规交互数据中提取用户地理位置、用户平台操作系统、用户常用应用进程等。本申请较佳实施例根据预设使用次数阈值筛选所述用户常用应用进程。如在一周时间内，所述应用进程被打开的次数是否超过所述预设使用次数阈值，若所述应用进程超过所述预设使用次数阈值，则将所述应用进程设定为所述用户常用应用进程。进一步地，本申请从所述请求交互数据提取出用户常用搜索、浏览的关键词，如用户经常搜索中华田园犬、观看武侠类型电影电视剧等，因此可以提取出中华田园犬、武侠等关键字。

进一步地，本申请基于提取出的关键字组成关键字集，对所述关键字集进行去重处理，如用户在程序A中搜索了中华田园犬，在程序B中也搜索了中华田园犬，因此会出现关键字相同的情况。

优选地，所述根据所述关键字集从所述标签集提取出相关标签得到用户的标签关系。如所述关键字集包括中华田园犬、武侠、上海，则从所述标签集中对应提取出宠物：爱狗；追剧类型：武侠；所居住地区：一线发达地区，因此建立了所述用户的标签关系。

S3、根据所述标签关系与预先构建的用户标签模型进行相似度计算得到相似度集合。

优选地，所述相似度计算的方法包括：根据所述用户的标签关系与所述用户标签模型建立用户-标签二部图，并根据所述用户-标签二部图计算用户相似度和标签相似度，将所述用户相似度与所述标签相似度按照用户与标签的对应关系组建得到相似度集合。

较佳地，所述预先构建的用户标签模型是预先经过验证而无误的用户与标签对应关系，如用户A的标签为宠物：爱猫；追剧类型：都市青春；所居住地区：二线地区，所述用户A的标签已经与用户A实证后确认无误的。

优选地，所述用户-标签二部图可以参照附图2所示，一个标签会同时对应一个或者多个用户，一个用户会同时对应一个或者多个标签，其中用户a、用户b为所述预先构建的用户标签模型中的用户，用户c为本申请所述标签关系中的用户。

较佳地，所述用户相似度为：

其中，S _m+1(u,u’)表示所述用户与所述用户标签模型中的用户相似度，u为所述用户的交互数据，u’所述用户标签模型中的交互数据，m为迭代次数，Trust(u,u’)为u,u’的信任度，O(u)表示所述用户标签集合，O(u’)表示所述用户标签模型中的用户u’的标签集合，S _m+1(O _i(u),O _j(u’))表示所述用户的标签i与所述用户标签模型中的用户u’的标签j的相似度，C ₁为介于[0,1]之间的常数。

进一步地，所述标签相似度为：

其中，S _m+1(t,t’)表示所述用户的标签t与所述用户标签模型中的标签t’的标签相似度，I(t)表示所述标签t的相似标签集合，I(t’)表示所述标签t’的相似标签集合，S _m+1(I _i(t),I _j(t’))表示所述标签t的相似标签集合i与所述标签t’的相似标签集合j的相似度，C ₂为介于[0,1]之间的常数。

S4、根据所述相似度集合计算所述标签关系中的标签得分，并根据所述标签得分进行标签排序得到标签排序集。

较佳地，所述标签得分的计算方法为：

其中，r _S(u,t)表示所述标签得分，S(u,t)表示所述相似度集合，u为所述用户的交互数据，t的所述用户的标签，u’为所述用户标签模型中的交互数据，

为所述用户标签模型的用户总量，

为所述用户标签模型的标签总量，

表示所述用户标签模型的用户与所述用户的相似度，r _u，t表示所述用户与所述用户的标签的过滤值。

较佳地，所述

和所述r _u,t可采用基于协同过滤算法的SimRank系列算法和马尔科夫链系列算法求解。

S5、根据预设标签个数从所述标签排序集中选择标签得到所述用户的标签分析结果，并输出所述标签分析结果。

优选地，如所述用户最终的标签得分为：标签A，75分；标签B，93分；标签C，61分；标签D，32分；标签E，88分。若所述预设标签个数为3，则提取出标签B，标签E和标签A称为所述用户的标签分析结果。

发明还提供一种基于用户行为的标签分析装置。参照图3所示，为本申请一实施例提供的电子设备的内部结构示意图。

在本实施例中，所述电子设备1可以是PC(Personal Computer，个人电脑)，或者是智能手机、平板电脑、便携计算机等终端设备，也可以是一种服务器等。该电子设备1至少包括存储器11、处理器12，通信总线13，以及网络接口14。

其中，存储器11至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是电子设备1的内部存储单元，例如该电子设备1的硬盘。存储器11在另一些实施例中也可以是电子设备1的外部存储设备，例如电子设备1上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。进一步地，存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据，例如基于用户行为的标签分析程序01的代码等，还可以用于暂时地存储已经输出或者将要输出的数据。

处理器12在一些实施例中可以是一中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器或其他数据处理芯片，用于运行存储器11中存储的程序代码或处理数据，例如执行基于用户行为的标签分析程序01等。

通信总线13用于实现这些组件之间的连接通信。

网络接口14可选的可以包括标准的有线接口、无线接口(如WI-FI接口)，通常用于在该装置1与其他电子设备之间建立通信连接。

可选地，该装置1还可以包括用户接口，用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard)，可选的用户接口还可以包括标准的有线接口、无线接口。可选地，在一些实施例中，显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode，有机发光二极管)触摸器等。其中，显示器也可以适当的称为显示屏或显示单元，用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。

图3仅示出了具有组件11-14以及基于用户行为的标签分析程序01的电子设备1，本领域技术人员可以理解的是，图1示出的结构并不构成对电子设备1的限定，可以包括比图示更少或者更多的部件，或者组合某些部件，或者不同的部件布置。

在图3所示的装置1实施例中，存储器11中存储有基于用户行为的标签分析程序01；处理器12执行存储器11中存储的基于用户行为的标签分析程序01时实现如下步骤：

步骤一、接收预先构建的标签集，采集用户的原始交互数据集，将所述原始交互数据集进行预处理后得到标准交互数据集。

步骤二、根据所述标准交互数据集与所述标签集建立所述用户的标签关系。

步骤三、根据所述标签关系与预先构建的用户标签模型进行相似度计算得到相似度集合。

较佳地，所述用户相似度为：

进一步地，所述标签相似度为：

步骤四、根据所述相似度集合计算所述标签关系中的标签得分，并根据所述标签得分进行标签排序得到标签排序集。

较佳地，所述标签得分的计算方法为：

为所述用户标签模型的用户总量，

为所述用户标签模型的标签总量，

表示所述用户标签模型的用户与所述用户的相似度，r _u,t表示所述用户与所述用户的标签的过滤值。

较佳地，所述

步骤五、根据预设标签个数从所述标签排序集中选择标签得到所述用户的标签分析结果，并输出所述标签分析结果。

可选地，在其他实施例中，基于用户行为的标签分析程序还可以被分割为一个或者多个模块，一个或者多个模块被存储于存储器11中，并由一个或多个处理器(本实施例为处理器12)所执行以完成本发明，本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段，用于描述基于用户行为的标签分析程序在电子设备中的执行过程。

参照图4所示，为本申请基于用户行为的标签分析装置一实施例中的程序模块示意图，该实施例中，所述基于用户行为的标签分析装置包括数据接收及处理模块10、标签关系建立模块20、相似度计算及标签排序模块30、标签分析结果输出模块40示例性地：

所述数据接收及处理模块10用于：接收预先构建的标签集，采集用户的原始交互数据集，将所述原始交互数据集进行预处理后得到标准交互数据集。

所述标签关系建立模块20用于：根据所述标准交互数据集与所述标签集建立所述用户的标签关系。

所述相似度计算及标签排序模块30用于：根据所述标签关系与预先构建的用户标签模型进行相似度计算得到相似度集合，根据所述相似度集合计算所述标签关系中的标签得分，并根据所述标签得分进行标签排序得到标签排序集。

所述标签分析结果输出模块40用于：根据预设标签个数从所述标签排序集中选择标签得到所述用户的标签分析结果，并输出所述标签分析结果。

上述数据接收及处理模块10、标签关系建立模块20、相似度计算及标签排序模块30、标签分析结果输出模块40等程序模块被执行时所实现的功能或操作步骤与上述实施例大体相同，在此不再赘述。

此外，本申请实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有基于用户行为的标签分析程序，所述基于用户行为的标签分析程序可被一个或多个处理器执行，以实现如下操作：

接收预先构建的标签集，采集用户的原始交互数据集，将所述原始交互数据集进行预处理后得到标准交互数据集。

根据所述标准交互数据集与所述标签集建立所述用户的标签关系。

根据所述标签关系与预先构建的用户标签模型进行相似度计算得到相似度集合，根据所述相似度集合计算所述标签关系中的标签得分，并根据所述标签得分进行标签排序得到标签排序集。

所述计算机可读存储介质可以是非易失性，也可以是易失性。

需要说明的是，上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种基于用户行为的标签分析方法，其中，所述方法包括：

接收预先构建的标签集，采集用户的原始交互数据集，将所述原始交互数据集进行预处理后得到标准交互数据集；

根据所述标准交互数据集与所述标签集建立所述用户的标签关系；

根据所述标签关系与预先构建的用户标签模型进行相似度计算得到相似度集合；

根据所述相似度集合计算所述标签关系中的标签得分，并根据所述标签得分进行标签排序得到标签排序集；

根据预设标签个数从所述标签排序集中选择标签得到所述用户的标签分析结果，并输出所述标签分析结果。
如权利要求1所述的基于用户行为的标签分析方法，其中，所述根据所述标准交互数据集与所述标签集建立所述待标签分析用户的标签关系，包括：

提取出所述标准交互数据集的关键字并进行关键字去重处理后得到关键字集；

根据所述关键字集从所述标签集提取出与所述关键字集相关的标签得到所述用户的标签关系。
如权利要求1或2所述的基于用户行为的标签分析方法，其中，所述根据所述标签关系与预先构建的用户标签模型进行相似度计算得到相似度集合，包括：

根据所述标签关系与所述预先构建的用户标签模型建立用户-标签二部图；

根据所述用户-标签二部图计算用户相似度及标签相似度；

将所述用户相似度与所述标签相似度按照用户与标签的对应关系计算得到所述相似度集合。
如权利要求3所述的基于用户行为的标签分析方法，其中，所述用户相似度的计算方法为：

其中，S _m+1(u,u ^,)表示所述用户相似度，u为所述用户的交互数据，u ^,为所述用户标签模型中的交互数据，m为迭代次数，Trust(u,u ^,)为u,u ^,的信任度，O(u)表示所述待标签分析用户标签集合，O(u ^,)表示所述用户标签模型中的用户u ^,的标签集合，S _m+1(O _i(u),O _j(u ^,))表示所述待标签分析用户的标签i与所述用户标签模型中的用户u ^,的标签j的相似度，C ₁为介于[0,1]之间的常数；

所述标签相似度为：

其中，S _m+1(t,t ^,)表示所述待标签分析用户的标签t与所述用户标签模型中的标签t ^,的标签相似度，I(t)表示所述标签t的相似标签集合，I(t ^,)表示所述标签t ^,的相似标签集合，S _m+1(I _i(t),I _j(t ^,))表示所述标签t的相似标签集合i与所述标签t ^,的相似标签集合j的相似度，C ₂为介于[0,1]之间的常数。
如权利要求1所述的基于用户行为的标签分析方法，其中，所述根据所述相似度集合计算所述标签关系中的标签得分的方法为：

其中，r _S(u,t)表示所述标签得分，S(u,t)表示所述相似度集合，u为所述用户的交互数据，t的所述用户的标签，u ^,为所述用户标签模型中的交互数据，
为所述用户标签模型的用户总量，
为所述用户标签模型的标签总量，
表示所述用户标签模型的用户与所述待标签分析用户的相似度，r _u,t表示所述待标签分析用户与所述待标签分析用户的标签的过滤值。
如权利要求1所述的基于用户行为的标签分析方法，其中，所述原始交互数据集包括常规交互数据和请求交互数据，其中，所述常规交互数据采用定时采集方法获取，所述请求交互数据采用实时监控方法获取。
如权利要求1所述的基于用户行为的标签分析方法，其中，所述交互数据集的采集方法基于预先构建的代码内嵌入所述用户平台操作系统中。
一种电子设备，其中，所述电子设备包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的基于用户行为的标签分析程序，所述基于用户行为的标签分析程序被所述处理器执行时实现如下步骤：

接收预先构建的标签集，采集用户的原始交互数据集，将所述原始交互数据集进行预处理后得到标准交互数据集；

根据所述标准交互数据集与所述标签集建立所述用户的标签关系；

根据所述标签关系与预先构建的用户标签模型进行相似度计算得到相似度集合；

根据所述相似度集合计算所述标签关系中的标签得分，并根据所述标签得分进行标签排序得到标签排序集；

根据预设标签个数从所述标签排序集中选择标签得到所述用户的标签分析结果，并输出所述标签分析结果。
如权利要求8所述的电子设备，其中，所述根据所述标准交互数据集与所述标签集建立所述待标签分析用户的标签关系，包括：

提取出所述标准交互数据集的关键字并进行关键字去重处理后得到关键字集；

根据所述关键字集从所述标签集提取出与所述关键字集相关的标签得到所述用户的标签关系。
如权利要求8或9所述的电子设备，其中，所述根据所述标签关系与预先构建的用户标签模型进行相似度计算得到相似度集合，包括：

根据所述标签关系与所述预先构建的用户标签模型建立用户-标签二部图；

根据所述用户-标签二部图计算用户相似度及标签相似度；

将所述用户相似度与所述标签相似度按照用户与标签的对应关系计算得到所述相似度集合。
如权利要求10中所述的电子设备，其中，所述用户相似度的计算方法为：

其中，S _m+1(u,u ^,)表示所述用户相似度，u为所述用户的交互数据，u ^,为所述用户标签模型中的交互数据，m为迭代次数，Trust(u,u ^,)为u,u ^,的信任度，O(u)表示所述待标签分析用户标签集合，O(u ^,)表示所述用户标签模型中的用户u ^,的标签集合，S _m+1(O _i(u),O _j(u ^,))表示所述待标签分析用户的标签i与所述用户标签模型中的用户u ^,的标签j的相似度，C ₁为介于[0,1]之间的常数；

所述标签相似度为：

其中，S _m+1(t,t ^,)表示所述待标签分析用户的标签t与所述用户标签模型中的标签t ^,的标签相似度，I(t)表示所述标签t的相似标签集合，I(t ^,)表示所述标签t ^,的相似标签集合，S _m+1(I _i(t),I _j(t ^,))表示所述标签t的相似标签集合i与所述标签t ^,的相似标签集合j的相似度，C ₂为介于[0,1]之间的常数。
如权利要求8所述的电子设备，其中，所述根据所述相似度集合计算所述标签关系中的标签得分的方法为：

其中，r _S(u,t)表示所述标签得分，S(u,t)表示所述相似度集合，u为所述用户的交互数据，t的所述用户的标签，u ^,为所述用户标签模型中的交互数据，
为所述用户标签模型的用户总量，
为所述用户标签模型的标签总量，
表示所述用户标签模型的用户与所述待标签分析用户的相似度，r _u,t表示所述待标签分析用户与所述待标签分析用户的标签的过滤值。
如权利要求8所述的电子设备，其中，所述原始交互数据集包括常规交互数据和请求交互数据，其中，所述常规交互数据采用定时采集方法获取，所述请求交互数据采用实时监控方法获取。
一种计算机可读存储介质，其中，所述计算机可读存储介质上存储有基于用户行为的标签分析程序，所述基于用户行为的标签分析程序可被一个或者多个处理器执行，以实现如下所述的基于用户行为的标签分析方法的步骤：

接收预先构建的标签集，采集用户的原始交互数据集，将所述原始交互数据集进行预处理后得到标准交互数据集；

根据所述标准交互数据集与所述标签集建立所述用户的标签关系；

根据所述标签关系与预先构建的用户标签模型进行相似度计算得到相似度集合；

根据所述相似度集合计算所述标签关系中的标签得分，并根据所述标签得分进行标签排序得到标签排序集；

根据预设标签个数从所述标签排序集中选择标签得到所述用户的标签分析结果，并输出所述标签分析结果。
如权利要求14所述的计算机可读存储介质，其中，所述根据所述标准交互数据集与所述标签集建立所述待标签分析用户的标签关系，包括：

提取出所述标准交互数据集的关键字并进行关键字去重处理后得到关键字集；

根据所述关键字集从所述标签集提取出与所述关键字集相关的标签得到所述用户的标签关系。
如权利要求14或15所述的计算机可读存储介质，其中，所述根据所述标签关系与预先构建的用户标签模型进行相似度计算得到相似度集合，包括：

根据所述标签关系与所述预先构建的用户标签模型建立用户-标签二部图；

根据所述用户-标签二部图计算用户相似度及标签相似度；

将所述用户相似度与所述标签相似度按照用户与标签的对应关系计算得到所述相似度集合。
如权利要求16中所述的计算机可读存储介质，其中，所述用户相似度的计算方法为：

其中，S _m+1(u,u ^,)表示所述用户相似度，u为所述用户的交互数据，u ^,为所述用户标签模型中的交互数据，m为迭代次数，Trust(u,u ^,)为u,u ^,的信任度，O(u)表示所述待标签分析用户标签集合，O(u ^,)表示所述用户标签模型中的用户u ^,的标签集合，S _m+1(O _i(u),O _j(u ^,))表示所述待标签分析用户的标签i与所述用户标签模型中的用户u ^,的标签j的相似度，C ₁为介于[0,1]之间的常数；

所述标签相似度为：

其中，S _m+1(t,t ^,)表示所述待标签分析用户的标签t与所述用户标签模型中的标签t ^,的标签相似度，I(t)表示所述标签t的相似标签集合，I(t ^,)表示所述标签t ^,的相似标签集合，S _m+1(I _i(t),I _j(t ^,))表示所述标签t的相似标签集合i与所述标签t ^,的相似标签集合j的相似度，C ₂为介于[0,1]之间的常数。
如权利要求14所述的计算机可读存储介质，其中，所述根据所述相似度集合计算所述标签关系中的标签得分的方法为：

其中，r _S(u,t)表示所述标签得分，S(u,t)表示所述相似度集合，u为所述用户的交互数据，t的所述用户的标签，u ^,为所述用户标签模型中的交互数据，
为所述用户标签模型的用户总量，
为所述用户标签模型的标签总量，
表示所述用户标签模型的用户与所述待标签分析用户的相似度，r _u,t表示所述待标签分析用户与所述待标签分析用户的标签的过滤值。
如权利要求14所述的计算机可读存储介质，其中，所述原始交互数据集包括常规交互数据和请求交互数据，其中，所述常规交互数据采用定时采集方法获取，所述请求交互数据采用实时监控方法获取。
一种基于用户行为的标签分析装置，其中，所述装置包括：

数据接收及处理模块，用于接收预先构建的标签集，采集用户的原始交互数据集，将所述原始交互数据集进行预处理后得到标准交互数据集。

标签关系建立模块，用于根据所述标准交互数据集与所述标签集建立所述用户的标签关系。

相似度计算及标签排序模块，用于根据所述标签关系与预先构建的用户标签模型进行相似度计算得到相似度集合，根据所述相似度集合计算所述标签关系中的标签得分，并根据所述标签得分进行标签排序得到标签排序集。

标签分析结果输出模块，用于根据预设标签个数从所述标签排序集中选择标签得到所述用户的标签分析结果，并输出所述标签分析结果。