CN115495570A - 应用程序用户分类方法和评估方法、装置及设备 - Google Patents
应用程序用户分类方法和评估方法、装置及设备 Download PDFInfo
- Publication number
- CN115495570A CN115495570A CN202110682747.XA CN202110682747A CN115495570A CN 115495570 A CN115495570 A CN 115495570A CN 202110682747 A CN202110682747 A CN 202110682747A CN 115495570 A CN115495570 A CN 115495570A
- Authority
- CN
- China
- Prior art keywords
- user
- application program
- interface calling
- preset
- real
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/10—Requirements analysis; Specification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种应用程序用户分类方法和评估方法、装置及设备,涉及应用程序评估技术领域。应用程序用户分类方法包括:获取预设周期内目标应用程序中各功能模块的接口调用信息,接口调用信息基于目标用户对目标应用程序的操作产生;将接口调用信息转换为操作语句序列,获得实时语料库;根据实时语料库和训练好的用户分类模型,获得目标用户的用户类型。本发明解决了现有的应用程序评估方法存在评估准确性较差的问题,实现了提高应用程序评估准确性的效果。
Description
技术领域
本发明涉及应用程序评估技术领域,尤其涉及一种应用程序用户分类方法和评估方法、装置及设备。
背景技术
随着智能手机和应用程序的逐渐增多,越来越多的业务都转移到了应用程序上进行处理,比如,理财投资、缴费充值、票券购买等等业务。一个应用程序往往具备多个业务功能模块,当开发人员对应用程序进行修复或升级后,需要及时知晓该功能模块对用户是否实用,是否真的解决了用户需求,因此需要对应用程序进行评估。而现有的应用程序评估方法存在评估准确性较差的问题,无法获取更切近实际的评估结果给开发人员,可能导致开发人员开发的应用程序无法满足用户的真正需求。
发明内容
本发明的主要目的在于:提供一种应用程序用户分类方法和评估方法、装置及设备,旨在解决现有技术中的应用程序评估方法存在评估准确性较差的技术问题。
为实现上述目的,本发明采用如下技术方案:
第一方面,本发明提供了一种应用程序用户分类方法,所述方法包括以下步骤:
获取预设周期内目标应用程序中各功能模块的接口调用信息,其中,所述接口调用信息基于目标用户对目标应用程序的操作产生;
将所述接口调用信息转换为操作语句序列,获得实时语料库;
根据所述实时语料库和训练好的用户分类模型,获得所述目标用户的用户类型,其中,所述用户分类模型基于自然语言处理算法构建。
可选地,上述应用程序用户分类方法中,所述将所述接口调用信息转换为操作语句序列,获得实时语料库的步骤,具体包括:
根据预设词库,将所述接口调用信息转换为操作语句序列,获得实时语料库,其中,所述预设词库包括根据接口调用序列定义的词组。
可选地,上述应用程序用户分类方法中,所述根据预设词库,将所述接口调用信息转换为操作语句序列,获得实时语料库的步骤之前,所述方法还包括:
获取目标应用程序的接口调用关系图谱;
根据所述接口调用关系图谱,获得所述目标应用程序中各功能模块对应的预设接口调用序列;
根据所述预设接口调用序列,定义多个功能词组和停顿词组,以获得功能词库和停顿词词库;
根据所述功能词库和所述停顿词词库,获得预设词库。
可选地,上述应用程序用户分类方法中,所述根据预设词库,将所述接口调用信息转换为操作语句序列,获得实时语料库的步骤,具体包括:
根据预设时间间隔,将所述接口调用信息转换为多个接口调用序列;
根据预设词库,将每个所述接口调用序列转换为多个词组构成的操作语句序列,以获得多个所述操作语句序列;
根据所述多个操作语句序列构建实时语料库。
可选地,上述应用程序用户分类方法中,所述根据所述实时语料库和训练好的用户分类模型,获得所述目标用户的用户类型的步骤之前,所述方法还包括:
利用脚本自动化模拟用户使用目标应用程序的各功能模块,获得对应的预设接口调用序列;
根据预设词库,将所述预设接口调用序列转换为预设操作语句序列,以获得训练语料库;
对所述训练语料库中的预设操作语句序列进行用户类型标注,获得多个标注样本,以构建训练数据集;
根据贝叶斯文本分类算法建立初始模型;
根据所述训练数据集,对所述初始模型进行训练,获得训练好的用户分类模型。
可选地,上述应用程序用户分类方法中,所述根据所述实时语料库和训练好的用户分类模型,获得所述目标用户的用户类型的步骤,具体包括:
将所述实时语料库中的操作语句序列输入训练好的用户分类模型;
所述用户分类模型基于贝叶斯文本分类算法对所述操作语句序列进行分类,获得分类结果;
根据所述分类结果获得所述目标用户的用户类型。
第二方面,本发明提供了一种应用程序评估方法,方法包括以下步骤:
获取多个用户在预设周期内使用目标应用程序的操作信息;
根据所述操作信息,利用上述的应用程序用户分类方法,获得多个所述用户的用户类型;
根据所述多个用户类型中各类用户类型的占比和预设的用户类型占比阈值,对所述目标应用程序进行评估,以获得评估结果。
第三方面,本发明提供了一种应用程序用户分类装置,所述装置包括:
信息采集模块,用于获取预设周期内目标应用程序中各功能模块的接口调用信息,其中,所述接口调用信息基于目标用户对目标应用程序的操作产生;
实时语料库获取模块,用于将所述接口调用信息转换为操作语句序列,获得实时语料库;
用户类型获取模块,用于根据所述实时语料库和训练好的用户分类模型,获得所述目标用户的用户类型,其中,所述用户分类模型基于自然语言处理算法构建。
第四方面,本发明提供了一种计算机设备,所述设备包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,实现如上述的方法。
第五方面,本发明提供了一种存储介质,其上存储有计算机程序,所述计算机程序可被一个或多个处理器执行,以实现如上述的方法。
本发明提供的上述一个或多个技术方案,可以具有如下优点或至少实现了如下技术效果:
本发明提出的一种应用程序用户分类方法和评估方法、装置及设备,通过获取预设周期内目标应用程序中各功能模块的接口调用信息,根据目标用户对目标应用程序的操作数据,建立实际用户与用户分类方法要分析的数据之间的对应关系;将接口调用信息转换为操作语句序列,获得实时语料库,结合自然语言来定义接口调用信息,初步进行字符到语句的归类处理,减少后续计算量;再根据实时语料库和训练好的用户分类模型,获得目标用户的用户类型,运用基于自然语言处理算法构建并训练好的用户分类模型,直接输入实时语料库即可得到用户分类结果,方便快捷,且随着模型的不断优化可以进一步提升用户分类的准确度。还通过利用该应用程序用户分类方法进行应用程序评估,当获取的用户类型更贴近实际的用户类型时,应用程序的支持有效性评估也将更准确,实现了提高应用程序评估准确性的效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的这些附图获得其他的附图。
图1为本发明应用程序用户分类方法第一实施例的流程示意图;
图2为本发明涉及的计算机设备的硬件结构示意图;
图3为本发明应用程序用户分类方法第二实施例的流程示意图;
图4为本发明应用程序用户分类方法第二实施例的接口调用关系图谱;
图5为本发明应用程序用户分类方法第二实施例的演示示意图;
图6为本发明应用程序评估方法第一实施例的流程示意图;
图7为本发明应用程序用户分类装置第一实施例的功能模块示意图;
图8为本发明应用程序评估装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明,在本发明中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。在本发明中,若有涉及“第一”、“第二”等的描述,则该“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,在本发明中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。另外,各个实施例的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时,应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
对现有技术的分析发现,随着智能手机和应用程序的逐渐增多,越来越多的业务都转移到了应用程序上进行处理,比如,理财投资、缴费充值、票券购买等等业务。一个应用程序往往具备多个业务功能模块,当开发人员对应用程序进行修复或升级后,需要及时知晓该功能模块对用户是否实用,是否真的解决了用户需求,因此需要对应用程序进行评估。
而现有的应用程序评估方法一般是事先人为设定好用户角色分类,然后基于用户角色分类匹配对应的功能模块分类,通过功能埋点,产生用户操作日志,再后台采集操作日志,从用户使用的功能模块开展用户角色分析,然后,基于使用频次,使用时长等对用户操作进行画像,获得用户使用行为个体画像,再基于设定好的用户角色分类,对所有用户使用行为个体画像进行汇总操作,形成群体画像,最后通过个体画像和群体画像对应用程序的各个功能模块进行有效性评估。现有的这种方式直接针对用户类型去获取相应的操作日志进行评估,只能从用户零散的操作行为出发,从操作日志文件中分析各种功能模块的调用行为,获取的操作日志和实际的用户没有明确的对应关系,并且由于调用粒度过细,容易引入过多分析噪音,导致分析的用户角色与实际的用户类型具有差异,从而导致应用程序评估没有反映用户的实际使用状态,存在评估准确性较差的问题,从而无法获取更切近实际的评估结果给开发人员。
鉴于现有技术中的应用程序评估方法,根据既有用户角色按照既有功能模块设计获取使用情况来进行用户角色画像,并且容易引入过多分析噪音,导致获得的用户分类与实际用户类型差异性较大,以及应用程序评估存在评估准确性较差的技术问题,本发明提供了一种应用程序用户分类方法,总体思路如下:
获取预设周期内目标应用程序中各功能模块的接口调用信息,其中,所述接口调用信息基于目标用户对目标应用程序的操作产生;将所述接口调用信息转换为操作语句序列,获得实时语料库;根据所述实时语料库和训练好的用户分类模型,获得所述目标用户的用户类型,其中,所述用户分类模型基于自然语言处理算法构建。
通过上述技术方案,获取预设周期内目标应用程序中各功能模块的接口调用信息,根据目标用户对目标应用程序的操作数据,建立实际用户与用户分类方法要分析的数据之间的对应关系;将接口调用信息转换为操作语句序列,获得实时语料库,结合自然语言来定义接口调用信息,初步进行字符到语句的归类处理,减少后续计算量;再根据实时语料库和训练好的用户分类模型,获得目标用户的用户类型,运用基于自然语言处理算法构建并训练好的用户分类模型,直接输入实时语料库即可得到用户分类结果,方便快捷,且随着模型的不断优化可以进一步提升用户分类的准确度。还通过利用该应用程序用户分类方法进行应用程序评估,当获取的用户类型更贴近实际的用户类型时,应用程序的支持有效性评估也将更准确,实现了提高应用程序评估准确性的效果。
实施例一
参照图1的流程示意图,提出本发明应用程序用户分类方法的第一实施例,该应用程序用户分类方法应用于计算机设备。
所述计算机设备是指能够实现网络连接的终端设备或网络连接设备,所述计算机设备可以是手机、电脑、平板电脑、嵌入式工控机等终端设备,也可以是服务器等网络设备。
如图2所示,为计算机设备的硬件结构示意图。所述设备可以包括:处理器1001,例如CPU(Central Processing Unit,中央处理器),通信总线1002,用户接口1003,网络接口1004,存储器1005。
本领域技术人员可以理解,图2中示出的硬件结构并不构成对本发明计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
具体的,通信总线1002用于实现这些组件之间的连接通信;
用户接口1003用于连接客户端,与客户端进行数据通信,用户接口1003可以包括输出单元,如显示屏、输入单元,如键盘,可选的,用户接口1003还可以包括其他输入/输出接口,比如标准的有线接口、无线接口;
网络接口1004用于连接后台服务器,与后台服务器进行数据通信,网络接口1004可以包括输入/输出接口,比如标准的有线接口、无线接口,如Wi-Fi接口;
存储器1005用于存储各种类型的数据,这些数据例如可以包括该设备中任何应用程序或方法的指令,以及应用程序相关的数据,存储器1005可以是高速RAM存储器,也可以是稳定的存储器,例如磁盘存储器,可选的,存储器1005还可以是独立于所述处理器1001的存储装置;
具体的,继续参照图2,存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及计算机程序,其中,网络通信模块主要用于连接服务器,与服务器进行数据通信;
处理器1001用于调用存储器1005中存储的计算机程序,并执行以下操作:
获取预设周期内目标应用程序中各功能模块的接口调用信息,其中,所述接口调用信息基于目标用户对目标应用程序的操作产生;
将所述接口调用信息转换为操作语句序列,获得实时语料库;
根据所述实时语料库和训练好的用户分类模型,获得所述目标用户的用户类型,其中,所述用户分类模型基于自然语言处理算法构建。
基于上述的计算机设备,下面结合图1所示的流程示意图,对本实施例的应用程序用户分类方法进行详细描述。所述方法可以包括以下步骤:
步骤S20:获取预设周期内目标应用程序中各功能模块的接口调用信息,其中,所述接口调用信息基于目标用户对目标应用程序的操作产生。
具体的,目标应用程序即APP被安装在多个用户的计算机设备上,当用户对该APP进行登录账号、数据查询、业务处理等等功能的操作时,记录该APP中所有接口被调用的接口调用信息,并存储到云端,以备使用。当开发人员需要对使用该目标应用程序的每个用户进行用户类型判断时,先从云端获取一端时间内的接口调用信息,获得多个目标用户对目标应用程序进行操作产生的对应的接口调用信息。
随机获取未知类型的用户对目标应用程序各个功能模块的操作信息,而不是获取已知用户类型的用户对特定功能模块的操作信息,数据更具全面性。获取一次预设周期内的数据即可判断多个用户的用户类型,而不用单独地多次对每个用户的特定操作进行采集,防止产生过多分析噪声,影响分类分析的准确性。
步骤S40:将所述接口调用信息转换为操作语句序列,获得实时语料库。
具体的,将获取的某一目标用户的接口调用信息中,每个接口的调用定位为一个字符,从而得到很多个字符,一个功能模块可以实现的多个子业务,一子业务可以涉及一个或多个接口调用,从而将一个子业务涉及的多个接口调用转换为多个字符构成的接口调用序列,即词组;从而得到一个功能模块的一次完整使用过程,将多个子业务的接口调用序列转换为了操作语句序列;进一步将该用户这一段时间内对该APP的使用转换为多个操作语句序列,以此方式继续获得其他用户的操作语句序列,从而构建得到实时语料库。
运用自然语言来定义应用程序的接口调用,以在后续继续利用自然语言分类进行用户分类,基于实际的业务操作行为进行实际用户的分类,更具有针对性,保证实际用户与根据操作行为分析的用户类型间对应关系不会受到分析处理的影响。
步骤S60:根据所述实时语料库和训练好的用户分类模型,获得所述目标用户的用户类型,其中,所述用户分类模型基于自然语言处理算法构建。
具体的,用户分类模型可以是二分类或多分类的深度学习模型,该深度学习模块可以包括操作语句序列与用户类型的对应关系。在基于自然语言处理算法构建并训练得到一个用户分类模型后,将步骤S40得到的实时语料库的多个操作语句序列输入该用户分类模型,输出得到对应的用户类型,从而可以知晓多个目标用户各自的用户类型,实现了将分析后得到的用户类型与实际的目标用户关联的效果。
运用已经训练好的深度学习的用户分类模型进行分析,方便快捷,并且,随着数据量的增多可以不断优化用户分类模型,进一步提高应用程序用户分类的准确性。
本实施例提供的应用程序用户分类方法,通过获取预设周期内目标应用程序中各功能模块的接口调用信息,根据目标用户对目标应用程序的操作数据,建立实际用户与用户分类方法要分析的数据之间的对应关系;将接口调用信息转换为操作语句序列,获得实时语料库,结合自然语言来定义接口调用信息,初步进行字符到语句的归类处理,减少后续计算量;再根据实时语料库和训练好的用户分类模型,获得目标用户的用户类型,运用基于自然语言处理算法构建并训练好的用户分类模型,直接输入实时语料库即可得到用户分类结果,方便快捷,且随着模型的不断优化可以进一步提升用户分类的准确度。
实施例二
基于同一发明构思,参照图3至图5,提出本发明应用程序用户分类方法的第二实施例,该应用程序用户分类方法应用于计算机设备。
下面结合图3所示的流程示意图,对本实施例的应用程序用户分类方法进行详细描述。所述方法可以包括以下步骤:
步骤S20:获取预设周期内目标应用程序中各功能模块的接口调用信息,其中,所述接口调用信息基于目标用户对目标应用程序的操作产生。
具体的,目标应用程序即APP被安装在多个用户的计算机设备上,当用户对该APP进行登录账号、数据查询、业务处理等等功能的操作时,记录该APP中所有接口被调用的接口调用信息,并存储到云端,以备使用。
本实施例以一个理财投资APP为例进行说明,该APP具有客户资金认领功能,相应地,就有该功能对应的功能模块,可以通过接口日志系统记录所有用户对该APP的客户资金认领功能模块的接口访问情况并存储。当开发人员需要对使用该APP的每个用户进行用户类型判断时,先从云端获取一端时间内的某个指定功能模块的接口调用信息,获得多个目标用户对该APP进行操作产生的对应的接口调用信息。
通过采集目标用户使用指定功能模块的接口调用信息来进行用户类型自动分类,而不是针对用户类型去获取相应的操作日志,相比现有技术,可以建立实际的目标用户与后续自动分类获得的用户类型的对应关系,可以获得更准确的用户类型分类。
步骤S30:构建预设词库。
具体的,所述步骤S30,可以包括:
步骤S31:获取目标应用程序的接口调用关系图谱;
在具体实施过程中,针对一个特定功能需要连续调用多个接口执行操作,比如一个功能可以调用m个接口,将这m个接口的调用行为以m个字符表示,比如分别表示为:A1、A2、…、Am,其中,m≥1。
本实施例中,如图4所示为本实施例的理财投资APP的客户资金认领功能模块的接口调用关系图谱。其中,有5个接口,每个接口的调用对应执行一个操作,将接口的调用通过字符表示为A1~A5,A1表示登录操作,A2表示获取资金列表操作,A3表示打开资金详情操作,A4表示资金认领操作,A5表示按条件搜索操作。
步骤S32:根据所述接口调用关系图谱,获得所述目标应用程序中各功能模块对应的预设接口调用序列。
具体的,序列是被排成一列的对象或事件,当用户在APP上执行一个子业务时,对应会有一个或多个操作,相应地就会产生一个或多个接口被调用的行为。不同的接口进行排列组合可以得到不同的子业务,在用字符表示接口调用后,根据预设子业务的具体接口调用关系设定接口调用序列。
本实施例中,根据图4的接口调用关系图谱,获得该客户资金认领功能模块中各个子业务对应的预设接口调用序列,比如,查阅待处理认领资金:A2A5、A5A2或A2A3;执行资金认领:A2A3A4等等,具体可根据实际设定。
步骤S33:根据所述预设接口调用序列,定义多个功能词组和停顿词组,以获得功能词库和停顿词词库。
具体的,一子业务对应一预设接口调用序列,将预设接口调用序列用词组W表示,一个功能模块具有多个子业务,对应就有多个词组,比如,APP的某个功能模块有n个子业务,将这n个子业务用n个词组表示,分别为W1、W2、…、Wn。还可以针对业务的不同和一些与业务无关的操作,分别设定功能词组W和停顿词组T。将应用程序中多个功能模块的子业务均设定相应的功能词组和停顿词组,即可获得多个功能词组和停顿词组。然后,根据多个功能词组构建一个功能词库,根据多个停顿词组构建一个停顿词词库。
本实施例中,根据上述预设接口调用序列,定义功能词组,比如,可以设定功能词组W1=A2A5、A5A2或A2A3,功能词组W2=A2A3A4。还可以将与子业务无关的接口另行定义为停顿词组,比如将验证登录信息的接口A1定义为停顿词组T1=A1。根据上述功能词组W1和W2构建得到功能词库W=[W1,W2],根据上述停顿词组T1构建得到停顿词词库T=[T1]。
步骤S34:根据所述功能词库和所述停顿词词库,获得预设词库。
本实施例根据上述功能词库W和停顿词词库T,构建得到预设词库,以备实际使用时调用。
步骤S40:将所述接口调用信息转换为操作语句序列,获得实时语料库。
在一种实施方式中,所述步骤S40,可以包括:
步骤S40a:根据预设词库,将所述接口调用信息转换为操作语句序列,获得实时语料库,其中,所述预设词库包括根据接口调用序列定义的词组。
具体的,运用预设词库中已经定义好的词组,将接口调用信息转换为操作语句序列,再由这些语句序列构建得到实时的语料库,以待后续进行分类。
在另一种实施方式中,所述步骤S40a,可以包括:
步骤S41:根据预设时间间隔,将所述接口调用信息转换为多个接口调用序列。
本实施例中,在一实际应用场景中,如果某个用户在一次使用中调用了s个接口A1、A2、…、As,根据获得的接口调用信息可以转换为类似于A1A2A4…AsA2A3As这样的接口调用序列。用户在一段时间内会有多次使用,对应就有多个接口调用序列。
步骤S42:根据预设词库,将每个所述接口调用序列转换为多个词组构成的操作语句序列,以获得多个所述操作语句序列。
如图5所示的演示示意图,本实施例根据预设词库,将接口调用序列转换为多个词组构成的操作语句序列,比如预设词库中已经定义了W1=A1A2、W2=As、…、Wn=A2A3As,T1=A4等等,那么可以将接口调用序列转换为操作语句序列L1=W1T1…W2Wn。对应多个接口调用序列接续得到多个操作语句序列L1、L2、…等等。这就完成了从基础的接口日志调用信息向一个语句的转换。其中,没有定义的接口调用可以在上述分析过程中直接忽略。
步骤S43:根据所述多个操作语句序列构建实时语料库。
根据上述多个操作语句序列L1、L2、…构建实时语料库L。
本实施例中,假设有两次使用情况,比如:
1)直接进入查看最新资金列表并认领的相关操作,获取到的接口调用序列为:A1A2A3A4,通过上述步骤,可以转换为操作语句序列L1=T1W2;
2)经过查询获取资金列表并认领的相关操作,获取到接口调用序列为:A1A2A5A2A3A4,通过上述步骤,可以转换为操作语句序列L2=T1W1W2。
根据上述两种情况,对于某个用户在预设时间内的相关操作,可以构成实时语料库L,比如L=[T1L1L2L1L2、T1L1L1]。
在将所述接口调用信息转换为操作语句序列,获得实时语料库的步骤之后,可以按顺序执行如下步骤S50~S70,从而实现用户分类模型的训练、使用和优化;也可以步骤S50为独立执行的步骤分支,从而获得训练好的用户分类模型。
步骤S50:建立初始模型,并进行训练,获得训练好的用户分类模型。
具体的,所述步骤S50,可以包括:
步骤S51:利用脚本自动化模拟用户使用目标应用程序的各功能模块,获得对应的预设接口调用序列;
步骤S52:根据预设词库,将所述预设接口调用序列转换为预设操作语句序列,以获得训练语料库。
具体的,可以根据步骤S30构建好的预设词库,不断的使用各种功能场景,将所有生成的语句加入到一个训练语料库。为了兼顾训练效果,可以使用脚本自动化模拟用户使用目标应用程序的各功能模块的各种场景,以快速产生包含足够数量语句的训练语料库。
此时可以假设一些不同类型用户的典型使用场景,比如设想有两种“性格”的用户:
“积极认领”型:代表积极查询并认领回款的用户;
“消极认领”型:代表不积极认领回款的用户。
根据上述设定,模拟“积极认领”型,每天上午和下午分别打开查询一次,并且都尽可能的执行认领操作,获取到模拟的预设接口调用序列后,根据预设词库,转换得到这样的预设操作语句序列:T1L1L2L1L2、T1L1L1、T1L1L1L1L2。将这些预设操作语句序列添加到训练语料库中。
步骤S53:对所述训练语料库中的预设操作语句序列进行用户类型标注,获得多个标注样本,以构建训练数据集。
具体的,根据模拟得到的训练语料库,对其中的预设操作语句序列进行用户类型标注,比如将T1L1L2L1L2、T1L1L1、T1L1L1L1L2标注为“积极认领”型用户,得到标注了用户类型的标注样本。按上述方式进行多次模拟和标注,可以得到多个标注样本,以多个标注样本构建训练数据集。
步骤S54:根据贝叶斯文本分类算法建立初始模型;
具体的,基于自然语言处理算法构建一个二分类或多分类的初始模型,比如可以根据贝叶斯文本分类算法建立一个深度学习模型,或者根据卷积神经网络建立一个深度学习模型等等。
步骤S55:根据所述训练数据集,对所述初始模型进行训练,获得训练好的用户分类模型。
具体的,根据步骤S53得到的训练数据集,对步骤S54的初始模型进行训练,获得训练好的用户分类模型,以备使用。
本实施例中,按照上述示例得到的训练语料库及分类标注,得到了一个可以按照操作序列把用户分类为“积极认领型”和“消极认领型”的用户分类模型。
步骤S60:根据所述实时语料库和训练好的用户分类模型,获得所述目标用户的用户类型,其中,所述用户分类模型基于自然语言处理算法构建。
具体的,所述步骤S60,可以包括:
步骤S61:将所述实时语料库中的操作语句序列输入训练好的用户分类模型;
步骤S62:所述用户分类模型基于贝叶斯文本分类算法对所述操作语句序列进行分类,获得分类结果;
步骤S63:根据所述分类结果获得所述目标用户的用户类型。
具体的,根据步骤S40构成的实时语料库L,比如获取的是在一周内用户A的一系列操作,得到的实时语料库L=[T1L1L2L1L2、T1L1L1L1L2],根据步骤S50训练获得的用户分类模型,将该实时语料库L中的语句进行用户类型匹配,获得该用户A为“积极认领”型用户。以此类推,我们可以将在预设周期内进行操作的所有实际用户分类到这两种类型中,得到最终的各个目标用户的用户类型。
步骤S70:根据所述目标用户的用户类型对所述用户分类模型进行优化。
具体的,所述步骤S70,可以包括:
步骤S71:根据所述实时语料库中的操作语句序列和所述目标用户的用户类型,获得训练样本;
步骤S72:根据所述训练样本和所述标注样本,重构所述训练数据集,以根据所述训练数据集,对所述用户分类模型进行优化。
具体的,由于用户分类模型为深度学习模型,因此可以根据获取的分类结果对该模型进行优化,以更新用户分类模型,在后续分类时可以达到更好的分类效果,可进一步提高分类准确度。
本实施例提供的应用程序用户分类方法,通过将App所有功能的接口调用序列定义为词组,以构建词库,然后根据模拟用户使用App,将使用中的接口调用序列通过词库生成语句,以构建训练语料库,并通过手动标注对应的用户分类,使用自然语言分类算法来训练模型,得到用户分类模型,最后通过该模型对用户的实际使用场景所产生的语句进行分类,以得到实际用户的分类;结合使用了自然语言分类算法,将用户使用App的行为视为一种特殊的语言表达,并使用自然语言的分类算法,根据获取的现有各种用户对App的操作数据对使用APP的用户进行分类,基于实际的业务操作行为来进行用户分类。后续可以通过分类结果和既有设计进行比较,提供有效评估APP设计与实际达成效果的方法。
实施例三
基于同一发明构思,参照图6,提出本发明应用程序评估方法的第一实施例,该方法可应用于计算机设备。
下面结合图6所示的流程示意图,对本实施例提供的应用程序评估方法进行详细描述,所述方法可以包括:
步骤S1:获取多个用户在预设周期内使用目标应用程序的操作信息。
具体的,操作信息包括指定功能模块的接口调用信息,预设周期为开发人员想要采集的指定周期,比如一天,一周或一个月等等。多个用户在计算机设备上使用目标应用程序,通过接口日志系统收集对应的接口调用信息,并存储。本实施例中,假设有10个用户A~J,获取各自的操作信息。
步骤S2:根据所述操作信息,利用上述的应用程序用户分类方法,获得多个所述用户的用户类型。
具体的,根据步骤S1的操作信息,利用本发明应用程序用户分类方法的第一实施例或第二实施例的全部或部分步骤,获得多个用户各自的用户类型,本实施例中,通过上述方法得到用户A、C、D、E、F、H、I、J为“积极认领”型,用户B、G为“消极认领”型。
步骤S3:根据所述多个用户类型中各类用户类型的占比和预设的用户类型占比阈值,对所述目标应用程序进行评估,以获得评估结果。
具体的,获取多个用户类型中各类用户类型的占比,本实施例中,根据上述10个用户中,获得“积极认领”型的占比80%,“消极认领”型的占比20%,若使用该目标应用程序的指定功能模块对应的用户类型希望的占比阈值是70%以上,则本实施例为80%,超过了预设的用户类型占比阈值,说明该功能模块的设计达到了预期,反之,若低于预期,说明该模块设计使用并不理想,开发人员可以考虑后续更新该应用程序时,是否需要删除该功能模块或是否需要改进该功能模块。
需要说明,上述方法步骤S2的具体实施方式中更多实施细节可参见实施例一或实施例二中具体实施方式的描述,为了说明书的简洁,此处不再重复赘述。
本实施例提出的应用程序评估方法,基于应用程序用户分类方法获得的用户分类来评估用户的实际使用情况是否符合应用程序设计的预期,通过比较实际用户类别和预期用户类别之间的差异来评估App的设计成效。当获取的用户类型更贴近实际的用户类型时,应用程序的支持有效性评估也将更准确,实现了提高应用程序评估准确性的效果。
实施例四
基于同一发明构思,参照图7,提出本发明应用程序用户分类装置的第一实施例,该应用程序用户分类装置可以为虚拟装置,应用于计算机设备。
下面结合图7所示的功能模块示意图,对本实施例提供的应用程序用户分类装置进行详细描述,所述装置可以包括:
信息采集模块,用于获取预设周期内目标应用程序中各功能模块的接口调用信息,其中,所述接口调用信息基于目标用户对目标应用程序的操作产生;
实时语料库获取模块,用于将所述接口调用信息转换为操作语句序列,获得实时语料库;
用户类型获取模块,用于根据所述实时语料库和训练好的用户分类模型,获得所述目标用户的用户类型,其中,所述用户分类模型基于自然语言处理算法构建。
进一步地,所述实时语料库获取模块还可以用于:
根据预设词库,将所述接口调用信息转换为操作语句序列,获得实时语料库,其中,所述预设词库包括根据接口调用序列定义的词组。
进一步地,所述装置还可以包括:
预设词库构建模块,用于构建预设词库。
更进一步地,所述预设词库构建模块,可以包括:
接口调用关系获取单元,用于获取目标应用程序的接口调用关系图谱;
预设接口调用序列获取单元,用于根据所述接口调用关系图谱,获得所述目标应用程序中各功能模块对应的预设接口调用序列;
词组定义单元,用于根据所述预设接口调用序列,定义多个功能词组和停顿词组,以获得功能词库和停顿词词库;
预设词库获取单元,用于根据所述功能词库和所述停顿词词库,获得预设词库。
进一步地,所述实时语料库获取模块,可以包括:
第一转换单元,用于根据预设时间间隔,将所述接口调用信息转换为多个接口调用序列;
第二转换单元,用于根据预设词库,将每个所述接口调用序列转换为多个词组构成的操作语句序列,以获得多个所述操作语句序列;
实时语料库构建单元,用于根据所述多个操作语句序列构建实时语料库。
进一步地,所述装置还可以包括:
模型训练模块,用于建立初始模型,并进行训练,获得训练好的用户分类模型。
更进一步地,所述模型训练模块,可以包括:
模拟单元,用于利用脚本自动化模拟用户使用目标应用程序的各功能模块,获得对应的预设接口调用序列;
训练语料库构建单元,用于根据预设词库,将所述预设接口调用序列转换为预设操作语句序列,以获得训练语料库;
训练数据集获取单元,用于对所述训练语料库中的预设操作语句序列进行用户类型标注,获得多个标注样本,以构建训练数据集;
初始模型建立单元,用于根据贝叶斯文本分类算法建立初始模型;
用户分类模型获取单元,用于根据所述训练数据集,对所述初始模型进行训练,获得训练好的用户分类模型。
进一步地,所述用户类型获取模块,可以包括:
输入单元,用于将所述实时语料库中的操作语句序列输入训练好的用户分类模型;
分类识别单元,用于所述用户分类模型基于贝叶斯文本分类算法对所述操作语句序列进行分类,获得分类结果;
输出单元,用于根据所述分类结果获得所述目标用户的用户类型。
需要说明,本实施例提供的应用程序用户分类装置中各个模块可实现的功能和对应达到的技术效果可以参照本发明应用程序用户分类方法各个实施例中具体实施方式的描述,为了说明书的简洁,此处不再赘述。
实施例五
基于同一发明构思,参照图8,提出本发明应用程序评估装置的第一实施例,该应用程序评估装置可以为虚拟装置,应用于计算机设备。
下面结合图8所示的功能模块示意图,对本实施例提供的应用程序评估装置进行详细描述,所述装置可以包括:
操作信息获取模块,用于获取多个用户在预设周期内使用目标应用程序的操作信息;
用户分类模块,用于根据所述操作信息,利用应用程序用户分类方法,获得多个所述用户的用户类型;
应用程序评估模块,用于根据所述多个用户类型中各类用户类型的占比和预设的用户类型占比阈值,对所述目标应用程序进行评估,以获得评估结果。
需要说明,本实施例提供的应用程序评估装置中各个模块可实现的功能和对应达到的技术效果可以参照本发明应用程序评估方法第一实施例中具体实施方式的描述,为了说明书的简洁,此处不再赘述。
实施例六
基于同一发明构思,参照图2,为本发明各实施例涉及的计算机设备的硬件结构示意图。本实施例提供了一种计算机设备,所述设备可以包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,实现本发明方法各个实施例的全部或部分步骤。
具体的,所述计算机设备是指能够实现网络连接的终端设备或网络连接设备,可以是手机、电脑、平板电脑、便携计算机等终端设备,也可以是服务器、云平台等网络设备。
可以理解,所述设备还可以包括通信总线,用户接口和网络接口。
其中,通信总线用于实现这些组件之间的连接通信。
用户接口用于连接客户端,与客户端进行数据通信,用户接口可以包括输出单元,如显示屏、输入单元,如键盘,可选的,用户接口还可以包括其他输入/输出接口,比如标准的有线接口、无线接口。
网络接口用于连接后台服务器,与后台服务器进行数据通信,网络接口可以包括输入/输出接口,比如标准的有线接口、无线接口,如Wi-Fi接口。
存储器用于存储各种类型的数据,这些数据例如可以包括该计算机设备中任何应用程序或方法的指令,以及应用程序相关的数据。存储器可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random AccessMemory,简称SRAM),可擦除可编程只读存储器(Erasable Programmable Read-OnlyMemory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘,可选的,存储器还可以是独立于所述处理器的存储装置。
处理器用于调用存储器中存储的计算机程序,并执行如上述的方法各个实施例的全部或部分步骤,处理器可以是专用集成电路(Application Specific IntegratedCircuit,简称ASIC)、数字信号处理器(Digital Signal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(ProgrammableLogic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件,用于执行如上述方法各个实施例的全部或部分步骤。
实施例七
基于同一发明构思,本实施例提供了一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,所述存储介质上存储有计算机程序,所述计算机程序可被一个或多个处理器执行,所述计算机程序被处理器执行时可以实现本发明方法各个实施例的全部或部分步骤。
需要说明,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
以上所述仅为本发明的可选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均包括在本发明的专利保护范围内。
Claims (10)
1.一种应用程序用户分类方法,其特征在于,所述方法包括以下步骤:
获取预设周期内目标应用程序中各功能模块的接口调用信息,其中,所述接口调用信息基于目标用户对目标应用程序的操作产生;
将所述接口调用信息转换为操作语句序列,获得实时语料库;
根据所述实时语料库和训练好的用户分类模型,获得所述目标用户的用户类型,其中,所述用户分类模型基于自然语言处理算法构建。
2.如权利要求1所述的应用程序用户分类方法,其特征在于,所述将所述接口调用信息转换为操作语句序列,获得实时语料库的步骤,具体包括:
根据预设词库,将所述接口调用信息转换为操作语句序列,获得实时语料库,其中,所述预设词库包括根据接口调用序列定义的词组。
3.如权利要求2所述的应用程序用户分类方法,其特征在于,所述根据预设词库,将所述接口调用信息转换为操作语句序列,获得实时语料库的步骤之前,所述方法还包括:
获取目标应用程序的接口调用关系图谱;
根据所述接口调用关系图谱,获得所述目标应用程序中各功能模块对应的预设接口调用序列;
根据所述预设接口调用序列,定义多个功能词组和停顿词组,以获得功能词库和停顿词词库;
根据所述功能词库和所述停顿词词库,获得预设词库。
4.如权利要求2所述的应用程序用户分类方法,其特征在于,所述根据预设词库,将所述接口调用信息转换为操作语句序列,获得实时语料库的步骤,具体包括:
根据预设时间间隔,将所述接口调用信息转换为多个接口调用序列;
根据预设词库,将每个所述接口调用序列转换为多个词组构成的操作语句序列,以获得多个所述操作语句序列;
根据所述多个操作语句序列构建实时语料库。
5.如权利要求1或3所述的应用程序用户分类方法,其特征在于,所述根据所述实时语料库和训练好的用户分类模型,获得所述目标用户的用户类型的步骤之前,所述方法还包括:
利用脚本自动化模拟用户使用目标应用程序的各功能模块,获得对应的预设接口调用序列;
根据预设词库,将所述预设接口调用序列转换为预设操作语句序列,以获得训练语料库;
对所述训练语料库中的预设操作语句序列进行用户类型标注,获得多个标注样本,以构建训练数据集;
根据贝叶斯文本分类算法建立初始模型;
根据所述训练数据集,对所述初始模型进行训练,获得训练好的用户分类模型。
6.如权利要求5所述的应用程序用户分类方法,其特征在于,所述根据所述实时语料库和训练好的用户分类模型,获得所述目标用户的用户类型的步骤,具体包括:
将所述实时语料库中的操作语句序列输入训练好的用户分类模型;
所述用户分类模型基于贝叶斯文本分类算法对所述操作语句序列进行分类,获得分类结果;
根据所述分类结果获得所述目标用户的用户类型。
7.一种应用程序评估方法,其特征在于,所述方法包括以下步骤:
获取多个用户在预设周期内使用目标应用程序的操作信息;
根据所述操作信息,利用权利要求1至6中任一项所述的应用程序用户分类方法,获得多个所述用户的用户类型;
根据所述多个用户类型中各类用户类型的占比和预设的用户类型占比阈值,对所述目标应用程序进行评估,以获得评估结果。
8.一种应用程序用户分类装置,其特征在于,所述装置包括:
信息采集模块,用于获取预设周期内目标应用程序中各功能模块的接口调用信息,其中,所述接口调用信息基于目标用户对目标应用程序的操作产生;
实时语料库获取模块,用于将所述接口调用信息转换为操作语句序列,获得实时语料库;
用户类型获取模块,用于根据所述实时语料库和训练好的用户分类模型,获得所述目标用户的用户类型,其中,所述用户分类模型基于自然语言处理算法构建。
9.一种计算机设备,其特征在于,所述设备包括存储器和处理器,所述存储器上存储有计算机程序,该计算机程序被所述处理器执行时,实现如权利要求1至7中任一项所述的方法。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序可被一个或多个处理器执行,以实现如权利要求1至7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110682747.XA CN115495570A (zh) | 2021-06-18 | 2021-06-18 | 应用程序用户分类方法和评估方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110682747.XA CN115495570A (zh) | 2021-06-18 | 2021-06-18 | 应用程序用户分类方法和评估方法、装置及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115495570A true CN115495570A (zh) | 2022-12-20 |
Family
ID=84465308
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110682747.XA Pending CN115495570A (zh) | 2021-06-18 | 2021-06-18 | 应用程序用户分类方法和评估方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115495570A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116702014A (zh) * | 2023-08-03 | 2023-09-05 | 中电科新型智慧城市研究院有限公司 | 人口识别方法、装置、终端设备及存储介质 |
-
2021
- 2021-06-18 CN CN202110682747.XA patent/CN115495570A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116702014A (zh) * | 2023-08-03 | 2023-09-05 | 中电科新型智慧城市研究院有限公司 | 人口识别方法、装置、终端设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107818344B (zh) | 用户行为进行分类和预测的方法和系统 | |
CN110245213B (zh) | 调查问卷生成方法、装置、设备和存储介质 | |
CN112181835B (zh) | 自动化测试方法、装置、计算机设备及存储介质 | |
CN111552633A (zh) | 接口的异常调用测试方法、装置、计算机设备及存储介质 | |
CN106844319B (zh) | 报表生成方法及装置 | |
CN109710214A (zh) | 电子签约软件的组建方法、装置、终端设备及存储介质 | |
US20230043882A1 (en) | Method for assisting launch of machine learning model | |
CN114090755A (zh) | 基于知识图谱的回复语句确定方法、装置及电子设备 | |
CN111190946A (zh) | 报告生成方法、装置、计算机设备和存储介质 | |
CN110599240A (zh) | 应用的偏好值确定方法、装置和设备及存储介质 | |
CN113051911B (zh) | 提取敏感词的方法、装置、设备、介质及程序产品 | |
CN115495570A (zh) | 应用程序用户分类方法和评估方法、装置及设备 | |
CN111783415B (zh) | 模板配置方法以及装置 | |
CN114253990A (zh) | 数据库查询方法、装置、计算机设备和存储介质 | |
CN108959289B (zh) | 网站类别获取方法和装置 | |
CN111309882B (zh) | 用于实现智能客服问答的方法和装置 | |
CN116643748A (zh) | 银行app前端页面生成方法、装置、系统及存储介质 | |
CN116957828A (zh) | 报账审核方法、设备、存储介质及装置 | |
CN110716859A (zh) | 自动为修改的代码推送测试用例的方法及相关装置 | |
CN112085594B (zh) | 身份核实方法、设备及可读存储介质 | |
CN111949776B (zh) | 一种用户标签评估的方法、装置和电子设备 | |
CN115186063A (zh) | 一种业务数据处理方法、装置、设备及存储介质 | |
CN111078972B (zh) | 提问行为数据的获取方法、装置和服务器 | |
CN106294433B (zh) | 设备信息处理方法及装置 | |
CN113190562A (zh) | 一种报表生成方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |