CN115375177A - 用户价值评估方法、装置、电子设备及存储介质 - Google Patents

用户价值评估方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN115375177A
CN115375177A CN202211117957.5A CN202211117957A CN115375177A CN 115375177 A CN115375177 A CN 115375177A CN 202211117957 A CN202211117957 A CN 202211117957A CN 115375177 A CN115375177 A CN 115375177A
Authority
CN
China
Prior art keywords
user
index
value
evaluation
evaluated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211117957.5A
Other languages
English (en)
Inventor
张园
吕文娟
盛晓鸣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kangjian Information Technology Shenzhen Co Ltd
Original Assignee
Kangjian Information Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kangjian Information Technology Shenzhen Co Ltd filed Critical Kangjian Information Technology Shenzhen Co Ltd
Priority to CN202211117957.5A priority Critical patent/CN115375177A/zh
Publication of CN115375177A publication Critical patent/CN115375177A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0207Discounts or incentives, e.g. coupons or rebates
    • G06Q30/0224Discounts or incentives, e.g. coupons or rebates based on user history
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H40/00ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
    • G16H40/20ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms

Abstract

本发明涉及数据分析技术领域,提供一种用户价值评估方法、装置、电子设备及存储介质;所述方法包括以下步骤:获取对应待评估用户的评估指标;对所述评估指标进行特征选择,获取最优指标集;对所述最优指标集中的每一指标进行价值评分,得到所述最优指标集中的每一指标的评分值;对所述最优指标集中所有指标的评分值进行计算,获取所述待评估用户的用户价值;本发明通过挖掘出的对应待评估用户的评估指标,能够实现对不同待评估用户的价值评估,且保证了用户价值评估的准确合理性;通过充分考虑用户在APP上的用户行为,并根据该用户行为挖掘出了一系列的行为指标,更加准确合理地评估了该APP的用户价值。

Description

用户价值评估方法、装置、电子设备及存储介质
技术领域
本发明属于数据分析技术领域,特别是涉及一种用户价值评估方法、装置、电子设备及存储介质。
背景技术
随着平台用户量的增长,如何提升用户对平台的忠诚度,增加用户黏性,提高用户留存率,以及如何将新用户逐步培养成为核心用户,引导其在平台持续活跃成为所有运营人员需要思考的问题,建立平台的会员积分体系变得至关重要。
会员积分体系是通过一系列的积分规则体系和专属权益来差异化用户享受权益,扩大用户规模,通过强化用户的正确行为,培养用户习惯,促进核心用户的养成,最终提升用户对平台的忠诚度和黏性,同时可为后续发展开辟主力军,持续为平台创收,而如何对各等级用户的价值做定量评估成为其中一个核心的难点。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种用户价值评估方法、装置、电子设备及存储介质,通过挖掘出对应用户的评估指标,能够实现对不同用户的价值评估。
为实现上述目的及其他相关目的,本发明提供一种用户价值评估方法,包括以下步骤:获取对应待评估用户的评估指标;对所述评估指标进行特征选择,获取最优指标集;对所述最优指标集中的每一指标进行价值评分,得到所述最优指标集中的每一指标的评分值;对所述最优指标集中所有指标的评分值进行计算,获取所述待评估用户的用户价值。
本发明提供一种用户价值评估装置,包括:指标获取模块,用于获取对应待评估用户的评估指标;特征选择模块,用于对所述评估指标进行特征选择,获取最优指标集;评分获取模块,用于对所述最优指标集中的每一评估指标进行价值评分,得到所述最优指标集中的每一指标的评分值;价值评估模块,用于对所述最优指标集中所有指标的评分值进行计算,获取所述待评估用户的用户价值。
本发明提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述用户价值评估方法的步骤。
本发明提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述用户价值评估方法的步骤。
如上所述,本发明所述的用户价值评估方法、装置、电子设备及存储介质,具有以下有益效果:
(1)与现有技术相比,本发明提供的用户价值评估方法,通过挖掘出的对应待评估用户的评估指标,能够基于该评估指标实现对不同待评估用户的价值评估,且保证了用户价值评估的准确合理性。
(2)本发明通过充分考虑用户在APP上的用户行为,并根据该用户行为挖掘出了一系列的行为指标,如,于APP上执行用户行为的频次和深度指标、于APP上是否付费、用户反馈信息、是否复诊指标及用户行为对应的疾病的权重,更加准确合理地评估了该APP的用户价值。
(3)本发明通过根据机器学习的特征工程中的特征选择,确定最优指标集中各指标的价值评分,并以此作为用户价值评估的重要依据。
(4)本发明的用户价值评估方法适用于同时有问诊业务和商城等其它综合业务的平台产品会员积分体系的建立;同时,本发明挖掘出的评估指标还可应用于其它类营销业务,如根据用户的疾病标签丰富度和价值度开辟新业务,结合保险、慢病管理等,从用户身上获得潜在的和更长期的收益。
附图说明
图1显示为本发明的终端于一实施例中的结构示意图。
图2显示为本发明的用户价值评估方法于一实施例中的流程图。
图3显示为本发明的获取对应待评估用户的评估指标于一实施例中的流程图。
图4显示为本发明的对评估指标进行特征选择于一实施例中的流程图。
图5显示为本发明的用户价值评估方法于另一实施例中的流程图。
图6显示为本发明的对最优指标集中的每一指标进行价值评分,得到最优指标集中的每一指标的评分值于一实施例中的流程图。
图7显示为本发明的对最优指标集中所有指标的评分值进行计算,获取待评估用户的用户价值于一实施例中的流程图。
图8显示为本发明的用户价值评估方法于又一实施例中的流程图。
图9显示为本发明的用户价值评估方法于再一实施例中的流程图。
图10显示为本发明的用户价值评估装置于一实施例中的结构示意图。
标号说明
1 终端
11 处理单元
12 存储器
121 随机存取存储器
122 高速缓存存储器
123 存储系统
124 程序/实用工具
1241 程序模块
13 总线
14 输入/输出接口
15 网络适配器
2 外部设备
3 显示器
101 指标获取模块
102 特征选择模块
103 评分获取模块
104 价值评估模块
S1~S4 步骤
S11~S12 步骤
S21~S22 步骤
S31~S32 步骤
S41~S42 步骤
S5 步骤
S6 步骤
S7 步骤
具体实施方式
以下通过特定的具体实施例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图示中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
参阅图1至图10。本发明的用户价值评估方法、装置、电子设备及存储介质,与现有技术相比,本发明提供的用户价值评估方法,通过挖掘出的对应待评估用户的评估指标,能够基于该评估指标实现对不同待评估用户的价值评估,且保证了用户价值评估的准确合理性;本发明通过充分考虑用户在APP上的用户行为,并根据该用户行为挖掘出了一系列的行为指标,如,于APP上执行用户行为的频次和深度指标、于APP上是否付费、用户反馈信息、是否复诊指标及用户行为对应的疾病的权重,更加准确合理地评估了该APP的用户价值;本发明通过根据机器学习的特征工程中的特征选择,确定最优指标集中各指标的价值评分,并以此作为用户价值评估的重要依据;本发明的用户价值评估方法适用于同时有问诊业务和商城等其它综合业务的平台产品会员积分体系的建立;同时,本发明挖掘出的评估指标还可应用于其它类营销业务,如根据用户的疾病标签丰富度和价值度开辟新业务,结合保险、慢病管理等,从用户身上获得潜在的和更长期的收益。
本发明的计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现下述的用户价值评估方法。所述存储介质包括:只读存储器(Read-Only Memory,ROM)、随机访问存储器(Random Access Memory,RAM)、磁碟、U盘、存储卡或者光盘等各种可以存储程序代码的介质。
可以采用一个或多个存储介质的任意组合。存储介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机盘、硬盘、RAM、ROM、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
下面将参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本发明。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些计算机程序指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。
也可以把这些计算机程序指令存储在计算机可读介质中,这些指令使得计算机、其它可编程数据处理装置、或其他设备以特定方式工作,从而,存储在计算机可读介质中的指令就产生出包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的指令的制造品(article of manufacture)。
也可以把计算机程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机或其它可编程装置上执行的指令提供实现流程图和/或框图中的一个或多个方框中规定的功能/动作的过程。
本发明的电子设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序。
优选地,所述存储器包括:ROM、RAM、磁碟、U盘、存储卡或者光盘等各种可以存储程序代码的介质。
所述处理器与所述存储器相连,用于执行所述存储器存储的计算机程序,以使所述电子设备执行下述用户价值评估方法的步骤。
优选地,所述处理器可以是通用处理器,包括中央处理器(Central ProcessingUnit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
于一实施例中,所述电子设备包括终端和/或服务器。
图1示出了适于用来实现本发明实施方式的示例性终端1的框图。
图1显示的终端1仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图1所示,终端1以通用计算设备的形式表现。终端1的组件可以包括但不限于:一个或者多个处理器或者处理单元11,存储器12,连接不同系统组件(包括存储器12和处理单元11)的总线13。
总线13表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture,简称ISA)总线,微通道体系结构(Micro Channel Architecture,简称MCA)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,简称VESA)局域总线以及外围组件互连(Peripheral Component Interconnect,简称PCI)总线。
终端1典型地包括多种计算机系统可读介质。这些介质可以是任何能够被终端1访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器12可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)121和/或高速缓存存储器122。终端1可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统123可以用于读写不可移动的、非易失性磁介质(图1未显示,通常称为“硬盘驱动器”)。尽管图1中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线13相连。存储器12可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块1241的程序/实用工具124,可以存储在例如存储器12中,这样的程序模块1241包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块1241通常执行本发明所描述的实施例中的功能和/或方法。
终端1也可以与一个或多个外部设备2(例如键盘、指向设备、显示器3等)通信,还可与一个或者多个使得用户能与该终端1交互的设备通信,和/或与使得该终端1能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口14进行。并且,终端1还可以通过网络适配器15与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图1所示,网络适配器15通过总线13与终端1的其它模块通信。应当明白,尽管图中未示出,可以结合终端1使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
如图2所示,于一实施例中,本发明的用户价值评估方法包括以下步骤:
步骤S1、获取对应待评估用户的评估指标。
于一实施例中,所述待评估用户包括使用终端上的APP(应用程序,Application的缩写)的指定用户。
于一实施例中,该终端包括智能终端。
需要说明的是,该智能终端包括并不限于智能手机、平板电脑、掌上电脑(PersonalDigital Assistant,PDA)以及其他具有数据处理功能的终端设备;通常,智能终端是指具有独立的操作系统,可以由用户自行安装软件、游戏等第三方服务商提供的程序,通过此类程序来不断对手持设备的功能进行扩充,并可以通过移动通讯网络来实现无线网络接入的这样一类终端设备。
具体地,在智能终端上安装有一APP,该待评估用户通过该智能终端使用该APP,从而会在该APP上产生一系列的行为动作。
需要说明的是,用户在使用智能终端上的APP时,通常需要先登录;具体地,登录方式有很多种,诸如,通过手机号码、微信、QQ、身份证号等进行登录。
进一步地,在使用该APP的过程中,有时还需要对用户进行实名认证(通常是基于用户的身份证号、姓名、银行卡等进行实名认证)。
于一实施例中,待评估用户通过身份证号登录APP。
于一实施例中,待评估用户于APP上利用身份证号进行实名认证。
于一实施例中,将本发明的用户价值评估方法应用于一终端。
需要说明的是,该用户价值评估方法应用的终端与安装有上述APP的终端可以为同一终端,也可以为两个不同的终端。
如图3所示,于一实施例中,所述获取对应待评估用户的评估指标包括:
步骤S11、获取对应所述指定用户的目标信息。
需要说明的是,所述目标信息至少包括但并不限于以下任意一种:用户信息、于所述APP上的活跃度、收入贡献及用户行为。
需要说明的是,考虑到不同年龄段的用户对APP的使用需求不同,在进行用户价值评估时,将用户的年龄作为一评估指标;具体地,当指定用户登录终端上的APP时,该指定用户使用其身份证号进行实名认证,该终端通过一定规则分析该身份证号,即可获得对应该指定用户的用户信息,诸如,年龄。
进一步地,该用户信息还可包括对应指定用户的BMI(Body Mass Index)指数等。
需要说明的是,该活跃度包括最近一次活跃间隔、最近一个月活跃天数、最近一个月日均APP访问时长等;该收入贡献包括指定用户最近一个月在APP内产生的所有收入,包括商城商品购买、付费问诊,处方购药、红包打赏、私家医生、挂号和外部名医等业务产生的所有收入。
于一实施例中,所述获取对应所述指定用户的目标信息包括:获取于一预设时间段内对应所述指定用户的目标信息。
需要说明的是,该预设时间段是预先设置的一具体时间段,于一实施例中,其具体设置为多少,不作为限制本发明的条件,在实际应用中,可根据具体应用场景来设定,诸如,一个月、半年,或者是一年。
具体地,所述用户信息对应用户指标;于所述APP上的活跃度对应活跃度指标;所述收入贡献对应贡献指标;所述用户行为对应行为指标。
步骤S12、根据所述目标信息获取所述评估指标。
于一实施例中,所述评估指标至少包括但并不限于以下任意一种:所述用户指标、所述活跃度指标、所述贡献指标及所述行为指标。
于一实施例中,所述行为指标至少包括但并不限于以下任意一种:于所述APP上执行所述用户行为的频次和深度指标、于所述APP上是否付费、用户反馈信息、是否复诊指标及所述用户行为对应的疾病的权重;诸如,该行为指标还可包括:是否挂取专家号;其中,是否复诊指标、所述用户行为对应的疾病的权重及是否挂取专家号主要是针对一些医疗APP。
需要说明的是,为了后续步骤S2中的特征选择工程,在该行为指标中加入是否复诊指标。
需要说明的是,于不同的实施例中,本发明可以仅根据用户行为对APP进行用户价值评估,也可以以用户行为为主,结合用户信息、活跃度、收入贡献中的至少一种对APP进行用户价值评估。
步骤S2、对所述评估指标进行特征选择,获取最优指标集。
需要说明的是,特征选择(Feature Selection)是特征工程里的一个重要问题,其目标是寻找最优特征子集;特征选择能剔除不想管或冗余的特征,从而达到减少特征个数,提高模型精确度,减少运行时间的目的。
如图4所示,于一实施例中,所述对所述评估指标进行特征选择包括:
步骤S21、获取所述评估指标对应的数值分布。
具体地,对各评估指标进行数据无量纲的归一化,获取各评估指标对应的数值分布。
需要说明的是,数据归一化是为了将数转换为(0,1)之间的小数,把有量纲的转换为无量纲的;归一化的好处在于,在多指标评价体系中,由于各评价指标的性质,通常具有不同的量纲和数量级,当各指标间的水平相差很大时,如果直接用原始指标值进行分析,就会突出数值较高的指标在综合分析中的作用,相对削弱值水平低指标的作用,因此,为了保证结果的可靠性,需要对原始数据进行标准化处理。
经验上来说,归一化就是让不同维度之间的特征在数值上有一定比较性,可以大大提高分类器的准确性。
于一实施例中,采用min-max标准化(Min-Max Normalization)方法,公式表达为:
Figure BDA0003846150240000091
其中,n表示所有评估指标的总数量;
Figure BDA0003846150240000092
表示所有评估指标组成的集合中的最小值;
Figure BDA0003846150240000093
表示所有评估指标组成的集合中的最大值;xi表示第i个评估指标;yi表示第i个评估指标被归一化处理后对应产生的数值。
具体地,采用上述方法对各评估指标进行归一化处理后,获取各评估指标对应的数值,由该数值组成的集合即为上述步骤S21中所述的数值分布。
需要说明的是,也可以采用现有其它的方法实现对各评估指标的数据无量纲的归一化。
步骤S22、将所述评估指标和所述数值分布均输入至决策树算法模型中,以使所述决策树算法模型基于预设规则和所述数值分布对所述评估指标进行特征选择,并输出决策树。
需要说明的是,决策树(Decision Tree)是一种简单但是广泛使用的分类器,通过训练数据构建决策树,可以高效的对未知数据进行分类;它有两大优点:1)可读性好,具有描述性,有助于人工分析;2)效率高,决策树只需要一次构建,反复使用,每一次预测的最大计算次数不超过决策树的深度。
具体地,所述决策树中的每一树节点对应所述最优指标集中的一指标。
于一实施例中,所述预设规则为:按照所有的评估指标对应的数值分布从大到小的顺序排列所有的评估指标,以从这些评估指标中选择出预设数量的评估指标。
需要说明的是,在按照上述预设规则对评估指标进行特征选择时,优先选取的是数值分布较大的评估指标。
进一步地,上述预设规则中的预设数量具体设为多少,不作为限制本发明的条件,在实际应用中,可根据具体应用场景来设定。
需要说明的是,预设规则具体设为什么样的规则,不作为限制本发明的条件,在实际应用中,可根据具体应用场景来设定(上述实施例中介绍的预设规则作为一种优选的实施例)。
如图5所示,于一实施例中,在对所述评估指标进行特征选择之前,所述方法还包括:
步骤S5、对所述评估指标进行数据清洗,获取清洗后的指标,以对所述清洗后的指标进行特征选择,获取最优指标集。
需要说明的是,数据清洗是指对所述评估指标中的残缺数据、无效数据和重复数据进行识别及处理,数据清洗用于发现并纠正评估指标中可识别的错误,包括检查数据一致性,处理无效值和缺失值等。
具体地,步骤S5中对清洗后的指标进行特征选择,与上述步骤S2中,对评估指标进行特征选择,采取的技术手段是相同的,只是特征选择的对象有所区别,步骤S2中,特征选择的对象是评估指标,而步骤S5中,特征选择的对象是清洗后的指标,故在此不再详细赘述。
步骤S3、对所述最优指标集中的每一指标进行价值评分,得到所述最优指标集中的每一指标的评分值。
如图6所示,于一实施例中,所述对所述最优指标集中的每一指标进行价值评分,得到所述最优指标集中的每一指标的评分值包括:
步骤S31、计算每一所述树节点的信息增益(Information Gain)。
具体地,所述信息增益为所述树节点对应的所述最优指标集中的一指标的评分值。
需要说明的是,将上述决策树中每个树节点的信息增益按照从大到小的顺序排序;在决策树算法中,信息增益的物理意义为一个特征能够为一个分类系统带来多少信息,带来的信息越多,说明该特征越重要,相应的信息增益也就越大;因此,可以根据信息增益的大小来评估各特征的重要性,即确定本发明的最优指标集中的各指标的评分值。
需要说明的是,信息增益是以信息熵为基础,计算当前划分对信息熵所造成的变化,而信息熵是度量样本集合“纯度”最常用的一种指标。
假定当前样本集合D(对应上述的最优指标集)中第k类样本(对应最优指标集中的指标)所占的比例为pk,则该当前样本集合D的信息熵定义为:
Figure BDA0003846150240000111
其中,y表示训练数据中所包含训练样本的总数。
若p=0,则plog2p=0;Ent(D)的最小值为0,最大值为log2|y|。
Ent(D)的值越小,则D的纯度越高。
以属性a(对应最优指标集中的指标)对数据集D进行划分(对应上述的决策树)所获得的信息增益为:
Figure BDA0003846150240000112
其中,Gain(D,a)表示属性a的信息增益;Ent(D)表示划分前的信息熵;
Figure BDA0003846150240000113
表示划分后的信息熵;
Figure BDA0003846150240000114
表示第v个分支的权重,样本越多越重要。
信息增益越大,则意味着使用属性a来进行划分所获得的“纯度提升”越大。
步骤S32、将所述信息增益作为所述树节点对应的所述最优指标集中的指标的评分值。
需要说明的是,经上述公式计算出每一所述树节点的信息增益后,将该信息增益作为该树节点对应的最优指标集中的指标的评分值,以在后续步骤S4中,基于该信息增益评估所述待评估用户的用户价值。
步骤S4、对所述最优指标集中所有指标的评分值进行计算,获取所述待评估用户的用户价值。
具体地,该最优指标集中所有指标的评分值分别对应上述决策树中每一树节点的信息增益。
如图7所示,于一实施例中,对所述最优指标集中所有指标的评分值进行计算,获取所述待评估用户的用户价值包括:
步骤S41、对所述最优指标集中所有指标的评分值进行加权求和,得到求和结果。
具体地,为最优指标集中所有的指标的评分值(即对应上述的信息增益)赋予相应的权重,然后采用加权求和的方式得到求和结果。
步骤S42、将所述求和结果作为所述用户价值。
如图8所示,于一实施例中,所述方法还包括:
步骤S6、根据所述用户价值为所述待评估用户推荐信息。
具体地,经上述步骤S4评估出待评估用户的用户价值后,根据不同待评估用户对应的不同的用户价值,为待评估用户推荐不同用户价值对应的不同的信息。
需要说明的是,不同的用户价值,对应推荐的信息也有所不同;诸如,将用户价值分为三类,分别为:高、中、低;具体地,当待评估用户的用户价值为高时,为该用户推送特定提醒,例如结合文字分析进行问诊提示或者体检提示,还可以合理发放红包;当待评估用户的用户价值为中时,可以向其推荐活动信息,例如重点进行红包活动行销;当待评估用户的用户价值为低时,对该用户主要进行促进消费升级的活动运营。
进一步地,根据步骤S4中评估出的待评估用户的用户价值,确定每个用户的用户价值的等级(高/中/低)。
如图9所示,于一实施例中,所述方法还包括:
步骤S7、根据所述用户价值对所述待评估用户进行等级划分。
例如,在0-50之间的用户价值确定为低,对应的用户为低级用户;在50-100之间的用户价值确定为中,对应的用户为中级用户;大于100的用户价值确定为高,对应的用户为高级用户。
需要说明的是,本发明所述的用户价值评估方法的保护范围不限于本实施例列举的步骤执行顺序,凡是根据本发明的原理所做的现有技术的步骤增减、步骤替换所实现的方案都包括在本发明的保护范围内。
下面通过具体实施例来进一步解释说明本发明的用户价值评估方法。
目前,主流的会员积分体系主要包括三大类,一是以刺激消费为核心需求的纯售卖商品的业务,如传统行业和电商类平台,用户价值完全以用户消费额度来评估;二是内容类产品,用户价值以用户活跃度和黏性作为核心评估指标;三是综合类产品,兼顾用户活跃度和消费额度来评估用户价值。
但是针对C端(C端指的是消费者、个人用户Consumer,即面向个人用户提供服务的医疗终端产品,是直接服务于用户的)医疗类,特别是以线上问诊为核心业务的平台,需充分考虑其业务的特殊性,不能忽视围绕用户问诊行为(对应上述的用户行为)产生的一系列核心价值,所以不能照搬以上三类会员积分体系所运用的用户价值评估模型,因此,如何将问诊这一核心需求融入到用户价值评估模型中成为待解决的难题。
于一实施例中,将本发明的用户价值评估方法应用于评估医疗APP的用户价值;具体地,待评估用户于该医疗APP上的用户行为为问诊行为;对应获取的行为指标包括以下6大类:
(1)问诊频次。具体地,问诊频次可以是半年内问诊的次数、一年内或其他合理设置的时间段内用户问诊次数。
(2)是否付费,是否挂取专家号。
具体地,愿意付费的用户价值高于免费用户,选择专家号的用户价值高于普通号。
(3)问诊对话深度类:主要根据对话回合数和用户与医生的问诊对话内容进行文本识别,通过业务建模识别有效文本内容和对话关键字,再对满足规则的文本或对话内容进行有效性计数,最终得到对话的深度指标,包括对话回合数和对话信息价值度。
其中,对话信息价值度可以根据对话内容的篇幅长短、对话关键字是否涉及某一病症的表现等方式确定。
(4)用户反馈类:问诊后通过发放问卷得到用户的反馈评价,根据问卷中每项问题的得分,根据NPS(NetPromoter Score,净推荐值)的计算模型得到用户对问诊服务的满意度得分,得分越高者,用户复诊的概率越大,价值越高。
(5)处方支付类:医生开具处方后,用户是否支付,愿意支付的用户表明对问诊小结更满意,同时也更愿意为问诊后处方开药付费,用户价值更高。
(6)疾病标签类:包括拟诊的疾病标签丰富度和其对应的标签权重价值度。疾病标签越丰富,我们获得的用户疾病信息就越多,因为针对用户各类疾病的针对性的运营措施和创收的可能性就越高,用户价值自然更大。两个不同的疾病标签权重应予以区别,实际应用中可以采用专家对疾病标签标识的有效期或者其他的疾病经验数据来确定其权重。
以下通过实际应用中的一个评分结果示例说明:
针对问诊频次:将问诊频次5次以上的记5分,问诊频次在1-3次之间的记3分,问诊频次仅有1次的记1分;
付费标准:针对用户挂号为专家号的记5分,用户挂号为普通号的记3分,预约挂号却没付费的记1分;
用户反馈:根据问卷中每项问题的得分所确定的用户对问诊服务的满意度得分包括:用户给出好评记为5分,用户给出一般评价记为3分,用户给出差评记为1分;
处方支付:针对医生开具的处方,支付处方费用记为5分,不支付处方费用记为1分;
疾病标签,按照标签个数给分。具体地,用户包括1个疾病标签,记为1分,用户包括3个疾病标签,记为3分。
诸如,于一实施例中,用户A的问诊频次为3次,每次挂号为专家号,用户反馈给出一次好评,两次一般评价,三次处方均支付,具有3个疾病标签,则用户A的用户价值为:3+5*3+(5+3*2)+5*3+3=47。
用户B的问诊频次为1次,挂号为专家号,用户反馈给出一般评价,处方未支付,具有一个疾病标签,则用户B的用户价值为:3+5+3+1+1=13。
根据用户A和用户B的用户价值,可知用户A的等级高于用户B。
需要说明的是,主流使用的用户价值评估方法都是基于用户活跃度和消费金额作为主要特征指标,本发明充分考虑以线上问诊为核心业务的医疗APP用户的行为属性,根据用户问诊行为挖掘出的一系列行为指标,更加准确合理的评估此类业务APP的用户价值;同时,根据机器学习中的特征工程,确定各核心行为的特征权重,以此作为会员等级积分加减规则的重要依据。
需要说明的是,于实际应用中,本发明的用户价值评估方法还适用于同时有问诊业务和商城等其它综合业务的平台产品会员积分体系的建立;同时,本发明通过数据挖掘分析出的问诊行为的评估指标还可应用于其它类营销业务,如根据用户的疾病标签丰富度、价值度和/或用户等级开辟新业务,结合保险、慢病管理等,从用户身上获得潜在的和更长期的收益。
进一步地,具体实施过程中,可以根据用户的疾病标签评估用户是否满足购买某保险的条件,也可以通过疾病标签或问诊对话深度内容分析用户的慢性病,向用户推荐慢病管理相关信息。
如图10所示,于一实施例中,本发明的用户价值评估装置包括:
指标获取模块101,用于获取对应待评估用户的评估指标。
特征选择模块102,用于对所述评估指标进行特征选择,获取最优指标集。
评分获取模块103,用于对所述最优指标集中的每一指标进行价值评分,得到所述最优指标集中的每一指标的评分值。
所述价值评估模块104,用于对所述最优指标集中所有指标的评分值进行计算,获取所述待评估用户的用户价值。
需要说明的是,所述指标获取模块101、所述特征选择模块102、所述评分获取模块103及所述价值评估模块104的结构及原理与上述用户价值评估方法的工作原理相同,故在此不再赘述。
需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,x模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上x模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个数字信号处理器(Digital Signal Processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(Central Processing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(System-On-a-Chip,简称SOC)的形式实现。
需要说明的是,本发明的用户价值评估装置可以实现本发明的用户价值评估方法,但本发明的用户价值评估方法的实现装置包括但不限于本实施例列举的用户价值评估装置的结构,凡是根据本发明的原理所做的现有技术的结构变形和替换,都包括在本发明的保护范围内。
综上所述,本发明的用户价值评估方法、装置、电子设备及存储介质,与现有技术相比,本发明提供的用户价值评估方法,通过挖掘出的对应待评估用户的评估指标,能够基于该评估指标实现对不同待评估用户的价值评估,且保证了用户价值评估的准确合理性;本发明通过充分考虑用户在APP上的用户行为,并根据该用户行为挖掘出了一系列的行为指标,如,于APP上执行用户行为的频次和深度指标、于APP上是否付费、用户反馈信息、是否复诊指标及用户行为对应的疾病的权重,更加准确合理地评估了该APP的用户价值;本发明通过根据机器学习的特征工程中的特征选择,确定最优指标集中各指标的价值评分,并以此作为用户价值评估的重要依据;本发明的用户价值评估方法适用于同时有问诊业务和商城等其它综合业务的平台产品会员积分体系的建立;同时,本发明挖掘出的评估指标还可应用于其它类营销业务,如根据用户的疾病标签丰富度和价值度开辟新业务,结合保险、慢病管理等,从用户身上获得潜在的和更长期的收益;所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (10)

1.一种用户价值评估方法,其特征在于,包括以下步骤:
获取对应待评估用户的评估指标;
对所述评估指标进行特征选择,获取最优指标集;
对所述最优指标集中的每一指标进行价值评分,得到所述最优指标集中的每一指标的评分值;
对所述最优指标集中所有指标的评分值进行计算,获取所述待评估用户的用户价值。
2.根据权利要求1所述的用户价值评估方法,其特征在于,所述待评估用户包括使用APP的指定用户;所述获取对应待评估用户的评估指标包括:
获取对应所述指定用户的目标信息;所述目标信息至少包括以下任意一种:用户信息、于所述APP上的活跃度、收入贡献及用户行为;其中,所述用户信息对应用户指标;于所述APP上的活跃度对应活跃度指标;所述收入贡献对应贡献指标;所述用户行为对应行为指标;
根据所述目标信息获取所述评估指标;所述评估指标至少包括以下任意一种:所述用户指标、所述活跃度指标、所述贡献指标及所述行为指标;其中,所述行为指标至少包括以下任意一种:于所述APP上执行所述用户行为的频次和深度指标、于所述APP上是否付费、用户反馈信息、是否复诊指标及所述用户行为对应的疾病的权重。
3.根据权利要求2所述的用户价值评估方法,其特征在于,所述获取对应所述指定用户的目标信息包括:
获取于一预设时间段内对应所述指定用户的目标信息。
4.根据权利要求1所述的用户价值评估方法,其特征在于,所述对所述评估指标进行特征选择包括:
获取所述评估指标对应的数值分布;
将所述评估指标和所述数值分布均输入至决策树算法模型中,以使所述决策树算法模型基于预设规则和所述数值分布对所述评估指标进行特征选择,并输出决策树;所述决策树中的每一树节点对应所述最优指标集中的一指标。
5.根据权利要求4所述的用户价值评估方法,其特征在于,所述对所述最优指标集中的每一指标进行价值评分,得到所述最优指标集中的每一指标的评分值包括:
计算每一所述树节点的信息增益;
将所述信息增益作为所述树节点对应的所述最优指标集中的指标的评分值。
6.根据权利要求1所述的用户价值评估方法,其特征在于,所述方法还包括:
在对所述评估指标进行特征选择之前,对所述评估指标进行数据清洗,获取清洗后的指标,以对所述清洗后的指标进行特征选择,获取最优指标集;和/或
所述对所述最优指标集中所有指标的评分值进行计算,获取所述待评估用户的用户价值包括:
对所述最优指标集中所有指标的评分值进行加权求和,得到求和结果;
将所述求和结果作为所述用户价值。
7.根据权利要求1所述的用户价值评估方法,其特征在于,所述方法还包括:
根据所述用户价值为所述待评估用户推荐信息,和/或对所述待评估用户进行等级划分。
8.一种用户价值评估装置,其特征在于,包括:
指标获取模块,用于获取对应待评估用户的评估指标;
特征选择模块,用于对所述评估指标进行特征选择,获取最优指标集;
评分获取模块,用于对所述最优指标集中的每一指标进行价值评分,得到所述最优指标集中的每一指标的评分值;
价值评估模块,用于对所述最优指标集中所有指标的评分值进行计算,获取所述待评估用户的用户价值。
9.一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的用户价值评估方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的用户价值评估方法的步骤。
CN202211117957.5A 2022-09-14 2022-09-14 用户价值评估方法、装置、电子设备及存储介质 Pending CN115375177A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211117957.5A CN115375177A (zh) 2022-09-14 2022-09-14 用户价值评估方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211117957.5A CN115375177A (zh) 2022-09-14 2022-09-14 用户价值评估方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN115375177A true CN115375177A (zh) 2022-11-22

Family

ID=84072662

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211117957.5A Pending CN115375177A (zh) 2022-09-14 2022-09-14 用户价值评估方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN115375177A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111104979A (zh) * 2019-12-18 2020-05-05 北京思维造物信息科技股份有限公司 一种用户行为价值评估模型的生成方法、装置及设备
CN115774816A (zh) * 2023-02-10 2023-03-10 成都萌想科技有限责任公司 基于用户价值的内容淘汰方法、系统、设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111104979A (zh) * 2019-12-18 2020-05-05 北京思维造物信息科技股份有限公司 一种用户行为价值评估模型的生成方法、装置及设备
CN115774816A (zh) * 2023-02-10 2023-03-10 成都萌想科技有限责任公司 基于用户价值的内容淘汰方法、系统、设备及存储介质
CN115774816B (zh) * 2023-02-10 2023-04-11 成都萌想科技有限责任公司 基于用户价值的内容淘汰方法、系统、设备及存储介质

Similar Documents

Publication Publication Date Title
US9501799B2 (en) System and method for determination of insurance classification of entities
US9830663B2 (en) System and method for determination of insurance classification and underwriting determination for entities
CN106611375A (zh) 一种基于文本分析的信用风险评估方法及装置
CN115375177A (zh) 用户价值评估方法、装置、电子设备及存储介质
CN107767070B (zh) 用于信息推广的方法及装置
CN111210335B (zh) 用户风险识别方法、装置及电子设备
US20190080352A1 (en) Segment Extension Based on Lookalike Selection
CN111179051A (zh) 金融目标客户确定方法、装置及电子设备
CN111210336A (zh) 用户风险模型生成方法、装置及电子设备
CN112750029A (zh) 信用风险预测方法、装置、电子设备及存储介质
Mak et al. A financial data mining model for extracting customer behavior
CN113034046A (zh) 一种数据风险计量方法、装置、电子设备及存储介质
KR20210157767A (ko) 재무관리시스템 및 방법
Angelia et al. Effect of attitude on mobile banking acceptance using extended UTAUT model
CN112950347A (zh) 资源数据处理的优化方法及装置、存储介质、终端
JP2021197089A (ja) 出力装置、出力方法及び出力プログラム
Khadivizand et al. Towards intelligent feature engineering for risk-based customer segmentation in banking
CN111192045A (zh) 基于交易记录信息的反作弊方法、装置和系统
CN115809930A (zh) 基于数据融合匹配的反欺诈分析方法、装置、设备及介质
Xiong et al. Do stock bulletin board systems (BBS) contain useful information? A viewpoint of interaction between BBS quality and predicting ability
CN113393295A (zh) 服务数据的推送方法、装置、电子设备及存储介质
Singh et al. Examining efficiencies of Indian ADRs and their underlying stocks
CN112348658A (zh) 资源分配方法、装置及电子设备
JP7302107B1 (ja) 学習システム、学習方法、及びプログラム
Wang et al. Semi-strong efficient market of Bitcoin and Twitter: An analysis of semantic vector spaces of extracted keywords and light gradient boosting machine models

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination