CN107038256B - 基于数据源的业务定制装置、方法及计算机可读存储介质 - Google Patents
基于数据源的业务定制装置、方法及计算机可读存储介质 Download PDFInfo
- Publication number
- CN107038256B CN107038256B CN201710313995.0A CN201710313995A CN107038256B CN 107038256 B CN107038256 B CN 107038256B CN 201710313995 A CN201710313995 A CN 201710313995A CN 107038256 B CN107038256 B CN 107038256B
- Authority
- CN
- China
- Prior art keywords
- user
- data source
- group
- business
- user group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Abstract
本发明涉及一种基于数据源的业务定制装置、方法及计算机可读存储介质,基于数据源的业务定制装置包括:存储器、处理器及存储在存储器上并可在处理器上运行的基于数据源的业务定制系统,基于数据源的业务定制系统被处理器执行时实现如下步骤:获取预定的各数据源中的用户生成内容;利用预先训练生成的用户群体标签识别模型对用户生成内容进行识别,以识别出各数据源对应的用户群体标签;根据预定的用户群体标签与群体业务的映射关系确定各数据源对应的群体业务,将各数据源与对应的群体业务发送给预定的终端,以对各数据源进行群体业务定制。本发明能够大范围地进行业务定制,提高业务定制的效率。
Description
技术领域
本发明涉及互联网技术领域,尤其涉及一种基于数据源的业务定制装置、方法及计算机可读存储介质。
背景技术
用户生成内容(UGC,User Generated Content)是由用户在网站或其他开放性媒介中参与生成的内容,该内容可独立传播展示并播放,例如微博、论坛讨论、用户自制的音视频、问答、各种网络新闻等等。目前,很多金融公司(例如,银行、保险等公司)基于这些用户生成内容进行分析,并确定用户的行为特征标签,进而根据用户的行为特征标签定制(或推广)对应的业务。
然而,这种确定每个用户的行为特征标签并为每个用户定制业务的方案,相对于网络上海量的用户生成内容,会使得业务的定制受到很大的局限性,业务定制的效率低下。
发明内容
本发明的目的在于提供一种基于数据源的业务定制装置、方法及计算机可读存储介质,旨在基于群体性的数据源进行大范围的业务定制,提高业务定制的效率。
为实现上述目的,本发明提供一种基于数据源的业务定制装置,所述基于数据源的业务定制装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于数据源的业务定制系统,所述基于数据源的业务定制系统被所述处理器执行时实现如下步骤:
S1,获取预定的各数据源中的用户生成内容;
S2,利用预先训练生成的用户群体标签识别模型对所述用户生成内容进行识别,以识别出各数据源对应的用户群体标签;
S3,根据预定的用户群体标签与群体业务的映射关系确定各所述数据源对应的群体业务,将各所述数据源与对应的群体业务发送给预定的终端,以对各所述数据源进行群体业务定制。
优选地,所述用户群体标签识别模型基于最大熵准则进行建立,所述用户群体标签识别模型的模型函数包括用户行为属性分布函数,所述用户行为属性分布函数为:
所述x为用户,所述y为用户标签,所述fj(x,y)为用户x的第j个特征的属性,λj,y={λ1,y,λ2,y,λ3,y,...,λF,y}为用户的行为属性的概率分布,所述Z(x)是正规化因子。
优选地,所述用户群体标签识别模型的模型函数还包括最优化函数,所述最优化函数为:
所述p(xi,yi)为用户xi的标签yi在用户群体标签中出现的概率,所述为用户的行为属性的似然函数,所述为正则化因子,所述β为控制所述最优化函数正则化程度的参数。
优选地,所述用户群体标签识别模型的识别过程包括对所述用户的行为属性的概率分布进行求解迭代,以及在每一迭代的过程中还包括微分模式迭代。
优选地,所述基于数据源的业务定制系统被所述处理器执行步骤S1之前,还包括:
S01,获取预设数量的数据源中的用户生成内容,以获取的每一数据源中的用户生成内容为一群体数据样本,并为每一群体数据样本标注对应的用户群体标签;
S02,将所述群体数据样本分为预设的第一比例的训练集及预设的第二比例的验证集,所述第一比例及第二比例之和小于等于1;
S03,利用所述训练集中的群体数据样本对预定的用户群体标签识别模型进行训练,并在训练完成后利用所述验证集对训练后的用户群体标签识别模型的准确率进行验证;
S04,若所述准确率大于预设阈值,则模型训练结束,以训练后的用户群体标签识别模型作为所述步骤S2中的用户群体标签识别模型,或者,若准确率小于等于预设阈值,则增加数据源的数量,并基于增加后的数据源重新进行训练。
为实现上述目的,本发明还提供一种基于数据源的业务定制方法,所述基于数据源的业务定制方法包括:
S1,获取预定的各数据源中的用户生成内容;
S2,利用预先训练生成的用户群体标签识别模型对所述用户生成内容进行识别,以识别出各数据源对应的用户群体标签;
S3,根据预定的用户群体标签与群体业务的映射关系确定各所述数据源对应的群体业务,将各所述数据源与对应的群体业务发送给预定的终端,以对各所述数据源进行群体业务定制。
优选地,所述用户群体标签识别模型基于最大熵准则进行建立,所述用户群体标签识别模型的模型函数包括用户行为属性分布函数,所述用户行为属性分布函数为:
所述x为用户,所述y为用户标签,所述fj(x,y)为用户x的第j个特征的属性,λj,y={λ1,y,λ2,y,λ3,y,...,λF,y}为用户的行为属性的概率分布,所述Z(x)是正规化因子。
优选地,所述用户群体标签识别模型的模型函数还包括最优化函数,所述最优化函数为:
所述p(xi,yi)为用户xi的标签yi在用户群体标签中出现的概率,所述为用户的行为属性的似然函数,所述为正则化因子,所述β为控制所述最优化函数正则化程度的参数。
优选地,所述步骤S1之前包括:
S01,获取预设数量的数据源中的用户生成内容,以获取的每一数据源中的用户生成内容为一群体数据样本,并为每一群体数据样本标注对应的用户群体标签;
S02,将所述群体数据样本分为预设的第一比例的训练集及预设的第二比例的验证集,所述第一比例及第二比例之和小于等于1;
S03,利用所述训练集中的群体数据样本对预定的用户群体标签识别模型进行训练,并在训练完成后利用所述验证集对训练后的用户群体标签识别模型的准确率进行验证;
S04,若所述准确率大于预设阈值,则模型训练结束,以训练后的用户群体标签识别模型作为所述步骤S2中的用户群体标签识别模型,或者,若准确率小于等于预设阈值,则增加数据源的数量,并基于增加后的数据源重新进行训练。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有基于数据源的业务定制系统,所述基于数据源的业务定制系统被处理器执行时实现上述的基于数据源的业务定制方法的步骤。
本发明的有益效果是:本发明获取预定的各数据源中的用户生成内容,利用用户群体标签识别模型识别出各数据源对应的用户群体标签,并确定各数据源对应的群体业务,将各数据源与对应的群体业务发送给预定的终端,本发明利用用户群体标签识别模型快速、准确地对各数据源中的用户进行识别,以识别出各数据源对应的用户群体标签,基于群体性的数据源对应的用户群体标签进行群体业务定制,能够大范围地进行业务定制,提高业务定制的效率。
附图说明
图1为本发明各个实施例一可选的应用环境示意图;
图2是图1中基于数据源的业务定制装置一实施例的硬件架构的示意图;
图3为本发明基于数据源的业务定制方法第一实施例的流程示意图;
图4为本发明基于数据源的业务定制方法第二实施例的流程示意图;
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
参阅图1,是本发明各个实施例一可选的应用环境示意图。
在本实施例中,本发明可应用于包括,但不仅限于,基于数据源的业务定制装置1、终端2、网络3的应用环境中。其中,所述基于数据源的业务定制装置1可以是移动电话、智能电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、导航装置等等的可移动设备,以及诸如数字TV、台式计算机、笔记本、服务器等等的固定终端。所述网络3可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication,GSM)、宽带码分多址(Wideband CodeDivision Multiple Access,WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。其中,所述基于数据源的业务定制装置1通过所述网络3分别与一个或多个所述终端2通信连接。
参阅图2,是图1中基于数据源的业务定制装置1一可选的硬件架构的示意图,本实施例中,基于数据源的业务定制装置1可包括,但不仅限于,可通过系统总线相互通信连接基于数据源的业务定制系统10、存储器11、处理器12、网络接口13。需要指出的是,图2仅示出了具有组件10-13的基于数据源的业务定制装置1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器11可以是所述基于数据源的业务定制装置1的内部存储单元,例如该基于数据源的业务定制装置1的硬盘或内存。在另一些实施例中,所述存储器11也可以是所述基于数据源的业务定制装置1的外部存储设备,例如该基于数据源的业务定制装置1上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器11还可以既包括所述基于数据源的业务定制装置1的内部存储单元也包括其外部存储设备。本实施例中,所述存储器11通常用于存储安装于所述基于数据源的业务定制装置1的操作系统和各类应用软件,例如所述基于数据源的业务定制系统10的程序代码等。此外,所述存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器12在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述基于数据源的业务定制装置1的总体操作,例如执行与所述终端2进行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如运行所述基于数据源的业务定制系统10等。
所述网络接口13可包括无线网络接口或有线网络接口,该网络接口13通常用于在所述基于数据源的业务定制装置1与其他电子设备之间建立通信连接。本实施例中,所述网络接口13主要用于通过所述网络3将所述基于数据源的业务定制装置1与一个或多个所述终端2相连,以建立数据传输通道和通信连接。
其中,上述基于数据源的业务定制系统10被所述处理器12执行时实现如下步骤:
步骤S1,获取预定的各数据源中的用户生成内容;
本实施例中,预定的数据源可以是微博网站、论坛网站及网络新闻网站等,其中,每个数据源中有大量的用户,每一用户均可以自行参与或制作用户生成内容。
本实施例中,业务定制系统可以实时获取各数据源中的用户生成内容,以获取各数据源中最新的用户生成内容,也可以定时(例如每隔一小时)获取各数据源中的用户生成内容,以减轻系统负担。
具体地,在一数据源中产生用户生成内容后,可以将产生的用户生成内容主动发送给上述的业务定制系统,或者将其存储至预定的服务器的存储区域中,然后由业务定制系统从该服务器中获取该用户生成内容。
步骤S2,利用预先训练生成的用户群体标签识别模型对所述用户生成内容进行识别,以识别出各数据源对应的用户群体标签;
其中,预先训练生成的用户群体标签识别模型为机器学习模型,例如可以是支持向量机模型或者随机森林模型等,当然也可以是其他的模型。
优选地,用户群体标签识别模型为基于最大熵准则进行建立的模型,以具有最大熵的概率分布作为用户的行为属性的概率分布,用户群体标签识别模型的模型函数包括用户行为属性分布函数,用户行为属性分布函数用以描述各用户对应的行为属性的概率分布状况,用户行为属性分布函数为:
该用户行为属性分布函数为一指数分布函数,其中,x为用户,y为用户标签(用户标签例如为“理财”、“证券”或“保险”等),fj(x,y)为用户x的第j个行为属性(用户的行为属性为其在数据源中所做出的行为,例如包括用户在数据源中发表的内容、讨论的内容等等),F为用户x的行为属性的总数,λj,y={λ1,y,λ2,y,λ3,y,...,λF,y}为用户的行为属性的概率分布(即),Z(x)是正规化因子,Z(x)的作用是为了使得用户行为属性分布函数pΛ(y|x)归一化在[0,1]的范围内,其值为
本实施例中,基于最大熵准则建立的用户群体标签识别模型的作用是为了准确、快速地识别得到各数据源的用户群体标签。
进一步地,基于上述的用户行为属性分布函数,用户群体标签识别模型的模型函数还包括最优化函数,最优化函数为构造寻求最佳解或最大评分的计算方法,最优化函数为:
其中,λj,y用Λ={λ1,y,λ2,y,...,λF,y}表示(即为用户的行为属性的概率分布),p(xi,yi)为用户xi的标签yi在用户群体标签中出现的概率,为用户的行为属性的似然函数,为正则化因子,β为控制最优化函数正则化程度的参数,β的取值范围为[0,1],优选地,β=0.6。
其中,argmax表示寻找具有最大评分的参量,求解并使得对于任何一个用户都有最大值,则各数据源的用户群体标签就可以用进行表示。
步骤S3,根据预定的用户群体标签与群体业务的映射关系确定各所述数据源对应的群体业务,将各所述数据源与对应的群体业务发送给预定的终端,以对各所述数据源进行群体业务定制。
本实施例中,预先将用户群体标签与对应的群体业务进行关联映射,例如对于用户群体标签为“理财”或者“证券”的,则将该用户群体标签关联映射的群体业务为股票业务、基金业务、债券业务、期货业务及保险业务等;又如对于用户群体标签为“保险”的,则将该用户群体标签关联映射的群体业务为财险业务、寿险业务、车险业务及航运险业务等;再如对于用户群体标签为“寿险”的,则将该用户群体标签关联映射的群体业务为寿险业务(有投资型、储蓄型、养老年金型及普通型等)、健康险业务和意外伤害险业务等,然后将用户群体标签与群体业务的映射关系进行存储(例如以列表的形式存储)。
在识别出各数据源的用户群体标签后,根据存储的用户群体标签与群体业务的映射关系得到对应的群体业务,将各数据源与对应的群体业务发送给预定的终端,例如发送给群体业务的业务推广员的终端,以供业务推广员对该数据源的所有用户进行群体业务定制或推广。
与现有技术相比,本实施例获取预定的各数据源中的用户生成内容,利用用户群体标签识别模型识别出各数据源对应的用户群体标签,并确定各数据源对应的群体业务,将各数据源与对应的群体业务发送给预定的终端,本实施例利用用户群体标签识别模型快速、准确地对各数据源中的用户进行识别,以识别出各数据源对应的用户群体标签,基于群体性的数据源对应的用户群体标签进行群体业务定制,能够大范围地进行业务定制,提高业务定制的效率。
在一优选的实施例中,在上述图1的实施例的基础上,为了对用户群体标签识别模型进行快速求解,用户群体标签识别模型的求解过程包括求解迭代步骤,用户群体标签识别模型的求解迭代步骤的目标是求得微分为零的一个式子。该求解迭代步骤如下:
假设将一个给定的数据源的行为属性分布函数记作L(Λ),Λ={λ1,y,λ2,y,...,λF,y}。假设Λ+Δ={λ1,y+δ1,λ2,y+δ2,λ3,y+δ3...},则求解用户行为属性的概率分布时,根据上述的最优化函数得到:
由于存在不等式-logα≥α,则有:
又由于詹森(Jensen's inequality)不等式∑p(x)exp q(x)≥exp∑p(x)q(x),则有:
;取导数可得(微分为零的公式):
优选地,用户群体标签识别模型在上述每一迭代的过程中还包括微分模式迭代,微分模式迭代的目标是快速解出上述式子为0的近似解:
假设上式为f(δi),在每一步迭代求解过程中,都需要使得导数为0,由于此式子形式如同aebx+cx+d=0,较难求解,所以用Newton-Raphson方式求解,由于x是一个很小的值:
使
而
以此类推(下述公式是上述微分为零的公式的近似解)可以得到:
当f(δi (n+1))<τ时,终止迭代,其中τ是一个控制收敛准确度的值,至此求解结束。
在一优选的实施例中,在上述图2的实施例的基础上,为了训练得到能够准确、快速地识别数据源的用户群体标签的模型,所述基于数据源的业务定制系统10被所述处理器12执行步骤S1之前,还包括:
S01,获取预设数量(例如1000个)的数据源中的用户生成内容,以获取的每一数据源中的用户生成内容为一群体数据样本,并为每一群体数据样本标注对应的用户群体标签;其中,每一群体数据样本可以标注一个或者多个用户群体标签,用户群体标签例如是“理财”、“保险”等等。
S02,将所述群体数据样本分为预设的第一比例(例如50%)的训练集及预设的第二比例的验证集(例如25%),所述第一比例及第二比例之和小于等于1;
S03,利用所述训练集中的群体数据样本对预定的用户群体标签识别模型进行训练,并在训练完成后利用所述验证集对训练后的用户群体标签识别模型的准确率进行验证;
S04,若所述准确率大于预设阈值(例如,98.5%),则模型训练结束,以训练后的用户群体标签识别模型作为上述步骤S2中的用户群体标签识别模型,或者,若准确率小于等于预设阈值,则增加数据源的数量,例如增加300个数据源,并基于增加后的数据源重新进行训练。
如图3所示,图3为本发明基于数据源的业务定制方法一实施例的流程示意图,该基于数据源的业务定制方法包括以下步骤:
步骤S1,获取预定的各数据源中的用户生成内容;
本实施例中,预定的数据源可以是微博网站、论坛网站及网络新闻网站等,其中,每个数据源中有大量的用户,每一用户均可以自行参与或制作用户生成内容。
本实施例中,业务定制系统可以实时获取各数据源中的用户生成内容,以获取各数据源中最新的用户生成内容,也可以定时(例如每隔一小时)获取各数据源中的用户生成内容,以减轻系统负担。
具体地,在一数据源中产生用户生成内容后,可以将产生的用户生成内容主动发送给上述的业务定制系统,或者将其存储至预定的服务器的存储区域中,然后由业务定制系统从该服务器中获取该用户生成内容。
步骤S2,利用预先训练生成的用户群体标签识别模型对所述用户生成内容进行识别,以识别出各数据源对应的用户群体标签;
其中,预先训练生成的用户群体标签识别模型为机器学习模型,例如可以是支持向量机模型或者随机森林模型等,当然也可以是其他的模型。
优选地,用户群体标签识别模型为基于最大熵准则进行建立的模型,以具有最大熵的概率分布作为用户的行为属性的概率分布,用户群体标签识别模型的模型函数包括用户行为属性分布函数,用户行为属性分布函数用以描述各用户对应的行为属性的概率分布状况,用户行为属性分布函数为:
该用户行为属性分布函数为一指数分布函数,其中,x为用户,y为用户标签(用户标签例如为“理财”、“证券”或“保险”等),fj(x,y)为用户x的第j个行为属性(用户的行为属性为其在数据源中所做出的行为,例如包括用户在数据源中发表的内容、讨论的内容等等),F为用户x的行为属性的总数,λj,y={λ1,y,λ2,y,λ3,y,...,λF,y}为用户的行为属性的概率分布(即),Z(x)是正规化因子,Z(x)的作用是为了使得用户行为属性分布函数pΛ(y|x)归一化在[0,1]的范围内,其值为
本实施例中,基于最大熵准则建立的用户群体标签识别模型的作用是为了准确、快速地识别得到各数据源的用户群体标签。
进一步地,基于上述的用户行为属性分布函数,用户群体标签识别模型的模型函数还包括最优化函数,最优化函数为构造寻求最佳解或最大评分的计算方法,最优化函数为:
其中,λj,y用Λ={λ1,y,λ2,y,...,λF,y}表示(即为用户的行为属性的概率分布),p(xi,yi)为用户xi的标签yi在用户群体标签中出现的概率,为用户的行为属性的似然函数,为正则化因子,β为控制最优化函数正则化程度的参数,β的取值范围为[0,1],优选地,β=0.6。
其中,argmax表示寻找具有最大评分的参量,求解并使得对于任何一个用户都有最大值,则各数据源的用户群体标签就可以用进行表示。
步骤S3,根据预定的用户群体标签与群体业务的映射关系确定各所述数据源对应的群体业务,将各所述数据源与对应的群体业务发送给预定的终端,以对各所述数据源进行群体业务定制。
本实施例中,预先将用户群体标签与对应的群体业务进行关联映射,例如对于用户群体标签为“理财”或者“证券”的,则将该用户群体标签关联映射的群体业务为股票业务、基金业务、债券业务、期货业务及保险业务等;又如对于用户群体标签为“保险”的,则将该用户群体标签关联映射的群体业务为财险业务、寿险业务、车险业务及航运险业务等;再如对于用户群体标签为“寿险”的,则将该用户群体标签关联映射的群体业务为寿险业务(有投资型、储蓄型、养老年金型及普通型等)、健康险业务和意外伤害险业务等,然后将用户群体标签与群体业务的映射关系进行存储(例如以列表的形式存储)。
在识别出各数据源的用户群体标签后,根据存储的用户群体标签与群体业务的映射关系得到对应的群体业务,将各数据源与对应的群体业务发送给预定的终端,例如发送给群体业务的业务推广员的终端,以供业务推广员对该数据源的所有用户进行群体业务定制或推广。
与现有技术相比,本实施例获取预定的各数据源中的用户生成内容,利用用户群体标签识别模型识别出各数据源对应的用户群体标签,并确定各数据源对应的群体业务,将各数据源与对应的群体业务发送给预定的终端,本实施例利用用户群体标签识别模型快速、准确地对各数据源中的用户进行识别,以识别出各数据源对应的用户群体标签,基于群体性的数据源对应的用户群体标签进行群体业务定制,能够大范围地进行业务定制,提高业务定制的效率。
在一优选的实施例中,在上述图3的实施例的基础上,为了对用户群体标签识别模型进行快速求解,用户群体标签识别模型的求解过程包括求解迭代步骤,用户群体标签识别模型的求解迭代步骤的目标是求得微分为零的一个式子。该求解迭代步骤如下:
假设将一个给定的数据源的行为属性分布函数记作L(Λ),Λ={λ1,y,λ2,y,...,λF,y}。假设Λ+Δ={λ1,y+δ1,λ2,y+δ2,λ3,y+δ3...},则求解用户行为属性的概率分布时,根据上述的最优化函数得到:
由于存在不等式-logα≥α,则有:
又由于詹森(Jensen's inequality)不等式∑p(x)exp q(x)≥exp∑p(x)q(x),则有:
;取导数可得(微分为零的公式):
优选地,用户群体标签识别模型在上述每一迭代的过程中还包括微分模式迭代,微分模式迭代的目标是快速解出上述式子为0的近似解:
假设上式为f(δi),在每一步迭代求解过程中,都需要使得导数为0,由于此式子形式如同aebx+cx+d=0,较难求解,所以用Newton-Raphson方式求解,由于x是一个很小的值:
使
而
以此类推(下述公式是上述微分为零的公式的近似解)可以得到:
当f(δi (n+1))<τ时,终止迭代,其中τ是一个控制收敛准确度的值,至此求解结束。
在一优选的实施例中,如图4所示,在上述图3的实施例的基础上,为了训练得到能够准确、快速地识别数据源的用户群体标签的模型,上述步骤S1之前包括:
S01,获取预设数量(例如1000个)的数据源中的用户生成内容,以获取的每一数据源中的用户生成内容为一群体数据样本,并为每一群体数据样本标注对应的用户群体标签;其中,每一群体数据样本可以标注一个或者多个用户群体标签,用户群体标签例如是“理财”、“保险”等等。
S02,将所述群体数据样本分为预设的第一比例(例如50%)的训练集及预设的第二比例的验证集(例如25%),所述第一比例及第二比例之和小于等于1;
S03,利用所述训练集中的群体数据样本对预定的用户群体标签识别模型进行训练,并在训练完成后利用所述验证集对训练后的用户群体标签识别模型的准确率进行验证;
S04,若所述准确率大于预设阈值(例如,98.5%),则模型训练结束,以训练后的用户群体标签识别模型作为上述步骤S2中的用户群体标签识别模型,或者,若准确率小于等于预设阈值,则增加数据源的数量,例如增加300个数据源,并基于增加后的数据源重新进行训练。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有基于数据源的业务定制系统,所述基于数据源的业务定制系统被处理器执行时实现上述的基于数据源的业务定制方法的步骤。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (6)
1.一种基于数据源的业务定制装置,其特征在于,所述基于数据源的业务定制装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于数据源的业务定制系统,所述基于数据源的业务定制系统被所述处理器执行时实现如下步骤:
S1,获取预定的各数据源中的用户生成内容;
S2,利用预先训练生成的用户群体标签识别模型对所述用户生成内容进行识别,以识别出各数据源对应的用户群体标签;
S3,根据预定的用户群体标签与群体业务的映射关系确定各所述数据源对应的群体业务,将各所述数据源与对应的群体业务发送给预定的终端,以对各所述数据源进行群体业务定制;
所述用户群体标签识别模型基于最大熵准则进行建立,所述用户群体标签识别模型的模型函数包括用户行为属性分布函数,用户行为属性分布函数用以描述各用户对应的行为属性的概率分布状况,所述用户行为属性分布函数为:
x为用户,y为用户标签,fj(x,y)为用户x的第j个特征的属性,λj,y={λ1,y,λ2,y,λ3,y,...,λF,y}为用户的行为属性的概率分布,Z(x)是正规化因子;
所述基于数据源的业务定制系统被所述处理器执行步骤S1之前,还包括:
S01,获取预设数量的数据源中的用户生成内容,以获取的每一数据源中的用户生成内容为一群体数据样本,并为每一群体数据样本标注对应的用户群体标签;
S02,将所述群体数据样本分为预设的第一比例的训练集及预设的第二比例的验证集,所述第一比例及第二比例之和小于等于1;
S03,利用所述训练集中的群体数据样本对预定的用户群体标签识别模型进行训练,并在训练完成后利用所述验证集对训练后的用户群体标签识别模型的准确率进行验证;
S04,若所述准确率大于预设阈值,则模型训练结束,以训练后的用户群体标签识别模型作为所述步骤S2中的用户群体标签识别模型,或者,若准确率小于等于预设阈值,则增加数据源的数量,并基于增加后的数据源重新进行训练。
2.根据权利要求1所述的基于数据源的业务定制装置,其特征在于,所述用户群体标签识别模型的模型函数还包括最优化函数,所述最优化函数为:
p(xi,yi)为用户xi的标签yi在用户群体标签中出现的概率,为用户的行为属性的似然函数,为正则化因子,β为控制所述最优化函数正则化程度的参数。
3.根据权利要求1或2所述的基于数据源的业务定制装置,其特征在于,所述用户群体标签识别模型的识别过程包括对所述用户的行为属性的概率分布进行求解迭代,以及在每一迭代的过程中还包括微分模式迭代。
4.一种基于数据源的业务定制方法,其特征在于,所述基于数据源的业务定制方法包括:
S1,获取预定的各数据源中的用户生成内容;
S2,利用预先训练生成的用户群体标签识别模型对所述用户生成内容进行识别,以识别出各数据源对应的用户群体标签;
S3,根据预定的用户群体标签与群体业务的映射关系确定各所述数据源对应的群体业务,将各所述数据源与对应的群体业务发送给预定的终端,以对各所述数据源进行群体业务定制;
所述用户群体标签识别模型基于最大熵准则进行建立,所述用户群体标签识别模型的模型函数包括用户行为属性分布函数,用户行为属性分布函数用以描述各用户对应的行为属性的概率分布状况,所述用户行为属性分布函数为:
x为用户,y为用户标签,fj(x,y)为用户x的第j个特征的属性,λj,y={λ1,y,λ2,y,λ3,y,...,λF,y}为用户的行为属性的概率分布,Z(x)是正规化因子;
所述步骤S1之前包括:
S01,获取预设数量的数据源中的用户生成内容,以获取的每一数据源中的用户生成内容为一群体数据样本,并为每一群体数据样本标注对应的用户群体标签;
S02,将所述群体数据样本分为预设的第一比例的训练集及预设的第二比例的验证集,所述第一比例及第二比例之和小于等于1;
S03,利用所述训练集中的群体数据样本对预定的用户群体标签识别模型进行训练,并在训练完成后利用所述验证集对训练后的用户群体标签识别模型的准确率进行验证;
S04,若所述准确率大于预设阈值,则模型训练结束,以训练后的用户群体标签识别模型作为所述步骤S2中的用户群体标签识别模型,或者,若准确率小于等于预设阈值,则增加数据源的数量,并基于增加后的数据源重新进行训练。
5.根据权利要求4所述的基于数据源的业务定制方法,其特征在于,所述用户群体标签识别模型的模型函数还包括最优化函数,所述最优化函数为:
p(xi,yi)为用户xi的标签yi在用户群体标签中出现的概率,为用户的行为属性的似然函数,为正则化因子,β为控制所述最优化函数正则化程度的参数。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有基于数据源的业务定制系统,所述基于数据源的业务定制系统被处理器执行时实现如权利要求4或5所述的基于数据源的业务定制方法的步骤。
Priority Applications (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710313995.0A CN107038256B (zh) | 2017-05-05 | 2017-05-05 | 基于数据源的业务定制装置、方法及计算机可读存储介质 |
PCT/CN2017/091367 WO2018201601A1 (zh) | 2017-05-05 | 2017-06-30 | 基于数据源的业务定制装置、方法、系统及存储介质 |
KR1020187023725A KR102171974B1 (ko) | 2017-05-05 | 2017-06-30 | 데이터 소스 기반의 업무 커스터마이즈화 장치, 방법, 시스템 및 저장매체 |
US16/084,565 US11544639B2 (en) | 2017-05-05 | 2017-06-30 | Data source-based service customizing device, method and system, and storage medium |
JP2018537628A JP6573418B2 (ja) | 2017-05-05 | 2017-06-30 | データソースに基づく業務カスタマイズ装置、方法、システム及び記憶媒体 |
EP17899235.0A EP3441891A4 (en) | 2017-05-05 | 2017-06-30 | DEVICE FOR PERSONALIZING A DATA SOURCE BASED SERVICE, PROCESS, SYSTEM AND STORAGE MEDIUM |
SG11201900260VA SG11201900260VA (en) | 2017-05-05 | 2017-06-30 | Data source-based service customizing device, method and system, and storage medium |
AU2017408797A AU2017408797B2 (en) | 2017-05-05 | 2017-06-30 | Data source-based service customizing device, method and system, and storage medium |
TW106135248A TWI677828B (zh) | 2017-05-05 | 2017-10-13 | 基於資料源的業務客製裝置、方法及電腦可讀儲存介質 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710313995.0A CN107038256B (zh) | 2017-05-05 | 2017-05-05 | 基于数据源的业务定制装置、方法及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107038256A CN107038256A (zh) | 2017-08-11 |
CN107038256B true CN107038256B (zh) | 2018-06-29 |
Family
ID=59537283
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710313995.0A Active CN107038256B (zh) | 2017-05-05 | 2017-05-05 | 基于数据源的业务定制装置、方法及计算机可读存储介质 |
Country Status (9)
Country | Link |
---|---|
US (1) | US11544639B2 (zh) |
EP (1) | EP3441891A4 (zh) |
JP (1) | JP6573418B2 (zh) |
KR (1) | KR102171974B1 (zh) |
CN (1) | CN107038256B (zh) |
AU (1) | AU2017408797B2 (zh) |
SG (1) | SG11201900260VA (zh) |
TW (1) | TWI677828B (zh) |
WO (1) | WO2018201601A1 (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107767259A (zh) * | 2017-09-30 | 2018-03-06 | 平安科技(深圳)有限公司 | 贷款风险控制方法、电子装置及可读存储介质 |
JPWO2020149073A1 (ja) * | 2019-01-18 | 2021-11-25 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、及びプログラム |
CN111680108B (zh) * | 2019-03-11 | 2023-11-03 | 杭州海康威视数字技术股份有限公司 | 一种数据存储方法、装置及一种数据获取方法、装置 |
CN110111814B (zh) * | 2019-05-20 | 2021-09-21 | 国家计算机网络与信息安全管理中心 | 网络类型识别方法及装置 |
CN110415094A (zh) * | 2019-06-18 | 2019-11-05 | 重庆金融资产交易所有限责任公司 | 资产负债智能管理方法、装置及计算机可读存储介质 |
CN110598769B (zh) * | 2019-08-30 | 2022-06-07 | 京东科技控股股份有限公司 | 用户群体发现方法、装置、设备及计算机可读存储介质 |
CN110930117A (zh) * | 2019-11-21 | 2020-03-27 | 中国银行股份有限公司 | 一种人工智能微服务系统 |
CN111126019B (zh) * | 2019-11-28 | 2024-01-05 | 泰康保险集团股份有限公司 | 基于模式定制的报表生成方法、装置和电子设备 |
CN111061566A (zh) * | 2019-12-16 | 2020-04-24 | 武汉达梦数据技术有限公司 | 一种动态数据源查询方法及装置 |
CN112529628B (zh) * | 2020-12-16 | 2024-04-09 | 平安科技(深圳)有限公司 | 客户标签的生成方法、装置、计算机设备及存储介质 |
CN114004456B (zh) * | 2021-10-09 | 2024-04-09 | 金蝶征信有限公司 | 数据标签的计算方法、装置、计算机设备和存储介质 |
CN116028107B (zh) * | 2023-02-28 | 2023-08-11 | 广州市高科通信技术股份有限公司 | 基于定制的设备参数管理方法、装置及存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101616356A (zh) * | 2009-07-31 | 2009-12-30 | 卓望数码技术(深圳)有限公司 | 一种无线数据业务产品信息推送方法及系统 |
CN102647716A (zh) * | 2012-04-01 | 2012-08-22 | 华为技术有限公司 | 无线应用的方法、设备和系统 |
CN103995858A (zh) * | 2014-05-15 | 2014-08-20 | 北京航空航天大学 | 基于任务分解的个性化知识主动推送方法 |
CN104184824A (zh) * | 2014-09-05 | 2014-12-03 | 北方工业大学 | 手机报定制和推送的装置及方法 |
CN106156127A (zh) * | 2015-04-08 | 2016-11-23 | 深圳市腾讯计算机系统有限公司 | 选择数据内容向终端推送的方法及装置 |
CN106372113A (zh) * | 2016-08-22 | 2017-02-01 | 上海亿账通互联网科技有限公司 | 新闻内容的推送方法及系统 |
CN106547798A (zh) * | 2015-09-23 | 2017-03-29 | 阿里巴巴集团控股有限公司 | 信息推送方法及装置 |
CN106572173A (zh) * | 2016-11-07 | 2017-04-19 | 网易无尾熊(杭州)科技有限公司 | 一种配置信息更新方法、装置和系统 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001059587A2 (en) | 2000-02-11 | 2001-08-16 | Kapow Aps | User interface, system and method for performing a web-based transaction |
KR100368129B1 (ko) | 2000-04-29 | 2003-01-15 | (주)동명기술공단종합건축사사무소 | 전자 상거래를 위한 상품 추천 장치 및 방법 |
US6889222B1 (en) * | 2000-12-26 | 2005-05-03 | Aspect Communications Corporation | Method and an apparatus for providing personalized service |
JP2002342360A (ja) * | 2001-05-18 | 2002-11-29 | Sharp Corp | 情報提供装置、その方法、そのコンピュータ・プログラムおよびそのプログラムを記録した記録媒体 |
US8140531B2 (en) * | 2008-05-02 | 2012-03-20 | International Business Machines Corporation | Process and method for classifying structured data |
JP5403340B2 (ja) * | 2009-06-09 | 2014-01-29 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
CN101908191A (zh) | 2010-08-03 | 2010-12-08 | 深圳市她秀时尚电子商务有限公司 | 应用于电子商务的数据分析方法及系统 |
TWI534732B (zh) * | 2010-11-15 | 2016-05-21 | Alibaba Group Holding Ltd | Recommended information output method, system and server |
US8706716B2 (en) | 2011-11-23 | 2014-04-22 | Rawllin International Inc. | Iterative and dynamic search of publicly available data based on augmentation of search terms and validation of data relevance |
US20150263925A1 (en) * | 2012-10-05 | 2015-09-17 | Telefonaktiebolaget L M Ericsson (Publ) | Method and apparatus for ranking users within a network |
CN103810192A (zh) * | 2012-11-09 | 2014-05-21 | 腾讯科技(深圳)有限公司 | 一种用户的兴趣推荐方法和装置 |
GB201307702D0 (en) * | 2013-04-29 | 2013-06-12 | Maxymiser Ltd | Customer community analytics |
CN104090888B (zh) | 2013-12-10 | 2016-05-11 | 深圳市腾讯计算机系统有限公司 | 一种用户行为数据的分析方法和装置 |
WO2017117029A1 (en) * | 2015-12-28 | 2017-07-06 | Cloudbrain Inc. | System and method for deploying customized machine learning services |
US10621497B2 (en) * | 2016-08-19 | 2020-04-14 | International Business Machines Corporation | Iterative and targeted feature selection |
US10984666B1 (en) * | 2016-11-03 | 2021-04-20 | Massachusetts Mutual Life Insurance Company | Learning engine application |
US11074599B2 (en) * | 2016-12-08 | 2021-07-27 | App Annie Inc. | Determining usage data of mobile applications for a population |
-
2017
- 2017-05-05 CN CN201710313995.0A patent/CN107038256B/zh active Active
- 2017-06-30 SG SG11201900260VA patent/SG11201900260VA/en unknown
- 2017-06-30 WO PCT/CN2017/091367 patent/WO2018201601A1/zh unknown
- 2017-06-30 US US16/084,565 patent/US11544639B2/en active Active
- 2017-06-30 EP EP17899235.0A patent/EP3441891A4/en not_active Withdrawn
- 2017-06-30 JP JP2018537628A patent/JP6573418B2/ja active Active
- 2017-06-30 AU AU2017408797A patent/AU2017408797B2/en active Active
- 2017-06-30 KR KR1020187023725A patent/KR102171974B1/ko active IP Right Grant
- 2017-10-13 TW TW106135248A patent/TWI677828B/zh active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101616356A (zh) * | 2009-07-31 | 2009-12-30 | 卓望数码技术(深圳)有限公司 | 一种无线数据业务产品信息推送方法及系统 |
CN102647716A (zh) * | 2012-04-01 | 2012-08-22 | 华为技术有限公司 | 无线应用的方法、设备和系统 |
CN103995858A (zh) * | 2014-05-15 | 2014-08-20 | 北京航空航天大学 | 基于任务分解的个性化知识主动推送方法 |
CN104184824A (zh) * | 2014-09-05 | 2014-12-03 | 北方工业大学 | 手机报定制和推送的装置及方法 |
CN106156127A (zh) * | 2015-04-08 | 2016-11-23 | 深圳市腾讯计算机系统有限公司 | 选择数据内容向终端推送的方法及装置 |
CN106547798A (zh) * | 2015-09-23 | 2017-03-29 | 阿里巴巴集团控股有限公司 | 信息推送方法及装置 |
CN106372113A (zh) * | 2016-08-22 | 2017-02-01 | 上海亿账通互联网科技有限公司 | 新闻内容的推送方法及系统 |
CN106572173A (zh) * | 2016-11-07 | 2017-04-19 | 网易无尾熊(杭州)科技有限公司 | 一种配置信息更新方法、装置和系统 |
Non-Patent Citations (1)
Title |
---|
健康保险数据及数据管理系统研究;郑春丽;《中国优秀硕士学位论文全文数据库 信息科技辑》;20111215;第I138-379页 * |
Also Published As
Publication number | Publication date |
---|---|
EP3441891A4 (en) | 2019-05-08 |
JP2019519009A (ja) | 2019-07-04 |
EP3441891A1 (en) | 2019-02-13 |
TWI677828B (zh) | 2019-11-21 |
SG11201900260VA (en) | 2019-02-27 |
AU2017408797B2 (en) | 2020-02-27 |
WO2018201601A1 (zh) | 2018-11-08 |
US11544639B2 (en) | 2023-01-03 |
KR102171974B1 (ko) | 2020-11-02 |
US20200302346A1 (en) | 2020-09-24 |
TW201843622A (zh) | 2018-12-16 |
AU2017408797A1 (en) | 2018-11-22 |
KR20190022440A (ko) | 2019-03-06 |
CN107038256A (zh) | 2017-08-11 |
JP6573418B2 (ja) | 2019-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107038256B (zh) | 基于数据源的业务定制装置、方法及计算机可读存储介质 | |
CN105608179B (zh) | 确定用户标识的关联性的方法和装置 | |
CN110060144B (zh) | 额度模型训练方法、额度评估方法、装置、设备及介质 | |
CN107895277A (zh) | 在应用程序中推送贷款广告的方法、电子装置及介质 | |
CN109446302A (zh) | 基于机器学习的问答数据处理方法、装置和计算机设备 | |
CN111897975A (zh) | 一种面向知识图谱表示学习训练的局部训练方法 | |
CN109165266A (zh) | 表单生成方法、装置、计算机设备和存储介质 | |
WO2019062081A1 (zh) | 业务员画像形成方法、电子装置及计算机可读存储介质 | |
CN110321426B (zh) | 摘要抽取方法、装置及计算机设备 | |
CN112632278A (zh) | 一种基于多标签分类的标注方法、装置、设备及存储介质 | |
CN105046289A (zh) | 一种文字域类型识别方法和文字域类型识别系统 | |
CN112287069A (zh) | 基于语音语义的信息检索方法、装置及计算机设备 | |
CN115311478A (zh) | 一种基于图深度聚类的联邦影像分类方法、存储介质 | |
CN107633257B (zh) | 数据质量评估方法及装置、计算机可读存储介质、终端 | |
CN109460541A (zh) | 词汇关系标注方法、装置、计算机设备和存储介质 | |
CN114240672A (zh) | 绿色资产的占比的识别方法及相关产品 | |
CN111552810B (zh) | 实体抽取与分类方法、装置、计算机设备和存储介质 | |
US10387545B2 (en) | Processing page | |
CN108256818A (zh) | 薪资计算方法、应用服务器及计算机可读存储介质 | |
CN112286988B (zh) | 医疗文献排序方法、装置、电子设备及存储介质 | |
CN105208033A (zh) | 一种基于智能终端情景的群体辅助推荐方法及系统 | |
CN115018608A (zh) | 风险预测方法、装置、计算机设备 | |
CN112561000B (zh) | 基于组合模型的分类方法、装置、设备及存储介质 | |
CN107895335B (zh) | 权益保护方法及应用服务器 | |
CN112633285A (zh) | 领域适应方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1238357 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1238357 Country of ref document: HK |