CN111782611B - 预测模型建模方法、装置、设备及存储介质 - Google Patents
预测模型建模方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN111782611B CN111782611B CN202010617186.0A CN202010617186A CN111782611B CN 111782611 B CN111782611 B CN 111782611B CN 202010617186 A CN202010617186 A CN 202010617186A CN 111782611 B CN111782611 B CN 111782611B
- Authority
- CN
- China
- Prior art keywords
- feature
- search
- search behavior
- time sequence
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 230000004931 aggregating effect Effects 0.000 claims abstract description 35
- 230000006399 behavior Effects 0.000 claims description 194
- 238000012954 risk control Methods 0.000 claims description 19
- 230000015654 memory Effects 0.000 claims description 18
- 238000012549 training Methods 0.000 claims description 11
- 230000002060 circadian Effects 0.000 claims description 10
- 230000002776 aggregation Effects 0.000 claims description 9
- 238000004220 aggregation Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 4
- 238000001212 derivatisation Methods 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 18
- 238000004590 computer program Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 9
- 238000009795 derivation Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/1734—Details of monitoring file system events, e.g. by the use of hooks, filter drivers, logs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- Technology Law (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Game Theory and Decision Science (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Operations Research (AREA)
- Computing Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了预测模型建模方法、装置、设备及存储介质,涉及大数据领域。具体实现方案为:根据样本用户的时间戳,获取样本用户在预设时间范围内的搜索日志数据;提取搜索日志数据中的时间戳,并对提取的时间戳按照时间维度进行排序整理及统计,得到搜索行为时序统计特征;对搜索行为时序统计特征进行聚合和衍生,得到搜索行为模式特征;以及将搜索行为模式特征作为入模变量,以生成预测模型,从而可以提高预测模型的预测效果。
Description
技术领域
本申请实施例涉及数据处理和深度学习领域,尤其涉及一种预测模型建模方法、装置、设备及存储介质,可用于大数据分析技术。
背景技术
预测模型的效果主要取决于所用来进行训练和预测的特征,现有技术一些预测模型存在预测效果不佳的问题,例如风险控制模型,对于银行和各类金融机构来说,行方和机构内部的数据一般都为客户的基本个人信息(性别、年龄、学历等),以及客户在该机构的交易记录与流水等,数据源种类较为单一,涉及的内容和反映用户的特性较为局限,从而导致使用该些信息对用户进行预测的效果不佳。
发明内容
本申请提供了一种用于预测模型建模的方法、装置、设备以及存储介质。
根据本申请的第一方面,提供了一种预测模型建模方法,包括:
根据样本用户的时间戳,获取所述样本用户在预设时间范围内的搜索日志数据;
提取所述搜索日志数据中的时间戳;
按照时间维度对提取的时间戳进行聚合和衍生,得到搜索行为模式特征;以及
将所述搜索行为模式特征作为入模变量,以生成所述预测模型。
根据本申请的第二方面,提供了一种预测模型建模装置,包括:
获取模块,用于根据样本用户的时间戳,获取所述样本用户在预设时间范围内的搜索日志数据;
提取模块,用于提取所述搜索日志数据中的时间戳;
衍生模块,用于按照时间维度对提取的时间戳进行聚合和衍生,得到搜索行为模式特征;以及
生成模块,用于将所述搜索行为模式特征作为入模变量,以生成所述预测模型。
根据本申请的第三方面,至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述第一方面所述的方法。
根据本申请第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行上述第一方面所述的方法。
根据本申请的第五方面,提供了一种计算机程序产品,所述程序产品包括:计算机程序,所述计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得电子设备执行第一方面所述的方法。
本申请中的一个实施例具有如下优点或有益效果:通过根据样本用户的时间戳,获取所述样本用户在预设时间范围内的搜索日志数据;提取所述搜索日志数据中的时间戳;按照时间维度对提取的时间戳进行聚合和衍生,得到搜索行为模式特征;对所述搜索行为时序统计特征进行聚合和衍生,得到搜索行为模式特征;以及将所述搜索行为模式特征作为入模变量,以生成所述预测模型,从而可以提高预测模型的预测效果。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1为本申请一实施例提供的预测模型建模方法的流程示意图;
图2为本申请另一实施例提供的预测模型建模方法的流程示意图;
图3为本申请另一实施例提供的预测模型建模方法的流程示意图;
图4为本申请另一实施例提供的预测模型建模方法的流程示意图
图5为本申请一实施例提供的预测模型建模方法中特征衍生过程的示意图;
图6为本申请另一实施例提供的预测模型建模方法的流程示意图;
图7为本申请一实施例提供的预测模型建模及预测过程的场景图;
图8为本申请一实施例提供的预测模型建模装置的结构示意图;以及
图9是用来实现本申请实施例的预测模型建模方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
不同业务的互联网用户大数据可以反映不同侧面的特征,如电商数据可以反映用户的购物偏好和消费水平;旅游平台数据可以一定程度反映用户的工作性质、常住地址、收入水平等属性。与这些数据相比,搜索引擎的搜索行为日志记录具有日常记录较多,覆盖面较广的特点,因此可以反映用户的日常活动规律特征。
根据搜索数据中的文本信息对用户的意图与关注点进行解析,可以提取较多与用户本身的身份、兴趣、职业等相关的信息。但是,这些信息不能反映用户日常的行为习惯特征,而日常活动的时序特征等信息往往可以更真实地反映某个人的活动特点、行为习惯、作息规律等,并能够间接反映出用户的生活状态、职业性质等属性,这些信息可以被用于预测模型的建模。举例来说,风险控制是当前金融科技与互联网金融领域中非常重要的一环。风险控制系统通过分析用户的个人属性、社会属性、以及过往的信用记录等信息,对用户的信用风险进行评估和量化,并用来指导信用卡和借贷等业务申请的核准与驳回、额度利率定价与调整等任务。因此,风险控制预测模型的质量对于金融行业具有较大的影响。而相关工程实践表明,用户的日常活动特征与用户的信用和风险具有较高程度的相关性。因此,本申请对用户搜索行为的时序分布特征进行提取及衍生,用于风险控制预测模型的建模任务,以辅助对用户的信用风险评估,提高风险控制的有效性。
图1为本申请一实施例提供的预测模型建模方法的流程示意图。需要说明的是,本申请下述实施例中以执行主体为预测模型建模装置为例进行介绍。如图1所示,本实施例提供的预测模型建模方法可以包括:
步骤S101、根据样本用户的时间戳,获取所述样本用户在预设时间范围内的搜索日志数据。
举例来说,根据样本用户的时间戳,可以分别回溯该用户近期几个月份的搜索日志数据,如最近4个月内的搜索日志数据。
步骤S102、提取所述搜索日志数据中的时间戳。
步骤S103、按照时间维度对提取的时间戳进行聚合和衍生,得到搜索行为模式特征。
在一个实施例中,所述时间维度包括月、日,小时、每月上旬、每月中旬、每月下旬、白天时间段以及夜间时间段中的至少一种,使用该些维度对提取的时间戳进行聚合和衍生,可以得到针对性较强的搜索行为模式特征。
举例来说,该步骤包含按照各个维度(例如每个月、每个月的上中下旬、每日、每小时、星期中的每天、周中、周末等的搜索行为总量)对提取的时间戳进行聚合,另外,还包含衍生出与预测(例如,风险预测)相关性较强的比值类衍生特征(如白天/夜间搜索次数比例等)。
步骤S104、将所述搜索行为模式特征作为入模变量,以生成所述预测模型。
举例来说,可以将搜索行为模式特征作为入模变量输入至建模算法模块中,来生成预测模型,该建模算法模块例如使用XGboost、逻辑斯蒂回归(logistic regression,LR)以及深度学习网络(deep neural network,DNN)等。
综上所述,本申请实施例中,通过根据样本用户的时间戳,获取样本用户在预设时间范围内的搜索日志数据;提取搜索日志数据中的时间戳;按照时间维度对提取的时间戳进行聚合和衍生,得到搜索行为模式特征;以及将搜索行为模式特征作为入模变量,以生成预测模型,从而可以提高预测模型的预测效果。
在一个实施例中,所述预设时间范围包括自所述样本用户的时间戳之前的预设时间段,即,获取样本用户的历史数据搜索日志数据。
在一个实施例中,步骤104包括:将所述搜索行为模式特征和所述搜索行为时序统计特征进行合并作为入模变量,以生成所述预测模型。
可以理解的是,可以仅将搜索行为模式特征作为入模变量,也可以将搜索行为模式特征和所述搜索行为时序统计特征进行合并作为入模变量。具体来说,该两种不同方式可以分别对应于不同的建模算法,以使得入模变量更好地与建模算法相适应。
在一个实施例中,步骤101之前还包括:获取全量搜索日志数据和样本用户数据,所述全量搜索日志数据包括用户标识、搜索行为发生的时间戳以及搜索的内容,所述样本用户数据包括所述样本用户的标识和所述样本用户的时间戳。通过该方式,可以在建模之前获取到建模中会使用到的所有数据。
图2为本申请另一实施例提供的预测模型建模方法的流程示意图。在上述实施例的基础上,本申请实施例对上述步骤S103的可实现方式进行介绍。如图2所示,本实施例的方法可以包括:
步骤S1031、按照时间维度对所述提取的时间戳进行聚合,得到第一聚合时序特征。
步骤S1032、对所述第一聚合时序特征进行衍生,得到第一衍生时序特征,所述搜索行为模式特征包括所述第一聚合时序特征和所述第一衍生时序特征;或者,对所述提取的时间戳进行衍生得到第二衍生时序特征,所述搜索行为模式特征包括所述第一聚合时序特征和所述第二衍生时序特征。
在本实施例中,通过根据样本用户的时间戳,获取样本用户在预设时间范围内的搜索日志数据;提取搜索日志数据中的时间戳;按照时间维度对所述提取的时间戳进行聚合,得到第一聚合时序特征;对所述第一聚合时序特征进行衍生,得到第一衍生时序特征,所述搜索行为模式特征包括所述第一聚合时序特征和所述第一衍生时序特征,或者,对所述提取的时间戳进行衍生得到第二衍生时序特征,所述搜索行为模式特征包括所述第一聚合时序特征和所述第二衍生时序特征;以及将搜索行为模式特征作为入模变量,以生成预测模型,从而可以提高预测模型的预测效果。
在一个实施例中,所述第一衍生时序特征包括昼夜搜索行为特征、周中/周末搜索行为特征、上/中/下旬搜索行为特征、搜索稳定性特征中的至少一种;所述第二衍生时序特征包括昼夜搜索行为特征、周中/周末搜索行为特征、上/中/下旬搜索行为特征、搜索稳定性特征中的至少一种。
举例来说,上述昼夜搜索行为特征、周中/周末搜索行为特征、上/中/下旬搜索行为特征、搜索稳定性特征,可以与特定应用领域相关性较强,例如,昼夜搜索行为特征与风险控制的相关性较强,因此,使用该些衍生时序特征可以进一步提高预测模型的预测效果。
图3为本申请另一实施例提供的预测模型建模方法的流程示意图。在图1所述实施例的基础上,本申请实施例在上述步骤S103之前还包括对时间戳进行排序整理及统计的预处理过程。如图3所示,本实施例的方法可以包括:
步骤S201、根据样本用户的时间戳,获取所述样本用户在预设时间范围内的搜索日志数据。
步骤S202、提取所述搜索日志数据中的时间戳。
步骤S203、对所述提取的时间戳进行排序整理及统计,得到搜索行为时序统计特征。
举例来说,对提取的时间戳进行排序可以对提取的时间戳按照时间维度进行排序整理及统计,即,先对提取的时间戳进行排序,再对排序后的时间戳进行统计,例如对同一个小时的搜索次数进行统计。
步骤S204、按照时间维度对所述搜索行为时序统计特征进行聚合和衍生,得到搜索行为模式特征。
步骤S205、将所述搜索行为模式特征作为入模变量,以生成所述预测模型。
在本实施例中,先对提取的时间戳进行排序和统计等预处理,可以提高时序特征聚合及衍生的效率。
图4为本申请另一实施例提供的预测模型建模方法的流程示意图。在上述实施例的基础上,本申请实施例对上述步骤S204的可实现方式进行介绍。如图4所示,本实施例的方法可以包括:
步骤S2041、按照时间维度对所述搜索行为时序统计特征进行聚合,得到第一聚合时序统计特征。
步骤S2042、对所述第一聚合时序统计特征进行衍生,得到第一衍生时序统计特征,所述搜索行为模式特征包括所述第一聚合时序统计特征和所述第一衍生时序统计特征;或者,对所述搜索行为时序统计特征进行衍生得到第二衍生时序统计特征,所述搜索行为模式特征包括所述第一聚合时序统计特征和所述第二衍生时序统计特征。
在本实施例中,在时序特征的聚合和衍生过程中,首先按照时间维度对所述搜索行为时序统计特征进行聚合,得到第一聚合时序统计特征。再对所述第一聚合时序统计特征进行衍生,得到第一衍生时序统计特征,所述搜索行为模式特征包括所述第一聚合时序统计特征和所述第一衍生时序统计特征;或者,对所述搜索行为时序统计特征进行衍生得到第二衍生时序统计特征,所述搜索行为模式特征包括所述第一聚合时序统计特征和所述第二衍生时序统计特征,可以进一步提高特征聚合和衍生的效率。
在一个实施例中,所述第一衍生时序统计特征包括昼夜搜索行为特征、周中/周末搜索行为特征、上/中/下旬搜索行为特征、搜索稳定性特征中的至少一种;所述第二衍生时序统计特征包括昼夜搜索行为特征、周中/周末搜索行为特征、上/中/下旬搜索行为特征、搜索稳定性特征中的至少一种。
举例来说,上述昼夜搜索行为特征、周中/周末搜索行为特征、上/中/下旬搜索行为特征、搜索稳定性特征,可以与特定应用领域相关性较强,例如,昼夜搜索行为特征与风险控制的相关性较强,因此,使用该些衍生时序特征可以进一步提高预测模型的预测效果。
下面结合图5对该过程进行详细说明。
图5为本申请一实施例提供的预测模型建模方法中特征衍生过程的示意图。如图5所示,首先对搜索行为时序统计特征进行聚合,可以得到一月中各日总搜索频次、一天各小时总搜索频次以及一星期内各日总搜索频次等时序特征中的至少一种,然后对聚合后时序统计特征或搜索行为时序统计特征进行衍生,得到昼夜搜索行为特征、周中/周末搜索行为特征、上/中/下旬搜索行为特征、搜索稳定性特征等时序特征中的至少一种,示例性的,本实施例的搜索行为模式特征可以包括图5中虚线框中的所有特征。
综上所述,本申请实施例中,通过对搜索行为时序统计特征进行聚合和衍生,可以得到昼夜搜索行为特征、周中/周末搜索行为特征、上/中/下旬搜索行为特征、搜索稳定性特征等时序特征中的至少一种,使用该些特征进行建模,可以提高预测模型的预测效果。
图6为本申请另一实施例提供的预测模型建模方法的流程示意图。在图1所述实施例的基础上,本申请实施例还包括步骤S105和S106。如图6所示,本实施例的方法可以包括:
步骤S101、根据样本用户的时间戳,获取所述样本用户在预设时间范围内的搜索日志数据。
步骤S102、提取所述搜索日志数据中的时间戳。
步骤S103、按照时间维度对提取的时间戳进行聚合和衍生,得到搜索行为模式特征。
步骤S104、将所述搜索行为模式特征作为入模变量,以生成所述预测模型。
步骤S105、根据所述样本用户的标识和预测标签对所述预测模型进行训练,得到训练的模型。
步骤S106、将目标用户的标识和所述目标用户的搜索行为模式特征输入所述训练的模型进行预测。
在一个实施例中,所述预测标签为风险控制标签,例如是关于用户相关金融行为是否逾期的标签。
举例来说,本申请实施例的预测模型可以用于风险控制领域的风险控制建模系统、评分卡模型或风险名单系统等。
在本实施例中,基于验证结果,使用预测标签对基于入模变量生成的模型进行训练,并使用训练后的模型进行预测,可以获得较好的预测结果。
下面结合图7对建模及训练的过程进行示例性说明。
图7为本申请一实施例提供的预测模型建模及预测过程的示意图。如图7所示,该示例以本申请的预测模型用于风险控制领域为例进行说明,首先,获取全量搜索日志数据,与待处理的样本用户数据。其中,样本用户数据包含用户的ID、时间戳,以及风险控制标签(如是用户对应的金融行为否逾期),全量搜索日志数据中包含用户的ID,以及对应的搜索行为发生的时间戳,以及搜索的内容等信息。根据样本用户的时间戳,分别回溯该用户近期几个月份的搜索日志数据,如最近4个月内的搜索日志。对回溯的搜索日志数据中的时间戳进行提取,并进行排序整理,并对同一个小时的搜索次数进行统计,得到搜索行为时序统计特征,以月份、该月中的第几日、该日中的第几个小时为三个维度。利用得到的搜索行为时序统计特征数据,进行特征衍生,通过该衍生模块,可以实现对搜索行为时序统计特征进行聚合和衍生,得到搜索行为模式特征。将搜索行为时序统计特征与衍生模块生成的搜索行为模式特征进行合并,作为入模变量进行建模,获得风险控制模型。
在本实施例中,以风险控制预测模型为例,给出了一种基于搜索行为时序特征衍生的建模方法,可以提高风险控制预测模型的预测效果,从而更好地支撑和辅助金融场景领域的相关项目实践和产品建设。
图8为本申请一实施例提供的预测模型建模装置的结构示意图。如图8所示,本实施例提供的预测模型建模装置包括:
获取模块81,用于根据样本用户的时间戳,获取所述样本用户在预设时间范围内的搜索日志数据;
提取模块82,用于提取所述搜索日志数据中的时间戳;
衍生模块83,用于按照时间维度对提取的时间戳进行聚合和衍生,得到搜索行为模式特征;以及
生成模块84,用于将所述搜索行为模式特征作为入模变量,以生成所述预测模型。
在一个实施例中,所述衍生模块83,具体用于:
按照时间维度对所述提取的时间戳进行聚合,得到第一聚合时序特征;以及
对所述第一聚合时序特征进行衍生,得到第一衍生时序特征,所述搜索行为模式特征包括所述第一聚合时序特征和所述第一衍生时序特征;或者,对所述提取的时间戳进行衍生得到第二衍生时序特征,所述搜索行为模式特征包括所述第一聚合时序特征和所述第二衍生时序特征。
在一个实施例中,所述第一衍生时序特征包括昼夜搜索行为特征、周中/周末搜索行为特征、上/中/下旬搜索行为特征、搜索稳定性特征中的至少一种;所述第二衍生时序特征包括昼夜搜索行为特征、周中/周末搜索行为特征、上/中/下旬搜索行为特征、搜索稳定性特征中的至少一种。
在一个实施例中,所述装置还包括:
统计模块,用于在所述衍生模块按照时间维度对提取的时间戳进行聚合和衍生,得到搜索行为模式特征之前,对所述提取的时间戳进行排序整理及统计,得到搜索行为时序统计特征;
所述衍生模块83,具体用于:
按照时间维度对所述搜索行为时序统计特征进行聚合和衍生,得到搜索行为模式特征。
在一个实施例中,所述衍生模块83,具体用于:
按照时间维度对所述搜索行为时序统计特征进行聚合,得到第一聚合时序统计特征;以及
对所述第一聚合时序统计特征进行衍生,得到第一衍生时序统计特征,所述搜索行为模式特征包括所述第一聚合时序统计特征和所述第一衍生时序统计特征;或者,对所述搜索行为时序统计特征进行衍生得到第二衍生时序统计特征,所述搜索行为模式特征包括所述第一聚合时序统计特征和所述第二衍生时序统计特征。
在一个实施例中,所述第一衍生时序统计特征包括昼夜搜索行为特征、周中/周末搜索行为特征、上/中/下旬搜索行为特征、搜索稳定性特征中的至少一种;所述第二衍生时序统计特征包括昼夜搜索行为特征、周中/周末搜索行为特征、上/中/下旬搜索行为特征、搜索稳定性特征中的至少一种。
在一个实施例中,所述时间维度包括月、日,小时、每月上旬、每月中旬、每月下旬、白天时间段以及夜间时间段中的至少一种。
在一个实施例中,所述装置还包括:
训练模块,用于在所述生成模块将所述搜索行为模式特征作为入模变量,以生成所述预测模型之后,根据所述样本用户的标识和预测标签对所述预测模型进行训练,得到训练的模型。
在一个实施例中,所述装置还包括:
预测模块,用于在所述训练模块根据所述样本用户的标识和预测标签对所述预测模型进行训练,得到训练的模型之后,将目标用户的标识和所述目标用户的搜索行为模式特征输入所述训练的模型进行预测。
在一个实施例中,所述预测标签为风险控制标签。
在一个实施例中,所述预设时间范围包括自所述样本用户的时间戳之前的预设时间段。
在一个实施例中,所述生成模块84,还用于:
将所述搜索行为模式特征和所述搜索行为时序统计特征进行合并作为入模变量,以生成所述预测模型。
在一个实施例中,所述获取模块81,还用于:
在根据样本用户的时间戳,获取所述样本用户在预设时间范围内的搜索日志数据之前,获取全量搜索日志数据和样本用户数据,所述全量搜索日志数据包括用户标识、搜索行为发生的时间戳以及搜索的内容,所述样本用户数据包括所述样本用户的标识和所述样本用户的时间戳。
本申请各实施例提供的预测模型建模装置可用于执行如前述各对应的实施例所示的方法,其实现方式与原理相同,不再赘述。
本申请实施例提供的预测模型建模方法及装置,应用于大数据领域中的预测模型建模,通过根据样本用户的时间戳,获取所述样本用户在预设时间范围内的搜索日志数据;提取所述搜索日志数据中的时间戳;按照时间维度对提取的时间戳进行聚合和衍生,得到搜索行为模式特征;对所述搜索行为时序统计特征进行聚合和衍生,得到搜索行为模式特征;以及将所述搜索行为模式特征作为入模变量,以生成所述预测模型,从而可以提高预测模型的预测效果。
根据本申请的实施例,本申请还提供了一种计算机程序产品,程序产品包括:计算机程序,计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从可读存储介质读取计算机程序,至少一个处理器执行计算机程序使得电子设备执行上述任一实施例提供的方案。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图9所示,图9为根据本申请实施例的预测模型建模方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图9所示,该电子设备包括:一个或多个处理器901、存储器902,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图9中以一个处理器901为例。
存储器902即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的预测模型建模方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的预测模型建模方法。
存储器902作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的预测模型建模方法对应的程序指令/模块(例如,附图8所示的获取模块81、提取模块82、衍生模块83和生成模块84)。处理器901通过运行存储在存储器902中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的预测模型建模方法。
存储器902可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据预测模型建模方法的电子设备的使用所创建的数据等。此外,存储器902可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器902可选包括相对于处理器901远程设置的存储器,这些远程存储器可以通过网络连接至预测模型建模方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
预测模型建模方法的电子设备还可以包括:输入装置903和输出装置904。处理器901、存储器902、输入装置903和输出装置904可以通过总线或者其他方式连接,图9中以通过总线连接为例。
输入装置903可接收输入的数字或字符信息,以及产生与预测模型建模方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置904可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算机程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算机程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
根据本申请实施例的技术方案,通过根据样本用户的时间戳,获取所述样本用户在预设时间范围内的搜索日志数据;提取所述搜索日志数据中的时间戳;按照时间维度对提取的时间戳进行聚合和衍生,得到搜索行为模式特征;对所述搜索行为时序统计特征进行聚合和衍生,得到搜索行为模式特征;以及将所述搜索行为模式特征作为入模变量,以生成所述预测模型,从而可以提高预测模型的预测效果。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (24)
1.一种预测模型建模方法,包括:
根据样本用户的时间戳,获取所述样本用户在预设时间范围内的搜索日志数据;
提取所述搜索日志数据中的时间戳;
按照时间维度对提取的时间戳进行聚合和衍生,得到搜索行为模式特征;以及
将所述搜索行为模式特征作为入模变量,以生成所述预测模型;
其中,所述按照时间维度对提取的时间戳进行聚合和衍生,得到搜索行为模式特征,包括:
按照时间维度对所述提取的时间戳进行聚合,得到第一聚合时序特征;以及
对所述第一聚合时序特征进行衍生,得到第一衍生时序特征,所述搜索行为模式特征包括所述第一聚合时序特征和所述第一衍生时序特征;或者,对所述提取的时间戳进行衍生得到第二衍生时序特征,所述搜索行为模式特征包括所述第一聚合时序特征和所述第二衍生时序特征;
其中,所述第一衍生时序特征包括昼夜搜索行为特征、周中搜索行为特征、周末搜索行为特征、每月上旬搜索行为特征、每月中旬搜索行为特征、每月下旬搜索行为特征、搜索稳定性特征;所述第二衍生时序特征包括昼夜搜索行为特征、周中搜索行为特征、周末搜索行为特征、每月上旬搜索行为特征、每月中旬搜索行为特征、每月下旬搜索行为特征、搜索稳定性特征。
2.根据权利要求1所述的方法,其中,所述按照时间维度对提取的时间戳进行聚合和衍生,得到搜索行为模式特征之前,还包括:
对所述提取的时间戳进行排序整理及统计,得到搜索行为时序统计特征;
所述按照时间维度对提取的时间戳进行聚合和衍生,得到搜索行为模式特征,包括:
按照时间维度对所述搜索行为时序统计特征进行聚合和衍生,得到搜索行为模式特征。
3. 根据权利要求2所述的方法,其中,所述按照时间维度对所述搜索行为时序统计特征进行聚合和衍生,得到搜索行为模式特征,包括:
按照时间维度对所述搜索行为时序统计特征进行聚合,得到第一聚合时序统计特征;以及
对所述第一聚合时序统计特征进行衍生,得到第一衍生时序统计特征,所述搜索行为模式特征包括所述第一聚合时序统计特征和所述第一衍生时序统计特征;或者,对所述搜索行为时序统计特征进行衍生得到第二衍生时序统计特征,所述搜索行为模式特征包括所述第一聚合时序统计特征和所述第二衍生时序统计特征。
4.根据权利要求3所述的方法,其中,所述第一衍生时序统计特征包括昼夜搜索行为特征、周中/周末搜索行为特征、上/中/下旬搜索行为特征、搜索稳定性特征中的至少一种;所述第二衍生时序统计特征包括昼夜搜索行为特征、周中/周末搜索行为特征、上/中/下旬搜索行为特征、搜索稳定性特征中的至少一种。
5.根据权利要求1-4中任一项所述的方法,其中,所述时间维度包括月、日,小时、每月上旬、每月中旬、每月下旬、白天时间段以及夜间时间段中的至少一种。
6.根据权利要求1-4中任一项所述的方法,其中,所述将所述搜索行为模式特征作为入模变量,以生成所述预测模型之后,还包括:
根据所述样本用户的标识和预测标签对所述预测模型进行训练,得到训练的模型。
7.根据权利要求6所述的方法,其中,所述根据所述样本用户的标识和预测标签对所述预测模型进行训练,得到训练的模型之后,包括:
将目标用户的标识和所述目标用户的搜索行为模式特征输入所述训练的模型进行预测。
8.根据权利要求7所述的方法,其中,所述预测标签为风险控制标签。
9.根据权利要求1-4中任一项所述的方法,其中,所述预设时间范围包括自所述样本用户的时间戳之前的预设时间段。
10.根据权利要求1-4中任一项所述的方法,其中,所述将所述搜索行为模式特征作为入模变量,以生成所述预测模型,包括:
将所述搜索行为模式特征和所述搜索行为时序统计特征进行合并作为入模变量,以生成所述预测模型。
11.根据权利要求1-4中任一项所述的方法,其中,所述根据样本用户的时间戳,获取所述样本用户在预设时间范围内的搜索日志数据之前,还包括:
获取全量搜索日志数据和样本用户数据,所述全量搜索日志数据包括用户标识、搜索行为发生的时间戳以及搜索的内容,所述样本用户数据包括所述样本用户的标识和所述样本用户的时间戳。
12.一种预测模型建模装置,包括:
获取模块,用于根据样本用户的时间戳,获取所述样本用户在预设时间范围内的搜索日志数据;
提取模块,用于提取所述搜索日志数据中的时间戳;
衍生模块,用于按照时间维度对提取的时间戳进行聚合和衍生,得到搜索行为模式特征;以及
生成模块,用于将所述搜索行为模式特征作为入模变量,以生成所述预测模型;
其中,所述衍生模块,具体用于:
按照时间维度对所述提取的时间戳进行聚合,得到第一聚合时序特征;以及
对所述第一聚合时序特征进行衍生,得到第一衍生时序特征,所述搜索行为模式特征包括所述第一聚合时序特征和所述第一衍生时序特征;或者,对所述提取的时间戳进行衍生得到第二衍生时序特征,所述搜索行为模式特征包括所述第一聚合时序特征和所述第二衍生时序特征;
其中,所述第一衍生时序特征包括昼夜搜索行为特征、周中搜索行为特征、周末搜索行为特征、每月上旬搜索行为特征、每月中旬搜索行为特征、每月下旬搜索行为特征、搜索稳定性特征;所述第二衍生时序特征包括昼夜搜索行为特征、周中搜索行为特征、周末搜索行为特征、每月上旬搜索行为特征、每月中旬搜索行为特征、每月下旬搜索行为特征、搜索稳定性特征。
13.根据权利要求12所述的装置,其中,所述装置还包括:
统计模块,用于在所述衍生模块按照时间维度对提取的时间戳进行聚合和衍生,得到搜索行为模式特征之前,对所述提取的时间戳进行排序整理及统计,得到搜索行为时序统计特征;
所述衍生模块,具体用于:
按照时间维度对所述搜索行为时序统计特征进行聚合和衍生,得到搜索行为模式特征。
14. 根据权利要求13所述的装置,其中,所述衍生模块,具体用于:
按照时间维度对所述搜索行为时序统计特征进行聚合,得到第一聚合时序统计特征;以及
对所述第一聚合时序统计特征进行衍生,得到第一衍生时序统计特征,所述搜索行为模式特征包括所述第一聚合时序统计特征和所述第一衍生时序统计特征;或者,对所述搜索行为时序统计特征进行衍生得到第二衍生时序统计特征,所述搜索行为模式特征包括所述第一聚合时序统计特征和所述第二衍生时序统计特征。
15.根据权利要求14所述的装置,其中,所述第一衍生时序统计特征包括昼夜搜索行为特征、周中/周末搜索行为特征、上/中/下旬搜索行为特征、搜索稳定性特征中的至少一种;所述第二衍生时序统计特征包括昼夜搜索行为特征、周中/周末搜索行为特征、上/中/下旬搜索行为特征、搜索稳定性特征中的至少一种。
16.根据权利要求12-15中任一项所述的装置,其中,所述时间维度包括月、日,小时、每月上旬、每月中旬、每月下旬、白天时间段以及夜间时间段中的至少一种。
17.根据权利要求12-15中任一项所述的装置,其中,所述装置还包括:
训练模块,用于在所述生成模块将所述搜索行为模式特征作为入模变量,以生成所述预测模型之后,根据所述样本用户的标识和预测标签对所述预测模型进行训练,得到训练的模型。
18.根据权利要求17所述的装置,其中,所述装置还包括:
预测模块,用于在所述训练模块根据所述样本用户的标识和预测标签对所述预测模型进行训练,得到训练的模型之后,将目标用户的标识和所述目标用户的搜索行为模式特征输入所述训练的模型进行预测。
19.根据权利要求18所述的装置,其中,所述预测标签为风险控制标签。
20.根据权利要求12-15中任一项所述的装置,其中,所述预设时间范围包括自所述样本用户的时间戳之前的预设时间段。
21.根据权利要求12-15中任一项所述的装置,其中,所述生成模块,还用于:
将所述搜索行为模式特征和所述搜索行为时序统计特征进行合并作为入模变量,以生成所述预测模型。
22.根据权利要求12-15中任一项所述的装置,其中,所述获取模块,还用于:
在根据样本用户的时间戳,获取所述样本用户在预设时间范围内的搜索日志数据之前,获取全量搜索日志数据和样本用户数据,所述全量搜索日志数据包括用户标识、搜索行为发生的时间戳以及搜索的内容,所述样本用户数据包括所述样本用户的标识和所述样本用户的时间戳。
23. 一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-11中任一项所述的方法。
24.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-11中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010617186.0A CN111782611B (zh) | 2020-06-30 | 2020-06-30 | 预测模型建模方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010617186.0A CN111782611B (zh) | 2020-06-30 | 2020-06-30 | 预测模型建模方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111782611A CN111782611A (zh) | 2020-10-16 |
CN111782611B true CN111782611B (zh) | 2024-01-23 |
Family
ID=72760780
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010617186.0A Active CN111782611B (zh) | 2020-06-30 | 2020-06-30 | 预测模型建模方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111782611B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112734560B (zh) * | 2020-12-31 | 2024-05-14 | 深圳前海微众银行股份有限公司 | 变量构造方法、装置、设备及计算机可读存储介质 |
CN113627950B (zh) * | 2021-06-25 | 2023-12-29 | 淮安集略科技有限公司 | 基于动态图的用户交易特征提取的方法和系统 |
CN116451056B (zh) * | 2023-06-13 | 2023-09-29 | 支付宝(杭州)信息技术有限公司 | 端特征洞察方法、装置以及设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101796515A (zh) * | 2007-05-21 | 2010-08-04 | 谷歌公司 | 查询统计提供器 |
CN105335391A (zh) * | 2014-07-09 | 2016-02-17 | 阿里巴巴集团控股有限公司 | 基于搜索引擎的搜索请求的处理方法和装置 |
WO2016206196A1 (zh) * | 2015-06-26 | 2016-12-29 | 百度在线网络技术(北京)有限公司 | 用于获取用户属性信息的方法、装置及服务器 |
CN106846061A (zh) * | 2017-01-25 | 2017-06-13 | 百度在线网络技术(北京)有限公司 | 潜在用户挖掘方法以及装置 |
CN107341187A (zh) * | 2017-06-07 | 2017-11-10 | 努比亚技术有限公司 | 搜索处理方法、装置、设备和计算机存储介质 |
CN107993085A (zh) * | 2017-10-19 | 2018-05-04 | 阿里巴巴集团控股有限公司 | 模型训练方法、基于模型的用户行为预测方法及装置 |
CN110674979A (zh) * | 2019-09-11 | 2020-01-10 | 腾讯科技(深圳)有限公司 | 风险预测模型的训练方法、预测方法及装置、介质和设备 |
CN111062736A (zh) * | 2018-10-17 | 2020-04-24 | 百度在线网络技术(北京)有限公司 | 模型训练、线索排序方法、装置及设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10929481B2 (en) * | 2016-11-03 | 2021-02-23 | International Business Machines Corporation | System and method for cognitive agent-based user search behavior modeling |
-
2020
- 2020-06-30 CN CN202010617186.0A patent/CN111782611B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101796515A (zh) * | 2007-05-21 | 2010-08-04 | 谷歌公司 | 查询统计提供器 |
CN105335391A (zh) * | 2014-07-09 | 2016-02-17 | 阿里巴巴集团控股有限公司 | 基于搜索引擎的搜索请求的处理方法和装置 |
WO2016206196A1 (zh) * | 2015-06-26 | 2016-12-29 | 百度在线网络技术(北京)有限公司 | 用于获取用户属性信息的方法、装置及服务器 |
CN106846061A (zh) * | 2017-01-25 | 2017-06-13 | 百度在线网络技术(北京)有限公司 | 潜在用户挖掘方法以及装置 |
CN107341187A (zh) * | 2017-06-07 | 2017-11-10 | 努比亚技术有限公司 | 搜索处理方法、装置、设备和计算机存储介质 |
CN107993085A (zh) * | 2017-10-19 | 2018-05-04 | 阿里巴巴集团控股有限公司 | 模型训练方法、基于模型的用户行为预测方法及装置 |
CN111062736A (zh) * | 2018-10-17 | 2020-04-24 | 百度在线网络技术(北京)有限公司 | 模型训练、线索排序方法、装置及设备 |
CN110674979A (zh) * | 2019-09-11 | 2020-01-10 | 腾讯科技(深圳)有限公司 | 风险预测模型的训练方法、预测方法及装置、介质和设备 |
Non-Patent Citations (1)
Title |
---|
协同搜索过程中用户交流内容与模式研究;张璐 等;图书情报知识;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111782611A (zh) | 2020-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107818344B (zh) | 用户行为进行分类和预测的方法和系统 | |
CN111782611B (zh) | 预测模型建模方法、装置、设备及存储介质 | |
CN112785397A (zh) | 一种产品推荐方法、装置及存储介质 | |
KR102472572B1 (ko) | 사용자 의도 프로파일링 방법 및 이를 위한 장치 | |
CN109783730A (zh) | 产品推荐方法、装置、计算机设备和存储介质 | |
US20160189201A1 (en) | Enhanced targeted advertising system | |
CN108090568B (zh) | 认知机器人学分析器 | |
CN111104514A (zh) | 文档标签模型的训练方法及装置 | |
CN111966890A (zh) | 基于文本的事件推送方法、装置、电子设备和存储介质 | |
CN106022708A (zh) | 一种预测员工离职的方法 | |
CN111046192A (zh) | 银行涉案账户的识别方法及装置 | |
KR20200039852A (ko) | 기업 경영 현황 분석 예측 모델링을 위한 기계학습 알고리즘 제공 방법 | |
US20190318255A1 (en) | Combining Entity Analysis and Predictive Analytics | |
CN111523677A (zh) | 实现对机器学习模型的预测结果进行解释的方法及装置 | |
US10922633B2 (en) | Utilizing econometric and machine learning models to maximize total returns for an entity | |
CN108647064A (zh) | 操作路径导航的方法及装置 | |
KR20200053005A (ko) | 상황인지 기반의 기업주가예측 알고리즘 제공 방법 | |
CN108520045B (zh) | 数据的服务响应方法及装置 | |
CN112597775A (zh) | 信贷风险预测方法及装置 | |
CN110880128A (zh) | 异常信息挖掘方法、装置、系统及终端设备 | |
Saleem et al. | Data science and machine learning approach to improve E-commerce sales performance on social web | |
CN114090601B (zh) | 一种数据筛选方法、装置、设备以及存储介质 | |
CN109558528A (zh) | 文章推送方法、装置、计算机可读存储介质和服务器 | |
CN116823410B (zh) | 数据处理方法、对象处理方法、推荐方法及计算设备 | |
CN112650919A (zh) | 实体资讯分析方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |