CN107657500A - 股票推荐方法及服务器 - Google Patents
股票推荐方法及服务器 Download PDFInfo
- Publication number
- CN107657500A CN107657500A CN201611097715.9A CN201611097715A CN107657500A CN 107657500 A CN107657500 A CN 107657500A CN 201611097715 A CN201611097715 A CN 201611097715A CN 107657500 A CN107657500 A CN 107657500A
- Authority
- CN
- China
- Prior art keywords
- client
- stock
- default
- predetermined number
- data class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Probability & Statistics with Applications (AREA)
- Technology Law (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了一种股票推荐方法及服务器,该方法包括:通过控制服务器根据第一预设数量的客户在预设时间内的股票交易数据,确定出高盈利客户;将基于高盈利客户提取的第一预设数量的客户作为训练集,随机抽取部分普通交易用户作为测试集,将第一预设数量的客户进行分类,形成第二预设数量的数据类;再按照预设的客户分群判别规则,以第二预设数量的数据类作为训练集,对普通用户的类别进行判别,并与第二预设数量的数据类进行匹配。本发明能实现将不同风格的股票精准的推送给偏好对应风格的普通用户。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种股票推荐方法及服务器。
背景技术
随着国内证券市场竞争的日趋激烈,券商的经营模式逐渐从“技术驱动”向“服务驱动”转化。面对多样化、层次化、个性化的客户需求,大众化营销和服务已经失去了其优势,基于客户需求深入数据分析的洞察力营销、个性化营销的理念逐渐被各大券商所接受,并渴望通过从数据中挖掘价值来减少营销成本、提高营销效益。目前,业内也有利用历史交易数据向用户进行股票推荐,但这种现有的推荐方式通常使用的是单一的收益率、胜率等指标进行股票筛选,准确率较低,而且未充分考虑用户的交易习惯(例如,偏好高抛低吸、偏好短线交易、偏好小盘股等)。
发明内容
本发明的主要目的在于提供一种股票推荐方法及服务器,旨在精准的为用户推荐符合其偏好风格的股票。
为实现上述目的,本发明提供的一种股票推荐方法,所述方法包括以下步骤:
a1、控制服务器与至少一个股票交易服务器通信连接,从客户的历史股票交易数据中,按照预设的提取规则提取出第一预设数量的客户在预设时间内的股票交易数据,计算出各个客户对应每支个股层面在各个预设的计算周期的各个预设类型的指标,根据计算出的各个客户对应每支个股层面的指标,并按预设的特征标签提取规则提取出预先确定的特征标签,以及提取出预先确定的常规标签,确定出符合预设标准的高盈利客户;
a2、控制服务器对第一预设数量的客户按照预先确定的多个维度标签进行客户画像匹配,并按照预设的变量筛选规则,提取出与高盈利客户相关性大的关键特征标签组合;
a3、控制服务器将提取的第一预设数量的客户作为训练集,随机抽取部分普通交易用户作为测试集,按照预设的分析规则及关键特征标签组合将第一预设数量的客户进行分类,形成第二预设数量的数据类;
a4、控制服务器按照预设的客户分群判别规则,以第二预设数量的数据类作为训练集,当接收到普通用户的股票推荐请求时,对普通用户的类别进行判别,并与第二预设数量的数据类进行匹配,将符合关键特征标签组合中特征的不同风格的股票推送给对应分类的普通用户。
优选地,该方法还包括:
a5、控制服务器定时或者实时获取第一预设数量用户的股票交易数据,并按预设的特征标签提取规则对获取的各个预先确定的客户的股票交易数据进行特征标签分析,以定时或实时更新第一、第二预设数量,实现数据的循环迭代更新;
a6、控制服务器实时跟踪第二预设数量用户的交易行为,优选各类别下预设数量的优选股票推送给相同风格的普通用户,并根据后台系统捕捉到的该优选股票相关信息,控制服务器根据预先确定的特征与推荐信息之间的关联关系,确定出所述特征标签中除关键特征之外的其他特征对应的推荐信息,并将确定出的推荐信息实时或者定时推送给该相同风格的普通客户。
优选地,所述预设的特征标签提取规则为:
对于连续数值的各种股票交易数据种类设置对应的标签阈值;对于非为连续数值的各种股票交易数据设置对应的标签范围;根据连续数值的各种股票交易数据与标签阈值的映射关系,确定出各个客户在预设时间内的属于连续数值的股票交易数据对应的标签信息,及根据非为连续数值的各种股票交易数据与标签范围的映射关系,确定出各个客户在预设时间内的属于非连续数值的股票交易数据对应的标签信息。
优选地,所述预设的变量筛选规则是典型相关分析,所述预设的变量筛选规则为:
以第一预设数量的客户在预设时间内的盈亏相关指标作为因变量,以预先确定的多个维度标签作为自变量,采用典型相关分析方法,分别找出自变量的线性组合U及因变量的线性组合V;
通过调整自变量、因变量的线性组合的系数,使得U和V的相关性达到最大,找出与盈亏相关指标相关性最大、并通过显著性检验的特征指标。
优选地,所述预设的分析规则是K-MEANS聚类算法规则,所述预设的分析规则为:
A、从第一预设数量的客户在预设时间内的股票交易数据,任意选择第二预设数量的客户在预设时间内的股票交易数据作为第一聚类中心,所述第二预设数量为K个,K为大于或等于2的正整数;
B、利用预设的距离计算方法算出剩余的各个客户在预设时间内的股票交易数据到每个第一聚类中心的第一距离,将剩余的各个客户在预设时间内的股票交易数据划分到距离最近的第一聚类中心的类,以获得K个当前数据类;
C、按照预设计算规则,重新计算各个所述当前数据类的第二聚类中心;
D、计算各个所述当前数据类的第二聚类中心与对应的原第一聚类中心的第二距离,若各个所述当前数据类对应的第二距离均小于预设阈值,则各个所述当前数据类即是要划分的第二预设数量的数据类,或者,若有所述当前数据类对应的第二距离大于等于预设阈值,则转入执行下述步骤E;
E、测量各个客户在预设时间内的股票交易数据到每个第二聚类中心的第一距离,将各个客户在预设时间内的股票交易数据划分到距离最近的第二聚类中心的类,以获得K个最新数据类;
F、按照预设计算规则,重新计算各个所述最新数据类的当前第二聚类中心;
G、计算各个所述最新数据类的当前第二聚类中心与对应的原第二聚类中心的第二距离,若各个所述最新数据类对应的第二距离均小于预设阈值,则各个所述最新数据类即是要划分的第二预设数量的数据类,或者,若有所述最新数据类对应的第二距离大于等于预设阈值,则重复执行上述步骤E、F、G,直到各个所述最新数据类对应的第二距离均小于预设阈值为止。
优选地,所述预设计算规则为:对数据类下的各个客户在预设时间内的股票交易数据取均值,所述均值是对应的数据类的第二聚类中心。
优选地,所述预设的客户分群判别规则为判别分析算法,所述预设的客户分群判别规则为:
将第二预设数量的数据类均分为X1、X2两部分,X1部分作为训练样本集,X2部分作为验证样本集,分别利用X1部分的训练样本训练出多个预先确定的分类判别模型,分别用X2部分的验证样本验证训练出的各个分类判别模型的准确率和/或召回率,确定出准确率和/或召回率符合预设要求的分类判别模型,并利用确定出的分类判别模型识别普通用户的类别。
此外,为实现上述目的,本发明还提供一种用于推荐股票的控制服务器,所述控制服务器包括:
第一提取模块,用于与至少一个股票交易服务器通信连接,从客户的历史股票交易数据中,按照预设的提取规则提取出第一预设数量的客户在预设时间内的股票交易数据,计算出各个客户对应每支个股层面在各个预设的计算周期的各个预设类型的指标,根据计算出的各个客户对应每支个股层面的指标,并按预设的特征标签提取规则提取出预先确定的特征标签,以及提取出预先确定的常规标签,确定出符合预设标准的高盈利客户;
第二提取模块,用于对第一预设数量的客户按照预先确定的多个维度标签进行客户画像匹配,并按照预设的变量筛选规则,提取出与高盈利客户相关性大的关键特征标签组合;
分类模块,用于将提取的第一预设数量的客户作为训练集,随机抽取部分普通交易用户作为测试集,按照预设的分析规则及关键特征标签组合将第一预设数量的客户进行分类,形成第二预设数量的数据类;
第一推送模块,用于按照预设的客户分群判别规则,以第二预设数量的数据类作为训练集,当接收到普通用户的股票推荐请求时,对普通用户的类别进行判别,并与第二预设数量的数据类进行匹配,将符合关键特征标签组合中特征的不同风格的股票推送给对应分类的普通用户。
优选地,还包括:
更新模块,用于定时或者实时获取第一预设数量用户的股票交易数据,并按预设的特征标签提取规则对获取的各个预先确定的客户的股票交易数据进行特征标签分析,以定时或实时更新第一、第二预设数量,实现数据的循环迭代更新;
第二推送模块,用于实时跟踪第二预设数量用户的交易行为,优选各类别下预设数量的优选股票推送给相同风格的普通用户,并根据后台系统捕捉到的该优选股票相关信息,根据预先确定的特征与推荐信息之间的关联关系,确定出所述特征标签中除关键特征之外的其他特征对应的推荐信息,并将确定出的推荐信息实时或者定时推送给该相同风格的普通客户。
优选地,所述预设的特征标签提取规则为:
对于连续数值的各种股票交易数据种类设置对应的标签阈值;对于非为连续数值的各种股票交易数据设置对应的标签范围;根据连续数值的各种股票交易数据与标签阈值的映射关系,确定出各个客户在预设时间内的属于连续数值的股票交易数据对应的标签信息,及根据非为连续数值的各种股票交易数据与标签范围的映射关系,确定出各个客户在预设时间内的属于非连续数值的股票交易数据对应的标签信息。
优选地,所述预设的变量筛选规则是典型相关分析,所述预设的变量筛选规则为:
以第一预设数量的客户在预设时间内的盈亏相关指标作为因变量,以预先确定的多个维度标签作为自变量,采用典型相关分析方法,分别找出自变量的线性组合U及因变量的线性组合V;
通过调整自变量、因变量的线性组合的系数,使得U和V的相关性达到最大,找出与盈亏相关指标相关性最大、并通过显著性检验的特征指标。
优选地,所述预设的分析规则是K-MEANS聚类算法规则,所述预设的分析规则为:
A、从第一预设数量的客户在预设时间内的股票交易数据,任意选择第二预设数量的客户在预设时间内的股票交易数据作为第一聚类中心,所述第二预设数量为K个,K为大于或等于2的正整数;
B、利用预设的距离计算方法算出剩余的各个客户在预设时间内的股票交易数据到每个第一聚类中心的第一距离,将剩余的各个客户在预设时间内的股票交易数据划分到距离最近的第一聚类中心的类,以获得K个当前数据类;
C、按照预设计算规则,重新计算各个所述当前数据类的第二聚类中心;
D、计算各个所述当前数据类的第二聚类中心与对应的原第一聚类中心的第二距离,若各个所述当前数据类对应的第二距离均小于预设阈值,则各个所述当前数据类即是要划分的第二预设数量的数据类,或者,若有所述当前数据类对应的第二距离大于等于预设阈值,则转入执行下述步骤E;
E、测量各个客户在预设时间内的股票交易数据到每个第二聚类中心的第一距离,将各个客户在预设时间内的股票交易数据划分到距离最近的第二聚类中心的类,以获得K个最新数据类;
F、按照预设计算规则,重新计算各个所述最新数据类的当前第二聚类中心;
G、计算各个所述最新数据类的当前第二聚类中心与对应的原第二聚类中心的第二距离,若各个所述最新数据类对应的第二距离均小于预设阈值,则各个所述最新数据类即是要划分的第二预设数量的数据类,或者,若有所述最新数据类对应的第二距离大于等于预设阈值,则重复执行上述步骤E、F、G,直到各个所述最新数据类对应的第二距离均小于预设阈值为止。
优选地,所述预设计算规则为:对数据类下的各个客户在预设时间内的股票交易数据取均值,所述均值是对应的数据类的第二聚类中心。
优选地,所述预设的客户分群判别规则为判别分析算法,所述预设的客户分群判别规则为:
将第二预设数量的数据类均分为X1、X2两部分,X1部分作为训练样本集,X2部分作为验证样本集,分别利用X1部分的训练样本训练出多个预先确定的分类判别模型,分别用X2部分的验证样本验证训练出的各个分类判别模型的准确率和/或召回率,确定出准确率和/或召回率符合预设要求的分类判别模型,并利用确定出的分类判别模型识别普通用户的类别。
本发明提出的一种股票推荐方法及服务器,通过控制服务器根据第一预设数量的客户在预设时间内的股票交易数据,确定出高收益率、高胜算率、高成功率的高盈利客户;将基于高盈利客户提取的第一预设数量的客户作为训练集,随机抽取部分普通交易用户作为测试集,将第一预设数量的客户进行分类,形成第二预设数量的数据类;再按照预设的客户分群判别规则,以第二预设数量的数据类作为训练集,对普通用户的类别进行判别,并与第二预设数量的数据类进行匹配。由于是基于高盈利客户区分的不同数据类来对普通用户的类别进行判别并进行股票推送,能向普通用户推送相对高收益率、高胜算率、高成功率的股票,且是根据与第二预设数量的数据类相匹配的数据类来进行推送,能实现将不同风格的股票精准的推送给偏好对应风格的普通用户。
附图说明
图1为本发明股票推荐方法第一实施例的流程示意图;
图2为本发明股票推荐方法第二实施例的流程示意图;
图3为本发明用于推荐股票的控制服务器第一实施例的功能模块示意图;
图4为本发明用于推荐股票的控制服务器第二实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种股票推荐方法。
参照图1,图1为本发明股票推荐方法第一实施例的流程示意图。
在第一实施例中,该股票推荐方法包括:
步骤S10,控制服务器与至少一个股票交易服务器通信连接,从客户的历史股票交易数据中,按照预设的提取规则提取出第一预设数量的客户在预设时间内的股票交易数据,计算出各个客户对应每支个股层面在各个预设的计算周期的各个预设类型的指标,根据计算出的各个客户对应每支个股层面的指标,并按预设的特征标签提取规则提取出预先确定的特征标签,以及提取出预先确定的常规标签,确定出符合预设标准的高盈利客户;
本实施例中,控制服务器与至少一个股票交易服务器通信连接,从客户的历史股票交易数据中,按照预设的提取规则提取出第一预设数量的(例如,股龄2年以上)的客户在预设时间内(例如,最近2年内)的股票交易数据,即提取出第一预设数量的客户属性数据对应的预设时间内的股票交易及资金数据(例如,交易时间、交易方向、交易份额、交易金额、股票类型、持仓市值、资金余额等),计算出各个客户对应每支个股层面在各个预设的计算周期(例如,累计、近3个月、近1个月及近1周)的各个预设类型的指标。例如,各个预设类型的指标可包括收益率、客户层面的胜算率(即:每次交易的盈利比例)、交易成功率(即:买入股票后上涨、卖出股票后下跌即为成功)、盈亏比及抓涨停板比例等盈亏相关指标,根据计算出的各个客户对应每支个股层面的指标,并按预设的特征标签提取规则提取出预先确定的特征标签(例如,“偏好短线交易“、“是否偏好大盘下降时低仓位”等),以及提取出预先确定的常规标签如持仓比例、交易频率、平均持有时长、股票的性质(板块、概念、行业、公司财务状况等)、年龄、性别等,确定出高收益率、高胜算率、高成功率的高盈利客户。其中,交易方向包括买入及卖出,交易份额指的是买入或者卖出的股票所占的份额;客户层面的胜算率指的是客户在统计期间内所有股票交易的盈利比例;盈亏比指的是赚钱的交易平均盈利点数/亏损的交易平均亏损点数,赚钱的交易指的是卖出股票价格大于买入股票价格的买卖交易,盈利点数指的是盈利比例(即:各个股票买卖交易对应的卖出额与买入额之差除以买入额的比例),亏损的交易指的是卖出额小于买入额的股票买卖交易,亏损点数指的是亏损比例(即:各个股票买卖交易对应的买入额与卖出额之差除以买入额的比例);抓涨停板比例指的是买入股票中在持有期间日涨幅在预设涨幅(例如,9.9%)以上的股票在全部买入股票中所占的比例。
步骤S20,控制服务器对第一预设数量的客户按照预先确定的多个维度标签进行客户画像匹配,并按照预设的变量筛选规则,提取出与高盈利客户相关性大的关键特征标签组合;
控制服务器对第一预设数量的客户按照预先确定的多个维度标签(例如,交易风格、持仓比例、交易频率、平均持有时长、年龄、总资产等多个维度标签)进行客户画像匹配,并按照预设的变量筛选规则,提取出与高盈利客户相关性大的关键特征标签组合。其中,客户画像指的是客户的各个预设分类(例如,学历特征类、年龄特征类、职业特征类、收入特征类、星座属相特征类、风险偏好特征类等等)的特征的集合(例如,X客户的画像对应包括的预设分类的特征包括高学历、青中年、高收入、偏好中高风险等),客户画像的生成过程包括:对于属于连续数值的特征数据设置对应的标准阈值(例如,可以设置年收入20万人民币为高收入标准阈值,若一个客户的年收入大于等于20万,则为该客户的客户画像加入高收入特征);对于不是连续数值的特征数据设置对应的特征范围(例如,可以设置本科及以上学历为高学历特征范围,可以设置高中及以下学历为低学历特征范围等);将客户的属于连续数值的特征数据与对应的标准阈值进行比较,确定出客户的属于连续数值的特征数据对应的分类特征;将客户的非为连续数值的特征数据与对应的特征范围进行比较,确定出客户的非为连续数值的特征数据对应的分类特征。
步骤S30,控制服务器将提取的第一预设数量的客户作为训练集,随机抽取部分普通交易用户作为测试集,按照预设的分析规则及关键特征标签组合将第一预设数量的客户进行分类,如分成高抛低吸、偏好短线交易等几大类,形成第二预设数量的数据类;
步骤S40,控制服务器按照预设的客户分群判别规则,以第二预设数量的数据类作为训练集,当接收到普通用户的股票推荐请求时,对普通用户的类别进行判别,并与第二预设数量的数据类进行匹配,将符合关键特征标签组合中特征的不同风格的股票推送给对应分类的普通用户。
本实施例通过控制服务器根据第一预设数量的客户在预设时间内的股票交易数据,确定出高收益率、高胜算率、高成功率的高盈利客户;将基于高盈利客户提取的第一预设数量的客户作为训练集,随机抽取部分普通交易用户作为测试集,将第一预设数量的客户进行分类,形成第二预设数量的数据类;再按照预设的客户分群判别规则,以第二预设数量的数据类作为训练集,对普通用户的类别进行判别,并与第二预设数量的数据类进行匹配。由于是基于高盈利客户区分的不同数据类来对普通用户的类别进行判别并进行股票推送,能向普通用户推送相对高收益率、高胜算率、高成功率的股票,且是根据与第二预设数量的数据类相匹配的数据类来进行推送,能实现将不同风格的股票精准的推送给偏好对应风格的普通用户。
如图2所示,本发明第二实施例提出一种股票推荐方法,在上述实施例的基础上,还包括:
步骤S50,控制服务器定时或者实时获取第一预设数量用户的股票交易数据,并按预设的特征标签提取规则对获取的各个预先确定的客户的股票交易数据进行特征标签分析,以定时或实时更新第一、第二预设数量,实现数据的循环迭代更新;
步骤S60,控制服务器实时跟踪第二预设数量用户的交易行为,优选各类别下预设数量的优选股票推送给相同风格的普通用户,并根据后台系统捕捉到的该优选股票相关信息,控制服务器根据预先确定的特征与推荐信息之间的关联关系,确定出所述特征标签中除关键特征之外的其他特征对应的推荐信息,并将确定出的推荐信息实时或者定时推送给该相同风格的普通客户。
控制服务器实时跟踪第二预设数据用户的交易行为,通过持仓比例、交易金额等方式优选各类别下(例如,偏好高抛低吸、偏好短线交易、偏好小盘股等)预设数量的优选股票(例如,客户排序前五位的优选股票)推送给相同风格的普通用户。并根据后台系统捕捉到的该优选股票相关信息如该股票行业、相关新闻、研究报告等信息,控制服务器根据预先确定的特征与推荐信息(例如,“最近两年资源型股表现抢眼,建议可以多关注资源型股”、“最近大盘处于下降通道,建议清仓或者保持低仓位”等)之间的关联关系,确定出所述特征标签即该基准特征标签中除关键特征之外的其他特征对应的推荐信息,并将确定出的推荐信息实时或者定时推送给该相同风格的普通客户(例如,将推荐信息发送给该客户对应的手机号码)。
进一步地,在其他实施例中,上述预设的特征标签提取规则为:
对于连续数值的各种股票交易数据种类设置对应的标签阈值;对于非为连续数值的各种股票交易数据设置对应的标签范围;根据连续数值的各种股票交易数据与标签阈值的映射关系,确定出各个客户在预设时间内的属于连续数值的股票交易数据对应的标签信息,及根据非为连续数值的各种股票交易数据与标签范围的映射关系,确定出各个客户在预设时间内的属于非连续数值的股票交易数据对应的标签信息。
对于连续数值的各种股票交易数据种类设置对应的标签阈值(例如,股票从买到卖的时间间隔对应的标签阈值可以为48小时,大盘处于上升通道时每次买卖股票后的股票仓位对应的标签阈值可以为60%;大盘处于下降通道时每次买卖股票后的股票仓位对应的标签阈值可以为40%;当客户在预设时间内每一次交易的股票或者有超过预设比例“例如,80%”的交易股票从买到卖的时间间隔小于等于48小时,则代表该客户的特征标签包括特征“偏好短线交易”;当大盘处于上升通道时,客户每次买卖股票后的股票仓位大于等于60%或者有超过预设比例“例如,80%”的股票买卖后的股票仓位大于等于60%,则代表该客户的特征标签包括特征“偏好大盘上升时高仓位”;当大盘处于下降通道时,客户每次买卖股票后的股票仓位小于等于40%或者有超过预设比例“例如,80%”的股票买卖后的股票仓位小于等于40%,则代表该客户的特征标签包括特征“偏好大盘下降时低仓位”);
对于非为连续数值的各种股票交易数据设置对应的标签范围(例如,资源型股包括:经营金、银、铜、铁、锡、煤、石油等预先确定的资源的企业对应的股票为资源型股,当客户每次买卖的股票均为资源型股或者有超过预设比例“例如,80%”的股票为资源型股时,代表该客户的特征标签包括特征“偏好资源型股”);
根据连续数值的各种股票交易数据与标签阈值的映射关系,确定出各个客户在预设时间内的属于连续数值的股票交易数据对应的标签信息,及根据非为连续数值的各种股票交易数据与标签范围的映射关系,确定出各个客户在预设时间内的属于非连续数值的股票交易数据对应的标签信息。
进一步地,在其他实施例中,上述预设的变量筛选规则是典型相关分析,所述预设的变量筛选规则为:
以第一预设数量的客户在预设时间内的收益率、胜算率、交易成功率、盈亏比、抓涨停板比例等盈亏相关指标作为因变量,以预先确定的多个维度标签(例如,交易风格、持仓比例、交易频率、平均持有时长、年龄、总资产等多个维度标签)作为自变量,采用典型相关分析方法,分别找出自变量的线性组合U及因变量的线性组合V;
通过调整自变量、因变量的线性组合的系数,使得U和V的相关性达到最大,找出与盈亏相关指标相关性最大、并通过显著性检验的特征指标。
进一步地,在其他实施例中,上述预设的分析规则是K-MEANS聚类算法规则,所述预设的分析规则为:
A、从第一预设数量的客户在预设时间内的股票交易数据,任意选择第二预设数量的客户在预设时间内的股票交易数据作为第一聚类中心,所述第二预设数量为K个,K为大于或等于2的正整数;
B、利用预设的距离计算方法(例如欧氏距离、余弦相似度等)算出剩余的各个客户在预设时间内的股票交易数据到每个第一聚类中心的第一距离,将剩余的各个客户在预设时间内的股票交易数据划分到距离最近的第一聚类中心的类(例如,若A客户在预设时间内的股票交易数据距离第一聚类中心X最近,则将A客户在预设时间内的股票交易数据划分到第一聚类中心X的类),以获得K个当前数据类;
C、按照预设计算规则,重新计算各个所述当前数据类的第二聚类中心;
D、计算各个所述当前数据类的第二聚类中心与对应的原第一聚类中心的第二距离,若各个所述当前数据类对应的第二距离均小于预设阈值,则各个所述当前数据类即是要划分的第二预设数量的数据类,或者,若有所述当前数据类对应的第二距离大于等于预设阈值,则转入执行下述步骤E;
E、测量各个客户在预设时间内的股票交易数据到每个第二聚类中心的第一距离,将各个客户在预设时间内的股票交易数据划分到距离最近的第二聚类中心的类,以获得K个最新数据类;
F、按照预设计算规则,重新计算各个所述最新数据类的当前第二聚类中心;其中,该预设计算规则为:对数据类下的各个客户在预设时间内的股票交易数据取均值,所述均值即是对应的数据类的第二聚类中心;
G、计算各个所述最新数据类的当前第二聚类中心与对应的原第二聚类中心的第二距离,若各个所述最新数据类对应的第二距离均小于预设阈值,则各个所述最新数据类即是要划分的第二预设数量的数据类,或者,若有所述最新数据类对应的第二距离大于等于预设阈值,则重复执行上述步骤E、F、G,直到各个所述最新数据类对应的第二距离均小于预设阈值为止。
进一步地,在其他实施例中,上述预设的客户分群判别规则为判别分析算法,所述预设的判别规则为:
将第二预设数量的数据类均分为X1、X2两部分,X1部分作为训练样本集,X2部分作为验证样本集,分别利用X1部分的训练样本训练出多个预先确定的分类判别模型(例如,距离判别模型、Bayes判别模型及Fisher判别模型等),分别用X2部分的验证样本验证训练出的各个分类判别模型的准确率和/或召回率,确定出准确率和/或召回率符合预设要求(综合数值最高,例如采用F1measure等指标来进行衡量)的分类判别模型,并利用确定出的分类判别模型识别普通用户的类别。
本发明进一步提供一种用于推荐股票的控制服务器。
参照图3,图3为本发明用于推荐股票的控制服务器第一实施例的功能模块示意图。
在第一实施例中,该控制服务器包括:
第一提取模块01,用于与至少一个股票交易服务器通信连接,从客户的历史股票交易数据中,按照预设的提取规则提取出第一预设数量的客户在预设时间内的股票交易数据,计算出各个客户对应每支个股层面在各个预设的计算周期的各个预设类型的指标,根据计算出的各个客户对应每支个股层面的指标,并按预设的特征标签提取规则提取出预先确定的特征标签,以及提取出预先确定的常规标签,确定出符合预设标准的高盈利客户;
本实施例中,控制服务器与至少一个股票交易服务器通信连接,从客户的历史股票交易数据中,按照预设的提取规则提取出第一预设数量的(例如,股龄2年以上)的客户在预设时间内(例如,最近2年内)的股票交易数据,即提取出第一预设数量的客户属性数据对应的预设时间内的股票交易及资金数据(例如,交易时间、交易方向、交易份额、交易金额、股票类型、持仓市值、资金余额等),计算出各个客户对应每支个股层面在各个预设的计算周期(例如,累计、近3个月、近1个月及近1周)的各个预设类型的指标。例如,各个预设类型的指标可包括收益率、客户层面的胜算率(即:每次交易的盈利比例)、交易成功率(即:买入股票后上涨、卖出股票后下跌即为成功)、盈亏比及抓涨停板比例等盈亏相关指标,根据计算出的各个客户对应每支个股层面的指标,并按预设的特征标签提取规则提取出预先确定的特征标签(例如,“偏好短线交易“、“是否偏好大盘下降时低仓位”等),以及提取出预先确定的常规标签如持仓比例、交易频率、平均持有时长、股票的性质(板块、概念、行业、公司财务状况等)、年龄、性别等,确定出高收益率、高胜算率、高成功率的高盈利客户。其中,交易方向包括买入及卖出,交易份额指的是买入或者卖出的股票所占的份额;客户层面的胜算率指的是客户在统计期间内所有股票交易的盈利比例;盈亏比指的是赚钱的交易平均盈利点数/亏损的交易平均亏损点数,赚钱的交易指的是卖出股票价格大于买入股票价格的买卖交易,盈利点数指的是盈利比例(即:各个股票买卖交易对应的卖出额与买入额之差除以买入额的比例),亏损的交易指的是卖出额小于买入额的股票买卖交易,亏损点数指的是亏损比例(即:各个股票买卖交易对应的买入额与卖出额之差除以买入额的比例);抓涨停板比例指的是买入股票中在持有期间日涨幅在预设涨幅(例如,9.9%)以上的股票在全部买入股票中所占的比例。
第二提取模块02,用于对第一预设数量的客户按照预先确定的多个维度标签进行客户画像匹配,并按照预设的变量筛选规则,提取出与高盈利客户相关性大的关键特征标签组合;
控制服务器对第一预设数量的客户按照预先确定的多个维度标签(例如,交易风格、持仓比例、交易频率、平均持有时长、年龄、总资产等多个维度标签)进行客户画像匹配,并按照预设的变量筛选规则,提取出与高盈利客户相关性大的关键特征标签组合。其中,客户画像指的是客户的各个预设分类(例如,学历特征类、年龄特征类、职业特征类、收入特征类、星座属相特征类、风险偏好特征类等等)的特征的集合(例如,X客户的画像对应包括的预设分类的特征包括高学历、青中年、高收入、偏好中高风险等),客户画像的生成过程包括:对于属于连续数值的特征数据设置对应的标准阈值(例如,可以设置年收入20万人民币为高收入标准阈值,若一个客户的年收入大于等于20万,则为该客户的客户画像加入高收入特征);对于不是连续数值的特征数据设置对应的特征范围(例如,可以设置本科及以上学历为高学历特征范围,可以设置高中及以下学历为低学历特征范围等);将客户的属于连续数值的特征数据与对应的标准阈值进行比较,确定出客户的属于连续数值的特征数据对应的分类特征;将客户的非为连续数值的特征数据与对应的特征范围进行比较,确定出客户的非为连续数值的特征数据对应的分类特征。
分类模块03,用于将提取的第一预设数量的客户作为训练集,随机抽取部分普通交易用户作为测试集,按照预设的分析规则及关键特征标签组合将第一预设数量的客户进行分类,如分成高抛低吸、偏好短线交易等几大类,形成第二预设数量的数据类;
第一推送模块04,用于按照预设的客户分群判别规则,以第二预设数量的数据类作为训练集,当接收到普通用户的股票推荐请求时,对普通用户的类别进行判别,并与第二预设数量的数据类进行匹配,将符合关键特征标签组合中特征的不同风格的股票推送给对应分类的普通用户。
本实施例通过控制服务器根据第一预设数量的客户在预设时间内的股票交易数据,确定出高收益率、高胜算率、高成功率的高盈利客户;将基于高盈利客户提取的第一预设数量的客户作为训练集,随机抽取部分普通交易用户作为测试集,将第一预设数量的客户进行分类,形成第二预设数量的数据类;再按照预设的客户分群判别规则,以第二预设数量的数据类作为训练集,对普通用户的类别进行判别,并与第二预设数量的数据类进行匹配。由于是基于高盈利客户区分的不同数据类来对普通用户的类别进行判别并进行股票推送,能向普通用户推送相对高收益率、高胜算率、高成功率的股票,且是根据与第二预设数量的数据类相匹配的数据类来进行推送,能实现将不同风格的股票精准的推送给偏好对应风格的普通用户。
如图4所示,本发明第二实施例提出一种用于推荐股票的控制服务器,在上述实施例的基础上,该控制服务器还包括:
更新模块05,用于定时或者实时获取第一预设数量用户的股票交易数据,并按预设的特征标签提取规则对获取的各个预先确定的客户的股票交易数据进行特征标签分析,以定时或实时更新第一、第二预设数量,实现数据的循环迭代更新;
第二推送模块06,用于实时跟踪第二预设数量用户的交易行为,优选各类别下预设数量的优选股票推送给相同风格的普通用户,并根据后台系统捕捉到的该优选股票相关信息,根据预先确定的特征与推荐信息之间的关联关系,确定出所述特征标签中除关键特征之外的其他特征对应的推荐信息,并将确定出的推荐信息实时或者定时推送给该相同风格的普通客户。
控制服务器实时跟踪第二预设数据用户的交易行为,通过持仓比例、交易金额等方式优选各类别下(例如,偏好高抛低吸、偏好短线交易、偏好小盘股等)预设数量的优选股票(例如,客户排序前五位的优选股票)推送给相同风格的普通用户。并根据后台系统捕捉到的该优选股票相关信息如该股票行业、相关新闻、研究报告等信息,控制服务器根据预先确定的特征与推荐信息(例如,“最近两年资源型股表现抢眼,建议可以多关注资源型股”、“最近大盘处于下降通道,建议清仓或者保持低仓位”等)之间的关联关系,确定出所述特征标签即该基准特征标签中除关键特征之外的其他特征对应的推荐信息,并将确定出的推荐信息实时或者定时推送给该相同风格的普通客户(例如,将推荐信息发送给该客户对应的手机号码)。
进一步地,在其他实施例中,上述预设的特征标签提取规则为:
对于连续数值的各种股票交易数据种类设置对应的标签阈值;对于非为连续数值的各种股票交易数据设置对应的标签范围;根据连续数值的各种股票交易数据与标签阈值的映射关系,确定出各个客户在预设时间内的属于连续数值的股票交易数据对应的标签信息,及根据非为连续数值的各种股票交易数据与标签范围的映射关系,确定出各个客户在预设时间内的属于非连续数值的股票交易数据对应的标签信息。
对于连续数值的各种股票交易数据种类设置对应的标签阈值(例如,股票从买到卖的时间间隔对应的标签阈值可以为48小时,大盘处于上升通道时每次买卖股票后的股票仓位对应的标签阈值可以为60%;大盘处于下降通道时每次买卖股票后的股票仓位对应的标签阈值可以为40%;当客户在预设时间内每一次交易的股票或者有超过预设比例“例如,80%”的交易股票从买到卖的时间间隔小于等于48小时,则代表该客户的特征标签包括特征“偏好短线交易”;当大盘处于上升通道时,客户每次买卖股票后的股票仓位大于等于60%或者有超过预设比例“例如,80%”的股票买卖后的股票仓位大于等于60%,则代表该客户的特征标签包括特征“偏好大盘上升时高仓位”;当大盘处于下降通道时,客户每次买卖股票后的股票仓位小于等于40%或者有超过预设比例“例如,80%”的股票买卖后的股票仓位小于等于40%,则代表该客户的特征标签包括特征“偏好大盘下降时低仓位”);
对于非为连续数值的各种股票交易数据设置对应的标签范围(例如,资源型股包括:经营金、银、铜、铁、锡、煤、石油等预先确定的资源的企业对应的股票为资源型股,当客户每次买卖的股票均为资源型股或者有超过预设比例“例如,80%”的股票为资源型股时,代表该客户的特征标签包括特征“偏好资源型股”);
根据连续数值的各种股票交易数据与标签阈值的映射关系,确定出各个客户在预设时间内的属于连续数值的股票交易数据对应的标签信息,及根据非为连续数值的各种股票交易数据与标签范围的映射关系,确定出各个客户在预设时间内的属于非连续数值的股票交易数据对应的标签信息。
进一步地,在其他实施例中,上述预设的变量筛选规则是典型相关分析,所述预设的变量筛选规则为:
以第一预设数量的客户在预设时间内的收益率、胜算率、交易成功率、盈亏比、抓涨停板比例等盈亏相关指标作为因变量,以预先确定的多个维度标签(例如,交易风格、持仓比例、交易频率、平均持有时长、年龄、总资产等多个维度标签)作为自变量,采用典型相关分析方法,分别找出自变量的线性组合U及因变量的线性组合V;
通过调整自变量、因变量的线性组合的系数,使得U和V的相关性达到最大,找出与盈亏相关指标相关性最大、并通过显著性检验的特征指标。
进一步地,在其他实施例中,上述预设的分析规则是K-MEANS聚类算法规则,所述预设的分析规则为:
A、从第一预设数量的客户在预设时间内的股票交易数据,任意选择第二预设数量的客户在预设时间内的股票交易数据作为第一聚类中心,所述第二预设数量为K个,K为大于或等于2的正整数;
B、利用预设的距离计算方法(例如欧氏距离、余弦相似度等)算出剩余的各个客户在预设时间内的股票交易数据到每个第一聚类中心的第一距离,将剩余的各个客户在预设时间内的股票交易数据划分到距离最近的第一聚类中心的类(例如,若A客户在预设时间内的股票交易数据距离第一聚类中心X最近,则将A客户在预设时间内的股票交易数据划分到第一聚类中心X的类),以获得K个当前数据类;
C、按照预设计算规则,重新计算各个所述当前数据类的第二聚类中心;
D、计算各个所述当前数据类的第二聚类中心与对应的原第一聚类中心的第二距离,若各个所述当前数据类对应的第二距离均小于预设阈值,则各个所述当前数据类即是要划分的第二预设数量的数据类,或者,若有所述当前数据类对应的第二距离大于等于预设阈值,则转入执行下述步骤E;
E、测量各个客户在预设时间内的股票交易数据到每个第二聚类中心的第一距离,将各个客户在预设时间内的股票交易数据划分到距离最近的第二聚类中心的类,以获得K个最新数据类;
F、按照预设计算规则,重新计算各个所述最新数据类的当前第二聚类中心;其中,该预设计算规则为:对数据类下的各个客户在预设时间内的股票交易数据取均值,所述均值即是对应的数据类的第二聚类中心;
G、计算各个所述最新数据类的当前第二聚类中心与对应的原第二聚类中心的第二距离,若各个所述最新数据类对应的第二距离均小于预设阈值,则各个所述最新数据类即是要划分的第二预设数量的数据类,或者,若有所述最新数据类对应的第二距离大于等于预设阈值,则重复执行上述步骤E、F、G,直到各个所述最新数据类对应的第二距离均小于预设阈值为止。
进一步地,在其他实施例中,上述预设的客户分群判别规则为判别分析算法,所述预设的判别规则为:
将第二预设数量的数据类均分为X1、X2两部分,X1部分作为训练样本集,X2部分作为验证样本集,分别利用X1部分的训练样本训练出多个预先确定的分类判别模型(例如,距离判别模型、Bayes判别模型及Fisher判别模型等),分别用X2部分的验证样本验证训练出的各个分类判别模型的准确率和/或召回率,确定出准确率和/或召回率符合预设要求(综合数值最高,例如采用F1measure等指标来进行衡量)的分类判别模型,并利用确定出的分类判别模型识别普通用户的类别。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (14)
1.一种股票推荐方法,其特征在于,所述方法包括以下步骤:
a1、控制服务器与至少一个股票交易服务器通信连接,从客户的历史股票交易数据中,按照预设的提取规则提取出第一预设数量的客户在预设时间内的股票交易数据,计算出各个客户对应每支个股层面在各个预设的计算周期的各个预设类型的指标,根据计算出的各个客户对应每支个股层面的指标,并按预设的特征标签提取规则提取出预先确定的特征标签,以及提取出预先确定的常规标签,确定出符合预设标准的高盈利客户;
a2、控制服务器对第一预设数量的客户按照预先确定的多个维度标签进行客户画像匹配,并按照预设的变量筛选规则,提取出与高盈利客户相关性大的关键特征标签组合;
a3、控制服务器将提取的第一预设数量的客户作为训练集,随机抽取部分普通交易用户作为测试集,按照预设的分析规则及关键特征标签组合将第一预设数量的客户进行分类,形成第二预设数量的数据类;
a4、控制服务器按照预设的客户分群判别规则,以第二预设数量的数据类作为训练集,当接收到普通用户的股票推荐请求时,对普通用户的类别进行判别,并与第二预设数量的数据类进行匹配,将符合关键特征标签组合中特征的不同风格的股票推送给对应分类的普通用户。
2.如权利要求1所述的股票推荐方法,其特征在于,该方法还包括:
a5、控制服务器定时或者实时获取第一预设数量用户的股票交易数据,并按预设的特征标签提取规则对获取的各个预先确定的客户的股票交易数据进行特征标签分析,以定时或实时更新第一、第二预设数量,实现数据的循环迭代更新;
a6、控制服务器实时跟踪第二预设数量用户的交易行为,优选各类别下预设数量的优选股票推送给相同风格的普通用户,并根据后台系统捕捉到的该优选股票相关信息,控制服务器根据预先确定的特征与推荐信息之间的关联关系,确定出所述特征标签中除关键特征之外的其他特征对应的推荐信息,并将确定出的推荐信息实时或者定时推送给该相同风格的普通客户。
3.如权利要求1或2所述的股票推荐方法,其特征在于,所述预设的特征标签提取规则为:
对于连续数值的各种股票交易数据种类设置对应的标签阈值;对于非为连续数值的各种股票交易数据设置对应的标签范围;根据连续数值的各种股票交易数据与标签阈值的映射关系,确定出各个客户在预设时间内的属于连续数值的股票交易数据对应的标签信息,及根据非为连续数值的各种股票交易数据与标签范围的映射关系,确定出各个客户在预设时间内的属于非连续数值的股票交易数据对应的标签信息。
4.如权利要求1或2所述的股票推荐方法,其特征在于,所述预设的变量筛选规则是典型相关分析,所述预设的变量筛选规则为:
以第一预设数量的客户在预设时间内的盈亏相关指标作为因变量,以预先确定的多个维度标签作为自变量,采用典型相关分析方法,分别找出自变量的线性组合U及因变量的线性组合V;
通过调整自变量、因变量的线性组合的系数,使得U和V的相关性达到最大,找出与盈亏相关指标相关性最大、并通过显著性检验的特征指标。
5.如权利要求1或2所述的股票推荐方法,其特征在于,所述预设的分析规则是K-MEANS聚类算法规则,所述预设的分析规则为:
A、从第一预设数量的客户在预设时间内的股票交易数据,任意选择第二预设数量的客户在预设时间内的股票交易数据作为第一聚类中心,所述第二预设数量为K个,K为大于或等于2的正整数;
B、利用预设的距离计算方法算出剩余的各个客户在预设时间内的股票交易数据到每个第一聚类中心的第一距离,将剩余的各个客户在预设时间内的股票交易数据划分到距离最近的第一聚类中心的类,以获得K个当前数据类;
C、按照预设计算规则,重新计算各个所述当前数据类的第二聚类中心;
D、计算各个所述当前数据类的第二聚类中心与对应的原第一聚类中心的第二距离,若各个所述当前数据类对应的第二距离均小于预设阈值,则各个所述当前数据类即是要划分的第二预设数量的数据类,或者,若有所述当前数据类对应的第二距离大于等于预设阈值,则转入执行下述步骤E;
E、测量各个客户在预设时间内的股票交易数据到每个第二聚类中心的第一距离,将各个客户在预设时间内的股票交易数据划分到距离最近的第二聚类中心的类,以获得K个最新数据类;
F、按照预设计算规则,重新计算各个所述最新数据类的当前第二聚类中心;
G、计算各个所述最新数据类的当前第二聚类中心与对应的原第二聚类中心的第二距离,若各个所述最新数据类对应的第二距离均小于预设阈值,则各个所述最新数据类即是要划分的第二预设数量的数据类,或者,若有所述最新数据类对应的第二距离大于等于预设阈值,则重复执行上述步骤E、F、G,直到各个所述最新数据类对应的第二距离均小于预设阈值为止。
6.如权利要求5所述的股票推荐方法,其特征在于,所述预设计算规则为:对数据类下的各个客户在预设时间内的股票交易数据取均值,所述均值是对应的数据类的第二聚类中心。
7.如权利要求1或2所述的股票推荐方法,其特征在于,所述预设的客户分群判别规则为判别分析算法,所述预设的客户分群判别规则为:
将第二预设数量的数据类均分为X1、X2两部分,X1部分作为训练样本集,X2部分作为验证样本集,分别利用X1部分的训练样本训练出多个预先确定的分类判别模型,分别用X2部分的验证样本验证训练出的各个分类判别模型的准确率和/或召回率,确定出准确率和/或召回率符合预设要求的分类判别模型,并利用确定出的分类判别模型识别普通用户的类别。
8.一种用于推荐股票的控制服务器,其特征在于,所述控制服务器包括:
第一提取模块,用于与至少一个股票交易服务器通信连接,从客户的历史股票交易数据中,按照预设的提取规则提取出第一预设数量的客户在预设时间内的股票交易数据,计算出各个客户对应每支个股层面在各个预设的计算周期的各个预设类型的指标,根据计算出的各个客户对应每支个股层面的指标,并按预设的特征标签提取规则提取出预先确定的特征标签,以及提取出预先确定的常规标签,确定出符合预设标准的高盈利客户;
第二提取模块,用于对第一预设数量的客户按照预先确定的多个维度标签进行客户画像匹配,并按照预设的变量筛选规则,提取出与高盈利客户相关性大的关键特征标签组合;
分类模块,用于将提取的第一预设数量的客户作为训练集,随机抽取部分普通交易用户作为测试集,按照预设的分析规则及关键特征标签组合将第一预设数量的客户进行分类,形成第二预设数量的数据类;
第一推送模块,用于按照预设的客户分群判别规则,以第二预设数量的数据类作为训练集,当接收到普通用户的股票推荐请求时,对普通用户的类别进行判别,并与第二预设数量的数据类进行匹配,将符合关键特征标签组合中特征的不同风格的股票推送给对应分类的普通用户。
9.如权利要求8所述的控制服务器,其特征在于,还包括:
更新模块,用于定时或者实时获取第一预设数量用户的股票交易数据,并按预设的特征标签提取规则对获取的各个预先确定的客户的股票交易数据进行特征标签分析,以定时或实时更新第一、第二预设数量,实现数据的循环迭代更新;
第二推送模块,用于实时跟踪第二预设数量用户的交易行为,优选各类别下预设数量的优选股票推送给相同风格的普通用户,并根据后台系统捕捉到的该优选股票相关信息,根据预先确定的特征与推荐信息之间的关联关系,确定出所述特征标签中除关键特征之外的其他特征对应的推荐信息,并将确定出的推荐信息实时或者定时推送给该相同风格的普通客户。
10.如权利要求8或9所述的控制服务器,其特征在于,所述预设的特征标签提取规则为:
对于连续数值的各种股票交易数据种类设置对应的标签阈值;对于非为连续数值的各种股票交易数据设置对应的标签范围;根据连续数值的各种股票交易数据与标签阈值的映射关系,确定出各个客户在预设时间内的属于连续数值的股票交易数据对应的标签信息,及根据非为连续数值的各种股票交易数据与标签范围的映射关系,确定出各个客户在预设时间内的属于非连续数值的股票交易数据对应的标签信息。
11.如权利要求8或9所述的控制服务器,其特征在于,所述预设的变量筛选规则是典型相关分析,所述预设的变量筛选规则为:
以第一预设数量的客户在预设时间内的盈亏相关指标作为因变量,以预先确定的多个维度标签作为自变量,采用典型相关分析方法,分别找出自变量的线性组合U及因变量的线性组合V;
通过调整自变量、因变量的线性组合的系数,使得U和V的相关性达到最大,找出与盈亏相关指标相关性最大、并通过显著性检验的特征指标。
12.如权利要求8或9所述的控制服务器,其特征在于,所述预设的分析规则是K-MEANS聚类算法规则,所述预设的分析规则为:
A、从第一预设数量的客户在预设时间内的股票交易数据,任意选择第二预设数量的客户在预设时间内的股票交易数据作为第一聚类中心,所述第二预设数量为K个,K为大于或等于2的正整数;
B、利用预设的距离计算方法算出剩余的各个客户在预设时间内的股票交易数据到每个第一聚类中心的第一距离,将剩余的各个客户在预设时间内的股票交易数据划分到距离最近的第一聚类中心的类,以获得K个当前数据类;
C、按照预设计算规则,重新计算各个所述当前数据类的第二聚类中心;
D、计算各个所述当前数据类的第二聚类中心与对应的原第一聚类中心的第二距离,若各个所述当前数据类对应的第二距离均小于预设阈值,则各个所述当前数据类即是要划分的第二预设数量的数据类,或者,若有所述当前数据类对应的第二距离大于等于预设阈值,则转入执行下述步骤E;
E、测量各个客户在预设时间内的股票交易数据到每个第二聚类中心的第一距离,将各个客户在预设时间内的股票交易数据划分到距离最近的第二聚类中心的类,以获得K个最新数据类;
F、按照预设计算规则,重新计算各个所述最新数据类的当前第二聚类中心;
G、计算各个所述最新数据类的当前第二聚类中心与对应的原第二聚类中心的第二距离,若各个所述最新数据类对应的第二距离均小于预设阈值,则各个所述最新数据类即是要划分的第二预设数量的数据类,或者,若有所述最新数据类对应的第二距离大于等于预设阈值,则重复执行上述步骤E、F、G,直到各个所述最新数据类对应的第二距离均小于预设阈值为止。
13.如权利要求12所述的控制服务器,其特征在于,所述预设计算规则为:对数据类下的各个客户在预设时间内的股票交易数据取均值,所述均值是对应的数据类的第二聚类中心。
14.如权利要求8或9所述的控制服务器,其特征在于,所述预设的客户分群判别规则为判别分析算法,所述预设的客户分群判别规则为:
将第二预设数量的数据类均分为X1、X2两部分,X1部分作为训练样本集,X2部分作为验证样本集,分别利用X1部分的训练样本训练出多个预先确定的分类判别模型,分别用X2部分的验证样本验证训练出的各个分类判别模型的准确率和/或召回率,确定出准确率和/或召回率符合预设要求的分类判别模型,并利用确定出的分类判别模型识别普通用户的类别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611097715.9A CN107657500B (zh) | 2016-12-03 | 2016-12-03 | 股票推荐方法及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611097715.9A CN107657500B (zh) | 2016-12-03 | 2016-12-03 | 股票推荐方法及服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107657500A true CN107657500A (zh) | 2018-02-02 |
CN107657500B CN107657500B (zh) | 2022-04-29 |
Family
ID=61127462
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611097715.9A Active CN107657500B (zh) | 2016-12-03 | 2016-12-03 | 股票推荐方法及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107657500B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108920646A (zh) * | 2018-06-29 | 2018-11-30 | 上海朝阳永续信息技术股份有限公司 | 一种股票筛选方法及装置 |
CN109035017A (zh) * | 2018-07-03 | 2018-12-18 | 东莞市波动赢机器人科技有限公司 | 机器人多兵作战推荐方法和系统 |
CN109087201A (zh) * | 2018-06-21 | 2018-12-25 | 腾讯科技(深圳)有限公司 | 虚拟资源的数据处理方法、服务器及存储介质 |
CN109447687A (zh) * | 2018-09-27 | 2019-03-08 | 中国平安人寿保险股份有限公司 | 基于大数据分析的用户挖掘方法及装置 |
CN109447728A (zh) * | 2018-09-07 | 2019-03-08 | 平安科技(深圳)有限公司 | 金融产品推荐方法、装置、计算机设备及存储介质 |
CN109474703A (zh) * | 2018-12-24 | 2019-03-15 | 杭州云纪网络科技有限公司 | 个性化产品组合推送方法、装置及系统 |
CN109685656A (zh) * | 2018-12-21 | 2019-04-26 | 天津知柿信息科技有限公司 | 一种股市走势智能预测方法及系统 |
CN109948051A (zh) * | 2019-02-21 | 2019-06-28 | 深圳投时科技有限公司 | 结合群体交易行为的内容推送方法、装置、服务器及系统 |
CN111127095A (zh) * | 2019-12-20 | 2020-05-08 | 秒针信息技术有限公司 | 目标受众兴趣分析方法、装置、设备及存储介质 |
CN111161076A (zh) * | 2019-12-31 | 2020-05-15 | 中国银行股份有限公司 | 金融市场产品的推送方法及装置 |
CN111222993A (zh) * | 2020-01-03 | 2020-06-02 | 中国工商银行股份有限公司 | 基金推荐方法及装置 |
TWI809669B (zh) * | 2022-01-20 | 2023-07-21 | 新光金融控股股份有限公司 | 客戶價值三維探索方法及其系統 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102262648A (zh) * | 2010-05-31 | 2011-11-30 | 索尼公司 | 评价预测设备、评价预测方法和程序 |
US20120271819A1 (en) * | 2011-04-25 | 2012-10-25 | Alibaba Group Holding Limited | Determination of recommendation data |
CN104751363A (zh) * | 2015-03-24 | 2015-07-01 | 北京工商大学 | 基于贝叶斯分类器的股票中长期趋势预测方法及系统 |
CN105744005A (zh) * | 2016-04-30 | 2016-07-06 | 平安证券有限责任公司 | 客户定位分析方法及服务器 |
-
2016
- 2016-12-03 CN CN201611097715.9A patent/CN107657500B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102262648A (zh) * | 2010-05-31 | 2011-11-30 | 索尼公司 | 评价预测设备、评价预测方法和程序 |
US20120271819A1 (en) * | 2011-04-25 | 2012-10-25 | Alibaba Group Holding Limited | Determination of recommendation data |
CN104751363A (zh) * | 2015-03-24 | 2015-07-01 | 北京工商大学 | 基于贝叶斯分类器的股票中长期趋势预测方法及系统 |
CN105744005A (zh) * | 2016-04-30 | 2016-07-06 | 平安证券有限责任公司 | 客户定位分析方法及服务器 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109087201A (zh) * | 2018-06-21 | 2018-12-25 | 腾讯科技(深圳)有限公司 | 虚拟资源的数据处理方法、服务器及存储介质 |
CN108920646A (zh) * | 2018-06-29 | 2018-11-30 | 上海朝阳永续信息技术股份有限公司 | 一种股票筛选方法及装置 |
CN109035017A (zh) * | 2018-07-03 | 2018-12-18 | 东莞市波动赢机器人科技有限公司 | 机器人多兵作战推荐方法和系统 |
CN109447728A (zh) * | 2018-09-07 | 2019-03-08 | 平安科技(深圳)有限公司 | 金融产品推荐方法、装置、计算机设备及存储介质 |
CN109447687A (zh) * | 2018-09-27 | 2019-03-08 | 中国平安人寿保险股份有限公司 | 基于大数据分析的用户挖掘方法及装置 |
CN109685656A (zh) * | 2018-12-21 | 2019-04-26 | 天津知柿信息科技有限公司 | 一种股市走势智能预测方法及系统 |
CN109474703A (zh) * | 2018-12-24 | 2019-03-15 | 杭州云纪网络科技有限公司 | 个性化产品组合推送方法、装置及系统 |
CN109948051A (zh) * | 2019-02-21 | 2019-06-28 | 深圳投时科技有限公司 | 结合群体交易行为的内容推送方法、装置、服务器及系统 |
CN111127095A (zh) * | 2019-12-20 | 2020-05-08 | 秒针信息技术有限公司 | 目标受众兴趣分析方法、装置、设备及存储介质 |
CN111127095B (zh) * | 2019-12-20 | 2023-05-30 | 秒针信息技术有限公司 | 目标受众兴趣分析方法、装置、设备及存储介质 |
CN111161076A (zh) * | 2019-12-31 | 2020-05-15 | 中国银行股份有限公司 | 金融市场产品的推送方法及装置 |
CN111222993A (zh) * | 2020-01-03 | 2020-06-02 | 中国工商银行股份有限公司 | 基金推荐方法及装置 |
TWI809669B (zh) * | 2022-01-20 | 2023-07-21 | 新光金融控股股份有限公司 | 客戶價值三維探索方法及其系統 |
Also Published As
Publication number | Publication date |
---|---|
CN107657500B (zh) | 2022-04-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107657500A (zh) | 股票推荐方法及服务器 | |
US7165043B2 (en) | Valuation prediction models in situations with missing inputs | |
US7039608B2 (en) | Rapid valuation of portfolios of assets such as financial instruments | |
US7120599B2 (en) | Methods and systems for modeling using classification and regression trees | |
US7031936B2 (en) | Methods and systems for automated inferred valuation of credit scoring | |
US7028005B2 (en) | Methods and systems for finding value and reducing risk | |
US6985881B2 (en) | Methods and apparatus for automated underwriting of segmentable portfolio assets | |
US7162445B2 (en) | Methods and systems for quantifying cash flow recovery and risk | |
US20010037278A1 (en) | Methods and apparatus for simulating competitive bidding yield | |
US20020116309A1 (en) | Methods and systems for efficiently sampling portfolios for optimal underwriting | |
US20020049659A1 (en) | Methods and systems for optimizing return and present value | |
EP1264256A1 (en) | Cross correlation tool for automated portfolio descriptive statistics | |
CN107730386A (zh) | 投资组合产品的生成方法、装置、存储介质和计算机设备 | |
CN110322347A (zh) | 一种长短期策略多因子量化投资方法及装置 | |
CN110968622A (zh) | 一种会计报告定制方法、平台和终端 | |
CN117495366A (zh) | 基于人工智能的3c产品服务平台的账单自动计费系统 | |
CN116629969A (zh) | 投资产品组合的推送方法、装置、电子设备及存储介质 | |
CN117291716A (zh) | 一种货款数据的风险评估方法 | |
CN114662824A (zh) | 风控策略切换方法、装置、计算机设备和存储介质 | |
EP1212718A2 (en) | Valuation prediction models in situations with missing inputs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |