CN108416684A - 一种账号主体的可信程度评估方法、装置及服务器 - Google Patents
一种账号主体的可信程度评估方法、装置及服务器 Download PDFInfo
- Publication number
- CN108416684A CN108416684A CN201710074022.6A CN201710074022A CN108416684A CN 108416684 A CN108416684 A CN 108416684A CN 201710074022 A CN201710074022 A CN 201710074022A CN 108416684 A CN108416684 A CN 108416684A
- Authority
- CN
- China
- Prior art keywords
- main body
- account main
- assessed
- booking reader
- positive sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000012549 training Methods 0.000 claims abstract description 28
- 230000003993 interaction Effects 0.000 claims description 47
- 239000004744 fabric Substances 0.000 claims description 16
- 238000009826 distribution Methods 0.000 claims description 14
- 238000010801 machine learning Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 5
- 230000006855 networking Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 210000004209 hair Anatomy 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000003542 behavioural effect Effects 0.000 description 2
- 230000003997 social interaction Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 206010000117 Abnormal behaviour Diseases 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- SBNFWQZLDJGRLK-UHFFFAOYSA-N phenothrin Chemical compound CC1(C)C(C=C(C)C)C1C(=O)OCC1=CC=CC(OC=2C=CC=CC=2)=C1 SBNFWQZLDJGRLK-UHFFFAOYSA-N 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000011273 social behavior Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/21—Monitoring or handling of messages
- H04L51/23—Reliability checks, e.g. acknowledgments or fault reporting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W8/00—Network data management
- H04W8/18—Processing of user or subscriber data, e.g. subscribed services, user preferences or user profiles; Transfer of user or subscriber data
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明实施例提供一种账号主体的可信程度评估方法、装置及服务器,该方法包括:确定待评估账号主体的订阅用户;分别确定各订阅用户在设定历史时间段的信用分;确定所述待评估账号主体在所述设定历史时间段的信息服务指标;根据所述各订阅用户在所述设定历史时间段的信用分,及所述信息服务指标确定评估输入特征;调取预训练的账号主体的信用预测模型,根据所述评估输入特征,以所述信用预测模型,确定所述待评估账号主体的信用分,以所确定的信用分表示所述待评估账号主体的可信程度。本发明实施例可提升账号主体的可信程度评估结果。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种账号主体的可信程度评估方法、装置及服务器。
背景技术
随着公众号、微博等社交应用平台的流行,通过订阅方式获取信息已成为用户获取信息的主要途径之一;信息服务商可以注册成为公众号、微博等社交应用平台上提供信息服务的账号主体,从而用户对感兴趣的账号主体进行订阅后,用户可获取到所订阅的账号主体发布的信息。
目前社交应用平台上提供信息服务的账号主体数量较多,账号主体的信息服务质量参差不齐,极有可能存在提供欺骗性质的信息服务的账号主体,因此如何识别账号主体的可信程度,以便账号主体的推荐、管理,一直是社交应用平台的工作人员关注的重点;账号主体的可信程度可与账号主体所提供的信息服务的可信程度对应。
账号主体的可信程度可通过账号主体的信用分表示,目前主要是通过用户对账号主体的举报、投诉等反馈,对账号主体的可信程度进行评估,例如用户对账号主体投诉一次,且投诉被核实成立,则在账号主体当前的信用分值的基础上减去一次投诉的扣分,从而实现对账号主体的可信程度的评估,账号主体初始的信用分值默认为满分;
然而,用户对账号主体的举报、投诉等反馈涉及到用户的主观意识,且核实举报、投诉等反馈的核实结果也会由于工作人员的认知不同,而导致核实结果存在差异,最终使得账号主体的可信程度评估结果的准确性较低;可见,因此如何提升账号主体的可信程度评估结果的准确性,成为了本领域技术人员需要考虑的问题。
发明内容
有鉴于此,本发明实施例提供一种账号主体的可信程度评估方法、装置及服务器,以提升账号主体的可信程度评估结果。
为实现上述目的,本发明实施例提供如下技术方案:
一种账号主体的可信程度评估方法,包括:
确定待评估账号主体的订阅用户;
分别确定各订阅用户在设定历史时间段的信用分;
确定所述待评估账号主体在所述设定历史时间段的信息服务指标;
根据所述各订阅用户在所述设定历史时间段的信用分,及所述信息服务指标确定评估输入特征;
调取预训练的账号主体的信用预测模型,根据所述评估输入特征,以所述信用预测模型,确定所述待评估账号主体的信用分,以所确定的信用分表示所述待评估账号主体的可信程度。
本发明实施例还提供一种账号主体的可信程度评估装置,包括:
订阅用户确定模块,用于确定待评估账号主体的订阅用户;
用户信用分确定模块,用于分别确定各订阅用户在设定历史时间段的信用分;
信息服务指标确定模块,用于确定所述待评估账号主体在所述设定历史时间段的信息服务指标;
评估输入特征确定模块,用于根据所述各订阅用户在所述设定历史时间段的信用分,及所述信息服务指标确定评估输入特征;
信用分确定模块,用于调取预训练的账号主体的信用预测模型,根据所述评估输入特征,以所述信用预测模型,确定所述待评估账号主体的信用分,以所确定的信用分表示所述待评估账号主体的可信程度。
本发明实施例还提供一种服务器,包括上述所述的可信程度评估装置。
基于上述技术方案,本发明实施例提供的账号主体的可信程度评估方法中,服务器可确定待评估账号主体的订阅用户,分别确定出各订阅用户在设定历史时间段的信用分,及确定出待评估账号主体在所述设定历史时间段的信息服务指标;根据所述各订阅用户在设定历史时间段的信用分,及所述信息服务指标确定评估输入特征;从而通过预训练的账号主体的信用预测模型,根据所述评估输入特征,确定出待评估账号主体的信用分,以所确定的信用分表示所述待评估账号主体的可信程度,实现账号主体的可信程度的评估。本发明实施例提供的账号主体的可信程度评估方法,结合了订阅账号主体的各订阅用户在设定历史时间段的信用分,以及待评估账号主体在设定历史时间段的信息服务指标,来确定账号主体的信用分,可评估的账号主体的信用分的评估依据能够更为客观、全面,使得所评估的账号主体的信用分更为客观、准确,提升了账号主体的可信程度评估结果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的账号主体的可信程度评估方法的流程图;
图2为本发明实施例提供的训练账号主体的信用预测模型的方法流程图;
图3为本发明实施例提供的训练账号主体的信用预测模型的另一方法流程图;
图4为本发明实施例提供的确定信用分分布用户占比的方法流程图;
图5为本发明实施例提供的确定阅读次数分布用户占比的方法流程图;
图6为本发明实施例提供的确定阅读篇数分布用户占比的方法流程图;
图7为本发明实施例提供的账号主体的可信程度评估装置的结构框图;
图8为本发明实施例提供的账号主体的可信程度评估装置的另一结构框图;
图9为本发明实施例提供的服务器的硬件结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的账号主体的可信程度评估方法的流程图,该方法可应用于服务器,服务器可以是公众号、微博等社交应用平台所属的服务器;如图1方法的执行设备可以直接选用提供社交服务的社交服务器(如选用提供公众号服务的公众号服务器,提供微博服务的微博服务器等);
可选的,图1方法的执行设备也可以是社交应用平台中专门设置的,能够与社交服务器相通信,以实现账号主体的可信程度评估的服务器;
参照图1,本发明实施例提供的账号主体的可信程度评估方法可以包括:
步骤S100、确定待评估账号主体的订阅用户。
待评估账号主体为本发明实施例需要进行可信程度评估的账号主体;待评估账号主体可以是在社交应用平台注册的任一账号主体,即本发明实施例可对社交应用平台注册的任一账号主体,分别进行可信程度的评估,如可将社交应用平台注册的各账号主体分别作为待评估账号主体,分别通过图1所示方法实现可信程度的评估。
可选的,本发明实施例可通过社交应用平台记录的待评估账号主体的订阅关系链,确定待评估账号主体的订阅用户;待评估账号主体的订阅关系链可以记录待评估账号主体,与订阅待评估账号主体的订阅用户集合的关系;订阅待评估账号主体的订阅用户集合,表示的是订阅了待评估账号主体,可以接收待评估账号主体发布的内容的订阅用户的集合;
如以待评估账号主体为公众号为例,公众号的订阅关系链可以记录公众号的号主账号,与对应的订阅该公众号的用户账户集合的关系;在实际使用中,需订阅内容的用户可以主动搜索公众号,并通过请求建立与搜索到的公众号的订阅关系来实现订阅关系链的建立;如需订阅内容的用户可通过建立订阅关系的入口(比如公众号的账号二维码,关注公众号的按钮入口等)来请求建立订阅关系。
步骤S110、分别确定各订阅用户在设定历史时间段的信用分。
对于每一个订阅用户,订阅用户在设定历史时间段的信用分可以通过,订阅用户在设定历史时间段的金融行为数据,社交行为数据等确定;订阅用户在设定历史时间段的信用分可以度量订阅用户未来按时还款的可能性,是对订阅用户异常行为所隐含的违约倾向概率的一种表示。订阅用户的信用分越高,则订阅用户的可信程度越高。
在设定历史时间段可以是指包含设定历史时间的时间段,如历史n个月(如距当前n个月)的时间段,n为设定整数。
可选的,本发明实施例在确定待评估账号主体的订阅用户后,对于每一个订阅用户,可通过订阅用户的身份标识获取订阅用户在设定历史时间段在金融、社交等维度的行为数据,将获取的订阅用户在设定历史时间段在金融、社交等维度的行为数据导入预先训练的预测用户信用的模型,计算得到订阅用户在在设定历史时间段的信用分;
可选的,订阅用户的身份标识如订阅用户的身份证号,如订阅用户在社交应用平台的用户账号等;如果社交应用平台本身提供有金融服务,则通过订阅用户在社交应用平台的用户账号可获取到订阅用户的金融、社交等维度的行为数据;可选的,提供金融服务的金融平台也可以接入社交应用平台的账号,即用户可通过社交应用平台的账号,登录金融平台。
可选的,订阅用户在设定历史时间段的信用分也可以通过调取记录有用户的信用分的第三方数据库确定;本发明实施例在确定待评估账号主体的订阅用户后,对于每一个订阅用户,可通过订阅用户的身份标识从征信数据库的开放接口,获取到订阅用户在设定历史时间段的信用分;即本发明实施例可以直接获取征信数据库中已计算的各用户的信用分,而不需要进行各用户信用分的具体计算;可选的,征信数据库可以是银行征信数据库、或者其他的开放查询用户的信用分的征信数据库。
步骤S120、确定所述待评估账号主体在所述设定历史时间段的信息服务指标。
待评估账号在所述设定历史时间段的信息服务指标,表示的是社交应用平台所记录的待评估账号在设定历史时间段与提供信息服务相关的指标;信息服务指标的种类可以根据实际需要设定,如各订阅用户对所述待评估账号主体的负面反馈次数,各订阅用户对所述待评估账号主体发布的信息的交互指标(交互指标可以表示如订阅用户阅读、转发待评估账号主体发布的信息等),所述待评估账号主体发布信息的发布指标等。
步骤S130、根据所述各订阅用户在设定历史时间段的信用分,及所述信息服务指标确定评估输入特征。
可选的,所述评估输入特征可以直接使用所述各订阅用户在设定历史时间段的信用分,及所述信息服务指标;
也可以是对所述各订阅用户在设定历史时间段的信用分,所述信息服务指标作进一步处理后,以进一步处理的结果作为评估输入特征。
步骤S140、调取预训练的账号主体的信用预测模型,根据所述评估输入特征,以所述信用预测模型,确定所述待评估账号主体的信用分,以所确定的信用分表示所述待评估账号主体的可信程度。
在根据待评估账号主体的各订阅用户在设定历史时间段的信用分,以及待评估账号主体在设定历史时间段的信息服务指标确定评估输入特征后,本发明实施例可调取预训练的账号主体的信用预测模型,将评估输入特征作为该信用预测模型的输入,通过该信用预测模型确定出待评估账号主体的信用分,从而以所确定的待评估账号主体的信用分表示待评估账号主体的可信程度,实现账号主体的可信程度的评估。
本发明实施例提供的账号主体的可信程度评估方法中,服务器可确定待评估账号主体的订阅用户,分别确定出各订阅用户在设定历史时间段的信用分,及确定出待评估账号主体在设定历史时间段的信息服务指标;根据所述各订阅用户在设定历史时间段的信用分,及所述信息服务指标确定评估输入特征;从而通过预训练的账号主体的信用预测模型,根据所述评估输入特征,确定出待评估账号主体的信用分,以所确定的信用分表示所述待评估账号主体的可信程度,实现账号主体的可信程度的评估。本发明实施例提供的账号主体的可信程度评估方法,结合了订阅账号主体的各订阅用户在设定历史时间段的信用分,以及待评估账号主体在设定历史时间段的信息服务指标,来确定账号主体的信用分,可评估的账号主体的信用分的评估依据能够更为客观、全面,使得所评估的账号主体的信用分更为客观、准确,提升了账号主体的可信程度评估结果。
下面对账号主体的信用预测模型的训练过程进行介绍,图2为本发明实施例提供的账号主体的信用预测模型的训练方法流程图,该方法可应用于服务器,参照图2,该方法可以包括:
步骤S200、确定正样本账号主体及负样本账号主体。
可选的,正样本账号主体的可信程度高于负样本账号主体,即正样本账号主体可以认为是高可信程度的账号主体,负样本账号主体可以认为是低可信程度的账号主体;本发明实施例可从社交应用平台注册的账号主体中,通过人工标注方式标准出正样本账号主体和负样本账号主体;如可将常被订阅用户投诉、举报的账号主体(被投诉、举报次数高于设定次数的账号主体)标注为负样本账号主体;将被订阅用户投诉、举报次数较低(被投诉、举报次数小于设定次数),且提供的信息服务质量较高(如发布的文章被阅读次数高于设定阅读次数,发布的文章的原创率高于设定原创率等)的账号主体标注为正样本账号主体。
具体的,本发明实施例可通过账号主体的被投诉、举报次数,以及账号主体的信息服务质量,以人工标注方式,从社交应用平台注册的账号主体中,标注出正样本账号主体及负样本账号主体;
可选的,可将被投诉、举报次数高于设定次数的账号主体,标注为负样本账号主体;将被投诉、举报次数小于设定次数,且信息服务质量满足设定质量条件的账号主体标注为正样本账号主体;
可选的,账号主体的信息服务质量可通过账号主体发布的文章等信息被阅读的次数,发布原创文章的原创率等指标确定;账号主体的信息服务质量满足设定质量条件的一种可选表现形式可以是:账号主体发布的文章被阅读次数高于设定阅读次数,发布的文章的原创率高于设定原创率等。
可选的,所确定的正样本账号主体,和负样本账号主体的数量比例可以满足设定比例要求,具体的设定比例数值可以根据实际情况设定。
步骤S210、对于各正样本账号主体,确定正样本账号主体的各订阅用户在设定历史时间段的信用分,及正样本账号主体在设定历史时间段的信息服务指标;对于各负样本账号主体,确定负样本账号主体的各订阅用户在设定历史时间段的信用分,及负样本账号主体在设定历史时间段的信息服务指标。
步骤S220、对于各正样本账号主体,根据正样本账号主体的各订阅用户在设定历史时间段的信用分,及正样本账号主体在设定历史时间段的信息服务指标,确定正样本账号主体的样本特征;对于各样本账号主体,根据负样本账号主体的订阅用户在设定历史时间段的信用分,及负样本账号主体在设定历史时间段的信息服务指标,确定负样本账号主体的样本特征。
可选的,正样本账号主体的样本特征可以直接使用正样本账号主体的订阅用户在设定历史时间段的信用分,及正样本账号主体在设定历史时间段的信息服务指标;
本发明实施例也可以根据实际情况,将正样本账号主体的订阅用户在设定历史时间段的信用分,及正样本账号主体在设定历史时间段的信息服务指标作进一步处理后,以进一步处理的结果作为正样本账号主体的样本特征;负样本账号主体的样本特征的确定相应同理;如本发明实施例可进一步确定正样本账号主体的订阅用户对应的信用分分布用户占比,以及对正样本账号主体在设定历史时间段的信息服务指标作进一步处理,以进一步处理后的结果作为正样本账号主体的样本特征。
步骤S230、通过机器学习方法,根据正样本账号主体的样本特征和负样本账号主体的样本特征,训练得到账号主体的信用预测模型。
可选的,本发明实施例所使用的机器学习方法可包括但不限于:逻辑回归方法、决策树等。
本发明实施例在得到各正样本账号主体的样本特征,以及各负样本账号主体的样本特征后,可将各正样本账号主体的样本特征以及各负样本账号主体的样本特征,作为机器学习方法的输入数据,从而通过机器学习方法,训练得到账号主体的信用预测模型;
可选的,对于一正样本账号主体而言,正样本账号主体的样本特征可以由该正样本账号主体的各订阅用户在设定历史时间段的信用分,及该正样本账号主体在设定历史时间段的信息服务指标确定;对于一负样本账号主体而言,负样本账号主体的样本特征可以由该负样本账号主体的各订阅用户在设定历史时间段的信用分,及该负样本账号主体在设定历史时间段的信息服务指标确定。
对于一正样本账号主体,正样本账号主体在设定历史时间段的信息服务指标可以包括如下至少一种:
正样本账号主体在设定历史时间段所存在的负面反馈次数;
正样本账号主体的各订阅用户在设定历史时间段,对正样本账号主体发布的信息的交互指标;
正样本账号主体在设定历史时间段发布信息的发布指标。
可选的,设定历史时间段可以分为n个时间周期,如设定历史时间段为距当前n个月的时间段,则一个时间周期为一个月;显然一个时间周期为一个月仅是一种可选方式,也可能一个时间周期为一个星期,两个星期等,时间周期的具体表现形式可以根据实际情况设定。
一正样本账号主体的各订阅用户在设定历史时间段的信用分可以由,该正样本账号主体的各订阅用户在单位时间周期的平均信用分表示;可选的,一正样本账号主体的一订阅用户在设定历史时间段对应的平均信用分可以表示为,该订阅用户在n个时间周期的总信用分除以n。
一正样本账号主体在设定历史时间段所存在的负面反馈次数可以由,该正样本账号主体单位时间周期存在负面反馈的平均次数表示;如该正样本账号主体单位时间周期被投诉、举报的平均次数等;可选的,一正样本账号主体在设定历史时间段被负面反馈的平均次数为,正样本账号主体在n个时间周期的被负面反馈总次数除以n。
一正样本账号主体的各订阅用户在设定历史时间段,对该正样本账号主体发布的信息的交互指标可以由:正样本账号主体的各订阅用户单位时间周期,对正样本账号主体发布的信息的平均交互指标表示;
交互指标可以通过订阅用户阅读账号主体发布的信息的阅读次数,和/或,阅读篇数表示,也可能是订阅用户转发账号主体发布的信息的次数;
相应的,一正样本账号主体的一订阅用户单位时间周期,对正样本账号主体发布的信息的平均交互指标可以包括:
该订阅用户单位时间周期阅读该正样本账号主体发布的文章的平均阅读次数(即该订阅用户在n个时间周期阅读该正样本账号主体发布的文章的总阅读次数除以n),和/或,该订阅用户单位时间周期阅读该正样本账号主体发布的文章的平均篇数(即该订阅用户在n个时间周期阅读该正样本账号主体发布的文章的总篇数除以n)等。
可选的,发布指标可以由账户主体发布原创文章的数量,或者原创率表示;
相应的,一正样本账号主体单位时间周期发布信息的平均发布指标可以包括:
该正样本账号主体单位时间周期发布原创文章的平均数量(即该正样本账号主体在n个时间周期发布原创文章的总数除以n),和/或,单位时间周期发布文章的平均原创率(即该正样本账号主体在n个时间周期发布文章的总原创率除以n)等。
上文描述了正样本账号主体的信息服务指标的可选具体内容,待评估账号主体、负样本账号主体关于信息服务指标的内容可与上文内容相应参照。
可选的,本发明实施例可将正样本账号主体的订阅用户在设定历史时间段的信用分,及正样本账号主体在设定历史时间段的信息服务指标作进一步处理后,以进一步处理的结果作为正样本账号主体的样本特征;
图3示出了本发明实施例提供的账号主体的信用预测模型的另一训练方法流程图,该方法可应用于服务器,参照图3,该方法可以包括:
步骤S300、确定正样本账号主体及负样本账号主体。
步骤S310、对于各正样本账号主体,分别确定正样本账号主体的各订阅用户单位时间周期的平均信用分,正样本账号主体单位时间周期存在负面反馈的平均次数,正样本账号主体的各订阅用户单位时间周期,对正样本账号主体发布的信息的平均交互指标,以及正样本账号主体单位时间周期,发布信息的平均发布指标。
以设定历史时间段包含n个时间周期为例,则对于一正样本账号主体的订阅用户Ui,Ui单位时间周期的平均信用分为,Ui各时间周期的总信用分除以n;
设j为n各时间周期中的第j个时间周期,0<j≤n,则Ui单位时间周期的平均信用分CCi的计算为:
一正样本账号主体单位时间周期存在负面反馈的平均次数,可以是该样本账号主体n个时间周期存在负面反馈的总次数除以n,设Bj为一正样本账号主体在第j个时间周期存在负面反馈的次数,则该正样本账号主体单位时间周期存在负面反馈的平均次数BB的计算为:
可选的,一正样本账号主体的各订阅用户单位时间周期,对正样本账号主体发布的信息的平均交互指标可以包括:正样本账号主体的各订阅用户单位时间周期,阅读正样本账号主体发布的文章的平均阅读次数,和/或,正样本账号主体的各订阅用户单位时间周期,阅读正样本账号主体发布的文章的平均篇数;
对于一正样本账号主体的订阅用户Ui,设RCi,j为订阅用户Ui第j个时间周期阅读该正样本账号主体发布的文章的阅读次数,则订阅用户Ui单位时间周期,阅读该正样本账号主体发布的文章的平均阅读次数RRCi的计算可以为:
对于一正样本账号主体的订阅用户Ui,设MCi,j为订阅用户Ui第j个时间周期阅读该正样本账号主体发布的文章的篇数,则订阅用户Ui单位时间周期,阅读该正样本账号主体发布的文章的平均篇数MMCi的计算可以为:
可选的,正样本账号主体单位时间周期,发布信息的平均发布指标可以包括:正样本账号主体单位时间周期发布原创文章的平均数量,发布文章的平均原创率;
对于一正样本账号主体,设该正样本账号主体第j个时间周期发布原创文章的数量为OMj,则该正样本账号主体单位时间周期发布原创文章的平均数量OOM的计算可以为:
对于一正样本账号主体,设该正样本账号主体第j个时间周期发布文章的原创率为OPj(OPj表示的是一正样本账号主体第j个月的原创率,由该正样本账号主体第j个月的原创文章数,除以第j个月的发布文章数得到),则该正样本账号主体单位时间周期发布文章的平均原创率OOP的计算可以为:
步骤S320、对于各负样本账号主体,分别确定负样本账号主体的各订阅用户单位时间周期的平均信用分,负样本账号主体单位时间周期存在负面反馈的平均次数,负样本账号主体的各订阅用户单位时间周期,对负样本账号主体发布的信息的平均交互指标,以及负样本账号主体单位时间周期,发布信息的平均发布指标。
可选的,步骤S320的处理与步骤S310的处理原理相同,可相互参照;只不过步骤S310是针对正样本账号主体,步骤S320是针对负样本账号主体。
步骤S330、对于各正样本账号主体,根据正样本账号主体的各订阅用户单位时间周期的平均信用分,确定正样本账号主体的订阅用户对应的信用分分布用户占比;对于各正样本账号主体,根据正样本账号主体的各订阅用户单位时间周期,对正样本账号主体发布的信息的平均交互指标,确定正样本账号主体的订阅用户对应的交互指标分布用户占比。
可选的,本发明实施例可将信用分的取值范围划分区间,确定出多个信用分分布区间;从而对于各正样本账号主体,确定正样本账号主体的各订阅用户单位时间周期的平均信用分所处于的信用分分布区间,将各信用分分布区间的订阅用户数除以该正样本账号主体的订阅用户总数,确定各信用分分布区间的用户占比,从而确定出正样本账号主体的订阅用户对应的信用分分布用户占比;对于每一正样本账号主体均作此处理,则可得到各正样本账号主体的订阅用户对应的信用分分布用户占比。
可选的,一正样本账号主体的各订阅用户单位时间周期,对该正样本账号主体发布的信息的平均交互指标可以包括:该正样本账号主体的各订阅用户单位时间周期,阅读该正样本账号主体发布的文章的平均阅读次数,和/或,该正样本账号主体的各订阅用户单位时间周期,阅读该正样本账号主体发布的文章的平均篇数;
相应的,一正样本账号主体的订阅用户对应的交互指标分布用户占比可以由,该正样本账号主体的订阅用户对应的阅读次数分布用户占比,和/或,该正样本账号主体的订阅用户对应的阅读篇数分布用户占比构成;可选的,正样本账号主体的订阅用户对应的阅读次数分布用户占比可以表示,该正样本账号主体的订阅用户,阅读该正样本账号主体发布的文章的阅读次数分布用户占比;正样本账号主体的订阅用户对应的阅读篇数分布用户占比可以表示,正样本账号主体的订阅用户,阅读该正样本账号主体发布的文章的阅读篇数分布用户占比构成;
可选的,本发明实施例可将阅读次数的取值范围划分区间,确定出多个阅读次数分布区间;从而对于各正样本账号主体,确定正样本账号主体的各订阅用户单位时间周期,阅读正样本账号主体发布的文章的平均阅读次数所处于的阅读次数分布区间,将各阅读次数分布区间对应的订阅用户数除以订阅用户总数,确定各阅读次数分布区间的用户占比,从而确定出正样本账号主体的订阅用户对应的阅读次数分布用户占比;对于每一正样本账号主体均作此处理,则可得到各正样本账号主体对应的订阅用户的阅读次数分布用户占比;
可选的,本发明实施例可将阅读篇数的取值范围划分区间,确定出多个阅读篇数分布区间;从而对于各正样本账号主体,确定正样本账号主体的各订阅用户单位时间周期,阅读正样本账号主体发布的文章的平均篇数所处于的阅读篇数分布区间,将各阅读篇数分布区间对应的订阅用户数除以订阅用户总数,确定各阅读篇数分布区间的用户占比,从而确定出正样本账号主体的订阅用户对应的阅读篇数分布用户占比;对于每一正样本账号主体均作此处理,则可得到各正样本账号主体对应的订阅用户的阅读篇数分布用户占比。
步骤S340、对于各负样本账号主体,根据负样本账号主体的各订阅用户单位时间周期的平均信用分,确定负样本账号主体的订阅用户对应的信用分分布用户占比;对于各负样本账号主体,根据负样本账号主体的各订阅用户单位时间周期,对负样本账号主体发布的信息的平均交互指标,确定负样本账号主体的订阅用户对应的交互指标分布用户占比。
可选的,步骤S340与步骤S330的处理原理相同,可相互参照。
步骤S350、对于各正样本账号主体,将正样本账号主体的订阅用户对应的信用分分布用户占比,正样本账号主体的订阅用户的交互指标分布用户占比,正样本账号主体单位时间周期存在负面反馈的平均次数,正样本账号主体单位时间周期,发布信息的平均发布指标,作为正样本账号主体的样本特征。
步骤S360、对于各负样本账号主体,将负样本账号主体的订阅用户对应的信用分分布用户占比,负样本账号主体的订阅用户的交互指标分布用户占比,负样本账号主体单位时间周期存在负面反馈的平均次数,负样本账号主体单位时间周期,发布信息的平均发布指标,作为负样本账号主体的样本特征。
步骤S370、利用机器学习方法,根据正样本账号主体的样本特征和负样本账号主体的样本特征,训练得到账号主体的信用预测模型。
相应的,图1所示方法中,待评估账号主体的各订阅用户在设定历史时间段的信用分可以由,待评估账号主体的各订阅用户单位时间周期的平均信用分表示;在进行待评估账号主体的信用分确定时,本发明实施例可以执行如下实现:
根据待评估账号主体的各订阅用户单位时间周期的平均信用分,确定待评估账号主体的订阅用户对应的信用分分布用户占比;并且确定待评估账号主体的订阅用户的交互指标分布用户占比,待评估账号主体单位时间周期存在负面反馈的平均次数,及待评估账号主体单位时间周期,发布信息的平均发布指标;
将待评估账号主体的订阅用户对应的信用分分布用户占比,待评估账号主体的订阅用户的交互指标分布用户占比,待评估账号主体单位时间周期存在负面反馈的平均次数,及待评估账号主体单位时间周期,发布信息的平均发布指标,作为评估输入特征;
从而根据所述评估输入特征,以所述信用预测模型,确定所述待评估账号主体的信用分。
可选的,待评估账号主体的订阅用户对应的信用分分布用户占比,与正样本账号主体、负样本账号主体的订阅用户对应的信用分分布用户占比的确定原理相同,下面以待评估账号主体的订阅用户的信用分分布用户占比的确定进行说明;
图4为本发明实施例提供的确定待评估账号主体的订阅用户对应的信用分分布用户占比的方法流程图,参照图4,该方法可以包括:
步骤S400、将信用分的取值范围划分区间,确定出多个信用分分布区间。
可选的,信用分分布区间可以满足频数分布占比、正态分布占比等。
本发明实施例可设定每一个信用分分布区间对应的信用分取值,从而将信用分的取值范围,按照各信用分分布区间的信用分取值划分信用分区间,得到多个信用分分布区间;如信用分的取值范围为[300,900),每个信用分分布区间的信用分取值为100,则可将信用分的取值范围的各个整百信用分除以100,得到如下表1所示的6个信用分分布区间;其中,3的分布区间表示百位为3的信用分,4的分布区间表示百位为4的信用分,以此类推;
表1
其中,表1所示3至8可以认为是信用分的取值范围的分箱(binning),分箱是连续变量离散化的常用手段,例如把0-99岁的人分成0-18岁是未成年人,18-45是青年,45-60是中年,60以上是老年。
本发明实施例可借住分箱手段,划分出信用分的取值范围对应的分箱,实现多个信用分分布区间的确定。显然,分箱不一定是通过将信用分的取值范围中的整百信用分除以100实现,还可以是通过其他的分箱划分方法实现。
步骤S410、根据待评估账号主体的各订阅用户单位时间周期的平均信用分,确定待评估账号主体的各订阅用户的平均信用分所处于的信用分分布区间,得到各信用分分布区间对应的订阅用户数。
步骤S420、分别将各信用分分布区间对应的订阅用户数除以待评估账号主体的订阅用户总数,确定各信用分分布区间的用户占比,得到待评估账号主体的订阅用户对应的信用分分布用户占比。
可选的,以表1所示信用分分布区间为例,本发明可将待评估账号主体的各订阅用户单位时间周期的平均信用分,分别对应到相应的信用分分布区间中,确定出各信用分分布区间对应到的订阅用户数量(即各信用分分布区间对应到的信用分所属于的订阅用户的数量),分别将各信用分分布区间对应的订阅用户数除以待评估账号主体的订阅用户总数,则可确定出各信用分分布区间的用户占比,得到待评估账号主体的订阅用户对应的信用分分布用户占比;
可选的,一平均信用分所处于的信用分分布区间可以是将平均信用分除以100后,平均信用分的整数位所对应的信用分分布区间;如750的信用分,其对应的信用分分布区间为7。
可选的,表2示出了一种信用分分布用户占比的示意可参照。
信用分分布区间 | 3 | 4 | 5 | 6 | 7 | 8 |
信用分分布用户占比 | 0.2 | 0.3 | 0.2 | 0.1 | 0.1 | 0.1 |
表2
可选的,设待评估账号主体的订阅用户数量为m,则相应的信用分分布用户占比的函数F可以是频数分布、正态分布等。
其中,F(CC1,CC2,...,CCm)。
可选的,待评估账号主体的订阅用户对应的阅读次数分布用户占比,与正样本账号主体、负样本账号主体的订阅用户对应的阅读次数分布用户占比的确定原理相同,下面以待评估账号主体的订阅用户对应的阅读次数分布用户占比的确定进行说明;
图5为本发明实施例提供的确定待评估账号主体的订阅用户对应的阅读次数分布用户占比的方法流程图,参照图5,该方法可以包括:
步骤S500、将阅读次数的取值范围划分区间,确定出多个阅读次数分布区间。
可选的,阅读次数分布区间可以满足频数分布占比、正态分布占比等。
本发明实施例可设定每一个阅读次数分布区间对应的阅读次数,从而将阅读次数的取值范围,按照各阅读次数分布区间的阅读次数取值划分区间,得到多个阅读次数分布区间。
步骤S510、根据待评估账号主体的各订阅用户单位时间周期,阅读待评估账号主体发布的文章的平均阅读次数,确定待评估账号主体的各订阅用户的平均阅读次数所处于的阅读次数分布区间,得到各阅读次数分布区间对应的订阅用户数。
步骤S520、分别将各阅读次数分布区间对应的订阅用户数除以待评估账号主体的订阅用户总数,确定各阅读次数分布区间的用户占比,得到待评估账号主体的订阅用户对应的阅读次数分布用户占比。
可选的,图5所示阅读次数分布用户占比与图4所示信用分分布用户占比的处理原理相同,细节之处可相互参照;可选的,表3示出了一种阅读次数分布用户占比的示意,可参照。
表3
设待评估账号主体的订阅用户数量为m,则阅读次数分布用户占比的函数F可以是频数分布、正态分布等。
其中,F(RRC1,RRC2,...,RRCm)。
可选的,待评估账号主体的订阅用户对应的阅读篇数分布用户占比,与正样本账号主体、负样本账号主体的订阅用户对应的阅读篇数分布用户占比的确定原理相同;下面以待评估账号主体的订阅用户对应的阅读篇数分布用户占比的确定进行说明;
图6为本发明实施例提供的确定待评估账号主体的订阅用户对应的阅读篇数分布用户占比的方法流程图,参照图6,该方法可以包括:
步骤S600、将阅读篇数的取值范围划分区间,确定出多个阅读篇数分布区间。
可选的,阅读篇数分布区间可以满足频数分布占比、正态分布占比等。
本发明实施例可设定每一个阅读篇数分布区间对应的阅读篇数,从而将阅读篇数的取值范围,按照各阅读篇数分布区间的阅读篇数取值划分区间,得到多个阅读篇数分布区间。
步骤S610、根据待评估账号主体的各订阅用户单位时间周期,阅读待评估账号主体发布的文章的平均阅读篇数,确定待评估账号主体的各订阅用户的平均阅读篇数所处于的阅读篇数分布区间,得到各阅读篇数分布区间对应的订阅用户数。
步骤S620、分别将各阅读篇数分布区间对应的订阅用户数除以待评估账号主体的订阅用户总数,确定各阅读篇数分布区间的用户占比,得到待评估账号主体的订阅用户对应的阅读篇数分布用户占比。
可选的,图6所示阅读篇数分布用户占比与图4所示信用分分布用户占比的处理原理相同,细节之处可相互参照;可选的,表4示出了一种阅读篇数分布用户占比的示意,可参照。
表4
设待评估账号主体的订阅用户数量为m,则阅读次数分布用户占比的函数F可以是频数分布、正态分布等。
其中,F(RRC1,RRC2,...,RRCm)。
可选的,待评估账号主体的订阅用户的交互指标分布用户占比,待评估账号主体单位时间周期存在负面反馈的平均次数,待评估账号主体单位时间周期发布信息的平均发布指标之中的至少一个,可以与待评估账号主体的订阅用户对应的信用分分布用户占比相结合,实现待评估账号主体的信用分确定;
具体的,本发明实施例可能有如下可能实现:
一、根据待评估账号主体的订阅用户的信用分分布用户占比,待评估账号主体的订阅用户的交互指标分布用户占比,通过账号主体的信用预测模型,确定待评估账号主体的信用分;相应的,在训练该信用预测模型时,本发明实施例可将正样本账号主体的订阅用户的信用分分布用户占比,正样本账号主体的订阅用户的交互指标分布用户占比,作为正样本账号主体的样本特征;负样本账号主体的样本特征选择相应;
二、根据待评估账号主体的订阅用户的信用分分布用户占比,待评估账号主体单位时间周期存在负面反馈的平均次数,通过账号主体的信用预测模型,确定待评估账号主体的信用分;相应的,在训练该信用预测模型时,正样本账号主体和负样本账号主体的样本特征相应调整;
三、根据待评估账号主体的订阅用户的信用分分布用户占比,待评估账号主体单位时间周期发布信息的平均发布指标,通过账号主体的信用预测模型,确定待评估账号主体的信用分;相应的,在训练该信用预测模型时,正样本账号主体和负样本账号主体的样本特征相应调整;
四、根据待评估账号主体的订阅用户的信用分分布用户占比,待评估账号主体的订阅用户的交互指标分布用户占比,待评估账号主体单位时间周期存在负面反馈的平均次数,通过账号主体的信用预测模型,确定待评估账号主体的信用分;相应的,在训练该信用预测模型时,正样本账号主体和负样本账号主体的样本特征相应调整;
五、根据待评估账号主体的订阅用户的信用分分布用户占比,待评估账号主体的订阅用户的交互指标分布用户占比,待评估账号主体单位时间周期发布信息的平均发布指标,通过账号主体的信用预测模型,确定待评估账号主体的信用分;相应的,在训练该信用预测模型时,正样本账号主体和负样本账号主体的样本特征相应调整;
六、根据待评估账号主体的订阅用户的信用分分布用户占比,待评估账号主体单位时间周期存在负面反馈的平均次数,待评估账号主体单位时间周期发布信息的平均发布指标,通过账号主体的信用预测模型,确定待评估账号主体的信用分;相应的,在训练该信用预测模型时,正样本账号主体和负样本账号主体的样本特征相应调整。
可选的,本发明实施例可在确定出待评估账号主体的信用分后,根据待评估账号主体的信用分进行待评估账号主体的推荐(如根据信用分调整账号主体在推荐页面的排序,且信用分越高,推荐页面的排序越靠前);也可以在待评估账号主体的显示页面,控制显示待评估账号主体的信用分,或者控制显示以待评估账号主体的信用分确定的信用分等级(一个信用分等级对应一个信用分范围),以使得用户可在账号主体的显示页面,了解到账号主体的可信程度,对账号主体提供的信息服务的可信程度进行判断。
本发明实施例评估的账号主体的信用分的评估依据能够更为客观、全面,使得所评估的账号主体的信用分更为客观、准确,提升了账号主体的可信程度评估结果。
下面对本发明实施例提供的账号主体的可信程度评估装置进行介绍,下文描述的账号主体的可信程度评估装置可以认为是,服务器为实现本发明实施例提供的账号主体的可信程度评估方法所需设置的功能模块结构。
图7示出了本发明实施例提供的账号主体的可信程度评估装置的结构框图,该装置可应用于服务器,参照图7,该装置可以包括:
订阅用户确定模块100,用于确定待评估账号主体的订阅用户;
用户信用分确定模块200,用于分别确定各订阅用户在设定历史时间段的信用分;
信息服务指标确定模块300,用于确定所述待评估账号主体在所述设定历史时间段的信息服务指标;
评估输入特征确定模块400,用于根据所述各订阅用户在设定历史时间段的信用分,及所述信息服务指标确定评估输入特征;
信用分确定模块500,用于调取预训练的账号主体的信用预测模型,根据所述评估输入特征,以所述信用预测模型,确定所述待评估账号主体的信用分,以所确定的信用分表示所述待评估账号主体的可信程度。
可选的,图8示出了本发明实施例提供的账号主体的可信程度评估装置的另一结构框图,结合图7和图8所示,该装置可以包括:
训练模块600,用于确定正样本账号主体及负样本账号主体,所述正样本账号主体的可信程度高于负样本账号主体的可信程度;
对于各正样本账号主体,根据正样本账号主体的各订阅用户在设定历史时间段的信用分,及正样本账号主体在设定历史时间段的信息服务指标,确定正样本账号主体的样本特征;对于各负样本账号主体,根据负样本账号主体的订阅用户在设定历史时间段的信用分,及负样本账号主体在设定历史时间段的信息服务指标,确定负样本账号主体的样本特征;
通过机器学习方法,根据正样本账号主体的样本特征和负样本账号主体的样本特征,训练得到账号主体的信用预测模型。
可选的,所述正样本账号主体在设定历史时间段的信息服务指标包括如下至少一种
正样本账号主体在设定历史时间段所存在的负面反馈次数;
正样本账号主体的各订阅用户在设定历史时间段,对正样本账号主体发布的信息的交互指标;
正样本账号主体在设定历史时间段发布信息的发布指标。
可选的,所述设定历史时间段包括n个时间周期;
所述正样本账号主体的各订阅用户在设定历史时间段的信用分包括:所述正样本账号主体的各订阅用户在单位时间周期的平均信用分;
所述正样本账号主体在设定历史时间段所存在的负面反馈次数包括:正样本账号主体单位时间周期存在负面反馈的平均次数;
所述正样本账号主体的各订阅用户在设定历史时间段,对正样本账号主体发布的信息的交互指标包括:正样本账号主体的各订阅用户单位时间周期,对正样本账号主体发布的信息的平均交互指标;
所述正样本账号主体在设定历史时间段发布信息的发布指标包括:正样本账号主体单位时间周期发布信息的平均发布指标。
可选的,所述正样本账号主体的各订阅用户单位时间周期,对正样本账号主体发布的信息的平均交互指标包括:
正样本账号主体的各订阅用户单位时间周期阅读正样本账号主体发布的文章的平均阅读次数,和/或,正样本账号主体的订阅用户单位时间周期阅读正样本账号主体发布的文章的平均篇数;
所述正样本账号主体单位时间周期发布信息的平均发布指标包括:
正样本账号主体单位时间周期发布原创文章的平均数量,和/或,正样本账号主体单位时间周期发布文章的平均原创率。
可选的,训练模块600,用于根据正样本账号主体的各订阅用户在设定历史时间段的信用分,及正样本账号主体在设定历史时间段的信息服务指标,确定正样本账号主体的样本特征,具体包括:
根据正样本账号主体的各订阅用户单位时间周期的平均信用分,确定正样本账号主体的订阅用户对应的信用分分布用户占比;
将正样本账号主体的订阅用户的交互指标分布用户占比,正样本账号主体单位时间周期存在负面反馈的平均次数,正样本账号主体单位时间周期发布信息的平均发布指标中的至少一个,与所述正样本账号主体的订阅用户对应的信用分分布用户占比,作为正样本账号主体的样本特征;
其中,所述正样本账号主体的订阅用户的交互指标分布用户占比,根据正样本账号主体的各订阅用户单位时间周期,对正样本账号主体发布的信息的平均交互指标确定。
可选的,评估输入特征确定模块400,用于根据所述各订阅用户在设定历史时间段的信用分,及所述信息服务指标确定评估输入特征,具体包括:
根据待评估账号主体的各订阅用户单位时间周期的平均信用分,确定待评估账号主体的订阅用户对应的信用分分布用户占比;
将待评估账号主体的订阅用户的交互指标分布用户占比,待评估账号主体单位时间周期存在负面反馈的平均次数,及待评估账号主体单位时间周期发布信息的平均发布指标中的至少一个,与所述待评估账号主体的订阅用户对应的信用分分布用户占比,作为所述评估输入特征。
可选的,评估输入特征确定模块400,用于根据待评估账号主体的各订阅用户单位时间周期的平均信用分,确定待评估账号主体的订阅用户对应的信用分分布用户占比,具体包括:
将信用分的取值范围划分区间,确定出多个信用分分布区间;
根据待评估账号主体的各订阅用户单位时间周期的平均信用分,确定待评估账号主体的各订阅用户的平均信用分所处于的信用分分布区间,得到各信用分分布区间对应的订阅用户数;
分别将各信用分分布区间对应的订阅用户数除以待评估账号主体的订阅用户总数,确定各信用分分布区间的用户占比,得到待评估账号主体的订阅用户对应的信用分分布用户占比。
可选的,所述待评估账号主体的各订阅用户单位时间周期,对待评估账号主体发布的信息的平均交互指标可以包括:待评估账号主体的各订阅用户单位时间周期,阅读待评估账号主体发布的文章的平均阅读次数;
相应的,评估输入特征确定模块400可用于确定待评估账号主体的订阅用户的交互指标分布用户占比,具体过程可以为:
将阅读次数的取值范围划分区间,确定出多个阅读次数分布区间;
根据待评估账号主体的各订阅用户单位时间周期,阅读待评估账号主体发布的文章的平均阅读次数,确定待评估账号主体的各订阅用户的平均阅读次数所处于的阅读次数分布区间,得到各阅读次数分布区间对应的订阅用户数;
分别将各阅读次数分布区间对应的订阅用户数除以待评估账号主体的订阅用户总数,确定各阅读次数分布区间的用户占比,得到待评估账号主体的订阅用户对应的阅读次数分布用户占比。
可选的,所述待评估账号主体的各订阅用户单位时间周期,对待评估账号主体发布的信息的平均交互指标可以包括:待评估账号主体的订阅用户单位时间周期,阅读待评估账号主体发布的文章的平均篇数;
相应的,评估输入特征确定模块400可用于确定待评估账号主体的订阅用户的交互指标分布用户占比,具体过程可以为:
将阅读篇数的取值范围划分区间,确定出多个阅读篇数分布区间;
根据待评估账号主体的各订阅用户单位时间周期,阅读待评估账号主体发布的文章的平均阅读篇数,确定待评估账号主体的各订阅用户的平均阅读篇数所处于的阅读篇数分布区间,得到各阅读篇数分布区间对应的订阅用户数;
分别将各阅读篇数分布区间对应的订阅用户数除以待评估账号主体的订阅用户总数,确定各阅读篇数分布区间的用户占比,得到待评估账号主体的订阅用户对应的阅读篇数分布用户占比。
可选的,该账号主体的可信程度评估装置还可用于:
根据待评估账号主体的信用分进行待评估账号主体的推荐;
和/或,在待评估账号主体的显示页面,控制显示待评估账号主体的信用分,或者控制显示以待评估账号主体的信用分确定的信用分等级。
本发明实施例还提供一种服务器,该服务器可以包括上述所述的账号主体的可信程度评估装置。
可选的,图9示出了本发明实施例提供的服务器的可选硬件结构,参照图9,该服务器可以包括:处理器1,通信接口2,存储器3和通信总线4;
其中处理器1、通信接口2、存储器3通过通信总线4完成相互间的通信;
可选的,通信接口2可以为通信模块的接口,如GSM模块的接口;
处理器1可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。
存储器3可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
其中,处理器1具体用于:
确定待评估账号主体的订阅用户;
分别确定各订阅用户在设定历史时间段的信用分;
确定所述待评估账号主体在所述设定历史时间段的信息服务指标;
根据所述各订阅用户在设定历史时间段的信用分,及所述信息服务指标确定评估输入特征;
调取预训练的账号主体的信用预测模型,根据所述评估输入特征,以所述信用预测模型,确定所述待评估账号主体的信用分,以所确定的信用分表示所述待评估账号主体的可信程度。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的核心思想或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (15)
1.一种账号主体的可信程度评估方法,其特征在于,包括:
确定待评估账号主体的订阅用户;
分别确定各订阅用户在设定历史时间段的信用分;
确定所述待评估账号主体在所述设定历史时间段的信息服务指标;
根据所述各订阅用户在所述设定历史时间段的信用分,及所述信息服务指标确定评估输入特征;
调取预训练的账号主体的信用预测模型,根据所述评估输入特征,以所述信用预测模型,确定所述待评估账号主体的信用分,以所确定的信用分表示所述待评估账号主体的可信程度。
2.根据权利要求1所述的账号主体的可信程度评估方法,其特征在于,所述方法还包括:
确定正样本账号主体及负样本账号主体,所述正样本账号主体的可信程度高于负样本账号主体的可信程度;
对于各正样本账号主体,根据正样本账号主体的各订阅用户在设定历史时间段的信用分,及正样本账号主体在设定历史时间段的信息服务指标,确定正样本账号主体的样本特征;对于各负样本账号主体,根据负样本账号主体的订阅用户在设定历史时间段的信用分,及负样本账号主体在设定历史时间段的信息服务指标,确定负样本账号主体的样本特征;
通过机器学习方法,根据正样本账号主体的样本特征和负样本账号主体的样本特征,训练得到账号主体的信用预测模型。
3.根据权利要求2所述的账号主体的可信程度评估方法,其特征在于,所述正样本账号主体在设定历史时间段的信息服务指标包括如下至少一种:
正样本账号主体在设定历史时间段所存在的负面反馈次数;
正样本账号主体的各订阅用户在设定历史时间段,对正样本账号主体发布的信息的交互指标;
正样本账号主体在设定历史时间段发布信息的发布指标。
4.根据权利要求3所述的账号主体的可信程度评估方法,其特征在于,所述设定历史时间段包括n个时间周期;
所述正样本账号主体的各订阅用户在设定历史时间段的信用分包括:所述正样本账号主体的各订阅用户在单位时间周期的平均信用分;
所述正样本账号主体在设定历史时间段所存在的负面反馈次数包括:正样本账号主体单位时间周期存在负面反馈的平均次数;
所述正样本账号主体的各订阅用户在设定历史时间段,对正样本账号主体发布的信息的交互指标包括:正样本账号主体的各订阅用户单位时间周期,对正样本账号主体发布的信息的平均交互指标;
所述正样本账号主体在设定历史时间段发布信息的发布指标包括:正样本账号主体单位时间周期发布信息的平均发布指标。
5.根据权利要求4所述的账号主体的可信程度评估方法,其特征在于,所述平均交互指标包括:
正样本账号主体的各订阅用户单位时间周期阅读正样本账号主体发布的文章的平均阅读次数,和/或,正样本账号主体的订阅用户单位时间周期阅读正样本账号主体发布的文章的平均篇数;
所述平均发布指标包括:
正样本账号主体单位时间周期发布原创文章的平均数量,和/或,正样本账号主体单位时间周期发布文章的平均原创率。
6.根据权利要求4或5所述的账号主体的可信程度评估方法,其特征在于,所述根据正样本账号主体的各订阅用户在设定历史时间段的信用分,及正样本账号主体在设定历史时间段的信息服务指标,确定正样本账号主体的样本特征包括:
根据正样本账号主体的各订阅用户单位时间周期的平均信用分,确定正样本账号主体的订阅用户对应的信用分分布用户占比;
将正样本账号主体的订阅用户的交互指标分布用户占比,正样本账号主体单位时间周期存在负面反馈的平均次数,正样本账号主体单位时间周期发布信息的平均发布指标中的至少一个,与所述正样本账号主体的订阅用户对应的信用分分布用户占比,作为正样本账号主体的样本特征;
其中,所述正样本账号主体的订阅用户的交互指标分布用户占比,根据正样本账号主体的各订阅用户单位时间周期,对正样本账号主体发布的信息的平均交互指标确定。
7.根据权利要求6所述的账号主体的可信程度评估方法,其特征在于,所述根据所述各订阅用户在所述设定历史时间段的信用分,及所述信息服务指标确定评估输入特征包括:
根据待评估账号主体的各订阅用户单位时间周期的平均信用分,确定待评估账号主体的订阅用户对应的信用分分布用户占比;
将待评估账号主体的订阅用户的交互指标分布用户占比,待评估账号主体单位时间周期存在负面反馈的平均次数,及待评估账号主体单位时间周期发布信息的平均发布指标中的至少一个,与所述待评估账号主体的订阅用户对应的信用分分布用户占比,作为所述评估输入特征。
8.根据权利要求7所述的账号主体的可信程度评估方法,其特征在于,所述根据待评估账号主体的各订阅用户单位时间周期的平均信用分,确定待评估账号主体的订阅用户对应的信用分分布用户占比包括:
将信用分的取值范围划分区间,确定出多个信用分分布区间;
根据待评估账号主体的各订阅用户单位时间周期的平均信用分,确定待评估账号主体的各订阅用户的平均信用分所处于的信用分分布区间,得到各信用分分布区间对应的订阅用户数;
分别将各信用分分布区间对应的订阅用户数除以待评估账号主体的订阅用户总数,确定各信用分分布区间的用户占比,得到待评估账号主体的订阅用户对应的信用分分布用户占比。
9.根据权利要求7所述的账号主体的可信程度评估方法,其特征在于,所述待评估账号主体的各订阅用户单位时间周期,对待评估账号主体发布的信息的平均交互指标包括:待评估账号主体的各订阅用户单位时间周期,阅读待评估账号主体发布的文章的平均阅读次数;
所述待评估账号主体的订阅用户的交互指标分布用户占比的确定过程包括:
将阅读次数的取值范围划分区间,确定出多个阅读次数分布区间;
根据待评估账号主体的各订阅用户单位时间周期,阅读待评估账号主体发布的文章的平均阅读次数,确定待评估账号主体的各订阅用户的平均阅读次数所处于的阅读次数分布区间,得到各阅读次数分布区间对应的订阅用户数;
分别将各阅读次数分布区间对应的订阅用户数除以待评估账号主体的订阅用户总数,确定各阅读次数分布区间的用户占比,得到待评估账号主体的订阅用户对应的阅读次数分布用户占比。
10.根据权利要求7所述的账号主体的可信程度评估方法,其特征在于,所述待评估账号主体的各订阅用户单位时间周期,对待评估账号主体发布的信息的平均交互指标包括:待评估账号主体的订阅用户单位时间周期,阅读待评估账号主体发布的文章的平均篇数;
所述待评估账号主体的订阅用户的交互指标分布用户占比的确定过程包括:
将阅读篇数的取值范围划分区间,确定出多个阅读篇数分布区间;
根据待评估账号主体的各订阅用户单位时间周期,阅读待评估账号主体发布的文章的平均阅读篇数,确定待评估账号主体的各订阅用户的平均阅读篇数所处于的阅读篇数分布区间,得到各阅读篇数分布区间对应的订阅用户数;
分别将各阅读篇数分布区间对应的订阅用户数除以待评估账号主体的订阅用户总数,确定各阅读篇数分布区间的用户占比,得到待评估账号主体的订阅用户对应的阅读篇数分布用户占比。
11.根据权利要求1所述的账号主体的可信程度评估方法,其特征在于,所述方法还包括:
根据待评估账号主体的信用分进行待评估账号主体的推荐;
和/或,在待评估账号主体的显示页面,控制显示待评估账号主体的信用分,或者控制显示以待评估账号主体的信用分确定的信用分等级。
12.一种账号主体的可信程度评估装置,其特征在于,包括:
订阅用户确定模块,用于确定待评估账号主体的订阅用户;
用户信用分确定模块,用于分别确定各订阅用户在设定历史时间段的信用分;
信息服务指标确定模块,用于确定所述待评估账号主体在所述设定历史时间段的信息服务指标;
评估输入特征确定模块,用于根据所述各订阅用户在所述设定历史时间段的信用分,及所述信息服务指标确定评估输入特征;
信用分确定模块,用于调取预训练的账号主体的信用预测模型,根据所述评估输入特征,以所述信用预测模型,确定所述待评估账号主体的信用分,以所确定的信用分表示所述待评估账号主体的可信程度。
13.根据权利要求12所述的账号主体的可信程度评估装置,其特征在于,还包括:
训练模块,用于确定正样本账号主体及负样本账号主体,所述正样本账号主体的可信程度高于负样本账号主体的可信程度;对于各正样本账号主体,根据正样本账号主体的各订阅用户在设定历史时间段的信用分,及正样本账号主体在设定历史时间段的信息服务指标,确定正样本账号主体的样本特征;对于各负样本账号主体,根据负样本账号主体的订阅用户在设定历史时间段的信用分,及负样本账号主体在设定历史时间段的信息服务指标,确定负样本账号主体的样本特征;通过机器学习方法,根据正样本账号主体的样本特征和负样本账号主体的样本特征,训练得到账号主体的信用预测模型。
14.根据权利要求12所述的账号主体的可信程度评估装置,其特征在于,所述评估输入特征确定模块,用于根据所述各订阅用户在设定历史时间段的信用分,及所述信息服务指标确定评估输入特征,具体包括:
根据待评估账号主体的各订阅用户单位时间周期的平均信用分,确定待评估账号主体的订阅用户对应的信用分分布用户占比;
将待评估账号主体的订阅用户的交互指标分布用户占比,待评估账号主体单位时间周期存在负面反馈的平均次数,及待评估账号主体单位时间周期发布信息的平均发布指标中的至少一个,与所述待评估账号主体的订阅用户对应的信用分分布用户占比,作为所述评估输入特征。
15.一种服务器,其特征在于,包括权利要求12-14任一项所述的可信程度评估装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710074022.6A CN108416684B (zh) | 2017-02-10 | 2017-02-10 | 一种账号主体的可信程度评估方法、装置及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710074022.6A CN108416684B (zh) | 2017-02-10 | 2017-02-10 | 一种账号主体的可信程度评估方法、装置及服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108416684A true CN108416684A (zh) | 2018-08-17 |
CN108416684B CN108416684B (zh) | 2021-09-07 |
Family
ID=63125090
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710074022.6A Active CN108416684B (zh) | 2017-02-10 | 2017-02-10 | 一种账号主体的可信程度评估方法、装置及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108416684B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109634995A (zh) * | 2018-09-10 | 2019-04-16 | 阿里巴巴集团控股有限公司 | 评估主体对关系的方法、装置及服务器 |
CN110119511A (zh) * | 2019-05-17 | 2019-08-13 | 网易传媒科技(北京)有限公司 | 文章热点得分的预测方法、介质、装置和计算设备 |
CN110120912A (zh) * | 2019-05-10 | 2019-08-13 | 腾讯科技(深圳)有限公司 | 富媒体内容处理方法、装置、可读存储介质和计算机设备 |
CN110381172A (zh) * | 2019-06-25 | 2019-10-25 | 苏州苏哲信息科技有限公司 | 一种主体管理方法及系统 |
CN112836084A (zh) * | 2019-11-25 | 2021-05-25 | 北京达佳互联信息技术有限公司 | 控制流量的方法、装置、设备及存储介质 |
CN113065908A (zh) * | 2020-01-02 | 2021-07-02 | 中国移动通信有限公司研究院 | 租赁方法、租赁装置、租赁平台及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105373887A (zh) * | 2015-11-12 | 2016-03-02 | 腾讯科技(深圳)有限公司 | 一种终端应用的质量评估方法和系统 |
CN105791091A (zh) * | 2016-03-02 | 2016-07-20 | 四川长虹电器股份有限公司 | 一种评估官微和微信公众号运营质量的系统及方法 |
CN105824806A (zh) * | 2016-06-13 | 2016-08-03 | 腾讯科技(深圳)有限公司 | 一种公众账号的质量评价方法和装置 |
CN106022849A (zh) * | 2016-07-11 | 2016-10-12 | 互动派科技股份有限公司 | 一种新媒体价值与效果评估方法和系统 |
CN106127551A (zh) * | 2016-06-22 | 2016-11-16 | 腾讯科技(深圳)有限公司 | 项目推荐方法和装置 |
CN106372207A (zh) * | 2016-09-05 | 2017-02-01 | 北京蓝色光标品牌管理顾问股份有限公司 | 公众号信息的影响力排序方法及排序系统 |
-
2017
- 2017-02-10 CN CN201710074022.6A patent/CN108416684B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105373887A (zh) * | 2015-11-12 | 2016-03-02 | 腾讯科技(深圳)有限公司 | 一种终端应用的质量评估方法和系统 |
CN105791091A (zh) * | 2016-03-02 | 2016-07-20 | 四川长虹电器股份有限公司 | 一种评估官微和微信公众号运营质量的系统及方法 |
CN105824806A (zh) * | 2016-06-13 | 2016-08-03 | 腾讯科技(深圳)有限公司 | 一种公众账号的质量评价方法和装置 |
CN106127551A (zh) * | 2016-06-22 | 2016-11-16 | 腾讯科技(深圳)有限公司 | 项目推荐方法和装置 |
CN106022849A (zh) * | 2016-07-11 | 2016-10-12 | 互动派科技股份有限公司 | 一种新媒体价值与效果评估方法和系统 |
CN106372207A (zh) * | 2016-09-05 | 2017-02-01 | 北京蓝色光标品牌管理顾问股份有限公司 | 公众号信息的影响力排序方法及排序系统 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109634995A (zh) * | 2018-09-10 | 2019-04-16 | 阿里巴巴集团控股有限公司 | 评估主体对关系的方法、装置及服务器 |
CN110120912A (zh) * | 2019-05-10 | 2019-08-13 | 腾讯科技(深圳)有限公司 | 富媒体内容处理方法、装置、可读存储介质和计算机设备 |
CN110119511A (zh) * | 2019-05-17 | 2019-08-13 | 网易传媒科技(北京)有限公司 | 文章热点得分的预测方法、介质、装置和计算设备 |
CN110119511B (zh) * | 2019-05-17 | 2023-05-02 | 网易传媒科技(北京)有限公司 | 文章热点得分的预测方法、介质、装置和计算设备 |
CN110381172A (zh) * | 2019-06-25 | 2019-10-25 | 苏州苏哲信息科技有限公司 | 一种主体管理方法及系统 |
CN112836084A (zh) * | 2019-11-25 | 2021-05-25 | 北京达佳互联信息技术有限公司 | 控制流量的方法、装置、设备及存储介质 |
CN112836084B (zh) * | 2019-11-25 | 2024-03-15 | 北京达佳互联信息技术有限公司 | 控制流量的方法、装置、设备及存储介质 |
CN113065908A (zh) * | 2020-01-02 | 2021-07-02 | 中国移动通信有限公司研究院 | 租赁方法、租赁装置、租赁平台及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108416684B (zh) | 2021-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108416684A (zh) | 一种账号主体的可信程度评估方法、装置及服务器 | |
CN105490823B (zh) | 一种数据处理方法及装置 | |
CN109564669A (zh) | 基于信任得分和地理范围搜索实体 | |
US11935036B2 (en) | Redemption and settlement transactions via smart contracts | |
US20140067656A1 (en) | Method and system for fraud risk estimation based on social media information | |
US20180284971A1 (en) | Intelligent visual object management system | |
CN105122285A (zh) | 为用户生成的内容给出奖励 | |
US11823197B2 (en) | Authenticating based on user behavioral transaction patterns | |
CN109978033A (zh) | 同操作人识别模型的构建与同操作人识别的方法和装置 | |
CN109064357B (zh) | 一种实时导游推荐系统及方法 | |
CN109685643A (zh) | 贷款审核中风险等级确定方法、装置、设备及存储介质 | |
CN110796539A (zh) | 一种征信评估方法及装置 | |
Melian et al. | Customer churn prediction in telecommunication industry. A data analysis techniques approach | |
CN112288460A (zh) | 提示用户登录平台的方法、装置、设备及存储介质 | |
CN103593355A (zh) | 用户原创内容的推荐方法及推荐装置 | |
CN104751234B (zh) | 一种用户资产的预测方法及装置 | |
CN113450158A (zh) | 银行活动信息推送方法及装置 | |
CN117611250A (zh) | 问卷数据处理方法、装置、计算机设备和存储介质 | |
CN112581281A (zh) | 产品推荐方法及装置、存储介质及电子设备 | |
CN112085332A (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN116467525A (zh) | 业务产品的推荐方法、装置、设备和存储介质 | |
CN116452201A (zh) | 一种养老服务支付结算处理方法及装置 | |
CN116361542A (zh) | 产品推荐方法、装置、计算机设备和存储介质 | |
CN109858952A (zh) | 服务场景下的数据处理方法和装置 | |
CN113706258A (zh) | 基于组合模型的产品推荐方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |