一种用户可信度评估方法、装置以及电子设备
技术领域
本说明书涉及计算机技术领域,尤其涉及一种用户可信度评估方法、装置以及电子设备。
背景技术
随着经济领域的各种失信问题日益突出,社会道德缺失现象不断蔓延,作为治理市场失灵问题的一项重要管制工具,用户可信度日益受到企业和行政管理部分的重视。
简单来讲,用户可信度可以辅助判断是否为该用户提供服务,以防范和控制风险,那么,如何准确预估用户可信度成为业界需要解决的课题之一。
发明内容
有鉴于此,本说明书实施例提供了一种用户可信度识别方法、装置以及电子设备。
本说明书实施例采用下述技术方案:
本说明书实施例提供一种用户可信度评估方法,包括:
确定在预设时间段内与用户信息对应的备注信息;
对所述备注信息进行处理,得到所述备注信息中的敏感词在所述预设时间段内的时序数据;
对所述时序数据进行处理,得到所述用户信息所对应的用户的可信度。
本说明书实施例还提供一种用户可信度评估方法,包括:
确定在预设时间段内与用户信息对应的备注信息,其中所述备注信息来自于不同用户的通信录;
对所述备注信息进行处理,得到所述备注信息中的敏感词在所述预设时间段内的时序数据;
对所述时序数据进行处理,得到所述用户信息所对应的用户的可信度。
本说明书实施例还提供一种用户可信度评估装置,包括:
确定模块,确定在预设时间段内与用户信息对应的备注信息;
第一处理模块,对所述备注信息进行处理,得到所述备注信息中的敏感词在所述预设时间段内的时序数据;
第二处理模块,对所述时序数据进行处理,得到所述用户信息所对应的用户的可信度。
本说明书实施例还提供一种电子设备,包括至少一个处理器及存储器,存储器存储有程序,并且被配置成由至少一个处理器执行以下步骤:
确定在预设时间段内与用户信息对应的备注信息,其中所述备注信息来自于不同用户的通信录;
对所述备注信息进行处理,得到所述备注信息中的敏感词在所述预设时间段内的时序数据;
对所述时序数据进行处理,得到所述用户信息所对应的用户的可信度。
本说明书实施例还提供一种电子设备,包括至少一个处理器及存储器,存储器存储有程序,并且被配置成由至少一个处理器执行以下步骤:
确定在预设时间段内与用户信息对应的备注信息,其中所述备注信息来自于不同用户的通信录;
对所述备注信息进行处理,得到所述备注信息中的敏感词在所述预设时间段内的时序数据;
对所述时序数据进行处理,得到所述用户信息所对应的用户的可信度。
本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:
根据预设时间段内其他用户对该用户的备注信息,确定备注信息中敏感词在预设时间段内的时序数据,即可确定敏感词在预设时间段内随着时间变化的变化状态。这样,根据所述时序数据所分析确定的用户可信度综合考虑了时间跨度和时序变化状态等因素,敏感词在预设时间段内的变化更能反映用户可信度的动态变化,从而更加准确和细致。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:
图1为本说明书一个实施例的一种用户可信度识别方法的流程图。
图2为本说明书一个实施例的一种用户可信度识别方法的预设时间段的确定方法的流程图。
图3为本说明书一个实施例的一种用户可信度识别方法的时序数据确定方法流程图。
图4为本说明书一个实施例的一种用户可信度识别方法中利用时序数据来确定用户是否为黑户的流程图。
图5为本说明书一个具体场景实施例的一种用户可信度识别方法的流程图。
图6为本说明书一个实施例的一种用户可信度识别方法的流程图
图7为本说明书一个实施例的一种用户可信度识别装置的结构框图。
图8为本说明书一个实施例的一种用户可信度识别装置的结构框图。
图9为本说明书一个实施例的一种用户可信度识别装置的敏感词库的示意图。
具体实施方式
在为用户提供服务过程中,可以经过其他用户的授权而采集其他用户储存的对该用户的备注信息,从而发现该用户的更多信息来辅助服务决策判断。例如,可以从其他用户的通信录中获取对该用户的备注信息。
现有技术中,对备注信息的挖掘处理有两种方向。第一种是通过静态标签属性进行判断,譬如通过其他用户在备注信息中标记的“中介”、“放贷人员”等敏感词来进行识别分析用户的可信度。第二种是通过交叉验证,譬如用通讯录中的敏感词和用户之前的表现进行交叉验证,例如通过用户的实际信用情况结合其他用户对该用户的备注信息进行匹配来综合判断用户风险。
但是这两种方式本质上只是通过备注信息中所包含的敏感词的浓度,计算对应标准场景的坏率,通过排序来计算这些敏感词的重要性,进而确定该用户信用度的方法。
本说明书的实施例提供一种用户可信度评估方法、装置和电子设备,根据预设时间段内其他用户对该用户的备注信息,确定备注信息中敏感词在预设时间段内的时序数据,即可确定敏感词在预设时间段内随着时间变化的变化状态。这样,根据所述时序数据所分析确定的用户可信度综合考虑了时间跨度和时序变化状态等因素,敏感词在预设时间段内的变化更能反映用户可信度的动态变化,从而更加准确和细致。
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
如图1所示,为本说明书的实施例提供的一个用户可信度评估方法的流程图。
步骤110:确定在预设时间段内与用户信息对应的备注信息。
所述用户信息为待评估信用度的该用户的信息,包括但不限于用户手机号或用户ID等。所述备注信息为其他用户储存的对该用户的备注或标记。例如,所述备注信息可以是昵称、公司、家庭住址、敏感词等等,在此不作具体限定。所述备注信息可以来自于其他用户的通信录、标签备忘录等等。
所述预设时间段可以是3,6,9,12个月等,并不限定。具体地,在本说明书的一个实施例中,可以对3,6,9,12个月等不同时间段的对应的所述备注信息,利用逻辑回归、PS-smart算法或评分卡模型等方法确定适于评估该用户的可信度的时间跨度,进而确定所述预设时间段。
对应地,在确定在预设时间段内与用户信息对应的备注信息之前,可以包括步骤:
采集不同时间段内的所述备注信息;
确定满足设定条件的预设时间段。
具体地,所述备注信息的采集可以是向存储有对应的所述备注信息的客户端申请授权,在获得授权后,采集存储在该客户端的所述备注信息。例如,客户端的通信录中存储有所述备注信息,则向该客户端申请授权,在获得授权后,采集通信录中的所述备注信息。
或者,所述备注信息的采集可以是预先向客户端发布授权协议,客户端签署授权协议后,客户端主动采集备注信息。例如,客户端的应用程序设有授权协议,该客户端签署所述授权协议,允许采集在该应用程序中对该用户的备注信息,则可以直接采集所述备注信息。比如,在客户端的聊天应用程序中设有授权协议,该客户端签署所述授权协议,允许采集在聊天应用程序中的所述备注信息。
步骤120:对所述备注信息进行处理,得到所述备注信息中的敏感词在所述预设时间段内的时序数据。
所述敏感词是和业务场景相关的负面性词或词组,譬如针对贷款场景,所述敏感词可以包含欠钱、不还、老赖等等。具体地,所述敏感词可以是人为设定和定性,例如“贷款中介”本身只是对用户身份和职业介绍,但是可以人为设定“贷款中介”为敏感词。
所述敏感词可以是通过对所述备注信息进行分词获得确定。例如,所述备注信息可以是“王中介”,利用分词技术,则可以将“王中介”分词为“王”和“中介”,其中如果“中介”在敏感词库中被设定为敏感词,则在此次分词中就获得敏感词“中介”。
对应地,对所述备注信息进行处理,可以包括:
对所述备注信息进行分词;
根据敏感词库,确定分词所得词中的所述敏感词。
具体地,可以采用基于规则的分词方法,按照一定的策略将待分词的汉字串与一个机器词典中的词条进行匹配,若在词典中找到某个字符串,则匹配成功。或者,例如,可以采用基于语义的分词方法,对自然语言自身的语言信息进行更多的处理,如扩充转移网络法、知识分词语义分析法等进而实现分词。本领域技术人员应知晓,此处只是举例说明,并非限制,本领域技术人员还可以采用基于统计的分词方法、基于理解的分词方法等等获得所述敏感词,本说明书并不限制。
优选地,在本说明书的一个实施例中,所述敏感词被划分为不同敏感等级。例如,在贷款场景中,“贷款中介”被分为负面影响最轻的一级敏感词,而“老赖”被分为负面影响较重的三级敏感词。
对应地,在所述敏感词确定步骤之后,还可以包括:
确定所述敏感词的敏感等级。
在本申请中,所述时序数据是指根据时间变化,反映所述敏感词的变化情况的数据。
在本发明的一个实施例中,对所述备注信息进行处理,得到所述备注信息中的敏感词在所述预设时间段内的时序数据,可以包括:
从所述备注信息中获取所述敏感词的创建时间;
根据所述创建时间,确定所述敏感词在所述预设时间段内的时序数据。
也就是说,根据所述创建时间,可以得到所述敏感词跟随时间变化的变化情况。例如可以利用折线图、柱形图等等直观地看出所述敏感词跟随时间变化的变化情况。
具体地,根据所述创建时间,确定所述敏感词在所述预设时间段内的时序数据,还可以包括:
确定所述预设时间段内设定的各时间单位;
根据所述敏感词的创建时间,确定至少一个所述时间单位内的所述敏感词的创建数。
进一步,根据所述创建时间,确定所述敏感词在所述预设时间段内的时序数据,还包括如下一种或多种的组合:
根据各所述时间单位内的所述敏感词的创建数,确定所述敏感词在所述预设时间段内的创建频率;
在创建敏感词的时间单位中确定满足预设条件的至少一个时间单位;
根据各所述时间单位内的所述敏感词的创建数,确定符合预设条件的至少一个时间单位内的所述敏感词的创建数量。
具体地,通过确定所述创建时间所属的时间单位,则可以判定对应的敏感词为其所属的时间单位内创建的。对应地,各个时间单位内的所述敏感词的创建数、所述预设时间段内的创建频率、及符合预设条件的时间单位等都可以得到。
具体地,所述敏感词在所述预设时间段内的创建频率可以包括:
连续时间单位的时间单位数,其中连续时间单位中的每个时间单位内均创建敏感词。
具体地,在创建敏感词的时间单位中确定满足预设条件的至少一个时间单位,可以包括:
在创建敏感词的时间单位中确定相比其他时间单位时序在后的时间单位。
也就是说,在所述预设时间段内可以找出最近一个创建敏感词命中的时间单位。
在本实施例中,是通过统计每个时间单位内敏感词的创建变量,来确定每个时间单位内的敏感词的创建情况,以获得对应的时序数据。
在本说明书的另一个实施例中,对所述备注信息进行处理,得到所述备注信息中的敏感词在所述预设时间段内的时序数据,包括:
确定所述预设时间段内的各个时间单位内所述敏感词的命中数。
也就是说,在本实施例中,所述命中数的统计可以是不论敏感词的新建时间、持续时间、取消时间,只要在该时间单位内,该敏感词存在,则该敏感词在该时间单位内命中,对应地统计入该时间单位的命中数。
进一步,对所述备注信息进行处理,得到所述备注信息中的敏感词在所述预设时间段内的时序数据,还可以包括:
根据各个时间单位内所述敏感词命中数,确定所述敏感词在所述预设时间段内的命中频率;
根据各个时间单位内所述敏感词命中数,确定在命中所述敏感词的各个时间单位中符合预设条件的时间单位。
对应地,当所述敏感词被确定等级,则所述时序数据可以包括如下的一种或多种的组合:
不同等级的所述敏感词分别在所述预设时间段内的命中频率;
不同等级的所述敏感词分别在时间单位内的命中数。
步骤130:对所述时序数据进行处理,得到所述用户信息所对应的用户的可信度。
例如,对前述所得各个所述时序数据,利用逻辑回归或者PS-smart算法等方式可以确定上述各个时序数据的权重,获得所述用户信息所对应的用户的可信度。
对应地,对所述时序数据进行处理,得到所述用户信息所对应的用户的可信度可以包括:
利用逻辑回归、PS-smart算法和评分卡模型中的一种处理所述时序数据,获得所述用户信息所对应的用户的可信度。
进一步,根据所述步骤230获得的所述可信度,可以确定所述用户是否为黑用户。
对应地,对所述时序数据进行处理,得到所述用户信息所对应的用户的可信度之后,还可以包括:
对比用户的可信度与预设阈值;
根据对比结果,确定对应的用户是否为黑用户。
所述用户可信度评估方法利用所述时序数据分析确定用户的可信度,是从时序角度分析该用户的状态变化情况,相比于传统意义上只通过敏感词的浓度对应标准场景的坏率来刻画的方法,本说明书的所述用户可信度评估方法可以更准确的反映所述用户的可信度。
例如,一个用户是最近一个月频繁被录“黑”(即被标记敏感词),还是最近几个月都有“黑”历史,还是在12个月之前被录“黑”过一次,从风险表现上来看这些严重程度是完全不一样的。本说明书的实施例的从时序角度分析该用户的状态变化情况所确定的可信度可以更细致和准确。
如图2所示,为本说明书的一个实施例的所述用户可信度评估方法的所述预设时间段的确定流程图。
步骤210:获取所述用户信息。
如前文所述,所述用户信息可以是用户电话号码、用户标识符等。所述用户信息的获取方法可以是要求用户主动输入提供,也可以是系统主动调取用户存储的信息等。
步骤220:采集不同时间段内与所述用户信息对应的备注信息。
根据所述用户信息,可以查询或者调用,和所述用户信息所对应的所述备注信息。例如,根据用户电话号码,可以查询到存储该用户的电话号码的系统或软件等,进而获取和该用户的电话号码关联的其他信息,作为所述备注信息。
不同的时间段可以是3,6,9,12个月等并不限定,根据业务需求可以灵活地设定。
步骤230:对所述备注信息进行分词,确定敏感词。
步骤240:确定所述敏感词在不同时间段内对应的时序数据。
以采集分别采集了3,6,9,12个月内的所述备注数据,对所述备注信息进行分词,确定所述敏感词后,可以分别确定3,6,9,12个月对应的所述时序数据。
步骤250:分别对不同时间段内对应的时序数据进行处理,确定不同时间段内对应的用户的可信度。
步骤260:对比不同时间段对应的所述时序数据所反映的用户的可信度的效果。
步骤270:根据反映效果,确定所述预设时间段对应的时间段。
具体地,所述步骤250至所述步骤270可以通过逻辑回归、PS-smart算法、评分卡模型等具体实现。也就是说,所述步骤250至所述步骤270实际上是在逻辑回归、PS-smart算法、评分卡模型等等方式中,处理所述敏感词在不同时间段内的对应的时序数据,进而来观察针对所述备注信息应该取何种时间跨度比较合适,以准确地评估该用户的可信度。
如图3所示,为本说明书的一个实施例的所述用户可信度评估方法的所述时序数据确定的流程图。
步骤311:获得在所述预设时间段内所述敏感词。
步骤313:确定所述敏感词的创建时间。
步骤315:确定所述创建时间所属时间单位。
步骤317:确定各个时间单位内的所述敏感词的创建数。
具体地,所述步骤313至步骤317中通过确定所述敏感词的创建时间,进而确定所述创建时间所属的时间单位,则可判定该敏感词为其所属的时间单位的创建的备注信息。对应地,该时间单位对应的敏感词的创建数对应地统计。
以所述预设时间段是6个月为例,所述时序数据对应地表征其他用户对该用户的备注信息分别在最近6个月时间窗口中每个月创建敏感词的创建数。例如,所述时序数据构成的数组为(0,1,3,2,1,0)。
以时间单位为一个月进行说明,根据所述时序数据的数组为(0,1,3,2,1,0),则第一个月没有新的敏感词被创建标记,第二个月敏感词的创建数为1,第三个月敏感词的创建数为3,等等不再赘述。
步骤319:确定连续时间单位的时间单位数,其中连续时间单位中的每个时间单位内均创建敏感词。
对应地,在前述举例中,在这6个月中有连续4个月内有敏感词被创建。这可能反映的是这6个月中有连续4个月中每个月内都新增了其他用户对该用户的备注信息标记了敏感词。
步骤321:确定创建敏感词的时间单位。
步骤323:在所确定出的时间单位中,确定出相比其他时间单位时序在后的时间单位。
这是为了确定出在这6个月中的最近一次有敏感词被创建的时间单位。
对应地,在这6个月,最近的第二个月创建了敏感词。这可能反映的是最近一次创建了其他用户对该用户标记了敏感词的最近第二个月。
步骤325:确定在所述预设时间段内,所述敏感词创建总数量。
对应地,在这6个月中总共创建了7次敏感词。这可能反映在最近6个月中新增了其他用户对该用户的备注信息标记了敏感词次数共7次。
所述步骤311至所述步骤325是确定的所述时序数据中的举例,并不是限制,本领域技术人员可以分析进而确定其他实施例的所述时序数据。
进一步,当所述时序数据确定后,可以分析获得对应用户的可信度,进而判断用户是否为黑户,如图4所示。
步骤410:根据所确定的时序数据,得到对应用户的可信度。
通过逻辑回归或者PS-smart算法来计算所述时序数据,进而得到对应用户的可信度。例如,所述可信度可以是用0至1之间的数值表征。通过逻辑回归或者PS-smart算法来计算这些信息的权重,得到对应的分数值,一般情况下分数值越高,则代表该用户可信度越低;数值越低,则代表该用户可信度越高。
步骤420:对比用户的可信度与预设阈值。
所述预设阈值根据不同业务场景或这业务标准,可以对应地不同。比如,对用户可信度要求越高,则预设阈值可以为越低的数值。例如,业务场景对用户可信度要求较高,则预设阈值可以设定为0.5;对业务场景对用户可信度要求较低,则预设阈值可以设定为0.8。
步骤430:根据对比结果,确定对应的用户是否为黑用户。
所述黑用户是指信用度低的用户。对应地,根据前文所述获得的可信度的分数值和预设阈值对比,即可对应地确定用户是否为黑用户。比如,所述预设阈值可以设定为0.5,则可信度对应分数值大于0.5的对应用户则为黑户,可信度对应分数值低于0.5的对应用户则不为黑户。
据此,所述用户可信度评估方法综上考虑了时间跨度、敏感词的频率以及敏感词的重要性等各方面来确定用户的可信度,以准确地刻画该用户,从而取代传统意义上只通过敏感词的浓度对应标准场景的坏率来刻画的方法。
为了更容易理解和阐述方便,本说明书以所述预设时间段的确定时间为当前时间、预设时间段为最近6个月、单位时间为一个月进行举例说明,如图5所示。
步骤511:获取与所述预设时间段的确定时间相邻的6个月的备注信息。
步骤513:对所述备注信息进行分词,获得敏感词。
步骤515:确定各个敏感词的新建时间的所属月份。
步骤517:统计在这6个月中每个月敏感词的创建数。
步骤519:统计在这6个月中每个月都有敏感词创建的所连续的月数。
步骤521:统计在这6个月中相比其他时间单位时序在后且有敏感词创建的月份。
步骤523:统计在这6个月中敏感词创建总数量。
步骤525:通过逻辑回归处理所述步骤515至所述步骤521获得的时序数据,获得用户可信度对应分数值。
步骤527:对比用户可信度对应分数值和预设阈值,如果用户可信度对应分数值比预设阈值大,则执行步骤529,如果用户可信度对应分数值比预设阈值小,则执行步骤531。
步骤529:确定该用户为黑用户。
步骤531:确定该用户不为黑用户。
进一步,在本说明的一个实施例中,所述备注信息来自于其他不同用户的通信录,如图6所示。
步骤610:确定在预设时间段内与用户信息对应的备注信息,其中所述备注信息来自于不同用户的通信录。
步骤620:对所述备注信息进行处理,得到所述备注信息中的敏感词在所述预设时间段内的时序数据。
步骤630:对所述时序数据进行处理,得到所述用户信息所对应的用户的可信度。
根据本说明书的另一个方面,本说明书的实施例提供一种用户可信度评估装置,如图7所示。所述用户可信度评估装置,包括:
确定模块10,确定在预设时间段内与用户信息对应的备注信息;
第一处理模块20,对所述备注信息进行处理,得到所述备注信息中的敏感词在所述预设时间段内的时序数据;
第二处理模块30,对所述时序数据进行处理,得到所述用户信息所对应的用户的可信度。
具体地,所述用户信息为待评估可信度的该用户的信息,包括但不限于用户手机号或用户ID等。
所述备注信息为其他用户储存的对该用户的备注或标记。
所述敏感词是和业务场景相关的负面性词或词组,譬如针对贷款场景,敏感词包含欠钱、不还、老赖等等。
所述时序数据是指根据时间变化,反映所述敏感词的变化情况的数据。在本说明书的一个实施例中,所述时序数据可以以数组的形式表征。
图8为图7所示的用户可信度评估装置的一个应用实例的结构示意图。在本说明书的该实施例中,所述用户可信度评估装置包括敏感词库40A。所述敏感词库40A存储有业务背景关联的敏感词。例如,对贷款场景,对应的敏感词包括但不限于贷款中介、欠钱、不还、老赖等等,如图9所示。
所述用户可信度评估装置包括所述采集模块70A根据所述用户信息,采集对应的所述备注信息。所述备注信息可能被存储于其他用户持有的客户端设备中,则可以向存储有对应的所述备注信息的客户端申请授权,在获得授权后,采集存储在该客户端的所述备注信息。例如,客户端的通信录中存储有所述备注信息,则向该客户端申请授权,在获得授权后,采集通信录中的所述备注信息。
进一步,所述用户可信度评估装置包括时间跨度确定模块50A,用于确定所述预设时间段,以使所述用户可信度评估装置利用的是预设时间段内的所述备注信息。具体地,所述时间跨度确定模块50A可以利用逻辑回归、PS-smart算法或评分卡模型等方式对不同时间跨度所对应的所述备注信息进行对比分析,进而确定何种时间跨度适于用来确定对应用户的可信度。
例如,所述时间跨度确定模块50A接收所述采集模块70A所采集的不同时间段的所述备注信息,进而采用时间跨度为3、6、9、和12个月的其他用户对该用户的所述备注信息,利用逻辑回归、PS-smart算法或评分卡模型等观察和分析何种时间跨度适于用来确定对应该用户的可信度。
所述确定模块10A接收所述采集模块70A所采集的所述备注信息后,根据所述时间跨度确定模块50A反馈的所述预设时间段,确定所述预设时间段内的所述备注信息。在本说明书的一个实施例中,所述采集模块70A可以根据所述时间跨度确定模块50A反馈的所述预设时间段,只发送所述预设时间段内的所述备注信息给所述确定模块10A。
进一步,所述用户可信度评估装置包括第一处理模块20A,对所述预设时间段内的所述备注信息进行处理,进而得到所述备注信息中的敏感词在所述预设时间段内的时序数据。
具体地,所述第一处理模块20A包括分词模块21A。所述分词模块21A根据所述敏感词库40A,对所述备注信息进行分词,获得所述敏感词。
也就是说,所述分词模块21A对所述备注信息进行分词,获得所述敏感词。对应地,所获得的所述敏感词也是所述预设时间段内的敏感词。例如,所述备注信息可以是“王中介”,利用分词技术,则可以将“王中介”分词为“王”和“中介”,其中如果“中介”在所述敏感词库40A中被设定为敏感词,则在此次分词中就获得敏感词“中介”。
具体地,所述分词模块21A可以采用基于规则的分词方法,按照一定的策略将待分词的汉字串与所述敏感词库40A中的词条进行匹配,若在词典中找到某个字符串,则匹配成功。
本领域技术人员应知晓,此处只是举例说明,并非限制,本领域技术人员还可以采用基于语义的分词方法,对自然语言自身的语言信息进行更多的处理,如扩充转移网络法、知识分词语义分析法等进而实现分词。或者,还可以基于统计的分词方法、基于理解的分词方法等等获得所述敏感词,本说明书并不限制
所述第一处理模块20A确定所述敏感词在所述预设时间段内的时序数据。在本说明书的一个实施例中,所述时序数据可以表现为数组。
举例说明,所述预设时间段的跨度为6个月,则分别统计在这6个月的时间窗口中其他用户对该用户的备注信息中标记了敏感词的所述时序数据。例如,当前月份为七月份,而在一月份时,其他用户均没有在备注信息中对该用户标记敏感词;在二月份时,有一个用户在备注信息中对该用户标记了敏感词;在三月份时又有三个用户在备注信息中对该用户创建了敏感词;在四月份时又新增有两个用户在备注信息中对该用户创建了敏感词;在5月份时又有一个用户在备注信息中对该用户创建了敏感词;在六月份时,没有用户在备注信息中均对该用户创建敏感词,则该用户在最近6个月被创建了敏感词的所述时序数据表示为(0,1,3,2,1,0),这个数组表示的是每个月创建的所述敏感词的数量。
进一步,根据所述时序数据,所述第一处理模块20A还可以分析出其他时序数据,例如所述敏感词在所述预设时间段内的命中频率或创建频率、在在命中所述敏感词的各个时间单位中符合预设条件的目标时间段、各个时间单位内所述敏感词命中数等。
以所述时序数据表示为(0,1,3,2,1,0)为例,这个数组表示的是每个月创建的备注信息中标记的所述敏感词的数量。
那么,该时序数据至少表达了三个信息:
第一,该用户最近一次被标记所述敏感词是在最近第二个月(即5月份);
第二,该用户在最近六个月内总共被标记敏感词7次;
第三,该用户在最近六个月中有4个月连续有新增的备注信息中标记了敏感词(即二、三、四、五月份连续4个月)。
对应地,第一个信息可以通过数组的最后一个数往前遍历,发现的第一个不为0的数字所对应的月份即为该用户最近一次被标记所述敏感词的月份。
对应地,第二个信息可以通过对数组中所有的数字相加所得。
对应地,第三个信息可以通过对数组的遍历数字,统计相邻两个0之间的数字个数获得。
本领域技术人员可得,本说明书此处只是举例说明,并不是限制,可以采用其他统计方法获得相应的信息。
所述第二处理模块30A对所述时序数据进行处理,获得用户的可信度。具体地,所述分析模块30A可以基于前述获得所述时序数据,利用逻辑回归或者PS-smart算法,获得表征用户可信度的分数值。一般情况下,所述分数值越高,则代表该用户可信度越低;数值越低,则代表该用户可信度越高。
例如,所述分数值可以是用0至1之间的数值。对应地,所述分数值为0.8的用户的可信度比所述分数值为0.5的用户的可信度低。
进一步,所述第二处理模块30A对比所述可信度和所述预设阈值,确定用户是否为黑户。所述黑用户是指信用度的用户。对应地,根据前文所述获得的可信度的对应分数值和预设阈值对比,即可对应地确定用户是否为黑用户。比如,所述预设阈值可以设定为0.5,则可信度对应分数值大于0.5的对应用户则为黑户,可信度对应分数值低于0.5的对应用户则不为黑户。
优选地,在本说明书的一个实施例中,所述敏感词库40A中的敏感词被划分为不同等级。例如,在贷款场景中,“贷款中介”被分为负面影响最轻的一级敏感词,而“老赖”被分为负面影响最重的三级敏感词。
对应地,所述第二处理模块20A所确定的所述时序数据反映根据时间变化,不同等级的所述敏感词的变化情况。这样,根据所述时序数据所确定的用户可信度的准确性更高,可以将用户的可信度进一步细致地划分和确定。
例如,可以根据所述时序数据,确定不同等级的所述敏感词分别在所述预设时间段内的命中频率;不同等级的所述敏感词分别在时间单位内的命中数的浮动。这样,所述第二处理模块30A再利用逻辑回归或者PS-smart算法计算这些信息,得到和表征用户可信度的分数值。
根据本说明书的另一个方面,本说明书还提供所述电子设备包括至少一个处理器及存储器,存储器存储有程序,并且被配置成由至少一个处理器执行以下步骤:
确定在预设时间段内与用户信息对应的备注信息;
对所述备注信息进行处理,确定所述备注信息中的敏感词在所述预设时间段内的时序数据;
对所述时序数据进行处理,获得所述用户信息所对应的用户的可信度。
基于同一发明构思,本说明书实施例还提供一种计算机可读存储介质,包括与电子设备结合使用的程序,程序可被处理器执行以完成以下步骤:
确定在预设时间段内与用户信息对应的备注信息;
对所述备注信息进行处理,确定所述备注信息中的敏感词在所述预设时间段内的时序数据;
对所述时序数据进行处理,获得所述用户信息所对应的用户的可信度。
根据本说明书的另一个方面,本说明书还提供所述电子设备包括至少一个处理器及存储器,存储器存储有程序,并且被配置成由至少一个处理器执行以下步骤:
确定在预设时间段内与用户信息对应的备注信息,其中所述备注信息来自于其他不同用户的通信录;
对所述备注信息进行处理,确定所述备注信息中的敏感词在所述预设时间段内的时序数据;
对所述时序数据进行处理,获得所述用户信息所对应的用户的可信度。
基于同一发明构思,本说明书实施例还提供一种计算机可读存储介质,包括与电子设备结合使用的程序,程序可被处理器执行以完成以下步骤:
确定在预设时间段内与用户信息对应的备注信息,其中所述备注信息来自于其他不同用户的通信录;
对所述备注信息进行处理,确定所述备注信息中的敏感词在所述预设时间段内的时序数据;
对所述时序数据进行处理,获得所述用户信息所对应的用户的可信度。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。