CN108881591B - 一种多平台信息推荐方法、装置及存储介质 - Google Patents
一种多平台信息推荐方法、装置及存储介质 Download PDFInfo
- Publication number
- CN108881591B CN108881591B CN201810553992.9A CN201810553992A CN108881591B CN 108881591 B CN108881591 B CN 108881591B CN 201810553992 A CN201810553992 A CN 201810553992A CN 108881591 B CN108881591 B CN 108881591B
- Authority
- CN
- China
- Prior art keywords
- platform
- determining
- information
- historical
- quality score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 79
- 238000012545 processing Methods 0.000 claims description 29
- 230000002159 abnormal effect Effects 0.000 claims description 17
- 238000004458 analytical method Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 21
- 238000004364 calculation method Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 230000009467 reduction Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 238000002372 labelling Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/57—Arrangements for indicating or recording the number of the calling subscriber at the called subscriber's set
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/57—Arrangements for indicating or recording the number of the calling subscriber at the called subscriber's set
- H04M1/575—Means for retrieving and displaying personal data about calling party
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种多平台信息推荐方法,包括:确定各平台的第一质量分数、第一号码在各平台的历史标记次数,以及分组平均标记次数;其中,每个平台的第一质量分数用于表征该平台的号码数量在各平台号码数量总和中的占比,以及表征用户对该平台的投诉程度;根据所述各平台的第一质量分数、所述分组平均标记次数,以及所述第一号码在各平台的历史标记次数,确定所述第一号码在各平台的投递加权分数;根据所述投递加权分数,从所述各平台中确定推荐平台,从所述推荐平台提供的所述第一号码的信息中选取信息,将所选取的信息确定为所述第一号码作为主叫号码时发送给被叫号码的信息。本发明还公开了一种多平台信息推荐装置、以及存储介质。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种多平台信息推荐方法、装置及存储介质。
背景技术
目前,在通话防骚扰提醒服务中,通信运营商号码库(以下简称号码库)可以对接多个外部平台,该外部平台作为第三方向号码库提供号码的信息。当号码库由这些外部平台汇入号码的信息后,通信运营商的后台服务器(以下简称后台服务器)会向被叫终端提供主叫号码的信息。
然而,当号码库从这些外部平台汇入号码的信息时,将出现同一号码的信息重复的问题。例如,某一号码同时在外部平台A、外部平台B和外部平台C均被标记,当后台服务器在提取该号码的信息时,将会向被叫终端提供该号码来自外部平台A、外部平台B和外部平台C的信息,进而造成同一号码的信息重复显示的问题。
另外,由于某一号码在各平台被标记的次数不同,导致标记次数较低的平台可能始终无法提供相应号码的信息,进而造成号码的信息筛选存在盲点、并且不平衡。甚至,如果某一号码本不是骚扰号码,但由于某一平台的系统错误造成该号码被标记为骚扰号码,当该平台上对该号码的标记次数远远大于其他平台时,可能后台服务器只会选择该平台的号码的信息,而无法推荐其他平台的号码的信息,以至于无法满足用户日益增长的使用需求,且相关技术中也没有提出其他比较完善的解决方案。
发明内容
有鉴于此,本发明实施例期望提供一种多平台信息推荐方法、装置及存储介质,至少用以解决相关技术中对多平台信息进行推荐的不准确的问题。
为达到上述目的,本发明实施例的技术方案是这样实现的:
第一方面,本发明实施例提供一种多平台信息推荐方法,所述方法包括:
确定各平台的第一质量分数、第一号码在各平台的历史标记次数,以及分组平均标记次数;其中,每个平台的第一质量分数用于表征该平台的号码数量在各平台号码数量总和中的占比,以及表征用户对该平台的投诉程度;
根据所述各平台的第一质量分数、所述分组平均标记次数,以及所述第一号码在各平台的历史标记次数,确定所述第一号码在各平台的投递加权分数;
根据所述投递加权分数,从所述各平台中确定推荐平台,从所述推荐平台提供的所述第一号码的信息中选取信息,将所选取的信息确定为所述第一号码作为主叫号码时发送给被叫号码的信息。
第二方面,本发明实施例还提供一种多平台信息推荐装置,所述装置包括:第一确定模块、第二确定模块和推荐模块;其中,
所述第一确定模块,用于确定各平台的第一质量分数、第一号码在各平台的历史标记次数,以及分组平均标记次数;其中,每个平台的第一质量分数用于表征该平台的号码数量在各平台号码数量总和中的占比,以及表征用户对该平台的投诉程度;
所述第二确定模块,用于根据所述各平台的第一质量分数、所述分组平均标记次数,以及所述第一号码在各平台的历史标记次数,确定所述第一号码在各平台的投递加权分数;
所述推荐模块,用于根据所述投递加权分数,从所述各平台中确定推荐平台,从所述推荐平台提供的所述第一号码的信息中选取信息,将所选取的信息确定为所述第一号码作为主叫号码时发送给被叫号码的信息。
第三方面,本发明实施例还提供一种存储介质,其上存储有可执行程序,所述可执行程序被处理器执行时实现本发明实施例提供的多平台信息推荐方法。
第四方面,本发明实施例还提供一种多平台信息推荐装置,包括存储器、处理器及存储在存储器上并能够由所述处理器运行的可执行程序,所述处理器运行所述可执行程序时执行本发明实施例提供的多平台信息推荐方法。
本发明实施例所提供的多平台信息推荐方法、装置及存储介质,将各平台的第一质量分数、分组平均标记次数,以及第一号码在各平台的历史标记次数共同作为确定第一号码在各平台的投递加权分数的依据,根据投递加权分数从各平台中确定待推荐的平台,以推荐该平台提供的第一号码的信息。如此,通过引入第一号码在各平台的投递加权分数,进而根据投递加权分数对多平台信息进行推荐,使得第一号码数据的筛选在各平台保持平衡,能够有效提升对多平台信息进行推荐的准确性,避免出现同一号码的信息重复显示的情况,进而抑制得到拥有大量平均标记次数但信息错误的平台所提供的第一号码的信息,可以满足用户日益增长的使用需求,大大提升用户体验。
附图说明
图1为本发明实施例提供的一种多平台信息推荐方法的实现流程示意图;
图2为本发明实施例提供的一种多平台信息推荐方法的具体实现流程示意图;
图3为本发明实施例提供的另一种多平台信息推荐方法的实现流程示意图;
图4为本发明实施例提供的一种多平台信息推荐方法的应用场景示意图;
图5为本发明实施例提供的一种多平台信息推荐装置的功能结构示意图;
图6为本发明实施例提供的另一种多平台信息推荐装置的功能结构示意图;
图7为本发明实施例提供的另一种多平台信息推荐装置的功能结构示意图;
图8为本发明实施例提供的另一种多平台信息推荐装置的功能结构示意图;
图9为本发明实施例提供的另一种多平台信息推荐装置的功能结构示意图;
图10为本发明实施例提供的一种多平台信息推荐装置的硬件结构示意图。
具体实施方式
为了能够更加详尽地了解本发明实施例的特点与技术内容,下面结合附图对本发明实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本发明。
图1为本发明实施例提供的一种多平台信息推荐方法的实现流程示意图,该多平台信息推荐方法可应用于服务器中;如图1所示,本发明实施例中的多平台信息推荐方法的实现流程,可以包括以下步骤:
步骤101:确定各平台的第一质量分数、第一号码在各平台的历史标记次数,以及分组平均标记次数;其中,每个平台的第一质量分数用于表征该平台的号码数量在各平台号码数量总和中的占比,以及表征用户对该平台的投诉程度。
这里,所述分组平均标记次数用于表征所述第一号码在各平台的所属分组的分组平均标记次数。所述用户对该平台的投诉程度的高低与该平台的第一质量分数的大小负相关;也就是说,用户对该平台的投诉程度越高,则表示该平台的第一质量分数越小,反之,用户对该平台的投诉程度越低,则表示该平台的第一质量分数越大。
在本发明实施例中,在本步骤101中确定各平台的第一质量分数之前,所述方法还包括:通过第一接口接收各平台的号码数据;对所述号码数据进行文本处理,得到各平台上各号码的历史标记次数、所述第一号码的标记类型信息或号码数量;其中,所述标记类型信息为推荐平台提供的所述第一号码的信息。
这里,所述标记类型信息可以包括但不限于诈骗电话的标记信息、房产中介的标记信息和广告推销的标记信息等。所述第一接口可为应用程序编程接口(API,ApplicationProgramming Interface);也就是说,包含号码库的服务器能够经由API端口接收来自平台的号码数据,并将所接收到的号码数据存储于号码库。其中,API端口与平台可以是一一对应的关系,即经由多个API端口接收来自多个平台的号码数据;当然,API端口与平台也可以是一对多的关系,即经由一个API端口接收来自多个平台的号码数据,本发明实施例在此不做具体限定。
这里,在接收到各平台的号码数据之后,服务器将通过文本分析的方式对所接收的号码数据的字段内容进行文本处理。其中,文本分析是指对文本的表示及其特征项的提取,即从所接收的号码数据的字段内容中抽取出特征词进行量化以表示文本信息。这里的文本信息是具有一定的符号或符码组成的信息结构体,这种信息结构体可采用不同的表现形态,例如语音、文字、影像等各种形态进行表示。
需要说明的是,可将各平台上各号码的历史标记次数、所述第一号码的标记类型信息或号码数量登载记录至号码库的记录表中。其中,记录表中还可以记录号码数据的来源信息、号码数据入库的时间、号码数据更新的时间以及号码数据是否有效等信息。
需要指出,同一号码可能涉及到提供信息的多个平台,例如,号码182****5678在平台A和平台B上均提供有该号码的信息。
在本发明实施例中,对于本步骤101中确定各平台的第一质量分数来说,可以采用以下方式实现:根据采集的各平台的号码数量,确定各平台的第一质量分数。具体来说,所述根据采集的各平台的号码数量,确定各平台的第一质量分数,可以采用如下方式实现:确定各平台的号码数量,得到号码总数量;根据第一平台的号码数量与所述号码总数量的关系,得到所述第一平台的第一质量分数。
这里,所述第一平台的第一质量分数是不断更新的,具体地,可以是按照每月进行更新,也可以是根据最近一段时间内的记录进行更新。在本发明实施例中,对于所述第一平台的第一质量分数的确定方式来说,可以采用以下方式实现:根据所述第一平台的号码数量与所述号码总数量的比值,得到第一计算结果,根据第一计算结果与预设数值的乘积,获得所述第一平台的第一质量分数。
举例来说,假设预设数值为100,号码库中包括平台A和平台B提供的号码的信息,其中,平台A提供了4000个号码数据,平台B提供了6000个号码数据,那么,该号码库中包括的号码总数量为10000个,则平台A的第一质量分数为(4000/10000)*100=40分,平台B的第一质量分数为(6000/10000)*100=60分。
需要说明的是,针对第一平台以外的其他平台而言,均可采用上述确定第一平台的第一质量分数的类似方式来计算第一平台之外的其他平台的第一质量分数,这里不再赘述。
在本发明实施例中,对于本步骤101中确定分组平均标记次数来说,可以采用如下方式实现:根据所述第一号码在各平台的历史标记次数,确定所述第一号码在各平台的所属分组;根据所述第一号码在各平台的所属分组所包含的所述第二号码的数量、以及所述第二号码的标记总次数,确定所述第一号码在各平台的所属分组的分组平均标记次数。
这里,在确定所述第一号码在各平台的所属分组之前,所述方法还包括:获取第一平台上的各号码的历史标记次数;根据第一平台上的各号码的历史标记次数,确定至少一个分组的阈值范围。
对于根据第一号码在各平台的历史标记次数,确定所述第一号码在各平台的所属分组来说,可以采用以下方式实现:首先,确定所述第一号码在第一平台的历史标记次数所在阈值范围;然后,根据所述阈值范围确定所述第一号码在所述第一平台的所属分组。
这里,确定第一号码在第一平台的所属分组实质上是对第一平台的号码进行聚类处理,例如基于划分(K-means)的均值聚类算法对第一平台中的号码进行分类标记处理。举例来说,假设K=3,则可划分成三个分组,确定每个分组的阈值范围;然后,确定第一号码在第一平台的历史标记次数落入到上述三个分组的阈值范围中的哪一个阈值范围;最后,根据所落入的阈值范围即可确定第一号码在第一平台的所属分组。
其中,每个分组的阈值范围的大小可根据第一平台的号码数量进行设定,也可根据实际情况进行设定,也就是说,每个分组的阈值范围可以设定成统一的相同大小,也可以设定成不同大小,这里不做限定。
在本发明实施例中,在所述根据第一平台上的各号码的历史标记次数,确定至少一个分组的阈值范围之前,所述方法还包括:将所述第一平台上的号码的历史标记次数小于第一阈值的号码作为噪音号码,其中,所述第一号码的历史标记次数不小于所述第一阈值;在所述第一平台的号码中删除所述噪音号码,得到所述第一平台上的第三号码。
所述根据第一平台上的各号码的历史标记次数,确定至少一个分组的阈值范围,具体可以包括:根据所述第一平台上的第三号码的历史标记次数确定至少一个分组的阈值范围。
这里,可通过对第一平台上的号码的历史标记次数与第一阈值进行比较,根据比较结果确定噪音号码,对第一平台上的号码进行降噪处理,即将噪音号码从第一平台的号码中去除掉,以得到精确的第三号码,用于提升确定至少一个分组的阈值范围的准确性。
这里,可采用以下公式计算第一号码在各平台的所属分组的分组平均标记次数:分组平均标记次数=第二号码的标记总次数/第一号码在第一平台的所属分组所包含的第二号码的数量。举例来说,假设根据第一平台上的各号码的历史标记次数,将平台A分成三个分组:A1组、A2组和A3组,且确定第一号码落入到平台A的A1组中,该A1组中所包含的号码数量为40个,并且A1组中这40个号码被标记的总次数为2080次,则分组平均标记次数=2080/40=52(次/每个号码)。根据以上描述可见,第二号码包含第一号码。
步骤102:根据所述各平台的第一质量分数、所述分组平均标记次数,以及所述第一号码在各平台的历史标记次数,确定所述第一号码在各平台的投递加权分数。
步骤103:根据所述投递加权分数,从所述各平台中确定推荐平台,从所述推荐平台提供的所述第一号码的信息中选取信息,将所选取的信息确定为所述第一号码作为主叫号码时发送给被叫号码的信息。
在本发明实施例中,以平台为第一平台为例,说明确定第一号码在各平台的投递加权分数的实现方式,可采用以下公式计算第一号码在第一平台的投递加权分数:投递加权分数=第一平台的第一质量分数*(第一号码在第一平台的历史标记次数/第一号码在第一平台的所属分组的分组平均标记次数)。
需要说明的是,针对第一平台以外的其他平台而言,均可采用上述计算第一号码在第一平台的投递加权分数的类似方式来计算第一号码在其他平台的投递加权分数,这里不再赘述。
这里,可以根据确定的多来源平台的投递加权分数,选取符合设定条件的推荐平台,优先提示符合设定条件的推荐平台所提供的第一号码的信息。其中,所述符合设定条件的推荐平台可为第一号码对应投递加权分数最高的平台。
在本发明实施例中,在本步骤102中确定所述第一号码在各平台的投递加权分数之前,所述方法还包括:
确定所述第一号码在第一平台上设定时间内的异常标记次数大于第二阈值时,对所述第一质量分数进行修正,将修正后的第一质量分数作为所述第一平台的第一质量分数;或者,
确定所述第一号码所在的第一平台中的各号码在设定时间内的异常标记次数大于第三阈值时,对所述第一质量分数进行修正,将修正后的第一质量分数作为所述第一平台的第一质量分数。
这里,可采用第一号码在第一平台上设定时间内的异常标记次数,或者第一号码所在的第一平台中的各号码在设定时间内的异常标记次数中的任意一种方式,来表示第一平台在设定时间段内被用户投诉的次数。本发明实施例针对用户对各平台提供的信息的投诉情况来说,可以对该平台的质量分数进行实时更新,即适应性降低该平台的质量分数,以减小对投递加权分数的计算结果的影响,从而保证多平台信息推荐的准确度。
采用本发明实施例的技术方案,引入第一号码在各平台的投递加权分数,进而根据投递加权分数对多平台信息进行推荐,使得第一号码数据的筛选在各平台保持平衡,能够有效提升对多平台信息进行推荐的准确性,避免出现同一号码的信息重复显示的情况,进而抑制得到拥有大量平均标记次数但信息错误的平台所提供的第一号码的信息。
图2为本发明实施例提供的一种多平台信息推荐方法的具体实现流程示意图,所述多平台信息推荐方法可应用于服务器例如云服务器中;如图2所示,本发明实施例中的多平台信息推荐方法的具体实现流程,可以包括如下步骤:
步骤201:经由多个第一接口接收来自多个平台的号码数据。
在本发明实施例中,所述第一接口可为API端口,即经由多个API端口接收来自多个平台的号码数据。当然,API端口与平台之间也可以是一对多的关系,即经由一个API端口接收来自多个平台的号码数据。
步骤202:通过文本分析对接收到的号码数据的字段内容进行文本处理。
这里,所述对号码数据的字段内容进行文本处理,也就是从接收的号码数据的字段内容中抽取出特征词进行量化以表示文本信息。这里的文本信息是具有一定的符号或符码组成的信息结构体,这种信息结构体可采用不同的表现形态,例如语音、文字、影像等各种形态进行表示。
步骤203:将文本处理后得到的信息登载记录至记录表中。
这里,所述文本处理后得到的信息可以包括:各平台上各号码的历史标记次数、第一号码的标记类型信息或号码数量。其中,所述标记类型信息为所述推荐平台提供的第一号码的信息。所述标记类型信息可以包括但不限于诈骗电话的标记信息、房产中介的标记信息和广告推销的标记信息等。
需要指出,记录表中所存储的通过文本处理后得到的信息还可以包括:号码数据的来源信息、号码数据入库的时间、号码数据更新的时间以及号码数据是否有效等信息。
步骤204:根据记录表获得每个号码数据涉及到提供信息的平台。
在本发明实施例中,同一号码可能涉及到提供信息的多个平台,例如,号码182****5678在平台A、平台B、平台C上均提供有该号码的信息。
步骤205:计算各个平台的初始质量分数。
这里,可根据采集的提供信息的平台的号码数量,计算各个平台的初始质量分数。具体地,首先,根据各平台提供的号码数量计算号码库中的号码总数量,然后,根据第一平台的号码数量与号码库中的号码总数量的关系,得到第一平台的初始质量分数。其中,所述第一平台的初始质量分数是不断更新的,具体地,可以是按照每月进行更新,也可以是根据最近一段时间内的记录进行更新。
需要说明的是,针对第一平台以外的其他平台而言,均可采用上述确定第一平台的初始质量分数的方式来计算其他平台的初始质量分数,这里不再赘述。
步骤206:判断第一号码所在的平台的用户投诉次数在设定时间内是否超过第一阈值,若是,则执行步骤207,否则执行步骤208。
步骤207:降低该平台的初始质量分数。
这里,在面对用户对各平台提供的信息进行投诉的情况下,当判断出第一号码所在的平台的用户投诉次数在设定时间内超过第一阈值时,则表明需要对第一平台的初始质量分数进行修正,将修正后的质量分数作为第一平台的更新质量分数。这样,可以减小后续对投递加权分数的计算结果的影响,从而保证多平台信息推荐的准确度。
步骤208:去除各个平台上号码的历史标记次数小于第二阈值的号码数据,得到该平台上降噪后的号码数据。
这里,通过对第一平台上的号码的历史标记次数与第二阈值进行比较,根据比较结果确定噪音号码,噪音号码将在一定程度上影响该平台中号码的分组情况,因此,将噪音号码从第一平台的号码中去除掉,得到该平台上降噪后的号码数据。可见,对第一平台上的号码进行降噪处理,可以提升确定至少一个分组的阈值范围的准确性,具有实际意义。
步骤209:根据该平台上降噪后的号码数据的历史标记次数,对该平台的号码进行分组。
首先,根据该平台上降噪后的号码数据的历史标记次数,确定至少一个分组的阈值范围,其次,确定第一号码在第一平台的历史标记次数所在阈值范围,最后,根据阈值范围确定第一号码在第一平台的所属分组。
需要说明的是,可基于K-means的均值聚类算法对第一平台的号码进行分类标记处理。其中,每个分组的阈值范围的大小可根据第一平台的号码数量进行设定,也可根据实际情况进行设定,也就是说,每个分组的阈值范围可以设定成统一的相同大小,也可以设定成不同大小,这里不做具体限定。
步骤210:计算各个平台中包含的各个分组的分组平均标记次数。
这里,可采用以下公式计算第一号码在各平台的所属分组的分组平均标记次数:分组平均标记次数=第二号码的标记总次数/第一号码在第一平台的所属分组所包含的第二号码的数量。
步骤211:计算各个平台除噪后号码数据的投递加权分数。
在本发明实施例中,可采用以下公式计算第一号码在第一平台的投递加权分数:投递加权分数=第一平台的第一质量分数*(第一号码在第一平台的历史标记次数/第一号码在第一平台的所属分组的分组平均标记次数)。
步骤212:将第一号码所涉及的各平台的投递加权分数记录至记录表中。
步骤213:当接收到第一号码作为主叫号码的查询号码信息的请求时,推荐投递加权分数最高的推荐平台提供的第一号码的信息。
图3为本发明实施例提供的另一种多平台信息推荐方法的实现流程示意图,该多平台信息推荐方法可以应用于对每次接收到的来电号码进行实时判别后再推荐的场景,该多平台信息推荐方法可应用于服务器例如云服务器中;如图3所示,本发明实施例中的多平台信息推荐方法的实现流程,可以包括如下步骤:
步骤301:接收到呼叫时,根据来电号码在各平台的当前标记次数确定所述来电号码在各平台的所属分组。
在本发明实施例中,在本步骤301中根据来电号码在各平台的当前标记次数确定所述来电号码在各平台的所属分组之前,所述方法还包括:确定各平台的第一质量分数,具体来说,可以根据采集的各平台的号码数量,确定各平台的第一质量分数。
下面说明确定各平台的第一质量分数的实现方式:确定各平台的号码数量,得到号码总数量;根据第一平台的号码数量与所述号码总数量的关系,得到所述第一平台的第一质量分数。具体地,先根据所述第一平台的号码数量与所述号码总数量的比值,得到第一计算结果,然后,根据第一计算结果与预设数值的乘积,获得所述第一平台的第一质量分数。
在本发明实施例中,在所述确定各平台的第一质量分数之前,所述方法还包括:通过第一接口接收各平台的号码数据;对所述号码数据进行文本处理,得到各平台上各号码的历史标记次数、所述来电号码的标记类型信息或号码数量;其中,所述标记类型信息为所述推荐平台提供的所述来电号码的信息。
这里,所述标记类型信息可以包括但不限于诈骗电话的标记信息、房产中介的标记信息和广告推销的标记信息等。所述第一接口可为API端口,即包含号码库的服务器可经由API端口接收来自平台的号码数据,并将所接收到的号码数据存储于号码库。其中,API端口与平台之间可以是一一对应的关系,即经由多个API端口接收来自多个平台的号码数据;当然,API端口与平台之间也可以是一对多的关系,即经由一个API端口接收来自多个平台的号码数据,本发明实施例在此不做具体限定。
需要说明的是,可将各平台上各号码的历史标记次数、所述来电号码的标记类型信息或号码数量登载记录至号码库的记录表中。其中,记录表中还可以记录号码数据的来源信息、号码数据入库的时间、号码数据更新的时间以及号码数据是否有效等信息。
步骤302:根据所述来电号码在各平台的所属分组所包含的第一号码的数量、以及所述第一号码的标记总次数,确定所述来电号码在各平台的所属分组的分组平均标记次数。
在本发明实施例中,在本步骤302中确定所述来电号码在各平台的所属分组的分组平均标记次数之前,所述方法还包括:根据来电号码在各平台的历史标记次数,确定所述来电号码在各平台的所属分组。
其中,在确定所述来电号码在各平台的所属分组之前,所述方法还包括:获取第一平台上的各号码的历史标记次数;根据第一平台上的各号码的历史标记次数,确定至少一个分组的阈值范围。
这里,对于根据来电号码在各平台的历史标记次数,确定所述来电号码在各平台的所属分组来说,可以采用以下方式实现:首先,确定所述来电号码在第一平台的历史标记次数所在阈值范围,然后,根据所述阈值范围确定所述来电号码在所述第一平台的所属分组。
需要指出,确定来电号码在第一平台的所属分组实质上是对第一平台的号码进行聚类处理,例如基于K-means的均值聚类算法对第一平台中的号码进行分类标记。举例来说,假设K=3,则可划分成三个分组,确定每个分组的阈值范围;然后,确定来电号码在第一平台的历史标记次数落入到上述三个分组的阈值范围中的哪一个阈值范围;最后,根据所落入的阈值范围即可确定来电号码在第一平台的所属分组。
在本发明实施例中,在所述根据第一平台上的各号码的历史标记次数,确定至少一个分组的阈值范围之前,所述方法还包括:将所述第一平台上的号码的历史标记次数小于第一阈值的号码作为噪音号码,其中,所述来电号码的历史标记次数不小于所述第一阈值;在所述第一平台的号码中删除所述噪音号码,得到所述第一平台上的第二号码。相应地,所述根据第一平台上的各号码的历史标记次数,确定至少一个分组的阈值范围,具体可以包括:根据所述第一平台上的第二号码的历史标记次数确定至少一个分组的阈值范围。
在本发明实施例中,对于确定所述来电号码在各平台的所属分组的分组平均标记次数而言,可采用以下公式计算:分组平均标记次数=第一号码的标记总次数/来电号码在第一平台的所属分组所包含的第一号码的数量。举例来说,假设根据第一平台上的各号码的历史标记次数,将平台A分成三个分组:A1组、A2组和A3组,且确定来电号码落入到平台A的A1组中,该A1组中所包含的号码数量为40个,并且A1组中这40个号码被标记的总次数为2080次,则分组平均标记次数=2080/40=52(次/每个号码)。根据以上描述可见,第二号码包含第一号码。
步骤303:根据各平台的第一质量分数、所述分组平均标记次数和所述当前标记次数,确定所述来电号码在各平台的投递加权分数。
在本发明实施例中,在本步骤303中确定所述来电号码在各平台的投递加权分数之前,所述方法还包括:确定所述来电号码在第一平台上设定时间内的异常标记次数大于第二阈值时,对所述第一质量分数进行修正,将修正后的第一质量分数作为所述第一平台的第一质量分数;或者,
确定所述来电号码所在的第一平台中的各号码在设定时间内的异常标记次数大于第三阈值时,对所述第一质量分数进行修正,将修正后的第一质量分数作为所述第一平台的第一质量分数。
这里,可采用来电号码在第一平台上设定时间内的异常标记次数,或者来电号码所在的第一平台中的各号码在设定时间内的异常标记次数中的任意一种方式,来表示第一平台在设定时间段内被用户投诉的次数。本发明实施例针对用户对各平台提供的信息的投诉情况来说,可以对该平台的质量分数进行实时更新,即适应性降低该平台的质量分数,以减小对投递加权分数的计算结果的影响,从而保证多平台信息推荐的准确度。
在本发明实施例中,以平台为第一平台为例,说明确定来电号码在各平台的投递加权分数的实现方式,可采用以下公式计算来电号码在第一平台的投递加权分数:投递加权分数=第一平台的第一质量分数*(来电号码在第一平台的历史标记次数/来电号码在第一平台的所属分组的分组平均标记次数)。
针对第一平台以外的其他平台而言,均可采用上述计算来电号码在第一平台的投递加权分数的类似方式来计算来电号码在其他平台的投递加权分数,这里不再赘述。
步骤304:根据所述投递加权分数确定推荐平台,推荐所述推荐平台提供的所述来电号码的信息。
在本发明实施例中,可以根据确定的多来源平台的投递加权分数,选取符合设定条件的推荐平台,优先推荐符合设定条件的推荐平台所提供的来电号码的信息。其中,所述符合设定条件的推荐平台可为来电号码所在的投递加权分数最高的平台。
下面以一个具体示例对本发明实施例提供的多平台信息推荐方法进行说明。
图4为本发明实施例提供的一种多平台信息推荐方法的应用场景示意图,如图4所示,首先,包含号码库的服务器经由API端口1接收来自外部平台A的号码数据,经由API端口2接收来自外部平台B的号码数据,其中,外部平台A提供了4000个号码数据,外部平台B提供了6000个号码数据,可见,该号码库中包括的号码总数量为10000个。在服务器接收到外部平台A和外部平台B的号码数据之后,服务器通过文本分析对所接收的号码数据的字段内容进行文本处理,以将号码数据中的文字内容解析出来,并将解析出来的各项信息记录至号码库的记录表中。根据记录表中的内容获得每一个号码数据涉及到提供信息的外部平台,例如,确定出号码182****5678在平台A和平台B上均提供有该号码的信息。
其次,服务器计算该号码涉及到的平台A和平台B的初始质量分数。根据前述涉及的初始质量分数的计算公式,即可计算出平台A的初始质量分数为(4000/10000)*100,即40分;平台B的初始质量分数为(6000/10000)*100,即60分。在获得各平台的初始质量分数之后,会判断该号码在平台A和平台B上设定时间内的异常标记次数是否超过第一阈值,以第一阈值为100为例,假设判断出该号码在平台A上设定时间内的异常标记次数未超过100次,则平台A的初始质量分数不发生变化;若判断出该号码在平台B上设定时间内的异常标记次数超过100次,则降低平台B的初始质量分数,比如将平台B的初始质量分数由60将为55。这里,导致出现异常标记的情况可能是非诈骗电话却提供为诈骗电话的标记,或是广告电话却未提供对应的提示等。
接下来,服务器对各个平台的号码数据进行降噪处理,即将各个平台上的号码的历史标记次数小于第二阈值的号码数据删除,假设第二阈值为20,则降噪后的号码数据为各个平台上的号码的历史标记次数大于等于20的号码数据,然后,采用K均值算法对各个平台降噪后的号码数据进行分组。在应用场景中,平台A提供了4000个号码,删除历史标记次数小于20次的号码数据,设定K=3,分成3个分组,则A1组(标记次数为:20-100的号码数据),A2组(标记次数为:101-500的号码数据),A3组(标记次数为:501以上的号码数据);平台B提供了6000个号码,删除历史标记次数小于20次的号码数据,分成3个分组,则B1组(标记次数为:20-500的号码数据),B2组(标记次数为:501-1000的号码数据),B3组(标记次数为:1001以上的号码数据)。
再者,在对各个平台的号码数据进行除噪与分组后,则服务器进一步计算该号码在各平台的所属分组的分组平均标记次数。例如,在平台A中,40个号码被分到A1组,且A1组中40个号码的标记总次数为2080次,则分组平均标记次数为52(次/每个号码);在平台B中,220个号码被分到B1组,且B1组中220个号码的标记总次数为70400次,则分组平均标记次数为320(次/每个号码)。
最后,服务器计算该号码在各平台的投递加权分数。例如,号码182****5678在平台A被标记60次,在分组中被分入到平台A的A1组,则此号码在平台A的投递加权分数为40*(60/52)=46.12。号码182****5678在平台B被标记260次,在分组中被分入到B1组,则此号码在平台B的投递加权分数为60*(260/320)=48.75。然而,若由于平台B的投诉情况较高,将影响平台B的初始质量分数,则此时该号码在平台B的投递加权分数为55*(260/320)=44.6875。在服务器计算完成号码182****5678在各平台的投递加权分数之后,再将该号码对应各个平台的投递加权分数重新填入数据库的栏位中。例如号码182****5678同时有平台A与平台B提供的号码信息,则当用户接收到号码182****5678的来电时,客户端向号码库发送查询请求,请求获取推荐平台,由于平台A的投递加权分数46.12,大于平台B的投递加权分数44.6875,因此,将向客户端推荐平台A提供的号码182****5678的信息。
为了实现上述多平台信息推荐方法,本发明实施例还提供了一种多平台信息推荐装置,该多平台信息推荐装置可以应用于服务器中,图5为本发明实施例提供的一种多平台信息推荐装置的功能结构示意图;如图5所示,所述多平台信息推荐装置可以包括第一确定模块51、第二确定模块52和推荐模块53。下面对各程序模块进行详细说明。其中,
所述第一确定模块51,用于确定各平台的第一质量分数、第一号码在各平台的历史标记次数,以及分组平均标记次数;其中,每个平台的第一质量分数用于表征该平台的号码数量在各平台号码数量总和中的占比,以及表征用户对该平台的投诉程度。
所述第二确定模块52,用于根据所述各平台的第一质量分数、所述分组平均标记次数,以及所述第一号码在各平台的历史标记次数,确定所述第一号码在各平台的投递加权分数。
所述推荐模块53,用于根据所述投递加权分数,从所述各平台中确定推荐平台,从所述推荐平台提供的所述第一号码的信息中选取信息,将所选取的信息确定为所述第一号码作为主叫号码时发送给被叫号码的信息。
在本发明实施例中,对于所述第一确定模块51确定各平台的第一质量分数来说,可以采用如下方式实现:根据采集的各平台的号码数量,确定各平台的第一质量分数;其中,对于根据采集的各平台的号码数量,确定各平台的第一质量分数来说,具体可以采用如下方式实现:确定各平台的号码数量,得到号码总数量;根据第一平台的号码数量与所述号码总数量的关系,得到所述第一平台的第一质量分数。
在本发明实施例中,对于所述第一确定模块51确定分组平均标记次数来说,可以采用如下方式实现:根据所述第一号码在各平台的历史标记次数,确定所述第一号码在各平台的所属分组;根据所述第一号码在各平台的所属分组所包含的所述第二号码的数量、以及所述第二号码的标记总次数,确定所述第一号码在各平台的所属分组的分组平均标记次数。
作为一种实施方式,图6为本发明实施例提供的另一种多平台信息推荐装置的功能结构示意图;如图6所示,所述装置还包括:第一获取模块54,用于在所述第一确定模块51在根据所述第一号码在各平台的历史标记次数,确定所述第一号码在各平台的所属分组之前,获取第一平台上的各号码的历史标记次数;
第三确定模块55,用于根据所述第一平台上的各号码的历史标记次数,确定至少一个分组的阈值范围。
其中,对于根据第一号码在各平台的历史标记次数,确定所述第一号码在各平台的所属分组来说,可以采用如下方式实现:确定所述第一号码在第一平台的历史标记次数所在阈值范围,根据所述阈值范围确定所述第一号码在所述第一平台的所属分组。
作为另一种实施方式,图7为本发明实施例提供的另一种多平台信息推荐装置的功能结构示意图;如图7所示,所述装置还包括:第四确定模块56,用于在所述第三确定模块55根据所述第一平台上的各号码的历史标记次数,确定至少一个分组的阈值范围之前,将所述第一平台上的号码的历史标记次数小于第一阈值的号码作为噪音号码,其中,所述第一号码的历史标记次数不小于所述第一阈值;在所述第一平台的号码中删除所述噪音号码,得到所述第一平台上的第三号码。
在本实施例中,对于所述第三确定模块55根据所述第一平台上的各号码的历史标记次数,确定至少一个分组的阈值范围来说,可以采用如下方式实现:根据所述第一平台上的第三号码的历史标记次数确定至少一个分组的阈值范围。
作为另一种实施方式,图8为本发明实施例提供的另一种多平台信息推荐装置的功能结构示意图;如图8所示,所述装置还包括:更新模块57,用于在所述第二确定模块52根据所述各平台的第一质量分数、所述分组平均标记次数,以及所述第一号码在各平台的历史标记次数,确定所述第一号码在各平台的投递加权分数之前,确定所述第一号码在第一平台上设定时间内的异常标记次数大于第二阈值时,对所述第一质量分数进行修正,将修正后的第一质量分数作为所述第一平台的第一质量分数;或者,
确定所述第一号码所在的第一平台中的各号码在设定时间内的异常标记次数大于第三阈值时,对所述第一质量分数进行修正,将修正后的第一质量分数作为所述第一平台的第一质量分数。
作为另一种实施方式,图9为本发明实施例提供的另一种多平台信息推荐装置的功能结构示意图;如图9所示,所述装置还包括:第二获取模块58,用于在所述第一确定模块51确定各平台的第一质量分数之前,通过第一接口接收各平台的号码数据;
分析处理模块59,用于对所述号码数据进行文本处理,得到各平台上各号码的历史标记次数、所述第一号码的标记类型信息或号码数量;
其中,所述标记类型信息为所述推荐平台提供的所述第一号码的信息。
所述标记类型信息可以包括但不限于诈骗电话的标记信息、房产中介的标记信息和广告推销的标记信息等。
需要说明的是:上述实施例提供的多平台信息推荐装置在对多平台信息进行推荐时,仅以上述各程序模块的划分进行举例说明,在实际应用中,可以根据需要而将上述处理分配由不同的程序模块完成,即将多平台信息推荐装置的内部结构划分成不同的程序模块,以完成以上描述的全部或者部分处理。另外,上述实施例提供的多平台信息推荐装置与多平台信息推荐方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再详细赘述。
在实际应用中,所述多平台信息推荐装置中的第一确定模块51、第二确定模块52、推荐模块53、第三确定模块55、第四确定模块56、更新模块57和分析处理模块59均可由服务器上的中央处理器(CPU,Central Processing Unit)、微处理器(MPU,Micro ProcessorUnit)、数字信号处理器(DSP,Digital Signal Processor)、或现场可编程门阵列(FPGA,Field Programmable Gate Array)等实现;所述多平台信息推荐装置中的第一获取模块54和第二获取模块58,在实际应用中可通过通信模组(包含:基础通信套件、操作系统、通信模块、标准化接口和协议等)及收发天线实现。
为了实现上述多平台信息推荐方法,本发明实施例还提供了一种多平台信息推荐装置的硬件结构。现在将参考附图描述实现本发明实施例的多平台信息推荐装置的硬件结构,所述多平台信息推荐装置可以以各种类型的服务器如云服务器的形式来实施。下面对本发明实施例的多平台信息推荐装置的硬件结构做进一步说明,可以理解,图10仅仅示出了多平台信息推荐装置的示例性结构而非全部结构,根据需要可以实施图10示出的部分结构或全部结构。
参见图10,图10为本发明实施例提供的一种多平台信息推荐装置的硬件结构示意图,实际应用中可以应用于前述运行应用程序的各种类型的服务器如云服务器中,图10所示的多平台信息推荐装置1000包括:至少一个处理器1001、存储器1002、用户接口1003和至少一个网络接口1004。所述多平台信息推荐装置1000中的各个组件通过总线系统1005耦合在一起。可以理解,总线系统1005用于实现这些组件之间的连接通信。总线系统1005除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图10中将各种总线都标为总线系统1005。
其中,用户接口1003可以包括显示器、键盘、鼠标、轨迹球、点击轮、按键、按钮、触感板或者触摸屏等。
可以理解,存储器1002可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。
本发明实施例中的存储器1002用于存储各种类型的数据以支持多平台信息推荐装置1000的操作。这些数据的示例包括:用于在多平台信息推荐装置1000上操作的任何计算机程序,如可执行程序10021和操作系统10022,实现本发明实施例的多平台信息推荐方法的程序可以包含在可执行程序10021中。
本发明实施例揭示的多平台信息推荐方法可以应用于处理器1001中,或者由处理器1001实现。处理器1001可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述多平台信息推荐方法的各步骤可以通过处理器1001中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1001可以是通用处理器、DSP,或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器1001可以实现或者执行本发明实施例提供的多平台信息推荐方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本发明实施例所提供的多平台信息推荐方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器1002,处理器1001读取存储器1002中的信息,结合其硬件完成本发明实施例提供的多平台信息推荐方法的步骤。
在本发明实施例中,所述多平台信息推荐装置1000包括存储器1002、处理器1001及存储在存储器1002上并能够由所述处理器1001运行的可执行程序10021,所述处理器1001运行所述可执行程序10021时实现:确定各平台的第一质量分数、第一号码在各平台的历史标记次数,以及分组平均标记次数;其中,每个平台的第一质量分数用于表征该平台的号码数量在各平台号码数量总和中的占比,以及表征用户对该平台的投诉程度;根据所述各平台的第一质量分数、所述分组平均标记次数,以及所述第一号码在各平台的历史标记次数,确定所述第一号码在各平台的投递加权分数;根据所述投递加权分数,从所述各平台中确定推荐平台,从所述推荐平台提供的所述第一号码的信息中选取信息,将所选取的信息确定为所述第一号码作为主叫号码时发送给被叫号码的信息。
作为一种实施方式,所述处理器1001运行所述可执行程序10021时实现:根据采集的各平台的号码数量,确定各平台的第一质量分数。
作为一种实施方式,所述处理器1001运行所述可执行程序10021时实现:确定各平台的号码数量,得到号码总数量;根据第一平台的号码数量与所述号码总数量的关系,得到所述第一平台的第一质量分数。
作为一种实施方式,所述处理器1001运行所述可执行程序10021时实现:根据所述第一号码在各平台的历史标记次数,确定所述第一号码在各平台的所属分组;根据所述第一号码在各平台的所属分组所包含的所述第二号码的数量、以及所述第二号码的标记总次数,确定所述第一号码在各平台的所属分组的分组平均标记次数。
作为一种实施方式,所述处理器1001运行所述可执行程序10021时实现:在所述根据所述第一号码在各平台的历史标记次数,确定所述第一号码在各平台的所属分组之前,获取第一平台上的各号码的历史标记次数;根据所述第一平台上的各号码的历史标记次数,确定至少一个分组的阈值范围;确定所述第一号码在第一平台的历史标记次数所在阈值范围,根据所述阈值范围确定所述第一号码在所述第一平台的所属分组。
作为一种实施方式,所述处理器1001运行所述可执行程序10021时实现:在所述根据所述第一平台上的各号码的历史标记次数,确定至少一个分组的阈值范围之前,将所述第一平台上的号码的历史标记次数小于第一阈值的号码作为噪音号码;在所述第一平台的号码中删除所述噪音号码,得到所述第一平台上的第三号码;根据所述第一平台上的第三号码的历史标记次数确定至少一个分组的阈值范围。
作为一种实施方式,所述处理器1001运行所述可执行程序10021时实现:在所述根据各平台的第一质量分数、所述分组平均标记次数,以及所述第一号码在各平台的历史标记次数,确定所述第一号码在各平台的投递加权分数之前,确定所述第一号码在第一平台上设定时间内的异常标记次数大于第二阈值时,对所述第一质量分数进行修正,将修正后的第一质量分数作为所述第一平台的第一质量分数;或者,确定所述第一号码所在的第一平台中的各号码在设定时间内的异常标记次数大于第三阈值时,对所述第一质量分数进行修正,将修正后的第一质量分数作为所述第一平台的第一质量分数。
作为一种实施方式,所述处理器1001运行所述可执行程序10021时实现:在所述根据采集的各平台的号码数量,确定各平台的第一质量分数之前,通过第一接口接收各平台的号码数据;对所述号码数据进行文本处理,得到各平台上各号码的历史标记次数、所述第一号码的标记类型信息或号码数量;其中,所述标记类型信息为所述推荐平台提供的所述第一号码的信息。
在示例性实施例中,本发明实施例还提供了一种存储介质,所述存储介质可为光盘、闪存或磁盘等存储介质,可选为非瞬间存储介质。其中,所述存储介质上存储有可执行程序10021,所述可执行程序10021被处理器1001执行时实现:确定各平台的第一质量分数、第一号码在各平台的历史标记次数,以及分组平均标记次数;其中,每个平台的第一质量分数用于表征该平台的号码数量在各平台号码数量总和中的占比,以及表征用户对该平台的投诉程度;根据所述各平台的第一质量分数、所述分组平均标记次数,以及所述第一号码在各平台的历史标记次数,确定所述第一号码在各平台的投递加权分数;根据所述投递加权分数,从所述各平台中确定推荐平台,从所述推荐平台提供的所述第一号码的信息中选取信息,将所选取的信息确定为所述第一号码作为主叫号码时发送给被叫号码的信息。
所述可执行程序10021被处理器1001执行时实现:根据采集的各平台的号码数量,确定各平台的第一质量分数。
所述可执行程序10021被处理器1001执行时实现:确定各平台的号码数量,得到号码总数量;根据第一平台的号码数量与所述号码总数量的关系,得到所述第一平台的第一质量分数。
所述可执行程序10021被处理器1001执行时实现:根据所述第一号码在各平台的历史标记次数,确定所述第一号码在各平台的所属分组;根据所述第一号码在各平台的所属分组所包含的所述第二号码的数量、以及所述第二号码的标记总次数,确定所述第一号码在各平台的所属分组的分组平均标记次数。
所述可执行程序10021被处理器1001执行时实现:在所述根据所述第一号码在各平台的历史标记次数,确定所述第一号码在各平台的所属分组之前,获取第一平台上的各号码的历史标记次数;根据所述第一平台上的各号码的历史标记次数,确定至少一个分组的阈值范围;确定所述第一号码在第一平台的历史标记次数所在阈值范围,根据所述阈值范围确定所述第一号码在所述第一平台的所属分组。
所述可执行程序10021被处理器1001执行时实现:在所述根据所述第一平台上的各号码的历史标记次数,确定至少一个分组的阈值范围之前,将所述第一平台上的号码的历史标记次数小于第一阈值的号码作为噪音号码;在所述第一平台的号码中删除所述噪音号码,得到所述第一平台上的第三号码;根据所述第一平台上的第三号码的历史标记次数确定至少一个分组的阈值范围。
所述可执行程序10021被处理器1001执行时实现:在所述根据各平台的第一质量分数、所述分组平均标记次数,以及所述第一号码在各平台的历史标记次数,确定所述第一号码在各平台的投递加权分数之前,确定所述第一号码在第一平台上设定时间内的异常标记次数大于第二阈值时,对所述第一质量分数进行修正,将修正后的第一质量分数作为所述第一平台的第一质量分数;或者,确定所述第一号码所在的第一平台中的各号码在设定时间内的异常标记次数大于第三阈值时,对所述第一质量分数进行修正,将修正后的第一质量分数作为所述第一平台的第一质量分数。
所述可执行程序10021被处理器1001执行时实现:在所述根据采集的各平台的号码数量,确定各平台的第一质量分数之前,通过第一接口接收各平台的号码数据;对所述号码数据进行文本处理,得到各平台上各号码的历史标记次数、所述第一号码的标记类型信息或号码数量;其中,所述标记类型信息为所述推荐平台提供的所述第一号码的信息。
本发明实施例所提供的技术方案,通过引入第一号码在各平台的投递加权分数,进而根据投递加权分数对多平台信息进行推荐,使得第一号码数据的筛选在各平台保持平衡,能够有效提升对多平台信息进行推荐的准确性,避免出现同一号码的信息重复显示的情况,进而抑制得到拥有大量平均标记次数但信息错误的平台所提供的第一号码的信息,满足用户日益增长的使用需求,大大提升用户体验。
本发明实施例所记载的各技术方案之间,在不冲突的情况下,可以任意组合。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或可执行程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的可执行程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和可执行程序产品的流程图和/或方框图来描述的。应理解可由可执行程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些可执行程序指令到通用计算机、专用计算机、嵌入式处理机或参考可编程数据处理设备的处理器以产生一个机器,使得通过计算机或参考可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些可执行程序指令也可存储在能引导计算机或参考可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些可执行程序指令也可装载到计算机或参考可编程数据处理设备上,使得在计算机或参考可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或参考可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (16)
1.一种多平台信息推荐方法,其特征在于,所述方法包括:
确定各平台的第一质量分数、第一号码在各平台的历史标记次数;其中,每个平台的第一质量分数用于表征该平台的号码数量在各平台号码数量总和中的占比,以及表征用户对该平台的投诉程度;
根据所述第一号码在各平台的历史标记次数,确定所述第一号码在各平台的所属分组;
根据所述第一号码在各平台的所属分组,确定分组平均标记次数;
根据所述各平台的第一质量分数、所述分组平均标记次数,以及所述第一号码在各平台的历史标记次数,确定所述第一号码在各平台的投递加权分数;
根据所述投递加权分数,从所述各平台中确定推荐平台,从所述推荐平台提供的所述第一号码的信息中选取信息,将所选取的信息确定为所述第一号码作为主叫号码时发送给被叫号码的信息。
2.根据权利要求1所述的多平台信息推荐方法,其特征在于,所述确定各平台的第一质量分数,包括:
根据采集的各平台的号码数量,确定各平台的第一质量分数;
所述根据采集的各平台的号码数量,确定各平台的第一质量分数,包括:
确定各平台的号码数量,得到号码总数量;
根据第一平台的号码数量与所述号码总数量的关系,得到所述第一平台的第一质量分数。
3.根据权利要求1所述的多平台信息推荐方法,其特征在于,所述根据所述第一号码在各平台的所属分组,确定分组平均标记次数,包括:
根据所述第一号码在各平台的所属分组所包含的第二号码的数量、以及所述第二号码的标记总次数,确定所述第一号码在各平台的所属分组的分组平均标记次数。
4.根据权利要求1所述的多平台信息推荐方法,其特征在于,在所述根据所述第一号码在各平台的历史标记次数,确定所述第一号码在各平台的所属分组之前,所述方法还包括:
获取第一平台上的各号码的历史标记次数;
根据所述第一平台上的各号码的历史标记次数,确定至少一个分组的阈值范围;
所述根据所述第一号码在各平台的历史标记次数,确定所述第一号码在各平台的所属分组,包括:
确定所述第一号码在第一平台的历史标记次数所在阈值范围,根据所述阈值范围确定所述第一号码在所述第一平台的所属分组。
5.根据权利要求4所述的多平台信息推荐方法,其特征在于,在所述根据所述第一平台上的各号码的历史标记次数,确定至少一个分组的阈值范围之前,所述方法还包括:
将所述第一平台上的号码的历史标记次数小于第一阈值的号码作为噪音号码,其中,所述第一号码的历史标记次数不小于所述第一阈值;
在所述第一平台的号码中删除所述噪音号码,得到所述第一平台上的第三号码;
所述根据所述第一平台上的各号码的历史标记次数,确定至少一个分组的阈值范围,包括:
根据所述第一平台上的第三号码的历史标记次数确定至少一个分组的阈值范围。
6.根据权利要求1所述的多平台信息推荐方法,其特征在于,在所述根据所述各平台的第一质量分数、所述分组平均标记次数,以及所述第一号码在各平台的历史标记次数,确定所述第一号码在各平台的投递加权分数之前,所述方法还包括:
确定所述第一号码在第一平台上设定时间内的异常标记次数大于第二阈值时,对所述第一质量分数进行修正,将修正后的第一质量分数作为所述第一平台的第一质量分数;或者,
确定所述第一号码所在的第一平台中的各号码在设定时间内的异常标记次数大于第三阈值时,对所述第一质量分数进行修正,将修正后的第一质量分数作为所述第一平台的第一质量分数。
7.根据权利要求1所述的多平台信息推荐方法,其特征在于,在所述确定各平台的第一质量分数之前,所述方法还包括:
通过第一接口接收各平台的号码数据;
对所述号码数据进行文本处理,得到各平台上各号码的历史标记次数、所述第一号码的标记类型信息或号码数量;
其中,所述标记类型信息为所述推荐平台提供的所述第一号码的信息。
8.一种多平台信息推荐装置,其特征在于,所述装置包括:第一确定模块、第二确定模块和推荐模块;其中,
所述第一确定模块,用于确定各平台的第一质量分数、第一号码在各平台的历史标记次数;其中,每个平台的第一质量分数用于表征该平台的号码数量在各平台号码数量总和中的占比,以及表征用户对该平台的投诉程度;还用于根据所述第一号码在各平台的历史标记次数,确定所述第一号码在各平台的所属分组,根据所述第一号码在各平台的所属分组,确定分组平均标记次数;
所述第二确定模块,用于根据所述各平台的第一质量分数、所述分组平均标记次数,以及所述第一号码在各平台的历史标记次数,确定所述第一号码在各平台的投递加权分数;
所述推荐模块,用于根据所述投递加权分数,从所述各平台中确定推荐平台,从所述推荐平台提供的所述第一号码的信息中选取信息,将所选取的信息确定为所述第一号码作为主叫号码时发送给被叫号码的信息。
9.根据权利要求8所述的多平台信息推荐装置,其特征在于,所述第一确定模块,具体用于:根据采集的各平台的号码数量,确定各平台的第一质量分数;
所述第一确定模块,具体用于:
确定各平台的号码数量,得到号码总数量;
根据第一平台的号码数量与所述号码总数量的关系,得到所述第一平台的第一质量分数。
10.根据权利要求8所述的多平台信息推荐装置,其特征在于,所述第一确定模块,具体用于:
根据所述第一号码在各平台的所属分组所包含的第二号码的数量、以及所述第二号码的标记总次数,确定所述第一号码在各平台的所属分组的分组平均标记次数。
11.根据权利要求8所述的多平台信息推荐装置,其特征在于,所述装置还包括:
第一获取模块,用于在所述第一确定模块在根据所述第一号码在各平台的历史标记次数,确定所述第一号码在各平台的所属分组之前,获取第一平台上的各号码的历史标记次数;
第三确定模块,用于根据所述第一平台上的各号码的历史标记次数,确定至少一个分组的阈值范围;
所述第一确定模块,具体用于:确定所述第一号码在第一平台的历史标记次数所在阈值范围,根据所述阈值范围确定所述第一号码在所述第一平台的所属分组。
12.根据权利要求11所述的多平台信息推荐装置,其特征在于,所述装置还包括:
第四确定模块,用于在所述第三确定模块根据所述第一平台上的各号码的历史标记次数,确定至少一个分组的阈值范围之前,将所述第一平台上的号码的历史标记次数小于第一阈值的号码作为噪音号码,其中,所述第一号码的历史标记次数不小于所述第一阈值;
在所述第一平台的号码中删除所述噪音号码,得到所述第一平台上的第三号码;
所述第三确定模块,具体用于:根据所述第一平台上的第三号码的历史标记次数确定至少一个分组的阈值范围。
13.根据权利要求8所述的多平台信息推荐装置,其特征在于,所述装置还包括:
更新模块,用于在所述第二确定模块根据所述各平台的第一质量分数、所述分组平均标记次数,以及所述第一号码在各平台的历史标记次数,确定所述第一号码在各平台的投递加权分数之前,
确定所述第一号码在第一平台上设定时间内的异常标记次数大于第二阈值时,对所述第一质量分数进行修正,将修正后的第一质量分数作为所述第一平台的第一质量分数;或者,
确定所述第一号码所在的第一平台中的各号码在设定时间内的异常标记次数大于第三阈值时,对所述第一质量分数进行修正,将修正后的第一质量分数作为所述第一平台的第一质量分数。
14.根据权利要求8所述的多平台信息推荐装置,其特征在于,所述装置还包括:
第二获取模块,用于在所述第一确定模块确定各平台的第一质量分数之前,通过第一接口接收各平台的号码数据;
分析处理模块,用于对所述号码数据进行文本处理,得到各平台上各号码的历史标记次数、所述第一号码的标记类型信息或号码数量;
其中,所述标记类型信息为所述推荐平台提供的所述第一号码的信息。
15.一种存储介质,其上存储有可执行程序,其特征在于,所述可执行程序被处理器执行时实现如权利要求1至7任一项所述的多平台信息推荐方法。
16.一种多平台信息推荐装置,包括存储器、处理器及存储在存储器上并能够由所述处理器运行的可执行程序,其特征在于,所述处理器运行所述可执行程序时执行如权利要求1至7任一项所述的多平台信息推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810553992.9A CN108881591B (zh) | 2018-05-31 | 2018-05-31 | 一种多平台信息推荐方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810553992.9A CN108881591B (zh) | 2018-05-31 | 2018-05-31 | 一种多平台信息推荐方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108881591A CN108881591A (zh) | 2018-11-23 |
CN108881591B true CN108881591B (zh) | 2020-10-30 |
Family
ID=64335709
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810553992.9A Active CN108881591B (zh) | 2018-05-31 | 2018-05-31 | 一种多平台信息推荐方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108881591B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110166741A (zh) * | 2019-04-15 | 2019-08-23 | 深圳壹账通智能科技有限公司 | 基于人工智能的环境监控方法、装置、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104469025A (zh) * | 2014-11-26 | 2015-03-25 | 杭州东信北邮信息技术有限公司 | 一种基于聚类算法的实时拦截诈骗电话的方法和系统 |
CN104683538A (zh) * | 2015-02-13 | 2015-06-03 | 广州市讯飞樽鸿信息技术有限公司 | 骚扰电话号码建库方法及系统 |
CN104702804A (zh) * | 2015-01-28 | 2015-06-10 | 北京羽乐创新科技有限公司 | 一种号码标记方法及装置 |
WO2017125092A1 (zh) * | 2016-01-19 | 2017-07-27 | 上海触乐信息科技有限公司 | 号码标记方法和系统 |
-
2018
- 2018-05-31 CN CN201810553992.9A patent/CN108881591B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104469025A (zh) * | 2014-11-26 | 2015-03-25 | 杭州东信北邮信息技术有限公司 | 一种基于聚类算法的实时拦截诈骗电话的方法和系统 |
CN104702804A (zh) * | 2015-01-28 | 2015-06-10 | 北京羽乐创新科技有限公司 | 一种号码标记方法及装置 |
CN104683538A (zh) * | 2015-02-13 | 2015-06-03 | 广州市讯飞樽鸿信息技术有限公司 | 骚扰电话号码建库方法及系统 |
WO2017125092A1 (zh) * | 2016-01-19 | 2017-07-27 | 上海触乐信息科技有限公司 | 号码标记方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN108881591A (zh) | 2018-11-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9870486B2 (en) | Methods and apparatus to assign demographic information to panelists | |
CN106294105B (zh) | 刷量工具检测方法和装置 | |
CN106874273B (zh) | 渠道信息统计方法、装置和系统 | |
CN109495467B (zh) | 拦截规则的更新方法、设备及计算机可读存储介质 | |
CN107404481B (zh) | 用户信息识别方法及装置 | |
CN105491444B (zh) | 一种数据识别处理方法以及装置 | |
CN107786601B (zh) | 一种信息处理方法、终端及服务器 | |
CN111383101A (zh) | 贷后风险监控方法、装置、设备及计算机可读存储介质 | |
CN108320089A (zh) | 坐席分配方法、电子装置及计算机可读存储介质 | |
CN107633257B (zh) | 数据质量评估方法及装置、计算机可读存储介质、终端 | |
CN108764951B (zh) | 用户相似度获得方法和装置、设备、存储介质 | |
CN109831454B (zh) | 虚假流量的识别方法和装置 | |
CN109598538B (zh) | 一种广告投放的流量控制方法、装置、设备及介质 | |
CN110708360A (zh) | 一种信息处理方法、系统和电子设备 | |
CN110807050B (zh) | 性能分析方法、装置、计算机设备及存储介质 | |
CN110019774B (zh) | 标签分配方法、装置、存储介质及电子装置 | |
CN108881591B (zh) | 一种多平台信息推荐方法、装置及存储介质 | |
CN107330709B (zh) | 确定目标对象的方法及装置 | |
CN105007184B (zh) | 用户行为习惯的获取方法 | |
CN106294457B (zh) | 网络信息推送方法及装置 | |
CN110210884B (zh) | 确定用户特征数据的方法、装置、计算机设备及存储介质 | |
CN114238777B (zh) | 基于行为分析的负反馈流量分配方法、装置、设备及介质 | |
CN115358772A (zh) | 一种交易风险预测方法、装置、存储介质及计算机设备 | |
CN115130577A (zh) | 一种欺诈号码识别方法、装置及电子设备 | |
CN112329814B (zh) | 一种发票数据处理方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |