CN110083517A - 一种用户画像置信度的优化方法及装置 - Google Patents

一种用户画像置信度的优化方法及装置 Download PDF

Info

Publication number
CN110083517A
CN110083517A CN201910353031.8A CN201910353031A CN110083517A CN 110083517 A CN110083517 A CN 110083517A CN 201910353031 A CN201910353031 A CN 201910353031A CN 110083517 A CN110083517 A CN 110083517A
Authority
CN
China
Prior art keywords
user
confidence
value interval
portrait
confidence level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910353031.8A
Other languages
English (en)
Other versions
CN110083517B (zh
Inventor
张贵川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Miaozhen Systems Information Technology Co Ltd
Original Assignee
Miaozhen Systems Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Miaozhen Systems Information Technology Co Ltd filed Critical Miaozhen Systems Information Technology Co Ltd
Priority to CN201910353031.8A priority Critical patent/CN110083517B/zh
Publication of CN110083517A publication Critical patent/CN110083517A/zh
Application granted granted Critical
Publication of CN110083517B publication Critical patent/CN110083517B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3438Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种用户画像置信度的优化方法及装置。通过获取待预测用户的至少一条用户行为日志;基于所述至少一条用户行为日志和训练好的分类模型,确定所述待预测用户的用户画像以及与所述用户画像对应的用户画像的第一置信度,其中,所述用户画像的第一置信度位于第一置信度取值区间内;将所述用户画像的第一置信度映射到第二置信度取值区间,确定所述用户画像在所述第二置信度取值区间的第二置信度,其中,所述第一置信度取值区间位于所述第二置信度取值区间内;基于所述用户画像的第二置信度,确定所述用户画像的目标置信度。这样,可以提高置信度的准确度和可信度,有利于后续资源的合理配置。

Description

一种用户画像置信度的优化方法及装置
技术领域
本申请涉及网络资源监测配置技术领域,尤其是涉及一种用户画像置信度的优化方法及装置。
背景技术
随着互联网技术的发展,对网络资源配置的研究也随之兴起,通过获取大量用户数据,将大量用户数据通过模型算法得到用户画像以及用户画像的置信度,所述用户画像用来描述用户信息,所述置信度用来表征用户信息的准确度,根据用户信息,对网络资源进行合理的配置,置信度的精确度对网络资源配置至关重要。
在网络资源配置研究过程中,主要利用逻辑回归、决策树等通用的模型算法根据大量用户数据组合成的用户行为日志推测用户画像,并将使用模型算法推测出的用户画像的原始置信度作为最终的值,从而确定用户信息,根据用户信息,对网络资源进行配置。但是利用模型推测出的用户画像的置信度准确性和可信度低,影响资源配置的合理性。
发明内容
有鉴于此,本申请的目的在于提供一种用户画像置信度的优化方法及装置,可以对模型推测出的原始置信度进行映射优化,可以提高置信度的准确度和可信度,有利于后续资源的合理配置。
本申请实施例提供了一种用户画像置信度的优化方法,所述优化方法包括:
获取待预测用户的至少一条用户行为日志;
基于所述至少一条用户行为日志和训练好的分类模型,确定所述待预测用户的用户画像以及与所述用户画像对应的用户画像的第一置信度,其中,所述用户画像的第一置信度位于第一置信度取值区间内;
将所述用户画像的第一置信度映射到第二置信度取值区间,确定所述用户画像在所述第二置信度取值区间中的第二置信度,其中,所述第一置信度取值区间位于所述第二置信度取值区间内;
基于所述用户画像的第二置信度,确定所述用户画像的目标置信度。
进一步的,所述将所述用户画像的第一置信度映射到第二置信度取值区间,确定所述用户画像在所述第二置信度取值区间中的第二置信度,其中,所述第一置信度取值区间位于所述第二置信度取值区间内,包括:
获取预设的第二置信度取值区间,其中,所述第一置信度取值区间位于所述第二置信度取值区间内;
通过以下方式确定所述用户画像在所述第二置信度取值区间中的第二置信度:
其中,c2为用户画像在所述第二置信度取值区间中的第二置信度,c为用户画像的第一置信度,N为分类模型的分类数。
进一步的,所述基于所述用户画像的第二置信度,确定所述用户画像的目标置信度,包括:
确定与所述用户行为日志对应的相关因子;
基于所述用户画像的第二置信度和与所述用户行为日志对应的相关因子,确定用户画像的第三置信度;
基于所述用户画像的第二置信度和所述用户画像的第三置信度,确定所述用户画像的目标置信度。
进一步的,所述基于所述用户画像的第二置信度,确定用户画像的第三置信度,包括:
通过以下方式确定用户画像的第三置信度:
其中,c2为用户画像在所述第二置信度取值区间中的第二置信度,为用户日志对应的相关因子,n为用户日志条数,m为在0到1区间内的与待预测用户相关的值,t为与待预测用户相关的值。
进一步的,所述基于所述用户画像的第二置信度,确定所述用户画像的目标置信度,包括:
通过以下方式确定所述用户画像的目标置信度:
其中,c2用户画像在所述第二置信度取值区间中的第二置信度,为用户日志对应的相关因子,n为用户日志条数,m为在0到1区间内的与待预测用户相关的值,t为与待预测用户相关的值。
本申请实施例还提供了一种用户画像置信度的优化装置,所述优化装置包括:
获取模块,用于获取待预测用户的至少一条用户行为日志;
第一处理模块,用于基于第一获取模块获取的至少一条用户行为日志和训练好的分类模型,确定所述待预测用户的用户画像以及与所述用户画像对应的用户画像的第一置信度,其中,所述用户画像的第一置信度位于第一置信度取值区间内;
第一确定模块,用于将第一处理模块确定的用户画像的第一置信度映射到第二置信度取值区间,确定所述用户画像在第二置信度取值区间中的第二置信度,其中,所述第一置信度取值区间位于第二置信度取值区间内;
第二确定模块,用于基于第一确定模块确定的用户画像的第二置信度,确定所述用户画像的目标置信度。
进一步的,所述第一确定模块包括:
第一获取单元,用于获取预设的第二置信度取值区间,其中,所述第一置信度取值区间位于第二置信度取值区间内;
第一处理单元,用于通过以下方式确定所述用户画像在第一获取单元获取的第二置信度取值区间中的第二置信度:
其中,c2为用户画像在所述第二置信度取值区间中的第二置信度,c为用户画像的第一置信度,N为分类模型的分类数。
进一步的,所述第二确定模块,包括:
第一确定单元,用于确定与所述用户行为日志对应的相关因子;
第二确定单元,用于基于第一处理单元处理获得的用户画像的第二置信度和第一确定单元确定的与所述用户行为日志对应的相关因子,确定用户画像的第三置信度;
第三确定单元,用于基于第一处理单元处理获得的用户画像的第二置信度和第二确定单元确定的用户画像的第三置信度确定所述用户画像的目标置信度。
进一步的,所述第二确定单元,具体用于:
通过以下方式确定用户画像的第三置信度:
其中,c2为用户画像在所述第二置信度取值区间中的第二置信度,为用户日志对应的相关因子,n为用户日志条数,m为在0到1区间内的与待预测用户相关的值,t为与待预测用户相关的值。
进一步的,所述第三确定单元,具体用于:
通过以下方式确定所述用户画像的目标置信度:
其中,c2为用户画像在所述第二置信度取值区间中的第二置信度,为用户日志对应的相关因子,n为用户日志条数,m为在0到1区间内的与待预测用户相关的值,t为与待预测用户相关的值。
本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的用户画像置信度的优化方法的步骤。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述的用户画像置信度的优化方法的步骤。
本申请实施例提供的用户画像置信度的优化方法及装置,通过获取待预测用户的至少一条用户行为日志;基于所述至少一条用户行为日志和训练好的分类模型,确定所述待预测用户的用户画像以及与所述用户画像对应的用户画像的第一置信度,其中,所述用户画像的第一置信度位于第一置信度取值区间内;将所述用户画像的第一置信度映射到第二置信度取值区间,确定所述用户画像在所述第二取值区间的第二置信度,其中,所述第一取值区间位于所述第二置信度取值区间内;基于所述用户画像的第二置信度,确定所述用户画像的目标置信度。这样,可以将分类模型初步确定的用户画像的置信度进行进一步的优化,通过映射置信度的表示空间,结合不同区间的映射来确定用户画像的目标置信度,可以提高置信度的表达精度、提高置信度的准确度和可信度,有利于后续资源的合理调度和配置。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为一种可能的应用场景下的系统架构图;
图2为本申请实施例所提供的一种用户画像置信度的优化方法的流程图;
图3为本申请实施例所提供的另一种用户画像置信度的优化方法的流程图;
图4为本申请实施例所提供的一种用户画像置信度的优化装置的结构示意图;
图5为图4中所示的第一确定模块的结构图;
图6为图4中所示的第二确定模块的结构图;
图7为本申请一实施例提供的电子设备的结构图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本申请保护的范围。
首先,对本申请可适用的应用场景进行介绍。本申请可应用于广告监测技术领域,通过将分类模型得出的用户画像的置信度的二次映射优化计算,可以扩大置信度表示空间,提高置信度的表达精度,请参阅图1,图1为一种在该应用场景下的系统结构图。如图1中所示,所述系统包括资源存储装置和用户画像置信度的优化装置,所述资源存储装置存储大量待预测的资源,包括带预测用户的行为日志,将所述待预测用户的至少一条用户行为日志输入至所述用户画像置信度的优化装置,对用户画像的置信度进行优化。
经研究发现,在资源配置研究过程中,主要利用逻辑回归、决策树等通用的模型算法根据用户的行为日志推测用户画像,并将使用模型算法推测出的用户画像的原始置信度作为最终的值,但是利用模型推测出的用户画像的置信度准确性和可信度低,影响对资源配置的合理性。
基于此,本申请实施例提供了一种用户画像置信度的优化方法,以扩大置信度表示空间,提高置信度的表达精度。
请参阅图2,图2为本申请实施例所提供的一种用户画像置信度的优化方法的流程图。本申请实施例提供用户画像置信度的优化方法,包括:
步骤201、获取待预测用户的至少一条用户行为日志。
该步骤中,在后台数据中获取海量用户数据,将获取的海量用户数据整合成至少一条用户行为日志。
其中,所述后台数据可以是媒体后台存储的数据,可以采用Adobe Analytic根据用户的监测需求提供不同的服务类型来获取后台中的用户数据。
步骤202、基于所述至少一条用户行为日志和训练好的分类模型,确定所述待预测用户的用户画像以及与所述用户画像对应的用户画像的第一置信度,其中,所述用户画像的第一置信度位于第一置信度取值区间内。
该步骤中,将获取到的至少一条用户行为日志输入到预先训练好的分类模型中,所述分类模型将与用户行为日志对应的用户画像和与用户画像对应的用户画像的第一置信度输出,其中,所述用户画像的第一置信度所在区间和采用分类模型的分类数有关,以所述分类模型的分类数为N类为例,所述第一用户画像置信度位于[1/N,1]区间内。
其中,所述分类模型的训练过程为获取种子用户,所述种子用户根据预先设定的分类需要,分类获取;将用户行为日志的监测维度做笛卡尔乘积处理,组合得到用户行为信息,其中,所述用户行为日志的监测维度包括但不限于监测点位、监测时间段、用户IP、广告曝光类型、广告点击次数;将种子用户和组合得到的用户行为信息相交,组合得到训练日志数据,将训练日志数据输入到传统的模型算法中,得到和用户行为日志对应的分类模型,其中,所述传统模型算法可以采用逻辑回归算法、决策树算法、FM因子分解机算法、XGBoost算法等。
这样,通过上述过程可以出将用户行为日志输入至分类模型中,分类模型输出与用户行为日志对应的用户画像和与用户画像对应的用户画像对应的第一置信度。其中,所述用户画像是将用户行为日志输入到分类模型后推测出的用户的性别、年龄等基本信息,可以用来表征该条用户行为日志对应的用户信息,用户画像对应的用户画像置信度来表征用户信息是否准确,结合用户画像和与之对应的置信度,确定资源配置的合理性。
步骤203、将所述用户画像的第一置信度映射到第二置信度取值区间,确定所述用户画像在所述第二置信度取值区间的第二置信度,其中,所述第一置信度取值区间位于所述第二置信度取值区间内。
该步骤中,分类模型处理输出的用户画像置信度的表示区间有限,并且与分类模型的分类数有关,以所述分类模型为N分类为例,所述分类模型输出的用户画像置信度的取值范围为[1/N,1],区间范围狭窄,置信度的精度不够,经研究发现,置信度的精确程度和取值区间的宽度成正相关。有鉴于此,通过对第一置信度的数值计算,得到与第一置信度对应的第二置信度,所述第二置信度所在的区间的取值范围包括第一置信度所在的区间的取值范围,将所述第一置信度映射到第二置信度取值区间。
步骤204、基于所述用户画像的第二置信度,确定所述用户画像的目标置信度。
该步骤中,在第二置信度取值区间得到用户画像的第二置信度,为了消除相同置信度对用户信息准确性判断的影响,还要对第二置信度进行进一步的加减缩放处理,以此提高目标置信度的精度。
本申请实施例提供的用户画像置信度的优化方法,获取待预测用户的至少一条用户行为日志;基于所述至少一条用户行为日志和训练好的分类模型,确定所述待预测用户的用户画像以及与所述用户画像对应的用户画像的第一置信度,其中,所述用户画像的第一置信度位于第一置信度取值区间内;将所述用户画像的第一置信度映射到第二置信度取值区间,确定所述用户画像在所述第二置信度取值区间的第二置信度,其中,所述第一置信度取值区间位于所述第二置信度取值区间内;基于所述用户画像的第二置信度,确定所述用户画像的目标置信度。
这样,将通过分类模型输出的用户画像的第一置信度映射到取值范围更宽的第二置信度取值区间,得到用户画像的第二置信度,再基于用户画像的第二置信度确定用户画像的目标置信度,可以扩大置信度的取值区间,提高置信度的精确度。
请参阅图3,图3为本申请另一实施例提供的用户画像的优化方法的流程图。如图3中所示,本申请实施例提供的用户画像的优化方法,包括:
步骤301、获取待预测用户的至少一条用户行为日志。
步骤302、基于所述至少一条用户行为日志和训练好的分类模型,确定所述待预测用户的用户画像以及与所述用户画像对应的用户画像的第一置信度,其中,所述用户画像的第一置信度位于第一置信度取值区间。
步骤303、将所述用户画像的第一置信度映射到第二置信度取值区间,确定所述用户画像在所述第二置信度取值区间的第二置信度,其中,所述第一置信度取值区间位于所述第二置信度取值区间内。
步骤304、确定与所述用户行为日志对应的相关因子。
该步骤中,获取与用户行为日志对应的相关因子式中n为用户日志条数,m为在0到1区间内的与待预测用户相关的值,t为与待预测用户相关的值,m和t的值根据用户日志的特性、采用的分类模型的特性以及监测数据的用途可以设置不同的值,以使置信度在相应区间内更加合理可信,例如,若获取的待预测的用户行为日志只有一条,n的取值可以为0.9,以此削弱只有一条用户行为日志的影响。
其中,获取到用户行为日志对应的相关因子后,还要对所述相关因子进行缩放,可以采用sigmoid缩放,缩放公式为其中,m为在0到1区间内的与待预测用户相关的值,t为与待预测用户相关的值,m和t的值根据用户日志的特性、采用的分类模型的特性以及监测数据的用途可以设置不同的值,以使置信度在相应区间内更加合理可信。
步骤305、基于所述用户画像的第二置信度和与所述用户行为日志对应的相关因子,确定用户画像的第三置信度。
该步骤中,在第二置信度取值区间,依据第二置信度将所述第二置信度取值区间分为两部分,一部分为第二置信度取值区间左端点到第二置信度的区间,另一部分为第二置信度到第二置信度取值区间右端点的区间,称为剩余置信度部分,在剩余置信度部分,将第二置信度取值区间右端点和第二置信度作差,所得差值与相关因子相乘,得到用户画像的第三置信度。
步骤306、基于所述用户画像的第二置信度和所述用户画像的第三置信度,确定所述用户画像的目标置信度。
该步骤中,求解出用户画像的第二置信度和用户画像的第三置信度,将所述用户画像的第二置信度和用户画像的第三置信度相加,确定用户画像的目标置信度。
其中,步骤301至步骤303的描述可以参照步骤201至步骤203的描述,并且能达到相同的技术效果,对此不做赘述。
进一步的,步骤303包括:
获取预设的第二取值区间;通过公式获得用户画像的第二置信度,其中,所述用户画像的第二置信度位于第二置信度取值区间内。
其中,c2为用户画像在所述第二置信度取值区间中的第二置信度,c为用户画像的第一置信度,N为分类模型的分类数。
该步骤中,获取预设一个取值区间,第一置信度取值区间位于预设的取值区间中,将位于第一置信度取值区间的第一置信度通过计算的到第二置信度,所述第二置信度位于预设区间内。可以通过公式来计算第二置信度,公式中c为第一置信度,N为分类模型的分类数,根据采用的分类模型的分类数进行调整。
进一步的,步骤305还包括:
通过以下方式确定用户画像的第三置信度:
其中,c2为用户画像在所述第二置信度取值区间中的第二置信度,为用户日志对应的相关因子,n为用户日志条数,m为在(0,1)区间内的与待预测用户相关的值,t为与待预测用户相关的值。
该步骤中,通过计算公式来确定第三置信度,所述第三置信度是由第二置信度取值区间的剩余置信度部分和相关因子乘积获得的,所述第三置信度用来区分相同置信度的用户,提高置信度的表达精度。
进一步的,步骤306还包括:
通过以下方式确定所述用户画像的目标置信度:
其中,c2为用户画像在所述第二置信度取值区间中的第二置信度,为用户日志对应的相关因子,n为用户日志条数,m为在0到1区间内的与待预测用户相关的值,t为与待预测用户相关的值。
该步骤中,将第二置信度和第三置信度进行求和处理,得到在第二置信度取值区间的目标置信度。其中,m为取值在0到1区间的值,t为根据实际情况设置的计算值,m和t的值根据用户日志的特性、采用的分类模型的特性以及监测数据的用途可以设置不同的值,以使置信度在相应区间内更加合理可信。
本申请实施例提供的用户画像置信度的优化方法,获取待预测用户的至少一条用户行为日志;基于所述至少一条用户行为日志和训练好的分类模型,确定所述待预测用户的用户画像的第一置信度,其中,所述用户画像的第一置信度位于第一置信度取值区间内;将所述用户画像的第一置信度映射到第二置信度取值区间,获得所述用户画像在所述第二置信度取值区间的第二置信度,其中,所述第一置信度取值区间位于所述第二置信度取值区间内;获取与所述用户行为日志对应的相关因子;基于所述用户画像的第二置信度和与所述用户行为日志对应的相关因子,确定用户画像的第三置信度,基于所述用户画像的第二置信度和所述用户画像的第三置信度,确定用户画像的目标置信度。
这样,通过将分类模型输出的用户画像的第一置信度映射到取值范围更宽的第二置信度取值区间,得到用户画像的第二置信度,并获取和用户日志对应的相关因子,基于用户画像的第二置信度和相关因子确定用户画像的目标置信度,可以扩大置信度的表示范围,区分相同置信度的用户信息,提高置信度的精度。
请参阅图4,图4本申请实施例所提供的一种用户画像置信度的优化装置的结构示意图,图5为图4中所示的第一确定模块的结构图,图6为图4中所示的第二确定模块的结构图。
如图4中所示,所述用户画像置信度的优化装置400包括:
获取模块410,用于获取待预测用户的至少一条用户行为日志。
第一处理模块420,用于基于第一获取模块获取的至少一条用户行为日志和训练好的分类模型,确定所述待预测用户的用户画像以及与所述用户画像对应的用户画像的第一置信度,其中,所述用户画像的第一置信度位于第一置信度取值区间内。
第一确定模块430,用于将第一处理模块确定的用户画像的第一置信度映射到第二置信度取值区间,确定所述用户画像在第二置信度取值区间中的第二置信度,其中,所述第一置信度取值区间位于第二置信度取值区间内。
第二确定模块440,用于基于第一确定模块确定的用户画像的第二置信度,确定所述用户画像的目标置信度。
进一步的,如图5所示,所述第一确定模块430包括:
第一获取单元431,用于获取预设的第二置信度取值区间,其中,所述第一置信度取值区间位于第二置信度取值区间内。
第一处理单元432,用于通过以下方式确定所述用户画像在第一获取单元获取的第二置信度取值区间中的第二置信度:
其中,c2为用户画像在所述第二置信度取值区间中的第二置信度,c为用户画像的第一置信度,N为分类模型的分类数。
进一步的,如图6所示,所述第二确定模块440包括:
第一确定单元441,用于确定与所述用户行为日志对应的相关因子。
第二确定单元442,用于基于第一处理单元处理获得的用户画像的第二置信度和第一确定单元确定的与所述用户行为日志对应的相关因子,确定用户画像的第三置信度。
第三确定单元443,用于基于第一处理单元处理获得的用户画像的第二置信度和第二确定单元确定的用户画像的第三置信度确定所述用户画像的目标置信度。
进一步的,所述第二确定单元442具体用于:
通过以下方式确定用户画像的第三置信度:
其中,c2为用户画像在所述第二置信度取值区间中的第二置信度,为用户日志对应的相关因子,n为用户日志条数,m为在0到1区间内的与待预测用户相关的值,t为与待预测用户相关的值。
进一步的,所述第三确定单元443具体用于:
通过以下方式确定所述用户画像的目标置信度:
其中,c2为用户画像在所述第二置信度取值区间中的第二置信度,为用户日志对应的相关因子,n为用户日志条数,m为在0到1区间内的与待预测用户相关的值,t为与待预测用户相关的值。
本实施例中的用户画像置信度的优化装置400,可以实现如图2和图3所示实施例中的用户画像置信度的优化方法的全部方法步骤,并可以达到相同的效果,在此不做赘述。
本申请实施例提供的用户画像置信度的优化装置,获取待预测用户的至少一条用户行为日志;基于所述至少一条用户行为日志和训练好的分类模型,确定所述待预测用户的用户画像以及与所述用户画像对应的用户画像的第一置信度,其中,所述用户画像的第一置信度位于第一置信度取值区间内;将所述用户画像的第一置信度映射到第二置信度取值区间,获得所述用户画像在所述第二置信度取值区间的第二置信度,其中,所述第一置信度取值区间位于所述第二置信度取值区间内;基于所述用户画像的第二置信度,确定所述用户画像的目标置信度。
这样,通过将通过分类模型输出的用户画像的第一置信度映射到取值范围更宽的第二置信度取值区间,得到用户画像的第二置信度,在基于用户画像的第二置信度确定用户画像的目标置信度,可以扩大置信度的取值区间,提高置信度的精确度。
请参阅图7,图7为本申请实施例所提供的一种电子设备的结构示意图。如图7中所示,所述电子设备700包括处理器710、存储器720和总线730。
所述存储器720存储有所述处理器710可执行的机器可读指令,当电子设备700运行时,所述处理器710与所述存储器720之间通过总线730通信,所述机器可读指令被所述处理器710执行时,可以执行如上述图2以及图3所示方法实施例中的用户画像置信度的优化方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时可以执行如上述图2以及图3所示方法实施例中的用户画像置信度的优化方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种用户画像置信度的优化方法,其特征在于,所述优化方法包括:
获取待预测用户的至少一条用户行为日志;
基于所述至少一条用户行为日志和训练好的分类模型,确定所述待预测用户的用户画像以及与所述用户画像对应的用户画像的第一置信度,其中,所述用户画像的第一置信度位于第一置信度取值区间内;
将所述用户画像的第一置信度映射到第二置信度取值区间,确定所述用户画像在所述第二置信度取值区间中的第二置信度,其中,所述第一置信度取值区间位于所述第二置信度取值区间内;
基于所述用户画像的第二置信度,确定所述用户画像的目标置信度。
2.根据权利要求1所述的优化方法,其特征在于,所述将所述用户画像的第一置信度映射到第二置信度取值区间,确定所述用户画像在所述第二置信度取值区间中的第二置信度,其中,所述第一置信度取值区间位于所述第二置信度取值区间内,包括:
获取预设的第二置信度取值区间,其中,所述第一置信度取值区间位于所述第二置信度取值区间内;
通过以下方式确定所述用户画像在所述第二置信度取值区间中的第二置信度:
其中,c2为用户画像在所述第二置信度取值区间中的第二置信度,c为用户画像的第一置信度,N为分类模型的分类数。
3.根据权利要求1所述的优化方法,其特征在于,所述基于所述用户画像的第二置信度,确定所述用户画像的目标置信度,包括:
确定与所述用户行为日志对应的相关因子;
基于所述用户画像的第二置信度和与所述用户行为日志对应的相关因子,确定用户画像的第三置信度;
基于所述用户画像的第二置信度和所述用户画像的第三置信度,确定所述用户画像的目标置信度。
4.根据权利要求3所述的优化方法,其特征在于,所述基于所述用户画像的第二置信度,确定用户画像的第三置信度,包括:
通过以下方式确定用户画像的第三置信度:
其中,c2为用户画像在所述第二置信度取值区间中的第二置信度,为用户日志对应的相关因子,n为用户日志条数,m为在0到1区间内的与待预测用户相关的值,t为与待预测用户相关的值。
5.根据权利要求3所述的优化方法,其特征在于,所述基于所述用户画像的第二置信度,确定所述用户画像的目标置信度,包括:
通过以下方式确定所述用户画像的目标置信度:
其中,c2为用户画像在所述第二置信度取值区间中的第二置信度,为用户日志对应的相关因子,n为用户日志条数,m为在0到1区间内的与待预测用户相关的值,t为与待预测用户相关的。
6.一种用户画像置信度的优化装置,其特征在于,所述优化装置包括:
获取模块,用于获取待预测用户的至少一条用户行为日志;
第一处理模块,用于基于第一获取模块获取的至少一条用户行为日志和训练好的分类模型,确定所述待预测用户的用户画像以及与所述用户画像对应的用户画像的第一置信度,其中,所述用户画像的第一置信度位于第一置信度取值区间内;
第一确定模块,用于将第一处理模块确定的用户画像的第一置信度映射到第二置信度取值区间,确定所述用户画像在第二置信度取值区间中的第二置信度,其中,所述第一置信度取值区间位于第二置信度取值区间内;
第二确定模块,用于基于第一确定模块确定的用户画像的第二置信度,确定所述用户画像的目标置信度。
7.根据权利要求6所述的优化装置,其特征在于,所述第一确定模块包括:
第一获取单元,用于获取预设的第二置信度取值区间,其中,所述第一置信度取值区间位于第二置信度取值区间内;
第一处理单元,用于通过以下方式确定所述用户画像在第一获取单元获取的第二置信度取值区间中的第二置信度:
其中,c2为用户画像在所述第二置信度取值区间中的第二置信度,c为用户画像的第一置信度,N为分类模型的分类数。
8.根据权利要求6所述的优化装置,其特征在于,所述第二确定模块,包括:
第一确定单元,用于确定与所述用户行为日志对应的相关因子;
第二确定单元,用于基于第一处理单元处理获得的用户画像的第二置信度和第一确定单元确定的与所述用户行为日志对应的相关因子,确定用户画像的第三置信度;
第三确定单元,用于基于第一处理单元处理获得的用户画像的第二置信度和第二确定单元确定的用户画像的第三置信度确定所述用户画像的目标置信度。
9.根据权利要求8所述的优化装置,其特征在于,所述第二确定单元,具体用于:
通过以下方式确定用户画像的第三置信度:
其中,c2为用户画像在所述第二置信度取值区间中的第二置信度,为用户日志对应的相关因子,n为用户日志条数,m为在0到1区间内的与待预测用户相关的值,t为与待预测用户相关的值。
10.根据权利要求8所述的优化装置,其特征在于,所述第三确定单元,具体用于:
通过以下方式确定所述用户画像的目标置信度:
其中,c2为用户画像在所述第二置信度取值区间中的第二置信度,为用户日志对应的相关因子,n为用户日志条数,m为在0到1区间内的与待预测用户相关的值,t为与待预测用户相关的值。
CN201910353031.8A 2019-04-29 2019-04-29 一种用户画像置信度的优化方法及装置 Active CN110083517B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910353031.8A CN110083517B (zh) 2019-04-29 2019-04-29 一种用户画像置信度的优化方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910353031.8A CN110083517B (zh) 2019-04-29 2019-04-29 一种用户画像置信度的优化方法及装置

Publications (2)

Publication Number Publication Date
CN110083517A true CN110083517A (zh) 2019-08-02
CN110083517B CN110083517B (zh) 2023-08-25

Family

ID=67417662

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910353031.8A Active CN110083517B (zh) 2019-04-29 2019-04-29 一种用户画像置信度的优化方法及装置

Country Status (1)

Country Link
CN (1) CN110083517B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110705402A (zh) * 2019-09-19 2020-01-17 天津天地伟业机器人技术有限公司 人脸识别置信值映射算法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015074849A1 (en) * 2013-11-21 2015-05-28 Thomson Licensing Method and apparatus for determining a confidence value for an alpha value
CN107341206A (zh) * 2017-06-23 2017-11-10 南京甄视智能科技有限公司 基于多个数据源构建精准的用户画像系统及方法
CN107368814A (zh) * 2017-07-24 2017-11-21 潍坊学院 基于Sobel算子和PauTa检验的瞬时频率估计方法
CN108280542A (zh) * 2018-01-15 2018-07-13 深圳市和讯华谷信息技术有限公司 一种用户画像模型的优化方法、介质以及设备
CN108495143A (zh) * 2018-03-30 2018-09-04 百度在线网络技术(北京)有限公司 视频推荐的方法和装置
WO2019041406A1 (zh) * 2017-08-28 2019-03-07 平安科技(深圳)有限公司 不雅图片识别方法、终端、设备及计算机可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015074849A1 (en) * 2013-11-21 2015-05-28 Thomson Licensing Method and apparatus for determining a confidence value for an alpha value
CN107341206A (zh) * 2017-06-23 2017-11-10 南京甄视智能科技有限公司 基于多个数据源构建精准的用户画像系统及方法
CN107368814A (zh) * 2017-07-24 2017-11-21 潍坊学院 基于Sobel算子和PauTa检验的瞬时频率估计方法
WO2019041406A1 (zh) * 2017-08-28 2019-03-07 平安科技(深圳)有限公司 不雅图片识别方法、终端、设备及计算机可读存储介质
CN108280542A (zh) * 2018-01-15 2018-07-13 深圳市和讯华谷信息技术有限公司 一种用户画像模型的优化方法、介质以及设备
CN108495143A (zh) * 2018-03-30 2018-09-04 百度在线网络技术(北京)有限公司 视频推荐的方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
STEPHEN A.ENGEL等: "《Confidence Intervals for fMRI Activation Maps》", 《PLOS ONE》 *
王乐等: "基于模型堆叠的上网行为日志用户画像方法", 《山东科技大学学报(自然科学版)》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110705402A (zh) * 2019-09-19 2020-01-17 天津天地伟业机器人技术有限公司 人脸识别置信值映射算法

Also Published As

Publication number Publication date
CN110083517B (zh) 2023-08-25

Similar Documents

Publication Publication Date Title
CN105678587B (zh) 一种推荐特征确定方法、信息推荐方法及装置
CN110033314B (zh) 广告数据处理方法及装置
CN108833458B (zh) 一种应用推荐方法、装置、介质及设备
JP6547070B2 (ja) プッシュ情報粗選択ソーティングの方法、デバイス、およびコンピュータ記憶媒体
CN109033408B (zh) 信息推送方法及装置、计算机可读存储介质、电子设备
JP6991983B2 (ja) 機械学習システムをトレーニングする方法及びシステム
CN105869022B (zh) 一种应用流行度预测方法和装置
CN113688310B (zh) 一种内容推荐方法、装置、设备及存储介质
CN111401700A (zh) 一种数据分析方法、装置、计算机系统及可读存储介质
CN110895706B (zh) 一种目标聚类数的获取方法、装置及计算机系统
CN107729473B (zh) 文章推荐方法及其装置
CN113034171B (zh) 一种业务数据处理方法、装置、计算机及可读存储介质
CN110083517A (zh) 一种用户画像置信度的优化方法及装置
CN111368195B (zh) 一种模型训练方法、装置、设备及存储介质
CN107644042B (zh) 软件程序点击率预估排序方法及服务器
CN113032440A (zh) 训练风险模型的数据处理方法和装置
CN116168403A (zh) 医疗数据分类模型训练方法、分类方法、装置及相关介质
CN113033938B (zh) 确定资源分配策略的方法、装置、终端设备及存储介质
CN111598390B (zh) 服务器高可用性评估方法、装置、设备和可读存储介质
CN112348356A (zh) 一种作品质量确定方法、装置、计算机设备及可读存储介质
CN113038242A (zh) 直播卡片展示位置的确定方法、装置、设备及存储介质
CN113132762A (zh) 留存行为因素分析方法、装置、电子设备和可读存储介质
CN107239660B (zh) 基于混合整数线性规划的粗糙集模型建立方法和装置
CN111309706A (zh) 模型训练方法、装置、可读存储介质及电子设备
JP2011227720A (ja) 推薦システム、推薦方法、及び推薦プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant