CN110019837A - 用户画像的生成方法及装置、计算机设备及可读介质 - Google Patents

用户画像的生成方法及装置、计算机设备及可读介质 Download PDF

Info

Publication number
CN110019837A
CN110019837A CN201711407335.5A CN201711407335A CN110019837A CN 110019837 A CN110019837 A CN 110019837A CN 201711407335 A CN201711407335 A CN 201711407335A CN 110019837 A CN110019837 A CN 110019837A
Authority
CN
China
Prior art keywords
user
target article
portrait
knowledge
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711407335.5A
Other languages
English (en)
Other versions
CN110019837B (zh
Inventor
沈之锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201711407335.5A priority Critical patent/CN110019837B/zh
Publication of CN110019837A publication Critical patent/CN110019837A/zh
Application granted granted Critical
Publication of CN110019837B publication Critical patent/CN110019837B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种用户画像的生成方法及装置、计算机设备及可读介质。其方法包括:当检测到用户对目标文章感兴趣时,提取目标文章的多个关键语句;根据多个关键语句,从预先建立的知识图谱中获取目标文章对应的多个目标知识点;根据目标文章对应的多个目标知识点和预先训练的用户画像生成模型,生成用户的画像。本发明的技术方案,能够弥补现有技术的不足,即使获取不到用户的注册信息、日志信息以及cookie和IP地址等,仍然可以基于知识图谱对用户阅读的感兴趣的文章进行分析,生成该用户的画像。本发明提出一种非常智能的用户画像的生成方案,使用非常方便。

Description

用户画像的生成方法及装置、计算机设备及可读介质
【技术领域】
本发明涉及计算机应用技术领域,尤其涉及一种用户画像的生成方法及装置、计算机设备及可读介质。
【背景技术】
随着互联网的发展,越来越多的用户通过互联网进行各种行为活动,互联网中会记录用户的各种基本信息,进而可以利用用户的各种基本信息,分析用户的兴趣、喜好以及需求等得到用户的画像,并进一步可以根据分析得到的用户的画像进行有目的广告推送等等服务。
例如,现有技术中的用户的画像,大多可以基于用户的注册信息、用户访问网络的日志信息、用户访问网络中的cookie以及用户访问网络所使用的IP地址等,进行分析得到。但是大多数情况,这些信息并无法轻易获得。例如,对于广告行业来讲,网站主之外的广告商想要获取这些数据将会非常困难,从而导致无法获取有效的用户的画像。因此,亟需提供一种不基于用户的注册信息、日志信息以及cookie和IP地址等来生成用户的画像的方案。
【发明内容】
本发明提供了一种用户画像的生成方法及装置、计算机设备及可读介质,用于提供一种智能的用户画像的生成方案。
本发明提供一种用户画像的生成方法,所述方法包括:
当检测到用户对目标文章感兴趣时,提取所述目标文章的多个关键语句;
根据所述多个关键语句,从预先建立的知识图谱中获取所述目标文章对应的多个目标知识点;
根据所述目标文章对应的多个目标知识点和预先训练的用户画像生成模型,生成所述用户的画像。
进一步可选地,如上所述的方法中,根据所述多个关键语句,从预先建立的知识图谱中获取所述目标文章对应的多个目标知识点,具体包括:
计算各所述关键语句分别与预先建立的知识图谱中各知识点的相似度;
根据各所述关键语句分别与所述知识图谱中各知识点的相似度,筛选所述目标文章对应的多个目标知识点。
进一步可选地,如上所述的方法中,根据各所述关键语句分别与所述知识图谱中各知识点的相似度,筛选所述目标文章对应的多个目标知识点,具体包括:
根据各所述关键语句分别与所述知识图谱中各知识点的相似度,从所述知识图谱的所有知识点中筛选与对应的所述关键语句的相似度最大的知识点作为所述目标知识点,得到所述目标文章对应的多个目标知识点;
或者,根据各所述关键语句分别与所述知识图谱中各知识点的相似度以及预设的相似度阈值,从所述知识图谱的所有知识点中筛选与对应的所述关键语句的相似度大于所述相似度阈值的知识点作为所述目标知识点,得到所述目标文章对应的多个目标知识点。
进一步可选地,如上所述的方法中,当检测到用户对目标文章感兴趣之前,所述方法还包括:
获取所述用户阅读所述目标文章的消耗时间长度;
基于所述消耗时间长度,检测所述用户是否对所述目标文章感兴趣。
进一步可选地,如上所述的方法中,基于所述消耗时间长度,检测所述用户是否对所述目标文章感兴趣,具体包括:
判断所述消耗时间长度是否大于预设的时间长度阈值,若是,确定所述用户对所述目标文章感兴趣,否则确定所述用户对所述目标文章不感兴趣。
进一步可选地,如上所述的方法中,基于所述消耗时间长度,检测所述用户是否对所述目标文章感兴趣,具体包括:
根据所述目标文章的长度和预设的阅读速度,获取所述目标文章的标准阅读时间长度;
根据所述标准阅读时长和预设的兴趣度比例,获取比例阅读时长;
判断所述消耗时间长度是否大于或者等于所述比例阅读时长,若是,确定所述用户对所述目标文章感兴趣,否则确定所述用户对所述目标文章不感兴趣。
进一步可选地,如上所述的方法中,根据所述目标文章对应的多个目标知识点和预先训练的用户画像生成模型,生成所述用户的画像,具体包括:
将所述目标文章对应的多个目标知识点输入所述用户画像生成模型,使得所述用户画像生成模型预测得到所述用户的多个特征信息,所述用户的多个特征信息构成所述用户的画像。
进一步可选地,如上所述的方法中,根据所述目标文章对应的多个目标知识点和预先训练的用户画像生成模型,生成所述用户的画像之前,所述方法还包括:
采集数条训练数据,各所述训练数据中包括基于所述知识图谱从训练用户阅读的训练文章中获取的多个训练知识点、以及所述训练用户的多个已知特征信息;
根据所述数条训练数据,训练所述用户画像生成模型。
本发明提供一种用户画像的生成装置,所述装置包括:
提取模块,用于当检测到用户对目标文章感兴趣时,提取所述目标文章的多个关键语句;
获取模块,用于根据所述多个关键语句,从预先建立的知识图谱中获取所述目标文章对应的多个目标知识点;
生成模块,用于根据所述目标文章对应的多个目标知识点和预先训练的用户画像生成模型,生成所述用户的画像。
进一步可选地,如上所述的装置中,所述获取模块,具体用于:
计算各所述关键语句分别与预先建立的知识图谱中各知识点的相似度;
根据各所述关键语句分别与所述知识图谱中各知识点的相似度,筛选所述目标文章对应的多个目标知识点。
进一步可选地,如上所述的装置中,所述获取模块,具体用于:
根据各所述关键语句分别与所述知识图谱中各知识点的相似度,从所述知识图谱的所有知识点中筛选与对应的所述关键语句的相似度最大的知识点作为所述目标知识点,得到所述目标文章对应的多个目标知识点;
或者,根据各所述关键语句分别与所述知识图谱中各知识点的相似度以及预设的相似度阈值,从所述知识图谱的所有知识点中筛选与对应的所述关键语句的相似度大于所述相似度阈值的知识点作为所述目标知识点,得到所述目标文章对应的多个目标知识点。
进一步可选地,如上所述的装置中,所述装置还包括检测模块:
所述获取模块,还用于当检测到用户对目标文章感兴趣之前,获取所述用户阅读所述目标文章的消耗时间长度;
所述检测模块,用于基于所述消耗时间长度,检测所述用户是否对所述目标文章感兴趣。
进一步可选地,如上所述的装置中,所述检测模块,具体用于:
判断所述消耗时间长度是否大于预设的时间长度阈值,若是,确定所述用户对所述目标文章感兴趣,否则确定所述用户对所述目标文章不感兴趣。
进一步可选地,如上所述的装置中,所述检测模块,具体用于:
根据所述目标文章的长度和预设的阅读速度,获取所述目标文章的标准阅读时间长度;
根据所述标准阅读时长和预设的兴趣度比例,获取比例阅读时长;
判断所述消耗时间长度是否大于或者等于所述比例阅读时长,若是,确定所述用户对所述目标文章感兴趣,否则确定所述用户对所述目标文章不感兴趣。
进一步可选地,如上所述的装置中,所述生成模块,具体用于:
将所述目标文章对应的多个目标知识点输入所述用户画像生成模型,使得所述用户画像生成模型预测得到所述用户的多个特征信息,所述用户的多个特征信息构成所述用户的画像。
进一步可选地,如上所述的装置中,所述装置还包括:
采集模块,用于采集数条训练数据,各所述训练数据中包括基于所述知识图谱从训练用户阅读的训练文章中获取的多个训练知识点、以及所述训练用户的多个已知特征信息;
训练模块,用于根据所述数条训练数据,训练所述用户画像生成模型。
本发明还提供一种计算机设备,所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的用户画像的生成方法。
本发明还提供一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的用户画像的生成方法。
本发明的用户画像的生成方法及装置、计算机设备及可读介质,当检测到用户对目标文章感兴趣时,通过提取目标文章的多个关键语句;根据多个关键语句,从预先建立的知识图谱中获取目标文章对应的多个目标知识点;根据目标文章对应的多个目标知识点和预先训练的用户画像生成模型,生成用户的画像。本发明的技术方案,能够弥补现有技术的不足,即使获取不到用户的注册信息、日志信息以及cookie和IP地址等,仍然可以基于知识图谱对用户阅读的感兴趣的文章进行分析,生成该用户的画像。本发明提出一种非常智能的用户画像的生成方案,使用非常方便。
【附图说明】
图1为本发明的用户画像的生成方法实施例的流程图。
图2为本发明的用户画像的生成装置实施例一的结构图。
图3为本发明的用户画像的生成装置实施例二的结构图。
图4为本发明的计算机设备实施例的结构图。
图5为本发明提供的一种计算机设备的示例图。
【具体实施方式】
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
图1为本发明的用户画像的生成方法实施例的流程图。如图1所示,本实施例的用户画像的生成方法,具体可以包括如下步骤:
100、当检测到用户对目标文章感兴趣时,提取目标文章的多个关键语句;
本实施例的用户画像的生成方法的执行主体为用户画像的生成装置。该用户画像的生成装置可以为一个独立的电子实体,基于知识图谱来生成用户的画像。
本实施例中,当检测到用户对目标文章感兴趣时,可以对目标文章进行类似于摘要句的提取,提取目标文章的多个关键语句。例如具体可以采用textrank技术,把目标文章中最重要的关键语句抽取到,得到多个关键语句。
101、根据多个关键语句,从预先建立的知识图谱中获取目标文章对应的多个目标知识点;
本实施例中的知识图谱为预先建立的,例如该知识图谱中可以包括多个知识点节点,多个知识点节点中的部分知识点之间具有相关性。例如与当前知识点具有相关性的知识点可以称之为上下文知识点。在该领域的所有知识点构成知识图谱对应的网络结构中,上下文知识点可以分别作为当前知识点的父节点的或者子节点。本实施例的知识图谱中,每个节点为一个知识点,例如“一元二次方程”、“蝴蝶效应”、“奢侈品”、“护肤品”、“软件开发”等等都可以作为知识点。本实施例中,可以预先采集多个领域的文章,提取文章的关键词或者关键句子作为知识点,并根据知识点之间的相关性关系,建立知识图谱。
根据上述步骤100提取目标文章的多个关键语句之后,根据知识图谱,获取每个关键语句对应的知识图谱中的知识点,作为目标文章对应的目标知识点。
例如,该步骤101,具体可以包括如下步骤:
(a1)计算各关键语句分别与预先建立的知识图谱中各知识点的相似度;
(b1)根据各关键语句分别与知识图谱中各知识点的相似度,从知识图谱中的多个知识点中筛选目标文章对应的多个目标知识点。
例如,对于提取的每个关键语句,可以计算该关键语句与知识图谱中所有知识点之间的相似度,这个相似度的计算可以参考相关现有技术中的句子与句子之间的相似度计算,或者词语与词语之间的相似度计算,在此不再赘述。然后根据每个关键语句与知识图谱中每个知识点的相似度,可以获取到与每个关键语句较为相似的知识点,作为目标知识点,从而可以获取到目标文章对应的多个目标知识点。
进一步可选地,步骤(b1)“根据各关键语句分别与知识图谱中各知识点的相似度,筛选目标文章对应的多个目标知识点”,具体可以包括如下两种方式:
第一种方式:根据各关键语句分别与知识图谱中各知识点的相似度,从知识图谱的所有知识点中筛选与对应的关键语句的相似度最大的知识点作为目标知识点,得到目标文章对应的多个目标知识点;
在第一种方式中,每一个关键语句仅对应一个目标知识点,具体可以根据该关键语句与知识图谱中各知识点的相似度,获取与该关键语句的相似度最大的知识点作为目标知识点。采用上述方式,获取每个关键语句对应的目标知识点,可以得到目标文章对应的多个目标知识点。
第二种方式:根据各关键语句分别与知识图谱中各知识点的相似度以及预设的相似度阈值,从知识图谱的所有知识点中筛选与对应的关键语句的相似度大于相似度阈值的知识点作为目标知识点,得到目标文章对应的多个目标知识点。
在第二种方式中,每一个关键语句可以对应一个以上的目标知识点,或者没有对应的目标知识点。具体地,可以设置有相似度阈值。对于每个关键语句,判断该关键语句与知识图谱中各知识点的相似度是否大于相似度阈值,若是,则将相似度大于相似度阈值的知识点作为该关键语句对应的目标知识点。否则该关键语句与知识图谱中各知识点的相似度均不大于相似度阈值,则此时该关键语句没有对应的目标知识点。采用上述方式,通过对每个关键语句进行处理,可以得到所有关键语句对应的目标知识点,即得到目标文章对应的多个目标知识点。
102、根据目标文章对应的多个目标知识点和预先训练的用户画像生成模型,生成用户的画像。
本实施例中根据目标文章对应的多个目标知识点来生成用户的画像。本实施例中生成的用户的画像可以包括用户的多个特征信息。例如,将目标文章对应的多个目标知识点输入用户画像生成模型,使得该用户画像生成模型预测得到用户的多个特征信息,用户的多个特征信息便构成用户的画像。
例如,本实施例的用户画像生成模型可以输出的用户的特征信息的数量的最大值为N个。这样,用户画像生成模型可以根据用户阅读的目标文章的多个知识点画出该用户的最多N个的特征信息。基于实事求是的原则,不是所有情况下,用户画像生成模型都可以准确预测用户的每一个特征,因此,对于每一个特征信息的预测,该用户画像生成模型可以预测到该用户具有该特征;或者还可以为无法确定用户是否具有该特征。例如对于用户性别特征的预测,根据用户阅读的目标文章,可以预测出该用户的性别为男、女或者无法确定。对于年龄特征的预测,可以预先设置有多个年龄段,如12-20,20-30,30-40,40-60以及无法确定。对于职业特征的预测,可以预先设置有多个职业,如教师、律师、工程师、会计或者其他,具体讲无法确定的职业都可以放入其他。实际应用中,用户的画像中还可以包括很多的其他特征信息,对于每一个特征信息,都可以按照上述方式,设置对应类似的分类,这样,根据用户的目标文章对应的多个目标知识点和用户画像生成模型,都可以生成该用户的特征信息,从而得到该用户的画像,进而可以根据用户的画像进行有效地广告推送或者其他业务服务的推送。
进一步可选地,本实施例的步骤102“根据目标文章对应的多个目标知识点和预先训练的用户画像生成模型,生成用户的画像”之前,还可以包括用户画像生成模型的训练步骤,例如,具体可以包括如下步骤:
(a2)采集数条训练数据,各训练数据中包括基于知识图谱从训练用户阅读的训练文章中获取的多个训练知识点、以及训练用户的多个已知特征信息;
(b2)根据数条训练数据,训练用户画像生成模型。
本实施例中,训练用户画像生成模型时,需要采集数条训练数据,每条训练数据中可以包括一个训练用户阅读训练文章时获取的多个训练知识点,其中训练知识点也是基于知识图谱获取的,获取过程可以参考上述步骤100和101的实施,在此不再赘述。另外,训练数据中还需要包括该训练用户的多个已知特征信息,这些已知特征信息都可以采集到。
然后利用数条训练数据,训练用户画像生成模型。训练时,该用户画像生成模型可以预先设置有初始参数,训练时,将各训练数据中的多个训练知识点输入至该用户画像生成模型中,该用户画像生成模型输出该用户的多个特征信息,然后检测输出的该用户的多个特征信息中的每一个特征是否与该用户的已知的该特征一致,若不一致,调整该用户画像生成模型的参数,使得用户画像生成模型输出的该用户的特征与该用户的已知特征一致。通过采用上述方式利用数条训练数据不断地对用户画像生成模型进行训练,直到用户画像生成模型输出的用户特征与该用户已知特征一致,确定用户画像生成模型的参数,从而确定用户画像生成模型,则用户画像生成模型训练完毕。
由于不是所有情况下,用户画像生成模型都可以准确预测用户的每一个特征,同理,在训练时,也需要考虑此种情况的存在。即对于每一个特征,训练时也可以采集不确定情况的数据,来训练该不确定情况的存在。例如对于用户性别特征的训练,需要分别采集根据用户阅读的文章能够确定性别为男、或者女的训练数据,还需要采集根据阅读文章无法确定性别的训练数据。同理,对于年龄特征的训练,除了采集已有年龄段的训练数据,还需要采集可以根据阅读文章无法确定年龄段的训练数据。同理,对于职业特征的训练,除了采集已知职业的训练数据,还需要采集可以根据阅读文章无法确定职业类别即其他职业的训练数据。因此,本实施例中,采集的训练数据中需要兼顾每一个特征中每个分类,以保证训练数据训练的用户画像生成模型的准确性。实际应用中,训练数据的数量越丰富,训练的用户画像生成模型越准确。
根据上述描述,可以得知,本实施例的用户画像生成模型类似于将预测用户多个特征的模型集成在一起,能够对用户的多个特征进行预测,从而实现用户的画像。
进一步可选地,本实施例的用户画像的生成方法中,在该步骤100中检测到用户对目标文章感兴趣之前,还可以包括如下步骤:
(a3)获取用户阅读目标文章的消耗时间长度;
(b3)基于消耗时间长度,检测用户是否对目标文章感兴趣。
具体地,本实施例中,可以检测用户打开目标文章之后,界面在目标文章上停留的时间长度,作为消耗时间长度。然后基于用户阅读目标文章的消耗时间长度来判断用户是否对目标文章感兴趣。
例如,该步骤(b3)“基于消耗时间长度,检测用户是否对目标文章感兴趣”,具体可以包括如下两种方式:
第一种方式:判断消耗时间长度是否大于预设的时间长度阈值,若是,确定用户对目标文章感兴趣,否则确定用户对目标文章不感兴趣。
本实施例中,可以设置一个对所有文章都适用的预设的时间长度阈值。当用户阅读的某文章的消耗时间长度大于预设的时间长度阈值,则认为用户对该文章感兴趣,否则认为用户对该文章不感兴趣。采用该种方式,可以确定用户是否该目标文章感兴趣。
第二种方式具体可以包括如下步骤:
(a4)根据目标文章的长度和预设的阅读速度,获取目标文章的标准阅读时间长度;
(b4)根据标准阅读时长和预设的兴趣度比例,获取比例阅读时长;
(c4)判断消耗时间长度是否大于或者等于比例阅读时长,若是,确定用户对目标文章感兴趣,否则确定用户对目标文章不感兴趣。
在该方式中,对于不同长度的文章可以采用不同的标准来确定用户是否对该文章感兴趣。本实施例中的目标文章的长度采用目标文章的字数来表示。例如,对于用户阅读的每个目标文章,可以获取到该目标文章的总字数,即目标文章的长度。然后还可以根据经验设置一个预设的阅读速度,该阅读速度可以为每秒阅读的字数或者每分钟阅读的字数。然后利用目标文章的长度除以预设的阅读速度,便可以得到目标文章的标准阅读时间长度。
本实施例中,可以设置预设的兴趣度比例。本实施例中,用户即使未阅读完整个目标文章,但是阅读的时长达到兴趣度比例对应的比例阅读时长,也可以认为用户对该目标文章时有兴趣的。具体地,可以利用标准阅读时长乘以预设的兴趣度比例,得到比例阅读时长。然后判断消耗时间长度是否大于或者等于比例阅读时长,若是,则认为用户阅读一定时间长度的该目标文章,且对该目标文章时有兴趣的,此时可以确定用户对目标文章感兴趣,否则确定用户对目标文章不感兴趣。本实施例中的预设的兴趣度比例可以为1,即此时要求用户阅读的消耗时间长度大约等于用户按照标准的阅读速度阅读完整个目标文章。或者该预设的兴趣度比例也可以小于1,例如4/5,2/3或者其他小于1比例,此时即使只要用户阅读的消耗时间长度达到该预设的兴趣度比例对应的比例阅读时长,就可以认为该用户对该目标文章是有兴趣的。
本实施例的用户画像的生成方法的应用场景为:当无法获取用户的注册信息、日志信息以及cookie和IP地址等基本信息时,可以借助于用户阅读的文章,并基于预先建立的知识图谱中获取用户阅读的文章对应的多个知识点,从而根据用户阅读的文章对应的多个知识点和预先训练的用户画像生成模型,生成用户的画像。本实施例的用户的画像中可以包括用户的多个特征信息,如用户的年龄、性别、用户的人生阶段、所在行业、收入水平、消费水平、婚姻状况以及兴趣爱好等等中的至少一个特征。
本实施例的用户画像的生成方法,当检测到用户对目标文章感兴趣时,通过提取目标文章的多个关键语句;根据多个关键语句,从预先建立的知识图谱中获取目标文章对应的多个目标知识点;根据目标文章对应的多个目标知识点和预先训练的用户画像生成模型,生成用户的画像。本实施例中的技术方案,能够弥补现有技术的不足,即使获取不到用户的注册信息、日志信息以及cookie和IP地址等,仍然可以基于知识图谱对用户阅读的感兴趣的文章进行分析,生成该用户的画像。本实施例提出一种非常智能的用户画像的生成方案,使用非常方便。
图2为本发明的用户画像的生成装置实施例一的结构图。如图2所示,本实施例的用户画像的生成装置,具体可以包括:
提取模块10用于当检测到用户对目标文章感兴趣时,提取目标文章的多个关键语句;
获取模块11用于根据提取模块10提取的多个关键语句,从预先建立的知识图谱中获取目标文章对应的多个目标知识点;
生成模块12用于根据获取模块11获取的目标文章对应的多个目标知识点和预先训练的用户画像生成模型,生成用户的画像。
本实施例的用户画像的生成装置,通过采用上述模块实现用户画像的生成的实现原理以及技术效果与上述相关方法实施例的实现相同,详细可以参考上述相关方法实施例的记载,在此不再赘述。
图3为本发明的用户画像的生成装置实施例二的结构图。如图3所示,本实施例的用户画像的生成装置在上述图2所示实施例的技术方案的基础上,进一步更加详细地介绍本发明的技术方案。
本实施例的用户画像的生成装置中,获取模块11具体用于:
计算各关键语句分别与预先建立的知识图谱中各知识点的相似度;
根据各关键语句分别与知识图谱中各知识点的相似度,筛选目标文章对应的多个目标知识点。
进一步可选地,本实施例的用户画像的生成装置中,获取模块11具体用于:
根据各关键语句分别与知识图谱中各知识点的相似度,从知识图谱的所有知识点中筛选与对应的关键语句的相似度最大的知识点作为目标知识点,得到目标文章对应的多个目标知识点;
或者,根据各关键语句分别与知识图谱中各知识点的相似度以及预设的相似度阈值,从知识图谱的所有知识点中筛选与对应的关键语句的相似度大于相似度阈值的知识点作为目标知识点,得到目标文章对应的多个目标知识点。
如图3所示,进一步可选地,本实施例的用户画像的生成装置中,还包括检测模块13
获取模块11还用于当检测到用户对目标文章感兴趣之前,获取用户阅读目标文章的消耗时间长度;
检测模块13用于基于获取模块11获取的消耗时间长度,检测用户是否对目标文章感兴趣。
进一步可选地,本实施例的用户画像的生成装置中,检测模块13具体用于:
判断消耗时间长度是否大于预设的时间长度阈值,若是,确定用户对目标文章感兴趣,否则确定用户对目标文章不感兴趣。
进一步可选地,本实施例的用户画像的生成装置中,检测模块13具体用于:
根据目标文章的长度和预设的阅读速度,获取目标文章的标准阅读时间长度;
根据标准阅读时长和预设的兴趣度比例,获取比例阅读时长;
判断消耗时间长度是否大于或者等于比例阅读时长,若是,确定用户对目标文章感兴趣,否则确定用户对目标文章不感兴趣。
进一步可选地,本实施例的用户画像的生成装置中,生成模块12具体用于:
将获取模块11获取的目标文章对应的多个目标知识点输入用户画像生成模型,使得用户画像生成模型预测得到用户的多个特征信息,用户的多个特征信息构成用户的画像。
如图3所示,进一步可选地,本实施例的用户画像的生成装置中,还包括:
采集模块14用于采集数条训练数据,各训练数据中包括基于知识图谱从训练用户阅读的训练文章中获取的多个训练知识点、以及训练用户的多个已知特征信息;
训练模块15用于根据数条训练数据,训练用户画像生成模型。
对应地,生成模块12用于根据获取模块11获取的目标文章对应的多个目标知识点和训练模块15预先训练的用户画像生成模型,生成用户的画像。
本实施例的用户画像的生成装置,通过采用上述模块实现用户画像的生成的实现原理以及技术效果与上述相关方法实施例的实现相同,详细可以参考上述相关方法实施例的记载,在此不再赘述。
图4为本发明的计算机设备实施例的结构图。如图4所示,本实施例的计算机设备,包括:一个或多个处理器30,以及存储器40,存储器40用于存储一个或多个程序,当存储器40中存储的一个或多个程序被一个或多个处理器30执行,使得一个或多个处理器30实现如上图1所示实施例的用户画像的生成方法。图4所示实施例中以包括多个处理器30为例。
例如,图5为本发明提供的一种计算机设备的示例图。图5示出了适于用来实现本发明实施方式的示例性计算机设备12a的框图。图5显示的计算机设备12a仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,计算机设备12a以通用计算设备的形式表现。计算机设备12a的组件可以包括但不限于:一个或者多个处理器16a,系统存储器28a,连接不同系统组件(包括系统存储器28a和处理器16a)的总线18a。
总线18a表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机设备12a典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12a访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28a可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30a和/或高速缓存存储器32a。计算机设备12a可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34a可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18a相连。系统存储器28a可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明上述图1-图3各实施例的功能。
具有一组(至少一个)程序模块42a的程序/实用工具40a,可以存储在例如系统存储器28a中,这样的程序模块42a包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42a通常执行本发明所描述的上述图1-图3各实施例中的功能和/或方法。
计算机设备12a也可以与一个或多个外部设备14a(例如键盘、指向设备、显示器24a等)通信,还可与一个或者多个使得用户能与该计算机设备12a交互的设备通信,和/或与使得该计算机设备12a能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22a进行。并且,计算机设备12a还可以通过网络适配器20a与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20a通过总线18a与计算机设备12a的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12a使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理器16a通过运行存储在系统存储器28a中的程序,从而执行各种功能应用以及数据处理,例如实现上述实施例所示的用户画像的生成方法。
本发明还提供一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例所示的用户画像的生成方法。
本实施例的计算机可读介质可以包括上述图5所示实施例中的系统存储器28a中的RAM30a、和/或高速缓存存储器32a、和/或存储系统34a。
随着科技的发展,计算机程序的传播途径不再受限于有形介质,还可以直接从网络下载,或者采用其他方式获取。因此,本实施例中的计算机可读介质不仅可以包括有形的介质,还可以包括无形的介质。
本实施例的计算机可读介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (18)

1.一种用户画像的生成方法,其特征在于,所述方法包括:
当检测到用户对目标文章感兴趣时,提取所述目标文章的多个关键语句;
根据所述多个关键语句,从预先建立的知识图谱中获取所述目标文章对应的多个目标知识点;
根据所述目标文章对应的多个目标知识点和预先训练的用户画像生成模型,生成所述用户的画像。
2.根据权利要求1所述的方法,其特征在于,根据所述多个关键语句,从预先建立的知识图谱中获取所述目标文章对应的多个目标知识点,具体包括:
计算各所述关键语句分别与预先建立的知识图谱中各知识点的相似度;
根据各所述关键语句分别与所述知识图谱中各知识点的相似度,筛选所述目标文章对应的多个目标知识点。
3.根据权利要求2所述的方法,其特征在于,根据各所述关键语句分别与所述知识图谱中各知识点的相似度,筛选所述目标文章对应的多个目标知识点,具体包括:
根据各所述关键语句分别与所述知识图谱中各知识点的相似度,从所述知识图谱的所有知识点中筛选与对应的所述关键语句的相似度最大的知识点作为所述目标知识点,得到所述目标文章对应的多个目标知识点;
或者,根据各所述关键语句分别与所述知识图谱中各知识点的相似度以及预设的相似度阈值,从所述知识图谱的所有知识点中筛选与对应的所述关键语句的相似度大于所述相似度阈值的知识点作为所述目标知识点,得到所述目标文章对应的多个目标知识点。
4.根据权利要求1所述的方法,其特征在于,当检测到用户对目标文章感兴趣之前,所述方法还包括:
获取所述用户阅读所述目标文章的消耗时间长度;
基于所述消耗时间长度,检测所述用户是否对所述目标文章感兴趣。
5.根据权利要求4所述的方法,其特征在于,基于所述消耗时间长度,检测所述用户是否对所述目标文章感兴趣,具体包括:
判断所述消耗时间长度是否大于预设的时间长度阈值,若是,确定所述用户对所述目标文章感兴趣,否则确定所述用户对所述目标文章不感兴趣。
6.根据权利要求4所述的方法,其特征在于,基于所述消耗时间长度,检测所述用户是否对所述目标文章感兴趣,具体包括:
根据所述目标文章的长度和预设的阅读速度,获取所述目标文章的标准阅读时间长度;
根据所述标准阅读时长和预设的兴趣度比例,获取比例阅读时长;
判断所述消耗时间长度是否大于或者等于所述比例阅读时长,若是,确定所述用户对所述目标文章感兴趣,否则确定所述用户对所述目标文章不感兴趣。
7.根据权利要求1所述的方法,其特征在于,根据所述目标文章对应的多个目标知识点和预先训练的用户画像生成模型,生成所述用户的画像,具体包括:
将所述目标文章对应的多个目标知识点输入所述用户画像生成模型,使得所述用户画像生成模型预测得到所述用户的多个特征信息,所述用户的多个特征信息构成所述用户的画像。
8.根据权利要求1所述的方法,其特征在于,根据所述目标文章对应的多个目标知识点和预先训练的用户画像生成模型,生成所述用户的画像之前,所述方法还包括:
采集数条训练数据,各所述训练数据中包括基于所述知识图谱从训练用户阅读的训练文章中获取的多个训练知识点、以及所述训练用户的多个已知特征信息;
根据所述数条训练数据,训练所述用户画像生成模型。
9.一种用户画像的生成装置,其特征在于,所述装置包括:
提取模块,用于当检测到用户对目标文章感兴趣时,提取所述目标文章的多个关键语句;
获取模块,用于根据所述多个关键语句,从预先建立的知识图谱中获取所述目标文章对应的多个目标知识点;
生成模块,用于根据所述目标文章对应的多个目标知识点和预先训练的用户画像生成模型,生成所述用户的画像。
10.根据权利要求9所述的装置,其特征在于,所述获取模块,具体用于:
计算各所述关键语句分别与预先建立的知识图谱中各知识点的相似度;
根据各所述关键语句分别与所述知识图谱中各知识点的相似度,筛选所述目标文章对应的多个目标知识点。
11.根据权利要求10所述的装置,其特征在于,所述获取模块,具体用于:
根据各所述关键语句分别与所述知识图谱中各知识点的相似度,从所述知识图谱的所有知识点中筛选与对应的所述关键语句的相似度最大的知识点作为所述目标知识点,得到所述目标文章对应的多个目标知识点;
或者,根据各所述关键语句分别与所述知识图谱中各知识点的相似度以及预设的相似度阈值,从所述知识图谱的所有知识点中筛选与对应的所述关键语句的相似度大于所述相似度阈值的知识点作为所述目标知识点,得到所述目标文章对应的多个目标知识点。
12.根据权利要求9所述的装置,其特征在于,所述装置还包括检测模块:
所述获取模块,还用于当检测到用户对目标文章感兴趣之前,获取所述用户阅读所述目标文章的消耗时间长度;
所述检测模块,用于基于所述消耗时间长度,检测所述用户是否对所述目标文章感兴趣。
13.根据权利要求12所述的装置,其特征在于,所述检测模块,具体用于:
判断所述消耗时间长度是否大于预设的时间长度阈值,若是,确定所述用户对所述目标文章感兴趣,否则确定所述用户对所述目标文章不感兴趣。
14.根据权利要求12所述的装置,其特征在于,所述检测模块,具体用于:
根据所述目标文章的长度和预设的阅读速度,获取所述目标文章的标准阅读时间长度;
根据所述标准阅读时长和预设的兴趣度比例,获取比例阅读时长;
判断所述消耗时间长度是否大于或者等于所述比例阅读时长,若是,确定所述用户对所述目标文章感兴趣,否则确定所述用户对所述目标文章不感兴趣。
15.根据权利要求9所述的装置,其特征在于,所述生成模块,具体用于:
将所述目标文章对应的多个目标知识点输入所述用户画像生成模型,使得所述用户画像生成模型预测得到所述用户的多个特征信息,所述用户的多个特征信息构成所述用户的画像。
16.根据权利要求9所述的装置,其特征在于,所述装置还包括:
采集模块,用于采集数条训练数据,各所述训练数据中包括基于所述知识图谱从训练用户阅读的训练文章中获取的多个训练知识点、以及所述训练用户的多个已知特征信息;
训练模块,用于根据所述数条训练数据,训练所述用户画像生成模型。
17.一种计算机设备,其特征在于,所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
18.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。
CN201711407335.5A 2017-12-22 2017-12-22 用户画像的生成方法及装置、计算机设备及可读介质 Active CN110019837B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711407335.5A CN110019837B (zh) 2017-12-22 2017-12-22 用户画像的生成方法及装置、计算机设备及可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711407335.5A CN110019837B (zh) 2017-12-22 2017-12-22 用户画像的生成方法及装置、计算机设备及可读介质

Publications (2)

Publication Number Publication Date
CN110019837A true CN110019837A (zh) 2019-07-16
CN110019837B CN110019837B (zh) 2021-07-16

Family

ID=67187146

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711407335.5A Active CN110019837B (zh) 2017-12-22 2017-12-22 用户画像的生成方法及装置、计算机设备及可读介质

Country Status (1)

Country Link
CN (1) CN110019837B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111079056A (zh) * 2019-10-11 2020-04-28 深圳壹账通智能科技有限公司 提取用户画像的方法、装置、计算机设备和存储介质
CN112446741A (zh) * 2020-12-10 2021-03-05 华院数据技术(上海)有限公司 一种基于概率知识图谱的用户画像方法及系统
CN115248890A (zh) * 2021-04-27 2022-10-28 百度国际科技(深圳)有限公司 用户兴趣画像的生成方法、装置、电子设备以及存储介质
CN116205612A (zh) * 2023-05-04 2023-06-02 国网山东省电力公司滨州市沾化区供电公司 辅助生成电网维护方案的方法、系统、终端及存储介质
CN118093865A (zh) * 2024-01-02 2024-05-28 厦门中卡科技股份有限公司 基于知识图谱的客户画像方法及系统

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2354089A (en) * 1999-09-08 2001-03-14 Sony Uk Ltd Artificial intelligence user profiling
CN101034997A (zh) * 2006-03-09 2007-09-12 新数通兴业科技(北京)有限公司 一种数据信息精确发布的方法和系统
US20090254971A1 (en) * 1999-10-27 2009-10-08 Pinpoint, Incorporated Secure data interchange
CN102141986A (zh) * 2010-01-28 2011-08-03 北京邮电大学 基于用户行为的个性化信息提供方法及系统
US20120109956A1 (en) * 2010-10-29 2012-05-03 Yahoo! Inc. Profile prediction for shared computers
CN102819555A (zh) * 2012-06-27 2012-12-12 北京奇虎科技有限公司 一种在网页的阅读模式中进行推荐信息加载的方法和装置
CN103186565A (zh) * 2011-12-28 2013-07-03 中国移动通信集团浙江有限公司 根据用户网页浏览行为判断用户偏好的方法及装置
CN103761296A (zh) * 2014-01-20 2014-04-30 北京集奥聚合科技有限公司 移动终端用户网络行为分析方法及系统
CN104182516A (zh) * 2014-08-21 2014-12-03 北京金山安全软件有限公司 信息推荐方法、装置和移动终端
CN104317822A (zh) * 2014-09-29 2015-01-28 新浪网技术(中国)有限公司 网络用户的人口属性预测方法和装置
CN105068661A (zh) * 2015-09-07 2015-11-18 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法和系统
CN105608171A (zh) * 2015-12-22 2016-05-25 青岛海贝易通信息技术有限公司 用户画像构建方法
CN105849765A (zh) * 2013-12-31 2016-08-10 谷歌公司 生成新闻时间线和推荐的新闻版本

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2354089A (en) * 1999-09-08 2001-03-14 Sony Uk Ltd Artificial intelligence user profiling
US20090254971A1 (en) * 1999-10-27 2009-10-08 Pinpoint, Incorporated Secure data interchange
CN101034997A (zh) * 2006-03-09 2007-09-12 新数通兴业科技(北京)有限公司 一种数据信息精确发布的方法和系统
CN102141986A (zh) * 2010-01-28 2011-08-03 北京邮电大学 基于用户行为的个性化信息提供方法及系统
US20120109956A1 (en) * 2010-10-29 2012-05-03 Yahoo! Inc. Profile prediction for shared computers
CN103186565A (zh) * 2011-12-28 2013-07-03 中国移动通信集团浙江有限公司 根据用户网页浏览行为判断用户偏好的方法及装置
CN102819555A (zh) * 2012-06-27 2012-12-12 北京奇虎科技有限公司 一种在网页的阅读模式中进行推荐信息加载的方法和装置
CN105849765A (zh) * 2013-12-31 2016-08-10 谷歌公司 生成新闻时间线和推荐的新闻版本
CN103761296A (zh) * 2014-01-20 2014-04-30 北京集奥聚合科技有限公司 移动终端用户网络行为分析方法及系统
CN104182516A (zh) * 2014-08-21 2014-12-03 北京金山安全软件有限公司 信息推荐方法、装置和移动终端
CN104317822A (zh) * 2014-09-29 2015-01-28 新浪网技术(中国)有限公司 网络用户的人口属性预测方法和装置
CN105068661A (zh) * 2015-09-07 2015-11-18 百度在线网络技术(北京)有限公司 基于人工智能的人机交互方法和系统
CN105608171A (zh) * 2015-12-22 2016-05-25 青岛海贝易通信息技术有限公司 用户画像构建方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PAVAN KAPANIPATHI 等: "User Interests Identification on Twitter Using a Hierarchical Knowledge Base", 《THE SEMANTIC WEB: TRENDS AND CHALLENGES. ESWC 2014. LECTURE NOTES IN COMPUTER SCIENCE》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111079056A (zh) * 2019-10-11 2020-04-28 深圳壹账通智能科技有限公司 提取用户画像的方法、装置、计算机设备和存储介质
CN112446741A (zh) * 2020-12-10 2021-03-05 华院数据技术(上海)有限公司 一种基于概率知识图谱的用户画像方法及系统
CN112446741B (zh) * 2020-12-10 2022-02-15 华院计算技术(上海)股份有限公司 一种基于概率知识图谱的用户画像方法及系统
CN115248890A (zh) * 2021-04-27 2022-10-28 百度国际科技(深圳)有限公司 用户兴趣画像的生成方法、装置、电子设备以及存储介质
CN115248890B (zh) * 2021-04-27 2024-04-05 百度国际科技(深圳)有限公司 用户兴趣画像的生成方法、装置、电子设备以及存储介质
CN116205612A (zh) * 2023-05-04 2023-06-02 国网山东省电力公司滨州市沾化区供电公司 辅助生成电网维护方案的方法、系统、终端及存储介质
CN118093865A (zh) * 2024-01-02 2024-05-28 厦门中卡科技股份有限公司 基于知识图谱的客户画像方法及系统
CN118093865B (zh) * 2024-01-02 2024-09-06 厦门中卡科技股份有限公司 基于知识图谱的客户画像方法及系统

Also Published As

Publication number Publication date
CN110019837B (zh) 2021-07-16

Similar Documents

Publication Publication Date Title
CN110019837A (zh) 用户画像的生成方法及装置、计算机设备及可读介质
CN109697435B (zh) 人流量监测方法、装置、存储介质及设备
US10936906B2 (en) Training data acquisition method and device, server and storage medium
US20190026605A1 (en) Neural network model training method and apparatus, living body detecting method and apparatus, device and storage medium
JP2018118144A5 (ja) 脳活動解析システム及び方法
Chen et al. Discovering informative social subgraphs and predicting pairwise relationships from group photos
EP2698685A2 (en) Using physical sensory input to determine human response to multimedia content displayed on a mobile device
CN114648392B (zh) 基于用户画像的产品推荐方法、装置、电子设备及介质
CN107909088B (zh) 获取训练样本的方法、装置、设备和计算机存储介质
US11842278B2 (en) Object detector trained via self-supervised training on raw and unlabeled videos
CN110197389A (zh) 一种用户识别方法及装置
US9241664B2 (en) Using physical sensory input to determine human response to multimedia content displayed on a mobile device
CN107729473B (zh) 文章推荐方法及其装置
US20220253647A1 (en) Automatic machine learning model evaluation
CN108629358A (zh) 对象类别的预测方法及装置
WO2022148391A1 (zh) 模型训练及数据检测方法、装置、设备及介质
CN106709318A (zh) 一种用户设备唯一性的识别方法、装置和计算设备
CN105094292A (zh) 评价用户关注度的方法和设备
WO2018033052A1 (zh) 一种评估用户画像数据的方法及系统
CN115391670B (zh) 一种基于知识图谱的互联网行为分析方法与系统
CN110232277A (zh) 网页后门的检测方法、装置和计算机设备
WO2019133164A1 (en) System and method for recommending features for content presentations
CN108268602A (zh) 分析文本话题点的方法、装置、设备和计算机存储介质
CN110023984A (zh) 用于汇总内容的电子设备和方法
Yang et al. Student Classroom Behavior Detection Based on YOLOv7+ BRA and Multi-model Fusion

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant