CN113139085B - 用户兴趣的挖掘方法及系统 - Google Patents

用户兴趣的挖掘方法及系统 Download PDF

Info

Publication number
CN113139085B
CN113139085B CN202010063555.6A CN202010063555A CN113139085B CN 113139085 B CN113139085 B CN 113139085B CN 202010063555 A CN202010063555 A CN 202010063555A CN 113139085 B CN113139085 B CN 113139085B
Authority
CN
China
Prior art keywords
video
user
interest category
interest
video operation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010063555.6A
Other languages
English (en)
Other versions
CN113139085A (zh
Inventor
牛心怡
吴安新
王瑜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Bilibili Technology Co Ltd
Original Assignee
Shanghai Bilibili Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Bilibili Technology Co Ltd filed Critical Shanghai Bilibili Technology Co Ltd
Priority to CN202010063555.6A priority Critical patent/CN113139085B/zh
Publication of CN113139085A publication Critical patent/CN113139085A/zh
Application granted granted Critical
Publication of CN113139085B publication Critical patent/CN113139085B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种用户兴趣的挖掘方法及系统,该方法包括:获取用户在预设时间内输入的多种视频操作和每种视频操作对应的视频信息;根据所述视频信息确定所述视频信息所属的兴趣类别;统计每个用户在每种兴趣类别中执行每种视频操作的次数和每种视频操作的总执行次数;根据每种视频操作的总执行次数,计算每个用户在每种兴趣类别的分值;根据所述分值确定与所述分值对应的用户对应的兴趣类别。本发明能够充分利用用户的视频数据,有效的挖掘用户的客观兴趣偏好,进而提高兴趣类别的召回率和人群区分度。

Description

用户兴趣的挖掘方法及系统
技术领域
本发明涉及数据处理技术领域,具体涉及一种用户兴趣的挖掘方法及系统。
背景技术
随着科学技术的迅猛发展,互联网已经成为人们生活中不可或缺的重要组成部分。通过互联网收集用户操作视频的行为,可对具有类似视频操作行为的用户进行对应互联网产品的投放。现有技术中,根据用户兴趣类别对用户进行互联网产品的投放是各大互联网投放平台使用率最高的投放依据。因此,挖掘用户的兴趣类别,丰富用户画像,对于提高客户投放效率具有重要意义。
现有的用户兴趣挖掘方案大多基于用户的广告行为数据来挖掘用户的兴趣类别,但是存在以下缺陷:
1)、广告数据投放不均匀,导致用户的广告行为不均匀,不具有客观性;
2)、对于没有投放记录的兴趣类别的广告,无法召回相应的用户;
3)、对于有投放记录的兴趣类别的广告,大多数的兴趣类别存在严重过度召回的问题,使得标签人群没有区分度。
发明内容
本发明的目的在于提供一种用户兴趣的挖掘方法、系统、计算机设备及可读存储介质,用于解决现有技术中由于兴趣类别标签少,兴趣类别标签无法召回,标签人群区分度低的缺陷。
根据本发明的一个方面,提供了一种用户兴趣的挖掘方法,该方法包括如下步骤:
获取用户在预设时间内输入的多种视频操作和每种视频操作对应的视频信息;
根据所述视频信息确定所述视频信息所属的兴趣类别;
统计每个用户在每种兴趣类别中执行每种视频操作的次数和每种视频操作的总执行次数;
根据每个用户在每种兴趣类别中执行每种视频操作的次数和每种视频操作的总执行次数,计算每个用户在每种兴趣类别的分值;
根据所述分值确定与所述分值对应的用户对应的兴趣类别。
可选的,所述根据所述视频信息确定所述视频信息所属的兴趣类别,包括:
将所述视频信息进行处理,以从所述视频信息中提取出核心词;
将所述核心词与预设的多个兴趣类别中的预设核心词进行相似度计算,以根据计算结果确定所述视频信息所属的兴趣类别。
可选的,所述将所述视频信息进行处理,以从所述视频信息中提取出核心词,包括:
将所述视频信息进行分词处理以得到分词结果;
将所述分词结果进行词义识别,以筛选出具有词义的关键词;
将所述关键词与预设词库中的词语进行匹配;
当匹配成功时,则确定所述关键词为所述核心词。
可选的,所述将所述核心词与预设的多个兴趣类别中的预设核心词进行相似度计算,以根据计算结果确定所述视频信息所属的兴趣类别,包括:
将所述核心词与所述预设核心词分别进行词向量处理,以得到与所述核心词对应的第一词向量和与所述预设核心词对应的第二词向量;
利用余弦相似度算法计算所述第一词向量和所述第二词向量的相似度;
当所述相似度高于预设相似度时,则确定所述视频信息属于所述预设核心词对应的目标兴趣类别,并将所述核心词加入至所述预设词库中。
可选的,所述根据每个用户在每种兴趣类别中执行每种视频操作的次数和每种视频操作的总执行次数,计算每个用户在每种兴趣类别的分值,包括:
根据每种视频操作的总执行次数确定对应的视频操作的权重;
根据每个用户在每种兴趣类别中执行每种视频操作的次数和所述对应的视频操作的权重,计算每个用户在每种兴趣类别的分值,计算公式为:
Figure BDA0002375267160000031
其中,j表示第j种兴趣类别,Cj表示每个用户在所述第j种兴趣类别的分值,N表示视频操作种数,i表示第i种视频操作,ki,j表示每个用户执行所述第j种兴趣类别中所述第i种视频操作的次数,wi表示所述第i种视频操作的权重。
可选的,所述根据每种视频操作的总执行次数确定对应的视频操作的权重,包括:
将每种视频操作的次数进行倒数计算,并得到每种视频操作的倒数计算结果;
将每种视频操作的倒数计算结果进行比例计算,以得到每种视频操作相应的权重。
可选的,所述根据所述分值确定与所述分值对应的用户对应的兴趣类别,包括:
将所述分值分别与多个兴趣类别的预设分值进行比较;
当所述分值高于所述预设分值时,则确定所述用户为与所述预设分值对应的兴趣类别。
为了实现上述目的,本发明还提供一种用户兴趣的挖掘系统,该系统具体包括以下组成部分:
获取模块,用于获取用户在预设时间内输入的多种视频操作和每种视频操作对应的视频信息;
第一确定模块,用于根据所述视频信息确定所述视频信息所属的兴趣类别;
统计模块,用于统计每个用户在每种兴趣类别中执行每种视频操作的次数和每种视频操作的总执行次数;
计算模块,用于根据每个用户在每种兴趣类别中执行每种视频操作的次数和每种视频操作的总执行次数,计算每个用户在每种兴趣类别的分值;
第二确定模块,用于根据所述分值确定与所述分值对应的用户对应的兴趣类别。
为了实现上述目的,本发明还提供一种计算机设备,该计算机设备具体包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述介绍的用户兴趣的挖掘方法的步骤。
为了实现上述目的,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述介绍的用户兴趣的挖掘方法的步骤。
本发明提供的用户兴趣的挖掘方法、系统、计算机设备及可读存储介质,通过用户在预设时间内的视频操作以及视频操作对应的视频信息,确定视频信息所属的兴趣类别,然后,统计每个用户在每种兴趣类别中执行每种视频操作的次数和每种视频操作的总执行次数,接着,根据每个用户在每种兴趣类别中执行每种视频操作的次数和每种视频操作的总执行次数,计算每个用户在每种兴趣类别的分值,最后,根据计算的分值确定每个用户对应的兴趣类别,能够充分利用用户的视频数据,有效的挖掘用户的客观兴趣偏好,进而提高兴趣类别的召回率和人群区分度。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本公开实施例提供的用户兴趣的挖掘方法的一种可选的应用环境图;
图2为本公开实施例提供的用户兴趣的挖掘方法的一种可选的流程示意图;
图3为所述图2中步骤S102的一种可选的具体流程示意图;
图4为所述图3中步骤S200的一种可选的具体流程示意图;
图5为所述图3中步骤S202的一种可选的具体流程示意图;
图6为所述图2中步骤S106的一种可选的具体流程示意图;
图7为所述图6中步骤S500的一种可选的具体流程示意图;
图8为所述图2中步骤S108的一种可选的具体流程示意图;
图9为本公开实施例提供的用户兴趣的挖掘系统的一种可选的程序模块示意图;
图10为本公开实施例提供的计算机设备的一种可选的硬件架构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合附图对本发明提供的用户兴趣的挖掘方法进行说明。
图1为本发明实施例用户兴趣的挖掘方法的一种可选的应用环境图。图1中服务器与多个终端进行通信连接。当终端接收用户输入的视频操作时,将该视频操作和与视频操作对应的视频信息上传至所述服务器,所述服务器接收该视频操作和与视频操作对应的视频信息,并对接收到的视频操作和视频信息进行处理,以得到用户感兴趣的视频类型,然后,将对应视频类型中的视频信息推送给该终端,以供用户查看。例如:将对应的广告信息推送给对应的终端用户。
图2为本发明用户兴趣的挖掘方法的一种可选的流程示意图。可以理解,本方法实施例中的流程图不用于对执行步骤的顺序进行限定,下面以计算机设备为执行主体进行示例性描述。所述计算机设备可以是移动电话、平板个人计算机(tablet personalcomputer)、膝上型计算机(laptop computer)、服务器等具有数据传输功能的设备。
如图2所示,该方法具体包括步骤S100~S108。
步骤S100:获取用户在预设时间内输入的多种视频操作和每种视频操作对应的视频信息。所述视频操作信息至少包括:播放所述视频、点赞所述视频、投币所述视频、收藏所述视频和分享所述视频。
具体地,当用户在预设时间(例如:一个月)内对至少一个视频执行过至少一次播放操作、点赞操作、投币操作、收藏操作和/或分享操作时,则所述计算机设备获取所述视频操作和与所述视频操作对应的视频信息。
需要说明的是,用户对不同视频的感兴趣程度的不同,可能有多次重复播放视频、多次分享过同一视频和通过播放、点赞、投币、收藏和分享同一视频的情况,故,所述计算机设备均需获取该些视频操作和与所述视频操作对应的视频信息。例如:播放视频A10次,同时对视频A分享、点赞和收藏各1次;播放视频B 20次,对视频B分享5次,对视频B点赞、投币和收藏各1次,则所述计算机设备需获取视频A和视频B的所有视频操作。
步骤S102:根据所述视频信息确定所述视频信息所属的兴趣类别。
具体地,根据视频信息的不同,视频信息有各自的兴趣类别,进而可根据视频信息确定所述视频信息所属的兴趣类别。例如:根据观看的视频的标题确定该视频信息为护肤兴趣类别的广告,还是娱乐兴趣类别的广告,还是新闻时事兴趣类别的视频等等。
在示例性的实施例中,如图3所示,所述步骤S102可以包括步骤S200~S202。
步骤S200:将所述视频信息进行处理,以从所述视频信息中提取出核心词。
示例性地,视频信息为一个关于视频内容的描述性语句,通过将该描述性的语句进行处理,以从该描述性的语句中提取出核心词。
在示例性的实施例中,如图4所示,所述步骤S200可以包括步骤S300~S306。
步骤S300:将所述视频信息进行分词处理以得到分词结果。
步骤S302:将所述分词结果进行词义识别,以筛选出具有词义的关键词。
步骤S304:将所述关键词与预设词库中的词语进行匹配。
步骤S306:当匹配成功时,则确定所述关键词为所述核心词。
具体地,将视频信息进行分词处理,以得到各个词语。然后,通过语义识别,将无意义的标点符号去除,并获得具有词义的关键词。接着,将提取出的关键词与预设词库中的词语进行匹配,当匹配成功时,则确定该关键词为核心词。所述预设词库中可以包括自定义的偏二次元词语。
需要说明的是,提取出的关键词与预设词库中的词语匹配方法可以是精确匹配,也可以是模糊匹配,可通过不同的场景进行设置。其中,精确匹配是指根据所提出的条件或者要求,给予一定精确程度的匹配;模糊匹配是指根据所给的条件或者说要求,给予大致程度的匹配。通过本实施例,能够准确的提取出视频信息中的核心词。
步骤S202:将所述核心词与预设的多个兴趣类别中的预设核心词进行相似度计算,以根据计算结果确定所述视频信息所属的兴趣类别。
具体地,所述计算机设备预设有多个兴趣类别,每个兴趣类别至少有一个预设核心词,通过将从视频信息中提取的核心词与每个兴趣类别中的预设核心词进行相似度计算,进而确定所述视频信息所属的兴趣类别。例如:从视频信息中提取出核心词“带货”,预设的兴趣类别包括“美妆”兴趣类别和“体育”兴趣类别,“美妆”兴趣类别中包括核心词(也可以称为标签)“美妆”,“体育”兴趣类别包括核心词(也可以称为标签)“篮球”、“足球”,则将“带货”分别与“美妆”兴趣类别中的核心词“美妆”、“体育”兴趣类别中的核心词“篮球”、“足球”进行相似度计算,以根据相似度计算结果确定将“带货”所属的兴趣类别。
在示例性的实施例中,如图5所示,所述步骤S202可以包括步骤S400~S404。
步骤S400:将所述核心词与所述预设核心词分别进行词向量处理,以得到与所述核心词对应的第一词向量和与所述预设核心词对应的第二词向量。
步骤S402:利用余弦相似度算法计算所述第一词向量和所述第二词向量的相似度。
需要说明的是:余弦相似度算法通过计算两个向量的夹角的余弦值,余弦值越接近1,则表明夹角越接近0度,也即两个向量越相似。故,计算出的余弦值越大,则表示两个词语相似度越高。
步骤S404:当所述相似度高于预设相似度时,则确定所述视频信息属于所述预设核心词对应的目标兴趣类别,并将所述核心词加入至所述预设词库中。
例如:当从视频信息中提取出的核心词“带货”与“美妆”兴趣类别中包括核心词“美妆”相似度高于预设相似度时,则确定所述视频信息属于“美妆”兴趣类别,然后将所述核心词“带货”加入至“美妆”兴趣类别。通过余弦相似度算法能够精准的计算两个核心词的相关性,也即相似度。当确定提取出的核心词属于该兴趣类别时,通过将该核心词加入至该兴趣类别,极大的丰富了兴趣类别中核心词(标签)的数量,保证了所有核心词均有对应的偏好人群。
步骤S104:统计每个用户在每种兴趣类别中执行每种视频操作的次数和每种视频操作的总执行次数。
具体地,当获取到多个用户在预设时间内输入的多种视频操作,并且每种视频操作对应的视频信息所属的兴趣类别确定后,所述计算机设备统计每个用户在每种兴趣类别中执行每种视频操作的次数和每种视频操作的所有用户总执行次数。例如:多个用户在预设时间内对“体育”兴趣类别和“美妆”兴趣类别的视频均执行过多次播放操作、分享操作、点赞操作、投币操作和收藏操作,所述计算机设备分别统计每个用户播放“体育”兴趣类别视频的次数、分享“体育”兴趣类别视频的次数、点赞“体育”兴趣类别视频的次数、投币“体育”兴趣类别视频的次数、收藏“体育”兴趣类别视频的次数、播放“美妆”兴趣类别视频的次数、分享“美妆”兴趣类别视频的次数、点赞“美妆”兴趣类别视频的次数、投币“美妆”兴趣类别视频的次数、收藏“美妆”兴趣类别视频的次数,并同时统计所有用户播放所有兴趣类别的总次数、所有用户分享所有兴趣类别视频的总次数、所有用户点赞所有兴趣类别视频的总次数、所有用户投币所有兴趣类别视频的总次数、所有用户收藏所有兴趣类别视频的总次数。
步骤S106:根据每个用户在每种兴趣类别中执行每种视频操作的次数和每种视频操作的总执行次数,计算每个用户在每种兴趣类别的分值。
例如:根据张三播放“体育”兴趣类别视频的次数、分享“体育”兴趣类别视频的次数、点赞“体育”兴趣类别视频的次数、投币“体育”兴趣类别视频的次数、收藏“体育”兴趣类别视频的次数和所有用户播放所有兴趣类别视频的总次数、所有用户分享所有兴趣类别视频的总次数、所有用户点赞所有兴趣类别视频的总次数、所有用户投币所有兴趣类别视频的总次数、所有用户收藏所有兴趣类别视频的总次数,计算所述张三在“体育”兴趣类别的分值;根据张三播放“美妆”兴趣类别视频的次数、分享“美妆”兴趣类别视频的次数、点赞“美妆”兴趣类别视频的次数、投币“美妆”兴趣类别视频的次数、收藏“美妆”兴趣类别视频的次数和所有用户播放所有兴趣类别视频的总次数、所有用户分享所有兴趣类别视频的总次数、所有用户点赞所有兴趣类别视频的总次数、所有用户投币所有兴趣类别视频的总次数、所有用户收藏所有兴趣类别视频的总次数,计算张三在“美妆”兴趣类别的分值。
在示例性的实施例中,如图6所示,所述步骤S106可以包括步骤S500~S502。
步骤S500:根据每种视频操作的总执行次数确定对应的视频操作的权重。
需要说明的是,用户对不同种视频操作次数的不同,代表用户对不同的视频操作付出的代价不同。次数越多,代表所述用户对所述视频操作付出的代价越低,则越会轻易执行所述视频操作。
例如:用户播放所有视频的总次数为20万次,分享视频的次数为5万次,点赞、投币和收藏视频的次数各为1万次,可知,用户播放视频的次数最多,分享视频的次数其次多,点赞、投币和收藏视频的次数最少,也即用户播放视频的代价最小,确定的用户播放视频的权重最低,点赞、投币和收藏视频的代价最高,确定的点赞、投币和收藏视频的权重并列最高。
在示例性的实施例中,如图7所示,所述步骤S500可以包括步骤S600~S602。
步骤S600:将每种视频操作的次数进行倒数计算,并得到每种视频操作的倒数计算结果。
步骤S602:将每种视频操作的倒数计算结果进行比例计算,以得到每种视频操作相应的权重。
具体地,通过将每种视频操作的次数进行倒数计算,可得到视频操作频率与用户执行视频操作代价的关联关系,并通过将倒数计算结果进行比例计算,即可得到每种视频操作具体的权重。例如:若统计出的用户播放视频20万次,分享视频5万次,点赞、投币和收藏视频均为1万次,分别进行倒数计算,结果为1/200000,1/50000,10000,10000,10000,经过比例计算为1/200000:1/50000:10000:10000:10000=1:4:20:20:20,则播放视频的权重为1,分享视频的权重为4,点赞、投币和收藏视频的权重均为20。通过以上可看出,不同兴趣类别的相同视频操作的权重相同。例如:播放“体育”兴趣类别的权重和播放“美妆”兴趣类别的权重相同;分享“体育”兴趣类别的权重和分享“美妆”兴趣类别的权重相同。通过本实施例,可通过统计全网中每种视频操作的次数得到每种视频操作的代价,并计算出对应的权重。
步骤S502:根据每个用户在每种兴趣类别中执行每种视频操作的次数和所述对应的视频操作的权重,计算每个用户在每种兴趣类别的分值。所述分值的计算公式为:
Figure BDA0002375267160000121
其中,j表示第j种兴趣类别,Cj表示每个用户在所述第j种兴趣类别的分值,N表示视频操作种数,i表示第i种视频操作,ki,j表示每个用户执行所述第j种兴趣类别中所述第i种视频操作的次数,wi表示所述第i种视频操作的权重。
示例性地,若统计出所有用户播放视频100次,分享视频50次,点赞视频20次,投币视频10次,收藏视频10次,其中,用户A播放兴趣类别1的视频20次,分享兴趣类别1的视频5次,点赞、投币和收藏兴趣类别1的视频均为1次,计算出的播放视频的权重为1,分享视频的权重为2,点赞视频的权重为5、投币视频的权重和收藏视频的权重均为10,根据分值计算公式计算,用户A在兴趣类别1的分值C1=20*1+5*2+1*5+1*10+1*10=55。
步骤S108:根据所述分值确定与所述分值对应的用户对应的兴趣类别。
在示例性的实施例中,如图8所示,所述步骤S108可以包括步骤S700~S702。
步骤S700:将所述分值分别与多个兴趣类别的预设分值进行比较。
步骤S702:当所述分值高于所述预设分值时,则确定与所述分值对应的用户属于所述预设分值对应的兴趣类别。
具体地,所述计算机设备预设有兴趣类别1、兴趣类别2的分值阈值,当计算出的用户A在兴趣类别1的分值为100,在兴趣类别2的分值为50,兴趣类别1的分值阈值为90,兴趣类别2的分值阈值也为90,则确定用户A的兴趣类别为兴趣类别1。在本实施例中,可通过调整分值阈值的高低,进而调整用户的召回量。
需要说明的是,在实际应用中,随着时间的流逝和社会的发展,用户的兴趣也随之改变,用户对不同兴趣类别视频的视频操作种类和次数也随之改变,通过每日获取用户预设时间内的多种视频操作和每种视频操作对应的视频信息,以更新用户的兴趣类别。当然,也可以设置为每隔一段时间获取用户预设时间(例如:一个月)内的多种视频操作和每种视频操作对应的视频信息,以更新用户的兴趣类别,在此不作限定。
通过本发明实施例,能够充分利用用户的视频数据,有效的挖掘用户的客观兴趣偏好,进而提高兴趣类别的召回率和人群区分度,通过确定用户的兴趣类别,极大的提高了用户标签的区分度,通过广告的正确推送,极大的提高了广告的点击率和收益。
基于上述实施例中提供的用户兴趣的挖掘方法,本实施例中提供一种用户兴趣的挖掘系统,所述用户兴趣的挖掘系统可以应用于计算机设备。具体地,图9示出了该用户兴趣的挖掘系统的可选的结构框图,该用户兴趣的挖掘系统被分割成一个或多个程序模块,一个或者多个程序模块被存储于存储介质中,并由一个或多个处理器所执行,以完成本发明。本发明所称的程序模块是指能够完成特定功能的一系列计算机程序指令段,比程序本身更适合描述用户兴趣的挖掘系统在存储介质中的执行过程,以下描述将具体介绍本实施例各程序模块的功能。
如图9所示,用户兴趣的挖掘系统具体包括以下组成部分:
获取模块201,用于获取用户在预设时间内输入的多种视频操作和每种视频操作对应的视频信息。所述视频操作信息至少包括:播放所述视频、点赞所述视频、投币所述视频、收藏所述视频和分享所述视频。
具体地,当用户在预设时间(例如:一个月)内对至少一个视频执行过至少一次播放操作、点赞操作、投币操作、收藏操作和/或分享的视频操作时,则所述获取模块201获取所述视频操作和与所述视频操作对应的视频信息。
需要说明的是,用户对不同视频的感兴趣程度的不同,可能有多次重复播放视频、多次分享过同一视频和通过播放、点赞、投币、收藏和分享同一视频的情况,故,所述计算机设备均需获取该些视频操作和与所述视频操作对应的视频信息。例如:播放视频A10次,同时对视频A分享、点赞和收藏各1次;播放视频B 20次,对视频B分享5次,对视频B点赞、投币和收藏各1次,则所述计算机设备需获取视频A和视频B的所有视频操作。
第一确定模块202,用于根据所述视频信息确定所述视频信息所属的兴趣类别。
具体地,根据视频信息的不同,视频信息有各自的兴趣类别,进而所述第一确定模块202可根据视频信息确定所述视频信息所属的兴趣类别。例如:所述第一确定模块202根据观看的视频的标题确定该视频信息为护肤兴趣类别的广告,还是娱乐兴趣类别的广告,还是新闻时事兴趣类别的视频等等。
所述第一确定模块202还包括提取单元和计算单元。
所述提取单元,用于将所述视频信息进行处理,以从所述视频信息中提取出核心词。
示例性地,视频信息为一个关于视频内容的描述性语句,通过将该描述性的语句进行处理,以从该描述性的语句中提取出核心词。
在示例性的实施例中,所述提取单元具体用于:将所述视频信息进行分词处理以得到分词结果;将所述分词结果进行词义识别,以筛选出具有词义的关键词;将所述关键词与预设词库中的词语进行匹配;当匹配成功时,则确定该关键词为所述核心词。
具体地,所述提取单元将视频信息进行分词处理,以得到各个词语。然后,通过语义识别,将无意义的标点符号去除,并获得具有词义的关键词。接着,将提取出的关键词与预设词库中的词语进行匹配,当匹配成功时,则确定该关键词为核心词。所述预设词库中可以包括自定义的偏二次元词语。
需要说明的是,提取出的关键词与预设词库中的词语匹配方法可以是精确匹配,也可以是模糊匹配,可通过不同的场景进行设置。其中,精确匹配是指根据所提出的条件或者要求,给予一定精确程度的匹配;模糊匹配是指根据所给的条件或者说要求,给予大致程度的匹配。通过本实施例,能够准确的提取出视频信息中的核心词。
所述计算单元,用于将所述核心词与预设的多个兴趣类别中的预设核心词进行相似度计算,以根据计算结果确定所述视频信息所属的兴趣类别。
具体地,所述计算机设备预设有多个兴趣类别,每个兴趣类别至少有一个预设核心词,所述计算单元通过将从视频信息中提取的核心词与每个兴趣类别中的预设核心词进行相似度计算,进而确定所述视频信息所属的兴趣类别。例如:从视频信息中提取出核心词“带货”,预设的兴趣类别包括“美妆”兴趣类别和“体育”兴趣类别,“美妆”兴趣类别中包括核心词“美妆”,“体育”兴趣类别包括核心词“篮球”、“足球”,则将“带货”分别与“美妆”兴趣类别中的核心词“美妆”、“体育”兴趣类别中的核心词“篮球”、“足球”进行相似度计算,以根据相似度计算结果确定将“带货”所属的兴趣类别。
在示例性的实施例中,所述计算单元,具体用于:
将所述核心词与所述预设核心词分别进行词向量处理,以得到与所述核心词对应的第一词向量和与所述预设核心词对应的第二词向量;利用余弦相似度算法计算所述第一词向量和所述第二词向量的相似度;当所述相似度高于预设相似度时,则确定所述视频信息属于所述预设核心词对应的目标兴趣类别,并将所述核心词加入至所述预设词库中。
需要说明的是:余弦相似度算法通过计算两个向量的夹角的余弦值,余弦值越接近1,则表明夹角越接近0度,也即两个向量越相似。故,计算出的余弦值越大,则表示两个词语相似度越高。
例如:当从视频信息中提取出的核心词“带货”与“美妆”兴趣类别中包括核心词“美妆”相似度高于预设相似度时,则确定所述视频信息属于“美妆”兴趣类别,然后将所述核心词“带货”加入至“美妆”兴趣类别。通过余弦相似度算法能够精准的计算两个核心词的相关性,也即相似度。当确定提取出的核心词属于该兴趣类别时,通过将该核心词加入至该兴趣类别,极大的丰富了兴趣类别中核心词(标签)的数量,保证了所有核心词均有对应的偏好人群。
统计模块203,用于统计每个用户在每种兴趣类别中执行每种视频操作的次数和每种视频操作的总执行次数。
具体地,当获取到多个用户在预设时间内输入的多种视频操作,并且每种视频操作对应的视频信息所属的兴趣类别确定后,所述统计模块203统计每个用户在每种兴趣类别中执行每种视频操作的次数和每种视频操作的所有用户总执行次数。例如:多个用户在预设时间内对“体育”兴趣类别和“美妆”兴趣类别的视频均执行过多次播放操作、分享操作、点赞操作、投币操作和收藏操作,所述统计模块203分别统计每个用户播放“体育”兴趣类别视频的次数、分享“体育”兴趣类别视频的次数、点赞“体育”兴趣类别视频的次数、投币“体育”兴趣类别视频的次数、收藏“体育”兴趣类别视频的次数、播放“美妆”兴趣类别视频的次数、分享“美妆”兴趣类别视频的次数、点赞“美妆”兴趣类别视频的次数、投币“美妆”兴趣类别视频的次数、收藏“美妆”兴趣类别视频的次数,并同时统计所有用户播放所有兴趣类别的总次数、所有用户分享所有兴趣类别视频的总次数、所有用户点赞所有兴趣类别视频的总次数、所有用户投币所有兴趣类别视频的总次数、所有用户收藏所有兴趣类别视频的总次数。
计算模块204,用于根据每个用户在每种兴趣类别中执行每种视频操作的次数和每种兴趣类别中每种视频操作的总执行次数,计算每个用户在每种兴趣类别的分值。
例如:根据张三播放“体育”兴趣类别视频的次数、分享“体育”兴趣类别视频的次数、点赞“体育”兴趣类别视频的次数、投币“体育”兴趣类别视频的次数、收藏“体育”兴趣类别视频的次数和所有用户播放所有兴趣类别视频的总次数、所有用户分享所有兴趣类别视频的总次数、所有用户点赞所有兴趣类别视频的总次数、所有用户投币所有兴趣类别视频的总次数、所有用户收藏所有兴趣类别视频的总次数,计算张三在“体育”兴趣类别的分值;根据张三播放“美妆”兴趣类别视频的次数、分享“美妆”兴趣类别视频的次数、点赞“美妆”兴趣类别视频的次数、投币“美妆”兴趣类别视频的次数、收藏“美妆”兴趣类别视频的次数和所有用户播放所有兴趣类别视频的总次数、所有用户分享所有兴趣类别视频的总次数、所有用户点赞所有兴趣类别视频的总次数、所有用户投币所有兴趣类别视频的总次数、所有用户收藏所有兴趣类别视频的总次数,计算张三在所有兴趣类别的分值。
在示例性的实施例中,所述计算模块204具体用于:根据每种视频操作的总执行次数确定对应的视频操作的权重。
需要说明的是,用户对不同种视频操作次数的不同,代表用户对不同的视频操作付出的代价不同。次数越多,代表所述用户对所述视频操作付出的代价越低,则越会轻易执行所述视频操作。
例如:用户播放视频的总次数为20次,分享视频的次数为5次,点赞、投币和收藏视频的次数各为1次,可知,用户播放视B的次数最多,分享视频的次数其次多,点赞、投币和收藏视频的次数最少,也即用户播放视频的代价最小,确定的用户播放视频的权重最低,点赞、投币和收藏视频的代价最高,确定的点赞、投币和收藏视频的权重并列最高。
所述计算模块204,还用于将每种视频操作的次数进行倒数计算,并得到每种视频操作的倒数计算结果;将每种视频操作的倒数计算结果进行比例计算,以得到每种视频操作相应的权重。
具体地,所述计算模块204通过将每种视频操作的次数进行倒数计算,可得到视频操作频率与用户执行视频操作代价的关联关系,并通过将倒数计算结果进行比例计算,即可得到每种视频操作具体的权重。例如:若统计出的用户播放视频20万次,分享视频5万次,点赞、投币和收藏视频均为1万次,分别进行倒数计算,结果为1/200000,1/50000,10000,10000,10000,经过比例计算为1/200000:1/50000:10000:10000:10000=1:4:20:20:20,则播放视频的权重为1,分享视频的权重为4,点赞、投币和收藏视频的权重均为20。通过以上可看出,不同兴趣类别的相同视频操作的权重相同。例如:播放“体育”兴趣类别的权重和播放“美妆”兴趣类别的权重相同;分享“体育”兴趣类别的权重和分享“美妆”兴趣类别的权重相同。通过本实施例,可通过统计全网中每种视频操作的次数得到每种视频操作的代价,并计算出对应的权重。
所述计算模块204,还用于根据每个用户在每种兴趣类别中执行每种视频操作的次数和所述对应的视频操作的权重,计算每个用户在每种兴趣类别的分值。所述分值的计算公式为:
Figure BDA0002375267160000191
其中,j表示第j种兴趣类别,Cj表示每个用户在所述第j种兴趣类别的分值,N表示视频操作种数,i表示第i种视频操作,ki,j表示每个用户执行所述第j种兴趣类别中所述第i种视频操作的次数,wi表示所述第i种视频操作的权重。
示例性地,若统计出所有用户播放视频100次,分享视频50次,点赞视频20次,投币视频10次,收藏视频10次,其中,用户A播放兴趣类别1的视频20次,分享兴趣类别1的视频5次,点赞、投币和收藏兴趣类别1的视频均为1次,计算出的播放视频的权重为1,分享视频的权重为2,点赞视频的权重为5、投币视频的权重和收藏视频的权重均为10,根据分值计算公式计算,用户A在兴趣类别1的分值C1=20*1+5*2+1*5+1*10+1*10=55。
第二确定模块205,用于根据所述分值确定与所述分值对应的用户对应的目标兴趣类别。
在示例性的实施例中,所述第二确定模块205,还具体用于:将所述分值分别与多个目标兴趣类别的预设分值进行比较;当所述分值高于所述预设分值时,则确定与所述分值对应的用户属于所述预设分值对应的兴趣类别。
具体地,所述计算机设备预设有兴趣类别1、兴趣类别2的分值阈值,当计算出的用户A在兴趣类别1的分值为100,在兴趣类别2的分值为50,兴趣类别1的分值阈值为90,兴趣类别2的分值阈值也为90,则所述第二确定模块205确定用户A的兴趣类别为兴趣类别1。在本实施例中,可通过调整分值阈值的高低,进而调整用户的召回量。
需要说明的是,在实际应用中,随着时间的流逝和社会的发展,用户的兴趣也随之改变,用户对不同兴趣类别视频的视频操作种类和次数也随之改变,通过每日获取用户预设时间内的多种视频操作和每种视频操作对应的视频信息,以更新用户的兴趣类别。当然,也可以设置为每隔一段时间获取用户预设时间(例如:一个月)内的多种视频操作和每种视频操作对应的视频信息,以更新用户的兴趣类别,在此不作限定。
通过本发明实施例,能够充分利用用户的视频数据,有效的挖掘用户的客观兴趣偏好,进而提高兴趣类别的召回率和人群区分度,通过确定用户的兴趣类别,极大的提高了用户标签的区分度,通过广告的正确推送,极大的提高了广告的点击率和收益。
本实施例还提供一种计算机设备,如可以执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。如图10所示,本实施例的计算机设备30至少包括但不限于:可通过系统总线相互通信连接的存储器301、处理器302。需要指出的是,图10仅示出了具有组件301-302的计算机设备30,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
本实施例中,存储器301(即可读存储介质)包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器301可以是计算机设备30的内部存储单元,例如该计算机设备30的硬盘或内存。在另一些实施例中,存储器301也可以是计算机设备30的外部存储设备,例如该计算机设备30上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器301还可以既包括计算机设备30的内部存储单元也包括其外部存储设备。在本实施例中,存储器301通常用于存储安装于计算机设备30的操作系统和各类应用软件,例如上述实施例提供的用户兴趣的挖掘系统的程序代码等。此外,存储器301还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器302在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器302通常用于控制计算机设备30的总体操作。
具体的,在本实施例中,处理器302用于执行处理器302中存储的用户兴趣的挖掘方法的程序,所述用户兴趣的挖掘方法的程序被执行时实现如下步骤:
获取用户在预设时间内输入的多种视频操作和每种视频操作对应的视频信息;
根据所述视频信息确定所述视频信息所属的兴趣类别;
统计每个用户在每种兴趣类别中执行每种视频操作的次数和每种视频操作的总执行次数;
根据每个用户在每种兴趣类别中执行每种视频操作的次数和每种视频操作的总执行次数,计算每个用户在每种兴趣类别的分值;
根据所述分值确定与所述分值对应的用户对应的兴趣类别。
上述方法步骤的具体实施例过程可参见上述实施例,本实施例在此不再重复赘述。
本实施例还提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,所述计算机程序被处理器执行时实现如下方法步骤:
获取用户在预设时间内输入的多种视频操作和每种视频操作对应的视频信息;
根据所述视频信息确定所述视频信息所属的兴趣类别;
统计每个用户在每种兴趣类别中执行每种视频操作的次数和每种视频操作的总执行次数;
根据每个用户在每种兴趣类别中执行每种视频操作的次数和每种视频操作的总执行次数,计算每个用户在每种兴趣类别的分值;
根据所述分值确定与所述分值对应的用户对应的兴趣类别。
上述方法步骤的具体实施例过程可参见上述实施例,本实施例在此不再重复赘述。
本实施例提供的计算机设备及可读存储介质,通过用户在预设时间内的视频操作以及视频操作对应的视频信息,确定视频信息所属的兴趣类别,然后,统计每种兴趣类别中每种视频操作的次数,接着,根据每种兴趣类别中每种视频操作的次数计算对应兴趣类别的分值,最后,根据计算的分值确定用户的目标兴趣类别。本实施例能够充分利用用户的视频数据,有效的挖掘用户的客观兴趣偏好,进而提高兴趣类别的召回率和人群区分度。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (9)

1.一种用户兴趣的挖掘方法,其特征在于,所述方法包括:
获取用户在预设时间内输入的多种视频操作和每种视频操作对应的视频信息;
根据所述视频信息确定所述视频信息所属的兴趣类别;
统计每个用户在每种兴趣类别中执行每种视频操作的次数和每种视频操作的总执行次数;
根据每个用户在每种兴趣类别中执行每种视频操作的次数和每种视频操作的总执行次数,计算每个用户在每种兴趣类别的分值;
其中,所述根据每个用户在每种兴趣类别中执行每种视频操作的次数和每种视频操作的总执行次数,计算每个用户在每种兴趣类别的分值,包括:
根据每种视频操作的总执行次数确定对应的视频操作的权重;
所述根据每种视频操作的总执行次数确定对应的视频操作的权重,包括:
将每种视频操作的次数进行倒数计算,并得到每种视频操作的倒数计算结果;
将每种视频操作的倒数计算结果进行比例计算,以得到每种视频操作相应的权重;
根据每个用户在每种兴趣类别中执行每种视频操作的次数和所述对应的视频操作的权重,计算每个用户在每种兴趣类别的分值;
根据所述分值确定与所述分值对应的用户对应的兴趣类别。
2.如权利要求1所述的挖掘方法,其特征在于,所述根据所述视频信息确定所述视频信息所属的兴趣类别,包括:
将所述视频信息进行处理,以从所述视频信息中提取出核心词;
将所述核心词与预设的多个兴趣类别中的预设核心词进行相似度计算,以根据计算结果确定所述视频信息所属的兴趣类别。
3.如权利要求2所述的挖掘方法,其特征在于,所述将所述视频信息进行处理,以从所述视频信息中提取出核心词,包括:
将所述视频信息进行分词处理以得到分词结果;
将所述分词结果进行词义识别,以筛选出具有词义的关键词;
将所述关键词与预设词库中的词语进行匹配;
当匹配成功时,则确定所述关键词为所述核心词。
4.如权利要求2所述的挖掘方法,其特征在于,所述将所述核心词与预设的多个兴趣类别中的预设核心词进行相似度计算,以根据计算结果确定所述视频信息所属的兴趣类别,包括:
将所述核心词与所述预设核心词分别进行词向量处理,以得到与所述核心词对应的第一词向量和与所述预设核心词对应的第二词向量;
利用余弦相似度算法计算所述第一词向量和所述第二词向量的相似度;
当所述相似度高于预设相似度时,则确定所述视频信息属于所述预设核心词对应的目标兴趣类别,并将所述核心词加入至所述预设词库中。
5.如权利要求1所述的挖掘方法,其特征在于,每个所述用户在每种兴趣类别的分值计算公式为:
Figure FDF0000020074990000021
其中,j表示第j种兴趣类别,Cj表示每个用户在所述第j种兴趣类别的分值,N表示视频操作种数,i表示第i种视频操作,ki,j表示每个用户执行所述第j种兴趣类别中所述第i种视频操作的次数,wi表示所述第i种视频操作的权重。
6.如权利要求1或5所述的挖掘方法,其特征在于,所述根据所述分值确定与所述分值对应的用户对应的兴趣类别,包括:
将所述分值分别与多个兴趣类别的预设分值进行比较;
当所述分值高于所述预设分值时,则确定所述用户为与所述预设分值对应的兴趣类别。
7.一种用户兴趣的挖掘系统,其特征在于,所述系统包括:
获取模块,用于获取用户在预设时间内输入的多种视频操作和每种视频操作对应的视频信息;
第一确定模块,用于根据所述视频信息确定所述视频信息所属的兴趣类别;
统计模块,用于统计每个用户在每种兴趣类别中执行每种视频操作的次数和每种视频操作的总执行次数;
计算模块,用于根据每个用户在每种兴趣类别中执行每种视频操作的次数和每种视频操作的总执行次数,计算每个用户在每种兴趣类别的分值;其中,所述计算模块还用于:根据每种视频操作的总执行次数确定对应的视频操作的权重;其中,将每种视频操作的次数进行倒数计算,并得到每种视频操作的倒数计算结果;将每种视频操作的倒数计算结果进行比例计算,以得到每种视频操作相应的权重;根据每个用户在每种兴趣类别中执行每种视频操作的次数和所述对应的视频操作的权重,计算每个用户在每种兴趣类别的分值;
第二确定模块,用于根据所述分值确定与所述分值对应的用户对应的兴趣类别。
8.一种计算机设备,所述计算机设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项的所述用户兴趣的挖掘方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项的所述用户兴趣的挖掘方法的步骤。
CN202010063555.6A 2020-01-20 2020-01-20 用户兴趣的挖掘方法及系统 Active CN113139085B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010063555.6A CN113139085B (zh) 2020-01-20 2020-01-20 用户兴趣的挖掘方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010063555.6A CN113139085B (zh) 2020-01-20 2020-01-20 用户兴趣的挖掘方法及系统

Publications (2)

Publication Number Publication Date
CN113139085A CN113139085A (zh) 2021-07-20
CN113139085B true CN113139085B (zh) 2023-03-21

Family

ID=76808826

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010063555.6A Active CN113139085B (zh) 2020-01-20 2020-01-20 用户兴趣的挖掘方法及系统

Country Status (1)

Country Link
CN (1) CN113139085B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113327140B (zh) * 2021-08-02 2021-10-29 深圳小蝉文化传媒股份有限公司 基于大数据分析的视频广告投放效果智能分析管理系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008294878A (ja) * 2007-05-28 2008-12-04 D & M Holdings Inc 音声・映像信号送出装置
CN104424302A (zh) * 2013-09-04 2015-03-18 阿里巴巴集团控股有限公司 一种同类数据对象的匹配方法和装置
CN106055617A (zh) * 2016-05-26 2016-10-26 乐视控股(北京)有限公司 一种数据推送方法及装置
CN106547908A (zh) * 2016-11-25 2017-03-29 三星电子(中国)研发中心 一种信息推送方法和系统
CN109684512A (zh) * 2018-11-20 2019-04-26 北京奇虎科技有限公司 一种用户兴趣点的挖掘方法及装置
CN110110143A (zh) * 2019-04-15 2019-08-09 厦门网宿有限公司 一种视频分类方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008294878A (ja) * 2007-05-28 2008-12-04 D & M Holdings Inc 音声・映像信号送出装置
CN104424302A (zh) * 2013-09-04 2015-03-18 阿里巴巴集团控股有限公司 一种同类数据对象的匹配方法和装置
CN106055617A (zh) * 2016-05-26 2016-10-26 乐视控股(北京)有限公司 一种数据推送方法及装置
CN106547908A (zh) * 2016-11-25 2017-03-29 三星电子(中国)研发中心 一种信息推送方法和系统
CN109684512A (zh) * 2018-11-20 2019-04-26 北京奇虎科技有限公司 一种用户兴趣点的挖掘方法及装置
CN110110143A (zh) * 2019-04-15 2019-08-09 厦门网宿有限公司 一种视频分类方法及装置

Also Published As

Publication number Publication date
CN113139085A (zh) 2021-07-20

Similar Documents

Publication Publication Date Title
CN107463605B (zh) 低质新闻资源的识别方法及装置、计算机设备及可读介质
CN108269122B (zh) 广告的相似度处理方法和装置
CN110633421B (zh) 特征提取、推荐以及预测方法、装置、介质和设备
CN107894998A (zh) 视频推荐方法及装置
CN110544109A (zh) 用户画像生成方法、装置、计算机设备和存储介质
CN111522724B (zh) 异常账号的确定方法、装置、服务器及存储介质
CN111444387A (zh) 视频分类方法、装置、计算机设备和存储介质
CN102934113A (zh) 信息提供系统、信息提供方法、信息提供设备、程序和信息记录介质
CN111597446B (zh) 基于人工智能的内容推送方法、装置、服务器和存储介质
CN112911326B (zh) 弹幕信息处理方法、装置、电子设备和存储介质
CN110929525A (zh) 一种网贷风险行为分析检测方法、装置、设备和存储介质
CN110880006A (zh) 用户分类方法、装置、计算机设备和存储介质
CN115705583A (zh) 多目标预测方法、装置、设备及存储介质
CN114265953A (zh) 一种基于标签的短视频推荐方法、系统、设备和介质
WO2023024408A1 (zh) 用户特征向量确定方法、相关设备及介质
CN113961823B (zh) 新闻推荐方法、系统、存储介质及设备
CN113139085B (zh) 用户兴趣的挖掘方法及系统
CN113297486B (zh) 一种点击率预测方法及相关装置
CN113011886B (zh) 帐号类型的确定方法和装置及电子设备
CN114329028A (zh) 一种数据处理方法、设备以及计算机可读存储介质
CN107025567A (zh) 一种数据处理方法和装置
CN110569447B (zh) 一种网络资源的推荐方法、装置及存储介质
CN106446696B (zh) 一种信息处理方法及电子设备
CN111368552A (zh) 一种面向特定领域的网络用户群组划分方法及装置
CN112182390B (zh) 一种函件推送方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant