CN113111198B - 基于协同过滤算法的演示文稿推荐方法及相关设备 - Google Patents

基于协同过滤算法的演示文稿推荐方法及相关设备 Download PDF

Info

Publication number
CN113111198B
CN113111198B CN202110660078.6A CN202110660078A CN113111198B CN 113111198 B CN113111198 B CN 113111198B CN 202110660078 A CN202110660078 A CN 202110660078A CN 113111198 B CN113111198 B CN 113111198B
Authority
CN
China
Prior art keywords
presentation
application
adaptation
calculating
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110660078.6A
Other languages
English (en)
Other versions
CN113111198A (zh
Inventor
廖伯轩
张天一
郑天琦
王士鑫
钟坯平
单允赟
刘美汐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202110660078.6A priority Critical patent/CN113111198B/zh
Publication of CN113111198A publication Critical patent/CN113111198A/zh
Application granted granted Critical
Publication of CN113111198B publication Critical patent/CN113111198B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例属于人工智能领域,应用于智慧企业领域中,涉及一种基于协同过滤算法的演示文稿推荐方法,包括接收用户对象的演示文稿推荐请求;根据所述推荐请求获取所述用户对象的对象特征和应用特征,其中,所述应用特征包括所述用户对象对各演示文稿进行应用类型标记的历史信息;基于通过协同过滤算法计算得到的文稿适配度,根据所述对象特征和所述应用特征计算所述用户对象的相似对象;获取通过文稿适配算法得到的与所述相似对象对应的演示文稿的适配类型,并将所述适配类型发送给所述用户对象。本申请还提供一种基于协同过滤算法的演示文稿推荐装置、计算机设备及存储介质。采用本方法大大提高了文稿推荐的准确率。

Description

基于协同过滤算法的演示文稿推荐方法及相关设备
技术领域
本申请涉及人工智能领域,特别是涉及一种基于协同过滤算法的演示文稿推荐方法、装置、计算机设备和存储介质。
背景技术
在日常的会议材料准备过程中,对于演示文稿的绘制只能依靠自主绘制模板或在互联网的海量模板素材中进行逐一的挑选下载,耗时耗力。对于电脑操作能力较弱的营业部而言,会议ppt材料的绘制较为简陋,页面设置突兀、配色视觉效果差,整体成片的观赏性较低,在会议材料播放的过程中难以产生视觉吸引力,从而降低了会议整体效率。现有的演示文稿设计软件/插件在风格选用中,都是采取人工自主挑选的模式,无法根据材料的主题进行风格主题的智能推送,整体效率较低。下载后需要对每一张灯片进行逐页修改,工序繁琐,制作准备的时间较长,进一步降低了会议主持/主讲人制作材料的意愿。
一般推送中,多是基于聚类形成用户标签结合使用习惯,通过机器学习对算法进行训练,缺少结合不同内容主题的算法优化。
发明内容
基于此,针对上述技术问题,本申请提供一种基于协同过滤算法的演示文稿推荐方法、装置、计算机设备及存储介质,以解决现有技术中只通过用户标签结合使用习惯进行演示文稿的推送,导致演示文稿推送风格单一的技术问题。
一种基于协同过滤算法的演示文稿推荐方法,应用于至少包括根据用户对象的用户请求进行演示文稿匹配以及用户对象对得到的演示文稿进行应用类型标记功能的文稿应用系统,包括:
接收用户对象的演示文稿推荐请求;
获取所述用户对象的对象特征和应用特征,其中,所述应用特征包括所述用户对象对各演示文稿进行应用类型标记的历史信息;
基于通过协同过滤算法计算得到的文稿适配度,根据所述对象特征和所述应用特征计算所述用户对象的相似对象;
获取通过文稿适配算法得到的与所述相似对象对应的演示文稿的适配类型,并将所述适配类型发送给所述用户对象。
一种基于协同过滤算法的演示文稿推荐装置,应用于至少包括根据用户对象的用户请求进行演示文稿匹配以及用户对象对得到的演示文稿进行应用类型标记功能的文稿应用系统,包括:
接收模块,用于接收用户对象的演示文稿推荐请求;
获取模块,用于获取所述用户对象的对象特征和应用特征,其中,所述应用特征包括所述用户对象对各演示文稿进行应用类型标记的历史信息;
适配模块,用于基于通过协同过滤算法计算得到的文稿适配度,根据所述对象特征和所述应用特征计算所述用户对象的相似对象;
推荐模块,用于获取通过文稿适配算法得到的与所述相似对象对应的演示文稿的适配类型,并将所述适配类型发送给所述用户对象。
一种计算机设备,包括存储器和处理器,以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现上述基于协同过滤算法的演示文稿推荐方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现上述基于协同过滤算法的演示文稿推荐方法的步骤。
上述基于协同过滤算法的演示文稿推荐方法、装置、计算机设备和存储介质,通过获取用户对象的对象特征和应用特征,基于协同过滤算法计算得到不同演示文稿与样本对象的文稿适配度,根据该对象特征和应用特征计算用户对象的相似对象,并将该相似对象的演示文稿的适配类型推送给该用户对象;本申请通过结合用户对象的自身的对象特征以及要将得到的演示文稿的应用场景,即应用特征,基于协同过滤的算法,解决现有技术中演示文稿的主题类型推送单一的技术问题。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为基于协同过滤算法的演示文稿推荐方法的应用环境示意图;
图2为基于协同过滤算法的演示文稿推荐方法的流程示意图;
图3为基于协同过滤算法的演示文稿推荐装置的示意图;
图4为一个实施例中计算机设备的示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了使本申请的目的、技术方案及优点更加清楚明白,下面结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的基于协同过滤算法的演示文稿推荐方法,可以应用于如图1所示的应用环境中。其中,该应用环境可以包括终端102、网络以及服务端104,网络用于在终端102和服务端104之间提供通信链路介质,网络可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端102通过网络与服务端104交互,以接收或发送消息等。终端102上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端102可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器( Moving Picture Experts Group AudioLayer III,动态影像专家压缩标准音频层面3 )、MP4( Moving Picture Experts GroupAudio Layer IV,动态影像专家压缩标准音频层面4 )播放器、膝上型便携计算机和台式计算机等等。
服务端104可以是提供各种服务的服务器,例如对终端102上显示的页面提供支持的后台服务器。
需要说明的是,本申请实施例所提供的基于协同过滤算法的演示文稿推荐方法一般由服务端/终端执行,相应地,基于协同过滤算法的演示文稿推荐装置一般设置于服务端/终端设备中。
本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本申请可应用于智慧企业领域中,从而推动智慧城市的建设。
应该理解,图1中的终端、网络和服务端的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
其中,终端102通过网络与服务端104进行通信。服务端104接收用户对象通过终端102发送的演示文稿推送请求,然后根据推荐请求获取用户对象的对象特征和应用特征,并基于通过协同过滤算法得到的文稿适配度,根据对象特征和应用特征计算用户对象的相似对象,最后再通过文稿适配算法得到与相似对象对应的演示文稿的适配类型,并将适配类型发送给用户对象。其中,终端102和服务端104之间通过网络进行连接,该网络可以是有线网络或者无线网络,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务端104可以用独立的服务器或者是多个组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种基于协同过滤算法的演示文稿推荐方法,以该方法应用于图1中的服务端为例进行说明,包括以下步骤:
步骤202,接收用户对象的演示文稿推荐请求。
在一些实施例中,本申请的技术方案可以应用于至少包括根据用户对象的用户请求进行演示文稿匹配以及用户对象对得到的演示文稿进行应用类型标记功能的文稿应用系统,例如,在能够接收用户对象的演示文稿推荐请求的office系统、WPS系统中,或者其他能够进行风格推荐的文稿推荐平台上。
具体地,推荐请求包括能够获取用户对象的对象特征和应用特征的URL地址或者特征数据存储地址,服务端对推荐请求进行解析后得到获取对象特征和应用特征的存储地址。
可选地,为了降低服务端的响应时间,提高计算效率,用户在终端时,可以直接将对象特征和应用特征作为推荐请求的一部分进行包装后,发送给服务端,这样服务端可以直接解析后得到需要的特征进行处理。
步骤204,根据所述推荐请求获取所述用户对象的对象特征和应用特征,其中,所述应用特征包括所述用户对象对各演示文稿进行应用类型标记的历史信息。
对推荐请求解析后,根据得到的特征地址获取用户对象的特征数据,得到的特征数据包括对象特征和应用特征,具体地,应用特征包括用户对象对各演示文稿进行应用类型标记的历史信息。
对象特征可以是用户的企业特征,例如至少包括用户的年资、职位、年龄以及所属部门。
可选地,对象特征还可以是用户的性格特征,例如至少包括用户的籍贯、岗位、年龄以及性格。
可选地,对象特征还可以是用户的状态特征,状态特征可以包括用户上传的社交平台的头像风格、文案风格、图像风格以及偏爱的信息类型,例如,微博、绿洲、Facebook、推特、instagram或者知乎等社交平台上的信息转发的风格和状态等特征信息。
应用特征包括用户对象对不同的演示文稿应用的场景的历史信息,至少包括重要应用、团体应用以及分享应用中的一种或多种,例如应用到重大会议、轻松会议、公开会议或者分享会议中的一种或多种,即,对不同的演示文稿进行应用类型的标记的信息。
步骤206,基于通过协同过滤算法计算得到的文稿适配度,根据所述对象特征和所述应用特征计算所述用户对象的相似对象。
在计算用户对象的相似对象之前,还包括:
计算不同对象特征下的样本对象对不同文稿类型下的演示文稿的第一评分向量,得到至少两个所述样本对象对不同演示文稿的第一多维操作向量;根据所述第一多维操作向量计算不同所述样本对象之间的第一多维标签向量;计算不同文稿类型下演示文稿在不同应用特征下第二评分向量,得到第二多维操作向量。
第一评分向量为样本对象对每个适配类型的演示文稿的使用次数/使用演示文稿 的总次数的评分向量;第一多维操作向量为样本对象对演示文稿的多维操作向量;然后可 以根据余弦相似度计算不同样本对象
Figure 748699DEST_PATH_IMAGE001
Figure 820429DEST_PATH_IMAGE002
之间的多维标签向量。
具体地,在当样本对象为汇报人员时,ppt风格推荐系统中,对每个汇报人员的特征做特征工程,分为年资、职位、年龄、性格、所属部门、等标签;然后根据每个ppt的版面的风格打标,整理约20种标签,包含简易精要、严谨多字、活泼分享、图文并行等。
定义汇报人员的特征集合为{u 1 ,u 2 ,u 3 ,..u m },且演示文稿的风格的标签为{q 1 ,q 2 , q 3 ,..q K },将汇报人员对每个ppt风格的使用次数/总次数视为
Figure 215025DEST_PATH_IMAGE003
评分向量,即第一评分 向量,得到汇报人员对ppt的多维操作向量,即,第一多维操作向量:
Figure 272980DEST_PATH_IMAGE004
之后,利用余弦相似度计算不同汇报人员
Figure 800914DEST_PATH_IMAGE001
Figure 184490DEST_PATH_IMAGE002
间的第一多维标签向量如公式 (1):
Figure 78102DEST_PATH_IMAGE005
(1)
得到第一多维标签向量后,再根据所述第二多维操作向量计算不同应用特征之间的第二多维标签向量;基于线性加权对所述第一多维标签向量和所述第二多维标签向量进行加权处理,并根据得到第三多维标签向量;基于协同过滤算法和所述第三多维标签向量计算不同样本对象和不同应用特征对不同文稿类型的文稿适配度。
具体地,第二多维标签向量的计算方式与汇报对象的相似度雷同,当用户对象的应用类型为会议时,仅参数部分改为以会议属性做特征工程,分为固定重要会议、部门会议、分享性质会议等10种标签,并同样使用已经打标完成的ppt版面风格标签。
定义会议特征集合{U 1 ,U 2 ,U 3 ,..U L },ppt风格的标签为{q 1 ,q 2 ,q 3 ,..q K }培训课程, 将每个ppt风格在不用性质会议上的使用次数/总次数视为
Figure 939748DEST_PATH_IMAGE006
第二操作向量,得到应用特 征对ppt的第二多维操作向量:
Figure 587767DEST_PATH_IMAGE007
然后,利用余弦相似度计算不同应用特征
Figure 611086DEST_PATH_IMAGE001
Figure 980275DEST_PATH_IMAGE002
间的第二多维标签向量如公式 (2):
Figure 645612DEST_PATH_IMAGE008
(2)
最后,计算最终相似度与用户评分:
具体地,从上面两步骤中得出汇报人员相似度
Figure 148137DEST_PATH_IMAGE009
、会议性质相似度
Figure 873517DEST_PATH_IMAGE010
,作为协同过滤的推荐基础。
然后,通过加权相似度以线性加权的方式,用作在协同过滤中考虑综合多维度标 签的相似度,使用参数
Figure 464423DEST_PATH_IMAGE011
做调整,控制两个相似度的权重,公式(3):
Figure 933450DEST_PATH_IMAGE012
(3)
最后根据公式(4)算出不同应用特征的会议/样本对象对ppt风格的最终的文稿配 适度
Figure 149537DEST_PATH_IMAGE013
Figure 514659DEST_PATH_IMAGE014
(4)
其中,
Figure 858440DEST_PATH_IMAGE015
Figure 334421DEST_PATH_IMAGE016
为相似汇报人v的评分及均值,N(u)为该汇报人的邻近集合,sim 为上述之相似度,即,第一多维标签向量和第二多维标签向量。
得到文稿适配度之后,当有汇报人员送出ppt制作需求时,便会根据该汇报人的对象特征、以及应用特征,计算与该用户对象相似度高样本用户的对象特征和/或应用特征对每种ppt风格的配适性,以此排序得到在前三的 ppt风格。
具体地,计算方式为:
可以通过余弦相似度计算该用户对象与不同特征下的样本对象的相似度,并将相似度达到预设相似度的样本对象作为相似对象。
一般的,预设相似度为0.89,当两个不同的对象之间的余弦相似度达到0.89以上,则认为该样本对象为用户对象的相似对象。
进一步地,具体地计算方式可以为:
定义用户对象的特征集合,即对象特征为{u 1 ,u 2 ,u 3 ,..u m },且演示文稿的风格的 标签为{q 1 ,q 2 ,q 3 ,..q K },将该用户对象对每个ppt风格的历史使用次数/总次数视为
Figure 670593DEST_PATH_IMAGE017
评 分向量,即第一评分向量,得到用户对象对ppt的多维操作向量,即,第一多维操作向量:
Figure 728986DEST_PATH_IMAGE018
之后,利用余弦相似度计算用户对象
Figure 760396DEST_PATH_IMAGE019
与样本对象
Figure 744795DEST_PATH_IMAGE020
之间的第一多维标签向量 如公式(1):
Figure 466632DEST_PATH_IMAGE021
(1)
可选地,计算不同特征下用户对象与样本对象之间的相似度,还可以通过统计两个对象是否有相同的特征,例如,对象特征是否相同、应用特征是否相同来计算两个用户是否相同,大大减少了两两用户之间没有相关性却遍历进行计算的时间,提高了演示文稿分配的效率。
具体地,获取和用户对象兴趣相似的样本用户的集合,找到这个集合中用户喜欢 的,且用户对象历史数据中没有使用过或者评分过的演示文稿的推荐给用户对象。主要通 过计算用户行为来计算用户行为的相似度,给定对象u,v,令N(u)表示对象u曾经有过正反 馈的物品集合,令N(v)表示v曾经有过正反馈的物品集合。那么,我们可以通过Jaccard公式 (5)计算u和v的两个对象之间的相似度
Figure 238803DEST_PATH_IMAGE022
Figure 288668DEST_PATH_IMAGE023
(5)
步骤208,获取通过文稿适配算法得到的与所述相似对象对应的演示文稿的适配类型,并将所述适配类型发送给所述用户对象。
因为会提前计算好各对象之间的相似度,以及各对象的适配类型的演示文稿,当得到用户对象的相似对象后,直接获取与该相似对象对应的适配类型的演示文稿,作为推荐结果。一般地,可以将通过文稿适配算法得到的前三对应的ppt风格对应的演示文稿推荐给用户对象,即获取适配类型排名在前三的演示文稿推荐给用户对象。
进一步地,在接收用户对象的演示文稿推荐请求之前,为了提高演示文稿推荐的准确度,还包括:
获取样本对象的历史文档;确定所述历史文档的文件类型;通过与所述文件类型对应的文件解析算法对所述历史文档进行类型解析,确定所述历史文档的适配类型。
进一步地,所述文件解析算法为:所述文件类型为演示文稿时;对所述演示文稿进行特征识别,得到所述演示文稿的文档尺寸、文字特征以及图片特征;将所述文档尺寸、文字特征以及图片特征输入到预训练的风格识别模型中,得到所述演示文稿的风格类型。
具体地,通过风格识别模型需要确定演示文稿的长和宽,并计算长和宽的比例,然后与预设的文稿比例进行对比,确定演示文稿的类型是PPT文稿还是Word等;然后基于最近邻聚类方法,取演示文稿中每一个页面的各个子区域中的文字做变换,使之成为同一尺寸大小,这一步骤称之为大小规范化;其中,常用的大小规范化操作也有两种,一种是将文字的外边框按比例线性放大或缩小成规定尺寸的文字,另一种是根据水平和垂直两个方向上文字黑像素的分布情况进行大小规范化。
将大小规范化后的文字与预设的点阵字体中同一文字进行对比,得到各子区域中字体的类型,例如楷体、宋体或华文琥珀等,然后计算演示文稿中占用文字区域面积最大的字体类型,并获取该字体类型所对应的演示文稿风格;
具体地,将各子区域的文字的像素点与预设的点阵字体的像素点做重合处理,并为不同类型的像素点设定不同的取值后,计算像素点重合率。
其中,像素点重合率为同一像素上(GRB)像素取值大小,即,计算同一文字的像素点取值完全相同的概率,若大于98%,则认为该文字区域的字体与预设字体相同,确定子区域文字的类型,例如,楷体。
然后,可以通过现有的阿里云图像风格识别平台,对图像风格进行识别,最后得出一个演示文稿中所有图片的风格类型。
最后,可以通过计算连通区域,计算文字在所有演示文稿中占用的面积,计算演示文稿的文字覆盖率,并根据文字覆盖率与预设的风格对照表进行对比,得到该文字覆盖率下演示文稿的风格,最后将文字覆盖确定的演示文稿的风格与同一风格类型的图片数量排名前两名的风格类型进行组合,计算得到的多个演示文稿的风格类型是否一致,若一致,则得到演示文稿风格;若不一致,则随机从三种风格类型中任选一种或多种,对演示文稿进行标签标记。
通过现有成熟的技术对演示文稿进行风格识别,可以大大提升演示文稿风格推荐效率。
进一步地,为了解决现有技术中用户对象审美风格或者工作需要等的变化,而导致的演示文稿风格推荐不准确的问题,在一些实施例中,本申请的技术方案还可以:
获取样本对象在不同时间段对同一适配类型的演示文稿的历史评分或者使用次数;计算不同对象特征下样本对象对不同适配类型的演示文稿的使用更替权重;获取所述相似对象对不同适配类型的演示文稿的使用更替权重,作为推荐更替权重;并根据所述推荐更替权重对通过文稿适配算法得到的适配类型的演示文稿进行排序,并将最小推荐更替权重对应的适配类型的演示文稿推送给所述用户对象。
其中,更替权重的计算公式(6)为:
Figure 231085DEST_PATH_IMAGE024
(6)
其中,
Figure 685724DEST_PATH_IMAGE025
为样本用户u对适配类型为i的演示文稿的评分时间,
Figure 563551DEST_PATH_IMAGE026
为对适配类 型为i的演示文稿的评分时间集合,
Figure 959766DEST_PATH_IMAGE027
为样本用户u在该集合里的最近评分时间,
Figure 861468DEST_PATH_IMAGE028
为样本用户u在该集合里的最大历史评分时间。
当加入衰减权重时,需要将用户对象对演示文稿的历史评分、以及评分时间作为一个特征进行计算,并在得到与该用户对象匹配的适配类型的演示文稿后,根据该特征,即更替权重系数对得到的演示文稿进行二次排序,通过这种方式可以大大提高演示文稿推荐的准确率。
进一步地,本申请还可以通过NLP语义模型对各特征维度多对应的特征数据进行语义解析,然后通过提取关键词,通过计算关键词之间的语义相似度的方式来计算特征与特征的相似度,并将与第一标准特征中的特征相似度大于预设相似度的特征所对应的特征数据进行合并操作。
例如,用户对象的性格对应的数据为:诚实守信、有毅力;而星座特征对应的数据为:热血,他们直率、坦诚、慷慨、冲动、大大咧咧,对于自己既定的目标,完成是唯一的选择,白羊座不给自己其他的选择,有很强的决心和毅力;他们通常都富有决断力,不会婆婆妈妈,不注重细节,没有耐心。
将星座与性格特征合并后,算法会偏向为该用户对象适配简约、篇幅短的演示文稿。
通过这种方式可以大大提高推荐系统的数据处理效率,提高文稿推荐速度,又综合多方面的特征数据进行文稿推荐,提高了文稿推荐的准确率。
上述基于协同过滤算法的演示文稿推荐方法中,通过协同过滤算法(用户标签+使用习惯)的推荐技术,对于不同用户登录工具完成会议材料的制作后精准地推送演示文稿的风格模板,提高了会议整体材料的观赏性,提升了会议召开的质量,贴合了用户的使用习惯。
应该理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图3所示,提供了一种基于协同过滤算法的演示文稿推荐装置,该基于协同过滤算法的演示文稿推荐装置与上述实施例中基于协同过滤算法的演示文稿推荐方法一一对应。该基于协同过滤算法的演示文稿推荐装置,应用于至少包括根据用户对象的用户请求进行演示文稿匹配以及用户对象对得到的演示文稿进行应用类型标记功能的文稿应用系统,包括:
接收模块302,用于接收用户对象的演示文稿推荐请求;
获取模块304,用于根据所述推荐请求获取所述用户对象的对象特征和应用特征,其中,所述应用特征包括所述用户对象对各演示文稿进行应用类型标记的历史信息;
适配模块306,用于基于通过协同过滤算法计算得到的文稿适配度,根据所述对象特征和所述应用特征计算所述用户对象的相似对象;
推荐模块308,用于获取通过文稿适配算法得到的与所述相似对象对应的演示文稿的适配类型,并将所述适配类型发送给所述用户对象。
进一步地,在适配模块之前,还包括:
第一特征计算模块,用于计算不同对象特征下的样本对象对不同文稿类型下的演示文稿的第一评分向量,得到至少两个所述样本对象对不同演示文稿的第一多维操作向量;
第一标签计算模块,用于根据所述第一多维操作向量计算不同所述样本对象之间的第一多维标签向量;
第二特征计算模块,用于计算不同文稿类型下演示文稿在不同应用特征下第二评分向量,得到第二多维操作向量;
第二标签计算模块,用于根据所述第二多维操作向量计算不同应用特征之间的第二多维标签向量;
加权处理模块,用于基于线性加权对所述第一多维标签向量和所述第二多维标签向量进行加权处理,并根据得到第三多维标签向量;
适配度计算模块,用于基于协同过滤算法和所述第三多维标签向量计算不同样本对象和不同应用特征对不同文稿类型的文稿适配度。
进一步地,在接收模块之前,还包括:
历史信息获取模块,用于获取样本对象的历史文档;
类型确定模块,用于确定所述历史文档的文件类型;
文件解析模块,用于通过与所述文件类型对应的文件解析算法对所述历史文档进行类型解析,确定所述历史文档的适配类型。
进一步地,文件解析模块,包括:
识别子模块,用于当所述文件类型为演示文稿时,识别所述演示文稿的文档尺寸、文字特征以及图片特征;
类型预测子模块,用于基于风格识别算法,根据所述文档尺寸、所述文字特征以及所述图片特征得到所述演示文稿的适配类型。
进一步地,在推荐模块之后,还包括:
评分模块,用于获取样本对象在不同时间段对同一适配类型的演示文稿的历史评分或者使用次数;
权重计算模块,用于计算不同对象特征下样本对象对不同适配类型的演示文稿的使用更替权重;
相似获取模块,用于获取所述相似对象对不同适配类型的演示文稿的使用更替权重,作为推荐更替权重;并
排序模块,用于根据所述推荐更替权重对通过文稿适配算法得到的适配类型的演示文稿进行排序,并将最小推荐更替权重对应的适配类型的演示文稿推送给所述用户对象。
上述基于协同过滤算法的演示文稿推荐装置,通过协同过滤算法的推荐技术,对于不同用户登录工具完成会议材料的制作后精准地推送演示文稿的风格模板,提高了会议整体材料的观赏性,提升了会议召开的质量,贴合了用户的使用习惯。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机可读指令和数据库。该内存储器为非易失性存储介质中的操作系统和计算机可读指令的运行提供环境。该计算机设备的数据库用于存储用户的特征数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机可读指令被处理器执行时以实现一种基于协同过滤算法的演示文稿推荐方法。本实施例通过协同过滤算法的推荐技术,对于不同用户登录工具完成会议材料的制作后精准地推送演示文稿的风格模板,提高了会议整体材料的观赏性,提升了会议召开的质量,贴合了用户的使用习惯。
其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable Gate Array,FPGA)、数字处理器 (Digital Signal Processor,DSP)、嵌入式设备等。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机可读指令,计算机可读指令被处理器执行时实现上述实施例中基于协同过滤算法的演示文稿推荐方法的步骤,例如图2所示的步骤202至步骤208,或者,处理器执行计算机可读指令时实现上述实施例中基于协同过滤算法的演示文稿推荐装置的各模块/单元的功能,例如图3所示模块302至模块308的功能。
本实施例通过协同过滤算法的推荐技术,对于不同用户登录工具完成会议材料的制作后精准地推送演示文稿的风格模板,提高了会议整体材料的观赏性,提升了会议召开的质量,贴合了用户的使用习惯。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机可读指令来指令相关的硬件来完成,所述的计算机可读指令可存储于一非易失性计算机可读取存储介质中,该计算机可读指令在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形、改进或者对部分技术特征进行等同替换,而这些修改或者替换,并不使相同技术方案的本质脱离本发明个实施例技术方案地精神和范畴,都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种基于协同过滤算法的演示文稿推荐方法,其特征在于,应用于至少包括根据用户对象的用户请求进行演示文稿匹配以及用户对象对得到的演示文稿进行应用类型标记功能的文稿应用系统,包括:
接收用户对象的演示文稿推荐请求;
根据所述推荐请求获取所述用户对象的对象特征和应用特征,其中,所述应用特征包括所述用户对象对各演示文稿进行应用类型标记的历史信息;
基于通过协同过滤算法计算得到的文稿适配度,根据所述对象特征和所述应用特征计算所述用户对象的相似对象;
获取通过文稿适配算法得到的与所述相似对象对应的演示文稿的适配类型,并将所述适配类型发送给所述用户对象;
所述基于通过协同过滤算法计算得到的文稿适配度,根据所述对象特征和所述应用特征计算所述用户对象的相似对象的步骤包括:
根据NLP语义模型对所述对象特征以及所述应用特征进行语义解析,得到对象关键词语义以及应用关键词语义;
计算所述对象关键词语义以及所述应用关键词语义的语义相似度;
将满足预设相似度阈值的所述语义相似度所对应的所述对象关键词语义以及所述应用关键词计算所述相似对象。
2.根据权利要求1所述的方法,其特征在于,在所述基于通过协同过滤算法计算得到的文稿适配度,根据所述对象特征和所述应用特征计算所述用户对象的相似对象之前,还包括:
计算不同对象特征下的样本对象对不同文稿类型下的演示文稿的第一评分向量,得到至少两个所述样本对象对不同演示文稿的第一多维操作向量;
根据所述第一多维操作向量计算不同所述样本对象之间的第一多维标签向量;
计算不同文稿类型下演示文稿在不同应用特征下第二评分向量,得到第二多维操作向量;
根据所述第二多维操作向量计算不同应用特征之间的第二多维标签向量;
基于线性加权对所述第一多维标签向量和所述第二多维标签向量进行加权处理,并根据得到第三多维标签向量;
基于协同过滤算法和所述第三多维标签向量计算不同样本对象和不同应用特征对不同文稿类型的文稿适配度。
3.根据权利要求2所述的方法,其特征在于,所述基于协同过滤算法和所述第三多维标签向量计算不同样本对象和不同应用特征对不同文稿类型的文稿适配度,包括:
通过
Figure 711876DEST_PATH_IMAGE002
计算得到所述文稿适配度,其中,
Figure DEST_PATH_IMAGE003
为相似样本对象
Figure 180028DEST_PATH_IMAGE004
的评分,
Figure DEST_PATH_IMAGE005
为该相似样本
Figure 699871DEST_PATH_IMAGE004
的对象均值,
Figure 45402DEST_PATH_IMAGE006
为该样本对象的邻近集合,
Figure DEST_PATH_IMAGE007
为所述第三多维标签向量。
4.根据权利要求1所述的方法,其特征在于,在所述接收用户对象的演示文稿推荐请求之前,还包括:
获取样本对象的历史文档;
确定所述历史文档的文件类型;
通过与所述文件类型对应的文件解析算法对所述历史文档进行类型解析,确定所述历史文档的适配类型。
5.根据权利要求4所述的方法,其特征在于,所述通过与所述文件类型对应的文件解析算法对所述历史文档进行类型解析,确定所述历史文档的适配类型,包括:
当所述文件类型为演示文稿时,识别所述演示文稿的文档尺寸、文字特征以及图片特征;
基于风格识别算法,根据所述文档尺寸、所述文字特征以及所述图片特征得到所述演示文稿的适配类型。
6.根据权利要求1所述的方法,其特征在于,在所述获取通过文稿适配算法得到的与所述相似对象对应的演示文稿的适配类型,并将所述适配类型发送给所述用户对象之后,还包括:
获取样本对象在不同时间段对同一适配类型的演示文稿的历史评分或者使用次数;
计算不同对象特征下样本对象对不同适配类型的演示文稿的使用更替权重;
获取所述相似对象对不同适配类型的演示文稿的使用更替权重,作为推荐更替权重;并
根据所述推荐更替权重对通过文稿适配算法得到的适配类型的演示文稿进行排序,并将最小推荐更替权重对应的适配类型的演示文稿推送给所述用户对象。
7.一种基于协同过滤算法的演示文稿推荐装置,其特征在于,应用于至少包括根据用户对象的用户请求进行演示文稿匹配以及用户对象对得到的演示文稿进行应用类型标记功能的文稿应用系统,包括:
接收模块,用于接收用户对象的演示文稿推荐请求;
获取模块,用于根据所述推荐请求获取所述用户对象的对象特征和应用特征,其中,所述应用特征包括所述用户对象对各演示文稿进行应用类型标记的历史信息;
适配模块,用于基于通过协同过滤算法计算得到的文稿适配度,根据所述对象特征和所述应用特征计算所述用户对象的相似对象;
推荐模块,用于获取通过文稿适配算法得到的与所述相似对象对应的演示文稿的适配类型,并将所述适配类型发送给所述用户对象;
所述适配模块包括:
语义解析子模块,用于根据NLP语义模型对所述对象特征以及所述应用特征进行语义解析,得到对象关键词语义以及应用关键词语义;
语义相似度子模块,用于计算所述对象关键词语义以及所述应用关键词语义的语义相似度;
适配子模块,用于将满足预设相似度阈值的所述语义相似度所对应的所述对象关键词语义以及所述应用关键词计算所述相似对象。
8.根据权利要求 7所述的装置,其特征在于,在所述适配模块之后,还包括:
第一特征计算模块,用于计算不同对象特征下的样本对象对不同文稿类型下的演示文稿的第一评分向量,得到至少两个所述样本对象对不同演示文稿的第一多维操作向量;
第一标签计算模块,用于根据所述第一多维操作向量计算不同所述样本对象之间的第一多维标签向量;
第二特征计算模块,用于计算不同文稿类型下演示文稿在不同应用特征下第二评分向量,得到第二多维操作向量;
第二标签计算模块,用于根据所述第二多维操作向量计算不同应用特征之间的第二多维标签向量;
加权处理模块,用于基于线性加权对所述第一多维标签向量和所述第二多维标签向量进行加权处理,并根据得到第三多维标签向量;
适配度计算模块,用于基于协同过滤算法和所述第三多维标签向量计算不同样本对象和不同应用特征对不同文稿类型的文稿适配度。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机可读指令,其特征在于,所述处理器执行所述计算机可读指令时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机可读指令,其特征在于,所述计算机可读指令被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202110660078.6A 2021-06-15 2021-06-15 基于协同过滤算法的演示文稿推荐方法及相关设备 Active CN113111198B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110660078.6A CN113111198B (zh) 2021-06-15 2021-06-15 基于协同过滤算法的演示文稿推荐方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110660078.6A CN113111198B (zh) 2021-06-15 2021-06-15 基于协同过滤算法的演示文稿推荐方法及相关设备

Publications (2)

Publication Number Publication Date
CN113111198A CN113111198A (zh) 2021-07-13
CN113111198B true CN113111198B (zh) 2021-08-31

Family

ID=76723597

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110660078.6A Active CN113111198B (zh) 2021-06-15 2021-06-15 基于协同过滤算法的演示文稿推荐方法及相关设备

Country Status (1)

Country Link
CN (1) CN113111198B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113553450B (zh) * 2021-08-03 2024-01-30 广东新学未科技有限公司 Ppt演示文稿自动生成方法、装置、计算设备及存储介质
CN117216586A (zh) * 2023-09-12 2023-12-12 北京饼干科技有限公司 演示文稿模版的生成方法、装置、介质及设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8281245B1 (en) * 2009-07-22 2012-10-02 Google Inc. System and method of preparing presentations
US9324028B1 (en) * 2014-02-28 2016-04-26 Outbrain Inc. Collaborative filtering of content recommendations
CN105740213A (zh) * 2014-12-10 2016-07-06 珠海金山办公软件有限公司 一种演示文稿模板提供方法及装置
CN106844714A (zh) * 2017-02-08 2017-06-13 河海大学常州校区 一种知识库管理系统
CN111553136A (zh) * 2019-02-11 2020-08-18 珠海金山办公软件有限公司 一种生成演示文档模板的方法、装置及电子设备
CN112380454A (zh) * 2021-01-18 2021-02-19 平安科技(深圳)有限公司 培训课程推荐方法、装置、设备及介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10242672B2 (en) * 2016-10-28 2019-03-26 Microsoft Technology Licensing, Llc Intelligent assistance in presentations
US10769203B1 (en) * 2019-10-17 2020-09-08 Samsung Electronics Co., Ltd. System and method for prediction and recommendation using collaborative filtering
CN112131876A (zh) * 2020-09-04 2020-12-25 交通银行股份有限公司太平洋信用卡中心 一种基于相似度确定标准问题的方法及系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8281245B1 (en) * 2009-07-22 2012-10-02 Google Inc. System and method of preparing presentations
US9324028B1 (en) * 2014-02-28 2016-04-26 Outbrain Inc. Collaborative filtering of content recommendations
CN105740213A (zh) * 2014-12-10 2016-07-06 珠海金山办公软件有限公司 一种演示文稿模板提供方法及装置
CN106844714A (zh) * 2017-02-08 2017-06-13 河海大学常州校区 一种知识库管理系统
CN111553136A (zh) * 2019-02-11 2020-08-18 珠海金山办公软件有限公司 一种生成演示文档模板的方法、装置及电子设备
CN112380454A (zh) * 2021-01-18 2021-02-19 平安科技(深圳)有限公司 培训课程推荐方法、装置、设备及介质

Also Published As

Publication number Publication date
CN113111198A (zh) 2021-07-13

Similar Documents

Publication Publication Date Title
CN111753060B (zh) 信息检索方法、装置、设备及计算机可读存储介质
US11070501B2 (en) Computerized system and method for automatically determining and providing digital content within an electronic communication system
US9514405B2 (en) Scoring concept terms using a deep network
US10180979B2 (en) System and method for generating suggestions by a search engine in response to search queries
US20150081696A1 (en) Systems and Methods for Actively Composing Content for Use in Continuous Social Communication
US20150169710A1 (en) Method and apparatus for providing search results
US11797634B2 (en) System and method for providing a content item based on computer vision processing of images
CN108446964B (zh) 一种基于移动流量dpi数据的用户推荐方法
US10193849B2 (en) Determining stories of interest based on quality of unconnected content
WO2009108576A2 (en) Prioritizing media assets for publication
US20230224301A1 (en) Enhanced access to media, systems and methods
CN113111198B (zh) 基于协同过滤算法的演示文稿推荐方法及相关设备
US11599571B2 (en) Generic card feature extraction based on card rendering as an image
WO2021155691A1 (zh) 用户画像生成方法、装置、存储介质及设备
US11734516B2 (en) Systems and methods to generate messages using machine learning on digital assets
CN113220734A (zh) 课程推荐方法、装置、计算机设备及存储介质
US11640420B2 (en) System and method for automatic summarization of content with event based analysis
US20160323232A1 (en) Aggregating content associated with topics in a social network
CN113569129A (zh) 点击率预测模型处理方法、内容推荐方法、装置及设备
WO2022001233A1 (zh) 基于层次化迁移学习的预标注方法及其相关设备
JP2023554210A (ja) インテリジェント推奨用のソートモデルトレーニング方法及び装置、インテリジェント推奨方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム
CN112597760A (zh) 文档中的领域词提取方法和装置
CN111797257B (zh) 基于词向量的图片推荐方法及相关设备
CN113792549B (zh) 一种用户意图识别的方法、装置、计算机设备及存储介质
CN114996561B (zh) 一种基于人工智能的信息推荐方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant