CN111782919A - 在线文档的处理方法、装置、计算机设备及存储介质 - Google Patents

在线文档的处理方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN111782919A
CN111782919A CN202010581622.3A CN202010581622A CN111782919A CN 111782919 A CN111782919 A CN 111782919A CN 202010581622 A CN202010581622 A CN 202010581622A CN 111782919 A CN111782919 A CN 111782919A
Authority
CN
China
Prior art keywords
target
online document
online
information
alternative
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010581622.3A
Other languages
English (en)
Inventor
陈卓铭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010581622.3A priority Critical patent/CN111782919A/zh
Publication of CN111782919A publication Critical patent/CN111782919A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • H04L12/1813Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
    • H04L12/1831Tracking arrangements for later retrieval, e.g. recording contents, participants activities or behavior, network status

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请涉及计算机技术领域,提供一种在线文档的处理方法、装置、计算机设备及存储介质,该方法包括:接收目标用户针对在线文档的获取请求;根据所述获取请求,从所述目标用户权限内的在线文档中,确定出多个备选在线文档;根据各备选在线文档的使用记录,获得各备选在线文档的热度;其中,所述热度用于表征备选在线文档的使用趋势和备选在线文档的时效性中的一种或两种的组合;从所述多个备选在线文档进中获得热度满足设定条件的至少一个目标在线文档;响应所述获取请求,发送所述至少一个目标在线文档的展示信息。

Description

在线文档的处理方法、装置、计算机设备及存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种在线文档的处理方法、装置、计算机设备及存储介质。
背景技术
随着网络技术的不断发展,逐渐出现了在线办公。在线办公中,用户可以将某些文档共享给会话窗口中的其他用户,其他用户可以随时查看或编辑该文档。随着各用户的不断共享,每个用户对应的文档会越来越多,用户查找某个文档时,可以根据搜索词搜索自己需要的文档。
目前,在为用户反馈搜索结果的方式是:根据各文档与用户输入的搜索词之间的相关性,对各文档进行排序。这种方式仅考虑了文档与搜索词之间的相关性,筛选出的在线文档较为片面,与用户实际想要的在线文档相差较远,即目前查找在线文档的准确性较低。
发明内容
本申请实施例提供一种在线文档的处理方法、装置、计算机设备及存储介质,用于提高获取在线文档的准确性。
一方面,提供一种在线文档的处理方法,包括:
接收目标用户针对在线文档的获取请求;
根据所述获取请求,从所述目标用户权限内的在线文档中,确定出多个备选在线文档;
根据各备选在线文档的使用记录,获得各备选在线文档的热度;其中,所述热度用于表征备选在线文档的使用趋势和备选在线文档的时效性中的一种或两种的组合;
从所述多个备选在线文档进中获得热度满足设定条件的至少一个目标在线文档;
响应所述获取请求,发送所述至少一个目标在线文档的展示信息。
又一方面,提供一种在线文档处理的方法,包括:
响应于目标用户进行的搜索在线文档的目标操作,发送搜索请求;
接收并显示至少一个目标在线文档的展示信息,以及每个目标在线文档的目标标签信息;其中,所述目标标签信息包括目标在线文档的时间属性和协作信息。
又一方面,提供一种在线文档处理的方法,包括:
响应于目标用户进行的插入在线文档的目标操作,发送推荐请求;
接收并显示至少一个目标在线文档的展示信息,以及每个目标在线文档的目标标签信息;其中,所述目标标签信息包括目标在线文档的时间属性和协作信息。
本申请实施例提供一种在线文档的处理装置,包括:
收发模块,用于接收目标用户针对在线文档的获取请求;
确定模块,用于根据所述获取请求,从所述目标用户权限内的在线文档中,确定出多个备选在线文档;
获得模块,用于根据各备选在线文档的使用记录,获得各备选在线文档的热度;其中,所述热度用于表征备选在线文档的使用趋势和备选在线文档的时效性中的一种或两种的组合;以及,从所述多个备选在线文档进中获得热度满足设定条件的至少一个目标在线文档;
所述收发模块,还用于响应所述获取请求,发送所述至少一个目标在线文档的展示信息。
在一种可能的实施例中,所述收发模块还用于:
响应所述获取请求,发送所述至少一个目标在线文档的展示信息时,还发送每个目标在线文档的目标标签信息,其中,所述目标标签信息包括目标在线文档的时间属性和协作信息。
在一种可能的实施例中,目标在线文档的目标标签信息是通过如下方式获得的:
根据各目标在线文档的使用记录,从各个目标在线文档的时间属性和协作信息中的一个或者两个中,提取目标在线文档的关键信息;
根据各个目标文档的关键信息,分别获得每个目标在线文档的多个备选标签信息;
针对每个目标在线文档,将目标在线文档的多个备选标签信息中相关度满足相关度阈值的备选标签信息确定为目标在线文档的目标标签信息。
在一种可能的实施例中,所述获得模块具体用于:
获取在设定时间段内对在线文档的访问频次信息、各次访问的时间长度信息,以及访问备选在线文档的时间与当前时间的时间间隔信息中的一个或者任意组合;
根据获取的信息分别确定各备选在线文档的热度,其中,访问频次越高热度越高,访问的时间长度越长热度越高,且时间间隔越小热度越高。
在一种可能的实施例中,所述获得模块还具体用于:
获取所述目标群组在设定时间段内关联的群消息集合与备选在线文档之间的相关度信息,以及
根据获取的信息分别确定各备选在线文档的热度时,相关度越大热度越高。
在一种可能的实施例中,所述获得模块具体用于通过如下任一方式获得备选在线文档的热度:
根据访问频次信息,获得备选在线文档每类访问操作对应的访问频次,并对备选在线文档每类访问操作对应的访问频次进行加权求和,获得备选在线文档的热度,其中,每类访问操作对应的加权权重不同;或,
根据各次访问的时间长度信息,获得每个用户对备选在线文档的访问时长,并对与所述目标用户相关的各用户的访问时长进行加权求和,其中,与所述目标用户的相关性越大的用户对应的加权权重越大;或,
将访问备选在线文档的时间与当前时间的时间间隔信息输入反相关函数,获得备选在线文档的热度。
在一种可能的实施例中,所述收发模块,还用于在所述响应所述获取请求,发送所述至少一个目标在线文档的展示信息之后,接收所述目标用户在查看所述至少一个目标在线文档的展示信息时的话语信息;
所述获得模块,还用于解析所述话语信息中的排序标准,获得所述至少一个目标在线文档满足所述排序标准的至少一个重选在线文档,并将所述至少一个重选在线文档的展示信息。
本申请实施例提供一种在线文档的处理装置,包括:
发送模块,用于响应于目标用户进行的搜索在线文档的目标操作,发送搜索请求;
接收模块,用于至少一个目标在线文档的展示信息,以及每个目标在线文档的目标标签信息;其中,所述目标标签信息包括目标在线文档的时间属性和协作信息;
显示模块,用于显示所述至少一个目标在线文档的展示信息,以及每个目标在线文档的目标标签信息。
在一种可能的实施例中,所述发送模块具体用于:
所述响应于目标用户通过网页进行的搜索在线文档的目标操作,发送搜索请求;或,
所述响应于目标用户在即时通讯客户端的聊天窗口中进行的搜索在线文档的目标操作,发送搜索请求。
在一种可能的实施例中,所述显示模块具体用于:
按照热度从高到低的顺序,依次显示所述至少一个目标在线文档中各目标在线文档的展示信息。
本申请实施例提供一种在线文档的处理装置,包括:
发送模块,用于响应于目标用户进行的搜索在线文档的目标操作,发送搜索请求;
接收模块,用于至少一个目标在线文档的展示信息,以及每个目标在线文档的目标标签信息;其中,所述目标标签信息包括目标在线文档的时间属性和协作信息;
显示模块,用于显示所述至少一个目标在线文档的展示信息,以及每个目标在线文档的目标标签信息。
本申请实施例提供一种计算机设备,包括:
至少一个处理器,以及
与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令实现任一所述的在线文档的处理方法。
本申请实施例提供一种存储介质,所述存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行任一所述的在线文档的处理方法。
由于本申请实施例采用上述技术方案,至少具有如下技术效果:
本申请实施例中,从目标用户关联的在线文档中,获得获取请求的相关的备选在线文档,根据各备选在线文档使用记录获,获得各备选在线文档的热度,该热度从一定程度上反映了最近各用户对在线文档的使用情况,即反映了在线文档的时效性,而各用户对在线文档的使用,或多或少会影响目标用户对在线文档是访问,因此,本申请实施例中筛选出的热度满足设定条件的目标在线文档用户需要的可能性更大,即本申请实施例中的获得目标在线文档更符合目标用户的使用需求,提升确定出的目标在线文档的准确性。且,生成的目标在线文档为热度满足设定条件的备选在线文档,能够筛选掉一部分备选在线文档,为目标用户提供相对更少的目标在线文档,避免了用户从大量目标在线文档筛选自己想要的在线文档的情况。
附图说明
图1为相关技术提供的一种在线文档的搜索结果示例图;
图2为本申请实施例提供的在线文档的处理系统的结构示意图;
图3为本申请实施例提供的一种在线文档的处理方法的过程示例图;
图4为本申请实施例提供的另一种在线文档的处理方法的过程示例图;
图5为本申请实施例提供的各设备之间的交互过程示意图一;
图6为本申请实施例提供的在一种网页上呈现的搜索界面示例图;
图7为本申请实施例提供的一种搜索过程中的界面示例图;
图8为本申请实施例提供的在设定时间段内聊天窗口中展示的群消息集合;
图9为本申请实施例提供的与图6对应的目标在线文档的显示界面;
图10为本申请实施例提供的与图7对应的目标在线文档的搜索反馈界面;
图11为本申请实施例提供的各设备之间的交互过程示意图二;
图12为本申请实施例提供的显示目标在线文档的示例图;
图13为本申请实施例提供的在线文档的处理装置的结构示意图一;
图14为本申请实施例提供的在线文档的处理装置的结构示意图二;
图15为本申请实施例提供的在线文档的处理装置的结构示意图三;
图16为本申请实施例提供的计算机设备的结构示意图。
具体实施方式
为了更好的理解本申请实施例提供的技术方案,下面将结合说明书附图以及具体的实施方式进行详细的说明。
为了便于本领域技术人员更好地理解本申请实施例中的技术方案,下面对本申请实施例涉及的名词进行介绍。
在线文档:是指通过网络渠道发布的文档。在线文档支持多人协同处理,比如支持多人同时协同处理。在线文档的格式可以有很多种,比如word格式、excel格式、txt格式或其它格式等。
使用记录:是指对同一共享空间下各用户访问在线文档所生成的使用记录,使用包括浏览在线文档、查看在线文档、下载在线文档、编辑在线文档、评论在线文档、分享在线文档等中的一种或几种的组合。同一共享空间比如同一个公司的各成员,比如同一个群组中的各成员。使用记录包括在线文档的时间属性信息和协作信息,具体可以包括各用户访问在线文档的频次信息、每次访问类型、每次访问在线文档的时间长度信息、每次访问在线文档的时间与当前时间的时间间隔信息中的一种或多种的组合。比如用户A编辑了在线文档,后台可以记录用户A的本次使用记录。
目标用户:泛指需要获取目标在线文档的用户。
在线文档的时间属性:是指在线文档相关的时间信息,包括在线文档的创建时间,比如2分钟前创建的;在线文档的浏览时间,比如今日3人浏览;在线文档的编辑时间,比如今日7人编辑;在线文档的最后更新时间,比如最后更新30天前,或者最后更新7天前;
在线文档的协作信息:包括目标用户对在线文档的协作信息,以及其他用户对在线文档的协作信息。协作信息包括目标用户对在线文档的协作信息和其他用户对在线文档的协作信息。目标用户对在线文档的协作信息包括:目标用户浏览在线文档的情况,比如目标用户最近浏览在线文档;目标用户周期性的访问情况,比如周一经常浏览、每月5日编辑;目标用户在群组接收到该在线文档的情况,比如目标用户在3个群组接收过该文档。其他用户比如与目标用户处于同一组织架构下的用户,其他用户的协作信息包括其他用户的协作情况,比如设计部今日6人浏览、今日公司内30人浏览;其他用户的协作信息包括组织架构成员在会话中发送在线文档的情况,比如本部门2人在群组发过。
目标群组:是指在即时通讯客户端中创建的会话组,每个目标群组对应有一个目标群组的群组标识。
目标用户权限内的在线文档:泛指目标用户具有访问权限的在线文档,包括目标用户自己创建或发布的,以及其他用户分享或转发给目标用户的。比如目标用户通过群组搜索在线文档,那么目标用户权限内的在线文档为该群组对应的共享空间下的所有文档。
热度:根据在线文档的使用记录获得的。热度可以用于表征在线文档的时效性,或者可以用于表征在线文档的使用趋势,或者可以用于表征在线文档的使用趋势以及时效性。时效性包括在线文档在时间方面的效力,以及在线文档在内容上的效力,比如在近期内被编辑过的在线文档,相较于近期未被编辑的在线文档时效性更好。使用趋势可以理解为目标用户可能使用在线文档的趋势,比如与目标用户位于同一共享空间下的用户在设定时间段内使用在线文档的频次比另一在线文档的频次更高,那么表示该在线文档的使用趋势相对更好。
在线内容的展示信息:用于表示目标在线文档,可以包括在线文档的在线文档标识、在线文档的链接、在线文档的名称、在线文档的图标、在线文档的发布者、在线文档的发布时间中的一种或多种的组合。在线文档的图标例如word图标。
热文档:又可以称为热在线文档,是指在最近用户浏览或编辑的文档,包括同一个共享空间下用户在浏览或编辑的文档,比如该用户的同组同事在浏览或编辑的文档。热文档可以理解为热度较高的在线文档。
冷文档:又可以称为冷在线文档,是指已过时的、再次访问的频率较低的在线文档,例如已经完成项目的项目进度文档等。冷文档可以理解为热度相对较低的在线文档。
首条满足率:是指搜索结果或推荐结果中,第一条结果满足用户的查找意图的概率。
粗排:粗排是指搜索时,从数据库召回相关结果的过程。
精排:精排是在通过搜索引擎去重之后,根据权重排序返回Top-N的排序结果给用户的过程。
累积增益:(Normalized Discounted Cumulative Gain,NDCG);推荐系统中表示将每个推荐结果相关性的分值累加后作为整个推荐列表的得分。
终端设备:又可以称为终端。可以是移动终端、固定终端或便携式终端,例如移动手机、站点、单元、设备、多媒体计算机、多媒体平板、互联网节点、通信器、台式计算机、膝上型计算机、笔记本计算机、上网本计算机、平板计算机、个人通信系统(PCS)设备、个人导航设备、个人数字助理(PDA)、音频/视频播放器、数码相机/摄像机、定位设备、电视接收器、无线电广播接收器、电子书设备、游戏设备或者其任意组合,包括这些设备的配件、外设或者其任意组合。还可预见到的是,终端设备能够支持任意类型的针对用户的接口设备(例如可穿戴设备)等。
服务器:服务器可以是一个或多个服务器。服务器也可以是实体服务器或虚拟服务器等。服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
由于在线文档技术的不断普及,各用户收到的在线文档也越来越多。用户在有时候可能想去查找之前的一些文档。比如用户想要下载之前共享空间中其他用户共享的在线文档。相关技术中的查找机制为:查找与用户输入的搜索词最相关的文档,具体比如查找文档名称与用户输入的搜索词最相关的文档,这种搜索机制仅考虑了在线文档与搜索词之间的相关性,搜索出的结果很有可能不是用户想要的,即搜索在线文档的准确性低。
例如,请参照图1,为相关技术中的一种在线文档的搜索结果示例图,用户输入的搜索词为图1中输入框110中所示的会议纪要,设备基于该搜索词,为用户提供的搜索结果,搜索结果包括如图1中所示的多个名称为“会议纪要”的在线文档,用户在获得这些搜索结果之后,还需点开每个“会议纪要”文档的内容,查看该在线文档是否是自己想要的。可见,相关技术中的在线文档搜索机制得到的搜索结果与用户的实际需求符合程度不高,搜索准确性不高。另外,该搜索机制会搜索出大量的相近文档,无疑增加了用户从多个搜索结果中查找出自己想要的搜索结果的难度。
鉴于此,本申请实施例提供一种在线文档的处理方法,该方法的技术思路为:根据获取请求获得备选在线文档,根据这些选在线文档的使用记录,而在线文档的使用记录包括目标用户自身的使用记录以及与该目标用户处于同一共享空间下的其他用户的使用记录,而其他用户使用在线文档的热度越高,该用户获取该在线文档的可能性也就越大,即通过该方法的目标在线文档更符合目标用户的需求,从而提高了确定出的目标在线文档的准确性。且,该方法利用热度获得目标在线文档时,可以利用热度筛掉部分与获取请求相关的备选在线文档,后期为目标用户提供的目标在线文档的数量相对更少,节省了目标用户从这些目标在线文档再次筛选自己所需的在线文档的时间。
本申请实施例中,可以根据在线文档的使用记录,获得访问频次信息、时间长度信息、访问在线文档的时间与当前时间的时间间隔信息中的一种或多种组合,确定在线文档的热度,即热度是根据同一共享下各用户对在线文档的使用记录生成的,而同一共享空间下各用户对目标用户访问在线文档与否是存在影响的,比如该用户关联的用户访问某个在线文档,该用户访问该在线文档的可能性越大,如此一来,该方法利用热度确定出的目标在线文档与用户想要的在线文档的符合程度越高,进而提高了获取在线文档的准确性。
本申请实施例中,可以在获得目标在线文档时,获得目标在线文档的目标标签信息,即使获得了多个名称相近的目标在线文档,用户可以根据目标标签信息从目标在线文档中筛选自己想要的目标在线文档。
本申请实施例中的在线文档的处理方法的应用场景介绍如下。
该方法可以用于任何获取在线文档的场景,比如搜索在线文档的场景,或者比如为用户推荐在线文档的场景等。请参照图2,为在线文档的处理系统的结构示意图。该处理系统包括:发布终端211、使用终端212、获取终端213、处理服务器220和数据库230。各终端与处理服务器220之间可以通过网络进行通信,网络包括诸如局域网(LAN)、广域网(WAN)、因特网或者其组合。
发布终端211泛指用于发布在线文档的终端,比如发布者可以通过网页访问在线文档发布服务,发布在线文档,或者比如发布者可以通过发布终端211中安装的客户端,发布在线文档,客户端比如预装在终端中的客户端,或者嵌入在第三方应用中的客户端。发布者通过发布终端211发布在线文档之后,处理服务器220可以将在线文档分享给同一共享空间下的其他用户。同一共享空间下的其他用户以及发布者自己可以访问在线文档。发布在线文档的用户可以称为创建者。
另外,处理服务器220还可以将该在线文档对应存储在数据库230中。处理服务器220存储在线文档时,可以存储在线文档的文档内容,或者还可以关联存储在线文档的在线文档标识以及在线文档的文档内容。在线文档标识可以是在线文档的名称、发布者、发布时间等一种或多种的组合,或者可以是是处理服务器220生成的每个在线文档的唯一标识等。
比如,发布者通过发布终端211中的即时通讯客户端的群组发布在线文档,该群组内的所有成员可以对在线文档进行访问。当发布终端211通过客户端中的某个群组或者某个联系人关联的聊天窗口分享在线文档时,该在线文档关联有对应的群组标识,或者联系人标识等。处理服务器220存储在线文档时,可以将该群组标识或联系人标识,将在线文档存储在该群组标识对应的共享空间中,或者存储在该联系人标识对应的共享空间中。
使用终端212泛指在发布者发布在线文档之后,对在线文档进行访问的终端。当发布者对在线文档进行发布操作之后,该发布者也可以对发布后的在线文档进行访问,那么此时该发布者关联的发布终端211实际也可以作为使用终端212。在各个用户对在线文档进行访问操作之后,使用终端212根据用户的访问操作,生成在线文档的使用记录,使用终端212将使用记录反馈给处理服务器220,处理服务器220将在线文档的使用记录存储在数据库230中。
获取终端213泛指从处理服务器220请求获取在线文档的终端。在处理服务器220存储在线文档以及对应的使用记录后,获取终端213可以向处理服务器220获取目标在线文档,获取在线文档包括很多种具体场景,下面以获取终端213请求搜索在线文档,或获取终端213获取推荐在线文档为例,对本申请实施例中的在线文档的处理方法的应用场景进行示例说明:
第一种可能的场景,搜索在线文档:
比如,获取终端213响应于用户通过套件进行的搜索操作,生成搜索请求,该搜索请求为获取请求的一种示例。具体请参照图3中(1)所示,为一种浏览器界面示例图,当用户在浏览器对应的网页的输入框310输入搜索关键词,获取终端213根据该搜索关键词,生成搜索请求,该搜索请求用于请求与搜索关键词对应的在线文档,该获取请求中携带有搜索关键词。浏览器对应的网页中是用超文本标记语言(HTML)格式化的web页面,其可以包含文本、图像、多媒体内容和编程要素(例如脚本)。该网页呈现的内容由后台对应的工作人员来维护。该网页是与处理服务器220关联的,用户可以通过该网页上传或创建自己的在线文档。
或者比如,获取终端213响应于用户通过客户端进行的搜索在线文档的目标操作,生成搜索请求。具体请参照图3中(2),表示一种客户端关联的在线文档搜索界面示例图,用户可以在输入框320中输入搜索关键词,获取终端213响应于该用户进行的输入操作,生成搜索请求。比如用户通过即时通讯客户端中的群组进行搜索,该搜索请求中除了包括搜索关键词之外,还可以包括该群组标识,该群组标识用于限定从该群组关联的共享空间中搜索在线文档。
处理服务器220按照本申请实施例中的在线文档的处理方法,获得目标在线文档,将目标在线文档的展示信息发送给获取终端213。在线文档的处理方法的具体过程将在下文进行详细介绍,此处不再详述。
其中,处理服务器220可以是单个服务器,或者可以是多个服务器。在一种可能的实施例中,在处理服务器220获得目标在线文档的展示信息时,可以通过第一服务器221、第二服务器222和第三服务器223实现。第一服务器221、第二服务器222和第三服务器223实质可以理解为三个服务,或者三个服务器。第一服务器221可以是客户端对应的后台服务器,或者网页对应的后台服务器,第一服务器221具体比如可以是具有公共网关接口(CommonGateway Interface,CGI)的服务器,或者简称为CGI服务器,CGI是Web服务器运行时外部程序的规范,按CGI编写的程序可以扩展服务器功能。CGI应用程序能与浏览器进行交互,还可通过数据API与数据库等外部数据源进行通信,从数据库中获取数据。第二服务器222可以是粗排服务器,用于获得与搜索请求关联的备选在线文档。第三服务器223可以是精排服务器,用于按照热度从备选在线文档中获得目标在线文档。
第二种可能的场景,推荐在线文档:
在有些情况下,用户需要系统为其推荐在线文档,例如请参照图4,为一种推荐在线文档的场景示例图,用户在编辑某些文件时,需要插入在线文档时,获取终端213可以根据用户进行插入在线文档的目标操作,生成推荐请求,该推荐请求为获取请求的一种示例,该推荐请求用于请求处理服务器220推荐在线文档。处理服务器220接收该推荐请求之后,按照本申请实施例中的在线文档的处理方法,获得目标在线文档,将目标在线文档作为推荐结果反馈给获取终端213。
应当说明的是,上述两种场景只是对本申请实施例中的在线文档的处理方法的场景进行示例,该方法的使用场景并不限于此。
基于上述图3论述的应用场景,下面对本申请实施例涉及的在线文档的处理方法进行介绍。
请参图5,表示各设备之间的交互示意图,该交互过程具体包括:
S501,获取终端213根据目标用户的目标操作,生成搜索请求。
如图3论述的内容,用户在浏览器对应的网页中的搜索操作,比如用户在网页中输入搜索关键词,相当于进行了目标操作,或者用户在客户端中进行的目标操作,比如用户在客户端的界面中输入搜索操作,客户端的界面比如为目标群组的应用界面,相当于进行了目标操作,获取终端213可以响应于该目标操作,生成搜索请求。该搜索请求用于请求搜索与搜索关键词相关的在线文档。
其中,该搜索请求中可以包括该搜索关键词。该搜索请求还可以包括该获取终端213的终端标识,以便于后续向该获取终端213反馈搜索结果。为了便于后续处理服务器220方便确定在线文档的搜索范围,如果该用户是通过即时通讯客户端中的群组或联系人等发送的搜索请求,则该搜索请求中还可以包括该群组的群组标识或联系人标识。
例如,请参照图6,为一种在网页上呈现的搜索界面。获取终端213可以响应于用户在该搜索界面上中的输入框601中进行搜索关键词的输入操作,比如用户输入“会议纪要”,则获取终端213根据该输入操作,以及搜索关键词,生成搜索请求。
或者例如,请参照图7,表示一种在客户端进行搜索的过程示例图,获取终端213响应于针对如图7中(1)所示的聊天窗口进行的点击操作,显示如图7中(2)所示的群组信息界面,获取终端213响应于用户针对群组信息界面中的在线文件图标701的点击操作,显示如图7中(3)所示的搜索界面。获取终端213可以响应于用户在该图7中(3)搜索界面上进行的关键词的输入操作,比如用户输入“会议纪要”,则获取终端213根据该输入操作,该群组的群组标识,以及搜索关键词,生成搜索请求。
S502,获取终端213向第一服务器221发送搜索请求。
S503,第一服务器221将搜索请求发送给第二服务器222。
S504,第二服务器222向第一服务器221发送备选在线文档的文档标识。
获取终端213会不定时的获取在线文档,第一服务器221可以从在获得对应的在线文档后,生成各在线文档的在线文档标识以及该在线文档的关键词等,第一服务器221将在线文档标识、在线文档的关键词存储在数据库230中。在线文档标识可以是以在线文档的名称和在线文档的发布者,或者可以是根据在线文档的名称等信息按照加密算法生成的唯一标识等。
第二服务器222获得搜索请求之后,可以从目标用户相关的在线文档中筛选出的与搜索请求相关的在线文档。与目标用户相关的在线文档包括是与目标用户进行搜索的位置相关的,下面进行具体示例说明:
如果用户通过浏览器对应的页面进行搜索,与目标用户相关的在线文档则包括该用户自己创建或发布的在线文档,以及该用户从各用户处接收的在线文档等。
如果用户通过某个联系人关联的搜索界面进行搜索,那么与目标用户相关的在线文档包括与该联系人的聊天界面相关的在线文档,比如与该联系人相关的在线文档,以及该联系人在该聊天窗口中分享的在线文档。如果用户通过某个群组关联的搜索界面进行搜索,那么与目标用户相关的在线文档包括与该群组相关的在线文档,比如目标用户通过该联系人对应的聊天窗口中分享的在线文档,以及该群组中其他联系人通过该聊天窗口分享的在线文档。
第二服务器222获得在线文档的关键词比如可以是提取在线文档的名称、在线文档的内容中一种或几种获得的关键词。第二服务器222获得搜索请求之后,可以提取搜索请求中的搜索关键词,将该搜索关键词与数据库230中搜索范围内的在线文档的关键词进行匹配,将匹配的在线文档作为备选在线文档,这些备选在线文档可以是召回结果。比如第二服务器222可以将关键词包括搜索关键词的在线文档确定为备选在线文档,或者比如第二服务器222可以确定搜索关键词与在线文档的各关键词的相似度,如果在线文档存在一个或多个关键词的相似度与搜索关键词的相似度大于或等于相似度阈值,第二服务器222将该在线文档确定为备选在线文档。备选在线文档的数量可以是两个或两个以上。两个词之间的相似度阈值比如可以是分别对两个词进行独热编码,确定独热编码后的序列之间的相似度。
如果用户输入的搜索关键词比较特殊,备选在线文档的数量可能是一个或没有,这时由于第一次筛选的备选在线文档的数量就比较少,因此可以无需执行后续步骤,直接将召回结果为零,或者一个反馈给第一服务器221,第一服务器221接收到召回结果之后,反馈给获取终端213。
第二服务器222获得备选在线文档的在线文档标识之后,可以向第一服务器221发送备选在线文档的在线文档标识,这样第一服务器221获得第二服务器222的搜索结果。
S505,第一服务器221查询使用记录。
S506,第一服务器221从数据库230中获取使用记录。
第一服务器221可以随时访问数据库230,第一服务器221获得备选在线文档的在线文档标识之后,可以从数据库230中获取各个备选在线文档的使用记录,使用记录可以参照前文论述的内容,此处不再赘述。
作为一种实施例,S505~S506为可选的步骤,比如第一服务器221中存储有各在线文档的使用记录,则无需从数据库230获取使用记录。
S507,第一服务器221将备选在线文档的在线文档标识和使用记录发送给第三服务器223。
第一服务器221在获得第二服务器222的召回结果之后,可以将每个在线文档的在线文档标识以及使用记录发送给第三服务器223,使得第三服务器223对该召回结果进行再次筛选。
作为一种实施例,S506为可选的步骤。比如第一服务器221可以将各备选在线文档的在线文档标识发送给第三服务器223,第三服务器223可以访问数据库230,获得备选在线文档的使用记录。
S508,第三服务器223根据各备选在线文档的使用记录,获得各备选在线文档的热度。
第三服务器223获得热度的方式可以有多种,下面以获得一个备选在线文档的热度为例对获得各个备选在线文档的热度的方式进行介绍。
方式一:
根据在设定时间段对在线文档的访问频次信息,确定备选在线文档的热度。
设定时间段可以是以当前时间为参考,与当前时间呈预设时长的时间段,或者指定的其它某个时间段。比如当前时间为2020年5月3日9:00,那么设定时间段可以为2020年5月1日9:00至2020年5月3日9:00。
对备选在线文档进行访问的用户就是具有备选在线文档访问权限的用户,包括目标用户以及其他用户。比如用户在群组内发送的搜索请求,那么具有备选在线文档访问权限的用户可以包括群组内的各成员等。由于具有访问权限的用户与目标用户或多或少与该目标用户有一定的关系,比如与目标用户处于同一个群组等,那么这些用户访问备选在线文档的频次越高,表示该目标用户访问该在线文档的可能性也越大,因此本申请实施例中可以利用使用记录,获取在设定时间段内对备选在线文档的访问频次信息,根据该访问频次信息,确定备选在线文档的热度。具体如何根据访问频次信息,确定热度,下面进行示例介绍:
A1:将备选在线文档的访问频次作为备选在线文档的热度。
根据使用记录,获得每个备选在线文档的访问频次信息,访问频次信息包括在线文档被访问的总次数,第三服务器223可以将备选在线文档的访问频次直接确定为该备选在线文档的热度,访问频次越大,该备选在线文档的热度越大。在没有特别限定的情况下,在线文档的访问频次是指各用户访问备选在线文档的总次数。
比如备选在线文档A的访问频次总计为200次,备选在线文档B的访问频次总计为100次,那么备选在线文档A的热度为200,备选在线文档B的热度为100,且备选在线文档A的热度大于备选在线文档B。
A2:对各类访问操作的访问频次进行加权求和,获得备选在线文档的热度;其中,不同类型的访问操作对应的加权权重不同。
在各用户对备选在线文档进行访问时,可以记录各用户针对备选在线文档的具体访问操作类型,比如是查看、浏览、下载、以及编辑等,第三服务器223可以统计不同访问操作类型下的访问频次,并对不同访问操作类型下的访问频次进行加权,在对所有访问操作类型下的加权结果进行求和,获得在线文档的热度。
作为一种实施例,访问操作的操作时长越长,该类访问操作下的加权权重越大。访问操作的平均时长可以理解为对备选在线文档进行访问操作的平均时长,比如统计多个用户进行该访问操作的时长,将多个用户的访问操作的时长的平均值作为访问操作的操作时长。比如访问操作对应的加权权重访问操作的平均时长成比例。
例如,第三服务器223统计对备选在线A的查看次数为100次,浏览次数为50次,编辑次数为10次,下载次数为5次。其中,查看时长<浏览时长<下载时长<编辑时长,因此该备选在线文档A的访问频次的热度为50*0.1+100*0.2+10*0.4+5*0.3=44。
本申请实施例中,操作时长越长,表示用户对备选在线文档进行该访问操作所花的时间就越长,而各用户针对备选在线文档进行该操作的时间越长,表示目标用户对该在线文档进行操作的可能性越大,因此可以基于加权求和的结果为热度,能够更好地预测目标用户访问在线文档的可能性。
方式二:
根据在设定时间段对在线文档进行的各访问的时间长度信息,确定备选在线文档的热度。
设定时间段可以参照前文论述的内容,此处不再赘述。第三服务器223获得使用记录之后,可以获得每一次访问在线文档的时间长度信息,时间长度信息包括本次访问所需的时长,比如本次查看在线文档的时长等,根据各访问的时间长度信息,确定出备选在线文档的热度。具体根据时间长度信息确定备选在线文档的热度的方式可以多种,下面进行示例说明:
B1:以各访问的时间长度的总时长确定为备选在线文档的热度。
第三服务器223可以根据每次访问备选在线文档的时间长度,获得各用户备选在线文档的总时长,将备选在线文档对应的总时长作为备选在线文档的热度。
比如备选在线文档A的总时长为60min,备选在线文档B的总时长为40min,那么备选在线文档A的热度为60,备选在线文档B的热度为40,且备选在线文档A的热度大于备选在线文档B。
B2:对各用户访问备选在线文档的时间长度进行加权,获得备选在线文档的热度,其中,不同用户,其对应的时间长度的加权权重不同。
第三服务器223根据备选在线文档的使用记录,确定每个用户访问备选在线文档的时间长度,再对不同用户对应的时间长度进行加权。与目标用户之间相关性越大的用户,该用户对应的时间长度的加权权重越大。与目标用户之间的相关性可以是根据目标用户与其他用户发消息的频繁程度等决定的。与目标用户的相关性越大的用户,表示目标用户跟随其访问类似在线文档的概率越大,因此该用户对应的加权权重越大,获得备选在线文档的热度更符合目标用户。
方式三:
根据访问备选在线文档的时间与当前时间的时间间隔信息,确定备选在线文档的热度。
时间间隔信息可以包括最近一次访问备选在线文档的时间与当前时间之间的时间间隔,根据该时间间隔,确定备选在线文档的热度。时间间隔越小,表示备选在线文档被访问的时间离当前时间越近,表示该备选在线文档可能近期被访问的概率越大,因此更加能表示备选在线文档的热度。具体比如可以将时间间隔输入反相关函数,获得备选在线文档的热度。反相关函数泛指自变量与因变量呈反相关的函数,比如反比例函数等。
方式四:可以根据访问频次信息、各次访问的时间长度信息,以及访问备选在线文档的时间与当前时间的时间间隔信息中的两种或三种信息,获得在线文档的热度。
C1:第三服务器223可以对访问频次、时间长度和访问备选在线文档的时间与当前时间的时间间隔中的两种或三种进行加权,获得备选在线文档的热度。
比如两种信息包括访问频次信息和各次访问的时间长度信息,第三服务器223可以对访问频次信息的访问频次、各访问的时间长度信息的时间长度进行加权,将加权结果作为备选在线文档的热度。
比如三种信息包括访问频次信息、各次访问的时间长度信息,以及访问备选在线文档的时间与当前时间的时间间隔信息,第三服务器223可以对访问频次信息的访问频次、各访问的时间长度信息的时间长度、访问备选在线文档的时间与当前时间的时间间隔三种进行加权,将加权结果作为备选在线文档的热度。应当说明的是,在对三种信息进行加权时,访问备选在线文档的时间与当前时间的时间间隔对应的加权权重可以是负数。
C2:第三服务器223将备选在线文档的访问频次、时间长度和访问备选在线文档的时间与当前时间的时间间隔中的两种或三种输入热度预测模型,获得备选在线文档的热度。
以输入在线文档的访问频次、时间长度为例获得热度为例,对本申请实施例中涉及的确定热度的方式进行说明:
热度预测模型用于预测备选在线文档的热度。热度预测模型可以采用机器学习模型等,热度预测模型通过样本数据进行训练得到的,样本数据包括样本在线文档的热度标签,样本在线文档的访问频次和时间长度。将样本在线文档的访问频次以及时间长度组合成特征向量,比如可以是将所有用户中各用户的访问频次,以及所有用户各用户的时长长度组合成特征向量,或者可以是将各用户的访问频次的总和,以及各用户的总时长组合成特效向量。
将样本数据中的特征向量输入热度预测模型,根据热度预测模型输出热度,根据预测的热度与热度标签之间的误差,调整热度预测模型的模型参数,直到热度预测模型输出的预测的热度和热度标签之间的误差达到误差条件,获得已训练的热度预测模型。
在需要获得备选在线文档的热度时,可以将备选在线文档的访问频次和时间长度组合成特征向量,组合方式可以参照样本数据的组合方式,此处不再赘述,并将组合特征向量输入预测热度模型,获得该备选在线文档的热度。
上述是以输入在线文档的访问频次、时间长度为例获得热度为例进行介绍,针对输入时间长度和访问备选在线文档的时间与当前时间的时间间隔获得热度的方式可以参照上述论述内容,此处不再赘述。针对输入在线文档的访问频次和访问备选在线文档的时间与当前时间的时间间隔获得热度的方式可以参照上述论述内容,此处不再赘述。针对输入时间长度、在线文档的访问频次和访问备选在线文档的时间与当前时间的时间间隔获得热度的方式可以参照上述论述内容,此处不再赘述。
方式五:结合上述中在设定时间段内对在线文档的访问频次信息、各次访问的时间长度信息,以及访问备选在线文档的时间与当前时间的时间间隔信息中的一种或多种组合,以及目标群组在设定时间段内关联的群消息集合与备选在线文档之间的相关度信息,确定目标在线文档的热度。
当目标用户通过目标群组进行搜索请求时,目标在线文档的热度可能还与目标群组的群消息集合相关,比如群消息集合中讨论最多的在线文档,那么目标用户查找该目标在线文档的可能性更大,因此本申请实施例中还可以结合目标群组在设定时间段内关联的群消息集合与备选在线文档之间的相关度信息,确定目标在线文档的热度。
在设定时间段内关联的群消息集合与备选在线文档之间的相关度信息包括群消息集合与备选在线文档之间的相关度。其中涉及到具体如何获得相关度,比如第三服务器223可以从数据库230中获取在设定时间段内的群消息,根据获得的群消息确定其与目标在线文档的相关度。
比如以涉及目标在线文档的名称的群消息数量除以设定时间段内的群消息总数量作为在设定时间段内关联的群消息集合与备选在线文档之间的相关度信息,以涉及目标在线文档的关键词的群消息数量除以设定时间段内的群消息总数量作为在设定时间段内关联的群消息集合与备选在线文档之间的相关度信息等。
获取终端213可以根据相关度,以及上述方式一直方式三中涉及的一种或多种的组合,进行加权,获得目标在线文档的热度,或者可以根据相关度,以及上述方式一直方式三中涉及的一种或多种的组合输入热度预测模型,获得目标在线文档的热度。具体加权或获得热度预测模型的方式可以参照前文论述的内容,此处不再赘述。
例如,请参照图8,为在设定时间段内聊天窗口中展示的群消息,当前需要确定与群消息集合的相关度的在线文档的名称为会议纪要。第一服务器221获得这些群消息之后,识别出该设定时间段内的提到“会议纪要”的群消息的数量为4,而设定时间段内的群消息的总数量为5,因此该目标在线文档与群消息集合的相关度可以表示为4/5,如果另一个目标在线文档的名称为“财务报表”,该群消息集合中提到财务报表的群消息为0条,则该目标在线文档与群消息集合的相关度为0。
S509,第三服务器223根据热度,获得至少一个目标在线文档。
第三服务器223获得各备选在线文档的热度之后,可以根据热度从高到低的顺序,对多个备选在线文档进行排序,获得排序表后的备选在线文档,将排序靠前的至少一个目标在线文档。或者,第三服务器223直接从多个备选在线文档中确定出热度大于或等于热度阈值的备选在线文档,将热度大于或等于热度阈值的备选在线文档确定为目标在线文档。
S510,第三服务器223将至少一个目标在线文档的展示信息发送给第一服务器221。
第三服务器223获得从多个备选在线文档确定出目标在线文档之后,可以从数据库230中,或者之前获取的使用记录中,获得目标在线文档的展示信息,将目标在线文档的展示信息发送给第一服务器221。
S511,第一服务器221获得各目标在线文档的目标标签信息。
第一服务器221根据目标在线文档的使用记录,提取目标在线文档的使用记录中的关键信息,根据关键信息,生成目标在线文档的备选标签信息。
其中涉及到第一服务器221如何根据关键信息,生成备选标签信息,第一服务器221可以从使用记录中的目标在线文档的时间属性信息或协作信息中的一种或两种,提取出该目标在线文档的关键信息。第一服务器221将关键信息直接作为备选标签信息,或者第一服务器221可以对至少一关键信息中各关键信息进行组合,获得备选标签信息,或者第一服务器221将关键信息,以及关键信息的组合均作为备选标签信息。
在获得备选标签信息之后,第一服务器221可以从多个备选标签信息中筛选出与目标在线文档的相关度满足阈值的备选标签信息,将与目标在线文档的相关度满足阈值的备选标签信息确定为目标在线文档的目标标签信息。其中涉及到第一服务器221具体如何筛选相关度满足阈值的备选标签信息,下面进行示例说明:
如前文论述的内容,每个目标在线文档是包括对应的关键词,可以确定目标在线文档的备选标签信息与目标在线文档的关键词,将与关键词匹配的备选标签信息作为目标在线文档的备选标签信息。匹配比如是备选标签信息与关键词相同,或者备选标签信息的编码向量与关键词之间的编码向量的相似度大于或等于相似度阈值。
或者,第一服务器221确定目标在线文档的名称,与各备选标签信息的相似度,将相似度大于或等于相似度阈值的备选标签信息确定为目标标签信息。
作为一种实施例,第一服务器221可以是在每次存储在线文档时,或者在线文档被使用时,会实时地生成或更新在线文档的目标标签信息,当第一服务器221获得目标在线文档的展示信息之后,从数据库230中获得多个备选标签信息,再从多个备选标签信息中获得目标在线文档的目标标签信息。
S512,第一服务器221将至少一个目标在线文档的展示信息,以及目标标签信息发送给获取终端213。
第一服务器221从第三服务器223接收至少一个目标在线文档的展示信息,以及目标标签信息之后,将目标在线文档的展示信息与目标标签信息进行关联,并将目标标签信息与关联的目标在线文档的展示信息转发给获取终端213,相当于获取终端213获得了搜索请求对应的获取结果。
S513,获取终端213显示至少一个目标在线文档的展示信息,以及目标标签信息。
获取终端213在获得至少一个目标在线文档中每个目标在线文档的展示信息,以及关联的目标标签信息之后,可以将目标在线文档与其关联的目标标签信息进行关联展示。
在本申请实施例中,可以将目标在线文档的展示信息与目标标签信息关联展示,即使在获取结果包括多个名称相近的目标在线文档时,目标用户也可以根据目标标签信息进一步区分目标在线文档,无需用户逐一地打开目标在线文档,使得用户可以快速地识别出自己想要的目标在线文档。
作为一种实施例,获取终端213在展示目标在线文档时,可以将按照热度从大到小的顺序,依次展示各个目标在线文档。
由于本申请实施例中热度高的目标在线文档,目标用户点击该在线文档的可能性更大,因此,更利于提升该在线文档的首条结果的点击通过率(Click Through Rate,CTR),以及呈现的目标在线文档的NDCG。
在另一种实施例中,获取终端213也可以显示至少一个目标在线文档的展示信息,而不显示目标标签信息。
以获取终端213通过图6对应的页面生成的搜索请求为例,获取终端213获得至少一个目标在线文档之后,可以显示如图9所示的目标在线文档的显示界面,该显示界面中显示有每个目标在线文档的名称901、目标在线文档的最近浏览时间903、以及目标在线文档的创建者904。目标在线文档的名称901具体如图9中所示的“会议纪要”,最近浏览时间903具体如图9中所示的“3月1日、3月2日、3月20日以及4月20日等”,创建者904具体如图9所示的“A、B、C和D”。除此之外,该显示界面还包括各个在线文档的目标标签信息902,比如显示在第一行的目标在线文档的目标标签信息具体包括“产品设计组6人本周浏览、新创建、3人正在浏览、今日被7人编辑”等标签信息。
或者,以获取终端213通过图7所示的群组关联的搜索界面进行的搜索操作为例,获取终端213获得至少一个目标在线文档之后,可以显示如图10所示的目标在线文档的搜索反馈界面,该搜索反馈界面中显示有每个目标在线文档的名称1001、目标在线文档的最近浏览时间1002、以及目标在线文档的创建者1003。目标在线文档的名称1001比如图10中所示的“会议纪要1”,目标在线文档的最近浏览时间1002比如图10中所示的“3月1日”,目标在线文档的创建者1003比如图10中的“A”。另外该搜索反馈界面上还显示有该目标在线文档的目标标签信息1004,具体如图10中所示的“产品设计组6本周浏览”。
在某些情况下,处理服务器220为目标用户筛选出的至少一个目标在线文档可能还是较多,或者筛选出的至少一个目标在线文档可能并不完全符合用户的需求,用户在查看至少一个目标在线文档时,可能会针对至少一个目标在线文档时与其他用户进行语音抱怨、或者自言自语等,这时获取终端213可以采集目标用户的话语信息,该话语信息具体可以是语音信息或目标用户的对话信息等,获取终端213将目标用户的话语信息发送给处理服务器220。其中,涉及到获取终端213如何确定目标用户的当前处于查看至少一个目标在线文档的情况,比如获取终端213可以根据目标用户是否进行其它操作,如果目标用户未进行其它操作,则确定目标用户处于查看至少一个目标在线文档的情况,其它操作是指除了与查看至少一个目标在线文档相关的操作。
处理服务器220在接收该话语信息之后,可以解析话语信息中的排序标准,处理服务器220可以将话语信息转换为文字内容,并提取文字内容中与排序标准相关的关键词,从而获得该关键词对应的排序标准,并根据该排序标准再从目标在线文档中筛选符合该排序标准的重选在线文档,并将重选在线文档的展示信息再次发送给获取终端213。获取终端213在接收重选在线文档的展示信息之后,可以将至少一个目标在线文档的展示信息更新为重选在线文档的展示信息。
本申请实施例中,相当于对至少一个目标在线文档进行再次筛选,以获得更符合目标用户需求的结果。
例如,目标用户查看至少一个在线文档时,提到“我记得是A在前两天发过的……怎么找不到”,这是获取终端213可以获得该话语信息,并将其发送处理服务器220,处理服务器220接收该话语信息之后,解析出该话语信息中的关键词包括“A”和“前两天”,进而处理服务器220可以从目标在线文档中筛选出“A”以及“前两天”相关的重选在线文档,将这些重选在线文档反馈给获取终端213。
应当说明的是,图5中是以处理服务器220包括第一服务器221、第二服务器222和第三服务器223为例进行说明,但是实际上处理服务器220也可以通过单独的一个服务器实现,这种情况下,图5中所示的各个服务器之间的交互步骤则是可选的。基于上述图4论述的应用场景,下面对本申请实施例涉及的在线文档的处理方法进行介绍。
请参图11,表示各设备之间的交互示意图,该交互过程具体包括:
S1101,获取终端213根据目标用户的目标操作,生成推荐请求。
用户在某些情况下需要获取一些在线文档的推荐结果时,比如用户想要在编辑文档时,需要插入在线文档,用户可以进行插入在线文档的目标操作,获取终端213根据该目标操作,生成推荐请求,该推荐请求用于为目标用户推荐对应的在线文档,该推荐请求可以携带有目标用户正在编辑的在线文档的名称,还可以包括该目标用户对应的获取终端213的终端标识。推荐请求也可以包括推荐关键词,推荐关键词用于表示目标用户想要查找与该推荐关键词相关的在线文档。
当用户如图4中的在线文档编辑界面中进行插入操作,获取终端213根据该插入操作,生成推荐请求。
S1102,获取终端213向处理服务器220发送推荐请求。
S1103,处理服务器220获取与该推荐请求关联的多个备选在线文档。
如果推荐请求中包括推荐关键词,则处理服务器220可以获取与推荐关键词关联的多个备选在线文档。如果推荐请求不包括推荐关键词,那么多个备选在线文档可以是与用户关联的所有在线文档。
S1104,处理服务器220查询使用记录。
查询使用记录、使用记录的相关内容可以参照前文论述的内容,此处不再赘述。
S1105,处理服务器220从数据库230获取使用记录。
作为一种实施例,S1104~S1105为可选的步骤。
S1106,处理服务器220根据各备选在线文档的使用记录,获得各备选在线文档的热度。
获取热度的方式可以参照前文论述的内容,此处不再赘述。
S1107,处理服务器220根据热度,获得至少一个目标在线文档。
根据热度获得目标在线文档的方式可以参照前文论述的内容,此处不再赘述。
S1108,处理服务器220获得各目标在线文档的目标标签信息。
目标标签信息,以及获得目标标签信息的方式可以参照前文论述的内容,此处不再赘述。
作为一种实施例,S1108为可选的步骤。
S1109,处理服务器220将至少一个目标在线文档的展示信息,以及目标标签信息发送给获取终端213。
S1110,获取终端213显示至少一个目标在线文档的展示信息,以及目标标签信息。
获取终端213显示展示信息以及目标标签信息的方式可以参照前文论述的内容,此处不再赘述。
在另一种实施例中,处理服务器220不获取目标标签信息,那么S1109中处理服务器220只需发送至少一个目标在线文档的展示信息,S1110中获取终端213也只对应显示至少一个目标在线文档的展示信息。
例如请参照图12,在用户进行插入操作之后,获取终端213响应该插入操作,生成推荐请求,并根据处理服务器220反馈的推荐结果,显示如图12所示的界面,该界面中包括推荐的各目标在线文档的展示信息,以及各目标在线文档的目标标签信息。
在一种可能的实施例中,处理服务器220可以接收目标用户在查看至少一个目标在线文档的展示信息时的话语信息;解析话语信息中的排序标准,获得至少一个目标在线文档满足排序标准的至少一个重选在线文档,并将至少一个重选在线文档的展示信息。具体获得重选在线文档的内容可以参照前文论述的内容,此处不再赘述。
基于同一发明构思,本申请实施例提供一种在线文档的处理装置,该在线文档的处理装置相当于前文论述的处理服务器220。请参图13,该在线文档的处理装置1300包括:
收发模块1301,用于接收目标用户针对在线文档的获取请求;
确定模块1302,用于根据所述获取请求,从所述目标用户权限内的在线文档中,确定出多个备选在线文档;
获得模块1303,用于根据各备选在线文档的使用记录,获得各备选在线文档的热度;其中,所述热度用于表征备选在线文档的使用趋势和备选在线文档的时效性中的一种或两种的组合;以及,从所述多个备选在线文档进中获得热度满足设定条件的至少一个目标在线文档;
收发模块1301,还用于响应所述获取请求,发送所述至少一个目标在线文档的展示信息。
在一种可能的实施例中,收发模块1301还用于:
响应获取请求,发送至少一个目标在线文档的展示信息时,还发送每个目标在线文档的目标标签信息,其中,目标标签信息包括目标在线文档的时间属性和协作信息。
在一种可能的实施例中,目标在线文档的目标标签信息是通过如下方式获得的:
根据各目标在线文档的使用记录,从各个目标在线文档的时间属性和协作信息中的一个或者两个中,提取目标在线文档的关键信息;
根据各个目标文档的关键信息,分别获得每个目标在线文档的多个备选标签信息;
针对每个目标在线文档,将目标在线文档的多个备选标签信息中相关度满足相关度阈值的备选标签信息确定为目标在线文档的目标标签信息。
在一种可能的实施例中,获得模块1303具体用于:
获取在设定时间段内对在线文档的访问频次信息、各次访问的时间长度信息,以及访问备选在线文档的时间与当前时间的时间间隔信息中的一个或者任意组合;
根据获取的信息分别确定各备选在线文档的热度,其中,访问频次越高热度越高,访问的时间长度越长热度越高,且时间间隔越小热度越高。
在一种可能的实施例中,获得模块1303还具体用于:
获取目标群组在设定时间段内关联的群消息集合与备选在线文档之间的相关度信息,以及
根据获取的信息分别确定各备选在线文档的热度时,相关度越大热度越高。
在一种可能的实施例中,获得模块1303具体用于通过如下任一方式获得备选在线文档的热度:
根据访问频次信息,获得备选在线文档每类访问操作对应的访问频次,并对备选在线文档每类访问操作对应的访问频次进行加权求和,获得备选在线文档的热度,其中,每类访问操作对应的加权权重不同;或,
根据各次访问的时间长度信息,获得每个用户对备选在线文档的访问时长,并对与目标用户相关的各用户的访问时长进行加权求和,其中,与目标用户的相关性越大的用户对应的加权权重越大;或,
将访问备选在线文档的时间与当前时间的时间间隔信息输入反相关函数,获得备选在线文档的热度。
在一种可能的实施例中,收发模块1301,还用于在响应获取请求,发送至少一个目标在线文档的展示信息之后,接收目标用户在查看至少一个目标在线文档的展示信息时的话语信息;
获得模块1303,还用于解析话语信息中的排序标准,获得至少一个目标在线文档满足排序标准的至少一个重选在线文档,并将至少一个重选在线文档的展示信息。
基于同一发明构思,本申请实施例提供一种在线文档的处理装置,该在线文档的处理装置相当于前文论述的获取终端213。请参图14,该在线文档的处理装置1400包括:
发送模块1401,用于响应于目标用户进行的插入在线文档的目标操作,发送推荐请求;
接收模块1402,用于接收至少一个目标在线文档的展示信息,以及每个目标在线文档的目标标签信息;其中,目标标签信息包括目标在线文档的时间属性和协作信息;
显示模块1403,用于显示至少一个目标在线文档的展示信息,以及每个目标在线文档的目标标签信息。
在一种可能的实施例中,发送模块1401具体用于:
响应于目标用户通过网页进行的搜索在线文档的目标操作,发送搜索请求;或,
响应于目标用户在即时通讯客户端的聊天窗口中进行的搜索在线文档的目标操作,发送搜索请求。
在一种可能的实施例中,显示模块1403具体用于:
按照热度从高到低的顺序,依次显示至少一个目标在线文档中各目标在线文档的展示信息。
基于同一发明构思,本申请实施例提供一种在线文档的处理装置,该在线文档的处理装置相当于前文论述的获取终端213。请参图15,该在线文档的处理装置1500包括:
发送模块1501,用于响应于目标用户进行的插入在线文档的目标操作,发送推荐请求;
接收模块1502,用于显示至少一个目标在线文档的展示信息,以及每个目标在线文档的目标标签信息;其中,目标标签信息包括目标在线文档的时间属性和协作信息;
显示模块1503,用于显示至少一个目标在线文档的展示信息,以及每个目标在线文档的目标标签信息;其中,目标标签信息包括目标在线文档的时间属性和协作信息。
在一种可能的实施例中,显示模块1503具体用于:
按照热度从高到低的顺序,依次显示至少一个目标在线文档中各目标在线文档的展示信息。
基于同一发明构思,本申请实施例还提供了一种计算机设备。该计算机设备相当于前文论述的处理服务器220。
请参照图16,计算机设备1600以通用计算机设备的形式表现。计算机设备1600的组件可以包括但不限于:至少一个处理器1610、至少一个存储器1620、连接不同系统组件(包括处理器1610和存储器1620)的总线1630。
总线1630表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、外围总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。
存储器1620可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)1621和/或高速缓存存储器1622,还可以进一步包括只读存储器(ROM)1623。存储器1620还可以包括具有一组(至少一个)程序模块1625的程序/实用工具1626,这样的程序模块1625包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。处理器1610用于执行存储器1620存储的程序指令等实现前文论述的在线文档的处理方法。处理器1610用于执行存储器1620存储的程序指令等还可以实现前文论述的处理服务器220的功能,以及图13~图15任一论述的在线文档的处理装置的功能。
计算机设备1600也可以与一个或多个外部设备1640(例如键盘、指向设备等)通信,还可与一个或者多个使得终端设备能与计算机设备1600交互的设备通信,和/或与使得该计算机设备1600能与一个或多个其它设备进行通信的任何设备(例如路由器、调制解调器等)通信。这种通信可以通过输入/输出(I/O)接口1650进行。并且,计算机设备1600还可以通过网络适配器1660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器1660通过总线1630与用于计算机设备1600的其它模块通信。应当理解,尽管图中未示出,可以结合计算机设备1600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
基于同一发明构思,本申请实施例提供一种存储介质,所述存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行前文论述的在线文档的处理方法。本申请实施例中的存储介质泛指计算机可读存储介质。
基于同一发明构思,本申请实施例提供了一种计算机程序产品,该计算机程序产品包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述任一的在线文档的处理方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (15)

1.一种在线文档的处理方法,其特征在于,包括:
接收目标用户针对在线文档的获取请求;
根据所述获取请求,从所述目标用户权限内的在线文档中,确定出多个备选在线文档;
根据各备选在线文档的使用记录,获得各备选在线文档的热度;其中,所述热度用于表征备选在线文档的使用趋势和备选在线文档的时效性中的一种或两种的组合;
从所述多个备选在线文档进中获得热度满足设定条件的至少一个目标在线文档;
响应所述获取请求,发送所述至少一个目标在线文档的展示信息。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
响应所述获取请求,发送所述至少一个目标在线文档的展示信息时,还发送每个目标在线文档的目标标签信息,其中,所述目标标签信息包括目标在线文档的时间属性和协作信息
3.如权利要求2所述的方法,其特征在于,目标在线文档的目标标签信息是通过如下方式获得的:
根据各目标在线文档的使用记录,从各个目标在线文档的时间属性和协作信息中的一个或者两个中,提取目标在线文档的关键信息;
根据各个目标文档的关键信息,分别获得每个目标在线文档的多个备选标签信息;
针对每个目标在线文档,将目标在线文档的多个备选标签信息中相关度满足相关度阈值的备选标签信息确定为目标在线文档的目标标签信息。
4.如权利要求1所述的方法,其特征在于,所述根据各备选在线文档的使用记录,获得各备选在线文档的热度,具体包括:
获取在设定时间段内对在线文档的访问频次信息、各次访问的时间长度信息,以及访问备选在线文档的时间与当前时间的时间间隔信息中的一个或者任意组合;
根据获取的信息分别确定各备选在线文档的热度,其中,访问频次越高热度越高,访问的时间长度越长热度越高,且时间间隔越小热度越高。
5.如权利要求4所述的方法,其特征在于,当所述目标用户通过目标群组关联的应用界面发送的确定请求时,所述根据各备选在线文档的使用记录,获得各备选在线文档的热度时,还具体包括:
获取所述目标群组在设定时间段内关联的群消息集合与备选在线文档之间的相关度信息,以及
根据获取的信息分别确定各备选在线文档的热度时,相关度越大热度越高。
6.如权利要求4所述的方法,其特征在于,所述根据各备选在线文档的使用记录,获得各备选在线文档的热度,包括针对每个备选在线文档执行如下任一方式:
根据访问频次信息,获得备选在线文档每类访问操作对应的访问频次,并对备选在线文档每类访问操作对应的访问频次进行加权求和,获得备选在线文档的热度,其中,每类访问操作对应的加权权重不同;或,
根据各次访问的时间长度信息,获得每个用户对备选在线文档的访问时长,并对与所述目标用户相关的各用户的访问时长进行加权求和,其中,与所述目标用户的相关性越大的用户对应的加权权重越大;或,
将访问备选在线文档的时间与当前时间的时间间隔信息输入反相关函数,获得备选在线文档的热度。
7.如权利要求1~6任一项所述的方法,其特征在于,在所述响应所述获取请求,发送所述至少一个目标在线文档的展示信息之后,包括:
接收所述目标用户在查看所述至少一个目标在线文档的展示信息时的话语信息;
解析所述话语信息中的排序标准,获得所述至少一个目标在线文档满足所述排序标准的至少一个重选在线文档,并将所述至少一个重选在线文档的展示信息。
8.一种在线文档的处理方法,其特征在于,包括:
响应于目标用户进行的搜索在线文档的目标操作,发送搜索请求;
接收并显示至少一个目标在线文档的展示信息,以及每个目标在线文档的目标标签信息;其中,所述目标标签信息包括目标在线文档的时间属性和协作信息。
9.如权利要求8所述的方法,其特征在于,所述响应于目标用户进行的搜索在线文档的目标操作,发送搜索请求,包括如下任意一种:
所述响应于目标用户通过网页进行的搜索在线文档的目标操作,发送搜索请求;或,
所述响应于目标用户在即时通讯客户端的聊天窗口中进行的搜索在线文档的目标操作,发送搜索请求。
10.一种在线文档的处理方法,其特征在于,包括:
响应于目标用户进行的插入在线文档的目标操作,发送推荐请求;
接收并显示至少一个目标在线文档的展示信息,以及每个目标在线文档的目标标签信息;其中,所述目标标签信息包括目标在线文档的时间属性和协作信息。
11.一种在线文档的处理装置,其特征在于,包括:
收发模块,用于接收目标用户针对在线文档的获取请求;
确定模块,用于根据所述获取请求,从所述目标用户权限内的在线文档中,确定出多个备选在线文档;
获得模块,用于根据各备选在线文档的使用记录,获得各备选在线文档的热度;其中,所述热度用于表征备选在线文档的使用趋势和备选在线文档的时效性中的一种或两种的组合;以及,从所述多个备选在线文档进中获得热度满足设定条件的至少一个目标在线文档;
所述收发模块,还用于响应所述获取请求,发送所述至少一个目标在线文档的展示信息。
12.一种在线文档的处理装置,其特征在于,包括:
发送模块,用于响应于目标用户进行的搜索在线文档的目标操作,发送搜索请求;
接收模块,用于至少一个目标在线文档的展示信息,以及每个目标在线文档的目标标签信息;其中,所述目标标签信息包括目标在线文档的时间属性和协作信息;
显示模块,用于显示所述至少一个目标在线文档的展示信息,以及每个目标在线文档的目标标签信息。
13.一种在线文档的处理装置,其特征在于,
发送模块,用于响应于目标用户进行的插入在线文档的目标操作,发送推荐请求;
接收模块,用于显示至少一个目标在线文档的展示信息,以及每个目标在线文档的目标标签信息;其中,所述目标标签信息包括目标在线文档的时间属性和协作信息;
显示模块,用于显示至少一个目标在线文档的展示信息,以及每个目标在线文档的目标标签信息;其中,所述目标标签信息包括目标在线文档的时间属性和协作信息。
14.一种计算机设备,其特征在于,包括:
至少一个处理器,以及
与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令实现如权利要求1-7或8-9或10中任一项所述的方法。
15.一种存储介质,其特征在于,所述存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行如权利要求1-7或8-9或10中任一项所述的方法。
CN202010581622.3A 2020-06-23 2020-06-23 在线文档的处理方法、装置、计算机设备及存储介质 Pending CN111782919A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010581622.3A CN111782919A (zh) 2020-06-23 2020-06-23 在线文档的处理方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010581622.3A CN111782919A (zh) 2020-06-23 2020-06-23 在线文档的处理方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN111782919A true CN111782919A (zh) 2020-10-16

Family

ID=72757245

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010581622.3A Pending CN111782919A (zh) 2020-06-23 2020-06-23 在线文档的处理方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN111782919A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113435847A (zh) * 2021-06-30 2021-09-24 珠海金山办公软件有限公司 一种信息展示方法、装置、电子设备以及存储介质
CN114153963A (zh) * 2021-11-30 2022-03-08 北京达佳互联信息技术有限公司 文档推荐方法、装置、计算机设备及介质
CN116701615A (zh) * 2023-08-08 2023-09-05 建信金融科技有限责任公司 业务文档在线管理方法、装置、电子设备及可读存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113435847A (zh) * 2021-06-30 2021-09-24 珠海金山办公软件有限公司 一种信息展示方法、装置、电子设备以及存储介质
CN114153963A (zh) * 2021-11-30 2022-03-08 北京达佳互联信息技术有限公司 文档推荐方法、装置、计算机设备及介质
CN116701615A (zh) * 2023-08-08 2023-09-05 建信金融科技有限责任公司 业务文档在线管理方法、装置、电子设备及可读存储介质
CN116701615B (zh) * 2023-08-08 2023-11-03 建信金融科技有限责任公司 业务文档在线管理方法、装置、电子设备及可读存储介质

Similar Documents

Publication Publication Date Title
US10706325B2 (en) Method and apparatus for selecting a network resource as a source of content for a recommendation system
US9721018B2 (en) System and method for displaying of most relevant vertical search results
CN107103019B (zh) 促进社交网络用户之间的交互
CN105706083B (zh) 用于提供对特定于用户的查询的回答的方法、系统和介质
US8666979B2 (en) Recommending interesting content using messages containing URLs
JP6827515B2 (ja) ビデオ検索に対する視聴時間クラスタリング
US9251532B2 (en) Method and apparatus for providing search capability and targeted advertising for audio, image, and video content over the internet
JP5981024B2 (ja) ソーシャルネットワーキングを介してテレビ番組およびビデオ番組を共有すること
US8099406B2 (en) Method for human editing of information in search results
US20080160490A1 (en) Seeking Answers to Questions
US20120016875A1 (en) Personalized data search utilizing social activities
US20130036344A1 (en) Intelligent link population and recommendation
US20120036137A1 (en) Method and system for providing actionable relevant recommendations
CN111782919A (zh) 在线文档的处理方法、装置、计算机设备及存储介质
US7899808B2 (en) Text enhancement mechanism
WO2015102931A1 (en) Systems and methods for guided user actions
CN106796590B (zh) 在搜索结果中显露直播事件
CN110874436B (zh) 用于基于第三方内容的上下文课程推荐的网络系统
US20110153425A1 (en) Knowledge based search engine
CN106658033A (zh) 直播内容查询方法、装置和服务器
JP2010257453A (ja) サーチクエリデータを用いて文書にタグ付けするシステム
CN112868003A (zh) 使用用户互动度的基于实体的搜索系统
JP2008108105A (ja) 情報提供装置、情報提供方法および情報提供プログラム
US9886415B1 (en) Prioritized data transmission over networks
JP2002288187A (ja) 情報蓄積システム、情報提示システム、電子メール配信システム、情報蓄積方法、情報提示方法、電子メール配信方法及び情報処理プログラムを記録した記録媒体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40030111

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination