CN114707502A - 虚拟空间处理方法、装置、电子设备及计算机存储介质 - Google Patents

虚拟空间处理方法、装置、电子设备及计算机存储介质 Download PDF

Info

Publication number
CN114707502A
CN114707502A CN202111600005.4A CN202111600005A CN114707502A CN 114707502 A CN114707502 A CN 114707502A CN 202111600005 A CN202111600005 A CN 202111600005A CN 114707502 A CN114707502 A CN 114707502A
Authority
CN
China
Prior art keywords
virtual space
collection
search
virtual
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111600005.4A
Other languages
English (en)
Inventor
刘国威
周运
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202111600005.4A priority Critical patent/CN114707502A/zh
Publication of CN114707502A publication Critical patent/CN114707502A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供了一种虚拟空间处理方法、装置以及虚拟空间展示方法、装置。其中,获取用户端发送的搜索词;识别所述搜索词对应的实体词,以及查找所述实体词对应的至少一个合集搜索信息;根据所述实体词、至少一个所述合集搜索信息中的搜索规则,召回多个虚拟空间,以构成至少一个虚拟空间合集;将获取的至少一个虚拟空间合集的提示信息发送至用户端。本实施例中,满足了搜索场景下虚拟空间的融合需求,提高了虚拟空间处理的效率。

Description

虚拟空间处理方法、装置、电子设备及计算机存储介质
技术领域
本申请实施例涉及互联网技术领域,尤其涉及一种虚拟空间处理方法、装置、电子设备及计算机存储介质。
背景技术
随着互联网的普及,越来越多用户喜欢通过直播的方式分享自己的生活或者对某一事件的评述(如徒步A城直播、电影评述直播等)。由于视频种类的多样化,为了使得每个用户能够观看到自己喜好的视频分类,因此可通过输入搜索词的方式,获取到对应分类的直播间。
然而目前的直播间展示方案,只能展出与用户输入的搜索词相关的直播间,但即使是同一搜索词,其相关的直播间分类仍较多。例如,以搜索词:翡翠为例,目前的直播间展示方案可能会一同展示翡翠手镯、翡翠耳环、翡翠吊坠等多个直播间,而此时用户若只想了解翡翠手镯相关的直播间时,则需要重新确定搜索词以获取翡翠手镯相关的直播间,从而影响用户的浏览体验。
发明内容
本申请实施例提供一种虚拟空间处理方法、装置、电子设备及计算机存储介质,满足了搜索场景下虚拟空间的融合需求,提高了虚拟空间处理的效率。
第一方面,本申请实施例提供了一种虚拟空间处理方法,包括:
获取用户端发送的搜索词;
识别所述搜索词对应的实体词,以及查找所述实体词对应的至少一个合集搜索信息;
根据所述实体词、至少一个所述合集搜索信息中的搜索规则,召回多个虚拟空间,以构成至少一个虚拟空间合集;
将获取的至少一个虚拟空间合集的提示信息发送至用户端。
可选地,还包括:
基于实时用户观看行为以及获取的虚拟空间合集的排列顺序,确定出每个虚拟空间合集在用户端的显示界面的展现位置,并将所述展现位置发送至用户端,所述展现位置用于指示用户端按照所述展现位置,展示至少一个虚拟空间合集的提示信息。
可选地,所述根据所述实体词、至少一个所述合集搜索信息中的搜索规则,召回多个虚拟空间,以构成至少一个虚拟空间合集,包括:
根据所述实体词、至少一个所述合集搜索信息中的搜索规则以及至少一种召回策略,召回多个虚拟空间,以构成至少一个虚拟空间合集。
可选地,还包括:
基于用户端发送的合集标识,确定所述合集标识对应的虚拟空间合集;
根据每个虚拟空间与所述实体词的相关程度以及每个所述虚拟空间的实时用户反馈行为,对所述虚拟空间合集中的多个虚拟空间进行排序,确定出所述虚拟空间合集中多个虚拟空间的排列顺序,并将所述排列顺序发送至用户端,所述排列顺序用于指示用户端按照所述虚拟空间合集中多个虚拟空间的排列顺序,展示排序后的所述多个虚拟空间的空间信息。空间信息
可选地,所述识别所述搜索词对应的实体词,包括:
通过预先建立的搜索词与实体词的对应关系中,确定出所述搜索词对应的实体词;或者,
计算所述搜索词的词向量与每个实体词的词向量的相似度,将相似度最高的实体词作为所述搜索词对应的实体词。
可选地,所述查找所述实体词对应的至少一个合集搜索信息,包括:
通过预先建立的实体词与合集搜索信息的对应关系中,确定出所述实体词对应的至少一个合集搜索信息。
可选地,所述根据所述实体词、至少一个所述合集搜索信息中的搜索规则以及至少一种召回策略,召回多个虚拟空间,以构成至少一个虚拟空间合集,包括:
在每个所述合集搜索信息中的搜索规则对应的多个虚拟空间内,召回包含所述实体词的第一用户账号信息、虚拟空间标题、音视频理解标签的虚拟空间,以构成至少一个虚拟空间合集;或者,
在每个所述合集搜索信息中的搜索规则对应的多个虚拟空间内,对所述实体词与所述多个虚拟空间中每个虚拟空间的第一用户账号向量化,通过近似最近邻查找算法,计算每个第一用户账号与所述实体词之间的距离,并将距离小于预设值的第一用户账号对应的虚拟空间作为召回的虚拟空间,以构成至少一个虚拟空间合集;或者,
在每个所述合集搜索信息中的搜索规则对应的多个虚拟空间内,对所述实体词与所述多个虚拟空间中每个虚拟空间的显示画面向量化,通过近似最近邻查找算法,计算每个显示画面与所述实体词之间的距离,并将距离小于预设值的显示画面对应的虚拟空间召回的虚拟空间,以构成至少一个虚拟空间合集。
可选地,所述实时用户反馈行为包括点击次数及播放次数;
所述根据每个虚拟空间与所述实体词的相关程度以及每个所述虚拟空间的实时用户反馈行为,对所述虚拟空间合集中的多个虚拟空间进行排序,确定出所述虚拟空间合集中多个虚拟空间的排列顺序,包括:
采集每个所述虚拟空间的特征信息,并根据所述特征信息、所述实体词以及标记结果的对应关系,确定出所述虚拟空间的标记结果,所述标记结果包括相关或不相关;
根据所述标记结果为相关的虚拟空间的特征信息以及每个特性信息对应的权重,计算出所述标记结果为相关的虚拟空间与所述实体词的相关值;
基于所述点击次数与所述播放次数之间的比值,计算出所述虚拟空间的分数;
基于所述标记结果为相关的虚拟空间与所述实体词的相关值以及每个所述虚拟空间的分数,对多个虚拟空间进行排序,确定出所述虚拟空间合集中多个虚拟空间的排列顺序。
可选地,所述基于实时用户观看行为以及获取的虚拟空间合集的排列顺序,确定出每个虚拟空间合集在用户端的显示界面的展现位置,包括:
确定每个虚拟空间合集的合集分数,所述合集分数为合集内前N个虚拟空间的分数之和;
基于每个虚拟空间合集对应的合集分数,对至少一个虚拟空间合集进行排序,确定出虚拟空间合集的排列顺序;
基于实时用户观看行为以及所述排列顺序,确定出每个虚拟空间合集在显示界面的展现位置。
可选地,还包括:确定所述虚拟空间合集中任一虚拟空间对应的推荐信息,并将推荐信息发送至用户端,所述推荐信息用于指示用户端展示所述推荐信息。
可选地,所述确定所述虚拟空间合集中任一虚拟空间对应的推荐信息,包括:
确定所述虚拟空间合集中排名首位的虚拟空间对应的推荐信息。
可选地,所述搜索规则包括搜索所述实体词对应的虚拟空间合集的规则。
可选地,所述推荐信息包括推荐理由、虚拟空间热度、实时精选评论信息。
第二方面,本申请实施例提供了一种虚拟空间展示方法,包括:
响应搜索界面的输入操作,确定输入的搜索词;
将搜索词发送至服务端;
接收至少一个虚拟空间合集的提示信息,所述提示信息为所述服务端通过所述搜索词召回多个虚拟空间,以构成至少一个虚拟空间合集而得到的提示信息;
在显示界面上显示所述至少一个虚拟空间合集的提示信息。
可选地,还包括:
响应显示界面输入的合集展示指令,确定用户所要打开的虚拟空间合集;
将所述虚拟空间合集的合集标识发送至服务端;
接收所述虚拟控件合集中多个虚拟空间的排列顺序,所述排列顺序为所述服务端根据每个虚拟空间与实体词的相关程度以及用户对每个所述虚拟空间的实时用户反馈行为,对所述虚拟空间合集中的多个虚拟空间进行排序,确定出的所述虚拟空间合集中多个虚拟空间的排列顺序;
在显示界面中按照所述虚拟空间合集中多个虚拟空间的排列顺序,展示排序后的所述多个虚拟空间的空间信息。
第三方面,本申请实施例提供了一种虚拟空间处理装置,包括:
获取模块,用于获取用户端发送的搜索词;
识别模块,用于识别所述搜索词对应的实体词;
查询模块,用于查找所述实体词对应的至少一个合集搜索信息;
构成模块,用于根据所述实体词、至少一个所述合集搜索信息中的搜索规则,召回多个虚拟空间,以构成至少一个虚拟空间合集;
第一发送模块,用于将获取的至少一个虚拟空间合集的提示信息发送至用户端。
第四方面,本申请实施例提供了一种虚拟空间展示装置,包括:
第二确定模块,用于响应搜索界面的输入操作,确定输入的搜索词;
第二发送模块,用于将搜索词发送至服务端;
接收模块,用于接收至少一个虚拟空间合集的提示信息,所述提示信息为所述服务端通过所述搜索词召回多个虚拟空间,以构成至少一个虚拟空间合集而得到的提示信息;
显示模块,用于在显示界面上显示所述至少一个虚拟空间合集的提示信息。
第五方面,本申请实施例提供了一种计算设备,包括处理组件以及存储组件;所述存储组件存储一个或多个计算机指令;所述一个或多个计算机指令用以被所述处理组件调用执行,实现如上述第一方面所述的虚拟空间处理方法、第二方面所述的虚拟空间展示方法。
第六方面,本申请实施例提供了一种计算机存储介质,存储有计算机程序,所述计算程序被计算机执行时,实现如上述第一方面所述的虚拟空间处理方法、第二方面所述的虚拟空间展示方法。
本申请实施例提供的中,获取用户端发送的搜索词;识别所述搜索词对应的实体词,以及查找所述实体词对应的至少一个合集搜索信息;根据所述实体词、至少一个所述合集搜索信息中的搜索规则,召回多个虚拟空间,以构成至少一个虚拟空间合集;将获取的至少一个虚拟空间合集的提示信息发送至用户端,满足了搜索场景下虚拟空间的融合需求,不仅提高了虚拟空间处理的效率,还提升了用户在搜索页单次搜索的虚拟空间的浏览时长,提升了搜索流量利用率和搜索体验。
本申请的这些方面或其他方面在以下实施例的描述中会更加简明易懂。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种虚拟空间处理方法的流程图;
图2为本申请实施例提供的一种展示虚拟空间合集的效果示意图;
图3为本申请实施例提供的另一种展示虚拟空间合集的效果示意图;
图4为本申请实施例提供的另一种虚拟空间处理方法的流程图;
图5为本申请实施例提供的一种展示虚拟空间的效果示意图;
图6为本申请实施例提供的另一种展示虚拟空间合集的效果示意图;
图7为本申请实施例提供的一种虚拟空间展示方法的流程图;
图8为本申请实施例提供的一种虚拟空间处理装置的结构示意图;
图9为本申请实施例提供的一种虚拟空间展示装置的结构示意图;
图10为本申请实施例提供的一种计算设备的结构示意图;
图11为本申请实施例提供的另一种计算设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
在本申请的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
在对本申请实施例所提供的虚拟空间处理方法进行介绍之前,相对本申请的所涉及的相关技术、相关概念以及研究背景进行简要介绍:
(1)相关技术以及相关概念
ANN(Approximate Nearest Neighbor)算法:也叫做近似最近邻搜索算法,是指一系列用于解决最近邻查找问题的近似算法,其中,最近邻查找问题,即在给定的向量合集中查找出与目标向量距离最近的N个向量。
倒排索引(inverted index):倒排索引源于实际应用中需要根据属性的值来查找记录。这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值,而是由属性值来确定记录的位置,因而称为倒排索引。
行业知识化信息:基于内外部合作的垂类信息提供方引入的信息,例如行业运营积累的优质主播等,进而通过行业知识化信息召回更多隐式相关的优质主播。
自然语言处理(Natural Language Processing,简称NLP)模型:是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。因而它是计算机科学的一部分。自然语言处理主要应用于机器翻译、舆情监测、自动摘要、观点提取、文本分类、问题回答、文本语义对比、语音识别、中文OCR 等方面。
深度学习(Deep Learning,简称DL)模型:是机器学习(Machine Learning,简称ML)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能(Artificial Intelligence,简称AI)。深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。
数据挖掘:指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来搜索隐藏于其中信息。
(2)研究背景
随着互联网的普及,越来越多用户喜欢通过直播的方式分享自己的生活或者对某一事件的评述(如徒步A城直播、电影评述直播等)。由于视频种类的多样化,为了使得每个用户能够观看到自己喜好的视频分类,因此可通过输入搜索词的方式,获取到对应分类的直播间。
然而目前的直播间展示方案,只能展出与用户输入的搜索词相关的直播间,但即使是同一搜索词,其相关的直播间分类仍较多。例如,以搜索词:翡翠为例,目前的直播间展示方案可能会一同展示翡翠手镯、翡翠耳环、翡翠吊坠等多个直播间,而此时用户若只想了解翡翠手镯相关的直播间时,则需要重新确定搜索词以获取翡翠手镯相关的直播间,从而影响用户的浏览体验。
也就是说,目前的技术方案大多只能够解决直播间搜索问题(即只能展出与用户输入的搜索词相关的直播间)以及对视频进行聚合的问题,缺乏一种直播间进行聚合的方案,用以满足用户对直播间处理的需求。
为解决目前缺乏直播间处理方案的问题,本申请提供了一种虚拟空间处理方法,除了用于满足了搜索场景下用户对直播间的融合需求,还可以满足其他虚拟空间的融合需求,例如,聊天室等。
具体地,本申请实施例提供了一种虚拟空间处理方法,通过获取用户端发送的搜索词;识别所述搜索词对应的实体词,以及查找所述实体词对应的至少一个合集搜索信息;根据所述实体词、至少一个所述合集搜索信息中的搜索规则,召回多个虚拟空间,以构成至少一个虚拟空间合集;将获取的至少一个虚拟空间合集的提示信息发送至用户端。本实施例中,满足了搜索场景下虚拟空间的融合需求,提高了虚拟空间处理的效率。
以虚拟空间包括直播间为例,本申请所提供的虚拟空间处理方案相对于目前的直播间搜索方案而言,本申请的虚拟空间处理方案存在较多先进性。具体地,本申请通过识别所述搜索词对应的实体词,而不仅仅停留在搜索词文本匹配层面,通过深度挖掘搜索词背后的实体词,以保证召回的直播间以及构建的直播间合集的准确性;本申请还通过实体词、搜索规则召回直播间,并构成直播间合集,满足了用户对直播间处理的需求;本申请还基于实时用户观看行为以及直播间合集的排列顺序,确定各个直播间合集的展示位置,不仅兼顾了直播间合集的相关性和用户体验,还在技术深度上更好地满足了用户浏览需求。
本申请所提供的虚拟空间处理方案相当于目前的视频聚合方案而言,本申请技术方案具有较多独创性。具体地,视频聚合方案中,由于视频是静态完整的,而直播是动态增长的,因此不能简单将视频聚合方案运用到虚拟空间处理。本申请的虚拟空间处理方案,会更多侧重于实时信号(如实时用户观看行为,实时用户反馈行为等)的识别和利用,以满足用户检索时低延迟高准确的虚拟空间处理需求。
下面对本申请实施例所提供的虚拟空间处理方法进行详细介绍:
图1为本申请实施例提供的一种虚拟空间处理方法的流程图,如图1所示,该方法应用于服务端,该方法包括:
101、获取用户端发送的搜索词。
在该步骤中,用户端发送的搜索词为用户输入的搜索词,其中,搜索词可以为单一名词、短句或者多个名词的组合。例如,搜索词可以是“A游戏 (单一名词)”、“A地点升旗(短句)”或者“A游戏教学”等。
本申请实施例中,当用户在用户端的搜索页面输入搜索词后,用户端获取用户输入的搜索词,并将该搜索词发送至服务端,以使服务端获取该搜索词。
102、识别所述搜索词对应的实体词,以及查找所述实体词对应的至少一个合集搜索信息。
在该步骤中,实体词可理解为该搜索词的代词、名词。例如,输入的搜索词为:A地点升旗,则该搜索词对应的实体词包括:A地点以及旗。例如,输入的搜索词为:苹果13,则搜索词对应的实体词包括:iPhone。
本申请实施例中,识别所述搜索词对应的实体词的方式可包括多种,例如,通过预先建立搜索词与实体词之间的对应关系,并基于该对应关系识别搜索词对应的实体词。例如建立搜索词“苹果”与实体词“iPhone”之间的对应关系,因此当搜索词包括苹果时,基于该对应关系,确定搜索词对应的实体词为iPhone。或者,通过NLP模型计算该搜索词的词向量,以及该搜索词的词向量与各实体词的词向量之间相似度,并将相似度最高的实体词作为该搜索词对应的实体词。除此之外还包括其他识别所述搜索词对应的实体词的方式,本申请上述仅为举例说明不做具体限定。
在该步骤中,每个实体词可对应一个或多个合集搜索信息。其中,合集搜索信息包括搜索该实体词对应的虚拟空间合集的搜索规则、该实体词对应的虚拟空间合集的标题、该实体词对应的虚拟空间合集的合集标识,其中,搜索规则包括搜索所述实体词对应的虚拟空间合集的规则。本申请可通过预先建立的实体词与合集搜索信息之间的对应关系,查找所述实体词对应的至少一个合集搜索信息。
本申请实施例中,例如,对于实体词“A游戏”预先建立了两个合集搜索信息,其中,两个合集搜索信息包括:A游戏技术主播合集的搜索规则-《A 游戏技术主播合集》-合集标识:123以及A游戏颜值主播合集的搜索规则- 《A游戏颜值主播合集》-合集标识:234,并建立实体词“A游戏”与其合集搜索信息之间的对应关系。需要说明的是,上述合集搜索信息仅为举例,实际上A游戏这一实体词还可以对应其他的合集搜索信息,具体可根据需求设定。
因此,当确定出实体词为“A游戏”时,基于“A游戏”与其合集搜索信息之间的对应关系,查找所述实体词对应的合集搜索信息包括A游戏技术主播合集的搜索规则-《A游戏技术主播合集》-合集标识:123以及A游戏颜值主播合集的搜索规则-《A游戏颜值主播合集》-合集标识:234。
103、根据所述实体词、至少一个所述合集搜索信息中的搜索规则,召回多个虚拟空间,以构成至少一个虚拟空间合集。
在该步骤中,虚拟空间包括但不限于:直播间、聊天室等。
本申请实施例中,以虚拟空间为直播间为例,该搜索规则为搜索该实体词对应的直播间合集的规则,其中,搜索规则可预先设置。例如,以A游戏技术主播合集的搜索规则为例,在预先划分的技术主播直播间中,召回多个直播间,以构成至少一个直播间合集。也就是说,所述合集搜索信息中的搜索规则,相当于圈定了一个直播间的搜索范围,在这个直播间的搜索范围再按照召回策略,召回符合的多个直播间,最终构成直播间合集。
需要说明的是,本申请通过设置所述合集搜索信息中的搜索规则的方式,避免了根据实体词从全部虚拟空间中召回多个虚拟空间,造成计算量大、且召回的虚拟空间不精确的问题,即不仅减少了召回的虚拟空间以及构建的虚拟空间合集的计算量,还提高了召回虚拟空间以及构建的虚拟空间合集的准确率。
104、将获取的至少一个虚拟空间合集的提示信息发送至用户端。
在该步骤中,提示信息包括虚拟空间合集的标题、虚拟空间合集所包含的虚拟空间数量、虚拟空间合集的更新时间以及虚拟空间合集的展示画面、虚拟空间合集等。
本申请实施例中,作为一种可选方案,服务端将获取的至少一个虚拟空间合集的提示信息发送至用户端后,用户端展示至少一个虚拟空间合集的提示信息。
在上述方案的基础上,还可以基于实时用户观看行为以及获取的虚拟空间合集的排列顺序,确定出每个虚拟空间合集在用户端的显示界面的展现位置,并将所述展现位置发送至用户端,以触发用户端按照所述展现位置,展示至少一个虚拟空间合集的提示信息。
在该方案中,实时用户观看行为可包括针对每个虚拟空间合集的用户的浏览量、点击量、点赞量、关注量等。
其中,获取虚拟空间合集的排列顺序的方式可包括多种,例如可通过确定每个虚拟空间合集的合集分数,所述合集分数为合集内前N个虚拟空间的分数之和;基于每个虚拟空间合集对应的合集分数,对至少一个虚拟空间合集进行排序,确定出虚拟空间合集的排列顺序,其中,虚拟空间的分数可根据该虚拟空间的点击次数与所述播放次数之间的比值确定。此外还可以通过其他方式获取虚拟空间合集的排列顺序,本申请对此不做限定。
在该方案中,以虚拟空间为直播间为例,例如,针对于“A游戏”该实体词,经过步骤103,构建了2个直播间合集,分别是“A游戏技术主播合集”以及“A游戏颜值主播合集”。而其中,“A游戏技术主播合集”内前4个直播间的分数之和为90分,“A游戏颜值主播合集”内前4个直播间的分数之和为95分,则确定“A游戏颜值主播合集”的展现位置位于“A游戏技术主播合集”之前。
进一步地,在确定出上述两个直播间集合在用户端的显示界面的展现位置后,按照所述展现位置,展示上述两个直播间合集的提示信息。例如图2 所示,在用户端的显示界面1显示“A游戏颜值主播合集”对应的标题“峡谷小姐姐在线带飞”、直播间合集所包含的直播间数量“24条视频”、直播间合集的更新时间“10/30更新”以及直播间合集的展示画面,并用户向下滑动后,再显示“A游戏技术主播合集”对应的标题“大神带你飞”、直播间合集所包含的直播间数量“30条视频”、直播间合集的更新时间“10/30 更新”以及直播间合集的展示画面。
此外,还可以包括其他的展现位置,本申请对此不做限定。例如,如图 3所示,在触发用户端的显示界面1显示“A游戏技术第一用户账号合集”的提示信息以及“A游戏颜值第一用户账号合集”的提示信息位于同一列,且“A游戏颜值第一用户账号合集”的提示信息展示在最左侧,用户通过往右滑动后,再显示“A游戏技术第一用户账号合集”的提示信息。
此外,虚拟空间还可以包括聊天室等,服务端还可以构成聊天室,并将聊天室的提示信息发送至用户端,以供用户端显示聊天室的提示信息。当然,虚拟空间还可以包括其他空间,本申请对此不作限定。
需要说明的是,虚拟空间的分数是动态变化的,因此虚拟空间合集的排序也可能会发生变化。需要在确定每个虚拟空间合集在用户端的显示界面的展现位置时,需要基于当前时刻的用户观看行为以及当前时刻的虚拟空间合集的排列顺序,综合确定出每个虚拟空间合集在用户端的显示界面的展现位置。
本申请实施例所提供的虚拟空间处理方案,主要应用于用户端的搜索场景下(不限定于虚拟空间搜索场景下,还可以是综合搜索场景或者其他搜索场景),通过实体词、合集搜索信息的搜索规则召回虚拟空间以构成虚拟空间合集的方式,能够实现对相同主题下的高质量虚拟空间进行聚合,从而提高搜索结果的信息展现效率,有助于用户更高效地筛选感兴趣的内容。
图4为本申请实施例提供的另一种虚拟空间处理方法的流程图,如图4 所示,该方法包括:
201、获取用户端发送的搜索词。
本申请实施例中,该步骤的执行过程可参见上述步骤101,本申请实施例对此不再累述。
202、识别所述搜索词对应的实体词,以及查找所述实体词对应的至少一个合集搜索信息。
本申请实施例中,识别搜索词对应的实体词的方式主要是基于数据挖掘技术和fastText等NLP模型,判断搜索词与哪些实体词相近,从而确定出搜索词对应的实体词。
具体地,作为一种可选的方案,通过预先建立的搜索词与实体词的对应关系中,确定出所述搜索词对应的实体词。
在该方案中,主要是通过数据挖掘技术,根据搜索词、用户观看的视频搜索、用户观看的虚拟空间搜索、音视频多媒体理解标签等信息,建立搜索词与实体词的对应关系。例如,搜索词为苹果,通过数据挖掘技术获取到该搜索词对应的用户观看的视频搜索、用户观看的虚拟空间搜索、音视频多媒体理解标签等信息均与iPhone相关,而并非与苹果(水果)相关,因此确定该搜索词对应的实体词可包括iPhone。
在实际应用中,可通过数据挖掘技术,根据搜索词、用户观看的视频搜索、用户观看的虚拟空间搜索、音视频多媒体理解标签等信息,建立搜索词- 实体词典,该搜索词-实体词典中包括搜索词与实体词的对应关系。当服务端获取到搜索词时,将所述搜索词输入至服务端的内部逻辑服务,内部逻辑服务通过解析搜索词-实体词典,找到该搜索词对应的实体词,并输出实体词反馈至服务端。
作为另一种可选的方案,可通过计算所述搜索词的词向量与每个实体词的词向量的相似度,将相似度最高的实体词作为所述搜索词对应的实体词。
在该方案中,fastText(fasttext是facebook开源的一个词向量与文本分类工具)等NLP模型是基于搜索词、视频标题、虚拟空间标题、用户观看行为等信息训练生成的,具备一定的泛化能力。
在实际应用中,当服务端获取到搜索词时,将所述搜索词输入预先训练好的NLP模型中,由NLP模型将搜索词转化为词向量,并在向量化索引中计算该搜索词的词向量与各实体词词向量的相似度,输出词向量最相近的实体词。
需要说明的是,相对于目前的搜索词文本匹配技术而言,本申请采用的数据挖掘技术以及NLP模型识别搜索词对应的实体词,是需要理解搜索词中的核心实体。而核心实体不一定字面上存在与搜索词中,部分关联关系需要基于数据挖掘技术或NLP模型来发现,例如,搜索词为苹果时,若通过搜索词文本匹配技术,可能匹配到苹果(水果),而通过本申请的数据挖掘技术或NLP模型,则确定出搜索词对应的实体词为iPhone,这种隐式语义挖掘的能力,是相对于现有技术方案的更具有优势,同时也实现了可通过搜索词查找虚拟空间合集的功能。
在该步骤中,针对于“查找所述实体词对应的至少一个合集搜索信息”的方式,首先需要预先建立的实体词与合集搜索信息之间的对应关系,再从该对应关系中查找所述实体词对应的至少一个合集搜索信息。
在实际应用中,本申请通过服务端的直播合集服务在离线部分,通过获取实体词,内部逻辑将实体词以及多个合集搜索信息进行关联,生成实体词- 合集搜索信息词典,该实体词-合集搜索信息词典中包含实体词与合集搜索信息之间的对应关系。
203、根据所述实体词、至少一个所述合集搜索信息中的搜索规则以及至少一种召回策略,召回多个虚拟空间,以构成至少一个虚拟空间合集。
本申请实施例中,以虚拟空间为直播间,虚拟空间合集为直播间合集为例,作为一种可选的方案,步骤203的具体实现过程可包括:在每个所述合集搜索信息中的搜索规则对应的多个虚拟空间内,召回包含所述实体词的第一用户账号信息、虚拟空间标题、音视频理解标签的虚拟空间,以构成至少一个虚拟空间合集。
具体地,可通过倒排索引的方式,召回包含所述实体词的第一用户账号信息、虚拟空间标题、音视频理解标签的虚拟空间。即将实体词作为索引,并在所述合集搜索信息中的搜索规则对应的多个虚拟空间中,记录包含该实体词的第一用户账号信息、虚拟空间标题或者音视频理解标签的虚拟空间,并将这些虚拟空间作为召回的虚拟空间,以构成虚拟空间合集,其中第一用户账户可为虚拟空间的创建者,例如以虚拟空间为直播间为例,第一用户账户可为主播;以虚拟空间为聊天室为例,第一用户账户可为房主。
在该方案中,以虚拟空间为直播间,虚拟空间合集为直播间合集,第一用户账号,实体词为“A游戏”为例,该实体词包括两个合集搜索信息,其中,两个合集搜索信息分别为:A游戏技术主播合集的搜索规则-《A游戏技术主播合集》-合集标识123以及A游戏颜值主播合集的搜索规则-《A游戏颜值主播合集》-合集标识234。
在执行该方案时,首先通过A游戏技术主播合集的搜索规则从直播搜索确定多个A游戏技术主播的直播间,再从多个A游戏技术主播的直播间中,召回包含所述实体词“A游戏”的主播信息、直播间标题、直播音视频理解标签的直播间,以构成一个直播间合集。再通过A游戏颜值主播合集的搜索规则从直播搜索确定多个A游戏颜值主播的直播间,再从多个A游戏颜值主播的直播间中,召回包含所述实体词“A游戏”的主播信息、直播间标题、直播音视频理解标签的直播间,以构成另一个直播间合集。
需要说明的是,通过召回策略召回多个虚拟空间的目的在于:通过召回策略能够召回高质量的虚拟空间,有助于用户更高效地筛选感兴趣的内容。
作为另一种可选的方案,步骤203的具体实现过程可包括:在每个所述合集搜索信息中的搜索规则对应的多个虚拟空间内,对所述实体词与所述多个虚拟空间中每个虚拟空间的第一用户账号向量化,通过近似最近邻查找算法,计算每个第一用户账号与所述实体词之间的距离,并将距离小于预设值的第一用户账号对应的虚拟空间作为召回的虚拟空间,以构成至少一个虚拟空间合集。
在该方案中,以虚拟空间为直播间,虚拟空间合集为直播间合集,第一用户账号可包括主播,实体词为“A游戏”为例,首先通过A游戏技术主播合集的搜索规则从直播搜索确定多个A游戏技术主播的直播间,对所述实体词与多个A游戏技术主播的直播间中每个直播间的主播向量化,通过近似最近邻查找算法,计算每个主播与所述实体词之间的距离,并将距离小于预设值的主播对应的直播间作为召回的直播间,以构成一个直播间合集。再通过A游戏颜值主播合集的搜索规则从直播搜索确定多个A游戏颜值主播的直播间,对所述实体词与多个A游戏颜值主播的直播间中每个直播间的主播向量化,通过近似最近邻查找算法,计算每个主播与所述实体词之间的距离,并将距离小于预设值的主播对应的直播间作为召回的直播间,以构成另一个直播间合集。
在该方案中,关于“对所述实体词与多个A游戏技术第一用户账号的虚拟空间中每个虚拟空间的第一用户账号向量化,通过近似最近邻查找算法,计算每个第一用户账号与所述实体词之间的距离”的具体过程:可通过对所述实体词与多个A游戏技术第一用户账号的虚拟空间中每个虚拟空间的第一用户账号向量化,并通过非对称距离计算(AsymmetricDistance Computation,简称ADC)快速求取每个第一用户账号与所述实体词之间的距离。
作为另一种可选的方案,步骤203的具体实现过程可包括:可在每个所述合集搜索信息中的搜索规则对应的多个虚拟空间内,对所述实体词与所述多个虚拟空间中每个虚拟空间的显示画面向量化,通过近似最近邻查找算法,计算每个显示画面与所述实体词之间的距离,并将距离小于预设值的显示画面对应的虚拟空间召回的虚拟空间,以构成至少一个虚拟空间合集。
在该方案中,以虚拟空间为直播间,虚拟空间合集为直播间合集,第一用户账号可包括主播,实体词为“A游戏”为例,首先通过A游戏技术主播合集的搜索规则从直播搜索确定多个A游戏技术主播的直播间,对所述实体词与所述多个A游戏技术主播的直播间中每个直播间的直播画面向量化,通过近似最近邻查找算法,计算每个直播画面与所述实体词之间的距离,并将距离小于预设值的直播画面对应的直播间召回的直播间,以构成一个直播间合集。再通过A游戏颜值主播合集的搜索规则从直播搜索确定多个A游戏颜值主播的直播间,对所述实体词与所述多个A游戏颜值主播的直播间中每个直播间的直播画面向量化,通过近似最近邻查找算法,计算每个直播画面与所述实体词之间的距离,并将距离小于预设值的直播画面对应的直播间召回的直播间,以构成另一个直播间合集。
在该方案中,需要说明的是,计算每个直播画面与所述实体词之间的距离的召回策略,是考虑到可能某一A游戏技术主播的直播间中,当前时刻该主播并未在直播A游戏,因此通过计算每个直播画面与所述实体词之间的距离,能够识别每个A游戏技术主播的直播间的直播画面是否A游戏的直播画面,从而保证了召回的直播间的质量及准确性。
此外,还可以包括其他的召回策略,本申请对此不做限定。例如,还可以基于实体词与行业知识化信息的对应关系,召回多个虚拟空间,以构成至少一个虚拟空间合集。在该方案中,行业知识化信息是指基于内外部合作的垂类信息提供方引入的信息,例如行业运营积累的优质主播等,进而通过行业知识化信息召回更多隐式相关的优质主播。以虚拟空间为直播间,虚拟空间合集为直播间合集,第一用户账号可包括主播,实体词为“A游戏”为例,某一主播为A游戏的人气主播,因此同样可将该主播的直播间进行召回,生成直播间合集。
在实际应用中,本申请通过服务端的合集服务在近线部分,基于实体词- 合集搜索信息词典,召回虚拟空间,并将召回的虚拟空间存储到缓存中。也就是说,在执行步骤203时,本申请通过在服务端的直播合集服务中输入是实体词-合集搜索信息词典,直播合集服务内部逻辑基于该实体词-合集搜索信息词典召回虚拟空间,并输出虚拟空间合集内召回的虚拟空间的缓存结果,以使服务端根据召回的虚拟空间的缓存结果构建虚拟空间合集。
在实际应用中,本申请通过服务端的合集服务在在线部分,通过解析合集搜索信息,按照合集搜索信息以及召回策略,召回并排序虚拟空间。也就是说,在执行步骤203时,本申请通过在服务端的直播合集服务中输入合集搜索信息,直播合集服务的内部逻辑基于合集搜索信息召回和排序虚拟空间并输出是虚拟空间合集内的虚拟空间以及虚拟空间的排序结果。
204、将获取的至少一个虚拟空间合集的提示信息发送至用户端。
本申请实施例中,该步骤的执行过程可参见上述步骤104,本申请实施例对此不再累述。
本申请实施例中,该方法还包括:
205、基于用户端发送的合集标识,确定所述合集标识对应的虚拟空间合集。
在该步骤中,所述合集标识对应的虚拟空间合集即为用户所要打开的虚拟空间合集,其中,合集标识可以是虚拟空间合集的ID,以虚拟空间为直播间为例,直播间合集标识可以是直播间合集的ID。
本申请实施例中,当用户端展示至少一个虚拟空间合集的提示信息后,用户在显示界面输入的合集展示指令,即用户通过点击等操作选择感兴趣的虚拟空间合集后,用户端响应显示界面输入的合集展示指令,确定用户所要打开的虚拟空间合集,将所述虚拟空间合集的合集标识发送至服务端,以使得服务端基于用户端发送的合集标识,确定用户所要打开的虚拟空间合集。
以虚拟空间为直播间,虚拟空间合集为直播间合集为例,用户端在显示界面展示了多个虚拟空间合集的提示信息,如图3所示,当用户点击标题为“峡谷小姐姐在线带飞”的直播间合集后,会生成一合集展开指令至用户端,其中合集展开指令携带该直播间合集的合集标识:234。用户端基于该合集展开指令确定用户所要打开的直播间合集为《A游戏颜值主播合集》,并将该《A游戏颜值主播合集》对应的合集标识:234发送至服务端,以使得服务端确定用户所要打开的直播间合集为《A游戏颜值主播合集》。
206、根据每个虚拟空间与所述实体词的相关程度以及每个所述虚拟空间的实时用户反馈行为,对所述虚拟空间合集中的多个虚拟空间进行排序,确定出所述虚拟空间合集中多个虚拟空间的排列顺序。
在该步骤中,所述实时用户反馈行为包括点击次数及播放次数。需要说明的是,即可以在确定用户所要打开的虚拟空间合集时,确定所述虚拟空间合集中多个虚拟空间的排列顺序;也可以在召回虚拟空间构建虚拟空间合集阶段,确定所述虚拟空间合集中多个虚拟空间的排列顺序。
本申请实施例中,作为一种可能实现的方案,步骤206的执行过程可具体包括:
2061、采集每个所述虚拟空间的特征信息,并根据所述特征信息以及特征信息、实体词以及标记结果的对应关系,确定出所述虚拟空间的标记结果,所述标记结果包括相关或不相关。
在该步骤中,在执行步骤2061之前,可基于大量的相关性标注样本训练深度学习模型,其中,每个相关性标注样本包括特征信息、实体词以及标记结果。其中,特征信息可包括虚拟空间标题、虚拟空间内容多模态识别标签等,其中,虚拟空间内容多模态识别标签可理解为对虚拟空间内容多模态(如音频、显示画面等)进行识别,以确定该虚拟空间的所属标签(如分类)。例如,以虚拟空间为直播间,实体词为A游戏为例,召回的直播间的显示画面为B游戏,则将该直播间的特性信息中直播间内容多模态识别标签为“B 游戏”,标记为不相关,并将“A游戏”-“B游戏”-“不相关”这一对应关系,训练深度学习模型。
通过上述方式训练的深度学习模型方式,基于大量的相关性标注样本训练好深度学习模型后,将步骤204召回的多个虚拟空间输入训练好的深度学习模型中,深度学习模型基于采集每个所述虚拟空间的特征信息,并利用训练过程所建立的特征信息、实体词以及标记结果的对应关系,输出标记结果为相关的虚拟空间以及每个标记结果为相关的虚拟空间的特征信息对应的相关分数,其中,相关分数越高,表示为该特征信息与实体词越相关。
2062、根据所述标记结果为相关的虚拟空间的特征信息以及每个特性信息对应的权重,计算出所述标记结果为相关的虚拟空间与所述实体词的相关值。
在该步骤中,可根据需求设定每个特性信息的权重值,例如,以特征信息可包括虚拟空间标题、虚拟空间内容多模态识别标签为例,可设置虚拟空间标题的权重为0.3、虚拟空间内容多模态识别标签的权重为0.7,再基于步骤2051获取的每个标记结果为相关的虚拟空间的特征信息对应的相关分数乘以每个特性信息对应的权重,从而计算出标记结果为相关的虚拟空间与所述实体词的相关值。
2063、基于所述点击次数与所述播放次数之间的比值,计算出所述虚拟空间的分数。
在该步骤中,点击次数和播放次数为实时变化的,因此可设定每间隔一段时间,重新计算虚拟空间的分数,或者在用户打开某一虚拟空间合集时,根据当前时刻的该虚拟空间合集内,每个虚拟空间的点击次数与所述播放次数,重新计算每个虚拟空间的分数。本申请实施例中,通过计算召回的虚拟空间的分数,可判断出召回的虚拟空间受用户的欢迎程度,以便在后续步骤对虚拟空间进行排序时,优先展示受用户欢迎程度更高的虚拟空间。
需要说明的是,播放次数为主动播放次数(如用户主动进入某一直播间,直播内容默认播放的次数)以及被动播放次数(如用户未主动进入某一直播间,该直播间的直播间内容在显示界面播放的次数)之和,通常播放次数大于点击次数。
2064、基于所述标记结果为相关的虚拟空间与所述实体词的相关值以及每个所述虚拟空间的分数,对多个虚拟空间进行排序,确定出所述虚拟空间合集中多个虚拟空间的排列顺序。
本申请实施例中,相对于目前的视频聚合方案,本申请实施例通过引入实时用户反馈行为以及虚拟空间相关性,能够更实时地查找到更相关和更受用户欢迎的虚拟空间,从而不仅提高了虚拟空间处理的效率,还提升了用户在搜索页单次搜索的直播浏览时长,提升了搜索流量利用率和搜索体验。
207、将所述排列顺序发送至用户端。
在该步骤中,所述排列顺序用于指示用户端按照所述虚拟空间合集中多个虚拟空间的排列顺序,展示排序后的所述多个虚拟空间的空间信息。也就是说,用户端在获取虚拟空间合集中多个虚拟空间的排列顺序之后,按照虚拟空间合集中多个虚拟空间的排列顺序,展示排序后的所述多个虚拟空间的空间信息。
其中,空间信息包括但不限于:显示画面、第一用户账号名称、虚拟空间点赞数量、直播实时评论、虚拟空间关注数量。具体地,以虚拟空间为直播间为例,空间信息可以为直播信息,其中,直播信息包括但不限于:直播画面、主播名称、直播间点赞数量、直播实时评论、直播间关注数量。以虚拟空间为聊天室为例,空间信息可以是聊天信息,其中,聊天信息可包括但不限于聊天画面、房主名称、聊天室点赞数量、聊天室实时评论、聊天室关注数量。
本申请实施例中,以虚拟空间为直播间为例,在用户端按照所述虚拟空间合集中多个虚拟空间的排列顺序,在用户发送该虚拟空间合集的合集展开指令后,如图5,在显示界面1中优先展现排序第一的直播间的直播信息:直播画面、主播名称:小红、直播间点赞数量:15W,直播间实时评论:“小姐姐真厉害!”,直播间关注数量:2W,并在用户进行下滑操作后,再展示排序第二的直播间的直播信息,以此类推,直至将该直播间合集内的直播间的直播信息展示完毕。
除此之外,还可以包括其他的直播间展示方式,本申请对此不作限定,可根据需求设定。
进一步地,该方法还包括:确定所述虚拟空间合集中任一虚拟空间对应的推荐信息,并将推荐信息发送至用户端,所述推荐信息用于指示用户端展示所述推荐信息。
在该步骤中,所述推荐信息包括推荐理由、虚拟空间热度、实时精选评论信息。具体地,作为一种可能的实现方案,可获取所述虚拟空间合集中排名首位的虚拟空间对应的推荐信息。
本申请实施例中,如图6所示,在用户端展示至少一个虚拟空间合集的提示信息时(虚拟空间合集的标题、虚拟空间合集所包含的虚拟空间数量、虚拟空间合集的更新时间以及虚拟空间合集的展示画面),在展示画面中展示虚拟空间合集中排名首位的虚拟空间对应的推荐信息(实时精选评论信息虚拟空间)。
其中,关于“确定所述虚拟空间合集中任一虚拟空间对应的推荐信息”的方式,可根据虚拟空间合集与搜索词的相关性强弱关系,生成推荐理由、虚拟空间热度、实时精选评论信息等推荐信息。其中,推荐理由可包括直播合集或者直播推荐,当推荐理由为直播合集时,表明该直播合集中的视频与搜索词相关性较强;当推荐理由为直播推荐时,表明该直播合集中的视频与搜索词相关性较弱。虚拟空间热度可包括虚拟空间实时的观众数。
在实际应用中,例如,虚拟空间为直播间,搜索词为翡翠为例,直播间合集为翡翠吊坠,就认为直播间合集与搜索词之间的相关性较强,并将推荐理由设置为直播合集;反之则设置为直播推荐。直播间实时的观众数(直播间热度),可体现在直播合集封面页上,作为吸引用户观看的信息元素。如图6所示,实时精选评论信息可体现在直播合集封面页上,且设置实时精选评论信息自动滚动,以增加用户关注量。
作为一种可能的实现方案,该方法还包括:确定所述虚拟空间合集中任一虚拟空间对应的推荐信息之后,还需要对虚拟空间的提示信息、空间信息以及推荐信息进行渲染,生成用户端的最终显示效果。
在实际应用中,本申请通过服务端的合集服务进行识别搜索词、构建虚拟空间合集、获取虚拟空间合集内的虚拟空间结果缓存、虚拟空间合集排序、虚拟空间合集渲染等操作。也就是说,在执行本申请的虚拟空间处理方案时,通过在合集服务中输入搜索词,合集服务经过上述操作,渲染后的虚拟空间合集发送至用户端。当然,也可以将虚拟空间合集以及虚拟空间合集对应的提示信息、空间信息以及推荐信息进行渲染,生成最终显示效果,以在显示界面展示最终显示效果。
图7为本申请实施例提供的一种虚拟空间展示方法的流程图,如图7所示,该方法应用于用户端,该方法包括:
301、响应搜索界面的输入操作,确定输入的搜索词。
在该步骤中,当用户在搜索界面输入搜索词时,用户端获取用户所输入的搜索词,并将该搜索词发送至服务端。
302、将搜索词发送至服务端。
在该步骤中,所述搜索词用于指示服务端获取用户端发送的搜索词;识别所述搜索词对应的实体词,以及查找所述实体词对应的至少一个合集搜索信息;根据所述实体词、至少一个所述合集搜索信息中的搜索规则,召回多个虚拟空间,以构成至少一个虚拟空间合集;将获取的至少一个虚拟空间合集的提示信息发送至用户端。
303、接收至少一个虚拟空间合集的提示信息。
在该步骤中,所述提示信息为所述服务端通过所述搜索词召回多个虚拟空间,以构成至少一个虚拟空间合集而得到的提示信息。
304、在显示界面上显示所述至少一个虚拟空间合集的提示信息。
本申请实施例中,如图2和图3所示,在用户端的显示界面的多个展现位置上显示对应虚拟空间合集的提示信息。
进一步地,还包括:
305、响应显示界面输入的合集展示指令,确定虚拟空间合集。
在该步骤中,可选地,响应于用户在显示界面输入的合集展示指令,确定用户所要打开的虚拟空间合集。
本申请实施例中,用户通过点击的方式选择某一虚拟空间合集时,用户端确定用户所选择的虚拟空间合集以及虚拟空间合集的合集标识,并将所述虚拟空间合集的合集标识发送至服务端。
306、将所述虚拟空间合集的合集标识发送至服务端。
在该步骤中,所述合集标识用于指示服务端基于用户端发送的合集标识,确定所述合集标识对应的虚拟空间合集;根据每个虚拟空间与所述实体词的相关程度以及用户对每个所述虚拟空间的实时用户反馈行为,对所述虚拟空间合集中的多个虚拟空间进行排序,确定出所述虚拟空间合集中多个虚拟空间的排列顺序。
307、接收所述虚拟控件合集中多个虚拟空间的排列顺序。
在该步骤中,所述排列顺序为所述服务端根据每个虚拟空间与实体词的相关程度以及用户对每个所述虚拟空间的实时用户反馈行为,对所述虚拟空间合集中的多个虚拟空间进行排序,确定出的所述虚拟空间合集中多个虚拟空间的排列顺序。
308、在显示界面中按照所述虚拟空间合集中多个虚拟空间的排列顺序,展示排序后的所述多个虚拟空间的空间信息。
本申请实施例中,如图6所示,在显示界面按照所述虚拟空间合集中多个虚拟空间的排列顺序,展示排序后的所述多个虚拟空间的空间信息。
图8为本申请实施例提供的一种虚拟空间处理装置的结构示意图,如图 8所示,该装置包括:
获取模块41,用于获取用户端发送的搜索词;
识别模块42,用于识别所述搜索词对应的实体词;
查询模块43,查找所述实体词对应的至少一个合集搜索信息;
构成模块44,用于根据所述实体词、至少一个所述合集搜索信息中的搜索规则,召回多个虚拟空间,以构成至少一个虚拟空间合集;
发送模块45,用于将获取的至少一个虚拟空间合集的提示信息发送至用户端。
本申请实施例中,可选地,该装置的触发模块45具体用于基于实时用户观看行为以及获取的虚拟空间合集的排列顺序,确定出每个虚拟空间合集在用户端的显示界面的展现位置。
第一发送模块45还用于将所述展现位置发送至用户端,所述展现位置用于指示用户端按照所述展现位置,展示至少一个直播间合集的提示信息。
本申请实施例中,可选地,该装置的构成模块44具体用于根据所述实体词、至少一个所述合集搜索信息中的搜索规则以及至少一种召回策略,召回多个虚拟空间,以构成至少一个虚拟空间合集。
本申请实施例中,可选地,该装置还包括第一确定模块46。
第一确定模块46用于基于用户端发送的合集标识,确定用户所要打开的虚拟空间合集;根据每个虚拟空间与所述实体词的相关程度以及每个所述虚拟空间的实时用户反馈行为,对所述虚拟空间合集中的多个虚拟空间进行排序,确定出所述虚拟空间合集中多个虚拟空间的排列顺序;
第一发送模块45还用于将所述排列顺序发送至用户端,所述排列顺序用于指示用户端按照所述虚拟空间合集中多个虚拟空间的排列顺序,展示排序后的所述多个虚拟空间的空间信息。
本申请实施例中,可选地,该装置的识别模块42还用于通过预先建立的搜索词与实体词的对应关系中,确定出所述搜索词对应的实体词;或者,计算所述搜索词的词向量与每个实体词的词向量的相似度,将相似度最高的实体词作为所述搜索词对应的实体词。
本申请实施例中,可选地,该装置的查询模块43还用于通过预先建立的实体词与合集搜索信息的对应关系中,确定出所述实体词对应的至少一个合集搜索信息。
本申请实施例中,可选地,该装置的构成模块44还用于在每个所述合集搜索信息中的搜索规则对应的多个虚拟空间内,召回包含所述实体词的第一用户账号信息、虚拟空间标题、音视频理解标签的虚拟空间,以构成至少一个虚拟空间合集;或者,在每个所述合集搜索信息中的搜索规则对应的多个虚拟空间内,对所述实体词与所述多个虚拟空间中每个虚拟空间的第一用户账号向量化,通过近似最近邻查找算法,计算每个第一用户账号与所述实体词之间的距离,并将距离小于预设值的第一用户账号对应的虚拟空间作为召回的虚拟空间,以构成至少一个虚拟空间合集;或者,在每个所述合集搜索信息中的搜索规则对应的多个虚拟空间内,对所述实体词与所述多个虚拟空间中每个虚拟空间的显示画面向量化,通过近似最近邻查找算法,计算每个显示画面与所述实体词之间的距离,并将距离小于预设值的显示画面对应的虚拟空间召回的虚拟空间,以构成至少一个虚拟空间合集。
本申请实施例中,所述实时用户反馈行为包括点击次数及播放次数;可选地,该装置的第一确定模块46还用于采集每个所述虚拟空间的特征信息,并根据所述特征信息以及特征信息、实体词以及标记结果的对应关系,确定出所述虚拟空间的标记结果,所述标记结果包括相关或不相关;根据所述标记结果为相关的虚拟空间的特征信息以及每个特性信息对应的权重,计算出所述标记结果为相关的虚拟空间与所述实体词的相关值;基于所述点击次数与所述播放次数之间的比值,计算出所述虚拟空间的分数;基于所述标记结果为相关的虚拟空间与所述实体词的相关值以及每个所述虚拟空间的分数,对多个虚拟空间进行排序,确定出所述虚拟空间合集中多个虚拟空间的排列顺序。
本申请实施例中,可选地,该装置的第一确定模块46还用于确定每个虚拟空间合集的合集分数,所述合集分数为合集内前N个虚拟空间的分数之和;基于每个虚拟空间合集对应的合集分数,对至少一个虚拟空间合集进行排序,确定出虚拟空间合集的排列顺序;基于实时用户观看行为以及所述排列顺序,确定出每个虚拟空间合集在显示界面的展现位置。
本申请实施例中,可选地,该装置的第一确定模块46还用于确定所述虚拟空间合集中任一虚拟空间对应的推荐信息;
第一发送模块45还用于将推荐信息发送至用户端,所述推荐信息用于指示用户端展示所述推荐信息。
本申请实施例中,可选地,该装置的触发模块45还用于确定所述虚拟空间合集中排名首位的虚拟空间对应的推荐信息。
本申请实施例中,可选地,所述搜索规则包括搜索所述实体词对应的虚拟空间合集的规则。
本申请实施例中,可选地,所述推荐信息包括推荐理由、虚拟空间热度、实时精选评论信息。
图8所述的虚拟空间处理装置可以执行图4所示实施例所述的虚拟空间处理方法,其实现原理和技术效果不再赘述。对于上述实施例中的虚拟空间处理装置其中各个模块、单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图9为本申请实施例提供的一种虚拟空间展示装置的结构示意图,如图 9所示,该装置包括:
第二确定模块51,用于响应搜索界面的输入操作,确定输入的搜索词;
第二发送模块52,用于将搜索词发送至服务端。
接收模块53,用于接收至少一个虚拟空间合集的提示信息,所述提示信息为所述服务端通过所述搜索词召回多个虚拟空间,以构成至少一个虚拟空间合集而得到的提示信息;
显示模块54,用于在显示界面上显示所述至少一个虚拟空间合集的提示信息。
本申请实施例中,可选地,该装置的第二确定模块51还用于响应显示界面输入的合集展示指令,确定用户所要打开的虚拟空间合集;
第二发送模块52还用于将所述虚拟空间合集的合集标识发送至服务端;
接收模块53还用于接收所述虚拟控件合集中多个虚拟空间的排列顺序,所述排列顺序为所述服务端根据每个虚拟空间与实体词的相关程度以及用户对每个所述虚拟空间的实时用户反馈行为,对所述虚拟空间合集中的多个虚拟空间进行排序,确定出的所述虚拟空间合集中多个虚拟空间的排列顺序;
显示模块54还用于在显示界面中按照所述虚拟空间合集中多个虚拟空间的排列顺序,展示排序后的所述多个虚拟空间的空间信息。
图9所述的虚拟空间展示装置可以执行图7所示实施例所述的虚拟空间展示方法,其实现原理和技术效果不再赘述。对于上述实施例中的虚拟空间处理装置其中各个模块、单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
在一个可能的设计中,图8所示实施例的虚拟空间处理装置可以实现为一计算设备,实际应用程序中,如图10中所示,该计算设备可以包括存储组件801以及处理组件802;
存储组件801中存储有一条或多条计算机指令,其中,一条或多条计算机指令供处理组件802调用执行,以实现图4实施例所述的虚拟空间处理方法。
其中,处理组件802可以包括一个或多个处理器来执行计算机指令,以完成上述的方法中的全部或部分步骤。当然处理组件也可以为一个或多个应用程序专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备 (DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、刷新控制器、微刷新控制器、微处理器或其他电子元件实现,用于执行上述图4实施例所述的虚拟空间处理方法。
存储组件801被配置为存储各种类型的数据以支持在终端的操作。存储组件可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器 (ROM),磁存储器,快闪存储器,磁盘或光盘。
本申请实施例还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被计算机执行时可以实现上述图4所示实施例的虚拟空间处理方法。
在另一个可能的设计中,图9所示实施例的虚拟空间展示装置可以实现为一计算设备,实际应用程序中,如图11中所示,该计算设备可以包括存储组件901以及处理组件902;
存储组件901中存储有一条或多条计算机指令,其中,一条或多条计算机指令供处理组件902调用执行,以实现图7实施例所述的虚拟空间展示方法。
其中,处理组件902可以包括一个或多个处理器来执行计算机指令,以完成上述的方法中的全部或部分步骤。当然处理组件也可以为一个或多个应用程序专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备 (DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、刷新控制器、微刷新控制器、微处理器或其他电子元件实现,用于执行上述图7实施例所述的虚拟空间展示方法。
存储组件901被配置为存储各种类型的数据以支持在终端的操作。存储组件可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器 (ROM),磁存储器,快闪存储器,磁盘或光盘。
本申请实施例还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被计算机执行时可以实现上述图7所示实施例的虚拟空间展示方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施例可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种虚拟空间处理方法,其特征在于,包括:
获取用户端发送的搜索词;
识别所述搜索词对应的实体词,以及查找所述实体词对应的至少一个合集搜索信息;
根据所述实体词、至少一个所述合集搜索信息中的搜索规则,召回多个虚拟空间,以构成至少一个虚拟空间合集;
将获取的至少一个虚拟空间合集的提示信息发送至用户端。
2.根据权利要求1所述的方法,其特征在于,还包括:
基于实时用户观看行为以及获取的虚拟空间合集的排列顺序,确定出每个虚拟空间合集在用户端的显示界面的展现位置,并将所述展现位置发送至用户端,所述展现位置用于指示用户端通过所述展现位置,展示至少一个虚拟空间合集的提示信息。
3.根据权利要求1所述的方法,其特征在于,所述根据所述实体词、至少一个所述合集搜索信息中的搜索规则,召回多个虚拟空间,以构成至少一个虚拟空间合集,包括:
根据所述实体词、至少一个所述合集搜索信息中的搜索规则以及至少一种召回策略,召回多个虚拟空间,以构成至少一个虚拟空间合集。
4.根据权利要求3所述的方法,其特征在于,还包括:
基于用户端发送的合集标识,确定所述合集标识对应的虚拟空间合集;
根据每个虚拟空间与所述实体词的相关程度以及每个所述虚拟空间的实时用户反馈行为,对所述虚拟空间合集中的多个虚拟空间进行排序,确定出所述虚拟空间合集中多个虚拟空间的排列顺序,并将所述排列顺序发送至用户端,所述排列顺序用于指示用户端按照所述虚拟空间合集中多个虚拟空间的排列顺序,展示排序后的所述多个虚拟空间的空间信息。
5.根据权利要求3所述的方法,其特征在于,所述根据所述实体词、至少一个所述合集搜索信息中的搜索规则以及至少一种召回策略,召回多个虚拟空间,以构成至少一个虚拟空间合集,包括:
在每个所述合集搜索信息中的搜索规则对应的多个虚拟空间内,召回包含所述实体词的第一用户账号信息、虚拟空间标题、音视频理解标签的虚拟空间,以构成至少一个虚拟空间合集;或者,
在每个所述合集搜索信息中的搜索规则对应的多个虚拟空间内,对所述实体词与所述多个虚拟空间中每个虚拟空间的第一用户账号向量化,通过近似最近邻查找算法,计算每个第一用户账号与所述实体词之间的距离,并将距离小于预设值的第一用户账号对应的虚拟空间作为召回的虚拟空间,以构成至少一个虚拟空间合集;或者,
在每个所述合集搜索信息中的搜索规则对应的多个虚拟空间内,对所述实体词与所述多个虚拟空间中每个虚拟空间的显示画面向量化,通过近似最近邻查找算法,计算每个显示画面与所述实体词之间的距离,并将距离小于预设值的显示画面对应的虚拟空间召回的虚拟空间,以构成至少一个虚拟空间合集。
6.根据权利要求4所述的方法,其特征在于,所述实时用户反馈行为包括点击次数及播放次数;
所述根据每个虚拟空间与所述实体词的相关程度以及每个所述虚拟空间的实时用户反馈行为,对所述虚拟空间合集中的多个虚拟空间进行排序,确定出所述虚拟空间合集中多个虚拟空间的排列顺序,包括:
采集每个所述虚拟空间的特征信息,并根据所述特征信息、所述实体词以及标记结果的对应关系,确定出所述虚拟空间的标记结果,所述标记结果包括相关或不相关;
根据所述标记结果为相关的虚拟空间的特征信息以及每个特性信息对应的权重,计算出所述标记结果为相关的虚拟空间与所述实体词的相关值;
基于所述点击次数与所述播放次数之间的比值,计算出所述虚拟空间的分数;
基于所述标记结果为相关的虚拟空间与所述实体词的相关值以及每个所述虚拟空间的分数,对多个虚拟空间进行排序,确定出所述虚拟空间合集中多个虚拟空间的排列顺序。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述搜索规则包括搜索所述实体词对应的虚拟空间合集的规则。
8.一种虚拟空间展示方法,其特征在于,包括:
响应搜索界面的输入操作,确定输入的搜索词;
将搜索词发送至服务端;
接收至少一个虚拟空间合集的提示信息,所述提示信息为所述服务端通过所述搜索词召回多个虚拟空间,以构成至少一个虚拟空间合集而得到的提示信息;
在显示界面上显示所述至少一个虚拟空间合集的提示信息。
9.一种电子设备,其特征在于,包括处理组件以及存储组件;所述存储组件存储一个或多个计算机指令;所述一个或多个计算机指令用以被所述处理组件调用执行,实现如权利要求1-7任一项所述的虚拟空间处理方法、权利要求8所述的虚拟空间展示方法。
10.一种计算机存储介质,其特征在于,存储有计算机程序,所述计算程序被计算机执行时,实现如权利要求1-7任一项所述的虚拟空间处理方法、权利要求8所述的虚拟空间展示方法。
CN202111600005.4A 2021-12-24 2021-12-24 虚拟空间处理方法、装置、电子设备及计算机存储介质 Pending CN114707502A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111600005.4A CN114707502A (zh) 2021-12-24 2021-12-24 虚拟空间处理方法、装置、电子设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111600005.4A CN114707502A (zh) 2021-12-24 2021-12-24 虚拟空间处理方法、装置、电子设备及计算机存储介质

Publications (1)

Publication Number Publication Date
CN114707502A true CN114707502A (zh) 2022-07-05

Family

ID=82167684

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111600005.4A Pending CN114707502A (zh) 2021-12-24 2021-12-24 虚拟空间处理方法、装置、电子设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN114707502A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115002501A (zh) * 2022-07-28 2022-09-02 北京达佳互联信息技术有限公司 信息展示方法、装置、电子设备、存储介质
CN116095053A (zh) * 2023-04-12 2023-05-09 广州此声网络科技有限公司 虚拟空间麦位资源处理方法、装置、计算机设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115002501A (zh) * 2022-07-28 2022-09-02 北京达佳互联信息技术有限公司 信息展示方法、装置、电子设备、存储介质
CN115002501B (zh) * 2022-07-28 2022-12-27 北京达佳互联信息技术有限公司 信息展示方法、装置、电子设备、存储介质
CN116095053A (zh) * 2023-04-12 2023-05-09 广州此声网络科技有限公司 虚拟空间麦位资源处理方法、装置、计算机设备
CN116095053B (zh) * 2023-04-12 2023-06-27 广州此声网络科技有限公司 虚拟空间麦位资源处理方法、装置、计算机设备

Similar Documents

Publication Publication Date Title
CN111143610B (zh) 一种内容推荐方法、装置、电子设备和存储介质
CN111680189B (zh) 影视剧内容检索方法和装置
CN111708941A (zh) 内容推荐方法、装置、计算机设备和存储介质
CN111046225B (zh) 音频资源处理方法、装置、设备及存储介质
CN114095749B (zh) 推荐及直播界面展示方法、计算机存储介质、程序产品
CN114707502A (zh) 虚拟空间处理方法、装置、电子设备及计算机存储介质
CN113746874B (zh) 一种语音包推荐方法、装置、设备及存储介质
CN113779381B (zh) 资源推荐方法、装置、电子设备和存储介质
CN114339285B (zh) 知识点的处理方法、视频处理方法、装置及电子设备
CN110166811A (zh) 弹幕信息的处理方法、装置及设备
CN112163560A (zh) 一种视频信息处理方法、装置、电子设备及存储介质
CN112040339A (zh) 一种视频数据的制作方法、装置、计算机设备和存储介质
CN111597446A (zh) 基于人工智能的内容推送方法、装置、服务器和存储介质
CN111432282A (zh) 一种视频推荐方法及装置
CN112749328B (zh) 搜索方法、装置和计算机设备
CN114363714B (zh) 标题生成方法、设备及存储介质
CN114845149B (zh) 视频片段的剪辑方法、视频推荐方法、装置、设备及介质
CN111813236B (zh) 输入方法、装置、电子设备及可读存储介质
CN111970525B (zh) 直播间搜索方法、装置、服务器及存储介质
CN111104583A (zh) 一种直播间推荐方法、存储介质、电子设备及系统
CN109800326B (zh) 一种视频处理方法、装置、设备和存储介质
CN111223014B (zh) 一种从大量细分教学内容在线生成细分场景教学课程的方法和系统
CN114398514B (zh) 一种视频展示方法、装置及电子设备
CN113688260A (zh) 视频推荐方法和装置
US11269940B1 (en) Related content searching

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination