CN111597469A - 展示位置的确定方法、确定装置、电子设备及存储介质 - Google Patents

展示位置的确定方法、确定装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111597469A
CN111597469A CN202010423678.6A CN202010423678A CN111597469A CN 111597469 A CN111597469 A CN 111597469A CN 202010423678 A CN202010423678 A CN 202010423678A CN 111597469 A CN111597469 A CN 111597469A
Authority
CN
China
Prior art keywords
media content
search information
information
target search
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010423678.6A
Other languages
English (en)
Other versions
CN111597469B (zh
Inventor
彭宗徽
张永华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Douyin Vision Co Ltd
Douyin Vision Beijing Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN202010423678.6A priority Critical patent/CN111597469B/zh
Publication of CN111597469A publication Critical patent/CN111597469A/zh
Application granted granted Critical
Publication of CN111597469B publication Critical patent/CN111597469B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种展示位置的确定方法、确定装置、电子设备及存储介质,其中,该方法包括:针对与目标搜索信息关联的每个媒体内容,获取表征该媒体内容与所述目标搜索信息相关度的多种特征信息,所述多种特征信息包括宽度模型输入特征、深度模型输入特征、以及深度模型和宽度模型之间的交互特征;基于所述宽度模型输入特征、所述深度模型输入特征、以及所述深度模型和宽度模型之间的交互特征,确定该媒体内容与所述目标搜索信息之间的相关度;基于每个媒体内容与所述目标搜索信息之间的相关度,确定该媒体内容在当前基于所述目标搜索信息进行搜索时对应的展示位置。本公开实施例提高了推荐的媒体内容在客户端的展示位置的准确度。

Description

展示位置的确定方法、确定装置、电子设备及存储介质
技术领域
本公开涉及计算机技术领域,具体而言,涉及一种展示位置的确定方法、确定装置、电子设备及存储介质。
背景技术
随着互联网技术的发展,媒体客户端每天均会推送大量不同类型的文章供用户观看,比如人物传记类、旅行类、美食类等。用户可以在媒体客户端的输入框输入目标搜索信息,来查找想要观看的媒体内容。
服务器在接收到目标搜索信息后,因召回的媒体内容数量较多,在向客户端推送时,一般按照一定的展示顺序在客户端进行展示,因此媒体内容的排列顺序将直接影响到用户体验度。
相关技术中的媒体内容排序方式较为机械和简单,准确度较低,提供给用户的排序靠前的媒体内容可能并不包含用户感兴趣的文章,无法满足用户的真实需求。
发明内容
本公开实施例至少提供一种展示位置的确定方案,以提高推荐信息展示位置的准确度。
第一方面,本公开实施例提供了一种展示位置的确定方法,包括:
针对与目标搜索信息关联的每个媒体内容,获取表征该媒体内容与所述目标搜索信息相关度的多种特征信息,所述多种特征信息包括宽度模型输入特征、深度模型输入特征、以及深度模型和宽度模型之间的交互特征;
基于所述宽度模型输入特征、所述深度模型输入特征、以及所述深度模型和宽度模型之间的交互特征,确定该媒体内容与所述目标搜索信息之间的相关度;
基于每个媒体内容与所述目标搜索信息之间的相关度,确定当前在基于所述目标搜索信息进行搜索时该媒体内容对应的展示位置。
在一种可能的实施方式中,按照以下方式获取所述多种特征信息中的所述宽度模型输入特征:
提取该媒体内容在设定时长内对应的点击次数以及该媒体内容的发布时间与当前时间的时间间隔;
确定所述目标搜索信息包含的第一文本信息对应的第一文字个数、该媒体内容在预先设置的多种维度下的第二文本信息对应的第二文字个数,以及所述第一文本信息与各个所述第二文本信息相同的第三文字个数;
基于所述第一文本信息,确定分类信息,所述分类信息中包含所述目标搜索信息与不同维度下的素材内容的匹配度;
将所述第一文字个数、各个所述第二文字个数、各个所述第三文字个数、所述分类信息、该媒体内容在设定时长内对应的点击次数以及该媒体内容的发布时间与当前时间的时间间隔,作为所述宽度模型输入特征。
在一种可能的实施方式中,按照以下方式获取所述多种特征信息中的所述深度模型输入特征:
基于所述目标搜索信息包含的第一文本信息的各个词单元确定所述目标搜索信息对应的语句特征,以及基于所述媒体内容在预先设置的多种维度下分别对应的各个第二文本信息的各个词单元,确定该媒体内容在预先设置的各种维度下分别对应的语句特征;
对所述目标搜索信息对应的语句特征以及该媒体内容在预先设置的多种维度下分别对应的语句特征进行拼接,得到所述深度模型输入特征。
在一种可能的实施方式中,按照以下方式获取所述深度模型和宽度模型之间的交互特征:
基于所述目标搜索信息包含的第一文本信息,确定分类信息,所述分类信息中包含所述目标搜索信息与不同维度下的素材内容的匹配度;
基于所述第一文本信息对应的各个词单元,以及所述媒体内容在预先设置的多种维度下分别对应的各个第二文本信息的词单元,确定所述目标搜索信息对应的词特征,以及该媒体内容在预先设置的各种维度下分别对应的词特征;
基于所述目标搜索信息对应的词特征、该媒体内容在预先设置的各种维度下分别对应的词特征以及所述分类信息,确定所述深度模型和宽度模型之间的交互特征。
在一种可能的实施方式中,所述分类信息包含在多个维度下的分值构成的分值序列,所述基于所述目标搜索信息对应的词特征、该媒体内容在预先设置的各种维度下分别对应的词特征以及所述分类信息,确定所述深度模型和宽度模型之间的交互特征,包括:
基于所述目标搜索信息对应的词特征、该媒体内容在预先设置的各种维度下分别对应的词特征,确定所述目标搜索信息与该媒体内容在预先设置的各种维度下分别对应的余弦相似度;
基于所述目标搜索信息与该媒体内容在预先设置的各种维度下分别对应的余弦相似度以及对应维度的分值,确定所述目标搜索信息与该媒体内容在预先设置的各种维度下的交互特征;
对所述目标搜索信息与该媒体内容在预先设置的各种维度下的交互特征求和,得到所述深度模型和宽度模型之间的交互特征。
在一种可能的实施方式中,所述基于所述宽度模型输入特征、所述深度模型输入特征、以及所述深度模型和宽度模型之间的交互特征,确定该媒体内容与所述目标搜索信息之间的相关度,包括:
将所述宽度模型输入特征、所述深度模型输入特征、以及所述深度模型和宽度模型之间的交互特征输入预先训练的神经网络,得到所述媒体内容与所述目标搜索信息之间的相关度。
在一种可能的实施方式中,在基于每个媒体内容与所述目标搜索信息之间的相关度,确定当前在基于所述目标搜索信息进行搜索时该媒体内容对应的展示位置之前,所述确定方法还包括:
获取预先确定的每个媒体内容对应的点击率、发布该媒体内容的客户端所属类别对应的分值以及该媒体内容的发布时间与当前时间的时间间隔;
所述基于每个媒体内容与所述目标搜索信息之间的相关度,确定当前在基于所述目标搜索信息进行搜索时该媒体内容对应的展示位置,包括:
对每个媒体内容对应的点击率、该媒体内容与所述目标搜索信息之间的相关度、发布该媒体内容的客户端所属类别对应的分值以及该媒体内容的发布时间与当前时间的时间间隔进行加权求和,确定每个媒体内容对应的排序分值;
基于每个媒体内容对应的排序分值,确定当前在基于所述目标搜索信息进行搜索时该媒体内容对应的展示位置。
在一种可能的实施方式中,在确定当前在基于所述目标搜索信息进行搜索时该媒体内容对应的展示位置后,所述确定方法还包括:
在接收到客户端发送的搜索请求时,获取所述搜索请求中包含的搜索信息;
基于所述搜索信息确定与所述搜索信息对应的目标搜索信息,并提取与所述目标搜索信息关联的多个媒体内容以及所述多个媒体内容各自对应的展示位置;
将所述多个媒体内容以及所述多个媒体内容各自对应的展示位置发送至客户端。
第二方面,本公开实施例提供了一种展示位置的确定装置,包括:
特征确定模块,用于针对与目标搜索信息关联的每个媒体内容,获取表征该媒体内容与所述目标搜索信息相关度的多种特征信息,所述多种特征信息包括宽度模型输入特征、深度模型输入特征、以及深度模型和宽度模型之间的交互特征;
相关度确定模块,用于基于所述宽度模型输入特征、所述深度模型输入特征、以及所述深度模型和宽度模型之间的交互特征,确定该媒体内容与所述目标搜索信息之间的相关度;
展示位置确定模块,用于基于每个媒体内容与所述目标搜索信息之间的相关度,确定当前在基于所述目标搜索信息进行搜索时该媒体内容对应的展示位置。
在一种可能的实施方式中,所述特征获取模块按照以下方式获取所述多种特征信息中的所述宽度模型输入特征:
提取该媒体内容在设定时长内对应的点击次数以及该媒体内容的发布时间与当前时间的时间间隔;
确定所述目标搜索信息包含的第一文本信息对应的第一文字个数、该媒体内容在预先设置的多种维度下的第二文本信息对应的第二文字个数,以及所述第一文本信息与各个所述第二文本信息相同的第三文字个数;
基于所述第一文本信息,确定分类信息,所述分类信息中包含所述目标搜索信息与不同维度下的素材内容的匹配度;
将所述第一文字个数、各个所述第二文字个数、各个所述第三文字个数、所述分类信息、该媒体内容在设定时长内对应的点击次数以及该媒体内容的发布时间与当前时间的时间间隔,作为所述宽度模型输入特征。
在一种可能的实施方式中,所述特征获取模块按照以下方式获取所述多种特征信息中的所述深度模型输入特征:
基于所述目标搜索信息包含的第一文本信息的各个词单元确定所述目标搜索信息对应的语句特征,以及基于所述媒体内容在预先设置的多种维度下分别对应的各个第二文本信息的各个词单元,确定该媒体内容在预先设置的各种维度下分别对应的语句特征;
对所述目标搜索信息对应的语句特征以及该媒体内容在预先设置的多种维度下分别对应的语句特征进行拼接,得到所述深度模型输入特征。
在一种可能的实施方式中,所述特征获取模块按照以下方式获取所述深度模型和宽度模型之间的交互特征:
基于所述目标搜索信息包含的第一文本信息,确定分类信息,所述分类信息中包含所述目标搜索信息与不同维度下的素材内容的匹配度;
基于所述第一文本信息对应的各个词单元,以及所述媒体内容在预先设置的多种维度下分别对应的各个第二文本信息的词单元,确定所述目标搜索信息对应的词特征,以及该媒体内容在预先设置的各种维度下分别对应的词特征;
基于所述目标搜索信息对应的词特征、该媒体内容在预先设置的各种维度下分别对应的词特征以及所述分类信息,确定所述深度模型和宽度模型之间的交互特征。
在一种可能的实施方式中,所述分类信息包含在多个维度下的分值构成的分值序列,所述特征获取模块在用于基于所述目标搜索信息对应的词特征、该媒体内容在预先设置的各种维度下分别对应的词特征以及所述分类信息,确定所述深度模型和宽度模型之间的交互特征时,包括:
基于所述目标搜索信息对应的词特征、该媒体内容在预先设置的各种维度下分别对应的词特征,确定所述目标搜索信息与该媒体内容在预先设置的各种维度下分别对应的余弦相似度;
基于所述目标搜索信息与该媒体内容在预先设置的各种维度下分别对应的余弦相似度以及对应维度的分值,确定所述目标搜索信息与该媒体内容在预先设置的各种维度下的交互特征;
对所述目标搜索信息与该媒体内容在预先设置的各种维度下的交互特征求和,得到所述深度模型和宽度模型之间的交互特征。
在一种可能的实施方式中,所述相关度确定模块在用于基于所述宽度模型输入特征、所述深度模型输入特征、以及所述深度模型和宽度模型之间的交互特征,确定该媒体内容与所述目标搜索信息之间的相关度时,包括:
将所述宽度模型输入特征、所述深度模型输入特征、以及所述深度模型和宽度模型之间的交互特征输入预先训练的神经网络,得到所述媒体内容与所述目标搜索信息之间的相关度。
在一种可能的实施方式中,在基于每个媒体内容与所述目标搜索信息之间的相关度,确定当前在基于所述目标搜索信息进行搜索时该媒体内容对应的展示位置之前,所述展示位置确定模块还用于:
获取预先确定的每个媒体内容对应的点击率、发布该媒体内容的客户端所属类别对应的分值以及该媒体内容的发布时间与当前时间的时间间隔;
所述展示位置确定模块在用于基于每个媒体内容与所述目标搜索信息之间的相关度,确定当前在基于所述目标搜索信息进行搜索时该媒体内容对应的展示位置时,包括:
对每个媒体内容对应的点击率、该媒体内容与所述目标搜索信息之间的相关度、发布该媒体内容的客户端所属类别对应的分值以及该媒体内容的发布时间与当前时间的时间间隔进行加权求和,确定每个媒体内容对应的排序分值;
基于每个媒体内容对应的排序分值,确定当前在基于所述目标搜索信息进行搜索时该媒体内容对应的当前展示位置。
在一种可能的实施方式中,所述确定装置还包括交互模块,在确定当前在基于所述目标搜索信息进行搜索时该媒体内容对应的展示位置后,所述交互模块用于:
在接收到客户端发送的搜索请求时,获取所述搜索请求中包含的搜索信息;
基于所述搜索信息确定与所述搜索信息对应的目标搜索信息,并提取与所述目标搜索信息关联的多个媒体内容以及所述多个媒体内容各自对应的展示位置;
将所述多个媒体内容以及所述多个媒体内容各自对应的展示位置发送至客户端。
第三方面,本公开实施例提供了一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如第一方面所述的确定方法的步骤。
第四方面,本公开实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如第一方面所述的确定方法的步骤。
本公开实施例提供的展示位置的确定方法,针对于目标搜索信息关联的每个媒体内容,这里可以获取表征该媒体内容与目标搜索信息相关度的多种特征信息,然后通过多种特征信息来共同确定该媒体内容与目标搜索信息之间的相关度,这样通过从多方面因素来共同确定每个媒体内容与目标搜索信息的相关度时,能够准确得到该媒体内容与目标搜索信息之间的相关度,从而在基于该相关度,能够提高推荐的媒体内容在客户端的展示位置的准确度。
为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本公开实施例所提供的一种展示位置的确定方法的流程图;
图2示出了本公开实施例所提供的一种确定宽度模型输入特征的具体方法的流程图;
图3示出了本公开实施例所提供的一种确定深度模型输入特征的具体方法的流程图;
图4示出了本公开实施例所提供的一种确定宽度模型和输入模型之间的交互特征的具体方法的流程图;
图5示出了本公开实施例所提供的一种展示位置的确定装置的结构示意图;
图6示出了本公开实施例所提供的一种电子设备的示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
针对一些媒体客户端,可以向用户提供大量题材的媒体内容供用户观看,当用户产生搜索需求时,也可以在该媒体内容中基于输入的目标搜索信息进行搜索,比如用户想要观看与“北京南锣鼓巷风景”的相关视频,则可以在媒体客户端中输入“北京南锣鼓巷风景”的目标搜索信息,这样,服务器在接收到目标搜索信息时,即可以在媒体库中查找与该目标搜索信息关联的媒体内容,比如搜索媒体内容中包含“北京”、“南锣鼓巷”、“风景”、“北京南锣鼓巷风景”的媒体内容,这样可能得到大量的媒体内容,在向媒体客户端返回推荐的媒体内容时,将比较符合用户需求的媒体内容展示在靠前的位置,如何能找到适合在靠前的位置展示的媒体内容,即如何提高推荐的准确度,为本公开实施例要研究的问题。
基于上述研究,本公开提供了一种展示位置的确定方法,针对于目标搜索信息关联的每个媒体内容,这里可以获取表征该媒体内容与目标搜索信息相关度的多种特征信息,然后通过多种特征信息来共同确定该媒体内容与目标搜索信息之间的相关度,这样通过从多方面因素来共同确定每个媒体内容与目标搜索信息的相关度时,能够准确得到该媒体内容与目标搜索信息之间的相关度,从而在基于该相关度,能够提高推荐的媒体内容在客户端的展示位置的准确度。
为便于对本实施例进行理解,首先对本公开实施例所公开的一种展示位置的确定方法进行详细介绍,本公开实施例所提供的展示位置的确定方法的执行主体一般为具有一定计算能力的计算机设备,该计算机设备可以为客户端对应的服务器。在一些可能的实现方式中,该展示位置的确定方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
下面以执行主体为服务器为例对本公开实施例提供的展示位置的确定方法加以说明。
参见图1所示,为本公开实施例提供的展示位置的确定方法的流程图,方法包括步骤S101~S103,具体如下:
S101,针对与目标搜索信息关联的每个媒体内容,获取表征该媒体内容与目标搜索信息相关度的多种特征信息,多种特征信息包括宽度模型输入特征、深度模型输入特征、以及深度模型和宽度模型之间的交互特征。
服务器可以存储大量的搜索信息,比如将历史阶段内,大量客户端输入的搜索信息中,频率较高的搜索信息作为这里的目标搜索信息,目标搜索信息关联的媒体内容可以为包含目标搜索信息的关键词的媒体内容,针对每个目标搜索信息,可以按照本公开实施例提出的方式,确定每个目标搜索信息关联的媒体内容在以该目标搜索信息进行搜索时,该媒体内容对应的展示位置。
这里基于目标搜索信息查找关联的媒体内容时,可以是按照预先设置的多种维度召回的媒体内容,比如在得到目标搜索信息的关键词后,可以按照媒体内容具有包含该关键词的媒体标题、媒体内容具有包含该关键词的音乐内容、或者媒体内容具有包含该关键词的用户名等方式召回关联的媒体内容等,这样,这里的维度即可以包括媒体标题维度、音乐内容维度、用户名维度等,这里引入的维度将在后文进行进一步介绍。
这里宽度模型输入特征是指在基于宽度模型确定每个媒体内容与目标搜索信息之间的相关度时,该宽度模型的输入特征,针对宽度模型的解释如下:
宽度模型是一种记忆力较佳的模型,在训练过程中,可以基于一些离散的特征进行训练,比如训练用于确定搜索信息与每个关联的媒体内容的相关度的宽度模型时,这里的离散特征可以是搜索信息的离散特征,比如搜索信息中的文本信息包含的字数,媒体内容中的文本信息包含的字数、搜索信息中的文本信息与媒体内容中的文本信息相同的字数等,具体将在后文进行介绍。
深度模型输入特征指在基于深度模型确定每个媒体内容与目标搜索信息之间的相关度时,该深度模型的输入特征,针对深度模型的解释如下:
深度模型是一种泛化能力较强的模型,能够对输入特征进行深度运算,在训练过程中,可以基于语句特征来进行训练,比如训练用于确定搜索信息与每个关联的媒体内容的相关度的宽度模型时,这里的语句特征可以通过是搜索信息对应的语句特征与媒体内容对应的语句特征,具体将在后文进行介绍。
当将深度模型和宽度模型进行结合,得到一种用于新的神经网络时,该宽度和深度模型的输入特征并非简单地将宽度模块输入特征以及深度模型输入特征作为这里的新的神经网络的输入特征,而是考虑再增加深度模型和宽度模型之间的交互特征,从而考虑深度模型和宽度模型在交互使用时,相互之间的关系,这样能够更全面地考虑目标搜索信息和与该目标搜索信息关联的媒体内容之间的相互关系,从而得到更加准确的相关度,深度模型和宽度模型之间的交互特征将在后文进行具体介绍。
S102,基于宽度模型输入特征、深度模型输入特征、以及深度模型和宽度模型之间的交互特征,确定该媒体内容与目标搜索信息之间的相关度。
这里即得到宽度模型输入特征、深度模型输入特征以及深度模型和宽度模型之间的交互特征后,将这些特征作为新的输入特征,输入预先训练的神经网络中,即可以得到该媒体内容与目标搜索信息之间的相关度。
S103,基于每个媒体内容与目标搜索信息之间的相关度,确定当前在基于目标搜索信息进行搜索时该媒体内容对应的展示位置。
在得到该媒体内容与该目标搜索信息的相关度后,即可以将该相关度作为确定当前在基于目标搜索信息进行搜索时,该媒体内容对应的当前展示位置的一种参考因素,当然,当前在基于目标搜索信息进行搜索时,每个媒体内容对应的当前展示位置还可以与其它因素相关,针对此将在后文进行详细阐述。
以上是针对S101~S103提出的展示位置的确定方法,针对于目标搜索信息关联的每个媒体内容,这里可以获取表征该媒体内容与目标搜索信息相关度的多种特征信息,然后通过多种特征信息来共同确定该媒体内容与目标搜索信息之间的相关度,这样通过从多方面因素来共同确定每个媒体内容与目标搜索信息的相关度时,能够准确得到该媒体内容与目标搜索信息之间的相关度,从而在基于该相关度,能够提高推荐的媒体内容在客户端的展示位置的准确度。
下面将结合具体实施例,对上述S101~S103进行具体阐述:
针对S101,如图2所示,具体按照以下方式获取多种特征信息中的宽度模型输入特征,包括S201~S204:
S201,提取该媒体内容在设定时长内对应的点击次数以及该媒体内容的发布时间与当前时间的时间间隔。
这里媒体内容在设定时长内对应的点击次数可以反映该媒体内容在一定时间段内的热度,点击次数高,即被客户端的用户查看的次数就多,即该媒体内容的热度就高。
该媒体内容的发布时间与当前时间的时间间隔可以用于体现该媒体内容的新鲜度,比如距离当前时间的时间间隔较长的媒体内容的新鲜度较低,距离当前时间的时间间隔较短的媒体内容的新鲜度较高。
S202,确定目标搜索信息包含的第一文本信息对应的第一文字个数、该媒体内容在预先设置的多种维度下的第二文本信息对应的第二文字个数,以及第一文本信息与各个第二文本信息相同的第三文字个数。
这里目标搜索信息包含的第一文本信息是指目标搜索信息对应的文字内容,比如上文提到的当搜索信息为“北京南锣鼓巷风景”时,则这里目标搜索信息包含的第一文本信息即为“北京南锣鼓巷风景”,该第一文字个数即目标搜索信息的第一文本信息中包含的文字个数,比如“北京南锣鼓巷风景”对应的第一文字个数为8。
这里预先设置的多种维度以包括媒体标题维度、音乐内容维度、用户名维度为例进行说明,当然不仅限于这三种维度,这样与目标搜索信息关联的媒体内容是按照这三种维度召回的,在召回后,得到与该目标搜索信息关联的大量媒体内容,针对每个媒体内容,这里可以确定该媒体内容在媒体标题维度、音乐内容维度、用户名维度下的第二文本信息对应的第二文字个数,即分别确定该媒体内容的媒体标题包含的文字个数、音乐内容包含的文字个数以及用户名包含的文字个数。
针对目标搜索信息和与该目标搜索信息关联的任一媒体内容,这里第一文本信息与各个第二文本信息相同的第三文字个数,是指该目标搜索信息与该任一媒体内容的媒体标题相同的文字个数、与该任一媒体内容的音乐内容相同的文字个数、以及与该任一媒体内容的用户名相同的文字个数。
S203,基于第一文本信息,确定分类信息,分类信息中包含目标搜索信息与不同维度下的素材内容的匹配度。
这里的分类信息包含在多个维度下的分值构成的分值序列,每个维度对应的分值可以表示目标搜索信息与该维度下的素材内容的匹配度,用于表示该目标搜索信息更倾向于搜索哪种维度下的媒体内容,若以上述三种维度为例,则这里可以基于该分类信息,确定出当客户端基于该目标搜索信息进行搜索时,更倾向搜索媒体标题与该目标搜索信息匹配的媒体内容、还是更倾向音乐内容与该目标搜索信息匹配的媒体内容、或者更倾向搜索用户名与该目标搜索信息匹配的媒体内容。
比如,该分类信息包含与三个维度对应的分值序列,第一个维度表示媒体标题维度、第二个维度表示音乐内容维度、第三个维度表示用户名维度,若该分类信息为(0.7,0.1,0.2),这里因为第一个维度对应的分值最高,则说明当客户端基于该目标搜索信息进行搜索时,更倾向搜索媒体标题与该目标搜索信息匹配的媒体内容。
具体地,这里的分类信息的确定方式可以通过预先训练的注意力模型来实现,比如可以通过大量的样本目标搜索信息以及该目标样本搜索信息对应的维度统计结果来进行训练,具体过程在此不再进行赘述。
S204,将第一文字个数、各个第二文字个数、各个第三文字个数、分类信息、该媒体内容在设定时长内对应的点击次数以及该媒体内容的发布时间与当前时间的时间间隔,作为宽度模型输入特征。
然后将上述得到的第一文字个数、各个第二文字个数、各个第三文字个数、分类信息、该媒体内容在设定时长内对应的点击次数以及该媒体内容的发布时间与当前时间的时间间隔,即可以作为这里的宽度模型输入特征。
如图3所示,可以按照以下方式获取多种特征信息中的深度模型输入特征,具体包括以下S301~S302:
S301,基于目标搜索信息包含的第一文本信息的各个词单元确定目标搜索信息对应的语句特征,以及基于媒体内容在预先设置的多种维度下分别对应的各个第二文本信息的各个词单元,确定该媒体内容在预先设置的各种维度下分别对应的语句特征。
这里第一文本信息、各个第二文本信息在上文进行过介绍,在此不再进对此进行介绍,针对第一文本信息,这里会先进行分词,得到第一文本信息中包含的词单元,同样,对各个第二文本信息进行分词,得到各个第二文本信息包含的各个词单元。
在得到第一文本信息包含的各个词单元后,可以按照预先训练的词向量模型,将每个词单元转换为词向量,同样,将各个第二文本信息包含的各个词单元转换为词向量,这样,将第一文本信息包含的各个词向量即可以得到该第一文本信息对应的语句向量,即这里目标搜索信息对应的语句特征,同理,可以得到各个第二文本信息对应的语句向量,即该媒体内容在预先设置的各种维度下分别对应的语句特征。
S302,对目标搜索信息对应的语句特征以及该媒体内容在预先设置的多种维度下分别对应的语句特征进行拼接,得到深度模型输入特征。
这里对目标搜索信息对应的语句特征以及该媒体内容在预先设置的多种维度下分别对应的语句特征进行拼接,实质上是对语句向量的拼接,比如,目标搜索信息对应的语句向量为50维度的向量,该媒体内容在预先设置的三种维度下分别对应的语句向量均为50维度的向量,则拼接后的深度模型输入特征为200维度的向量。
如图4所示,可以按照以下方式获取深度模型和宽度模型之间的交互特征,具体包括以下S401~S404:
S401,基于目标搜索信息包含的第一文本信息,确定分类信息,分类信息中包含目标搜索信息与不同维度下的素材内容的匹配度。
这里的分类信息在上文进行过介绍,在此不再进行赘述。
S402,基于第一文本信息对应的各个词单元,以及媒体内容在预先设置的多种维度下分别对应的各个第二文本信息的词单元,确定目标搜索信息对应的词特征,以及该媒体内容在预先设置的各种维度下分别对应的词特征。
这里的解释详见上文,在此不再赘述。
S403,基于目标搜索信息对应的词特征、该媒体内容在预先设置的各种维度下分别对应的词特征以及分类信息,确定深度模型和宽度模型之间的交互特征。
具体地,分类信息包含在多个维度下的分值构成的分值序列,在基于目标搜索信息对应的词特征、该媒体内容在预先设置的各种维度下分别对应的词特征以及分类信息,确定深度模型和宽度模型之间的交互特征时,可以包括以下(1)~(3):
(1)基于目标搜索信息对应的词特征、该媒体内容在预先设置的各种维度下分别对应的词特征,确定目标搜索信息与该媒体内容在预先设置的各种维度下分别对应的余弦相似度。
这里可以通过引入余弦公式,来确定目标搜索信息与该媒体内容在预先设置的各种维度下分别对应的余弦相似度。
比如,目标搜索信息包含两个词单元,即对应两个词特征,可以分为记为(W1,W2),该媒体内容在预先设置的媒体标题维度下对应的词特征同样包含两个,分别记录为(A1,A2),其中W1、W2、A1、A2分别为词向量。
这样,若媒体标题维度为各个维度中的第1个维度,则目标搜索信息与该媒体内容在预先设置的媒体标题维度下对应的余弦相似度I1,可以通过以下公式表示:
I1=cos<(W1,W2)·(A1,A2)>
=cos<W1,A2>+cos<W1,A2>+cos<W2,A1>+cos<W2,A2)
这样,当音乐内容维度为各个维度中的第2个维度,用户名维度为各个维度中的第3个维度,则按照相同的方式可以得到目标搜索信息与该媒体内容在预先设置的音乐内容维度下对应的余弦相似度I2,以及得到目标搜索信息与该媒体内容在预先设置的用户名维度下对应的余弦相似度I3
(2)基于目标搜索信息与该媒体内容在预先设置的各种维度下分别对应的余弦相似度以及对应维度的分值,确定目标搜索信息与该媒体内容在预先设置的各种维度下的交互特征。
这里对应维度的分值详见上文介绍,比如可以通过S来表示分类信息,该分类信息包含多个维度下的分值构成的分值序列,比如若预设维度为三种,可以分别为上述提到的媒体标题维度、音乐内容维度、用户名维度,则该分值序列可以包含三个分值,可以表示为S=(s1,s2,s3)。
这里可以通过将目标搜索信息与该媒体内容在预先设置的该任一维度下对应的余弦相似度与对应该任一维度的分值进行相乘,得到目标搜索信息与该媒体内容在预先设置的任一维度下的交互特征。
比如,s1·I1来表示目标搜索信息与该媒体内容在预先设置的媒体标题维度下的交互特征。
(3)对目标搜索信息与该媒体内容在预先设置的各种维度下的交互特征求和,得到深度模型和宽度模型之间的交互特征。
上述目标搜索信息在各种维度下对应的分值,可以表示目标搜索信息与不同维度下的素材内容的匹配度,可以将每个维度对应的分值作为该维度下的余弦相似度在确定深度模型和宽度模型之间的交互特征时的权重,这样,按照每个维度对应的分值,对各个维度下的余弦相似度进行加权求和,即可以得到深度模型和宽度模型之间的交互特征。
另外,针对上述S102中提出的基于宽度模型输入特征、深度模型输入特征、以及深度模型和宽度模型之间的交互特征,确定该媒体内容与目标搜索信息之间的相关度时引入的神经网络,可以按照以下方式进行训练:
(1)获取样本目标搜索信息、样本目标搜索信息关联的样本媒体内容、以及每个样本媒体内容与关联的目标搜索信息之间的标注相关度;
(2)针对与样本目标搜索信息关联的每个样本媒体内容,获取表征该样本媒体内容与样本目标搜索信息相关度的多种样本特征信息,多种样本特征信息包括宽度模型样本输入特征、深度模型样本输入特征、以及深度模型和宽度模型之间的样本交互特征;
(3)基于宽度模型样本输入特征、深度模型样本输入特征、以及深度模型和宽度模型之间的样本交互特征,预测该样本媒体内容与样本目标搜索信息之间的相关度;
(4)基于预测的该样本媒体内容与样本目标搜索信息之间的相关度,以及每个样本媒体内容与关联的目标搜索信息之间的标注相关度,对神经网络中的网络参数值进行调整,得到用于确定媒体内容与目标搜索信息之间的相关度的神经网络。
以上神经网络的训练过程与上文确定媒体内容与目标搜索信息之间的相关度的过程相似,在此不再赘述。
在一种实施例中,在执行步骤S103之前,即在基于每个媒体内容与目标搜索信息之间的相关度,确定当前在基于目标搜索信息进行搜索时该媒体内容对应的展示位置之前,本公开实施例提出的确定方法还包括:
获取预先确定的每个媒体内容对应的点击率、发布该媒体内容的客户端所属类别对应的分值以及该媒体内容的发布时间与当前时间的时间间隔。
这里每个媒体内容对应的点击率可以通过在最近设定时长内,该媒体内容的点击次数与被展示次数的比值确定,比如每天固定时间,均会统计这里每个媒体内容对应的点击率。
这里发布该媒体内容的客户端所属类别是指在预先设置的多种客户端类别中,发布该媒体内容的客户端所属的类别,比如预先可以按照客户端行为数据来对客户端进行分类,比如发布媒体内容的数量小于第一设定阈值的客户端为A类客户端,发布媒体内容的数量大于或等于第一设定阈值且小于第二设定阈值的客户端为B类客户端,发布媒体内容的数量大于或等于第二设定阈值的客户端为C类客户端,并且为每种类别的客户端均分配了对应分值,这里考虑到发布媒体内容数量较大的客户端相对于发布媒体内容数量较少的客户端所受关注度较大,而可以通过数据统计,关注度较大的客户端发布的媒体内容在客户端被展示时,用户点击的概率较高,因此若将这类媒体内容在客户端展示时的展示位置置前,更符合用户需求。
基于每个媒体内容与目标搜索信息之间的相关度,确定当前在基于目标搜索信息进行搜索时该媒体内容对应的展示位置,包括:
(1)对每个媒体内容对应的点击率、该媒体内容与目标搜索信息之间的相关度、发布该媒体内容的客户端所属类别对应的分值以及该媒体内容的发布时间与当前时间的时间间隔进行加权求和,确定每个媒体内容对应的排序分值。
具体地,这里可以提前基于数据统计,确定点击率对应的权重,相关度对应的权重、客户端所属类别的对应分值的权重以及发布时间与当前时间的时间间隔对应的权重,然后基于这些权重对每个媒体内容对应的点击率、该媒体内容与目标搜索信息之间的相关度、发布该媒体内容的客户端所属类别的对应分值、以及该媒体内容的发布时间与当前时间的时间间隔进行加权求和,从而得到每个媒体内容对应的排序分值。
(2)基于每个媒体内容对应的排序分值,确定当前在基于目标搜索信息进行搜索时该媒体内容对应的展示位置。
在得到每个媒体内容对应的排序分值后,即可以基于每个媒体内容对应的排序分值,确定当前在基于目标搜索信息进行搜索时该媒体内容对应的展示位置,然后将该展示位置进行保存。
在一种实施方式中,在确定当前在基于目标搜索信息进行搜索时该媒体内容对应的展示位置后,确定方法还包括:
(1)在接收到客户端发送的搜索请求时,获取搜索请求中包含的搜索信息。
这里搜索信息可以是指用户在客户端输入的用于搜索相关媒体内容的搜索词。
(2)基于搜索信息确定与搜索信息对应的目标搜索信息,并提取与目标搜索信息关联的多个媒体内容以及多个媒体内容各自对应的展示位置。
服务器在接收到客户端发送的搜索信息后,可以基于搜索信息中包含的关键词,以及预先存储的各个目标搜索信息中的关键词,确定与该搜索信息匹配的目标搜索信息,比如基于相似度来查找与搜索信息匹配的目标搜索信息,然后再在该目标搜索信息关联的媒体内容中,提取多个媒体内容,以及多个媒体内容各自对应的展示位置。
这里在目标搜索信息关联的媒体内容中,提取多个媒体内容时,可以考虑客户端的属性信息进行提取,具体地,客户端的属性信息可以包括客户端侧的用户的年龄、性别以及地域等,然后根据客户端的属性信息,在目标搜索信息关联的大量媒体内容中,提取与该客户端的属性信息匹配的多个媒体内容。
(3)将多个媒体内容以及多个媒体内容各自对应的展示位置发送至客户端。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
基于同一技术构思,本公开实施例中还提供了与上述确定方法对应的展示位置的确定装置,由于本公开实施例中的装置解决问题的原理与本公开实施例上述展示位置的确定方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
参照图5所示,为本公开实施例提供的一种展示位置的确定装置500的示意图,该装置包括:特征确定模块501、相关度确定模块502、展示位置确定模块503。
其中,特征确定模块501,用于针对与目标搜索信息关联的每个媒体内容,获取表征该媒体内容与目标搜索信息相关度的多种特征信息,多种特征信息包括宽度模型输入特征、深度模型输入特征、以及深度模型和宽度模型之间的交互特征;
相关度确定模块502,用于基于宽度模型输入特征、深度模型输入特征、以及深度模型和宽度模型之间的交互特征,确定该媒体内容与目标搜索信息之间的相关度;
展示位置确定模块503,用于基于每个媒体内容与目标搜索信息之间的相关度,确定当前在基于目标搜索信息进行搜索时该媒体内容对应的展示位置。
在一种可能的实施方式中,特征获取模块501按照以下方式获取多种特征信息中的宽度模型输入特征:
提取该媒体内容在设定时长内对应的点击次数以及该媒体内容的发布时间与当前时间的时间间隔;
确定目标搜索信息包含的第一文本信息对应的第一文字个数、该媒体内容在预先设置的多种维度下的第二文本信息对应的第二文字个数,以及第一文本信息与各个第二文本信息相同的第三文字个数;
基于第一文本信息,确定分类信息,分类信息中包含目标搜索信息与不同维度下的素材内容的匹配度;
将第一文字个数、各个第二文字个数、各个第三文字个数、分类信息、该媒体内容在设定时长内对应的点击次数以及该媒体内容的发布时间与当前时间的时间间隔,作为宽度模型输入特征。
在一种可能的实施方式中,特征获取模块501按照以下方式获取多种特征信息中的深度模型输入特征:
基于目标搜索信息包含的第一文本信息的各个词单元确定目标搜索信息对应的语句特征,以及基于媒体内容在预先设置的多种维度下分别对应的各个第二文本信息的各个词单元,确定该媒体内容在预先设置的各种维度下分别对应的语句特征;
对目标搜索信息对应的语句特征以及该媒体内容在预先设置的多种维度下分别对应的语句特征进行拼接,得到深度模型输入特征。
在一种可能的实施方式中,特征获取模块501按照以下方式获取深度模型和宽度模型之间的交互特征:
基于目标搜索信息包含的第一文本信息,确定分类信息,分类信息中包含目标搜索信息与不同维度下的素材内容的匹配度;
基于第一文本信息对应的各个词单元,以及媒体内容在预先设置的多种维度下分别对应的各个第二文本信息的词单元,确定目标搜索信息对应的词特征,以及该媒体内容在预先设置的各种维度下分别对应的词特征;
基于目标搜索信息对应的词特征、该媒体内容在预先设置的各种维度下分别对应的词特征以及分类信息,确定深度模型和宽度模型之间的交互特征。
在一种可能的实施方式中,分类信息包含在多个维度下的分值构成的分值序列,特征获取模块501在用于基于目标搜索信息对应的词特征、该媒体内容在预先设置的各种维度下分别对应的词特征以及分类信息,确定深度模型和宽度模型之间的交互特征时,包括:
基于目标搜索信息对应的词特征、该媒体内容在预先设置的各种维度下分别对应的词特征,确定目标搜索信息与该媒体内容在预先设置的各种维度下分别对应的余弦相似度;
基于目标搜索信息与该媒体内容在预先设置的各种维度下分别对应的余弦相似度以及对应维度的分值,确定目标搜索信息与该媒体内容在预先设置的各种维度下的交互特征;
对目标搜索信息与该媒体内容在预先设置的各种维度下的交互特征求和,得到深度模型和宽度模型之间的交互特征。
在一种可能的实施方式中,相关度确定模块502在用于基于宽度模型输入特征、深度模型输入特征、以及深度模型和宽度模型之间的交互特征,确定该媒体内容与目标搜索信息之间的相关度时,包括:
将宽度模型输入特征、深度模型输入特征、以及深度模型和宽度模型之间的交互特征输入预先训练的神经网络,得到媒体内容与目标搜索信息之间的相关度。
在一种可能的实施方式中,在基于每个媒体内容与目标搜索信息之间的相关度,确定当前在基于目标搜索信息进行搜索时该媒体内容对应的展示位置之前,展示位置确定模块503还用于:
获取预先确定的每个媒体内容对应的点击率、发布该媒体内容的客户端所属类别对应的分值以及该媒体内容的发布时间与当前时间的时间间隔;
展示位置确定模块503在用于基于每个媒体内容与目标搜索信息之间的相关度,确定当前在基于目标搜索信息进行搜索时该媒体内容对应的展示位置,包括:
对每个媒体内容对应的点击率、该媒体内容与目标搜索信息之间的相关度、发布该媒体内容的客户端所属类别对应的分值以及该媒体内容的发布时间与当前时间的时间间隔进行加权求和,确定每个媒体内容对应的排序分值;
基于每个媒体内容对应的排序分值,确定当前在基于目标搜索信息进行搜索时该媒体内容对应的当前展示位置。
在一种可能的实施方式中,确定装置还包括交互模块504,在确定当前在基于目标搜索信息进行搜索时该媒体内容对应的展示位置后,交互模块504用于:
在接收到客户端发送的搜索请求时,获取搜索请求中包含的搜索信息;
基于搜索信息确定与搜索信息对应的目标搜索信息,并提取与目标搜索信息关联的多个媒体内容以及多个媒体内容各自对应的展示位置;
将多个媒体内容以及多个媒体内容各自对应的展示位置发送至客户端。
对应于图1中的展示位置的确定方法,本公开实施例还提供了一种电子设备600,如图6所示,为本公开实施例提供的电子设备600结构示意图,包括:
处理器61、存储器62、和总线63;存储器62用于存储执行指令,包括内存621和外部存储器622;这里的内存621也称内存储器,用于暂时存放处理器61中的运算数据,以及与硬盘等外部存储器622交换的数据,处理器61通过内存621与外部存储器622进行数据交换,当所述电子设备600运行时,所述处理器61与所述存储器62之间通过总线63通信,使得处理器61执行以下指令:
针对与目标搜索信息关联的每个媒体内容,获取表征该媒体内容与目标搜索信息相关度的多种特征信息,多种特征信息包括宽度模型输入特征、深度模型输入特征、以及深度模型和宽度模型之间的交互特征;
基于宽度模型输入特征、深度模型输入特征、以及深度模型和宽度模型之间的交互特征,确定该媒体内容与目标搜索信息之间的相关度;
基于每个媒体内容与目标搜索信息之间的相关度,确定当前在基于目标搜索信息进行搜索时该媒体内容对应的展示位置。
在一种可能的实施方式中,处理器61执行的指令中,按照以下方式获取多种特征信息中的宽度模型输入特征:
提取该媒体内容在设定时长内对应的点击次数以及该媒体内容的发布时间与当前时间的时间间隔;
确定目标搜索信息包含的第一文本信息对应的第一文字个数、该媒体内容在预先设置的多种维度下的第二文本信息对应的第二文字个数,以及第一文本信息与各个第二文本信息相同的第三文字个数;
基于第一文本信息,确定分类信息,分类信息中包含目标搜索信息与不同维度下的素材内容的匹配度;
将第一文字个数、各个第二文字个数、各个第三文字个数、分类信息、该媒体内容在设定时长内对应的点击次数以及该媒体内容的发布时间与当前时间的时间间隔,作为宽度模型输入特征。
在一种可能的实施方式中,处理器61执行的指令中,按照以下方式获取多种特征信息中的深度模型输入特征:
基于目标搜索信息包含的第一文本信息的各个词单元确定目标搜索信息对应的语句特征,以及基于媒体内容在预先设置的多种维度下分别对应的各个第二文本信息的各个词单元,确定该媒体内容在预先设置的各种维度下分别对应的语句特征;
对目标搜索信息对应的语句特征以及该媒体内容在预先设置的多种维度下分别对应的语句特征进行拼接,得到深度模型输入特征。
在一种可能的实施方式中,处理器61执行的指令中,按照以下方式获取深度模型和宽度模型之间的交互特征:
基于目标搜索信息包含的第一文本信息,确定分类信息,分类信息中包含目标搜索信息与不同维度下的素材内容的匹配度;
基于第一文本信息对应的各个词单元,以及媒体内容在预先设置的多种维度下分别对应的各个第二文本信息的词单元,确定目标搜索信息对应的词特征,以及该媒体内容在预先设置的各种维度下分别对应的词特征;
基于目标搜索信息对应的词特征、该媒体内容在预先设置的各种维度下分别对应的词特征以及分类信息,确定深度模型和宽度模型之间的交互特征。
在一种可能的实施方式中,分类信息包含在多个维度下的分值构成的分值序列,处理器61执行的指令中,包括:
基于目标搜索信息对应的词特征、该媒体内容在预先设置的各种维度下分别对应的词特征,确定目标搜索信息与该媒体内容在预先设置的各种维度下分别对应的余弦相似度;
基于目标搜索信息与该媒体内容在预先设置的各种维度下分别对应的余弦相似度以及对应维度的分值,确定目标搜索信息与该媒体内容在预先设置的各种维度下的交互特征;
对目标搜索信息与该媒体内容在预先设置的各种维度下的交互特征求和,得到深度模型和宽度模型之间的交互特征。
在一种可能的实施方式中,处理器61执行的指令中,包括:
将宽度模型输入特征、深度模型输入特征、以及深度模型和宽度模型之间的交互特征输入预先训练的神经网络,得到媒体内容与目标搜索信息之间的相关度。
在一种可能的实施方式中,在基于每个媒体内容与目标搜索信息之间的相关度,确定当前在基于目标搜索信息进行搜索时该媒体内容对应的展示位置之前,处理器61执行的指令中,还包括:
获取预先确定的每个媒体内容对应的点击率、发布该媒体内容的客户端所属类别对应的分值以及该媒体内容的发布时间与当前时间的时间间隔;
在一种可能的实施方式中,处理器61执行的指令中,包括:
对每个媒体内容对应的点击率、该媒体内容与目标搜索信息之间的相关度、发布该媒体内容的客户端所属类别对应的分值以及该媒体内容的发布时间与当前时间的时间间隔进行加权求和,确定每个媒体内容对应的排序分值;
基于每个媒体内容对应的排序分值,确定当前在基于目标搜索信息进行搜索时该媒体内容对应的展示位置。
在一种可能的实施方式中,在确定当前在基于目标搜索信息进行搜索时该媒体内容对应的展示位置后,处理器61执行的指令中,还包括:
在接收到客户端发送的搜索请求时,获取搜索请求中包含的搜索信息;
基于搜索信息确定与搜索信息对应的目标搜索信息,并提取与目标搜索信息关联的多个媒体内容以及多个媒体内容各自对应的展示位置;
将多个媒体内容以及多个媒体内容各自对应的展示位置发送至客户端。
本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的展示位置的确定方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
本公开实施例所提供的展示位置的确定方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行上述方法实施例中所述的展示位置的确定方法的步骤,具体可参见上述方法实施例,在此不再赘述。
本公开实施例还提供一种计算机程序,该计算机程序被处理器执行时实现前述实施例的任意一种方法。该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software DevelopmentKit,SDK)等等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。

Claims (11)

1.一种展示位置的确定方法,其特征在于,包括:
针对与目标搜索信息关联的每个媒体内容,获取表征该媒体内容与所述目标搜索信息相关度的多种特征信息,所述多种特征信息包括宽度模型输入特征、深度模型输入特征、以及深度模型和宽度模型之间的交互特征;
基于所述宽度模型输入特征、所述深度模型输入特征、以及所述深度模型和宽度模型之间的交互特征,确定该媒体内容与所述目标搜索信息之间的相关度;
基于每个媒体内容与所述目标搜索信息之间的相关度,确定当前在基于所述目标搜索信息进行搜索时该媒体内容对应的展示位置。
2.根据权利要求1所述的确定方法,其特征在于,按照以下方式获取所述多种特征信息中的所述宽度模型输入特征:
提取该媒体内容在设定时长内对应的点击次数以及该媒体内容的发布时间与当前时间的时间间隔;
确定所述目标搜索信息包含的第一文本信息对应的第一文字个数、该媒体内容在预先设置的多种维度下的第二文本信息对应的第二文字个数,以及所述第一文本信息与各个所述第二文本信息相同的第三文字个数;
基于所述第一文本信息,确定分类信息,所述分类信息中包含所述目标搜索信息与不同维度下的素材内容的匹配度;
将所述第一文字个数、各个所述第二文字个数、各个所述第三文字个数、所述分类信息、该媒体内容在设定时长内对应的点击次数以及该媒体内容的发布时间与当前时间的时间间隔,作为所述宽度模型输入特征。
3.根据权利要求1所述的确定方法,其特征在于,按照以下方式获取所述多种特征信息中的所述深度模型输入特征:
基于所述目标搜索信息包含的第一文本信息的各个词单元确定所述目标搜索信息对应的语句特征,以及基于所述媒体内容在预先设置的多种维度下分别对应的各个第二文本信息的各个词单元,确定该媒体内容在预先设置的各种维度下分别对应的语句特征;
对所述目标搜索信息对应的语句特征以及该媒体内容在预先设置的多种维度下分别对应的语句特征进行拼接,得到所述深度模型输入特征。
4.根据权利要求1所述的确定方法,其特征在于,按照以下方式获取所述深度模型和宽度模型之间的交互特征:
基于所述目标搜索信息包含的第一文本信息,确定分类信息,所述分类信息中包含所述目标搜索信息与不同维度下的素材内容的匹配度;
基于所述第一文本信息对应的各个词单元,以及所述媒体内容在预先设置的多种维度下分别对应的各个第二文本信息的词单元,确定所述目标搜索信息对应的词特征,以及该媒体内容在预先设置的各种维度下分别对应的词特征;
基于所述目标搜索信息对应的词特征、该媒体内容在预先设置的各种维度下分别对应的词特征以及所述分类信息,确定所述深度模型和宽度模型之间的交互特征。
5.根据权利要求4所述的确定方法,其特征在于,所述分类信息包含在多个维度下的分值构成的分值序列,所述基于所述目标搜索信息对应的词特征、该媒体内容在预先设置的各种维度下分别对应的词特征以及所述分类信息,确定所述深度模型和宽度模型之间的交互特征,包括:
基于所述目标搜索信息对应的词特征、该媒体内容在预先设置的各种维度下分别对应的词特征,确定所述目标搜索信息与该媒体内容在预先设置的各种维度下分别对应的余弦相似度;
基于所述目标搜索信息与该媒体内容在预先设置的各种维度下分别对应的余弦相似度以及对应维度的分值,确定所述目标搜索信息与该媒体内容在预先设置的各种维度下的交互特征;
对所述目标搜索信息与该媒体内容在预先设置的各种维度下的交互特征求和,得到所述深度模型和宽度模型之间的交互特征。
6.根据权利要求1至5任一所述的确定方法,其特征在于,所述基于所述宽度模型输入特征、所述深度模型输入特征、以及所述深度模型和宽度模型之间的交互特征,确定该媒体内容与所述目标搜索信息之间的相关度,包括:
将所述宽度模型输入特征、所述深度模型输入特征、以及所述深度模型和宽度模型之间的交互特征输入预先训练的神经网络,得到所述媒体内容与所述目标搜索信息之间的相关度。
7.根据权利要求1所述的确定方法,其特征在于,在基于每个媒体内容与所述目标搜索信息之间的相关度,确定当前在基于所述目标搜索信息进行搜索时该媒体内容对应的展示位置之前,所述确定方法还包括:
获取预先确定的每个媒体内容对应的点击率、发布该媒体内容的客户端所属类别对应的分值以及该媒体内容的发布时间与当前时间的时间间隔;
所述基于每个媒体内容与所述目标搜索信息之间的相关度,确定当前在基于所述目标搜索信息进行搜索时该媒体内容对应的展示位置,包括:
对每个媒体内容对应的点击率、该媒体内容与所述目标搜索信息之间的相关度、发布该媒体内容的客户端所属类别对应的分值以及该媒体内容的发布时间与当前时间的时间间隔进行加权求和,确定每个媒体内容对应的排序分值;
基于每个媒体内容对应的排序分值,确定当前在基于所述目标搜索信息进行搜索时该媒体内容对应的展示位置。
8.根据权利要求1所述的确定方法,其特征在于,在确定当前在基于所述目标搜索信息进行搜索时该媒体内容对应的展示位置后,所述确定方法还包括:
在接收到客户端发送的搜索请求时,获取所述搜索请求中包含的搜索信息;
基于所述搜索信息确定与所述搜索信息对应的目标搜索信息,并提取与所述目标搜索信息关联的多个媒体内容以及所述多个媒体内容各自对应的展示位置;
将所述多个媒体内容以及所述多个媒体内容各自对应的展示位置发送至客户端。
9.一种展示位置的确定装置,其特征在于,包括:
特征确定模块,用于针对与目标搜索信息关联的每个媒体内容,获取表征该媒体内容与所述目标搜索信息相关度的多种特征信息,所述多种特征信息包括宽度模型输入特征、深度模型输入特征、以及深度模型和宽度模型之间的交互特征;
相关度确定模块,用于基于所述宽度模型输入特征、所述深度模型输入特征、以及所述深度模型和宽度模型之间的交互特征,确定该媒体内容与所述目标搜索信息之间的相关度;
展示位置确定模块,用于基于每个媒体内容与所述目标搜索信息之间的相关度,确定当前在基于所述目标搜索信息进行搜索时该媒体内容对应的展示位置。
10.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至8任一所述的确定方法的步骤。
11.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至8任一所述的确定方法的步骤。
CN202010423678.6A 2020-05-19 2020-05-19 展示位置的确定方法、确定装置、电子设备及存储介质 Active CN111597469B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010423678.6A CN111597469B (zh) 2020-05-19 2020-05-19 展示位置的确定方法、确定装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010423678.6A CN111597469B (zh) 2020-05-19 2020-05-19 展示位置的确定方法、确定装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN111597469A true CN111597469A (zh) 2020-08-28
CN111597469B CN111597469B (zh) 2022-05-20

Family

ID=72185829

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010423678.6A Active CN111597469B (zh) 2020-05-19 2020-05-19 展示位置的确定方法、确定装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111597469B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113038242A (zh) * 2021-05-24 2021-06-25 武汉斗鱼鱼乐网络科技有限公司 直播卡片展示位置的确定方法、装置、设备及存储介质
CN114691906A (zh) * 2020-12-29 2022-07-01 北京达佳互联信息技术有限公司 媒体内容的处理方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103186574A (zh) * 2011-12-29 2013-07-03 北京百度网讯科技有限公司 一种搜索结果的生成方法和装置
CN109325146A (zh) * 2018-11-12 2019-02-12 平安科技(深圳)有限公司 一种视频推荐方法、装置、存储介质和服务器
CN109508394A (zh) * 2018-10-18 2019-03-22 青岛聚看云科技有限公司 一种多媒体文件搜索排序模型的训练方法及装置
US20190114668A1 (en) * 2016-09-13 2019-04-18 Tencent Technology (Shenzhen) Company Limited Application recommendation method and server
CN110674429A (zh) * 2018-07-03 2020-01-10 百度在线网络技术(北京)有限公司 用于信息检索的方法、装置、设备和计算机可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103186574A (zh) * 2011-12-29 2013-07-03 北京百度网讯科技有限公司 一种搜索结果的生成方法和装置
US20190114668A1 (en) * 2016-09-13 2019-04-18 Tencent Technology (Shenzhen) Company Limited Application recommendation method and server
CN110674429A (zh) * 2018-07-03 2020-01-10 百度在线网络技术(北京)有限公司 用于信息检索的方法、装置、设备和计算机可读存储介质
CN109508394A (zh) * 2018-10-18 2019-03-22 青岛聚看云科技有限公司 一种多媒体文件搜索排序模型的训练方法及装置
CN109325146A (zh) * 2018-11-12 2019-02-12 平安科技(深圳)有限公司 一种视频推荐方法、装置、存储介质和服务器

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114691906A (zh) * 2020-12-29 2022-07-01 北京达佳互联信息技术有限公司 媒体内容的处理方法、装置、电子设备及存储介质
CN113038242A (zh) * 2021-05-24 2021-06-25 武汉斗鱼鱼乐网络科技有限公司 直播卡片展示位置的确定方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN111597469B (zh) 2022-05-20

Similar Documents

Publication Publication Date Title
CN107832437B (zh) 音/视频推送方法、装置、设备及存储介质
CN106970991B (zh) 相似应用的识别方法、装置和应用搜索推荐方法、服务器
CN111782947B (zh) 一种搜索内容展示方法、装置、电子设备及存储介质
US20160188619A1 (en) Method and system for enhanced query term suggestion
CN106445963B (zh) App平台的广告索引关键词自动生成方法和装置
CN110325986A (zh) 文章处理方法、装置、服务器及存储介质
CN108133058B (zh) 一种视频检索方法
Vakulenko et al. Enriching iTunes App Store Categories via Topic Modeling.
US11354349B1 (en) Identifying content related to a visual search query
CN111400517A (zh) 信息推送、信息发布方法及装置
CN112199526B (zh) 一种多媒体内容发布的方法、装置、电子设备及存储介质
CN111597469B (zh) 展示位置的确定方法、确定装置、电子设备及存储介质
CN115907868A (zh) 一种广告投放分析方法及装置
CN112307366A (zh) 一种信息展示的方法、装置及计算机存储介质
CN106919588A (zh) 一种应用程序搜索系统及方法
CN111753194B (zh) 一种信息推送的方法、装置、电子设备及存储介质
CN111753204B (zh) 一种信息推送方法、装置、电子设备及存储介质
CN113378058B (zh) 一种信息搜索的方法、装置、计算机设备及存储介质
CN116823410B (zh) 数据处理方法、对象处理方法、推荐方法及计算设备
CN109299378B (zh) 搜索结果的展示方法、装置、终端及存储介质
CN111737607A (zh) 数据处理方法、装置、电子设备以及存储介质
CN111738754A (zh) 对象推荐方法及装置、存储介质、计算机设备
CN116610858A (zh) 一种信息分发方法、装置、电子设备以及存储介质
CN115080829A (zh) 一种搜索结果展示方法、装置、计算机设备及存储介质
CN111597470A (zh) 一种搜索结果展示位置的确定方法及确定装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee after: Douyin Vision Co.,Ltd.

Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee before: Tiktok vision (Beijing) Co.,Ltd.

Address after: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee after: Tiktok vision (Beijing) Co.,Ltd.

Address before: 100041 B-0035, 2 floor, 3 building, 30 Shixing street, Shijingshan District, Beijing.

Patentee before: BEIJING BYTEDANCE NETWORK TECHNOLOGY Co.,Ltd.