CN111309999A - 一种互动场景内容的生成方法及装置 - Google Patents
一种互动场景内容的生成方法及装置 Download PDFInfo
- Publication number
- CN111309999A CN111309999A CN201811511010.6A CN201811511010A CN111309999A CN 111309999 A CN111309999 A CN 111309999A CN 201811511010 A CN201811511010 A CN 201811511010A CN 111309999 A CN111309999 A CN 111309999A
- Authority
- CN
- China
- Prior art keywords
- text information
- vocabulary
- search
- feature
- timeliness
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 61
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000004590 computer program Methods 0.000 claims description 14
- 230000015654 memory Effects 0.000 claims description 14
- 230000011218 segmentation Effects 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 239000013598 vector Substances 0.000 description 12
- 230000006872 improvement Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
本申请实施方式公开了一种互动场景内容的生成方法及装置,其中,所述方法包括:获取具备时效性的文本信息,并从所述文本信息中解析出特征词汇;从解析出的所述特征词汇中确定核心词汇,并获取针对所述核心词汇的搜索结果,所述搜索结果中包括多个基于时效性进行召回的结果项;基于获取的所述搜索结果,生成以所述文本信息为互动标题的互动场景内容。本申请提供的技术方案,能够降低人工成本。
Description
技术领域
本申请涉及互联网技术领域,特别涉及一种互动场景内容的生成方法及装置。
背景技术
随着互联网的不断发展,网络中的信息也在瞬息万变,用户很多时候会关注最新的话题信息,并针对最新的话题信息进行互动,或者将最新的话题信息转发或分享给其他用户。
当前,为了实现用户的上述需求,针对一些最新的热点话题,通常会通过人工及时从网络中搜集与最新的热点话题相关的资源,并将这些搜集到的资源编辑后生成针对该热点话题的互动场景内容,从而可以向用户提供可以讨论或转发的场景内容
然而,为了生成这些互动场景内容,通常需要投入大量人工成本。因此,目前亟需一种更加便捷的互动场景内容的生成方法,以降低人工成本。
发明内容
本申请实施方式的目的是提供一种互动场景内容的生成方法及装置,能够降低人工成本。
为实现上述目的,本申请实施方式提供一种互动场景内容的生成方法,所述方法包括:获取具备时效性的文本信息,并从所述文本信息中解析出特征词汇;从解析出的所述特征词汇中确定核心词汇,并获取针对所述核心词汇的搜索结果,所述搜索结果中包括多个基于时效性进行召回的结果项;基于获取的所述搜索结果,生成以所述文本信息为互动标题的互动场景内容。
为实现上述目的,本申请实施方式还提供一种互动场景内容的生成装置,所述装置包括:特征词汇解析单元,用于获取具备时效性的文本信息,并从所述文本信息中解析出特征词汇;搜索结果获取单元,从解析出的所述特征词汇中确定核心词汇,并获取针对所述核心词汇的搜索结果,所述搜索结果中包括多个基于时效性进行召回的结果项;场景内容生成单元,基于获取的所述搜索结果,生成以所述文本信息为标题的互动场景内容。
为实现上述目的,本申请实施方式还提供一种互动场景内容的生成装置,所述装置包括存储器和处理器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时,实现上述的方法。
由上可见,本申请提供的技术方案,首先可以获取来自网站内或者网站外的具备时效性的文本信息,该具备时效性的文本信息可以是当前网络中的热搜文本信息,还可以是网站内新增视频的标题信息,还可以是处于未开播状态或者处于更新状态的剧集信息等。然后,可以从这些具备时效性的文本信息中解析出特征词汇,该特征词汇可以是这些文本信息中涉及的人名、动作、事件等。然后,可以从解析出的所述特征词汇中确定核心词汇,并可以通过爬虫模块在当前网络中获取针对所述核心词汇的搜索结果,还可以通过当前网站的预设接口获取所述当前网站针对所述核心词汇的搜索结果。最后,可以基于获取的所述搜索结果,自动生成以所述文本信息为互动标题的互动场景内容。因此,本申请提供的技术方案,无需人工参与,能够降低人工成本。
附图说明
为了更清楚地说明本申请实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施方式中互动场景内容的生成方法流程图;
图2为本申请实施方式中互动场景内容的生成装置的功能模块示意图;
图3为本申请实施方式中互动场景内容的生成装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施方式中的附图,对本申请实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本申请一部分实施方式,而不是全部的实施方式。基于本申请中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都应当属于本申请保护的范围。
本申请提供的互动场景内容的生成方法,可以应用于搜索引擎中。请参阅图1,所述方法可以包括以下步骤。
S11:获取具备时效性的文本信息,并从所述文本信息中解析出特征词汇。
在本实施方式中,当前网站的搜索引擎可以预先获取网络中具备时效性的文本信息。其中,所述具备时效性的文本信息可以包括网站外的热搜文本信息。所述热搜文本信息例如可以是微博的热搜榜中出现的热搜词汇或者热搜短语。在获取所述热搜文本信息时,搜索引擎可以利用爬虫模块,通过多个门户网站的链接,从门户网站中爬取相应的热搜榜中的热搜词汇或者热搜短语,并且可以将爬取的热搜文本信息作为所述具备时效性的文本信息。
此外,在一个实施方式中,所述热搜文本信息还可以根据网站内的新增视频来确定。具体地,网站内的新增视频通常会具备一定的时效性,这些新增视频所展示的内容可以通过新增视频的标题信息来表示。因此,在本实施方式中,可以获取当前网站内新增视频的标题信息,并将所述标题信息作为所述具备时效性的文本信息。
在另一个实施方式中,考虑到用户通常想要了解未开播的剧集和持续更新的剧集的最新消息,因此可以获取当前网站中处于未开播状态或者处于更新状态的剧集信息,并将所述剧集信息作为所述具备时效性的文本信息。其中,所述剧集信息例如可以是剧集中演员的近况,或者该剧集的剧情推测,或者该剧集的开播日期、开播频道等信息。
在本实施方式中,在获取到具备时效性的文本信息后,由于有时候这些文本信息过于冗长,因此可以从所述文本信息中解析出能够体现时效性的特征词汇。具体地,在解析所述特征词汇时,首先可以利用分词器对所述文本信息进行分词处理。具体地,所述分词器例如可以是mmseg4j、IKAnalyzer、Ansj、paoding等分词器。在经过分词处理之后,可以将原本的文本信息拆分为一个或者多个词汇,这些词汇通常会具备词性标注的结果。其中,词性标注的结果可以通过词性的代码来表示。词性和词性代码的对应关系可以通过词性对照表来表示。例如,形容词可以通过词性代码a来表示,副形词可以通过词性代码ad来表示,形语素可以通过词性代码ag来表示,人名可以通过词性代码nr来表示,地名可以通过词性代码ns来表示等。通常而言,在文本信息中,能够表征时效性的通常是人名、地名、动作等词性的词汇,因此,可以将分词处理的结果中具备指定词性的词汇或者由多个所述具备指定词性的词汇构成的词汇组合作为解析出的特征词汇。其中,所述指定词性便可以是上述能够表征时效性的词性。
举例来说,获取的文本信息为“2017维密秀奚梦瑶摔倒全纪录,台上保持微笑,台下嚎啕大哭”,从该文本信息中可以提取出“奚梦瑶”、“2017维密秀”、“摔倒”、“奚梦瑶摔倒”等特征词汇。
需要说明的是,上述实施方式中具备时效性的文本信息,可以分别从网站内或者网站外获取。
S13:从解析出的所述特征词汇中确定核心词汇,并获取针对所述核心词汇的搜索结果,所述搜索结果中包括多个基于时效性进行召回的结果项。
在本实施方式中,在从所述文本信息中解析出特征词汇之后,通常可以得到多个特征词汇。例如,获取的文本信息为“王俊凯参加高考”,从该文本信息中可以提取出“王俊凯”、“参加”、“高考”等特征词汇。为了更加准确地获取与该文本信息相关的搜索结果,可以先从这些解析出的特征词汇中筛选出用户真正希望关注的核心词汇。具体地,在从所述文本信息中解析出特征词汇之后,可以利用爬虫模块,分别获取这些特征词汇的搜索量。接着可以将最高搜索量对应的特征词汇作为所述文本信息中的核心词汇。例如,针对从该文本信息中提取出的“王俊凯”、“参加”、“高考”等特征词汇,通过这些特征词汇的搜索量,可以筛选出核心词汇为“王俊凯”。这样,后续便可以获取针对所述核心词汇的搜索结果,并基于针对所述核心词汇的搜索结果,生成以所述文本信息为互动标题的互动场景内容。
在本实施方式中,在从解析出的所述特征词汇中确定核心词汇之后,那么可以基于该核心词汇,来生成以所述文本信息为互动标题的互动场景内容。具体地,通过当前网站的预设接口获取所述当前网站针对所述核心词汇的搜索结果。还可以通过爬虫模块获取当前网络中针对所述核心词汇的搜索结果。其中,所述预设接口可以是专门用于获取当前网站的搜索结果的SDK(Software Development Kit,软件开发工具)接口。
在本实施方式中,在获取针对核心词汇的搜索结果时,当前网站可以按照预先设定的时效性搜索策略,搜索出所述核心词汇对应的搜索结果。还可以利用爬虫模块,通过多个门户网站的链接,从门户网站中爬取针对核心词汇的搜索结果。在对核心词汇进行搜索时,搜索引擎可以从各自的资源池中计算出与该核心词汇相关的资源,并可以将相关的资源作为搜索结果召回。召回的搜索结果中可以包括多个结果项。这些资源例如可以包括相关的视频、图像和文本等等。这样,最终获取到的搜索结果便可以包括多个基于时效性进行召回结果项。
S15:基于获取的所述搜索结果,生成以所述文本信息为互动标题的互动场景内容。
在本实施方式中,在获取针对所述核心词汇的搜索结果之后,可以通过所述搜索结果中的各个结果项关联的资源特征,来评估这些结果项的排列先后顺序,从而可以在生成的互动场景内容中优先展示用户更想关注的相关内容。其中,所述资源特征可以包括资源相关度、用户点击量、用户停留时长、资源质量、资源上传时间中至少一种。所述资源相关度可以用于表征搜索到的结果项与所述核心词汇之间的相关度。所述用户点击量可以用于表征用户点击结果项的数量。所述用户停留时长用于表征用户在持续浏览该结果项时停留的时长。所述资源质量可以包括上传的视频资源质量等。当然,在实际应用中,还可以考虑其他资源特征,例如视频评论数等,在这里便不再一一例举。为了利用各个结果项关联的资源特征对结果项进行评估,可以在获取针对所述核心词汇的搜索结果之后,针对结果项的资源特征的推荐程度,预先设定资源特征关联的推荐系数。例如,针对资源相关度,资源相关度越高,关联的推荐系数也越高。比如,当资源相关度在90百分比(%)至100%的取值范围内时,可以设定关联的推荐系数为7,当资源相关度在80%至90%的取值范围内时,可以设定关联的推荐系数为5,当资源相关度在60%至70%的取值范围内时,可以设定关联的推荐系数为3,当资源相关度在40%至60%的取值范围内时,可以设定关联的推荐系数为2,当资源相关度在40%以下时,可以设定关联的推荐系数为1。针对用户点击量,点击量越高,关联的推荐系数越高。针对资源质量,资源质量越高,关联的推荐系数也越高。针对资源上传时间,上传时间越接近当前时间,关联的推荐系数也越高。对这些资源特征关联的推荐系数的设定方式类似于资源相关度的设定方式,具体设定的推荐系数值可以根据实际应用情况进行调整。
在本实施方式中,在获取针对所述核心词汇的搜索结果之后,生成针对核心词汇并以所述文本信息为标题的互动场景内容具体可以包括,可以先确定与所述搜索结果中的指定结果项关联的至少一种资源特征。例如,可以在搜索到这些结果项时,同时获取这些结果项的上传时间、资源相关度、用户点击量、用户停留时长以及视频资源的参数信息。所述参数信息可以包括视频的清晰度、分辨率等等。所述指定结果项可以是指所述搜索结果中的任意结果项。接着可以根据所述资源特征关联的推荐系数,确定所述指定结果项对应的排序系数。例如,针对所述指定结果项,可以将各个所述资源特征关联的推荐系数之和,作为所述指定结果项对应的排序系数。那么,便可以确定所述搜索结果中各个结果项对应的排序系数。在确定所述搜索结果中各个结果项对应的排序系数之后,便可以根据确定的结果项对应的排序系数,对所述搜索结果进行排序。例如,可以按照排序系数由大到小对所述搜索结果中的各个结果项进行排序。最后,可以将排序后的搜索结果作为针对核心词汇的互动场景内容,以便按照排列的顺序向用户展示这些结果项。这样,便可以自动生成针对时效性搜索词汇的互动场景内容,整个过程无需人工参与,从而可以更加高效地满足用户在热点事件发生时的互动需求,同时可以降低人工成本。
在本申请一个实施方式中,考虑到时效性具有一定的生命周期,通常会将指定时间内的搜索内容作为具有时效性的内容。例如,通常情况下会获取近三天内的针对所述核心汇的搜索结果。
在一个实施方式中,考虑到获取的具备时效性的文本信息可能比较多,并且其中可能有些文本信息可能热度较低,可能并不满足用户的互动需求。为此,在获取具备时效性的文本信息之后,还可以获取所述文本信息的转发量和/或搜索量。接着可以将转发量满足第一指定条件和/或搜索量满足第二指定条件的文本信息作为互动标题。其中,所述第一指定条件可以包括所述文本信息的转发量最高,或者所述文本信息的转发量达到指定转发量阈值。所述第二指定条件可以包括所述文本信息的搜索量最高,或者所述文本信息的搜索量达到指定搜索量阈值。所述指定转发量阈值和所述指定搜索量阈值具体可以根据实际应用情况来设定,此处不做限定。这样,后续便可以从所述互动标题中解析出特征词汇,从而获取针对所述核心词汇的搜索结果,并基于针对所述核心词汇的搜索结果,生成包括所述互动标题的互动场景内容。
在另一个实施方式中,在实际应用中,获取的具备时效性的文本信息中可能会包含例如“震惊”、“揭秘”、“独家”等吸引力较强的词汇。往往包含这些词汇的文本信息是用户比较愿意互动关注的。为此,在从所述文本信息中解析出特征词汇之后,当解析出的所述特征词汇中包含指定词汇时,可以直接将所述文本信息作为互动标题。其中,所述指定词汇例如可以包括“震惊”、“揭秘”、“独家”等吸引力较强的词汇。还可以将这些特征词汇分别与所述指定词汇进行对比,判断这些特征词汇中是否包含与所述指定词汇相似的词汇,若包含,可以直接将所述文本信息作为互动标题。
具体地,在对比两个词汇是否相似时,可以采用词向量的方法来判断。具体地,首先可以分别生成所述特征词汇和所述指定词汇的词向量。其中,所述词向量可以是用于表征指定词汇或者特征词汇的一种数学形式。生成词向量的方式也多种多样。例如,在一个实施方式中,可以通过共现矩阵来表示一个词汇的词向量。又例如,在另一个实施方式中,还可以通过对共现矩阵进行奇异值分解,并将奇异值分解的结果来作为一个词汇的词向量。再者,还可以通过语言模型来生成一个词汇的词向量。所述语言模型例如可以包括Skip-gram、CBOW、LBL、NNLM、C&W、GloVe等模型。
在本实施方式中,在生成了两个词汇的词向量之后,为了判断两个词汇是否相似,可以计算两个词向量之间的相似度。具体地,两个词汇的相似度在向量空间中可以表示为两个词向量之间的距离。距离越近,表示两个词汇越相似。距离越远,表示两个词汇差别越大。因此,在判断所述特征词汇和所述指定词汇是否相似时,可以计算两个词向量之间的空间距离,并将所述空间距离的倒数作为这两个词汇之间的相似度。这样,空间距离越小,其对应的相似度越大,表明两个词汇越相似。相反地,空间距离越大,其对应的相似度越小,表明两个词汇越不相似。这样,当计算的所述相似度大于或者等于指定相似度阈值时,可以判定所述相似度对应的特征词汇与所述指定词汇是相似的。其中,所述指定相似度阈值可以按照实际需求进行灵活调整。例如,所述指定相似度阈值可以是75%。
请参阅图2,本申请还提供一种互动场景内容的生成装置,所述装置包括:
时效性判断单元,用于获取当前搜索词汇,并判断所述当前搜索词汇是否为时效性搜索词汇;
搜索结果获取单元,用于若是,获取针对所述当前搜索词汇的搜索结果,所述搜索结果中包括多个基于时效性进行召回的结果项;
场景内容生成单元,用于基于获取的所述搜索结果,生成针对时效性搜索词汇的互动场景内容。
请参阅图3,本申请还提供一种互动场景内容的生成装置,所述装置包括存储器和处理器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时,可以实现以下步骤:
S11:获取具备时效性的文本信息,并从所述文本信息中解析出特征词汇;
S13:从解析出的所述特征词汇中确定核心词汇,并获取针对所述核心词汇的搜索结果,所述搜索结果中包括多个基于时效性进行召回的结果项;
S15:基于获取的所述搜索结果,生成以所述文本信息为互动标题的互动场景内容。
在本实施方式中,所述存储器可以包括用于存储信息的物理装置,通常是将信息数字化后再以利用电、磁或者光学等方法的媒体加以存储。本实施方式所述的存储器又可以包括:利用电能方式存储信息的装置,如RAM、ROM等;利用磁能方式存储信息的装置,如硬盘、软盘、磁带、磁芯存储器、磁泡存储器、U盘;利用光学方式存储信息的装置,如CD或DVD。当然,还有其他方式的存储器,例如量子存储器、石墨烯存储器等等。
在本实施方式中,所述处理器可以按任何适当的方式实现。例如,所述处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。
在一个实施方式中,所述计算机程序被所述处理器执行时,还可以实现以下步骤:
利用爬虫模块获取当前网络中的热搜文本信息,并将所述热搜文本信息作为所述具备时效性的文本信息;
和/或
获取所述当前网站内新增视频的标题信息,并将所述标题信息作为所述具备时效性的文本信息;
和/或
获取所述当前网站中处于未开播状态或者处于更新状态的剧集信息,并将所述剧集信息作为所述具备时效性的文本信息。
在一个实施方式中,所述计算机程序被所述处理器执行时,还可以实现以下步骤:
对所述文本信息进行分词处理,并将分词处理的结果中具备指定词性的词汇或者由多个所述具备指定词性的词汇构成的词汇组合作为解析出的特征词汇。
所述计算机程序被所述处理器执行时,还可以实现以下步骤:
获取所述特征词汇的搜索量;
将最高搜索量对应的特征词汇作为所述文本信息中的核心词汇。
在一个实施方式中,所述计算机程序被所述处理器执行时,还可以实现以下步骤:
确定与所述搜索结果中的指定结果项关联的至少一种资源特征;
根据所述资源特征关联的推荐系数,确定所述指定结果项对应的排序系数;
根据确定的结果项对应的排序系数,对所述搜索结果进行排序,将排序后的搜索结果作为以所述文本信息为标题的互动场景内容。
在一个实施方式中,所述计算机程序被所述处理器执行时,所述资源特征包括资源相关度、用户点击量、用户停留时长、资源质量、资源上传时间中至少一种。
在一个实施方式中,所述计算机程序被所述处理器执行时,还可以实现以下步骤:
通过当前网站的预设接口获取所述当前网站针对所述核心词汇的搜索结果;
和/或
通过爬虫模块获取当前网络中针对所述核心词汇的搜索结果。
在一个实施方式中,所述计算机程序被所述处理器执行时,还可以实现以下步骤:
获取所述文本信息的转发量和/或搜索量;
将转发量满足第一指定条件和/或搜索量满足第二指定条件的文本信息作为互动标题;
相应地,从所述文本信息中解析出特征词汇,包括:从所述互动标题中解析出特征词汇。
在一个实施方式中,所述计算机程序被所述处理器执行时,还可以实现以下步骤:
当解析出的所述特征词汇中包含指定词汇时,将所述文本信息作为互动标题。
本说明书实施方式提供的装置,其存储器和处理器实现的具体功能,可以与本说明书中的前述实施方式相对照解释,并能够达到前述实施方式的技术效果,这里便不再赘述。
由上可见,本申请提供的技术方案,首先可以获取来自网站内或者网站外的具备时效性的文本信息,该具备时效性的文本信息可以是当前网络中的热搜文本信息,还可以是网站内新增视频的标题信息,还可以是处于未开播状态或者处于更新状态的剧集信息等。然后,可以从这些具备时效性的文本信息中解析出特征词汇,该特征词汇可以是这些文本信息中涉及的人名、动作、事件等。然后,可以从解析出的所述特征词汇中确定核心词汇,并可以通过爬虫模块在当前网络中获取针对所述核心词汇的搜索结果,还可以通过当前网站的预设接口获取所述当前网站针对所述核心词汇的搜索结果。最后,可以基于获取的所述搜索结果,自动生成以所述文本信息为互动标题的互动场景内容。因此,本申请提供的技术方案,无需人工参与,能够降低人工成本。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现服务器以外,完全可以通过将方法步骤进行逻辑编程来使得服务器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种服务器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的单元也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的单元视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施方式或者实施方式的某些部分所述的方法。
本说明书中的各个实施方式均采用递进的方式描述,各个实施方式之间相同相似的部分互相参见即可,每个实施方式重点说明的都是与其他实施方式的不同之处。尤其,针对装置的实施方式来说,均可以参照前述方法的实施方式的介绍对照解释。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
虽然通过实施方式描绘了本申请,本领域普通技术人员知道,本申请有许多变形和变化而不脱离本申请的精神,希望所附的权利要求包括这些变形和变化而不脱离本申请的精神。
Claims (11)
1.一种互动场景内容的生成方法,其特征在于,所述方法包括:
获取具备时效性的文本信息,并从所述文本信息中解析出特征词汇;
从解析出的所述特征词汇中确定核心词汇,并获取针对所述核心词汇的搜索结果,所述搜索结果中包括多个基于时效性进行召回的结果项;
基于获取的所述搜索结果,生成以所述文本信息为互动标题的互动场景内容。
2.根据权利要求1所述的方法,其特征在于,获取具备时效性的文本信息包括:
利用爬虫模块获取当前网络中的热搜文本信息,并将所述热搜文本信息作为所述具备时效性的文本信息;
和/或
获取所述当前网站内新增视频的标题信息,并将所述标题信息作为所述具备时效性的文本信息;
和/或
获取所述当前网站中处于未开播状态或者处于更新状态的剧集信息,并将所述剧集信息作为所述具备时效性的文本信息。
3.根据权利要求1或2所述的方法,其特征在于,从所述文本信息中解析出特征词汇包括:
对所述文本信息进行分词处理,并将分词处理的结果中具备指定词性的词汇或者由多个所述具备指定词性的词汇构成的词汇组合作为解析出的特征词汇。
4.根据权利要求1所述的方法,其特征在于,从解析出的所述特征词汇中确定核心词汇包括:
获取所述特征词汇的搜索量;
将最高搜索量对应的特征词汇作为所述文本信息中的核心词汇。
5.根据权利要求1所述的方法,其特征在于,生成以所述文本信息为标题的互动场景内容包括:
确定与所述搜索结果中的指定结果项关联的至少一种资源特征;
根据所述资源特征关联的推荐系数,确定所述指定结果项对应的排序系数;
根据确定的结果项对应的排序系数,对所述搜索结果进行排序,将排序后的搜索结果作为以所述文本信息为标题的互动场景内容。
6.根据权利要求5所述的方法,其特征在于,所述资源特征包括资源相关度、用户点击量、用户停留时长、资源质量、资源上传时间中至少一种。
7.根据权利要求1所述的方法,其特征在于,获取针对所述核心词汇的搜索结果包括:
通过当前网站的预设接口获取所述当前网站针对所述核心词汇的搜索结果;
和/或
通过爬虫模块获取当前网络中针对所述核心词汇的搜索结果。
8.根据权利要求1所述的方法,其特征在于,在获取具备时效性的文本信息之后,所述方法还包括:
获取所述文本信息的转发量和/或搜索量;
将转发量满足第一指定条件和/或搜索量满足第二指定条件的文本信息作为互动标题;
相应地,从所述文本信息中解析出特征词汇,包括:从所述互动标题中解析出特征词汇。
9.根据权利要求1所述的方法,其特征在于,在从所述文本信息中解析出特征词汇之后,所述方法还包括:
当解析出的所述特征词汇中包含指定词汇时,将所述文本信息作为互动标题。
10.一种互动场景内容的生成装置,其特征在于,所述装置包括:
特征词汇解析单元,用于获取具备时效性的文本信息,并从所述文本信息中解析出特征词汇;
搜索结果获取单元,从解析出的所述特征词汇中确定核心词汇,并获取针对所述核心词汇的搜索结果,所述搜索结果中包括多个基于时效性进行召回的结果项;
场景内容生成单元,基于获取的所述搜索结果,生成以所述文本信息为标题的互动场景内容。
11.一种互动场景内容的生成装置,其特征在于,所述装置包括存储器和处理器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时,实现如权利要求1至9中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811511010.6A CN111309999B (zh) | 2018-12-11 | 2018-12-11 | 一种互动场景内容的生成方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811511010.6A CN111309999B (zh) | 2018-12-11 | 2018-12-11 | 一种互动场景内容的生成方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111309999A true CN111309999A (zh) | 2020-06-19 |
CN111309999B CN111309999B (zh) | 2023-05-16 |
Family
ID=71159532
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811511010.6A Active CN111309999B (zh) | 2018-12-11 | 2018-12-11 | 一种互动场景内容的生成方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111309999B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113722610A (zh) * | 2021-08-13 | 2021-11-30 | 支付宝(杭州)信息技术有限公司 | 基于搜索场景的用户间互动方法、装置以及设备 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102004792A (zh) * | 2010-12-07 | 2011-04-06 | 百度在线网络技术(北京)有限公司 | 一种热搜词生成方法及系统 |
CN103617169A (zh) * | 2013-10-23 | 2014-03-05 | 杭州电子科技大学 | 一种基于Hadoop的微博热点话题提取方法 |
CN103853746A (zh) * | 2012-12-01 | 2014-06-11 | 上海斐讯数据通信技术有限公司 | 词库生成方法及其系统、输入法及输入系统 |
CN104598607A (zh) * | 2015-01-29 | 2015-05-06 | 百度在线网络技术(北京)有限公司 | 推荐搜索短语的方法及系统 |
CN104915447A (zh) * | 2015-06-30 | 2015-09-16 | 北京奇艺世纪科技有限公司 | 一种热点话题追踪及关键词确定方法及装置 |
CN105095434A (zh) * | 2015-07-23 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 时效需求识别方法及装置 |
WO2015176624A1 (zh) * | 2014-05-19 | 2015-11-26 | 北京奇虎科技有限公司 | 突发时效性查询词识别方法和系统 |
CN105956149A (zh) * | 2016-05-12 | 2016-09-21 | 北京奇艺世纪科技有限公司 | 默认搜索词的推荐方法和装置 |
CN106202285A (zh) * | 2016-06-30 | 2016-12-07 | 北京百度网讯科技有限公司 | 搜索结果展示方法和装置 |
CN106649740A (zh) * | 2016-12-23 | 2017-05-10 | 北京奇虎科技有限公司 | 基于搜索的3c类ugc数据的推荐方法及装置 |
WO2017101818A1 (zh) * | 2015-12-16 | 2017-06-22 | 广州神马移动信息科技有限公司 | 搜索结果显示方法、装置及搜索系统 |
CN107180093A (zh) * | 2017-05-15 | 2017-09-19 | 北京奇艺世纪科技有限公司 | 信息搜索方法及装置和时效性查询词识别方法及装置 |
CN107193867A (zh) * | 2017-04-07 | 2017-09-22 | 广东精点数据科技股份有限公司 | 基于大数据的热点话题分析方法 |
-
2018
- 2018-12-11 CN CN201811511010.6A patent/CN111309999B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102004792A (zh) * | 2010-12-07 | 2011-04-06 | 百度在线网络技术(北京)有限公司 | 一种热搜词生成方法及系统 |
CN103853746A (zh) * | 2012-12-01 | 2014-06-11 | 上海斐讯数据通信技术有限公司 | 词库生成方法及其系统、输入法及输入系统 |
CN103617169A (zh) * | 2013-10-23 | 2014-03-05 | 杭州电子科技大学 | 一种基于Hadoop的微博热点话题提取方法 |
WO2015176624A1 (zh) * | 2014-05-19 | 2015-11-26 | 北京奇虎科技有限公司 | 突发时效性查询词识别方法和系统 |
CN104598607A (zh) * | 2015-01-29 | 2015-05-06 | 百度在线网络技术(北京)有限公司 | 推荐搜索短语的方法及系统 |
CN104915447A (zh) * | 2015-06-30 | 2015-09-16 | 北京奇艺世纪科技有限公司 | 一种热点话题追踪及关键词确定方法及装置 |
CN105095434A (zh) * | 2015-07-23 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 时效需求识别方法及装置 |
WO2017101818A1 (zh) * | 2015-12-16 | 2017-06-22 | 广州神马移动信息科技有限公司 | 搜索结果显示方法、装置及搜索系统 |
CN105956149A (zh) * | 2016-05-12 | 2016-09-21 | 北京奇艺世纪科技有限公司 | 默认搜索词的推荐方法和装置 |
CN106202285A (zh) * | 2016-06-30 | 2016-12-07 | 北京百度网讯科技有限公司 | 搜索结果展示方法和装置 |
CN106649740A (zh) * | 2016-12-23 | 2017-05-10 | 北京奇虎科技有限公司 | 基于搜索的3c类ugc数据的推荐方法及装置 |
CN107193867A (zh) * | 2017-04-07 | 2017-09-22 | 广东精点数据科技股份有限公司 | 基于大数据的热点话题分析方法 |
CN107180093A (zh) * | 2017-05-15 | 2017-09-19 | 北京奇艺世纪科技有限公司 | 信息搜索方法及装置和时效性查询词识别方法及装置 |
Non-Patent Citations (1)
Title |
---|
张景;朱国宾;: "基于CBOW-LDA主题模型的Stack Overflow编程网站热点主题发现研究", 计算机科学 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113722610A (zh) * | 2021-08-13 | 2021-11-30 | 支付宝(杭州)信息技术有限公司 | 基于搜索场景的用户间互动方法、装置以及设备 |
CN113722610B (zh) * | 2021-08-13 | 2024-03-19 | 支付宝(杭州)信息技术有限公司 | 基于搜索场景的用户间互动方法、装置以及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111309999B (zh) | 2023-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ghalandari et al. | A large-scale multi-document summarization dataset from the Wikipedia current events portal | |
US10691737B2 (en) | Content summarization and/or recommendation apparatus and method | |
US10217058B2 (en) | Predicting interesting things and concepts in content | |
Chen et al. | User intention modeling in web applications using data mining | |
US20190129942A1 (en) | Methods and systems for automatically generating reports from search results | |
US20130262449A1 (en) | System and method for search refinement using knowledge model | |
US8661035B2 (en) | Content management system and method | |
CN101354711A (zh) | 信息搜索方法、信息搜索装置、信息搜索系统 | |
CN113039539A (zh) | 使用ai模型推荐来扩展搜索引擎能力 | |
Han et al. | Inferring search queries from web documents via a graph-augmented sequence to attention network | |
Pappas et al. | Combining content with user preferences for non-fiction multimedia recommendation: a study on TED lectures | |
JP7395377B2 (ja) | コンテンツ検索方法、装置、機器、および記憶媒体 | |
CN111310017B (zh) | 一种时效性场景内容的生成方法及装置 | |
CN116975271A (zh) | 文本相关性的确定方法、装置、计算机设备和存储介质 | |
CN111309999B (zh) | 一种互动场景内容的生成方法及装置 | |
Im et al. | STAG: semantic image annotation using relationships between tags | |
CN111310069B (zh) | 一种针对时效性搜索的评估方法及装置 | |
Redondo-García et al. | Augmenting TV newscasts via entity expansion | |
Xue et al. | Topical key concept extraction from folksonomy through graph-based ranking | |
Ding et al. | Research and analysis of recommendation algorithm based on convolutional neural network | |
CN111310018B (zh) | 一种时效性搜索词汇的确定方法及搜索引擎 | |
Kwak et al. | Interactive Story Maker: Tagged Video Retrieval System for Video Re-creation Service | |
CN110069665B (zh) | 一种筛选项的提供方法、客户端及服务器 | |
CN117009574B (zh) | 热点视频模板的生成方法、系统、设备及存储介质 | |
Ma et al. | D-Sempre: Learning deep semantic-preserving embeddings for user interests-social contents modeling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240619 Address after: Room 201, No. 9 Fengxiang East Street, Yangsong Town, Huairou District, Beijing Patentee after: Youku Culture Technology (Beijing) Co.,Ltd. Country or region after: China Address before: Greater Cayman, British Cayman Islands Patentee before: ALIBABA GROUP HOLDING Ltd. Country or region before: Cayman Islands |