CN108460104A - 一种实现内容定制的方法和装置 - Google Patents
一种实现内容定制的方法和装置 Download PDFInfo
- Publication number
- CN108460104A CN108460104A CN201810117407.0A CN201810117407A CN108460104A CN 108460104 A CN108460104 A CN 108460104A CN 201810117407 A CN201810117407 A CN 201810117407A CN 108460104 A CN108460104 A CN 108460104A
- Authority
- CN
- China
- Prior art keywords
- keyword
- video
- user
- picture
- feature vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/7867—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/5866—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/735—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/738—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Library & Information Science (AREA)
- Computational Linguistics (AREA)
- User Interface Of Digital Computer (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种实现内容定制的方法、装置、电子设备和计算机可读存储介质。该方法包括:获取关键词;提供内容定制页面,并在内容定制页面上展示所获取的关键词供用户进行选择;获取用户在所述内容定制页面上选择的一个或多个关键词对应的语义特征向量;将所述语义特征向量输入到实现文本转图片/视频的神经网络中,得到该神经网络输出的图片/视频;将所述图片/视频展示给用户。通过本技术方案,用户根据自己的需求选择相应的关键词,然后就会根据用户的选择进行图片或视频的生成,改善被动的选择他人提供的图片或视频资源的情况,实现图片或视频的定制,且增加趣味性,提高用户的使用体验。
Description
技术领域
本发明涉及计算机技术领域,具体涉及一种实现内容定制的方法、装置、电子设备和计算机可读存储介质。
背景技术
随着电子设备的功能的日益增多,通过电子设备进行分享视频的播放成为提高用户的日常生活质量的途径之一。用户可以将自己采集的图像或视频通过多种功能软件进行分享,且还可以播放其他用户采集并分享的图片或视频。但是,上述分享的图片或视频是他人提供的,即图片或视频的资源取决于他人,用户只能被动的从他人分享的图片或视频资源中进行选择,用户自身无法根据需求进行图片或视频的定制,降低用户的使用体验。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的实现内容定制的方法、装置、电子设备和计算机可读存储介质。
根据本发明的一个方面,提供了一种实现内容定制的方法,其中,该方法包括:
获取关键词;
提供内容定制页面,并在内容定制页面上展示所获取的关键词供用户进行选择;
获取用户在所述内容定制页面上选择的一个或多个关键词对应的语义特征向量;
将所述语义特征向量输入到实现文本转图片/视频的神经网络中,得到该神经网络输出的图片/视频;
将所述图片/视频展示给用户。
可选地,所述获取关键词包括如下中的一种或多种:
从用户的画像信息中提取关键词;
从用户浏览过的视频内容中提取关键词;
获取最近的预设时间长度内的搜索热点词作为关键词。
可选地,所述从用户浏览过的视频内容中提取关键词包括如下中的一种或多种:
从所述视频的标题中提取实体词作为关键词;
从所述视频的字幕信息中提取实体词,并进行筛选后作为关键词;
从所述视频的图像中识别出文字,从识别出的文字中提取关键词。
可选地,所述在内容定制页面上展示所获取的关键词供用户进行选择包括:
在内容定制页面上展示与所获取的各关键词对应的组件,以及展示一个工作面板区域;
当一个关键词对应的组件被拖动到所述工作面板区域时,确定该关键词被用户选择。
可选地,所述获取用户在所述内容定制页面上选择的一个或多个关键词对应的语义特征向量包括:
将所述一个或多个关键词输入到分析语义特征的神经网络,得到该神经网络输出的对应的语义特征向量。
可选地,在将所述语义特征向量输入到实现文本转图片/视频的神经网络中之前,该方法还包括:
将所述语义特征向量与高斯白噪声向量进行整合;
将整合后的向量输入到实现文本转图片/视频的神经网络中。
根据本发明的另一方面,提供了一种实现内容定制的装置,其中,该装置包括:
关键词获取单元,适于获取关键词;
提供单元,适于提供内容定制页面,并在内容定制页面上展示所获取的关键词供用户进行选择;
特征向量获取单元,适于获取用户在所述内容定制页面上选择的一个或多个关键词对应的语义特征向量;
输入单元,适于将所述语义特征向量输入到实现文本转图片/视频的神经网络中,得到该神经网络输出的图片/视频;
展示单元,适于将所述图片/视频展示给用户。
可选地,所述关键词获取单元,适于如下中的一种或多种:
从用户的画像信息中提取关键词;
从用户浏览过的视频内容中提取关键词;
获取最近的预设时间长度内的搜索热点词作为关键词。
可选地,所述关键词获取单元,进一步适于如下中的一种或多种:
从所述视频的标题中提取实体词作为关键词;
从所述视频的字幕信息中提取实体词,并进行筛选后作为关键词;
从所述视频的图像中识别出文字,从识别出的文字中提取关键词。
可选地,
所述提供单元,适于在内容定制页面上展示与所获取的各关键词对应的组件,以及展示一个工作面板区域;当一个关键词对应的组件被拖动到所述工作面板区域时,确定该关键词被用户选择。
可选地,
所述特征向量获取单元,适于将所述一个或多个关键词输入到分析语义特征的神经网络,得到该神经网络输出的对应的语义特征向量。
可选地,在所述输入单元将所述语义特征向量输入到实现文本转图片/视频的神经网络中之前,该装置还包括:
整合单元,适于将所述语义特征向量与高斯白噪声向量进行整合;
所述输入单元,适于将整合后的向量输入到实现文本转图片/视频的神经网络中。
根据本发明的又一方面,提供了一种电子设备,其中,该电子设备包括:
处理器;以及,
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据前述的方法。
根据本发明的再一方面,提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现前述的方法。
根据本发明的技术方案,获取关键词;提供内容定制页面,并在内容定制页面上展示所获取的关键词供用户进行选择;获取用户在所述内容定制页面上选择的一个或多个关键词对应的语义特征向量;将所述语义特征向量输入到实现文本转图片/视频的神经网络中,得到该神经网络输出的图片/视频;将所述图片/视频展示给用户。通过本技术方案,用户根据自己的需求选择相应的关键词,然后就会根据用户的选择进行图片或视频的生成,改善被动的选择他人提供的图片或视频资源的情况,实现图片或视频的定制,且增加趣味性,提高用户的使用体验。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的实现内容定制的方法的流程示意图;
图2示出了根据本发明一个实施例的实现内容定制的装置的结构示意图;
图3示出了根据本发明一个实施例的电子设备的结构示意图;
图4示出了根据本发明一个实施例的计算机可读存储介质的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的实现内容定制的方法的流程示意图。如图1所示,该方法包括:
步骤S110,获取关键词。
在本实施例中,用户是通过对关键词的选择,然后根据用户选择的关键词完成的图片或视频的定制,因此,首先需要获取关键词。
步骤S120,提供内容定制页面,并在内容定制页面上展示所获取的关键词供用户进行选择。
在本实施例中,用户在内容定制页面中进行相应的操作才能完成图片或视频的定制,需要将获取的关键词展示在内容定制页面,以便用户进行选择。
步骤S130,获取用户在内容定制页面上选择的一个或多个关键词对应的语义特征向量。
步骤S140,将语义特征向量输入到实现文本转图片/视频的神经网络中,得到该神经网络输出的图片/视频。
因为在进行图片或视频生成时,关键词是不可以直接使用的,需要将关键词转换成实现文本转图片/视频的神经网络可以识别的语义特征向量。例如,将关键词转换成1000维的语义特征向量,然后将这1000维的语义特征向量输入到实现文本转图片/视频的神经网络中。神经网络经过识别会输出对应的图片/视频。
步骤S150,将图片/视频展示给用户。
这样,本实施例中展示给用户的图片/视频就是根据用户选择的关键词生成的图片/视频,即用户定制的图片/视频。
可见,通过本实施例,用户根据自己的需求选择相应的关键词,然后就会根据用户的选择进行图片或视频的生成,改善被动的选择他人提供的图片或视频资源的情况,实现图片或视频的定制,满足用户的需求,且增加趣味性,提高用户的使用体验。
在本发明的一个实施例中,步骤S110中的获取关键词包括如下中的一种或多种:从用户的画像信息中提取关键词;从用户浏览过的视频内容中提取关键词;获取最近的预设时间长度内的搜索热点词作为关键词。
在本实施例中,为了使得获取的关键词符合用户的需求,根据用户的兴趣喜好进行获取,因为用户的兴趣喜好是反应在用户的画像信息或者用户的历史浏览记录中的,所以具体是从用户的画像信息中和/或用户浏览过的视频内容中提取关键词。另外,考虑到搜索热点也可以引起用户的兴趣,关键词还可以从搜索热点词中进行选择。
例如,用户的画像信息是“足球”、“世界杯”等,最近浏览的是关于世界杯或者足球队员内马尔的视频,则可以选择“足球”、“内马尔”作为关键词。
具体地,上述的从用户浏览过的视频内容中提取关键词包括如下中的一种或多种:从视频的标题中提取实体词作为关键词;从视频的字幕信息中提取实体词,并进行筛选后作为关键词;从视频的图像中识别出文字,从识别出的文字中提取关键词。
例如,视频标题是“足坛上十大精彩进球瞬间”,则可以选择“足球”作为关键词;又如,从字幕中筛选出现的频率最大的词语作为关键词;再如,在视频图像中有球迷举着梅西的灯牌,则识别出该视频图像中有关键词“梅西”,则将“梅西”作为关键词。
在本发明的一个实施例中,步骤S120中的在内容定制页面上展示所获取的关键词供用户进行选择包括:在内容定制页面上展示与所获取的各关键词对应的组件,以及展示一个工作面板区域;当一个关键词对应的组件被拖动到工作面板区域时,确定该关键词被用户选择。
这里的组件可以以控件的形式进行展示,用户尽心选择时可以选择该控件,将该空间拖动到工作面板区域;或者也可以以文字的形式进行展示,用户进行选择时,可以通过框选的方式进行选择,当关键词被框选后,将选中的关键词拖动到工作面板区域。也就是说工作面板区域内的关键词是用户预选的关键词,优选地,用户可以在工作面板区域内进行已选中的关键词的删除等操作;当用户确认后,将工作面板区域内的关键词作为用户最终选择的关键词。
在本发明的一个实施例中,步骤S130中的获取用户在内容定制页面上选择的一个或多个关键词对应的语义特征向量包括:将一个或多个关键词输入到分析语义特征的神经网络,得到该神经网络输出的对应的语义特征向量。
在本实施例中,具体是通过全连接网络把匹配的文本转换为特征向量,即把原始文本对应的one-hot编码的向量乘以一个矩阵转换为一个低维稠密的向量;通过全连接网络把不匹配的文本转换为特征向量。在神经网络中,全连接网络(即全连接层)在整个卷积神经网络中起到“分类器”的作用。如果说卷积层、池化层和激活函数层等操作是将原始数据映射到隐层特征空间的话,全连接层起到将学到的“分布式特征表示”映射到样本标记空间的作用。
在本发明的一个实施例中,在步骤S130中的获取用户在内容定制页面上选择的一个或多个关键词对应的语义特征向量之前,图1所示的方法还包括:获取一个或多个关键词生成的关键词语句;获取该关键词语句对应的语义特征向量。
在本实施例中,获取的关键词语句可以是根据用户选择的一个或多个关键词自动生成的,或者是接收用户的排序结果生成关键词语句。
在本发明的一个实施例中,在步骤S140中的将语义特征向量输入到实现文本转图片/视频的神经网络中之前,图1所示的方法还包括:将语义特征向量与高斯白噪声向量进行整合;将整合后的向量输入到实现文本转图片/视频的神经网络中。
在本实施例中,这里的整合是将语义特征向量和高斯白噪声向量的位数进行叠加,例如,高斯白噪声向量是100维,关键词转换成的是1000维的语义特征向量,则整合后就是1100维的向量,然后将1100维的向量输入到实现文本转图片/视频的神经网络中。
本技术方案中的实现文本转图片/视频的神经网络可以采用DC-GAN网络,主要由两部分组成,即Generator Network(生成网络)和Discriminator Network(判别网络)。生成对抗网络的训练过程如下:
1)准备训练数据,构成网络的输入,训练数据是用来学习模型参数的数据,由真实的图片x,与图片匹配的文本描述t,与图片不匹配的文本描述训练的迭代次数s。
2)开始迭代。
3)通过全连接网络把匹配的文本t转换为特征向量h,即把原始文本对应的one-hot编码的向量乘以一个矩阵转换为一个低维稠密的向量。
4)通过全连接网络把不匹配的文本转换为特征向量h。
5)生成一个随机的高斯噪声向量z。
6)把高斯噪声向量z和匹配文本特征向量h整合起来,并通过生成网络G,得到生成的与选择的文本对应的图片x。
7)用判别网络来判断x和h的是否一致。
8)用判别网络来判断x和h的是否一致。
9)用判别网络来判断x和h的是否一致。
10)把判别网络输出的损失函数求和。
11)利用梯度下降法更新判别网络的参数。
12)求得判别网络的损失函数。
13)利用梯度下降法更新生成网络的参数。
上述的生成网络是一个反卷积网络,判别网络是一个卷积网络。生成对抗网络的生成图片的过程仅需要用到生成网络,即卷积网络。待训练完成之后,生成网络的参数已经优化完成,输入一段文本或者单词组合就能够通过生成网络得到一副图片。
图2示出了根据本发明一个实施例的实现内容定制的装置的结构示意图。如图2所示,该实现内容定制的装置200包括:
关键词获取单元210,适于获取关键词。
在本实施例中,用户是通过对关键词的选择,然后根据用户选择的关键词完成的图片或视频的定制,因此,首先需要获取关键词。
提供单元220,适于提供内容定制页面,并在内容定制页面上展示所获取的关键词供用户进行选择。
在本实施例中,用户在内容定制页面中进行相应的操作才能完成图片或视频的定制,需要将获取的关键词展示在内容定制页面,以便用户进行选择。
特征向量获取单元230,适于获取用户在内容定制页面上选择的一个或多个关键词对应的语义特征向量。
输入单元240,适于将语义特征向量输入到实现文本转图片/视频的神经网络中,得到该神经网络输出的图片/视频。
因为在进行图片或视频生成时,关键词是不可以直接使用的,需要将关键词转换成实现文本转图片/视频的神经网络可以识别的语义特征向量。例如,将关键词转换成1000维的语义特征向量,然后将这1000维的语义特征向量输入到实现文本转图片/视频的神经网络中。神经网络经过识别会输出对应的图片/视频。
展示单元250,适于将图片/视频展示给用户。
这样,本实施例中展示给用户的图片/视频就是根据用户选择的关键词生成的图片/视频,即用户定制的图片/视频。
可见,通过本实施例,用户根据自己的需求选择相应的关键词,然后就会根据用户的选择进行图片或视频的生成,改善被动的选择他人提供的图片或视频资源的情况,实现图片或视频的定制,满足用户的需求,且增加趣味性,提高用户的使用体验。
在本发明的一个实施例中,关键词获取单元210,适于如下中的一种或多种:从用户的画像信息中提取关键词;从用户浏览过的视频内容中提取关键词;获取最近的预设时间长度内的搜索热点词作为关键词。
在本实施例中,为了使得获取的关键词符合用户的需求,根据用户的兴趣喜好进行获取,因为用户的兴趣喜好是反应在用户的画像信息或者用户的历史浏览记录中的,所以具体是从用户的画像信息中和/或用户浏览过的视频内容中提取关键词。另外,考虑到搜索热点也可以引起用户的兴趣,关键词还可以从搜索热点词中进行选择。
例如,用户的画像信息是“足球”、“世界杯”等,最近浏览的是关于世界杯或者足球队员内马尔的视频,则可以选择“足球”、“内马尔”作为关键词。
具体地,关键词获取单元210,进一步适于如下中的一种或多种:从视频的标题中提取实体词作为关键词;从视频的字幕信息中提取实体词,并进行筛选后作为关键词;从视频的图像中识别出文字,从识别出的文字中提取关键词。
例如,视频标题是“足坛上十大精彩进球瞬间”,则可以选择“足球”作为关键词;又如,从字幕中筛选出现的频率最大的词语作为关键词;再如,在视频图像中有球迷举着梅西的灯牌,则识别出该视频图像中有关键词“梅西”,则将“梅西”作为关键词。
在本发明的一个实施例中,提供单元220,适于在内容定制页面上展示与所获取的各关键词对应的组件,以及展示一个工作面板区域;当一个关键词对应的组件被拖动到工作面板区域时,确定该关键词被用户选择。
这里的组件可以以控件的形式进行展示,用户尽心选择时可以选择该控件,将该空间拖动到工作面板区域;或者也可以以文字的形式进行展示,用户进行选择时,可以通过框选的方式进行选择,当关键词被框选后,将选中的关键词拖动到工作面板区域。也就是说工作面板区域内的关键词是用户预选的关键词,优选地,用户可以在工作面板区域内进行已选中的关键词的删除等操作;当用户确认后,将工作面板区域内的关键词作为用户最终选择的关键词。
在本发明的一个实施例中,特征向量获取单元230,适于将一个或多个关键词输入到分析语义特征的神经网络,得到该神经网络输出的对应的语义特征向量。
在本实施例中,具体是通过全连接网络把匹配的文本转换为特征向量,即把原始文本对应的one-hot编码的向量乘以一个矩阵转换为一个低维稠密的向量;通过全连接网络把不匹配的文本转换为特征向量。在神经网络中,全连接网络(即全连接层)在整个卷积神经网络中起到“分类器”的作用。如果说卷积层、池化层和激活函数层等操作是将原始数据映射到隐层特征空间的话,全连接层起到将学到的“分布式特征表示”映射到样本标记空间的作用。
在本发明的一个实施例中,特征向量获取单元230,适于在获取用户在内容定制页面上选择的一个或多个关键词对应的语义特征向量之前,获取一个或多个关键词生成的关键词语句;然后获取该关键词语句对应的语义特征向量。
在本实施例中,获取的关键词语句可以是根据用户选择的一个或多个关键词自动生成的,或者是接收用户的排序结果生成关键词语句。
在本发明的一个实施例中,在输入单元240将语义特征向量输入到实现文本转图片/视频的神经网络中之前,图2所示的装置还包括:
整合单元,适于将语义特征向量与高斯白噪声向量进行整合。
输入单元240,适于将整合后的向量输入到实现文本转图片/视频的神经网络中。
在本实施例中,这里的整合是将语义特征向量和高斯白噪声向量的位数进行叠加,例如,高斯白噪声向量是100维,关键词转换成的是1000维的语义特征向量,则整合后就是1100维的向量,然后将1100维的向量输入到实现文本转图片/视频的神经网络中。
本发明还提供了一种电子设备,其中,该电子设备包括:
处理器;以及被安排成存储计算机可执行指令的存储器,可执行指令在被执行时使处理器执行根据图1所示的及其各实施例中的实现内容定制的方法
图3示出了根据本发明一个实施例的电子设备的结构示意图。如图3所示,该电子设备300包括:
处理器310;以及被安排成存储计算机可执行指令(程序代码)的存储器320,在存储器320中,有存储程序代码的存储空间330,用于执行根据本发明的方法步骤的程序代码330存储在存储空间330中,该程序代码在被执行时使处理器310执行根据图1所示的及其各实施例中的实现内容定制的方法。
图4示出了根据本发明一个实施例的计算机可读存储介质的结构示意图。如图4所示,该计算机可读存储介质400,存储一个或多个程序(程序代码)410,一个或多个程序(程序代码)410当被处理器执行时,用于执行根据本发明的方法步骤,即图1所示的以及其各实施例中的实现内容定制的方法。
需要说明的是,图3所示的电子设备和图4所示的计算机可读存储介质的各实施例与图1所示的方法的各实施例对应相同,上文已有详细说明,在此不再赘述。
综上所述,根据本发明的技术方案,获取关键词;提供内容定制页面,并在内容定制页面上展示所获取的关键词供用户进行选择;获取用户在所述内容定制页面上选择的一个或多个关键词对应的语义特征向量;将所述语义特征向量输入到实现文本转图片/视频的神经网络中,得到该神经网络输出的图片/视频;将所述图片/视频展示给用户。通过本技术方案,用户根据自己的需求选择相应的关键词,然后就会根据用户的选择进行图片或视频的生成,改善被动的选择他人提供的图片或视频资源的情况,实现图片或视频的定制,且增加趣味性,提高用户的使用体验。
需要说明的是:
在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的实现内容定制的装置、电子设备和计算机可读存储介质中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
例如,图3示出了根据本发明一个实施例的电子设备的结构示意图。该电子设备300传统上包括处理器310和被安排成存储计算机可执行指令(程序代码)的存储器320。存储器320可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。存储器320具有存储用于执行图1所示的以及各实施例中的任何方法步骤的程序代码340的存储空间330。例如,用于程序代码的存储空间330可以包括分别用于实现上面的方法中的各种步骤的各个程序代码340。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。这些计算机程序产品包括诸如硬盘,紧致盘(CD)、存储卡或者软盘之类的程序代码载体。这样的计算机程序产品通常为例如图4所述的计算机可读存储介质400。该计算机可读存储介质400可以具有与图3的电子设备中的存储器320类似布置的存储段、存储空间等。程序代码可以例如以适当形式进行压缩。通常,存储单元存储有用于执行根据本发明的方法步骤的程序代码410,即可以由诸如310之类的处理器读取的程序代码,当这些程序代码由电子设备运行时,导致该电子设备执行上面所描述的方法中的各个步骤。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
本发明公开了A1、一种实现内容定制的方法,其中,该方法包括:
获取关键词;
提供内容定制页面,并在内容定制页面上展示所获取的关键词供用户进行选择;
获取用户在所述内容定制页面上选择的一个或多个关键词对应的语义特征向量;
将所述语义特征向量输入到实现文本转图片/视频的神经网络中,得到该神经网络输出的图片/视频;
将所述图片/视频展示给用户。
A2、如A1所述的方法,其中,所述获取关键词包括如下中的一种或多种:
从用户的画像信息中提取关键词;
从用户浏览过的视频内容中提取关键词;
获取最近的预设时间长度内的搜索热点词作为关键词。
A3、如A2所述的方法,其中,所述从用户浏览过的视频内容中提取关键词包括如下中的一种或多种:
从所述视频的标题中提取实体词作为关键词;
从所述视频的字幕信息中提取实体词,并进行筛选后作为关键词;
从所述视频的图像中识别出文字,从识别出的文字中提取关键词。
A4、如A1所述的方法,其中,所述在内容定制页面上展示所获取的关键词供用户进行选择包括:
在内容定制页面上展示与所获取的各关键词对应的组件,以及展示一个工作面板区域;
当一个关键词对应的组件被拖动到所述工作面板区域时,确定该关键词被用户选择。
A5、如A1所述的方法,其中,所述获取用户在所述内容定制页面上选择的一个或多个关键词对应的语义特征向量包括:
将所述一个或多个关键词输入到分析语义特征的神经网络,得到该神经网络输出的对应的语义特征向量。
A6、如A1所述的方法,其中,在将所述语义特征向量输入到实现文本转图片/视频的神经网络中之前,该方法还包括:
将所述语义特征向量与高斯白噪声向量进行整合;
将整合后的向量输入到实现文本转图片/视频的神经网络中。
本发明还公开了B7、一种实现内容定制的装置,其中,该装置包括:
关键词获取单元,适于获取关键词;
提供单元,适于提供内容定制页面,并在内容定制页面上展示所获取的关键词供用户进行选择;
特征向量获取单元,适于获取用户在所述内容定制页面上选择的一个或多个关键词对应的语义特征向量;
输入单元,适于将所述语义特征向量输入到实现文本转图片/视频的神经网络中,得到该神经网络输出的图片/视频;
展示单元,适于将所述图片/视频展示给用户。
B8、如B7所述的装置,其中,所述关键词获取单元,适于如下中的一种或多种:
从用户的画像信息中提取关键词;
从用户浏览过的视频内容中提取关键词;
获取最近的预设时间长度内的搜索热点词作为关键词。
B9、如B8所述的装置,其中,所述关键词获取单元,进一步适于如下中的一种或多种:
从所述视频的标题中提取实体词作为关键词;
从所述视频的字幕信息中提取实体词,并进行筛选后作为关键词;
从所述视频的图像中识别出文字,从识别出的文字中提取关键词。
B10、如B7所述的装置,其中,
所述提供单元,适于在内容定制页面上展示与所获取的各关键词对应的组件,以及展示一个工作面板区域;当一个关键词对应的组件被拖动到所述工作面板区域时,确定该关键词被用户选择。
B11、如B7所述的装置,其中,
所述特征向量获取单元,适于将所述一个或多个关键词输入到分析语义特征的神经网络,得到该神经网络输出的对应的语义特征向量。
B12、如B7所述的装置,其中,在所述输入单元将所述语义特征向量输入到实现文本转图片/视频的神经网络中之前,该装置还包括:
整合单元,适于将所述语义特征向量与高斯白噪声向量进行整合;
所述输入单元,适于将整合后的向量输入到实现文本转图片/视频的神经网络中。
本发明还公开了C13、一种电子设备,其中,该电子设备包括:
处理器;以及,
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据A1~A6中任一项所述的方法。
本发明还公开了D14、一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现A1~A6中任一项所述的方法。
Claims (10)
1.一种实现内容定制的方法,其中,该方法包括:
获取关键词;
提供内容定制页面,并在内容定制页面上展示所获取的关键词供用户进行选择;
获取用户在所述内容定制页面上选择的一个或多个关键词对应的语义特征向量;
将所述语义特征向量输入到实现文本转图片/视频的神经网络中,得到该神经网络输出的图片/视频;
将所述图片/视频展示给用户。
2.如权利要求1所述的方法,其中,所述获取关键词包括如下中的一种或多种:
从用户的画像信息中提取关键词;
从用户浏览过的视频内容中提取关键词;
获取最近的预设时间长度内的搜索热点词作为关键词。
3.如权利要求2所述的方法,其中,所述从用户浏览过的视频内容中提取关键词包括如下中的一种或多种:
从所述视频的标题中提取实体词作为关键词;
从所述视频的字幕信息中提取实体词,并进行筛选后作为关键词;
从所述视频的图像中识别出文字,从识别出的文字中提取关键词。
4.如权利要求1所述的方法,其中,所述在内容定制页面上展示所获取的关键词供用户进行选择包括:
在内容定制页面上展示与所获取的各关键词对应的组件,以及展示一个工作面板区域;
当一个关键词对应的组件被拖动到所述工作面板区域时,确定该关键词被用户选择。
5.如权利要求1所述的方法,其中,所述获取用户在所述内容定制页面上选择的一个或多个关键词对应的语义特征向量包括:
将所述一个或多个关键词输入到分析语义特征的神经网络,得到该神经网络输出的对应的语义特征向量。
6.如权利要求1所述的方法,其中,在将所述语义特征向量输入到实现文本转图片/视频的神经网络中之前,该方法还包括:
将所述语义特征向量与高斯白噪声向量进行整合;
将整合后的向量输入到实现文本转图片/视频的神经网络中。
7.一种实现内容定制的装置,其中,该装置包括:
关键词获取单元,适于获取关键词;
提供单元,适于提供内容定制页面,并在内容定制页面上展示所获取的关键词供用户进行选择;
特征向量获取单元,适于获取用户在所述内容定制页面上选择的一个或多个关键词对应的语义特征向量;
输入单元,适于将所述语义特征向量输入到实现文本转图片/视频的神经网络中,得到该神经网络输出的图片/视频;
展示单元,适于将所述图片/视频展示给用户。
8.如权利要求7所述的装置,其中,所述关键词获取单元,适于如下中的一种或多种:
从用户的画像信息中提取关键词;
从用户浏览过的视频内容中提取关键词;
获取最近的预设时间长度内的搜索热点词作为关键词。
9.一种电子设备,其中,该电子设备包括:
处理器;以及,
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据权利要求1~6中任一项所述的方法。
10.一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现权利要求1~6中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810117407.0A CN108460104B (zh) | 2018-02-06 | 2018-02-06 | 一种实现内容定制的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810117407.0A CN108460104B (zh) | 2018-02-06 | 2018-02-06 | 一种实现内容定制的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108460104A true CN108460104A (zh) | 2018-08-28 |
CN108460104B CN108460104B (zh) | 2021-06-18 |
Family
ID=63239557
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810117407.0A Active CN108460104B (zh) | 2018-02-06 | 2018-02-06 | 一种实现内容定制的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108460104B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109218629A (zh) * | 2018-09-14 | 2019-01-15 | 三星电子(中国)研发中心 | 视频生成方法、存储介质和装置 |
CN109462730A (zh) * | 2018-10-25 | 2019-03-12 | 百度在线网络技术(北京)有限公司 | 基于视频获取全景图的方法和装置 |
CN109635273A (zh) * | 2018-10-25 | 2019-04-16 | 平安科技(深圳)有限公司 | 文本关键词提取方法、装置、设备及存储介质 |
CN109743617A (zh) * | 2018-12-03 | 2019-05-10 | 清华大学 | 一种视频播放的跳转导航方法和设备 |
CN109815448A (zh) * | 2019-02-02 | 2019-05-28 | 天津字节跳动科技有限公司 | 幻灯片生成方法及装置 |
CN110381381A (zh) * | 2019-06-21 | 2019-10-25 | 深圳市轱辘汽车维修技术有限公司 | 一种视频定制方法、视频定制装置及电子设备 |
CN113099267A (zh) * | 2021-06-04 | 2021-07-09 | 武汉卓尔数字传媒科技有限公司 | 视频生成方法、装置、电子设备及存储介质 |
CN114302227A (zh) * | 2021-12-28 | 2022-04-08 | 北京智美互联科技有限公司 | 基于容器采集的网络视频采集与解析的方法和系统 |
WO2022171052A1 (zh) * | 2021-02-10 | 2022-08-18 | 北京字节跳动网络技术有限公司 | 视频获取的方法、视频分享的方法、装置、设备和介质 |
EP4149109A4 (en) * | 2020-05-30 | 2023-10-25 | Huawei Technologies Co., Ltd. | VIDEO PRODUCTION METHOD AND APPARATUS |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103309993A (zh) * | 2013-06-20 | 2013-09-18 | 天脉聚源(北京)传媒科技有限公司 | 一种关键词的提取方法及装置 |
CN104216881A (zh) * | 2013-05-29 | 2014-12-17 | 腾讯科技(深圳)有限公司 | 一种个性化标签的推荐方法及装置 |
CN104424249A (zh) * | 2013-08-28 | 2015-03-18 | 富泰华工业(深圳)有限公司 | 个性化网页系统及实现方法 |
CN105045901A (zh) * | 2015-08-05 | 2015-11-11 | 百度在线网络技术(北京)有限公司 | 搜索关键词的推送方法和装置 |
CN105740343A (zh) * | 2016-01-25 | 2016-07-06 | 百度在线网络技术(北京)有限公司 | 搜索方法和装置 |
US20170011291A1 (en) * | 2015-07-07 | 2017-01-12 | Adobe Systems Incorporated | Finding semantic parts in images |
US20170061250A1 (en) * | 2015-08-28 | 2017-03-02 | Microsoft Technology Licensing, Llc | Discovery of semantic similarities between images and text |
CN106507143A (zh) * | 2016-10-21 | 2017-03-15 | 北京小米移动软件有限公司 | 视频推荐方法及装置 |
CN106649316A (zh) * | 2015-10-29 | 2017-05-10 | 北京国双科技有限公司 | 一种视频推送方法及装置 |
-
2018
- 2018-02-06 CN CN201810117407.0A patent/CN108460104B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104216881A (zh) * | 2013-05-29 | 2014-12-17 | 腾讯科技(深圳)有限公司 | 一种个性化标签的推荐方法及装置 |
CN103309993A (zh) * | 2013-06-20 | 2013-09-18 | 天脉聚源(北京)传媒科技有限公司 | 一种关键词的提取方法及装置 |
CN104424249A (zh) * | 2013-08-28 | 2015-03-18 | 富泰华工业(深圳)有限公司 | 个性化网页系统及实现方法 |
US20170011291A1 (en) * | 2015-07-07 | 2017-01-12 | Adobe Systems Incorporated | Finding semantic parts in images |
CN105045901A (zh) * | 2015-08-05 | 2015-11-11 | 百度在线网络技术(北京)有限公司 | 搜索关键词的推送方法和装置 |
US20170061250A1 (en) * | 2015-08-28 | 2017-03-02 | Microsoft Technology Licensing, Llc | Discovery of semantic similarities between images and text |
CN106649316A (zh) * | 2015-10-29 | 2017-05-10 | 北京国双科技有限公司 | 一种视频推送方法及装置 |
CN105740343A (zh) * | 2016-01-25 | 2016-07-06 | 百度在线网络技术(北京)有限公司 | 搜索方法和装置 |
CN106507143A (zh) * | 2016-10-21 | 2017-03-15 | 北京小米移动软件有限公司 | 视频推荐方法及装置 |
Non-Patent Citations (3)
Title |
---|
ALEC RADFORD&LUKE METZ: "UNSUPERVISED REPRESENTATION LEARNING WITH DEEP CONVOLUTIONAL GENERATIVE ADVERSARIAL NETWORKS", 《UNDER REVIEW AS A CONFERENCE PAPER AT ICLR 2016》 * |
SCOTT REED: "Generative Adversarial Text to Image Synthesis", 《ARXIV:1605.05396V2》 * |
徐一峰: "生成对抗网络理论模型和应用综述", 《金华职业技术学院学报》 * |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109218629A (zh) * | 2018-09-14 | 2019-01-15 | 三星电子(中国)研发中心 | 视频生成方法、存储介质和装置 |
CN109218629B (zh) * | 2018-09-14 | 2021-02-05 | 三星电子(中国)研发中心 | 视频生成方法、存储介质和装置 |
CN109462730A (zh) * | 2018-10-25 | 2019-03-12 | 百度在线网络技术(北京)有限公司 | 基于视频获取全景图的方法和装置 |
CN109635273A (zh) * | 2018-10-25 | 2019-04-16 | 平安科技(深圳)有限公司 | 文本关键词提取方法、装置、设备及存储介质 |
CN109743617B (zh) * | 2018-12-03 | 2020-11-24 | 清华大学 | 一种视频播放的跳转导航方法和设备 |
CN109743617A (zh) * | 2018-12-03 | 2019-05-10 | 清华大学 | 一种视频播放的跳转导航方法和设备 |
CN109815448A (zh) * | 2019-02-02 | 2019-05-28 | 天津字节跳动科技有限公司 | 幻灯片生成方法及装置 |
CN109815448B (zh) * | 2019-02-02 | 2024-02-27 | 天津字节跳动科技有限公司 | 幻灯片生成方法及装置 |
CN110381381A (zh) * | 2019-06-21 | 2019-10-25 | 深圳市轱辘汽车维修技术有限公司 | 一种视频定制方法、视频定制装置及电子设备 |
EP4149109A4 (en) * | 2020-05-30 | 2023-10-25 | Huawei Technologies Co., Ltd. | VIDEO PRODUCTION METHOD AND APPARATUS |
WO2022171052A1 (zh) * | 2021-02-10 | 2022-08-18 | 北京字节跳动网络技术有限公司 | 视频获取的方法、视频分享的方法、装置、设备和介质 |
CN113099267A (zh) * | 2021-06-04 | 2021-07-09 | 武汉卓尔数字传媒科技有限公司 | 视频生成方法、装置、电子设备及存储介质 |
CN113099267B (zh) * | 2021-06-04 | 2021-11-12 | 武汉卓尔数字传媒科技有限公司 | 视频生成方法、装置、电子设备及存储介质 |
CN114302227A (zh) * | 2021-12-28 | 2022-04-08 | 北京智美互联科技有限公司 | 基于容器采集的网络视频采集与解析的方法和系统 |
CN114302227B (zh) * | 2021-12-28 | 2024-04-26 | 北京国瑞数智技术有限公司 | 基于容器采集的网络视频采集与解析的方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN108460104B (zh) | 2021-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108460104A (zh) | 一种实现内容定制的方法和装置 | |
JP7562612B2 (ja) | アンケートを生成するための方法およびシステム | |
Bebko et al. | bmlTUX: Design and control of experiments in virtual reality and beyond | |
Yuan et al. | Infocolorizer: Interactive recommendation of color palettes for infographics | |
Campbell et al. | Considering methodological options for reviews of theory: illustrated by a review of theories linking income and health | |
Booshehrian et al. | Vismon: Facilitating analysis of trade‐offs, uncertainty, and sensitivity in fisheries management decision making | |
Davis et al. | Building semantic memory from embodied and distributional language experience | |
EP1782285A1 (en) | Methods and apparatus for query refinement using genetic algorithms | |
CN109271594A (zh) | 电子书的推荐方法、电子设备及计算机存储介质 | |
CN108470036A (zh) | 一种基于故事文本生成视频的方法和装置 | |
Reinhartz-Berger et al. | Domain engineering | |
Baumberg | The secret life of science: how it really works and why it matters | |
CN106507686A (zh) | 设计不同技术领域的复杂信息物理系统的具有其各种软件工件的软件架构的方法和工具 | |
CN108415935A (zh) | 一种推送推荐消息的方法、装置 | |
McCormack et al. | Deep learning of individual aesthetics | |
Heger et al. | The hierarchy-of-hypotheses approach: a synthesis method for enhancing theory development in ecology and evolution | |
Hsiao et al. | A study on the application of an artificial neural algorithm in the color matching of Taiwanese cultural and creative commodities | |
Pritchard | Examining web images: a combined visual analysis (cva) Approach | |
Kim et al. | Drawing guidelines for receiver operating characteristic curve in preparation of manuscripts | |
Dondi et al. | Multimodal workflow for the creation of interactive presentations of 360 spin images of historical violins | |
CN108460106A (zh) | 一种识别广告视频的方法和装置 | |
CN107633480A (zh) | 一种图像处理方法和装置 | |
Albohn et al. | A data-driven, hyper-realistic method for visualizing individual mental representations of faces | |
CN106557496A (zh) | 一种表格配置方法和装置 | |
Toharia et al. | PyramidalExplorer: a new interactive tool to explore morpho-functional relations of human pyramidal neurons |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |