CN113468373B - 信息获取方法、装置、电子设备及存储介质 - Google Patents
信息获取方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113468373B CN113468373B CN202110605485.7A CN202110605485A CN113468373B CN 113468373 B CN113468373 B CN 113468373B CN 202110605485 A CN202110605485 A CN 202110605485A CN 113468373 B CN113468373 B CN 113468373B
- Authority
- CN
- China
- Prior art keywords
- resource
- introduction
- text
- introduction text
- generation model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/735—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7844—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开是关于一种信息获取方法、装置、电子设备及存储介质,该方法包括:获取待介绍资源的特征信息;利用文本生成模型基于待介绍资源的特征信息,得到待介绍资源对应的介绍文本,其中,文本生成模型被预先通过参考用户对应的训练数据训练,所述参考用户对应的训练数据包括:所述参考用户通过所述参考用户的视频介绍的参考资源的特征信息、所述参考资源对应的介绍文本,所述参考资源对应的介绍文本基于所述参考用户的视频的语音信号对应的语音识别结果确定;将所述待介绍资源对应的介绍文本发送至目标用户的终端,以将所述待介绍资源对应的介绍文本提供给所述目标用户。
Description
技术领域
本公开涉及视频领域,尤其涉及信息获取方法、装置、电子设备及存储介质。
背景技术
在诸如网络主播的用户通过诸如直播视频的视频介绍资源之前,需要准备资源对应的介绍文本,用户根据资源对应的介绍文本,说出介绍资源的话语。目前,需要用户预先自行撰写资源对应的介绍文本。
然而,绝大多数需要介绍资源的用户由于缺乏全面地介绍资源以吸引观众的经验,导致需要介绍资源的用户自行撰写的资源对应的介绍文本的内容的丰富程度较低。
发明内容
为克服相关技术中存在的问题,本公开提供一种信息获取方法、装置、电子设备及存储介质,以至少解决相关技术中的资源对应的介绍文本的内容的丰富程度较低的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种信息获取方法,包括:
获取待介绍资源的特征信息;
利用文本生成模型基于待介绍资源的特征信息,得到待介绍资源对应的介绍文本,其中,文本生成模型被预先通过参考用户对应的训练数据训练,所述参考用户对应的训练数据包括:所述参考用户通过所述参考用户的视频介绍的参考资源的特征信息、所述参考资源对应的介绍文本,所述参考资源对应的介绍文本基于所述参考用户的视频的语音信号对应的语音识别结果确定;
将所述待介绍资源对应的介绍文本发送至目标用户的终端,以将所述待介绍资源对应的介绍文本提供给所述目标用户。
在一些实施例中,所述参考用户对应的训练数据还包括:所述参考资源对应的介绍文本的风格的标识;在获取待介绍资源的特征信息之前,所述方法还包括:
将所述参考资源对应的介绍文本的风格的标识和参考资源的特征信息输入到文本生成模型中,得到文本生成模型输出的所述参考资源对应的预测介绍文本;
基于所述参考资源对应的预测介绍文本与所述参考资源对应的介绍文本之间的差值,更新文本生成模型的参数的参数值,其中,所述参考资源对应的预测介绍文本与所述参考资源对应的介绍文本之间的差值指示参考资源对应的预测介绍文本与所述参考资源对应的介绍文本的差异程度。
在一些实施例中,利用文本生成模型基于待介绍资源的特征信息,得到待介绍资源对应的介绍文本包括:
将待介绍资源的特征信息输入到文本生成模型中,得到文本生成模型输出的多个候选介绍文本;
将多个候选介绍文本中的、风格为目标风格的候选介绍文本确定为待介绍资源对应的介绍文本,其中,目标风格为所述目标用户从多个风格中选择出的风格。
在一些实施例中,利用文本生成模型基于待介绍资源的特征信息,得到待介绍资源对应的介绍文本包括:
将待介绍资源的特征信息输入到文本生成模型中,得到文本生成模型输出的多个候选介绍文本和每一个候选介绍文本的置信度;
将置信度最高的候选介绍文本确定为待介绍资源对应的介绍文本。
在一些实施例中,在获取待介绍资源的特征信息之前,所述方法还包括:
获取参考资源的描述信息;
对参考资源的图像进行图像识别,得到参考资源的外观信息;
基于参考资源的描述信息和参考资源的外观信息,生成参考资源的特征信息。
根据本公开实施例的第二方面,提供一种信息获取装置,包括:
特征信息获取模块被配置为获取待介绍资源的特征信息;
介绍文本生成模块被配置为利用文本生成模型基于待介绍资源的特征信息,得到待介绍资源对应的介绍文本,其中,文本生成模型被预先通过参考用户对应的训练数据训练,所述参考用户对应的训练数据包括:所述参考用户通过所述参考用户的视频介绍的参考资源的特征信息、所述参考资源对应的介绍文本,所述参考资源对应的介绍文本基于所述参考用户的视频的语音信号对应的语音识别结果确定;
介绍文本发送模块被配置为将所述待介绍资源对应的介绍文本发送至目标用户的终端,以将所述待介绍资源对应的介绍文本提供给所述目标用户。
在一些实施例中,所述参考用户对应的训练数据还包括:所述参考资源对应的介绍文本的风格的标识;信息获取装置还包括:
训练模块,被配置为在获取待介绍资源的特征信息之前,将所述参考资源对应的介绍文本的风格的标识和参考资源的特征信息输入到文本生成模型中,得到文本生成模型输出的所述参考资源对应的预测介绍文本;基于所述参考资源对应的预测介绍文本与所述参考资源对应的介绍文本之间的差值,更新文本生成模型的参数的参数值,其中,所述参考资源对应的预测介绍文本与所述参考资源对应的介绍文本之间的差值指示参考资源对应的预测介绍文本与所述参考资源对应的介绍文本的差异程度。
在一些实施例中,介绍文本生成模块进一步被配置为将待介绍资源的特征信息输入到文本生成模型中,得到文本生成模型输出的多个候选介绍文本;将多个候选介绍文本中的、风格为目标风格的候选介绍文本确定为待介绍资源对应的介绍文本,其中,目标风格为所述目标用户从多个风格中选择出的风格。
在一些实施例中,介绍文本生成模块进一步被配置为将待介绍资源的特征信息输入到文本生成模型中,得到文本生成模型输出的多个候选介绍文本和每一个候选介绍文本的置信度;将置信度最高的候选介绍文本确定为待介绍资源对应的介绍文本。
在一些实施例中,信息获取装置还包括:
特征信息获取模块,被配置为在获取待介绍资源的特征信息之前,获取参考资源的描述信息;对参考资源的图像进行图像识别,得到参考资源的外观信息;基于参考资源的描述信息和参考资源的外观信息,生成参考资源的特征信息。
本公开的实施例提供的技术方案可以包括以下有益效果:
预先通过受欢迎程度高的参考用户对应的训练数据训练文本生成模型,受欢迎程度高的参考用户对应的训练数据中的、内容的丰富程度较高的介绍文本参与文本生成模型的训练,从而,可以训练文本生成模型生成内容的丰富程度较高的介绍文本。利用文本生成模型基于待介绍资源的特征信息,得到待介绍资源对应的介绍文本,待介绍资源对应的介绍文本的丰富程度较高,将丰富程度较高的待介绍资源对应的介绍文本发送至目标用户的终端,从而,将丰富程度较高的待介绍资源对应的介绍文本提供给目标用户。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种信息获取方法的一个实施例的流程图;
图2是根据一示例性实施例示出的一种信息获取装置的结构框图;
图3是根据一示例性实施例示出的一种电子设备的结构框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的信息获取方法的一个实施例的流程图。该方法包括以下步骤:
步骤101,获取待介绍资源的特征信息。
在本公开中,待介绍资源的特征信息可以包括待介绍资源的名称、待介绍资源的品牌、待介绍资源的产地、待介绍资源的价格、待介绍资源的尺寸等。
待介绍资源的特征信息可以由目标用户输入。目标用户在目标用户的终端上输入待介绍资源的特征信息,目标用户的终端将待介绍资源的特征信息发送至执行本公开实施例提供的信息获取方法的电子设备,从而,获取到参考待介绍资源的特征信息。
步骤102,利用文本生成模型基于待介绍资源的特征信息,得到待介绍资源对应的介绍文本。
在本公开中,用户可以为网络主播、视频创作者例如短视频创作者等。参考用户为受欢迎程度高的用户。例如,用户为网络主播,参考用户可以为称之为知名网络主播,目标用户可以称之为普通网络主播。例如,用户为视频创作者,参考用户可以称之为知名视频创作者。
在本公开中,可以由视频平台的运营人员预先设置用于判断用户是否为参考用户的条件项。例如,一个用户为网络主播,若该用户的直播间满足以下条件项,则确定该用户为参考用户:该用户的直播间的观众数量的平均值大于观众数量阈值、该用户的粉丝数量大于粉丝数量阈值。例如,一个用户为视频创作者,若用户满足以下条件项,则确定该用户为参考用户:该用户发布的视频的数量大于视频发布数量阈值、该用户的粉丝数量大于粉丝数量阈值。
在本公开中,参考用户的视频可以为用于介绍资源的网络直播视频、用于介绍资源的短视频等。
在本公开中,文本生成模型可以为编码器-解码器(Encoder-Decoder)类型的神经网络例如U-Net网络。可以预先利用多个参考用户对应的训练数据对文本生成模型进行训练,使得文本生成模型学习资源的特征信息与介绍文本之间的关联关系。
在本公开中,参考资源为参考用户通过参考用户的视频介绍的资源。
对于每一个参考用户,该参考用户对应的训练数据包括:该参考用户通过该参考用户的视频介绍的参考资源的特征信息、该参考资源对应的介绍文本,该参考资源的特征信息可以包括该参考资源的名称、该参考资源的品牌、该参考资源的产地、该参考资源的价格、该参考资源的尺寸等。
在本公开中,对于任意一个参考用户,可以预先获取参考用户的视频,对参考用户的视频的语音信号进行语音识别,得到参考用户的视频对应的语音识别结果,从该参考用户的视频对应的语音识别结果中提取出通过该参考用户的视频介绍的参考资源对应的介绍文本,该参考资源对应的介绍文本包括:该参考用户的用于介绍资源的话语。
在本公开中,对于任意一个参考用户,该参考用户对应的训练数据的数量为多个。对于任意一个参考用户,可以获取该参考用户的多个视频,对于该参考用户的每一个视频,可以从该视频对应的语音识别结果中提取出通过该视频介绍的参考资源对应的介绍文本,将该参考资源的特征信息和该参考资源对应的介绍文本组成该参考用户对应的一个训练数据。
每一次训练文本生成模型,可以将一个参考用户对应的一个训练数据中的参考资源的特征信息输入到文本生成模型中,文本生成模型输出该参考资源对应的预测介绍文本,计算该参考资源对应的预测介绍文本与该参考资源对应的介绍文本之间的损失,根据该参考资源对应的预测介绍文本与该训练数据中的该参考资源对应的介绍文本之间的损失,更新文本生成模型的参数的参数值。
在本公开中,在利用文本生成模型基于待介绍资源的特征信息,得到待介绍资源对应的介绍文本时,可以将待介绍资源的特征信息输入到文本生成模型中,得到文本生成模型输出的多个候选介绍文本,可以从多个候选介绍文本中选择出待介绍资源对应的介绍文本。
例如,可以以随机方式从多个候选介绍文本选择出待介绍资源对应的介绍文本。例如,可以将多个候选介绍文本中的长度最长的候选介绍文本选择为待介绍资源对应的介绍文本。
在一些实施例中,在获取待介绍资源的特征信息之前,还包括:获取参考资源的描述信息;对该参考资源的图像进行图像识别,得到该参考资源的外观信息;基于该参考资源的描述信息和该参考资源的外观信息,生成该参考资源的特征信息。
在本公开中,对于任意一个参考资源,可以从存储该参考资源的描述信息的服务器获取该参考资源的描述信息,该参考资源的描述信息可以包括该参考资源的名称、该参考资源的品牌、该参考资源的产地、该参考资源的价格、该参考资源的尺寸等。
对于任意一个参考资源,可以对该参考资源的图像进行图像识别,得到该参考资源的外观信息,该参考资源的外观信息可以包括该参考资源的形状、该参考资源的颜色等。对于任意一个参考资源,可以利用用于识别图像中的对象的形状、颜色的神经网络对该参考资源的图像进行图像识别,得到该参考资源的外观信息。
对于任意一个参考资源,若该参考资源的描述信息包括参考资源的外观信息,可以直接将该参考资源的描述信息作为参考资源的特征信息。若该参考资源的外观信息包括未被该参考资源的描述信息包括的信息项,将该参考资源的外观信息中的未被该参考资源的描述信息包括的信息项与该参考资源的描述信息进行组合,得到该参考资源的特征信息。
在本公开中,可以同时根据参考资源的描述信息和参考资源的外观信息,生成参考资源的特征信息,使得参考资源的特征信息的信息丰富度较高,参考资源的特征信息可以较为全面地描述参考资源的特征。
在一些实施例中,参考用户对应的训练数据还包括:该参考用户通过该参考用户的视频介绍的参考资源对应的介绍文本的风格的标识;在获取待介绍资源的特征信息之前,还包括:将该参考资源对应的介绍文本的风格的标识和该参考资源的特征信息输入到文本生成模型中,得到文本生成模型输出的该参考资源对应的预测介绍文本;基于该参考资源对应的预测介绍文本与该参考资源对应的介绍文本之间的差值,更新文本生成模型的参数的参数值,该参考资源对应的预测介绍文本与该参考资源对应的介绍文本之间的差值指示该参考资源对应的预测介绍文本与该参考资源对应的介绍文本的差异程度。
参考资源对应的预测介绍文本与参考资源对应的介绍文本之间的差值,参考资源对应的预测介绍文本与参考资源对应的介绍文本之间的差值可以为参考资源对应的预测介绍文本与参考资源对应的介绍文本之间的损失。参考资源对应的预测介绍文本与参考资源对应的介绍文本之间的损失可以通过用于计算两个文本的差异程度的损失函数,针对参考资源对应的预测介绍文本和参考资源对应的介绍文本进行差异程度计算得到。
每一次训练文本生成模型,可以将参考用户对应的训练数据中的参考资源的特征信息和该训练数据中的参考资源对应的介绍文本的风格的标识输入到文本生成模型中,以训练文本生成模型生成风格为被输入的参考资源对应的介绍文本的风格的介绍文本。
对于任意一个参考资源对应的介绍文本,文本生成模型根据该参考资源对应的介绍文本的风格的标识,确定该参考资源对应的介绍文本的风格,文本生成模型学习该参考资源对应的介绍文本中的可以用于区分该风格和其他风格的、该风格关键语句,在完成对文本生成模型的训练之后,文本生成模型学习可以生成包括该风格的关键语句的、该风格的介绍文本。
例如,一个参考用户为一个网络主播,该网络主播介绍多个不同的参考资源中的每一个参考资源时均会说“全网最低价”。对应于该网络主播的每一个训练数据中的介绍文本均包括“全网最低价”。对应于该网络主播的每一个训练数据中的介绍文本的风格的标识相同。在完成对文本生成模型的训练之后,文本生成模型学习可以生成包括该风格的关键语句“全网最低价”的、该风格的介绍文本。
在本公开中,参考资源对应的介绍文本的风格可以相当于通过视频介绍该参考资源的参考用户的介绍风格。每一个参考用户对应的训练数据中的介绍文本的风格的标识不同,同一个参考用户介绍的每一个参考资源对应的介绍文本的风格相同。
在本公开中,若利用多个参考用户的包括文本的风格的标识的训练数据对文本生成模型进行训练,在完成对文本生成模型的训练之后,文本生成模型可以基于输入的相应的资源的特征信息,生成多个不同的风格的相应的资源对应的介绍文本。在利用文本生成模型基于待介绍资源的特征信息,得到待介绍资源对应的介绍文本时,将待介绍资源的特征信息输入到文本生成模型中,文本生成模型可以输出多个不同的风格的该待介绍资源对应的候选介绍文本。
在本公开中,每一次训练文本生成模型,除了参考用户通过参考用户的视频介绍的参考资源的特征信息、参考资源对应的介绍文本,参考用户通过该参考用户的视频介绍的参考资源对应的介绍文本的风格的标识也参与训练,从而,使得文本生成模型可以学习参考资源的特征信息与参考资源对应的该风格的、介绍文本之间的关联关系,进而使得在训练之后,文本生成模型可以生成该风格的介绍文本。
在一些实施例中,利用文本生成模型基于待介绍资源的特征信息,得到待介绍资源对应的介绍文本包括:将待介绍资源的特征信息输入到文本生成模型中,得到文本生成模型输出的多个候选介绍文本;将多个候选介绍文本中的、风格为目标风格的候选介绍文本确定为待介绍资源对应的介绍文本,其中,目标风格为目标用户从多个风格中选择出的风格。
在本公开中,若利用多个参考用户的包括风格的标识的训练数据对文本生成模型进行训练,文本生成模型可以基于输入的相应的资源的特征信息,生成多个不同的风格的相应的资源对应的介绍文本。将待介绍资源的特征信息输入到文本生成模型中,文本生成模型可以输出多个候选介绍文本,文本生成模型输出的多个候选介绍文本中的每一个候选介绍文本分别具有一个风格。
在本公开中,可以在目标用户的终端上展示多个风格。由目标用户通过选择操作从多个风格中选择出目标风格。目标用户的终端可以将目标风格的标识发送至发送至执行本公开实施例提供的信息获取方法的电子设备。可以根据目标风格的标识,确定目标风格。然后,可以将多个候选介绍文本中的、风格为目标风格的候选介绍文本确定为待介绍资源对应的介绍文本。
在本公开中,可以由目标用户从多个风格中选择任意一个风格作为目标风格,利用文本生成模型基于待介绍资源的特征信息,得到目标风格的、待介绍资源对应的介绍文本,可以利用文本生成模型得到任意一个风格的、待介绍资源对应的介绍文本,同时,提升利用文本生成模型得到待介绍资源对应的介绍文本的灵活性。
在一些实施例中,利用文本生成模型基于待介绍资源的特征信息,得到待介绍资源对应的介绍文本包括:将待介绍资源的特征信息输入到文本生成模型中,得到文本生成模型输出的多个候选介绍文本和每一个候选介绍文本的置信度;将置信度最高的候选介绍文本确定为待介绍资源对应的介绍文本。
候选介绍文本的置信度指示候选介绍文本的可信程度。在利用文本生成模型基于待介绍资源的特征信息,得到待介绍资源对应的介绍文本时,可以将文本生成模型输出的多个候选介绍文本中的、置信度最高的候选介绍文本确定为待介绍资源对应的介绍文本。
在本公开中,在利用文本生成模型,得到待介绍资源对应的介绍文本时,可以将置信度最高即可信程度的候选介绍文本确定为待介绍资源对应的介绍文本,从而,可以使得得到的待介绍资源对应的介绍文本的准确性较高。
步骤103,将待介绍资源对应的介绍文本发送至目标用户的终端,以将待介绍资源对应的介绍文本提供给目标用户。
在本公开中,在将待介绍资源对应的介绍文本发送至目标用户的终端之后,可以在目标用户的终端展示待介绍资源对应的介绍文本,从而,将待介绍资源对应的介绍文本提供给目标用户。目标用户可以根据待介绍资源对应的介绍文本,介绍待介绍资源。
例如,在目标用户进行用于介绍待介绍资源的网络直播时,目标用户可以根据待介绍资源对应的介绍文本,说出介绍资源的话语,以介绍待介绍资源。例如,在拍摄目标用户的用于介绍待介绍资源的短视频时,目标用户可以根据待介绍资源对应的介绍文本,说出介绍资源的话语,以介绍待介绍资源。
在本公开中,预先通过受欢迎程度高的参考用户对应的训练数据训练文本生成模型,受欢迎程度高的参考用户对应的训练数据中的、内容的丰富程度较高的介绍文本参与文本生成模型的训练,从而,可以训练文本生成模型生成内容的丰富程度较高的介绍文本。利用文本生成模型基于待介绍资源的特征信息,得到待介绍资源对应的介绍文本,待介绍资源对应的介绍文本的丰富程度较高,将丰富程度较高的待介绍资源对应的介绍文本发送至目标用户的终端,从而,将丰富程度较高的待介绍资源对应的介绍文本提供给目标用户。
图2是根据一示例性实施例示出的一种信息获取装置的结构框图。参照图2,信息获取装置包括:特征信息获取模块201,介绍文本生成模块202,介绍文本发送模块203。
特征信息获取模块201被配置为获取待介绍资源的特征信息;
介绍文本生成模块202被配置为利用文本生成模型基于待介绍资源的特征信息,得到待介绍资源对应的介绍文本,其中,文本生成模型被预先通过参考用户对应的训练数据训练,所述参考用户对应的训练数据包括:所述参考用户通过所述参考用户的视频介绍的参考资源的特征信息、所述参考资源对应的介绍文本,所述参考资源对应的介绍文本基于所述参考用户的视频的语音信号对应的语音识别结果确定;
介绍文本发送模块203被配置为将所述待介绍资源对应的介绍文本发送至目标用户的终端,以将所述待介绍资源对应的介绍文本提供给所述目标用户。
在一些实施例中,所述参考用户对应的训练数据还包括:所述参考资源对应的介绍文本的风格的标识;信息获取装置还包括:
训练模块,被配置为在获取待介绍资源的特征信息之前,将所述参考资源对应的介绍文本的风格的标识和参考资源的特征信息输入到文本生成模型中,得到文本生成模型输出的所述参考资源对应的预测介绍文本;基于所述参考资源对应的预测介绍文本与所述参考资源对应的介绍文本之间的差值,更新文本生成模型的参数的参数值,其中,所述参考资源对应的预测介绍文本与所述参考资源对应的介绍文本之间的差值指示参考资源对应的预测介绍文本与所述参考资源对应的介绍文本的差异程度。
在一些实施例中,介绍文本生成模块进一步被配置为将待介绍资源的特征信息输入到文本生成模型中,得到文本生成模型输出的多个候选介绍文本;将多个候选介绍文本中的、风格为目标风格的候选介绍文本确定为待介绍资源对应的介绍文本,其中,目标风格为所述目标用户从多个风格中选择出的风格。
在一些实施例中,介绍文本生成模块进一步被配置为将待介绍资源的特征信息输入到文本生成模型中,得到文本生成模型输出的多个候选介绍文本和每一个候选介绍文本的置信度;将置信度最高的候选介绍文本确定为待介绍资源对应的介绍文本。
在一些实施例中,信息获取装置还包括:
特征信息获取模块,被配置为在获取待介绍资源的特征信息之前,获取参考资源的描述信息;对参考资源的图像进行图像识别,得到参考资源的外观信息;基于参考资源的描述信息和参考资源的外观信息,生成参考资源的特征信息。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图3是根据一示例性实施例示出的一种电子设备的结构框图。参照图3,电子设备包括处理组件322,其进一步包括一个或多个处理器,以及由存储器332所代表的存储器资源,用于存储可由处理组件322执行的指令,例如应用程序。存储器332中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件322被配置为执行指令,以执行上述信息获取方法。
电子设备还可以包括一个电源组件326被配置为执行电子设备的电源管理,一个有线或无线网络接口350被配置为将电子设备连接到网络,和一个输入输出(I/O)接口358。电子设备可以操作基于存储在存储器332的操作系统,例如Windows ServerTM,MacOS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
在示例性实施例中,还提供了一种包括指令的存储介质,例如包括指令的存储器,上述指令可由电子设备执行以完成上述信息获取方法。可选地,计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,本申请还提供一种计算机程序产品,包括计算机可读代码,当计算机可读代码在电子设备上运行时,使得电子设备执行信息获取方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
Claims (10)
1.一种信息获取方法,其特征在于,所述方法包括:
将参考资源对应的介绍文本的风格的标识和所述参考资源的特征信息输入到文本生成模型中,得到文本生成模型输出的所述参考资源对应的预测介绍文本;
基于所述参考资源对应的预测介绍文本与所述参考资源对应的介绍文本之间的差值,更新文本生成模型的参数值,其中,所述参考资源对应的预测介绍文本与所述参考资源对应的介绍文本之间的差值指示所述参考资源对应的预测介绍文本与所述参考资源对应的介绍文本的差异程度;
获取待介绍资源的特征信息;
利用文本生成模型基于所述待介绍资源的特征信息,得到所述待介绍资源对应的介绍文本,其中,所述文本生成模型被预先通过参考用户对应的训练数据训练,所述参考用户对应的训练数据包括:所述参考用户通过所述参考用户的视频介绍的参考资源的特征信息、所述参考资源对应的介绍文本,所述参考资源对应的介绍文本基于所述参考用户的视频的语音信号对应的语音识别结果确定;所述参考用户对应的训练数据还包括:所述参考资源对应的介绍文本的风格的标识;所述参考用户为受欢迎程度高的用户;
将所述待介绍资源对应的介绍文本发送至目标用户的终端,以将所述待介绍资源对应的介绍文本提供给所述目标用户。
2.根据权利要求1所述的方法,其特征在于,利用文本生成模型基于所述待介绍资源的特征信息,得到所述待介绍资源对应的介绍文本包括:
将所述待介绍资源的特征信息输入到文本生成模型中,得到文本生成模型输出的多个候选介绍文本;
将多个候选介绍文本中的、风格为目标风格的候选介绍文本确定为所述待介绍资源对应的介绍文本,其中,目标风格为所述目标用户从多个风格中选择出的风格。
3.根据权利要求1所述的方法,其特征在于,利用文本生成模型基于所述待介绍资源的特征信息,得到所述待介绍资源对应的介绍文本包括:
将所述待介绍资源的特征信息输入到文本生成模型中,得到文本生成模型输出的多个候选介绍文本和每一个候选介绍文本的置信度;
将置信度最高的候选介绍文本确定为所述待介绍资源对应的介绍文本。
4.根据权利要求1所述的方法,其特征在于,在获取待介绍资源的特征信息之前,所述方法还包括:
获取所述参考资源的描述信息;
对所述参考资源的图像进行图像识别,得到所述参考资源的外观信息;
基于所述参考资源的描述信息和所述参考资源的外观信息,生成所述参考资源的特征信息。
5.一种信息获取装置,其特征在于,所述装置包括:
训练模块,被配置为将参考资源对应的介绍文本的风格的标识和参考资源的特征信息输入到文本生成模型中,得到文本生成模型输出的所述参考资源对应的预测介绍文本;基于所述参考资源对应的预测介绍文本与所述参考资源对应的介绍文本之间的差值,更新文本生成模型的参数值,其中,所述参考资源对应的预测介绍文本与所述参考资源对应的介绍文本之间的差值指示参考资源对应的预测介绍文本与所述参考资源对应的介绍文本的差异程度;
特征信息获取模块,被配置为获取待介绍资源的特征信息;
介绍文本生成模块,被配置为利用文本生成模型基于所述待介绍资源的特征信息,得到所述待介绍资源对应的介绍文本,其中,文本生成模型被预先通过参考用户对应的训练数据训练,所述参考用户对应的训练数据包括:所述参考用户通过所述参考用户的视频介绍的参考资源的特征信息、所述参考资源对应的介绍文本,所述参考资源对应的介绍文本基于所述参考用户的视频的语音信号对应的语音识别结果确定;所述参考用户对应的训练数据还包括:所述参考资源对应的介绍文本的风格的标识;所述参考用户为受欢迎程度高的用户;
介绍文本发送模块,被配置为将所述待介绍资源对应的介绍文本发送至目标用户的终端,以将所述待介绍资源对应的介绍文本提供给所述目标用户。
6.据权利要求5所述的装置,其特征在于,介绍文本生成模块进一步被配置为将待介绍资源的特征信息输入到文本生成模型中,得到文本生成模型输出的多个候选介绍文本;将多个候选介绍文本中的、风格为目标风格的候选介绍文本确定为待介绍资源对应的介绍文本,其中,目标风格为所述目标用户从多个风格中选择出的风格。
7.据权利要求5所述的装置,其特征在于,文本生成模块进一步被配置为将待介绍资源的特征信息输入到文本生成模型中,得到文本生成模型输出的多个候选介绍文本和每一个候选介绍文本的置信度;将置信度最高的候选介绍文本确定为待介绍资源对应的介绍文本。
8.据权利要求5所述的装置,其特征在于,所述装置还包括:
特征信息获取模块,被配置为在获取待介绍资源的特征信息之前,获取参考资源的描述信息;对参考资源的图像进行图像识别,得到参考资源的外观信息;基于参考资源的描述信息和参考资源的外观信息,生成参考资源的特征信息。
9.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至4中任一项所述的方法。
10.一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1至4中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110605485.7A CN113468373B (zh) | 2021-05-31 | 2021-05-31 | 信息获取方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110605485.7A CN113468373B (zh) | 2021-05-31 | 2021-05-31 | 信息获取方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113468373A CN113468373A (zh) | 2021-10-01 |
CN113468373B true CN113468373B (zh) | 2022-09-02 |
Family
ID=77871972
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110605485.7A Active CN113468373B (zh) | 2021-05-31 | 2021-05-31 | 信息获取方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113468373B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103324729A (zh) * | 2013-06-27 | 2013-09-25 | 北京小米科技有限责任公司 | 一种推荐多媒体资源的方法和装置 |
CN105975535A (zh) * | 2016-04-29 | 2016-09-28 | 合网络技术(北京)有限公司 | 多媒体资源的推荐方法和装置 |
CN112868004A (zh) * | 2018-11-07 | 2021-05-28 | 深圳市欢太科技有限公司 | 资源推荐方法、装置、电子设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090259646A1 (en) * | 2008-04-09 | 2009-10-15 | Yahoo!, Inc. | Method for Calculating Score for Search Query |
-
2021
- 2021-05-31 CN CN202110605485.7A patent/CN113468373B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103324729A (zh) * | 2013-06-27 | 2013-09-25 | 北京小米科技有限责任公司 | 一种推荐多媒体资源的方法和装置 |
CN105975535A (zh) * | 2016-04-29 | 2016-09-28 | 合网络技术(北京)有限公司 | 多媒体资源的推荐方法和装置 |
CN112868004A (zh) * | 2018-11-07 | 2021-05-28 | 深圳市欢太科技有限公司 | 资源推荐方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
矩阵分解在大规模个性化推荐系统中的实际应用;徐细林等;《现代计算机(专业版)》;20181231;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113468373A (zh) | 2021-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110582025B (zh) | 用于处理视频的方法和装置 | |
CN109862393B (zh) | 视频文件的配乐方法、系统、设备及存储介质 | |
CN110263150B (zh) | 文本生成方法、装置、计算机设备及存储介质 | |
CN112533051B (zh) | 弹幕信息显示方法、装置、计算机设备和存储介质 | |
CN109547814B (zh) | 视频推荐方法、装置、服务器及存储介质 | |
CN110364146B (zh) | 语音识别方法、装置、语音识别设备及存储介质 | |
US11450311B2 (en) | System and methods for accent and dialect modification | |
CN108305643B (zh) | 情感信息的确定方法和装置 | |
US10839788B2 (en) | Systems and methods for selecting accent and dialect based on context | |
CN114666663A (zh) | 用于生成视频的方法和装置 | |
CN109582825B (zh) | 用于生成信息的方法和装置 | |
CN110234018A (zh) | 多媒体内容描述生成方法、训练方法、装置、设备及介质 | |
CN110059224B (zh) | 投影仪设备的视频检索方法、装置、设备及存储介质 | |
CN111147871B (zh) | 直播间歌唱识别方法、装置及服务器、存储介质 | |
CN110769267B (zh) | 一种视频的展示方法、装置、电子设备及存储介质 | |
CN112163560A (zh) | 一种视频信息处理方法、装置、电子设备及存储介质 | |
CN113411674A (zh) | 视频的播放控制方法、装置、电子设备及存储介质 | |
CN115640398A (zh) | 评论生成模型训练方法、评论生成方法、设备及存储介质 | |
CN113923475B (zh) | 一种视频合成方法及视频合成器 | |
CN118035711A (zh) | 一种针对大模型内容安全能力的评测方法及系统 | |
CN116074574A (zh) | 一种视频处理方法、装置、设备及存储介质 | |
CN117975942A (zh) | 语音识别模型的训练方法、语音识别方法及相关装置 | |
CN117253480A (zh) | 虚拟主播对话模型处理方法、装置及电子设备 | |
CN113468373B (zh) | 信息获取方法、装置、电子设备及存储介质 | |
CN113360630B (zh) | 交互信息提示方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |