CN111753107A - 资源展示方法、装置、设备及存储介质 - Google Patents

资源展示方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111753107A
CN111753107A CN202010584925.0A CN202010584925A CN111753107A CN 111753107 A CN111753107 A CN 111753107A CN 202010584925 A CN202010584925 A CN 202010584925A CN 111753107 A CN111753107 A CN 111753107A
Authority
CN
China
Prior art keywords
resource
picture
data
audio file
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010584925.0A
Other languages
English (en)
Inventor
张雷
唐高林
赵哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Internet Security Software Co Ltd
Original Assignee
Beijing Kingsoft Internet Security Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Internet Security Software Co Ltd filed Critical Beijing Kingsoft Internet Security Software Co Ltd
Priority to CN202010584925.0A priority Critical patent/CN111753107A/zh
Publication of CN111753107A publication Critical patent/CN111753107A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/438Presentation of query results
    • G06F16/4387Presentation of query results by the use of playlists
    • G06F16/4393Multimedia presentations, e.g. slide shows, multimedia albums
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • G06F16/433Query formulation using audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • G06F16/434Query formulation using image data, e.g. images, photos, pictures taken by a user
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/483Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09FDISPLAYING; ADVERTISING; SIGNS; LABELS OR NAME-PLATES; SEALS
    • G09F27/00Combined visual and audible advertising or displaying, e.g. for public address

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Library & Information Science (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例提供了一种资源展示方法、装置、设备及存储介质。其中,一种资源展示方法,应用于智能机器人,在展示关于宣传服务的资源数据时,判断所述资源数据表明的资源是否为图片资源;如果为图片资源,基于所述资源数据,获取与所述图片资源对应的音频文件;其中,所述音频文件用于表明所述资源数据所表明的图片资源的画面内容;在展示所述资源数据所表明的图片资源时,播放所述音频文件。本方案可以提高智能机器人提供的宣传服务的宣传有效性。

Description

资源展示方法、装置、设备及存储介质
技术领域
本发明涉及计算机技术领域,特别是涉及一种资源展示方法、装置、设备及存储介质。
背景技术
智能机器人具有能够认识周围环境、对周围环境做出反应以及自主动作的特点,因此,可以替代人工,应用于医院、商超以及银行等等需要大量人工服务的物理场景中,用于提供人工服务,例如宣传服务。并且,对于宣传服务而言,智能机器人具有显示屏,与人工宣传相比,可以利用显示屏进行宣传,提高宣传的生动性。
相关技术中,智能机器人可以在显示屏上展示用于宣传服务的资源,实现宣传服务。其中,宣传服务的资源可以是视频资源、图片资源以及文字资源等等,例如,广告视频,科普图片等。但是,图片资源通常只有画面效果,作为宣传对象的用户容易忽略而不观看该资源,导致宣传的有效性大大降低。
因此,如何提高在智能机器人提供的宣传服务中,图片资源的宣传有效性,是亟待解决的问题
发明内容
本发明实施例的目的在于提供一种资源展示方法、装置、设备及存储介质,以实现提高在智能机器人提供的宣传服务中,图片资源的宣传有效性。具体技术方案如下:
第一方面,本发明实施例提供了一种资源展示方法,应用于智能机器人,所述方法包括:
在展示关于宣传服务的资源数据时,判断所述资源数据表明的资源是否为图片资源;
如果为图片资源,基于所述资源数据,获取与所述图片资源对应的音频文件;其中,所述音频文件用于表明所述资源数据所表明的图片资源的画面内容;
在展示所述资源数据所表明的图片资源时,播放所述音频文件。
可选的,所述音频文件为利用文本到音频转换模型,处理所述图片资源对应的文本数据,得到的文件;
其中,所述图片资源对应的文本数据为能够描述所述图片资源的画面内容的数据。
可选的,所述资源数据为服务器发送的数据,包括所述图片资源的标识;
所述图片资源对应的文本数据为所述服务器从运维人员提交的资源数据中查找的数据,且所述服务器将所述文本数据输入所述文本到音频转换模型,得到所述与所述图片资源对应的音频文件;
所述基于所述资源数据,获取与所述图片资源对应的音频文件,包括:
从所述资源数据中查找具有所述图片资源的标识的音频文件。
可选的,所述基于所述资源数据,获取与所述图片资源对应的音频文件,包括:
对所述资源数据中的图片资源进行图像识别,得到所述图片资源的内容识别结果;
基于所述内容识别结果,获取与所述图片资源对应的文本数据;
将所述文本数据输入所述文本到音频转换模型,得到所述与所述图片资源对应的音频文件。
可选的,所述基于所述内容识别结果,获取与所述图片资源对应的文本数据,包括:
从预存的文本资源库中,查找与所述内容识别结果对应的文本数据,作为与所述图片资源对应的文本数据;
或者,将所述内容识别结果输入预设的文本生成模型,得到与所述图片资源对应的文本数据。
可选的,所述资源数据还包括:声音类型;其中,所述声音类型为按照音效的年龄,和/或者,性别差异划分的类型;
所述将所述文本数据输入所述文本到音频转换模型,得到所述与所述图片资源对应的音频文件,包括:
将所述文本数据和所述声音类型输入所述文本到音频转换模型,得到所述与所述图片资源对应的、且音效为所述声音类型的音频文件。
可选的,在所述在展示所述资源数据所表明的图片资源时,播放所述音频文件之后,所述方法还包括:
记录所述音频文件播放和所述图片资源展示时产生的数据;
将所记录的数据上报给服务器。
第二方面,本发明实施例提供了一种资源展示装置,应用于智能机器人,所述装置包括:
资源类型判断模块,用于在展示关于宣传服务的资源数据时,判断所述资源数据表明的资源是否为图片资源;
音频文件获取模块,用于在所述资源数据表明的资源为图片资源时,基于所述资源数据,获取与所述图片资源对应的音频文件;其中,所述音频文件用于表明所述资源数据所表明的图片资源的画面内容;
资源展示模块,用于在展示所述资源数据所表明的图片资源时,播放所述音频文件。
可选的,所述音频文件为利用文本到音频转换模型,处理所述图片资源对应的文本数据,得到的文件;
其中,所述图片资源对应的文本数据为能够描述所述图片资源的画面内容的数据。
可选的,所述资源数据为服务器发送的数据,包括所述图片资源的标识;
所述图片资源对应的文本数据为所述服务器从运维人员提交的资源数据中查找的数据,且所述服务器将所述文本数据输入所述文本到音频转换模型,得到所述与所述图片资源对应的音频文件;
所述音频文件获取模块,具体用于:
从所述资源数据中查找具有所述图片资源的标识的音频文件。
可选的,所述音频文件获取模块,具体用于:
对所述资源数据中的图片资源进行图像识别,得到所述图片资源的内容识别结果;
基于所述内容识别结果,获取与所述图片资源对应的文本数据;
将所述文本数据输入所述文本到音频转换模型,得到所述与所述图片资源对应的音频文件。
可选的,所述音频文件获取模块,具体用于:
从预存的文本资源库中,查找与所述内容识别结果对应的文本数据,作为与所述图片资源对应的文本数据;
或者,将所述内容识别结果输入预设的文本生成模型,得到与所述图片资源对应的文本数据。
可选的,所述资源数据还包括:声音类型;其中,所述声音类型为按照音效的年龄,和/或者,性别差异划分的类型;
所述音频文件获取模块,具体用于:
将所述文本数据和所述声音类型输入所述文本到音频转换模型,得到所述与所述图片资源对应的、且音效为所述声音类型的音频文件。
可选的,在所述在展示所述资源数据所表明的图片资源时,播放所述音频文件之后,所述装置还包括:数据记录模块,用于:
记录所述音频文件播放和所述图片资源展示时产生的数据;
将所记录的数据上报给服务器。
第三方面,本发明实施例提供了一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述第一方面所述的资源展示方法的步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的资源展示方法的步骤。
本发明实施例有益效果:
本发明的发明点在于,智能机器人在展示关于宣传服务的资源数据时,对关于宣传服务的资源数据进行判断,从而针对图片资源,获取与图片资源对应的音频文件,进而在展示资源数据所表明的图片资源时,播放音频文件,实现图片资源和音频文件的同时展示。其中,音频文件用于表明所述资源数据所表明的图片资源的画面内容。因此,可以通过播放音频文件,实现用户无需主动观看即可获知图片资源的内容;并且,图片资源和音频文件的同时展示,可以利用音效提醒和吸引用户观看图片资源的画面。可见,本方案可以实现图片资源的画面内容以声音形式主动输出,以及音效提醒用户观看图片资源的双重效果,提高图片资源的宣传有效性。
当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为本发明一实施例提供的资源展示方法的流程示意图;
图2为本发明另一实施例提供的资源展示方法的流程示意图;
图3为本发明一实施例提供的资源展示装置的结构示意图;
图4为本发明另一实施例提供的资源展示装置的结构示意图;
图5为本发明一实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了便于理解,下面对本发明实施例提供的一种资源展示方法进行说明。
本发明实施例提供的一种资源展示方法,可以应用于智能机器人,该智能机器人可以应用于商场、医院以及银行等需要宣传服务的物理场所,提供适用于相应物理场所的宣传服务。
如图1所示,本发明一实施例提供的一种资源展示方法,该方法可以包括如下步骤:
S101,在展示关于宣传服务的资源数据时,判断资源数据表明的资源是否为图片资源。
其中,资源数据的形式可以是清单或者列表,具体可以包括资源本身、资源的标识、资源的提供者以及资源展示时间等等数据。在具体应用中,关于宣传服务的资源数据具体可以是多种的。示例性的,医院的资源数据表明的资源可以是关于医院介绍、就诊流程以及健康知识的视频资源或者图片资源,商超的资源数据表明的资源可以是关于店铺介绍以及商品广告的视频资源或者图片资源,银行的资源数据表明的资源可以是关于理财产品介绍、金融政策以及预防诈骗的视频资源或者图片资源。
并且,判断资源数据表明的资源是否为图片资源的方式可以是多种的。示例性的,当图片资源对应的音频文件由服务器提供、且包含在资源数据中时,可以判断资源数据中是否存在与资源对应的音频文件,如果存在,判定资源数据表明的资源为图片资源。其中,与资源对应的音频文件可以具有资源的标识的音频文件。或者,示例性的,当资源数据包括资源的类型时,可以直接判断资源数据中的资源类型是否为图片类型,如果为图片类型,判定资源数据表明的资源为图片资源。
S102,如果为图片资源,基于资源数据,获取与图片资源对应的音频文件。
其中,音频文件用于表明资源数据所表明的图片资源的画面内容。
具体的,音频文件可以通过音频的形式描述资源数据所表明的图片资源的画面内容。并且,基于资源数据,获取与图片资源对应的音频文件的方式可以是多种的。示例性的,当图片资源对应的音频文件由服务器提供、且包含在资源数据中时,可以从资源数据中查找具有图片资源的标识的音频文件,得到与图片资源对应的音频文件。或者,智能机器人可以对图片资源进行图像识别,得到图片资源的内容识别结果,进而基于内容识别结果获得与图片资源对应的音频文件。为了便于理解和合理布局,后续以可选本发明图2实施例和可选实施例的形式对上述示例性说明进行具体描述。
另外,上述音频文件的来源可以是多种的,下面以可选实施例的形式进行说明。
在一种可选的实施方式中,上述音频文件可以为预先录制描述图片资源的画面内容的声音,得到的音频文件。
在一种可选的实施方式中,上述音频文件为利用文本到音频转换模型,处理图片资源对应的文本数据,得到的文件;
其中,图片资源对应的文本数据为能够描图片资源的画面内容的数据。
在具体应用中,文本到音频转换模型可以为TTS(Text-To-Speech,语音合成)算法,一种在内置芯片的支持之下,通过神经网络把文字转化为自然语音流的算法。并且,能够描图片资源的画面内容的文本数据的来源可以是多种的。示例性的,该文本数据可以是人工撰写的描述图片资源的画面内容的文本,或者,该文本数据可以是服务器或者智能机器人对图片资源的画面内容进行识别,进而基于画面内容的识别结果获得的文本数据。
与录制得到音频文件相比,本可选实施例利用文本数据得到音频数据,可以节省录制音频的硬件和人工成本,减少资源展示成本和提高展示效率。
S103,在展示资源数据所表明的图片资源时,播放音频文件。
智能机器人可以在智能机器人自身的显示屏上展示资源数据所表明的图片资源。其中,智能机器人的显示屏的数量可以是一个或者两个。并且,当显示屏的数量为两个,其中至少一个显示屏可以为触摸屏,以便用户使用触摸屏与智能机器人交互。
并且,在展示资源数据所表明的图片资源时,播放音频文件的方式可以是多种的。示例性的,当图片资源的展示时长等于音频文件的播放时长时,可以在展示资源数据所表明的图片资源时,直接播放音频文件。或者,当图片资源的展示时长大于音频文件的播放时长时,可以在展示资源数据所表明的图片资源的过程中,循环播放音频文件,直到图片资源展示结束。上述两种示例性方式均为图片资源和音频文件同时展示的方式。
本发明的发明点在于,智能机器人在展示关于宣传服务的资源数据时,对关于宣传服务的资源数据进行判断,从而针对图片资源,获取与图片资源对应的音频文件,进而在展示资源数据所表明的图片资源时,播放音频文件,实现图片资源和音频文件的同时展示。其中,音频文件用于表明所述资源数据所表明的图片资源的画面内容。因此,可以通过播放音频文件,实现用户无需主动观看即可获知图片资源的内容;并且,图片资源和音频文件的同时展示,可以利用音效提醒和吸引用户观看图片资源的画面。可见,本方案可以实现图片资源的画面内容以声音形式主动输出,以及音效提醒用户观看图片资源的双重效果,提高图片资源的宣传有效性。
如图2所示,本发明另一实施例提供的一种资源展示方法,该方法可以包括如下步骤:
S201,服务器接收运维人员提交的资源数据。
S202,服务器从运维人员提交的资源数据中查找图片资源对应的文本数据。
S203,服务器将文本数据输入文本到音频转换模型,得到与图片资源对应的音频文件。
S204,服务器发送资源数据给智能机器人。
其中,资源数据包括图片资源的标识,以及与图片资源对应的音频文件。
在具体应用中,智能机器人可以与服务器通信连接,以便运维人员通过服务器对智能机器人进行远程运维,以及利用服务器分担智能机器人的数据处理工作等等。对此,与图片资源对应的文本数据可以是人工撰写的描述图片资源的画面内容的文本,该文本数据可以包含在资源数据中由运维人员提交给服务器。举例而言,运营人员可以在服务器中创建关于资源数据的订单,创建时在该订单中填写用于描述本资源数据中图片资源的画面内容的文本数据。
由此,服务器可以从运维人员提交的资源数据中查找图片资源对应的文本数据,进而将文本数据输入文本到音频转换模型,得到与图片资源对应的音频文件,并发送包括图片资源的标识,以及与图片资源对应的音频文件的资源数据给智能机器人。
S205,智能机器人在展示关于宣传服务的资源数据时,判断资源数据表明的资源是否为图片资源;如果为图片资源,执行步骤S206。
上述S205与本发明图1实施例的S101为相同的步骤,在此不再赘述,详见本发明图1实施例的描述。
S206,智能机器人从资源数据中查找具有图片资源的标识的音频文件。
其中,音频文件用于表明资源数据所表明的图片资源的画面内容。
由于资源数据中包含与图片资源对应的音频文件,因此,智能机器人可以直接从资源数据中查找具有图片资源的标识的音频文件。
S207,智能机器人在展示资源数据所表明的图片资源时,播放音频文件。
上述S207与本发明图1实施例的S103为相同的步骤,在此不再赘述,详见本发明图1实施例的描述。
本实施例中,音频文件由服务器转换得到,并发送给智能机器人用于进行资源数据的展示,可以实现利用服务器分担分担智能机器人的数据处理工作,提高智能机器人的性能。并且,运维人员向服务器提交资源数据,再由服务器向智能机器人发送资源数据,可以实现在无需中断智能机器人工作的同时,对智能机器人进行实时远程维护的效果。
在一种可选的实施方式中,上述基于资源数据,获取与图片资源对应的音频文件,具体可以包括如下步骤:
对资源数据中的图片资源进行图像识别,得到图片资源的内容识别结果;
基于内容识别结果,获取与图片资源对应的文本数据;
将文本数据输入文本到音频转换模型,得到与图片资源对应的音频文件。
为了减少人工撰写文本数据的工作量,可以由智能机器人直接对资源数据中的图片资源进行图像识别,进而基于图片资源的内容识别结果获取与图片资源对应的文本数据,从而将文本数据输入文本到音频转换模型,得到与图片资源对应的音频文件,实现与图片资源对应的音频文件的全自动获取。其中,基于内容识别结果,获取与图片资源对应的文本数据的方式,具体可以是多种的,下面以可选实施例的形式进行具体说明。
在一种可选的实施方式中,上述基于内容识别结果,获取与图片资源对应的文本数据,具体可以包括如下步骤:
从预存的文本资源库中,查找与内容识别结果对应的文本数据,作为与图片资源对应的文本数据;
或者,将内容识别结果输入预设的文本生成模型,得到与图片资源对应的文本数据。
其中,内容识别结果可以是图片内容的分类结果。例如,商场的店铺导航机器人的图片资源的内容识别结果可以是服装店、餐饮店以及电影院等等类型,预存的文本资源库中存储有对应于分类结果的文本数据,例如,关于服装店的宣传文本,关于美食的宣传文本以及关于预设时间段内电影的宣传文本,因此,可以从预存的文本资源库中,查找与内容识别结果对应的文本数据,作为与图片资源对应的文本数据。
或者,内容识别结果可以是关于图片内容的关键字。例如,服装店的名称,菜单以及电影的名称和播出时间等等。对此,可以将识别得到的关键字输入预设的文本生成模型,得到与图片资源对应的文本数据。其中,预设的文本生成模型为预先利用样本文本数据和与样本文本数据对应的样本关键词训练得到模型,具体可以是Char-RNN(Character basedRecurrent Neural Network,基于特征的递归神经网络),LSTM(Long Short-Term Memory,长短期记忆网络)等等模型。
在一种可选的实施方式中,上述资源数据还可以包括:声音类型;其中,声音类型为按照音效的年龄,和/或者,性别差异划分的类型;
相应的,上述将文本数据输入文本到音频转换模型,得到与图片资源对应的音频文件,具体可以包括如下步骤:
将文本数据和声音类型输入文本到音频转换模型,得到与图片资源对应的、且音效为声音类型的音频文件。
其中,按照音效的年龄,和/或者,性别差异划分的声音类型具体可以是多种的。示例性的,声音类型可以包括成年女声、成年男声、男童声以及女童声。由此,可以保证音频文件的音效与资源数据中的声音类型相同,更加符合宣传需求。
在一种可选的实施方式中,在上述在展示资源数据所表明的图片资源时,播放音频文件之后,本发明实施例提供的资源展示方法,还可以包括如下步骤:
记录音频文件播放和图片资源展示时产生的数据;
将所记录的数据上报给服务器。
为了向宣传服务的发起方,例如广告商、银行以及医院反馈宣传效果,以及针对宣传效果调整宣传次数和时间等等宣传策略,在对图片资源和音频文件完成同时展示后,可以记录音频文件播放和图片资源展示时产生的数据;将所记录的数据上报给服务器。其中,音频文件播放和图片资源展示时产生的数据具体可以包括:音频文件播放次数和图片资源的展示时长,展示过程中智能机器人与顾客的交互次数,以及顾客的交互数据等等。
相应于上述方法实施例,本发明还提供了一种资源展示装置。
如图3所示,本发明一实施例提供的一种资源展示装置,应用于智能机器人,该装置包括:
资源类型判断模块301,用于在展示关于宣传服务的资源数据时,判断所述资源数据表明的资源是否为图片资源;
音频文件获取模块302,用于在所述资源数据表明的资源为图片资源时,基于所述资源数据,获取与所述图片资源对应的音频文件;其中,所述音频文件用于表明所述资源数据所表明的图片资源的画面内容;
资源展示模块303,用于在展示所述资源数据所表明的图片资源时,播放所述音频文件。
本发明的发明点在于,智能机器人在展示关于宣传服务的资源数据时,对关于宣传服务的资源数据进行判断,从而针对图片资源,获取与图片资源对应的音频文件,进而在展示资源数据所表明的图片资源时,播放音频文件,实现图片资源和音频文件的同时展示。其中,音频文件用于表明所述资源数据所表明的图片资源的画面内容。因此,可以通过播放音频文件,实现用户无需主动观看即可获知图片资源的内容;并且,图片资源和音频文件的同时展示,可以利用音效提醒和吸引用户观看图片资源的画面。可见,本方案可以实现图片资源的画面内容以声音形式主动输出,以及音效提醒用户观看图片资源的双重效果,提高图片资源的宣传有效性。
可选的,所述音频文件为利用文本到音频转换模型,处理所述图片资源对应的文本数据,得到的文件;
其中,所述图片资源对应的文本数据为能够描述所述图片资源的画面内容的数据。
可选的,所述资源数据为服务器发送的数据,包括所述图片资源的标识;
所述图片资源对应的文本数据为所述服务器从运维人员提交的资源数据中查找的数据,且所述服务器将所述文本数据输入所述文本到音频转换模型,得到所述与所述图片资源对应的音频文件;
所述音频文件获取模块302,具体用于:
从所述资源数据中查找具有所述图片资源的标识的音频文件。
可选的,所述音频文件获取模块302,具体用于:
对所述资源数据中的图片资源进行图像识别,得到所述图片资源的内容识别结果;
基于所述内容识别结果,获取与所述图片资源对应的文本数据;
将所述文本数据输入所述文本到音频转换模型,得到所述与所述图片资源对应的音频文件。
可选的,所述音频文件获取模块302,具体用于:
从预存的文本资源库中,查找与所述内容识别结果对应的文本数据,作为与所述图片资源对应的文本数据;
或者,将所述内容识别结果输入预设的文本生成模型,得到与所述图片资源对应的文本数据。
可选的,所述资源数据还包括:声音类型;其中,所述声音类型为按照音效的年龄,和/或者,性别差异划分的类型;
所述音频文件获取模块302,具体用于:
将所述文本数据和所述声音类型输入所述文本到音频转换模型,得到所述与所述图片资源对应的、且音效为所述声音类型的音频文件。
如图4所示,本发明另一实施例提供的一种资源展示装置,应用于智能机器人,该装置包括:
资源类型判断模块401,用于在展示关于宣传服务的资源数据时,判断所述资源数据表明的资源是否为图片资源;
音频文件获取模块402,用于在所述资源数据表明的资源为图片资源时,基于所述资源数据,获取与所述图片资源对应的音频文件;其中,所述音频文件用于表明所述资源数据所表明的图片资源的画面内容;
资源展示模块403,用于在展示所述资源数据所表明的图片资源时,播放所述音频文件;
数据记录模块404,用于记录音频文件播放和图片资源展示时产生的数据;将所记录的数据上报给服务器。
本发明实施例还提供了一种电子设备,如图5所示,包括处理器501、通信接口502、存储器503和通信总线504,其中,处理器501,通信接口502,存储器503通过通信总线504完成相互间的通信,
存储器503,用于存放计算机程序;
处理器501,用于执行存储器503上所存放的程序时,实现如下步骤:
在展示关于宣传服务的资源数据时,判断所述资源数据表明的资源是否为图片资源;
如果为图片资源,基于所述资源数据,获取与所述图片资源对应的音频文件;其中,所述音频文件用于表明所述资源数据所表明的图片资源的画面内容;
在展示所述资源数据所表明的图片资源时,播放所述音频文件。
在具体应用中,本实施例中的电子设备为智能机器人。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一资源展示方法的步骤。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一资源展示方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备和存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种资源展示方法,其特征在于,应用于智能机器人,所述方法包括:
在展示关于宣传服务的资源数据时,判断所述资源数据表明的资源是否为图片资源;
如果为图片资源,基于所述资源数据,获取与所述图片资源对应的音频文件;其中,所述音频文件用于表明所述资源数据所表明的图片资源的画面内容;
在展示所述资源数据所表明的图片资源时,播放所述音频文件。
2.根据权利要求1所述的方法,其特征在于,所述音频文件为利用文本到音频转换模型,处理所述图片资源对应的文本数据,得到的文件;
其中,所述图片资源对应的文本数据为能够描述所述图片资源的画面内容的数据。
3.根据权利要求2所述的方法,其特征在于,所述资源数据为服务器发送的数据,包括所述图片资源的标识;
所述图片资源对应的文本数据为所述服务器从运维人员提交的资源数据中查找的数据,且所述服务器将所述文本数据输入所述文本到音频转换模型,得到所述与所述图片资源对应的音频文件;
所述基于所述资源数据,获取与所述图片资源对应的音频文件,包括:
从所述资源数据中查找具有所述图片资源的标识的音频文件。
4.根据权利要求2所述的方法,其特征在于,所述基于所述资源数据,获取与所述图片资源对应的音频文件,包括:
对所述资源数据中的图片资源进行图像识别,得到所述图片资源的内容识别结果;
基于所述内容识别结果,获取与所述图片资源对应的文本数据;
将所述文本数据输入所述文本到音频转换模型,得到所述与所述图片资源对应的音频文件。
5.根据权利要求4所述的方法,其特征在于,所述基于所述内容识别结果,获取与所述图片资源对应的文本数据,包括:
从预存的文本资源库中,查找与所述内容识别结果对应的文本数据,作为与所述图片资源对应的文本数据;
或者,将所述内容识别结果输入预设的文本生成模型,得到与所述图片资源对应的文本数据。
6.根据权利要求3或4所述的方法,其特征在于,所述资源数据还包括:声音类型;其中,所述声音类型为按照音效的年龄,和/或者,性别差异划分的类型;
所述将所述文本数据输入所述文本到音频转换模型,得到所述与所述图片资源对应的音频文件,包括:
将所述文本数据和所述声音类型输入所述文本到音频转换模型,得到所述与所述图片资源对应的、且音效为所述声音类型的音频文件。
7.根据权利要求1至5任一项所述的方法,其特征在于,在所述在展示所述资源数据所表明的图片资源时,播放所述音频文件之后,所述方法还包括:
记录所述音频文件播放和所述图片资源展示时产生的数据;
将所记录的数据上报给服务器。
8.一种资源展示装置,其特征在于,应用于智能机器人,所述装置包括:
资源类型判断模块,用于在展示关于宣传服务的资源数据时,判断所述资源数据表明的资源是否为图片资源;
音频文件获取模块,用于在所述资源数据表明的资源为图片资源时,基于所述资源数据,获取与所述图片资源对应的音频文件;其中,所述音频文件用于表明所述资源数据所表明的图片资源的画面内容;
资源展示模块,用于在展示所述资源数据所表明的图片资源时,播放所述音频文件。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-7任一所述的方法步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7任一所述的方法步骤。
CN202010584925.0A 2020-06-23 2020-06-23 资源展示方法、装置、设备及存储介质 Pending CN111753107A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010584925.0A CN111753107A (zh) 2020-06-23 2020-06-23 资源展示方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010584925.0A CN111753107A (zh) 2020-06-23 2020-06-23 资源展示方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN111753107A true CN111753107A (zh) 2020-10-09

Family

ID=72676690

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010584925.0A Pending CN111753107A (zh) 2020-06-23 2020-06-23 资源展示方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111753107A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112288463A (zh) * 2020-10-15 2021-01-29 北京京东乾石科技有限公司 用于控制业务对象展示的方法、装置、电子设备和介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108197286A (zh) * 2018-01-16 2018-06-22 维沃移动通信有限公司 一种信息显示方法及移动终端
CN110427499A (zh) * 2018-04-26 2019-11-08 腾讯科技(深圳)有限公司 多媒体资源的处理方法、装置及存储介质和电子装置
US10643616B1 (en) * 2014-03-11 2020-05-05 Nvoq Incorporated Apparatus and methods for dynamically changing a speech resource based on recognized text
CN111309200A (zh) * 2020-01-17 2020-06-19 百度在线网络技术(北京)有限公司 一种扩展阅读内容的确定方法、装置、设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10643616B1 (en) * 2014-03-11 2020-05-05 Nvoq Incorporated Apparatus and methods for dynamically changing a speech resource based on recognized text
CN108197286A (zh) * 2018-01-16 2018-06-22 维沃移动通信有限公司 一种信息显示方法及移动终端
CN110427499A (zh) * 2018-04-26 2019-11-08 腾讯科技(深圳)有限公司 多媒体资源的处理方法、装置及存储介质和电子装置
CN111309200A (zh) * 2020-01-17 2020-06-19 百度在线网络技术(北京)有限公司 一种扩展阅读内容的确定方法、装置、设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112288463A (zh) * 2020-10-15 2021-01-29 北京京东乾石科技有限公司 用于控制业务对象展示的方法、装置、电子设备和介质

Similar Documents

Publication Publication Date Title
US10943257B2 (en) Digital media environment for analysis of components of digital content
US8635169B2 (en) System and methods for providing user generated video reviews
US20170303010A1 (en) Methods and apparatus for enhancing a digital content experience
US8615474B2 (en) System and methods for providing user generated video reviews
US9420319B1 (en) Recommendation and purchase options for recommemded products based on associations between a user and consumed digital content
TWI478085B (zh) 呈現廣告的方法與系統
WO2020088058A1 (zh) 生成信息的方法和装置
US20190026367A1 (en) Navigating video scenes using cognitive insights
US20200097538A1 (en) Book analysis and recommendation
US10121187B1 (en) Generate a video of an item
US20200128286A1 (en) Live streaming social interaction to trigger product search
US10489799B2 (en) Tracking performance of digital design asset attributes
WO2012092240A2 (en) Method and apparatus for providing or utilizing interactive video with tagged objects
US20120316970A1 (en) System and method for providing targeted content
US20200250369A1 (en) System and method for transposing web content
US10440435B1 (en) Performing searches while viewing video content
US20150058417A1 (en) Systems and methods of presenting personalized personas in online social networks
US20210350417A1 (en) Resource presentation method, resource presentation apparatus, and storage medium
WO2020042376A1 (zh) 用于输出信息的方法和装置
CN111460179A (zh) 多媒体信息展示方法及装置、计算机可读介质及终端设备
CN112070524B (zh) 广告业务推荐方法、装置
CN116821475B (zh) 基于客户数据的视频推荐方法、装置及计算机设备
US20200137429A1 (en) Video media content analysis
CN104102683A (zh) 用于增强视频显示的上下文查询
CN115190366B (zh) 一种信息展示方法、装置、电子设备、计算机可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination