CN109618204B - 多媒体资源播放方法和装置 - Google Patents

多媒体资源播放方法和装置 Download PDF

Info

Publication number
CN109618204B
CN109618204B CN201811515749.4A CN201811515749A CN109618204B CN 109618204 B CN109618204 B CN 109618204B CN 201811515749 A CN201811515749 A CN 201811515749A CN 109618204 B CN109618204 B CN 109618204B
Authority
CN
China
Prior art keywords
information
user intention
playing
multimedia resource
currently played
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811515749.4A
Other languages
English (en)
Other versions
CN109618204A (zh
Inventor
侯柏岑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Shanghai Xiaodu Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201811515749.4A priority Critical patent/CN109618204B/zh
Publication of CN109618204A publication Critical patent/CN109618204A/zh
Application granted granted Critical
Publication of CN109618204B publication Critical patent/CN109618204B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47217End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for controlling playback functions for recorded or on-demand content, e.g. using progress bars, mode or play-point indicators or bookmarks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47202End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting content on demand, e.g. video on demand
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例提出一种多媒体资源播放方法和装置,方法包括:从用户语音中识别出用户意图;如果用户意图中包含时间需求,则获取当前播放的多媒体资源的播放进度信息;根据当前播放的多媒体资源的播放进度信息和用户意图,得到与用户意图对应的交互信息。装置包括:识别模块,用于从用户语音中识别出用户意图;第一需求获取模块,用于如果用户意图中包含时间需求,则获取当前播放的多媒体资源的播放进度信息;第一处理模块,用于根据当前播放的多媒体资源的播放进度信息和用户意图,得到与用户意图对应的交互信息。本发明实施例能够根据用户语音指令,实现基于时间维度对多媒体资源进行复杂查询和控制。

Description

多媒体资源播放方法和装置
技术领域
本发明涉及智能播放技术领域,尤其涉及一种多媒体资源播放方法和装置。
背景技术
目前的多媒体播放设备虽然实现了与用户的语音交互,但是只能够根据语音指令实现最基本的用户操作需求。例如,控制播放的多媒体资源“暂停”、“停止”或“继续播放”等简单的操作功能。另一方面,当用户下达语音指令时,多媒体播放设备每次只能够根据用户意图理解用户语音中的一个操作指令,而无法理解一句话中的多个不同的操作指令。
在背景技术中公开的上述信息仅用于加强对本发明的背景的理解,因此其可能包含没有形成为本领域普通技术人员所知晓的现有技术的信息。
发明内容
本发明实施例提供一种多媒体资源播放方法和装置,以解决现有技术中的一个或多个技术问题。
第一方面,本发明实施例提供了一种多媒体资源播放方法,包括:
从用户语音中识别出用户意图;
如果所述用户意图中包含时间需求,则获取当前播放的多媒体资源的播放进度信息;
根据所述当前播放的多媒体资源的播放进度信息和所述用户意图,得到与所述用户意图对应的交互信息。
在一个实施方式中,当所述用户意图为查询所述当前播放的多媒体资源的剩余播放时长时,根据所述当前播放的多媒体资源的播放进度信息和所述用户意图,得到与所述用户意图对应的交互信息,包括:
获取所述播放进度信息中的所述当前播放的多媒体资源的总时长信息和当前播放进度信息;
根据所述总时长信息和所述当前播放进度信息,计算出所述当前播放的多媒体资源的剩余播放时长信息;
将计算出的所述当前播放的多媒体资源的剩余播放时长信息作为与所述用户意图对应的交互信息。
在一个实施方式中,当所述用户意图为查询所述当前播放的多媒体资源的已观看时长时,根据所述当前播放的多媒体资源的播放进度信息和所述用户意图,得到与所述用户意图对应的交互信息,包括:
获取所述播放进度信息中的所述当前播放的多媒体资源的当前播放进度信息和起始播放位置信息;
根据所述当前播放进度信息和所述起始播放位置信息,计算出所述当前播放的多媒体资源的已观看时长信息;
将计算出的所述当前播放的多媒体资源的已观看时长信息作为与所述用户意图对应的交互信息。
在一个实施方式中,根据所述当前播放的多媒体资源的播放进度信息和所述用户意图,得到与所述用户意图对应的交互信息之后,还包括:
根据所述交互信息进一步生成与所述用户意图对应的推荐播放策略交互信息。
在一个实施方式中,根据所述当前播放的多媒体资源的播放进度信息和所述用户意图,得到与所述用户意图对应的交互信息,包括:
获取所述用户意图中的控制需求;
根据所述当前播放的多媒体资源的播放进度信息和所述用户意图中的控制需求,得到与所述用户意图对应的交互信息。
在一个实施方式中,还包括:
如果所述用户意图中包含资源信息需求,则获取当前播放的多媒体资源的属性信息;
根据所述当前播放的多媒体资源的属性信息和所述用户意图,得到与所述用户意图对应的交互信息。
在一个实施方式中,当所述用户意图为查询所述当前播放的多媒体资源的子资源总数时,根据所述当前播放的多媒体资源的属性信息和所述用户意图,得到与所述用户意图对应的交互信息,包括:
从数据库中获取所述当前播放的多媒体资源的属性信息数据;
获取所述当前播放的多媒体资源的属性信息数据中的子资源信息;
将获取的所述当前播放的多媒体资源的子资源信息作为与所述用户意图对应的交互信息。
第二方面,本发明实施例提供了一种多媒体资源播放装置,包括:
识别模块,用于从用户语音中识别出用户意图;
第一需求获取模块,用于如果所述用户意图中包含时间需求,则获取当前播放的多媒体资源的播放进度信息;
第一处理模块,用于根据所述当前播放的多媒体资源的播放进度信息和所述用户意图,得到与所述用户意图对应的交互信息。
在一个实施方式中,所述第一处理模块包括:
第一获取子模块,用于获取所述播放进度信息中的所述当前播放的多媒体资源的总时长信息和当前播放进度信息;
第一计算子模块,用于根据所述总时长信息和所述当前播放进度信息,计算出所述当前播放的多媒体资源的剩余播放时长信息;
第一交互子模块,用于将计算出的所述当前播放的多媒体资源的剩余播放时长信息作为与所述用户意图对应的交互信息。
在一个实施方式中,所述第一处理模块包括:
第二获取子模块,用于获取所述播放进度信息中的所述当前播放的多媒体资源的当前播放进度信息和起始播放位置信息;
第二计算子模块,用于根据所述当前播放进度信息和所述起始播放位置信息,计算出所述当前播放的多媒体资源的已观看时长信息;
第二交互子模块,用于将计算出的所述当前播放的多媒体资源的已观看时长信息作为与所述用户意图对应的交互信息。
在一个实施方式中,还包括:
生成模块,用于根据所述交互信息进一步生成与所述用户意图对应的推荐播放策略交互信息。
在一个实施方式中,所述第一处理模块包括:
第三获取子模块,用于获取所述用户意图中的控制需求;
第三交互子模块,用于根据所述当前播放的多媒体资源的播放进度信息和所述用户意图中的控制需求,得到与所述用户意图对应的交互信息。
在一个实施方式中,还包括:
第二需求获取模块,用于如果所述用户意图中包含资源信息需求,则获取当前播放的多媒体资源的属性信息;
第二处理模块,用于根据所述当前播放的多媒体资源的属性信息和所述用户意图,得到与所述用户意图对应的交互信息。
第三方面,本发明实施例提供了一种资源播放的终端,包括:
所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
在一个可能的设计中,多媒体资源播放的终端的结构中包括处理器和存储器,所述存储器用于存储支持多媒体资源播放的终端执行上述第一方面中多媒体资源播放方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。多媒体资源播放的终端还可以包括通信接口,用于多媒体资源播放的终端与其他设备或通信网络通信。
第四方面,本发明实施例提供了一种计算机可读存储介质,用于存储多媒体资源播放的终端所用的计算机软件指令,其包括用于执行上述第一方面中多媒体资源播放方法为多媒体资源播放的终端所涉及的程序。
上述技术方案中的一个技术方案具有如下优点或有益效果:本发明实施例能够根据用户语音指令,实现基于时间维度对多媒体资源进行复杂查询和控制。
上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本发明进一步的方面、实施方式和特征将会是容易明白的。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本发明公开的一些实施方式,而不应将其视为是对本发明范围的限制。
图1为本发明实施方式提供的多媒体资源播放方法的流程图。
图2为本发明实施方式提供的多媒体资源播放方法的步骤S300的流程图。
图3为本发明实施方式提供的多媒体资源播放方法的步骤S300的流程图。
图4为本发明实施方式提供的多媒体资源播放方法的流程图。
图5为本发明实施方式提供的推荐播放策略的逻辑框图。
图6为本发明实施方式提供的多媒体资源播放方法的流程图。
图7为本发明实施方式提供的多媒体资源播放装置的结构图。
图8为本发明实施方式提供的第一处理模块的结构图。
图9为本发明实施方式提供的第一处理模块的结构图。
图10为本发明实施方式提供的多媒体资源播放装置的结构图。
图11为本发明实施方式提供的第一处理模块的结构图。
图12为本发明实施方式提供的多媒体资源播放终端结构示意图。
具体实施方式
在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本发明的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
本发明实施例提供了一种多媒体资源播放方法,如图1所示,包括以下步骤:
S100:从用户语音中识别出用户意图。用户意图可以理解为用户想要实现的需求是什么。例如,当用户语音指令为“请帮我看一下这部电影还有多长时间演完”,其中的用户意图为“查询电影的剩余播放时长”。
需要说明的是,用户语音中的一个意图可以包含有多个需求。例如,用户语音指令为“请帮我在三十分钟后停止播放这部电视剧”,其中的意图为“在当前播放进度基础上继续播放三十分钟并停止播放”。且该意图中包含了时间需求(三十分钟)和控制需求(停止播放)。
S200:如果用户意图中包含时间需求,则获取当前播放的多媒体资源的播放进度信息。时间需求可以理解为用户语音中能够解析出的与时间维度有关联的语义信息。例如,“还有多久演完”中的“多久”、“当前播放进度”中的“当前”、“只看半小时”中的“半小时”等,均可以理解为是时间需求。多媒体资源可以理解为视频或音频。播放进度信息可以包含多媒体资源的当前播放进度信息、多媒体资源的总时长信息、多媒体资源的起始播放位置信息等任何能够体现播放进度的信息。
S300:根据当前播放的多媒体资源的播放进度信息和用户意图,得到与用户意图对应的交互信息。交互信息包括可以与用户交互的多种类型的信息,例如文本、音频、视频等。
在一个实施方式中,如图2所示,当用户意图为查询当前播放的多媒体资源的剩余播放时长时,根据当前播放的多媒体资源的播放进度信息和用户意图,得到与用户意图对应的交互信息,包括:
S310:获取播放进度信息中的当前播放的多媒体资源的总时长信息和当前播放进度信息。
S320:根据总时长信息和当前播放进度信息,计算出当前播放的多媒体资源的剩余播放时长信息。
S330:将计算出的当前播放的多媒体资源的剩余播放时长信息作为与用户意图对应的交互信息。
在一个应用实例中,当多媒体资源播放设备接收到用户发送的用户语音为“当前电影还有多久演完”时,多媒体资源播放设备识别出用户意图为查询电影的剩余播放时长。然后进一步获取当前电影的实时播放进度信息以及当前电影的总时长信息,并根据当前电影的实时播放进度信息以及当前电影的总时长信息计算出当前电影的剩余播放时长为三十分钟。最后将计算出的结果作为交互信息向用户反馈,即多媒体资源向用户播放答复语音“当前电影还有三十分钟结束”。
在一个实施方式中,如图3所示,当用户意图为查询当前播放的多媒体资源的已观看时长时,根据当前播放的多媒体资源的播放进度信息和用户意图,得到与用户意图对应的交互信息,包括:
S340:获取播放进度信息中的当前播放的多媒体资源的当前播放进度信息和起始播放位置信息。
S350:根据当前播放进度信息和起始播放位置信息,计算出当前播放的多媒体资源的已观看时长信息。
S360:将计算出的当前播放的多媒体资源的已观看时长信息作为与用户意图对应的交互信息。
在一个实施方式中,如图4所示,根据当前播放的多媒体资源的播放进度信息和用户意图,得到与用户意图对应的交互信息之后,还包括步骤:
S400:根据交互信息进一步生成与用户意图对应的差异化的推荐播放策略交互信息。
在一个应用实例中,当用户询问当前播放视频的剩余播放时长时,在计算出当前播放视频的剩余播放时长后,进一步判断剩余播放时长是否大于预设剩余时长阈值。当剩余播放时长大于预设剩余时长阈值时,可启动计算和询问功能,引导用户进行视频的加速播放,并告知用户若加速播放多久能够播放结束。从而通过推荐播放策略交互信息供用户辅助决策,使得用户体验更好。当判断剩余播放时长小于预设剩余时长阈值时,则只输出与用户意图对应的交互信息。即本应用示例的逻辑如图5所示,根据用户询问的剩余时间,计算资源的剩余播放时间,若剩余时间长则建议用户暂停观看或加速观看,若剩余时间短则建议用户继续观看。
例如,当用户询问“电影还有多久播放结束?”时,多媒体资源播放设备计算完成后告知用户“还有三十分钟播放结束,如果两倍速播放十分钟可以播放结束,需要两倍速播放吗?”。在该答复语音中不仅告知了与用户意图对应的交互信息,还给出了针对该交互信息的进一步策略。
在一个实施方式中,如图6所示,根据当前播放的多媒体资源的播放进度信息和用户意图,得到与用户意图对应的交互信息,包括以下步骤:
S370:获取用户意图中的控制需求。控制需求可以理解为用户语音中能够解析出的与操作动作有关联的语义信息。例如,“停止播放”、“暂停”、“加速播放”、“快进”等,均可以理解为是控制需求。
S380:根据当前播放的多媒体资源的播放进度信息和用户意图中的控制需求,得到与用户意图对应的交互信息。
在一个应用实例中,可应用于儿童观看电视的场景中。小孩痴迷于看电视或沉溺于跟有屏音箱互动,会导致父母采取强制手段将小孩子与设备隔绝开,例如关机、拔电源等方式。而在本实施例中,可以为多媒体资源播放设备增加有趣儿童模式(例如,播放定时语音交互)。一方面帮助儿童在有趣的过程中实现可控的观看行为、一方面也能让凶巴巴的父母下线,让家庭更和睦。
例如,父母跟孩子说“我们只看30分钟动画片好不好?你跟小度说,跟小度拉勾勾好嘛?”。孩子对多媒体资源播放设备说“小度小度(设备唤醒词),我再看三十分钟就不看了”。多媒体资源播放设备获取到孩子的用户意图包括了时间需求(三十分钟)和控制需求(暂停播放)。根据时间需求,获取当前动画片的播放进度信息,并在此基础上进行三十分钟的计时播放,当播放满三十分钟后则停止播放。当多媒体资源播放设备完成计算过程和播放设置后,多媒体资源播放设备向用户发送交互信息“好的,我们一起看,但说好只看三十分钟哦,拉勾勾”。从而实现了基于时间维度,针对用户意图中的多个需求同时进行处理及反馈。
在一个可变化的应用示例中,在完成与用户的播放定时设置后,可在多媒体资源播放过程中或邻近结束前提醒用户,即将到达约定播放时间。当多媒体资源播放到约定时间后,对当前多媒体资源的播放进度信息进行记录,保证下次播放该资源时能够继续播放。
在一个实施方式中,还包括:
如果用户意图中包含资源信息需求,则获取当前播放的多媒体资源的属性信息。属性信息可以理解为与多媒体资源相关联的任何信息。例如,当多媒体资源为电视剧时,属性信息可以包含电视剧的演职人员信息,还可以包含电视剧的剧情信息和剧集信息等。
根据当前播放的多媒体资源的属性信息和用户意图,得到与用户意图对应的交互信息。
在一个实施方式中,当用户意图为查询当前播放的多媒体资源的子资源总数时,根据当前播放的多媒体资源的属性信息和用户意图,得到与用户意图对应的交互信息,包括:
从数据库中获取当前播放的多媒体资源的最新更新的属性信息数据。
获取当前播放的多媒体资源的属性信息数据中的子资源信息。子资源信息可以理解为多媒体资源中的任意信息。例如,当用户询问电视剧当前总集数时,子资源信息则可以理解为是电视剧的每一集,而子资源总数则可以理解为是电视剧的当前已更新的所有剧集,或是电视剧的总剧集。
将获取的当前播放的多媒体资源的子资源信息作为与用户意图对应的交互信息。
本发明实施例提供了一种多媒体资源播放方法,包括:
从用户语音中识别出用户意图。
如果用户意图中包含资源信息需求,则获取当前播放的多媒体资源的属性信息。
根据当前播放的多媒体资源的属性信息和用户意图,得到与用户意图对应的交互信息。
在一个实施例中,当用户意图为查询当前播放的多媒体资源的子资源总数时,根据当前播放的多媒体资源的属性信息和用户意图,得到与用户意图对应的意图结果,包括:
从数据库中获取当前播放的多媒体资源的属性信息数据。
获取当前播放的多媒体资源的属性信息数据中的子资源信息。
将获取的当前播放的多媒体资源的子资源信息作为与用户意图对应的交互信息。
在一个应用场景中,当用户语音为“这个电视剧现在更新到多少集了”,多媒体资源播放装置识别出用户意图为询问电视剧当前最新的总集数。且识别出总集数为资源信息需求。则进一步的从数据库中获取该电视剧的最新剧集属性信息数据。并从最新剧集属性信息数据查询包括的剧集总数(即子资源信息)。当查询到目前最新的剧集总数为53集时,则生成对应的交互信息并通过语音播放给用户“当前该电视剧最新剧集为53集”。
本发明实施例提供了一种多媒体资源播放装置,如图7所示,包括:
识别模块10,用于从用户语音中识别出用户意图。
第一需求获取模块20,用于如果用户意图中包含时间需求,则获取当前播放的多媒体资源的播放进度信息。
第一处理模块30,用于根据当前播放的多媒体资源的播放进度信息和用户意图,得到与用户意图对应的交互信息。
在一个实施方式中,如图8所示,第一处理模块30包括:
第一获取子模块31,用于获取播放进度信息中的当前播放的多媒体资源的总时长信息和当前播放进度信息。
第一计算子模块32,用于根据总时长信息和当前播放进度信息,计算出当前播放的多媒体资源的剩余播放时长信息。
第一交互子模块33,用于将计算出的当前播放的多媒体资源的剩余播放时长信息作为与用户意图对应的交互信息。
在一个实施方式中,如图9所示,第一处理模块30包括:
第二获取子模块34,用于获取播放进度信息中的当前播放的多媒体资源的当前播放进度信息和起始播放位置信息。
第二计算子模块35,用于根据当前播放进度信息和起始播放位置信息,计算出当前播放的多媒体资源的已观看时长信息。
第二交互子模块36,用于将计算出的当前播放的多媒体资源的已观看时长信息作为与用户意图对应的交互信息。
在一个实施方式中,如图10所示,还包括:
生成模块40,用于根据交互信息进一步生成与用户意图对应的推荐播放策略交互信息。
在一个实施方式中,如图11所示,第一处理模块30包括:
第三获取子模块37,用于获取用户意图中的控制需求。
第三交互子模块38,用于根据当前播放的多媒体资源的播放进度信息和用户意图中的控制需求,得到与用户意图对应的交互信息。
在一个实施方式中,还包括:
第二需求获取模块,用于如果用户意图中包含资源信息需求,则获取当前播放的多媒体资源的属性信息。
第二处理模块,用于根据当前播放的多媒体资源的属性信息和用户意图,得到与用户意图对应的交互信息。
本发明实施例提供了一种多媒体资源播放的终端,如图12所示,包括:
存储器910和处理器920,存储器910内存储有可在处理器920上运行的计算机程序。处理器920执行计算机程序时实现上述实施例中的多媒体资源播放方法。存储器910和处理器920的数量可以为一个或多个。
通信接口930,用于存储器910和处理器920与外部进行通信。
存储器910可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
如果存储器910、处理器920、以及通信接口930独立实现,则存储器910、处理器920以及通信接口930可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(ISA,Industry Standard Architecture)总线、外部设备互连(PCI,PeripheralComponent Interconnect)总线或扩展工业标准体系结构(EISA,Extended IndustryStandard Component)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图12中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器910、处理器920以及通信接口930集成在一块芯片上,则存储器910、处理器920及通信接口930可以通过内部接口完成相互间的通信。
本发明实施例提供了一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现如上述任一实施例所述的多媒体资源播放方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。所述存储介质可以是只读存储器,磁盘或光盘等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (13)

1.一种多媒体资源播放方法,其特征在于,包括:
从用户语音中识别出用户意图;
在所述用户意图中包含时间需求的情况下,根据所述时间需求获取当前播放的多媒体资源的播放进度信息;
根据所述当前播放的多媒体资源的播放进度信息和所述用户意图中的时间需求,计算出与所述用户意图中的时间需求对应的交互信息;
根据所述时间需求对应的交互信息,生成对应的推荐播放策略交互信息,所述推荐播放策略交互信息用于推荐所述当前播放的多媒体资源在下一时间段的播放方式;
将所述时间需求对应的交互信息和所述推荐播放策略交互信息反馈至用户。
2.如权利要求1所述的方法,其特征在于,当所述用户意图为查询所述当前播放的多媒体资源的剩余播放时长时,根据所述当前播放的多媒体资源的播放进度信息和所述用户意图中的时间需求,计算出与所述用户意图中的时间需求对应的交互信息,包括:
获取所述播放进度信息中的所述当前播放的多媒体资源的总时长信息和当前播放进度信息;
根据所述总时长信息和所述当前播放进度信息,计算出所述当前播放的多媒体资源的剩余播放时长信息;
将计算出的所述当前播放的多媒体资源的剩余播放时长信息作为与所述用户意图对应的交互信息。
3.如权利要求1所述的方法,其特征在于,当所述用户意图为查询所述当前播放的多媒体资源的已观看时长时,根据所述当前播放的多媒体资源的播放进度信息和所述用户意图中的时间需求,计算出与所述用户意图中的时间需求对应的交互信息,包括:
获取所述播放进度信息中的所述当前播放的多媒体资源的当前播放进度信息和起始播放位置信息;
根据所述当前播放进度信息和所述起始播放位置信息,计算出所述当前播放的多媒体资源的已观看时长信息;
将计算出的所述当前播放的多媒体资源的已观看时长信息作为与所述用户意图对应的交互信息。
4.如权利要求1所述的方法,其特征在于,根据所述当前播放的多媒体资源的播放进度信息和所述用户意图中的时间需求,计算出与所述用户意图中的时间需求对应的交互信息,包括:
获取所述用户意图中的控制需求;
根据所述当前播放的多媒体资源的播放进度信息和所述用户意图中的控制需求,得到与所述用户意图对应的交互信息。
5.如权利要求1所述的方法,其特征在于,还包括:
如果所述用户意图中包含资源信息需求,则获取当前播放的多媒体资源的属性信息;
根据所述当前播放的多媒体资源的属性信息和所述用户意图,得到与所述用户意图对应的交互信息。
6.如权利要求5所述的方法,其特征在于,当所述用户意图为查询所述当前播放的多媒体资源的子资源总数时,根据所述当前播放的多媒体资源的属性信息和所述用户意图,得到与所述用户意图对应的交互信息,包括:
从数据库中获取所述当前播放的多媒体资源的属性信息数据;
获取所述当前播放的多媒体资源的属性信息数据中的子资源信息;
将获取的所述当前播放的多媒体资源的子资源信息作为与所述用户意图对应的交互信息。
7.一种多媒体资源播放装置,其特征在于,包括:
识别模块,用于从用户语音中识别出用户意图;
第一需求获取模块,用于在所述用户意图中包含时间需求的情况下,根据所述时间需求获取当前播放的多媒体资源的播放进度信息;
第一处理模块,用于根据所述当前播放的多媒体资源的播放进度信息和所述用户意图中的时间需求,计算出与所述用户意图中的时间需求对应的交互信息;
生成模块,用于根据所述时间需求对应的交互信息,生成对应的推荐播放策略交互信息,所述推荐播放策略交互信息用于推荐所述当前播放的多媒体资源在下一时间段的播放方式;
所述第一处理模块还用于将所述时间需求对应的交互信息和所述推荐播放策略交互信息反馈至用户。
8.如权利要求7所述的装置,其特征在于,所述第一处理模块包括:
第一获取子模块,用于获取所述播放进度信息中的所述当前播放的多媒体资源的总时长信息和当前播放进度信息;
第一计算子模块,用于根据所述总时长信息和所述当前播放进度信息,计算出所述当前播放的多媒体资源的剩余播放时长信息;
第一交互子模块,用于将计算出的所述当前播放的多媒体资源的剩余播放时长信息作为与所述用户意图对应的交互信息。
9.如权利要求7所述的装置,其特征在于,所述第一处理模块包括:
第二获取子模块,用于获取所述播放进度信息中的所述当前播放的多媒体资源的当前播放进度信息和起始播放位置信息;
第二计算子模块,用于根据所述当前播放进度信息和所述起始播放位置信息,计算出所述当前播放的多媒体资源的已观看时长信息;
第二交互子模块,用于将计算出的所述当前播放的多媒体资源的已观看时长信息作为与所述用户意图对应的交互信息。
10.如权利要求7所述的装置,其特征在于,所述第一处理模块包括:
第三获取子模块,用于获取所述用户意图中的控制需求;
第三交互子模块,用于根据所述当前播放的多媒体资源的播放进度信息和所述用户意图中的控制需求,得到与所述用户意图对应的交互信息。
11.如权利要求7所述的装置,其特征在于,还包括:
第二需求获取模块,用于如果所述用户意图中包含资源信息需求,则获取当前播放的多媒体资源的属性信息;
第二处理模块,用于根据所述当前播放的多媒体资源的属性信息和所述用户意图,得到与所述用户意图对应的交互信息。
12.一种多媒体资源播放终端,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至6中任一项所述的方法。
13.一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至6中任一项所述的方法。
CN201811515749.4A 2018-12-12 2018-12-12 多媒体资源播放方法和装置 Active CN109618204B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811515749.4A CN109618204B (zh) 2018-12-12 2018-12-12 多媒体资源播放方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811515749.4A CN109618204B (zh) 2018-12-12 2018-12-12 多媒体资源播放方法和装置

Publications (2)

Publication Number Publication Date
CN109618204A CN109618204A (zh) 2019-04-12
CN109618204B true CN109618204B (zh) 2021-04-23

Family

ID=66007898

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811515749.4A Active CN109618204B (zh) 2018-12-12 2018-12-12 多媒体资源播放方法和装置

Country Status (1)

Country Link
CN (1) CN109618204B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110035301A (zh) * 2019-04-15 2019-07-19 钟俊强 一种基于语音控制的播放进度调节方法
CN110297940A (zh) * 2019-06-13 2019-10-01 百度在线网络技术(北京)有限公司 播放处理方法、装置、设备和存储介质
CN110784768B (zh) * 2019-10-17 2021-06-15 珠海格力电器股份有限公司 一种多媒体资源播放方法、存储介质及电子设备
CN113468367A (zh) * 2020-03-31 2021-10-01 百度在线网络技术(北京)有限公司 一种生成服务信息的方法和装置
CN113946744B (zh) * 2020-07-16 2024-08-13 北京达佳互联信息技术有限公司 数据处理方法、装置、服务器及存储介质
CN112511406B (zh) * 2020-10-30 2022-04-29 国网山东省电力公司泰安供电公司 即时通讯软件的语音播放方法和系统
CN112822509B (zh) * 2021-01-29 2023-07-21 北京百度网讯科技有限公司 一种数据处理方法、装置、电子设备和介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103219005A (zh) * 2013-04-28 2013-07-24 北京云知声信息技术有限公司 一种语音识别方法及装置
CN107195303A (zh) * 2017-06-16 2017-09-22 北京云知声信息技术有限公司 语音处理方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003233392A (ja) * 2002-02-08 2003-08-22 Altia Co Ltd 車両用音声入力装置
KR20110072847A (ko) * 2009-12-23 2011-06-29 삼성전자주식회사 열려진 사용자 의도 처리를 위한 대화관리 시스템 및 방법
CN105070288B (zh) * 2015-07-02 2018-08-07 百度在线网络技术(北京)有限公司 车载语音指令识别方法和装置
CN105357585B (zh) * 2015-08-29 2019-05-03 华为技术有限公司 对视频内容任意位置和时间播放的方法及装置
CN105227656B (zh) * 2015-09-28 2018-09-07 百度在线网络技术(北京)有限公司 基于语音识别的信息推送方法和装置
CN107071542B (zh) * 2017-04-18 2020-07-28 百度在线网络技术(北京)有限公司 视频片段播放方法及装置
CN107515944A (zh) * 2017-08-31 2017-12-26 广东美的制冷设备有限公司 基于人工智能的交互方法、用户终端、及存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103219005A (zh) * 2013-04-28 2013-07-24 北京云知声信息技术有限公司 一种语音识别方法及装置
CN107195303A (zh) * 2017-06-16 2017-09-22 北京云知声信息技术有限公司 语音处理方法及装置

Also Published As

Publication number Publication date
CN109618204A (zh) 2019-04-12

Similar Documents

Publication Publication Date Title
CN109618204B (zh) 多媒体资源播放方法和装置
US10950228B1 (en) Interactive voice controlled entertainment
CN107071542B (zh) 视频片段播放方法及装置
US10448082B2 (en) Information exchanging method and device, audio terminal and computer-readable storage medium
US11217256B2 (en) Voice interaction method, device and terminal
JP6958573B2 (ja) 情報処理装置、情報処理方法、およびプログラム
CN106941619A (zh) 基于人工智能的节目提醒方法、装置以及系统
CN110704594A (zh) 基于人工智能的任务型对话交互处理方法、装置
US20170272800A1 (en) Method for bullet screen pushing and electronic device
CN111079529B (zh) 信息提示方法、装置、电子设备及存储介质
CN112866798B (zh) 视频生成方法、装置、设备及存储介质
CN109743589B (zh) 文章生成方法及装置
CN111096680B (zh) 烹饪设备、电子设备、语音服务器、语音控制方法和装置
CN111753061A (zh) 多轮对话处理方法、装置、电子设备及存储介质
CN111862974A (zh) 智能设备的控制方法及智能设备
CN113177134A (zh) 音乐播放方法、装置、电子设备和存储介质
CN106682976A (zh) 一种物品拍卖方法及装置
CN108492826B (zh) 音频处理方法、装置、智能设备及介质
CN111182317B (zh) 直播信息提示方法、装置、电子设备及存储介质
CN118132695A (zh) 启发式人机对话方法及装置、电子设备和存储介质
CN114095738A (zh) 视频及直播处理方法、直播系统、电子设备、终端、介质
CN111723343B (zh) 电子设备的交互控制方法、装置以及电子设备
US11868399B2 (en) System and methods for resolving query related to content
CN104902297A (zh) 一种节目播放的方法及装置
CN111865766B (zh) 基于音像传输的互动方法、介质、设备及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210512

Address after: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing

Patentee after: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

Patentee after: Shanghai Xiaodu Technology Co.,Ltd.

Address before: 100085 Baidu Building, 10 Shangdi Tenth Street, Haidian District, Beijing

Patentee before: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.