CN113163245B - 数据处理方法、装置、电子设备及计算机存储介质 - Google Patents

数据处理方法、装置、电子设备及计算机存储介质 Download PDF

Info

Publication number
CN113163245B
CN113163245B CN202010075748.3A CN202010075748A CN113163245B CN 113163245 B CN113163245 B CN 113163245B CN 202010075748 A CN202010075748 A CN 202010075748A CN 113163245 B CN113163245 B CN 113163245B
Authority
CN
China
Prior art keywords
interaction
voice interaction
voice
interactive
prompt
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010075748.3A
Other languages
English (en)
Other versions
CN113163245A (zh
Inventor
房秀强
章兢
徐昊
陈翌
朱艺
郑庚辛
闫晓亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Youku Culture Technology Beijing Co ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN202010075748.3A priority Critical patent/CN113163245B/zh
Publication of CN113163245A publication Critical patent/CN113163245A/zh
Application granted granted Critical
Publication of CN113163245B publication Critical patent/CN113163245B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4882Data services, e.g. news ticker for displaying messages, e.g. warnings, reminders

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例提供了一种数据处理方法、装置、电子设备及计算机存储介质,其中,所述数据处理方法应用于播放互动媒体内容的过程中,所述方法包括:在互动媒体播放过程中,接收用户根据互动提示输入的语音互动信息;获取所述语音互动信息中的互动关键信息;根据所述互动关键信息,播放与所述互动关键信息对应的互动媒体内容。通过本发明实施例,简化了互动媒体的互动操作过程,降低了互动成本且减轻了用户操作负担。

Description

数据处理方法、装置、电子设备及计算机存储介质
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种数据处理方法、装置、电子设备及计算机存储介质。
背景技术
随着计算机技术的发展,可与用户进行交互的平台和应用正被广泛使用,例如,即时通讯交互、直播交互等等。日前,更多新的可与用户进行交互的媒体类型,如互动视频等也越来越多地被使用。
以互动视频为例,互动视频是一种旨在通过增强体感反馈、剧情参考、内容探索等方式,为观看用户带来更加丰富的观感体验的全新视频类型。目前的互动视频采用在视频播放过程中展示预先设置的多个选项,由用户手动点击选择某个选项,进而播放被点击选项对应的视频的方式。
然而,这种方式需要用户手动参与操作,互动操作复杂,互动成本较高,用户操作负担较大。其它类型的互动媒体也存在着类似的问题。
发明内容
有鉴于此,本发明实施例提供一种数据处理方案,以至少部分解决上述问题。
根据本发明实施例的第一方面,提供了一种数据处理方法,应用于播放互动媒体内容的过程中,所述方法包括:接收用户根据互动提示输入的语音互动信息;获取所述语音互动信息中的互动关键信息;根据所述互动关键信息,播放与所述互动关键信息对应的互动媒体内容。
根据本发明实施例的第二方面,提供了一种数据处理装置,应用于播放互动媒体内容的过程中,所述装置包括:接收模块,用于接收用户根据互动提示输入的语音互动信息;获取模块,用于获取所述语音互动信息中的互动关键信息;互动模块,用于根据所述互动关键信息,播放与所述互动关键信息对应的互动媒体内容。
根据本发明实施例的第三方面,提供了一种电子设备,包括:显示设备,用于显示播放的互动媒体的内容,以及,在所述互动媒体播放过程中用于提示用户进行语音互动操作的互动提示;语音输入设备,用于接收所述用户根据所述互动提示输入的语音互动信息;处理器,用于对所述语音互动信息进行分析,以获取所述语音互动信息中的互动关键信息;并且,确定与所述互动关键信息对应的互动媒体内容,并通过所述显示设备播放确定的所述互动媒体内容。。
根据本发明实施例的第四方面,提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的数据处理方法。
根据本发明实施例提供的数据处理方案,在互动媒体中引入语音互动,用户可以在观看互动媒体的过程中,一方面,根据互动提示通过语音与互动媒体进行互动,参与决定互动媒体的剧情走向;另一方面,用户无需手动操作,将用户的双手解放出来,简化了互动操作过程,降低了互动成本且减轻了用户操作负担。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1A为根据本发明实施例一的一种数据处理方法的步骤流程图;
图1B为图1A所示实施例中的一种使用场景的示意图;
图2A为根据本发明实施例二的一种数据处理方法的步骤流程图;
图2B为图2A所示实施例中的一种使用场景的数据处理过程示意图;
图2C为图2A所示实施例中的一种互动媒体的互动界面示意图;
图2D为图2A所示实施例中的另一种使用场景的数据处理过程示意图;
图3为根据本发明实施例三的一种数据处理装置的结构框图;
图4为根据本发明实施例四的一种数据处理装置的结构框图;
图5为根据本发明实施例五的一种电子设备的结构示意图。
具体实施方式
为了使本领域的人员更好地理解本发明实施例中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明实施例一部分实施例,而不是全部的实施例。基于本发明实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本发明实施例保护的范围。
下面结合本发明实施例附图进一步说明本发明实施例具体实现。
实施例一
参照图1A和图1B,图1A示出了根据本发明实施例一的一种数据处理方法的步骤流程。图1B示出了根据本发明实施例一的一种数据处理方法的步骤场景图。
本实施例的数据处理方法应用于播放互动媒体内容的过程中,所述方法包括以下步骤:
步骤S102:接收用户根据互动提示输入的语音互动信息。
一般来说,互动媒体都提供有可与用户进行互动的选项,常规方式中采用的是选项按钮提示用户参与互动的方式,本实施例中引入语音互动方式,互动提示可以包括但不限于:文字提示、语音提示、图像提示中的一种或多种的结合。当然,选项按钮提示的方式也同样可以适用,但不再需要用户手动操作,根据提示输入语音即可。
例如,如图1B中所示,互动媒体的播放端开始播放互动媒体后,会通过显示界面来显示播放的互动媒体的内容。当互动媒体播放至某一剧情时刻,如某一时间点,互动节点被触发,则会通过显示界面来展示相应的互动提示。如图1B中所示的、通过播放界面展示的麦克风图标及对应的文字提示,如“可以交个朋友吗?”。用户根据该提示输入语音互动信息,例如,用户可以根据文字提示,语音输入“可以”;也可以语音输入“不行”。当然,在实际应用中,用户输入的语音互动信息不需和文字提示完全一样,例如,用户也可以输入“当然可以”,或者输入“完全不行”,包含相应关键提示信息即可。
步骤S104:获取语音互动信息中的互动关键信息。
互动关键信息指示了用户倾向的互动媒体走向,不同的互动关键信息对应不同的互动媒体分支,后续也将播放不同的互动媒体分支对应的媒体内容。
本步骤在具体实现时,可以由本领域技术人员根据实际需求采用任意适当的方式实现,在一种可行方式中,可以先将语音互动信息转换为文本内容,再对该文本内容进行关键信息分析或者关键信息提取,从而获得互动关键信息。互动关键信息可以是互动关键字或者是互动语义结果,等等。
仍以图1B中所示场景为例,假如用户语音输入了“可以”,则对该语音互动信息进行关键信息提取后,即可提取到互动关键词“可以”。同样,假如用户语音输入了“不行”,则对该语音互动信息进行关键信息提取后,即可提取到互动关键词“不行”。
步骤S106:根据互动关键信息,播放与互动关键信息对应的互动媒体内容。
在确定了互动关键信息后,即可确定互动媒体后续的剧情走向,也即后续的互动媒体分支及该分支对应的互动媒体内容。基于此,互动媒体可以跳转至确定的互动媒体内容进行播放,以使用户明确感受到自身参与到了媒体的剧情走向决策中。
例如,假如用户语音输入了“可以”,则将播放对应于“可以”这一互动关键词的互动分支剧情1,如互动视频分支A对应的互动媒体内容A。而若用户语音输入了“不行”,则将播放对应于“不行”这一互动关键词的互动分支剧情2,如互动视频分支B对应的互动媒体内容B。
需要说明的是,本发明实施例中,互动媒体内容可以为视频内容,例如,短视频剧、电影、UGC(User Generated Content,用户生成内容)等。而用户输入的语音互动信息可以包括但不限于:通过语音输入的语句、短语、歌唱片段、尖叫声等。
可见,通过本实施例,在互动媒体中引入语音互动,用户可以在观看互动媒体的过程中,一方面,根据互动提示通过语音与互动媒体进行互动,参与决定互动媒体的剧情走向;另一方面,用户无需手动操作,将用户的双手解放出来,简化了互动操作过程,降低了互动成本且减轻了用户操作负担。
本实施例的数据处理方法可以由任意适当的具有数据处理能力的电子设备执行,包括但不限于:移动终端(如手机、PAD等)、PC机和服务器等。
实施例二
参照图2A,示出了根据本发明实施例二的一种数据处理方法的步骤流程图。
本实施例的数据处理方法应用于播放互动媒体内容的过程中,所述方法包括以下步骤:
步骤S202:播放互动媒体。
步骤S204:在互动媒体播放过程中,接收用户根据互动提示输入的语音互动信息。
本实施例中,设置语音互动引导提示,以提示用户进行语音输入。具体地,本步骤可以实现为:若确定互动媒体播放至语音互动触发节点,则展示语音互动引导提示,并接收用户根据语音互动引导提示输入的语音互动信息;其中,语音互动引导提示包括以下至少之一:语音互动引导图像、语音互动引导文案。
其中,语音互动触发节点可以由本领域技术人员根据实际需求适当设置,可以是互动媒体中的某一视频帧,也可以是某一句台词,还可以是一个时间点。当互动媒体播放至该视频帧或该句台词或该时间点,即触发展示语音互动引导提示,以提示用户通过语音与互动媒体进行互动。
在一种可选方式中,可以根据互动媒体的播放时间信息和预设的语音互动时间信息,确定互动媒体播放至语音互动触发节点。也即,当互动媒体播放至某一时间点时,进行语音互动引导提示。通过这种方式,一方面,可以精确控制语音互动引导提示的展示时间;另一方面,实现简单,实现成本低。
进一步可选地,语音互动引导提示还具有相应的展示时长,具体的展示时长的设置可以由本领域技术人员根据实际需求适当设置,例如,可以为0秒-1秒中的任意数值。需要说明的是,该展示时长可以设置为0秒,以此指示不需展示语音互动引导提示。由此,使用一种数值实现不同功能,既可根据展示时长确定是否要展示语音互动引导提示,又可在需要展示时确定其展示时长。该展示时长通过语音互动引导提示的展示时间信息进行指示。基于此,所述若确定互动媒体播放至语音互动触发节点,则展示语音互动引导提示可以实现为:若确定互动媒体播放至语音互动触发节点,且确定预设的语音互动引导提示的展示时间信息满足第一预设展示时间设置,则展示语音互动引导提示。如前所述,该第一预设展示时间设置可设置为大于0秒的数值。
需要说明的是,若该展示时长为0,虽不展示语音互动引导提示,但仍可进行语音互动,如视频播放画面暂停在某一画面,用户可根据该画面对应的台词进行语音输入。例如,互动媒体播放至某一视频帧暂停,该视频帧的画面中当前的台词为“你觉得是他吗?”,则虽然没有提示,但用户可以语音输入“是他”来与互动媒体互动。当然,用户也可以不做处理,暂停时间如3S到达时,继续互动媒体播放。
而对于展示的语音互动引导提示,其可以包括以下至少之一:语音互动引导图像、语音互动引导文案。其中,语音互动引导图像可以实现为静态图或动态图,若实现为动态图可以有更好的展示效果。语音互动引导文案可以根据互动需求预先设定,也可以根据剧情信息或者台词信息等生成,除可实现提示作用外,还能够与剧情的结合更为紧密。
步骤S206:获取语音互动信息中的互动关键信息。
如前所述,互动关键信息可以通过在将语音互动信息转换为文字内容后,经适当的处理(如算法或模型分析、关键词提取等)获得。但不限于此,也可以通过直接的语音内容分析获得(如通过适当的语音分析处理模型等)。
在一种可行方式中,可以通过互动媒体的播放界面展示语音互动反馈提示,并在展示语音互动反馈提示的过程中,对语音互动信息中进行关键信息分析以获取互动关键信息。可选地,语音互动反馈提示包括以下至少之一:语音互动反馈图像、语音互动反馈文案。
语音互动反馈提示是针对用户输入的语音互动信息的反馈,其可以呈现为反馈图像和/或反馈文案的形式。例如,假设语音互动引导图像显示为麦克风,则语音互动反馈图像则可显示为向麦克风周边或两侧发射频谱的动态图像。假设语音互动引导文案显示“站住,别跑!”和“快跑”,在用户语音输入后,语音互动反馈文案则可显示为诸如“识别中”等等。通过语音互动反馈提示,一方面可以使得用户能够明确获知其输入的语音互动信息已被接收及其处理进度;另一方面,同时在后台分析互动关键信息,也避免了界面展示单调,提升用户使用感受和体验。
可选地,可以为语音互动反馈提示设置展示时长,展示时长可以根据获取互动关键信息的速度和时间灵活设定,一般地,可以设置为4秒以上。
此外,在语音互动引导提示的展示时长为0的情况下,即,不展示语音互动引导提示的情况下,也可通过语音互动反馈提示来提醒用户,例如,可以将语音互动反馈文案显示为“您还没有输入语音”等等。
步骤S208:根据互动关键信息,播放与互动关键信息对应的互动媒体内容。
根据互动关键信息的不同,互动媒体的剧情走向将不同,需要将当前的互动媒体内容跳转至与互动关键信息对应的互动媒体内容进行播放。
在一种可行方式中,可以根据互动关键信息,确定与互动关键信息对应的互动媒体内容;根据互动媒体的跳转设置信息,跳转至与互动关键信息对应的互动媒体内容并进行播放。其中,跳转设置信息用于指示当前互动媒体是否开启了跳转模式。
基于此,若根据互动媒体的跳转设置信息确定互动媒体已开启跳转播放模式,则终止播放当前互动媒体内容并跳转至与互动关键信息对应的互动媒体内容进行播放;而若根据互动媒体的跳转设置信息确定互动媒体未开启跳转播放模式,则继续播放当前互动媒体内容,并在当前互动媒体内容播放完毕后,跳转至与互动关键信息对应的互动媒体内容进行播放。由此,无论当前互动媒体是否开启了跳转播放模式,都可以顺利实现根据用户的指示进行剧情跳转。在开启跳转播放模式下及时进行互动媒体内容跳转,可以使得用户需求实时得到满足;而在未开启跳转播放模式下,在当前互动媒体内容播放完毕后进行跳转,虽然会有很短时间的跳转延迟,但同样可满足用户参与剧情决策的需求,有效避免了用户需求无法得到响应的情况。
此外,在播放与互动关键信息对应的互动媒体内容之前,还可以通过互动媒体的播放界面展示语音互动结果提示,其中,语音互动结果提示包括以下至少之一:语音互动结果图像、语音互动结果文案。语音互动结果提示是对用户输入的语音互动信息进行处理后的结果的一种展示,例如,语音互动结果文案可以展示为“输入正确”、“输入错误”、“即将跳转”等等,可以由本领域技术人员根据实际需求设定。相应地,语音互动结果图像也可以是任意适当的图像,如,麦克风图标恢复为静止状态等等。通过语音互动结果提示,可以使用户明确了解自己输入的语音互动信息与互动媒体的交互结果,提升用户体验。
此外,也可以为语音互动结果提示设置相应的展示时长,具体的展示时长的设置可以由本领域技术人员根据实际需求适当设置,例如,可以为0秒-1秒中的任意数值。需要说明的是,该展示时长可以设置为0秒,以此指示不需展示语音互动结果提示。与语音互动引导提示类似,使用一种数值实现不同功能,既可根据展示时长确定是否要展示语音互动结果提示,又可在需要展示时确定其展示时长。该展示时长通过语音互动结果提示的展示时间信息进行指示。
基于此,在通过互动媒体的播放界面展示语音互动结果提示时,若确定语音互动结果提示的展示时间信息满足第二预设展示时间设置,则通过互动媒体的播放界面展示语音互动结果提示。其中,该第二预设展示时间设置可设置为大于0秒的数值。
以下,以一个具体使用场景实例,对本实施例的上述过程进行示例性说明,如图2B所示。
该过程包括:
步骤A,在互动媒体播放过程中,进入语音识别互动,显示语音互动引导提示。
例如,设定语音互动引导提示的引导UI(User Interface,用户界面)的显示时间大于0秒,则可在互动媒体播放界面某位置(该位置可以是预先设定的,也可以根据对播放界面中内容的识别结果确定)出现该引导UI的引导图像(该图像可以为动图)和引导文案,以引导用户进入语音互动,需要用户操作。一种该界面的示例如图2C中的第一个界面所示,在该界面中,在播放互动媒体内容的同时,在界面下端正中展示有麦克风图像,并且,在该麦克风图像下方显示有引导文案“昨晚的盗贼‘是‘你吗?”。其中,“是”字以引号特别标出,以提示用户可以回答“是”或者“不是”。
在具体实现时,语音互动引导提示的展示时长可以使用GMT,表示引导提示的最大展示时长。如图2B中所示,可以在进入语音互动检测后,先判断GMT是否大于0,若大于0,则显示语音互动引导提示,然后,执行步骤C的检测;否则,直接进行步骤C的检测。
步骤B,进行麦克风确权。
即,确认终端如手机的麦克风功能是否已授权,如果已授权,直接进行步骤C;如果未授权,则可以通过弹窗提示用户进行授权,并在用户授权后进行步骤C。
步骤C,实时反馈语音互动信息。
例如,可以在互动媒体播放界面的某位置展示语音互动反馈提示的U I,包括语音互动反馈图像(如,麦克风的图像变换的动图)和语音互动反馈文案(例如,匹配中,识别中,等)。一种该界面的示例如图2C中的第二个界面所示,在该界面中,界面下端正中展示的麦克风图像向两侧发射频谱图样,并且,在该麦克风图像下方显示有文案“匹配中……”。
应用中,可以将语音互动反馈提示的展示时长使用FMT代表,表示反馈提示的最长展示时长。如图2B所示,在步骤A后,进入实时循环,检查FMT倒计时时间是否已到,如果倒计时未到,则可以继续进行检测;如果倒计时已到,则进入步骤D。
该过程中,针对用户根据语音互动引导提示说出的包含关键词的话语,手机麦克风采集语音内容,并通过语音算法转换成文本文字,然后判断文字中是否包含关键词,如果识别出关键词,则进入步骤D;如果未识别出关键词,则可以继续循环判断,如果FMT倒计时时间已到,直接进入步骤D。
步骤D,互动结果反馈。
本示例中,设置有语音互动结果提示。则,首先判断语音互动结果提示对应的U I的显示时间是否为0,如果为0,直接跳过该互动结果反馈阶段,进入步骤E;如果不为0,显示语音互动结果提示的U I,包括:语音互动结果图像(如,麦克风变成对号或差号,或者,变成“成功”或者“失败”字,样)和对应的语音互动结果文案(如,“说对了”,“说错了”等)。一种语音互动结果提示的U I界面示意如图2C中第三个界面所示。
在实际应用中,如图2B中所示,使用RT代表语音互动结果提示的最大显示时长,在步骤C之后,判断RT是否大于0,若大于0,则显示语音互动结果提示的U I,然后,执行步骤E;否则,直接执行步骤E。
步骤E,跳转播放。
如果互动媒体的跳转开关已开启(可选地,可以设置成默认开启),终止当前互动媒体播放,并切换到对应的互动媒体分支,进行播放;如果跳转开关未开启,则当前互动媒体继续播放,直到播放完毕,然后切换到对应的互动媒体分支,进行播放。如图2C中第四个界面所示。
在实际应用中,以JG代表跳转开关,则如图2B中所示,若JG已开,则直接跳转到相应的互动媒体分支;若JG未开,则可以等待TT时间到达后,再跳转到相应的互动媒体分支。其中:TT=GMT+FMT+RT。
由上,在互动媒体播放的过程中,终端设备通过麦克风,采集用户语句内容并上传给后端,然后通过语音识别算法,判断语句中是否包含关键记号,从而决定剧情的未来走向,使得用户通过语音即可有效参与到与互动媒体的互动交互中来。
在另一个使用场景的示例中,如图2D所示,互动媒体播放至某一剧情时刻,通过播放界面展示语音互动引导提示,包括麦克风图像和文案“昨晚的盗贼‘是’你吗?”。用户根据该提示进行输入语音互动信息,例如,若用户说“是”(也可以为“不是”),则接下来会展示语音互动反馈提示,如图中向两侧发射频谱图样的麦克风图像,以及,在该麦克风图像下方显示的文案“匹配中……”。在此过程中,后台还会对用户输入的语音互动信息进行关键信息分析并获得互动关键信息。进而,展示语音互动结果提示,如对号图像和“说对了”文案。在该语音互动结果提示展示完成后,则若跳转播放模式已开启,则当前互动媒体跳转至与“是”相对应的互动媒体内容进行播放。
而若跳转播放模式未开启,则当前互动媒体会继续播放,至播放完毕后,再跳转至与“是”相对应的互动媒体内容进行播放。
若用户输入语音互动信息错误,例如,用户在语音互动引导提示的提示下,既未说“是”,也未说“不是”,而是说了“锅子”,则该信息无法对应到相应的互动媒体分支,则此种情况下,语音互动结果提示会结合叉号图像和文案“说错了”来提示用户。在一种可行方式中,将会跳转至互动关键信息错误的分支进行互动媒体内容播放,如图2D中所示。当然,也可以不进行跳转,继续播放当前互动媒体。
可见,通过本实施例,在互动媒体中引入语音互动,用户可以在观看互动媒体的过程中,一方面,根据互动提示通过语音与互动媒体进行互动,参与决定互动媒体的剧情走向;另一方面,用户无需手动操作,将用户的双手解放出来,简化了互动操作过程,降低了互动成本且减轻了用户操作负担。
本实施例的数据处理方法可以由任意适当的具有数据处理能力的电子设备执行,包括但不限于:移动终端(如手机、PAD等)、PC机和服务器等。
实施例三
参照图3,示出了根据本发明实施例三的一种数据处理装置的结构框图。
本实施例的数据处理装置应用于播放互动媒体内容的过程中,所述装置包括:接收模块302,用于接收用户根据互动提示输入的语音互动信息;获取模块304,用于获取语音互动信息中的互动关键信息;互动模块306,用于根据互动关键信息,播放与互动关键信息对应的互动媒体内容。
本实施例的数据处理装置用于实现前述方法实施例一和二中相应的数据处理方法,并具有相应的方法实施例的有益效果,在此不再赘述。此外,本实施例的数据处理装置中的各个模块的功能实现均可参照前述方法实施例一和二中的相应部分的描述,在此亦不再赘述。
实施例四
参照图4,示出了根据本发明实施例四的一种数据处理装置的结构框图。
本实施例的数据处理装置应用于播放互动媒体内容的过程中,所述装置包括:接收模块402,用于接收用户根据互动提示输入的语音互动信息;获取模块404,用于获取语音互动信息中的互动关键信息;互动模块406,用于根据互动关键信息,播放与互动关键信息对应的互动媒体内容。
可选地,接收模块402,用于若确定互动媒体播放至语音互动触发节点,则展示语音互动引导提示,并接收用户根据语音互动引导提示输入的语音互动信息;其中,语音互动引导提示包括以下至少之一:语音互动引导图像、语音互动引导文案。
可选地,接收模块402,用于若根据互动媒体的播放时间信息和预设的语音互动时间信息,确定互动媒体播放至所述语音互动触发节点,则展示语音互动引导提示,并接收用户根据语音互动引导提示输入的语音互动信息。
可选地,接收模块402,用于若确定互动媒体播放至语音互动触发节点,且确定预设的语音互动引导提示的展示时间信息满足第一预设展示时间设置,则展示语音互动引导提示,并接收用户根据语音互动引导提示输入的语音互动信息。
可选地,获取模块404,用于通过互动媒体的播放界面展示语音互动反馈提示,并在展示语音互动反馈提示的过程中,对语音互动信息中进行关键信息分析以获取互动关键信息。
可选地,语音互动反馈提示包括以下至少之一:语音互动反馈图像、语音互动反馈文案。
可选地,互动模块406,用于根据互动关键信息,确定与互动关键信息对应的互动媒体内容;根据互动媒体的跳转设置信息,跳转至与互动关键信息对应的互动媒体内容并进行播放。
可选地,互动模块406,用于根据互动关键信息,确定与互动关键信息对应的互动媒体内容;若根据互动媒体的跳转设置信息确定互动媒体已开启跳转播放模式,则终止播放当前互动媒体内容并跳转至与互动关键信息对应的互动媒体内容进行播放;若根据互动媒体的跳转设置信息确定互动媒体未开启跳转播放模式,则继续播放当前互动媒体内容,并在当前互动媒体内容播放完毕后,跳转至与互动关键信息对应的互动媒体内容进行播放。
可选地,互动模块406,还用于在播放与互动关键信息对应的互动媒体内容之前,通过互动媒体的播放界面展示语音互动结果提示,所述语音互动结果提示包括以下至少之一:语音互动结果图像、语音互动结果文案。
可选地,互动模块406,还用于在播放与互动关键信息对应的互动媒体内容之前,若确定语音互动结果提示的展示时间信息满足第二预设展示时间设置,则通过互动媒体的播放界面展示语音互动结果提示。
本实施例的数据处理装置用于实现前述方法实施例一和二中相应的数据处理方法,并具有相应的方法实施例的有益效果,在此不再赘述。此外,本实施例的数据处理装置中的各个模块的功能实现均可参照前述方法实施例一和二中的相应部分的描述,在此亦不再赘述。
实施例五
参照图5,示出了根据本发明实施例五的一种电子设备的结构示意图,本发明具体实施例并不对电子设备的具体实现做限定。
如图5所示,该电子设备可以包括:处理器(processor)502、显示设备504、语音输入设备506、存储器(memory)508、以及通信部件510。
其中:
处理器502、显示设备504、语音输入设备506、以及存储器508通过通信部件510完成相互间的通信。此外,通信部件510还可以与其它电子设备或服务器进行通信。
显示设备504,用于进行数据或信息的显示,具体到本实施例,可以用于显示播放的互动媒体的内容,以及,在所述互动媒体播放过程中用于提示用户进行语音互动操作的互动提示;以及,根据处理器502的指示播放与互动关键信息对应的互动媒体内容。
语音输入设备506,用于接收语音输入,本实施例中,可以用于接收所述用户根据所述互动提示输入的语音互动信息。可选地,语音输入设备506可以是麦克风。
处理器502,用于执行程序512,具体可以执行上述数据处理方法实施例中的相关步骤。例如,用于对所述语音互动信息进行分析,以获取所述语音互动信息中的互动关键信息;并且,确定与所述互动关键信息对应的互动媒体内容,并通过所述显示设备播放确定的所述互动媒体内容。
具体地,程序512可以包括程序代码,该程序代码包括计算机操作指令。
处理器502可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。智能设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器508,用于存放程序512,并且,用于至少存储对应于多个互动媒体分支的互动媒体内容,其中,每个互动媒体分支与至少一个互动关键信息对应。存储器508可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
在一种可选的实施方式中,程序512还用于使得处理器502在接收用户根据互动提示输入的语音互动信息时:若确定互动媒体播放至语音互动触发节点,则通过显示设备504展示语音互动引导提示,并接收用户根据语音互动引导提示通过语音输入设备506输入的语音互动信息;其中,语音互动引导提示包括以下至少之一:语音互动引导图像、语音互动引导文案。
在一种可选的实施方式中,程序512还用于使得处理器502在确定互动媒体播放至语音互动触发节点时:根据互动媒体的播放时间信息和预设的语音互动时间信息,确定互动媒体播放至语音互动触发节点。
在一种可选的实施方式中,程序512还用于使得处理器502在若确定互动媒体播放至语音互动触发节点,则通过显示设备504展示语音互动引导提示时:若确定互动媒体播放至语音互动触发节点,且确定预设的语音互动引导提示的展示时间信息满足第一预设展示时间设置,则通过显示设备504展示语音互动引导提示。
在一种可选的实施方式中,程序512还用于使得处理器502在获取语音互动信息中的互动关键信息时:通过显示设备504中展示的互动媒体的播放界面展示语音互动反馈提示,并在展示语音互动反馈提示的过程中,对语音互动信息中进行关键信息分析以获取互动关键信息。
在一种可选的实施方式中,语音互动反馈提示包括以下至少之一:语音互动反馈图像、语音互动反馈文案。
在一种可选的实施方式中,程序512还用于使得处理器502在根据互动关键信息,播放与互动关键信息对应的互动媒体内容时:根据互动关键信息,确定与互动关键信息对应的互动媒体内容;根据互动媒体的跳转设置信息,跳转至与互动关键信息对应的互动媒体内容并通过显示设备504进行播放。
在一种可选的实施方式中,程序512还用于使得处理器502在根据互动媒体的跳转设置信息,跳转至与互动关键信息对应的互动媒体内容并进行播放时:若根据互动媒体的跳转设置信息确定互动媒体已开启跳转播放模式,则终止播放当前互动媒体内容并跳转至与互动关键信息对应的互动媒体内容进行播放;若根据互动媒体的跳转设置信息确定互动媒体未开启跳转播放模式,则继续播放当前互动媒体内容,并在当前互动媒体内容播放完毕后,跳转至与互动关键信息对应的互动媒体内容进行播放。
在一种可选的实施方式中,程序512还用于使得处理器502在通过显示设备504播放与所述互动关键信息对应的互动媒体内容之前,通过显示设备504中显示的互动媒体的播放界面展示语音互动结果提示,语音互动结果提示包括以下至少之一:语音互动结果图像、语音互动结果文案。
在一种可选的实施方式中,程序512还用于使得处理器502在通过显示设备504中显示的互动媒体的播放界面展示语音互动结果提示时:若确定语音互动结果提示的展示时间信息满足第二预设展示时间设置,则通过显示设备504中显示的互动媒体的播放界面展示语音互动结果提示。
程序512中各步骤的具体实现可以参见上述数据处理方法实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
通过本实施例的电子设备,在互动媒体中引入语音互动,用户可以在观看互动媒体的过程中,一方面,根据互动提示通过语音与互动媒体进行互动,参与决定互动媒体的剧情走向;另一方面,用户无需手动操作,将用户的双手解放出来,简化了互动操作过程,降低了互动成本且减轻了用户操作负担。
需要指出,根据实施的需要,可将本发明实施例中描述的各个部件/步骤拆分为更多部件/步骤,也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤,以实现本发明实施例的目的。
上述根据本发明实施例的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的数据处理方法。此外,当通用计算机访问用于实现在此示出的数据处理方法的代码时,代码的执行将通用计算机转换为用于执行在此示出的数据处理方法的专用计算机。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明实施例的范围。
以上实施方式仅用于说明本发明实施例,而并非对本发明实施例的限制,有关技术领域的普通技术人员,在不脱离本发明实施例的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明实施例的范畴,本发明实施例的专利保护范围应由权利要求限定。

Claims (13)

1.一种数据处理方法,应用于播放互动媒体内容的过程中,所述方法包括:
接收用户根据互动提示输入的语音互动信息;
获取所述语音互动信息中的互动关键信息;
根据所述互动关键信息,播放与所述互动关键信息对应的互动媒体内容;
其中,所述获取所述语音互动信息中的互动关键信息,包括:
通过所述互动媒体的播放界面展示语音互动反馈提示,并在展示所述语音互动反馈提示的过程中,对所述语音互动信息中进行关键信息分析以获取所述互动关键信息,所述语音互动反馈提示为针对用户输入的语音互动信息的反馈;并且,
所述接收用户根据互动提示输入的语音互动信息,包括:
若确定所述互动媒体播放至语音互动触发节点,且确定预设的语音互动引导提示的展示时间为0,则不展示所述语音互动引导提示并且暂停当前互动媒体播放界面,以使用户根据所述当前互动媒体播放界面中的台词进行语音输入,并且通过所述当前互动媒体的播放界面展示所述语音互动反馈提示,接收用户根据所述台词输入的语音互动信息,其中,根据所述语音互动信息的所述互动关键信息的不同,互动媒体的剧情走向不同。
2.根据权利要求1所述的方法,其中,所述语音互动引导提示包括以下至少之一:语音互动引导图像、语音互动引导文案。
3.根据权利要求2所述的方法,其中,所述确定所述互动媒体播放至语音互动触发节点,包括:
根据互动媒体的播放时间信息和预设的语音互动时间信息,确定所述互动媒体播放至所述语音互动触发节点。
4.根据权利要求2所述的方法,其中,所述方法还包括:
若确定互动媒体播放至语音互动触发节点,且确定预设的语音互动引导提示的展示时间信息满足第一预设展示时间设置,则展示所述语音互动引导提示,其中第一预设展示时间为大于0秒的时间。
5.根据权利要求1所述的方法,其中,所述语音互动反馈提示包括以下至少之一:语音互动反馈图像、语音互动反馈文案。
6.根据权利要求1所述的方法,其中,所述根据所述互动关键信息,播放与所述互动关键信息对应的互动媒体内容,包括:
根据所述互动关键信息,确定与所述互动关键信息对应的互动媒体内容;
根据互动媒体的跳转设置信息,跳转至所述互动媒体内容并进行播放。
7.根据权利要求6所述的方法,其中,所述根据互动媒体的跳转设置信息,跳转至所述互动媒体内容并进行播放,包括:
若根据所述互动媒体的跳转设置信息确定所述互动媒体已开启跳转播放模式,则终止播放当前互动媒体内容并跳转至与所述互动关键信息对应的所述互动媒体内容进行播放;
若根据所述互动媒体的跳转设置信息确定所述互动媒体未开启跳转播放模式,则继续播放当前互动媒体内容,并在当前互动媒体内容播放完毕后,跳转至与所述互动关键信息对应的所述互动媒体内容进行播放。
8.根据权利要求1所述的方法,其中,在所述播放与所述互动关键信息对应的互动媒体内容之前,所述方法还包括:
通过所述互动媒体的播放界面展示语音互动结果提示,所述语音互动结果提示包括以下至少之一:语音互动结果图像、语音互动结果文案。
9.根据权利要求8所述的方法,其中,所述通过所述互动媒体的播放界面展示语音互动结果提示,包括:
若确定所述语音互动结果提示的展示时间信息满足第二预设展示时间设置,则通过所述互动媒体的播放界面展示所述语音互动结果提示。
10.一种数据处理装置,应用于播放互动媒体内容的过程中,所述装置包括:
接收模块,用于接收用户根据互动提示输入的语音互动信息;
获取模块,用于获取所述语音互动信息中的互动关键信息;
互动模块,用于根据所述互动关键信息,播放与所述互动关键信息对应的互动媒体内容;
所述获取模块,还用于通过互动媒体的播放界面展示语音互动反馈提示,并在展示语音互动反馈提示的过程中,对语音互动信息中进行关键信息分析以获取互动关键信息,所述语音互动反馈提示为针对用户输入的语音互动信息的反馈;并且,
所述接收模块还用于:
若确定所述互动媒体播放至语音互动触发节点,且确定预设的语音互动引导提示的展示时间为0,则不展示所述语音互动引导提示并且暂停当前互动媒体播放界面,以使用户根据所述当前互动媒体播放界面中的台词进行语音输入,并且通过所述当前互动媒体的播放界面展示所述语音互动反馈提示,接收用户根据所述台词输入的语音互动信息,其中,根据所述语音互动信息的所述互动关键信息的不同,互动媒体的剧情走向不同。
11.一种电子设备,包括:
显示设备,用于显示播放的互动媒体的内容,以及,在所述互动媒体播放过程中用于提示用户进行语音互动操作的互动提示;
语音输入设备,用于接收所述用户根据所述互动提示输入的语音互动信息;
处理器,用于对所述语音互动信息进行分析,以获取所述语音互动信息中的互动关键信息;并且,确定与所述互动关键信息对应的互动媒体内容,并通过所述显示设备播放确定的所述互动媒体内容;所述处理器用于在获取语音互动信息中的互动关键信息时:通过所述显示设备中展示的互动媒体的播放界面展示语音互动反馈提示,并在展示语音互动反馈提示的过程中,对语音互动信息中进行关键信息分析以获取互动关键信息,所述语音互动反馈提示为针对用户输入的语音互动信息的反馈;所述处理器还用于在接收用户根据互动提示输入的语音互动信息时:若确定所述互动媒体播放至语音互动触发节点,且确定预设的语音互动引导提示的展示时间为0,则不展示所述语音互动引导提示并且暂停当前互动媒体播放界面,以使用户根据所述当前互动媒体播放界面中的台词进行语音输入,并且在当前互动媒体的播放界面展示所述语音互动反馈提示,和接收用户根据所述台词输入的语音互动信息,其中,根据所述语音互动信息的所述互动关键信息的不同,互动媒体的剧情走向不同。
12.根据权利要求11所述的电子设备,其中,还包括存储器;
所述存储器,用于至少存储对应于多个互动媒体分支的互动媒体内容,其中,每个互动媒体分支与至少一个互动关键信息对应。
13.一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1-9中任一所述的数据处理方法。
CN202010075748.3A 2020-01-22 2020-01-22 数据处理方法、装置、电子设备及计算机存储介质 Active CN113163245B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010075748.3A CN113163245B (zh) 2020-01-22 2020-01-22 数据处理方法、装置、电子设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010075748.3A CN113163245B (zh) 2020-01-22 2020-01-22 数据处理方法、装置、电子设备及计算机存储介质

Publications (2)

Publication Number Publication Date
CN113163245A CN113163245A (zh) 2021-07-23
CN113163245B true CN113163245B (zh) 2023-06-02

Family

ID=76882026

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010075748.3A Active CN113163245B (zh) 2020-01-22 2020-01-22 数据处理方法、装置、电子设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN113163245B (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104216990A (zh) * 2014-09-09 2014-12-17 科大讯飞股份有限公司 视频广告播放方法及系统
CN104519373B (zh) * 2014-12-16 2017-12-01 微梦创科网络科技(中国)有限公司 媒体节目互动方法及相关设备
CN107659847B (zh) * 2016-09-22 2019-10-15 腾讯科技(北京)有限公司 语音互动方法和装置
CN109947993B (zh) * 2019-03-14 2022-10-21 阿波罗智联(北京)科技有限公司 基于语音识别的情节跳转方法、装置及计算机设备

Also Published As

Publication number Publication date
CN113163245A (zh) 2021-07-23

Similar Documents

Publication Publication Date Title
CN106227335B (zh) 预习讲义与视频课程的交互学习方法及应用学习客户端
US11368754B2 (en) Video playing method, apparatus, electronic device and storage medium
US11527233B2 (en) Method, apparatus, device and computer storage medium for generating speech packet
CN112653902B (zh) 说话人识别方法、装置及电子设备
CN107403011B (zh) 虚拟现实环境语言学习实现方法和自动录音控制方法
CN113010704B (zh) 一种会议纪要的交互方法、装置、设备及介质
US20240114197A1 (en) Video file processing method and apparatus, electronic device, and computer storage medium
CN113010698B (zh) 多媒体的交互方法、信息交互方法、装置、设备及介质
CN113259740A (zh) 一种多媒体处理方法、装置、设备及介质
CN110769189B (zh) 视频会议切换方法、装置及可读存储介质
CN112380365A (zh) 一种多媒体的字幕交互方法、装置、设备及介质
CN111796818B (zh) 多媒体文件的制作方法、装置、电子设备及可读存储介质
CN111061452A (zh) 用户界面的语音控制方法和装置
CN113177419B (zh) 文本改写方法、装置、存储介质及电子设备
CN113163245B (zh) 数据处理方法、装置、电子设备及计算机存储介质
CN113259754B (zh) 视频生成方法、装置、电子设备及存储介质
CN113157236B (zh) 数据处理方法、装置、电子设备及计算机存储介质
CN112988956A (zh) 自动生成对话的方法及装置、信息推荐效果检测方法及装置
CN114422844B (zh) 弹幕素材生成方法、推荐方法、装置、设备、介质及产品
CN112487247B (zh) 视频处理方法及视频处理装置
CN111210673B (zh) 课程数据处理方法、装置、终端设备及计算机存储介质
CN113778596A (zh) 远程协助方法、装置和电子设备
CN111968637A (zh) 终端设备的操作模式控制方法、装置、终端设备及介质
CN113132789B (zh) 一种多媒体的交互方法、装置、设备及介质
US11792494B1 (en) Processing method and apparatus, electronic device and medium

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240613

Address after: Room 201, No. 9 Fengxiang East Street, Yangsong Town, Huairou District, Beijing

Patentee after: Youku Culture Technology (Beijing) Co.,Ltd.

Country or region after: China

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Patentee before: ALIBABA GROUP HOLDING Ltd.

Country or region before: Cayman Islands