CN107194015A - 一种控制音视频资源播放的方法和装置 - Google Patents

一种控制音视频资源播放的方法和装置 Download PDF

Info

Publication number
CN107194015A
CN107194015A CN201710551157.7A CN201710551157A CN107194015A CN 107194015 A CN107194015 A CN 107194015A CN 201710551157 A CN201710551157 A CN 201710551157A CN 107194015 A CN107194015 A CN 107194015A
Authority
CN
China
Prior art keywords
character string
class
video
audio
verb
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710551157.7A
Other languages
English (en)
Inventor
戚秋芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Siyixuan Robot Technology Co Ltd
Original Assignee
Shanghai Siyixuan Robot Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Siyixuan Robot Technology Co Ltd filed Critical Shanghai Siyixuan Robot Technology Co Ltd
Priority to CN201710551157.7A priority Critical patent/CN107194015A/zh
Publication of CN107194015A publication Critical patent/CN107194015A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/438Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • G06F16/433Query formulation using audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本申请一种控制音视频资源播放的方法和装置。方法包括:接收语音信息,并将语音信息转化为语句字符串;依据预设的动词类词库和视频类词库,判断语句字符串中是否包含有视频类动词字符串和视频类字符串;如果包含有,提取视频类动词字符串和视频类字符串,并控制输出视频类字符串对应的目标视频数据;如果不包含有视频类动词字符串和/或视频类字符串,则依据预设的动词类词库和音频类词库,判断语句字符串中是否包含有音频类动词字符串和音频类字符串;如果包含有,提取音频类动词字符串和音频类字符串,并控制输出音频类字符串对应的目标音频数据。本申请基于用户输入的语音信息实现控制相应音视频资源的播放,实现简单,提高了用户操作体验。

Description

一种控制音视频资源播放的方法和装置
技术领域
本申请涉及音视频资源控制技术领域,尤其涉及一种控制音视频资源播放的方法和装置。
背景技术
在控制音视频数据输出上,音视频播放器目前都是基于接收到的来自于遥控器等控制设备发送的控制信号来输出音频数据或视频数据。
显然,这种控制方法依赖于用户利用遥控器等控制设备才能实现,控制方式繁琐。
发明内容
有鉴于此,本申请提供一种控制音视频资源播放的方法和装置,基于用户输入的语音信息实现控制相应音视频资源的播放,实现简单且提高了用户操作体验。技术方案如下:
基于本申请的一方面,本申请提供一种控制音视频资源播放的方法,包括:
接收语音信息,并将所述语音信息转化为语句字符串;
依据预设的动词类词库和视频类词库,判断所述语句字符串中是否包含有视频类动词字符串和视频类字符串;所述动词类词库存储有视频类动词字符串和音频类动词字符串,所述视频类词库存储有视频类型字符串、视频集数字符串、或视频资源字符串中的至少一种,所述视频类字符串包括所述视频类型字符串、视频集数字符串、或视频资源字符串中的至少一种;
如果所述语句字符串中包含有视频类动词字符串和视频类字符串,则提取所述视频类动词字符串和视频类字符串,并控制输出所述视频类字符串对应的目标视频数据;
如果所述语句字符串中不包含有所述视频类动词字符串和/或所述视频类字符串,则依据预设的动词类词库和音频类词库,判断所述语句字符串中是否包含有音频类动词字符串和音频类字符串;其中,所述音频类词库存储有音频类型字符串、明确音频类型的字符串、或音频资源字符串中的至少一种,所述音频类字符串包括所述音频类型字符串、明确音频类型的字符串、或音频资源字符串中的至少一种;
如果所述语句字符串中包含有音频类动词字符串和音频类字符串,则提取所述音频类动词字符串和音频类字符串,并控制输出所述音频类字符串对应的目标音频数据。
优选地,所述依据预设的动词类词库和视频类词库,判断所述语句字符串中是否包含有视频类动词字符串和视频类字符串包括:
将所述语句字符串进行切分,获得多个子字符串;
将所述多个子字符串分别与所述动词类词库中存储的视频类动词字符串,以及所述视频类词库中存储的视频类字符串进行匹配。
优选地,所述依据预设的动词类词库和音频类词库,判断所述语句字符串中是否包含有音频类动词字符串和音频类字符串包括:
将所述多个子字符串分别与所述动词类词库中存储的音频类动词字符串,以及所述音频类词库中存储的音频类字符串进行匹配。
优选地,所述视频类词库包括:用于存储视频类型字符串的视频类型词库、用于存储视频集数字符串的视频集数词库、以及用于存储视频资源字符串的视频资源词库;
所述音频类词库包括:用于存储音频类型字符串的第一音频类型词库、用于存储明确音频类型的字符串的第二音频类型词库、以及用于存储音频资源字符串的音频资源词库。
基于本申请的另一方面,本申请还提供一种控制音视频资源播放的方法,包括:
接收语音信息,并将所述语音信息转化为语句字符串;
依据预设的动词类词库和音频类词库,判断所述语句字符串中是否包含有音频类动词字符串和音频类字符串;其中,所述动词类词库存储有视频类动词字符串和音频类动词字符串,所述音频类词库存储有音频类型字符串、明确音频类型的字符串、或音频资源字符串中的至少一种,所述音频类字符串包括所述音频类型字符串、明确音频类型的字符串、或音频资源字符串中的至少一种;
如果所述语句字符串中包含有音频类动词字符串和音频类字符串,则提取所述音频类动词字符串和音频类字符串,并控制输出所述音频类字符串对应的目标音频数据;
如果所述语句字符串中不包含有所述音频类动词字符串和/或所述音频类字符串,则依据预设的动词类词库和视频类词库,判断所述语句字符串中是否包含有视频类动词字符串和视频类字符串;其中,所述视频类词库存储有视频类型字符串、视频集数字符串、或视频资源字符串中的至少一种,所述视频类字符串包括所述视频类型字符串、视频集数字符串、或视频资源字符串中的至少一种;
如果所述语句字符串中包含有视频类动词字符串和视频类字符串,则提取所述视频类动词字符串和视频类字符串,并控制输出所述视频类字符串对应的目标视频数据。
基于本申请的再一方面,本申请提供一种控制音视频资源播放的装置,包括:
第一接收单元,用于接收语音信息;
第一转化单元,用于将所述语音信息转化为语句字符串;
第一判断单元,用于依据预设的动词类词库和视频类词库,判断所述语句字符串中是否包含有视频类动词字符串和视频类字符串;所述动词类词库存储有视频类动词字符串和音频类动词字符串,所述视频类词库存储有视频类型字符串、视频集数字符串、或视频资源字符串中的至少一种,所述视频类字符串包括所述视频类型字符串、视频集数字符串、或视频资源字符串中的至少一种;
第一提取单元,用于在所述第一判断单元判断所述语句字符串中包含有视频类动词字符串和视频类字符串时,提取所述视频类动词字符串和视频类字符串;
第一输出单元,用于控制输出所述视频类字符串对应的目标视频数据;
第二判断单元,用于在所述第一判断单元判断所述语句字符串中不包含有视频类动词字符串和视频类字符串时,依据预设的动词类词库和音频类词库,判断所述语句字符串中是否包含有音频类动词字符串和音频类字符串;其中,所述音频类词库存储有音频类型字符串、明确音频类型的字符串、或音频资源字符串中的至少一种,所述音频类字符串包括所述音频类型字符串、明确音频类型的字符串、或音频资源字符串中的至少一种;
第二提取单元,用于在所述第二判断单元判断所述语句字符串中包含有音频类动词字符串和音频类字符串时,提取所述音频类动词字符串和音频类字符串;
第二输出单元,用于控制输出所述音频类字符串对应的目标音频数据。
优选地,所述第一判断单元包括:
字符串切分子单元,用于将所述语句字符串进行切分,获得多个子字符串;
第一字符串匹配子单元,用于将所述多个子字符串分别与所述动词类词库中存储的视频类动词字符串,以及所述视频类词库中存储的视频类字符串进行匹配。
优选地,所述第二判断单元包括:
第二字符串匹配子单元,用于将所述多个子字符串分别与所述动词类词库中存储的音频类动词字符串,以及所述音频类词库中存储的音频类字符串进行匹配。
优选地,所述视频类词库包括:用于存储视频类型字符串的视频类型词库、用于存储视频集数字符串的视频集数词库、以及用于存储视频资源字符串的视频资源词库;
所述音频类词库包括:用于存储音频类型字符串的第一音频类型词库、用于存储明确音频类型的字符串的第二音频类型词库、以及用于存储音频资源字符串的音频资源词库。
基于本申请的再一方面,本申请还提供一种控制音视频资源播放的装置,包括:
第二接收单元,用于接收语音信息;
第二转化单元,用于将所述语音信息转化为语句字符串;
第三判断单元,用于依据预设的动词类词库和音频类词库,判断所述语句字符串中是否包含有音频类动词字符串和音频类字符串;其中,所述动词类词库存储有视频类动词字符串和音频类动词字符串,所述音频类词库存储有音频类型字符串、明确音频类型的字符串、或音频资源字符串中的至少一种,所述音频类字符串包括所述音频类型字符串、明确音频类型的字符串、或音频资源字符串中的至少一种;
第三提取单元,用于在所述第三判断单元判断所述语句字符串中包含有音频类动词字符串和音频类字符串时,提取所述音频类动词字符串和音频类字符串;
第三输出单元,用于控制输出所述音频类字符串对应的目标音频数据;
第四判断单元,用于在所述第三判断单元判断所述语句字符串中不包含有所述音频类动词字符串和/或所述音频类字符串时,依据预设的动词类词库和视频类词库,判断所述语句字符串中是否包含有视频类动词字符串和视频类字符串;其中,所述视频类词库存储有视频类型字符串、视频集数字符串、或视频资源字符串中的至少一种,所述视频类字符串包括所述视频类型字符串、视频集数字符串、或视频资源字符串中的至少一种;
第四提取单元,用于在所述第四判断单元判断所述语句字符串中包含有视频类动词字符串和视频类字符串时,提取所述视频类动词字符串和视频类字符串;
第四输出单元,用于控制输出所述视频类字符串对应的目标视频数据。
本申请提供的控制音视频资源播放的方法中,将接收到的语音信息转化为语句字符串,进而依据预设的动词类词库、视频类词库和音频类字符串判断语句字符串是否包含有视频类动词字符串和视频类字符串,或,判断是否包含有音频类动词字符串和音频类字符串。如果语句字符串中包含有视频类动词字符串和视频类字符串,则提取视频类动词字符串和视频类字符串,控制输出视频类字符串对应的目标视频数据;如果语句字符串中包含有音频类动词字符串和音频类字符串,则提取音频类动词字符串和音频类字符串,控制输出音频类字符串对应的目标音频数据。本申请基于用户输入的语音信息实现控制相应音视频资源的播放,实现简单且提高了用户操作体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请提供的一种控制音视频资源播放的方法的流程图;
图2为本申请提供的另一种控制音视频资源播放的方法的流程图;
图3为本申请提供的一种控制音视频资源播放的装置的结构示意图;
图4为本申请提供的另一种控制音视频资源播放的装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
请参阅图1,其示出了本申请提供的一种控制音视频资源播放的方法的流程图,包括:
步骤101,接收语音信息,并将所述语音信息转化为语句字符串。
在实际应用过程中,可以利用拾音器、麦克风等设备实现对用户发出的语音信息的获取,进而将获取到的语音信息发送至音视频播放器的处理器。处理器接收到语音信息后,将所述语音信息转化为语句字符串。
目前,将语音信息转化为语句字符串的实现手段已经非常成熟,本申请可直接采用现有的语音转化方法,将语音信息转化为语句字符串,申请人对此不再进行详细论述。
步骤102,依据预设的动词类词库和视频类词库,判断所述语句字符串中是否包含有视频类动词字符串和视频类字符串。如果都包含有,执行步骤103,如果有任意一个不包含,则执行步骤104。
在本申请具体应用前,本申请首先建立了动词类词库、视频类词库、和音频类词库。其中动词类词库存储有视频类动词字符串和音频类动词字符串。为了便于管理和查找字符串,本申请可以进一步将动词类词库划分为用于存储视频类动词字符串的第一动词类词库,和用于存储音频类动词字符串的第二动词类词库。
本申请中,视频类动词字符串表示该动词字符串指向播放视频数据,例如包括“看”、“观看”。音频类动词字符串表示该动词字符串指向播放音频数据,例如包括“听”、“收听”。当然,有些动词字符串既属于视频类动词字符串又属于音频类动词字符串,例如“播放”、“欣赏”、“打开”等,这些既属于视频类动词字符串又属于音频类动词字符串的动词字符串会同时存储在第一动词类词库和第二动词类词库中。
视频类词库存储有视频类型字符串、视频集数字符串、或视频资源字符串中的至少一种。其中视频类型字符串表示视频的类型,例如包括“电视剧”、“电影”;视频集数字符串表示视频的集数,例如包括“第三集”、“最后一集”;视频资源字符串表示视频资源涉及的主要内容,例如包括视频名称“西游记”等。视频类型字符串、视频集数字符串、和视频资源字符串统称为视频类字符串。
为了便于对视频类词库的管理,本申请可以进一步将视频类词库中的各类字符串进行划分,并分开存储。具体地,本申请实施例中,视频类词库可以进一步包括用于存储视频类型字符串的视频类型词库、用于存储视频集数字符串的视频集数词库、以及用于存储视频资源字符串的视频资源词库。
音频类词库存储有音频类型字符串、明确音频类型的字符串、或音频资源字符串中的至少一种。其中,音频类型字符串表示音频的类型,例如包括“歌曲”、“音乐”;明确音频类型的字符串例如包括“xx明星的歌”、“摇滚”等;音频资源字符串表示音频资源涉及的主要内容,例如包括音频名称“忘情水”。音频类型字符串、明确音频类型的字符串、和音频资源字符串统称为音频类字符串。
为了便于对音频类词库的管理,本申请可以进一步将音频类词库中的各类字符串进行划分,并分开存储。具体地,本申请实施例中,音频类词库可以进一步包括用于存储音频类型字符串的第一音频类型词库、用于存储明确音频类型的字符串的第二音频类型词库、以及用于存储音频资源字符串的音频资源词库。
本申请步骤102判断语句字符串中是否包含有视频类动词字符串和视频类字符串可以采用如下步骤1021-步骤1022实现:
步骤1021,将语句字符串进行切分,获得多个子字符串。
本申请可以预设各种切分规则,进而依据预设的切法规则对语句字符串进行切分,从而获得多个子字符串。
步骤1022,将所述多个子字符串分别与所述动词类词库中存储的视频类动词字符串,以及所述视频类词库中存储的视频类字符串进行匹配。
在获得多个子字符串后,将各子字符串分别与动词类词库中存储的视频类动词字符串,以及视频类词库中存储的视频类字符串进行匹配。当匹配的两者一致时,即确定匹配成功,也即确定语句字符串中包含有视频类动词字符串或视频类字符串。
举例来讲,假设当前的语句字符串中“播放电视剧西游记”,经切分后得到的多个子字符串分别为“播放”、“电视剧”、“西游记”,其中子字符串“播放”与视频类动词字符串中的“播放”字符串一致,子字符串“电视剧”与视频类型字符串(即视频类字符串)中的“电视剧”字符串一致,子字符串“西游记”与视频资源字符串(即视频类字符串)中的“西游记”字符串一致,那么即可确定语句字符串中包含有视频类动词字符串“播放”和视频类字符串“电视剧”、“西游记”。
步骤103,提取所述视频类动词字符串和视频类字符串,并控制输出所述视频类字符串对应的目标视频数据。
当判断语句字符串中包含有视频类动词字符串和视频类字符串时,提取该视频类动词字符串和视频类字符串,进而控制输出视频类字符串对应的目标视频数据。
仍以前述事例为例进行说明,当判断语句字符串中包含有视频类动词字符串“播放”和视频类字符串“电视剧”、“西游记”后,提取视频类动词字符串“播放”、视频类字符串“电视剧”和视频类字符串“西游记”,并依据该提取出的字符串,控制播放电视剧西游记。
步骤104,依据预设的动词类词库和音频类词库,判断所述语句字符串中是否包含有音频类动词字符串和音频类字符串。如果都包含有,则执行步骤105,如果有任意一个不包含,则执行步骤106。
具体地,本申请步骤104可以为,将步骤1021切分得到的多个子字符串分别与动词类词库中存储的音频类动词字符串,以及音频类词库中存储的音频类字符串进行匹配。
举例来讲,假设当前的语句字符串为“播放歌曲忘情水”,经切分后得到的多个子字符串分别为“播放”、“歌曲”、“忘情水”。在经前述步骤102判断得知当前的语句字符串虽然包含有视频类动词字符串“播放”,但并未包含有视频类字符串,因此执行步骤104,继续判断语句字符串中是否包含有音频类动词字符串和音频类字符串。
通过将多个子字符串分别与动词类词库中存储的音频类动词字符串,以及音频类词库中存储的音频类字符串进行匹配可以获知,子字符串“播放”与音频类动词字符串中的“播放”字符串一致,子字符串“歌曲”与音频类型字符串(即音频类字符串)中的“歌曲”字符串一致,子字符串“忘情水”与音频资源字符串(即音频类字符串)中的“忘情水”字符串一致,那么即可确定语句字符串中包含有音频类动词字符串“播放”和音频类字符串“歌曲”、“忘情水”。
步骤105,提取所述音频类动词字符串和音频类字符串,并控制输出所述音频类字符串对应的目标音频数据。
当判断语句字符串中包含有音频类动词字符串和音频类字符串时,提取该音频类动词字符串和音频类字符串,进而控制输出音频类字符串对应的目标音频数据。
仍以前述事例为例进行说明,当判断语句字符串中包含有音频类动词字符串“播放”和音频类字符串“歌曲”、“忘情水”后,提取视频类动词字符串“播放”、音频类字符串“歌曲”和音频类字符串“忘情水”,并依据该提取出的字符串,控制播放歌曲忘情水。
步骤106,输出提示信息。
当判断语句字符串,既没有同时包含有视频类动词字符串和视频类字符串,也没有同时包含有音频类动词字符串和音频类字符串时,本申请优选为输出提示信息,以告知用户当前输入错误。
其中输出提示信息的方式例如包括,通过喇叭输出“输入错误”、“未找到查询结果”等语音,或通过显示屏输出“输入错误”、“未找到查询结果”等信息。
应用本申请提供的控制音视频资源播放的方法,将接收到的语音信息转化为语句字符串,进而依据预设的动词类词库、视频类词库和音频类字符串判断语句字符串是否包含有视频类动词字符串和视频类字符串,或,判断是否包含有音频类动词字符串和音频类字符串。如果语句字符串中包含有视频类动词字符串和视频类字符串,则提取视频类动词字符串和视频类字符串,控制输出视频类字符串对应的目标视频数据;如果语句字符串中包含有音频类动词字符串和音频类字符串,则提取音频类动词字符串和音频类字符串,控制输出音频类字符串对应的目标音频数据。本申请基于用户输入的语音信息实现控制相应音视频资源的播放,实现简单且提高了用户操作体验。
实施例二
前述实施例一中,首先判断语句字符串中是否包含有视频类动词字符串和视频类字符串,如果包含有视频类动词字符串和视频类字符串,则直接提取视频类动词字符串和视频类字符串,并控制输出所述视频类字符串对应的目标视频数据,而不再继续判断后续是否控制输出音频数据的步骤。
本实施例二与实施例一的不同在于,首先判断语句字符串中是否包含有音频类动词字符串和音频类字符串,如果包含有音频类动词字符串和音频类字符串,则直接提取音频类动词字符串和音频类字符串,并控制输出所述音频类字符串对应的目标音频数据,而不再继续判断是否控制输出视频数据。具体参阅图2所示,方法包括:
步骤201,接收语音信息,并将所述语音信息转化为语句字符串。
步骤202,依据预设的动词类词库和音频类词库,判断语句字符串中是否包含有音频类动词字符串和音频类字符串。如果都包含有,执行步骤203,如果有任意一个不包含,则执行步骤204。
其中动词类词库存储有视频类动词字符串和音频类动词字符串。为了便于管理和查找字符串,本申请可以进一步将动词类词库划分为用于存储视频类动词字符串的第一动词类词库,和用于存储音频类动词字符串的第二动词类词库。
本申请中,视频类动词字符串表示该动词字符串指向播放视频数据,例如包括“看”、“观看”。音频类动词字符串表示该动词字符串指向播放音频数据,例如包括“听”、“收听”。当然,有些动词字符串既属于视频类动词字符串又属于音频类动词字符串,例如“播放”、“欣赏”、“打开”等,这些既属于视频类动词字符串又属于音频类动词字符串的动词字符串会同时存储在第一动词类词库和第二动词类词库中。
视频类词库存储有视频类型字符串、视频集数字符串、或视频资源字符串中的至少一种。其中视频类型字符串表示视频的类型,例如包括“电视剧”、“电影”;视频集数字符串表示视频的集数,例如包括“第三集”、“最后一集”;视频资源字符串表示视频资源涉及的主要内容,例如包括视频名称“西游记”等。视频类型字符串、视频集数字符串、和视频资源字符串统称为视频类字符串。
为了便于对视频类词库的管理,本申请可以进一步将视频类词库中的各类字符串进行划分,并分开存储。具体地,本申请实施例中,视频类词库可以进一步包括用于存储视频类型字符串的视频类型词库、用于存储视频集数字符串的视频集数词库、以及用于存储视频资源字符串的视频资源词库。
音频类词库存储有音频类型字符串、明确音频类型的字符串、或音频资源字符串中的至少一种。其中,音频类型字符串表示音频的类型,例如包括“歌曲”、“音乐”;明确音频类型的字符串例如包括“xx明星的歌”、“摇滚”等;音频资源字符串表示音频资源涉及的主要内容,例如包括音频名称“忘情水”。音频类型字符串、明确音频类型的字符串、和音频资源字符串统称为音频类字符串。
为了便于对音频类词库的管理,本申请可以进一步将音频类词库中的各类字符串进行划分,并分开存储。具体地,本申请实施例中,音频类词库可以进一步包括用于存储音频类型字符串的第一音频类型词库、用于存储明确音频类型的字符串的第二音频类型词库、以及用于存储音频资源字符串的音频资源词库。
本申请步骤202判断语句字符串中是否包含有音频类动词字符串和音频类字符串可以采用如下步骤2021-步骤2022实现:
步骤2021,将语句字符串进行切分,获得多个子字符串。
本申请可以预设各种切分规则,进而依据预设的切法规则对语句字符串进行切分,从而获得多个子字符串。
步骤1022,将所述多个子字符串分别与所述动词类词库中存储的音频类动词字符串,以及所述音频类词库中存储的音频类字符串进行匹配。
在获得多个子字符串后,将各子字符串分别与动词类词库中存储的音频类动词字符串,以及音频类词库中存储的音频类字符串进行匹配。当匹配的两者一致时,即确定匹配成功,也即确定语句字符串中包含有音频类动词字符串或音频类字符串。
步骤203,提取所述音频类动词字符串和音频类字符串,并控制输出所述音频类字符串对应的目标音频数据。
步骤204,依据预设的动词类词库和视频类词库,判断语句字符串中是否包含有视频类动词字符串和视频类字符串。如果都包含有,则执行步骤205,如果有任意一个不包含,则执行步骤206。
具体地,本申请步骤204可以为,将步骤2021切分得到的多个子字符串分别与动词类词库中存储的音频类动词字符串,以及音频类词库中存储的音频类字符串进行匹配。
步骤205,提取所述视频类动词字符串和视频类字符串,并控制输出所述视频类字符串对应的目标视频数据。
步骤206,输出提示信息。
当判断语句字符串,既没有同时包含有视频类动词字符串和视频类字符串,也没有同时包含有音频类动词字符串和音频类字符串时,本申请优选为输出提示信息,以告知用户当前输入错误。
其中输出提示信息的方式例如包括,通过喇叭输出“输入错误”、“未找到查询结果”等语音,或通过显示屏输出“输入错误”、“未找到查询结果”等信息。
本申请实施例基于用户输入的语音信息实现控制相应音视频资源的播放,实现简单,提高了用户操作体验。
实施例三
基于前文实施例一提供的一种控制音视频资源播放的方法,本申请实施例还提供一种控制音视频资源播放的装置,如图3所示,包括:
第一接收单元10,用于接收语音信息;
第一转化单元20,用于将所述语音信息转化为语句字符串;
第一判断单元30,用于依据预设的动词类词库和视频类词库,判断所述语句字符串中是否包含有视频类动词字符串和视频类字符串;所述动词类词库存储有视频类动词字符串和音频类动词字符串,所述视频类词库存储有视频类型字符串、视频集数字符串、或视频资源字符串中的至少一种,所述视频类字符串包括所述视频类型字符串、视频集数字符串、或视频资源字符串中的至少一种;
第一提取单元40,用于在所述第一判断单元30判断所述语句字符串中包含有视频类动词字符串和视频类字符串时,提取所述视频类动词字符串和视频类字符串;
第一输出单元50,用于控制输出所述视频类字符串对应的目标视频数据;
第二判断单元60,用于在所述第一判断单元30判断所述语句字符串中不包含有视频类动词字符串和视频类字符串时,依据预设的动词类词库和音频类词库,判断所述语句字符串中是否包含有音频类动词字符串和音频类字符串;其中,所述音频类词库存储有音频类型字符串、明确音频类型的字符串、或音频资源字符串中的至少一种,所述音频类字符串包括所述音频类型字符串、明确音频类型的字符串、或音频资源字符串中的至少一种;
第二提取单元70,用于在所述第二判断单元60判断所述语句字符串中包含有音频类动词字符串和音频类字符串时,提取所述音频类动词字符串和音频类字符串;
第二输出单元80,用于控制输出所述音频类字符串对应的目标音频数据。
其中,所述第一判断单元30包括:
字符串切分子单元31,用于将所述语句字符串进行切分,获得多个子字符串;
第一字符串匹配子单元32,用于将所述多个子字符串分别与所述动词类词库中存储的视频类动词字符串,以及所述视频类词库中存储的视频类字符串进行匹配。
所述第二判断单元60包括:
第二字符串匹配子单元61,用于将所述多个子字符串分别与所述动词类词库中存储的音频类动词字符串,以及所述音频类词库中存储的音频类字符串进行匹配。
本申请实施例中,所述视频类词库包括:用于存储视频类型字符串的视频类型词库、用于存储视频集数字符串的视频集数词库、以及用于存储视频资源字符串的视频资源词库;
所述音频类词库包括:用于存储音频类型字符串的第一音频类型词库、用于存储明确音频类型的字符串的第二音频类型词库、以及用于存储音频资源字符串的音频资源词库。
实施例四
基于前文实施例二提供的一种控制音视频资源播放的方法,本申请实施例还提供一种控制音视频资源播放的装置,如图4所示,包括:
第二接收单元100,用于接收语音信息;
第二转化单元200,用于将所述语音信息转化为语句字符串;
第三判断单元300,用于依据预设的动词类词库和音频类词库,判断所述语句字符串中是否包含有音频类动词字符串和音频类字符串;其中,所述动词类词库存储有视频类动词字符串和音频类动词字符串,所述音频类词库存储有音频类型字符串、明确音频类型的字符串、或音频资源字符串中的至少一种,所述音频类字符串包括所述音频类型字符串、明确音频类型的字符串、或音频资源字符串中的至少一种;
第三提取单元400,用于在所述第三判断单元300判断所述语句字符串中包含有音频类动词字符串和音频类字符串时,提取所述音频类动词字符串和音频类字符串;
第三输出单元500,用于控制输出所述音频类字符串对应的目标音频数据;
第四判断单元600,用于在所述第三判断单元300判断所述语句字符串中不包含有所述音频类动词字符串和/或所述音频类字符串时,依据预设的动词类词库和视频类词库,判断所述语句字符串中是否包含有视频类动词字符串和视频类字符串;其中,所述视频类词库存储有视频类型字符串、视频集数字符串、或视频资源字符串中的至少一种,所述视频类字符串包括所述视频类型字符串、视频集数字符串、或视频资源字符串中的至少一种;
第四提取单元700,用于在所述第四判断单元600判断所述语句字符串中包含有视频类动词字符串和视频类字符串时,提取所述视频类动词字符串和视频类字符串;
第四输出单元800,用于控制输出所述视频类字符串对应的目标视频数据。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的一种控制音视频资源播放的方法和装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种控制音视频资源播放的方法,其特征在于,包括:
接收语音信息,并将所述语音信息转化为语句字符串;
依据预设的动词类词库和视频类词库,判断所述语句字符串中是否包含有视频类动词字符串和视频类字符串;所述动词类词库存储有视频类动词字符串和音频类动词字符串,所述视频类词库存储有视频类型字符串、视频集数字符串、或视频资源字符串中的至少一种,所述视频类字符串包括所述视频类型字符串、视频集数字符串、或视频资源字符串中的至少一种;
如果所述语句字符串中包含有视频类动词字符串和视频类字符串,则提取所述视频类动词字符串和视频类字符串,并控制输出所述视频类字符串对应的目标视频数据;
如果所述语句字符串中不包含有所述视频类动词字符串和/或所述视频类字符串,则依据预设的动词类词库和音频类词库,判断所述语句字符串中是否包含有音频类动词字符串和音频类字符串;其中,所述音频类词库存储有音频类型字符串、明确音频类型的字符串、或音频资源字符串中的至少一种,所述音频类字符串包括所述音频类型字符串、明确音频类型的字符串、或音频资源字符串中的至少一种;
如果所述语句字符串中包含有音频类动词字符串和音频类字符串,则提取所述音频类动词字符串和音频类字符串,并控制输出所述音频类字符串对应的目标音频数据。
2.根据权利要求1所述的方法,其特征在于,所述依据预设的动词类词库和视频类词库,判断所述语句字符串中是否包含有视频类动词字符串和视频类字符串包括:
将所述语句字符串进行切分,获得多个子字符串;
将所述多个子字符串分别与所述动词类词库中存储的视频类动词字符串,以及所述视频类词库中存储的视频类字符串进行匹配。
3.根据权利要求2所述的方法,其特征在于,所述依据预设的动词类词库和音频类词库,判断所述语句字符串中是否包含有音频类动词字符串和音频类字符串包括:
将所述多个子字符串分别与所述动词类词库中存储的音频类动词字符串,以及所述音频类词库中存储的音频类字符串进行匹配。
4.根据权利要求1-3任一项所述的方法,其特征在于,
所述视频类词库包括:用于存储视频类型字符串的视频类型词库、用于存储视频集数字符串的视频集数词库、以及用于存储视频资源字符串的视频资源词库;
所述音频类词库包括:用于存储音频类型字符串的第一音频类型词库、用于存储明确音频类型的字符串的第二音频类型词库、以及用于存储音频资源字符串的音频资源词库。
5.一种控制音视频资源播放的方法,其特征在于,包括:
接收语音信息,并将所述语音信息转化为语句字符串;
依据预设的动词类词库和音频类词库,判断所述语句字符串中是否包含有音频类动词字符串和音频类字符串;其中,所述动词类词库存储有视频类动词字符串和音频类动词字符串,所述音频类词库存储有音频类型字符串、明确音频类型的字符串、或音频资源字符串中的至少一种,所述音频类字符串包括所述音频类型字符串、明确音频类型的字符串、或音频资源字符串中的至少一种;
如果所述语句字符串中包含有音频类动词字符串和音频类字符串,则提取所述音频类动词字符串和音频类字符串,并控制输出所述音频类字符串对应的目标音频数据;
如果所述语句字符串中不包含有所述音频类动词字符串和/或所述音频类字符串,则依据预设的动词类词库和视频类词库,判断所述语句字符串中是否包含有视频类动词字符串和视频类字符串;其中,所述视频类词库存储有视频类型字符串、视频集数字符串、或视频资源字符串中的至少一种,所述视频类字符串包括所述视频类型字符串、视频集数字符串、或视频资源字符串中的至少一种;
如果所述语句字符串中包含有视频类动词字符串和视频类字符串,则提取所述视频类动词字符串和视频类字符串,并控制输出所述视频类字符串对应的目标视频数据。
6.一种控制音视频资源播放的装置,其特征在于,包括:
第一接收单元,用于接收语音信息;
第一转化单元,用于将所述语音信息转化为语句字符串;
第一判断单元,用于依据预设的动词类词库和视频类词库,判断所述语句字符串中是否包含有视频类动词字符串和视频类字符串;所述动词类词库存储有视频类动词字符串和音频类动词字符串,所述视频类词库存储有视频类型字符串、视频集数字符串、或视频资源字符串中的至少一种,所述视频类字符串包括所述视频类型字符串、视频集数字符串、或视频资源字符串中的至少一种;
第一提取单元,用于在所述第一判断单元判断所述语句字符串中包含有视频类动词字符串和视频类字符串时,提取所述视频类动词字符串和视频类字符串;
第一输出单元,用于控制输出所述视频类字符串对应的目标视频数据;
第二判断单元,用于在所述第一判断单元判断所述语句字符串中不包含有视频类动词字符串和视频类字符串时,依据预设的动词类词库和音频类词库,判断所述语句字符串中是否包含有音频类动词字符串和音频类字符串;其中,所述音频类词库存储有音频类型字符串、明确音频类型的字符串、或音频资源字符串中的至少一种,所述音频类字符串包括所述音频类型字符串、明确音频类型的字符串、或音频资源字符串中的至少一种;
第二提取单元,用于在所述第二判断单元判断所述语句字符串中包含有音频类动词字符串和音频类字符串时,提取所述音频类动词字符串和音频类字符串;
第二输出单元,用于控制输出所述音频类字符串对应的目标音频数据。
7.根据权利要求6所述的装置,其特征在于,所述第一判断单元包括:
字符串切分子单元,用于将所述语句字符串进行切分,获得多个子字符串;
第一字符串匹配子单元,用于将所述多个子字符串分别与所述动词类词库中存储的视频类动词字符串,以及所述视频类词库中存储的视频类字符串进行匹配。
8.根据权利要求7所述的装置,其特征在于,所述第二判断单元包括:
第二字符串匹配子单元,用于将所述多个子字符串分别与所述动词类词库中存储的音频类动词字符串,以及所述音频类词库中存储的音频类字符串进行匹配。
9.根据权利要求6-8任一项所述的装置,其特征在于,
所述视频类词库包括:用于存储视频类型字符串的视频类型词库、用于存储视频集数字符串的视频集数词库、以及用于存储视频资源字符串的视频资源词库;
所述音频类词库包括:用于存储音频类型字符串的第一音频类型词库、用于存储明确音频类型的字符串的第二音频类型词库、以及用于存储音频资源字符串的音频资源词库。
10.一种控制音视频资源播放的装置,其特征在于,包括:
第二接收单元,用于接收语音信息;
第二转化单元,用于将所述语音信息转化为语句字符串;
第三判断单元,用于依据预设的动词类词库和音频类词库,判断所述语句字符串中是否包含有音频类动词字符串和音频类字符串;其中,所述动词类词库存储有视频类动词字符串和音频类动词字符串,所述音频类词库存储有音频类型字符串、明确音频类型的字符串、或音频资源字符串中的至少一种,所述音频类字符串包括所述音频类型字符串、明确音频类型的字符串、或音频资源字符串中的至少一种;
第三提取单元,用于在所述第三判断单元判断所述语句字符串中包含有音频类动词字符串和音频类字符串时,提取所述音频类动词字符串和音频类字符串;
第三输出单元,用于控制输出所述音频类字符串对应的目标音频数据;
第四判断单元,用于在所述第三判断单元判断所述语句字符串中不包含有所述音频类动词字符串和/或所述音频类字符串时,依据预设的动词类词库和视频类词库,判断所述语句字符串中是否包含有视频类动词字符串和视频类字符串;其中,所述视频类词库存储有视频类型字符串、视频集数字符串、或视频资源字符串中的至少一种,所述视频类字符串包括所述视频类型字符串、视频集数字符串、或视频资源字符串中的至少一种;
第四提取单元,用于在所述第四判断单元判断所述语句字符串中包含有视频类动词字符串和视频类字符串时,提取所述视频类动词字符串和视频类字符串;
第四输出单元,用于控制输出所述视频类字符串对应的目标视频数据。
CN201710551157.7A 2017-07-07 2017-07-07 一种控制音视频资源播放的方法和装置 Pending CN107194015A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710551157.7A CN107194015A (zh) 2017-07-07 2017-07-07 一种控制音视频资源播放的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710551157.7A CN107194015A (zh) 2017-07-07 2017-07-07 一种控制音视频资源播放的方法和装置

Publications (1)

Publication Number Publication Date
CN107194015A true CN107194015A (zh) 2017-09-22

Family

ID=59882696

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710551157.7A Pending CN107194015A (zh) 2017-07-07 2017-07-07 一种控制音视频资源播放的方法和装置

Country Status (1)

Country Link
CN (1) CN107194015A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060136226A1 (en) * 2004-10-06 2006-06-22 Ossama Emam System and method for creating artificial TV news programs
CN101021855A (zh) * 2006-10-11 2007-08-22 鲍东山 基于内容的视频检索系统
CN102740014A (zh) * 2011-04-07 2012-10-17 青岛海信电器股份有限公司 语音控制电视机、电视系统及通过语音控制电视机的方法
CN102833582A (zh) * 2012-08-02 2012-12-19 四川长虹电器股份有限公司 采用语音搜索音视频资源的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060136226A1 (en) * 2004-10-06 2006-06-22 Ossama Emam System and method for creating artificial TV news programs
CN101021855A (zh) * 2006-10-11 2007-08-22 鲍东山 基于内容的视频检索系统
CN102740014A (zh) * 2011-04-07 2012-10-17 青岛海信电器股份有限公司 语音控制电视机、电视系统及通过语音控制电视机的方法
CN102833582A (zh) * 2012-08-02 2012-12-19 四川长虹电器股份有限公司 采用语音搜索音视频资源的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
KINGTT1994: "酷开6.0系统语音控制电视(酷开精灵)", 《智能电视网HTTPS://WWW.ZNDS.COM/TV-731280-1-1.HTML》 *

Similar Documents

Publication Publication Date Title
US7143102B2 (en) Autogenerated play lists from search criteria
CN105120304B (zh) 信息显示方法、装置及系统
US7500193B2 (en) Method and apparatus for annotating a line-based document
US20180121547A1 (en) Systems and methods for providing information discovery and retrieval
US20140012859A1 (en) Personalized dynamic content delivery system
US20060143007A1 (en) User interaction with voice information services
WO1998027542A1 (en) Audio-based wide area information system
CN107527619A (zh) 语音控制业务的定位方法及装置
US20170242861A1 (en) Music Recommendation Method and Apparatus
US20100017393A1 (en) Entry Selection from Long Entry Lists
CN207164544U (zh) 一种应用于卡拉ok的语音控制系统
CN106021398A (zh) 一种发布信息的方法和装置
CN104462576A (zh) 基于标签页提供音乐综合搜索的方法和装置
CN206601700U (zh) 一种语音识别搜歌的导航装置
CN110741362A (zh) 音频查询的重叠处理的协调
CN108682423A (zh) 一种语音识别方法和装置
CN100418095C (zh) 音词同步的播放系统及其方法
US20190340222A1 (en) Computing device and corresponding method for generating data representing text
CN107194015A (zh) 一种控制音视频资源播放的方法和装置
US20080005673A1 (en) Rapid file selection interface
CN106980674A (zh) 一种基于关键信息的搜索音频方法
KR20090062548A (ko) 콘텐츠 검색 방법 및 이를 이용하는 이동통신 단말기
CN108132956A (zh) 一种搜索方法、装置及电子设备
KR101954802B1 (ko) 오디오 데이터를 이용한 프레즌스 정보 제공 시스템, 이를 위한 장치 및 방법
US20180011834A1 (en) Computing device and corresponding method for generating data representing text

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 201207 Shanghai City, Pudong New Area Chinese (Shanghai) free trade zone fanchun Road No. 400 Building 1 layer 3

Applicant after: SHANGHAI SIYIXUAN ROBOT TECHNOLOGY CO., LTD.

Address before: 200233 room F6, room 4, building No. 34, Guiping Road, Xuhui District, Xuhui District, Shanghai

Applicant before: SHANGHAI SIYIXUAN ROBOT TECHNOLOGY CO., LTD.

CB02 Change of applicant information
RJ01 Rejection of invention patent application after publication

Application publication date: 20170922

RJ01 Rejection of invention patent application after publication