CN111147905A - 媒体资源查找方法、电视机、存储介质及装置 - Google Patents
媒体资源查找方法、电视机、存储介质及装置 Download PDFInfo
- Publication number
- CN111147905A CN111147905A CN201911425861.3A CN201911425861A CN111147905A CN 111147905 A CN111147905 A CN 111147905A CN 201911425861 A CN201911425861 A CN 201911425861A CN 111147905 A CN111147905 A CN 111147905A
- Authority
- CN
- China
- Prior art keywords
- resource
- target
- media
- time
- category
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000000605 extraction Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000003672 processing method Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42203—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种媒体资源查找方法、电视机、存储介质及装置,属于语音电视技术领域。本发明通过获取用户输入的语音信号,将语音信号发送至服务器,接收服务器根据语音信号反馈的文本信息,并对文本信息进行意图识别,得到时间信息与类别信息,根据时间信息与类别信息从历史记录中查找对应的目标媒体资源,并对目标媒体资源进行展示,结合时间信息与类别信息提高了历史媒体资源查找的准确性,同时提高了历史媒体资源的查找效率。
Description
技术领域
本发明涉及语音电视机技术领域,尤其涉及一种媒体资源查找方法、电视机、存储介质及装置。
背景技术
语音电视是一种可以通过语音代替部分遥控器功能对网络电视进行操作的电视,包括对各种媒体资源的搜索。用户在使用电视时,可以通过语音搜索,进行观看电视直播、点播电影电视剧、听歌、听有声书等活动。在进行这些活动时,可能是在不同信源、不同APP下进行的。当用户下次想要继续播放历史播放过的内容时,通常需要切换信源或打开播放过该内容的APP查询历史播放记录进行播放。但是用户在通过语音搜索进行观看和收听媒体资源过后,往往不会记得是在哪个信源或APP下进行的,通常只能通过手动方式从历史记录中查找所看过或者收听过的媒体资源,人工方式需要花费大量时间,导致历史媒体资源查找效率低。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种媒体资源查找方法,旨在解决人工查找历史媒体资源效率低的技术问题。
为实现上述目的,本发明提供了一种媒体资源查找方法,所述方法包括以下步骤:
获取用户输入的语音信号;
对所述语音信号进行语音识别,获得文本信息;
对所述文本信息进行意图识别,获得时间信息及类别信息;
在历史记录中查找与所述时间信息及类别信息对应的目标媒体资源,并对所述目标媒体资源进行展示。
优选地,所述对所述语音信号进行语音识别,获得文本信息的步骤,具体包括:
将所述语音信号发送至语音识别服务器,以使所述语音识别服务器对所述语音信号进行识别;
接收所述语音识别服务器反馈的文本信息。
优选地,所述对所述文本信息进行意图识别,获得时间信息及类别信息的步骤,具体包括:
通过条件随机场模型对所述文本信息进行意图识别,以提取所述文本信息中的时间信息及类别信息。
优选地,所述在历史记录中查找与所述时间信息及类别信息对应的目标媒体资源,并对所述目标媒体资源进行展示的步骤,具体包括:
对所述时间信息及类别信息进行归一化处理,得到目标资源时间及目标资源类别;
从历史记录中查找与所述目标资源时间及目标资源类别匹配的目标媒体资源,并对所述目标媒体资源进行展示。
优选地,所述从历史记录中查找与所述目标资源时间及目标资源类别匹配的目标媒体资源,并对所述目标媒体资源进行展示的步骤,具体包括:
获取历史记录中各个媒体资源的参考资源时间及参考资源类别;
将所述目标资源时间及目标资源类别分别与各个媒体资源的参考资源时间及参考资源类别进行匹配;
根据匹配结果确定目标媒体资源,并将所述目标媒体资源进行展示。
优选地,所述根据匹配结果确定目标媒体资源,并将所述目标媒体资源进行展示的步骤,具体包括:
在匹配结果为不存在与目标资源时间及目标资源类别匹配的媒体资源时,获取所述目标资源时间与各个媒体资源的参考资源时间之间的时间余弦相似度,并获取所述目标资源类别与各个媒体资源的参考资源类别之间的类别余弦相似度;
将所述时间余弦相似度和所述类别余弦相似度分别与预设相似度阈值进行比较;
将所述时间余弦相似度和类别余弦相似度均大于预设相似度阈值的媒体资源作为目标媒体资源,并对所述目标媒体资源进行展示。
优选地,所述根据匹配结果确定目标媒体资源,并将所述目标媒体资源进行展示的步骤,具体包括:
在匹配结果为存在与目标资源时间及目标资源类别匹配的媒体资源时,将与目标资源时间及目标资源类别匹配的媒体资源作为目标媒体资源,并对所述目标媒体资源进行展示。
优选地,所述在历史记录中查找与所述时间信息及类别信息对应的目标媒体资源,并对所述目标媒体资源进行展示的步骤之后,还包括:
获取当前播放的媒体资源;
从所述媒体资源中提取出符合预设格式的时间信息与类别信息,并根据预设顺序及预设周期对所述时间信息与类别信息进行存储。
此外,为实现上述目的,本发明还提出一种媒体资源查找装置,所述装置包括:
接收模块,用于获取用户输入的语音信号;
提取模块,用于对所述语音信号进行语音识别,获得文本信息;
识别模块,用于对所述文本信息进行意图识别,获得时间信息及类别信息;
查找模块,用于在历史记录中查找与所述时间信息及类别信息对应的目标媒体资源,并对所述目标媒体资源进行展示。
此外,为实现上述目的,本发明还提出一种电视机,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的媒体资源查找程序,所述媒体资源查找程序配置为实现如上文所述的媒体资源查找方法的步骤。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有媒体资源查找程序,所述媒体资源查找程序被处理器执行时实现如上文所述的媒体资源查找方法的步骤。
本发明通过获取用户输入的语音信号,将语音信号发送至服务器,接收服务器根据语音信号反馈的文本信息,并对文本信息进行意图识别,得到时间信息与类别信息,根据时间信息与类别信息从历史记录中查找对应的目标媒体资源,并对目标媒体资源进行展示,结合时间信息与类别信息提高了历史媒体资源查找的准确性,同时提高了历史媒体资源的查找效率。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的电视机的结构示意图;
图2为本发明媒体资源查找方法第一实施例的流程示意图;
图3为本发明媒体资源查找方法第二实施例的流程示意图;
图4为本发明媒体资源查找方法第三实施例的流程示意图;
图5为本发明媒体资源查找装置第一实施例的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的电视机结构示意图。
如图1所示,该电子设备可以包括:处理器1001,例如中央处理器(CentralProcessing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(WIreless-FIdelity,WI-FI)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM)存储器,也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及媒体资源查找程序。
在图1所示的电视机中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明电子设备中的处理器1001、存储器1005可以设置在电视机中,所述电子设备通过处理器1001调用存储器1005中存储的媒体资源查找程序,并执行本发明实施例提供的媒体资源查找方法。
本发明实施例提供了一种媒体资源查找方法,参照图2,图2为本发明一种媒体资源查找方法第一实施例的流程示意图。
本实施例中,所述媒体资源查找方法包括以下步骤:
步骤S10:获取用户输入的语音信号。
需要说明的是,本实施例的执行主体为具有语音识别功能的语音电视机,语音电视机内部包含各种功能模块,例如语音采集模块、语意理解模块、历史存储模块、归一化模块以及模糊匹配模块,用户通过对语音电视机讲话,以输出语音信号,语音电视机通过内部语音采集模块获取用户输入的语音信号,语音信号中包含用户对语音电视的控制指令,语音电视通过语音信号中的控制指令完成相应的操作。
步骤S20:对所述语音信号进行语音识别,获得文本信息。
在本实施例中,对所述语音信号进行语音识别,获得文本信息的步骤具体包括:将语音信号发送至语音识别服务器,以使语音识别服务器对语音信号进行识别,接收语音识别服务器反馈的文本信息。
需要说明的是,语音电视机将接收到的语音信号发送至语音识别服务器,服务器对语音信号进行转化,将语音信号转化成文本信息,并对语音电视机反馈文本信息,语音电视机通过内部语音采集模块接收服务器反馈的文本信息,例如用户想要查看前天晚上观看的综艺节目,用户通过对语音电视机讲话输出语音信号,语音电视机在接收到语音信号之后,将语音信号发送至语音识别服务器,语音识别服务器对接收到的语音进行识别,将语音信号转换为文本信息“我想要查看前天晚上观看的综艺节目”,服务器再将文本信息进行反馈,语音电视机即可接收到“我想要查看前天晚上观看的综艺节目”这一文本信息。
步骤S30:对所述文本信息进行意图识别,获得时间信息及类别信息。
在具体实现中,语音电视机在接收到文本信息之后,需要对文本信息进行意图识别,通过对文本信息进行意图识别,从文本信息中提取时间信息及类别信息,时间信息包括三天前,前天上午或昨天晚上等,类别信息包括音乐、电视剧或电影等,时间信息的定义以及类别信息的划分可以根据实际情况自行设定。
需要说明的是,通过条件随机场模型bi-lstm+crf对文本信息进行意图识别,条件随机场模型是一种判别式概率模型,通过中文分词和词性标注等词法对文本信息进行意图识别,例如假设用户在输入语音信号后,通过服务器反馈的文本信息为“查看昨天晚上的电视剧”,通过条件随机场模型对文本信息进行识别后,通过中文分词即每个电视剧对应的不同名称得到用户昨天晚上所看到的所有的电视剧。
进一步地,在对文本信息进行意图识别后,从符合条件的文本信息中提取时间信息及类别信息,时间信息为用户观看或收听媒体资源的历史时间,类别信息为用户观看或收听的历史媒体资源的类别,容易理解的是,本实施例针对的是历史媒体资源的查找,符合条件的文本信息可以理解为从文本信息中的时间信息上可以判定用户所要查看的媒体资源为历史媒体资源,即文本信息中的时间信息为历史时间,包括前天或者昨天等,对于不符合条件的文本信息即文本信息中的时间信息不是历史时间,则只获取类别信息,为了便于理解进行举例说明,例如用户甲想要查找昨天晚上看的电视剧,通过服务器接收到反馈的文本信息为“我想看昨天晚上的电视剧”,对文本信息“我想看昨天晚上的电视剧”进行意图识别后,判定昨天晚上是历史时间,从文本信息“我想看昨天晚上的电视剧”中提取时间信息“昨天晚上”和类别信息“电视剧”,又假设获取到用户乙输入的语音信号对应点的文本信息为“我想看电视剧”,对文本信息“我想看电视剧”进行意图识别后,判定用户乙并非查找历史记录,因此不用获取对应的时间信息。
步骤S40:在历史记录中查找与所述时间信息及类别信息对应的目标媒体资源,并对所述目标媒体资源进行展示。
在本实施例中,根据时间信息与类别信息从历史记录中查找对应的目标媒体资源,目标媒体资源可以为一个,也可以为多个,若从历史记录中查找到的目标媒体资源为一个,则将查找到的目标媒体资源直接进行播放,若从历史记录中查找到的目标媒体资源为多个,则生成媒体资源列表,以供用户自行选择所要播放的目标媒体资源。
本实施例通过获取用户输入的语音信号,将语音信号发送至服务器,接收服务器根据语音信号反馈的文本信息,并对文本信息进行意图识别,得到时间信息与类别信息,根据时间信息与类别信息从历史记录中查找对应的目标媒体资源,并对目标媒体资源进行展示,结合时间信息与类别信息提高了历史媒体资源查找的准确性,同时提高了历史媒体资源的查找效率。
参考图3,图3为本发明一种媒体资源查找方法第二实施例的流程示意图。
基于上述第一实施例,所述步骤S40具体包括:
步骤S401:对所述时间信息及类别信息进行归一化处理,得到目标资源时间及目标资源类别。
步骤S402:获取历史记录中各个媒体资源的参考资源时间及参考资源类别。
在具体实现中,对提取到的时间信息及类别信息进行归一化处理,归一化处理一种简化的计算方式,将无量纲转化为标量,即将时间信息转换为固定格式具体时间,例如“昨天19点0分0秒”,将类别信息转换为具体的类别,例如“电视剧”,对时间信息的归一化处理方式可以为将“晚上”转化为“19点0分0秒至22点0分0秒”,也可以将“晚上”转化为“18点0分0秒至”,对类别信息的归一化处理方式可以为将“电视连续剧”转化为“电视剧”,也可以将“连续剧”转化为“电视剧”,对时间信息及类别信息的归一化处理方式可以根据实际情况自行设置,本实施例不加以限制,在对时间信息及类别信息进行归一化处理后,得到目标资源时间及目标资源类别,目标资源时间为用户想要查看的历史媒体资源的历史播放时间,包括昨天晚上7点或前天早上9点等,目标资源类别为用户想要查看历史的历史媒体资源的资源类别,包括电视剧、歌曲或电影等。
此外,在得到目标资源时间及目标资源类别之后,从历史记录中获取各个媒体资源的参考资源时间及参考资源类别,参考资源时间为历史记录中所存储的各个媒体资源的历史播放时间,参考资源类别为历史记录中所述存储的各个媒体资源的资源类别,例如历史记录中存有“前天早上的歌曲”、“昨天中午的综艺节目”以及“昨天晚上的电视剧”等。
步骤S403:将所述目标资源时间及目标资源类别分别与各个媒体资源的参考资源时间及参考资源类别进行匹配。
步骤S404:根据匹配结果确定目标媒体资源,并将所述目标媒体资源进行展示。
在本实施例中,通过将目标资源时间及目标资源类别分别与各个媒体资源的参考资源时间及参考资源类别进行匹配,从而确定目标媒体资源,例如对时间信息及类别信息进行归一化处理后得到目标资源时间为前天7点0分0秒及歌曲,假设从历史记录存有历史媒体资源播放记录A、B、C,分别为前天12点0分0秒的电视剧,昨天19点0分0秒的综艺节目,前天7点0分0秒的歌曲,根据匹配结果可知,历史播放记录C为所要查找的目标媒体资源。
本实施例通过对时间信息及类别信息进行归一化处理,得到固定格式的目标资源时间及目标资源类别,从历史记录中获取各个媒体资源的参考资源时间及参考资源类别,将目标资源时间及目标资源类别分别与各个媒体资源的参考资源时间及参考资源类别进行匹配,根据匹配结果确定目标媒体资源,并将目标媒体资源进行展,使得历史媒体资源的查找更加全面准确。
参考图4,图4为本发明一种媒体资源查找方法第三实施例的流程示意图。
基于上述第一实施例与第二实施例,所述步骤S404包括:
步骤S4041:在匹配结果为不存在与目标资源时间及目标资源类别匹配的媒体资源时,获取所述目标资源时间与各个媒体资源的参考资源时间之间的时间余弦相似度,并获取所述目标资源类别与各个媒体资源的参考资源类别之间的类别余弦相似度。
步骤S4042:将所述时间余弦相似度和所述类别余弦相似度分别与预设相似度阈值进行比较。
步骤S4043:将所述时间余弦相似度和类别余弦相似度均大于预设相似度阈值的媒体资源作为目标媒体资源,并对所述目标媒体资源进行展示。
在本实施例中,不存在与目标资源时间及目标资源类别匹配的媒体资源指的是媒体资源的时间及类别分别与目标资源时间及目标资源类别不完全匹配,例如目标资源时间为昨天19点,目标资源类别为电视剧“知否知否应是绿肥红瘦”,媒体资源为昨天19点看的电视剧“知否”,则认定媒体资源的时间及类别分别与目标资源时间及目标资源类别不完全匹配,也即匹配结果为不存在与目标资源时间及目标资源类别匹配的媒体资源。
进一步地,在匹配结果为不存在与目标资源时间及目标资源类别匹配的媒体资源时,获取目标资源时间与各个媒体资源的参考资源时间之间的时间余弦相似度,并获取目标资源类别与各个媒体资源的参考资源类别之间的类别余弦相似度,时间余弦相似度为用户想要查看的媒体资源的历史播放时间与历史记录中存储的各个媒体资源的播放时间之间的余弦相似度,类别余弦相似度为用户想要查看的媒体资源的资源类别与历史记录中存储的各个媒体资源的资源类别之间的类别相似度,将历史记录中时间余弦相似度和类别余弦相似度均大于预设相似度阈值的媒体资源作为目标媒体资源,预设相似度阈值为相似度临界值,可以设置为90%、95%或99%等,本实施例中不加以限制,并对所述目标媒体资源进行展示,例如历史记录中存有历史媒体资源A、B、C,假设目标资源时间与历史媒体资源A、B、C的参考资源时间之间的时间余弦相似度分别为80%,85%及95%,目标资源类别与历史媒体资源A、B、C的参考资源类别之间的类别余弦相似度为82%,90%及98%,又假设时间相似度阈值为95%,类别相似度为90%,根据比较可知,历史媒体资源C为目标媒体资源。
进一步地,所述步骤S404还包括:
步骤S4044:在匹配结果为存在与目标资源时间及目标资源类别匹配的媒体资源时,将与目标资源时间及目标资源类别匹配的媒体资源作为目标媒体资源,并对所述目标媒体资源进行展示。
需要说明的是,存在与目标资源时间及目标资源类别匹配的媒体资源指的是媒体资源的时间及类别分别与目标资源时间及目标资源类别完全匹配,例如目标资源时间为昨天21点,目标资源类别为电视剧“琅琊榜”,媒体资源为昨天21点看的电视剧“琅琊榜”,则认定媒体资源的时间及类别分别与目标资源时间及目标资源类别完全匹配,也即匹配结果为存在与目标资源时间及目标资源类别匹配的媒体资源,该媒体资源即为目标媒体资源。
进一步地,所述步骤S40还包括:
步骤S501:获取当前播放的媒体资源。
步骤S502:从所述媒体资源中提取出符合预设格式的时间信息与类别信息,并根据预设顺序及预设周期对所述时间信息与类别信息进行存储。
在本实施例中,电视会实时获取当前播放的媒体资源,并从当前播放的媒体资源中提取出符合预设格式的时间信息与类别信息,预设格式包括json格式等,本实施例不加以限制,时间信息包括昨天晚上或前天早上等,类别信息包括音乐、影视或视频等,在得到符合预设格式的时间信息与类别信息之后,根据预设顺序及预设周期对时间信息及类别信息进行存储,预设顺序包括媒体资源播放的时间顺序等,预设周期为媒体资源的存储周期,存储周期可以为一周,也可以为两周,本实施例中不加以限制。
本实施例通过在匹配结果为存在与目标资源时间及目标资源类别匹配的媒体资源时,将与目标资源时间及目标资源类别匹配的媒体资源作为目标媒体资源,在匹配结果为不存在与目标资源时间及目标资源类别匹配的媒体资源时,获取各个媒体资源的资源时间与所述参考资源时间之间的时间余弦相似度,并获取各个媒体资源的资源类别与所述参考资源类别之间的类别余弦相似度,将时间余弦相似度和类别余弦相似度均大于预设相似度阈值的媒体资源作为目标媒体资源,并对所述目标媒体资源进行展示,从而准确从历史记录中查找到目标媒体资源,同时将当前播放的媒体资源中符合预设格式的时间信息与类别信息进行提取,并根据预设顺序及预设周期进行存储,使得历史记录中存储的历史媒体资源更加全面,提高了历史媒体资源查找的准确性。
参照图5,图5为本发明媒体资源查找装置第一实施例的结构框图。
如图5所示,本发明实施例提出的媒体资源查找装置包括:
接收模块10,用于获取用户输入的语音信号。
需要说明的是,本实施例的执行主体为具有语音识别功能的语音电视机,语音电视机内部包含各种功能模块,例如语音采集模块、语意理解模块、历史存储模块、归一化模块以及模糊匹配模块,用户通过对语音电视机讲话,以输出语音信号,语音电视机通过内部语音采集模块获取用户输入的语音信号,语音信号中包含用户对语音电视的控制指令,语音电视通过语音信号中的控制指令完成相应的操作。
提取模块20,用于对所述语音信号进行语音识别,获得文本信息。
在本实施例中,对所述语音信号进行语音识别,获得文本信息的步骤具体包括:将语音信号发送至语音识别服务器,以使语音识别服务器对语音信号进行识别,接收语音识别服务器反馈的文本信息。
需要说明的是,语音电视机将接收到的语音信号发送至语音识别服务器,服务器对语音信号进行转化,将语音信号转化成文本信息,并对语音电视机反馈文本信息,语音电视机通过内部语音采集模块接收服务器反馈的文本信息,例如用户想要查看前天晚上观看的综艺节目,用户通过对语音电视机讲话输出语音信号,语音电视机在接收到语音信号之后,将语音信号发送至语音识别服务器,语音识别服务器对接收到的语音进行识别,将语音信号转换为文本信息“我想要查看前天晚上观看的综艺节目”,服务器再将文本信息进行反馈,语音电视机即可接收到“我想要查看前天晚上观看的综艺节目”这一文本信息。
识别模块30,用于对所述文本信息进行意图识别,获得时间信息及类别信息。
在具体实现中,语音电视机在接收到文本信息之后,需要对文本信息进行意图识别,通过对文本信息进行意图识别,从文本信息中提取时间信息及类别信息,时间信息包括三天前,前天上午或昨天晚上等,类别信息包括音乐、电视剧或电影等,时间信息的定义以及类别信息的划分可以根据实际情况自行设定。
需要说明的是,通过条件随机场模型bi-lstm+crf对文本信息进行意图识别,条件随机场模型是一种判别式概率模型,通过中文分词和词性标注等词法对文本信息进行意图识别,例如假设用户在输入语音信号后,通过服务器反馈的文本信息为“查看昨天晚上的电视剧”,通过条件随机场模型对文本信息进行识别后,通过中文分词即每个电视剧对应的不同名称得到用户昨天晚上所看到的所有的电视剧。
进一步地,在对文本信息进行意图识别后,从符合条件的文本信息中提取时间信息及类别信息,时间信息为用户观看或收听媒体资源的历史时间,类别信息为用户观看或收听的历史媒体资源的类别,容易理解的是,本实施例针对的是历史媒体资源的查找,符合条件的文本信息可以理解为从文本信息中的时间信息上可以判定用户所要查看的媒体资源为历史媒体资源,即文本信息中的时间信息为历史时间,包括前天或者昨天等,对于不符合条件的文本信息即文本信息中的时间信息不是历史时间,则只获取类别信息,为了便于理解进行举例说明,例如用户甲想要查找昨天晚上看的电视剧,通过服务器接收到反馈的文本信息为“我想看昨天晚上的电视剧”,对文本信息“我想看昨天晚上的电视剧”进行意图识别后,判定昨天晚上是历史时间,从文本信息“我想看昨天晚上的电视剧”中提取时间信息“昨天晚上”和类别信息“电视剧”,又假设获取到用户乙输入的语音信号对应点的文本信息为“我想看电视剧”,对文本信息“我想看电视剧”进行意图识别后,判定用户乙并非查找历史记录,因此不用获取对应的时间信息。
查找模块40,用于在历史记录中查找与所述时间信息及类别信息对应的目标媒体资源,并对所述目标媒体资源进行展示。
在本实施例中,根据时间信息与类别信息从历史记录中查找对应的目标媒体资源,目标媒体资源可以为一个,也可以为多个,若从历史记录中查找到的目标媒体资源为一个,则将查找到的目标媒体资源直接进行播放,若从历史记录中查找到的目标媒体资源为多个,则生成媒体资源列表,以供用户自行选择所要播放的目标媒体资源。
本实施例通过获取用户输入的语音信号,将语音信号发送至服务器,接收服务器根据语音信号反馈的文本信息,并对文本信息进行意图识别,得到时间信息与类别信息,根据时间信息与类别信息从历史记录中查找对应的目标媒体资源,并对目标媒体资源进行展示,结合时间信息与类别信息提高了历史媒体资源查找的准确性,同时提高了历史媒体资源的查找效率。、在一实施例中,所述提取模块20还用于将所述语音信号发送至语音识别服务器,以使所述语音识别服务器对所述语音信号进行识别;接收所述语音识别服务器反馈的文本信息。
在一实施例中,所述识别模块30还用于通过条件随机场模型对所述文本信息进行意图识别,以提取所述文本信息中的时间信息及类别信息。
在一实施例中,所述查找模块40还用于对所述时间信息及类别信息进行归一化处理,得到目标资源时间及目标资源类别;从历史记录中查找与所述目标资源时间及目标资源类别匹配的目标媒体资源,并对所述目标媒体资源进行展示。
在一实施例中,所述查找模块40还用于获取历史记录中各个媒体资源的参考资源时间及参考资源类别;将所述目标资源时间及目标资源类别分别与各个媒体资源的参考资源时间及参考资源类别进行匹配;根据匹配结果确定目标媒体资源,并将所述目标媒体资源进行展示。
在一实施例中,所述查找模块40还用于在匹配结果为不存在与目标资源时间及目标资源类别匹配的媒体资源时,获取所述目标资源时间与各个媒体资源的参考资源时间之间的时间余弦相似度,并获取所述目标资源类别与各个媒体资源的参考资源类别之间的类别余弦相似度;将所述时间余弦相似度和所述类别余弦相似度分别与预设相似度阈值进行比较;将所述时间余弦相似度和类别余弦相似度均大于预设相似度阈值的媒体资源作为目标媒体资源,并对所述目标媒体资源进行展示。
在一实施例中,所述查找模块40还用于在匹配结果为存在与目标资源时间及目标资源类别匹配的媒体资源时,将与目标资源时间及目标资源类别匹配的媒体资源作为目标媒体资源,并对所述目标媒体资源进行展示。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有媒体资源查找程序,所述媒体资源查找程序被处理器执行时实现如上文所述的媒体资源查找方法的步骤。
应当理解的是,以上仅为举例说明,对本发明的技术方案并不构成任何限定,在具体应用中,本领域的技术人员可以根据需要进行设置,本发明对此不做限制。
需要说明的是,以上所描述的工作流程仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部来实现本实施例方案的目的,此处不做限制。
另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的媒体资源查找方法,此处不再赘述。
此外,需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器(Read Only Memory,ROM)/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (11)
1.一种媒体资源查找方法,其特征在于,所述方法包括:
获取用户输入的语音信号;
对所述语音信号进行语音识别,获得文本信息;
对所述文本信息进行意图识别,获得时间信息及类别信息;
在历史记录中查找与所述时间信息及类别信息对应的目标媒体资源,并对所述目标媒体资源进行展示。
2.如权利要求1所述的媒体资源查找方法,其特征在于,所述对所述语音信号进行语音识别,获得文本信息的步骤,具体包括:
将所述语音信号发送至语音识别服务器,以使所述语音识别服务器对所述语音信号进行识别;
接收所述语音识别服务器反馈的文本信息。
3.如权利要求1所述的媒体资源查找方法,其特征在于,所述对所述文本信息进行意图识别,获得时间信息及类别信息的步骤,具体包括:
通过条件随机场模型对所述文本信息进行意图识别,以提取所述文本信息中的时间信息及类别信息。
4.如权利要求1所述的媒体资源查找方法,其特征在于,所述在历史记录中查找与所述时间信息及类别信息对应的目标媒体资源,并对所述目标媒体资源进行展示的步骤,具体包括:
对所述时间信息及类别信息进行归一化处理,得到目标资源时间及目标资源类别;
从历史记录中查找与所述目标资源时间及目标资源类别匹配的目标媒体资源,并对所述目标媒体资源进行展示。
5.如权利要求4所述的媒体资源查找方法,其特征在于,所述从历史记录中查找与所述目标资源时间及目标资源类别匹配的目标媒体资源,并对所述目标媒体资源进行展示的步骤,具体包括:
获取历史记录中各个媒体资源的参考资源时间及参考资源类别;
将所述目标资源时间及目标资源类别分别与各个媒体资源的参考资源时间及参考资源类别进行匹配;
根据匹配结果确定目标媒体资源,并将所述目标媒体资源进行展示。
6.如权利要求5所述的媒体资源查找方法,其特征在于,所述根据匹配结果确定目标媒体资源,并将所述目标媒体资源进行展示的步骤,具体包括:
在匹配结果为不存在与目标资源时间及目标资源类别匹配的媒体资源时,获取所述目标资源时间与各个媒体资源的参考资源时间之间的时间余弦相似度,并获取所述目标资源类别与各个媒体资源的参考资源类别之间的类别余弦相似度;
将所述时间余弦相似度和所述类别余弦相似度分别与预设相似度阈值进行比较;
将所述时间余弦相似度和类别余弦相似度均大于预设相似度阈值的媒体资源作为目标媒体资源,并对所述目标媒体资源进行展示。
7.如权利要求5所述的媒体资源查找方法,其特征在于,所述根据匹配结果确定目标媒体资源,并将所述目标媒体资源进行展示的步骤,具体包括:
在匹配结果为存在与目标资源时间及目标资源类别匹配的媒体资源时,将与目标资源时间及目标资源类别匹配的媒体资源作为目标媒体资源,并对所述目标媒体资源进行展示。
8.如权利要求1~7中任一项所述的媒体资源查找方法,其特征在于,所述在历史记录中查找与所述时间信息及类别信息对应的目标媒体资源,并对所述目标媒体资源进行展示的步骤之后,还包括:
获取当前播放的媒体资源;
从所述媒体资源中提取出符合预设格式的时间信息与类别信息,并根据预设顺序及预设周期对所述时间信息与类别信息进行存储。
9.一种媒体资源查找装置,其特征在于,所述装置包括:
接收模块,用于获取用户输入的语音信号;
提取模块,用于对所述语音信号进行语音识别,获得文本信息;
识别模块,用于对所述文本信息进行意图识别,获得时间信息及类别信息;
查找模块,用于在历史记录中查找与所述时间信息及类别信息对应的目标媒体资源,并对所述目标媒体资源进行展示。
10.一种电视机,其特征在于,所述电视机包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的媒体资源查找程序,所述媒体资源查找程序配置为实现如权利要求1至7中任一项所述的媒体资源查找方法的步骤。
11.一种存储介质,其特征在于,所述存储介质上存储有媒体资源查找程序,所述媒体资源查找程序被处理器执行时实现如权利要求1至7任一项所述的媒体资源查找方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911425861.3A CN111147905A (zh) | 2019-12-31 | 2019-12-31 | 媒体资源查找方法、电视机、存储介质及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911425861.3A CN111147905A (zh) | 2019-12-31 | 2019-12-31 | 媒体资源查找方法、电视机、存储介质及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111147905A true CN111147905A (zh) | 2020-05-12 |
Family
ID=70523215
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911425861.3A Pending CN111147905A (zh) | 2019-12-31 | 2019-12-31 | 媒体资源查找方法、电视机、存储介质及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111147905A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112329458A (zh) * | 2020-05-21 | 2021-02-05 | 北京明亿科技有限公司 | 新组织描述词识别方法与装置、电子设备及存储介质 |
CN113012693A (zh) * | 2021-02-18 | 2021-06-22 | 深圳创维-Rgb电子有限公司 | 基于语音的本地媒体筛选播放方法、装置、终端设备及介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1079387A2 (en) * | 1999-08-26 | 2001-02-28 | Matsushita Electric Industrial Co., Ltd. | Mechanism for storing information about recorded television broadcasts |
CN106162319A (zh) * | 2015-04-20 | 2016-11-23 | 中兴通讯股份有限公司 | 一种语音控制电子节目的方法及装置 |
CN106649694A (zh) * | 2016-12-19 | 2017-05-10 | 北京云知声信息技术有限公司 | 语音交互中确定用户意图的方法及装置 |
CN106941619A (zh) * | 2017-03-16 | 2017-07-11 | 百度在线网络技术(北京)有限公司 | 基于人工智能的节目提醒方法、装置以及系统 |
CN107357875A (zh) * | 2017-07-04 | 2017-11-17 | 北京奇艺世纪科技有限公司 | 一种语音搜索方法、装置及电子设备 |
CN108536414A (zh) * | 2017-03-06 | 2018-09-14 | 腾讯科技(深圳)有限公司 | 语音处理方法、装置和系统、移动终端 |
CN109036425A (zh) * | 2018-09-10 | 2018-12-18 | 百度在线网络技术(北京)有限公司 | 用于操作智能终端的方法和装置 |
-
2019
- 2019-12-31 CN CN201911425861.3A patent/CN111147905A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1079387A2 (en) * | 1999-08-26 | 2001-02-28 | Matsushita Electric Industrial Co., Ltd. | Mechanism for storing information about recorded television broadcasts |
CN106162319A (zh) * | 2015-04-20 | 2016-11-23 | 中兴通讯股份有限公司 | 一种语音控制电子节目的方法及装置 |
CN106649694A (zh) * | 2016-12-19 | 2017-05-10 | 北京云知声信息技术有限公司 | 语音交互中确定用户意图的方法及装置 |
CN108536414A (zh) * | 2017-03-06 | 2018-09-14 | 腾讯科技(深圳)有限公司 | 语音处理方法、装置和系统、移动终端 |
CN106941619A (zh) * | 2017-03-16 | 2017-07-11 | 百度在线网络技术(北京)有限公司 | 基于人工智能的节目提醒方法、装置以及系统 |
CN107357875A (zh) * | 2017-07-04 | 2017-11-17 | 北京奇艺世纪科技有限公司 | 一种语音搜索方法、装置及电子设备 |
CN109036425A (zh) * | 2018-09-10 | 2018-12-18 | 百度在线网络技术(北京)有限公司 | 用于操作智能终端的方法和装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112329458A (zh) * | 2020-05-21 | 2021-02-05 | 北京明亿科技有限公司 | 新组织描述词识别方法与装置、电子设备及存储介质 |
CN112329458B (zh) * | 2020-05-21 | 2024-05-10 | 北京明亿科技有限公司 | 新组织描述词识别方法与装置、电子设备及存储介质 |
CN113012693A (zh) * | 2021-02-18 | 2021-06-22 | 深圳创维-Rgb电子有限公司 | 基于语音的本地媒体筛选播放方法、装置、终端设备及介质 |
CN113012693B (zh) * | 2021-02-18 | 2024-04-30 | 深圳创维-Rgb电子有限公司 | 基于语音的本地媒体筛选播放方法、装置、终端设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10824874B2 (en) | Method and apparatus for processing video | |
US11960526B2 (en) | Query response using media consumption history | |
CN110430476B (zh) | 直播间搜索方法、系统、计算机设备和存储介质 | |
CN107844586B (zh) | 新闻推荐方法和装置 | |
KR101289081B1 (ko) | 음성 인터페이스를 이용한 iptv 시스템 및 서비스 방법 | |
JP5828501B2 (ja) | 番組コンテキストに基づくモバイルコンテンツの提示 | |
CN106098063B (zh) | 一种语音控制方法、终端设备和服务器 | |
CN109688475B (zh) | 视频播放跳转方法、系统及计算机可读存储介质 | |
US11127399B2 (en) | Method and apparatus for pushing information | |
CN105979376A (zh) | 一种推荐方法和装置 | |
CN110740389B (zh) | 视频定位方法、装置、计算机可读介质及电子设备 | |
US8768744B2 (en) | Method and apparatus for automated user review of media content in a mobile communication device | |
US10255321B2 (en) | Interactive system, server and control method thereof | |
US20240015349A1 (en) | Crowd sourced indexing and/or searching of content | |
US20140114656A1 (en) | Electronic device capable of generating tag file for media file based on speaker recognition | |
CN109600646B (zh) | 语音定位的方法及装置、智能电视、存储介质 | |
CN109325180B (zh) | 文章摘要推送方法、装置、终端设备、服务器及存储介质 | |
CN109600625B (zh) | 一种节目搜索方法、装置、设备及介质 | |
US20170092277A1 (en) | Search and Access System for Media Content Files | |
CN111147905A (zh) | 媒体资源查找方法、电视机、存储介质及装置 | |
EP3518530B1 (en) | Information processing apparatus, information processing method, program for scheduling the recording of a broadcast program | |
CN111508506A (zh) | 音频文件的原唱检测方法、装置、服务器及存储介质 | |
CN105404681A (zh) | 直播情感分类方法及装置 | |
CN108595470B (zh) | 音频段落收藏方法、装置、系统及计算机设备 | |
CN114390306A (zh) | 一种直播互动摘要生成方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200512 |
|
RJ01 | Rejection of invention patent application after publication |