CN110598012B - 一种音视频播放的方法及多媒体播放装置 - Google Patents
一种音视频播放的方法及多媒体播放装置 Download PDFInfo
- Publication number
- CN110598012B CN110598012B CN201910897728.1A CN201910897728A CN110598012B CN 110598012 B CN110598012 B CN 110598012B CN 201910897728 A CN201910897728 A CN 201910897728A CN 110598012 B CN110598012 B CN 110598012B
- Authority
- CN
- China
- Prior art keywords
- text information
- playing
- word
- audio
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/44—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/64—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/74—Browsing; Visualisation therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/431—Generation of visual interfaces for content selection or interaction; Content or additional data rendering
- H04N21/4318—Generation of visual interfaces for content selection or interaction; Content or additional data rendering by altering the content in the rendering process, e.g. blanking, blurring or masking an image region
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/472—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
- H04N21/47217—End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for controlling playback functions for recorded or on-demand content, e.g. using progress bars, mode or play-point indicators or bookmarks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/485—End-user interface for client configuration
- H04N21/4856—End-user interface for client configuration for language selection, e.g. for the menu or subtitles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/488—Data services, e.g. news ticker
- H04N21/4888—Data services, e.g. news ticker for displaying teletext characters
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Television Signal Processing For Recording (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本发明公开了一种音视频播放的方法及多媒体播放装置,其中音视频播放的方法包含以下步骤:从服务器中获取音视频文件和相对应的第一文字信息;以语句为单位,对所述第一文字信息进行分割;对第一文字信息分割点在相对应的音视频文件中播放的起始时间和结束时间进行标记;从服务器中获取第一数据库;将所述第一文字信息中所包含的每个单词与所述第一数据库进行比对,相匹配的为第一类单词,不匹配的为第二类单词;显示一条或数条部分单词被遮挡的语句,其中第一类单词被遮挡,第二类单词不被遮挡;响应用户的第一点击事件;调取所述被点击的语句对应的音视频文件中标记的起始时间和结束时间;按预定播放时间播放所述音视频文件。
Description
技术领域
本发明涉及互联网技术领域,特别是涉及一种音视频播放的方法及多媒体播放装置。
背景技术
随着网络资源的不断丰富,很多外语爱好者通过下载外语原声影视剧、演讲、公开课等音视频文件,并使用多媒体播放装置来练习外语听力。但是,在练习过程中,观看字幕会影响听力练习的效果,不看字幕又不能确保完全理解音视频资料的内容,所以经常在字幕开和关之间切换。比如,先关掉字幕听,听到不懂的地方,再倒回去,打开字幕,边听边看一下字幕,这样极其不方便。遇到听到不懂的地方,也不确是否是常用的基础词汇,需要多盲听几遍,提高语音辨识能力;还是因为有不认识的生词难词,需要尽早查看字幕学习新单词,亦或该生词过于生僻,完全可以跳过不理。
另一方面,当用户希望重复再听一遍某个句子的时候,通常是以鼠标或者手指滑动的方式,调整播放的时间。但是,这种方式调整播放时间比较复杂,且调整的时间不够精确,很难精准定位到希望的开始和终止的位置。给用户操作和练习带来极大不方便,影响外语学习者的学习效率。
发明内容
为了解决现有技术中调整播放时间的方式比较复杂并且不够精确,以及字幕显示难以区别处理生词难词和基础词汇的问题,本发明提供了一种音视频播放的方法及多媒体播放装置。
为达到此目的,本发明采用以下技术方案。
根据本发明的第一个方面,提供了一种音视频播放的方法,包括以下步骤:
从服务器中获取音视频文件和相对应的第一文字信息,所述第一文字信息包括至少一条语句,每条语句包括至少一个单词;
以语句为单位,对所述第一文字信息进行分割;
对第一文字信息分割点在相对应的音视频文件中播放的起始时间和结束时间进行标记;
从服务器中获取第一数据库,所述第一数据库包含至少一个单词;
将所述第一文字信息中所包含的每个单词与所述第一数据库进行比对,相匹配的为第一类单词,不匹配的为第二类单词;
显示一条或数条部分单词被遮挡的语句,其中第一类单词被遮挡,第二类单词不被遮挡;
响应用户的第一点击事件,所述第一点击事件为点击第一文字信息中的一个语句;
调取所述被点击的语句对应的音视频文件中标记的起始时间和结束时间;
按预定播放时间播放所述音视频文件,所述预定播放时间为从所述标记的起始时间开始,至所述标记的结束时间。
本方案中,用户可以通过点击语句的方式,重复播放该语句对应的音视频文件。操作简便且播放的起始时间和结束时间非常精确。另一方面,所述第一数据库是一个常用单词数据库。通过隐藏第一文字信息中常用的单词使得用户在播放音视频文件的同时,可以目标精准地针对常用词汇进行听力练习。
优选的,所述音视频播放的方法,还包括以下步骤:
从服务器中获取和所述音视频文件相对应的第二文字信息;
以语句为单位,对第二文字信息进行分割,所述对第二文字信息的分割与对第一文字信息的分割相对应;
响应用户的显示指令,所述显示指令包括:显示第一文字信息、显示第二文字信息以及显示第一文字信息和第二文字信息;
根据显示指令,显示分割后的第一文字信息、分割后的第二文字信息或者分割后的第一文字信息和第二文字信息。
本优选方案中,用户可以方便的在第一文字信息(即英语字幕)和第二文字信息(即中文翻译)之间进行自由切换。
优选的,所述音视频播放的方法,所述第一类单词被遮挡的方法,包括:
获取所述第一类单词的显示位置;
生成与所述每个第一类单词大小相同或者相近的图层;
将生成的所述图层遮挡在相对应的第一类单词的显示位置。
在该优选方案中,以一个与被隐藏单词大小相同的图层来隐藏单词,单词之间的空格予以保留。英语中存在大量的连读和略读。而作为非以英语作为母语的用户来说,很难在一连串发音中判断出正确的词汇间隔,容易造成将几个连读的单词听成一个单词,影响理解。在该优选方案中,以图层的形式提示其听到的一连串音节中包含了几个单词,对培养连略读意识和提高识别能力均有增强效果。
优选的,所述音视频播放的方法,还包括以下步骤:
响应用户的播放速度指令,所述播放速度指令包括,快速播放、慢速播放以及正常速度播放;
根据用户的播放速度指令,以快速、慢速或者正常速度播放所述音视频文件。
本优选方案,提供了用户三种不同速度的播放模式。其中,慢速用于语速较快或者有晦涩难懂的特征性发音的语句,可以放大语音现象中的细节,帮助用户听懂其中的每个音节,而快速模式则可以方便用户快速的听完音视频文件。
优选的,所述音频播播放的方法,还包括以下步骤:
响应用户的第二点击事件,所述第二点击事件为选中第一文字信息中的一个单词,所述第二点击事件可以是用户以点击时间超过两秒的方式或者双击的方式选中第一文字信息中的一个单词;
检索服务器中包含第二点击事件中用户所选中单词的第三文字信息,并获取所述第三文字信息以及与所述第三文字信息对应的音视频文件;
响应用户的第二播放指令,所述第二播放指令为播放所述第三文字信息对应的音视频文件;
根据第二播放指令,播放所述第三文字信息对应的音视频文件。
本优选方案,提供了用户一种联想播放的功能。通过该功能,用户可以就同一个单词听到不同语境中的读音,从而加深单词的熟悉程度。
根据本发明的第二个方面,提供了一种多媒体播放装置,包括以下模块:
第一获取模块,用于从服务器中获取音视频文件和相对应的第一文字信息,所述第一文字信息包括至少一条语句,每条语句包括至少一个单词;
第一分割模块,用于以语句为单位,对所述第一文字信息进行分割;
标记模块,用于对第一文字信息分割点在相对应的音视频文件中播放的起始时间和结束时间进行标记;
第二获取模块,用于从服务器中获取第一数据库,所述第一数据库包含至少一个单词;
对比模块,用于将所述第一文字信息中所包含的每个单词与所述第一数据库进行比对,相匹配的为第一类单词,不匹配的为第二类单词;
第一显示模块,用于显示一条或数条部分单词被遮挡的语句,其中第一类单词被遮挡,第二类单词不被遮挡,其中第一类单词被遮挡由遮挡模块完成;
第一点击模块,用于响应用户的第一点击事件,所述第一点击事件为点击第一文字信息中的一个语句;
调取模块,用于调取所述被点击的语句对应的音视频文件中标记的起始时间和结束时间;
第一播放模块,用于按预定播放时间播放所述音视频文件,所述预定播放时间为从所述标记的起始时间开始,至所述标记的结束时间。
优选的,所述多媒体播放装置,还包括以下模块:
第三获取模块,用于从服务器中获取和所述音视频文件相对应的第二文字信息;
第二分割模块,用于以语句为单位,对第二文字信息进行分割,所述对第二文字信息的分割与对第一文字信息的分割相对应;
第一指令模块,用于响应用户的显示指令,所述显示指令包括:显示第一文字信息、显示第二文字信息以及显示第一文字信息和第二文字信息;
第二显示模块,用于根据显示指令,显示分割后的第一文字信息、分割后的第二文字信息或者分割后的第一文字信息和第二文字信息。
优选的,所述多媒体播放装置,还包括遮挡模块,所述遮挡模块包括:
第四获取模块,用于获取所述第一类单词的显示位置;
生成模块,用于生成与所述每个第一类单词大小相同或者相近的图层;
遮盖模块,用于将生成的所述图层遮挡在相对应的第一类单词的显示位置。
优选的,所述多媒体播放装置,还包括以下模块:
变速播放指令模块,用于响应用户的播放速度指令,所述播放速度指令包括,快速播放、慢速播放以及正常速度播放;
第二播放模块,用于根据用户的播放速度指令,以快速、慢速或者正常速度播放所述音视频文件。
优选的,所述多媒体播放装置,还包括联想模块,所述联想模块包括:
第二点击模块,用于响应用户的第二点击事件,所述第二点击事件为选中第一文字信息中的一个单词,所述第二点击事件可以是用户以点击时间超过两秒的方式或者双击的方式选中第一文字信息中的一个单词;
检索模块,用于检索服务器中包含第二点击事件中用户所点击单词的第三文字信息;
第五获取模块,用于获取所述第三文字信息以及与所述第三文字信息对应的音视频文件;
第二指令模块,用于响应用户的第二播放指令,所述第二播放指令为播放第五获取模块获取的音视频文件;
第三播放模块,用于播放所述第三文字信息对应的音视频文件。
与现有技术相比,本发明所提供的技术方案的有益效果在于:通过按语句对音视频文件以及文字信息进行分割,用户可以简便的反复播放其希望听到的语句,并且播放的起始时间和结束时间非常精准。另一方面,本播放方法所提供的字幕中,仅显示非常用单词,这样用户在播放音视频文件同时进行盲听训练的时候,可以排除生词干扰,集中精力优先针对占据语言主体内容的基础词汇进行听力训练。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明的音视频播放的方法的一个实施例的流程图。
图2为本发明的多媒体播放装置的一个实施例的示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和达到的技术效果更加清楚,下面将结合附图对本发明实施例的技术方案作详细的说明。显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部。基于本发明的实施例,本领域技术人员在没有作出创造性劳动的前提下,所获得的所有其他实施例也属于本发明的保护范围。
实施例1:
如图1所示,本实施例提供了一种音视频播放的方法,包括以下步骤:
在步骤S100中,从服务器中获取音视频文件以及相对应的第一文字信息、第二文字信息,所述第一文字信息和第二文字信息均包括至少一条语句,每条语句包括至少一个单词;所述音视频文件可以是音频文件或者视频文件。在本实施例中,以英语电影为例,所述音视频文件是一部英语电影的视频文件,所述第一文字信息是该英语电影的英文字幕,所述第二文字信息是第一文字信息的中文翻译,所述第一文字信息的单词为英文单词,而第二文字信息的单词为中文单词。
随后,进入步骤S101,以语句为单位,对第一文字信息和第二文字信息进行分割。在本实施例中,英文字幕以及中文翻译均以语句为单位进行分割。分割后的英语字幕及其中文翻译,即第一文字信息和第二文字信息,仍然将是一一对应。
在步骤S102中,对第一文字信息分割点在相对应的音视频文件中播放的起始时间和结束时间进行标记。
在步骤S103中,从服务器中获取第一数据库,所述第一数据库包含至少一个单词。在本实施例中,该第一数据库是一个基本单词数据库,其中包含了常用的单词,例如可以是四六级单词。
在步骤S104中,将所述第一文字信息中所包含的每个单词与所述第一数据库进行比对,相匹配的为第一类单词,不匹配的为第二类单词。
在步骤S105中,响应用户的显示指令,所述显示指令包括,显示第一文字信息、显示第二文字信息或者同时显示第一文字信息和第二文字信息。根据用户的显示指令,显示分割后的第一文字信息、分割后的第二文字信息或者同时显示分割后的第一文字信息和第二文字信息。
在步骤S106中,显示一条或数条部分单词被遮挡的语句,其中第一类单词被遮挡,第二类单词不被遮挡。所述第一类单词被遮挡的方法包括:获取所述第一类单词的显示位置,生成与所述每个第一类单词大小相同或者相近的图层,将生成的所述图层遮挡在相对应的第一类单词的显示位置。当用户选择显示的是第一文字信息或者同时显示第一文字信息和第二文字信息时,在屏幕上显示的第一文字信息的每条语句中,常用单词(即第一数据库中的单词)不会被显示,而仅显示非常用的单词。
在步骤S107中,响应用户的第一点击事件,所述第一点击事件为用户点击第一文字信息或者第二文字信息中的一个语句。在本实施例中所述点击,可以是以单击的方式点击语句的任何一个位置。
在步骤S108中,调取所述被点击的语句对应的音视频文件中标记的起始时间和结束时间。若用户点击的是第一文字信息中的一个语句,则直接调取相应的起始时间和结束时间。若用户点击的是第二文字信息中的一个语句,则调取所述语句对应的第一文字信息中语句相应的音视频文件标记的起始时间和结束时间。
在步骤S109中,按预定播放时间播放所述音视频文件,所述预定播放时间为从所述标记的起始时间开始,至所述标记的结束时间。
在本实施例中,还包括对分割后的音视频文件进行变速播放的步骤,具体包括:
响应用户的播放速度指令,所述播放速度指令包括,快速播放、慢速播放以及正常速度播放。
根据用户的播放速度指令,以快速、慢速或者正常速度播放分割后的音视频文件。在本实施例中,快速播放可以是以1.5倍速进行播放,慢速播放可以是以0.5倍速进行播放。
在本实施例中,还包括联想播放的步骤,具体包括:
响应用户的第二点击事件,所述第二点击事件为选中第一文字信息中的一个单词。在本实施例中,所述第二点击事件可以是用户以点击时间超过两秒的方式或者双击的方式选中第一文字信息中的一个单词。
检索服务器中包含第二点击事件中用户所选中单词的第三文字信息,并获取所述第三文字信息以及与所述第三文字信息对应的音视频文件。在本实施例中,所述服务器中包含多部电影、讲座、公开课、演讲等音视频文件以及相对应的文字信息。当用户选中一个单词的时候,系统会自动检索服务器中包含该单词的其他音视频文件。
响应用户的第二播放指令,所述第二播放指令为播放所述第三文字信息对应的音视频文件。
根据第二播放指令,播放所述第三文字信息对应的音视频文件。
实施例2:
图2示出了根据本发明的多媒体播放装置的一个实施例的示意图。该播放装置包括以下模块:
第一获取模块200,用于从服务器中获取音视频文件和相对应的第一文字信息,所述第一文字信息包括至少一条语句,每条语句包括至少一个单词。所述音视频文件可以是音频文件或者视频文件。
第一分割模块201,用于以语句为单位,对所述第一文字信息进行分割。
第三获取模块202,用于从服务器中获取和所述音视频文件相对应的第二文字信息。
第二分割模块203,用于以语句为单位,对第二文字信息进行分割,所述对第二文字信息的分割与对第一文字信息的分割相对应。在本实施例中,以英语电影为例,所述音视频文件是一部英语电影的视频文件,所述第一文字信息是该英语电影的英文字幕,所述第二文字信息是第一文字信息的中文翻译。英文字幕以及中文翻译均以语句为单位进行分割。分割后的英语字幕及其中文翻译,即第一文字信息和第二文字信息,仍然将是一一对应。
标记模块204,用于对第一文字信息分割点在相对应的音视频文件中播放的起始时间和结束时间进行标记。
第一指令模块205,用于响应用户的显示指令,所述显示指令包括:显示第一文字信息、显示第二文字信息以及显示第一文字信息和第二文字信息。
第二显示模块206,用于根据显示指令,显示分割后的第一文字信息、分割后的第二文字信息或者分割后的第一文字信息和第二文字信息。
第二获取模块207,用于从服务器中获取第一数据库,所述第一数据库包含至少一个单词。在本实施例中,该第一数据库是一个基本单词数据库,其中包含了常用的单词,例如可以是四六级单词。
对比模块208,用于将所述第一文字信息中所包含的每个单词与所述第一数据库进行比对,相匹配的为第一类单词,不匹配的为第二类单词。
第一显示模块209,用于显示一条或数条部分单词被遮挡的语句,其中第一类单词被遮挡,第二类单词不被遮挡,其中第一类单词被遮挡由遮挡模块完成。遮挡模块包括:第四获取模块,用于获取所述第一类单词的显示位置;生成模块,用于生成与所述每个第一类单词大小相同或者相近的图层;遮盖模块,用于将生成的所述图层遮挡在相对应的第一类单词的显示位置。当用户选择显示的是第一文字信息或者同时显示第一文字信息和第二文字信息时,在屏幕上显示的第一文字信息的每条语句中,常用单词(即第一数据库中的单词)不会被显示,而仅显示非常用的单词。
第一点击模块210,用于响应用户的第一点击事件,所述第一点击事件为点击第一文字信息中的一个语句。在本实施例中所述点击,可以是以单击的方式点击语句的任何一个位置。
调取模块211,用于调取所述被点击的语句对应的音视频文件中标记的起始时间和结束时间。若用户点击的是第一文字信息中的一个语句,则直接调取相应的起始时间和结束时间。若用户点击的是第二文字信息中的一个语句,则调取所述语句对应的第一文字信息中相对应的语句的音视频文件中标记的起始时间和结束时间。
第一播放模块212,用于按预定播放时间播放所述音视频文件,所述预定播放时间为从所述标记的的起始时间开始,至所述标记的结束时间。
在本实施例中,所述多媒体播放装置,还包括播放变速模块,包括:
变速播放指令模块,用于响应用户的播放速度指令,所述播放速度指令包括,快速播放、慢速播放以及正常速度播放。
第二播放模块,用于根据用户的播放速度指令,以快速、慢速或者正常速度播放所述音视频文件。在本实施例中,快速播放可以是以1.5倍速进行播放,慢速播放可以是以0.5倍速进行播放。
在本实施例中,所述多媒体播放装置,还包括联想模块,包括:
第二点击模块,用于响应用户的第二点击事件,所述第二点击事件为选中第一文字信息中的一个单词,所述第二点击事件可以是用户以点击时间超过两秒的方式或者双击的方式选中第一文字信息中的一个单词。
检索模块,用于检索服务器中包含第二点击事件中用户所点击单词的第三文字信息。
第五获取模块,用于获取所述第三文字信息以及与所述第三文字信息对应的音视频文件。
第二指令模块,用于响应用户的第三播放指令,所述第二播放指令为播放第五获取模块获取的音视频文件。
第三播放模块,用于播放所述第三文字信息对应的音视频文件。
在现有的多媒体播放装置中,如果用户希望重复听一条语句时,通常是以鼠标或者手指滑动的方式,调整播放的时间。但是,该种方式调整播放时间比较复杂,每次重复播放都要手动调整一次。并且,该方式调整的时间不够精确,无法就用户希望重复的语句进行精准定位。根据本发明提供的技术方案,用户可以简便的重复播放其希望听到的语句,并且播放的起始时间和结束时间非常精准。
另一方面,在外语学习的过程中,由于母语人士通常语速较快,而且存在大量连读、略读、弱读、浊化等语音现象,使得某些语句即使反复播放也很难听懂。根据本发明提供的技术方案,可以变更语句的播放速度,这样对于一些难懂或者包含特征发音的语句可以慢速播放,以便更好的识别语句中的每一个发音细节。
另一方面,本发明提供的技术方案还提供了联想播放的功能。用户通过检索不同音视频文件中的同一个单词,感受其在不同上下文中的语音变化,以及对应的场景含义和应用形式,更全面、更有效地掌握该词汇和相应的表达。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
如在此所使用的那样,除非另行规定,使用序数词“ 第一”、“ 第二”、“ 第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。
Claims (8)
1.一种音视频播放的方法,其特征在于,包括以下步骤:
从服务器中获取音视频文件和相对应的第一文字信息,所述第一文字信息包括至少一条语句,每条语句包括至少一个单词;
以语句为单位,对所述第一文字信息进行分割;
对第一文字信息分割点在相对应的音视频文件中播放的起始时间和结束时间进行标记;
从服务器中获取第一数据库,所述第一数据库包含至少一个单词;
将所述第一文字信息中所包含的每个单词与所述第一数据库进行比对,相匹配的为第一类单词,不匹配的为第二类单词;
其中,所述第一数据库为基本单词数据库;
所述第一类单词为预设常用单词,所述第二类单词为除所述预设常用单词之外的其他非常用单词;
显示一条或数条部分单词被遮挡的语句,其中第一类单词被遮挡,第二类单词不被遮挡;
其中,以一个与被隐藏单词大小相同的图层来隐藏所述第一类单词,且对应图层与相邻的其他图层之间保留单词之间对应的空格;
响应用户的第一点击事件,所述第一点击事件为点击第一文字信息中的一个语句;
调取所述被点击的语句对应的音视频文件中标记的起始时间和结束时间;
按预定播放时间播放所述音视频文件,所述预定播放时间为从所述标记的起始时间开始,至所述标记的结束时间;
所述音视频播放的方法还包括以下步骤:
从服务器中获取和所述音视频文件相对应的第二文字信息;
以语句为单位,对第二文字信息进行分割,所述对第二文字信息的分割与对第一文字信息的分割相对应;
响应用户的显示指令,所述显示指令包括:显示第一文字信息、显示第二文字信息以及显示第一文字信息和第二文字信息;
根据显示指令,显示分割后的第一文字信息、分割后的第二文字信息或者分割后的第一文字信息和第二文字信息。
2.如权利要求1所述的音视频播放的方法,其特征在于,所述第一类单词被遮挡的方法,包括:
获取所述第一类单词的显示位置;
生成与所述每个第一类单词大小相同或者相近的图层;
将生成的所述图层遮挡在相对应的第一类单词的显示位置。
3.如权利要求1或2所述的音视频播放的方法,其特征在于,还包括以下步骤:
响应用户的播放速度指令,所述播放速度指令包括,快速播放、慢速播放以及正常速度播放;
根据用户的播放速度指令,以快速、慢速或者正常速度播放所述音视频文件。
4.如权利要求1或2所述的音视频播放的方法,其特征在于,还包括以下步骤:
响应用户的第二点击事件,所述第二点击事件为选中第一文字信息中的一个单词;
检索服务器中包含第二点击事件中用户所选中单词的第三文字信息,并获取所述第三文字信息以及与所述第三文字信息对应的音视频文件;
响应用户的第二播放指令,所述第二播放指令为播放所述第三文字信息对应的音视频文件;
根据第二播放指令,播放所述第三文字信息对应的音视频文件。
5.一种多媒体播放装置,其特征在于,所述装置包含以下模块:
第一获取模块,用于从服务器中获取音视频文件和相对应的第一文字信息,所述第一文字信息包括至少一条语句,每条语句包括至少一个单词;
第一分割模块,用于以语句为单位,对所述第一文字信息进行分割;
标记模块,用于对第一文字信息分割点在相对应的音视频文件中播放的起始时间和结束时间进行标记;
第二获取模块,用于从服务器中获取第一数据库,所述第一数据库包含至少一个单词;
对比模块,用于将所述第一文字信息中所包含的每个单词与所述第一数据库进行比对,相匹配的为第一类单词,不匹配的为第二类单词;
其中,所述第一数据库为基本单词数据库;
所述第一类单词为预设常用单词,所述第二类单词为除所述预设常用单词之外的其他非常用单词;
第一显示模块,用于显示一条或数条部分单词被遮挡的语句,其中第一类单词被遮挡,第二类单词不被遮挡;
其中,以一个与被隐藏单词大小相同的图层来隐藏所述第一类单词,且对应图层与相邻的其他图层之间保留单词之间对应的空格,其中第一类单词被遮挡由遮挡模块完成;
第一点击模块,用于响应用户的第一点击事件,所述第一点击事件为点击第一文字信息中的一个语句;
调取模块,用于调取所述被点击的语句对应的音视频文件中标记的起始时间和结束时间;
第一播放模块,用于按预定播放时间播放所述音视频文件,所述预定播放时间为从所述标记的起始时间开始,至所述标记的结束时间;
所述装置还包括以下模块:
第三获取模块,用于从服务器中获取和所述音视频文件相对应的第二文字信息;
第二分割模块,用于以语句为单位,对第二文字信息进行分割,所述对第二文字信息的分割与对第一文字信息的分割相对应;
第一指令模块,用于响应用户的显示指令,所述显示指令包括:显示第一文字信息、显示第二文字信息以及显示第一文字信息和第二文字信息;
第二显示模块,用于根据显示指令,显示分割后的第一文字信息、分割后的第二文字信息或者分割后的第一文字信息和第二文字信息。
6.如权利要求5所述的多媒体播放装置,其特征在于,所述遮挡模块:
第四获取模块,用于获取所述第一类单词的显示位置;
生成模块,用于生成与所述每个第一类单词大小相同或者相近的图层;
遮盖模块,用于将生成的所述图层遮挡在相对应的第一类单词的显示位置。
7.如权利要求5或6所述的多媒体播放装置,其特征在于,所述装置还包括变速播放模块,包括:
变速播放指令模块,用于响应用户的播放速度指令,所述播放速度指令包括,快速播放、慢速播放以及正常速度播放;
第二播放模块,用于根据用户的播放速度指令,以快速、慢速或者正常速度播放所述音视频文件。
8.如权利要求5或6所述的多媒体播放装置,其特征在于,所述装置还包括联想模块,包括:
第二点击模块,用于响应用户的第二点击事件,所述第二点击事件为选中第一文字信息中的一个单词;
检索模块,用于检索服务器中包含第二点击事件中用户所点击单词的第三文字信息;
第五获取模块,用于获取所述第三文字信息以及与所述第三文字信息对应的音视频文件;
第二指令模块,用于响应用户的第二播放指令;
第三播放模块,用于播放所述与第三文字信息对应的音视频文件。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910897728.1A CN110598012B (zh) | 2019-09-23 | 2019-09-23 | 一种音视频播放的方法及多媒体播放装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910897728.1A CN110598012B (zh) | 2019-09-23 | 2019-09-23 | 一种音视频播放的方法及多媒体播放装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110598012A CN110598012A (zh) | 2019-12-20 |
CN110598012B true CN110598012B (zh) | 2023-05-30 |
Family
ID=68862212
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910897728.1A Active CN110598012B (zh) | 2019-09-23 | 2019-09-23 | 一种音视频播放的方法及多媒体播放装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110598012B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110263334A (zh) * | 2019-06-06 | 2019-09-20 | 深圳市柯达科电子科技有限公司 | 一种辅助外语学习的方法和可读存储介质 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1228760C (zh) * | 2003-11-07 | 2005-11-23 | 无敌科技(西安)有限公司 | 依照语音查询单词的系统及方法 |
US20130177891A1 (en) * | 2011-07-02 | 2013-07-11 | Joachim Hammerschmidt | Audio-visual learning system |
WO2013043984A1 (en) * | 2011-09-23 | 2013-03-28 | Documentation Services Group, Inc. | Systems and methods for extracting and processing intelligent structured data from media files |
CN103942990A (zh) * | 2013-01-23 | 2014-07-23 | 郭毓斌 | 一种语言学习装置 |
CN103414948A (zh) * | 2013-08-01 | 2013-11-27 | 王强 | 一种视频的播放方法和装置 |
CN104038827B (zh) * | 2014-06-06 | 2018-02-02 | 小米科技有限责任公司 | 多媒体播放方法及装置 |
CN104822078B (zh) * | 2015-04-30 | 2017-11-28 | 无锡天脉聚源传媒科技有限公司 | 一种视频字幕的遮挡方法及装置 |
CN107767871B (zh) * | 2017-10-12 | 2021-02-02 | 安徽听见科技有限公司 | 文本显示方法、终端及服务器 |
CN108133632B (zh) * | 2017-12-20 | 2019-10-01 | 刘昳旻 | 英语听力的训练方法及系统 |
CN109756770A (zh) * | 2018-12-10 | 2019-05-14 | 华为技术有限公司 | 视频播放过程实现单词或语句复读的方法及电子设备 |
-
2019
- 2019-09-23 CN CN201910897728.1A patent/CN110598012B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110263334A (zh) * | 2019-06-06 | 2019-09-20 | 深圳市柯达科电子科技有限公司 | 一种辅助外语学习的方法和可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110598012A (zh) | 2019-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Romero-Fresco | Subtitling through speech recognition: Respeaking | |
Gambier | The position of audiovisual translation studies | |
US5697789A (en) | Method and system for aiding foreign language instruction | |
Szarkowska | Text-to-speech audio description: towards wider availability of AD | |
US20040152054A1 (en) | System for learning language through embedded content on a single medium | |
US20050010952A1 (en) | System for learning language through embedded content on a single medium | |
CN109348145B (zh) | 基于字幕生成关联弹幕的方法及设备、计算机可读介质 | |
JP2001525078A (ja) | 口頭単語発音と順序付けられた一連の視覚的単語記号を持つ視聴覚作品を制作する方法、その方法を実施するシステムおよびその視聴覚作品 | |
WO2001020596A1 (en) | Method and apparatus to determine and use audience affinity and aptitude | |
CN111462553A (zh) | 一种基于视频配音和纠音训练的语言学习方法及系统 | |
Romero-Fresco | Reception studies in live and pre-recorded subtitles for the deaf and hard of hearing | |
Jeong-Hwa et al. | An analysis of the errors in the auto-generated captions of university commencement speeches on youtube | |
US20040248068A1 (en) | Audio-visual method of teaching a foreign language | |
US20060183088A1 (en) | Audio-visual language teaching material and audio-visual languages teaching method | |
CN110598012B (zh) | 一种音视频播放的方法及多媒体播放装置 | |
Thompson | Media player accessibility: Summary of insights from interviews & focus groups | |
KR102396263B1 (ko) | 스크립트를 이용한 스마트 어학학습서비스를 제공하는 시스템 | |
KR20180128656A (ko) | 원어민 동영상의 자막인지 및 해석기능을 갖는 영어 학습시스템을 이용한 영어 교육방법 | |
US9817829B2 (en) | Systems and methods for prioritizing textual metadata | |
KR101783872B1 (ko) | 동영상 검색 시스템 및 방법 | |
JP2004325905A (ja) | 外国語学習装置および外国語学習プログラム | |
Wald et al. | Using automatic speech recognition to assist communication and learning | |
Ellis et al. | Automatic closed captions and immersive learning in higher education | |
Dinmore et al. | Voice-to-Text Transcription of Lecture Recordings | |
Güler et al. | The Effect of Integrating Authentic Captioned Videos on Learning Collocation and Content Comprehension in Foreign Language Context |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |