CN104301771A - 视频文件播放进度的调整方法及装置 - Google Patents

视频文件播放进度的调整方法及装置 Download PDF

Info

Publication number
CN104301771A
CN104301771A CN201310295470.0A CN201310295470A CN104301771A CN 104301771 A CN104301771 A CN 104301771A CN 201310295470 A CN201310295470 A CN 201310295470A CN 104301771 A CN104301771 A CN 104301771A
Authority
CN
China
Prior art keywords
video file
file
text message
caption content
reproduction time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310295470.0A
Other languages
English (en)
Inventor
周鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201310295470.0A priority Critical patent/CN104301771A/zh
Priority to PCT/CN2013/084520 priority patent/WO2014161282A1/zh
Priority to EP13880926.4A priority patent/EP2978232A4/en
Priority to US14/890,186 priority patent/US9799375B2/en
Publication of CN104301771A publication Critical patent/CN104301771A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440236Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by media transcoding, e.g. video is transformed into a slideshow of still pictures, audio is converted into text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47217End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for controlling playback functions for recorded or on-demand content, e.g. using progress bars, mode or play-point indicators or bookmarks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • H04N21/4828End-user interface for program selection for searching program descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

本发明公开了一种视频文件播放进度的调整方法及装置,在上述方法中,接收待搜索的文本信息;在视频文件的字幕文件中查找与文本信息相匹配的字幕内容,其中,字幕文件是从视频文件中获取的或者根据视频文件生成的;根据查找到的字幕内容确定与该字幕内容对应的播放时间,并按照播放时间调整视频文件的播放进度。根据本发明提供的技术方案,实现了对用户期望回放片段进行准确定位,操作简单方便。

Description

视频文件播放进度的调整方法及装置
技术领域
本发明涉及通信领域,具体而言,涉及一种视频文件播放进度的调整方法及装置。
背景技术
随着智能移动终端处理能力的不断提高和显示屏幕的不断增大,视频播放器已经逐渐成为智能移动终端中普遍安装的应用程序。目前,大多数的智能移动终端均配置有触摸屏,用户可以通过手指触摸屏幕来操作和控制应用程序。这种智能移动终端上的视频播放器在播放视频时,通常都会在屏幕上显示进度条、视频的总时间长度以及当前已播放的时间。而进度条上又通常设置有滑块,该滑块会在视频播放的过程中前进,并且该滑块在进度条中的位置与视频播放的进度相对应。当然,用户也可以使用手指来回拖动滑块,此时屏幕上显示的视频内容和当前已播放时间将会进行相应地更新,用户在拖动滑块的过程中通过查看视频内容或者当前已播放时间来定位感兴趣的播放位置。
但上述定位播放内容的方式并不方便,这种定位方式只适合于用户根据播放时间进行定位,而在其它一些场景下并不太适用。例如:用户以前看过当前播放的视频,对某个画面或者某个人物说的某句话有印象,其可以是在观看教学视频的时候,记得老师讲过的某个知识点,也可以是在观看电影的时候,记得某句经典台词。如果用户想根据上述线索对视频进行搜索定位,则需要来回反复地拖动进度条上的滑块,并查看对应的视频内容或者视频中人物的讲话,直至能够查找到用户脑海中存有印象的视频播放位置。
发明内容
本发明提供了一种视频文件播放进度的调整方法及装置,以至少解决相关技术中移动终端用户在已经观看视频中查找特定片段的方式较为复杂且对该特定片段的播放进度定位的准确性较差的问题。
根据本发明的一个方面,提供了一种视频文件播放进度的调整方法。
本发明的视频文件播放进度的调整方法包括:接收待搜索的文本信息;在视频文件的字幕文件中查找与文本信息相匹配的字幕内容,其中,字幕文件是从视频文件中获取的或者根据视频文件生成的;根据查找到的字幕内容确定与该字幕内容对应的播放时间,并按照播放时间调整视频文件的播放进度。
根据本发明的另一方面,提供了一种视频文件播放进度的调整装置。
本发明的视频文件播放进度的调整装置包括:接收模块,用于接收待搜索的文本信息;查找模块,用于在视频文件的字幕文件中查找与文本信息相匹配的字幕内容,其中,字幕文件是从视频文件中获取的或者根据视频文件生成的;调整模块,用于根据查找到的字幕内容确定与该字幕内容对应的播放时间,并按照播放时间调整视频文件的播放进度。
上述技术方案具有如下有益效果:采用接收待搜索的文本信息;在视频文件的字幕文件中查找与文本信息相匹配的字幕内容,该字幕文件是从视频文件中获取的或者根据视频文件生成的;根据查找到的字幕内容确定与该字幕内容对应的播放时间,并按照播放时间调整视频文件的播放进度,由此,移动终端可以通过确定用户待搜索的文本信息,然后将该文本信息与视频文件中的字幕文件进行匹配,如果能够查找到匹配的字幕内容,则获取与匹配字幕内容对应的播放时间,从而根据播放时间准确调整视频文件的播放进度,解决了相关技术中移动终端用户在已经观看视频中查找特定片段的方式较为复杂且对该特定片段的播放进度定位的准确性较差的问题,进而实现了对用户期望回放片段进行准确定位,操作简单方便。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的视频文件播放进度的调整方法的流程图;
图2是根据本发明优选实施例的视频文件播放进度的调整方法的流程图;
图3是根据本发明实施例的视频文件播放进度的调整装置的结构框图;
图4是根据本发明优选实施例的视频文件播放进度的调整装置的结构框图;
图5是根据本发明优选实施例的智能移动终端的软硬件架构示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
图1是根据本发明实施例的视频文件播放进度的调整方法的流程图。如图1所示,该方法可以包括以下处理步骤:
步骤S102:接收待搜索的文本信息;
步骤S104:在视频文件的字幕文件中查找与文本信息相匹配的字幕内容,其中,字幕文件是从视频文件中获取的或者根据视频文件生成的;
步骤S106:根据查找到的字幕内容确定与该字幕内容对应的播放时间,并按照播放时间调整视频文件的播放进度。
相关技术中,移动终端用户在已经观看视频中查找特定片段的方式较为复杂且对该特定片段的播放进度定位的准确性较差。采用如图1所示的方法,接收待搜索的文本信息;在视频文件的字幕文件中查找与文本信息相匹配的字幕内容,该字幕文件是从视频文件中获取的或者根据视频文件生成的;根据查找到的字幕内容确定与该字幕内容对应的播放时间,并按照播放时间调整视频文件的播放进度,由此,移动终端可以通过确定用户待搜索的文本信息,然后将该文本信息与视频文件中的字幕文件进行匹配,如果能够查找到匹配的字幕内容,则获取与匹配字幕内容对应的播放时间,从而根据播放时间准确调整视频文件的播放进度,解决了相关技术中移动终端用户在已经观看视频中查找特定片段的方式较为复杂且对该特定片段的播放进度定位的准确性较差的问题,进而实现了对用户期望回放片段进行准确定位,操作简单方便。
优选地,在步骤S104,查找与文本信息相匹配的字幕内容之前,还可以包括以下操作:
步骤S1:判断视频文件中是否存在字幕文件;
步骤S2:如果否,则根据视频文件中的音频数据生成字幕文件。
在优选实施例中,如果视频文件已经加载了预设格式(例如:srt格式)的字幕文件,则可以直接从本地的视频文件中获取与该视频文件对应的字幕文件,当然还可以从网络中专门提供字幕的网站下载相应的字幕文件;如果视频文件中缺少对应的字幕文件,则可以通过采集视频文件中的音频数据生成相应的字幕文件。
字幕文件可以是一个文本文件,其中,描述了视频文件中的各段字幕信息,而每一段字幕信息可以包括:字幕序号、起始时间以及字幕内容。字幕文件可以有多种格式,例如:其中一种字幕文件格式为srt格式,此类字幕文件的文件名通常以.srt为后缀。每段字幕的格式如下:
字幕序列号
起始时间→终止时间
字幕文本(一行或多行)
空白行
字幕序号一般从1开始编号,其所采用的时间格式是“小时:分钟:秒,毫秒”。下面是一个格式为srt的字幕文件的示例:
1
00:00:10,500→00:00:13,000
Elephant's Dream
2
00:00:15,000→00:00:18,000
At the left we can see…
上述字幕文件中包含有两段字幕,第一段字幕的起始时间是从10.5秒至13秒,其字幕内容为Elephant’s Dream,第二段字幕的起始时间是从15秒至18秒,其字幕内容为At the left wecan see…。
优选地,在步骤S2中,根据音频数据生成字幕文件可以包括以下操作:
步骤S21:对视频文件中的音频数据进行解码处理;
步骤S22:将解码后的音频数据转换成字幕文件。
在优选实施例中,可以采用移动终端的音视频解码器对视频文件中的音频数据进行解码,然后将其转换成特定语言(例如:中文或者英文)的文本。
优选地,在步骤S104,查找与文本信息相匹配的字幕内容之前,还可以包括以下步骤:
步骤S3:判断字幕文件所使用的语言与文本信息所使用的语言是否一致;
步骤S4:如果否,则将字幕文件所使用的语言译成与文本信息所使用的语言一致,或者,按照文本信息所使用的语言重新生成字幕文件。
在优选实施例中,在移动终端已经确定用户待搜索的文件信息并且已经获取到或者已经生成与视频文件对应的字幕文件的情况下,如果希望将两者进行匹配,就需要确保两者所使用的语音保持一致。因此,如果字幕文件中的所使用语言与用户进行语音搜索时所使用的语言相同,此时,视频播放器可以允许用户指定字幕文件。但是,如果视频文件中没有加载字幕文件或者其加载的字幕文件所使用的语言与用户所使用的语言不同。此时,需要将字幕文件所使用的语言译成与文本信息所使用的语言一致或者按照文本信息所使用的语言重新生成字幕文件。
优选地,在步骤S106中,根据查找到的字幕内容确定与该字幕内容对应的播放时间,并按照播放时间调整播放进度可以包括以下处理步骤:
步骤S5:根据查找到的字幕内容确定该字幕内容的字幕序号;
步骤S6:根据字幕序号获取与查找到的字幕内容对应的播放时间段,并在播放时间段中确定与查找到的字幕内容对应的起始的播放时间;
步骤S7:按照播放时间调整播放进度。
在优选实施例中,尽管字幕文件可以有多种格式,但是在各种格式的字幕文件中均包含有多段字幕信息,而每一段字幕信息又可以包括:字幕序号、播放时间段以及字幕内容。当在字幕文件中查找到与用户待搜索的文本信息匹配的字幕内容后,便可以进一步确定该段字幕内容的字幕序号,并且可以根据字幕序号进一步确定该段字幕内容对应的播放时间段(包括:起始时间与终止时间),由此可以确定该段字幕内容的起始的播放时间,进而按照播放时间调整播放进度。以上述格式为srt的字幕文件示例为例,假设待搜索的文本信息为“At the leftwe can see…”,而在字幕文件中确实查找到与该文本信息相匹配的字幕信息,具体如下:
2
00:00:15,000→00:00:18,000
At the left we can see…
由此可以确定该段字幕内容的字幕序号为2,而与字幕序号为2对应的播放时间段为00:00:15,000→00:00:18,000,即起始的播放时间为00:00:15,000,因此,可以按照播放时间调整视频文件的播放进度。
优选地,在步骤S102中,确定文本信息可以包括但不限于以下方式之一:
方式一、接收输入的文本信息;
方式二、接收语音数据,并将语音数据转换成文本信息。
在优选实施例中,移动终端用户既可以通过键盘或者触摸屏在视频播放器的搜索对话框中输入待搜索的文本信息,也可以通过麦克风将待搜索的文本信息通过语音的方式输入到移动终端中。
下面结合图2所示的优选实施方式对上述优选实施过程做进一步的描述。
图2是根据本发明优选实施例的视频文件播放进度的调整方法的流程图。如图2所示,该流程可以包括以下处理步骤:
步骤S202:用户在移动终端上打开视频播放器软件,并选择播放特定的视频文件;
步骤S204:用户查找是否存在与视频文件对应的字幕文件,并且可以在视频播放器中指定字幕文件;如果是,则转到步骤S208;如果否,则继续执行步骤S206;
步骤S206:如果没有,可以采用移动终端的音视频解码器对视频文件中的音频数据进行解码,然后将其转换成特定语言(例如:中文或者英文)的文本格式并同时记录时间信息,即新生成一个字幕文件;
步骤S208:用户选择使用语音搜索功能来搜索视频内容;
步骤S210:视频播放器软件将用户通过麦克风输入的语音数据转换成特定格式的文本;
步骤S212:视频播放器软件使用转换后的用户语音文本在字幕文件中进行搜索,如果查找到相匹配的字幕内容,则可以得到对应字幕的播放时间;
步骤S214:视频播放器软件使用播放时间调整视频文件的播放进度。
图3是根据本发明实施例的视频文件播放进度的调整装置的结构框图。如图3所示,该视频文件播放进度的调整装置可以包括:接收模块10,用于接收待搜索的文本信息;查找模块20,用于在视频文件的字幕文件中查找与文本信息相匹配的字幕内容,其中,字幕文件是从视频文件中获取的或者根据视频文件生成的;调整模块30,用于根据查找到的字幕内容确定与该字幕内容对应的播放时间,并按照播放时间调整视频文件的播放进度。
采用如图3所示的装置,解决了相关技术中移动终端用户在已经观看视频中查找特定片段的方式较为复杂且对该特定片段的播放进度定位的准确性较差的问题,进而实现了对用户期望回放片段进行准确定位,操作简单方便。
优选地,如图4所示,上述装置还可以包括:第一判断模块40,用于判断视频文件中是否存在字幕文件;第一处理模块50,用于在第一判断模块输出为否时,根据视频文件中的音频数据生成字幕文件。
优选地,如图4所示,第一处理模块50可以包括:解码单元500,用于对视频文件中的音频数据进行解码处理;转换单元502,用于将解码后的音频数据转换成字幕文件。
优选地,如图4所示,上述装置还可以包括:第二判断模块60,用于判断字幕文件所使用的语言与文本信息所使用的语言是否一致;第二处理模块70,用于在第二判断模块输出为否时,将字幕文件所使用的语言译成与文本信息所使用的语言一致,或者,按照文本信息所使用的语言重新生成字幕文件。
优选地,如图4所示,调整模块30可以包括:第一确定单元300,用于根据查找到的字幕内容确定该字幕内容的字幕序号;第二确定单元302,用于根据字幕序号获取与查找到的字幕内容对应的播放时间段,并在播放时间段中确定与查找到的字幕内容对应的起始的播放时间;调整单元304,用于按照播放时间调整播放进度。
优选地,如图4所示,确定模块10可以包括:第一接收单元100,用于接收输入的文本信息;第二接收单元102,用于接收语音数据,并将语音数据转换成文本信息。
下面结合图5所示的优选实施方式对上述优选实施过程做进一步的描述。
图5是根据本发明优选实施例的智能移动终端的软硬件架构示意图。该架构可以分为三个层次,从下至上依次分别为硬件层、操作系统层以及应用程序层。硬件层可以包括:处理器、存储器、麦克风、扬声器和触控显示屏。操作系统层负责管理硬件设备、提供文件系统和功能程序库,而功能程序库中可以包括:语音识别模块(相当于上述第一处理模块和确定模块)。语音识别模块的作用在于将语音数据转换成对应的文本内容。应用程序层可以包括:多个应用程序,例如:视频播放器、计算器。视频播放器中可以包括音视频解码器,能够对视频文件进行解码,然后在显示屏上播放图像,并通过扬声器播放声音。本发明所提供的技术方案可以在视频播放器中新增一个功能模块,在显示屏上显示的视频图像中可以将该功能命名为语音搜索(相当于上述查找模块和调整模块)。
当用户使用视频播放器观看视频时,可以选择使用语音搜索功能。此时,用户可以对着智能移动终端说出脑海中记忆的期望检索的语句,然后,语音搜索模块即可根据用户说出的语句的字幕内容搜索视频文件中相应的音频数据,进而查找匹配项。如果能够查找到匹配项,则将视频播放器的进度条滑块定位到相应的位置。
在该优选实施例中,语音搜索模块完成上述工作需要具备以下前提条件:
条件一、智能移动终端的软件系统中包含语音识别模块,该语音识别模块可以由操作系统或者其它应用程序提供,而且视频播放器软件可以对其进行使用。例如:语音识别模块可以接收预设格式(例如:脉冲编码调制(Pulse Code Modulation,简称为PCM))的音频输入,并将其转换成特定语言(例如:中文或者英文)的文本。
条件二、视频播放器中的音视频解码器能够识别视频文件的格式(例如:MP4、AVI),并将视频文件中的音频数据解码成语音识别模块能够接收的格式。
条件三、语音搜索模块能够通过操作系统从麦克风采集用户说出的语音数据,而且这些语音数据能够被语音识别模块所接收。
作为本发明的一个优选实施例,可以采用srt格式的字幕文件为例进一步对用户希望搜索的文本信息在视频文件中的定位进行详细的描述,当然,在具体实施过程中还可以采用其它格式的字幕文件,此处并不构成对本发明的限定。整个过程具体包括以下几个步骤:
第一步、使用视频播放器中的音频解码器将视频文件中的音频数据解码成语音识别模块能够识别的格式(例如:PCM格式)并保存至音频文件中。
第二步、分析上述音频文件并生成字幕文件。循环读取音频文件中的语音数据,可以每次读取1秒的语音数据,其次将这1秒的音频数据输入至语音识别模块中,生成对应的字幕文本,然后按照srt格式生成一段字幕信息保存至字幕文件中。按照上述方式,如果视频文件的长度为N秒,那么在字幕文件中就会生成N段字幕。
第三步、视频文件的搜索定位。在用户启用语音搜索功能时,用户说出在视频文件中期望检索到的语句,语音搜索模块从麦克风采集到用户说出的语音数据,然后将其输入到语音识别模块中,以生成对应的文本。随后,语音搜索模块在字幕文件中搜索上述生成的文本,如果搜索到与之匹配的文本,按照字幕文件的格式可以获得与匹配文本对应的播放时间。最后,视频播放器根据播放时间进行定位。
从以上的描述中,可以看出,上述实施例实现了如下技术效果(需要说明的是这些效果是某些优选实施例可以达到的效果):采用本发明实施例所提供的技术方案,为用户提供了一种新的视频文件播放进度的调整方法及装置,移动终端可以通过确定用户待搜索的文本信息,然后将该文本信息与视频文件中的字幕文件进行匹配,如果能够查找到匹配的字幕内容,则获取与匹配字幕内容对应的播放时间,从而根据播放时间准确调整视频文件的播放进度,解决了相关技术中移动终端用户在已经观看视频中查找特定片段的方式较为复杂且对该特定片段的播放进度定位的准确性较差的问题,进而实现了对用户期望回放片段进行准确定位,操作简单方便。
显然,本领域的技术人员应该明白,上述的本发明实施例的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种视频文件播放进度的调整方法,包括:
接收待搜索的文本信息;
在视频文件的字幕文件中查找与所述文本信息相匹配的字幕内容,其中,所述字幕文件是从所述视频文件中获取的或者根据所述视频文件生成的;
根据查找到的字幕内容确定与该字幕内容对应的播放时间,并按照所述播放时间调整所述视频文件的播放进度。
2.根据权利要求1所述的方法,其特征在于,在查找与所述文本信息相匹配的字幕内容之前,还包括:
判断所述视频文件中是否存在所述字幕文件;
如果否,则根据所述视频文件中的音频数据生成所述字幕文件。
3.根据权利要求2所述的方法,其特征在于,根据所述音频数据生成所述字幕文件包括:
对所述视频文件中的音频数据进行解码处理;
将解码后的音频数据转换成所述字幕文件。
4.根据权利要求1所述的方法,其特征在于,在查找与所述文本信息相匹配的字幕内容之前还包括:
判断所述字幕文件所使用的语言与所述文本信息所使用的语言是否一致;
如果否,则将所述字幕文件所使用的语言译成与所述文本信息所使用的语言一致,或者,按照所述文本信息所使用的语言重新生成所述字幕文件。
5.根据权利要求1所述的方法,其特征在于,根据所述查找到的字幕内容确定与该字幕内容对应的播放时间,并按照所述播放时间调整所述播放进度包括:
根据所述查找到的字幕内容确定该字幕内容的字幕序号;
根据所述字幕序号获取与所述查找到的字幕内容对应的播放时间段,并在所述播放时间段中确定与所述查找到的字幕内容对应的起始的播放时间;
按照所述播放时间调整所述播放进度。
6.根据权利要求1至5中任一项所述的方法,其特征在于,接收所述文本信息包括以下之一:
接收输入的所述文本信息;
接收语音数据,并将所述语音数据转换成所述文本信息。
7.一种视频文件播放进度的调整装置,其特征在于,包括:
接收模块,用于接收待搜索的文本信息;
查找模块,用于在视频文件的字幕文件中查找与所述文本信息相匹配的字幕内容,其中,所述字幕文件是从所述视频文件中获取的或者根据所述视频文件生成的;
调整模块,用于根据查找到的字幕内容确定与该字幕内容对应的播放时间,并按照所述播放时间调整所述视频文件的播放进度。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第一判断模块,用于判断所述视频文件中是否存在所述字幕文件;
第一处理模块,用于在所述第一判断模块输出为否时,根据所述视频文件中的音频数据生成所述字幕文件。
9.根据权利要求8所述的装置,其特征在于,所述第一处理模块包括:
解码单元,用于对所述视频文件中的音频数据进行解码处理;
转换单元,用于将解码后的音频数据转换成所述字幕文件。
10.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第二判断模块,用于判断所述字幕文件所使用的语言与所述文本信息所使用的语言是否一致;
第二处理模块,用于在所述第二判断模块输出为否时,将所述字幕文件所使用的语言译成与所述文本信息所使用的语言一致,或者,按照所述文本信息所使用的语言重新生成所述字幕文件。
11.根据权利要求7所述的装置,其特征在于,所述调整模块包括:
第一确定单元,用于根据所述查找到的字幕内容确定该字幕内容的字幕序号;
第二确定单元,用于根据所述字幕序号获取与所述查找到的字幕内容对应的播放时间段,并在所述播放时间段中确定与所述查找到的字幕内容对应的起始的播放时间;
调整单元,用于按照所述播放时间调整所述播放进度。
12.根据权利要求7至11中任一项所述的装置,其特征在于,所述接收模块包括:
第一接收单元,用于接收输入的所述文本信息;
第二接收单元,用于接收语音数据,并将所述语音数据转换成所述文本信息。
CN201310295470.0A 2013-07-15 2013-07-15 视频文件播放进度的调整方法及装置 Pending CN104301771A (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201310295470.0A CN104301771A (zh) 2013-07-15 2013-07-15 视频文件播放进度的调整方法及装置
PCT/CN2013/084520 WO2014161282A1 (zh) 2013-07-15 2013-09-27 视频文件播放进度的调整方法及装置
EP13880926.4A EP2978232A4 (en) 2013-07-15 2013-09-27 METHOD AND DEVICE FOR ADJUSTING THE PLAYING PROGRESS OF A VIDEO FILE
US14/890,186 US9799375B2 (en) 2013-07-15 2013-09-27 Method and device for adjusting playback progress of video file

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310295470.0A CN104301771A (zh) 2013-07-15 2013-07-15 视频文件播放进度的调整方法及装置

Publications (1)

Publication Number Publication Date
CN104301771A true CN104301771A (zh) 2015-01-21

Family

ID=51657475

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310295470.0A Pending CN104301771A (zh) 2013-07-15 2013-07-15 视频文件播放进度的调整方法及装置

Country Status (4)

Country Link
US (1) US9799375B2 (zh)
EP (1) EP2978232A4 (zh)
CN (1) CN104301771A (zh)
WO (1) WO2014161282A1 (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105163178A (zh) * 2015-08-28 2015-12-16 北京奇艺世纪科技有限公司 一种视频播放位置定位方法和装置
CN106210845A (zh) * 2016-08-11 2016-12-07 张婧 音乐课程中教学视频同步的方法及系统
CN106297846A (zh) * 2016-08-11 2017-01-04 张婧 钢琴视频教学中的同步方法及系统
CN107396203A (zh) * 2017-09-06 2017-11-24 深圳市视维科技股份有限公司 一种基于IJKPlayer外挂字幕的方法
CN107506385A (zh) * 2017-07-25 2017-12-22 努比亚技术有限公司 一种视频文件检索方法、设备及计算机可读存储介质
WO2018027731A1 (zh) * 2016-08-11 2018-02-15 张婧 英文学习中的视频同步方法及系统
WO2018027730A1 (zh) * 2016-08-11 2018-02-15 张婧 钢琴视频教学中的同步方法及系统
WO2018027729A1 (zh) * 2016-08-11 2018-02-15 张婧 音乐课程中教学视频同步的方法及系统
CN107767871A (zh) * 2017-10-12 2018-03-06 安徽听见科技有限公司 文本显示方法、终端及服务器
CN107809679A (zh) * 2017-10-26 2018-03-16 费非 调节字幕的方法和装置
CN107908674A (zh) * 2017-10-26 2018-04-13 费非 语音判断方法及装置、存储介质和处理器
CN108806692A (zh) * 2018-05-29 2018-11-13 深圳市云凌泰泽网络科技有限公司 一种音频内容查找及可视化播放方法
CN109246472A (zh) * 2018-08-01 2019-01-18 平安科技(深圳)有限公司 视频播放方法、装置、终端设备及存储介质
CN109271532A (zh) * 2017-07-18 2019-01-25 北京国双科技有限公司 一种多媒体文件回放的方法及装置
CN109657094A (zh) * 2018-11-27 2019-04-19 平安科技(深圳)有限公司 音频处理方法及终端设备
CN110248245A (zh) * 2019-06-21 2019-09-17 维沃移动通信有限公司 一种视频定位方法、装置、移动终端及存储介质
CN110401879A (zh) * 2019-08-13 2019-11-01 宇龙计算机通信科技(深圳)有限公司 一种视频播放的控制方法、装置、终端及存储介质
CN112702658A (zh) * 2019-10-07 2021-04-23 富士施乐株式会社 信息处理装置、存储介质及信息处理方法
CN113099312A (zh) * 2021-03-30 2021-07-09 深圳市多科特文化传媒有限公司 教学视频播放系统
CN113378001A (zh) * 2021-06-28 2021-09-10 北京百度网讯科技有限公司 视频播放进度的调整方法及装置、电子设备和介质
CN113382291A (zh) * 2020-03-09 2021-09-10 海信视像科技股份有限公司 一种显示设备及流媒体播放方法

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140123178A1 (en) 2012-04-27 2014-05-01 Mixaroo, Inc. Self-learning methods, entity relations, remote control, and other features for real-time processing, storage, indexing, and delivery of segmented video
US20130291019A1 (en) * 2012-04-27 2013-10-31 Mixaroo, Inc. Self-learning methods, entity relations, remote control, and other features for real-time processing, storage, indexing, and delivery of segmented video
CN103686352A (zh) * 2013-11-15 2014-03-26 乐视致新电子科技(天津)有限公司 智能电视媒体播放器及其字幕处理方法、智能电视
CN104883607B (zh) * 2015-06-05 2017-12-19 广东欧珀移动通信有限公司 一种视频截图或剪切的方法、装置及移动设备
CN107820123A (zh) * 2017-10-25 2018-03-20 深圳天珑无线科技有限公司 移动终端截取屏幕画面的方法、移动终端以及存储装置
US10459620B2 (en) * 2018-02-09 2019-10-29 Nedelco, Inc. Caption rate control
CN108282678B (zh) * 2018-02-11 2021-01-05 孙新峰 一种多媒体数据的播放方法、装置及系统
CN109005445A (zh) * 2018-06-26 2018-12-14 卫军征 多媒体播放方法、系统、存储介质及播放设备
CN110162668B (zh) * 2019-03-07 2023-11-14 腾讯科技(深圳)有限公司 交互方法、装置、计算机可读存储介质和计算机设备
CN109905772B (zh) * 2019-03-12 2022-07-22 腾讯科技(深圳)有限公司 视频片段查询方法、装置、计算机设备及存储介质
US10965888B1 (en) * 2019-07-08 2021-03-30 Snap Inc. Subtitle presentation based on volume control
CN113051985A (zh) * 2019-12-26 2021-06-29 深圳云天励飞技术有限公司 信息提示方法、装置、电子设备及存储介质
CN114501159B (zh) * 2022-01-24 2023-12-22 传神联合(北京)信息技术有限公司 一种字幕编辑方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101102419A (zh) * 2007-07-10 2008-01-09 北京大学 一种定位视频字幕区域的方法
CN101382937A (zh) * 2008-07-01 2009-03-11 深圳先进技术研究院 基于语音识别的多媒体资源处理方法及其在线教学系统
CN101908053A (zh) * 2009-11-27 2010-12-08 新奥特(北京)视频技术有限公司 一种语音检索的方法及装置
US20120275761A1 (en) * 2011-04-29 2012-11-01 Microsoft Corporation Utilizing subtitles in multiple languages to facilitate second-language learning
CN103067775A (zh) * 2013-01-28 2013-04-24 Tcl集团股份有限公司 一种音视频终端的字幕显示方法、音视频终端及服务器

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5794249A (en) * 1995-12-21 1998-08-11 Hewlett-Packard Company Audio/video retrieval system that uses keyword indexing of digital recordings to display a list of the recorded text files, keywords and time stamps associated with the system
US6370543B2 (en) * 1996-05-24 2002-04-09 Magnifi, Inc. Display of media previews
US20030046075A1 (en) * 2001-08-30 2003-03-06 General Instrument Corporation Apparatus and methods for providing television speech in a selected language
KR100700814B1 (ko) * 2005-07-07 2007-03-27 엘지전자 주식회사 디지털 비디오 기기에서의 텍스트 파일 재생장치 및 방법
US20070154176A1 (en) * 2006-01-04 2007-07-05 Elcock Albert F Navigating recorded video using captioning, dialogue and sound effects
US7680853B2 (en) * 2006-04-10 2010-03-16 Microsoft Corporation Clickable snippets in audio/video search results
US8891938B2 (en) * 2007-09-06 2014-11-18 Kt Corporation Methods of playing/recording moving picture using caption search and image processing apparatuses employing the method
US20100106482A1 (en) * 2008-10-23 2010-04-29 Sony Corporation Additional language support for televisions
CN101739450B (zh) 2009-11-26 2012-08-22 北京网梯科技发展有限公司 对视频中出现的信息进行检索的方法及系统
US8914276B2 (en) * 2011-06-08 2014-12-16 Microsoft Corporation Dynamic video caption translation player
TW201421994A (zh) * 2012-11-21 2014-06-01 Hon Hai Prec Ind Co Ltd 視頻內容搜索系統及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101102419A (zh) * 2007-07-10 2008-01-09 北京大学 一种定位视频字幕区域的方法
CN101382937A (zh) * 2008-07-01 2009-03-11 深圳先进技术研究院 基于语音识别的多媒体资源处理方法及其在线教学系统
CN101908053A (zh) * 2009-11-27 2010-12-08 新奥特(北京)视频技术有限公司 一种语音检索的方法及装置
US20120275761A1 (en) * 2011-04-29 2012-11-01 Microsoft Corporation Utilizing subtitles in multiple languages to facilitate second-language learning
CN103067775A (zh) * 2013-01-28 2013-04-24 Tcl集团股份有限公司 一种音视频终端的字幕显示方法、音视频终端及服务器

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105163178A (zh) * 2015-08-28 2015-12-16 北京奇艺世纪科技有限公司 一种视频播放位置定位方法和装置
CN106210845A (zh) * 2016-08-11 2016-12-07 张婧 音乐课程中教学视频同步的方法及系统
CN106297846A (zh) * 2016-08-11 2017-01-04 张婧 钢琴视频教学中的同步方法及系统
WO2018027731A1 (zh) * 2016-08-11 2018-02-15 张婧 英文学习中的视频同步方法及系统
WO2018027730A1 (zh) * 2016-08-11 2018-02-15 张婧 钢琴视频教学中的同步方法及系统
WO2018027729A1 (zh) * 2016-08-11 2018-02-15 张婧 音乐课程中教学视频同步的方法及系统
CN109271536A (zh) * 2017-07-18 2019-01-25 北京国双科技有限公司 一种多媒体文件回放的方法及装置
CN109271532A (zh) * 2017-07-18 2019-01-25 北京国双科技有限公司 一种多媒体文件回放的方法及装置
CN107506385A (zh) * 2017-07-25 2017-12-22 努比亚技术有限公司 一种视频文件检索方法、设备及计算机可读存储介质
CN107396203A (zh) * 2017-09-06 2017-11-24 深圳市视维科技股份有限公司 一种基于IJKPlayer外挂字幕的方法
CN107767871A (zh) * 2017-10-12 2018-03-06 安徽听见科技有限公司 文本显示方法、终端及服务器
CN107908674A (zh) * 2017-10-26 2018-04-13 费非 语音判断方法及装置、存储介质和处理器
CN107809679A (zh) * 2017-10-26 2018-03-16 费非 调节字幕的方法和装置
CN108806692A (zh) * 2018-05-29 2018-11-13 深圳市云凌泰泽网络科技有限公司 一种音频内容查找及可视化播放方法
CN109246472A (zh) * 2018-08-01 2019-01-18 平安科技(深圳)有限公司 视频播放方法、装置、终端设备及存储介质
WO2020024353A1 (zh) * 2018-08-01 2020-02-06 平安科技(深圳)有限公司 视频播放方法、装置、终端设备及存储介质
CN109657094A (zh) * 2018-11-27 2019-04-19 平安科技(深圳)有限公司 音频处理方法及终端设备
CN109657094B (zh) * 2018-11-27 2024-05-07 平安科技(深圳)有限公司 音频处理方法及终端设备
CN110248245A (zh) * 2019-06-21 2019-09-17 维沃移动通信有限公司 一种视频定位方法、装置、移动终端及存储介质
CN110401879A (zh) * 2019-08-13 2019-11-01 宇龙计算机通信科技(深圳)有限公司 一种视频播放的控制方法、装置、终端及存储介质
CN112702658A (zh) * 2019-10-07 2021-04-23 富士施乐株式会社 信息处理装置、存储介质及信息处理方法
CN113382291A (zh) * 2020-03-09 2021-09-10 海信视像科技股份有限公司 一种显示设备及流媒体播放方法
CN113099312A (zh) * 2021-03-30 2021-07-09 深圳市多科特文化传媒有限公司 教学视频播放系统
CN113378001A (zh) * 2021-06-28 2021-09-10 北京百度网讯科技有限公司 视频播放进度的调整方法及装置、电子设备和介质
CN113378001B (zh) * 2021-06-28 2024-02-27 北京百度网讯科技有限公司 视频播放进度的调整方法及装置、电子设备和介质

Also Published As

Publication number Publication date
US20160133298A1 (en) 2016-05-12
US9799375B2 (en) 2017-10-24
EP2978232A1 (en) 2016-01-27
WO2014161282A1 (zh) 2014-10-09
EP2978232A4 (en) 2016-05-04

Similar Documents

Publication Publication Date Title
CN104301771A (zh) 视频文件播放进度的调整方法及装置
US8924853B2 (en) Apparatus, and associated method, for cognitively translating media to facilitate understanding
KR101700365B1 (ko) 미디어 컨텐츠 관련 정보 제공 방법, 이 방법을 수행할 수 있는 디바이스와 서버 및 저장 매체
US20150098018A1 (en) Techniques for live-writing and editing closed captions
US8340797B2 (en) Method and system for generating and processing digital content based on text-to-speech conversion
CN110717337A (zh) 信息处理方法、装置、计算设备和存储介质
CN104871240A (zh) 信息处理设备、信息处理方法、以及程序
CN105489072A (zh) 用于确定电子设备中增补内容的方法
CN112601102A (zh) 同声传译字幕的确定方法、装置、电子设备及存储介质
WO2014154097A1 (en) Automatic page content reading-aloud method and device thereof
CN112423081A (zh) 一种视频数据处理方法、装置、设备及可读存储介质
JP2014120032A (ja) 文字認識装置および文字認識方法並びに文字認識プログラム
CN112291614A (zh) 一种视频生成方法及装置
US20130117464A1 (en) Personalized media filtering based on content
CN115967833A (zh) 视频生成方法、装置、设备计存储介质
CN110930969A (zh) 背景音乐的确定方法及相关设备
US20110035223A1 (en) Audio clips for announcing remotely accessed media items
US9066135B2 (en) System and method for generating a second screen experience using video subtitle data
KR102403149B1 (ko) 전자 장치 및 그의 제어 방법
KR101924634B1 (ko) 콘텐츠 제공 서버, 콘텐츠 제공 단말 및 콘텐츠 제공 방법
CN106572140B (zh) 媒体文件播放的方法和终端设备
CN115269920A (zh) 交互方法、装置、电子设备和存储介质
KR102468214B1 (ko) 사용자의 발화를 기반으로 컨텐츠를 제공하는 장치 및 시스템
CN113891108A (zh) 字幕优化方法、装置、电子设备和存储介质
CN112562733A (zh) 媒体数据处理方法及装置、存储介质、计算机设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150121