CN109274915A - 一种信息采集方法及装置 - Google Patents
一种信息采集方法及装置 Download PDFInfo
- Publication number
- CN109274915A CN109274915A CN201811434295.8A CN201811434295A CN109274915A CN 109274915 A CN109274915 A CN 109274915A CN 201811434295 A CN201811434295 A CN 201811434295A CN 109274915 A CN109274915 A CN 109274915A
- Authority
- CN
- China
- Prior art keywords
- video
- audio
- target
- time point
- recording
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000001727 in vivo Methods 0.000 claims abstract description 37
- 230000001815 facial effect Effects 0.000 claims description 20
- 238000003860 storage Methods 0.000 claims description 20
- 238000001514 detection method Methods 0.000 claims description 19
- 239000000203 mixture Substances 0.000 claims description 12
- 238000004091 panning Methods 0.000 claims description 8
- 108010001267 Protein Subunits Proteins 0.000 claims description 2
- 230000015654 memory Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 13
- 238000004590 computer program Methods 0.000 description 11
- 239000010865 sewage Substances 0.000 description 7
- 238000000746 purification Methods 0.000 description 6
- 239000000463 material Substances 0.000 description 5
- 238000009826 distribution Methods 0.000 description 4
- 230000005611 electricity Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 241001672694 Citrus reticulata Species 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 239000011800 void material Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/44008—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/442—Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
- H04N21/44213—Monitoring of end-user related data
- H04N21/44218—Detecting physical presence or behaviour of the user, e.g. using sensors to detect if the user is leaving the room or changes his face expression during a TV program
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/91—Television signal processing therefor
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Social Psychology (AREA)
- Computer Networks & Wireless Communication (AREA)
- Databases & Information Systems (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
一种信息采集方法及装置,包括:在录制时间轴上确定第一时间点之后,从该第一时间点开始录制音视频、进行声音信息和显示屏的屏体内容的识别,以及当检测到音视频录制终止指令时,在录制时间轴上确定第二时间点以获得目标录制时间轴,并终止音视频的录制、声音信息和显示屏的屏体内容的识别,以及将识别声音信息获得的第一目标文本流和识别显示屏的屏体内容获得的第二目标文本流与目标录制时间轴进行关联生成目标文件。实施本发明实施例,能够细化检索粒度,提高检索效果,从而提高信息资源的利用率。
Description
技术领域
本发明涉及信息处理技术领域,具体涉及一种信息采集方法及装置。
背景技术
为了辅助学生学习,许多高校往往会对老师的授课过程进行录制,并将所录制的授课内容保存至学习资源库供学生查找。然而,在实践中发现,学生如果想查找某一个知识点的相关内容,如“相对论”,也只能在学习资源库中根据授课内容的文件名称、授课内容的上传时间或者授课老师的简介等来进行查找,这就使得学生在学习资源库中查找所耗费的时间较久,准确率较低,进而导致学习资源库的利用率较低。因此,如何提升学习资源库的利用率成为了一个亟需解决的问题。
发明内容
本发明实施例公开一种信息采集方法及装置,能够细化检索粒度,提高检索效果,从而提高信息资源的利用率。
本发明实施例第一方面公开一种信息采集方法,所述方法包括:
当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点,从所述第一时间点开始录制音视频、识别声音信息和识别显示屏的屏体内容;
当检测到音视频录制终止指令时,根据音视频录制的终止时间点在所述录制时间轴上确定第二时间点以获得目标录制时间轴,并终止音视频录制以获得所述目标录制时间轴对应的目标音视频、终止声音信息的识别以获得所述目标录制时间轴内的第一目标文本流和终止所述显示屏的屏体内容的识别以获得所述目标录制时间轴内的第二目标文本流,所述目标录制时间轴由所述第一时间点、所述第二时间点、以及所述第一时间点至所述第二时间点之间的所有时间点组成;
将所述第一目标文本流和所述第二目标文本流与所述目标音视频的目标录制时间轴进行关联,获得目标文件并存储。
作为一种可选的实施方式,在本发明实施例第一方面中,所述第一目标文本流由多个第一点文本流组成,且所述第一点文本流的数量与所述目标音视频的目标录制时间轴上时间点的数量相同,每个所述第一点文本流对应一个时间点,任意两个所述第一点文本流所对应的时间点不相同;所述第二目标文本流由多个第二点文本流组成,且所述第二点文本流的数量与所述目标音视频的目标录制时间轴上时间点的数量相同,每个所述第二点文本流对应一个时间点,任意两个所述第二点文本流所对应的时间点不相同。
作为一种可选的实施方式,在本发明实施例第一方面中,所述将所述第一目标文本流和所述第二目标文本流与所述目标音视频的目标录制时间轴进行关联,获得目标文件并存储,包括:
将所述目标音视频的目标录制时间轴上的每一个时间点与所述第一目标文本流中的对应第一点文本流和所述第二目标文本流中的对应第二点文本流进行关联,获得目标文件并存储。
作为一种可选的实施方式,在本发明实施例第一方面中,所述当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点之前,所述方法还包括:
通过电子设备采集当前使用所述电子设备主持某一主题的主持者的人脸图像,对采集到的所述人脸图像进行特征识别,以获得所述人脸图像对应者的用户信息,所述用户信息至少包括用户姓名;
进而,所述将所述第一目标文本流和所述第二目标文本流与所述目标音视频的目标录制时间轴进行关联,获得目标文件并存储,包括:
将所述第一目标文本流和所述第二目标文本流与所述目标音视频的目标录制时间轴进行关联,获得目标文件;
根据所述某一主题、所述某一主题的主持者的用户信息和所述目标音视频的录制时间生成所述目标文件的文件名,以所述文件名作为所述目标文件的文件保存名称并将所述目标文件保存至所述用户信息所对应的存储路径。
作为一种可选的实施方式,在本发明实施例第一方面中,所述当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点之前,所述方法还包括:
检测用户输入的操作手势,所述操作手势用于指示对所述电子设备的摄像头的工作模式进行调整,所述工作模式至少包括近景模式、跟踪模式和全景模式;
将所述电子设备的摄像头的工作模式调整为所述操作手势所对应的目标工作模式;
所述当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点,从所述第一时间点开始录制音视频、识别声音信息和识别显示屏的屏体内容,包括:
在所述目标工作模式下,当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点,从所述第一时间点开始识别声音信息、识别显示屏的屏体内容、以及开始通过所述电子设备的摄像头和麦克风设备录制音视频。
本发明实施例第二方面公开一种信息采集装置,包括:
录播单元,用于当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点,从所述第一时间点开始录制音视频、识别声音信息和识别显示屏的屏体内容;
文本流生成单元,用于当检测到音视频录制终止指令时,根据音视频录制的终止时间点在所述录制时间轴上确定第二时间点以获得目标录制时间轴,并终止音视频录制以获得所述目标录制时间轴对应的目标音视频、终止声音信息的识别以获得所述目标录制时间轴内的第一目标文本流和终止所述显示屏的屏体内容的识别以获得所述目标录制时间轴内的第二目标文本流,所述目标录制时间轴由所述第一时间点、所述第二时间点、以及所述第一时间点至所述第二时间点之间的所有时间点组成;
关联存储单元,用于将所述第一目标文本流和所述第二目标文本流与所述目标音视频的目标录制时间轴进行关联,获得目标文件并存储。
作为一种可选的实施方式,在本发明实施例第二方面中,所述第一目标文本流由多个第一点文本流组成,且所述第一点文本流的数量与所述目标音视频的目标录制时间轴上时间点的数量相同,每个所述第一点文本流对应一个时间点,任意两个所述第一点文本流所对应的时间点不相同;所述第二目标文本流由多个第二点文本流组成,且所述第二点文本流的数量与所述目标音视频的目标录制时间轴上时间点的数量相同,每个所述第二点文本流对应一个时间点,任意两个所述第二点文本流所对应的时间点不相同。
作为一种可选的实施方式,在本发明实施例第二方面中,所述关联存储单元用于将所述第一目标文本流和所述第二目标文本流与所述目标音视频的目标录制时间轴进行关联,获得目标文件并存储的方式具体为:
所述关联存储单元,用于将所述目标音视频的目标录制时间轴上的每一个时间点与所述第一目标文本流中的对应第一点文本流和所述第二目标文本流中的对应第二点文本流进行关联,获得目标文件并存储。
作为一种可选的实施方式,在本发明实施例第二方面中,所述信息采集装置还包括:
获取单元,用于在所述录播单元当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点之前,通过电子设备采集当前使用所述电子设备主持某一主题的主持者的人脸图像,对采集到的所述人脸图像进行特征识别,以获得所述人脸图像对应者的用户信息,所述用户信息至少包括用户姓名;
进而,所述关联存储单元包括:
关联子单元,用于将所述第一目标文本流和所述第二目标文本流与所述目标音视频的目标录制时间轴进行关联,获得目标文件;
存储子单元,用于根据所述某一主题、所述某一主题的主持者的用户信息和所述目标音视频的录制时间生成所述目标文件的文件名,以所述文件名作为所述目标文件的文件保存名称并将所述目标文件保存至所述用户信息所对应的存储路径。
作为一种可选的实施方式,在本发明实施例第二方面中,所述信息采集装置还包括:
检测单元,用于在所述录播单元当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点之前,检测用户输入的操作手势,所述操作手势用于指示对所述电子设备的摄像头的工作模式进行调整,所述工作模式至少包括近景模式、跟踪模式和全景模式;
调整单元,用于将所述电子设备的摄像头的工作模式调整为所述操作手势所对应的目标工作模式;
所述录播单元,具体用于在所述目标工作模式下,当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点,从所述第一时间点开始识别声音信息、识别显示屏的屏体内容、以及开始通过所述电子设备的摄像头和麦克风设备录制音视频。
本发明实施例第三方面公开一种电子设备,包括:
本发明第二方面所介绍的信息采集装置。
本发明实施例第四方面公开了一种电子设备,可包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明第一方面的任意一种方法的部分或全部步骤。
本发明实施例第五方面公开一种计算机可读存储介质,其存储计算机程序,所述计算机程序包括用于执行本发明第一方面的任意一种方法的部分或全部步骤的指令。
本发明实施例第六方面公开一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面的任意一种方法的部分或全部步骤。
本发明实施例第七方面公开一种应用发布平台,所述应用发布平台用于发布计算机程序产品,其中,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面的任意一种方法的部分或全部步骤。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,根据音视频录制的起始时间点在录制时间轴上确定第一时间点,从第一时间点开始音视频的录制、声音信息的识别、显示屏的屏体内容的识别,以及当检测到音视频录制终止指令时,根据音视频录制的终止时间点在录制时间轴上确定第二时间点以获得目标录制时间轴,并终止音视频的录制、声音信息和显示屏的屏体内容的识别,以及将识别声音信息获得的第一目标文本流和识别显示屏的屏体内容获得的第二目标文本流与目标音视频的目标录制时间轴进行关联获得目标文件并存储。本发明实施例中,能够在录制音视频过程中,同时单独识别声音信息生成第一目标文本流以及识别显示屏的屏体内容生成第二目标文本流,由于第一目标文本流和第二目标文本流与音视频的录制时间轴相关联,能够结合三者获得目标文件然后存储下来,方便用户后续可以通过对屏体内容和声音信息进行检索,以检索到音视频内容中包含着某一内容的音视频,解决现有技术中只能从主题名称、上传时间或者授课老师的简介等来检索课件所带来的检索效率低且利用率较低的技术问题,细化检索粒度,提高检索效果,从而提高信息资源的利用率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种信息采集方法的流程示意图;
图2是本发明实施例公开的另一种信息采集方法的流程示意图;
图3是本发明实施例公开的一种信息采集装置的结构示意图;
图4是本发明实施例公开的另一种信息采集装置的结构示意图;
图5是本发明实施例公开的又一种信息采集装置的结构示意图;
图6是本发明实施例公开的一种目标文件的组成示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例及附图中的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例公开一种信息采集方法及装置,能够细化检索粒度,提高检索效率,以提高资源利用率。以下分别进行详细说明。
本发明实施例所描述的信息采集方法可以应用于授课、会议或培训等过程中。以授课过程举例,老师利用触摸一体机授课过程中,会利用触摸一体机的显示屏向学生播放课件(例如视频、文档等),同时,这一授课过程中往往还会伴随有老师对所播放课件的解释,这就需要通过触摸一体机、以及触摸一体机上设置的摄像头和麦克风实现对授课过程中音视频的录制,该音视频的录制既可以是对老师解释播放课件整个过程的录制(其中,录制后的音视频能够清晰地呈现课件内容),也可以是对显示屏上播放课件的单独录制和老师授课声音的采集。同时在音视频的录制过程中,基于音视频的录制时间轴实现对课件内容的识别和授课声音的识别,识别之后分别获得相应的文本流,然后将文本流和音视频关联,以实现细化检索音视频的粒度,提高检索效果,以提高课件的利用率。可以理解,在以触摸一体机授课为例时,上述信息采集方法可以由触摸一体机单独执行,即信息采集装置为触摸一体机,也可以由后台服务器辅助触摸一体机执行,即信息采集装置包括触摸一体机和后台服务器,本发明实施例不做限定。
结合上述所介绍的内容,下面将通过具体实施例对本发明技术方案进行详细说明。
实施例一
请参阅图1,图1是本发明实施例公开的一种信息采集方法的流程示意图,图6是本发明实施例公开的一种目标文件的组成示意图。如图1所示,该信息采集方法可以包括以下步骤:
101、当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点,从第一时间点开始录制音视频、识别声音信息和识别显示屏的屏体内容。
在本发明实施例中,在授课、会议或者培训等过程中,可以采用如多媒体设备、触摸一体机或显示屏播放课件、培训文档等电子设备,在电子设备中设置有摄像头和麦克风等或者在场地中设置有独立摄像头和麦克风等。在过程中,当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点之后(即确定音视频的起始时间点),若显示屏上播放视频或文档(如WORD、PPT、EXCEL等),从第一时间点开始录制的音视频可以为录制显示屏上播放的视频或文档和声音,也可以为录制包括显示屏上播放的视频或者文档在内的视频。
需要说明的是,显示屏的屏体内容可以为显示屏上播放的视频的字幕或文档内容,若显示屏上播放的视频或文档中存在包含文字的图片,那么显示屏的屏体内容也可以包括图片中的文字,至少包括如下几种情况:若显示屏播放的为视频,那么屏体内容就包括视频所配的字幕、存在于视频中的图片所包含的文字信息等;若显示屏播放的为文档,那么屏体内容就包括文档中的文字信息、存在于文档中的图片所包含的文字信息等。
作为一种可选的实施方式,在本发明实施例中,当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点之前,电子设备还可以检测用户输入的用于选择声音信息的识别类型的指令,该声音信息的识别类型可以包括标准普通话识别类型、粤语识别类型等,还可以根据检测到的指令确定目标识别类型。进一步可选的,当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点,从第一时间点开始录制音视频、识别声音信息和识别显示屏的屏体内容,可以包括:当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点,从第一时间点开始录制音视频、识别显示屏的屏体内容,以及采用目标识别类型对声音信息进行识别。通过实施该方法可以提供声音信息的多种识别类型给用户,以便于用户选择适合自己声音信息的识别类型实现语音信息的识别,从而有效地提高语音信息识别的准确性。
102、当检测到音视频录制终止指令时,根据音视频录制的终止时间点在录制时间轴上确定第二时间点以获得目标录制时间轴,并终止音视频录制以获得所述目标录制时间轴对应的目标音视频、终止声音信息的识别以获得所述目标录制时间轴内的第一目标文本流和终止显示屏的屏体内容的识别以获得目标录制时间轴内的第二目标文本流。
在本发明实施例中,目标录制时间轴可以由上述第一时间点、第二时间点、以及第一时间点至第二时间点之间的所有时间点组成,且该目标录制时间轴为目标音视频的时间轴。作为一种可选的实施方式,在本发明实施例中,第一目标文本流可以由多个第一点文本流组成,且第一目标文本流所包含的第一点文本流的数量与上述目标音视频的目标录制时间轴上时间点的数量相同,每个第一点文本流对应一个时间点,任意两个第一点文本流所对应的时间点不相同;第二目标文本流可以由多个第二点文本流组成,且第二目标文本流所包含的第二点文本流的数量与上述目标音视频的目标录制时间轴上时间点的数量相同,每个第二点文本流对应一个时间点,任意两个第二点文本流所对应的时间点不相同。
需要说明的是,第一目标文本流是基于目标录制时间轴的,由目标录制时间轴上所有时间点所对应的所有第一点文本流组成,每个第一点文本流中包含音视频录制过程中在该时间点处识别出的声音信息内容,同样的,第二目标文本流也是基于目标录制时间轴的,由目标录制时间轴上所有时间点所对应的所有第二点文本流组成,每个第二点文本流中包含音视频录制过程中在该时间点处识别出的显示屏的屏体内容。
作为一种可选的实施方式,在本发明实施例中,步骤102之前,还可以判断在预设时间段内是否检测到声音信息或者显示屏的屏体内容,如果否,生成音视频录制终止指令,以触发执行步骤102。通过实施该方法,可以实现自动终止音视频录制过程,从而可以通过提高电子设备的智能化程度,提高用户体验。
103、将第一目标文本流和第二目标文本流与上述目标音视频的目标录制时间轴进行关联,获得目标文件并存储。
在本发明实施例中,根据信息采集方法的应用环境,目标文件可以是生成的学习资料、培训资料和会议记录等,在此不做限定。目标文件可以包含目标音视频、第一目标文本流以及第二目标文本流,第一目标文本流和第二目标文本流都是基于目标音视频所对应的目标录制时间轴的,为了便于理解,图6所示的目标文件的组成示意图将第一目标文本流、第二目标文本流以及目标音视频与目标录制时间轴之间的关系分别用L1、L2以及L3来表示,其中,L1用于表示目标录制时间轴与目标音视频的关联,L2用于表示目标录制时间轴与第一目标文本流的关联,L3用于表示目标录制时间轴与第二目标文本流的关联。L1、L2和L3上都包含有多个时间点(1~n),其中,1所在的时间点为本发明所介绍的第一时间点即音视频录制开始的时间点,n所在的时间点为本发明所介绍的第二时间点即音视频录制结束的时间点,m所在的时间点为1~n之间某一时间点,以m所在的时间点为例,L1上m所在的时间点上关联有音视频录制过程中处于该时间点的音视频内容,L2上m所在的时间点上关联有处于该时间点的第一点文本流,即该时间点识别出的声音信息内容,L3上m所在的时间点上关联有第二点文本流,即该时间点识别出的显示屏的屏体内容。
进一步可选的,将第一目标文本流和第二目标文本流与上述目标音视频的目标录制时间轴进行关联,获得目标文件并存储,可以包括:
将上述目标音视频的目标录制时间轴上的每一个时间点与第一目标文本流中的对应第一点文本流和第二目标文本流中的对应第二点文本流进行关联,获得目标文件并存储。即通过该实施方式,将基于目标音视频的目标录制时间轴生成第一文本流和第二文本流,能够细化后续的内容检索粒度。
通过实施上述方法,这种在音视频录制过程中,同时也将识别屏体内容和声音作为文本流进行存储的方式可以提高信息的查找效率和准确率,进而提高资源利用率。
实施例二
请参阅图2,图2是本发明实施例公开的另一种信息采集方法的流程示意图。如图2所示,该信息采集方法可以包括以下步骤:
201、通过电子设备采集当前使用该电子设备主持某一主题的主持者的人脸图像,对采集到的人脸图像进行特征识别,以获得人脸图像对应者的用户信息,该用户信息至少包括用户姓名。
在本发明实施例中,电子设备可以外设一个无线麦克风设备,该无线麦克风设备可以与电子设备网络或蓝牙连接,本发明实施例不做限定,该无线麦克风设备可以采集握持者的指纹,并发送给电子设备,因此,电子设备获得用户信息的途径除步骤201之外,还可以通过无线麦克风设备采集当前使用电子设备主持某一主题的主持者的指纹,对采集到的指纹进行识别,以获得指纹信息对应的用户信息,通过该方法可以提高用户信息的获取速度。
202、检测用户输入的操作手势,该操作手势用于指示对电子设备的摄像头的工作模式进行调整,电子设备的摄像头的工作模式至少可以包括近景模式、跟踪模式和全景模式。
本发明实施例中,电子设备可以预设有至少三种合法操作手势,每一种合法操作手势指示一种电子设备的摄像头的工作模式,任意两种合法操作手势所指示的电子设备的摄像头的工作模式不相同,上述三种合法操作手势可以为三种简单的几何图形,如圆形、三角形和长方形,其中,圆形可以指示电子设备的摄像头的工作模式为近景模式,三角形可以指示电子设备的摄像头的工作模式为跟踪模式,长方形可以指示电子设备的工作模式为全景模式,那么,作为一种可选的实施方式,电子设备检测用户输入的操作手势可以包括:电子设备可以通过识别用户输入的几何图形,并根据识别结果的指示对电子设备的摄像头的工作模式进行调整。
在本发明实施例中,电子设备还可以在其显示屏上显示用于选择电子设备的摄像头的工作模式的选择界面,该选择界面可以包含代表电子设备的摄像头不同工作模式的虚拟按钮,其中,该选择界面中的虚拟按钮的数量与摄像头的工作模式的数量相同,且虚拟按钮可以以简单几何图案的形式呈现,如圆形、三角形和长方形,其中,圆形可以指示电子设备的摄像头的工作模式为近景模式,三角形可以指示电子设备的摄像头的工作模式为跟踪模式,长方形可以指示电子设备的摄像头工作模式为全景模式,那么,作为另一种可选的实施方式,电子设备检测用户输入的操作手势可以包括:电子设备可以通过检测用户针对选择界面中虚拟按钮的触摸操作,确定用户选择的目标虚拟按钮,并根据该目标虚拟按钮的指示对电子设备的摄像头的工作模式进行调整。通过实施上述两种方法可以便于用户根据自己的需要随时随地地调整电子设备摄像头的工作模式,从而提高音视频录制时的视频画质。
203、将电子设备的摄像头的工作模式调整为上述操作手势所对应的目标工作模式。
204、在上述目标工作模式下,当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点,从第一时间点开始识别声音信息、识别显示屏的屏体内容、以及开始通过电子设备的摄像头和麦克风设备录制音视频。
针对步骤204的详细描述,请参照实施例一中针对步骤101的描述,本发明实施例不再赘述。
在本发明实施例中,需要说明的是,步骤202~步骤203可以发生在步骤201之前,也可以发生在步骤201之后,本发明实施例不做限定。
205、当检测到音视频录制终止指令时,根据音视频录制的终止时间点在录制时间轴上确定第二时间点以获得目标录制时间轴,并终止音视频录制以获得所述目标录制时间轴对应的目标音视频、终止声音信息的识别以获得所述目标录制时间轴内的第一目标文本流和终止显示屏的屏体内容的识别以获得目标录制时间轴内的第二目标文本流。
需要说明的是,在本发明实施例中目标录制时间轴由上述第一时间点、第二时间点、以及第一时间点至第二时间点之间的所有时间点组成。针对步骤205的详细描述,请参照实施例一中针对步骤102的描述,本发明实施例不再赘述。
206、将第一目标文本流和第二目标文本流与上述目标音视频的目标录制时间轴进行关联,获得目标文件。
需要说明的是,针对步骤206所提及的目标文件的解释,请参照实施例一中针对步骤103中目标文件的解释,本发明实施例不再赘述。
207、根据上述某一主题、上述某一主题的主持者的用户信息和上述目标音视频的录制时间生成目标文件的文件名,以该文件名作为目标文件的文件保存名称并将目标文件保存至上述用户信息所对应的存储路径。
针对步骤201~步骤207举例来说,若电子设备为触摸一体机,张三教授在2018年3月12日有一场有关污水净化的讲座,在讲座开始之前,触摸一体机可以通过采集人脸信息获得张三教授的姓名“张三”,当前张三教授距离触摸一体机的距离较近时,张三教授可以用手指画圆的方式将触摸一体机摄像头的工作模式调整为近景模式,以及利用触摸一体机对张三教授的主讲过程进行录制得到有关污水净化的学习资料,在该讲座结束之后,触摸一体机根据张三教授的姓名“张三”,讲座的时间“2018年3月12日”以及讲座主题“污水净化”生成有关污水净化的学习资料的文件名“2018.3.12-张三-污水净化”,并将命名之后的有关污水净化的学习资料上传至学习资源库中名称为“张三”子库中。需要说明的是,对主讲过程的录制既包括对张三教授讲述过程的录制,也包括对显示屏播放讲座资料的录制,该有关污水净化的学习资料中包括有张三教授讲述过程的音视频、张三教授讲述的语音信息、触摸一体机显示屏所播放的张三教授讲述过程中用到的课件(视频文件或文档文件),以及课件中的文本信息。
通过实施上述方法,可以提高资源利用率,也可以有效地提高语音信息识别的准确性,还可以通过电子设备的智能化程度,提高用户体验,还可以提高用户信息的获取速度,还可以提高音视频录制时的视频画质。
实施例三
请参阅图3,图3是本发明实施例公开的一种信息采集装置的结构示意图。如图3所示,该信息采集装置可以包括:
录播单元301,用于当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点,从第一时间点开始录制音视频、识别声音信息和识别显示屏的屏体内容。
作为一种可选的实施方式,在本发明实施例中,录播单元301,还可以用于当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点之前,检测用户输入的用于选择声音信息的识别类型的指令,该声音信息的识别类型可以包括标准普通话识别类型、粤语识别类型等,并根据检测到的指令确定目标识别类型。进一步可选的,录播单元301当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点,从第一时间点开始录制音视频、识别声音信息和识别显示屏的屏体内容的方式具体可以为:录播单元301,用于当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点,从第一时间点开始录制音视频、识别显示屏的屏体内容,以及采用目标识别类型对声音信息进行识别。通过实施该方式可以提供声音信息的多种识别类型给用户,以便于用户选择适合自己声音信息的识别类型实现语音信息的识别,从而有效地提高语音信息识别的准确性。
文本流生成单元302,用于当检测到音视频录制终止指令时,根据音视频录制的终止时间点在上述录制时间轴上确定第二时间点以获得目标录制时间轴,并终止音视频录制以获得目标录制时间轴对应的目标音视频、终止声音信息的识别以获得目标录制时间轴内的第一目标文本流和终止显示屏的屏体内容的识别以获得目标录制时间轴内的第二目标文本流,目标录制时间轴由第一时间点、第二时间点、以及第一时间点至第二时间点之间的所有时间点组成。
在本发明实施例中,第一目标文本流和第二目标文本流的详细解释,请参照实施例一中步骤102下面的解释,本发明实施例不再赘述。
作为一种可选的实施方式,在本发明实施例中,文本流生成单元302,还可以用于当检测到音视频录制终止指令时,根据音视频录制的终止时间点在上述录制时间轴上确定第二时间点以获得目标录制时间轴之前,判断在预设时间段内是否检测到声音信息或者显示屏的屏体内容,如果否,生成音视频录制终止指令,并触发执行上述的当检测到音视频录制终止指令时,根据音视频录制的终止时间点在上述录制时间轴上确定第二时间点以获得目标录制时间轴。通过实施该方式,可以通过提高电子设备的智能化程度,从而提高用户体验。
关联存储单元303,用于将第一目标文本流和第二目标文本流与目标音视频的目标录制时间轴进行关联,获得目标文件并存储。
在本发明实施例中,针对目标文件的解释,请参照实施例一中步骤103下面的解释,本发明实施例不再赘述。
针对上述描述,进一步可选的,关联存储单元303用于将第一目标文本流和第二目标文本流与目标音视频的目标录制时间轴进行关联,获得目标文件并存储的方式具体可以为:关联存储单元303,用于将目标音视频的目标录制时间轴上的每一个时间点与第一目标文本流中的对应第一点文本流和第二目标文本流中的对应第二点文本流进行关联,获得目标文件并存储。
通过实施上述信息采集装置,可以提高信息的查找效率和准确率,进而提高资源利用率。
实施例四
请参阅图4,图4是本发明实施例公开的另一种信息采集装置的结构示意图。图4所示的信息采集装置是由图3所示的信息采集装置优化得到的,如图4所示,该信息采集装置可以包括:
获取单元304,用于在录播单元301当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点之前,通过电子设备采集当前使用该电子设备主持某一主题的主持者的人脸图像,对采集到的人脸图像进行特征识别,以获得人脸图像对应者的用户信息,该用户信息至少包括用户姓名。
在本发明实施例中,电子设备可以外设一个无线麦克风设备,该无线麦克风设备可以与电子设备网络或蓝牙连接,本发明实施例不做限定,该无线麦克风设备可以采集握持者的指纹,并发送给电子设备,因此,获取单元304,还可以用于通过无线麦克风设备采集当前使用电子设备主持某一主题的主持者的指纹,对采集到的指纹进行识别,以获得指纹信息对应的用户信息,通过该方式可以提高用户信息的获取速度。
作为一种可选的实施方式,在本发明实施例中,获取单元304,还可以用于在通过电子设备采集当前使用电子设备主持某一主题的主持者的人脸图像,对采集到的人脸图像进行特征识别,以获得人脸图像对应者的用户信息之后,向检测单元305发送启动指令,以启动检测单元305。
进而,关联存储单元303可以包括:
关联子单元3031,用于将第一目标文本流和第二目标文本流与目标音视频的目标录制时间轴进行关联,获得目标文件。
存储子单元3032,用于根据上述某一主题、上述某一主题的主持者的用户信息和目标音视频的录制时间生成目标文件的文件名,以该文件名作为目标文件的文件保存名称并将目标文件保存至用户信息所对应的存储路径。
作为一种可选的实施方式,在本发明实施例中,图4所示的信息采集装置还可以包括:
检测单元305,用于在录播单元301当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点之前,检测用户输入的操作手势,该操作手势用于指示对电子设备的摄像头的工作模式进行调整,电子设备的摄像头的工作模式至少包括近景模式、跟踪模式和全景模式。
作为一种可选的实施方式,本发明实施例中,电子设备可以预设有至少三种合法操作手势,每一种合法操作手势指示一种电子设备的摄像头的工作模式,任意两种合法操作手势所指示的电子设备的摄像头的工作模式不相同,上述三种合法操作手势可以为三种简单的几何图形,如圆形、三角形和长方形,其中,圆形可以指示电子设备的摄像头的工作模式为近景模式,三角形可以指示电子设备的摄像头的工作模式为跟踪模式,长方形可以指示电子设备的工作模式为全景模式。检测单元305检测用户输入的操作手势的方式具体可以为:检测单元305,用于通过识别用户输入的几何图形,并根据识别结果的指示对电子设备的摄像头的工作模式进行调整。
作为另一种可选的实施方式,电子设备还可以在其显示屏上显示用于选择电子设备的摄像头的工作模式的选择界面,该选择界面可以包含代表电子设备的摄像头不同工作模式的虚拟按钮,其中,该选择界面中的虚拟按钮的数量与摄像头的工作模式的数量相同,且虚拟按钮可以以简单几何图案的形式呈现,如圆形、三角形和长方形,其中,圆形可以指示电子设备的摄像头的工作模式为近景模式,三角形可以指示电子设备的摄像头的工作模式为跟踪模式,长方形可以指示电子设备的摄像头工作模式为全景模式,检测单元305检测用户输入的操作手势的方式具体可以为:检测单元305,用于通过检测用户针对选择界面中虚拟按钮的触摸操作,确定用户选择的目标虚拟按钮,并根据该目标虚拟按钮的指示对电子设备的摄像头的工作模式进行调整。
通过实施上述两种方式可以便于用户根据自己的需要随时随地地调整电子设备摄像头的工作模式,从而提高音视频录制时的视频画质。
调整单元306,用于将电子设备的摄像头的工作模式调整为上述操作手势所对应的目标工作模式。
录播单元301,具体用于在上述目标工作模式下,当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点,从第一时间点开始识别声音信息、识别显示屏的屏体内容、以及开始通过电子设备的摄像头和麦克风设备录制音视频。
针对该实施例的举例请参照实施例二中的举例,本发明实施例不再赘述。
通过实施上述信息采集装置,可以提高资源利用率,也可以有效地提高语音信息识别的准确性,还可以通过电子设备的智能化程度,提高用户体验,还可以提高用户信息的获取速度,还可以提高音视频录制时的视频画质。
实施例五
请参阅图5,图5是本发明实施例公开的一种电子设备的结构示意图,该电子设备还可以包括实施例三至实施例四中任一实施例所描述的信息采集装置。如图5所示,该电子设备可以包括:
存储有可执行程序代码的存储器501;
与存储器501耦合的处理器502;
其中,处理器502调用存储器501中存储的可执行程序代码,执行图1~图2任意一种信息采集方法。
本发明实施例公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行图1~图2任意一种信息采集方法。
本发明实施例公开一种计算机程序产品,当该计算机程序产品在计算机上运行时,使得计算机执行图1~图2任意一种信息采集方法。
本发明实施例公开一种应用发布平台,该应用发布平台用于发布计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行图1~图2任意一种信息采集方法。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本发明实施例公开的一种信息采集方法及装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,且上述具体个例中步骤序号的大小并不意味着执行顺序的必然先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,可根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
本文中字符“/”,一般表示前后关联对象是一种“或”的关系。在本发明所提供的实施例中,应理解,“与A相应的B”表示B与A相关联,根据A可以确定B。但还应理解,根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确定B。另外,在本发明各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。若上述集成的单元以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可获取的存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分,可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本发明的各个实施例上述方法的部分或全部步骤。
以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种信息采集方法,其特征在于,所述方法包括:
当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点,从所述第一时间点开始录制音视频、识别声音信息和识别显示屏的屏体内容;
当检测到音视频录制终止指令时,根据音视频录制的终止时间点在所述录制时间轴上确定第二时间点以获得目标录制时间轴,并终止音视频录制以获得所述目标录制时间轴对应的目标音视频、终止声音信息的识别以获得所述目标录制时间轴内的第一目标文本流和终止所述显示屏的屏体内容的识别以获得所述目标录制时间轴内的第二目标文本流,所述目标录制时间轴由所述第一时间点、所述第二时间点、以及所述第一时间点至所述第二时间点之间的所有时间点组成;
将所述第一目标文本流和所述第二目标文本流与所述目标音视频的目标录制时间轴进行关联,获得目标文件并存储。
2.根据权利要求1所述的方法,其特征在于,所述第一目标文本流由多个第一点文本流组成,且所述第一点文本流的数量与所述目标音视频的目标录制时间轴上时间点的数量相同,每个所述第一点文本流对应一个时间点,任意两个所述第一点文本流所对应的时间点不相同;所述第二目标文本流由多个第二点文本流组成,且所述第二点文本流的数量与所述目标音视频的目标录制时间轴上时间点的数量相同,每个所述第二点文本流对应一个时间点,任意两个所述第二点文本流所对应的时间点不相同。
3.根据权利要求2所述的方法,其特征在于,所述将所述第一目标文本流和所述第二目标文本流与所述目标音视频的目标录制时间轴进行关联,获得目标文件并存储,包括:
将所述目标音视频的目标录制时间轴上的每一个时间点与所述第一目标文本流中的对应第一点文本流和所述第二目标文本流中的对应第二点文本流进行关联,获得目标文件并存储。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点之前,所述方法还包括:
通过电子设备采集当前使用所述电子设备主持某一主题的主持者的人脸图像,对采集到的所述人脸图像进行特征识别,以获得所述人脸图像对应者的用户信息,所述用户信息至少包括用户姓名;
进而,所述将所述第一目标文本流和所述第二目标文本流与所述目标音视频的目标录制时间轴进行关联,获得目标文件并存储,包括:
将所述第一目标文本流和所述第二目标文本流与所述目标音视频的目标录制时间轴进行关联,获得目标文件;
根据所述某一主题、所述某一主题的主持者的用户信息和所述目标音视频的录制时间生成所述目标文件的文件名,以所述文件名作为所述目标文件的文件保存名称并将所述目标文件保存至所述用户信息所对应的存储路径。
5.根据权利要求1所述的方法,其特征在于,所述当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点之前,所述方法还包括:
检测用户输入的操作手势,所述操作手势用于指示对所述电子设备的摄像头的工作模式进行调整,所述工作模式至少包括近景模式、跟踪模式和全景模式;
将所述电子设备的摄像头的工作模式调整为所述操作手势所对应的目标工作模式;
所述当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点,从所述第一时间点开始录制音视频、识别声音信息和识别显示屏的屏体内容,包括:
在所述目标工作模式下,当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点,从所述第一时间点开始识别声音信息、识别显示屏的屏体内容、以及开始通过所述电子设备的摄像头和麦克风设备录制音视频。
6.一种信息采集装置,其特征在于,所述信息采集装置包括:
录播单元,用于当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点,从所述第一时间点开始录制音视频、识别声音信息和识别显示屏的屏体内容;
文本流生成单元,用于当检测到音视频录制终止指令时,根据音视频录制的终止时间点在所述录制时间轴上确定第二时间点以获得目标录制时间轴,并终止音视频录制以获得所述目标录制时间轴对应的目标音视频、终止声音信息的识别以获得所述目标录制时间轴内的第一目标文本流和终止所述显示屏的屏体内容的识别以获得所述目标录制时间轴内的第二目标文本流,所述目标录制时间轴由所述第一时间点、所述第二时间点、以及所述第一时间点至所述第二时间点之间的所有时间点组成;
关联存储单元,用于将所述第一目标文本流和所述第二目标文本流与所述目标音视频的目标录制时间轴进行关联,获得目标文件并存储。
7.根据权利要求6所述的信息采集装置,其特征在于,所述第一目标文本流由多个第一点文本流组成,且所述第一点文本流的数量与所述目标音视频的目标录制时间轴上时间点的数量相同,每个所述第一点文本流对应一个时间点,任意两个所述第一点文本流所对应的时间点不相同;所述第二目标文本流由多个第二点文本流组成,且所述第二点文本流的数量与所述目标音视频的目标录制时间轴上时间点的数量相同,每个所述第二点文本流对应一个时间点,任意两个所述第二点文本流所对应的时间点不相同。
8.根据权利要求7所述的信息采集装置,其特征在于,所述关联存储单元用于将所述第一目标文本流和所述第二目标文本流与所述目标音视频的目标录制时间轴进行关联,获得目标文件并存储的方式具体为:
所述关联存储单元,用于将所述目标音视频的目标录制时间轴上的每一个时间点与所述第一目标文本流中的对应第一点文本流和所述第二目标文本流中的对应第二点文本流进行关联,获得目标文件并存储。
9.根据权利要求6至8任一项所述的信息采集装置,其特征在于,所述信息采集装置还包括:
获取单元,用于在所述录播单元当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点之前,通过电子设备采集当前使用所述电子设备主持某一主题的主持者的人脸图像,对采集到的所述人脸图像进行特征识别,以获得所述人脸图像对应者的用户信息,所述用户信息至少包括用户姓名;
进而,所述关联存储单元包括:
关联子单元,用于将所述第一目标文本流和所述第二目标文本流与所述目标音视频的目标录制时间轴进行关联,获得目标文件;
存储子单元,用于根据所述某一主题、所述某一主题的主持者的用户信息和所述目标音视频的录制时间生成所述目标文件的文件名,以所述文件名作为所述目标文件的文件保存名称并将所述目标文件保存至所述用户信息所对应的存储路径。
10.根据权利要求6所述的信息采集装置,其特征在于,所述信息采集装置还包括:
检测单元,用于在所述录播单元当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点之前,检测用户输入的操作手势,所述操作手势用于指示对所述电子设备的摄像头的工作模式进行调整,所述工作模式至少包括近景模式、跟踪模式和全景模式;
调整单元,用于将所述电子设备的摄像头的工作模式调整为所述操作手势所对应的目标工作模式;
所述录播单元,具体用于在所述目标工作模式下,当检测到音视频录制开始指令时,根据音视频录制的起始时间点在录制时间轴上确定第一时间点,从所述第一时间点开始识别声音信息、识别显示屏的屏体内容、以及开始通过所述电子设备的摄像头和麦克风设备录制音视频。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811434295.8A CN109274915A (zh) | 2018-11-28 | 2018-11-28 | 一种信息采集方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811434295.8A CN109274915A (zh) | 2018-11-28 | 2018-11-28 | 一种信息采集方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109274915A true CN109274915A (zh) | 2019-01-25 |
Family
ID=65185735
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811434295.8A Pending CN109274915A (zh) | 2018-11-28 | 2018-11-28 | 一种信息采集方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109274915A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101382937A (zh) * | 2008-07-01 | 2009-03-11 | 深圳先进技术研究院 | 基于语音识别的多媒体资源处理方法及其在线教学系统 |
CN103186557A (zh) * | 2011-12-28 | 2013-07-03 | 宇龙计算机通信科技(深圳)有限公司 | 一种录音或者录像文件自动命名的方法和装置 |
CN105430316A (zh) * | 2015-11-25 | 2016-03-23 | 北京华夏电通科技有限公司 | 庭审录像自动控制系统及方法 |
WO2017152603A1 (zh) * | 2016-03-10 | 2017-09-14 | 深圳创维-Rgb电子有限公司 | 显示方法及装置 |
CN107483813A (zh) * | 2017-08-08 | 2017-12-15 | 深圳市明日实业股份有限公司 | 一种根据手势进行跟踪录播的方法、装置及存储装置 |
CN107920280A (zh) * | 2017-03-23 | 2018-04-17 | 广州思涵信息科技有限公司 | 视频、讲义ppt和语音内容精准匹配的方法和系统 |
-
2018
- 2018-11-28 CN CN201811434295.8A patent/CN109274915A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101382937A (zh) * | 2008-07-01 | 2009-03-11 | 深圳先进技术研究院 | 基于语音识别的多媒体资源处理方法及其在线教学系统 |
CN103186557A (zh) * | 2011-12-28 | 2013-07-03 | 宇龙计算机通信科技(深圳)有限公司 | 一种录音或者录像文件自动命名的方法和装置 |
CN105430316A (zh) * | 2015-11-25 | 2016-03-23 | 北京华夏电通科技有限公司 | 庭审录像自动控制系统及方法 |
WO2017152603A1 (zh) * | 2016-03-10 | 2017-09-14 | 深圳创维-Rgb电子有限公司 | 显示方法及装置 |
CN107920280A (zh) * | 2017-03-23 | 2018-04-17 | 广州思涵信息科技有限公司 | 视频、讲义ppt和语音内容精准匹配的方法和系统 |
CN107483813A (zh) * | 2017-08-08 | 2017-12-15 | 深圳市明日实业股份有限公司 | 一种根据手势进行跟踪录播的方法、装置及存储装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2019262848B2 (en) | Interactive application adapted for use by multiple users via a distributed computer-based system | |
CN106210836B (zh) | 一种视频播放过程中的互动学习方法及装置、终端设备 | |
CN106575149A (zh) | 用于捕获和传输媒体和位置内容的消息用户界面 | |
CN109960809B (zh) | 一种听写内容的生成方法及电子设备 | |
JP5972707B2 (ja) | 学習コンテンツの構造化装置及びそれを用いた学習コンテンツ選択支援システム並びに支援方法 | |
US20220150287A1 (en) | System and method for an interactive digitally rendered avatar of a subject person | |
CN111077996B (zh) | 一种基于点读的信息推荐方法及学习设备 | |
JP6176041B2 (ja) | 情報処理装置及びプログラム | |
CN108920450A (zh) | 一种基于电子设备的知识点复习方法及电子设备 | |
CN109726308A (zh) | 一种生成小说的背景音乐的方法及设备 | |
CN108763475B (zh) | 一种录制方法、录制装置及终端设备 | |
CN109597898A (zh) | 一种信息检索方法及装置 | |
CN111026786B (zh) | 一种听写列表生成方法及家教设备 | |
JP2014085998A (ja) | 電子ノート作成支援装置および電子ノート作成支援装置用プログラム | |
CN111223487A (zh) | 一种信息处理方法及电子设备 | |
US20100240018A1 (en) | Process for creating and administrating tests | |
CN113391745A (zh) | 网络课程的重点内容处理方法、装置、设备及存储介质 | |
US11367048B2 (en) | Automated creation of digital affinity diagrams | |
JP2010134681A (ja) | 講演資料作成支援システム、講演資料作成支援方法及び講演資料作成支援プログラム | |
CN109274915A (zh) | 一种信息采集方法及装置 | |
CN114760274B (zh) | 在线课堂的语音交互方法、装置、设备及存储介质 | |
JP2006030513A (ja) | 教育支援装置及び教育情報管理サーバ | |
US10593366B2 (en) | Substitution method and device for replacing a part of a video sequence | |
CN108280184A (zh) | 一种基于智能笔的试题摘录方法、系统及智能笔 | |
CN111081088A (zh) | 一种听写字词收录方法及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190125 |
|
RJ01 | Rejection of invention patent application after publication |