CN113784190A - 一种电子绘本的生成方法、系统和电子绘本的播放方法 - Google Patents

一种电子绘本的生成方法、系统和电子绘本的播放方法 Download PDF

Info

Publication number
CN113784190A
CN113784190A CN202110972326.0A CN202110972326A CN113784190A CN 113784190 A CN113784190 A CN 113784190A CN 202110972326 A CN202110972326 A CN 202110972326A CN 113784190 A CN113784190 A CN 113784190A
Authority
CN
China
Prior art keywords
key frame
audio
text content
frame picture
audio text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110972326.0A
Other languages
English (en)
Inventor
陈旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202110972326.0A priority Critical patent/CN113784190A/zh
Publication of CN113784190A publication Critical patent/CN113784190A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • H04N21/4307Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
    • H04N21/43072Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen of multiple content streams on the same device
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种电子绘本的生成方法、系统和电子绘本的播放方法,包括获取音视频中关键帧图片特征库与音频文本内容特征库;将关键帧图片索引文件与音频文本内容索引文件进行匹配;生成对应新索引的关键帧图片和音频文本内容匹配一致性映射关系;依据匹配一致性映射关系关键帧图片与音频文本内容同步播放。同时,通过本地数据处理系统实现对本地音视频特征库中关键帧图片与音频文本内容数据的采集、计算、存储、播放等功能,云端数据处理系统实现对云端音视频特征库中关键帧图片与音频文本内容数据的采集、少量数据计算、短期数据存储功能。该云端数据处理系统有效的解决了因用户端占用存储空间过大,而导致本地数据处理系统运算速度降低的问题。

Description

一种电子绘本的生成方法、系统和电子绘本的播放方法
技术领域
本发明涉及数据处理技术领域,尤其涉及一电子绘本的生成方法、系统和电子绘本的播放方法。
背景技术
目前,随着科技的不断发展,数字化电子阅读时代已经到来,儿童读物电子化成为普遍趋势,传统的纸质阅读慢慢转向电子阅读,从而市场上也出现了一些电子绘本。电子绘本即借助平板、手机等电子设备呈现的绘本,可以将APP下载到手机或电脑里,阅读的时候直接点开软件就可以观看;此外,电子绘本可内置多种媒体形式,如音频、视频等,能更好地激发儿童阅读兴趣
然而,就单独音频节目来说其内容比较单一缺少图片、文字等色彩信息,儿童在收听较长音频节目的过程中其兴趣会有显著降低。电子绘本结合图片、音频两种媒体形式,收听观看的灵活性更大。电子绘本需要同视频节目一样进行专门制作,且制作周期长成本都较高,其中音视频文件会占用较大的存储空间,因此生成的电子绘本也会占用较大的存储空间。同时,无法自动生成、准确翻页的播放体验效果。从而导致使用不够灵活方便给用户造成不便。
发明内容
本发明提供一种电子绘本的生成方法、系统和电子绘本的播放方法,将音视频的内容视通过频模型运算与音频模型算法获取关键帧图片与音频文本内容,关键帧图片与音频文本内容进行匹配,达到连续生成关键帧图片与音频文本内容的播放进度一致。
本发明实施例提供一种电子绘本的播放方法,所述播放方法包括:
获取音视频中关键帧图片特征库与音频文本内容特征库;所述关键帧图片特征库包括键帧图片索引文件,所述音频文本内容特征库包括音频文本内容索引文件;将所述关键帧图片索引文件与音频文本内容索引文件进行匹配;生成对应新索引的关键帧图片和音频文本内容匹配一致性映射关系;依据新索引的关键帧图片和音频文本内容匹配一致性映射关系同步播放关键帧图片与音频文本内容。
根据本发明的另一方面,还提供一种电子绘本的生成方法,所述生成方法包括如下步骤:
获取步骤,用于获取音视频中关键帧图片特征库与音频文本内容特征库,通过对所述关键帧图片特征库进行视频模型算法处理生成关键帧图片索引文件,通过对所述音频内容特征库进行音频模型算法处理生成音频文本内容索引文件;
匹配步骤,用于将所述关键帧图片索引文件与音频文本内容索引文件进行匹配;生成对应新索引的关键帧图片和音频文本内容匹配一致性映射关系;
生成步骤,用于根据新索引的关键帧图片和音频文本内容匹配一致性映射关系生成绘本模式。
在本发明提供的电子绘本的生成方法中,所述匹配步骤包括:通过视频模型算法对所述关键帧图片索引文件进行处理得到与所述关键帧图片对应的n组关键帧图片序号,通过音频模型算法对所述音频文本内容索引文件进行处理得到与所述音频文本内容对应的n组音频文本内容序号;将每一组所述关键帧图片序号与每一组所述音频文本内容序号进行匹配;生成对应新索引的所述关键帧图片序号与所述音频文本内容序号匹配一致性映射关系。
在本发明提供的电子绘本的生成方法中,所述匹配步骤还包括:根据视频模型算法对所述关键帧图片进行处理生成与所述关键帧图片序号对应的关键帧图片索引表,根据音频模型算法对所述音频文本内容进行处理生成与所述音频文本内容序号对应的音频文本内容索引表,将所述关键帧图片索引表与所述音频文本内容索引表进行匹配,生成对应新索引的所述关键帧图片索引表与所述音频文本内容索引表匹配一致性映射关系。
在本发明提供的电子绘本的生成方法中,所述关键帧图片索引表包括图片序号、关键帧图片对应的时间信息与图片标签,所述音频文本内容索引表包括音频序号、音频文本内容对应的时间信息与内容标签。
根据本发明的另一方面,还提供一种电子绘本的生成系统,包括本地数据处理系统、云端数据处理系统与用户端,所述用户端分别与所述本地数据处理系统、云端数据处理系统通信连接;所述本地数据处理系统与所述云端数据处理系统用于对获取音视频中的关键帧图片特征库与音频文本内容特征库进行采集分析以获得关键帧图片索引文件与音频文本内容索引文件,并对存储于所述本地数据处理系统与所述云端数据处理系统中的关键帧图片索引文件与音频文本内容索引文件进行匹配;生成对应新索引的关键帧图片和音频文本内容匹配一致性映射关系;根据新索引的关键帧图片和音频文本内容匹配一致性映射关系生成绘本模式;所述用户端用于开启所述本地数据处理系统与所述云端数据处理系统中的的关键帧图片特征库与音频文本内容特征库的内容后,进行绘本模式结果的获取、存储与播放。
在本发明提供的电子绘本的生成系统中,所述本地数据处理系统包括本地音视频特征库模块、本地存储模块、本地运算模块与本地数据同步模块,所述本地音视频特征库模块用于提供视频模型算法与音频模型算法的参数信息,将视频模型算法的参数信息与音频模型算法的参数信息发送至所述本地运算模块,所述本地运算模块通过视频模型算法的参数信息与音频模型算法的参数信息对音视频进行处理,生成关键帧图片、音频文本内容、关键帧图片索引表与音频文本内容索引表,并将生成的所述关键帧图片、所述音频文本内容、所述关键帧图片索引表与所述音频文本内容索引表分别发送至存储模块,所述本地存储模块用于存储所述关键帧图片、音频文本内容、关键帧图片索引表与音频文本内容索引表,所述本地数据同步模块用于更新所述本地音视频特征库模块中视频模型算法与音频模型算法的参数信息,同时同步上传存储于存储模块中关键帧图片索引表与所述音频文本内容索引表的信息以及运算模块的请求。
在本发明提供的电子绘本的生成系统中,所述云端数据处理系统包括云端音视频特征库模块、云端存储模块、云端运算模块与云端数据同步模块,所述云端音视频特征库模块获取关键帧图片特征库与音频文本内容特征库,以便于所述本地音视频特征库模块中视频模型算法与音频模型算法的参数信息同步更新,所述云端存储模块用于存储所述关键帧图片、音频文本内容、关键帧图片索引表与音频文本内容索引表,所述云端同步模块用于将存储所述云端存储模块的关键帧图片特征库与音频文本内容特征库或存储本存储模块的关键帧图片特征库与音频文本内容特征库同步上传于所述云端数据处理系统中,并转发到所述云端存储模块中备份保存。
在本发明提供的电子绘本的生成系统中,所述视频模型算法的参数信息包括关键帧图片提取的运算方法、关键帧获取速度、关键帧图片清晰度大小等模型参数,所述关键帧图片提取的运算方法、关键帧获取速度、关键帧图片清晰度大小模型参数存储于所述本地存储模块与云端存储模块,所述音频模型算法的参数信息包括音频文本的运算方法与音频内容获取速度模型参数。
在本发明提供的电子绘本的生成系统中,所述用户端包括接口模块,所述用户端通过接口模块获取存储模块中的关键帧图片特征库与音频文本内容特征库的内容。
实施本发明实施例,具有如下有益效果:通过建立关键帧图片与音频文本内容的对应关系,将关键帧图片索引文件与音频文本内容索引文件进行匹配;生成对应新索引的关键帧图片和音频文本内容匹配一致性映射关系;依据匹配一致性映射关系关键帧图片与音频文本内容同步播放。同时,通过本地数据处理系统实现对本地音视频特征库中关键帧图片与音频文本内容数据的采集、计算、存储、播放等功能,云端数据处理系统实现对云端音视频特征库中关键帧图片与音频文本内容数据的采集、少量数据计算、短期数据存储等功能。该云端数据处理系统有效的解决了因用户端占用存储空间过大,而导致本地数据处理系统运算速度降低的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1所示是本发明一实施例提供的电子绘本的播放方法的流程示意图;
图2所示是本发明一实施例提供的电子绘本的生成方法的流程示意图;
图3所示是本发明一实施例提供的电子绘本的匹配步骤的流程示意图;
图4所示是本发明一实施例提供的电子绘本的生成系统的原理框图;
图5所示是本发明一实施例提供的电子绘本的生成方法中关键帧图片序号与音频文本内容序号匹配参考图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1所示是本发明一实施例提供的电子绘本的播放方法的流程示意图。
如图1所示,本发明提供的电子绘本的播放方法。播放方法包括:
在步骤101中;获取音视频中关键帧图片特征库与音频文本内容特征库;关键帧图片特征库包括键帧图片索引文件,音频文本内容特征库包括音频文本内容索引文件;
在步骤102中;将关键帧图片索引文件与音频文本内容索引文件进行匹配;
在步骤103中;生成对应新索引的关键帧图片和音频文本内容匹配一致性映射关系;
在步骤104中;依据新索引的关键帧图片和音频文本内容匹配一致性映射关系同步播放关键帧图片与音频文本内容。
如图2所示,基于同一发明构思,本发明还提供一种电子绘本的生成方法,生成方法包括如下步骤S1-S3:
S1、获取步骤,用于获取音视频中关键帧图片特征库与音频文本内容特征库,通过对关键帧图片特征库进行视频模型算法处理生成关键帧图片索引文件,通过对音频内容特征库进行音频模型算法处理生成音频文本内容索引文件;
S2、匹配步骤,用于将关键帧图片索引文件与音频文本内容索引文件进行匹配;生成对应新索引的关键帧图片和音频文本内容匹配一致性映射关系;
S3、生成步骤,用于根据新索引的关键帧图片和音频文本内容匹配一致性映射关系生成绘本模式。
如图3所示,S2包括下子步骤S21-S23:
S21、通过视频模型算法对关键帧图片索引文件进行处理得到与关键帧图片对应的n组关键帧图片序号,通过音频模型算法对音频文本内容索引文件进行处理得到与音频文本内容对应的n组音频文本内容序号;
S22、将每一组关键帧图片序号与每一组音频文本内容序号进行匹配;
S23、生成对应新索引的关键帧图片序号与音频文本内容序号匹配一致性映射关系。
具体地,在本发明一实施例中,S2还包括以下子步骤S24-S26:
S24、根据视频模型算法对关键帧图片进行处理生成与关键帧图片序号对应的关键帧图片索引表,根据音频模型算法对音频文本内容进行处理生成与音频文本内容序号对应的音频文本内容索引表;
S25、将关键帧图片索引表与音频文本内容索引表进行匹配;
S26、生成对应新索引的关键帧图片索引表与音频文本内容索引表匹配一致性映射关系。
在本发明提供的电子绘本的生成方法中,关键帧图片索引表包括图片序号、关键帧图片对应的时间信息与图片标签,音频文本内容索引表包括音频序号、音频文本内容对应的时间信息与内容标签。
如图4所示,基于同一发明构思,本发明还提供一种电子绘本的生成系统包括本地数据处理系统、云端数据处理系统与用户端,用户端分别与本地数据处理系统、云端数据处理系统通信连接;本地数据处理系统与云端数据处理系统用于对获取音视频中的关键帧图片特征库与音频文本内容特征库进行采集分析以获得关键帧图片索引文件与音频文本内容索引文件,并对存储于本地数据处理系统与云端数据处理系统中的关键帧图片索引文件与音频文本内容索引文件进行匹配;生成对应新索引的关键帧图片和音频文本内容匹配一致性映射关系;根据新索引的关键帧图片和音频文本内容匹配一致性映射关系生成绘本模式;用户端用于开启本地数据处理系统与云端数据处理系统中的的关键帧图片特征库与音频文本内容特征库的内容后,进行绘本模式结果的获取、存储与播放。
具体地,本地数据处理系统包括本地音视频特征库模块、本地存储模块、本地运算模块与本地数据同步模块,本地音视频特征库模块用于提供视频模型算法与音频模型算法的参数信息,将视频模型算法的参数信息与音频模型算法的参数信息发送至本地运算模块,本地运算模块通过视频模型算法的参数信息与音频模型算法的参数信息对音视频进行处理,生成关键帧图片、音频文本内容、关键帧图片索引表与音频文本内容索引表,并将生成的关键帧图片、音频文本内容、关键帧图片索引表与音频文本内容索引表分别发送至存储模块,本地存储模块用于存储关键帧图片、音频文本内容、关键帧图片索引表与音频文本内容索引表,本地数据同步模块用于更新本地音视频特征库模块中视频模型算法与音频模型算法的参数信息,同时同步上传存储于存储模块中关键帧图片索引表与音频文本内容索引表的信息以及运算模块的请求。本地运算模块通过获取视频模型算法的参数信息与音频模型算法的参数信息将关键帧图片、音频文本内容,分析建立关键帧图片索引表与音频文本内容索引表的索引关系,实现关键帧图片、音频文本内容的分离和映射关系。
具体地,云端数据处理系统包括云端音视频特征库模块、云端存储模块、云端运算模块与云端数据同步模块,云端音视频特征库模块获取关键帧图片特征库与音频文本内容特征库,以便于本地音视频特征库模块中视频模型算法与音频模型算法的参数信息同步更新,云端存储模块用于存储关键帧图片、音频文本内容、关键帧图片索引表与音频文本内容索引表,云端同步模块用于将存储云端存储模块的关键帧图片特征库与音频文本内容特征库或存储本存储模块的关键帧图片特征库与音频文本内容特征库同步上传于云端数据处理系统中,并转发到云端存储模块中备份保存。
进一步地,视频模型算法的参数信息包括关键帧图片提取的运算方法、关键帧获取速度、关键帧图片清晰度大小等模型参数,关键帧图片提取的运算方法、关键帧获取速度、关键帧图片清晰度大小等模型参数存储于本地存储模块与云端存储模块,音频模型算法的参数信息包括音频文本的运算方法与音频内容获取速度等模型参数。
进一步地,用户端包括接口模块,用户端通过接口模块获取存储模块中的关键帧图片特征库与音频文本内容特征库的内容。用户端安装有应用程序,通过户端安装有应用程序开启本地数据处理系统、云端数据处理系统,进行关键帧图片、音频文本内容的索引结果的获取、存储、播放等相关数据内容。接口模块接受用户端的应用程序的请求并调用初始化的各关键帧图片特征库与音频文本内容特征库的可访问功能参数的同时将音视频内容发送给接口模块处理。应用程序再通过接口模块获取访问存储模块的生成的关键帧图片与音频文本内容,并执行相应播放等动作指令。同时,用户端也可以通过程序应用通过接口模块对关键帧图片、音频文本内容的索引关系表的结果进行修订,可以解决因部分识别场景偏差可以通过人工识别校准,用户端也可以直接自己建立关键帧图片、音频文本内容的索引关系表的时间匹配索引关系,系统就人工建立的索引关系进行存储播放。
该电子绘本的生成方法、系统和电子绘本的播放方法的一实例如下:
接口模块用于接收用户通过用户端发出的操作请求,同时将音视频内容的相关信息及模式生成的初始化模型参数发送给存储模块、本地运算模块与云端运算处理。其中,音视频内容的相关信息包括音视频的名称、存储位置等,初始化模型参数信息包括生成关键帧图片特征库的清晰图(1080P)、播放速率(1倍)、播放模式(自动翻页)。因此,用户设置本次生成绘本为本地视频A,时长为3分钟,并选择参数为清晰度1080P、播放速度1倍、自动翻页模式。
本地存储模块、本地运算模块与云端运算接收到接口模块发送的请求参数,调用本地音视频特征库模块中的视频模型算法与音频模型算法的参数信息,通过视频模型算法与音频模型算法生成关键帧图片、音频文本内容的索引关系表。
如图5所示,生成的关键帧图片索引表结果分别如下:
关键帧图片序号1、索引A1、开始时间0.3min、图片标签的内容为猫、老鼠、厨房;关键帧图片序号2、索引A2、开始时间1min、图片标签的内容为猫、老鼠、草地;关键帧图片序号3、索引A3、开始时间3.5min、图片标签的内容为猫、老鼠、大树;依次类推,本次视频索引生成20个索引结果,索引从A1到A20。
生成的音频文本内容索引表结果分别分别如下:
音频序号1、索引B1、开始时间0.5min、内容标签为猫、老鼠、厨房;音频序号2、索引B2、开始时间1.5min、视频内容为猫、老鼠、室外;音频序号3、索引B3、开始时间4min、内容标签为猫、老鼠、爬山;依次类推,本次视频索引生成20个索引结果,索引从B1到B20。
生成的关键帧图片与音频文本内容的映射关系结果分别为关键帧图片序号1、索引A1、索引B1;键帧图片序号2、索引A2、索引B2;键帧图片序号3、索引A3、索引B3;依次类推,本次视频、音频映射索引生成20个索引映射关系。
因此,用户通过使用的用户端,根据生成关键帧图片和音频文本内容一致性的索引关系,进行翻页、暂停、关闭等播放控制操作,完成电子绘本模式的播放体验。因为关键帧图片特征库与音频文本内容特征库生成索引的结果存在一定偏差准确性问题,所以系统支持通过人工调整索引关系进行处理。因此,该电子绘本的生成方法、系统和电子绘本的播放方法的另一实例如下:
通过本地存储模块、本地运算模块与云端运算模块接收到用户端接口模块发送的请求参数,调用本地音视频特征库模块中的视频模型算法与音频模型算法的参数信息,通过视频模型算法与音频模型算法生成关键帧图片、音频文本内容的索引关系表。
如图5所示,生成的关键帧图片索引表结果分别如下:
关键帧图片序号1、索引A1、开始时间0.3min、视频内容为猫、老鼠、厨房;关键帧图片序号2、索引A2、开始时间1min、视频内容为猫、老鼠、草地;关键帧图片序号3、索引A3、开始时间3.5min、视频内容为猫、老鼠、大树;依次类推,本次音视频索引生成20个索引结果,索引从A1到A20。
生成的音频文本内容索引表结果分别分别如下:
音频序号1、索引B1、开始时间0.5min、视频内容为猫、老鼠、厨房;音频序号2、索引B2、开始时间1.5min、视频内容为猫、老鼠、室外;音频序号3、索引B3、开始时间4min、视频内容为猫、老鼠、爬山;依次类推,本次视频索引生成20个索引结果,索引从B1到B20。
生成的关键帧图片与音频文本内容的映射关系结果,分别为序号1、索引A1、索引B1;序号2、索引A2、索引B2;序号2、索引A3、索引B3;依次类推,本次视频、音频映射索引生成20个索引映射关系。
用户使用的用户端的应用程序作为本地控制管理模块,播放发现部分视频页面同音频内容存在不一致性。因此,用户可以通过用户端的应用程序对索引关系在播放器界面进行调整,修正为正确的索引时间关系。例如,系统生成上述的索引关系B2的时间进度不正确,可以调整为“序号2、索引B2、开始时间为1.8min”。系统后续按照新的索引B2设定的数值进行匹配处理。
需要指出的是,上文对各种模块的描述中,分割成这些模块,是为了说明清楚。然而,在实际实施中,各种模块的界限可以是模糊的。例如,本文中的任意或所有功能性模块可以共享各种硬件和/或软件元件。又例如,本文中的任何和/或所有功能模块可以由共有的处理器执行软件指令来全部或部分实施。另外,由一个或多个处理器执行的各种软件子模块可以在各种软件模块间共享。相应地,除非明确要求,本发明的范围不受各种硬件和/或软件元件间强制性界限的限制。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (10)

1.一种电子绘本的播放方法,其特征在于,所述播放方法包括:
获取音视频中关键帧图片特征库与音频文本内容特征库;所述关键帧图片特征库包括键帧图片索引文件,所述音频文本内容特征库包括音频文本内容索引文件;
将所述关键帧图片索引文件与所述音频文本内容索引文件进行匹配;
生成对应新索引的关键帧图片和音频文本内容匹配一致性映射关系;
依据新索引的关键帧图片和音频文本内容匹配一致性映射关系同步播放所述关键帧图片与所述音频文本内容。
2.一种电子绘本的生成方法,其特征在于,所述生成方法包括如下步骤:
获取步骤,用于获取音视频中关键帧图片特征库与音频文本内容特征库,通过对所述关键帧图片特征库进行视频模型算法处理生成关键帧图片索引文件,通过对所述音频内容特征库进行音频模型算法处理生成音频文本内容索引文件;
匹配步骤,用于将所述关键帧图片索引文件与音频文本内容索引文件进行匹配;生成对应新索引的关键帧图片和音频文本内容匹配一致性映射关系;
生成步骤,用于根据新索引的关键帧图片和音频文本内容匹配一致性映射关系生成绘本模式。
3.根据权利要求2所述的电子绘本的生成方法,其特征在于,所述匹配步骤包括:
通过视频模型算法对所述关键帧图片索引文件进行处理得到与所述关键帧图片对应的n组关键帧图片序号,通过音频模型算法对所述音频文本内容索引文件进行处理得到与所述音频文本内容对应的n组音频文本内容序号;
将每一组所述关键帧图片序号与每一组所述音频文本内容序号进行匹配;
生成对应新索引的所述关键帧图片序号与所述音频文本内容序号匹配一致性映射关系。
4.根据权利要求3所述的电子绘本的生成方法,其特征在于,所述匹配步骤还包括:
根据视频模型算法对所述关键帧图片进行处理生成与所述关键帧图片序号对应的关键帧图片索引表,根据音频模型算法对所述音频文本内容进行处理生成与所述音频文本内容序号对应的音频文本内容索引表,将所述关键帧图片索引表与所述音频文本内容索引表进行匹配,生成对应新索引的所述关键帧图片索引表与所述音频文本内容索引表匹配一致性映射关系。
5.根据权利要求4所述的电子绘本的生成方法,其特征在于,所述关键帧图片索引表包括图片序号、关键帧图片对应的时间信息与图片标签,所述音频文本内容索引表包括音频序号、音频文本内容对应的时间信息与内容标签。
6.一种电子绘本的生成系统,其特征在于,所述生成系统包括:本地数据处理系统、云端数据处理系统与用户端,所述用户端分别与所述本地数据处理系统、云端数据处理系统通信连接;
所述本地数据处理系统与所述云端数据处理系统用于对获取音视频中的关键帧图片特征库与音频文本内容特征库进行采集分析以获得关键帧图片索引文件与音频文本内容索引文件,并对存储于所述本地数据处理系统与所述云端数据处理系统中的关键帧图片索引文件与音频文本内容索引文件进行匹配;生成对应新索引的关键帧图片和音频文本内容匹配一致性映射关系;根据新索引的关键帧图片和音频文本内容匹配一致性映射关系生成绘本模式;
所述用户端用于开启所述本地数据处理系统与所述云端数据处理系统中的的关键帧图片特征库与音频文本内容特征库的内容后,进行绘本模式结果的获取、存储与播放。
7.根据权利要求6所述的电子绘本的生成系统,其特征在于,所述本地数据处理系统包括本地音视频特征库模块、本地存储模块、本地运算模块与本地数据同步模块,所述本地音视频特征库模块用于提供视频模型算法与音频模型算法的参数信息,将视频模型算法的参数信息与音频模型算法的参数信息发送至所述本地运算模块,所述本地运算模块通过视频模型算法的参数信息与音频模型算法的参数信息对音视频进行处理,生成关键帧图片、音频文本内容、关键帧图片索引表与音频文本内容索引表,并将生成的所述关键帧图片、所述音频文本内容、所述关键帧图片索引表与所述音频文本内容索引表分别发送至存储模块,所述本地存储模块用于存储所述关键帧图片、音频文本内容、关键帧图片索引表与音频文本内容索引表,所述本地数据同步模块用于更新所述本地音视频特征库模块中视频模型算法与音频模型算法的参数信息,同时同步上传存储于存储模块中关键帧图片索引表与所述音频文本内容索引表的信息以及运算模块的请求。
8.根据权利要求6所述的电子绘本的生成系统,其特征在于,所述云端数据处理系统包括云端音视频特征库模块、云端存储模块、云端运算模块与云端数据同步模块,所述云端音视频特征库模块获取关键帧图片特征库与音频文本内容特征库,以便于所述本地音视频特征库模块中视频模型算法与音频模型算法的参数信息同步更新,所述云端存储模块用于存储所述关键帧图片、音频文本内容、关键帧图片索引表与音频文本内容索引表,所述云端同步模块用于将存储所述云端存储模块的关键帧图片特征库与音频文本内容特征库或存储本存储模块的关键帧图片特征库与音频文本内容特征库同步上传于所述云端数据处理系统中,并转发到所述云端存储模块中备份保存。
9.根据权利要求7所述的电子绘本的生成系统,其特征在于,所述视频模型算法的参数信息包括关键帧图片提取的运算方法、关键帧获取速度、关键帧图片清晰度大小模型参数,所述关键帧图片提取的运算方法、关键帧获取速度、关键帧图片清晰度大小等模型参数存储于所述本地存储模块与所述云端存储模块,所述音频模型算法的参数信息包括音频文本的运算方法与音频内容获取速度模型参数。
10.根据权利要求6所述的电子绘本的生成系统,其特征在于,所述用户端包括接口模块,所述用户端通过接口模块获取存储模块中的所述关键帧图片特征库与所述音频文本内容特征库的内容。
CN202110972326.0A 2021-08-24 2021-08-24 一种电子绘本的生成方法、系统和电子绘本的播放方法 Pending CN113784190A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110972326.0A CN113784190A (zh) 2021-08-24 2021-08-24 一种电子绘本的生成方法、系统和电子绘本的播放方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110972326.0A CN113784190A (zh) 2021-08-24 2021-08-24 一种电子绘本的生成方法、系统和电子绘本的播放方法

Publications (1)

Publication Number Publication Date
CN113784190A true CN113784190A (zh) 2021-12-10

Family

ID=78838698

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110972326.0A Pending CN113784190A (zh) 2021-08-24 2021-08-24 一种电子绘本的生成方法、系统和电子绘本的播放方法

Country Status (1)

Country Link
CN (1) CN113784190A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1741004A (zh) * 2004-08-23 2006-03-01 微软公司 关联便携式通信设备中的内容类型的系统和方法
CN101174448A (zh) * 2007-12-10 2008-05-07 北京炬力北方微电子有限公司 有声图片播放方法、装置和有声图片索引文件生成方法
US20080120546A1 (en) * 2006-11-21 2008-05-22 Mediaplatform On-Demand, Inc. System and method for creating interactive digital audio, video and synchronized media presentations
US20120257876A1 (en) * 2011-04-07 2012-10-11 Infosys Technologies, Ltd. Method and system for generating at least one of: comic strips and storyboards from videos
US20150310107A1 (en) * 2014-04-24 2015-10-29 Shadi A. Alhakimi Video and audio content search engine
CN111367870A (zh) * 2018-12-25 2020-07-03 深圳市优必选科技有限公司 一种绘本共享方法、装置和系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1741004A (zh) * 2004-08-23 2006-03-01 微软公司 关联便携式通信设备中的内容类型的系统和方法
US20080120546A1 (en) * 2006-11-21 2008-05-22 Mediaplatform On-Demand, Inc. System and method for creating interactive digital audio, video and synchronized media presentations
CN101174448A (zh) * 2007-12-10 2008-05-07 北京炬力北方微电子有限公司 有声图片播放方法、装置和有声图片索引文件生成方法
US20120257876A1 (en) * 2011-04-07 2012-10-11 Infosys Technologies, Ltd. Method and system for generating at least one of: comic strips and storyboards from videos
US20150310107A1 (en) * 2014-04-24 2015-10-29 Shadi A. Alhakimi Video and audio content search engine
CN111367870A (zh) * 2018-12-25 2020-07-03 深圳市优必选科技有限公司 一种绘本共享方法、装置和系统

Similar Documents

Publication Publication Date Title
CN105812920B (zh) 媒体信息处理方法及媒体信息处理装置
CN108960889B (zh) 房屋虚拟三维空间中语音讲房进度控制方法及装置
EP3055793A1 (en) Systems and methods for adding descriptive metadata to digital content
CN103604271A (zh) 一种基于智能冰箱的食品识别方法
CN104281847A (zh) 一种点读方法、装置及设备
CN111062276A (zh) 基于人机交互的人体姿态推荐方法、装置、机器可读介质及设备
CN107861750B (zh) 一种标签管理方法、标签管理装置及智能终端
WO2022166897A1 (zh) 脸型调整图像生成方法、模型训练方法、装置和设备
WO2023045635A1 (zh) 多媒体文件的字幕处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品
CN113055709B (zh) 视频发布方法、装置、设备、存储介质及程序产品
CN108319641A (zh) 菜品信息录入方法及装置
US9195896B2 (en) Methods and systems for image recognition
CN111210487A (zh) 图案生成方法和系统
CN112785488A (zh) 一种图像处理方法、装置、存储介质及终端
CN113132780A (zh) 一种视频合成的方法、装置、电子设备及可读存储介质
CN111143590A (zh) 图像过滤方法、系统、设备及机器可读介质
CN114170472A (zh) 图像处理方法、可读存储介质及计算机终端
CN113094801A (zh) 装修模拟图像生成方法、装置、设备及介质
CN113784190A (zh) 一种电子绘本的生成方法、系统和电子绘本的播放方法
CN105187860B (zh) 获取数字电视节目数据库的系统及方法
CN107995538B (zh) 视频批注方法及系统
CN111383289A (zh) 图像处理方法、装置、终端设备及计算机可读存储介质
CN106803285B (zh) 一种ar图书自定义定向生成方法及装置
CN110673737B (zh) 基于智能家居操作系统的显示内容的调整方法及装置
CN107450947A (zh) 启动应用的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination