CN116347134A

CN116347134A - 基于人工智能教学课堂的机顶盒音频处理系统及其方法

Info

Publication number: CN116347134A
Application number: CN202310316144.7A
Authority: CN
Inventors: 汤代佳; 毛冠军; 王伟国; 徐志杰; 宋志朋
Original assignee: Shenzhen United Information Technology Co ltd
Current assignee: Shenzhen United Information Technology Co ltd
Priority date: 2023-03-29
Filing date: 2023-03-29
Publication date: 2023-06-27
Anticipated expiration: 2043-03-29
Also published as: CN116347134B

Abstract

本发明公开了基于人工智能教学课堂的机顶盒音频处理系统及其方法，属于音频处理技术领域。为解决语音处理较慢以及需要进行板书的问题，分段子模块可以根据关键帧对音频进行分段化处理，从而在系统录入较长的音频时，可以根据其中的关键帧将较长的语音进行分段化处理，从而可以有效的对音频中的关键性词语进行提取，提高后续对音频的识别和读取效率，语义判定子模块及文字区分子模块可以对录入的长音频进行自动的识别，对控制性的语句进行挑出并执行，对于展示性的语句进行重新排版和展示，使得教师可以在进行授课的同时由系统自动在显示屏上对内容进行自动排版和展示，根据教师所说的内容智能识别出控制指令和板书内容，提高效率。

Description

基于人工智能教学课堂的机顶盒音频处理系统及其方法

技术领域

本发明涉及音频处理技术领域，特别涉及基于人工智能教学课堂的机顶盒音频处理系统及其方法。

背景技术

市面上的音频设备中通常都设置有人工智能系统，使用者可通过用声音发出指令，从而完成与音频设备之间的对话以及控制音频设备，操作起来十分方便，且音频设备也可通过连接线，与手机电脑等主机设备进行连接，从而间接播放音频。

已有相关专利，比如公开号CN113938776A 公开了一种基于人工智能的音频处理系统及其实施方法，该专利采用清理装置设置在安装内槽中，安装内槽与连接接口之间呈相连通设置，解决了当清理装置被启动后，电机带动齿轮进行转动，使得带动组件带动推动圆柱向前运动，刷毛垫旋转清理连接接口的内腔的问题，操作者将主机和连接接口之间通过连接线连接后，导电模块则会将电信号发送给断电检测模块，解决了断电检测模块检测是否断电的问题。

上述专利其实在实际的操作中还存在以下问题：

1、在教师利用语音指令对多媒体教学设备进行控制时，往往可能因为语音指令的长度导致系统响应速度较慢，影响教学效果。

2、在运用多媒体进行教学时，往往还是不可避免的需要进行一定的板书，教师需要一边讲解一边板书，没有对智能多媒体教学做到充分的利用。

发明内容

本发明的目的在于提供基于人工智能教学课堂的机顶盒音频处理系统及其方法，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：基于人工智能教学课堂的机顶盒音频处理系统，包括：

音频捕捉单元，用于对音频数据信息进行采集捕捉；

音频处理单元，用于对音频捕捉单元所捕捉的音频数据进行处理；

遥控接收模块，用于对遥控指令进行接收；

主控模块，用于根据音频处理单元的处理结果或遥控接收模块所接收到的控制指令进行；

多媒体展示单元，用于对教学用音频、视频及文档数据文件进行展示；

无线传输单元，无线传输单元通过与无线网络连接实现与云端共享单元的无线连接，用于对机顶盒音频处理系统内的音频、视频及文档数据文件进行多终端及云端之间的无线传输；

云端共享单元，用于对音频、视频及文档数据文件进行云端分类储存。

进一步的，所述音频处理单元包括：

音频缓存模块，用于对音频捕捉单元所采集捕捉的音频进行快速缓存和调取；

音频处理模块，用于对音频缓存模块内快速缓存的音频进行分段处理；

智能识别模块，用于对音频处理模块所处理的音频进行分段识别，并对分段识别的音频进行文字化处理，生成分段式文字；

智能匹配模块，用于结合智能语库模块并对智能识别模块所识别的分段式指令文字进行匹配，并区分指令型音频文字和展示型音频文字；

智能语库模块，用于生成语库并对智能指令语言进行存储。

进一步的，所述音频处理模块包括：

分段子模块，用于对音频进行分段处理，在进行分段处理时对音频进行关键帧识别，所述关键帧包括动词关键帧、名词关键帧及辅助关键帧，音频根据关键帧的数量进行音频段分割，每个音频段内至少含有一个关键帧；

规则子模块，用于对关键帧的识别规则进行存储，分段子模块进行关键帧识别时引用规则子模块内部的识别规则；

排序子模块，用于对分段子模块所分割的音频段进行排序。

进一步的，所述智能匹配模块包括：

语义判定子模块，用于结合智能语库模块对音频中不同的音频段进行语义判定，进行语义判定时根据关键帧的内容进行匹配判定；

文字区分子模块，用于根据语义判定子模块的判断结果，对音频中的指令型音频文字和展示型音频文字进行区分，指令型音频文字用于主控模块进行识别，并于识别后根据指令型音频文字的内容进行控制指令执行，展示型音频文字用于展示排版子模块进行文字排版，并于排版后通过多媒体展示单元进行展示；

展示排版子模块，用于对文字区分子模块所区分出的展示型文字进行展示预排版，根据展示型文字中音频段的关键帧进行分段优化。

进一步的，所述主控模块包括：

指令处理模块，用于对音频处理单元的处理结果或遥控接收模块所接收到的控制指令进行接收处理；

控制执行模块，用于根据指令处理模块所处理完成的控制指令进行执行，并通过与多媒体展示单元交互实现人工智能课堂教学。

进一步的，所述多媒体展示单元包括：

音频展示模块，用于根据主控模块的控制指令对相应的音频数据进行多媒体展示；

视频展示模块，用于根据主控模块的控制指令对相应的视频数据进行多媒体展示；

文档展示模块，用于根据主控模块的控制指令对相应的文档数据进行多媒体展示。

进一步的，所述云端共享单元包括：

云端数据库，用于将接收到的数据流组依据数据流标签进行分类并云端储存；

数据处理模块，用于将分类储存的数据依据流属性信息和数据内容进行分组，并分类标记，所述分组包括音频数据集、视频数据集和文档数据集；

数据检索模块，用于对云端数据库内部储存的数据进行检索；

云端传输模块，用于与互联网交互，并对云端数据库与机顶盒之间进行文件数据的交互传递。

进一步的，所述无线传输单元包括调节模块，用于：

确定终端及云端之间的待传输数据，并将待传输数据分成若干个数据块：

确定每个数据块的类型，并根据类型查询预设的传输顺序表，确定传输顺序，基于传输顺序对若干个数据块进行传输；

在传输过程中，将第一个传输的数据库块作为关键数据块，将第二个传输的数据块作为待调节目标数据块；

确定关键数据块的传输情况及传输信道信息；

根据关键数据块的传输情况及传输信道信息生成对待调节目标数据块的传输速率的调节指令，并对待调节目标数据块进行调节；

基于调节后的待调节目标数据块的传输情况及传输信道信息，生成对第三个传输的数据块的调节指令，重复迭代，直至完成对最后传输的数据块的调节；

根据关键数据块的传输情况及传输信道信息生成对待调节目标数据块的传输速率的调节指令，并对待调节目标数据块进行调节，包括：

确定待调节目标数据块在t时刻的传输速率

；构建理想传输速率函数：

其中，

根据理想传输速率函数得到的待调节目标数据块在t时刻的传输速率；/>

为当前传输通道的最大传输速率；/>

为预设的当前传输通道的安全距离；

为t时刻待调节目标数据块与关键数据块之间的距离；/>

为预设的对待调节目标数据块的调节时间，一般预设为0.1s；

计算对待调节目标数据块的传输速率的控制加速度因子：

其中， />

为在t时刻时对待调节目标数据块的传输速率的控制加速度因子；/>

为对待调节目标数据块的预设理想传输速率调节系数，取值区间为/>

；/>

为对待调节目标数据块的预设安全控制系数，取值区间为/>

；/>

为关键数据块在t时刻的传输速率；/>

为预设记忆传输速率控制系数，取值区间为/>

；/>

为根据理想传输速率函数得到的待调节目标数据块在t-1时刻时的传输速率；

计算待调节目标数据块在t+1时刻的传输速率

；/>

其中，T为预设的时间间距；生成将待调节目标数据块的传输速率调节至/>

的调节指令，并对待调节目标数据块进行调节。

进一步的，还包括：检测模块，用于：检测云端传输模块对云端数据库与机顶盒之间进行文件数据的交互传递时，文件数据的信号波动系数：

其中，

为文件数据的信号波动系数；/>

为文件数据在第/>

个编码单元中的信号最大值；/>

为文件数据在传输过程中的编码单元的数量；/>

；

将所述信号波动系数与预设信号波动系数进行比较，在确定信号波动系数大于预设信号波动系数时，发出报警提示。

本发明要解决的另一技术问题是提供基于人工智能教学课堂的机顶盒音频处理的方法，包括如下步骤：

步骤一：音频捕捉单元接收课堂教学人员的语音音频，音频处理模块根据语音音频中的关键帧对音频进行分段处理，智能匹配模块对分段化后的音频进行语义判定，区分指令型音频文字和展示型音频文字；

步骤二：文字区分子模块对指令型音频文字和展示型音频文字进行区分，区分出的指令型音频文字通过主控模块进行控制指令转化并对系统整体进行控制，区分出的展示型音频文字通过展示排版子模块展示；

步骤三：展示排版子模块对展示型音频文字进行分段优化预排版，多媒体展示单元连接显示设备对预排版后的展示型音频文字进行多媒体展示。

与现有技术相比，本发明的有益效果是：

1.现有技术下，在教师利用语音指令对多媒体教学设备进行控制时，往往可能因为语音指令的长度导致系统响应速度较慢，影响教学效果，而本发明的分段子模块可以根据关键帧对音频进行分段化处理，从而在系统录入较长的音频时，可以根据其中的动词关键帧、名词关键帧及辅助关键帧将较长的语音进行分段化处理，从而可以有效的对音频中的关键性词语进行提取，提高后续对音频的识别和读取效率，从而提高了系统整体对音频的识别出理速度，提高课堂教学的效果。

2.现有技术下，在运用多媒体进行教学时，往往还是不可避免的需要进行一定的板书，教师需要一边讲解一边板书，没有对智能多媒体教学做到充分的利用，而本发明的语义判定子模块及文字区分子模块可以对录入的长音频进行自动的识别，对控制性的语句进行挑出并执行，对于其他的展示性的语句可以通过展示排版子模块进行重新排版和展示，使得教师可以在进行授课的同时由系统自动在显示屏上对教师所说的内容进行自动排版和展示，无需进行手动的板书，根据教师所说的内容智能识别出控制指令和板书内容，提高课堂教育效率。

附图说明

图1为本发明的系统整体模块示意图；

图2为本发明的音频处理单元模块示意图。

实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1，基于人工智能教学课堂的机顶盒音频处理系统，包括：

音频捕捉单元，用于对音频数据信息进行采集捕捉；

遥控接收模块，用于对遥控指令进行接收；

具体的，音频捕捉单元接收课堂教学人员的语音音频，音频处理单元根据语音音频中的关键帧对音频进行分段处理并对分段化后的音频进行语义判定，区分指令型音频文字和展示型音频文字，对于区分出的指令型音频文字和展示型音频文字，区分出的指令型音频文字通过主控模块进行控制指令转化并对系统整体进行控制，区分出的展示型音频文字通过多媒体展示单元连接显示设备对预排版后的展示型音频文字进行多媒体展示。

为了解决在教师利用语音指令对多媒体教学设备进行控制时，往往可能因为语音指令的长度导致系统响应速度较慢，影响教学效果，同时在运用多媒体进行教学时，往往还是不可避免的需要进行一定的板书，教师需要一边讲解一边板书，没有对智能多媒体教学做到充分的利用的技术问题，请参阅图1-2，本发明提供以下技术方案：

音频处理单元包括：

智能语库模块，用于生成语库并对智能指令语言进行存储。

音频处理模块包括：

排序子模块，用于对分段子模块所分割的音频段进行排序。

具体的，分段子模块可以根据关键帧对音频进行分段化处理，从而在系统录入较长的音频时，可以根据其中的动词关键帧、名词关键帧及辅助关键帧将较长的语音进行分段化处理，从而可以有效的对音频中的关键性词语进行提取，提高后续对音频的识别和读取效率，从而提高了系统整体对音频的识别出理速度，提高课堂教学的效果。

智能匹配模块包括：

具体的，语义判定子模块及文字区分子模块的设置可以对录入的长音频进行自动的识别，对控制性的语句进行挑出并执行，对于其他的展示性的语句可以通过展示排版子模块进行重新排版和展示，使得教师可以在进行授课的同时由系统自动在显示屏上对教师所说的内容进行自动排版和展示，无需进行手动的板书，根据教师所说的内容智能识别出控制指令和板书内容，提高课堂教育效率。

请参阅图1，主控模块包括：

指令处理模块，用于对音频处理单元的处理结果或遥控接收模块所接收到的控制指令进行接收处理；控制执行模块，用于根据指令处理模块所处理完成的控制指令进行执行，并通过与多媒体展示单元交互实现人工智能课堂教学。

具体的，在接收到遥控接收模块所接收的遥控指令后，通过主控模块进行处理并执行，从而通过遥控器对系统整体进行控制，同时在接收到音频处理单元发出的指令型音频文字时，将其作为控制指令执行，从而通过教师的语音音频对系统进行整体的控制。

请参阅图1，多媒体展示单元包括：

音频展示模块，用于根据主控模块的控制指令对相应的音频数据进行多媒体展示；视频展示模块，用于根据主控模块的控制指令对相应的视频数据进行多媒体展示；文档展示模块，用于根据主控模块的控制指令对相应的文档数据进行多媒体展示。

具体的，通过连接显示设备可以利用多媒体展示单元对预排版后的展示型音频文字进行多媒体展示，对各种形式的教学课件进行调取和展示，包括音频课件、视频课件以及文档课件等。

请参阅图1，云端共享单元包括：

具体的，通过云端共享单元可以对教学用的音频、视频和文档文件进行云端存储，从而可以进行教学课件共享，可以在教学课堂上从云端直接调取课件进行教学展示，提高教学的便利性以及课件丰富性，提高教学效果。

进一步的，所述无线传输单元包括调节模块，用于：

确定关键数据块的传输情况及传输信道信息；

确定待调节目标数据块在t时刻的传输速率

；构建理想传输速率函数：

其中，/>

为当前传输通道的最大传输速率；/>

为预设的当前传输通道的安全距离；/>

为t时刻待调节目标数据块与关键数据块之间的距离；/>

为预设的对待调节目标数据块的调节时间，一般预设为0.1s；计算对待调节目标数据块的传输速率的控制加速度因子：

其中，

为在t时刻时对待调节目标数据块的传输速率的控制加速度因子；

；/>

为对待调节目标数据块的预设安全控制系数，取值区间为/>

；/>

为关键数据块在t时刻的传输速率；/>

为预设记忆传输速率控制系数，取值区间为/>

；/>

计算待调节目标数据块在t+1时刻的传输速率

；/>

的调节指令，并对待调节目标数据块进行调节。

上述技术方案的工作原理及有益效果：基于调节模块确定终端及云端之间的待传输数据，并将待传输数据分成若干个数据块：确定每个数据块的类型，并根据类型查询预设的传输顺序表，确定传输顺序，基于传输顺序对若干个数据块进行传输；传输顺序表包括类型与传输序号标签的对应关系，如文字类型对应的序号标签为1，图像类型对应的序号标签为2，则传输顺序为先传输文字类型对应的数据块，再传输图像类型对应的数据块，实现对根据数据块类型的不同，进行有序的数据传输，提高了数据传输的准确性及效率。

在传输过程中，将第一个传输的数据库块作为关键数据块，将第二个传输的数据块作为待调节目标数据块；第一个传输的数据块占用传输信道，并实现优先传输的领头者，会对后续数据块的传输进行影响。确定关键数据块的传输情况及传输信道信息；根据关键数据块的传输情况及传输信道信息生成对待调节目标数据块的传输速率的调节指令，并对待调节目标数据块进行调节；基于调节后的待调节目标数据块的传输情况及传输信道信息，生成对第三个传输的数据块的调节指令，重复迭代，直至完成对最后传输的数据块的调节；便于根据关键数据块的传输情况及传输信道信息，实现对待调节目标数据块的传输速率进行调节，依次迭代，进而实现对除关键数据块外的其他数据块的传输速率进行调节，保证数据传输的有序性，同时避免出现数据块碰撞等，导致的数据缺失，提升了数据传输的准确性。

上述算法中，基于确定待调节目标数据块在t时刻的传输速率、构建理想传输速率函数、对待调节目标数据块的传输速率的控制加速度因子、待调节目标数据块在t+1时刻的传输速率等，进而确定准确的调节指令，便于平稳的调节传输速率，提高了调节的准确性。

其中，

为文件数据的信号波动系数；/>

为文件数据在第/>

个编码单元中的信号最大值；/>

为文件数据在传输过程中的编码单元的数量；/>

；

上述技术方案的工作原理及有益效果：基于检测模块检测云端传输模块对云端数据库与机顶盒之间进行文件数据的交互传递时，文件数据的信号波动系数：将所述信号波动系数与预设信号波动系数进行比较，在确定信号波动系数大于预设信号波动系数时，发出报警提示。预设信号波动系数为经过多次实验获取的。在进行对文件数据的传输过程中，需要进行编码，可极大地避免码流传送中误码的发生，便于提高数据传输效率，降低误码率是编码单元的主要任务。在确定信号波动系数大于预设信号波动系数时，表示传输信号出现了极大的不稳定，会影响编码速率以及传输速率，同时数据丢失的风险大大增加，发出报警提示，便于及时进行查看修正，便于提高数据传输的安全性、准确性及传输效率。

为了更好的展现基于人工智能教学课堂的机顶盒音频处理系统，本实施例现提出基于人工智能教学课堂的机顶盒音频处理的方法，包括以下步骤：

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明披露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。