CN116347134A - 基于人工智能教学课堂的机顶盒音频处理系统及其方法 - Google Patents

基于人工智能教学课堂的机顶盒音频处理系统及其方法 Download PDF

Info

Publication number
CN116347134A
CN116347134A CN202310316144.7A CN202310316144A CN116347134A CN 116347134 A CN116347134 A CN 116347134A CN 202310316144 A CN202310316144 A CN 202310316144A CN 116347134 A CN116347134 A CN 116347134A
Authority
CN
China
Prior art keywords
audio
module
data block
transmission
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310316144.7A
Other languages
English (en)
Other versions
CN116347134B (zh
Inventor
汤代佳
毛冠军
王伟国
徐志杰
宋志朋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen United Information Technology Co ltd
Original Assignee
Shenzhen United Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen United Information Technology Co ltd filed Critical Shenzhen United Information Technology Co ltd
Priority to CN202310316144.7A priority Critical patent/CN116347134B/zh
Publication of CN116347134A publication Critical patent/CN116347134A/zh
Application granted granted Critical
Publication of CN116347134B publication Critical patent/CN116347134B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/4104Peripherals receiving signals from specially adapted client devices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • H04N21/42206User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details
    • H04N21/42222Additional components integrated in the remote control device, e.g. timer, speaker, sensors for detecting position, direction or movement of the remote control, microphone or battery charging device
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/436Interfacing a local distribution network, e.g. communicating with another STB or one or more peripheral devices inside the home
    • H04N21/4363Adapting the video stream to a specific local network, e.g. a Bluetooth® network
    • H04N21/43637Adapting the video stream to a specific local network, e.g. a Bluetooth® network involving a wireless protocol, e.g. Bluetooth, RF or wireless LAN [IEEE 802.11]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明公开了基于人工智能教学课堂的机顶盒音频处理系统及其方法,属于音频处理技术领域。为解决语音处理较慢以及需要进行板书的问题,分段子模块可以根据关键帧对音频进行分段化处理,从而在系统录入较长的音频时,可以根据其中的关键帧将较长的语音进行分段化处理,从而可以有效的对音频中的关键性词语进行提取,提高后续对音频的识别和读取效率,语义判定子模块及文字区分子模块可以对录入的长音频进行自动的识别,对控制性的语句进行挑出并执行,对于展示性的语句进行重新排版和展示,使得教师可以在进行授课的同时由系统自动在显示屏上对内容进行自动排版和展示,根据教师所说的内容智能识别出控制指令和板书内容,提高效率。

Description

基于人工智能教学课堂的机顶盒音频处理系统及其方法
技术领域
本发明涉及音频处理技术领域,特别涉及基于人工智能教学课堂的机顶盒音频处理系统及其方法。
背景技术
市面上的音频设备中通常都设置有人工智能系统,使用者可通过用声音发出指令,从而完成与音频设备之间的对话以及控制音频设备,操作起来十分方便,且音频设备也可通过连接线,与手机电脑等主机设备进行连接,从而间接播放音频。
已有相关专利,比如公开号CN113938776A 公开了一种基于人工智能的音频处理系统及其实施方法,该专利采用清理装置设置在安装内槽中,安装内槽与连接接口之间呈相连通设置,解决了当清理装置被启动后,电机带动齿轮进行转动,使得带动组件带动推动圆柱向前运动,刷毛垫旋转清理连接接口的内腔的问题,操作者将主机和连接接口之间通过连接线连接后,导电模块则会将电信号发送给断电检测模块,解决了断电检测模块检测是否断电的问题。
上述专利其实在实际的操作中还存在以下问题:
1、在教师利用语音指令对多媒体教学设备进行控制时,往往可能因为语音指令的长度导致系统响应速度较慢,影响教学效果。
2、在运用多媒体进行教学时,往往还是不可避免的需要进行一定的板书,教师需要一边讲解一边板书,没有对智能多媒体教学做到充分的利用。
发明内容
本发明的目的在于提供基于人工智能教学课堂的机顶盒音频处理系统及其方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:基于人工智能教学课堂的机顶盒音频处理系统,包括:
音频捕捉单元,用于对音频数据信息进行采集捕捉;
音频处理单元,用于对音频捕捉单元所捕捉的音频数据进行处理;
遥控接收模块,用于对遥控指令进行接收;
主控模块,用于根据音频处理单元的处理结果或遥控接收模块所接收到的控制指令进行;
多媒体展示单元,用于对教学用音频、视频及文档数据文件进行展示;
无线传输单元,无线传输单元通过与无线网络连接实现与云端共享单元的无线连接,用于对机顶盒音频处理系统内的音频、视频及文档数据文件进行多终端及云端之间的无线传输;
云端共享单元,用于对音频、视频及文档数据文件进行云端分类储存。
进一步的,所述音频处理单元包括:
音频缓存模块,用于对音频捕捉单元所采集捕捉的音频进行快速缓存和调取;
音频处理模块,用于对音频缓存模块内快速缓存的音频进行分段处理;
智能识别模块,用于对音频处理模块所处理的音频进行分段识别,并对分段识别的音频进行文字化处理,生成分段式文字;
智能匹配模块,用于结合智能语库模块并对智能识别模块所识别的分段式指令文字进行匹配,并区分指令型音频文字和展示型音频文字;
智能语库模块,用于生成语库并对智能指令语言进行存储。
进一步的,所述音频处理模块包括:
分段子模块,用于对音频进行分段处理,在进行分段处理时对音频进行关键帧识别,所述关键帧包括动词关键帧、名词关键帧及辅助关键帧,音频根据关键帧的数量进行音频段分割,每个音频段内至少含有一个关键帧;
规则子模块,用于对关键帧的识别规则进行存储,分段子模块进行关键帧识别时引用规则子模块内部的识别规则;
排序子模块,用于对分段子模块所分割的音频段进行排序。
进一步的,所述智能匹配模块包括:
语义判定子模块,用于结合智能语库模块对音频中不同的音频段进行语义判定,进行语义判定时根据关键帧的内容进行匹配判定;
文字区分子模块,用于根据语义判定子模块的判断结果,对音频中的指令型音频文字和展示型音频文字进行区分,指令型音频文字用于主控模块进行识别,并于识别后根据指令型音频文字的内容进行控制指令执行,展示型音频文字用于展示排版子模块进行文字排版,并于排版后通过多媒体展示单元进行展示;
展示排版子模块,用于对文字区分子模块所区分出的展示型文字进行展示预排版,根据展示型文字中音频段的关键帧进行分段优化。
进一步的,所述主控模块包括:
指令处理模块,用于对音频处理单元的处理结果或遥控接收模块所接收到的控制指令进行接收处理;
控制执行模块,用于根据指令处理模块所处理完成的控制指令进行执行,并通过与多媒体展示单元交互实现人工智能课堂教学。
进一步的,所述多媒体展示单元包括:
音频展示模块,用于根据主控模块的控制指令对相应的音频数据进行多媒体展示;
视频展示模块,用于根据主控模块的控制指令对相应的视频数据进行多媒体展示;
文档展示模块,用于根据主控模块的控制指令对相应的文档数据进行多媒体展示。
进一步的,所述云端共享单元包括:
云端数据库,用于将接收到的数据流组依据数据流标签进行分类并云端储存;
数据处理模块,用于将分类储存的数据依据流属性信息和数据内容进行分组,并分类标记,所述分组包括音频数据集、视频数据集和文档数据集;
数据检索模块,用于对云端数据库内部储存的数据进行检索;
云端传输模块,用于与互联网交互,并对云端数据库与机顶盒之间进行文件数据的交互传递。
进一步的,所述无线传输单元包括调节模块,用于:
确定终端及云端之间的待传输数据,并将待传输数据分成若干个数据块:
确定每个数据块的类型,并根据类型查询预设的传输顺序表,确定传输顺序,基于传输顺序对若干个数据块进行传输;
在传输过程中,将第一个传输的数据库块作为关键数据块,将第二个传输的数据块作为待调节目标数据块;
确定关键数据块的传输情况及传输信道信息;
根据关键数据块的传输情况及传输信道信息生成对待调节目标数据块的传输速率的调节指令,并对待调节目标数据块进行调节;
基于调节后的待调节目标数据块的传输情况及传输信道信息,生成对第三个传输的数据块的调节指令,重复迭代,直至完成对最后传输的数据块的调节;
根据关键数据块的传输情况及传输信道信息生成对待调节目标数据块的传输速率的调节指令,并对待调节目标数据块进行调节,包括:
确定待调节目标数据块在t时刻的传输速率
Figure SMS_1
;构建理想传输速率函数:
Figure SMS_2
其中,
Figure SMS_3
根据理想传输速率函数得到的待调节目标数据块在t时刻的传输速率;/>
Figure SMS_4
为当前传输通道的最大传输速率;/>
Figure SMS_5
为预设的当前传输通道的安全距离;
Figure SMS_6
为t时刻待调节目标数据块与关键数据块之间的距离;/>
Figure SMS_7
为预设的对待调节目标数据块的调节时间,一般预设为0.1s;
计算对待调节目标数据块的传输速率的控制加速度因子:
Figure SMS_10
其中, />
Figure SMS_13
为在t时刻时对待调节目标数据块的传输速率的控制加速度因子;/>
Figure SMS_16
为对待调节目标数据块的预设理想传输速率调节系数,取值区间为/>
Figure SMS_9
;/>
Figure SMS_12
为对待调节目标数据块的预设安全控制系数,取值区间为/>
Figure SMS_15
;/>
Figure SMS_17
为关键数据块在t时刻的传输速率;/>
Figure SMS_8
为预设记忆传输速率控制系数,取值区间为/>
Figure SMS_11
;/>
Figure SMS_14
为根据理想传输速率函数得到的待调节目标数据块在t-1时刻时的传输速率;
计算待调节目标数据块在t+1时刻的传输速率
Figure SMS_18
;/>
Figure SMS_19
其中,T为预设的时间间距;生成将待调节目标数据块的传输速率调节至/>
Figure SMS_20
的调节指令,并对待调节目标数据块进行调节。
进一步的,还包括:检测模块,用于:检测云端传输模块对云端数据库与机顶盒之间进行文件数据的交互传递时,文件数据的信号波动系数:
Figure SMS_21
其中,
Figure SMS_22
为文件数据的信号波动系数;/>
Figure SMS_23
为文件数据在第/>
Figure SMS_24
个编码单元中的信号最大值;/>
Figure SMS_25
为文件数据在传输过程中的编码单元的数量;/>
Figure SMS_26
将所述信号波动系数与预设信号波动系数进行比较,在确定信号波动系数大于预设信号波动系数时,发出报警提示。
本发明要解决的另一技术问题是提供基于人工智能教学课堂的机顶盒音频处理的方法,包括如下步骤:
步骤一:音频捕捉单元接收课堂教学人员的语音音频,音频处理模块根据语音音频中的关键帧对音频进行分段处理,智能匹配模块对分段化后的音频进行语义判定,区分指令型音频文字和展示型音频文字;
步骤二:文字区分子模块对指令型音频文字和展示型音频文字进行区分,区分出的指令型音频文字通过主控模块进行控制指令转化并对系统整体进行控制,区分出的展示型音频文字通过展示排版子模块展示;
步骤三:展示排版子模块对展示型音频文字进行分段优化预排版,多媒体展示单元连接显示设备对预排版后的展示型音频文字进行多媒体展示。
与现有技术相比,本发明的有益效果是:
1.现有技术下,在教师利用语音指令对多媒体教学设备进行控制时,往往可能因为语音指令的长度导致系统响应速度较慢,影响教学效果,而本发明的分段子模块可以根据关键帧对音频进行分段化处理,从而在系统录入较长的音频时,可以根据其中的动词关键帧、名词关键帧及辅助关键帧将较长的语音进行分段化处理,从而可以有效的对音频中的关键性词语进行提取,提高后续对音频的识别和读取效率,从而提高了系统整体对音频的识别出理速度,提高课堂教学的效果。
2.现有技术下,在运用多媒体进行教学时,往往还是不可避免的需要进行一定的板书,教师需要一边讲解一边板书,没有对智能多媒体教学做到充分的利用,而本发明的语义判定子模块及文字区分子模块可以对录入的长音频进行自动的识别,对控制性的语句进行挑出并执行,对于其他的展示性的语句可以通过展示排版子模块进行重新排版和展示,使得教师可以在进行授课的同时由系统自动在显示屏上对教师所说的内容进行自动排版和展示,无需进行手动的板书,根据教师所说的内容智能识别出控制指令和板书内容,提高课堂教育效率。
附图说明
图1为本发明的系统整体模块示意图;
图2为本发明的音频处理单元模块示意图。
实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,基于人工智能教学课堂的机顶盒音频处理系统,包括:
音频捕捉单元,用于对音频数据信息进行采集捕捉;
音频处理单元,用于对音频捕捉单元所捕捉的音频数据进行处理;
遥控接收模块,用于对遥控指令进行接收;
主控模块,用于根据音频处理单元的处理结果或遥控接收模块所接收到的控制指令进行;
多媒体展示单元,用于对教学用音频、视频及文档数据文件进行展示;
无线传输单元,无线传输单元通过与无线网络连接实现与云端共享单元的无线连接,用于对机顶盒音频处理系统内的音频、视频及文档数据文件进行多终端及云端之间的无线传输;
云端共享单元,用于对音频、视频及文档数据文件进行云端分类储存。
具体的,音频捕捉单元接收课堂教学人员的语音音频,音频处理单元根据语音音频中的关键帧对音频进行分段处理并对分段化后的音频进行语义判定,区分指令型音频文字和展示型音频文字,对于区分出的指令型音频文字和展示型音频文字,区分出的指令型音频文字通过主控模块进行控制指令转化并对系统整体进行控制,区分出的展示型音频文字通过多媒体展示单元连接显示设备对预排版后的展示型音频文字进行多媒体展示。
为了解决在教师利用语音指令对多媒体教学设备进行控制时,往往可能因为语音指令的长度导致系统响应速度较慢,影响教学效果,同时在运用多媒体进行教学时,往往还是不可避免的需要进行一定的板书,教师需要一边讲解一边板书,没有对智能多媒体教学做到充分的利用的技术问题,请参阅图1-2,本发明提供以下技术方案:
音频处理单元包括:
音频缓存模块,用于对音频捕捉单元所采集捕捉的音频进行快速缓存和调取;
音频处理模块,用于对音频缓存模块内快速缓存的音频进行分段处理;
智能识别模块,用于对音频处理模块所处理的音频进行分段识别,并对分段识别的音频进行文字化处理,生成分段式文字;
智能匹配模块,用于结合智能语库模块并对智能识别模块所识别的分段式指令文字进行匹配,并区分指令型音频文字和展示型音频文字;
智能语库模块,用于生成语库并对智能指令语言进行存储。
音频处理模块包括:
分段子模块,用于对音频进行分段处理,在进行分段处理时对音频进行关键帧识别,所述关键帧包括动词关键帧、名词关键帧及辅助关键帧,音频根据关键帧的数量进行音频段分割,每个音频段内至少含有一个关键帧;
规则子模块,用于对关键帧的识别规则进行存储,分段子模块进行关键帧识别时引用规则子模块内部的识别规则;
排序子模块,用于对分段子模块所分割的音频段进行排序。
具体的,分段子模块可以根据关键帧对音频进行分段化处理,从而在系统录入较长的音频时,可以根据其中的动词关键帧、名词关键帧及辅助关键帧将较长的语音进行分段化处理,从而可以有效的对音频中的关键性词语进行提取,提高后续对音频的识别和读取效率,从而提高了系统整体对音频的识别出理速度,提高课堂教学的效果。
智能匹配模块包括:
语义判定子模块,用于结合智能语库模块对音频中不同的音频段进行语义判定,进行语义判定时根据关键帧的内容进行匹配判定;
文字区分子模块,用于根据语义判定子模块的判断结果,对音频中的指令型音频文字和展示型音频文字进行区分,指令型音频文字用于主控模块进行识别,并于识别后根据指令型音频文字的内容进行控制指令执行,展示型音频文字用于展示排版子模块进行文字排版,并于排版后通过多媒体展示单元进行展示;
展示排版子模块,用于对文字区分子模块所区分出的展示型文字进行展示预排版,根据展示型文字中音频段的关键帧进行分段优化。
具体的,语义判定子模块及文字区分子模块的设置可以对录入的长音频进行自动的识别,对控制性的语句进行挑出并执行,对于其他的展示性的语句可以通过展示排版子模块进行重新排版和展示,使得教师可以在进行授课的同时由系统自动在显示屏上对教师所说的内容进行自动排版和展示,无需进行手动的板书,根据教师所说的内容智能识别出控制指令和板书内容,提高课堂教育效率。
请参阅图1,主控模块包括:
指令处理模块,用于对音频处理单元的处理结果或遥控接收模块所接收到的控制指令进行接收处理;控制执行模块,用于根据指令处理模块所处理完成的控制指令进行执行,并通过与多媒体展示单元交互实现人工智能课堂教学。
具体的,在接收到遥控接收模块所接收的遥控指令后,通过主控模块进行处理并执行,从而通过遥控器对系统整体进行控制,同时在接收到音频处理单元发出的指令型音频文字时,将其作为控制指令执行,从而通过教师的语音音频对系统进行整体的控制。
请参阅图1,多媒体展示单元包括:
音频展示模块,用于根据主控模块的控制指令对相应的音频数据进行多媒体展示;视频展示模块,用于根据主控模块的控制指令对相应的视频数据进行多媒体展示;文档展示模块,用于根据主控模块的控制指令对相应的文档数据进行多媒体展示。
具体的,通过连接显示设备可以利用多媒体展示单元对预排版后的展示型音频文字进行多媒体展示,对各种形式的教学课件进行调取和展示,包括音频课件、视频课件以及文档课件等。
请参阅图1,云端共享单元包括:
云端数据库,用于将接收到的数据流组依据数据流标签进行分类并云端储存;
数据处理模块,用于将分类储存的数据依据流属性信息和数据内容进行分组,并分类标记,所述分组包括音频数据集、视频数据集和文档数据集;
数据检索模块,用于对云端数据库内部储存的数据进行检索;
云端传输模块,用于与互联网交互,并对云端数据库与机顶盒之间进行文件数据的交互传递。
具体的,通过云端共享单元可以对教学用的音频、视频和文档文件进行云端存储,从而可以进行教学课件共享,可以在教学课堂上从云端直接调取课件进行教学展示,提高教学的便利性以及课件丰富性,提高教学效果。
进一步的,所述无线传输单元包括调节模块,用于:
确定终端及云端之间的待传输数据,并将待传输数据分成若干个数据块:
确定每个数据块的类型,并根据类型查询预设的传输顺序表,确定传输顺序,基于传输顺序对若干个数据块进行传输;
在传输过程中,将第一个传输的数据库块作为关键数据块,将第二个传输的数据块作为待调节目标数据块;
确定关键数据块的传输情况及传输信道信息;
根据关键数据块的传输情况及传输信道信息生成对待调节目标数据块的传输速率的调节指令,并对待调节目标数据块进行调节;
基于调节后的待调节目标数据块的传输情况及传输信道信息,生成对第三个传输的数据块的调节指令,重复迭代,直至完成对最后传输的数据块的调节;
根据关键数据块的传输情况及传输信道信息生成对待调节目标数据块的传输速率的调节指令,并对待调节目标数据块进行调节,包括:
确定待调节目标数据块在t时刻的传输速率
Figure SMS_28
;构建理想传输速率函数:
Figure SMS_30
其中,/>
Figure SMS_33
根据理想传输速率函数得到的待调节目标数据块在t时刻的传输速率;/>
Figure SMS_29
为当前传输通道的最大传输速率;/>
Figure SMS_31
为预设的当前传输通道的安全距离;/>
Figure SMS_32
为t时刻待调节目标数据块与关键数据块之间的距离;/>
Figure SMS_34
为预设的对待调节目标数据块的调节时间,一般预设为0.1s;计算对待调节目标数据块的传输速率的控制加速度因子:
Figure SMS_27
其中,
Figure SMS_37
为在t时刻时对待调节目标数据块的传输速率的控制加速度因子;
Figure SMS_39
为对待调节目标数据块的预设理想传输速率调节系数,取值区间为/>
Figure SMS_41
;/>
Figure SMS_36
为对待调节目标数据块的预设安全控制系数,取值区间为/>
Figure SMS_40
;/>
Figure SMS_42
为关键数据块在t时刻的传输速率;/>
Figure SMS_43
为预设记忆传输速率控制系数,取值区间为/>
Figure SMS_35
;/>
Figure SMS_38
为根据理想传输速率函数得到的待调节目标数据块在t-1时刻时的传输速率;
计算待调节目标数据块在t+1时刻的传输速率
Figure SMS_44
;/>
Figure SMS_45
其中,T为预设的时间间距;生成将待调节目标数据块的传输速率调节至/>
Figure SMS_46
的调节指令,并对待调节目标数据块进行调节。
上述技术方案的工作原理及有益效果:基于调节模块确定终端及云端之间的待传输数据,并将待传输数据分成若干个数据块:确定每个数据块的类型,并根据类型查询预设的传输顺序表,确定传输顺序,基于传输顺序对若干个数据块进行传输;传输顺序表包括类型与传输序号标签的对应关系,如文字类型对应的序号标签为1,图像类型对应的序号标签为2,则传输顺序为先传输文字类型对应的数据块,再传输图像类型对应的数据块,实现对根据数据块类型的不同,进行有序的数据传输,提高了数据传输的准确性及效率。
在传输过程中,将第一个传输的数据库块作为关键数据块,将第二个传输的数据块作为待调节目标数据块;第一个传输的数据块占用传输信道,并实现优先传输的领头者,会对后续数据块的传输进行影响。确定关键数据块的传输情况及传输信道信息;根据关键数据块的传输情况及传输信道信息生成对待调节目标数据块的传输速率的调节指令,并对待调节目标数据块进行调节;基于调节后的待调节目标数据块的传输情况及传输信道信息,生成对第三个传输的数据块的调节指令,重复迭代,直至完成对最后传输的数据块的调节;便于根据关键数据块的传输情况及传输信道信息,实现对待调节目标数据块的传输速率进行调节,依次迭代,进而实现对除关键数据块外的其他数据块的传输速率进行调节,保证数据传输的有序性,同时避免出现数据块碰撞等,导致的数据缺失,提升了数据传输的准确性。
上述算法中,基于确定待调节目标数据块在t时刻的传输速率、构建理想传输速率函数、对待调节目标数据块的传输速率的控制加速度因子、待调节目标数据块在t+1时刻的传输速率等,进而确定准确的调节指令,便于平稳的调节传输速率,提高了调节的准确性。
进一步的,还包括:检测模块,用于:检测云端传输模块对云端数据库与机顶盒之间进行文件数据的交互传递时,文件数据的信号波动系数:
Figure SMS_47
其中,
Figure SMS_48
为文件数据的信号波动系数;/>
Figure SMS_49
为文件数据在第/>
Figure SMS_50
个编码单元中的信号最大值;/>
Figure SMS_51
为文件数据在传输过程中的编码单元的数量;/>
Figure SMS_52
将所述信号波动系数与预设信号波动系数进行比较,在确定信号波动系数大于预设信号波动系数时,发出报警提示。
上述技术方案的工作原理及有益效果:基于检测模块检测云端传输模块对云端数据库与机顶盒之间进行文件数据的交互传递时,文件数据的信号波动系数:将所述信号波动系数与预设信号波动系数进行比较,在确定信号波动系数大于预设信号波动系数时,发出报警提示。预设信号波动系数为经过多次实验获取的。在进行对文件数据的传输过程中,需要进行编码,可极大地避免码流传送中误码的发生,便于提高数据传输效率,降低误码率是编码单元的主要任务。在确定信号波动系数大于预设信号波动系数时,表示传输信号出现了极大的不稳定,会影响编码速率以及传输速率,同时数据丢失的风险大大增加,发出报警提示,便于及时进行查看修正,便于提高数据传输的安全性、准确性及传输效率。
为了更好的展现基于人工智能教学课堂的机顶盒音频处理系统,本实施例现提出基于人工智能教学课堂的机顶盒音频处理的方法,包括以下步骤:
步骤一:音频捕捉单元接收课堂教学人员的语音音频,音频处理模块根据语音音频中的关键帧对音频进行分段处理,智能匹配模块对分段化后的音频进行语义判定,区分指令型音频文字和展示型音频文字;
步骤二:文字区分子模块对指令型音频文字和展示型音频文字进行区分,区分出的指令型音频文字通过主控模块进行控制指令转化并对系统整体进行控制,区分出的展示型音频文字通过展示排版子模块展示;
步骤三:展示排版子模块对展示型音频文字进行分段优化预排版,多媒体展示单元连接显示设备对预排版后的展示型音频文字进行多媒体展示。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (10)

1.基于人工智能教学课堂的机顶盒音频处理系统,其特征在于,包括:
音频捕捉单元,用于对音频数据信息进行采集捕捉;
音频处理单元,用于对音频捕捉单元所捕捉的音频数据进行处理;
遥控接收模块,用于对遥控指令进行接收;
主控模块,用于根据音频处理单元的处理结果或遥控接收模块所接收到的控制指令进行;
多媒体展示单元,用于对教学用音频、视频及文档数据文件进行展示;
无线传输单元,无线传输单元通过与无线网络连接实现与云端共享单元的无线连接,用于对机顶盒音频处理系统内的音频、视频及文档数据文件进行多终端及云端之间的无线传输;
云端共享单元,用于对音频、视频及文档数据文件进行云端分类储存。
2.如权利要求1所述的基于人工智能教学课堂的机顶盒音频处理系统,其特征在于:所述音频处理单元包括:
音频缓存模块,用于对音频捕捉单元所采集捕捉的音频进行快速缓存和调取;
音频处理模块,用于对音频缓存模块内快速缓存的音频进行分段处理;
智能识别模块,用于对音频处理模块所处理的音频进行分段识别,并对分段识别的音频进行文字化处理,生成分段式文字;
智能匹配模块,用于结合智能语库模块并对智能识别模块所识别的分段式指令文字进行匹配,并区分指令型音频文字和展示型音频文字;
智能语库模块,用于生成语库并对智能指令语言进行存储。
3.如权利要求2所述的基于人工智能教学课堂的机顶盒音频处理系统,其特征在于:所述音频处理模块包括:
分段子模块,用于对音频进行分段处理,在进行分段处理时对音频进行关键帧识别,所述关键帧包括动词关键帧、名词关键帧及辅助关键帧,音频根据关键帧的数量进行音频段分割,每个音频段内至少含有一个关键帧;
规则子模块,用于对关键帧的识别规则进行存储,分段子模块进行关键帧识别时引用规则子模块内部的识别规则;
排序子模块,用于对分段子模块所分割的音频段进行排序。
4.如权利要求3所述的基于人工智能教学课堂的机顶盒音频处理系统,其特征在于:所述智能匹配模块包括:
语义判定子模块,用于结合智能语库模块对音频中不同的音频段进行语义判定,进行语义判定时根据关键帧的内容进行匹配判定;
文字区分子模块,用于根据语义判定子模块的判断结果,对音频中的指令型音频文字和展示型音频文字进行区分,指令型音频文字用于主控模块进行识别,并于识别后根据指令型音频文字的内容进行控制指令执行,展示型音频文字用于展示排版子模块进行文字排版,并于排版后通过多媒体展示单元进行展示;
展示排版子模块,用于对文字区分子模块所区分出的展示型文字进行展示预排版,根据展示型文字中音频段的关键帧进行分段优化。
5.如权利要求1所述的基于人工智能教学课堂的机顶盒音频处理系统,其特征在于:所述主控模块包括:
指令处理模块,用于对音频处理单元的处理结果或遥控接收模块所接收到的控制指令进行接收处理;
控制执行模块,用于根据指令处理模块所处理完成的控制指令进行执行,并通过与多媒体展示单元交互实现人工智能课堂教学。
6.如权利要求1所述的基于人工智能教学课堂的机顶盒音频处理系统,其特征在于:所述多媒体展示单元包括:
音频展示模块,用于根据主控模块的控制指令对相应的音频数据进行多媒体展示;
视频展示模块,用于根据主控模块的控制指令对相应的视频数据进行多媒体展示;
文档展示模块,用于根据主控模块的控制指令对相应的文档数据进行多媒体展示。
7.如权利要求1所述的基于人工智能教学课堂的机顶盒音频处理系统,其特征在于:所述云端共享单元包括:
云端数据库,用于将接收到的数据流组依据数据流标签进行分类并云端储存;
数据处理模块,用于将分类储存的数据依据流属性信息和数据内容进行分组,并分类标记,所述分组包括音频数据集、视频数据集和文档数据集;
数据检索模块,用于对云端数据库内部储存的数据进行检索;
云端传输模块,用于与互联网交互,并对云端数据库与机顶盒之间进行文件数据的交互传递。
8.如权利要求1所述的基于人工智能教学课堂的机顶盒音频处理系统,其特征在于:所述无线传输单元包括调节模块,用于:
确定终端及云端之间的待传输数据,并将待传输数据分成若干个数据块:
确定每个数据块的类型,并根据类型查询预设的传输顺序表,确定传输顺序,基于传输顺序对若干个数据块进行传输;
在传输过程中,将第一个传输的数据库块作为关键数据块,将第二个传输的数据块作为待调节目标数据块;
确定关键数据块的传输情况及传输信道信息;
根据关键数据块的传输情况及传输信道信息生成对待调节目标数据块的传输速率的调节指令,并对待调节目标数据块进行调节;
基于调节后的待调节目标数据块的传输情况及传输信道信息,生成对第三个传输的数据块的调节指令,重复迭代,直至完成对最后传输的数据块的调节;
根据关键数据块的传输情况及传输信道信息生成对待调节目标数据块的传输速率的调节指令,并对待调节目标数据块进行调节,包括:
确定待调节目标数据块在t时刻的传输速率
Figure QLYQS_1
构建理想传输速率函数:
Figure QLYQS_2
其中,/>
Figure QLYQS_3
根据理想传输速率函数得到的待调节目标数据块在t时刻的传输速率;/>
Figure QLYQS_4
为当前传输通道的最大传输速率;/>
Figure QLYQS_5
为预设的当前传输通道的安全距离;/>
Figure QLYQS_6
为t时刻待调节目标数据块与关键数据块之间的距离;/>
Figure QLYQS_7
为预设的对待调节目标数据块的调节时间,一般预设为0.1s;
计算对待调节目标数据块的传输速率的控制加速度因子:
Figure QLYQS_8
其中,
Figure QLYQS_10
为在t时刻时对待调节目标数据块的传输速率的控制加速度因子;/>
Figure QLYQS_13
为对待调节目标数据块的预设理想传输速率调节系数,取值区间为/>
Figure QLYQS_15
;/>
Figure QLYQS_11
为对待调节目标数据块的预设安全控制系数,取值区间为/>
Figure QLYQS_14
;/>
Figure QLYQS_16
为关键数据块在t时刻的传输速率;/>
Figure QLYQS_17
为预设记忆传输速率控制系数,取值区间为/>
Figure QLYQS_9
;/>
Figure QLYQS_12
为根据理想传输速率函数得到的待调节目标数据块在t-1时刻时的传输速率;
计算待调节目标数据块在t+1时刻的传输速率
Figure QLYQS_18
Figure QLYQS_19
其中,T为预设的时间间距;
生成将待调节目标数据块的传输速率调节至
Figure QLYQS_20
的调节指令,并对待调节目标数据块进行调节。
9.如权利要求7所述的基于人工智能教学课堂的机顶盒音频处理系统,其特征在于,还包括:检测模块,用于:
检测云端传输模块对云端数据库与机顶盒之间进行文件数据的交互传递时,文件数据的信号波动系数:
Figure QLYQS_21
其中,
Figure QLYQS_22
为文件数据的信号波动系数;/>
Figure QLYQS_23
为文件数据在第/>
Figure QLYQS_24
个编码单元中的信号最大值;/>
Figure QLYQS_25
为文件数据在传输过程中的编码单元的数量;/>
Figure QLYQS_26
将所述信号波动系数与预设信号波动系数进行比较,在确定信号波动系数大于预设信号波动系数时,发出报警提示。
10.一种根据权利要求1-9中任一项所述的基于人工智能教学课堂的机顶盒音频处理系统的实现方法,其特征在于:包括如下步骤:
步骤一:音频捕捉单元接收课堂教学人员的语音音频,音频处理模块根据语音音频中的关键帧对音频进行分段处理,智能匹配模块对分段化后的音频进行语义判定,区分指令型音频文字和展示型音频文字;
步骤二:文字区分子模块对指令型音频文字和展示型音频文字进行区分,区分出的指令型音频文字通过主控模块进行控制指令转化并对系统整体进行控制,区分出的展示型音频文字通过展示排版子模块展示;
步骤三:展示排版子模块对展示型音频文字进行分段优化预排版,多媒体展示单元连接显示设备对预排版后的展示型音频文字进行多媒体展示。
CN202310316144.7A 2023-03-29 2023-03-29 基于人工智能教学课堂的机顶盒音频处理系统及其方法 Active CN116347134B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310316144.7A CN116347134B (zh) 2023-03-29 2023-03-29 基于人工智能教学课堂的机顶盒音频处理系统及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310316144.7A CN116347134B (zh) 2023-03-29 2023-03-29 基于人工智能教学课堂的机顶盒音频处理系统及其方法

Publications (2)

Publication Number Publication Date
CN116347134A true CN116347134A (zh) 2023-06-27
CN116347134B CN116347134B (zh) 2024-01-30

Family

ID=86892666

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310316144.7A Active CN116347134B (zh) 2023-03-29 2023-03-29 基于人工智能教学课堂的机顶盒音频处理系统及其方法

Country Status (1)

Country Link
CN (1) CN116347134B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104616654A (zh) * 2014-10-13 2015-05-13 深圳中电数码显示有限公司 多媒体一体机及其语音控制实现方法
CN106997694A (zh) * 2016-01-26 2017-08-01 深圳市正谱科技有限公司 一种云教育智能系统
CN111968628A (zh) * 2020-08-22 2020-11-20 彭玲玲 一种用于语音指令捕捉的信号精确度调节系统及方法
KR20210031141A (ko) * 2019-09-11 2021-03-19 주식회사 아하정보통신 음성 인식을 통하여 인공지능 제어기술을 수행하는 전자 칠판
CN114093361A (zh) * 2021-11-18 2022-02-25 厦门理工学院 一种基于语言模型的板书自主转化方法及系统
CN114254076A (zh) * 2021-12-16 2022-03-29 天翼爱音乐文化科技有限公司 一种多媒体教学的音频处理方法、系统及存储介质
CN114758540A (zh) * 2022-04-02 2022-07-15 湖南城市学院 一种用于英语教学的智能型英语教学系统及使用方法
CN114827518A (zh) * 2021-01-27 2022-07-29 安普拉公司 一种投影视频会议系统
CN114972716A (zh) * 2022-05-20 2022-08-30 北京奕斯伟计算技术股份有限公司 上课内容记录方法、相关装置和介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104616654A (zh) * 2014-10-13 2015-05-13 深圳中电数码显示有限公司 多媒体一体机及其语音控制实现方法
CN106997694A (zh) * 2016-01-26 2017-08-01 深圳市正谱科技有限公司 一种云教育智能系统
KR20210031141A (ko) * 2019-09-11 2021-03-19 주식회사 아하정보통신 음성 인식을 통하여 인공지능 제어기술을 수행하는 전자 칠판
CN111968628A (zh) * 2020-08-22 2020-11-20 彭玲玲 一种用于语音指令捕捉的信号精确度调节系统及方法
CN114827518A (zh) * 2021-01-27 2022-07-29 安普拉公司 一种投影视频会议系统
CN114093361A (zh) * 2021-11-18 2022-02-25 厦门理工学院 一种基于语言模型的板书自主转化方法及系统
CN114254076A (zh) * 2021-12-16 2022-03-29 天翼爱音乐文化科技有限公司 一种多媒体教学的音频处理方法、系统及存储介质
CN114758540A (zh) * 2022-04-02 2022-07-15 湖南城市学院 一种用于英语教学的智能型英语教学系统及使用方法
CN114972716A (zh) * 2022-05-20 2022-08-30 北京奕斯伟计算技术股份有限公司 上课内容记录方法、相关装置和介质

Also Published As

Publication number Publication date
CN116347134B (zh) 2024-01-30

Similar Documents

Publication Publication Date Title
CN108520743B (zh) 智能设备的语音控制方法、智能设备及计算机可读介质
CN109889920B (zh) 网络课程视频剪辑方法、系统、设备及存储介质
CN107657947A (zh) 基于人工智能的语音处理方法及其装置
CN110232340B (zh) 建立视频分类模型以及视频分类的方法、装置
CN111261162B (zh) 语音识别方法、语音识别装置及存储介质
CN101410790A (zh) 文本显示设备、文本显示方法及程序
CN112399258A (zh) 直播回放视频生成播放方法、装置、存储介质及电子设备
US11392791B2 (en) Generating training data for natural language processing
CN111415537A (zh) 一种基于符号标注的中小学生听词系统
US11580971B2 (en) Photo album management method, storage medium and electronic device
CN113450774A (zh) 一种训练数据的获取方法及装置
CN112818680A (zh) 语料的处理方法、装置、电子设备及计算机可读存储介质
CN110136697B (zh) 一种基于多进程/线程并行运算的英语朗读练习系统
CN116347134B (zh) 基于人工智能教学课堂的机顶盒音频处理系统及其方法
CN113393841B (zh) 语音识别模型的训练方法、装置、设备及存储介质
CN112543371A (zh) 视频数据处理方法、装置、终端及存储介质
CN114398952B (zh) 训练文本生成方法、装置、电子设备及存储介质
CN112417867B (zh) 一种语音识别后的视频片名纠错方法及系统
CN113038259B (zh) 互联网教育的上课质量反馈方法及系统
CN116017088A (zh) 视频字幕处理方法、装置、电子设备和存储介质
CN112506405B (zh) 一种基于互联网监管领域的人工智能语音大屏指挥方法
CN111613208B (zh) 一种语种识别方法和设备
CN114125184A (zh) 一种提词方法、装置、终端及存储介质
CN112837398A (zh) 文本批注的方法、装置、电子设备及存储介质
CN112887779B (zh) 基于语音节奏进行自动滚动字幕的方法、系统及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant