CN109087658A - 一种在线互动直播噪声处理系统 - Google Patents

一种在线互动直播噪声处理系统 Download PDF

Info

Publication number
CN109087658A
CN109087658A CN201810779628.4A CN201810779628A CN109087658A CN 109087658 A CN109087658 A CN 109087658A CN 201810779628 A CN201810779628 A CN 201810779628A CN 109087658 A CN109087658 A CN 109087658A
Authority
CN
China
Prior art keywords
module
voice
noise
information
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810779628.4A
Other languages
English (en)
Inventor
吴伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Guo Yi Chong Polytron Technologies Inc
Original Assignee
Anhui Guo Yi Chong Polytron Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Guo Yi Chong Polytron Technologies Inc filed Critical Anhui Guo Yi Chong Polytron Technologies Inc
Priority to CN201810779628.4A priority Critical patent/CN109087658A/zh
Publication of CN109087658A publication Critical patent/CN109087658A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B5/00Electrically-operated educational appliances
    • G09B5/08Electrically-operated educational appliances providing for individual presentation of information to a plurality of student stations
    • G09B5/10Electrically-operated educational appliances providing for individual presentation of information to a plurality of student stations all student stations being capable of presenting the same information simultaneously
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明公开了一种在线互动直播噪声处理系统,包括第一语音录入模块、第二语音录入模块、人声消除模块、语音处理模块、噪音消除模块、控制器、语音播放模块、语音转文字模块和显示模块;所述第一语音录入模块用于实时录制教师讲课的第一声音信息;本发明通过第一语音录入模块实时录制教师讲课的第一声音信息,通过第二语音录入模块用于录入教师所在环境内所有声音的第二声音信息,所述第二语音录入模块用于将第二声音信息传输到人声消除模块,之后通过噪音消除模块对初步声音信息做相关处理获得教学声音信号,之后将其播放出来,同时借助语音转文字模块将其转换为文字,之后通过显示模块实时显示,便于学生实时观看。

Description

一种在线互动直播噪声处理系统
技术领域
本发明属于噪声处理领域,涉及一种在线互动直播技术,具体是一种在线互动直播噪声处理系统。
背景技术
网络直播由于是通过互联网平台展开,相对于传统直播来说,让大众有了更好的主动操作性,也就是说有了更好的和更自由的选择空间。例如目前流行的球赛直播、体育直播等,婚礼直播,开业直播等直播是为了方便广大群众,将这些信号在互联网上发布,观众就可以很方便选择自己所需要的直播线路。全球任何有网络的地方都能看到在线直播的实况直播;
而当前随着直播的兴起和热门,越来越多的人趋向于参与直播互动,或者自己开启直播分享自己的生活,也有不少教育机构借助直播平台开启了在线直播教学,但是,由于录音设备或者网络原因或者环境影响的情况下,会在直播的过程中产生噪声,这极大影响了人们的直播体验;为解决上述缺陷,现提供一种解决方案。
发明内容
本发明的目的在于提供一种在线互动直播噪声处理系统。
本发明的目的可以通过以下技术方案实现:
一种在线互动直播噪声处理系统,包括第一语音录入模块、第二语音录入模块、人声消除模块、语音处理模块、噪音消除模块、控制器、语音播放模块、语音转文字模块和显示模块;
其中,所述第一语音录入模块用于实时录制教师讲课的第一声音信息,所述第一语音录入模块用于将第一声音信息传输到语音处理模块;所述第二语音录入模块用于录入教师所在环境内所有声音的第二声音信息,所述第二语音录入模块用于将第二声音信息传输到人声消除模块;
所述人声消除模块接收到第二语音录入模块传输的第二声音信息并将第二声音信息中的人声去除掉获得参考声音信息,所述人声消除模块用于将参考声音信息传输到语音处理模块,所述语音处理模块用于根据参考声音信息将第二声音信息内的参考声音信息去除掉获得初步声音信息,所述语音处理模块用于将初步声音信息传输到噪音消除模块,所述噪音消除模块用于对初步声音信息做下述处理获得教学声音信号;处理步骤如下:
步骤一:对初步声音信息进行EMD分解,分解出噪声主导的高频分量和初步声音信息主导的低频分量;
步骤二:根据分量的不同,按照窗长选用规则选用不同窗长的TFPF对IMF分量进行处理;
步骤三:对处理过的IMF进行相加,并加上残量,最终得到初步声音信号经处理后的教学声音信号。
进一步地,所述窗长选用规则为:
因为噪声主导的高频分量中,主要成分为噪声,因此选用长窗长对高频IMF进行噪声压制;而初步声音信号主导的低频分量因为噪声含量少,初步声音信号成分多,因此选取短窗长,主要是保持初步声音信号的成分,去除少量的噪声分量。
进一步地,所述噪音消除模块用于将教学声音信号传输到控制器,所述控制器用于将教学声音信号传输到语音播放模块,所述语音播放模块用于播放教学声音信号。
进一步地,所述语音处理模块还用于在参考声音信息与第二声音信息一致时向控制器传输停播信号;
所述控制器还用于将停播信号传输到语音播放模块,所述语音播放模块在接收到控制器传输的停播信号时会停止播放。
进一步地,所述控制器还用于将教学声音信号传输到语音转文字模块,所述语音转文字模块用于将教学声音信号转换为教学文字信号;
所述语音转文字模块用于将教学文字信号传输到显示模块,所述显示模块用于实时显示教学文字信号。
本发明的有益效果:本发明通过第一语音录入模块实时录制教师讲课的第一声音信息,通过第二语音录入模块用于录入教师所在环境内所有声音的第二声音信息,所述第二语音录入模块用于将第二声音信息传输到人声消除模块,之后通过噪音消除模块对初步声音信息做相关处理获得教学声音信号,之后将其播放出来,同时借助语音转文字模块将其转换为文字,之后通过显示模块实时显示,便于学生实时观看;本发明简单有效,且易于实用。
附图说明
为了便于本领域技术人员理解,下面结合附图对本发明作进一步的说明。
图1为本发明的系统框图。
具体实施方式
如图1所示,一种在线互动直播噪声处理系统,包括第一语音录入模块、第二语音录入模块、人声消除模块、语音处理模块、噪音消除模块、控制器、语音播放模块、语音转文字模块和显示模块;
其中,所述第一语音录入模块用于实时录制教师讲课的第一声音信息,所述第一语音录入模块用于将第一声音信息传输到语音处理模块;所述第二语音录入模块用于录入教师所在环境内所有声音的第二声音信息,所述第二语音录入模块用于将第二声音信息传输到人声消除模块;
所述人声消除模块接收到第二语音录入模块传输的第二声音信息并将第二声音信息中的人声去除掉获得参考声音信息,所述人声消除模块用于将参考声音信息传输到语音处理模块,所述语音处理模块用于根据参考声音信息将第二声音信息内的参考声音信息去除掉获得初步声音信息,所述语音处理模块用于将初步声音信息传输到噪音消除模块,所述噪音消除模块用于对初步声音信息做下述处理获得教学声音信号;处理步骤如下:
步骤一:对初步声音信息进行EMD分解,分解出噪声主导的高频分量和初步声音信息主导的低频分量;
步骤二:根据分量的不同,按照窗长选用规则选用不同窗长的TFPF对IMF分量进行处理;
步骤三:对处理过的IMF进行相加,并加上残量,最终得到初步声音信号经处理后的教学声音信号。
进一步地,所述窗长选用规则为:
因为噪声主导的高频分量中,主要成分为噪声,因此选用长窗长对高频IMF进行噪声压制;而初步声音信号主导的低频分量因为噪声含量少,初步声音信号成分多,因此选取短窗长,主要是保持初步声音信号的成分,去除少量的噪声分量。
进一步地,所述噪音消除模块用于将教学声音信号传输到控制器,所述控制器用于将教学声音信号传输到语音播放模块,所述语音播放模块用于播放教学声音信号。
进一步地,所述语音处理模块还用于在参考声音信息与第二声音信息一致时向控制器传输停播信号;
所述控制器还用于将停播信号传输到语音播放模块,所述语音播放模块在接收到控制器传输的停播信号时会停止播放。
进一步地,所述控制器还用于将教学声音信号传输到语音转文字模块,所述语音转文字模块用于将教学声音信号转换为教学文字信号;
所述语音转文字模块用于将教学文字信号传输到显示模块,所述显示模块用于实时显示教学文字信号。
一种在线互动直播噪声处理系统,在工作时,通过第一语音录入模块实时录制教师讲课的第一声音信息,通过第二语音录入模块用于录入教师所在环境内所有声音的第二声音信息,所述第二语音录入模块用于将第二声音信息传输到人声消除模块,之后通过噪音消除模块对初步声音信息做相关处理获得教学声音信号,之后将其播放出来,同时借助语音转文字模块将其转换为文字,之后通过显示模块实时显示,便于学生实时观看;本发明简单有效,且易于实用。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (5)

1.一种在线互动直播噪声处理系统,其特征在于,包括第一语音录入模块、第二语音录入模块、人声消除模块、语音处理模块、噪音消除模块、控制器、语音播放模块、语音转文字模块和显示模块;
其中,所述第一语音录入模块用于实时录制教师讲课的第一声音信息,所述第一语音录入模块用于将第一声音信息传输到语音处理模块;所述第二语音录入模块用于录入教师所在环境内所有声音的第二声音信息,所述第二语音录入模块用于将第二声音信息传输到人声消除模块;
所述人声消除模块接收到第二语音录入模块传输的第二声音信息并将第二声音信息中的人声去除掉获得参考声音信息,所述人声消除模块用于将参考声音信息传输到语音处理模块,所述语音处理模块用于根据参考声音信息将第二声音信息内的参考声音信息去除掉获得初步声音信息,所述语音处理模块用于将初步声音信息传输到噪音消除模块,所述噪音消除模块用于对初步声音信息做下述处理获得教学声音信号;处理步骤如下:
步骤一:对初步声音信息进行EMD分解,分解出噪声主导的高频分量和初步声音信息主导的低频分量;
步骤二:根据分量的不同,按照窗长选用规则选用不同窗长的TFPF对IMF分量进行处理;
步骤三:对处理过的IMF进行相加,并加上残量,最终得到初步声音信号经处理后的教学声音信号。
2.根据权利要求1所述的一种在线互动直播噪声处理系统,其特征在于,所述窗长选用规则为:
因为噪声主导的高频分量中,主要成分为噪声,因此选用长窗长对高频IMF进行噪声压制;而初步声音信号主导的低频分量因为噪声含量少,初步声音信号成分多,因此选取短窗长,主要是保持初步声音信号的成分,去除少量的噪声分量。
3.根据权利要求1所述的一种在线互动直播噪声处理系统,其特征在于,所述噪音消除模块用于将教学声音信号传输到控制器,所述控制器用于将教学声音信号传输到语音播放模块,所述语音播放模块用于播放教学声音信号。
4.根据权利要求1所述的一种在线互动直播噪声处理系统,其特征在于,所述语音处理模块还用于在参考声音信息与第二声音信息一致时向控制器传输停播信号;
所述控制器还用于将停播信号传输到语音播放模块,所述语音播放模块在接收到控制器传输的停播信号时会停止播放。
5.根据权利要求1所述的一种在线互动直播噪声处理系统,其特征在于,所述控制器还用于将教学声音信号传输到语音转文字模块,所述语音转文字模块用于将教学声音信号转换为教学文字信号;
所述语音转文字模块用于将教学文字信号传输到显示模块,所述显示模块用于实时显示教学文字信号。
CN201810779628.4A 2018-07-16 2018-07-16 一种在线互动直播噪声处理系统 Pending CN109087658A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810779628.4A CN109087658A (zh) 2018-07-16 2018-07-16 一种在线互动直播噪声处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810779628.4A CN109087658A (zh) 2018-07-16 2018-07-16 一种在线互动直播噪声处理系统

Publications (1)

Publication Number Publication Date
CN109087658A true CN109087658A (zh) 2018-12-25

Family

ID=64838070

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810779628.4A Pending CN109087658A (zh) 2018-07-16 2018-07-16 一种在线互动直播噪声处理系统

Country Status (1)

Country Link
CN (1) CN109087658A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111522971A (zh) * 2020-04-08 2020-08-11 广东小天才科技有限公司 一种直播教学中辅助用户听课的方法及装置
CN115394310A (zh) * 2022-08-19 2022-11-25 中邮消费金融有限公司 一种基于神经网络的背景人声去除方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201177964Y (zh) * 2008-01-30 2009-01-07 联创汽车电子有限公司 车内主动消声系统
CN101873363A (zh) * 2010-06-09 2010-10-27 中兴通讯股份有限公司 使用双麦克抑制噪声的方法及终端
CN102469387A (zh) * 2010-11-15 2012-05-23 财团法人工业技术研究院 抑制噪音系统与方法
CN105791713A (zh) * 2016-03-21 2016-07-20 安徽声讯信息技术有限公司 一种智能语音文字字幕同步播音的装置
CN106210219A (zh) * 2015-05-06 2016-12-07 小米科技有限责任公司 降噪方法及装置
CN107197388A (zh) * 2017-06-29 2017-09-22 广州华多网络科技有限公司 一种直播降噪的方法及系统
CN108173793A (zh) * 2017-12-26 2018-06-15 哈尔滨理工大学 基于emd-tfpf的电力线通信信号去噪算法
CN108227001A (zh) * 2017-12-31 2018-06-29 吉林大学 基于snmf-2d时频谱分离的沙漠低频噪声消减方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201177964Y (zh) * 2008-01-30 2009-01-07 联创汽车电子有限公司 车内主动消声系统
CN101873363A (zh) * 2010-06-09 2010-10-27 中兴通讯股份有限公司 使用双麦克抑制噪声的方法及终端
CN102469387A (zh) * 2010-11-15 2012-05-23 财团法人工业技术研究院 抑制噪音系统与方法
CN106210219A (zh) * 2015-05-06 2016-12-07 小米科技有限责任公司 降噪方法及装置
CN105791713A (zh) * 2016-03-21 2016-07-20 安徽声讯信息技术有限公司 一种智能语音文字字幕同步播音的装置
CN107197388A (zh) * 2017-06-29 2017-09-22 广州华多网络科技有限公司 一种直播降噪的方法及系统
CN108173793A (zh) * 2017-12-26 2018-06-15 哈尔滨理工大学 基于emd-tfpf的电力线通信信号去噪算法
CN108227001A (zh) * 2017-12-31 2018-06-29 吉林大学 基于snmf-2d时频谱分离的沙漠低频噪声消减方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
翟明岳等: "基于EMD-TFPF算法在电力线通信噪声消除技术研究" *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111522971A (zh) * 2020-04-08 2020-08-11 广东小天才科技有限公司 一种直播教学中辅助用户听课的方法及装置
CN115394310A (zh) * 2022-08-19 2022-11-25 中邮消费金融有限公司 一种基于神经网络的背景人声去除方法及系统
CN115394310B (zh) * 2022-08-19 2023-04-07 中邮消费金融有限公司 一种基于神经网络的背景人声去除方法及系统

Similar Documents

Publication Publication Date Title
Yürük Using Kahoot as a skill improvement technique in pronunciation
McKay Speaking up: voice amplification and women's struggle for public expression
Li et al. A research on using English movies to improve Chinese college students' oral English
CN107633719A (zh) 基于多语种人机交互的拟人形象人工智能教学系统和方法
CN106485968A (zh) 在线课堂互动交流系统
CN107886784A (zh) 一种基于vr眼镜的教学系统
CN109087658A (zh) 一种在线互动直播噪声处理系统
Purba et al. Investigation of decoding fillers used in an English learning talk show “English with Alice”
Rashidova Potential difficulties in learning listening
CN108831215A (zh) 一种基于云数据库的音乐老师在线教学系统
CN107995534A (zh) 一种远程教学系统
Siegel et al. Imitation of intonation by infants
CN109741645A (zh) Ai机器人引导及互动对话教学系统
Sugai et al. The time domain factors affecting EFL learners’ listening comprehension: A study on Japanese EFL learners
Haerunnisa et al. THE USE OF DUBBING VIDEO TECHNIQUE TO IMPROVE STUDENTS’SPEAKING SKILL AT SMPN 35 MAKASSAR
Belo et al. Factors Enabling Children Acquiring Indonesian as A Second Language: an East Timor Perspective
CN108962257A (zh) 一种在线互动直播回音消除系统
Cross 'Watch mi eyes': The predicament of visual and scribal literacy choices, as explored with rural Jamaican adolescent boys
Setiawati et al. Pragmatics competence of preschool age children
Varhola “His lectures were like watching a show on Netflix”: A success story of laugh tracks in prerecorded undergraduate lessons
TWI717211B (zh) 遠距教學線上互動直播系統
Bee The voice of the station
Kvile From the Bedroom to the Moon: Tuning into the Relations of Children and Music through Spacetimemattering
Mauro How we, uh, perceive disfluencies: the effect of linguistic disfluencies on judgements of learning, attention-orientation and academic materials
Smoyak Do you coddle or challenge?

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181225