CN112802489A - 一种通话语音自动调节系统及方法 - Google Patents

一种通话语音自动调节系统及方法 Download PDF

Info

Publication number
CN112802489A
CN112802489A CN202110380050.7A CN202110380050A CN112802489A CN 112802489 A CN112802489 A CN 112802489A CN 202110380050 A CN202110380050 A CN 202110380050A CN 112802489 A CN112802489 A CN 112802489A
Authority
CN
China
Prior art keywords
voice
signal
frequency
call
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110380050.7A
Other languages
English (en)
Inventor
刘永华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Jianpi Technology Co ltd
Original Assignee
Guangzhou Jianpi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Jianpi Technology Co ltd filed Critical Guangzhou Jianpi Technology Co ltd
Priority to CN202110380050.7A priority Critical patent/CN112802489A/zh
Publication of CN112802489A publication Critical patent/CN112802489A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B3/00Audible signalling systems; Audible personal calling systems
    • G08B3/10Audible signalling systems; Audible personal calling systems using electric transmission; using electromagnetic transmission
    • G08B3/1008Personal calling arrangements or devices, i.e. paging systems
    • G08B3/1016Personal calling arrangements or devices, i.e. paging systems using wireless transmission
    • G08B3/1025Paging receivers with audible signalling details
    • G08B3/1033Paging receivers with audible signalling details with voice message alert
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0224Processing in the time domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Electromagnetism (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种通话语音自动调节系统及方法,包括:信号采集单元、噪声信号强度获取单元、场景模拟测试单元、通话频率采集单元、数据传输中心、信号强度比较单元、滤波处理单元、目标语音信号获取单元、通话频率测试单元、频率分析单元和语音频率调节单元,通过信号采集单元采集在火灾现场通话呼救时的语音信号和周围环境的噪声信号,比较两个信号强度,通过滤波处理单元依据对信号时域和频域的分析设计数字滤波器滤除噪声,对滤波后的语音信号进行通话频率测试,建立火灾模拟场景,根据男女生通话呼救时的清晰语音频率对测试的语音进行调节,得出了清晰、质量高的通话语音,进一步帮助了消防中心准确地获取关键信息并尽快地实施救援。

Description

一种通话语音自动调节系统及方法
技术领域
本发明涉及电话通信技术领域,具体为一种通话语音自动调节系统及方法。
背景技术
通信时代,手机是人们生活中必不可少的设备,日常生活中,用手机进行通话也是基本的通讯方式,在通话时,语音的质量和清晰度是需要不断完善和提高的,提高通话语音质量和清晰度不仅能够在生活中提高通话对象听语音时的舒适度,更能帮助通话对象在一些紧急情况中获取关键和完整信息,例如在火灾中,人们拨打电话进行呼救时可能因为情绪的不稳定而说不清话,也可能因为周围嘈杂环境而不能传输清晰语音内容,消防中心不能获取关键信息,如:发生火灾的地点、火源和火势大小等,这种情况下,需要对通话语音进行调节,滤除周围噪声是基本提高通话语音质量的方法,由于呼救人员的声音频率各不相同,男女生的语音频率也相差较大,在此基础上建立模拟火灾场景,通过大数据采集不同呼救人员清晰的声音频率,将滤除噪声后的语音靠近对应身份的人的语音频率进行调节能够得出更加清晰、质量高的语音,进一步帮助了消防中心准确地获取关键信息并尽快地实施救援。
所以,人们需要一种通话语音自动调节系统及方法来解决上述问题。
发明内容
本发明的目的在于提供一种通话语音自动调节系统及方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:一种通话语音自动调节系统,其特征在于:包括:一种通话语音自动调节系统,其特征在于:包括:信号采集单元、噪声信号强度获取单元、场景模拟测试单元、通话频率采集单元、数据传输中心、信号强度比较单元、滤波处理单元、目标语音信号获取单元、通话频率测试单元、频率分析单元和语音频率调节单元;
所述信号传输中心的输入端连接所述信号采集单元、所述噪声信号强度获取单元和所述通话频率采集单元的输出端,所述通话频率采集单元的输入端连接所述场景模拟测试单元的输出端,所述数据传输中心的输出端连接所述数据调取单元的输入端,所述数据调取单元的输出端连接所述信号强度比较单元和所述频率分析单元的输入端,所述信号强度比较单元的输出端连接所述滤波处理单元的输入端,所述滤波处理单元的输出端连接所述目标语音信号获取单元的输入端,所述目标语音信号获取单元的输出端连接所述通话频率测试单元的输入端,所述通话频率测试单元的输出端连接所述频率分析单元的输入端,所述频率分析单元的输出端连接所述语音频率调节单元的输入端;
所述信号采集单元采集在火灾现场通话呼救时的语音信号和周围环境的噪声信号,测试噪声信号强度,将采集到的信号强度数据传输到所述数据传输中心,所述数据调取单元调取信号强度数据到所述信号强度比较单元,所述信号强度比较单元比较通话语音信号强度和噪声信号强度,若噪声信号强度大于语音信号强度导致通话语音听不清楚,通过所述滤波处理单元滤除噪声信号,将处理后的语音信号传输到所述目标语音信号获取单元中;
所述场景模拟测试单元建立火灾模拟场景,测试不同人通话呼救时的语音频率,将测试数据传输到所述通话频率采集单元中,所述通话频率采集单元采集整理测试的语音频率数据并传输到所述数据传输中心中,所述数据调取单元调取语音频率数据至所述频率分析单元,所述目标语音信号获取单元在处理后的语音信号中获取目标语音信号,将目标语音信息传输到所述通话频率测试单元中,所述通话频率测试单元测试目标语音信号的频率,将测试数据传输到所述频率分析单元中,所述频率分析单元比较分析采集和测试的数据,将测试到的语音频率进行归类,将比较分析的结果传输到所述语音频率调节单元中,所述语音频率调节单元依据分析结果对测试到的语音频率进行调节并输出,在滤除通话周围噪声的基础上调节通话语音的频率,不仅提高了通话语音的质量,也提高了通话语音的清晰度。
进一步的,在火灾现场通话呼救时,利用所述信号采集单元采集通话语音信号,通过对一定帧长的语音信号波形分析得出通话语音的信号强度,通过所述噪声信号强度获取单元以同样的方式采集在相同帧长范围内周围噪声信号的强度,将采集到的信号强度数据传输到所述数据传输中心中。
进一步的,所述数据调取单元调取所述数据传输中心的信号强度数据至所述信号强度比较单元,利用所述信号强度比较单元比较通话语音信号强度和周围噪声信号强度,得出信号强度比值,比值越大,说明通话语音中混入的噪声越少,即通话语音的质量越高,设置信号强度比值阈值,若信号强度小于阈值,需要对通话语音信号进行滤波处理。
进一步的,将需要进行滤波处理的通话语音信号传输到所述滤波处理单元中,利用所述滤波处理单元滤除噪声信号:对夹杂噪声的通话语音信号进行时域分析,通过对通话语音信号进行傅里叶变换分析语音信号的频域波形,根据时域和频域的分析结果设计数字滤波器滤除噪声,通过设计的滤波器对语音信号进行滤波得出滤波后的信号,对滤波后的语音进行回放,利用所述滤波处理单元将滤波后的语音传输到所述目标语音信号获取单元中,根据语音信号的时域和频域波形的不同设计唯一合适的数字滤波器滤除噪声,有利于在滤除噪声的同时避免通话语音的滤除、使语音信息不完整而失真,提高了通话语音质量。
一种通话语音自动调节方法,其特征在于:包括以下步骤:
S1:在火灾现场通话呼救时,采集通话语音信号和周围噪声信号强度;
S2:比较通话语音信号强度和周围噪声信号强度,对噪声信号进行滤波处理;
S3:滤波处理后获取目标通话语音信号,进行通话语音频率的测试;
S4:建立火灾模拟场景,采集不同的人在该场景下通话呼救的频率数据;
S5:将采集到的数据与测试的数据进行比较分析,调节语音频率。
进一步的,在步骤S1中:在火灾现场通话呼救时,利用信号采集单元采集通话语音信号强度:通话语音信号短时帧长范围为[0,N-1],其中,N表示语音短时采集的帧长,设采集到的语音信号为s(m),根据下列公式计算通话语音的信号强度E0
Figure 238387DEST_PATH_IMAGE001
通过噪声信号强度获取单元以同样的方式采集到在相同帧长范围内周围噪声信号的强度为E,将采集到的信号强度数据传输到数据传输中心中,通过计算每一帧语音信号的能量值得出通话语音信号强度的目的是与噪声信号强度进行比较,判断通话语音中混入的噪声多少,有利于进一步滤除通话语音中的噪声,提高通话语音质量。
进一步的,在步骤S2中:数据调取单元调取所述数据传输中心的信号强度数据至信号强度比较单元,利用信号强度比较单元比较通话语音信号强度E0和周围噪声信号强度E:根据下列公式得出信号强度比值W:
Figure 807908DEST_PATH_IMAGE002
信号强度比值W越大,说明通话语音中混入的噪声越少,即通话语音的质量越高,设置信号强度比值阈值为W,若
Figure 286294DEST_PATH_IMAGE003
,需要对通话语音信号进行滤波处理,将需要进行滤波处理的通话语音信号传输到滤波处理单元中,利用滤波处理单元滤除噪声信号:对通话语音信号进行时域分析,通过对通话语音信号进行傅里叶变换分析语音信号的频域波形,根据时域和频域的分析结果设计数字滤波器滤除噪声,通过设计的滤波器对语音信号进行滤波得出滤波后的信号,傅里叶变换是指能将满足一定条件的某个函数表示成三角函数或者它们积分的线性组合,是一种分析信号的方法,比较通话语音信号强度和周围噪声信号强度得出强度比值的目的是判断通话语音信号中夹杂的噪声信号能量,根据语音信号时域和频域波形的不同设计唯一合适的数字滤波器滤除噪声,有利于在滤除噪声的同时避免通话语音的滤除、使得语音信息不完整而失真的情况。
进一步的,在步骤S3中:利用matlab中的sound函数对滤波后的语音进行回放,利用滤波处理单元将滤波后的语音传输到目标语音信号获取单元中,利用目标语音信号获取单元获取目标通话语音并传输到通话频率测试单元,利用通话频率测试单元测试到目标通话语音的频率为fc,将测试到的语音频率f传输到频率分析单元中,sound函数是指matlab中的发声函数,能够帮助更方便地编辑声音,利用sound函数对滤波后的语音进行回放有利于清楚滤波前后的语音信号变化。
进一步的,在步骤S4中:通过场景模拟测试单元建立火灾模拟场景,测试不同男生在该场景下通话呼救的清晰语音频率集合为f={f1,f2,...,fn},其中,n表示测试的男生个数,测试不同女生在该场景下通话呼救的清晰语音频率集合为f={f1 ,f2 ,...,fn },其中,n表示测试的女生个数,测试的男女生数相同,设置男女生通话时的语音频率边界值为flimit,通过通话频率采集单元采集测试数据传输到数据传输中心,通过数据调取单元调取测试数据至频率分析单元中。
进一步的,在步骤S5中:所述频率分析单元接收到目标通话语音频率fc,将fc与flimit比较:若
Figure 992082DEST_PATH_IMAGE004
,说明通话呼救的人是男生,根据下列公式计算男生通话呼救的清晰语音频率最佳值f
Figure DEST_PATH_IMAGE005
将fc最大程度上调节到f,再将调节后的语音输出;若
Figure 747155DEST_PATH_IMAGE006
,说明通话呼救的人是女生,根据下列公式计算女生通话呼救的清晰语音频率最佳值f
Figure 679339DEST_PATH_IMAGE007
将fc最大程度上调节到f ,再将调节后的语音输出得到清晰的语音,由于男女生的语音频率也相差较大,先要将滤除噪声后的语音进行归类,识别呼救者的身份,再根据各自的音频范围进行调节通话语音,通过模拟火灾场景、采集男女生呼救时的清晰的语音频率,将采集到的清晰语音频率平均值作为最佳频率是最为合理的,将呼救的语音频率往靠近各自最佳的频率上进行调节,有利于提高通话语音的清晰度,也帮助了消防中心获取更准确的现场信息并迅速前往救援。
与现有技术相比,本发明所达到的有益效果是:
1.本发明通过信号采集单元采集在火灾现场通话呼救时的语音信号,截取一定帧长的短时语音信号,计算通话语音的信号强度,通过噪声信号强度获取单元以同样的方式采集在相同帧长范围内周围噪声信号的强度,利用信号强度比较单元比较通话语音信号强度和周围噪声信号强度,得出信号强度比值,比值越大,说明混在通话语音中混入的噪声越少,即通话语音的质量越高,对通话语音信号进行滤波处理,通过对通话语音信号进行傅里叶变换分析语音信号的频域波形,根据时域和频域的分析结果设计数字滤波器滤除噪声,通过设计的滤波器对语音信号进行滤波得出滤波后的信号,利用matlab中的sound函数对滤波后的语音进行回放以获取不含噪声的目标通话语音,火灾事故现场人员较多,环境也较嘈杂,在通话时需要滤除噪声信号,有利于提高通话语音的质量;
2.本发明通过通话频率测试单元测试目标通话语音频率,将测试到的语音频率传输到频率分析单元中,通过场景模拟测试单元建立火灾模拟场景,测试不同男生和女生在该场景下通话呼救的清晰语音频率,由于呼救人员的声音频率各不相同,男女生的语音频率也相差较大,设置男女生通话时的语音频率边界值,通过频率分析单元将目标通话语音频率和语音频率边界值相比较,判断呼救的语音频率属于男生还是女生,得出结果后根据各自采集到的清晰的语音频率,将呼救的语音频率往靠近各自最佳的频率上进行调节,有利于提高通话语音的清晰度,也帮助了消防中心获取更准确的现场信息并迅速前往救援,在一定程度上减少了火灾的伤亡率。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明一种通话语音自动调节系统及方法的系统结构图;
图2是本发明一种通话语音自动调节系统及方法的方法步骤图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
请参阅图1-图2,本发明提供技术方案:一种通话语音自动调节系统,其特征在于:包括:一种通话语音自动调节系统,其特征在于:包括:信号采集单元、噪声信号强度获取单元、场景模拟测试单元、通话频率采集单元、数据传输中心、信号强度比较单元、滤波处理单元、目标语音信号获取单元、通话频率测试单元、频率分析单元和语音频率调节单元;
信号传输中心的输入端连接信号采集单元、噪声信号强度获取单元和通话频率采集单元的输出端,通话频率采集单元的输入端连接场景模拟测试单元的输出端,数据传输中心的输出端连接数据调取单元的输入端,数据调取单元的输出端连接信号强度比较单元和频率分析单元的输入端,信号强度比较单元的输出端连接滤波处理单元的输入端,滤波处理单元的输出端连接目标语音信号获取单元的输入端,目标语音信号获取单元的输出端连接通话频率测试单元的输入端,通话频率测试单元的输出端连接频率分析单元的输入端,频率分析单元的输出端连接语音频率调节单元的输入端;
信号采集单元采集在火灾现场通话呼救时的语音信号和周围环境的噪声信号,测试噪声信号强度,将采集到的信号强度数据传输到数据传输中心,数据调取单元调取信号强度数据到信号强度比较单元,信号强度比较单元比较通话语音信号强度和噪声信号强度,若噪声信号强度大于语音信号强度导致通话语音听不清楚,通过滤波处理单元滤除噪声信号,将处理后的语音信号传输到目标语音信号获取单元中;
场景模拟测试单元建立火灾模拟场景,测试不同人通话呼救时的语音频率,将测试数据传输到通话频率采集单元中,通话频率采集单元采集整理测试的语音频率数据并传输到数据传输中心中,数据调取单元调取语音频率数据至频率分析单元,目标语音信号获取单元在处理后的语音信号中获取目标语音信号,将目标语音信息传输到通话频率测试单元中,通话频率测试单元测试目标语音信号的频率,将测试数据传输到频率分析单元中,频率分析单元比较分析采集和测试的数据,将测试到的语音频率进行归类,将比较分析的结果传输到语音频率调节单元中,语音频率调节单元依据分析结果对测试到的语音频率进行调节并输出,在滤除通话周围噪声的基础上调节通话语音的频率,不仅能提高通话语音的质量,也能提高通话语音的清晰度。
在火灾现场通话呼救时,利用信号采集单元采集通话语音信号,通过对一定帧长的语音信号波形分析得出通话语音的信号强度,通过噪声信号强度获取单元以同样的方式采集在相同帧长范围内周围噪声信号的强度,将采集到的信号强度数据传输到数据传输中心中。
数据调取单元调取数据传输中心的信号强度数据至信号强度比较单元,利用信号强度比较单元比较通话语音信号强度和周围噪声信号强度,得出信号强度比值,比值越大,说明通话语音中混入的噪声越少,即通话语音的质量越高,设置信号强度比值阈值,若信号强度小于阈值,需要对通话语音信号进行滤波处理。
将需要进行滤波处理的通话语音信号传输到滤波处理单元中,利用滤波处理单元滤除噪声信号:对夹杂噪声的通话语音信号进行时域分析,通过对通话语音信号进行傅里叶变换分析语音信号的频域波形,根据时域和频域的分析结果设计数字滤波器滤除噪声,通过设计的滤波器对语音信号进行滤波得出滤波后的信号,对滤波后的语音进行回放,利用滤波处理单元将滤波后的语音传输到目标语音信号获取单元中,根据语音信号的时域和频域波形的不同设计唯一合适的数字滤波器滤除噪声,便于在滤除噪声的同时避免通话语音的滤除、使语音信息不完整而失真,便于提高通话语音质量。
一种通话语音自动调节方法,其特征在于:包括以下步骤:
S1:在火灾现场通话呼救时,采集通话语音信号和周围噪声信号强度;
S2:比较通话语音信号强度和周围噪声信号强度,对噪声信号进行滤波处理;
S3:滤波处理后获取目标通话语音信号,进行通话语音频率的测试;
S4:建立火灾模拟场景,采集不同的人在该场景下通话呼救的频率数据;
S5:将采集到的数据与测试的数据进行比较分析,调节语音频率。
在步骤S1中:在火灾现场通话呼救时,利用信号采集单元采集通话语音信号强度:通话语音信号短时帧长范围为[0,N-1],其中,N表示语音短时采集的帧长,设采集到的语音信号为s(m),根据下列公式计算通话语音的信号强度E0
Figure 86049DEST_PATH_IMAGE008
通过噪声信号强度获取单元以同样的方式采集到在相同帧长范围内周围噪声信号的强度为E,将采集到的信号强度数据传输到数据传输中心中,通过计算每一帧语音信号的能量值得出通话语音信号强度的目的是与噪声信号强度进行比较,判断通话语音中混入的噪声多少,便于进一步滤除通话语音中的噪声,提高通话语音质量。
在步骤S2中:数据调取单元调取数据传输中心的信号强度数据至信号强度比较单元,利用信号强度比较单元比较通话语音信号强度E0和周围噪声信号强度E:根据下列公式得出信号强度比值W:
Figure 911923DEST_PATH_IMAGE002
信号强度比值W越大,说明通话语音中混入的噪声越少,即通话语音的质量越高,设置信号强度比值阈值为W,若
Figure 512931DEST_PATH_IMAGE003
,需要对通话语音信号进行滤波处理,将需要进行滤波处理的通话语音信号传输到滤波处理单元中,利用滤波处理单元滤除噪声信号:对通话语音信号进行时域分析,通过对通话语音信号进行傅里叶变换分析语音信号的频域波形,根据时域和频域的分析结果设计数字滤波器滤除噪声,通过设计的滤波器对语音信号进行滤波得出滤波后的信号,傅里叶变换是指能将满足一定条件的某个函数表示成三角函数或者它们积分的线性组合,是一种分析信号的方法,比较通话语音信号强度和周围噪声信号强度得出强度比值的目的是判断通话语音信号中夹杂的噪声信号能量,根据语音信号时域和频域波形的不同设计唯一合适的数字滤波器滤除噪声,便于在滤除噪声的同时避免通话语音的滤除、使得语音信息不完整而失真的情况。
在步骤S3中:利用matlab中的sound函数对滤波后的语音进行回放,利用滤波处理单元将滤波后的语音传输到目标语音信号获取单元中,利用目标语音信号获取单元获取目标通话语音并传输到通话频率测试单元,利用通话频率测试单元测试到目标通话语音的频率为fc,将测试到的语音频率f传输到频率分析单元中,sound函数是指matlab中的发声函数,能够帮助更方便地编辑声音,利用sound函数对滤波后的语音进行回放便于清楚滤波前后的语音信号变化。
在步骤S4中:通过场景模拟测试单元建立火灾模拟场景,测试不同男生在该场景下通话呼救的清晰语音频率集合为f={f1,f2,...,fn},其中,n表示测试的男生个数,测试不同女生在该场景下通话呼救的清晰语音频率集合为f={f1 ,f2 ,...,fn },其中,n表示测试的女生个数,测试的男女生数相同,设置男女生通话时的语音频率边界值为flimit,通过通话频率采集单元采集测试数据传输到数据传输中心,通过数据调取单元调取测试数据至频率分析单元中。
在步骤S5中:频率分析单元接收到目标通话语音频率fc,将fc与flimit比较:若
Figure 932411DEST_PATH_IMAGE004
,说明通话呼救的人是男生,根据下列公式计算男生通话呼救的清晰语音频率最佳值f
Figure 142812DEST_PATH_IMAGE005
将fc最大程度上调节到f,再将调节后的语音输出;若
Figure 823192DEST_PATH_IMAGE009
,说明通话呼救的人是女生,根据下列公式计算女生通话呼救的清晰语音频率最佳值f
Figure 969003DEST_PATH_IMAGE010
将fc最大程度上调节到f ,再将调节后的语音输出得到清晰的语音,由于男女生的语音频率也相差较大,先要将滤除噪声后的语音进行归类,识别呼救者的身份,再根据各自的音频范围进行调节通话语音,通过模拟火灾场景、采集男女生呼救时的清晰的语音频率,将采集到的清晰语音频率平均值作为最佳频率是最为合理的,将呼救的语音频率往靠近各自最佳的频率上进行调节,便于提高通话语音的清晰度,能够帮助消防中心获取更准确的现场信息并迅速前往救援。
实施例一:在获取滤除噪声的通话语音后,利用通话频率测试单元测试到目标通话语音的频率为fc=160(Hz),通过场景模拟测试单元建立火灾模拟场景,测试不同男生在该场景下通话呼救的清晰语音频率集合为f={f1,f2,f3,f4,f5}={166.4,164.6,140.2,159.2,150},测试不同女生在该场景下通话呼救的清晰语音频率集合为f={f1 ,f2 ,f3 ,f4 ,f5 }={240.2,212.3,279.2,264.6,254.3},设置男女生通话时的语音频率边界值为flimit=200(Hz),因为fc=160(Hz)<200(Hz),
Figure 413DEST_PATH_IMAGE004
,所以判断通话呼救的人是男生,根据公式
Figure 247461DEST_PATH_IMAGE011
计算男生通话呼救的清晰语音频率最佳值f=156.08(Hz),将fc最大程度上调节到f,得到最清晰的语音,将调节后的语音输出。
最后应说明的是:以上所述仅为本发明的优选实例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种通话语音自动调节系统,其特征在于:包括:信号采集单元、噪声信号强度获取单元、场景模拟测试单元、通话频率采集单元、数据传输中心、信号强度比较单元、滤波处理单元、目标语音信号获取单元、通话频率测试单元、频率分析单元和语音频率调节单元;
所述信号传输中心的输入端连接所述信号采集单元、所述噪声信号强度获取单元和所述通话频率采集单元的输出端,所述通话频率采集单元的输入端连接所述场景模拟测试单元的输出端,所述数据传输中心的输出端连接所述数据调取单元的输入端,所述数据调取单元的输出端连接所述信号强度比较单元和所述频率分析单元的输入端,所述信号强度比较单元的输出端连接所述滤波处理单元的输入端,所述滤波处理单元的输出端连接所述目标语音信号获取单元的输入端,所述目标语音信号获取单元的输出端连接所述通话频率测试单元的输入端,所述通话频率测试单元的输出端连接所述频率分析单元的输入端,所述频率分析单元的输出端连接所述语音频率调节单元的输入端;
所述信号采集单元采集在火灾现场通话呼救时的语音信号和周围环境的噪声信号,测试噪声信号强度,将采集到的信号强度数据传输到所述数据传输中心,所述数据调取单元调取信号强度数据到所述信号强度比较单元,所述信号强度比较单元比较通话语音信号强度和噪声信号强度,若噪声信号强度大于语音信号强度导致通话语音听不清楚,通过所述滤波处理单元滤除噪声信号,将处理后的语音信号传输到所述目标语音信号获取单元中;
所述场景模拟测试单元建立火灾模拟场景,测试不同人通话呼救时的语音频率,将测试数据传输到所述通话频率采集单元中,所述通话频率采集单元采集整理测试的语音频率数据并传输到所述数据传输中心中,所述数据调取单元调取语音频率数据至所述频率分析单元,所述目标语音信号获取单元在处理后的语音信号中获取目标语音信号,将目标语音信息传输到所述通话频率测试单元中,所述通话频率测试单元测试目标语音信号的频率,将测试数据传输到所述频率分析单元中,所述频率分析单元比较分析采集和测试的数据,将测试到的语音频率进行归类,将比较分析的结果传输到所述语音频率调节单元中,所述语音频率调节单元依据分析结果对测试到的语音频率进行调节并输出。
2.根据权利要求1所述的一种通话语音自动调节系统,其特征在于:在火灾现场通话呼救时,利用所述信号采集单元采集通话语音信号,通过对一定帧长的语音信号波形分析得出通话语音的信号强度,通过所述噪声信号强度获取单元以同样的方式采集在相同帧长范围内周围噪声信号的强度,将采集到的信号强度数据传输到所述数据传输中心中。
3.根据权利要求2所述的一种通话语音自动调节系统,其特征在于:所述数据调取单元调取所述数据传输中心的信号强度数据至所述信号强度比较单元,利用所述信号强度比较单元比较通话语音信号强度和周围噪声信号强度,得出信号强度比值,比值越大,说明通话语音中混入的噪声越少,即通话语音的质量越高,设置信号强度比值阈值,若信号强度小于阈值,需要对通话语音信号进行滤波处理。
4.根据权利要求3所述的一种通话语音自动调节系统,其特征在于:将需要进行滤波处理的通话语音信号传输到所述滤波处理单元中,利用所述滤波处理单元滤除噪声信号:对夹杂噪声的通话语音信号进行时域分析,通过对通话语音信号进行傅里叶变换分析语音信号的频域波形,根据时域和频域的分析结果设计数字滤波器滤除噪声,通过设计的滤波器对语音信号进行滤波得出滤波后的信号,对滤波后的语音进行回放,利用所述滤波处理单元将滤波后的语音传输到所述目标语音信号获取单元中。
5.一种通话语音自动调节方法,其特征在于:包括以下步骤:
S1:在火灾现场通话呼救时,采集通话语音信号和周围噪声信号强度;
S2:比较通话语音信号强度和周围噪声信号强度,对噪声信号进行滤波处理;
S3:滤波处理后获取目标通话语音信号,进行通话语音频率的测试;
S4:建立火灾模拟场景,采集不同的人在该场景下通话呼救的频率数据;
S5:将采集到的数据与测试的数据进行比较分析,调节语音频率。
6.根据权利要求5所述的一种通话语音自动调节方法,其特征在于:在步骤S1中:在火灾现场通话呼救时,利用信号采集单元采集通话语音信号强度:通话语音信号短时帧长范围为[0,N-1],其中,N表示语音短时采集的帧长,设采集到的语音信号为s(m),根据下列公式计算通话语音的信号强度E0
Figure 545318DEST_PATH_IMAGE001
通过噪声信号强度获取单元以同样的方式采集到在相同帧长范围内周围噪声信号的强度为E,将采集到的信号强度数据传输到数据传输中心中。
7.根据权利要求6所述的一种通话语音自动调节方法,其特征在于:在步骤S2中:数据调取单元调取所述数据传输中心的信号强度数据至信号强度比较单元,利用信号强度比较单元比较通话语音信号强度E0和周围噪声信号强度E:根据下列公式得出信号强度比值W:
Figure 721084DEST_PATH_IMAGE002
信号强度比值W越大,说明通话语音中混入的噪声越少,即通话语音的质量越高,设置信号强度比值阈值为W,若
Figure 708632DEST_PATH_IMAGE003
,需要对通话语音信号进行滤波处理,将需要进行滤波处理的通话语音信号传输到滤波处理单元中,利用滤波处理单元滤除噪声信号:对通话语音信号进行时域分析,通过对通话语音信号进行傅里叶变换分析语音信号的频域波形,根据时域和频域的分析结果设计数字滤波器滤除噪声,通过设计的滤波器对语音信号进行滤波得出滤波后的信号。
8.根据权利要求5所述的一种通话语音自动调节方法,其特征在于:在步骤S3中:利用matlab中的sound函数对滤波后的语音进行回放,利用滤波处理单元将滤波后的语音传输到目标语音信号获取单元中,利用目标语音信号获取单元获取目标通话语音并传输到通话频率测试单元,利用通话频率测试单元测试到目标通话语音的频率为fc,将测试到的语音频率f传输到频率分析单元中。
9.根据权利要求5所述的一种通话语音自动调节方法,其特征在于:在步骤S4中:通过场景模拟测试单元建立火灾模拟场景,测试不同男生在该场景下通话呼救的清晰语音频率集合为f={f1,f2,...,fn},其中,n表示测试的男生个数,测试不同女生在该场景下通话呼救的清晰语音频率集合为f={f1 ,f2 ,...,fn },其中,n表示测试的女生个数,测试的男女生数相同,设置男女生通话时的语音频率边界值为flimit,通过通话频率采集单元采集测试数据传输到数据传输中心,通过数据调取单元调取测试数据至频率分析单元中。
10.根据权利要求9所述的一种通话语音自动调节方法,其特征在于:在步骤S5中:所述频率分析单元接收到目标通话语音频率fc,将fc与flimit比较:若
Figure 995256DEST_PATH_IMAGE004
,说明通话呼救的人是男生,根据下列公式计算男生通话呼救的清晰语音频率最佳值f
Figure 886114DEST_PATH_IMAGE005
将fc最大程度上调节到f,再将调节后的语音输出;若
Figure 232782DEST_PATH_IMAGE006
,说明通话呼救的人是女生,根据下列公式计算女生通话呼救的清晰语音频率最佳值f
Figure 504363DEST_PATH_IMAGE007
将fc最大程度上调节到f ,再将调节后的语音输出得到清晰的语音。
CN202110380050.7A 2021-04-09 2021-04-09 一种通话语音自动调节系统及方法 Pending CN112802489A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110380050.7A CN112802489A (zh) 2021-04-09 2021-04-09 一种通话语音自动调节系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110380050.7A CN112802489A (zh) 2021-04-09 2021-04-09 一种通话语音自动调节系统及方法

Publications (1)

Publication Number Publication Date
CN112802489A true CN112802489A (zh) 2021-05-14

Family

ID=75816685

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110380050.7A Pending CN112802489A (zh) 2021-04-09 2021-04-09 一种通话语音自动调节系统及方法

Country Status (1)

Country Link
CN (1) CN112802489A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114792524A (zh) * 2022-06-24 2022-07-26 腾讯科技(深圳)有限公司 音频数据处理方法、装置、程序产品、计算机设备和介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102413218A (zh) * 2011-08-03 2012-04-11 宇龙计算机通信科技(深圳)有限公司 一种自动调节通话音质的方法、装置及通信终端
CN102498482A (zh) * 2009-09-14 2012-06-13 Srs实验室有限公司 用于自适应话音可懂度处理的系统
CN103236263A (zh) * 2013-03-27 2013-08-07 东莞宇龙通信科技有限公司 一种改善通话质量的方法、系统及移动终端
CN103489454A (zh) * 2013-09-22 2014-01-01 浙江大学 基于波形形态特征聚类的语音端点检测方法
US9190069B2 (en) * 2005-11-22 2015-11-17 2236008 Ontario Inc. In-situ voice reinforcement system
CN106710604A (zh) * 2016-12-07 2017-05-24 天津大学 提高语音可懂度的共振峰增强装置和方法
CN112309421A (zh) * 2019-07-29 2021-02-02 中国科学院声学研究所 一种融合信噪比与可懂度双重目标的语音增强方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9190069B2 (en) * 2005-11-22 2015-11-17 2236008 Ontario Inc. In-situ voice reinforcement system
CN102498482A (zh) * 2009-09-14 2012-06-13 Srs实验室有限公司 用于自适应话音可懂度处理的系统
CN102413218A (zh) * 2011-08-03 2012-04-11 宇龙计算机通信科技(深圳)有限公司 一种自动调节通话音质的方法、装置及通信终端
CN103236263A (zh) * 2013-03-27 2013-08-07 东莞宇龙通信科技有限公司 一种改善通话质量的方法、系统及移动终端
CN103489454A (zh) * 2013-09-22 2014-01-01 浙江大学 基于波形形态特征聚类的语音端点检测方法
CN106710604A (zh) * 2016-12-07 2017-05-24 天津大学 提高语音可懂度的共振峰增强装置和方法
CN112309421A (zh) * 2019-07-29 2021-02-02 中国科学院声学研究所 一种融合信噪比与可懂度双重目标的语音增强方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114792524A (zh) * 2022-06-24 2022-07-26 腾讯科技(深圳)有限公司 音频数据处理方法、装置、程序产品、计算机设备和介质
CN114792524B (zh) * 2022-06-24 2022-09-06 腾讯科技(深圳)有限公司 音频数据处理方法、装置、程序产品、计算机设备和介质

Similar Documents

Publication Publication Date Title
Studebaker et al. A frequency importance function for continuous discourse
Humes et al. Application of the Articulation Index and the Speech Transmission Index to the recognition of speech by normal-hearing and hearing-impaired listeners
Ching et al. Speech recognition of hearing-impaired listeners: Predictions from audibility and the limited role of high-frequency amplification
Turner et al. Benefits of amplification for speech recognition in background noise
Pollack et al. Masking of speech by noise at high sound levels
CN105050014A (zh) 一种基于智能手机的助听装置及实现方法
Xia et al. Effects of reverberation and noise on speech intelligibility in normal-hearing and aided hearing-impaired listeners
Cameron et al. Development of the North American Listening in Spatialized Noise–Sentences Test (NA LiSN-S): Sentence equivalence, normative data, and test–retest reliability studies
Jørgensen et al. Speech intelligibility evaluation for mobile phones
CN107948898A (zh) 一种助听器辅助验配系统及方法
Neuman et al. Effect of compression ratio in a slow‐acting compression hearing aid: Paired‐comparison judgments of quality
CN112802489A (zh) 一种通话语音自动调节系统及方法
US3784745A (en) Method and apparatus for providing electronic sound clarification for aurally handicapped persons
Adams et al. Effects of speech rate, background noise, and simulated hearing loss on speech rate judgment and speech intelligibility in young listeners
Ono et al. Clinical results of hearing aid with noise-level-controlled selective amplification
Sullivan et al. Amplification for listeners with steeply sloping, high-frequency hearing loss
Preminger et al. An examination of the practicality of the simplex procedure
CN114205724B (zh) 助听耳机的调试方法、装置以及设备
de Larrea-Mancera et al. Portable Automated Rapid Testing (PART) of auditory processing abilities in young normally-hearing listeners: A remotely administered replication with participant-owned devices
WO2019222477A1 (en) Auditory communication devices and related methods
CN105748079A (zh) 一种基于蓝牙耳机的听力测试方法和系统
Yanick Jr Effects of signal processing on intelligibility of speech in noise for persons with sensorineural hearing loss
Sorri et al. Solutions to electromagnetic interference problems between cochlear implants and GSM phones
Yanick et al. Signal processing to improve intelligibility in the presence of noice for persons with a ski-slope hearing impairment
Srinivasan et al. Normative psychoacoustic data using the portable automated rapid testing (PART) iPad application

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210514

RJ01 Rejection of invention patent application after publication