CN111613236A - 一种ct语音降噪方法 - Google Patents
一种ct语音降噪方法 Download PDFInfo
- Publication number
- CN111613236A CN111613236A CN202010655544.7A CN202010655544A CN111613236A CN 111613236 A CN111613236 A CN 111613236A CN 202010655544 A CN202010655544 A CN 202010655544A CN 111613236 A CN111613236 A CN 111613236A
- Authority
- CN
- China
- Prior art keywords
- voice
- noise
- noise reduction
- chip
- reduction method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000005070 sampling Methods 0.000 claims abstract description 6
- 230000007613 environmental effect Effects 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 5
- 238000002513 implantation Methods 0.000 claims description 4
- 230000002238 attenuated effect Effects 0.000 claims description 3
- 238000009434 installation Methods 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 9
- 230000003313 weakening effect Effects 0.000 abstract 1
- 238000003759 clinical diagnosis Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000001816 cooling Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000002591 computed tomography Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000017525 heat dissipation Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B6/00—Apparatus or devices for radiation diagnosis; Apparatus or devices for radiation diagnosis combined with radiation therapy equipment
- A61B6/02—Arrangements for diagnosis sequentially in different planes; Stereoscopic radiation diagnosis
- A61B6/03—Computed tomography [CT]
- A61B6/032—Transmission computed tomography [CT]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0224—Processing in the time domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
- G10L21/028—Voice signal separating using properties of sound source
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- High Energy & Nuclear Physics (AREA)
- Heart & Thoracic Surgery (AREA)
- Theoretical Computer Science (AREA)
- Pulmonology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Optics & Photonics (AREA)
- Pathology (AREA)
- Radiology & Medical Imaging (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Surgery (AREA)
- Animal Behavior & Ethology (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明公开了一种CT语音降噪方法,通过两个麦克风拾音,音频芯片对获取语音采样并数字化,通过内置算法将噪音成分进行弱化,将人声成分加强,提高降噪效果;且内置多种不同场景背景噪音,在特定的应用场景里,可以快速识别噪音成分,并进行精确降噪。
Description
技术领域
本发明涉及计算机断层成像技术领域,更具体涉及一种CT语音降噪方法。
背景技术
在进行CT临床扫描时,医生与患者需要进行必要的语音沟通,以保证扫描正常进行。语音沟通是双向的,医生在操作间说话通过麦克风传输到屏蔽间里面,患者在屏蔽间说话通过CT外罩上的麦克风传输到操作间,是医生能听到。但是由于CT里面的器件在运行过程中会发出巨大的噪音,如机架旋转时的噪音、球管旋转阳极的噪音、散热风扇的噪音。这些噪音距离外罩上的麦克风更近,使得病人的语音完全被噪音覆盖,医生无法听清,以至于发生突发状况时,医生不能及时的制止。因此,在CT对讲系统中需要用到语音降噪,提高CT的语音对讲质量。传统双麦降噪方法使用一只麦克风来识别环境噪音,一只麦克风来识别语音,经过一定比例的运算之后去除环境噪音,这种方法要求两只麦克风距离较远,且环境噪音不是很大的场景,在手机等手持式设备上应用得较多。
发明内容
针对现有技术的不足,本发明提供了一种CT语音降噪方法,能够将噪音成分弱化,将人声成分加强,降噪效果好且运算稳定。
为实现上述目的,本发明提供了如下技术方案:一种CT语音降噪方法,包括如下步骤:
(1)语音获取与数字化,通过两个麦克风获取语音信息室模拟量,然后经过音频芯片采样并数字化;
(2)语音提取,通过语音芯片的内置算法对数字化的语音进行空间域、时域和频域进行分析,以确定音频的成分;
(3)语音匹配,在语音芯片的内置算法中,已经对噪音和人声种类进行采样分析,通过步骤(2)的语音提取分辨出语音中的人声成分和噪音成分;
(4)语音加强与弱化,通过步骤(3)将语音匹配后,将噪音成分进行弱化,将人声成分加强。
采用高灵敏度麦克风与安森美公司的BR262音频芯片配合,高灵敏度MENS麦克风可以保证麦克风阵列的一致性,使两只麦克风的输入输出特性一致,对降噪算法更稳定,采用两只麦克风,对动态噪音的过滤效果优于一个麦克风,且MENS麦克风的灵敏度高于普通驻极体麦克风,对声源的定位更准。BR262芯片可通过配置芯片的外围电路来满足不同的应用场景。音频芯片内置语音提取算法,可分别出人声,风扇噪音,机械噪音、汽车噪音等各种噪音,开发简单。语音算法存储在音频芯片的DSP ROM内,上电即可加载。该算法可实现频域、空间域和时间域同时处理,通过麦克风对音频进行采样分析并处理提高性噪比。
进一步,所述音频芯片内植入有若干不同的场景背景噪音,音频处理器已经集成了降噪算法和基本的应用场景,但如果要提高降噪效果,需要特定的环境数据。在CT临床诊断中,CT的噪音分为两个部分,在CT待机时,CT的噪音主要来自CT上的各种散热风扇,在CT工作时,噪音包括风扇和转子旋转的噪音。在音频处理器的内置场景里是一些基本的噪音样本,如风扇噪音,汽车噪音等。但是CT的应用场景比较特殊,如果只套用基本的噪声样本,降噪效果可能不是非常理想,因此场景设置中,需要将特定的场景背景噪音植入到音频处理芯片内,这样在特定的应用场景里,可以快速识别噪音成分,并进行精确降噪。
进一步,所述场景背景噪音的植入过程为,首先采集环境的噪音,然后将环境噪音进行数字化处理,提取环境噪音的频域特性然后将该环境的频域特性植入所述音频芯片。
进一步,所述麦克风和所述音频芯片组成拾音电路板,在CT外罩上安装时,前外罩和后外罩各安装一个所述拾音电路板,以保证病人在不同的扫描位置时,都能很好的识别到患者语音。
进一步,所述两个麦克风的安装距离为1-3cm,且同一个朝向安装。
综上所述,本发明通过两个麦克风拾音,音频芯片对获取语音采样并数字化,通过内置算法将噪音成分进行弱化,将人声成分加强,提高降噪效果;且内置多种不同场景背景噪音,在特定的应用场景里,可以快速识别噪音成分,并进行精确降噪。
附图说明
图1为本发明流程图;
图2为本发明中拾音电路板电路图;
图3为本发明中场景背景噪音植入到音频芯片内的植入过程示意图。
具体实施方式
参照图1至图3对本发明一种CT语音降噪方法的具体实施方式作进一步的说明。
一种CT语音降噪方法,如图2所示,包括如下步骤:
(1)语音获取与数字化,通过两个麦克风M1、M2获取语音信息室模拟量,,而音频处理需要数字量,因此麦克风获得的模拟语音需要进过音频芯片U1采样并数字化;
(2)语音提取,通过语音芯片的内置算法对数字化的语音进行空间域、时域和频域进行分析,以确定音频的成分,包括人声与噪音成分;
(3)语音匹配,在语音芯片的内置算法中,已经对噪音和人声种类进行采样分析,通过步骤(2)的语音提取分辨出语音中的人声成分和噪音成分;
(4)语音加强与弱化,通过步骤(3)将语音匹配后,将噪音成分进行弱化,将人声成分加强。
由麦克风和BR262音频芯片组成的拾音电路板如图1所示,两只麦克风M1和M2的安装距离在1-3cm以内,且同一个朝向,在CT外罩上安装时,前外罩和后外罩各安装一个拾音电路板,以保证病人在不同的扫描位置时,都能很好的识别到患者语音。
在整个CT的扫描范围内患者嘴巴与拾音电路板的距离在50-100cm之间,所以将音频芯片U1的算法配置为中场算法,最高信噪比能提高19dB,人声能加强0.8dB。
通过配置音频芯片U1的A7,B8,C9,A9引脚的电压就能实现音频芯片算法的选择,这4个脚的电压通过A7脚的电压通过电阻R1与R7分压获得,B8脚的电压通过电阻R2与R8分压获得,C9脚的电压通过R3与R9分压获得,A9脚电压通过R6与R10分压获得。两只麦克风M1、M2分别接在音频芯片的G1脚和C7脚,经降噪后的语音信息通过音频芯片的E7脚输出。
采用高灵敏度麦克风与安森美公司的BR262音频芯片配合,高灵敏度MENS麦克风可以保证麦克风阵列的一致性,使两只麦克风的输入输出特性一致,对降噪算法更稳定,采用两只麦克风,对动态噪音的过滤效果优于一个麦克风,且MENS麦克风的灵敏度高于普通驻极体麦克风,对声源的定位更准。BR262芯片可通过配置芯片的外围电路来满足不同的应用场景。音频芯片内置语音提取算法,可分别出人声,风扇噪音,机械噪音、汽车噪音等各种噪音,开发简单。语音算法存储在音频芯片的DSP ROM内,上电即可加载。该算法可实现频域、空间域和时间域同时处理,通过麦克风对音频进行采样分析并处理提高性噪比。
本实施例优选的,所述音频芯片内植入有若干不同的场景背景噪音,音频处理器已经集成了降噪算法和基本的应用场景,但如果要提高降噪效果,需要特定的环境数据。在CT临床诊断中,CT的噪音分为两个部分,在CT待机时,CT的噪音主要来自CT上的各种散热风扇,在CT工作时,噪音包括风扇和转子旋转的噪音。在音频处理器的内置场景里是一些基本的噪音样本,如风扇噪音,汽车噪音等。但是CT的应用场景比较特殊,如果只套用基本的噪声样本,降噪效果可能不是非常理想,因此场景设置中,需要将特定的场景背景噪音植入到音频处理芯片内,这样在特定的应用场景里,可以快速识别噪音成分,并进行精确降噪。
如图3所示,所述场景背景噪音的植入过程为,首先采集环境的噪音,然后将环境噪音进行数字化处理,提取环境噪音的频域特性然后将该环境的频域特性植入所述音频芯片。
以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (5)
1.一种CT语音降噪方法,其特征在于,包括如下步骤:
(1)语音获取与数字化,通过两个麦克风获取语音信息室模拟量,然后经过音频芯片采样并数字化;
(2)语音提取,通过语音芯片的内置算法对数字化的语音进行空间域、时域和频域进行分析,以确定音频的成分;
(3)语音匹配,在语音芯片的内置算法中,已经对噪音和人声种类进行采样分析,通过步骤(2)的语音提取分辨出语音中的人声成分和噪音成分;
(4)语音加强与弱化,通过步骤(3)将语音匹配后,将噪音成分进行弱化,将人声成分加强。
2.根据权利要求1所述的CT语音降噪方法,其特征在于:所述音频芯片内植入有若干不同的场景背景噪音。
3.根据权利要求2所述的CT语音降噪方法,其特征在于:所述场景背景噪音的植入过程为,首先采集环境的噪音,然后将环境噪音进行数字化处理,提取环境噪音的频域特性然后将该环境的频域特性植入所述音频芯片。
4.根据权利要求1所述的CT语音降噪方法,其特征在于:所述麦克风和所述音频芯片组成拾音电路板,在CT外罩上安装时,前外罩和后外罩各安装一个所述拾音电路板。
5.根据权利要求4所述的CT语音降噪方法,其特征在于:所述两个麦克风的安装距离为1-3cm,且同一个朝向安装。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2020103146636 | 2020-04-21 | ||
CN202010314663 | 2020-04-21 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111613236A true CN111613236A (zh) | 2020-09-01 |
Family
ID=72204294
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010655544.7A Pending CN111613236A (zh) | 2020-04-21 | 2020-07-09 | 一种ct语音降噪方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111613236A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112929047A (zh) * | 2021-01-26 | 2021-06-08 | 明峰医疗系统股份有限公司 | 一种低噪声数字ct音频交互系统及控制方法 |
CN113573188A (zh) * | 2021-05-17 | 2021-10-29 | 深圳市瑞禾高科通讯电子有限公司 | 一种屏噪耳机 |
CN115359803A (zh) * | 2022-10-21 | 2022-11-18 | 中诚华隆计算机技术有限公司 | 一种基于芯片实现的语音降噪优化方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003096031A2 (en) * | 2002-03-05 | 2003-11-20 | Aliphcom | Voice activity detection (vad) devices and methods for use with noise suppression systems |
CN201830414U (zh) * | 2010-10-27 | 2011-05-11 | 广州市浩云安防科技工程有限公司 | 拾音器 |
US20130218559A1 (en) * | 2012-02-16 | 2013-08-22 | JVC Kenwood Corporation | Noise reduction apparatus, audio input apparatus, wireless communication apparatus, and noise reduction method |
CN109545210A (zh) * | 2018-12-03 | 2019-03-29 | 北京云知声信息技术有限公司 | 一种提升语音识别稳健性的装置及其方法 |
CN109872719A (zh) * | 2017-12-05 | 2019-06-11 | 炬芯(珠海)科技有限公司 | 一种分级式智能语音系统及其语音处理方法 |
CN109920434A (zh) * | 2019-03-11 | 2019-06-21 | 南京邮电大学 | 一种基于会议场景的噪声分类去除方法 |
-
2020
- 2020-07-09 CN CN202010655544.7A patent/CN111613236A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003096031A2 (en) * | 2002-03-05 | 2003-11-20 | Aliphcom | Voice activity detection (vad) devices and methods for use with noise suppression systems |
CN201830414U (zh) * | 2010-10-27 | 2011-05-11 | 广州市浩云安防科技工程有限公司 | 拾音器 |
US20130218559A1 (en) * | 2012-02-16 | 2013-08-22 | JVC Kenwood Corporation | Noise reduction apparatus, audio input apparatus, wireless communication apparatus, and noise reduction method |
CN109872719A (zh) * | 2017-12-05 | 2019-06-11 | 炬芯(珠海)科技有限公司 | 一种分级式智能语音系统及其语音处理方法 |
CN109545210A (zh) * | 2018-12-03 | 2019-03-29 | 北京云知声信息技术有限公司 | 一种提升语音识别稳健性的装置及其方法 |
CN109920434A (zh) * | 2019-03-11 | 2019-06-21 | 南京邮电大学 | 一种基于会议场景的噪声分类去除方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112929047A (zh) * | 2021-01-26 | 2021-06-08 | 明峰医疗系统股份有限公司 | 一种低噪声数字ct音频交互系统及控制方法 |
CN113573188A (zh) * | 2021-05-17 | 2021-10-29 | 深圳市瑞禾高科通讯电子有限公司 | 一种屏噪耳机 |
CN115359803A (zh) * | 2022-10-21 | 2022-11-18 | 中诚华隆计算机技术有限公司 | 一种基于芯片实现的语音降噪优化方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111613236A (zh) | 一种ct语音降噪方法 | |
Anzalone et al. | Determination of the potential benefit of time-frequency gain manipulation | |
Levitt | Noise reduction in hearing aids: a review. | |
Dawson et al. | Clinical evaluation of signal-to-noise ratio–based noise reduction in Nucleus® cochlear implant recipients | |
Munro et al. | The effect of speech presentation level on measurement of auditory acclimatization to amplified speech | |
US20030185411A1 (en) | Single channel sound separation | |
US9640193B2 (en) | Systems and methods for enhancing place-of-articulation features in frequency-lowered speech | |
CN106098077B (zh) | 一种带降噪的人工耳蜗言语处理系统及方法 | |
Wu et al. | The effect of hearing aid signal-processing schemes on acceptable noise levels: perception and prediction | |
CN108305637B (zh) | 耳机语音处理方法、终端设备及存储介质 | |
Koning et al. | The potential of onset enhancement for increased speech intelligibility in auditory prostheses | |
EP3337190B1 (en) | A method of reducing noise in an audio processing device | |
US8917892B2 (en) | Automated real speech hearing instrument adjustment system | |
CN103310796B (zh) | 语音信号提取方法 | |
Hazrati et al. | Reverberation suppression in cochlear implants using a blind channel-selection strategy | |
Jamieson et al. | Evaluation of a speech enhancement strategy with normal-hearing and hearing-impaired listeners | |
CN115348507A (zh) | 脉冲噪声抑制方法、系统、可读存储介质及计算机设备 | |
Guevara et al. | The Voice Track multiband single-channel modified Wiener-filter noise reduction system for cochlear implants: patients' outcomes and subjective appraisal | |
CN107734416B (zh) | 一种激光面纹识别降噪装置、耳机及方法 | |
CN105748079B (zh) | 一种基于蓝牙耳机的听力测试方法和系统 | |
US20120076331A1 (en) | Method for reconstructing a speech signal and hearing device | |
CN115022767A (zh) | 耳机降风噪方法、装置、耳机及计算机可读存储介质 | |
Saripella et al. | The effects of selective consonant amplification on sentence recognition in noise by hearing-impaired listeners | |
CN110338811A (zh) | 用于复杂声信号背景下的听力检测装置及计算机可读介质 | |
CN111603191B (zh) | 医学扫描中的语音降噪方法、装置和计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200901 |