CN105741855B - 一种基于音频分析的乘务员呼唤应答检测方法 - Google Patents
一种基于音频分析的乘务员呼唤应答检测方法 Download PDFInfo
- Publication number
- CN105741855B CN105741855B CN201610076440.4A CN201610076440A CN105741855B CN 105741855 B CN105741855 B CN 105741855B CN 201610076440 A CN201610076440 A CN 201610076440A CN 105741855 B CN105741855 B CN 105741855B
- Authority
- CN
- China
- Prior art keywords
- audio signal
- time point
- time
- call response
- call
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 36
- 230000005236 sound signal Effects 0.000 claims abstract description 46
- 238000000034 method Methods 0.000 claims abstract description 25
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 4
- 230000003137 locomotive effect Effects 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于音频分析的乘务员呼唤应答检测方法,该方法包括如下步骤:1)根据LKJ运行记录文件,获取需要乘务员进行呼唤应答的时间点;2)根据步骤1)中的时间点,对乘务员行车录音文件中各时间点对应的设定时长的音频信号流进行语音信号处理,判断各时间点对应的音频信号流中是否包含语音信号;3)若某时间点对应的音频信号流不包含语音信号,则表明乘务员该时间点进行呼唤应答,给出报警提示。本发明的检测方法为自动检测方法,大大降低了乘务员呼唤应答的检测难度,提高了检测效率,减轻了检查人员的工作量,并且可以对LKJ运行记录文件中的所有关键项时间点进行乘务员呼唤应答检测,检测较为全面。
Description
技术领域
本发明属于语音处理技术领域,具体涉及一种针对机车乘务员一次乘务作业全过程中是否进行呼唤应答的自动化检测方法。
背景技术
根据《铁路机车操作规则》中附件7《机车乘务员确认呼唤(应答)标准》规定一次乘务作业全过程必须认真执行确认(呼唤)应答制度,在关键项点发生时,需要对关键项点进行相应的呼唤应答。为了检查乘务员是否作业规范,需判断乘务员在关键项点是否进行了相应的呼唤。目前这些工作都是由地面分析人员进行抽查的,费时费力。
发明内容
本发明提供了一种基于音频分析的乘务员呼唤应答检测方法,旨在解决在进行乘务员呼唤应答检测时需要地面分析人员进行抽查,费时费力,且不能够全面检测的问题。
为解决上述技术问题,本发明的基于音频分析的乘务员呼唤应答检测方法包括:
1)根据LKJ运行记录文件,获取需要乘务员进行呼唤应答的时间点;
2)根据步骤1)中的时间点,对乘务员行车录音文件中各时间点对应的设定时长的音频信号流进行语音信号处理,判断各时间点对应的音频信号流中是否包含语音信号;
3)若某时间点对应的音频信号流不包含语音信号,则表明乘务员在该时间点未进行呼唤应答,给出报警提示。
步骤2)中检测各时间点对应的设定时长的音频信号流中是否包含语音信号的具体过程是:从乘务员行车录音文件中截取各时间点对应的设定时长的音频信号流,对各音频信号流进行预处理、特征提取和模型训练,识别出各音频信号流是否包含语音信号。
若音频信号流包含语音信号,检测语音信号持续时间的长度;将语音信号持续时间长度与乘务员关键项呼唤应答标准时间长度进行比较,如果时间长度差超出预设范围,判断乘务员在规定的时间点进行了错误呼唤应答,进行报警。
所述乘务员关键项呼唤应答标准时间长度是根据不同关键项点处呼唤应答的内容不同,结合实际情况,事先制定好的。
对各音频信号流进行预处理包括:采用小波包法对音频信号流进行去噪处理。
对各音频信号流进行特征提取时采用Mel频率倒谱系数法。
语音信号持续时间的长度的检测方法为端点检测。
所述端点检测包括短时能量检测和过零率检测。
所述步骤2)中所述设定时长为20s。
本发明的技术效果:该方法根据LKJ运行记录文件获取关键项时间点,对乘务员行车录音文件中关键项时间点对应的音频信号流进行一系列语音处理后识别出是否是语音信号,对于不是语音信号的音频信号流进行报警提示。该方法为自动检测乘务员呼唤应答的方法,只需要通过软件自动实现乘务员呼唤应答的检测,大大降低了乘务员呼唤应答的检测难度,提高了检测效率,减轻了检查人员的工作量,并且可以对LKJ运行记录文件中的所有关键项时间点进行乘务员呼唤应答检测,检测较为全面。
附图说明
图1为本实施例基于音频分析的乘务员呼唤应答检测方法流程图。
具体实施方式
下面结合附图,对本发明的技术方案作进一步详细说明。
本实施例的基于音频分析的乘务员呼唤应答检测方法包括如下步骤:
1)根据LKJ运行记录文件,获取需要乘务员进行呼唤应答的时间点;
2)根据步骤1)中的时间点,对乘务员行车录音文件中各时间点对应的设定时长的音频信号流进行语音信号处理,判断各时间点对应的音频信号流中是否包含语音信号;
3)若某时间点对应的音频信号流不包含语音信号,则表明乘务员该时间点进行呼唤应答,给出报警提示
下面对上述步骤进行具体阐述:
对于步骤1),结合LKJ运行记录文件,根据机务管理文件的要求,自动分析判断需要进行呼唤应答的时间点。
步骤2)中检测各时间点对应的音频信号流中是否包含语音信号时可采用两种方式:
方式一,根据步骤1)中的时间点,在乘务员行车录音文件中,向后截取设定时长的各时间点对应的音频信号流,然后对截取的各音频信号流进行语音信号处理,识别出各时间点对应的音频信号流中是否包含语音信号。
方式二,根据步骤1)中的时间点,在乘务员行车录音文件中,找到时间点对应的设定时长的音频信号,然后对该音频信号流进行语音信号处理及识别。
本实施例中的LKJ运行记录文件和录音文件是相匹配的,是同一车次、同一机班、同一时间段的记录数据,并且LKJ运行记录文件和录音文件的时间是同步的,因此LKJ运行记录文件和录音文件关键项点的时间是相同的。定位到录音文件中的所有关键项点后,向后截取音频信号流的时长可自行设定,本实施例中结合实际情况每个关键项点向后截取20秒的音频信号流。
本实施例对音频信号包括预处理、特征提取和模式识别。其中预处理包括去噪处理,而去除噪声的方法很多,本实施例中采用小波包法对语音信号进行去噪,小波包法对语音去噪是比较成熟的技术,这里不再详细说明。
对去噪处理过的语音信号提取相关特征,主要是根据音频信号的时域特征中的平均能量、短时平均过零率、共振峰、基音周期等参数以及频域特征中有线性预测系数(LPC)、LPC倒谱系数(LPCC)、线谱对数(LSP)、短时频谱、Mel频率倒谱系数(MFCC)等,本实施例中使用了MFCC来提取语音信号的特征。
利用提取的特征训练特征模型,检测判断音频信号流中的语音信号和非语音信号。模型训练的方法在现有技术中也有很多,如DTW,HMM、人工神经网络等,这里不再详细介绍其原理。
对于步骤3),如果音频信号流中未检测到语音信号,则说明乘务员在此关键项点处未进行呼唤应答,给出相应的报警提示。
进一步,当音频信号流中检测到语音信号后,检测语音信号的开始和结束点(即乘务员呼唤应答说话时间的开始点和结束点),根据语音信号的开始点和结束点计算乘务员说话时间的长度。开始点和结束点的检测即语音信号的端点检测,本实施例中采用短时能量检测和过零率检测相结合的方法进行语音的端点检测。
根据乘务员关键项点呼唤应答标准,将检测计算到的乘务员说话时间长度和在此关键项点呼唤应答标准时间长度进行比较判断,如果时间长度差在预定的范围内,则判断乘务员在此处进行了呼唤应答;否则,给出提示,指明乘务员在此处未进行相应的呼唤应答。
结合乘务员呼唤应答实际情况,在不同项点处呼唤应答的内容不同。关键项点呼唤应答的标准时长,是结合实际情况,事先已经制定好的。
相较于现有的人工对乘务员的呼唤应答情况进行检查的方法,利用本发明的乘务员呼唤应答自动化检测方法,只需要通过软件自动实现乘务员呼唤应答的检测,大大降低了乘务员呼唤应答的检测难度,提高了检测效率,减轻了检查人员的工作量。
Claims (9)
1.一种基于音频分析的乘务员呼唤应答检测方法,其特征在于,该方法包括如下步骤:
1)根据LKJ运行记录文件,获取需要乘务员对关键项点进行呼唤应答的时间点;
2)根据步骤1)中的时间点,对乘务员行车录音文件中各时间点对应的设定时长的音频信号流进行语音信号处理,判断各时间点对应的音频信号流中是否包含语音信号;
3)若某时间点对应的音频信号流不包含语音信号,则表明乘务员在该时间点未进行呼唤应答,给出报警提示。
2.根据权利要求1所述基于音频分析的乘务员呼唤应答检测方法,其特征在于,步骤2)中检测各时间点对应的设定时长的音频信号流中是否包含语音信号的具体过程是:从乘务员行车录音文件中截取各时间点对应的设定时长的音频信号流,对各音频信号流进行预处理、特征提取和模型训练,识别出各音频信号流是否包含语音信号。
3.根据权利要求1-2任一所述基于音频分析的乘务员呼唤应答检测方法,其特征在于,若音频信号流包含语音信号,检测语音信号持续时间的长度;将语音信号持续时间长度与乘务员关键项呼唤应答标准时间长度进行比较,如果时间长度差超出预设范围,判断乘务员在规定的时间点进行了错误呼唤应答,进行报警。
4.根据权利要求3所述基于音频分析的乘务员呼唤应答检测方法,其特征在于,所述乘务员关键项呼唤应答标准时间长度是根据不同关键项点处呼唤应答的内容不同,结合实际情况,事先制定好的。
5.根据权利要求2所述基于音频分析的乘务员呼唤应答检测方法,其特征在于,对各音频信号流进行预处理包括:采用小波包法对音频信号流进行去噪处理。
6.根据权利要求2所述基于音频分析的乘务员呼唤应答检测方法,其特征在于,对各音频信号流进行特征提取时采用Mel频率倒谱系数法。
7.根据权利要求3所述基于音频分析的乘务员呼唤应答检测方法,其特征在于,语音信号持续时间的长度的检测方法为端点检测。
8.根据权利要求7所述基于音频分析的乘务员呼唤应答检测方法,其特征在于,所述端点检测包括短时能量检测和过零率检测。
9.根据权利要求3所述基于音频分析的乘务员呼唤应答检测方法,其特征在于,所述步骤2)中所述设定时长为20s。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610076440.4A CN105741855B (zh) | 2016-02-03 | 2016-02-03 | 一种基于音频分析的乘务员呼唤应答检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610076440.4A CN105741855B (zh) | 2016-02-03 | 2016-02-03 | 一种基于音频分析的乘务员呼唤应答检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105741855A CN105741855A (zh) | 2016-07-06 |
CN105741855B true CN105741855B (zh) | 2019-12-20 |
Family
ID=56245756
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610076440.4A Active CN105741855B (zh) | 2016-02-03 | 2016-02-03 | 一种基于音频分析的乘务员呼唤应答检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105741855B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110660381A (zh) * | 2018-06-28 | 2020-01-07 | 山西智济电子科技有限公司 | 一种机车车载音频智能分析管理方法 |
CN109545027B (zh) * | 2018-12-24 | 2021-06-01 | 郑州畅想高科股份有限公司 | 一种实训台、乘务员仿真实训方法及装置 |
CN112216269A (zh) * | 2019-07-09 | 2021-01-12 | 中车株洲电力机车研究所有限公司 | 一种机车司机作业标准语音识别装置及其语音识别方法 |
CN112634692A (zh) * | 2020-12-15 | 2021-04-09 | 成都职业技术学院 | 一种乘务员客舱应急撤离推演训练系统 |
CN113256153B (zh) * | 2021-06-16 | 2024-03-08 | 北京铁道工程机电技术研究所股份有限公司 | 一种评价方法、装置、存储介质及电子设备 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103856642A (zh) * | 2014-01-22 | 2014-06-11 | 中国移动(深圳)有限公司 | 一种探测方法及系统 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100576240C (zh) * | 2007-10-29 | 2009-12-30 | 北京佳讯飞鸿电气股份有限公司 | 一种应答器远程监测方法 |
WO2014159581A1 (en) * | 2013-03-12 | 2014-10-02 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
CN103177732B (zh) * | 2013-03-26 | 2015-05-20 | 航天科技控股集团股份有限公司 | 基于dsp的声音对比处理检测系统及检测方法 |
US9928851B2 (en) * | 2013-09-12 | 2018-03-27 | Mediatek Inc. | Voice verifying system and voice verifying method which can determine if voice signal is valid or not |
US20160155435A1 (en) * | 2013-11-14 | 2016-06-02 | Honeywell International Inc. | Aircraft systems and methods for reducing and detecting read-back and hear-back errors |
CN104952445A (zh) * | 2014-03-25 | 2015-09-30 | 新昌县鸿裕工业产品设计有限公司 | 一种基于音频分析的设备运行监控装置 |
CN104766605B (zh) * | 2015-04-23 | 2018-03-27 | 郑州畅想高科股份有限公司 | 一种机车录音装置和lkj监控装置间的时间同步系统和方法 |
-
2016
- 2016-02-03 CN CN201610076440.4A patent/CN105741855B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103856642A (zh) * | 2014-01-22 | 2014-06-11 | 中国移动(深圳)有限公司 | 一种探测方法及系统 |
Non-Patent Citations (2)
Title |
---|
列车运行监控记录装置数据复核诊断系统的研究与应用;刘海燕 等;《内燃机车》;20080831(第8期);第43-46页 * |
机车运行关键位语音提示系统设计;邱建东 等;《铁道机车车辆》;20140630;第34卷(第3期);第51-56页 * |
Also Published As
Publication number | Publication date |
---|---|
CN105741855A (zh) | 2016-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105741855B (zh) | 一种基于音频分析的乘务员呼唤应答检测方法 | |
US9412371B2 (en) | Visualization interface of continuous waveform multi-speaker identification | |
US9536547B2 (en) | Speaker change detection device and speaker change detection method | |
WO2021128741A1 (zh) | 语音情绪波动分析方法、装置、计算机设备及存储介质 | |
US20190318743A1 (en) | Metadata-based diarization of teleconferences | |
WO2018145584A1 (zh) | 一种语音端点检测方法及语音识别方法 | |
KR100930584B1 (ko) | 인간 음성의 유성음 특징을 이용한 음성 판별 방법 및 장치 | |
US9336780B2 (en) | Identification of a local speaker | |
US8078463B2 (en) | Method and apparatus for speaker spotting | |
CN102623009B (zh) | 一种基于短时分析的异常情绪自动检测和提取方法和系统 | |
CA2567230A1 (en) | Multi-pass speech analytics | |
CN103811009A (zh) | 一种基于语音分析的智能电话客服系统 | |
CN109903752B (zh) | 对齐语音的方法和装置 | |
CN102142254A (zh) | 基于声纹识别和语音识别的防录音假冒的身份确认方法 | |
CN103578470A (zh) | 一种电话录音数据的处理方法及系统 | |
CN108922541A (zh) | 基于dtw和gmm模型的多维特征参数声纹识别方法 | |
CN107705791A (zh) | 基于声纹识别的来电身份确认方法、装置和声纹识别系统 | |
KR101250668B1 (ko) | Gmm을 이용한 응급 단어 인식 방법 | |
CN109215634A (zh) | 一种多词语音控制通断装置的方法及其系统 | |
CN111933144A (zh) | 后创建声纹的会议语音转写方法、装置及存储介质 | |
CN110782902A (zh) | 音频数据确定方法、装置、设备和介质 | |
CN105679323A (zh) | 一种号码发现方法及系统 | |
Friedland et al. | Live speaker identification in conversations | |
CN110415707B (zh) | 一种基于语音特征融合和gmm的说话人识别方法 | |
Ouzounov | Telephone speech endpoint detection using Mean-Delta feature |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |