CN115103319A - 一种特种作业环境下的对讲呼叫方法及装置 - Google Patents
一种特种作业环境下的对讲呼叫方法及装置 Download PDFInfo
- Publication number
- CN115103319A CN115103319A CN202210684954.3A CN202210684954A CN115103319A CN 115103319 A CN115103319 A CN 115103319A CN 202210684954 A CN202210684954 A CN 202210684954A CN 115103319 A CN115103319 A CN 115103319A
- Authority
- CN
- China
- Prior art keywords
- communication terminal
- real
- initiator
- communication
- sound signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000004891 communication Methods 0.000 claims abstract description 409
- 230000005236 sound signal Effects 0.000 claims abstract description 144
- 238000001514 detection method Methods 0.000 claims abstract description 37
- 230000004913 activation Effects 0.000 claims abstract description 31
- 239000003999 initiator Substances 0.000 claims description 129
- 238000012545 processing Methods 0.000 claims description 11
- 230000000977 initiatory effect Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 230000001960 triggered effect Effects 0.000 abstract 1
- 238000004422 calculation algorithm Methods 0.000 description 13
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/06—Selective distribution of broadcast services, e.g. multimedia broadcast multicast service [MBMS]; Services to user groups; One-way selective calling services
- H04W4/10—Push-to-Talk [PTT] or Push-On-Call services
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q5/00—Selecting arrangements wherein two or more subscriber stations are connected by the same line to the exchange
- H04Q5/24—Selecting arrangements wherein two or more subscriber stations are connected by the same line to the exchange for two-party-line systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/06—Selective distribution of broadcast services, e.g. multimedia broadcast multicast service [MBMS]; Services to user groups; One-way selective calling services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种特种作业环境下的对讲呼叫方法及装置,涉及无线对讲通信领域,所述对讲呼叫方法应用于中心通信系统以及多个通信终端中,所述多个通信终端均与所述中心通信系统互联,所述通信终端通过话音激活检测的方式,对获得的实时声音信号进行检测,实现了在不需要PTT按键的情况下自动完成对讲呼叫,结合音量检测和波达方向估计,降低环境中噪音信号误触发对讲呼叫的概率,并通过语音识别和声纹检测的方法,结合所述多个通信终端不同的权限,满足了特种作业环境下对于工作指挥调度的需要,解决了传统使用PTT按键完成对讲呼叫的方式使特种作业环境的工作效率降低以及安全性不佳的问题。
Description
技术领域
本发明涉及无线对讲通信领域,具体地,涉及一种特种作业环境下的对讲呼叫方法及装置。
背景技术
集群通信为将多个终端用户集合起来构成的一个无线通信通道,是能够实现以指挥调度为主体的多用途、高效能专用无线通信网络。对讲通信系统即为集群通信的典型实例,对讲通信系统通常以半双工的方式实现,半双工的对讲方式为在发起对讲呼叫前,用户按下终端PTT按键向系统申请话权,当用户得到允许后发送终端麦克风采集的语音数据。但在一些需要指挥调度的特种作业环境下,如消防、交警、特警等作业环境,由于通信的某一方或双方用户的双手需要承担救援、驾驶、安保、抓捕等任务,传统使用PTT按键完成对讲呼叫的方式需要用手操作,大大影响了对讲呼叫的便捷性,影响了作业效率及作业安全性。
发明内容
为了解决特种作业环境下使用对讲通信系统时,在发起对讲呼叫前,需要用户按下终端PTT按键向系统申请发起对讲呼叫的方式对特种环境作业效率及作业安全产生消极影响的问题,本发明提供了一种特种作业环境下的对讲呼叫方法,通过话音激活检测的方式发起对讲呼叫,避免了传统使用PTT按键完成对讲呼叫的方式对于特种作业环境下工作的消极影响。
为实现上述目的,本发明提供了一种特种作业环境下的对讲呼叫方法,所述方法应用于中心通信系统以及多个通信终端中,所述多个通信终端均与所述中心系统互联,所述特种作业环境下的对讲呼叫方法包括以下步骤:
步骤1:第一发起方通信终端获得第一实时声音信号,对所述第一实时声音信号进行话音激活检测;
步骤2:若检测到所述第一实时声音信号中存在人声,则所述第一发起方通信终端向所述中心通信系统发送通信请求信号,经所述中心通信系统许可后,所述第一发起方通信终端向所述中心通信系统传输所述第一实时声音信号,所述中心通信系统将收到的第一实时语音数据转发给所述目标方通信终端集群;
步骤3:所述第一通信终端对所述第一实时声音信号进行话音激活检测,若检测到所述第一实时声音信号中人声的中断时长大于阈值,则所述第一发起方通信终端向所述中心通信系统发送通信结束信号,并停止向所述中心通信系统传输所述第一实时声音信号。
其中,本方法原理为:所述第一发起方通信终端对获得的第一实时声音信号进行话音激活检测,当检测到所述第一实时声音信号中存在人声时,则认为开始对讲呼叫,第一发起方通信终端向中心通信系统发送通信请求信号,经所述中心通信系统许可后,所述发起方通信系统向所述中心通信系统传输所述第一实时声音信号,并由所述中心通信系统将收到的第一实时语音数据转发给所述目标方通信终端集群,当检测到所述第一实时声音信号中人声的中断时长大于阈值时,则认为本次对讲呼叫结束,等待下一次对讲呼叫开始,实现了在不需要PTT按键的情况下自动完成对讲呼叫,能够适应特种作业环境下用户不使用双手按键,通过话音激活检测实现自动发起对讲呼叫的特殊需求。
进一步的,在特种作业环境下对所述第一实时声音信号进行话音激活检测,其检测到的人声可能是环境中除用户外的其他人声信号,为了排除所述第一实时声音信号背景环境中人声误触发对讲呼叫,需要计算所述第一实时声音信号中检测到的人声的方向,因此所述步骤2中,若检测到所述第一实时声音信号中存在人声,则在所述第一发起方通信终端向所述中心通信系统发起通信请求信号前,对所述第一实时声音信号进行波达方向估计,获得人声方向,若所述人声方向在标准方位区间内,则所述第一发起方通信终端向所述中心通信系统发送通信请求信号,并执行后续步骤。
其中,为了对所述第一实时声音信号进行波达方向估计,所述第一实时声音信号为阵列信号,所述第一发起方通信终端通过麦克风阵列获得所述阵列信号。
进一步的,在特种作业环境下,对所述第一实时声音信号进行话音激活检测,其检测到的人声信号可能是工作时人声交谈所产生的信号,为了避免特种作业环境下工作时人声交谈误触发对讲呼叫,需要计算所述第一实时声音信号中检测到的人声的音量,所述步骤2中,若检测到所述第一实时声音信号中存在人声,则在所述第一发起方通信终端向所述中心通信系统用发送通信请求信号前对所述第一实时声音信号进行音量检测,若所述第一实时声音信号音量大于阈值,则所述第一发起方通信终端向所述中心通信系统发送通信请求信号,并执行后续步骤。
进一步的,当所述第一发起方通信终端由于实时作业情况需要请求保持对讲通话,使所述目标方通信终端集群对所述起始终端进行监听,此时,所述步骤2中,若检测到所述第一实时信号中存在人声,则所述第一发起方通信终端向所述中心通信系统发起通信请求信号之前,对所述第一实时声音信号进行语音识别,若所述第一实时声音信号中存在与第一指令相匹配的语音指令,则所述步骤3中,所述第一通信终端对所述第一实时声音信号进行语音识别,若检测到所述第二实时声音信号中存在与第二指令相匹配的语音指令,则所述第一发起方通信终端向所述中心通信系统发送通信结束信号,并停止向所述中心通信系统传输所述第一实时声音信号。
进一步的,由于对讲呼叫通信系统为双半工通信,对于某个通信终端,在同一时刻仅允许执行对于实时声音信号的发送或接收中的任意一个操作,在特种作业环境下,由于作业情况的特殊性,可能有第二发起方通信终端向正在进行对讲呼叫的一个或多个通信终端发起通信请求,此时,中心通信系统需要判断是否断开原有对讲通信,许可新的通信请求,因此,所述多个通信终端分别具有不同的通信权限。
其中,当第一发起方通信终端正在与目标方通信终端集群对讲时,所述目标方通信终端集群中任意一个通信终端作为第二发起方通信终端向所述目标方通信终端集群中的其他通信终端发起呼叫时,包括以下步骤:
步骤a:所述第二发起方通信终端获得第二实时声音信号,并对所述第二实时声音信号进行话音激活检测;
步骤b:若检测到所述第二实时声音信号中存在人声,则所述第二发起方通信终端向所述中心通信系统发送通信请求信号,所述中心通信系统判断所述第二发起方通信终端和所述第一发起方通信终端的通话权限,若所述第二发起方通信终端的通话权限大于所述第一发起方通信终端的通话权限,则执行步骤c,否则拒绝所述第二发起方通信终端的通信请求;
步骤c:所述中心通信系统停止向所述目标方通信终端集群转发所述第一发起方通信终端发送的第一实时声音信号,并向所述第一发起方通信终端和所述目标方通信终端集群发送通信结束信号;
步骤d:所述第一发起方通信终端停止向所述中心通信系统传输所述第一实时声音信号;
步骤e:所述第二发起方通信终端向所述中心通信系统传输所述第二实时声音信号,所述中心通信系统将收到的第二实时声音信号转发给对应的目标方通信终端。
进一步的,在特种作业环境下,可能有第二发起方通信终端向正在进行对讲呼叫的一个或多个通信终端发起通信请求,所述第二发起方通信终端可能由于实时作业情况需要申请紧急权限,此时,所述特种作业环境下的对讲呼叫方法包括以下步骤:
所述第二发起方通信终端获得第二实时声音信号,并对所述第二实时声音信号进行话音激活检测;
若检测到所述第二实时声音信号中存在人声,则对所述第二实时声音信号进行语音识别,若所述第二实时声音信号中存在与第三指令相匹配的语音指令,则所述中心通信系统停止向所述目标方通信终端集群转发所述第一发起方通信终端发送的第一实时声音信号,并向所述第一发起方通信终端和所述目标方通信终端集群发送通信结束信号;
所述第一发起方通信终端停止向所述中心通信系统传输所述第一实时声音信号;
所述第二发起方通信终端向所述中心通信系统传输所述第二实时声音信号,所述中心通信系统将收到的第二实时声音信号转发给对应的目标方通信终端。
进一步的,在特种作业环境下,可能有第二发起方通信终端向正在进行对讲呼叫的一个或多个通信终端发起通信请求,所述第二发起方通信终端可能由于实时作业情况由高权限用户使用,因此,为了判断使用所述第二发起方通信终端的用户的权限,从而满足特种作业环境下特殊作业情况的需求,所述特种作业环境下的对讲呼叫方法还包括建立声纹数据库,所述声纹数据库用于存储人声特征,当第一发起方通信终端正在与目标方通信终端集群对讲,所述目标方通信终端集群中任意一个通信终端作为第二发起方通信终端向所述目标方通信终端集群中的其他通信终端发起呼叫时,所述方法包括以下步骤:
所述第二发起方通信终端获得第二实时声音信号,并对所述第二实时声音信号进行话音激活检测;
若检测到所述第二实时声音信号中存在人声,则对所述第二实时声音信号进行声纹识别,获得第一人声特征,若所述声纹数据库中存在与所述第一人声特征相同的人声特征,则所述中心通信系统停止向所述目标方通信终端集群转发所述第一发起方通信终端发送的第一实时声音信号,并向所述第一发起方通信终端和所述目标方通信终端集群发送通信结束信号;
所述第一发起方通信终端停止向所述中心通信系统传输所述第一实时声音信号;
所述第二发起方通信终端向所述中心通信系统传输所述第二实时声音信号,所述中心通信系统将收到的第二实时声音信号转发给对应的目标方通信终端。
为了实现上述发明目的,本发明还提供了一种特种作业环境下的对讲呼叫装置,包括无线通信模块、声音采集模块、存储模块、声音输出模块以及处理模块,所述声音采集模块用于获得实时声音信号,所述无线通信模块用于传输通信请求信号、通信结束信号和实时声音信号,所述声音输出模块用于输出收到的实时声音信号,所述存储模块用于存储可在所述处理模块上运行的计算机程序,所述处理模块执行所述计算机程序时实现所述特种作业环境下的对讲呼叫方法的步骤。
本发明提供的一个或多个技术方案,至少具有如下技术效果或优点:本发明通过话音激活检测的方式发起对讲呼叫,结合音量检测、语音指令识别、声纹识别的处理方式避免了传统使用PTT按键完成对讲呼叫的方式对于特种作业环境下工作效率及安全性的消极影响。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本发明的一部分,并不构成对本发明实施例的限定;
图1是本发明中对讲呼叫整体流程示意图;
图2是本发明中讲呼叫装置示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在相互不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述范围内的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
实施例一
请参考图1,本发明提供了一种特种作业环境下的对讲呼叫方法,所述方法应用于中心通信系统以及多个通信终端中,所述通信终端均与所述中心通信系统互联,所述特种作业环境下的对讲呼叫方法包括以下步骤:
步骤1:所述第一发起方通信终端获得第一实时声音信号,并对所述第一实时声音信号进行话音激活检测;
步骤2:若检测到所述第一实时声音信号中存在人声,则所述第一发起方通信终端向所述中心通信系统发送发起通信请求信号,经所述中心通信系统许可后,所述第一发起方通信终端向所述中心通信系统传输所述第一实时声音信号,所述中心通信系统将收到的第一实时声音引号转发给目标方通信终端集群;
步骤3:所述第一通信终端对所述第一实时声音信号进行话音激活检测,若检测到所述第一实时声音信号中人声的中断时长大于阈值,则所述第一发起方通信终端向所述中心通信系统发送通信结束信号,并停止向所述中心通信系统传输所述第一实时声音信号。
其中,所述通信终端可以是对讲设备,如数字对讲机和模拟对讲机等,也可以是移动电子设备,如手机、智能手表等,本实施在此不做限定。
其中,所述话音激活检测算法用于检测当前信号中是否存在人的话音信号,为实现所述话音激活检测算法,可以通过对输入信号的短时能量(short time energy,STE)和短时过零率(zero cross counter,ZCC)或者使用统计和机器学习的方法得出当前信号中是否存在人的话音信号,由于机器学习的方法需要获得大量训练样本集,为简化算法开发过程,优选通过对输入信号的短时能量和短时过零率的值实现话音激活检测。
其中,所述步骤3中,所述阈值为定值,用于判断所述第一实时声音信号中的人声对讲是否结束,当所述第一实时声音信号中人声的中断时长大于所述阈值,则认为本次对讲呼叫结束,所述阈值的具体大小根据实际使用时情况确定,本实施例在此不做限定。
进一步的,所述步骤2中,若检测到所述第一实时声音信号中存在人声,则在所述第一发起方通信终端向所述中心通信系统发送通信请求信号前,对所述第一实时声音信号进行波达方向估计,获得人声方向,若所述人声方向在标准方位区间内,则所述第一发起方通信终端向所述中心通信系统发送通信请求信号,并执行后续步骤。
其中,为了实现对所述第一实时声音信号进行波达方向估计,所述第一实时声音信号为阵列信号,所述第一发起方通信终端通过阵列麦克风获得所述第一实时声音信号。
其中,所述波达方向估计的算法包括延迟-相加法、Capon最小方差法、多重信号分类算法、旋转不变子空间法、确定性最大似然算法、随机性最大似然算法;旋转不变子空间法作为子空间法中的一种,可以突破瑞利极限,且其计算量相对其他波达方向估计的算法小,因此优选旋转不变子空间法计算所述人声方向。
其中,所述标准方位区间为正常使用所述通信终端时的人声方向区间,其具体区间根据实际使用时的情况确定,本实施例在此不做限定。
进一步的,所述步骤2中,若检测到所述第一实时声音信号中存在人声,则在所述第一发起方通信终端向所述中心通信系统发送通信请求信号前,对所述第一实时声音信号进行音量检测,若所述第一实时声音信号音量大于阈值,则所述第一发起方通信终端向所述中心通信系统发送通信请求信号,并执行后续步骤。
其中,所述音量检测即对所述第一实时声音信号中人声强度进行检测,所述阈值为正常使用所述通信终端时的人声强度,其具体值根据实际使用时情况确定,本实施例在此不做限定。
实施例二
请参考图1,本发明提供了一种特种作业环境下的对讲呼叫方法,在实施例一的基础上,在特种作业环境下,可能有第二发起方通信终端向正在进行对讲呼叫的一个或多个通信终端发起通信请求,此时,中心通信系统需要判断是否断开原有通信请求,许可新的通信请求,因此,所述多个通信终端分别具有不同的通话权限,当第一发起方通信终端正在与目标方通信终端集群对讲,所述目标方通信终端集群中任意一个通信终端作为第二发起方通信终端向所述目标方通信终端集群中的其他通信终端发起呼叫时,包括以下步骤:
步骤a:所述第二发起方通信终端获得第二实时声音信号,并对所述第二实时声音信号进行话音激活检测;
步骤b:若检测到所述第二实时声音信号中存在人声,则所述第二发起方通信终端向所述中心通信系统发送通信请求信号,所述中心通信系统判断所述第二发起方通信终端和所述第一发起方通信终端的通话权限,若所述第二发起方通信终端的通话权限大于所述第一发起方通信终端的通话权限,则执行步骤c,否则拒绝所述第二发起方通信终端的通信请求信号;
步骤c:所述中心通信系统停止向所述目标方通信终端集群转发所述第一发起方通信终端发送的第一实时声音信号,并向所述第一发起方通信终端和所述目标方通信终端集群发送通信结束信号;
步骤d:所述第一发起方通信终端停止向所述中心通信系统传输所述第一实时声音信号;
步骤e:所述第二发起方通信终端向所述中心通信系统传输所述第二实时声音信号,所述中心通信系统将收到的第二实时声音信号转发给对应的目标方通信终端。
其中,所述通信终端可以是对讲设备,如数字对讲机和模拟对讲机等,也可以是移动电子设备,如手机、智能手表等,本实施在此不做限定。
其中,所述话音激活检测算法用于检测当前信号中是否存在人的话音信号,为实现所述话音激活检测算法,可以通过对输入信号的短时能量(short time energy,STE)和短时过零率(zero cross counter,ZCC)或者使用统计和机器学习的方法得出当前信号中是否存在人的话音信号,由于机器学习的方法需要获得大量训练样本集,为简化算法开发过程,优选通过对输入信号的短时能量和短时过零率的值实现话音激活检测。
其中,所述第一实时声音信号的阈值为定值,当所述第一实时声音信号中人声的中断时长大于阈值,则认为本次对讲呼叫结束,所述阈值的具体大小根据实际使用时情况确定,本实施例在此不做限定。
其中,在本实施例中,所述第二发起方通信终端可能由于实时作业情况需要申请紧急权限,此时,所述特种作业环境下的对讲呼叫方法包括以下步骤:
所述第二发起方通信终端获得第二实时声音信号,并对所述第二实时声音信号进行话音激活检测;
若检测到所述第二实时声音信号中存在人声,则对所述第二实时声音信号进行语音识别,若所述第二实时声音信号中存在与第三指令相匹配的语音指令,则所述中心通信系统停止向所述目标方通信终端集群转发所述第一发起方通信终端发送的第一实时声音信号,并向所述第一发起方通信终端和所述目标方通信终端集群发送通信结束信号;
所述第一发起方通信终端停止向所述中心通信系统传输所述第一实时声音信号;
所述第二发起方通信终端向所述中心通信系统传输所述第二实时声音信号,所述中心通信系统将收到的第二实时声音信号转发给对应的目标方通信终端。
其中,所述语音识别可以通过随机模型法、神经网络方法、概率语法分析法实现,其中,随机模型法技术较为成熟,通过特征提取、训练模板、对模板进行分类及对模板进行判断的步骤对语音进行识别,相较于神经网络法和概率语法分析法简便,且具有良好的语音识别性能,因此,优选随机模型法对所述第二实时声音信号进行语音识别。
其中,所述第一指令为用于请求紧急通话权的指令,其具体指令内容根据实际使用情况确定,本实施例在此不做限定。
其中,在本实施例中,在特种作业环境下,可能有第二发起方通信终端向正在进行对讲呼叫的一个或多个通信终端发起通信请求,所述第二发起方通信终端可能由于实时作业情况由高权限用户使用,因此,所述特种作业环境下的对讲呼叫方法还包括建立声纹数据库,所述声纹数据库用于存储人声特征,当第一发起方通信终端正在与目标方通信终端集群对讲,所述目标方通信终端集群中任意一个通信终端作为第二发起方通信终端向所述目标方通信终端集群中的其他通信终端发起呼叫时,所述方法包括以下步骤:
所述第二发起方通信终端获得第二实时声音信号,并对所述第二实时声音信号进行话音激活检测;
若检测到所述第二实时声音信号中存在人声,则对所述第二实时声音信号进行声纹识别,获得第一人声特征,若所述声纹数据库中存在与所述第一人声特征相同的人声特征,则所述中心通信系统停止向所述目标方通信终端集群转发所述第一发起方通信终端发送的第一实时声音信号,并向所述第一发起方通信终端和所述目标方通信终端集群发送通信结束信号;
所述第一发起方通信终端停止向所述中心通信系统传输所述第一实时声音信号;
所述第二发起方通信终端向所述中心通信系统传输所述第二实时声音信号,所述中心通信系统将收到的第二实时声音信号转发给对应的目标方通信终端。
其中,所述声纹识别可以通过动态时间规整法、矢量量化法、隐马尔可夫模型法、高斯混合模型法、人工神经网络和支持向量机的方法实现,由于不需要对文本进行识别,因此,本实施例优选针对说话人进行识别效果最好的高斯混合模型法进行声纹识别。
实施例三
本发明提供了一种特种作业环境下的对讲呼叫方法,在实施例一的基础上,所述第一发起方通信终端可能由于实时作业情况需要请求保持对讲通话,使所述目标方通信终端集群对所述第一发起方通信终端情况进行监听,此时,所述特种作业环境下的对讲呼叫方法包括以下步骤:
所述第一发起方通信终端获得所述第一实时声音信号,并对所述第一实时声音信号进行话音激活检测;
若检测到所述第一实时声音信号中存在人声,对所述第一实时声音信号进行语音识别,若所述第一实时声音信号中存在与第一指令相匹配的语音指令,所述第一发起方通信终端向所述中心通信系统传输所述第一实时声音信号,所述中心通信系统将接收到的第一实时语音数据转发给所述目标方通信终端集群;
对所述第一实时声音信号进行语音识别,若所述第一实时声音信号中存在与第二指令相匹配的语音指令,则所述第一发起方通信终端向所述中心通信系统发送通信结束信号,并停止向所述中心通信系统传输所述第一实时声音信号。
其中,所述通信终端可以是对讲设备,如数字对讲机和模拟对讲机等,也可以是移动电子设备,如手机、智能手表等,本实施在此不做限定。
其中,所述话音激活检测算法用于检测当前信号中是否存在人的话音信号,为实现所述话音激活检测算法,可以通过对输入信号的短时能量(short time energy,STE)和短时过零率(zero cross counter,ZCC)或者使用统计和机器学习的方法得出当前信号中是否存在人的话音信号,由于机器学习的方法需要获得大量训练样本集,为简化算法开发过程,优选通过对输入信号的短时能量和短时过零率的值实现话音激活检测。
其中,所述语音识别可以通过随机模型法、神经网络方法、概率语法分析法实现,其中,随机模型法技术较为成熟,通过特征提取、训练模板、对模板进行分类及对模板进行判断的步骤对语音进行识别,相较于神经网络法和概率语法分析法简便,且具有良好的语音识别性能,因此,优选随机模型法对所述第一实时声音信号进行语音识别。
其中,所述第二指令为请求开启保持对讲通话的指令,所述第三指令为请求结束对讲通话的指令,其具体指令内容根据实际使用情况确定,本实施例在此不做限定。
实施例四
本发明实施例四提供了一种特种作业环境下的对讲呼叫装置,包括无线通信模块、声音采集模块、存储模块、声音输出模块以及处理模块,所述声音采集模块用于获得实时声音信号,所述无线通信模块用于传输通信请求信号、通信结束信号和实时声音信号,所述声音输出模块用于输出收到的实时声音信号,所述储存模块用于储存所述可在所述处理模块上运行的计算机程序,所述处理模块执行所述计算机程序时实现实施例一至三中所述的特种作业环境下的对讲呼叫方法的步骤。
其中,在本实施例中,所述无线通信模块、声音采集模块、存储模块、声音输出模块以及处理模块可以通过总线或蓝牙实现装置内的数据传输,本实施例在此不做限定。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种特种作业环境下的对讲呼叫方法,所述方法应用于中心通信系统以及多个通信终端中,其特征在于,所述多个通信终端均与所述中心通信系统互联,所述特种作业环境下的对讲呼叫方法包括以下步骤:
步骤1:第一发起方通信终端获得第一实时声音信号,并对所述第一实时声音信号进行话音激活检测;
步骤2:若检测到所述第一实时声音信号中存在人声,则所述第一发起方通信终端向所述中心通信系统发送发起通信请求信号,经所述中心通信系统许可后,所述第一发起方通信终端向所述中心通信系统传输所述第一实时声音信号,所述中心通信系统将收到的第一实时声音信号转发给所述目标方通信终端集群;
步骤3:所述第一发起方通信终端对所述第一实时声音信号进行话音激活检测,若检测到所述第一实时声音信号中人声的中断时长大于阈值,则所述第一发起方通信终端向所述中心通信系统发送通信结束信号,并停止向所述中心通信系统传输所述第一实时声音信号。
2.根据权利要求1所述的一种特种作业环境下的对讲呼叫方法,其特征在于,所述步骤2中,若检测到所述第一实时信号中存在人声,则在所述第一发起方通信终端向所述中心通信系统发起通信请求信号之前,对所述第一实时声音信号进行语音识别,若所述第一实时声音信号中存在与第一指令相匹配的语音指令,则所述第一发起方通信终端向所述中心通信系统发起通信请求信号,并执行后续步骤;
所述步骤3中,所述第一发起方通信终端对所述第一实时声音信号进行语音识别,若检测到所述第一实时声音信号中存在于第二指令相匹配的语音指令,则所述第一发起方通信终端向所述中心通信系统发送通信结束信号,并停止向所述中心通信系统传输所述第一实时声音信号。
3.根据权利要求1所述的一种特种作业环境下的对讲呼叫方法,其特征在于,所述多个通信终端分别具有不同的通信权限。
4.根据权利要求3所述的一种特种作业环境下的对讲呼叫方法,其特征在于,当第一发起方通信终端正在与目标方通信终端集群对讲,所述目标方通信终端集群中任意一个通信终端作为第二发起方通信终端向所述目标方通信终端集群中的其他通信终端发起呼叫时,所述方法包括以下步骤:
步骤a:所述第二发起方通信终端获得第二实时声音信号,并对所述第二实时声音信号进行话音激活检测;
步骤b:若检测到所述第二实时声音信号中存在人声,则所述第二发起方通信终端向所述中心通信系统发起通信请求信号,所述中心通信系统判断所述第二发起方通信终端和所述第一发起方通信终端的通话权限,若所述第二发起方通信终端的通话权限大于所述第一发起方通信终端的通话权限,则执行步骤c,否则拒绝所述第二发起方通信终端的通信请求;
步骤c:所述中心通信系统停止向所述目标方通信终端集群转发所述第一发起方通信终端发送的第一实时声音信号,并向所述第一发起方通信终端和所述目标方通信终端集群发送通信结束信号;
步骤d:所述第一发起方通信终端停止向所述中心通信系统传输所述第一实时声音信号;
步骤e:所述第二发起方通信终端向所述中心通信系统传输所述第二实时声音信号,所述中心通信系统将收到的第二实时声音信号转发给对应的目标方通信终端。
5.根据权利要求3所述的一种特种作业环境下的对讲呼叫方法,其特征在于,当第一发起方通信终端正在与目标方通信终端集群对讲,所述目标方通信终端集群中任意一个通信终端作为第二发起方通信终端向所述目标方通信终端集群中的其他通信终端发起呼叫时,所述方法包括以下步骤:
所述第二发起方通信终端获得第二实时声音信号,并对所述第二实时声音信号进行话音激活检测;
若检测到所述第二实时声音信号中存在人声,则对所述第二实时声音信号进行语音识别,若所述第二实时声音信号中存在与第三指令相匹配的语音指令,则所述中心通信系统停止向所述目标方通信终端集群转发所述第一发起方通信终端发送的第一实时声音信号,并向所述第一发起方通信终端和所述目标方通信终端集群发送通信结束信号;
所述第一发起方通信终端停止向所述中心通信系统传输所述第一实时声音信号;
所述第二发起方通信终端向所述中心通信系统传输所述第二实时声音信号,所述中心通信系统将收到的第二实时声音信号转发给对应的目标方通信终端。
6.根据权利要求3所述的一种特种作业环境下的对讲呼叫方法,其特征在于,所述方法还包括建立声纹数据库,所述声纹数据库用于存储人声特征,当第一发起方通信终端正在与目标方通信终端集群对讲,所述目标方通信终端集群中任意一个通信终端作为第二发起方通信终端向所述目标方通信终端集群中的其他通信终端发起呼叫时,所述方法包括以下步骤:
所述第二发起方通信终端获得第二实时声音信号,并对所述第二实时声音信号进行话音激活检测;
若检测到所述第二实时声音信号中存在人声,则对所述第二实时声音信号进行声纹识别,获得第一人声特征,若所述声纹数据库中存在与所述第一人声特征相同的人声特征,则所述中心通信系统停止向所述目标方通信终端集群转发所述第一发起方通信终端发送的第一实时声音信号,并向所述第一发起方通信终端和所述目标方通信终端集群发送通信结束信号;
所述第一发起方通信终端停止向所述中心通信系统传输所述第一实时声音信号;
所述第二发起方通信终端向所述中心通信系统传输所述第二实时声音信号,所述中心通信系统将收到的第二实时声音信号转发给对应的目标方通信终端。
7.根据权利要求1所述的一种特种作业环境下的对讲呼叫方法,其特征在于,所述步骤2中,若检测到所述第一实时声音信号中存在人声,则在所述第一发起方通信终端向所述中心通信系统发起通信请求信号前,对所述第一实时声音信号进行音量检测,若所述第一实时声音信号的音量大于阈值,则所述第一发起方通信终端向中心通信系统发送通信请求信号,并执行后续步骤。
8.根据权利要求1所述的一种特种作业环境下的对讲呼叫方法,其特征在于,所述步骤2中,若检测到所述第一实时声音信号中存在人声,则在所述第一发起方通信终端向所述中心通信系统发送通信请求信号前,对所述第一实时声音信号进行波达方向估计,获得人声方向,若所述人声方向在标准方位区间内,则所述第一发起方通信终端向中心通信系统发送通信请求信号,并执行后续步骤。
9.根据权利要求8实时的一种特种作业环境下的对讲呼叫方法,其特征在于,所述第一实时声音信号为阵列信号,所述第一发起方通信终端通过麦克风阵列获得所述第一实时声音信号。
10.一种特种作业环境下的对讲呼叫装置,包括无线通信模块、声音采集模块、存储模块、声音输出模块以及处理模块,其特征在于,所述声音采集模块用于获得实时声音信号,所述无线通信模块用于传输通信请求信号、通信结束信号和实时声音信号,所述声音输出模块用于输出收到的实时声音信号,所述存储模块用于存储可在所述处理模块上运行的计算机程序,所述处理模块执行所述计算机程序时实现如权利要求1-9中任意一个所述特种作业环境下的对讲呼叫方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210684954.3A CN115103319A (zh) | 2022-06-15 | 2022-06-15 | 一种特种作业环境下的对讲呼叫方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210684954.3A CN115103319A (zh) | 2022-06-15 | 2022-06-15 | 一种特种作业环境下的对讲呼叫方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115103319A true CN115103319A (zh) | 2022-09-23 |
Family
ID=83291658
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210684954.3A Pending CN115103319A (zh) | 2022-06-15 | 2022-06-15 | 一种特种作业环境下的对讲呼叫方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115103319A (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1098536A (ja) * | 1996-09-20 | 1998-04-14 | Matsushita Electric Ind Co Ltd | インターホン装置 |
US20060019613A1 (en) * | 2004-07-23 | 2006-01-26 | Lg Electronics Inc. | System and method for managing talk burst authority of a mobile communication terminal |
EP1622408A1 (en) * | 2004-07-28 | 2006-02-01 | LG Electronics Inc. | Talk burst allocation in group communication system supporting ptt service |
US20060079261A1 (en) * | 2004-09-29 | 2006-04-13 | Nec Corporation | Push-to-talk communication system, mobile communication terminal, and voice transmitting method |
CA2570695A1 (en) * | 2005-09-23 | 2007-03-23 | Bce Inc. | Method and system to enable touch-free incoming call handling and touch-free outgoing call origination |
US20070073536A1 (en) * | 2005-09-23 | 2007-03-29 | Bce Inc. | Methods and systems for touch-free call origination |
US20070121853A1 (en) * | 2005-09-23 | 2007-05-31 | Bce Inc. | Methods and systems for touch-free call handling |
US20080194279A1 (en) * | 2007-02-09 | 2008-08-14 | Nextel Communications, Inc. | Method for push-to-talk pre-emption |
CN101764882A (zh) * | 2009-12-31 | 2010-06-30 | 深圳市戴文科技有限公司 | 一种ptt通话装置及实现ptt通话的方法 |
CN107358958A (zh) * | 2017-08-30 | 2017-11-17 | 长沙世邦通信技术有限公司 | 对讲方法、装置及系统 |
DE102016118007A1 (de) * | 2016-09-23 | 2018-03-29 | Gira Giersiepen Gmbh & Co. Kg | Verfahren für den Betrieb mindestens einer Gebäudegegensprechanlage und eine entsprechende Gebäudegegensprechanlage |
CN111866256A (zh) * | 2019-04-19 | 2020-10-30 | 海能达通信股份有限公司 | 一种终端呼叫方法、呼叫终端及存储装置 |
-
2022
- 2022-06-15 CN CN202210684954.3A patent/CN115103319A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1098536A (ja) * | 1996-09-20 | 1998-04-14 | Matsushita Electric Ind Co Ltd | インターホン装置 |
US20060019613A1 (en) * | 2004-07-23 | 2006-01-26 | Lg Electronics Inc. | System and method for managing talk burst authority of a mobile communication terminal |
EP1622408A1 (en) * | 2004-07-28 | 2006-02-01 | LG Electronics Inc. | Talk burst allocation in group communication system supporting ptt service |
US20060079261A1 (en) * | 2004-09-29 | 2006-04-13 | Nec Corporation | Push-to-talk communication system, mobile communication terminal, and voice transmitting method |
CA2570695A1 (en) * | 2005-09-23 | 2007-03-23 | Bce Inc. | Method and system to enable touch-free incoming call handling and touch-free outgoing call origination |
US20070073536A1 (en) * | 2005-09-23 | 2007-03-29 | Bce Inc. | Methods and systems for touch-free call origination |
US20070121853A1 (en) * | 2005-09-23 | 2007-05-31 | Bce Inc. | Methods and systems for touch-free call handling |
US20080194279A1 (en) * | 2007-02-09 | 2008-08-14 | Nextel Communications, Inc. | Method for push-to-talk pre-emption |
CN101764882A (zh) * | 2009-12-31 | 2010-06-30 | 深圳市戴文科技有限公司 | 一种ptt通话装置及实现ptt通话的方法 |
DE102016118007A1 (de) * | 2016-09-23 | 2018-03-29 | Gira Giersiepen Gmbh & Co. Kg | Verfahren für den Betrieb mindestens einer Gebäudegegensprechanlage und eine entsprechende Gebäudegegensprechanlage |
CN107358958A (zh) * | 2017-08-30 | 2017-11-17 | 长沙世邦通信技术有限公司 | 对讲方法、装置及系统 |
CN111866256A (zh) * | 2019-04-19 | 2020-10-30 | 海能达通信股份有限公司 | 一种终端呼叫方法、呼叫终端及存储装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110557451B (zh) | 对话交互处理方法、装置、电子设备和存储介质 | |
JP6208376B2 (ja) | 複数のデバイス上でのホットワード検出 | |
CN105513596B (zh) | 一种语音控制方法和控制设备 | |
US12051441B2 (en) | Multi-register-based speech detection method and related apparatus, and storage medium | |
JP6402748B2 (ja) | 音声対話装置および発話制御方法 | |
CN102104473A (zh) | 一种单工终端与双工终端通话的方法及系统 | |
US8767922B2 (en) | Elimination of typing noise from conference calls | |
CN110489949B (zh) | 车辆及其车载终端隐私设置方法 | |
CN103024224B (zh) | 一种多人语音通信中的语音控制方法及装置 | |
WO2012089831A4 (en) | Communication system and method for handling voice and/or video calls when multiple audio or video transducers are available | |
CN108111701A (zh) | 静音处理方法和装置 | |
CN104602199A (zh) | 一种公网集群调度中ptt实现方法及系统 | |
CN113296728A (zh) | 音频播放方法、装置、电子设备及存储介质 | |
WO2022124040A1 (ja) | 遠隔会議システム、通信端末、遠隔会議方法及びプログラム | |
CN101557563B (zh) | 用于数字集群通信系统的集群移动台及其业务态处理方法 | |
WO2017210856A1 (zh) | 控制音频输出的方法、用户终端和对讲机终端 | |
CN114039803A (zh) | 群组对讲消息管理方法、装置、计算机设备及存储介质 | |
CN115103319A (zh) | 一种特种作业环境下的对讲呼叫方法及装置 | |
CN108881840A (zh) | 带人脸识别功能的楼宇对讲系统及方法 | |
CN103916984A (zh) | 电脑与手机的接管通讯方法 | |
US11056106B2 (en) | Voice interaction system and information processing apparatus | |
CN113873384A (zh) | 无线耳机、基于无线耳机实现的对讲方法及对讲系统 | |
US20230254411A1 (en) | Group calling system, group calling method, and program | |
CN111028837B (zh) | 语音会话方法、语音识别系统及计算机存储介质 | |
CN115623126A (zh) | 语音通话方法、系统、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220923 |
|
RJ01 | Rejection of invention patent application after publication |