CN112116911B - 一种声音布控方法、装置及计算机可读存储介质 - Google Patents
一种声音布控方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN112116911B CN112116911B CN202011000038.0A CN202011000038A CN112116911B CN 112116911 B CN112116911 B CN 112116911B CN 202011000038 A CN202011000038 A CN 202011000038A CN 112116911 B CN112116911 B CN 112116911B
- Authority
- CN
- China
- Prior art keywords
- information
- vehicle
- voice
- speaker
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 102
- 238000012544 monitoring process Methods 0.000 claims abstract description 54
- 230000008569 process Effects 0.000 claims description 59
- 230000004044 response Effects 0.000 claims description 15
- 238000007726 management method Methods 0.000 claims description 13
- 238000004891 communication Methods 0.000 abstract description 22
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000001514 detection method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/24—Speech recognition using non-acoustical features
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/30—Services specially adapted for particular environments, situations or purposes
- H04W4/40—Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P]
- H04W4/48—Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P] for in-vehicle communication
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开的声音布控方法采集车辆的声音信息;对所述声音信息进行语音分析,获取所述声音信息中讲话者的信息参数并判断所述讲话者的信息参数是否满足预设条件,所述讲话者的信息参数包括声纹特征参数、性别、年龄范围中的至少一种;若所述讲话者的信息参数满足所述预设条件,向客户端发送监听通知,所述监听通知用于通知用户对所述车辆的声音信息进行实时监听;这样,本发明提供的声音布控方法满足预设条件的情况下通知用户对车辆的声音信息进行实时监听,能够在存在有效声音时通知用户进行监听,且不易给用户造成额外打扰,还能够有效节省通信资源,降低用户对车辆的管理成本。
Description
技术领域
本发明涉及车辆风险管控技术领域,尤其涉及一种声音布控方法、装置及计算机可读存储介质。
背景技术
随着电子技术的不断发展,用户对车辆的管理方式也越来越智能化,例如可以通过车载定位器对车辆进行实时定位或者通过车载定位器的定位数据确定车辆的历史行驶轨迹,方便用户对车辆进行防窃管理。目前,还可以通过在车辆上防止录音设备,实现对车辆的远程监听,用户可以结合车辆内部和/或周边的声音协助车辆的防窃定位管理。
现有技术中,当录音设备开启时,无论是否存在有效声音,均会向用户上报采集到的声音信息,一方面容易给用户造成打扰,且降低了用户获取有效信息的效率,另一方面容易造成通信资源的浪费,增加了用户对车辆的管理成本。
发明内容
有鉴于此,本发明提出一种声音布控方法、装置及计算机可读存储介质,以解决上述技术问题。
首先,为实现上述目的,本发明提出一种声音布控方法,所述方法包括:
采集车辆的声音信息;
对所述声音信息进行语音分析,获取所述声音信息中讲话者的信息参数并判断所述讲话者的信息参数是否满足预设条件,所述讲话者的信息参数包括声纹特征参数、性别、年龄范围中的至少一种;
若所述讲话者的信息参数满足所述预设条件,向客户端发送监听通知,所述监听通知用于通知用户对所述车辆的声音信息进行实时监听;
其中,所述预设条件包括以下的至少一项:
所述讲话者的信息参数与预设信息参数匹配,所述预设信息参数包括声纹特征参数、性别、年龄范围中的至少一种;
所述讲话者的信息参数的所述声纹特征参数在第一预设时长内出现次数大于预设次数,其中,某一声纹特征参数在所述车辆的M次行驶过程中出现则记录该声纹特征参数出现M次,M为大于或等于1的整数。
可选地,所述对所述声音信息进行语音分析,获取所述声音信息中讲话者的信息参数,包括:
对所述声音信息进行语音分类获得语音类型,所述语音类型包括:人声、噪音、音乐的至少一种;
若所述语音类型是所述人声,则对所述声音信息进行声纹识别获取所述讲话者的声纹特征参数,和/或对所述语音信息进行讲话者的性别判断获取所述讲话者的性别,和/或对所述语音信息进行讲话者的年龄范围判断获取所述讲话者的年龄范围。
可选地,所述讲话者的信息参数与所述预设信息参数匹配,包括:
所述讲话者的信息参数的所述声纹特征参数与所述预设信息参数的所述声纹特征参数匹配;
和/或,所述讲话者的信息参数的所述性别与所述预设信息参数的所述性别相同;
和/或,所述讲话者的信息参数的所述年龄范围落入所述预设信息参数的所述年龄范围。
可选地,所述车辆的一次行驶过程为检测到所述车辆启动并行驶,至所述车辆静止且检测到车门关闭的声音的过程。
可选地,所述方法还包括:
若所述讲话者的信息参数满足所述预设条件,在所述车辆的本次行驶过程中不再对所述声音信息进行语音分析。
可选地,所述方法还包括:
在所述车辆的一次行程过程中,对所述讲话者的信息参数中的所述声纹特征参数和/或所述性别和/或所述年龄范围进行分析,得到所述车辆的乘客数量;
所述车辆的乘客数量达到所述车辆的车辆限乘人数后,在所述车辆的本次行驶过程中不再对所述声音信息进行语音分析,其中,所述车辆限乘人数根据所述车辆的类型获得或通过用户设置获得。
可选地,所述在所述车辆的一次行程过程中,对所述讲话者的信息参数中的所述声纹特征参数和/或所述性别和/或所述年龄范围进行分析,得到所述车辆的乘客数量,包括以下步骤:
所述讲话者的信息参数中的所述声纹特征参数与所述车辆的本次行驶过程中已保存的其他讲话者的声纹特征参数不匹配,则所述讲话者为新的乘客,所述车辆的乘客数量加1;
所述讲话者的信息参数中的所述性别与所述车辆的本次行驶过程中已保存的其他讲话者的性别不相同和/或所述讲话者的信息参数中的所述年龄范围不在所述车辆的本次行驶过程中已保存的所述其他讲话者的年龄范围的范围之内,则所述讲话者为新的乘客,所述车辆的乘客数量加1。
可选地,所述若所述声音信息满足所述预设条件,向客户端发送监听通知,包括:
若所述声音信息满足所述预设条件,向客户端发送实时监听请求消息;
若第二预设时长内接收所述客户端发送的实时监听请求响应,向所述客户端实时上报采集的声音信息;
若所述第二预设时长内未接收到所述客户端发送的实时监听请求响应,通过预设方式向所述客户端发送监听通知,所述预设方式包括发送短信和/或拨打电话。
进一步地,为实现上述目的,本发明还提供一种声音布控装置,所述声音布控装置包括存储器、至少一个处理器以及存储在所述存储器上并可在所述至少一个处理器执行的至少一个程序,所述至少一个程序被所述至少一个处理器执行时实现上述方法中的步骤。
进一步地,为实现上述目的,本发明一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行的至少一个程序,所述至少一个程序被所述计算机执行时使所述计算机执行上述任一项所述的方法中的步骤。
相较于现有技术,本发明所提出的声音布控方法采集车辆的声音信息;对所述声音信息进行语音分析,获取所述声音信息中讲话者的信息参数并判断所述讲话者的信息参数是否满足预设条件,所述讲话者的信息参数包括声纹特征参数、性别、年龄范围中的至少一种;若所述讲话者的信息参数满足所述预设条件,向客户端发送监听通知,所述监听通知用于通知用户对所述车辆的声音信息进行实时监听;其中,所述预设条件包括以下的至少一项:所述讲话者的信息参数与预设信息参数匹配,所述预设信息参数包括声纹特征参数、性别、年龄范围中的至少一种;所述讲话者的信息参数的所述声纹特征参数在第一预设时长内出现次数大于预设次数,其中,某一声纹特征参数在所述车辆的M次行驶过程中出现则记录该声纹特征参数出现M次,M为大于或等于1的整数。这样,本发明提供的声音布控方法满足预设条件的情况下通知用户对车辆的声音信息进行实时监听,能够在存在有效声音时通知用户进行监听,且不易给用户造成额外打扰,还能够有效节省通信资源,降低用户对车辆的管理成本。
附图说明
图1是本发明实施例提供的一种声音布控装置的结构示意图;
图2是本发明实施例提供的一种车载定位器的结构示意图;
图3是本发明实施例提供的一种服务器的结构示意图;
图4是本发明实施例提供的声音布控方法的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
请参阅图1,图1是本发明实施例提供的一种声音布控装置的结构示意图,如图1所示,声音布控装置100包括处理器101以及存储器102,所述存储器102用于存储所述声音布控装置100的相关数据,例如程序,所述处理器101用于执行所述存储器102中存储的程序,并实现相应的功能。本发明实施例中,所述声音布控装置100可以为车载定位器,也可以为服务器。
请进一步参阅图2,图2是本发明实施例提供的一种车载定位器的结构示意图,如图2所示,车载定位器200包括处理器201以及存储器202,所述存储器202用于存储所述车载定位器200的相关数据,例如所述车载定位器200采集到的数据以及程序,所述处理器201用于执行所述存储器202中存储的程序,并实现相应的功能。
所述车载定位器200还包括定位模块203、录音模块204、无线通信模块205、震动传感器206、低电检测模块207以及电池模块208中的一种或多种。所述定位模块203用于对所述车载定位器200进行定位,获得所述车载定位器200的位置信息,所述定位模块203可以为GPS或北斗等定位芯片,通过获取车辆的经纬度信息,也可以为WIFI定位模块、蓝牙定位模块或者基站定位模块,通过获取周边的WIFI设备地址信息、蓝牙设备地址信息或者基站标识信息。
所述录音模块204用于收录所述车载定位器200周围的声音,所述无线通信模块205用于实现所述车载定位器200与外部设备之间的无线通信连接,所述无线通信模块205可以包括蓝牙通信模块、红外通信模块、WIFI通信模块、移动蜂窝网通信模块(如2G、3G、4G、5G通信模块)中的一种或多种。可以理解的是,在一些实施例中,所述车载定位器200可以包括有线通信模块,用于实现所述车载定位器200与车载终端之间的有线通信连接,进而通过所述车载终端实现为外部设备之间的通信连接。所述震动传感器206用于检测车辆的震动数据,所述处理器201可以根据所述震动传感器206检测的震动数据判断车辆的行驶状态(例如移动状态或静止状态)。所述低电检测模块207用于检测所述车载定位器200的电量信息,并向所述处理器201上报电池电量信息所述电池模块208用于为所述车载定位器200供电。
请参阅图3,图3是本发明实施例提供的一种服务器的结构示意图,如图3所示,服务器300包括处理器301以及存储器302,所述存储器302用于存储所述服务器300的相关数据,例如程序,所述处理器301用于执行所述存储器302中存储的程序,并实现相应的功能。
需要说明的是,当所述声音布控装置100为如图2所示的车载定位器200,所述车载定位器200可以通过服务器300实现与客户端的通信连接,也可以不通过所述服务器300,直接与所述客户端建立通信连接。当所述声音布控装置100为如图3所示的服务器300时,所述服务器300通过与所述车载定位器200建立通信连接,获取所述车载定位器200采集的数据,例如位置信息以及声音信息等。
基于上述声音布控装置100的结构示意图,提出本发明方法各个实施例。
参阅图4,图4是本发明实施例提供的一种声音布控方法的步骤流程图,所述方法应用于所述声音布控装置100中,如图4所示,所述方法包括:
步骤401、采集车辆的声音信息。
该步骤中,所述声音布控装置采集车辆的声音信息,当所述声音布控装置为车载定位器时,所述声音布控装置直接通过自身的录音模块采集车辆的声音信息。当所述声音布控装置为服务器时,所述声音布控模块通过与一车载定位器建立通信连接,并获取所述车载定位器采集的车辆的声音信息。
步骤402、对所述声音信息进行语音分析,获取所述声音信息中讲话者的信息参数并判断所述讲话者的信息参数是否满足预设条件,所述讲话者的信息参数包括声纹特征参数、性别、年龄范围中的至少一种;所述预设条件包括以下的至少一项:所述讲话者的信息参数与预设信息参数匹配,所述预设信息参数包括声纹特征参数、性别、年龄范围中的至少一种;所述讲话者的信息参数的所述声纹特征参数在第一预设时长内出现次数大于预设次数,其中,某一声纹特征参数在所述车辆的M次行驶过程中出现则记录该声纹特征参数出现M次,M为大于或等于1的整数。
该步骤中,所述声音布控装置对所述声音信息进行语音分析,获取所述声音信息中讲话者的信息参数并判断所述讲话者的信息参数是否满足预设条件。对于语音内容过长的情况,可以将语音内容拆分成多条,然后逐条进行语音分析。需要说明的是,所述声音布控装置内部可以部署语音识别装置,通过所述语音识别装置对所述声音信息进行语音分析,也可以不部署语音识别装置,通过调用外部语音识别服务器实现对所述声音信息进行语音分析的功能。
所述预设条件可以包括所述讲话者的信息参数与预设信息参数匹配,所述预设信息参数包括声纹特征参数、性别、年龄范围中的至少一种。该实施例中,通过判断是否存在特定讲话者确定是否满足预设条件,具体地,当所述声音信息中讲话者的信息参数与预设信息参数匹配时,确定所述车辆中存在特定讲话者(例如指定讲话者,或者特定性别的讲话者,或者特定年龄范围的讲话者),所述讲话者的信息参数满足所述预设条件。
所述预设条件也可以包括所述讲话者的信息参数的所述声纹特征参数在第一预设时长内出现次数大于预设次数。该实施例中,记录车辆每一次行驶过程中声纹特征参数出现的次数,当所述讲话者的声纹特征参数在第一预设时长内出现次数大于预设次数,则确定所述讲话者的信息参数满足所述预设条件。需要说明的是,在记录声纹特征参数出现次数时,若某一声纹特征参数在所述车辆的M次行驶过程中出现则记录该声纹特征参数出现M次,M为大于或等于1的整数。
所述预设条件可以是用户根据实际需求预先设置的监听条件,本发明一些实施例中,在声音布控过程中和/或声音布控完成后,所述方法还能够接收针对所述预设条件的修改操作,并根据所述修改操作更新所述预设条件。
步骤403、若所述讲话者的信息参数满足所述预设条件,向客户端发送监听通知,所述监听通知用于通知用户对所述车辆的声音信息进行实时监听。
该步骤中,若所述讲话者的信息参数满足所述预设条件,所述声音布控装置向客户端发送监听通知,所述监听通知用于通知用户对所述车辆的声音信息进行实时监听,所述客户端为车主或管理员使用的终端。
具体地,所述声音布控装置可以向所述客户端发送监听通知,所述客户端在接收到所述监听通知后,向所述声音布控装置发送监听通知应答消息,所述声音布控装置在接收到所述监听通知应答消息后与所述客户端建立语音实时监听通道,例如通过VoIP(Voiceover Internet Protocol,基于IP的语音传输)呼叫方式建立语音实时监听通道,或者通过拨通电话号码的方式进行实时监听,本实施例中,为了节省通信费用,优先通过VoIP方式建立语音实时监听通道。
在监听过程中,若车辆处于行驶状态,且连续多次检测到讲话者的信息参数不满足所述预设条件(例如大于10次检测到讲话者的信息参数不满足所述预设条件),所述声音布控装置可以停止向所述客户端实时上报语音。当车辆从行驶状态变成停止状态时,所述声音布控装置重新判断检测到的讲话者的信息参数是否满足所述预设条件。
本实施例中,所述声音布控方法采集车辆的声音信息;对所述声音信息进行语音分析,获取所述声音信息中讲话者的信息参数并判断所述讲话者的信息参数是否满足预设条件,所述讲话者的信息参数包括声纹特征参数、性别、年龄范围中的至少一种;若所述讲话者的信息参数满足所述预设条件,向客户端发送监听通知,所述监听通知用于通知用户对所述车辆的声音信息进行实时监听;其中,所述预设条件包括以下的至少一项:所述讲话者的信息参数与预设信息参数匹配,所述预设信息参数包括声纹特征参数、性别、年龄范围中的至少一种;所述讲话者的信息参数的所述声纹特征参数在第一预设时长内出现次数大于预设次数,其中,某一声纹特征参数在所述车辆的M次行驶过程中出现则记录该声纹特征参数出现M次,M为大于或等于1的整数。这样,本发明提供的声音布控方法满足预设条件的情况下通知用户对车辆的声音信息进行实时监听,能够在存在有效声音时通知用户进行监听,且不易给用户造成额外打扰,还能够有效节省通信资源,降低用户对车辆的管理成本。
以下以所述声音布控装置为服务器为例,对本发明提供的方法过程进行详细描述。
管理员需要对声音布控方式进行管理时,可以在客户端上开启应用程序,并通过应用程序向服务器发送声音布控请求,所述声音布控请求中携带有布控参数,所述布控参数可以包括布控类型(例如驾乘人员类型或指定驾乘人员)、驾乘人员信息参数(例如预设声纹特征参数、预设性别、预设年龄范围等)中的至少一种,还可以包括车辆的其他信息,例如用户账号、车载定位器标识、车辆限乘人数、贷款用户信息(如姓名、性别、年龄、联系方式等)中的至少一种。所述服务器接收到所述客户端发送的声音布控请求后,获取并保存所述声音布控请求中携带的布控参数,用于后续进行声音布控,并向所述客户端返回开启声音布控应答消息,标识所述服务器成功接收所述客户端发送的声音布控请求且已开启声音布控功能,所述服务器向所述车载定位器标识对应的车载定位器发送声音布控识别请求,用于请求获取所述车载定位器采集的声音信息,并根据获取的声音信息进行后续的声音布控步骤。可以理解的是,所述服务器向所述车载定位器发送所述声音布控请求之前,可以先判断所述车载定位器是否在线,若在线,则直接向所述车载定位器发送所述声音布控请求,若不在线,则等待所述车载定位器上线之后向所述车载定位器发送所述声音布控请求。所述车载定位器在接收到所述服务器发送的所述声音布控请求后,保存所述声音布控请求中的布控参数,并向所述服务器返回声音布控应答消息,此外,所述车载定位器还将采集到的声音信息向所述服务器上报。
以下以所述声音布控装置为车载定位器为例,对本发明提供的方法过程进行详细描述。
管理员需要对声音布控方式进行管理时,可以在客户端上开启应用程序,并通过应用程序向车载定位器发送声音布控请求,所述声音布控中携带有布控参数,所述布控参数可以包括布控类型(例如驾乘人员类型或指定驾乘人员)、驾乘人员信息参数(例如预设声纹特征参数、预设性别、预设年龄范围等)中的至少一种,还可以包括车辆的其他信息,例如用户账号、车载定位器标识、车辆限乘人数、贷款用户信息(如姓名、性别、年龄、联系方式等)中的至少一种。所述客户端可以直接与所述车载定位器建立通信连接并向所述车载定位器发送所述声音布控请求,也可以通过服务器向所述车载定位器发送所述声音布控请求。所述车载定位器接收到所述客户端发送的声音布控请求后,获取并保存所述声音布控请求中携带的布控参数,用于后续进行声音布控,并向所述客户端返回开启声音布控应答消息,标识所述车载定位器成功接收所述客户端发送的声音布控请求且已开启声音布控功能,所述载定位器获取采集的声音信息,并根据获取的声音信息进行后续的声音布控步骤。
可选地,所述对所述声音信息进行语音分析,获取所述声音信息中讲话者的信息参数,包括:
对所述声音信息进行语音分类获得语音类型,所述语音类型包括:人声、噪音、音乐的至少一种;
若所述语音类型是所述人声,则对所述声音信息进行声纹识别获取所述讲话者的声纹特征参数,和/或对所述语音信息进行讲话者的性别判断获取所述讲话者的性别,和/或对所述语音信息进行讲话者的年龄范围判断获取所述讲话者的年龄范围。
可选地,所述讲话者的信息参数与所述预设信息参数匹配,包括:
所述讲话者的信息参数的所述声纹特征参数与所述预设信息参数的所述声纹特征参数匹配;
和/或,所述讲话者的信息参数的所述性别与所述预设信息参数的所述性别相同;
和/或,所述讲话者的信息参数的所述年龄范围落入所述预设信息参数的所述年龄范围。
可选地,所述车辆的一次行驶过程为检测到所述车辆启动并行驶,至所述车辆静止且检测到车门关闭的声音的过程。
可选地,所述方法还包括:
若所述讲话者的信息参数满足所述预设条件,在所述车辆的本次行驶过程中不再对所述声音信息进行语音分析。
该实施例中,在一次行驶过程中,若确定讲话者的信息参数满足所述预设条件,并向所述客户端发送所述监听通知之后,在车辆的本次行驶过程中不再对所述声音信息进行语音分析。
可选地,所述方法还包括:
在所述车辆的一次行程过程中,对所述讲话者的信息参数中的所述声纹特征参数和/或所述性别和/或所述年龄范围进行分析,得到所述车辆的乘客数量;
所述车辆的乘客数量达到所述车辆的车辆限乘人数后,在所述车辆的本次行驶过程中不再对所述声音信息进行语音分析,其中,所述车辆限乘人数根据所述车辆的类型获得或通过用户设置获得。
可选地,所述在所述车辆的一次行程过程中,对所述讲话者的信息参数中的所述声纹特征参数和/或所述性别和/或所述年龄范围进行分析,得到所述车辆的乘客数量,包括以下步骤:
所述讲话者的信息参数中的所述声纹特征参数与所述车辆的本次行驶过程中已保存的其他讲话者的声纹特征参数不匹配,则所述讲话者为新的乘客,所述车辆的乘客数量加1;
所述讲话者的信息参数中的所述性别与所述车辆的本次行驶过程中已保存的其他讲话者的性别不相同和/或所述讲话者的信息参数中的所述年龄范围不在所述车辆的本次行驶过程中已保存的所述其他讲话者的年龄范围的范围之内,则所述讲话者为新的乘客,所述车辆的乘客数量加1。
本发明一些实施例中,在根据声纹特征参数确定驾乘人员信息时,可以通过设置乘客标识进行统计,针对每一次行驶过程中获取的每一声纹特征参数设置对应的乘客标识,其中,相同的声纹特征参数对应相同的乘客标识,同时将根据该声纹特征参数确定的性别、年龄范围与该乘客标识关联并存储,记录的方式如下:
车辆行程ID | 乘客标识 | 声纹特征码10 |
20201213008 | GPS005 | WX124xafw543 |
20201213008 | GPS009 | WX173284x4fw |
20201113007 | GPS005 | WX124xafw543 |
20201014011 | GPS005 | WX124xafw543 |
20201119009 | GPS005 | WX124xafw543 |
20201119009 | GPS011 | WX111xaf2w57 |
20201119009 | GPS009 | WX173284x4fw |
在一次行驶过程中,若多次检测到相同的声纹特征参数,则在该次行驶过程中仅记录该声纹特征参数出现一次。在一次行驶过程中,若检测到的驾乘人员数量达到车辆最大允许乘坐的乘客数量,即若检测到不相同的声纹特征参数的数量达到车辆最大允许乘坐的乘客数量,则在针对该次行驶过程中的声音信息不作进一步的语音分析。例如车辆最多允许乘坐5个人,在该次行驶过程中已检测到5个驾乘人员的声纹特征参数时,在该次行驶过程中不再进行声音布控的语音信息分析。
可选地,所述若所述声音信息满足所述预设条件,向客户端发送监听通知,包括:
若所述声音信息满足所述预设条件,向客户端发送实时监听请求消息;
若第二预设时长内接收所述客户端发送的实时监听请求响应,向所述客户端实时上报采集的声音信息;
若所述第二预设时长内未接收到所述客户端发送的实时监听请求响应,通过预设方式向所述客户端发送监听通知,所述预设方式包括发送短信和/或拨打电话。
本领域普通技术人员可以理解实现上述实施例方法的全部或者部分步骤是可以通过至少一个程序指令相关的硬件来完成,所述至少一个程序可以存储于如图1所示的声音布控装置100的存储器102中,并能够被所述声音布控装置100的处理器101执行,所述至少一个程序被所述处理器执行时实现如下步骤:
采集车辆的声音信息;
对所述声音信息进行语音分析,获取所述声音信息中讲话者的信息参数并判断所述讲话者的信息参数是否满足预设条件,所述讲话者的信息参数包括声纹特征参数、性别、年龄范围中的至少一种;
若所述讲话者的信息参数满足所述预设条件,向客户端发送监听通知,所述监听通知用于通知用户对所述车辆的声音信息进行实时监听;
其中,所述预设条件包括以下的至少一项:
所述讲话者的信息参数与预设信息参数匹配,所述预设信息参数包括声纹特征参数、性别、年龄范围中的至少一种;
所述讲话者的信息参数的所述声纹特征参数在第一预设时长内出现次数大于预设次数,其中,某一声纹特征参数在所述车辆的M次行驶过程中出现则记录该声纹特征参数出现M次,M为大于或等于1的整数。
可选地,所述对所述声音信息进行语音分析,获取所述声音信息中讲话者的信息参数,包括:
对所述声音信息进行语音分类获得语音类型,所述语音类型包括:人声、噪音、音乐的至少一种;
若所述语音类型是所述人声,则对所述声音信息进行声纹识别获取所述讲话者的声纹特征参数,和/或对所述语音信息进行讲话者的性别判断获取所述讲话者的性别,和/或对所述语音信息进行讲话者的年龄范围判断获取所述讲话者的年龄范围。
可选地,所述讲话者的信息参数与所述预设信息参数匹配,包括:
所述讲话者的信息参数的所述声纹特征参数与所述预设信息参数的所述声纹特征参数匹配;
和/或,所述讲话者的信息参数的所述性别与所述预设信息参数的所述性别相同;
和/或,所述讲话者的信息参数的所述年龄范围落入所述预设信息参数的所述年龄范围。
可选地,所述车辆的一次行驶过程为检测到所述车辆启动并行驶,至所述车辆静止且检测到车门关闭的声音的过程。
可选地,所述处理器101还用于实现以下步骤:
若所述讲话者的信息参数满足所述预设条件,在所述车辆的本次行驶过程中不再对所述声音信息进行语音分析。
可选地,所述处理器101还用于实现以下步骤:
在所述车辆的一次行程过程中,对所述讲话者的信息参数中的所述声纹特征参数和/或所述性别和/或所述年龄范围进行分析,得到所述车辆的乘客数量;
所述车辆的乘客数量达到所述车辆的车辆限乘人数后,在所述车辆的本次行驶过程中不再对所述声音信息进行语音分析,其中,所述车辆限乘人数根据所述车辆的类型获得或通过用户设置获得。
可选地,所述在所述车辆的一次行程过程中,对所述讲话者的信息参数中的所述声纹特征参数和/或所述性别和/或所述年龄范围进行分析,得到所述车辆的乘客数量,包括以下步骤:
所述讲话者的信息参数中的所述声纹特征参数与所述车辆的本次行驶过程中已保存的其他讲话者的声纹特征参数不匹配,则所述讲话者为新的乘客,所述车辆的乘客数量加1;
所述讲话者的信息参数中的所述性别与所述车辆的本次行驶过程中已保存的其他讲话者的性别不相同和/或所述讲话者的信息参数中的所述年龄范围不在所述车辆的本次行驶过程中已保存的所述其他讲话者的年龄范围的范围之内,则所述讲话者为新的乘客,所述车辆的乘客数量加1。
可选地,所述若所述声音信息满足所述预设条件,向客户端发送监听通知,包括:
若所述声音信息满足所述预设条件,向客户端发送实时监听请求消息;
若第二预设时长内接收所述客户端发送的实时监听请求响应,向所述客户端实时上报采集的声音信息;
若所述第二预设时长内未接收到所述客户端发送的实时监听请求响应,通过预设方式向所述客户端发送监听通知,所述预设方式包括发送短信和/或拨打电话。
本领域普通技术人员可以理解实现上述实施例方法的全部或者部分步骤是可以通过至少一个程序指令相关的硬件来完成,所述至少一个程序可以存储于一计算机可读存储介质中,该至少一个程序被执行时,实现以下步骤:
采集车辆的声音信息;
对所述声音信息进行语音分析,获取所述声音信息中讲话者的信息参数并判断所述讲话者的信息参数是否满足预设条件,所述讲话者的信息参数包括声纹特征参数、性别、年龄范围中的至少一种;
若所述讲话者的信息参数满足所述预设条件,向客户端发送监听通知,所述监听通知用于通知用户对所述车辆的声音信息进行实时监听;
其中,所述预设条件包括以下的至少一项:
所述讲话者的信息参数与预设信息参数匹配,所述预设信息参数包括声纹特征参数、性别、年龄范围中的至少一种;
所述讲话者的信息参数的所述声纹特征参数在第一预设时长内出现次数大于预设次数,其中,某一声纹特征参数在所述车辆的M次行驶过程中出现则记录该声纹特征参数出现M次,M为大于或等于1的整数。
可选地,所述对所述声音信息进行语音分析,获取所述声音信息中讲话者的信息参数,包括:
对所述声音信息进行语音分类获得语音类型,所述语音类型包括:人声、噪音、音乐的至少一种;
若所述语音类型是所述人声,则对所述声音信息进行声纹识别获取所述讲话者的声纹特征参数,和/或对所述语音信息进行讲话者的性别判断获取所述讲话者的性别,和/或对所述语音信息进行讲话者的年龄范围判断获取所述讲话者的年龄范围。
可选地,所述讲话者的信息参数与所述预设信息参数匹配,包括:
所述讲话者的信息参数的所述声纹特征参数与所述预设信息参数的所述声纹特征参数匹配;
和/或,所述讲话者的信息参数的所述性别与所述预设信息参数的所述性别相同;
和/或,所述讲话者的信息参数的所述年龄范围落入所述预设信息参数的所述年龄范围。
可选地,所述车辆的一次行驶过程为检测到所述车辆启动并行驶,至所述车辆静止且检测到车门关闭的声音的过程。
可选地,所述至少一个程序被执行时,还可实现以下步骤:
若所述讲话者的信息参数满足所述预设条件,在所述车辆的本次行驶过程中不再对所述声音信息进行语音分析。
可选地,所述至少一个程序被执行时,还可实现以下步骤:
在所述车辆的一次行程过程中,对所述讲话者的信息参数中的所述声纹特征参数和/或所述性别和/或所述年龄范围进行分析,得到所述车辆的乘客数量;
所述车辆的乘客数量达到所述车辆的车辆限乘人数后,在所述车辆的本次行驶过程中不再对所述声音信息进行语音分析,其中,所述车辆限乘人数根据所述车辆的类型获得或通过用户设置获得。
可选地,所述在所述车辆的一次行程过程中,对所述讲话者的信息参数中的所述声纹特征参数和/或所述性别和/或所述年龄范围进行分析,得到所述车辆的乘客数量,包括以下步骤:
所述讲话者的信息参数中的所述声纹特征参数与所述车辆的本次行驶过程中已保存的其他讲话者的声纹特征参数不匹配,则所述讲话者为新的乘客,所述车辆的乘客数量加1;
所述讲话者的信息参数中的所述性别与所述车辆的本次行驶过程中已保存的其他讲话者的性别不相同和/或所述讲话者的信息参数中的所述年龄范围不在所述车辆的本次行驶过程中已保存的所述其他讲话者的年龄范围的范围之内,则所述讲话者为新的乘客,所述车辆的乘客数量加1。
可选地,所述若所述声音信息满足所述预设条件,向客户端发送监听通知,包括:
若所述声音信息满足所述预设条件,向客户端发送实时监听请求消息;
若第二预设时长内接收所述客户端发送的实时监听请求响应,向所述客户端实时上报采集的声音信息;
若所述第二预设时长内未接收到所述客户端发送的实时监听请求响应,通过预设方式向所述客户端发送监听通知,所述预设方式包括发送短信和/或拨打电话。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (8)
1.一种声音布控方法,其特征在于,所述方法包括:
采集车辆的声音信息;
对所述声音信息进行语音分析,获取所述声音信息中讲话者的信息参数并判断所述讲话者的信息参数是否满足预设条件,所述讲话者的信息参数包括声纹特征参数、性别、年龄范围中的至少一种;
若所述讲话者的信息参数满足所述预设条件,向客户端发送监听通知,所述监听通知用于通知用户对所述车辆的声音信息进行实时监听;
其中,所述预设条件包括以下的至少一项:
所述讲话者的信息参数与预设信息参数匹配,所述预设信息参数包括声纹特征参数、性别、年龄范围中的至少一种;
所述讲话者的信息参数的所述声纹特征参数在第一预设时长内出现次数大于预设次数,其中,某一声纹特征参数在所述车辆的M次行驶过程中出现则记录该声纹特征参数出现M次,M为大于或等于1的整数;
其中,所述方法还包括:
在所述车辆的一次行程过程中,对所述讲话者的信息参数中的所述声纹特征参数进行分析,得到所述车辆的乘客数量,包括以下步骤:
所述讲话者的信息参数中的所述声纹特征参数与所述车辆的本次行驶过程中已保存的其他讲话者的声纹特征参数不匹配,则所述讲话者为新的乘客,所述车辆的乘客数量加1;
所述车辆的乘客数量达到所述车辆的车辆限乘人数后,在所述车辆的本次行驶过程中不再对所述声音信息进行语音分析,其中,所述车辆限乘人数根据所述车辆的类型获得或通过用户设置获得。
2.根据权利要求1所述的声音布控方法,其特征在于,所述对所述声音信息进行语音分析,获取所述声音信息中讲话者的信息参数,包括:
对所述声音信息进行语音分类获得语音类型,所述语音类型包括:人声、噪音、音乐的至少一种;
若所述语音类型是所述人声,则对所述声音信息进行声纹识别获取所述讲话者的声纹特征参数,和/或对所述声音信息进行讲话者的性别判断获取所述讲话者的性别,和/或对所述声音信息进行讲话者的年龄范围判断获取所述讲话者的年龄范围。
3.根据权利要求1所述的声音布控方法,其特征在于,所述讲话者的信息参数与所述预设信息参数匹配,包括:
所述讲话者的信息参数的所述声纹特征参数与所述预设信息参数的所述声纹特征参数匹配;
和/或,所述讲话者的信息参数的所述性别与所述预设信息参数的所述性别相同;
和/或,所述讲话者的信息参数的所述年龄范围落入所述预设信息参数的所述年龄范围。
4.根据权利要求1所述的声音布控方法,其特征在于,所述车辆的一次行驶过程为检测到所述车辆启动并行驶,至所述车辆静止且检测到车门关闭的声音的过程。
5.根据权利要求1所述的声音布控方法,其特征在于,所述方法还包括:
若所述讲话者的信息参数满足所述预设条件,在所述车辆的本次行驶过程中不再对所述声音信息进行语音分析。
6.根据权利要求1所述的声音布控方法,其特征在于,所述若所述讲话者的信息参数满足所述预设条件,向客户端发送监听通知,包括:
若所述声音信息满足所述预设条件,向客户端发送实时监听请求消息;
若第二预设时长内接收所述客户端发送的实时监听请求响应,向所述客户端实时上报采集的声音信息;
若所述第二预设时长内未接收到所述客户端发送的实时监听请求响应,通过预设方式向所述客户端发送监听通知,所述预设方式包括发送短信和/或拨打电话。
7.一种声音布控装置,其特征在于,所述声音布控装置包括存储器、至少一个处理器以及存储在所述存储器上并可在所述至少一个处理器执行的至少一个程序,所述至少一个程序被所述至少一个处理器执行时实现上述权利要求1~6任一项所述的方法中的步骤。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行的至少一个程序,其特征在于,所述至少一个程序被所述计算机执行时使所述计算机执行上述权利要求1~6任一项所述的方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011000038.0A CN112116911B (zh) | 2020-09-22 | 2020-09-22 | 一种声音布控方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011000038.0A CN112116911B (zh) | 2020-09-22 | 2020-09-22 | 一种声音布控方法、装置及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112116911A CN112116911A (zh) | 2020-12-22 |
CN112116911B true CN112116911B (zh) | 2023-12-19 |
Family
ID=73800113
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011000038.0A Active CN112116911B (zh) | 2020-09-22 | 2020-09-22 | 一种声音布控方法、装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112116911B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1996029216A1 (fr) * | 1995-03-20 | 1996-09-26 | Vladimir Lvovich Taubkin | Procede permettant de controler des vehicules faisant appel a un systeme de protection contre les acces non autorises fonctionnant par analyse vocale automatique, et systeme en vue de sa realisation |
CN1910633A (zh) * | 2003-08-15 | 2007-02-07 | 程滋颐 | 有面部识别和无线通讯功能的汽车安全防卫报警系统 |
CN107395352A (zh) * | 2016-05-16 | 2017-11-24 | 腾讯科技(深圳)有限公司 | 基于声纹的身份识别方法及装置 |
CN109383416A (zh) * | 2017-08-03 | 2019-02-26 | 松下电器(美国)知识产权公司 | 车辆控制装置、车辆控制方法和程序 |
CN110217194A (zh) * | 2019-04-28 | 2019-09-10 | 大众问问(北京)信息科技有限公司 | 共享汽车控制方法、装置及电子设备 |
CN110539721A (zh) * | 2019-09-04 | 2019-12-06 | 宝能汽车有限公司 | 一种车辆控制方法及其装置 |
CN111130807A (zh) * | 2019-12-31 | 2020-05-08 | 苏州思必驰信息科技有限公司 | 基于声纹识别的车载账户管理方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE602004030534D1 (de) * | 2003-01-28 | 2011-01-27 | Cellport Systems Inc | Ein System und ein Verfahren zum Steuern des Zugriffs von Anwendungen auf geschützte Mittel innerhalb eines sicheren Fahrzeugtelematiksystems |
-
2020
- 2020-09-22 CN CN202011000038.0A patent/CN112116911B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1996029216A1 (fr) * | 1995-03-20 | 1996-09-26 | Vladimir Lvovich Taubkin | Procede permettant de controler des vehicules faisant appel a un systeme de protection contre les acces non autorises fonctionnant par analyse vocale automatique, et systeme en vue de sa realisation |
CN1910633A (zh) * | 2003-08-15 | 2007-02-07 | 程滋颐 | 有面部识别和无线通讯功能的汽车安全防卫报警系统 |
CN107395352A (zh) * | 2016-05-16 | 2017-11-24 | 腾讯科技(深圳)有限公司 | 基于声纹的身份识别方法及装置 |
CN109383416A (zh) * | 2017-08-03 | 2019-02-26 | 松下电器(美国)知识产权公司 | 车辆控制装置、车辆控制方法和程序 |
CN110217194A (zh) * | 2019-04-28 | 2019-09-10 | 大众问问(北京)信息科技有限公司 | 共享汽车控制方法、装置及电子设备 |
CN110539721A (zh) * | 2019-09-04 | 2019-12-06 | 宝能汽车有限公司 | 一种车辆控制方法及其装置 |
CN111130807A (zh) * | 2019-12-31 | 2020-05-08 | 苏州思必驰信息科技有限公司 | 基于声纹识别的车载账户管理方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112116911A (zh) | 2020-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109584008B (zh) | 基于语音识别的网约车异常驾驶环境监督系统及方法 | |
US8005467B2 (en) | Method and system for providing a telematics readiness mode | |
US20190391999A1 (en) | Methods And Systems For Searching Utilizing Acoustical Context | |
US9290145B2 (en) | Detecting a transport emergency event and directly enabling emergency services | |
US8260639B1 (en) | Systems and methods for automobile accident claims initiation | |
US10604097B1 (en) | Detection and classification of events | |
US20120009894A1 (en) | Collaborative incident alert system for mobile devices | |
US20050096020A1 (en) | Providing status data for vehicle maintenance | |
CN112086098A (zh) | 一种驾乘人员分析方法、装置及计算机可读存储介质 | |
CN105303819A (zh) | 乘客通过手机监督司机行为和车辆环境的系统及方法 | |
CN110248133A (zh) | 一种网约车安全监控方法、装置及数据库节点 | |
JP7160454B2 (ja) | 情報を出力するための方法、装置及びシステム、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム | |
CN102594977A (zh) | 来电处理系统及方法 | |
CN110580799A (zh) | 一种出租车网约车驾乘人员言行自动预判报警系统 | |
CN111010668A (zh) | 基于车载终端位置的信息分享方法、终端设备、及服务器 | |
CN111801667B (zh) | 车辆用操作辅助装置和车辆用操作辅助方法 | |
CN112862507A (zh) | 网约车司乘纠纷的制止方法、装置、设备、介质以及产品 | |
CN112116911B (zh) | 一种声音布控方法、装置及计算机可读存储介质 | |
CN112118536B (zh) | 一种装置的省电方法、省电装置及计算机可读存储介质 | |
CN112698892A (zh) | 提醒危险的方法、装置、智能终端和存储介质 | |
CN112102854A (zh) | 一种录音过滤方法、装置及计算机可读存储介质 | |
CN111626907A (zh) | 一种报警信息处理方法及平台 | |
CN105719370B (zh) | 停车场声纹验证系统及其方法 | |
JP2002008164A (ja) | 緊急情報通知システム、緊急情報通知方法、緊急情報通知プログラム及び緊急情報サービスサーバ | |
CN113140212A (zh) | 一种车辆安全监控方法、装置及安全监控设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20230731 Address after: 518000, Building 522, Qianhai Platinum Residence, Intersection of Fusan Road and Fuqi Road, Dachanwan Port District, Haoye Community, Xixiang Street, Bao'an District, Shenzhen City, Guangdong Province Applicant after: Shenzhen Yimeinuo Technology Co.,Ltd. Address before: Group 6, Jisheng village, Datong Town, Changting County, Longyan City, Fujian Province Applicant before: Fujian hongxingfu Food Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |