CN111325386A - 交通工具运行状态的预测方法、装置、终端及存储介质 - Google Patents

交通工具运行状态的预测方法、装置、终端及存储介质 Download PDF

Info

Publication number
CN111325386A
CN111325386A CN202010086658.4A CN202010086658A CN111325386A CN 111325386 A CN111325386 A CN 111325386A CN 202010086658 A CN202010086658 A CN 202010086658A CN 111325386 A CN111325386 A CN 111325386A
Authority
CN
China
Prior art keywords
vehicle
state
environmental sound
prediction model
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010086658.4A
Other languages
English (en)
Other versions
CN111325386B (zh
Inventor
刘文龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jinsheng Communication Technology Co ltd
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Shanghai Jinsheng Communication Technology Co ltd
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jinsheng Communication Technology Co ltd, Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Shanghai Jinsheng Communication Technology Co ltd
Priority to CN202010086658.4A priority Critical patent/CN111325386B/zh
Publication of CN111325386A publication Critical patent/CN111325386A/zh
Priority to PCT/CN2021/074713 priority patent/WO2021159987A1/zh
Application granted granted Critical
Publication of CN111325386B publication Critical patent/CN111325386B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Signal Processing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本申请实施例公开了一种交通工具运行状态的预测方法、装置、终端及存储介质,属于人工智能领域。该方法包括:当处于交通工具时,通过麦克风采集环境音;对环境音进行特征提取,得到环境音的环境音特征,环境音特征包括能量特征和时频特征中的至少一种;将环境音特征输入预设预测模型,得到预设预测模型输出的目标预测结果,预设预测模型包括第一预测模型和第二预测模型中的至少一种;根据目标预测结果确定交通工具所处的目标运行状态。本申请实施例中,由于交通工具进站刹车和出站启动时的声音变化明显,且不受终端运动状态或其余环境音等其他因素影响,因此基于交通工具的运行时的声音特征预测运行状态能够提高准确率和有效性。

Description

交通工具运行状态的预测方法、装置、终端及存储介质
技术领域
本申请实施例涉及人工智能技术领域,特别涉及一种交通工具运行状态的预测方法、装置、终端及存储介质。
背景技术
人们在乘坐地铁等公共交通工具出行时,需要时刻注意当前停靠站点是否为自己的目标站点,而到站提醒功能则是一种提醒乘客在到达目标站时及时下车的功能。
相关技术中,终端通常利用传感器(例如加速度传感器、重力传感器和磁力传感器等)采集的数据,通过加速与减速计算交通工具是否进站或出站,从而判断终端当前所处的站点是否为乘客的目标站点。
然而,采用上述方法预测交通工具是否进站或出站时,交通工具在行驶过程中并非始终匀速行驶,并且乘客的握持终端的姿态、动作以及在交通工具内部的行走也会对终端的传感器产生一定影响,这些因素会导致终端的进出站预测不准确。
发明内容
本申请实施例提供了一种交通工具运行状态的预测方法、装置、终端及存储介质。所述技术方案如下:
一方面,本申请实施例提供了一种交通工具运行状态的预测方法,所述方法包括:
当处于交通工具时,通过麦克风采集环境音;
对所述环境音进行特征提取,得到所述环境音的环境音特征,所述环境音特征包括能量特征和时频特征中的至少一种;
将所述环境音特征输入预设预测模型,得到所述预设预测模型输出的目标预测结果,所述预设预测模型包括第一预测模型和第二预测模型中的至少一种,所述第一预测模型的输入为所述能量特征,所述第二预测模型的输入为所述时频特征,所述目标预测结果是预测出的所述交通工具所处的运行状态,所述运行状态包括进站状态、出站状态和行驶状态中的至少一种;
根据所述目标预测结果确定所述交通工具所处的目标运行状态。
另一方面,本申请实施例提供了一种交通工具运行状态的预测装置,所述装置包括:
采集模块,用于当处于交通工具时,通过麦克风采集环境音;
特征提取模块,用于对所述环境音进行特征提取,得到所述环境音的环境音特征,所述环境音特征包括能量特征和时频特征中的至少一种;
预测模块,用于将所述环境音特征输入预设预测模型,得到所述预设预测模型输出的目标预测结果,所述预设预测模型包括第一预测模型和第二预测模型中的至少一种,所述第一预测模型的输入为所述能量特征,所述第二预测模型的输入为所述时频特征,所述目标预测结果是预测出的所述交通工具所处的运行状态,所述运行状态包括进站状态、出站状态和行驶状态中的至少一种;
确定模块,用于根据所述目标预测结果确定所述交通工具所处的目标运行状态。
另一方面,本申请实施例提供了一种终端,所述终端包括处理器和存储器;所述存储器存储有至少一条指令,所述至少一条指令用于被所述处理器执行以实现上述方面所述的交通工具运行状态的预测方法。
另一方面,本申请实施例提供了一种计算机可读存储介质,所述存储介质存储有至少一条指令,所述至少一条指令用于被处理器执行以实现上述方面所述的交通工具运行状态的预测方法。
本申请实施例提供的技术方案的有益效果至少包括:
本申请实施例中,通过实时采集环境音,并根据环境音的环境音特征预测交通工具的运行状态,判断交通工具是否进站或出站;终端对采集到的环境音进行能量和时频特征提取,并将得到的环境音特征输入预设预测模型,使得预设预测模型对环境音的环境音特征进行识别,提高了预测结果的准确性;由于交通工具进站刹车和出站启动时的声音变化明显,且不受终端运动状态或其余环境音等其他因素影响,因此基于交通工具的声音变化预测运行状态能够提高运行状态预测的准确率和有效性。
附图说明
图1是根据一示例性实施例示出的交通工具的运行状态预测方法的流程图;
图2是根据另一示例性实施例示出的交通工具的运行状态预测方法的流程图;
图3是根据另一示例性实施例示出的交通工具的运行状态预测方法的流程图;
图4是根据一示例性实施例示出的能量特征提取模块的结构框图;
图5是根据一示例性实施例示出的MFCC特征矩阵提取模块的结构框图;
图6是根据一示例性实施例示出的交通工具出站状态的环境音频谱图;
图7是根据一示例性实施例示出的交通工具进站状态的环境音频谱图;
图8是根据一示例性实施例示出的第二预测模块的结构框图;
图9是根据一示例性实施例示出的滑窗处理示意图;
图10是根据另一示例性实施例示出的交通工具的运行状态预测方法的流程图;
图11是根据一示例性实施例示出的交通工具的运行状态预测装置的结构框图;
图12是根据一示例性实施例示出的终端的结构框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
相关技术中,终端通常利用传感器(例如加速度传感器、重力传感器和磁力传感器等)采集的数据,通过加速与减速计算交通工具是否进站或出站,从而判断终端当前所处的站点是否为乘客的目标站点。
然而,采用上述方法预测交通工具是否进站或出站时,交通工具在行驶过程中并非始终匀速行驶,而是具有一定的振荡现象;用户握持终端的姿态会对加速度传感器记录的加速度方向产生影响;并且如果用户在交通工具内部行走,终端记录的加速度值包含用户行走时的加速度,也会对终端的传感器产生一定影响,难以判断交通工具处于加速状态还是减速状态,这些因素会导致终端的进出站预测不准确。
为了解决上述问题,本申请实施例提供了一种交通工具运行状态的预测方法,该方法用于具备音频采集和处理功能的终端,该终端可以是智能手机、平板电脑、电子书阅读器、个人便携式计算机等。在一种可能的实施方式中,本申请实施例提供的交通工具运行状态的预测方法可以实现成为应用程序或者应用程序的一部分,并安装在终端中。当用户乘坐交通工具时,可以手动开启该应用程序(或应用程序自动开启),从而通过应用程序,提示用户当前所在站点。
请参考图1,其示出了本申请的一个实施例示出的交通工具运行状态的预测方法的流程图。本实施例以交通工具运行状态的预测方法用于具备音频采集和处理功能的终端为例进行说明,该方法包括:
步骤101,当处于交通工具时,通过麦克风采集环境音。
当处于交通工具时,终端开启运行状态预测功能,并通过麦克风实时采集环境音。
在一种可能的实施方式中,交通工具的运行状态预测方法应用于地图导航类应用程序时,终端实时获取用户位置信息,当根据用户位置信息确定用户进入交通工具时,终端开启运行状态预测功能。
可选的,当用户使用支付类应用程序进行刷卡乘坐交通工具时,终端确认进入交通工具,开启运行状态预测功能。
可选的,为了降低终端的功耗,终端可使用低功耗麦克风进行实时采集。
步骤102,对环境音进行特征提取,得到环境音的环境音特征,环境音特征包括能量特征和时频特征中的至少一种。
由于终端无法直接从环境音的中识别出交通工具运行时的声音变化情况,因此,需要对采集到的环境音进行预处理。在一种可能的实施方式中,终端将通过麦克风实时采集的环境音转换为音频数据,并对音频数据进行环境音特征提取,得到终端能够识别的数字特征。
交通工具在进站刹车时,存在声音的能量由大到小的渐变过程,同时声音信号的频率也存在明显变化;同样地,交通工具出站加速时,存在声音的能量由小到大的渐变过程和频率变化。因此,在一种可能的实施方式中,终端采集环境音后,对环境音的能量特征和时频特征中的至少一种进行提取。
步骤103,将环境音特征输入预设预测模型,得到预设预测模型输出的目标预测结果,预设预测模型包括第一预测模型和第二预测模型中的至少一种。
其中,第一预测模型的输入为能量特征,第二预测模型的输入为时频特征,目标预测结果是预测出的交通工具所处的运行状态,运行状态包括进站状态、出站状态和行驶状态中的至少一种。
在一种可能的实施方式中,终端将简单且功耗较低的第一预测模型作为预设预测模型,利用环境音的能量特征得到目标预测结果。
可选的,为了提高预测结果的准确性,终端将精确度高但功耗较大的第二预测模型作为预设预测模型,利用环境音的时频特征得到目标预测结果。
可选的,为了在提高预测结果准确率的同时降低终端的功耗,终端中同时设置有第一预测模型和第二预测模型,在终端处于交通工具时始终开启第一预测模型,当第一预测模型判断交通工具可能处于进站状态或出站状态时,开启第二预测模型进行预测,得到目标预测结果后,关闭第二预测模型。
步骤104,根据目标预测结果确定交通工具所处的目标运行状态。
在一种可能的实施方式中,终端根据至少一个预设预测模型的目标预测结果确定交通工具所处的目标运行状态。可选的,当预测到交通工具即将进站或出站时向乘客发送进站或出站的提示消息。
综上所述,本申请实施例中,通过实时采集环境音,并根据环境音的环境音特征预测交通工具的运行状态,判断交通工具是否进站或出站;终端对采集到的环境音进行能量和时频特征提取,并将得到的环境音特征输入预设预测模型,使得预设预测模型对环境音的环境音特征进行识别,提高了预测结果的准确性;由于交通工具进站刹车和出站启动时的声音变化明显,且不受终端运动状态或其余环境音等其他因素影响,因此基于交通工具的声音变化预测运行状态能够提高运行状态预测的准确率和有效性。
由于终端在交通工具行驶过程中需要一直开启麦克风获取环境音,并将环境音的环境音特征输入预设预测模型进行运行状态的预测,因此预设预测模型一直处于工作状态。若终端中仅设置一种预设预测模型,则会存在预测准确率不高或终端功耗较大的问题,因此在一种可能的实施方式中,终端内设置两种预设预测模型,对于模型简单且功耗小的模型,可以实时开启运行,对于模型复杂功耗较大,但准确率高的模型,则在前一种模型的预测结果符合条件时开启,进一步预测交通工具的运行状态。
请参考图2,其示出了本申请的另一个实施例示出的交通工具运行状态的预测方法的流程图。本实施例以交通工具运行状态的预测方法用于具备音频采集和处理功能的终端为例进行说明,该方法包括:
步骤201,当处于交通工具时,通过麦克风采集环境音。
步骤202,对环境音进行特征提取,得到环境音的环境音特征,环境音特征包括能量特征和时频特征中的至少一种。
步骤201和202的实施方式可以参考上述步骤101和102,本实施例在此不再赘述。
步骤203,将能量特征输入第一预测模型,得到第一预测模型输出的第一预测结果。
在一种可能的实施方式中,第一预测模型是依据环境音的能量特征预测交通工具运行状态的模型。通过获取当前环境音的能量特征,比较一段时间内对应频率部分的能量变化,可以预测出交通工具的运行状态,例如,当能量由小到大变化时,交通工具可能正在加速出站;当能量由大到小变化时,交通工具可能正在减速进站;而能量变化幅度较小且没有一致的变化趋势时,交通工具可能正在行驶状态中。
可选的,第一预测模型可以采用过零率等数据作为环境音特征进行预测,例如在交通工具行驶和停止的声音信号中选取一个或多个频率作为标准频率,即0值,并筛选出信号频率过零点的音频帧,根据当前环境音的音频数据的过零率判断交通工具是否进站或出站。
步骤204,响应于第一预测结果指示交通工具处于行驶状态,确定第一预测结果为目标预测结果。
由于第一预测模型是根据环境音的能量特征进行预测的模型,因此对于环境音的变化预测不够精确,但当第一预测模型的第一预测结果指示交通工具处于行驶状态时,说明此时环境音的变化不符合进站状态或出站状态的能量特征,因此可以将第一预测结果作为目标预测结果,即交通工具的运行状态为行驶状态。
步骤205,响应于第一预测结果指示交通工具处于进站状态或出站状态,将时频特征输入第二预测模型,得到第二预测模型输出的第二预测结果。
在一种可能的实施方式中,当第一预测结果指示交通工具处于进站状态或出站状态时,为了保证预测结果的准确性,避免错误预测进出站情况,需要通过更精确的模型进一步预测,终端将环境音的时频特征输入第二预测模型,其中,第二预测模型是根据环境音的时频特征进行预测的模型,可以采用深度学习算法构建第二预测模型,提高预测准确率。
步骤206,将第二预测结果确定为目标预测结果。
第一预测结果为交通工具处于进站状态或出站状态时,终端开启第二预测模型进行预测,得到的第二预测结果可能为交通工具处于进站状态、出站状态或行驶状态,终端将第二预测结果确定为目标预测结果。
步骤207,根据目标预测结果确定交通工具所处的目标运行状态。
步骤207的实施方式可以参考上述步骤104,本实施例在此不再赘述。
本申请实施例中,通过设置两种预设预测模型预测交通工具的运行状态,其中第一预测模型功耗低且容易实现,实时开启并对环境音的环境音特征进行检测,第二预测模型精度高但功耗高,当第一预测模型判断交通工具可能进站或出站时开启第二预测模型,提高预测结果准确率的同时降低了终端的功耗。
在一种可能的实施方式中,在图2的基础上,如图3所示,上述步骤202包括步骤202a至202d。
步骤202a,对环境音的音频数据进行分帧处理,得到m个音频帧。
示意性的,请参考图4,其示出了一种能量特征提取模块的结构示意图。终端获取音频数据后,首先利用分帧模块401对音频数据进行分帧处理。
由于终端麦克风实时采集环境音,其音频数据整体上并不是平稳的,但其局部可以看作平稳数据,而预设预测模型只能对平稳数据进行识别,因此终端先将对应的音频数据进行分帧处理,得到m个不同音频帧对应的音频数据,其中,m为大于等于2的整数。
步骤202b,计算各个音频帧在预设频段的能量数值,所述预设频段为低于预设频率的低频频段。
可选的,由于交通工具运行时的声音信号主要为低频信号,为了减少其余高频环境音的影响,终端在计算能量数值时只选取低频部分的信号进行计算,例如0-600Hz。
在一种可能的实施方式中,终端利用傅里叶变换模块402对各个音频帧进行傅里叶变换,公式如下:
Figure BDA0002382291600000081
其中,N为傅里叶变换的点数,k为傅里叶变换的频率信息。
终端利用能量计算模块403计算经过傅里叶变换后的音频帧的能量数值。可选的,上述k表示环境音的频率信息,k由小到大表示频率由低频到高频,本申请实施例中计算前Y个频率部分的能量数值,Y的取值与N和交通工具的声音信号频率范围有关。各个音频帧前Y个频率部分的额能量数值计算公式如下:
Figure BDA0002382291600000082
其中,t表示各个音频帧,T为音频帧个数,Y为频段编号。
步骤202c,根据前m/2个音频帧对应的能量数值,计算第一能量数值。
为了获取环境音中预设频段的能量变化情况,终端需要将部分环境音对应的音频帧能量数值合并,并比较各部分的合并能量数值。
可选的,终端每次截取一定时长的环境音进行预测,例如,截取的环境音的时长为t,能量特征包括前t/2时长内环境音的第一能量数值,以及后t/2时长内环境音的第二能量数值,其中t为大于0的数,终端计算各个音频帧的能量数值后,计算前t/2的环境音对应的m/2个音频帧的第一能量数值。
其中,终端利用能量合并模块404计算第一能量数值的计算公式如下:
Figure BDA0002382291600000083
步骤202d,根据后m/2个音频帧对应的能量数值,计算第二能量数值。
相应的,终端利用能量合并模块404计算后m/2个音频帧对应的第二能量数值,计算公式如下:
Figure BDA0002382291600000091
在一种可能的实施方式中,在图2的基础上,如图3所示,上述步骤203包括步骤203a至203d。
步骤203a,将第一能量数值和第二能量数值输入第一预测模型。
终端利用第一预测模型进行预测时,依据的能量特征为第一能量数值和第二能量数值,为了体现环境音中低频部分的能量变化,终端首先计算第二能量数值与第一能量数值的比值,即E2/E1,若该比值大于1,则表示能量增大;若该比值小于1,则表示能量减小。
步骤203b,响应于第二能量数值与第一能量数值的比值小于等于第一阈值且大于等于第二阈值,输出指示交通工具处于行驶状态的第一预测结果。
第二能量数值与第一能量数值的比值处于不同范围时,对应的交通工具的运行状态不同。例如,当该比值在一定范围内上下浮动时,交通工具处于行驶状态,而当该比值超出一定阈值时,则表示该段时间内环境音低频部分的能量变化明显且有一定的趋势,交通工具可能处于进站状态或出站状态。
可选的,当第二能量数值与第一能量数值的比值小于等于第一阈值且大于等于第二阈值,输出指示交通工具处于行驶状态的第一预测结果,第一预测结果为交通工具处于行驶状态。
步骤203c,响应于第二能量数值与第一能量数值的比值大于第一阈值,输出指示交通工具处于出站状态的第一预测结果。
当第二能量数值与第一能量数值的比值大于第一阈值时,说明此时交通工具运行产生的声音能量由小变大,且变化率较大,则输出指示交通工具处于出站状态的第一预测结果。
步骤203d,响应于第二能量数值与第一能量数值的比值小于第二阈值,输出指示交通工具处于进站状态的第一预测结果,第二阈值小于第一阈值。
当第二能量数值与第一能量数值的比值小于第二阈值时,说明此时交通工具运行产生的声音能量由大变小,且变化率较大,则输出指示交通工具处于进站状态的第一预测结果。
示意性的,第一阈值为1.5,第二阈值为0.5,当第二能量数值与第一能量数值的比值大于0.5且小于1.5时,交通工具处于行驶状态;当第二能量数值与第一能量数值的比值大于1.5时,交通工具处于出站状态;当第二能量数值与第一能量数值的比值小于0.5时,交通工具处于进站状态。
在一种可能的实施方式中,当第一预测结果指示交通工具处于进站状态或出站状态时,终端开启第二预测模型对环境音进行进一步检测。
第二预测模型所依据的环境音特征为时频特征,因此在第二预测模型开启前,终端对环境音进行时频特征提取,得到环境音的时频特征,步骤如下:
一、对环境音的音频数据进行梅尔滤波处理,得到音频数据的梅尔谱。
示意性的,请参考图5,其示出了一种提取MFCC特征矩阵的模块结构示意图。音频数据首先经过预加重模块501进行预加重处理,预加重过程采用高通滤波器,其只允许高于某一频率的信号分量通过,而抑制低于该频率的信号分量,从而去除音频数据中人的交谈声、脚步声和机械噪音等不必要的低频干扰,使音频信号的频谱变得平坦。高通滤波器的数学表达式为:
H(z)=1-az-1
其中,a是修正系数,一般取值范围为0.95至0.97,z是音频信号。
将去除噪音后的音频数据通过分帧加窗模块502进行分帧处理,得到不同音频帧对应的音频数据。示意性的,本实施例中将包含1024个数据点的音频数据划分为一帧,当音频数据的采样频率选取为16000Hz时,一帧音频数据的时长为64ms。
由于分帧处理后的音频数据在后续特征提取时需要进行离散傅里叶变换,而一帧音频数据没有明显的周期性,即帧左端和帧右端不连续,经过傅里叶变换后与原始数据会产生误差,分帧越多误差越大,因此为了使分帧后的音频数据连续,且每一帧音频数据表现出周期函数的特征,需要通过分帧加窗模块502进行分帧加窗处理。
在一种可能的实施方式中,采用汉明窗对音频帧进行加窗处理。将每一帧数据乘以汉明窗函数,得到的音频数据就有了明显的周期性。汉明窗的函数形式为:
Figure BDA0002382291600000111
其中n为整数,n的取值范围为0至M,M是傅里叶变换的点数,示意性的,本实施例取1024个数据点作为傅里叶变换点。
二、根据音频数据的梅尔谱计算梅尔频率倒谱系数(Mel-Frequency CepstralCoefficients,MFCC),得到音频数据的MFCC特征矩阵,MFCC特征矩阵用于表示时频特征。
由于从音频信号在时域上的变换中很难得到其信号特性,通常需要把时域信号转换为频域上的能量分布来处理,因此终端先将音频帧数据输入傅里叶变换模块503进行傅里叶变换,然后将傅里叶变换后的音频帧数据输入能量谱计算模块454,计算音频帧数据的能量谱。为了将其能量谱转化为符合人耳听觉的梅尔谱,需要将能量谱输入梅尔滤波处理模块进行滤波处理,滤波处理的数学表达式为:
Figure BDA0002382291600000112
其中,f为傅里叶变换后的频点。
得到音频帧的梅尔谱之后,终端通过离散余弦变换(Discrete CosineTransform,DCT)模块506对其取对数,得到的DCT系数即为MFCC特征。
示意性的,本申请实施例选取128维的MFCC特征,终端在实际提取特征时,音频数据的时长为10s,而一帧信号的时间长度为64ms,因此每一次输入音频数据对应生成的时频特征为156*128的矩阵,多余的16ms数据不需要计算。
可选的,第二预测模型是采用卷积神经网络(Convolutional Neural Networks,CNN)的分类模型,该分类模型根据第一样本、第二样本和第三样本训练,其中,第一样本为进站状态下采集的样本环境音,第二样本为出站状态下采集的样本环境音,第三样本为行驶状态下采集的样本环境音,且分类模型以焦点损失(Focal loss)为损失函数,通过梯度下降算法训练得到。
在一种可能的实施方式中,CNN分类模型的训练过程如下:
一、将采集到的包含进站、出站和行驶状态的环境音转换为频谱图。
请参考图6和图7,其分别示出了一种交通工具出站状态和进站状态的频谱图他,可以明显看出图中低频部分的能量变化情况,交通工具出站状态的频谱图中,低频部分的能量由低到高,在图中表现为底部601颜色由暗变亮;交通工具进站状态的频谱图中,低频部分的能量由高到低,在图中表现为底部701颜色由亮变暗;对于行驶状态的频谱图,其低频部分的能量变化不大,频谱图的底部颜色较均匀。
二、对采集到的环境音进行特征提取。
事先采集的环境音的特征提取方式与上述实施例中的时频特征提取方式相同,每个音频帧对应的MFCC矩阵作为一条训练样本,其中,第一样本为进站状态下采集的样本环境音,对应的样本标签为1;第二样本为出站状态下采集的样本环境音,对应的样本标签为0;第三样本为行驶状态下采集的样本环境音,对应的样本标签为2。
三、构建CNN模型。
在一种可能的实施方式中,CNN模型结构如图8所示,第一卷积层801和第二卷积层802用于提取输入的音频特征矩阵的特征,第一全连接层803和第二全连接层804整合卷积层801和802中具有类别区分性的信息,最后接归一化指数函数(Softmax)805,将全连接层整合的信息进行分类,得到第二预测结果。
四、构建模型的损失函数。
由于交通工具行驶时,进站状态和出站状态通常只有几秒钟,而其余环境音长达几分钟,样本数据非常不平衡,因此选取Focal loss解决样本不均衡的问题,Focal loss公式如下:
Figure BDA0002382291600000121
其中,y′为CNN分类模型输出的概率,y为训练样本对应的标签,α和γ为手动调节参数,用于调整三种样本的比例。
五、导入训练样本进行模型训练。
在一种可能的实施方式中,可以利用Tensorflow系统训练CNN分类模型,并采用Focal loss和梯度下降算法,直至模型收敛。
在一种可能的实施方式中,二级声音识别模型可以也可以采用其他的传统机器学习分类器或深度学习分类模型,本实施例对此不做限定。
实际乘车过程中,可能存在异常情况导致某一时间段内环境音的低频部分声音信号有明显变化,而此时交通工具可能处于行驶状态,若仅依据预设预测模型的一次预测结果确定交通工具的运行状态,可能导致进出站预测错误。为了进一步提高预测结果的准确率,在一种可能的实施方式中,终端通过麦克风采集环境音之后,对采集到的环境音进行滑窗处理,得到各个音频窗内的环境音。
示意性的,为了方便处理环境音的音频数据,终端将连续的音频数据分割,如图9所示,以10s为窗长,2.5s为步长对环境音的音频数据作滑窗处理,得到三个音频窗901、902和903,并以音频窗为单位执行后续的环境音特征提取和模型预测步骤。
可选的,根据目标预测结果确定交通工具所处的目标运行状态包括:
响应于连续n个音频窗对应的目标预测结果相同,且目标预测结果的置信度高于置信度阈值,将目标预测结果指示的运行状态确定为目标运行状态,n为大于等于2的整数。
由于滑窗处理时的步长较小,远远小于交通工具进站、出站或行驶时的时长,因此当交通工具进站或出站时,至少存在2个音频窗的目标预测结果为进站状态或出站状。因此为了排除异常情况,当连续n个音频窗对应的目标预测结果相同,并且目标预测结果的置信度高于置信度阈值时,终端确定目标预测结果指示的运行状态确定为目标运行状态。其中,置信度为第二预测模型输出结果中的概率值。
本申请实施例中,通过第一预测模型和第二预测模型对环境音的能量特征和时频特征进行检测,利用了环境音特征的稳定性和特有的变化情况,不易受其他因素干扰;并且对连续环境音进行滑窗处理,对预设预测模型输出的目标预测结果进行后处理(连续n个音频窗对应的目标预测结果相同,且目标预测结果的置信度高于置信度阈值时,将目标预测结果指示的运行状态确定为目标运行状态),进一步提高了预测结果的准确性,避免了异常情况的影响。
请参考图11,其示出了一种交通工具的运行状预测方法的流程图,步骤如下:
步骤1001,输入环境音。
步骤1002,滑窗处理。
步骤1003,能量特征提取。
步骤1004,能量阈值判断。当判断结果为交通工具运行状态是进站状态或出站状态时,执行步骤1005;否则返回步骤1001继续输入下一段环境音。
步骤1005,MFCC特征提取。
步骤1006,CNN分类。当判断结果为交通工具运行状态是进站状态或出站状态时,执行步骤1007;否则返回步骤1001继续输入下一段环境音。
步骤1007,后处理。
步骤1008,输出目标运行状态。
请参考图11,其示出了本申请一个示例性实施例提供的交通工具运行状态的预测装置的结构框图。该装置可以通过软件、硬件或者两者的结合实现成为终端的全部或一部分。该装置包括:
采集模块1101,用于当处于交通工具时,通过麦克风采集环境音;
特征提取模块1102,用于对所述环境音进行特征提取,得到所述环境音的环境音特征,所述环境音特征包括能量特征和时频特征中的至少一种;
预测模块1103,用于将所述环境音特征输入预设预测模型,得到所述预设预测模型输出的目标预测结果,所述预设预测模型包括第一预测模型和第二预测模型中的至少一种,所述第一预测模型的输入为所述能量特征,所述第二预测模型的输入为所述时频特征,所述目标预测结果是预测出的所述交通工具所处的运行状态,所述运行状态包括进站状态、出站状态和行驶状态中的至少一种;
确定模块1104,用于根据所述目标预测结果确定所述交通工具所处的目标运行状态。
可选的,所述预测模块1103,包括:
第一预测单元,用于将所述能量特征输入所述第一预测模型,得到所述第一预测模型输出的第一预测结果;
第一确定单元,用于响应于所述第一预测结果指示所述交通工具处于所述行驶状态,确定所述第一预测结果为所述目标预测结果;
第二预测单元,用于响应于所述第一预测结果指示所述交通工具处于所述进站状态或所述出站状态,将所述时频特征输入所述第二预测模型,得到所述第二预测模型输出的第二预测结果;
第二确定单元,用于将所述第二预测结果确定为所述目标预测结果。
可选的,所述环境音的时长为t,所述能量特征包括前t/2时长内所述环境音的第一能量数值,以及后t/2时长内所述环境音的第二能量数值,t为大于0的数;
所述第一预测单元,还用于:
将所述第一能量数值和所述第二能量数值输入所述第一预测模型;
响应于所述第二能量数值与所述第一能量数值的比值大于第一阈值,输出指示所述交通工具处于所述出站状态的所述第一预测结果;
响应于所述第二能量数值与所述第一能量数值的比值小于第二阈值,输出指示所述交通工具处于所述进站状态的所述第一预测结果,所述第二阈值小于所述第一阈值;
响应于所述第二能量数值与所述第一能量数值的比值小于等于所述第一阈值且大于等于所述第二阈值,输出指示所述交通工具处于所述行驶状态的所述第一预测结果。
可选的,所述特征提取模块1102,包括:
分帧单元,用于对所述环境音的音频数据进行分帧处理,得到m个音频帧,m为大于等于2的整数;
第一计算单元,用于计算各个音频帧在预设频段的能量数值,所述预设频段为低于预设频率的低频频段;
第二计算单元,用于根据前m/2个音频帧对应的所述能量数值,计算所述第一能量数值;
第三计算单元,用于根据后m/2个音频帧对应的所述能量数值,计算所述第二能量数值。
可选的,所述环境音特征为所述时频特征,所述特征提取模块1102,包括:
滤波单元,用于对所述环境音的音频数据进行梅尔滤波处理,得到所述音频数据的梅尔谱;
第四计算单元,用于根据所述音频数据的梅尔谱计算梅尔频率倒谱系数MFCC,得到所述音频数据的MFCC特征矩阵,所述MFCC特征矩阵用于表示所述时频特征。
可选的,所述第二预测模型是采用卷积神经网络CNN的分类模型,所述分类模型根据第一样本、第二样本和第三样本训练,所述第一样本为所述进站状态下采集的样本环境音,所述第二样本为所述出站状态下采集的样本环境音,所述第三样本为所述行驶状态下采集的样本环境音,且所述分类模型以焦点损失focal loss为损失函数,通过梯度下降算法训练得到。
可选的,所述装置还包括:
处理模块,用于对采集到的所述环境音进行滑窗处理,得到各个音频窗内的所述环境音;
所述确定模块1104,包括:
第三确定单元,用于响应于连续n个所述音频窗对应的所述目标预测结果相同,且所述目标预测结果的置信度高于置信度阈值,将所述目标预测结果指示的所述运行状态确定为所述目标运行状态,n为大于等于2的整数。
请参考图12,其示出了本申请一个示例性实施例提供的终端1200的结构方框图。该终端1200可以是智能手机、平板电脑、电子书、便携式个人计算机等安装并运行有应用程序的电子设备。本申请中的终端1200可以包括一个或多个如下部件:处理器1220、存储器1210、屏幕1230和麦克风1240。
处理器1220可以包括一个或者多个处理核心。处理器1220利用各种接口和线路连接整个终端1200内的各个部分,通过运行或执行存储在存储器1210内的指令、程序、代码集或指令集,以及调用存储在存储器1210内的数据,执行终端1200的各种功能和处理数据。可选地,处理器1220可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable LogicArray,PLA)中的至少一种硬件形式来实现。处理器1220可集成中央处理器(CentralProcessing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责屏幕1230所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器1220中,单独通过一块通信芯片进行实现。
存储器1210可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory,ROM)。可选地,该存储器1210包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器1210可用于存储指令、程序、代码、代码集或指令集。存储器1210可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等,该操作系统可以是安卓(Android)系统(包括基于Android系统深度开发的系统)、苹果公司开发的IOS系统(包括基于IOS系统深度开发的系统)或其它系统。存储数据区还可以存储终端1200在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。
屏幕1230可以为电容式触摸显示屏,该电容式触摸显示屏用于接收用户使用手指、触摸笔等任何适合的物体在其上或附近的触摸操作,以及显示各个应用程序的用户界面。触摸显示屏通常设置在终端1200的前面板。触摸显示屏可被设计成为全面屏、曲面屏或异型屏。触摸显示屏还可被设计成为全面屏与曲面屏的结合,异型屏与曲面屏的结合,本申请实施例对此不加以限定。
麦克风1240可以为低功耗麦克风,该麦克风1240用于终端开启进出站预测功能时采集环境音,也可以用于语音通话时采集环境音。麦克风1240通常设置在终端显示屏一侧的边缘部分(如下边缘),本申请实施例对此不加限定。
除此之外,本领域技术人员可以理解,上述附图所示出的终端1200的结构并不构成对终端1200的限定,终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。比如,终端1200中还包括射频电路、拍摄组件、传感器、音频电路、无线保真(Wireless Fidelity,Wi-Fi)组件、电源、蓝牙组件等部件,在此不再赘述。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如上各个实施例所述的交通工具运行状态的预测方法。
本申请实施例还提供了一种计算机程序产品,该计算机程序产品存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如上各个实施例所述的交通工具运行状态的预测方法。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本申请实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读存储介质中或者作为计算机可读存储介质上的一个或多个指令或代码进行传输。计算机可读存储介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。
以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种交通工具运行状态的预测方法,其特征在于,所述方法包括:
当处于交通工具时,通过麦克风采集环境音;
对所述环境音进行特征提取,得到所述环境音的环境音特征,所述环境音特征包括能量特征和时频特征中的至少一种;
将所述环境音特征输入预设预测模型,得到所述预设预测模型输出的目标预测结果,所述预设预测模型包括第一预测模型和第二预测模型中的至少一种,所述第一预测模型的输入为所述能量特征,所述第二预测模型的输入为所述时频特征,所述目标预测结果是预测出的所述交通工具所处的运行状态,所述运行状态包括进站状态、出站状态和行驶状态中的至少一种;
根据所述目标预测结果确定所述交通工具所处的目标运行状态。
2.根据权利要求1所述的方法,其特征在于,所述将所述环境音特征输入预设预测模型,得到所述预设预测模型输出的目标预测结果,包括:
将所述能量特征输入所述第一预测模型,得到所述第一预测模型输出的第一预测结果;
响应于所述第一预测结果指示所述交通工具处于所述行驶状态,确定所述第一预测结果为所述目标预测结果;
响应于所述第一预测结果指示所述交通工具处于所述进站状态或所述出站状态,将所述时频特征输入所述第二预测模型,得到所述第二预测模型输出的第二预测结果;
将所述第二预测结果确定为所述目标预测结果。
3.根据权利要求2所述的方法,其特征在于,所述环境音的时长为t,所述能量特征包括前t/2时长内所述环境音的第一能量数值,以及后t/2时长内所述环境音的第二能量数值,t为大于0的数;
所述将所述能量特征输入所述第一预测模型,得到所述第一预测模型输出的第一预测结果,包括:
将所述第一能量数值和所述第二能量数值输入所述第一预测模型;
响应于所述第二能量数值与所述第一能量数值的比值大于第一阈值,输出指示所述交通工具处于所述出站状态的所述第一预测结果;
响应于所述第二能量数值与所述第一能量数值的比值小于第二阈值,输出指示所述交通工具处于所述进站状态的所述第一预测结果,所述第二阈值小于所述第一阈值;
响应于所述第二能量数值与所述第一能量数值的比值小于等于所述第一阈值且大于等于所述第二阈值,输出指示所述交通工具处于所述行驶状态的所述第一预测结果。
4.根据权利要求3所述的方法,其特征在于,所述对所述环境音进行特征提取,得到所述环境音的环境音特征,包括:
对所述环境音的音频数据进行分帧处理,得到m个音频帧,m为大于等于2的整数;
计算各个音频帧在预设频段的能量数值,所述预设频段为低于预设频率的低频频段;
根据前m/2个音频帧对应的所述能量数值,计算所述第一能量数值;
根据后m/2个音频帧对应的所述能量数值,计算所述第二能量数值。
5.根据权利要求1至4任一所述的方法,其特征在于,所述环境音特征为所述时频特征,所述对所述环境音进行特征提取,得到所述环境音的环境音特征,包括:
对所述环境音的音频数据进行梅尔滤波处理,得到所述音频数据的梅尔谱;
根据所述音频数据的梅尔谱计算梅尔频率倒谱系数MFCC,得到所述音频数据的MFCC特征矩阵,所述MFCC特征矩阵用于表示所述时频特征。
6.根据权利要求1至4任一所述的方法,其特征在于,所述第二预测模型是采用卷积神经网络CNN的分类模型,所述分类模型根据第一样本、第二样本和第三样本训练,所述第一样本为所述进站状态下采集的样本环境音,所述第二样本为所述出站状态下采集的样本环境音,所述第三样本为所述行驶状态下采集的样本环境音,且所述分类模型以焦点损失focal loss为损失函数,通过梯度下降算法训练得到。
7.根据权利要求1至4任一所述的方法,其特征在于,所述通过麦克风采集环境音之后,所述方法还包括:
对采集到的所述环境音进行滑窗处理,得到各个音频窗内的所述环境音;
所述根据所述目标预测结果确定所述交通工具所处的目标运行状态包括:
响应于连续n个所述音频窗对应的所述目标预测结果相同,且所述目标预测结果的置信度高于置信度阈值,将所述目标预测结果指示的所述运行状态确定为所述目标运行状态,n为大于等于2的整数。
8.一种交通工具运行状态的预测装置,其特征在于,所述装置包括:
采集模块,用于当处于交通工具时,通过麦克风采集环境音;
特征提取模块,用于对所述环境音进行特征提取,得到所述环境音的环境音特征,所述环境音特征包括能量特征和时频特征中的至少一种;
预测模块,用于将所述环境音特征输入预设预测模型,得到所述预设预测模型输出的目标预测结果,所述预设预测模型包括第一预测模型和第二预测模型中的至少一种,所述第一预测模型的输入为所述能量特征,所述第二预测模型的输入为所述时频特征,所述目标预测结果是预测出的所述交通工具所处的运行状态,所述运行状态包括进站状态、出站状态和行驶状态中的至少一种;
确定模块,用于根据所述目标预测结果确定所述交通工具所处的目标运行状态。
9.一种终端,其特征在于,所述终端包括处理器和存储器;所述存储器存储有至少一条指令,所述至少一条指令用于被所述处理器执行以实现如权利要求1至7任一所述的交通工具运行状态的预测方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有至少一条指令,所述至少一条指令用于被处理器执行以实现如权利要求1至7任一所述的交通工具运行状态的预测方法。
CN202010086658.4A 2020-02-11 2020-02-11 交通工具运行状态的预测方法、装置、终端及存储介质 Active CN111325386B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010086658.4A CN111325386B (zh) 2020-02-11 2020-02-11 交通工具运行状态的预测方法、装置、终端及存储介质
PCT/CN2021/074713 WO2021159987A1 (zh) 2020-02-11 2021-02-01 交通工具运行状态的预测方法、装置、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010086658.4A CN111325386B (zh) 2020-02-11 2020-02-11 交通工具运行状态的预测方法、装置、终端及存储介质

Publications (2)

Publication Number Publication Date
CN111325386A true CN111325386A (zh) 2020-06-23
CN111325386B CN111325386B (zh) 2023-07-07

Family

ID=71167941

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010086658.4A Active CN111325386B (zh) 2020-02-11 2020-02-11 交通工具运行状态的预测方法、装置、终端及存储介质

Country Status (2)

Country Link
CN (1) CN111325386B (zh)
WO (1) WO2021159987A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113128115A (zh) * 2021-04-16 2021-07-16 Oppo广东移动通信有限公司 地铁运行状态的预测及模型的训练方法、装置及存储介质
WO2021159987A1 (zh) * 2020-02-11 2021-08-19 Oppo广东移动通信有限公司 交通工具运行状态的预测方法、装置、终端及存储介质
WO2021169742A1 (zh) * 2020-02-26 2021-09-02 Oppo广东移动通信有限公司 交通工具运行状态的预测方法、装置、终端及存储介质
WO2021190145A1 (zh) * 2020-03-25 2021-09-30 Oppo广东移动通信有限公司 站点识别方法、装置、终端及存储介质
TWI755774B (zh) * 2020-06-24 2022-02-21 萬里雲互聯網路有限公司 損失函數的優化系統、優化方法及其電腦可讀取記錄媒體

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116761114B (zh) * 2023-07-14 2024-01-26 润芯微科技(江苏)有限公司 一种车载音响播放声音调节方法及其系统
CN117368870B (zh) * 2023-12-08 2024-02-09 国家卫星海洋应用中心 一种微波散射计载荷特性评估方法、装置及设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070079626A (ko) * 2006-02-03 2007-08-08 최원석 주파수를 이용한 알림 시스템
CN103714827A (zh) * 2013-12-11 2014-04-09 浙江大学 基于声音信号检测的来车识别装置
CN107545763A (zh) * 2016-06-28 2018-01-05 高德信息技术有限公司 一种车辆定位方法、终端、服务器及系统
CN110598762A (zh) * 2019-08-26 2019-12-20 Oppo广东移动通信有限公司 基于音频的出行方式检测方法、装置以及移动终端
CN110600059A (zh) * 2019-09-05 2019-12-20 Oppo广东移动通信有限公司 声学事件检测方法、装置、电子设备及存储介质
CN110660201A (zh) * 2019-09-23 2020-01-07 Oppo广东移动通信有限公司 到站提醒方法、装置、终端及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110570873B (zh) * 2019-09-12 2022-08-05 Oppo广东移动通信有限公司 声纹唤醒方法、装置、计算机设备以及存储介质
CN111325386B (zh) * 2020-02-11 2023-07-07 Oppo广东移动通信有限公司 交通工具运行状态的预测方法、装置、终端及存储介质
CN111354371B (zh) * 2020-02-26 2022-08-05 Oppo广东移动通信有限公司 交通工具运行状态的预测方法、装置、终端及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070079626A (ko) * 2006-02-03 2007-08-08 최원석 주파수를 이용한 알림 시스템
CN103714827A (zh) * 2013-12-11 2014-04-09 浙江大学 基于声音信号检测的来车识别装置
CN107545763A (zh) * 2016-06-28 2018-01-05 高德信息技术有限公司 一种车辆定位方法、终端、服务器及系统
CN110598762A (zh) * 2019-08-26 2019-12-20 Oppo广东移动通信有限公司 基于音频的出行方式检测方法、装置以及移动终端
CN110600059A (zh) * 2019-09-05 2019-12-20 Oppo广东移动通信有限公司 声学事件检测方法、装置、电子设备及存储介质
CN110660201A (zh) * 2019-09-23 2020-01-07 Oppo广东移动通信有限公司 到站提醒方法、装置、终端及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021159987A1 (zh) * 2020-02-11 2021-08-19 Oppo广东移动通信有限公司 交通工具运行状态的预测方法、装置、终端及存储介质
WO2021169742A1 (zh) * 2020-02-26 2021-09-02 Oppo广东移动通信有限公司 交通工具运行状态的预测方法、装置、终端及存储介质
WO2021190145A1 (zh) * 2020-03-25 2021-09-30 Oppo广东移动通信有限公司 站点识别方法、装置、终端及存储介质
TWI755774B (zh) * 2020-06-24 2022-02-21 萬里雲互聯網路有限公司 損失函數的優化系統、優化方法及其電腦可讀取記錄媒體
CN113128115A (zh) * 2021-04-16 2021-07-16 Oppo广东移动通信有限公司 地铁运行状态的预测及模型的训练方法、装置及存储介质

Also Published As

Publication number Publication date
WO2021159987A1 (zh) 2021-08-19
CN111325386B (zh) 2023-07-07

Similar Documents

Publication Publication Date Title
CN111325386B (zh) 交通工具运行状态的预测方法、装置、终端及存储介质
CN111354371B (zh) 交通工具运行状态的预测方法、装置、终端及存储介质
CN110660201B (zh) 到站提醒方法、装置、终端及存储介质
CN108122556B (zh) 减少驾驶人语音唤醒指令词误触发的方法及装置
CN107481718B (zh) 语音识别方法、装置、存储介质及电子设备
CN110880328B (zh) 到站提醒方法、装置、终端及存储介质
CN110853618A (zh) 一种语种识别的方法、模型训练的方法、装置及设备
CN106782504A (zh) 语音识别方法和装置
CN110232933B (zh) 音频检测方法、装置、存储介质及电子设备
WO2021115232A1 (zh) 到站提醒方法、装置、终端及存储介质
CN110972112A (zh) 地铁运行方向的确定方法、装置、终端及存储介质
EP4191579A1 (en) Electronic device and speech recognition method therefor, and medium
CN114360527B (zh) 车载语音交互方法、装置、设备及存储介质
CN112669822B (zh) 音频处理方法、装置、电子设备和存储介质
WO2023071768A1 (zh) 到站提醒方法、装置、终端、存储介质及程序产品
CN111722696B (zh) 用于低功耗设备的语音数据处理方法和装置
CN104361887A (zh) 行车噪声环境下的快速声学事件检测系统
CN107274892A (zh) 说话人识别方法及装置
CN110689887B (zh) 音频校验方法、装置、存储介质及电子设备
CN111415679A (zh) 站点识别方法、装置、终端及存储介质
CN112015261A (zh) 一种智能终端驾驶模式识别方法
CN110728993A (zh) 一种变声识别方法及电子设备
CN113225624A (zh) 一种语音识别耗时确定方法和装置
CN110895930A (zh) 语音识别方法及装置
CN111862946B (zh) 一种订单处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant