CN113436630A

CN113436630A - 基于多模态语音交互模型的地铁智能语音购票系统

Info

Publication number: CN113436630A
Application number: CN202010154838.1A
Authority: CN
Inventors: 常伟; 余捷全
Original assignee: Guangdong Yuxiu Technology Co ltd
Current assignee: Guangdong Yuxiu Technology Co ltd
Priority date: 2020-03-08
Filing date: 2020-03-08
Publication date: 2021-09-24

Abstract

本发明涉及交通管理技术领域，尤其是基于多模态语音交互模型的地铁智能语音购票系统；它包括回声抵消模块、声源寻踪模块、去噪模块和语音识别购票模块；可根据旅客发声位置转动，更加便民；可模糊查询，不需要明确说出精确站点名称；在购票的同时顺带将换乘信息告诉旅客，防止旅客错过中转站而延误行程。

Description

基于多模态语音交互模型的地铁智能语音购票系统

技术领域

本发明涉及交通管理技术领域，尤其是基于多模态语音交互模型的地铁智能语音购票系统。

背景技术

语音购票是一种时髦的轨交售票方式，例如中国专利公开了一种轨道交通智能语音购票的系统及购票方法，申请号201810705851.4，其中记载：通过语音识别模块获取并识别语音信息，调用存储的词库信息与语音信息进行比对，生成对应的移动终端识别ID，移动终端根据识别ID输出购票订单信息，然后移动终端根据语音识别模块输入指令匹配购票车次，创建购票订单，完成购票交易。本发明可以方便乘客快速选择购票信息，减少在复杂线网中选取目的站点的操作，可以快速、便捷、智能的进行购票选择，解放乘客的双手，缩短购票时间，方便乘客出行，减小客流量较大车站的排队压力。

该技术尚不完善，例如需要指定站点才能购票，对于一些不熟悉当地路况的游客来说，他们只知道一些地标或者地名，不一定熟悉对应的站点。例如游客熟悉天安门，但是并一定知道天安门对应的地铁站是哪一个，此时再通过手机查询等就会耽误买票时间，特别是游客聚集的地方容易手机网络拥堵，进一步耽误时间。

另外，公知的，地铁站内非常嘈杂，购票系统的提示音、旅客买票的声音以及人群的杂音汇聚在一起，导致购票系统难以区分旅客买票的声音，可能出现识别错误。

发明内容

针对现有技术的不足，本发明提供一种可模糊查询且可准确识别旅客声音的语音购票系统。

本发明的技术方案为：

基于多模态语音交互模型的地铁智能语音购票系统，它包括回声抵消模块、声源寻踪模块、去噪模块和语音识别购票模块；

其中回声抵消模块通过估计回声路径的特征参数，产生一个模拟的回音路径，得出模拟回声信号，从接收信号中减去该信号，实现回声抵消；

其中声源寻踪模块包括基座、电动转轴和面板，所述电动转轴安装在基座上，面板安装在电动转轴上，面板在电动转轴的带动下180°转动，面板上且位于同一水平线从左到右等距安装有三个收音器分别为a、b、c，其瞬时音量分别为Ya、Yb、Yc，当Ya大于Yb时电动转轴向左转，当Yb小于Yc时电动转轴向右转，面板上还设置有扬声器；

其中去噪模块按一定的采样频率，即每个一小段时间，测得模拟信号的模拟电压值，通过采样时测的的模拟电压值，进行分级量化，按整个电压变化的最大幅度划分成几个区段，把落在某区段的采样到的样品值归成一类，并给出相应的量化值，根据采样频率和量化值通过小波去噪法得到去噪后的声音数据；其中采样频率是指将模拟声音波形数字化后每秒钟所抽取的声波幅度的样本次数，其单位为kHz(千赫兹)；

语音识别购票模块对输入的原始语音数据进行断电检测、语音分帧和预加重处理，然后使用Mel倒谱系数取出语音数据中冗余信息，采用隐马尔可夫模型模拟人的语音过程，采用N-gram模型通过词汇出现先后顺序的概率计算概率最大的单次序列，根据已经训练好的声学模型、语音模型或者字典建立一个由语音因素组成的有向网络并寻找到最佳路径，也就确定了识别的文字信息，而后通过现有的购票平台模糊查询文字信息所对应的路线以及价格，通过语音和显示屏两种方式反馈给旅客。

其中，所述采样频率为5-11kHz，采样频率决定声音失真的大小，采样频率越高失真越小，为保证不失真，大部分音像制品的采样频率设置在40kHz或者以上，标准CD的采样频率是44kHz，网站音频播放标准是22kHz，但上述各种标准都是给人听的，用于机器识别时有5kHz就已经足够，采样频率低对于采样数据的存放空间需求较小，降低了系统的构建成本。

其中，所述小波去噪法应用小波分解与重构的方法(也就是Mallet算法)，去噪具体步骤是：根据需要，将含有噪声信号在某一尺度下分解到不同的频带内，然后再将噪声所处的频带置零或直接提取有用信号所在的频带，进行小波重构，从而达到去噪的目的。

其中，所述模糊查询方法为：查询旅客输入的起始地和目的地最近的地铁站点作为起始站和终点站，计算价钱并将价钱信息输出，查询这两个站点之间所有地铁线路，查询出两站点之间所有线路的中转站，将这些中转站放入一个一维数组中，查询从起始站点到达中转站的所有地铁线路，将线路信息中的线路名称、起始和中转站名称以及两站点之间的站点个数存入一个二维数组，在查询从中转站到目的地站点的所有地铁线路，将线路信息中的线路名称、中转站和目的站点名称以及两站之间的站点个数存入另一个二维数组，判断两组路线之间是否存在相同站点，相同站点也就是中转站，将转乘信息输出。

在一个较佳实施例中，所述模糊查询方法中还包括最短线路查询算法，对站点之间的个数加入一段比较站点个数的代码，通过三个临时变量用于记录所有线路中最短路径，通过临时变量记录下来的信息在输出数组中对应位置输出。

本发明的有益效果为：可根据旅客发声位置转动，更加便民；可模糊查询，不需要明确说出精确站点名称；在购票的同时顺带将换乘信息告诉旅客，防止旅客错过中转站而延误行程。

具体实施方式

下面结合具体实施方式作进一步说明：

实施例1

实施例2

所述模糊查询方法中还包括最短线路查询算法，对站点之间的个数加入一段比较站点个数的代码，通过三个临时变量用于记录所有线路中最短路径，通过临时变量记录下来的信息在输出数组中对应位置输出。

本实施例的其他结构和方法与实施例1相同。

上述实施例和说明书中描述的只是说明本发明的原理和最佳实施例，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。

Claims

1.基于多模态语音交互模型的地铁智能语音购票系统，它包括回声抵消模块、声源寻踪模块、去噪模块和语音识别购票模块；

其中去噪模块按一定的采样频率，即每个一小段时间，测得模拟信号的模拟电压值，通过采样时测的的模拟电压值，进行分级量化，按整个电压变化的最大幅度划分成几个区段，把落在某区段的采样到的样品值归成一类，并给出相应的量化值，根据采样频率和量化值通过小波去噪法得到去噪后的声音数据；其中采样频率是指将模拟声音波形数字化后每秒钟所抽取的声波幅度的样本次数；

2.根据权利要求1所述的基于多模态语音交互模型的地铁智能语音购票系统，其特征在于：所述采样频率为5-11kHz。

3.根据权利要求1所述的基于多模态语音交互模型的地铁智能语音购票系统，其特征在于：所述小波去噪法应用小波分解与重构的方法，去噪具体步骤是：根据需要，将含有噪声信号在某一尺度下分解到不同的频带内，然后再将噪声所处的频带置零或直接提取有用信号所在的频带，进行小波重构，从而达到去噪的目的。

4.根据权利要求1所述的基于多模态语音交互模型的地铁智能语音购票系统，其特征在于：所述模糊查询方法为：查询旅客输入的起始地和目的地最近的地铁站点作为起始站和终点站，计算价钱并将价钱信息输出，查询这两个站点之间所有地铁线路，查询出两站点之间所有线路的中转站，将这些中转站放入一个一维数组中，查询从起始站点到达中转站的所有地铁线路，将线路信息中的线路名称、起始和中转站名称以及两站点之间的站点个数存入一个二维数组，在查询从中转站到目的地站点的所有地铁线路，将线路信息中的线路名称、中转站和目的站点名称以及两站之间的站点个数存入另一个二维数组，判断两组路线之间是否存在相同站点，相同站点也就是中转站，将转乘信息输出。

5.根据权利要求4所述的基于多模态语音交互模型的地铁智能语音购票系统，其特征在于：所述模糊查询方法中还包括最短线路查询算法，对站点之间的个数加入一段比较站点个数的代码，通过三个临时变量用于记录所有线路中最短路径，通过临时变量记录下来的信息在输出数组中对应位置输出。