CN103078915A

CN103078915A - 一种基于云计算车联网的车载语音点歌系统及其方法

Info

Publication number: CN103078915A
Application number: CN2012105824691A
Authority: CN
Inventors: 易定
Original assignee: Shenzhen Polytechnic
Current assignee: Shenzhen Polytechnic
Priority date: 2012-12-28
Filing date: 2012-12-28
Publication date: 2013-05-01
Anticipated expiration: 2032-12-28
Also published as: CN103078915B

Abstract

本发明提供一种基于云计算车联网的车载语音点歌系统及其方法，所述基于云计算车联网的车载语音点歌系统包括：车载主机，所述车载主机通过车联网接入至互联网中；语音识别和歌名管理服务器，所述语音识别和歌名管理服务器通过车联网与车载主机建立连接，语音识别和歌名管理服务器接收到车载主机的语音信号后进行关键词的识别和解析，并将查询到的语音信号所对应的网络地址返回至车载主机中；以及，音乐服务器，所述音乐服务器通过车联网与车载主机建立连接。司机只需要说出想听的歌名，本发明便能够通过联网的车载主机，将存储在云端的数字音频流媒体文件进行音乐播放，实现方式快速有效，对点歌的语音信号的识别和解析效率高。

Description

一种基于云计算车联网的车载语音点歌系统及其方法

技术领域

本发明涉及一种车载点歌系统，尤其涉及一种基于云计算车联网的车载语音点歌系统，并提供一种基于云计算车联网的车载语音点歌系统的方法。

背景技术

开车时听歌听音乐，是很多司机的一种常见行为，但是在汽车行驶中，司机需要手握方向盘，注意交通安全，因此，不方便操作车载主机的按键，包括遥控器按键，所以在传统的汽车行驶过程中，司机想点歌是不能随心所欲的。而传统的车载主机受限于机身存储空间和CPU运算能力，使用的词库和语言模型较小，并不足以支持用语音识别；同样，传统的车载主机受限于存储空间，不能保存海量歌库，也不方便及时更新歌库。

发明内容

本发明所要解决的技术问题是需要提供一种司机只需要说出想听的歌名，就可以快速实现的车载语音点歌系统。

对此，本发明提供一种基于云计算车联网的车载语音点歌系统，包括：

车载主机，所述车载主机通过车联网接入至互联网中，用于接收用户点歌的语音信号和该语音信号所对应的网络地址，进而实现数字音频流媒体文件的播放；

语音识别和歌名管理服务器，所述语音识别和歌名管理服务器通过车联网与车载主机建立连接，语音识别和歌名管理服务器接收到车载主机的语音信号后进行关键词的识别和解析，并将查询到的语音信号所对应的网络地址返回至车载主机中；以及，

音乐服务器，所述音乐服务器通过车联网与车载主机建立连接，音乐服务器接收到车载主机的语音信号所对应的网络地址后，发送有效的数字音频流媒体文件至车载主机中。

本发明包括车载主机、语音识别和歌名管理服务器以及音乐服务器，均接入互联网，车载主机通过车联网接入互联网；所述语音识别和歌名管理服务器为云计算语音识别和歌名管理服务器，所述音乐服务器为云计算音乐服务器；本发明将云计算进入车联网，乃至接驳入车载主机，使所述车载主机的机身存储空间、CPU运算能力以及更新速度等受限功能都可以从云服务中得到弥补，进而实现本发明提出的基于云计算车联网的车载语音点歌系统。

车联网是互联网上的一个接入子网，由网络运营商提供服务，所述车载主机通过车联网提供的接入服务连入互联网中；语音识别和歌名管理服务器，用于提供语音识别支持和歌名管理服务，包括硬件和网络操作系统，其网络操作系统上可以运行语音引擎；音乐服务器用于存放和控制数字音频流媒体文件，提供音频源，本发明需要从联网的云计算音乐服务器来获取数字音频流媒体文件，所述音乐服务器需要实时进行更新管理，进而保证提供给车载主机的数字音频流媒体文件均是有效的；车载主机从云服务中获取语音识别和歌名管理服务，从云服务中获取数字音频流媒体文件来实现语音点歌的音乐播放。

与现有技术相比，本发明提供一种基于云计算车联网的语音点歌系统，司机只需要说出想听的歌名，通过联网的车载主机，便能够将存储在云端的数字音频流媒体文件进行音乐播放；所述车载主机安装在汽车上，是一个软硬件相结合的装置，车载主机从云服务中获取语音识别和歌名管理服务，并从云服务中的音乐服务器获取数字音频流媒体文件来播放，实现方式快速有效、效率高。

本发明的进一步改进在于，所述语音识别和歌名管理服务器接收到车载主机的语音信号后，通过自适应语音识别模块进行关键词的识别和解析。

本发明的进一步改进在于，所述语音识别和歌名管理服务器包括语音特征库、特定人自适应语音识别单元和非特定人自适应语音识别单元，所述语音特征库用于记录用户点歌的语音特征；当用户点歌的语音特征已存在于语音特征库时，则采用特定人自适应语音识别单元结合关键词对用户点歌的语音信号进行识别和解析；否，则自动改为非特定人自适应语音识别单元结合关键词对用户点歌的语音信号进行识别和解析，并同时将该次点歌的用户的语音特征添加至语音特征库中。

所述自适应语音识别模块包括非特定人自适应语音识别单元和特定人自适应语音识别单元，所述非特定人自适应语音识别单元用于在新用户点歌时进行语音信号的识别和解析，新用户即第一次使用该车载主机进行语音点歌的用户；所述特定人自适应语音识别单元用于在车载主机的老用户点歌时进行语音信号的识别和解析，特定人指的是其语音特征已存储于语音特征库中的用户。

非特定人自适应语音识别单元和特定人自适应语音识别单元的工作如下：进行一次语音信号的识别时，如果语音特征库中有该车载主机发送的语音特征，则先采用特定人语音识别单元结合关键词语音识别模块对点歌的语音信号进行识别和解析；如果这次的语音信号识别不成功，那么不成功的原因可能是因为新人点歌，在语音特征库中还没有该语音特征的记录，这时将自动改为非特定人语音识别单元结合关键词语音识别模块对点歌的语音信号进行识别和解析，并将这次的语音特征加入至语音特征库的记录中。

所述语音识别和歌名管理服务器的工作位于网络应用层，包括非特定人自适应语音识别单元、特定人自适应语音识别单元、关键词语音识别模块、歌名库、语音特征库和控制模块。语音识别和歌名管理服务器的硬件及其运行的操作系统拥有网络功能，能够位于网络应用层实现云计算，并使用其下层提供的网络服务；所述控制模块将点歌的语音信号交给关键词语音识别模块，关键词语音识别成功后，查询到歌曲音频所在的有效的网络地址，将该网络地址返回给车载主机。

本发明针对“点歌”这个特定的环境和应用，用户点歌时只需说出“歌名”、“歌手名”或者“歌名+歌手名”等关键词，而不需要用完整的自然语言来表达，就已经能够提供足够的歌曲信息，具有较高的识别准确度；因此，本发明采用关键词实现关键词语音识别模块能够大大简化识别和解析的问题，实现方法简单有效，同时可以提高识别率。

因为同一辆车的司机大多时候是固定一人或几人，所以从同一车载主机所接收的语音特征也是有限的，本发明将这些有限的语音特征保存在语音特征库中；并为第一次联网的车载主机创建语音特征的信息记录，以后如果有从这个车载主机接收的新的语音特征，就添加到该语音特征库的记录中。与现有技术相比，本发明所述语音识别和歌名管理服务器通过语音特征库、特定人自适应语音识别单元和非特定人自适应语音识别单元进而对语音信号实现关键字的识别和解析，能够在快速实现车载语音点歌的基础上，充分利用有限的存储空间存储车载主机对应的语音特征，更进一步提高语音点歌的成功率和识别率。

反之，如果采用连续的自然语言语音识别技术，相同的语义可以有不同的表述方式，那么，对于语音信号的识别和解析会很困难，识别的准确度很低。

本发明的进一步改进在于，每一个车载主机都有唯一对应的车载地址，并与语音特征库一一对应；所述语音特征库的记录包括车载地址字段和语音特征字段。

车载主机、车载地址与语音特征库呈一一对应的关系，所述语音特征库记录包括车载地址和语音特征字段，而每一个入网的车载主机都有一个唯一的车载地址；那么在实现语音点歌的时候，便能够通过该车载地址快速找到对应的语音特征库进行高效的语音信号识别和解析，并能够有效防止数字音频流媒体文件返回时发送错误的弊端。

本发明的进一步改进在于，所述关键词包括歌名和歌手中至少一个。

本发明针对“点歌”这个特定的环境和应用，用户点歌时只需说出“歌名”、“歌手名”或者“歌名+歌手名”，而不需要用完整的自然语言来表达，就已经能够提供足够的歌曲信息，具有较高的识别准确度；因此，本发明采用包括歌名和歌手中至少一个的关键词实现关键词语音识别模块便能够大大简化语音信号识别和解析的难度，实现方法简单有效，识别率高。

本发明的进一步改进在于，所述语音识别和歌名管理服务器还包括实时更新的歌名库，所述歌名库的每一条记录包括歌名字段、歌手字段和该歌曲对应的数字音频流媒体文件所在的网络地址字段。

歌名库的每一条记录包括歌名、歌手和该歌曲对应的数字音频流媒体文件所在的网络地址共三个字段；歌名库中并不存有歌曲的音频，而是只需记录歌曲音频所在的网络地址，语音识别和歌名管理服务器对歌名库的管理包括需要对歌名、歌手和网络地址进行实时维护，保证及时添加新歌，并同时保证其网络地址是有效的。而歌名库中的歌名字段和歌手字段正好是与歌名和歌手中至少一个的关键词相对应，所以歌名库一方面用于支持关键词的语音识别，而另一方面则用于支持查询歌曲对应的数字音频流媒体文件所在的网络地址。

本发明的进一步改进在于，所述车载主机包括一键式启动模块、语音接收模块、通信模块和播放模块，所述一键式启动模块通过启动键实现车载语音点歌系统的工作启动和结束；所述语音接收模块用于实现语音信号的检测，并对有效的语音信号进行录音；所述通信模块将语音信号的录音文件传送给语音识别和歌名管理服务器，并将从语音识别和歌名管理服务器返回的网络地址存入播放模块的播放列表中；所述播放模块从播放列表中取出歌曲的网络地址后，通信模块与音乐服务器建立连接使得播放模块获取并播放歌曲的数字音频流媒体文件。

所述车载主机用于实现如下功能：通过车联网接入互联网；接收用户点歌的语音信号；与语音识别和歌曲管理服务器实现通信；与网上公共的音乐服务器实现通信；管理播放模块的播放列表；播放从音乐服务器接收的数字音频流媒体文件。

所述车载主机的一键式启动模块包括一个启动键，用户在按下该启动键以后，车载语音点歌系统开始工作；再次按下该启动键，结束工作；通过启动键的设置，能够防止用户说话的时候被误以为是点歌的语音信号，避免了误点歌的错误；本发明还可以通过预先设置的语音信号启动信号和语音信号结束信号来避免误点歌的错误。

车载主机通信模块有一个唯一的车载地址，通过车联网接入互联网，负责访问语音识别和歌名管理服务器以及云计算音乐服务器；所述车载主机的通信模块工作在网络层；车载主机的语音接收模块负责检测声音，对有效的点歌语音进行录音，通信模块将录音文件传送给语音识别和歌名管理服务器；所述有效的点歌语音是指在启动键开始工作和结束工作之间的有效的语音信号；通信模块接收语音识别和歌名管理服务器返回的歌曲的音频所在网络地址，并将该网络地址存入播放列表；播放模块负责从播放列表中取出歌曲的网络地址，通信模块与该网络地址的音乐服务器建立连接，获取歌曲的数字音频流媒体文件，播放模块将数字音频流媒体文件播放出来。

本发明还提供一种采用了上述的基于云计算车联网的车载语音点歌系统的方法，包括如下步骤：

车载主机通过车联网接入互联网，所述车载主机发送连接请求至语音识别和歌名管理服务器，所述歌名管理服务器返回连接应答至车载主机，建立连接；

联网的车载主机接收用户点歌的语音信号后，将点歌的语音信号发送给语音识别和歌名管理服务器；

语音识别和歌名管理服务器对用户点歌的语音信号进行识别和解析后，查询到该语音信号对应的数字音频流媒体文件的网络地址，并将该网络地址返回至车载主机；

车载主机接收网络地址并将该网络地址存入播放列表；车载主机从播放列表中取当前播放歌曲的网络地址，并与该网络地址对应的音乐服务器建立连接，然后车载主机接收并播放从音乐服务器发送来的数字音频流媒体文件。

本发明的进一步改进在于，所述语音识别和歌名管理服务器，以及音乐服务器的数据均存储于云端。音乐服务器在接收到车载主机发送的连接请求后，发送连接应答至车载主机，并根据网络地址将数字音频流媒体文件发送给车载主机，实现边传输便播放的车载语音点歌系统的方法。

本发明的进一步改进在于，所述车载主机通过无线接入点连接至车联网。

本发明的有益效果在于，司机只需要说出想听的歌名，或是说出歌名和歌手中至少一个关键词的语音信号，通过联网的车载主机，便能够将存储在云端的数字音频流媒体文件进行音乐播放；其中，对于语音信号的识别和解析，本发明采用了语音特征库、特定人自适应语音识别单元、非特定人自适应语音识别单元以及关键词相结合，能够更进一步提高语音点歌的成功率和识别率，不再受限于车载主机本身的存储空间和处理速度的局限，甚至还能够进一步防止误点歌的弊端；车载主机安装在汽车上，是一个软硬件结合的装置，车载主机从云服务中获取语音识别和歌名管理的服务，并从云服务中获取数字音频流媒体文件进而实现语音点歌后的音乐播放。

附图说明

图1是本发明一种实施例的整体结构示意图；

图2是本发明另一种实施例的语音识别和歌名管理服务器结构示意图；

图3是本发明另一种实施例的车载主机结构示意图；

图4是本发明另一种实施例的工作过程数据流向示意图。

具体实施方式

下面结合附图，对本发明的较优的实施例作进一步的详细说明。

实施例1：

如图1所示，本例提供一种基于云计算车联网的车载语音点歌系统，包括：

本例包括车载主机、语音识别和歌名管理服务器和音乐服务器，均接入互联网，车载主机通过车联网接入互联网；所述语音识别和歌名管理服务器为云计算语音识别和歌名管理服务器，所述音乐服务器为云计算音乐服务器。

本例将云计算应用到车联网，乃至接驳入车载主机，使所述车载主机的机身存储空间、CPU运算能力以及更新速度等受限功能都可以从云服务中获取弥补，进而实现本例提出的基于云计算车联网的车载语音点歌系统。

车联网是互联网上的一个接入子网，由网络运营商提供服务，所述车载主机通过车联网提供的接入服务连入互联网中；语音识别和歌名管理服务器，用于提供语音识别支持和歌名管理服务，包括硬件和网络操作系统，其网络操作系统上可以运行语音引擎；音乐服务器用于存放和控制数字音频流媒体文件，提供音频源，本例需要从联网的云计算音乐服务器来获取数字音频流媒体文件，所述音乐服务器需要实时进行更新管理，进而保证提供给车载主机的数字音频流媒体文件均是有效的；车载主机从云服务中获取语音识别和歌名管理服务，从云服务中获取数字音频流媒体文件来实现语音点歌的音乐播放。

本例所述语音识别和歌名管理服务器的硬件和网络操作系统可采用市场通用的，操作系统上可以运行语音引擎，采用第三方专业语音引擎开发商的产品；所述音乐服务器是位于互联网上的已有的公共资源，它用于存放和控制流媒体数据，提供音频源。

与现有技术相比，本例提供一种基于云计算车联网的语音点歌系统，司机只需要说出想听的歌名，通过联网的车载主机，便能够将存储在云端的数字音频流媒体文件进行音乐播放；所述车载主机安装在汽车上，是一个软硬件相结合的装置，车载主机从云服务中获取语音识别和歌名管理服务，并从云服务中的音乐服务器获取数字音频流媒体文件来播放，实现方式快速有效、效率高。

实施例2：

在实施例1的基础上，本例所述语音识别和歌名管理服务器接收到车载主机的语音信号后，通过自适应语音识别模块进行关键词的识别和解析。所述语音识别和歌名管理服务器包括语音特征库、特定人自适应语音识别单元和非特定人自适应语音识别单元，所述语音特征库用于记录用户点歌的语音特征；当用户点歌的语音特征已存在于语音特征库时，则采用特定人自适应语音识别单元结合关键词对用户点歌的语音信号进行识别和解析；否，则自动改为非特定人自适应语音识别单元结合关键词对用户点歌的语音信号进行识别和解析，并同时将该次点歌的用户的语音特征添加至语音特征库中。

如图2所示，所述语音识别和歌名管理服务器的工作位于网络应用层，包括非特定人自适应语音识别单元、特定人自适应语音识别单元、关键词语音识别模块、歌名库、语音特征库和控制模块。语音识别和歌名管理服务器的硬件及其运行的操作系统拥有网络功能，能够位于网络应用层实现云计算，并使用其下层提供的网络服务；所述控制模块将点歌的语音信号交给关键词语音识别模块，关键词语音识别成功后，查询到歌曲音频所在的有效的网络地址，将该网络地址返回给车载主机。

本例的进一步改进在于，所述关键词包括歌名和歌手中至少一个。

本例针对“点歌”这个特定的环境和应用，用户点歌时只需说出“歌名”、“歌手名”或者“歌名+歌手名”，而不需要用完整的自然语言来表达，就已经能够提供足够的歌曲信息，具有较高的识别准确度；因此，本例采用包括歌名和歌手中至少一个的关键词实现关键词语音识别模块便能够大大简化语音信号识别和解析的难度，实现方法简单有效，识别率高。

因为同一辆车的司机大多时候是固定一人或几人，所以从同一车载主机所接收的语音特征也是有限的，本例将这些有限的语音特征保存在语音特征库中；并为第一次联网的车载主机创建语音特征的信息记录，以后如果有从这个车载主机接收的新的语音特征，就添加到该语音特征库的记录中。与现有技术相比，本例所述语音识别和歌名管理服务器通过语音特征库、特定人自适应语音识别单元和非特定人自适应语音识别单元进而对语音信号实现关键字的识别和解析，能够在快速实现车载语音点歌的基础上，充分利用有限的存储空间存储车载主机对应的语音特征，更进一步提高语音点歌的成功率和识别率。

反之，如果采用连续的自然语言语音识别技术，相同的语义可以有不同的表述方式，那么对语音信号的识别和解析实现起来会很困难，识别的准确度很低。

本例的进一步改进在于，每一个车载主机都有唯一对应的车载地址，并与语音特征库一一对应；所述语音特征库的记录包括车载地址字段和语音特征字段。

本例的进一步改进在于，所述语音识别和歌名管理服务器还包括实时更新的歌名库，所述歌名库的每一条记录包括歌名字段、歌手字段和该歌曲对应的数字音频流媒体文件所在的网络地址字段。

如图3所示，本例的进一步改进在于，所述车载主机包括一键式启动模块、语音接收模块、通信模块和播放模块，所述一键式启动模块通过启动键实现车载语音点歌系统的工作启动和结束；所述语音接收模块用于实现语音信号的检测，并对有效的语音信号进行录音；所述通信模块将语音信号的录音文件传送给语音识别和歌名管理服务器，并将从语音识别和歌名管理服务器返回的网络地址存入播放模块的播放列表中；所述播放模块从播放列表中取出歌曲的网络地址后，通信模块与音乐服务器建立连接使得播放模块获取并播放歌曲的数字音频流媒体文件。

所述车载主机的一键式启动模块包括一个启动键，用户在按下该启动键以后，车载语音点歌系统开始工作；再次按下该启动键，结束工作；通过启动键的设置，能够防止用户说话的时候被误以为是点歌的语音信号，避免了误点歌的错误；本例还可以通过预先设置的语音信号启动信号和语音信号结束信号来避免误点歌的错误。

实施例3：

本例还提供一种采用了上述的基于云计算车联网的车载语音点歌系统的方法，包括如下步骤：

本例的工作过程数据流向示意图如图4所示，本例所述语音识别和歌名管理服务器，以及音乐服务器的数据均存储于云端。音乐服务器在接收到车载主机发送的连接请求后，发送连接应答至车载主机，并根据网络地址将数字音频流媒体文件发送给车载主机，实现边传输便播放的车载语音点歌系统的方法。

本例的进一步改进在于，所述车载主机通过无线接入点连接至车联网。

本例的有益效果在于，司机只需要说出想听的歌名，或是说出歌名和歌手中至少一个关键词的语音信号，通过联网的车载主机，便能够将存储在云端的数字音频流媒体文件进行音乐播放；其中，对于语音信号的识别和解析，本例采用了语音特征库、特定人自适应语音识别单元、非特定人自适应语音识别单元以及关键词相结合，能够更进一步提高语音点歌的成功率和识别率，不再受限于车载主机本身的存储空间和处理速度的局限，甚至还能够进一步防止误点歌的弊端；车载主机安装在汽车上，是一个软硬件结合的装置，车载主机从云服务中获取语音识别和歌名管理的服务，并从云服务中获取数字音频流媒体文件进而实现语音点歌后的音乐播放。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

Claims

1.一种基于云计算车联网的车载语音点歌系统，其特征在于，包括：

2.根据权利要求1所述的基于云计算车联网的车载语音点歌系统，其特征在于，所述语音识别和歌名管理服务器接收到车载主机的语音信号后，通过自适应语音识别模块进行关键词的识别和解析。

3.根据权利要求2所述的基于云计算车联网的车载语音点歌系统，其特征在于，所述语音识别和歌名管理服务器包括语音特征库、特定人自适应语音识别单元和非特定人自适应语音识别单元，所述语音特征库用于记录用户点歌的语音特征；当用户点歌的语音特征已存在于语音特征库时，则采用特定人自适应语音识别单元结合关键词对用户点歌的语音信号进行识别和解析；否，则自动改为非特定人自适应语音识别单元结合关键词对用户点歌的语音信号进行识别和解析，并同时将该次点歌的用户的语音特征添加至语音特征库中。

4.根据权利要求3所述的基于云计算车联网的车载语音点歌系统，其特征在于，每一个车载主机都有唯一对应的车载地址，并与语音特征库一一对应；所述语音特征库的记录包括车载地址字段和语音特征字段。

5.根据权利要求1至4任意一项所述的基于云计算车联网的车载语音点歌系统，其特征在于，所述关键词包括歌名和歌手中至少一个。

6.根据权利要求1至4任意一项所述的基于云计算车联网的车载语音点歌系统，其特征在于，所述语音识别和歌名管理服务器还包括实时更新的歌名库，所述歌名库的每一条记录包括歌名字段、歌手字段和该歌曲对应的数字音频流媒体文件所在的网络地址字段。

7.根据权利要求1至4任意一项所述的基于云计算车联网的车载语音点歌系统，其特征在于，所述车载主机包括一键式启动模块、语音接收模块、通信模块和播放模块，所述一键式启动模块通过启动键实现车载语音点歌系统的工作启动和结束；所述语音接收模块用于实现语音信号的检测，并对有效的语音信号进行录音；所述通信模块将语音信号的录音文件传送给语音识别和歌名管理服务器，并将从语音识别和歌名管理服务器返回的网络地址存入播放模块的播放列表中；所述播放模块从播放列表中取出歌曲的网络地址后，通信模块与音乐服务器建立连接使得播放模块获取并播放歌曲的数字音频流媒体文件。

8.一种采用了如权利要求1至7任意一项所述的基于云计算车联网的车载语音点歌系统的方法，其特征在于，包括如下步骤：

9.根据权利要求8所述的基于云计算车联网的车载语音点歌系统的方法，其特征在于，所述语音识别和歌名管理服务器，以及音乐服务器的数据均存储于云端。

10.根据权利要求8所述的基于云计算车联网的车载语音点歌系统的方法，其特征在于，所述车载主机通过无线接入点连接至车联网。