CN114333791A - 语音识别方法、服务器、语音识别系统、可读存储介质 - Google Patents

语音识别方法、服务器、语音识别系统、可读存储介质 Download PDF

Info

Publication number
CN114333791A
CN114333791A CN202111509402.0A CN202111509402A CN114333791A CN 114333791 A CN114333791 A CN 114333791A CN 202111509402 A CN202111509402 A CN 202111509402A CN 114333791 A CN114333791 A CN 114333791A
Authority
CN
China
Prior art keywords
user
vehicle
data model
database
user data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111509402.0A
Other languages
English (en)
Inventor
韩森淼
张岩
郭华鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Xiaopeng Motors Technology Co Ltd
Original Assignee
Guangzhou Xiaopeng Motors Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Xiaopeng Motors Technology Co Ltd filed Critical Guangzhou Xiaopeng Motors Technology Co Ltd
Priority to CN202111509402.0A priority Critical patent/CN114333791A/zh
Publication of CN114333791A publication Critical patent/CN114333791A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种语音识别方法、服务器、语音识别系统、可读存储介质。语音识别方法包括:根据车辆上传的用户特征热词生成或更新用户数据模型;在车辆行驶时接收车辆发送的语音请求;根据用户数据模型对语音请求进行语音识别。上述语音识别方法中,通过由用户特征热词得到用户数据模型,用户数据模型具有用户的个性化信息,从而可用于识别出特定用户的偏好和习惯,方便快速确定特定用户发出的语音请求中难以识别的语义,提高语音识别率。

Description

语音识别方法、服务器、语音识别系统、可读存储介质
技术领域
本发明涉及语音识别技术领域,特别涉及一种语音识别方法、服务器、语音识别系统、可读存储介质。
背景技术
在相关技术中,用户所发出的语音可以进行语音识别,从而确定用户的语音所对应的意图,使得用户可通过语音交互的方式来执行相应的控制和操作。语音交互技术对语音识别的准确率具有较高的要求。
发明内容
本发明提供了一种语音识别方法、服务器、语音识别系统、可读存储介质。
本发明提供的一种语音识别方法,所述语音识别方法包括:
根据车辆上传的用户特征热词生成或更新用户数据模型;
在所述车辆行驶时接收所述车辆发送的语音请求;
根据所述用户数据模型对所述语音请求进行语音识别。
上述语音识别方法中,通过由用户特征热词得到用户数据模型,用户数据模型具有用户的个性化信息,从而可用于识别出特定用户的偏好和习惯,方便快速确定特定用户发出的语音请求中难以识别的语义,提高语音识别率。
所述用户特征热词生成在所述车辆中,根据车辆上传的用户特征热词生成或更新用户数据模型,包括:
接收所述车辆上传的用户特征热词;
根据接收到的所述用户特征热词建立数据库;
根据所述数据库生成或更新所述用户数据模型。
如此,可根据特定场景下的用户特征热词来生成或更新用户数据模型。
所述用户特征热词包括兴趣地点热词,所述车辆用于根据所述车辆的历史位置信息确定所述兴趣地点热词,所述数据库包括兴趣地点热词数据库;所述根据接收到的所述用户特征热词建立数据库,包括:
根据接收到的所述兴趣地点热词建立所述兴趣地点热词数据库。
如此,可提高对导航场景下语音请求的识别率。
所述车辆包括收藏列表,所述车辆用于将所述收藏列表中的多媒体热词确定为所述用户特征热词,所述数据库包括多媒体热词数据库;所述根据接收到的所述用户特征热词建立数据库,包括:
根据接收到的所述多媒体热词建立所述多媒体热词数据库。
如此,可提高对多媒体场景下语音请求的识别率。
所述用户特征热词存储在移动终端中,所述移动终端能够和所述车辆通信连接,
根据车辆上传的用户特征热词生成或更新用户数据模型,包括:
在所述车辆获取到所述移动终端发送的所述用户特征热词的情况下,接收所述车辆上传的用户特征热词;
根据接收到的所述用户特征热词建立数据库;
根据所述数据库生成或更新所述用户数据模型。
如此,可根据特定场景下的用户特征热词来生成或更新用户数据模型。
所述用户特征热词包括通讯录热词,所述车辆用于获取所述移动终端发送的所述通讯录热词,所述数据库包括通讯录热词数据库;所述根据接收到的所述用户特征热词建立数据库,包括:
根据接收到的所述通讯录热词建立所述通讯录热词数据库。
如此,可提高对通话场景下语音请求的识别率。
根据车辆上传的用户特征热词生成或更新用户数据模型,包括:
在接收到新的用户特征热词的情况下,根据接收到的所述新的用户特征热词对所述数据库进行增量更新;
根据更新后得到的所述数据库,对所述用户数据模型进行全量更新。
如此,可提高信息传输的效率、查询效率以及和用户数据模型的稳定性。
根据所述用户数据模型对所述语音请求进行语音识别,包括:
在对所述用户数据模型进行更新时接收到所述语音请求的情况下,以更新前的所述用户数据模型对所述语音请求进行识别。
如此,可保证查询效率。
本发明提供的一种服务器,所述服务器包括接收模块和控制模块,
所述接收模块用于:
在车辆行驶时接收所述车辆发送的语音请求;
所述控制模块用于:
根据所述车辆上传的用户特征热词生成或更新用户数据模型;
根据所述用户数据模型对所述语音请求进行语音识别。
上述服务器中,通过由用户特征热词得到用户数据模型,用户数据模型具有用户的个性化信息,从而可用于识别出特定用户的偏好和习惯,方便快速确定特定用户发出的语音请求中难以识别的语义,提高语音识别率。
本发明提供的一种语音识别系统,包括:
车辆,用于:发送用户特征热词和语音请求;和
服务器,用于:
根据所述车辆上传的用户特征热词生成或更新用户数据模型;
在所述车辆行驶时接收所述车辆发送的语音请求;
根据所述用户数据模型对所述语音请求进行语音识别。
上述语音识别系统中,通过由用户特征热词得到用户数据模型,用户数据模型具有用户的个性化信息,从而可用于识别出特定用户的偏好和习惯,方便快速确定特定用户发出的语音请求中难以识别的语义,提高语音识别率。
本发明提供的一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时,实现上述实施方式所述的语音识别方法。
上述计算机可读存储介质中,通过由用户特征热词得到用户数据模型,用户数据模型具有用户的个性化信息,从而可用于识别出特定用户的偏好和习惯,方便快速确定特定用户发出的语音请求中难以识别的语义,提高语音识别率。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施方式的描述中将变得明显和容易理解,其中:
图1是本发明的语音识别方法的流程图;
图2是本发明的语音识别系统的场景示意图;
图3是本发明的服务器的模块图;
图4是本发明的语音识别方法的流程图;
图5是本发明的语音识别方法的场景流程图;
图6是本发明的语音识别系统的场景示意图;
图7是本发明的语音识别方法的流程图。
主要元件符号说明:
服务器10、控制模块11、语音接收模块13;
车辆20、交互界面21;
语音识别系统30;
移动终端40。
具体实施方式
在相关领域中,用户可以通过语音交互的方式来实现语音控制的效果。具体地,在获取到用户发出的语音请求的时候,可对语音请求进行语音识别来得到语义信息。在语义信息能够到达机器能够辨别出的程度的情况下,即能够根据语义信息来识别得到与语音请求对应的控制指令,进而执行控制指令,达到语音控制的效果。
然而,在实际应用中,用户所发出的语音请求容易出现难以被识别的状况。在这样的一个应用场景中,用户在需要播放歌曲时,可发出如“播放老实情歌”的语音请求,而最后得到的识别结果为“播放老情歌”,从而造成了识别错误的问题,给用户造成了困扰。
请参考图1,本发明提供的一种语音识别方法,语音识别方法包括:
02:根据车辆20上传的用户特征热词生成或更新用户数据模型;
03:在车辆20行驶时接收车辆20发送的语音请求;
04:根据用户数据模型对语音请求进行语音识别。
本发明的语音识别方法可以通过本发明的服务器10来实现。具体地,请参考图2,服务器10和车辆20通信连接,使得车辆20能够向服务器10上传数据信息。请再参考图3,服务器10系统包括控制模块11和接收模块13。控制模块11用于:根据车辆20上传的用户特征热词生成或更新用户数据模型;根据用户数据模型对语音请求进行语音识别。接收模块13用于:在车辆20行驶时接收车辆20发送的语音请求。
上述语音识别方法和服务器10中,通过由用户特征热词得到用户数据模型,用户数据模型具有用户的个性化信息,从而可用于识别出特定用户的偏好和习惯,方便快速确定特定用户发出的语音请求中难以识别的语义,提高语音识别率。
可以理解,用户在进行语音交互时,往往会使用个人偏好使用的字词,这些字词容易存在无法识别的问题,进而容易导致语音请求无法被识别或识别错误的情况。在此基础上,通过用户特征热词中与用户相关联的语义信息,使得用户数据模型中的用户特征热词带有特定的用户特征,这些用户特征能够对应用户偏好使用的语义,能够用于识别出用户个人偏好和较频繁使用的字词,使得语音请求能够被准确识别。
在确定用户数据模型的情况下,则可在用户数据模型中对语音请求进行查询,在用户数据模型中根据用户特征热词查询到对应的语义,确定语音请求所表示的信息,从而能够识别出语音请求。
在已建立用户数据模型的基础上,在用户发出语音请求的时候,可根据语音请求所对应的用户标识来确定对应的用户数据模型。其中,用户标识和用户的个人信息相关联,根据用户标识则可确定用户的个人信息,进而可搜索到用户所关联的用户数据模型。
在这样的一个应用场景中,用户发出“播放老实情歌”的语音请求。通过语音请求所对应的用户标识来确定对应的用户数据模型,在对应的用户数据模型中查询用户特征热词“老实情歌”,并可查询到名为“老实情歌”的歌曲,从而可确定语音请求为:对歌曲“老实情歌”进行播放。
用户可通过向车辆20来进行语音交互,且车辆20能够与服务器10进行信息交互,从而能够进行语音识别。
车辆20在获取到语音请求的情况下,可将语音请求和车辆20的设备信息传输至服务器10,使得服务器10根据车辆20的设备信息来确定上述的车辆20,进而确定发出语音请求的用户的个人信息,从而能够搜索得到对应的用户数据模型。语音请求和车辆20的设备信息可以是同步传输的,即车辆20在获取到语音请求的情况下,将语音请求和车辆20的设备信息同时传输至服务器10;语音请求和车辆20的设备信息也可以是不同步传输的,即车辆20可以在向服务器10传输语音请求之前,先向服务器10传输自身的设备信息。
关于用户数据模型,可以为服务器10根据获取到的用户相关的信息来进行模型训练,从而得到能够仅供特定用户的用于语音识别的模型。可以理解,对于不同人用户而言,需要使用到的用于语音识别的数据也会存在不同,在建立仅限于特定用户的用户数据模型的前提下,可避免涉及其他用户的相关数据而增加对语音请求进行查询的时长,以及避免多个用户的相关数据之间存在部分的相似性而查询到错误的信息,方便快速确定特定用户的需求。
关于用户特征热词,用户数据模型可包括多个不同类型的数据库,每个数据库中存储有对应类型的用户特征热词。数据库可以包括:通讯录热词数据库、兴趣地点热词数据库、多媒体热词数据库。通讯录热词数据库可用于存储用户通讯录中联系人的姓名和电话号码,兴趣地点热词数据库可用于存储特定地点的位置信息,多媒体热词数据库可用于存储用户偏好的歌曲信息和电台信息。在确定到关联的用户数据模型的情况下,可根据语音请求来确定对应类型的数据库,从而可在对应类型的数据库中进行查询。
请参考图2和图4,用户特征热词生成在车辆20中。根据车辆20上传的用户特征热词生成或更新用户数据模型,包括:
021:接收车辆20上传的用户特征热词;
023:根据接收到的用户特征热词建立数据库;
024:根据数据库生成或更新用户数据模型。
本发明的语音识别方法可以通过本发明的服务器10来实现。具体地,请参考图3,控制模块11用于:接收车辆20上传的用户特征热词;根据接收到的用户特征热词建立数据库;根据数据库生成或更新用户数据模型。
如此,可根据特定场景下的用户特征热词来生成或更新用户数据模型。
请结合图2,用户特征热词可以通过车辆20和用户之间的交互来生成。这些用户特征热词可以被存储在车辆20中,并通过车辆20与服务器10之间的通信进行上传。服务器10在接收到车辆20上传的用户特征热词后,会根据用户特征热词来建立数据库,并根据建立的数据库来对用户的所有用户特征热词进行整合,从而能够在此前未接收到用户特征热词的前提下生成用户数据模型,以及在已生成用户数据模型的前提下,对用户数据模型进行更新。
用户特征热词包括兴趣地点热词。车辆20用于根据车辆20的历史位置信息确定兴趣地点热词。数据库包括兴趣地点热词数据库。根据接收到的用户特征热词建立数据库,包括:
根据接收到的兴趣地点热词建立兴趣地点热词数据库。
本发明的语音识别方法可以通过本发明的服务器10来实现。具体地,请参考图3,控制模块11用于:根据接收到的兴趣地点热词建立兴趣地点热词数据库。
请结合图2,车辆20包括交互界面21。用户可以通过交互界面21进行导航,交互界面21可以根据用户的导航需求来确定车辆20的位置信息。
可以理解,对于多数情况而言,用户驾驶车辆20去过的地方往往会再次前往,从而会增加将车辆20已去过的地方作为目的地的导航频率,使得车辆20已经去过的地方具有较高的导航价值。根据车辆20的历史位置信息来确定车辆20曾经去过的地方,并根据车辆20的历史位置信息来确定兴趣地点热词。在车辆20与服务器10通信的情况下,车辆20可以将兴趣地点热词上传至服务器10,服务器10可根据接收到的兴趣地点热词来建立兴趣地点热词数据库。在车辆20行驶时服务器10接收到导航场景下的语音请求时,则可在兴趣地点热词数据库中查询对应的兴趣地点热词。
需要说明的是,对于一些位置信息而言,可能存在多音字、用户发音不标准的问题。在一个应用场景中,车辆20曾经去过的地方为A地,当用户需要再次前往A地时,在语音识别时,可能会将A地所对应的名称中存在多音的字识别为同音的另外一个字,导致车辆20会导航到一个完全不同的目的地。在另一个应用场景中,车辆20曾经去过的地方为B地,当用户需要再次前往B地时,则会由于用户的发音不标准,将B地所对应的名称中的某一个字识别为另外一个不同的字,导致车辆20同样会导航到一个完全不同的目的地。在上述基础上,通过将车辆20的历史位置信息来作为建立兴趣地点热词数据库的依据,可避免上述由于多音字、语音不标准所导致的识别错误的问题。
另外,关于兴趣地点,在实际应用中,用户可能需要前往的目的地不具备通过导航地图来直接识别具体信息(如某某街道某号),而是可能需要依据目的地的邻近位置来进行确定,而对于具有这些特征的目的地,车辆20可以将其确定为用户感兴趣的地点,在用户需要再次前往时,就能够根据车辆20在先前的导航场景中的历史位置信息来确定目的地的具体位置,从而能够成功识别出目的地为当前需要导航的目的地。
车辆20包括收藏列表。车辆20用于将收藏列表中的多媒体热词确定为用户特征热词。数据库包括多媒体热词数据库。根据接收到的用户特征热词建立数据库,包括:
根据接收到的多媒体热词建立多媒体热词数据库。
本发明的语音识别方法可以通过本发明的服务器10来实现。具体地,请参考图3,控制模块11用于:根据接收到的多媒体热词建立多媒体热词数据库。
请再结合图2,用户可以通过交互界面21来使用多媒体媒介(如播放音乐、收听电台等),并可将用户通过交互确定的多媒体媒介收藏在收藏列表中,从而作为位于收藏列表中的多媒体热词。
在图5所示的应用场景中,用户可将歌曲《老实情歌》放入收藏列表,车辆20在和服务器10通信时可将位于收藏列表中的歌曲《老实情歌》作为用户特征热词上传给服务器10,服务器10会根据《老实情歌》来建立多媒体热词数据库,并根据多媒体热词数据库来对用户数据模型进行生成或更新。
在后续用户发出的语音请求为“播放《老实情歌》”的情况下,通过对语音请求的识别可确定对应的用户特征热词为多媒体热词,从而在用户数据模型中的多媒体热词数据库中查询,并最终能够得到“播放《老实情歌》”的识别结果。
对语音请求中所涉及到的用户特征热词的类型的确定,可以通过语音请求中的其他语音信息来确定。请结合图5,可通过对语音请求中的“播放”来确定对应的热词类型为多媒体热词。
另外,根据多媒体媒介的不同类型,可对多媒体热词数据库进行进一步的区分。多媒体热词可以包括音乐热词、电台热词,音乐热词对应的数据库为音乐热词数据库,电台热词对应的数据库为电台热词数据库。
请参考图6和图7,用户特征热词存储在移动终端40中。移动终端40能够和车辆20通信连接。根据车辆20上传的用户特征热词生成或更新用户数据模型,包括:
022:在车辆20获取到移动终端40发送的用户特征热词的情况下,接收车辆20上传的用户特征热词;
023:根据接收到的用户特征热词建立数据库;
024:根据数据库生成或更新用户数据模型。
本发明的语音识别方法可以通过本发明的服务器10来实现。具体地,请参考图3,控制模块11用于:在车辆20获取到移动终端40发送的用户特征热词的情况下,接收车辆20上传的用户特征热词;根据接收到的用户特征热词建立数据库;根据数据库生成或更新用户数据模型。
如此,可根据特定场景下的用户特征热词来生成或更新用户数据模型。
具体地,请结合图5,在这样的一些场景中,存储在移动终端40内的用户特征热词可以传输给车辆20,然后由车辆20再上传至服务器10。服务器10在接收到车辆20上传的用户特征热词后,会根据用户特征热词来建立数据库,并根据建立的数据库来对用户的所有用户特征热词进行整合,从而能够在此前未接收到用户特征热词的前提下生成用户数据模型,以及在已生成用户数据模型的前提下,对用户数据模型进行更新。
用户特征热词包括通讯录热词。车辆20用于获取移动终端40发送的通讯录热词。数据库包括通讯录热词数据库。根据接收到的用户特征热词建立数据库,包括:
根据接收到的通讯录热词建立通讯录热词数据库。
本发明的语音识别方法可以通过本发明的服务器10来实现。具体地,请参考图3,控制模块11用于:根据接收到的通讯录热词建立通讯录热词数据库。
具体地,移动终端40中可存储有通讯录,通讯录中记录有用户保存的联系人的信息(称呼、联系方式等)。
在一些情况下,通讯录中所保持的联系人信息中,可能会存在称呼类似或读音相同的情况。在这样的一个应用场景中,通讯录中保存有多个联系人的信息,其中存在联系人的称呼为“张山”。在语音请求为“呼叫张山”时,若服务器10未通过用户数据模型对其进行语音识别,则可能会由于读音相同而识别为“呼叫张珊”,或由于用户发音不标准而识别为“呼叫张三”,从而导致无法联系到正确的联系人。
在上述基础上,通过将通讯录中联系人的信息作为通讯录热词,并通过车辆20上传至服务器10,服务器10可根据联系人“张山”的相关信息来建立通讯录热词数据库,并根据建立后得到的通讯录热词数据库来生成或更新用户数据模型。在车辆20行驶时服务器10接收到呼叫联系人场景下的语音请求为“呼叫张山”时,则可在通讯录热词数据库中查询对应的通讯录热词为“张山”和对应“张山”的联系方式,使得车辆20在接收到识别结果后可直接呼叫“张山”,进而排除其他可能识别错误的情况。移动终端40可以通过蓝牙连接的方式与车辆20进行通信连接。
语音识别方法包括:
在接收到新的用户特征热词的情况下,根据接收到的新的用户特征热词对数据库进行增量更新。
本发明的语音识别方法可以通过本发明的服务器10来实现。具体地,请结合图3,控制模块11用于:在接收到新的用户特征热词的情况下,根据接收到的新的用户特征热词对数据库进行增量更新。
如此,可提高信息传输的效率。
具体地,在已完成对用户数据模型的生成的情况下,若车辆20上传了新的用户特征热词时,则需要将新的用户特征热词更新到数据库中。请结合图2,车辆20在确定有新的用户特征热词的情况下,会只上传新的用户特征热词,服务器10在接收到新的用户特征热词后,则将新的用户特征热词以增量更新的方式添加到数据库中,使得数据库除了存储原先用于生成用户数据模型的用户特征热词,还会存储新的用户特征热词,从而对数据库进行更新。
其中,新的用户特征热词,可以为直接新增的用户特征热词,从而可直接向数据库中增加新增的用户特征热词;可以为对原先存储在车辆20中的用户特征热词进行删除,从而可相应地对数据库中的用户特征热词进行删除,这当中,由于对用户特征热词的删除意味着对应的用户特征热词不再被需要,使得原先存储的用户特征热词被删除,对数据库进行增量更新则可以理解为将数据库中对应的用户特征热词进行删除;可以为对原先存储在车辆20中的用户特征热词进行修订,从而将数据库中对应的用户特征热词修改为相应的用户特征热词;也可以兼而有之。
由于在多数情况下,对用户特征热词进行的改动幅度较小,从而可减少服务器10和车辆20之间数据的传输量,避免需要上传车辆20所存储的所有用户特征热词而占用过多的网络带宽以及造成传输性能下降,从而能够提高信息传输的效率。
语音识别方法包括:
根据更新后得到的数据库,对用户数据模型进行全量更新。
本发明的语音识别方法可以通过本发明的服务器10来实现。具体地,请结合图3,控制模块11用于:根据更新后得到的数据库,对用户数据模型进行全量更新。
如此,可提高查询效率和用户数据模型的稳定性。
具体地,在完成对数据库的更新后,则可将更新后得到的数据库用于生成新的用户数据模型,从而将原先的用户特征热词和新的用户特征热词进行整合,使得重新生成的用户数据模型不仅可用于查询原先存储的用户特征热词,还能够用于查询新的用户特征热词。
可以理解,对于用户数据模型而言,在根据数据库进行训练时,需要对所有的用户特征热词进行关联和整合,从而会使得其中任意一个用户特征热词都可具有与其他用户特征热词之间的关联。通过将数据库以全量更新的方式重新生成用户数据模型,可确定新的用户特征热词和原先存储的用户特征热词之间的关联,从而可使得用户数据模型能够根据关联进行查询,有利于提高用户数据模型的查询效率和整体稳定性。
根据用户数据模型对语音请求进行语音识别,包括:
在对用户数据模型进行更新时接收到语音请求的情况下,以更新前的用户数据模型对语音请求进行识别。本发明的语音识别方法可以通过本发明的服务器10来实现。具体地,请结合图3,控制模块11用于:在对用户数据模型进行更新时接收到语音请求的情况下,以更新前的用户数据模型对语音请求进行识别。
如此,可保证查询效率。
具体地,在对用户数据模型进行全量更新的情况下,无法通过更新后的用户数据模型进行查询。若在此情况下获取到语音请求,则可能会由于用户数据模型不可用而导致无法进行语音识别。
可以理解,由于每次对数据库中用户特征热词进行的改动幅度较小,在上述情况下获取到的语音请求对应新的用户特征热词的可能性较小,这使得更新前的数据库可用于语音识别。
在此基础上,通过将更新前的数据库用于语音识别,可避免由于用户数据模型不可用的情况,从而使得对用户数据模型的更新和对语音请求的识别之间的进程是异步而相互独立的,不会使得识别过程被迫中断而影响识别效率,而更新后的用户数据模型可以在下一次获取到语音请求的情况下用于语音识别,从而有利于保证识别效率。
请参考图2和图6,本发明提供的一种语音识别系统30,包括车辆20和服务器10。车辆20用于发送用户特征热词和语音请求。服务器10用于根据车辆上传的用户特征热词生成或更新用户数据模型;及在车辆行驶时接收车辆发送的语音请求;及根据用户数据模型对语音请求进行语音识别。
上述语音识别系统30中,通过由用户特征热词得到用户数据模型,用户数据模型具有用户的个性化信息,从而可用于识别出特定用户的偏好和习惯,方便快速确定特定用户发出的语音请求中难以识别的语义,提高语音识别率。
具体地,请结合图6,车辆20可包括交互界面21。车辆20通过交互界面21与服务器10通信连接。用户可向交互界面21发出语音请求,交互界面21将接收到的语音请求上传至服务器10。服务器10在获取到语音请求的情况下,先根据语音请求确定对应的用户数据模型,再根据被确定的用户数据模型中的数据库来识别语音请求。在识别到与语音请求对应的用户特征热词的情况下,则可根据对应的用户特征热词得到识别结构,并将识别结果从服务器10传输至交互界面21,车辆20通过交互界面21接收到的识别结果来执行相应的操作。
其中,在用户发出语音请求之前,车辆20可以交互界面21来确定具有用户特征的用户特征热词,并可通过交互界面21将用户特征热词上传至服务器10,使得服务器10根据接收到的用户特征热词来建立数据库,并通过数据库进行训练,生成或更新与用户相关联的用户数据模型。
而且,在前述关于用户特征热词的实施方式的基础上,用户特征热词可通过交互界面21接收到的输入信息来确定(如图2所示),也可以通过与移动终端40等其他电子设备传输的数据信息来确定(如图6所示)。由于用户数据模型中的用户特征热词具有特定的用户特征,从而更容易对用户的个性化信息进行记录,使得用户数据模型以用户偏好和个人习惯的角度来对语音请求进行识别,避免如多音字、发音不标准等问题导致的识别错误的情况,从而可提高对语音请求进行识别的效率和成功率。
本发明提供的一种计算机可读存储介质,其上存储有计算机程序,计算机程序在被处理器执行时,实现上述任一实施方式的语音识别方法。
例如,在计算机程序被执行的情况下,可以实现以下步骤:
02:根据车辆20上传的用户特征热词生成或更新用户数据模型;
03:在车辆20行驶时接收车辆20发送的语音请求;
04:根据用户数据模型对语音请求进行语音识别。
计算机可读存储介质可设置在服务器10,也可设置在其他终端,服务器10能够与其他终端进行通信来获取到相应的程序。
可以理解,计算机可读存储介质可以包括:能够携带计算机程序的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、以及软件分发介质等。计算机程序包括计算机程序代码。计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读存储介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、以及软件分发介质等。
在本发明的某些实施方式中,控制模块11可以是一个单片机芯片,集成了处理器、存储器,通讯模块等。处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理模块的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。
尽管已经示出和描述了本发明的实施方式,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施方式进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (11)

1.一种语音识别方法,其特征在于,所述语音识别方法包括:
根据车辆上传的用户特征热词生成或更新用户数据模型;
在所述车辆行驶时接收所述车辆发送的语音请求;
根据所述用户数据模型对所述语音请求进行语音识别。
2.根据权利要求1所述的语音识别方法,其特征在于,所述用户特征热词生成在所述车辆中,根据车辆上传的用户特征热词生成或更新用户数据模型,包括:
接收所述车辆上传的用户特征热词;
根据接收到的所述用户特征热词建立数据库;
根据所述数据库生成或更新所述用户数据模型。
3.根据权利要求2所述的语音识别方法,其特征在于,所述用户特征热词包括兴趣地点热词,所述车辆用于根据所述车辆的历史位置信息确定所述兴趣地点热词,所述数据库包括兴趣地点热词数据库;所述根据接收到的所述用户特征热词建立数据库,包括:
根据接收到的所述兴趣地点热词建立所述兴趣地点热词数据库。
4.根据权利要求2所述的语音识别方法,其特征在于,所述车辆包括收藏列表,所述车辆用于将所述收藏列表中的多媒体热词确定为所述用户特征热词,所述数据库包括多媒体热词数据库;所述根据接收到的所述用户特征热词建立数据库,包括:
根据接收到的所述多媒体热词建立所述多媒体热词数据库。
5.根据权利要求1所述的语音识别方法,其特征在于,所述用户特征热词存储在移动终端中,所述移动终端能够和所述车辆通信连接,
根据车辆上传的用户特征热词生成或更新用户数据模型,包括:
在所述车辆获取到所述移动终端发送的所述用户特征热词的情况下,接收所述车辆上传的用户特征热词;
根据接收到的所述用户特征热词建立数据库;
根据所述数据库生成或更新所述用户数据模型。
6.根据权利要求5所述的语音识别方法,其特征在于,所述用户特征热词包括通讯录热词,所述车辆用于获取所述移动终端发送的所述通讯录热词,所述数据库包括通讯录热词数据库;所述根据接收到的所述用户特征热词建立数据库,包括:
根据接收到的所述通讯录热词建立所述通讯录热词数据库。
7.根据权利要求2至6任一项所述的语音识别方法,其特征在于,根据车辆上传的用户特征热词生成或更新用户数据模型,包括:
在接收到新的用户特征热词的情况下,根据接收到的所述新的用户特征热词对所述数据库进行增量更新;
根据更新后得到的所述数据库,对所述用户数据模型进行全量更新。
8.根据权利要求7所述的语音识别方法,其特征在于,根据所述用户数据模型对所述语音请求进行语音识别,包括:
在对所述用户数据模型进行更新时接收到所述语音请求的情况下,以更新前的所述用户数据模型对所述语音请求进行识别。
9.一种服务器,其特征在于,所述服务器包括接收模块和控制模块,
所述接收模块用于:
在车辆行驶时接收所述车辆发送的语音请求;
所述控制模块用于:
根据所述车辆上传的用户特征热词生成或更新用户数据模型;
根据所述用户数据模型对所述语音请求进行语音识别。
10.一种语音识别系统,其特征在于,包括:
车辆,用于:发送用户特征热词和语音请求;和
服务器,用于:
根据所述车辆上传的用户特征热词生成或更新用户数据模型;
在所述车辆行驶时接收所述车辆发送的语音请求;
根据所述用户数据模型对所述语音请求进行语音识别。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序在被处理器执行时,实现权利要求1-8任一项所述的语音识别方法。
CN202111509402.0A 2021-12-10 2021-12-10 语音识别方法、服务器、语音识别系统、可读存储介质 Pending CN114333791A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111509402.0A CN114333791A (zh) 2021-12-10 2021-12-10 语音识别方法、服务器、语音识别系统、可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111509402.0A CN114333791A (zh) 2021-12-10 2021-12-10 语音识别方法、服务器、语音识别系统、可读存储介质

Publications (1)

Publication Number Publication Date
CN114333791A true CN114333791A (zh) 2022-04-12

Family

ID=81050504

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111509402.0A Pending CN114333791A (zh) 2021-12-10 2021-12-10 语音识别方法、服务器、语音识别系统、可读存储介质

Country Status (1)

Country Link
CN (1) CN114333791A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023226700A1 (zh) * 2022-05-27 2023-11-30 京东方科技集团股份有限公司 语音交互方法及其装置、电子设备和存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023226700A1 (zh) * 2022-05-27 2023-11-30 京东方科技集团股份有限公司 语音交互方法及其装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
EP2226793B1 (en) Speech recognition system and data updating method
RU2494476C2 (ru) Способ и система для предоставления речевого интерфейса
CN101939740B (zh) 在集成语言导航服务环境中提供自然语言语音用户界面
US8255154B2 (en) System, method, and computer program product for social networking utilizing a vehicular assembly
US9502025B2 (en) System and method for providing a natural language content dedication service
US7478072B2 (en) Information terminal device, operation supporting method, and operation supporting program
US8265862B1 (en) System, method, and computer program product for communicating location-related information
US20080153465A1 (en) Voice search-enabled mobile device
US20120259951A1 (en) Systems and Methods for Delivering Content to Vehicles
US20080154870A1 (en) Collection and use of side information in voice-mediated mobile search
US20080154612A1 (en) Local storage and use of search results for voice-enabled mobile communications devices
CN107785018A (zh) 多轮交互语义理解方法和装置
WO2008109835A2 (en) Speech recognition of speech recorded by a mobile communication facility
US20080154608A1 (en) On a mobile device tracking use of search results delivered to the mobile device
US20170018268A1 (en) Systems and methods for updating a language model based on user input
JP2018040904A (ja) 音声認識装置および音声認識方法
JP2019040166A (ja) 音声合成辞書配信装置、音声合成配信システムおよびプログラム
CN114333791A (zh) 语音识别方法、服务器、语音识别系统、可读存储介质
JPWO2019155717A1 (ja) 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム
CN116368353A (zh) 内容感知导航指令
CN101908058B (zh) 计算机实施系统
JP4228442B2 (ja) 音声応答装置
JP6944920B2 (ja) スマートインタラクティブの処理方法、装置、設備及びコンピュータ記憶媒体
JP4049456B2 (ja) 音声情報利用システム
CN1882015B (zh) 使用顾问和语音识别引擎的服务质量呼叫路由选择系统及其方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination