CN108122557A - 基于声纹识别的车载多媒体导航终端 - Google Patents
基于声纹识别的车载多媒体导航终端 Download PDFInfo
- Publication number
- CN108122557A CN108122557A CN201711422606.4A CN201711422606A CN108122557A CN 108122557 A CN108122557 A CN 108122557A CN 201711422606 A CN201711422606 A CN 201711422606A CN 108122557 A CN108122557 A CN 108122557A
- Authority
- CN
- China
- Prior art keywords
- user
- module
- vocal print
- identity information
- voiceprint
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000001755 vocal effect Effects 0.000 claims description 48
- 238000000605 extraction Methods 0.000 claims description 11
- 238000007619 statistical method Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000003739 neck Anatomy 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/36—Input/output arrangements for on-board computers
- G01C21/3626—Details of the output of route guidance instructions
- G01C21/3629—Guidance using speech or audio output, e.g. text-to-speech
Landscapes
- Engineering & Computer Science (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Automation & Control Theory (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- Navigation (AREA)
Abstract
本发明涉及车载多媒体导航终端技术。本发明是要解决现有带语音识别的车载多媒体导航终端不会识别用户的问题,提供了一种基于声纹识别的车载多媒体导航终端,其技术方案可概括为:基于声纹识别的车载多媒体导航终端,包括语音模块及车载导航终端本体,所述语音模块与车载导航终端本体连接,其特征在于,还包括声纹识别模块、用户使用习惯记录模块及初始化模块,所述声纹识别模块与语音模块连接,用户使用习惯记录模块分别与初始化模块、车载导航终端本体及声纹识别模块连接,初始化模块分别与声纹识别模块及车载导航终端本体连接。本发明的有益效果是,提升用户体验,适用于车载多媒体导航终端。
Description
技术领域
本发明涉及车载多媒体导航终端技术,特别涉及车载多媒体导航终端的用户使用习惯的技术。
背景技术
随着人工智能技术及深度学习技术的不断发展,声纹识别、图像识别的准确度得到质的提升,目前声纹识别及图像识别已经广泛的应用到智能手机、监控、考勤及支付等领域,在车载行业目前语音识别主要用于指令信息的获取,即将用户语音指令翻译成机器指令,以解放用户双手,方便实现车载多媒体导航终端的操作,但是其并不会识别用户,而只是根据语音指令进行操作。
发明内容
本发明的目的是要解决由于目前带语音识别的车载多媒体导航终端不会识别用户的问题,提供了一种基于声纹识别的车载多媒体导航终端。
本发明解决其技术问题,采用的技术方案是,基于声纹识别的车载多媒体导航终端,包括语音模块及车载导航终端本体,所述语音模块与车载导航终端本体连接,其特征在于,还包括声纹识别模块、用户使用习惯记录模块及初始化模块,所述声纹识别模块与语音模块连接,用户使用习惯记录模块分别与初始化模块、车载导航终端本体及声纹识别模块连接,初始化模块分别与声纹识别模块及车载导航终端本体连接,
所述语音模块用于采集输入的语音信息并识别出其中的语音指令,当识别出语音指令时,将该语音信息发送给声纹识别模块,并将识别出的语音指令发送给车载导航终端本体进行本次操作;
所述声纹识别模块用于接收语音模块发送来的声音信息,对其声纹进行识别,获取到对应的用户身份信息,若未识别出则认定为新用户,建立相应的用户身份信息,并向初始化模块及用户使用习惯记录模块发送得到的用户身份信息;
所述用户使用习惯记录模块用于从车载导航终端本体中获取本次操作,根据声纹识别模块发送来的用户身份信息确定用户身份,若该用户身份信息为新用户,则为其建立对应的用户使用习惯记录,并在其中记录本次操作,若该用户身份信息已有对应的用户使用习惯记录,则直接在其中记录本次操作,且根据各用户使用习惯记录分别对其进行统计分析,得到各用户对应的推荐配置;
所述初始化模块用于根据声纹识别模块发送来的用户身份信息从用户使用习惯记录模块中提取其对应的推荐配置,根据该推荐配置初始化车载导航终端本体。
具体的,所述声纹识别模块包括特征提取单元、声纹存储单元及声纹比对单元,所述特征提取单元分别与语音识别模块、声纹存储单元及声纹比对单元连接,声纹比对单元分别与声纹存储单元、用户使用习惯记录模块及初始化模块连接,
所述特征提取单元用于提取语音识别模块发送来的语音信息中的特征信息,并将其分别发送给声纹存储单元及声纹比对单元;
所述声纹存储单元用于接收特征提取单元发送来的特征信息,根据声纹比对单元发送来的用户身份信息选择对应的用户声纹特征存储该特征信息,若用户身份信息为新用户,则建立该用户对应的用户声纹特征,并在其中存入该特征信息,且根据所存储的特征信息建立用户识别模型并提供给声纹比对单元;
所述声纹比对单元用于根据接收到的特征信息通过用户识别模型进行比对,得到对应的用户身份信息。
进一步的,所述本次操作为车载导航终端本体根据语音指令做出的相应操作或根据用户手动指令做出的相应手动操作;
所述用户使用习惯记录模块获取本次操作时,若声纹识别模块没有发送来用户身份信息,则认定为手动操作,并将本次操作记录至最近一次接收到的用户身份信息对应的用户使用习惯记录中,若之前没有接收到任何用户身份信息,则不记录本次操作。
具体的,所述推荐配置包括导航推荐路线和/或喜爱的电台和/或喜爱的音乐和/或音量。
本发明的有益效果是,在本发明方案中,通过上述基于声纹识别的车载多媒体导航终端,其可识别用户,为对应用户提供推荐配置对车载导航终端进行初始化,提升用户体验,方便用户。
附图说明
图1为本发明实施例中基于声纹识别的车载多媒体导航终端的系统框图。
具体实施方式
下面结合实施例及附图,详细描述本发明的技术方案。
本发明所述基于声纹识别的车载多媒体导航终端,包括语音模块、车载导航终端本体、声纹识别模块、用户使用习惯记录模块及初始化模块,其中,语音模块与车载导航终端本体连接,声纹识别模块与语音模块连接,用户使用习惯记录模块分别与初始化模块、车载导航终端本体及声纹识别模块连接,初始化模块分别与声纹识别模块及车载导航终端本体连接,这里,语音模块用于采集输入的语音信息并识别出其中的语音指令,当识别出语音指令时,将该语音信息发送给声纹识别模块,并将识别出的语音指令发送给车载导航终端本体进行本次操作;声纹识别模块用于接收语音模块发送来的声音信息,对其声纹进行识别,获取到对应的用户身份信息,若未识别出则认定为新用户,建立相应的用户身份信息,并向初始化模块及用户使用习惯记录模块发送得到的用户身份信息;用户使用习惯记录模块用于从车载导航终端本体中获取本次操作,根据声纹识别模块发送来的用户身份信息确定用户身份,若该用户身份信息为新用户,则为其建立对应的用户使用习惯记录,并在其中记录本次操作,若该用户身份信息已有对应的用户使用习惯记录,则直接在其中记录本次操作,且根据各用户使用习惯记录分别对其进行统计分析,得到各用户对应的推荐配置;初始化模块用于根据声纹识别模块发送来的用户身份信息从用户使用习惯记录模块中提取其对应的推荐配置,根据该推荐配置初始化车载导航终端本体。
实施例
本发明实施例的基于声纹识别的车载多媒体导航终端,其系统框图参见图1,包括语音模块、车载导航终端本体、声纹识别模块、用户使用习惯记录模块及初始化模块,其中,语音模块与车载导航终端本体连接,声纹识别模块与语音模块连接,用户使用习惯记录模块分别与初始化模块、车载导航终端本体及声纹识别模块连接,初始化模块分别与声纹识别模块及车载导航终端本体连接。
这里,语音模块用于采集输入的语音信息并识别出其中的语音指令,当识别出语音指令时,将该语音信息发送给声纹识别模块,并将识别出的语音指令发送给车载导航终端本体进行本次操作。其仅将识别出语音指令的语音信息发送给声纹识别模块的目的在于,避免用户正常说话时,声纹识别模块仍在识别用户,从而浪费资源。
声纹识别模块用于接收语音模块发送来的声音信息,对其声纹进行识别,获取到对应的用户身份信息,若未识别出则认定为新用户,建立相应的用户身份信息,并向初始化模块及用户使用习惯记录模块发送得到的用户身份信息。
声纹识别模块可包括特征提取单元、声纹存储单元及声纹比对单元,其中,特征提取单元分别与语音识别模块、声纹存储单元及声纹比对单元连接,声纹比对单元分别与声纹存储单元、用户使用习惯记录模块及初始化模块连接,特征提取单元用于提取语音识别模块发送来的语音信息中的特征信息,并将其分别发送给声纹存储单元及声纹比对单元;声纹存储单元用于接收特征提取单元发送来的特征信息,根据声纹比对单元发送来的用户身份信息选择对应的用户声纹特征存储该特征信息,若用户身份信息为新用户,则建立该用户对应的用户声纹特征,并在其中存入该特征信息,且根据所存储的特征信息建立用户识别模型并提供给声纹比对单元;声纹比对单元用于根据接收到的特征信息通过用户识别模型进行比对,得到对应的用户身份信息。建立用户识别模型的具体步骤或处理方式为现在较为成熟的技术,此处不再详述。
用户使用习惯记录模块用于从车载导航终端本体中获取本次操作,根据声纹识别模块发送来的用户身份信息确定用户身份,若该用户身份信息为新用户,则为其建立对应的用户使用习惯记录,并在其中记录本次操作,若该用户身份信息已有对应的用户使用习惯记录,则直接在其中记录本次操作,且根据各用户使用习惯记录分别对其进行统计分析,得到各用户对应的推荐配置。而该统计分析也是现在较为成熟的技术,因此此处不再详述。
初始化模块用于根据声纹识别模块发送来的用户身份信息从用户使用习惯记录模块中提取其对应的推荐配置,根据该推荐配置初始化车载导航终端本体。
而由于车载导航终端本体所做出的本次操作可以为车载导航终端本体根据语音指令做出的相应操作或根据用户手动指令做出的相应手动操作;则用户使用习惯记录模块获取本次操作时,若声纹识别模块没有发送来用户身份信息,则认定为手动操作,并将本次操作记录至最近一次接收到的用户身份信息对应的用户使用习惯记录中,若之前没有接收到任何用户身份信息,则不记录本次操作。
本例中,推荐配置可包括导航推荐路线和/或喜爱的电台和/或喜爱的音乐和/或音量等。
Claims (4)
1.基于声纹识别的车载多媒体导航终端,包括语音模块及车载导航终端本体,所述语音模块与车载导航终端本体连接,其特征在于,还包括声纹识别模块、用户使用习惯记录模块及初始化模块,所述声纹识别模块与语音模块连接,用户使用习惯记录模块分别与初始化模块、车载导航终端本体及声纹识别模块连接,初始化模块分别与声纹识别模块及车载导航终端本体连接,
所述语音模块用于采集输入的语音信息并识别出其中的语音指令,当识别出语音指令时,将该语音信息发送给声纹识别模块,并将识别出的语音指令发送给车载导航终端本体进行本次操作;
所述声纹识别模块用于接收语音模块发送来的声音信息,对其声纹进行识别,获取到对应的用户身份信息,若未识别出则认定为新用户,建立相应的用户身份信息,并向初始化模块及用户使用习惯记录模块发送得到的用户身份信息;
所述用户使用习惯记录模块用于从车载导航终端本体中获取本次操作,根据声纹识别模块发送来的用户身份信息确定用户身份,若该用户身份信息为新用户,则为其建立对应的用户使用习惯记录,并在其中记录本次操作,若该用户身份信息已有对应的用户使用习惯记录,则直接在其中记录本次操作,且根据各用户使用习惯记录分别对其进行统计分析,得到各用户对应的推荐配置;
所述初始化模块用于根据声纹识别模块发送来的用户身份信息从用户使用习惯记录模块中提取其对应的推荐配置,根据该推荐配置初始化车载导航终端本体基于声纹识别的车载多媒体导航终端。
2.如权利要求1所述的基于声纹识别的车载多媒体导航终端,其特征在于,所述声纹识别模块包括特征提取单元、声纹存储单元及声纹比对单元,所述特征提取单元分别与语音识别模块、声纹存储单元及声纹比对单元连接,声纹比对单元分别与声纹存储单元、用户使用习惯记录模块及初始化模块连接,
所述特征提取单元用于提取语音识别模块发送来的语音信息中的特征信息,并将其分别发送给声纹存储单元及声纹比对单元;
所述声纹存储单元用于接收特征提取单元发送来的特征信息,根据声纹比对单元发送来的用户身份信息选择对应的用户声纹特征存储该特征信息,若用户身份信息为新用户,则建立该用户对应的用户声纹特征,并在其中存入该特征信息,且根据所存储的特征信息建立用户识别模型并提供给声纹比对单元;
所述声纹比对单元用于根据接收到的特征信息通过用户识别模型进行比对,得到对应的用户身份信息。
3.如权利要求1所述的基于声纹识别的车载多媒体导航终端,其特征在于,所述本次操作为车载导航终端本体根据语音指令做出的相应操作或根据用户手动指令做出的相应手动操作;
所述用户使用习惯记录模块获取本次操作时,若声纹识别模块没有发送来用户身份信息,则认定为手动操作,并将本次操作记录至最近一次接收到的用户身份信息对应的用户使用习惯记录中,若之前没有接收到任何用户身份信息,则不记录本次操作。
4.如权利要求1或2或3所述的基于声纹识别的车载多媒体导航终端,其特征在于,所述推荐配置包括导航推荐路线和/或喜爱的电台和/或喜爱的音乐和/或音量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711422606.4A CN108122557A (zh) | 2017-12-25 | 2017-12-25 | 基于声纹识别的车载多媒体导航终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711422606.4A CN108122557A (zh) | 2017-12-25 | 2017-12-25 | 基于声纹识别的车载多媒体导航终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108122557A true CN108122557A (zh) | 2018-06-05 |
Family
ID=62231452
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711422606.4A Pending CN108122557A (zh) | 2017-12-25 | 2017-12-25 | 基于声纹识别的车载多媒体导航终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108122557A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109166585A (zh) * | 2018-11-02 | 2019-01-08 | 珠海格力电器股份有限公司 | 语音控制的方法及装置、存储介质 |
CN109752021A (zh) * | 2018-12-18 | 2019-05-14 | 维沃移动通信有限公司 | 一种行驶路线规划方法及装置 |
CN111199593A (zh) * | 2020-01-09 | 2020-05-26 | 广州智体科技有限公司 | 出租车考勤调度管理方法 |
CN112201257A (zh) * | 2020-09-29 | 2021-01-08 | 北京百度网讯科技有限公司 | 基于声纹识别的信息推荐方法、装置、电子设备及存储介质 |
US11700127B2 (en) | 2019-09-29 | 2023-07-11 | Boe Technology Group Co., Ltd. | Authentication method, authentication device, electronic device and storage medium |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105957525A (zh) * | 2016-04-26 | 2016-09-21 | 珠海市魅族科技有限公司 | 一种语音助手的交互方法以及用户设备 |
CN105979376A (zh) * | 2015-12-02 | 2016-09-28 | 乐视致新电子科技(天津)有限公司 | 一种推荐方法和装置 |
CN106126717A (zh) * | 2016-06-30 | 2016-11-16 | 维沃移动通信有限公司 | 一种应用的推送方法及移动终端 |
CN106131684A (zh) * | 2016-06-24 | 2016-11-16 | 依偎科技(南昌)有限公司 | 一种内容推荐方法及终端 |
CN106228988A (zh) * | 2016-07-29 | 2016-12-14 | 珠海市魅族科技有限公司 | 一种基于声纹信息的习惯信息匹配方法及装置 |
-
2017
- 2017-12-25 CN CN201711422606.4A patent/CN108122557A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105979376A (zh) * | 2015-12-02 | 2016-09-28 | 乐视致新电子科技(天津)有限公司 | 一种推荐方法和装置 |
US20170164049A1 (en) * | 2015-12-02 | 2017-06-08 | Le Holdings (Beijing) Co., Ltd. | Recommending method and device thereof |
CN105957525A (zh) * | 2016-04-26 | 2016-09-21 | 珠海市魅族科技有限公司 | 一种语音助手的交互方法以及用户设备 |
CN106131684A (zh) * | 2016-06-24 | 2016-11-16 | 依偎科技(南昌)有限公司 | 一种内容推荐方法及终端 |
CN106126717A (zh) * | 2016-06-30 | 2016-11-16 | 维沃移动通信有限公司 | 一种应用的推送方法及移动终端 |
CN106228988A (zh) * | 2016-07-29 | 2016-12-14 | 珠海市魅族科技有限公司 | 一种基于声纹信息的习惯信息匹配方法及装置 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109166585A (zh) * | 2018-11-02 | 2019-01-08 | 珠海格力电器股份有限公司 | 语音控制的方法及装置、存储介质 |
CN109752021A (zh) * | 2018-12-18 | 2019-05-14 | 维沃移动通信有限公司 | 一种行驶路线规划方法及装置 |
US11700127B2 (en) | 2019-09-29 | 2023-07-11 | Boe Technology Group Co., Ltd. | Authentication method, authentication device, electronic device and storage medium |
CN111199593A (zh) * | 2020-01-09 | 2020-05-26 | 广州智体科技有限公司 | 出租车考勤调度管理方法 |
CN112201257A (zh) * | 2020-09-29 | 2021-01-08 | 北京百度网讯科技有限公司 | 基于声纹识别的信息推荐方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108122557A (zh) | 基于声纹识别的车载多媒体导航终端 | |
CN107945792B (zh) | 语音处理方法和装置 | |
US10380992B2 (en) | Natural language generation based on user speech style | |
CN107240398B (zh) | 智能语音交互方法及装置 | |
CN107316643B (zh) | 语音交互方法及装置 | |
US10438586B2 (en) | Voice dialog device and voice dialog method | |
US20170270922A1 (en) | Smart home control method based on emotion recognition and the system thereof | |
CN108986826A (zh) | 自动生成会议记录的方法、电子装置及可读存储介质 | |
CN108447471A (zh) | 语音识别方法及语音识别装置 | |
CN108122555B (zh) | 通讯方法、语音识别设备和终端设备 | |
CN104811559B (zh) | 降噪方法、通信方法及移动终端 | |
US9601107B2 (en) | Speech recognition system, recognition dictionary registration system, and acoustic model identifier series generation apparatus | |
CN106782615A (zh) | 语音数据情感检测方法和装置及系统 | |
CN107274889A (zh) | 一种根据语音生成业务单据的方法及装置 | |
CN108447488A (zh) | 增强语音识别任务完成 | |
CN106462513A (zh) | 信息处理系统及车载装置 | |
CN109817211A (zh) | 一种电器控制方法、装置、存储介质及电器 | |
CN109918619B (zh) | 一种基于基础字典标注的发音标注方法和装置 | |
CN104756185A (zh) | 语音识别装置 | |
WO2014173325A1 (zh) | 喉音识别方法及装置 | |
CN109346057A (zh) | 一种智能儿童玩具的语音处理系统 | |
CN110972112A (zh) | 地铁运行方向的确定方法、装置、终端及存储介质 | |
CN104103272A (zh) | 语音识别方法、装置和蓝牙耳机 | |
CN112585674A (zh) | 信息处理装置、信息处理方法和程序 | |
KR20140067687A (ko) | 대화형 음성인식이 가능한 차량 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180605 |