CN108346431A - 基于tcp通道的车载智能语音拓展系统及拓展方法 - Google Patents
基于tcp通道的车载智能语音拓展系统及拓展方法 Download PDFInfo
- Publication number
- CN108346431A CN108346431A CN201810041124.2A CN201810041124A CN108346431A CN 108346431 A CN108346431 A CN 108346431A CN 201810041124 A CN201810041124 A CN 201810041124A CN 108346431 A CN108346431 A CN 108346431A
- Authority
- CN
- China
- Prior art keywords
- control unit
- mobile device
- voice
- transmission control
- tcp channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 9
- 230000005540 biological transmission Effects 0.000 claims abstract description 37
- 230000006870 function Effects 0.000 claims description 13
- 230000003993 interaction Effects 0.000 claims description 12
- 238000007405 data analysis Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/16—Implementation or adaptation of Internet protocol [IP], of transmission control protocol [TCP] or of user datagram protocol [UDP]
- H04L69/163—In-band adaptation of TCP data exchange; In-band control procedures
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Security & Cryptography (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明公开基于TCP通道的车载智能语音拓展系统及拓展方法,其包括指令输入设备、传输控制单元和语音处理单元;指令输入设备和语音处理单元分别连接传输控制单元,指令输入设备用于录音生成录音数据,语音处理单元用于将录音数据处理为语音数据,传输控制单元用于从语音数据中分析语音指令并分配语音指令执行设备,传输控制单元通过TCP通道连接外部移动设备,外部移动设备用于录音生成录音数据和辅助执行语音指令。本发明通过TCP通道与外部移动客户端设备建立连接,使得语音命令分块处理,效率提升。
Description
技术领域
本发明涉及电信通讯领域,尤其涉及基于TCP通道的车载智能语音拓展系统及拓展方法。
背景技术
随着互联网在汽车领域的运用发展,智能语音系统日渐成熟。但是现阶段的车载智能语音系统,一般都是集成于车辆终端,无法进行外部移动设备的扩展,失去了进一步增加人机交互的可能性。
发明内容
本发明的目的在于克服现有技术的不足,提供基于TCP通道的车载智能语音拓展系统及拓展方法,通过外部移动客户端设备,在功能app支持的情况下,可以实现车载智能语音互动的界面展示,提高人机交互体验。。
本发明采用的技术方案是:
基于TCP通道的车载智能语音拓展系统,其包括指令输入设备、传输控制单元和语音处理单元;指令输入设备和语音处理单元分别连接传输控制单元,指令输入设备用于录音生成录音数据,语音处理单元用于将录音数据处理为语音数据,传输控制单元用于从语音数据中分析语音指令并分配语音指令执行设备,传输控制单元通过TCP通道连接外部移动设备,外部移动设备用于录音生成录音数据和辅助执行语音指令。
指令输入设备包括麦克风和车辆方控。
外部移动设备还用于录音生成录音数据。
语音处理单元为科大讯飞SDK。
传输控制单元上集成有人机交互(HMI)模块,人机交互(HMI)模块基于处理后的语音数据分析出语音指令。
外部移动设备为手机或平板。
基于TCP通道的车载智能语音拓展方法,其包括以下步骤:
S1,指令输入设备触发进行录音,并生成录音数据;
S2,录音数据发至语音处理单元(如科大讯飞sdk)识别状态及结果生成语音数据;
S3,在外部移动设备获取语音数据并显示识别状态及结果;
S4,用户通过外部移动设备确认识别状态及结果,并决定是否执行;
当执行指令时,外部移动设备显示为语音识别状态,并通过语音处理单元将语音数据发至传输控制单元,并步骤S5;
当不执行指令时,语音播报退出语,移动设备端关闭外部移动设备的语音识别界面,执行步骤S7;
S5,传输控制单元的HMI模块从语音数据中分析语音指令并分配语音指令执行设备;
S6,当语音指令为传输控制单元本地执行的指令时,则直接执行,执行结果语音播报;当语音指令为外部移动设备执行的指令,则通过TCP通道将指令送达外部移动设备,调用传输控制单元的相应功能应用执行该语音指令,执行结果语音播报;
S7,结束。
S2中语音处理单元处理生成的语音数据为XML数据。
本发明采用以上技术方案,通过TCP通道与外部移动客户端设备建立连接,使得语音命令分块处理,效率提升。将录音数据通过语音处理单元(如科大讯飞sdk)进行处理后,返回的语音数据(xml数据),传输控制单元的HMI模块会判断该信息是否是传输控制单元处理还是外部设备端处理,当是前者时,将转传输控制单元本地处理,后者的话通过TCP通道转外部移动设备处理;通过TCP通道与外部移动客户端设备建立连接,使得语音命令分块处理,效率提升。
本发明中较为复杂的语音命令可以在外部移动设备的功能app上实现(如语音控制在线音乐、语音导航等),即减传输控制单元(TU)中人机交互(HMI)模块压力,实现车载智能语音互动的界面展示,提高人机交互体验,丰富语音功能。本发明可以通过功能app添加新的语音功能,使车辆的语音系统有良好的提升潜力。
附图说明
以下结合附图和具体实施方式对本发明做进一步详细说明;
图1为本发明基于TCP通道的车载智能语音拓展系统的结构示意图;
图2为本发明基于TCP通道的车载智能语音拓展系统的协作关系示意图;
图3为本发明基于TCP通道的车载智能语音拓展方法的流程示意图。
具体实施方式
如图1-3所示,本发明公开了基于TCP通道的车载智能语音拓展系统,其包括指令输入设备、传输控制单元和语音处理单元;指令输入设备和语音处理单元分别连接传输控制单元,指令输入设备用于录音生成录音数据,语音处理单元用于将录音数据处理为语音数据,传输控制单元用于从语音数据中分析语音指令并分配语音指令执行设备,传输控制单元通过TCP通道连接外部移动设备,外部移动设备用于录音生成录音数据和辅助执行语音指令。
指令输入设备包括麦克风和车辆方控,车辆方控连接连接传输控制单元。当语音指令通过麦克风输入时,由麦克风直接录音生成录音数据;当用户通过车内方控按键触发指令输入时,方控按键通知外部移动设备启动语音识别功能进行录音生成录音数据。
语音处理单元为科大讯飞SDK。
传输控制单元上集成有人机交互(HMI)模块,人机交互(HMI)模块基于处理后的语音数据分析出语音指令。
外部移动设备为手机或平板。
如图3所示,基于TCP通道的车载智能语音拓展方法,其包括以下步骤:
S1,指令输入设备触发进行录音,并生成录音数据;
S2,录音数据发至语音处理单元(如科大讯飞sdk)识别状态及结果生成语音数据;
S3,在外部移动设备获取语音数据并显示识别状态及结果;
S4,用户通过外部移动设备确认识别状态及结果,并决定是否执行;
当执行指令时,外部移动设备显示为语音识别状态,并通过语音处理单元将语音数据发至传输控制单元,并步骤S5;
当不执行指令时,语音播报退出语,移动设备端关闭外部移动设备的语音识别界面,执行步骤S7;
S5,传输控制单元的HMI模块从语音数据中分析语音指令并分配语音指令执行设备;
S6,当语音指令为传输控制单元本地执行的指令时,则直接执行,执行结果语音播报;当语音指令为外部移动设备执行的指令,则通过TCP通道将指令送达外部移动设备,调用传输控制单元的相应功能应用执行该语音指令,执行结果语音播报。
S7,结束。
S2中语音处理单元处理生成的语音数据为XML数据。
本发明采用以上技术方案,通过TCP通道与外部移动客户端设备建立连接,使得语音命令分块处理,效率提升。将录音数据通过语音处理单元(如科大讯飞sdk)进行处理后,返回的语音数据(xml数据),传输控制单元的HMI模块会判断该信息是否是传输控制单元处理还是外部设备端处理,当是前者时,将转传输控制单元本地处理,后者的话通过TCP通道转外部移动设备处理;通过TCP通道与外部移动客户端设备建立连接,使得语音命令分块处理,效率提升。
本发明中较为复杂的语音命令可以在外部移动设备的功能app上实现(如语音控制在线音乐、语音导航等),即减传输控制单元(TU)中人机交互(HMI)模块压力,实现车载智能语音互动的界面展示,提高人机交互体验,丰富语音功能。本发明可以通过功能app添加新的语音功能,使车辆的语音系统有良好的提升潜力。
Claims (8)
1.基于TCP通道的车载智能语音拓展系统,其特征在于:其包括指令输入设备、传输控制单元和语音处理单元;指令输入设备和语音处理单元分别连接传输控制单元,指令输入设备用于录音生成录音数据,语音处理单元用于将录音数据处理为语音数据,传输控制单元用于从语音数据中分析语音指令并分配语音指令执行设备,传输控制单元通过TCP通道连接外部移动设备,外部移动设备用于录音生成录音数据和辅助执行语音指令。
2.根据权利要求1所述的基于TCP通道的车载智能语音拓展系统,其特征在于:所述指令输入设备包括麦克风和车辆方控。
3.根据权利要求2所述的基于TCP通道的车载智能语音拓展系统,其特征在于:所述外部移动设备还用于录音生成录音数据。
4.根据权利要求1所述的基于TCP通道的车载智能语音拓展系统,其特征在于:所述语音处理单元为科大讯飞SDK。
5.根据权利要求1所述的基于TCP通道的车载智能语音拓展系统,其特征在于:所述传输控制单元上集成有人机交互(HMI)模块,人机交互(HMI)模块基于处理后的语音数据分析出语音指令。
6.根据权利要求1所述的基于TCP通道的车载智能语音拓展系统,其特征在于:所述外部移动设备为手机或平板。
7.基于TCP通道的车载智能语音拓展方法,其特征在于:其包括以下步骤:
S1,指令输入设备触发进行录音,并生成录音数据;
S2,录音数据发至语音处理单元(如科大讯飞sdk)识别状态及结果生成语音数据;
S3,在外部移动设备获取语音数据并显示识别状态及结果;
S4,用户通过外部移动设备确认识别状态及结果,并决定是否执行;
当执行指令时,外部移动设备显示为语音识别状态,并通过语音处理单元将语音数据发至传输控制单元,并步骤S5;
当不执行指令时,语音播报退出语,移动设备端关闭外部移动设备的语音识别界面,执行步骤S7;
S5,传输控制单元的HMI模块从语音数据中分析语音指令并判断语音指令是否为传输控制单元本地执行;
S6,当语音指令为传输控制单元本地执行的指令时,则直接执行,执行结果语音播报;当语音指令为外部移动设备执行的指令,则通过TCP通道将指令送达外部移动设备,调用传输控制单元的相应功能应用执行该语音指令,执行结果语音播报;
S7,结束。
8.根据权利要求7所述的基于TCP通道的车载智能语音拓展系统,其特征在于:所述S2中语音处理单元处理生成的语音数据为XML数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810041124.2A CN108346431A (zh) | 2018-01-16 | 2018-01-16 | 基于tcp通道的车载智能语音拓展系统及拓展方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810041124.2A CN108346431A (zh) | 2018-01-16 | 2018-01-16 | 基于tcp通道的车载智能语音拓展系统及拓展方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108346431A true CN108346431A (zh) | 2018-07-31 |
Family
ID=62960373
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810041124.2A Pending CN108346431A (zh) | 2018-01-16 | 2018-01-16 | 基于tcp通道的车载智能语音拓展系统及拓展方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108346431A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113409758A (zh) * | 2021-06-10 | 2021-09-17 | 恒大新能源汽车投资控股集团有限公司 | 一种智能语音的交互方法、装置和系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103617795A (zh) * | 2013-10-31 | 2014-03-05 | 广东好帮手电子科技股份有限公司 | 一种车载语音识别控制方法及系统 |
CN103794213A (zh) * | 2012-10-31 | 2014-05-14 | 通用汽车环球科技运作有限责任公司 | 车辆中的通过外在装置的语音识别功能 |
CN104754500A (zh) * | 2015-04-16 | 2015-07-01 | 芜湖宏景电子股份有限公司 | 基于蓝牙传输的车载终端与智能手机语音声控互联互控系统 |
CN204539202U (zh) * | 2014-04-17 | 2015-08-05 | 深圳市掌翼星通科技有限公司 | 一种车载声控语音点播在线歌曲系统 |
CN105632493A (zh) * | 2016-02-05 | 2016-06-01 | 深圳前海勇艺达机器人有限公司 | 一种通过语音控制和唤醒机器人的方法 |
CN106782527A (zh) * | 2016-12-16 | 2017-05-31 | 福建省汽车工业集团云度新能源汽车股份有限公司 | 一种智能电动汽车语音控制系统及方法 |
-
2018
- 2018-01-16 CN CN201810041124.2A patent/CN108346431A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103794213A (zh) * | 2012-10-31 | 2014-05-14 | 通用汽车环球科技运作有限责任公司 | 车辆中的通过外在装置的语音识别功能 |
CN103617795A (zh) * | 2013-10-31 | 2014-03-05 | 广东好帮手电子科技股份有限公司 | 一种车载语音识别控制方法及系统 |
CN204539202U (zh) * | 2014-04-17 | 2015-08-05 | 深圳市掌翼星通科技有限公司 | 一种车载声控语音点播在线歌曲系统 |
CN104754500A (zh) * | 2015-04-16 | 2015-07-01 | 芜湖宏景电子股份有限公司 | 基于蓝牙传输的车载终端与智能手机语音声控互联互控系统 |
CN105632493A (zh) * | 2016-02-05 | 2016-06-01 | 深圳前海勇艺达机器人有限公司 | 一种通过语音控制和唤醒机器人的方法 |
CN106782527A (zh) * | 2016-12-16 | 2017-05-31 | 福建省汽车工业集团云度新能源汽车股份有限公司 | 一种智能电动汽车语音控制系统及方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113409758A (zh) * | 2021-06-10 | 2021-09-17 | 恒大新能源汽车投资控股集团有限公司 | 一种智能语音的交互方法、装置和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108630193A (zh) | 语音识别方法及装置 | |
CN107018228B (zh) | 一种语音控制系统、语音处理方法及终端设备 | |
CN105793923A (zh) | 本地和远程语音处理 | |
CN109144458B (zh) | 用于执行与语音输入相对应的操作的电子设备 | |
CN108271078A (zh) | 通过手势识别的语音唤醒方法、智能电视及存储介质 | |
US10565862B2 (en) | Methods and systems for ambient system control | |
CN111833875B (zh) | 一种嵌入式语音交互系统 | |
CN110047484A (zh) | 一种语音识别交互方法、系统、设备和存储介质 | |
CN108418744A (zh) | 一种用于提升电力服务质量的电子坐席系统 | |
CN108632653A (zh) | 语音管控方法、智能电视及计算机可读存储介质 | |
CN109462546A (zh) | 一种语音对话历史消息记录方法、装置及系统 | |
CN110232924A (zh) | 车载语音管理方法、装置、车辆及存储介质 | |
WO2017000772A1 (zh) | 一种前端音频处理系统 | |
CN110428835A (zh) | 一种语音设备的调节方法、装置、存储介质及语音设备 | |
KR20200045851A (ko) | 음성 인식 서비스를 제공하는 전자 장치 및 시스템 | |
KR20140067687A (ko) | 대화형 음성인식이 가능한 차량 시스템 | |
CN108346431A (zh) | 基于tcp通道的车载智能语音拓展系统及拓展方法 | |
CN112015879B (zh) | 基于文本结构化管理的人机交互引擎实现方法及装置 | |
CN111312243B (zh) | 设备交互方法和装置 | |
CN113362845A (zh) | 声音数据降噪方法、装置、设备、存储介质及程序产品 | |
KR102386040B1 (ko) | 음성 입력을 처리하기 위한 방법, 장치 및 명령어들을 갖는 컴퓨터 판독 가능한 저장 매체, 음성 처리 기능을 갖는 자동차, 및 사용자 단말기 | |
CN113066489A (zh) | 语音交互方法、装置、计算机可读存储介质及电子设备 | |
CN114333817A (zh) | 遥控器及遥控器语音识别方法 | |
CN114550720A (zh) | 语音交互方法、装置、电子设备和存储介质 | |
KR20220125523A (ko) | 전자 장치 및 전자 장치에서 레코딩과 음성 입력을 처리하는 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180731 |
|
RJ01 | Rejection of invention patent application after publication |