CN106328136A - 一种可语音操控的智能装置 - Google Patents

一种可语音操控的智能装置 Download PDF

Info

Publication number
CN106328136A
CN106328136A CN201610696393.3A CN201610696393A CN106328136A CN 106328136 A CN106328136 A CN 106328136A CN 201610696393 A CN201610696393 A CN 201610696393A CN 106328136 A CN106328136 A CN 106328136A
Authority
CN
China
Prior art keywords
command
voice
smart machine
double
core cpu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610696393.3A
Other languages
English (en)
Inventor
黄广明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201610696393.3A priority Critical patent/CN106328136A/zh
Publication of CN106328136A publication Critical patent/CN106328136A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

本发明公开了一种可语音操控的智能装置,包括用于采集语音命令的麦克风、音频模块、双核CPU、用于存储对比命令的命令向量存储单元,其中,麦克风通过音频模块与双核CPU电连接,双核CPU与智能设备电连接,采集的语音命令和对比命令传输至双核CPU并形成识别命令后,输送至智能设备来对其进行实时操控。本发明的有益效果是:结构简单,使用方便灵活,仅需将本装置连接智能设备,无需接触就能进行实时语音识别,通过配置能对存储不同的语音命令进行本地语音识别,还能通过本装置的语音识别连接智能设备本身的语音识别功能,实现在线语音识别。实现无接触,本地与在线联合的语音操控功能。

Description

一种可语音操控的智能装置
技术领域
本发明涉及智能装置领域,尤其是涉及一种可语音操控的智能装置。
背景技术
随着智能控制技术的发展,语音命令识别技术也日渐成熟,语音搜索、语音命令在各种智能硬件中都有使用,如智能手机上的语音搜索。但这些语音识别还依赖手的操作,无法实现无接触语音识别,如苹果手机的语音识别命令siri,想要使用其进行语音识别,必需按键来触发该功能。但在特殊场景下,用户无法接触到智能设备,又要对其进行操控时,如开车时想接电话,这些语音识别功能就无法发挥作用。
发明内容
针对现有技术的上述缺陷,本发明之目的在于提供一种可语音操控的智能装置,其结构简单、使用方便灵活、无需接触就能进行实时语音识别。
为实现上述目的,本发明的一种可语音操控的智能装置,包括用于采集语音命令的麦克风、音频模块、双核CPU、用于存储对比命令的命令向量存储单元,其中,麦克风通过音频模块与双核CPU电连接,双核CPU与智能设备电连接,采集的语音命令和对比命令传输至双核CPU并形成识别命令后,输送至智能设备来对其进行实时操控,电源管理模块可以在不使用时将装置调整为休眠状态。
进一步,所述智能设备内置有命令映射模块,该命令映射模块接收所述双核CPU的识别命令,并将识别命令映射成所述智能设备的操控。
进一步,存储预设有限集语音对比命令的所述命令向量存储单元形成本地语音识别存储单元。
进一步,所述命令映射模块控制所述智能设备的语音识别引擎单元,反馈连接至所述双核CPU,形成在线语音识别单元。
进一步,所述麦克风、双核CPU和命令向量存储单元集成为语音识别模块,该语音识别模块直接集成设置于所述智能设备的主板上。
进一步,所述麦克风为所述智能设备内置的麦克风,所述语音识别模块与所述智能设备共用一个麦克风。
进一步,所述麦克风、双核CPU和命令向量存储单元设置为外置的微型硬件单元,该微型硬件单元上还设置有与所述智能设备连接的智能设备接口模块。
进一步,所述智能设备接口模块包括USB连接口、耳机插孔连接口、蓝牙连接模块。
进一步,所述智能设备包括智能手机、导航仪、可视电话、会议终端、智能穿戴设备、智能家具设备。
本发明的有益效果是:结构简单,使用方便灵活,仅需将本装置连接智能设备,无需接触就能进行实时语音识别,通过配置能对存储不同的语音命令进行本地语音识别,还能通过本装置的语音识别连接智能设备本身的语音识别功能,实现在线语音识别。实现无接触,本地与在线联合的语音操控功能。
附图说明
图1为本发明的一种可语音操控的智能装置的结构框图。
具体实施方式
如图1所示,一种可语音操控的智能装置,能够实时识别语音命令并转化为语音命令,控制智能设备,并且本装置无需接触智能硬件就能进行语音命令的识别。既能实现有限集的本地语音识别,又能通过语音命令打开并连接云端语音识别引擎,实现无接触的语音识别功能,电源管理模块可以在不使用时将装置调整为休眠状态。
针对于其功能,可分为两种结构形式:1、作为外置的微型硬件单元,2、直接集成在智能设备的主板上。针对上述两种结构,详细结构说明如下:
1、本发明一种可语音操控的智能装置,作为外置的微型硬件单元。
本发明一种可语音操控的智能装置,包括麦克风、音频模块、双核CPU、命令向量存储单元、智能设备接口模块。其中,麦克风通过音频模块与双核CPU电连接,双核CPU与智能设备通过智能设备接口模块电连接。
麦克风用于采集语音命令信号,并通过语音识别单元将其传输给双核CPU。
双核CPU接收麦克风传输的语音命令信号,通过特征向量提取技术计算语音信号的向量值,对比存储在命令向量存储单元内的信号进行命令识别,给出语音识别结果。
命令向量存储单元用于存储对比命令,即:存储本地识别语音命令。命令向量存储单元存储预设有限集语音对比命令,形成本地语音识别存储单元。
智能设备接口模块用于微型硬件单元与智能设备连接。智能设备接口模块用于读取双核CPU识别的命令,并传输给智能设备。智能设备接口模块可包括USB连接口、耳机插孔连接口、蓝牙连接模块等,其可根据设备的连接要求而采用多种结构形式。
智能设备还内置有命令映射模块,命令映射模块接收双核CPU的识别命令,并将识别命令映射成智能设备所需的操作,控制智能设备。
上述的本地语音识别存储单元应用于本地命令识别。本地语音识别采用多项语音向量提取和对比的方式进行语音命令的识别,该方式提取输入的语音的音量、音调和音节等音频向量,与存储在向量存储单元的音频向量进行对比识别,多项语音向量具有识别度精准和存储空间小的特定。
同时,通过内置于智能设备的命令映射模块打开智能设备的语音识别引擎单元,反馈连接至双核CPU,形成在线语音识别单元实现语音在线识别功能。
命令映射模块可为智能设备内置的硬件单元,也可为智能设备内置的命令映射软件、驱动等形式。
工作时,麦克风采集到语音命令并传输给双核CPU,双核CPU计算语音命令的特征向量,与命令向量存储单元中的命令特征向量进行对比识别,将识别的命令通过智能设备接口传输给智能设备。智能设备接受到命令后,内置在其中的命令映射模块会根据命令操控智能设备,实现本地命令识别,比如手机的唤醒,接电话,挂断电话等本地命令识别。
同时,还能通过连接智能设备安装的语音识别引擎实现在线命令识别,比如通过本地命令″语音引擎″打开手机的语音识别引擎,如苹果手机的″siri″,进行在线语音命令识别。
2、本发明一种可语音操控的智能装置,其直接集成在智能设备的主板上。
直接集成在智能设备的主板上的结构形式,与上述外置的微型硬件单元的基本结构类似、工作形式相同。
其具体为:麦克风、双核CPU和命令向量存储单元集成为语音识别模块,该语音识别模块直接集成设置于所述智能设备的主板上。与上述外置的微型硬件单元相比较,可省略智能设备接口模块。同时,该语音识别模块的麦克风还可为智能设备内置的麦克风,即:语音识别模块与智能设备共用一个麦克风。
本发明中,智能设备包括智能手机、导航仪、可视电话、会议终端、智能穿戴设备、智能家具设备等。本发明可语音操控的智能装置,作为外置的微型硬件单元,可形成非常小巧的结构形式;或者直接集成在智能设备的主板上,形成非常小的模块单元;本发明可语音操控的智能装置只要与智能设备连接后,就能进行语音命令识别,不需再操作智能设备,完全实现无接触操作。其不仅能实现有限集的本地语音识别,还能通过打开智能设备的语音识别引擎,实现语音在线识别功能。本发明一种可语音操控的智能装置可广泛应用于现有的智能设备上,可有效提高设备的智能化,提高用户体验,具有广阔的市场前景。
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (9)

1.一种可语音操控的智能装置,其特征在于,包括用于采集语音命令的麦克风、语音识别单元、双核CPU、用于存储对比命令的命令向量存储单元,其中,麦克风通过语音识别单元与双核CPU电连接,双核CPU与智能设备电连接,麦克风采集的语音命令和命令向量存储单元存储的对比命令传输至双核CPU并形成识别命令后,输送至智能设备来对其进行实时操控,电源管理模块可以在不使用时将装置调整为休眠状态。
2.如权利要求1所述的可语音操控的智能装置,其特征在于,所述智能设备内置有命令映射模块,该命令映射模块接收所述双核CPU的识别命令,并将识别命令映射成所述智能设备的操控。
3.如权利要求1所述的可语音操控的智能装置,其特征在于,存储预设有限集语音对比命令的所述命令向量存储单元形成本地语音识别存储单元。
4.如权利要求2所述的可语音操控的智能装置,其特征在于,所述命令映射模块控制所述智能设备的语音识别引擎单元,反馈连接至所述双核CPU,形成在线语音识别单元。
5.如权利要求1所述的可语音操控的智能装置,其特征在于,所述麦克风、音频模块、双核CPU和命令向量存储单元集成为语音识别模块,该语音识别模块直接集成设置于所述智能设备的主板上。
6.如权利要求5所述的可语音操控的智能装置,其特征在于,所述麦克风为所述智能设备内置的麦克风,所述语音识别模块与所述智能设备共用一个麦克风。
7.如权利要求1所述的可语音操控的智能装置,其特征在于,所述麦克风、双核CPU和命令向量存储单元设置为外置的微型硬件单元,该微型硬件单元上还设置有与所述智能设备连接的智能设备接口模块。
8.如权利要求7所述的可语音操控的智能装置,其特征在于,所述智能设备接口模块包括USB连接口、耳机插孔连接口、蓝牙连接模块。
9.如权利要求1所述的可语音操控的智能装置,其特征在于,所述智能设备包括智能手机、导航仪、可视电话、会议终端、智能穿戴设备、智能家具设备。
CN201610696393.3A 2016-08-19 2016-08-19 一种可语音操控的智能装置 Pending CN106328136A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610696393.3A CN106328136A (zh) 2016-08-19 2016-08-19 一种可语音操控的智能装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610696393.3A CN106328136A (zh) 2016-08-19 2016-08-19 一种可语音操控的智能装置

Publications (1)

Publication Number Publication Date
CN106328136A true CN106328136A (zh) 2017-01-11

Family

ID=57741075

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610696393.3A Pending CN106328136A (zh) 2016-08-19 2016-08-19 一种可语音操控的智能装置

Country Status (1)

Country Link
CN (1) CN106328136A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112133301A (zh) * 2020-08-21 2020-12-25 深圳数联天下智能科技有限公司 一种语音识别方法、控制装置、语音识别电路及家居设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103456298A (zh) * 2012-06-04 2013-12-18 三星电子株式会社 提供语音识别服务的方法及其电子装置
CN103959374A (zh) * 2011-11-17 2014-07-30 环球电子有限公司 用于控制装置的声控配置的系统和方法
CN204332356U (zh) * 2014-12-30 2015-05-13 杭州微纳科技有限公司 一种语音命令识别装置
CN105513594A (zh) * 2015-11-26 2016-04-20 许传平 语音操控系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103959374A (zh) * 2011-11-17 2014-07-30 环球电子有限公司 用于控制装置的声控配置的系统和方法
CN103456298A (zh) * 2012-06-04 2013-12-18 三星电子株式会社 提供语音识别服务的方法及其电子装置
CN204332356U (zh) * 2014-12-30 2015-05-13 杭州微纳科技有限公司 一种语音命令识别装置
CN105513594A (zh) * 2015-11-26 2016-04-20 许传平 语音操控系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112133301A (zh) * 2020-08-21 2020-12-25 深圳数联天下智能科技有限公司 一种语音识别方法、控制装置、语音识别电路及家居设备

Similar Documents

Publication Publication Date Title
CN208689384U (zh) 一种带具有语音交互功能耳机的智能手表
CN108564949A (zh) 一种tws耳机、腕带式ai语音交互装置及系统
CN107506353B (zh) 翻译盒子和翻译系统
CN204332356U (zh) 一种语音命令识别装置
CN105163234B (zh) 一种自拍杆的适配方法、装置及相应移动设备
CN108665899A (zh) 一种语音交互系统及语音交互方法
CN102594988A (zh) 一种实现蓝牙耳机语音识别自动配对连接的方法及系统
CN203279119U (zh) 基于运动传感器的无线耳机
CN105491216A (zh) 来电处理方法、装置及终端
CN204761690U (zh) 耳机电路
KR20200072196A (ko) 오디오 개선을 지원하는 전자 장치 및 이를 위한 방법
CN202713296U (zh) 多媒体设备、多媒体传输与播放系统及电话会议系统
CN206672078U (zh) 一种具备语音控制功能的声卡
CN106328136A (zh) 一种可语音操控的智能装置
CN202590338U (zh) 一种带有语音功能的手柄
CN105407445A (zh) 一种连接方法及第一电子设备
CN208538475U (zh) 一种智能机器人
CN106803849B (zh) 一种基于穿戴设备的通话控制方法及穿戴设备
CN109121123A (zh) 信息处理方法及相关产品
CN102638598A (zh) 语音信号的处理方法和装置以及移动终端
CN209517430U (zh) 翻译机拾音扩展装置、传译系统以及麦克风阵列底座
CN209517115U (zh) 5g智能手表
CN112788175A (zh) 一种机器翻译方法及机器翻译装置
CN203387659U (zh) 多功能音响控制电路
CN110351690B (zh) 一种智能语音系统及其语音处理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170111