CN107945794A - 一种声纹识别与控制的装置 - Google Patents
一种声纹识别与控制的装置 Download PDFInfo
- Publication number
- CN107945794A CN107945794A CN201711221065.9A CN201711221065A CN107945794A CN 107945794 A CN107945794 A CN 107945794A CN 201711221065 A CN201711221065 A CN 201711221065A CN 107945794 A CN107945794 A CN 107945794A
- Authority
- CN
- China
- Prior art keywords
- control
- module
- application
- sound
- voiceprint recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000006870 function Effects 0.000 claims description 8
- 238000012905 input function Methods 0.000 claims description 3
- 230000002618 waking effect Effects 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000004378 air conditioning Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明提供一种声纹识别与控制的装置,包括声音采集装置、数据服务器、控制装置、程序设置模块并通过互联网实现数据连接;本发明通过声音采集模块使声音生成指令发送到控制装置控制电器或返馈预设信号,通过数据服务器和程序设置模块对声音采集装置、数据服务器、控制装置进行系统设置与调试,声音产品实体与控制程序分体生产和设置,使语音识别产品兼容性好、设置操作简单,适用性广、可操作性强。
Description
技术领域
本发明涉及计算机程序领域,尤其涉及一种声纹识别与控制的装置。
背景技术
智能家居是在互联网影响之下物联化的体现。智能家居通过物联网技术将家中的各种设备(如音视频设备、照明系统、窗帘控制、空调控制、安防系统、数字影院系统、影音服务器、影柜系统、网络家电等)连接到一起,提供家电控制、照明控制、电话远程控制、室内外遥控、防盗报警、环境监测、暖通控制、红外转发以及可编程定时控制等多种功能和手段。与普通家居相比,智能家居不仅具有传统的居住功能,兼备建筑、网络通信、信息家电、设备自动化,提供全方位的信息交互功能,甚至为各种能源费用节约资金。
语言和声音作为人与人之间最常用和最便利的方式,如果能应用到人机交互中,那将会大大提高用户体验,效率及安全性。 语音识别经过几十年的坎坷发展,到如今已经初步达到可应用的水平,从降噪到识别到语义解析都达到一个空前的高水平。
但是在应用界还并没有非常的普及,出现的产品也还远远没有达到完全“解放双手”的目的,从开发上讲,效率和成本都是非常的高,而且目前很多企业应用的方案可维护和可扩展性很差,一旦有需求的变更,则会对开发者造成非常大的困扰 ;从产品上讲,出现的一些语音识别的平台,将会造成语音产品同质化严重的情况,不利于该行业的发展。 现在的语音产品开发方案存在着很多问题,诸如效率低,灵活性差,产品体验不够好,产品同质化严重等问题,很多企业为了想做语音识别产品而没有好的方案,最后仅只投入了根据识别文字匹配字符串的功能。
发明内容
本发明的目的是为智能家居产品实现语音操作功能,本发明提供一种声纹识别与控制的装置,其包括声音采集装置、数据服务器、控制装置、程序设置模块并通过互联网实现数据连接;
所述的声音采集装置用于采集和处理声音信息;
所述的数据服务器用于存储和读取数据库数据信息;
所述的控制装置用于接收指令并按预设的指令规则执行指令;
所述的程序设置模块用于调试设置声音采集装置、数据服务器、控制装置,至少预设一种唤醒录音方式,可以通过唤醒词唤醒、硬件按钮唤醒或者软件按钮唤醒。
其中,所述的采集装置包括声音采集模块、语音识别模块、语义解析模块;所述的声音采集模块指的是能够支持声音录入功能,将声音采集为数字数据,即配备麦克风或者可以提供相同功能的其他设备 ;所述的语音识别模块将声音数据转化为文本数据;所述的语义解析模块通过预设的语义解析规则生成指令。
其中,所述的控制装置包括指令接收模块、指令管理模块、信息返馈模块。
其中,所述的信息返馈模块包括语音信息输出、数字信息输出、操作信号输出。
其中,所述的程序设置模块可以通过电脑或手机APP网络连接对声音采集装置、数据服务器、控制装置进行系统设置与调试。
本发明的有益效果是通过一种声纹识别与控制的装置,使语音识别产品兼容性好、设置操作简单,适用性广、可操作性强。
附图说明
图1,一种声纹识别与控制的装置的结构示意图。
图2,一种声纹识别与控制的装置控制的流程示意图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步的描述。
本发明提出一种声纹识别与控制的装置,其包括声音采集装置(A1)、数据服务器(A2)、控制装置(A3)、程序设置模块(A4)并通过互联网实现数据连接;
所述的声音采集装置(A1)用于采集和处理声音信息;
所述的数据服务器(A2)用于存储和读取数据库数据信息;
所述的控制装置(A3)用于接收指令并按预设的指令规则执行指令;
所述的程序设置模块(A4)用于调试设置声音采集装置(A1)、数据服务器(A2)、控制装置(A3),至少预设一种唤醒录音方式,可以通过唤醒词唤醒、硬件按钮唤醒或者软件按钮唤醒。
其中,所述的采集装置(A1)包括声音采集模块(A101)、语音识别模块(A102)、语义解析模块(A103);所述的声音采集模块(A101)指的是能够支持声音录入功能,将声音采集为数字数据,即配备麦克风或者可以提供相同功能的其他设备 ;所述的语音识别模块(A102)将声音数据转化为文本数据;所述的语义解析模块(A103)通过预设的语义解析规则生成指令。
具体的,所述的控制装置(A3)包括指令接收模块(A301)、指令管理模块(A302)、信息返馈模块(A303)。
具体的,所述的信息返馈模块(A303)包括语音信息输出、数字信息输出、操作信号输出。
具体的,所述的程序设置模块(A4)可以通过电脑或手机APP网络连接对声音采集装置(A1)、数据服务器(A2)、控制装置(A3)进行系统设置与调试。
本发明的有益效果是通过一种声纹识别与控制的装置,使语音识别产品兼容性好、设置操作简单,适用性广、可操作性强。
最后需要说明的是,以上所述仅为本发明的较佳实施方式,而不是对本发明技术方案的限定,任何对本发明技术特征所做的等同替换或相应改进,仍在本发明的保护范围之内。
Claims (5)
1.一种声纹识别与控制的装置,其特征在于,其包括声音采集装置、数据服务器、控制装置、程序设置模块并通过互联网实现数据连接;
所述的声音采集装置用于采集和处理声音信息;
所述的数据服务器用于存储和读取数据库数据信息;
所述的控制装置用于接收指令并按预设的指令规则执行指令;
所述的程序设置模块用于调试设置声音采集装置、数据服务器、控制装置,至少预设一种唤醒录音方式,可以通过唤醒词唤醒、硬件按钮唤醒或者软件按钮唤醒。
2.根据权利要求1所述的一种声纹识别与控制的装置,其特征在于,所述的采集装置包括声音采集模块、语音识别模块、语义解析模块;所述的能够支持声音录入功能,所述的声音采集模块指的是将声音采集为数字数据,即配备麦克风或者可以提供相同功能的其他设备 ;所述的语音识别模块将声音数据转化为文本数据;所述的语义解析模块通过预设的语义解析规则生成指令。
3.根据权利要求1所述的一种声纹识别与控制的装置,其特征在于,所述的控制装置包括指令接收模块、指令管理模块、信息返馈模块。
4.根据权利要求3所述的一种声纹识别与控制的装置,其特征在于,所述的信息返馈模块包括语音信息输出、数字信息输出、操作信号输出。
5.根据权利要求1所述的一种声纹识别与控制的装置,其特征在于,所述的程序设置模块可以通过电脑或手机APP网络连接对声音采集装置、数据服务器、控制装置进行系统设置与调试。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711221065.9A CN107945794A (zh) | 2017-11-29 | 2017-11-29 | 一种声纹识别与控制的装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711221065.9A CN107945794A (zh) | 2017-11-29 | 2017-11-29 | 一种声纹识别与控制的装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107945794A true CN107945794A (zh) | 2018-04-20 |
Family
ID=61950468
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711221065.9A Pending CN107945794A (zh) | 2017-11-29 | 2017-11-29 | 一种声纹识别与控制的装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107945794A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112542156A (zh) * | 2020-12-08 | 2021-03-23 | 山东航空股份有限公司 | 基于声纹识别和语音指令控制的民航维修工卡系统 |
-
2017
- 2017-11-29 CN CN201711221065.9A patent/CN107945794A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112542156A (zh) * | 2020-12-08 | 2021-03-23 | 山东航空股份有限公司 | 基于声纹识别和语音指令控制的民航维修工卡系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103093755B (zh) | 基于终端及互联网语音交互的网络家电控制方法及系统 | |
CN106601248A (zh) | 一种基于分布式语音控制的智能家居系统 | |
JP6783339B2 (ja) | 音声を処理する方法及び装置 | |
CN104852957A (zh) | 面向物联网应用的智能家居服务系统 | |
CN110956963A (zh) | 一种基于可穿戴设备实现的交互方法及可穿戴设备 | |
CN103024630A (zh) | 一种第一电子设备的音量调节方法及第一电子设备 | |
CN105446146A (zh) | 基于语义分析的智能终端控制方法、系统及智能终端 | |
CN105182763A (zh) | 一种基于语音识别的智能遥控器及实现方法 | |
CN108364649A (zh) | 一种基于语音识别的智能监测家居系统 | |
CN104918088A (zh) | 一种基于语音控制的智能酒店客房电视系统 | |
CN104657104A (zh) | 一种面向pc的嵌入式非特定语音沟通系统 | |
CN204721518U (zh) | 一种基于语音控制的智能酒店管理系统 | |
CN108665900A (zh) | 云端唤醒方法及系统、终端以及计算机可读存储介质 | |
CN204117217U (zh) | 一种多重识别的网络型门禁系统 | |
Devi et al. | Smart home system using voice command with integration of esp8266 | |
CN107945794A (zh) | 一种声纹识别与控制的装置 | |
CN108375914A (zh) | 一种基于语音识别的智能家居控制系统 | |
WO2018023514A1 (zh) | 一种家居背景音乐控制系统 | |
CN207720161U (zh) | 一种基于语音控制的智能家居3d虚拟演示系统 | |
CN205647777U (zh) | 一种企业会议多媒体网络通讯架构 | |
CN106303075A (zh) | 一种基于移动终端的关闭闹铃的方法及移动终端 | |
Khunchai et al. | Development of application and face recognition for smart home | |
WO2018023518A1 (zh) | 一种语音交互识别智能终端 | |
CN107703769A (zh) | 门铃控制系统 | |
CN212519027U (zh) | 一种基于语音控制的智能家居系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20180420 |