CN108510980A - 一种可学习的语音识别控制方法 - Google Patents
一种可学习的语音识别控制方法 Download PDFInfo
- Publication number
- CN108510980A CN108510980A CN201810189287.5A CN201810189287A CN108510980A CN 108510980 A CN108510980 A CN 108510980A CN 201810189287 A CN201810189287 A CN 201810189287A CN 108510980 A CN108510980 A CN 108510980A
- Authority
- CN
- China
- Prior art keywords
- phoneme
- sound
- acquisition
- voice
- extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 12
- 238000012549 training Methods 0.000 claims abstract description 22
- 238000000605 extraction Methods 0.000 claims abstract description 20
- 230000001149 cognitive effect Effects 0.000 claims abstract description 16
- 238000010801 machine learning Methods 0.000 claims abstract description 8
- 238000013179 statistical model Methods 0.000 claims abstract description 5
- 230000004913 activation Effects 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 5
- 230000009467 reduction Effects 0.000 claims description 5
- 238000001574 biopsy Methods 0.000 claims 1
- 230000006870 function Effects 0.000 abstract description 7
- 238000005516 engineering process Methods 0.000 abstract description 6
- 230000003321 amplification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000004378 air conditioning Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
一种可学习的语音识别控制方法,本发明涉及智能家居语音控制技术领域;一号训练阶段通过语音录入,并对录入的语音数据进行特征提取,将提取的特征数据与机器学习音素相匹配,同时将字典结合机器学习音素相匹配,形成声学模型;二号训练阶段通过文本数据的输入,对语法进行提取,再将提取的语法生成语言模型;识别阶段首先对采集的声音进行音素的特征提取,并将提取的特征音素与一号训练阶段中的声学模型和二号训练阶段中的语言模型相结合,采用统计模型与匹配模型算法相结合依次进行音素匹配、字典配对以及语法配对,最后将匹配的结果整理输出。在现有家电的开关组上添加语言识别功能,用于实现对家电的声音控制,扩大其使用范围,实用性更强。
Description
技术领域
本发明涉及智能家居语音控制技术领域,具体涉及一种可学习的语音识别控制方法。
背景技术
智能家居是在物联网的影响之下物联化体现。智能家居通过物联网技术将家中的各种设备(如音视频设备、照明系统、窗帘控制、空调控制、安防系统、数字影院系统、网络家电以及三表抄送等)连接到一起,提供家电控制、照明控制、窗帘控制、电话远程控制、室内外遥控、防盗报警、环境监测、暖通控制、红外转发以及可编程定时控制等多种功能和手段。与普通家居相比,智能家居不仅具有传统的居住功能,兼备建筑、网络通信、信息家电、设备自动化,集系统、结构、服务、管理为一体的高效、舒适、安全、便利、环保的居住环境,提供全方位的信息交互功能,帮助家庭与外部保持信息交流畅通,优化人们的生活方式,帮助人们有效安排时间,增强家居生活的安全性,甚至为各种能源费用节约资金。
现有的家电控制大多采用机械开关,需要人工现场控制,使用条件收到局限,亟待改进。
发明内容
本发明的目的在于针对现有技术的缺陷和不足,提供一种结构简单,设计合理、使用方便的可学习的语音识别控制方法,在现有家电的开关组上添加语言识别功能,用于实现对家电的声音控制,扩大其使用范围,实用性更强。
为实现上述目的,本发明采用的技术方案是:它包含一号训练阶段、二号训练阶段和识别阶段,其中一号训练阶段通过语音录入,并对录入的语音数据进行特征提取,将提取的特征数据与机器学习音素相匹配,同时将字典结合机器学习音素相匹配,形成声学模型;其中二号训练阶段通过文本数据的输入,对语法进行提取,再将提取的语法生成语言模型;所述的识别阶段首先对采集的声音进行音素的特征提取,并将提取的特征音素与一号训练阶段中的声学模型和二号训练阶段中的语言模型相结合,采用统计模型与匹配模型算法相结合依次进行音素匹配、字典配对以及语法配对,最后将匹配的结果整理输出,即可。
进一步地,所述的识别阶段对采集的声音进行音素的特征提取,其中采集的声音包含对带DSP声音的采集以及和不带DSP声音的采集,其中,对带DSP声音的采集的流程如下:带DSP声音采集→ADC→运放→降噪→回声消除AEC→远场放大和唤醒→语音激活检测AVD→识别阶段;其中,对不带DSP声音的采集的采集的流程如下:不带DSP声音采集→ADC→运放→降噪→回声消除AEC→语音激活检测AVD→识别阶段。
采用上述方法后,本发明有益效果为:本发明所述的一种可学习的语音识别控制方法,在现有家电的开关组上添加语言识别功能,用于实现对家电的声音控制,扩大其使用范围,实用性更强,本发明具有结构简单,设置合理,制作成本低等优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的流程框图。
图2是实施例的流程框图。
具体实施方式
下面结合附图对本发明作进一步的说明。
参看如图1所示,本具体实施方式采用的技术方案是:它包含一号训练阶段、二号训练阶段和识别阶段,其中一号训练阶段通过语音录入,并对录入的语音数据进行特征提取,将提取的特征数据与机器学习音素相匹配,同时将字典结合机器学习音素相匹配,形成声学模型;其中二号训练阶段通过文本数据的输入,对语法进行提取,再将提取的语法生成语言模型;所述的识别阶段首先对声音进行采集,将采集的声音进行音素的特征提取,并将提取的特征音素与一号训练阶段中的声学模型和二号训练阶段中的语言模型相结合,采用统计模型与匹配模型算法相结合依次进行音素匹配、字典配对以及语法配对,最后将匹配的结果整理输出,即可。
进一步地,所述的识别阶段对采集的声音进行音素的特征提取,其中采集的声音包含对带DSP声音的采集以及和不带DSP声音的采集,其中,对带DSP声音的采集的流程如下:带DSP声音采集→ADC→运放→降噪→回声消除AEC→远场放大和唤醒→语音激活检测AVD→识别阶段;其中,对不带DSP声音的采集的采集的流程如下:不带DSP声音采集→ADC→运放→降噪→回声消除AEC→语音激活检测AVD→识别阶段。
采用上述方法后,本具体实施方式有益效果为:本具体实施方式所述的一种可学习的语音识别控制方法,在现有家电的开关组上添加语言识别功能,用于实现对家电的声音控制,扩大其使用范围,实用性更强,本发明具有结构简单,设置合理,制作成本低等优点。
实施例:
参看图2,本实施例中首先对在一号训练阶段和二号训练阶段进行声学模型和语言模型的建立,再对声音进行采集,再利用语音识别模组对采集的声音进行预处理,预处理后的声音被语音激活检测模块激活检测之后进入识别阶段,在识别阶段中,采用统计模型与匹配模型算法相结合依次进行音素匹配、字典配对以及语法配对,最后将匹配的结果整理输出至调用URT接口,从而实现对智能开关组(PLC开关组)的控制。
以上所述,仅用以说明本发明的技术方案而非限制,本领域普通技术人员对本发明的技术方案所做的其它修改或者等同替换,只要不脱离本发明技术方案的精神和范围,均应涵盖在本发明的权利要求范围当中。
Claims (2)
1.一种可学习的语音识别控制方法,其特征在于:它包含一号训练阶段、二号训练阶段和识别阶段,其中一号训练阶段通过语音录入,并对录入的语音数据进行特征提取,将提取的特征数据与机器学习音素相匹配,同时将字典结合机器学习音素相匹配,形成声学模型;其中二号训练阶段通过文本数据的输入,对语法进行提取,再将提取的语法生成语言模型;所述的识别阶段首先对采集的声音进行音素的特征提取,并将提取的特征音素与一号训练阶段中的声学模型和二号训练阶段中的语言模型相结合,采用统计模型与匹配模型算法相结合依次进行音素匹配、字典配对以及语法配对,最后将匹配的结果整理输出,即可。
2.根据权利要求1所述的一种可学习的语音识别控制方法,其特征在于:所述的识别阶段对采集的声音进行音素的特征提取,其中采集的声音包含对带DSP声音的采集以及和不带DSP声音的采集,其中,对带DSP声音的采集的流程如下:带DSP声音采集→ADC→运放→降噪→回声消除AEC→远场放大和唤醒→语音激活检测AVD→识别阶段;其中,对不带DSP声音的采集的采集的流程如下:不带DSP声音采集→ADC→运放→降噪→回声消除AEC→语音激活检测AVD→识别阶段。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810189287.5A CN108510980A (zh) | 2018-03-08 | 2018-03-08 | 一种可学习的语音识别控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810189287.5A CN108510980A (zh) | 2018-03-08 | 2018-03-08 | 一种可学习的语音识别控制方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108510980A true CN108510980A (zh) | 2018-09-07 |
Family
ID=63377386
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810189287.5A Pending CN108510980A (zh) | 2018-03-08 | 2018-03-08 | 一种可学习的语音识别控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108510980A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110060664A (zh) * | 2019-05-13 | 2019-07-26 | 杨柳 | 一种智能家居语音控制系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN201589951U (zh) * | 2009-09-25 | 2010-09-22 | 南京信息工程大学 | 具有语音识别功能的插座式电源开关 |
CN105609104A (zh) * | 2016-01-22 | 2016-05-25 | 北京云知声信息技术有限公司 | 一种信息处理方法、装置及智能语音路由控制器 |
CN106328122A (zh) * | 2016-08-19 | 2017-01-11 | 深圳市唯特视科技有限公司 | 一种利用长短期记忆模型递归神经网络的语音识别方法 |
CN107195296A (zh) * | 2016-03-15 | 2017-09-22 | 阿里巴巴集团控股有限公司 | 一种语音识别方法、装置、终端及系统 |
CN206976006U (zh) * | 2017-03-08 | 2018-02-06 | 深圳旭康科技有限公司 | 一种语音控制的智能开关 |
-
2018
- 2018-03-08 CN CN201810189287.5A patent/CN108510980A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN201589951U (zh) * | 2009-09-25 | 2010-09-22 | 南京信息工程大学 | 具有语音识别功能的插座式电源开关 |
CN105609104A (zh) * | 2016-01-22 | 2016-05-25 | 北京云知声信息技术有限公司 | 一种信息处理方法、装置及智能语音路由控制器 |
CN107195296A (zh) * | 2016-03-15 | 2017-09-22 | 阿里巴巴集团控股有限公司 | 一种语音识别方法、装置、终端及系统 |
CN106328122A (zh) * | 2016-08-19 | 2017-01-11 | 深圳市唯特视科技有限公司 | 一种利用长短期记忆模型递归神经网络的语音识别方法 |
CN206976006U (zh) * | 2017-03-08 | 2018-02-06 | 深圳旭康科技有限公司 | 一种语音控制的智能开关 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110060664A (zh) * | 2019-05-13 | 2019-07-26 | 杨柳 | 一种智能家居语音控制系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108306797A (zh) | 声控智能家居设备方法、系统、终端以及存储介质 | |
CN106249614A (zh) | 智能终端、智能家居系统、语音识别方法及下单方法 | |
CN108388225A (zh) | 智能家居语音交互智能终端 | |
CN102183075A (zh) | 具有自定义声控功能的空调器的声音控制器 | |
CN109377992A (zh) | 基于无线通信的全空间语音交互物联网控制系统及方法 | |
CN105182763A (zh) | 一种基于语音识别的智能遥控器及实现方法 | |
CN108156705A (zh) | 一种智能语音灯光控制系统 | |
CN205487330U (zh) | 一种基于语音阵列的控制器 | |
CN207742924U (zh) | 基于智能语音控制的遥控器 | |
CN110164436A (zh) | 便携式多点智能语音控制家居的系统及方法 | |
CN108833229B (zh) | 一种语音识别功能的智能家居控制系统 | |
CN107015481A (zh) | 一种带语音身份认证的智能声控窗帘系统 | |
CN205377906U (zh) | 一种智能家居语音控制主机 | |
CN206057845U (zh) | 智能终端、智能家居系统 | |
CN201408365Y (zh) | 智能家居声控装置 | |
CN107068151A (zh) | 一种语音识别与语音控制装置 | |
CN201408366Y (zh) | 智能家居声控装置 | |
CN108510980A (zh) | 一种可学习的语音识别控制方法 | |
CN204697289U (zh) | 基于麦克风的声源识别系统及智能家电设备 | |
CN106125566A (zh) | 一种家居背景音乐控制系统 | |
WO2018023514A1 (zh) | 一种家居背景音乐控制系统 | |
CN106019977A (zh) | 一种手势及情感识别家居控制系统 | |
CN211699711U (zh) | 一种ai智能机器人自然语言处理系统 | |
WO2018023518A1 (zh) | 一种语音交互识别智能终端 | |
CN210265228U (zh) | 一种基于ai语音芯片的风扇控制器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180907 |