CN108510980A - 一种可学习的语音识别控制方法 - Google Patents

一种可学习的语音识别控制方法 Download PDF

Info

Publication number
CN108510980A
CN108510980A CN201810189287.5A CN201810189287A CN108510980A CN 108510980 A CN108510980 A CN 108510980A CN 201810189287 A CN201810189287 A CN 201810189287A CN 108510980 A CN108510980 A CN 108510980A
Authority
CN
China
Prior art keywords
phoneme
sound
acquisition
voice
extraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810189287.5A
Other languages
English (en)
Inventor
胡吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Xu Kang Technology Co Ltd
Original Assignee
Shenzhen Xu Kang Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Xu Kang Technology Co Ltd filed Critical Shenzhen Xu Kang Technology Co Ltd
Priority to CN201810189287.5A priority Critical patent/CN108510980A/zh
Publication of CN108510980A publication Critical patent/CN108510980A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

一种可学习的语音识别控制方法,本发明涉及智能家居语音控制技术领域;一号训练阶段通过语音录入,并对录入的语音数据进行特征提取,将提取的特征数据与机器学习音素相匹配,同时将字典结合机器学习音素相匹配,形成声学模型;二号训练阶段通过文本数据的输入,对语法进行提取,再将提取的语法生成语言模型;识别阶段首先对采集的声音进行音素的特征提取,并将提取的特征音素与一号训练阶段中的声学模型和二号训练阶段中的语言模型相结合,采用统计模型与匹配模型算法相结合依次进行音素匹配、字典配对以及语法配对,最后将匹配的结果整理输出。在现有家电的开关组上添加语言识别功能,用于实现对家电的声音控制,扩大其使用范围,实用性更强。

Description

一种可学习的语音识别控制方法
技术领域
本发明涉及智能家居语音控制技术领域,具体涉及一种可学习的语音识别控制方法。
背景技术
智能家居是在物联网的影响之下物联化体现。智能家居通过物联网技术将家中的各种设备(如音视频设备、照明系统、窗帘控制、空调控制、安防系统、数字影院系统、网络家电以及三表抄送等)连接到一起,提供家电控制、照明控制、窗帘控制、电话远程控制、室内外遥控、防盗报警、环境监测、暖通控制、红外转发以及可编程定时控制等多种功能和手段。与普通家居相比,智能家居不仅具有传统的居住功能,兼备建筑、网络通信、信息家电、设备自动化,集系统、结构、服务、管理为一体的高效、舒适、安全、便利、环保的居住环境,提供全方位的信息交互功能,帮助家庭与外部保持信息交流畅通,优化人们的生活方式,帮助人们有效安排时间,增强家居生活的安全性,甚至为各种能源费用节约资金。
现有的家电控制大多采用机械开关,需要人工现场控制,使用条件收到局限,亟待改进。
发明内容
本发明的目的在于针对现有技术的缺陷和不足,提供一种结构简单,设计合理、使用方便的可学习的语音识别控制方法,在现有家电的开关组上添加语言识别功能,用于实现对家电的声音控制,扩大其使用范围,实用性更强。
为实现上述目的,本发明采用的技术方案是:它包含一号训练阶段、二号训练阶段和识别阶段,其中一号训练阶段通过语音录入,并对录入的语音数据进行特征提取,将提取的特征数据与机器学习音素相匹配,同时将字典结合机器学习音素相匹配,形成声学模型;其中二号训练阶段通过文本数据的输入,对语法进行提取,再将提取的语法生成语言模型;所述的识别阶段首先对采集的声音进行音素的特征提取,并将提取的特征音素与一号训练阶段中的声学模型和二号训练阶段中的语言模型相结合,采用统计模型与匹配模型算法相结合依次进行音素匹配、字典配对以及语法配对,最后将匹配的结果整理输出,即可。
进一步地,所述的识别阶段对采集的声音进行音素的特征提取,其中采集的声音包含对带DSP声音的采集以及和不带DSP声音的采集,其中,对带DSP声音的采集的流程如下:带DSP声音采集→ADC→运放→降噪→回声消除AEC→远场放大和唤醒→语音激活检测AVD→识别阶段;其中,对不带DSP声音的采集的采集的流程如下:不带DSP声音采集→ADC→运放→降噪→回声消除AEC→语音激活检测AVD→识别阶段。
采用上述方法后,本发明有益效果为:本发明所述的一种可学习的语音识别控制方法,在现有家电的开关组上添加语言识别功能,用于实现对家电的声音控制,扩大其使用范围,实用性更强,本发明具有结构简单,设置合理,制作成本低等优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的流程框图。
图2是实施例的流程框图。
具体实施方式
下面结合附图对本发明作进一步的说明。
参看如图1所示,本具体实施方式采用的技术方案是:它包含一号训练阶段、二号训练阶段和识别阶段,其中一号训练阶段通过语音录入,并对录入的语音数据进行特征提取,将提取的特征数据与机器学习音素相匹配,同时将字典结合机器学习音素相匹配,形成声学模型;其中二号训练阶段通过文本数据的输入,对语法进行提取,再将提取的语法生成语言模型;所述的识别阶段首先对声音进行采集,将采集的声音进行音素的特征提取,并将提取的特征音素与一号训练阶段中的声学模型和二号训练阶段中的语言模型相结合,采用统计模型与匹配模型算法相结合依次进行音素匹配、字典配对以及语法配对,最后将匹配的结果整理输出,即可。
进一步地,所述的识别阶段对采集的声音进行音素的特征提取,其中采集的声音包含对带DSP声音的采集以及和不带DSP声音的采集,其中,对带DSP声音的采集的流程如下:带DSP声音采集→ADC→运放→降噪→回声消除AEC→远场放大和唤醒→语音激活检测AVD→识别阶段;其中,对不带DSP声音的采集的采集的流程如下:不带DSP声音采集→ADC→运放→降噪→回声消除AEC→语音激活检测AVD→识别阶段。
采用上述方法后,本具体实施方式有益效果为:本具体实施方式所述的一种可学习的语音识别控制方法,在现有家电的开关组上添加语言识别功能,用于实现对家电的声音控制,扩大其使用范围,实用性更强,本发明具有结构简单,设置合理,制作成本低等优点。
实施例:
参看图2,本实施例中首先对在一号训练阶段和二号训练阶段进行声学模型和语言模型的建立,再对声音进行采集,再利用语音识别模组对采集的声音进行预处理,预处理后的声音被语音激活检测模块激活检测之后进入识别阶段,在识别阶段中,采用统计模型与匹配模型算法相结合依次进行音素匹配、字典配对以及语法配对,最后将匹配的结果整理输出至调用URT接口,从而实现对智能开关组(PLC开关组)的控制。
以上所述,仅用以说明本发明的技术方案而非限制,本领域普通技术人员对本发明的技术方案所做的其它修改或者等同替换,只要不脱离本发明技术方案的精神和范围,均应涵盖在本发明的权利要求范围当中。

Claims (2)

1.一种可学习的语音识别控制方法,其特征在于:它包含一号训练阶段、二号训练阶段和识别阶段,其中一号训练阶段通过语音录入,并对录入的语音数据进行特征提取,将提取的特征数据与机器学习音素相匹配,同时将字典结合机器学习音素相匹配,形成声学模型;其中二号训练阶段通过文本数据的输入,对语法进行提取,再将提取的语法生成语言模型;所述的识别阶段首先对采集的声音进行音素的特征提取,并将提取的特征音素与一号训练阶段中的声学模型和二号训练阶段中的语言模型相结合,采用统计模型与匹配模型算法相结合依次进行音素匹配、字典配对以及语法配对,最后将匹配的结果整理输出,即可。
2.根据权利要求1所述的一种可学习的语音识别控制方法,其特征在于:所述的识别阶段对采集的声音进行音素的特征提取,其中采集的声音包含对带DSP声音的采集以及和不带DSP声音的采集,其中,对带DSP声音的采集的流程如下:带DSP声音采集→ADC→运放→降噪→回声消除AEC→远场放大和唤醒→语音激活检测AVD→识别阶段;其中,对不带DSP声音的采集的采集的流程如下:不带DSP声音采集→ADC→运放→降噪→回声消除AEC→语音激活检测AVD→识别阶段。
CN201810189287.5A 2018-03-08 2018-03-08 一种可学习的语音识别控制方法 Pending CN108510980A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810189287.5A CN108510980A (zh) 2018-03-08 2018-03-08 一种可学习的语音识别控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810189287.5A CN108510980A (zh) 2018-03-08 2018-03-08 一种可学习的语音识别控制方法

Publications (1)

Publication Number Publication Date
CN108510980A true CN108510980A (zh) 2018-09-07

Family

ID=63377386

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810189287.5A Pending CN108510980A (zh) 2018-03-08 2018-03-08 一种可学习的语音识别控制方法

Country Status (1)

Country Link
CN (1) CN108510980A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110060664A (zh) * 2019-05-13 2019-07-26 杨柳 一种智能家居语音控制系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201589951U (zh) * 2009-09-25 2010-09-22 南京信息工程大学 具有语音识别功能的插座式电源开关
CN105609104A (zh) * 2016-01-22 2016-05-25 北京云知声信息技术有限公司 一种信息处理方法、装置及智能语音路由控制器
CN106328122A (zh) * 2016-08-19 2017-01-11 深圳市唯特视科技有限公司 一种利用长短期记忆模型递归神经网络的语音识别方法
CN107195296A (zh) * 2016-03-15 2017-09-22 阿里巴巴集团控股有限公司 一种语音识别方法、装置、终端及系统
CN206976006U (zh) * 2017-03-08 2018-02-06 深圳旭康科技有限公司 一种语音控制的智能开关

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN201589951U (zh) * 2009-09-25 2010-09-22 南京信息工程大学 具有语音识别功能的插座式电源开关
CN105609104A (zh) * 2016-01-22 2016-05-25 北京云知声信息技术有限公司 一种信息处理方法、装置及智能语音路由控制器
CN107195296A (zh) * 2016-03-15 2017-09-22 阿里巴巴集团控股有限公司 一种语音识别方法、装置、终端及系统
CN106328122A (zh) * 2016-08-19 2017-01-11 深圳市唯特视科技有限公司 一种利用长短期记忆模型递归神经网络的语音识别方法
CN206976006U (zh) * 2017-03-08 2018-02-06 深圳旭康科技有限公司 一种语音控制的智能开关

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110060664A (zh) * 2019-05-13 2019-07-26 杨柳 一种智能家居语音控制系统

Similar Documents

Publication Publication Date Title
CN108306797A (zh) 声控智能家居设备方法、系统、终端以及存储介质
CN106249614A (zh) 智能终端、智能家居系统、语音识别方法及下单方法
CN108388225A (zh) 智能家居语音交互智能终端
CN102183075A (zh) 具有自定义声控功能的空调器的声音控制器
CN109377992A (zh) 基于无线通信的全空间语音交互物联网控制系统及方法
CN105182763A (zh) 一种基于语音识别的智能遥控器及实现方法
CN108156705A (zh) 一种智能语音灯光控制系统
CN205487330U (zh) 一种基于语音阵列的控制器
CN207742924U (zh) 基于智能语音控制的遥控器
CN110164436A (zh) 便携式多点智能语音控制家居的系统及方法
CN108833229B (zh) 一种语音识别功能的智能家居控制系统
CN107015481A (zh) 一种带语音身份认证的智能声控窗帘系统
CN205377906U (zh) 一种智能家居语音控制主机
CN206057845U (zh) 智能终端、智能家居系统
CN201408365Y (zh) 智能家居声控装置
CN107068151A (zh) 一种语音识别与语音控制装置
CN201408366Y (zh) 智能家居声控装置
CN108510980A (zh) 一种可学习的语音识别控制方法
CN204697289U (zh) 基于麦克风的声源识别系统及智能家电设备
CN106125566A (zh) 一种家居背景音乐控制系统
WO2018023514A1 (zh) 一种家居背景音乐控制系统
CN106019977A (zh) 一种手势及情感识别家居控制系统
CN211699711U (zh) 一种ai智能机器人自然语言处理系统
WO2018023518A1 (zh) 一种语音交互识别智能终端
CN210265228U (zh) 一种基于ai语音芯片的风扇控制器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180907