CN111128173A - 基于语音识别技术的智能家居语音交互方法 - Google Patents
基于语音识别技术的智能家居语音交互方法 Download PDFInfo
- Publication number
- CN111128173A CN111128173A CN201911419244.2A CN201911419244A CN111128173A CN 111128173 A CN111128173 A CN 111128173A CN 201911419244 A CN201911419244 A CN 201911419244A CN 111128173 A CN111128173 A CN 111128173A
- Authority
- CN
- China
- Prior art keywords
- information
- input
- voice
- word
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 38
- 238000000034 method Methods 0.000 title claims abstract description 20
- 239000013598 vector Substances 0.000 claims abstract description 95
- 238000012545 processing Methods 0.000 claims abstract description 15
- 238000006243 chemical reaction Methods 0.000 claims abstract description 12
- 241001672694 Citrus reticulata Species 0.000 claims description 9
- 239000002245 particle Substances 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于语音识别技术的智能家居语音交互方法,该方法通过对智能家居的语音交互词库中的指令信息和用户语音输入信息按照词性进行分解成词向量;然后计算指令信息和输入信息之间的相关性,并根据相关性为用户提供相应的反馈信息;本申请能够对不能成功匹配的输入信息进行模糊音转换处理,然后再将经模糊音转换处理后的输入信息与指令信息进行匹配,能够提高方言语音信息的识别效率。
Description
技术领域
本发明涉及一种基于语音识别技术的智能家居语音交互方法。
背景技术
语音是人类最常用的交流方式,也是人类和计算机交流最渴望的方式。因此用语音同计算机交流也成为了最近研究的热点,计算机对语音的理解是计算机科学中的一个引人入胜的、富有挑战性的课题。
随着计算机技术的普及,当今人们的生活已经逐渐走入智能时代。不仅仅是电脑,手机,PAD,人们的衣食住行的方方面面都开始应用出现不久的智能技术,智能电视,智能导航,智能家居等等,智能技术将在人们生活的各个方面提供方便快捷的服务。然而,目前的智能家居语音交互在针对方言使用者的语音识别时语音识别效率非常低,严重影响了方案使用者的体验感。
发明内容
本发明的目的是提供一种基于语音识别技术的智能家居语音交互方法,以解决目前的智能家居语音交互在针对方言使用者的语音识别时语音识别效率低的问题。
为解决上述技术问题,本发明提供一种基于语音识别技术的智能家居语音交互方法,包括以下步骤:
S1:录入智能家居语音交互指令信息构建语音交互词库,并在语音交互词库中为各指令信息匹配相应的反馈信息;再将所述语音交互词库中的各条指令信息按照词性分类标准分别进行分词处理得到若干参考词向量,并对若干所述输入词向量按照其在指令信息中出现顺序进行依次顺序编号;
S2:采集现场语音信息,对采集到的所述现场语音信息进行特征提取,识别当前声音中是否包括注册用户的语音信息;若识别到注册用户的语音信息,则筛选出注册用户的语音信息作为输入信息,并对筛选出的输入信息进行放大处理得到放大后的输入信息;
S3:对步骤S2得到的输入信息进行标准化处理得到标准化语音输入信息,再将所述标准化语音输入信息按照词性分类标准进行分词处理得到若干输入词向量,并对若干所述输入词向量按照其在输入信息中出现顺序进行依次顺序编号;
S4:计算所述输入词向量与语音交互词库中的各条指令信息的若干参考词向量之间的最大相关系数,若计算出的最大相关系数大于阈值,则输出与最大相关系数多对应指令信息所对应的反馈信息;否则,对与参考词向量存在差异的输入词向量进行模糊音转换处理,并计算经转换处理的输入词向量与语音交互词库中的各条指令信息的若干参考词向量之间的最大模糊相关系数,若所述模糊相关系数大于阈值,则输出与最大模糊相关系数多对应指令信息所对应的反馈信息;否则,输出输入信息无效指令。
进一步地,步骤S1中,每条指令包括的若干参考词向量分别构成一段序列X,其中序列X可表示为:
其中,An为名词参考向量,Bv为动词参考向量,Ca为形容词参考向量,Dnum为数词参考向量,Epron为量词参考向量,Fcom为代词参考向量,Gemp为虚词参考向量。
进一步地,步骤S3中,输入信息包括的若干输入词向量分别构成一段序列Y,其中Y可表示为:
进一步地,所述步骤S2得到的输入信息进行标准化处理得到标准化语音输入信息的采用的具体方法包括:
S31:判断所述步骤S2得到的输入信息是否包括方言,若是,将输入信息中的方言转换成标准普通话后再将整段输入信息转成文字信息;否则,将输入信息直接转换成文字信息;
S32:判断所述标准普通话语言文字中是否包含外语信息,若是,则将标准普通话语言文字中的外语信息翻译成汉语后输出标准化语音输入信息;否则,直接将步骤S31中得到的文字信息作为标准化语音输入信息输出。
进一步地,计算所述输入词向量与语音交互词库中的各条指令信息的若干参考词向量之间的最大相关系数r1max(i)所采用的具体公式为:
其中,计算出的最大r1(i)即为最大相关系数r1max(i),i为序列X编号。
本发明的有益效果为:通过对智能家居的语音交互词库中的指令信息和用户语音输入信息按照词性进行分解成词向量;然后计算指令信息和输入信息之间的相关性,并根据相关性为用户提供相应的反馈信息;本申请能够对不能成功匹配的输入信息进行模糊音转换处理,然后再将经模糊音转换处理后的输入信息与指令信息进行匹配,能够提高方言语音信息的识别效率。
具体实施方式
一种基于语音识别技术的智能家居语音交互方法,包括以下步骤:
S1:录入智能家居语音交互指令信息构建语音交互词库,并在语音交互词库中为各指令信息匹配相应的反馈信息;再将所述语音交互词库中的各条指令信息按照词性分类标准分别进行分词处理得到若干参考词向量,并对若干所述输入词向量按照其在指令信息中出现顺序进行依次顺序编号;
S2:采集现场语音信息,对采集到的所述现场语音信息进行特征提取,识别当前声音中是否包括注册用户的语音信息;若识别到注册用户的语音信息,则筛选出注册用户的语音信息作为输入信息,并对筛选出的输入信息进行放大处理得到放大后的输入信息;
S3:对步骤S2得到的输入信息进行标准化处理得到标准化语音输入信息,再将所述标准化语音输入信息按照词性分类标准进行分词处理得到若干输入词向量,并对若干所述输入词向量按照其在输入信息中出现顺序进行依次顺序编号;
S4:计算所述输入词向量与语音交互词库中的各条指令信息的若干参考词向量之间的最大相关系数,若计算出的最大相关系数大于阈值,则输出与最大相关系数多对应指令信息所对应的反馈信息;否则,对与参考词向量存在差异的输入词向量进行模糊音转换处理,并计算经转换处理的输入词向量与语音交互词库中的各条指令信息的若干参考词向量之间的最大模糊相关系数,若所述模糊相关系数大于阈值,则输出与最大模糊相关系数多对应指令信息所对应的反馈信息;否则,输出输入信息无效指令。
本发明通过对语音交互词库中的指令信息和用户语音输入信息按照词性进行分解成词向量;然后计算指令信息和输入信息之间的相关性,并根据相关性为用户提供相应的反馈信息;本申请能够对不能成功匹配的输入信息进行模糊音转换处理,然后再将经模糊音转换处理后的输入信息与指令信息进行匹配,能够提高方言语音信息的识别效率。
根据本申请的一个实施例,步骤S1中,每条指令包括的若干参考词向量分别构成一段序列X,其中序列X可表示为:
其中,An为名词参考向量,Bv为动词参考向量,Ca为形容词参考向量,Dnum为数词参考向量,Epron为量词参考向量,Fcom为代词参考向量,Gemp为虚词参考向量。
根据本申请的一个实施例,步骤S3中,输入信息包括的若干输入词向量分别构成一段序列Y,其中Y可表示为:
根据本申请的一个实施例,所述步骤S2得到的输入信息进行标准化处理得到标准化语音输入信息的采用的具体方法包括:
S31:判断所述步骤S2得到的输入信息是否包括方言,若是,将输入信息中的方言转换成标准普通话后再将整段输入信息转成文字信息;否则,将输入信息直接转换成文字信息;
S32:判断所述标准普通话语言文字中是否包含外语信息,若是,则将标准普通话语言文字中的外语信息翻译成汉语后输出标准化语音输入信息;否则,直接将步骤S31中得到的文字信息作为标准化语音输入信息输出。
根据本申请的一个实施例,计算所述输入词向量与语音交互词库中的各条指令信息的若干参考词向量之间的最大相关系数r1max(i)所采用的具体公式为:
其中,计算出的最大r1(i)即为最大相关系数r1max(i),i为序列X编号。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (5)
1.一种基于语音识别的智能家居语音交互方法,其特征在于,包括以下步骤:
S1:录入智能家居语音交互指令信息构建语音交互词库,并在语音交互词库中为各指令信息匹配相应的反馈信息;再将所述语音交互词库中的各条指令信息按照词性分类标准分别进行分词处理得到若干参考词向量,并对若干所述输入词向量按照其在指令信息中出现顺序进行依次顺序编号;
S2:采集现场语音信息,对采集到的所述现场语音信息进行特征提取,识别当前声音中是否包括注册用户的语音信息;若识别到注册用户的语音信息,则筛选出注册用户的语音信息作为输入信息,并对筛选出的输入信息进行放大处理得到放大后的输入信息;
S3:对步骤S2得到的输入信息进行标准化处理得到标准化语音输入信息,再将所述标准化语音输入信息按照词性分类标准进行分词处理得到若干输入词向量,并对若干所述输入词向量按照其在输入信息中出现顺序进行依次顺序编号;
S4:计算所述输入词向量与语音交互词库中的各条指令信息的若干参考词向量之间的最大相关系数,若计算出的最大相关系数大于阈值,则输出与最大相关系数多对应指令信息所对应的反馈信息;否则,对与参考词向量存在差异的输入词向量进行模糊音转换处理,并计算经转换处理的输入词向量与语音交互词库中的各条指令信息的若干参考词向量之间的最大模糊相关系数,若所述模糊相关系数大于阈值,则输出与最大模糊相关系数多对应指令信息所对应的反馈信息;否则,输出输入信息无效指令。
4.根据权利要求3所述的基于语音识别技术的智能家居语音交互方法,其特征在于,所述步骤S2得到的输入信息进行标准化处理得到标准化语音输入信息的采用的具体方法包括:
S31:判断所述步骤S2得到的输入信息是否包括方言,若是,将输入信息中的方言转换成标准普通话后再将整段输入信息转成文字信息;否则,将输入信息直接转换成文字信息;
S32:判断所述标准普通话语言文字中是否包含外语信息,若是,则将标准普通话语言文字中的外语信息翻译成汉语后输出标准化语音输入信息;否则,直接将步骤S31中得到的文字信息作为标准化语音输入信息输出。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911419244.2A CN111128173A (zh) | 2019-12-31 | 2019-12-31 | 基于语音识别技术的智能家居语音交互方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911419244.2A CN111128173A (zh) | 2019-12-31 | 2019-12-31 | 基于语音识别技术的智能家居语音交互方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111128173A true CN111128173A (zh) | 2020-05-08 |
Family
ID=70507077
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911419244.2A Pending CN111128173A (zh) | 2019-12-31 | 2019-12-31 | 基于语音识别技术的智能家居语音交互方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111128173A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022000140A1 (zh) * | 2020-06-28 | 2022-01-06 | 北京来也网络科技有限公司 | 结合rpa和ai的疫情排查方法和装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106502979A (zh) * | 2016-09-20 | 2017-03-15 | 海信集团有限公司 | 一种自然语言信息的数据处理方法和装置 |
CN106776562A (zh) * | 2016-12-20 | 2017-05-31 | 上海智臻智能网络科技股份有限公司 | 一种关键词提取方法和提取系统 |
CN108121528A (zh) * | 2017-12-06 | 2018-06-05 | 深圳市欧瑞博科技有限公司 | 语音控制方法、装置、服务器和计算机可读存储介质 |
CN109215643A (zh) * | 2017-07-05 | 2019-01-15 | 阿里巴巴集团控股有限公司 | 一种交互方法、电子设备及服务器 |
CN110288972A (zh) * | 2019-08-07 | 2019-09-27 | 北京新唐思创教育科技有限公司 | 语音合成模型训练方法、语音合成方法及装置 |
-
2019
- 2019-12-31 CN CN201911419244.2A patent/CN111128173A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106502979A (zh) * | 2016-09-20 | 2017-03-15 | 海信集团有限公司 | 一种自然语言信息的数据处理方法和装置 |
CN106776562A (zh) * | 2016-12-20 | 2017-05-31 | 上海智臻智能网络科技股份有限公司 | 一种关键词提取方法和提取系统 |
CN109215643A (zh) * | 2017-07-05 | 2019-01-15 | 阿里巴巴集团控股有限公司 | 一种交互方法、电子设备及服务器 |
CN108121528A (zh) * | 2017-12-06 | 2018-06-05 | 深圳市欧瑞博科技有限公司 | 语音控制方法、装置、服务器和计算机可读存储介质 |
CN110288972A (zh) * | 2019-08-07 | 2019-09-27 | 北京新唐思创教育科技有限公司 | 语音合成模型训练方法、语音合成方法及装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022000140A1 (zh) * | 2020-06-28 | 2022-01-06 | 北京来也网络科技有限公司 | 结合rpa和ai的疫情排查方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020232861A1 (zh) | 命名实体识别方法、电子装置及存储介质 | |
CN103971675B (zh) | 自动语音识别方法和系统 | |
US9230547B2 (en) | Metadata extraction of non-transcribed video and audio streams | |
CN108038208B (zh) | 上下文信息识别模型的训练方法、装置和存储介质 | |
CN108536807B (zh) | 一种信息处理方法及装置 | |
CN111445898B (zh) | 语种识别方法、装置、电子设备和存储介质 | |
CN112487824B (zh) | 客服语音情感识别方法、装置、设备及存储介质 | |
Ishihara | A likelihood ratio-based evaluation of strength of authorship attribution evidence in SMS messages using N-grams. | |
CN101505328A (zh) | 应用语音识别的网络数据检索方法及其系统 | |
CN107526721A (zh) | 一种对电商产品评论词汇的歧义消除方法及装置 | |
CN112347339A (zh) | 一种搜索结果处理方法及装置 | |
CN115759071A (zh) | 基于大数据的政务敏感信息识别系统和方法 | |
Bigot et al. | Person name recognition in ASR outputs using continuous context models | |
CN111209367A (zh) | 信息查找方法、信息查找装置、电子设备及存储介质 | |
US7617182B2 (en) | Document clustering based on entity association rules | |
CN113761192B (zh) | 文本处理方法、文本处理装置及文本处理设备 | |
CN112836019B (zh) | 公共医疗卫生命名实体识别与实体链接方法、装置、电子设备及存储介质 | |
CN111128173A (zh) | 基于语音识别技术的智能家居语音交互方法 | |
CN113726942A (zh) | 一种智能电话接听方法、系统、介质及电子终端 | |
CN101576876B (zh) | 一种自动拆分英文复合词组的系统和方法 | |
KR102540665B1 (ko) | 한국어 언어 모델에 기반한 핵심문장 추출장치 및 그 방법 | |
Sohail et al. | Text classification in an under-resourced language via lexical normalization and feature pooling | |
CN111708872B (zh) | 对话方法、装置及电子设备 | |
CN111292741B (zh) | 智能语音交互机器人 | |
CN113111855A (zh) | 一种多模态情感识别方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200508 |
|
RJ01 | Rejection of invention patent application after publication |