CN111128173A - 基于语音识别技术的智能家居语音交互方法 - Google Patents

基于语音识别技术的智能家居语音交互方法 Download PDF

Info

Publication number
CN111128173A
CN111128173A CN201911419244.2A CN201911419244A CN111128173A CN 111128173 A CN111128173 A CN 111128173A CN 201911419244 A CN201911419244 A CN 201911419244A CN 111128173 A CN111128173 A CN 111128173A
Authority
CN
China
Prior art keywords
information
input
voice
word
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911419244.2A
Other languages
English (en)
Inventor
刘兵
田佳雯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Hounify Technology Co ltd
Original Assignee
Chongqing Hounify Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Hounify Technology Co ltd filed Critical Chongqing Hounify Technology Co ltd
Priority to CN201911419244.2A priority Critical patent/CN111128173A/zh
Publication of CN111128173A publication Critical patent/CN111128173A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于语音识别技术的智能家居语音交互方法,该方法通过对智能家居的语音交互词库中的指令信息和用户语音输入信息按照词性进行分解成词向量;然后计算指令信息和输入信息之间的相关性,并根据相关性为用户提供相应的反馈信息;本申请能够对不能成功匹配的输入信息进行模糊音转换处理,然后再将经模糊音转换处理后的输入信息与指令信息进行匹配,能够提高方言语音信息的识别效率。

Description

基于语音识别技术的智能家居语音交互方法
技术领域
本发明涉及一种基于语音识别技术的智能家居语音交互方法。
背景技术
语音是人类最常用的交流方式,也是人类和计算机交流最渴望的方式。因此用语音同计算机交流也成为了最近研究的热点,计算机对语音的理解是计算机科学中的一个引人入胜的、富有挑战性的课题。
随着计算机技术的普及,当今人们的生活已经逐渐走入智能时代。不仅仅是电脑,手机,PAD,人们的衣食住行的方方面面都开始应用出现不久的智能技术,智能电视,智能导航,智能家居等等,智能技术将在人们生活的各个方面提供方便快捷的服务。然而,目前的智能家居语音交互在针对方言使用者的语音识别时语音识别效率非常低,严重影响了方案使用者的体验感。
发明内容
本发明的目的是提供一种基于语音识别技术的智能家居语音交互方法,以解决目前的智能家居语音交互在针对方言使用者的语音识别时语音识别效率低的问题。
为解决上述技术问题,本发明提供一种基于语音识别技术的智能家居语音交互方法,包括以下步骤:
S1:录入智能家居语音交互指令信息构建语音交互词库,并在语音交互词库中为各指令信息匹配相应的反馈信息;再将所述语音交互词库中的各条指令信息按照词性分类标准分别进行分词处理得到若干参考词向量,并对若干所述输入词向量按照其在指令信息中出现顺序进行依次顺序编号;
S2:采集现场语音信息,对采集到的所述现场语音信息进行特征提取,识别当前声音中是否包括注册用户的语音信息;若识别到注册用户的语音信息,则筛选出注册用户的语音信息作为输入信息,并对筛选出的输入信息进行放大处理得到放大后的输入信息;
S3:对步骤S2得到的输入信息进行标准化处理得到标准化语音输入信息,再将所述标准化语音输入信息按照词性分类标准进行分词处理得到若干输入词向量,并对若干所述输入词向量按照其在输入信息中出现顺序进行依次顺序编号;
S4:计算所述输入词向量与语音交互词库中的各条指令信息的若干参考词向量之间的最大相关系数,若计算出的最大相关系数大于阈值,则输出与最大相关系数多对应指令信息所对应的反馈信息;否则,对与参考词向量存在差异的输入词向量进行模糊音转换处理,并计算经转换处理的输入词向量与语音交互词库中的各条指令信息的若干参考词向量之间的最大模糊相关系数,若所述模糊相关系数大于阈值,则输出与最大模糊相关系数多对应指令信息所对应的反馈信息;否则,输出输入信息无效指令。
进一步地,步骤S1中,每条指令包括的若干参考词向量分别构成一段序列X,其中序列X可表示为:
Figure BDA0002351921060000021
其中,An为名词参考向量,Bv为动词参考向量,Ca为形容词参考向量,Dnum为数词参考向量,Epron为量词参考向量,Fcom为代词参考向量,Gemp为虚词参考向量。
进一步地,步骤S3中,输入信息包括的若干输入词向量分别构成一段序列Y,其中Y可表示为:
Figure BDA0002351921060000031
其中,
Figure BDA0002351921060000032
为名词输入向量,
Figure BDA0002351921060000033
为动词输入向量,
Figure BDA0002351921060000034
为形容词输入向量,
Figure BDA0002351921060000035
为数词输入向量,
Figure BDA0002351921060000036
为量词输入向量,
Figure BDA0002351921060000037
为代词输入向量,
Figure BDA0002351921060000038
为虚词输入向量。
进一步地,所述步骤S2得到的输入信息进行标准化处理得到标准化语音输入信息的采用的具体方法包括:
S31:判断所述步骤S2得到的输入信息是否包括方言,若是,将输入信息中的方言转换成标准普通话后再将整段输入信息转成文字信息;否则,将输入信息直接转换成文字信息;
S32:判断所述标准普通话语言文字中是否包含外语信息,若是,则将标准普通话语言文字中的外语信息翻译成汉语后输出标准化语音输入信息;否则,直接将步骤S31中得到的文字信息作为标准化语音输入信息输出。
进一步地,计算所述输入词向量与语音交互词库中的各条指令信息的若干参考词向量之间的最大相关系数r1max(i)所采用的具体公式为:
Figure BDA0002351921060000039
其中,计算出的最大r1(i)即为最大相关系数r1max(i),i为序列X编号。
本发明的有益效果为:通过对智能家居的语音交互词库中的指令信息和用户语音输入信息按照词性进行分解成词向量;然后计算指令信息和输入信息之间的相关性,并根据相关性为用户提供相应的反馈信息;本申请能够对不能成功匹配的输入信息进行模糊音转换处理,然后再将经模糊音转换处理后的输入信息与指令信息进行匹配,能够提高方言语音信息的识别效率。
具体实施方式
一种基于语音识别技术的智能家居语音交互方法,包括以下步骤:
S1:录入智能家居语音交互指令信息构建语音交互词库,并在语音交互词库中为各指令信息匹配相应的反馈信息;再将所述语音交互词库中的各条指令信息按照词性分类标准分别进行分词处理得到若干参考词向量,并对若干所述输入词向量按照其在指令信息中出现顺序进行依次顺序编号;
S2:采集现场语音信息,对采集到的所述现场语音信息进行特征提取,识别当前声音中是否包括注册用户的语音信息;若识别到注册用户的语音信息,则筛选出注册用户的语音信息作为输入信息,并对筛选出的输入信息进行放大处理得到放大后的输入信息;
S3:对步骤S2得到的输入信息进行标准化处理得到标准化语音输入信息,再将所述标准化语音输入信息按照词性分类标准进行分词处理得到若干输入词向量,并对若干所述输入词向量按照其在输入信息中出现顺序进行依次顺序编号;
S4:计算所述输入词向量与语音交互词库中的各条指令信息的若干参考词向量之间的最大相关系数,若计算出的最大相关系数大于阈值,则输出与最大相关系数多对应指令信息所对应的反馈信息;否则,对与参考词向量存在差异的输入词向量进行模糊音转换处理,并计算经转换处理的输入词向量与语音交互词库中的各条指令信息的若干参考词向量之间的最大模糊相关系数,若所述模糊相关系数大于阈值,则输出与最大模糊相关系数多对应指令信息所对应的反馈信息;否则,输出输入信息无效指令。
本发明通过对语音交互词库中的指令信息和用户语音输入信息按照词性进行分解成词向量;然后计算指令信息和输入信息之间的相关性,并根据相关性为用户提供相应的反馈信息;本申请能够对不能成功匹配的输入信息进行模糊音转换处理,然后再将经模糊音转换处理后的输入信息与指令信息进行匹配,能够提高方言语音信息的识别效率。
根据本申请的一个实施例,步骤S1中,每条指令包括的若干参考词向量分别构成一段序列X,其中序列X可表示为:
Figure BDA0002351921060000051
其中,An为名词参考向量,Bv为动词参考向量,Ca为形容词参考向量,Dnum为数词参考向量,Epron为量词参考向量,Fcom为代词参考向量,Gemp为虚词参考向量。
根据本申请的一个实施例,步骤S3中,输入信息包括的若干输入词向量分别构成一段序列Y,其中Y可表示为:
Figure BDA0002351921060000052
其中,
Figure BDA0002351921060000053
为名词输入向量,
Figure BDA0002351921060000054
为动词输入向量,
Figure BDA0002351921060000055
为形容词输入向量,
Figure BDA0002351921060000056
为数词输入向量,
Figure BDA0002351921060000057
为量词输入向量,
Figure BDA0002351921060000058
为代词输入向量,
Figure BDA0002351921060000059
为虚词输入向量。
根据本申请的一个实施例,所述步骤S2得到的输入信息进行标准化处理得到标准化语音输入信息的采用的具体方法包括:
S31:判断所述步骤S2得到的输入信息是否包括方言,若是,将输入信息中的方言转换成标准普通话后再将整段输入信息转成文字信息;否则,将输入信息直接转换成文字信息;
S32:判断所述标准普通话语言文字中是否包含外语信息,若是,则将标准普通话语言文字中的外语信息翻译成汉语后输出标准化语音输入信息;否则,直接将步骤S31中得到的文字信息作为标准化语音输入信息输出。
根据本申请的一个实施例,计算所述输入词向量与语音交互词库中的各条指令信息的若干参考词向量之间的最大相关系数r1max(i)所采用的具体公式为:
Figure BDA0002351921060000061
其中,计算出的最大r1(i)即为最大相关系数r1max(i),i为序列X编号。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (5)

1.一种基于语音识别的智能家居语音交互方法,其特征在于,包括以下步骤:
S1:录入智能家居语音交互指令信息构建语音交互词库,并在语音交互词库中为各指令信息匹配相应的反馈信息;再将所述语音交互词库中的各条指令信息按照词性分类标准分别进行分词处理得到若干参考词向量,并对若干所述输入词向量按照其在指令信息中出现顺序进行依次顺序编号;
S2:采集现场语音信息,对采集到的所述现场语音信息进行特征提取,识别当前声音中是否包括注册用户的语音信息;若识别到注册用户的语音信息,则筛选出注册用户的语音信息作为输入信息,并对筛选出的输入信息进行放大处理得到放大后的输入信息;
S3:对步骤S2得到的输入信息进行标准化处理得到标准化语音输入信息,再将所述标准化语音输入信息按照词性分类标准进行分词处理得到若干输入词向量,并对若干所述输入词向量按照其在输入信息中出现顺序进行依次顺序编号;
S4:计算所述输入词向量与语音交互词库中的各条指令信息的若干参考词向量之间的最大相关系数,若计算出的最大相关系数大于阈值,则输出与最大相关系数多对应指令信息所对应的反馈信息;否则,对与参考词向量存在差异的输入词向量进行模糊音转换处理,并计算经转换处理的输入词向量与语音交互词库中的各条指令信息的若干参考词向量之间的最大模糊相关系数,若所述模糊相关系数大于阈值,则输出与最大模糊相关系数多对应指令信息所对应的反馈信息;否则,输出输入信息无效指令。
2.根据权利要求1所述的基于语音识别技术的智能家居语音交互方法,其特征在于,步骤S1中,每条指令包括的若干参考词向量分别构成一段序列X,其中序列X可表示为:
Figure FDA0002351921050000021
其中,An为名词参考向量,Bv为动词参考向量,Ca为形容词参考向量,Dnum为数词参考向量,Epron为量词参考向量,Fcom为代词参考向量,Gemp为虚词参考向量,αi为各参考向量的编号。
3.根据权利要求2所述的基于语音识别技术的智能家居语音交互方法,其特征在于,步骤S3中,输入信息包括的若干输入词向量分别构成一段序列Y,其中Y可表示为:
Figure FDA0002351921050000022
其中,
Figure FDA0002351921050000023
为名词输入向量,
Figure FDA0002351921050000024
为动词输入向量,
Figure FDA0002351921050000025
为形容词输入向量,
Figure FDA0002351921050000026
为数词输入向量,
Figure FDA0002351921050000027
为量词输入向量,
Figure FDA0002351921050000028
为代词输入向量,
Figure FDA0002351921050000029
为虚词输入向量,
Figure FDA00023519210500000210
为各参考向量的编号。
4.根据权利要求3所述的基于语音识别技术的智能家居语音交互方法,其特征在于,所述步骤S2得到的输入信息进行标准化处理得到标准化语音输入信息的采用的具体方法包括:
S31:判断所述步骤S2得到的输入信息是否包括方言,若是,将输入信息中的方言转换成标准普通话后再将整段输入信息转成文字信息;否则,将输入信息直接转换成文字信息;
S32:判断所述标准普通话语言文字中是否包含外语信息,若是,则将标准普通话语言文字中的外语信息翻译成汉语后输出标准化语音输入信息;否则,直接将步骤S31中得到的文字信息作为标准化语音输入信息输出。
5.根据权利要求4所述的基于语音识别技术的智能家居语音交互方法,其特征在于,计算所述输入词向量与语音交互词库中的各条指令信息的若干参考词向量之间的最大相关系数r1max(i)所采用的具体公式为:
Figure FDA0002351921050000031
其中,计算出的最大r1(i)即为最大相关系数r1max(i),i为指令信息编号。
CN201911419244.2A 2019-12-31 2019-12-31 基于语音识别技术的智能家居语音交互方法 Pending CN111128173A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911419244.2A CN111128173A (zh) 2019-12-31 2019-12-31 基于语音识别技术的智能家居语音交互方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911419244.2A CN111128173A (zh) 2019-12-31 2019-12-31 基于语音识别技术的智能家居语音交互方法

Publications (1)

Publication Number Publication Date
CN111128173A true CN111128173A (zh) 2020-05-08

Family

ID=70507077

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911419244.2A Pending CN111128173A (zh) 2019-12-31 2019-12-31 基于语音识别技术的智能家居语音交互方法

Country Status (1)

Country Link
CN (1) CN111128173A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022000140A1 (zh) * 2020-06-28 2022-01-06 北京来也网络科技有限公司 结合rpa和ai的疫情排查方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106502979A (zh) * 2016-09-20 2017-03-15 海信集团有限公司 一种自然语言信息的数据处理方法和装置
CN106776562A (zh) * 2016-12-20 2017-05-31 上海智臻智能网络科技股份有限公司 一种关键词提取方法和提取系统
CN108121528A (zh) * 2017-12-06 2018-06-05 深圳市欧瑞博科技有限公司 语音控制方法、装置、服务器和计算机可读存储介质
CN109215643A (zh) * 2017-07-05 2019-01-15 阿里巴巴集团控股有限公司 一种交互方法、电子设备及服务器
CN110288972A (zh) * 2019-08-07 2019-09-27 北京新唐思创教育科技有限公司 语音合成模型训练方法、语音合成方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106502979A (zh) * 2016-09-20 2017-03-15 海信集团有限公司 一种自然语言信息的数据处理方法和装置
CN106776562A (zh) * 2016-12-20 2017-05-31 上海智臻智能网络科技股份有限公司 一种关键词提取方法和提取系统
CN109215643A (zh) * 2017-07-05 2019-01-15 阿里巴巴集团控股有限公司 一种交互方法、电子设备及服务器
CN108121528A (zh) * 2017-12-06 2018-06-05 深圳市欧瑞博科技有限公司 语音控制方法、装置、服务器和计算机可读存储介质
CN110288972A (zh) * 2019-08-07 2019-09-27 北京新唐思创教育科技有限公司 语音合成模型训练方法、语音合成方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022000140A1 (zh) * 2020-06-28 2022-01-06 北京来也网络科技有限公司 结合rpa和ai的疫情排查方法和装置

Similar Documents

Publication Publication Date Title
WO2020232861A1 (zh) 命名实体识别方法、电子装置及存储介质
CN103971675B (zh) 自动语音识别方法和系统
US9230547B2 (en) Metadata extraction of non-transcribed video and audio streams
CN108038208B (zh) 上下文信息识别模型的训练方法、装置和存储介质
CN108536807B (zh) 一种信息处理方法及装置
CN111445898B (zh) 语种识别方法、装置、电子设备和存储介质
CN112487824B (zh) 客服语音情感识别方法、装置、设备及存储介质
Ishihara A likelihood ratio-based evaluation of strength of authorship attribution evidence in SMS messages using N-grams.
CN101505328A (zh) 应用语音识别的网络数据检索方法及其系统
CN107526721A (zh) 一种对电商产品评论词汇的歧义消除方法及装置
CN112347339A (zh) 一种搜索结果处理方法及装置
CN115759071A (zh) 基于大数据的政务敏感信息识别系统和方法
Bigot et al. Person name recognition in ASR outputs using continuous context models
CN111209367A (zh) 信息查找方法、信息查找装置、电子设备及存储介质
US7617182B2 (en) Document clustering based on entity association rules
CN113761192B (zh) 文本处理方法、文本处理装置及文本处理设备
CN112836019B (zh) 公共医疗卫生命名实体识别与实体链接方法、装置、电子设备及存储介质
CN111128173A (zh) 基于语音识别技术的智能家居语音交互方法
CN113726942A (zh) 一种智能电话接听方法、系统、介质及电子终端
CN101576876B (zh) 一种自动拆分英文复合词组的系统和方法
KR102540665B1 (ko) 한국어 언어 모델에 기반한 핵심문장 추출장치 및 그 방법
Sohail et al. Text classification in an under-resourced language via lexical normalization and feature pooling
CN111708872B (zh) 对话方法、装置及电子设备
CN111292741B (zh) 智能语音交互机器人
CN113111855A (zh) 一种多模态情感识别方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200508

RJ01 Rejection of invention patent application after publication