CN115331670B - 一种家用电器用离线语音遥控器 - Google Patents

一种家用电器用离线语音遥控器 Download PDF

Info

Publication number
CN115331670B
CN115331670B CN202210948521.4A CN202210948521A CN115331670B CN 115331670 B CN115331670 B CN 115331670B CN 202210948521 A CN202210948521 A CN 202210948521A CN 115331670 B CN115331670 B CN 115331670B
Authority
CN
China
Prior art keywords
target
voice
offline
control
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210948521.4A
Other languages
English (en)
Other versions
CN115331670A (zh
Inventor
沈卫民
刘祖芳
马学文
王志辉
王伟林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Michoi Iot Co ltd
Original Assignee
Shenzhen Macchi Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Macchi Information Technology Co ltd filed Critical Shenzhen Macchi Information Technology Co ltd
Priority to CN202210948521.4A priority Critical patent/CN115331670B/zh
Publication of CN115331670A publication Critical patent/CN115331670A/zh
Application granted granted Critical
Publication of CN115331670B publication Critical patent/CN115331670B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G08SIGNALLING
    • G08CTRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
    • G08C23/00Non-electrical signal transmission systems, e.g. optical systems
    • G08C23/04Non-electrical signal transmission systems, e.g. optical systems using light waves, e.g. infrared
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/04Segmentation; Word boundary detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • G10L2015/025Phonemes, fenemes or fenones being the recognition units
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0631Creating reference templates; Clustering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Selective Calling Equipment (AREA)
  • Remote Monitoring And Control Of Power-Distribution Networks (AREA)

Abstract

本发明提供了一种家用电器用离线语音遥控器,包括:语音采集模块,用于采集用户输入的离线语音信号;语音识别模块,用于对所述离线语音信号进行降噪处理,并对降噪处理后的离线语音信号进行识别;控制模块,用于基于识别结果确定目标控制电器,并向所述目标控制电器发送离线语音信号对应的目标红外码,完成对目标控制电器的控制。通过采集用户的离线语音信号,实现通过一个遥控器对不同的电器进行控制,增加了遥控器的智能性,其次,通过对语音信号进行分析,保障了对电器控制的准确率,提升了对不同电器的控制效果,同时,也便于满足使用者的使用需求,为用户提供了极大的便利。

Description

一种家用电器用离线语音遥控器
技术领域
本发明涉及语音遥控器技术领域,特别涉及一种家用电器用离线语音遥控器。
背景技术
目前,随着数字化技术的发展,遥控器的功能也越来越多,有蓝牙,红外,语音等功能。而语音功能是智能设备非常重要的一种功能,其语音识别的准确率也是非常重要的;
但是,传统遥控器的语音数据接收模块外一层存在屏幕遮挡,且容易受到周围复杂环境的影响,使得遥控器的语音识别能力比较差,同时,随着智能化产品的丰富,越来越多的智能产品涌入人们的生活,智能产品在使用过程中为人们生活提供了极大的便利,但由于种类繁多,不同的智能产品对应不同的遥控器,这就导致在控制过程中需要来会切换不同的遥控器,为用户的使用造成了极大的不便;
因此,本发明提供了一种家用电器用离线语音遥控器。
发明内容
本发明提供一种家用电器用离线语音遥控器,用以通过采集用户的离线语音信号,实现通过一个遥控器对不同的电器进行控制,增加了遥控器的智能性,其次,通过对语音信号进行分析,保障了对电器控制的准确率,提升了对不同电器的控制效果,同时,也便于满足使用者的使用需求,为用户提供了极大的便利。
本发明提供了一种家用电器用离线语音遥控器,包括:
语音采集模块,用于采集用户输入的离线语音信号;
语音识别模块,用于对所述离线语音信号进行降噪处理,并对降噪处理后的离线语音信号进行识别;
控制模块,用于基于识别结果确定目标控制电器,并向所述目标控制电器发送离线语音信号对应的目标红外码,完成对目标控制电器的控制。
优选的,一种家用电器用离线语音遥控器,所述语音采集模块包括:
转换单元,用于实时获取用户的语音信号,并将所述语音信号转换为对应的脚本文件,其中,所述脚本文件内容与所述语音信号内容一致;
内容分析单元,用于基于预设语法规则对所述脚本文件进行词汇分割,得到词汇集合,并提取所述词汇集合中各词汇的词汇标识;
唤醒单元,用于将所述词汇标识与预设唤醒关键词库中各预设唤醒关键词的目标标识进行匹配,且基于匹配结果判定存储预设唤醒关键词的目标标识与所述词汇标识相匹配时,向预设控制器发送唤醒指令,并基于预设控制器控制离线语音遥控器切换至工作状态。
优选的,一种家用电器用离线语音遥控器,所述语音采集模块包括:
语音信号预采集单元,用于实时监测用户发送的语音信号,并对所述语音信号进行分析,确定所述语音信号的信号强度以及目标信号来源方向;
配置单元,用于当所述信号强度满足预设条件时,确定所述信号强度与预设基准信号强度的目标差值,并基于所述目标差值确定信号放大倍数;
语音采集单元,还用于基于目标来源方向调整离线语音遥控器中的预设麦克风阵列,并基于调整结果采集目标信号来源方向上用户发送的离线语音信号;
所述语音采集单元,还用于基于所述信号放大倍数对所述离线语音信号的信号强度进行调整,并将调整后的离线语音信号进行输出。
优选的,一种家用电器用离线语音遥控器,所述语音采集单元包括:
语音信号获取子单元,用于获取采集到的离线语音信号,并对所述离线语音信号进行端点检测,得到所述离线语音信号对应的有声数据;
数据校验子单元,用于提取所述有声数据的数据特征,并基于所述数据特征确定有声数据的声音图谱,且基于所述声音图谱确定所述有声数据是否为有效语音信号;
执行子单元,用于当所述有声数据为有效语音信号时,判定接收到的离线语音信号合格,否则,重新采集用户输入的离线语音信号。
优选的,一种家用电器用离线语音遥控器,所述语音识别模块包括:
语音信号获取单元,用于获取采集到的离线语音信号,并将所述离线语音信号进行分帧处理,得到N帧待降噪语音信号,且将所述N帧待降噪语音信号进行短时傅里叶变换,得到N帧待降噪语音信号对应的信号谱;
降噪单元,用于基于所述信号谱确定不同帧待降噪语音信号的信号分量,并基于预设降噪规则对所述信号分量进行降噪处理,并将降噪后的每一帧待降噪语音信号进行短时傅里叶逆变换以及重组,得到目标离线语音信号;
模型构建单元,用于获取预设训练数据,并提取所述预设训练数据的声学标签,且基于所述声学标签构建声学识别模型;
第一语音识别单元,用于基于所述声学识别模型对所述目标离线语音信号进行第一语音识别,得到所述目标离线语音信号的声学特征,并基于所述声学特征判定所述目标离线语音信号是否为方言口音,且当为方言口音时,基于所述声学特征确定目标离线语音信号的语调信息以及特征信息,并基于所述语调信息以及特征信息确定所述目标离线语音信号对应的音素序列,且基于所述音素序列对所述目标离线语音信号进行转换,得到标准离线语音信号;
第二语音识别单元,用于构建语义识别模型,并基于所述语义识别模型对所述标准离线语音信号进行第二语音识别,得到所述标准离线语音信号对应的目标语义,且基于所述目标语义完成对离线语音信号的识别。
优选的,一种家用电器用离线语音遥控器,所述第二语音识别单元包括:
信号获取子单元,用于获取得到的标准离线语音信号,并基于预设检测方法确定所述标准离线语音信号的语音端点,且基于所述语音端点将所述标准离线语音信号进行断句,得到语句集合,其中,所述语句集合中至少包含一条语句;
模型构建子单元,用于获取历史训练数据,并确定所述历史训练数据的语义标签,且基于所述语义标签构建语义识别模型;
语义识别子单元,用于基于所述语义识别模型对所述语句集合中每一语句进行解码,得到每一语句的目标语义。
优选的,一种家用电器用离线语音遥控器,所述第二语音识别单元包括:
识别结果获取子单元,用于获取所述标准离线语音信号对应的目标语义,并提取所述目标语义的第一语义特征;
识别结果筛选子单元,用于确定第一语义特征的置信度,并基于所述置信度对所述第一语义特征对应的目标语义进行第一筛选;
所述识别结果筛选子单元,还用于获取离线语音遥控器中预设离线语音的第二语义特征,并将所述第二语义特征与第一筛选处理后的目标语义的第一语义特征进行匹配,且基于匹配结果对所述第一语义特征对应的目标语义进行第二筛选,得到标准目标语义,并将所述标准目标语义作为最终的识别结果。
优选的,一种家用电器用离线语音遥控器,所述控制模块包括:
识别结果获取单元,用于获取对降噪处理后的离线语音信号进行识别后得到的识别结果,并确定所述识别结果对应的目标识别数据;
识别结果分析单元,用于提取所述目标识别数据的数据属性,并基于所述数据属性确定离线语音信号对应的控制目的;
电器种类确定单元,用于基于所述控制目的确定目标控制电器,同时,基于所述控制目的确定对所述目标控制电器的待控制功能;
分析单元,用于提取所述目标识别数据的目标参数值,并基于所述目标参数值以及所述待控制功能生成对所述目标控制电器的控制指令;
控制单元,用于确定所述目标控制电器的电器类型,并基于所述电器类型确定对所述目标控制电器的目标控制频段,且基于所述控制指令控制离线语音遥控器在所述目标控制频段向所述目标控制电器发送目标红外码,其中,所述目标红外码中携带有离线语音遥控器的身份标识;
执行单元,用于当所述目标控制电器接收到所述目标红外码时,提取所述目标红外码中携带的身份标识,并将所述身份标识与自身内部存储的遥控器响应标识进行比较,且当所述身份标识与所述遥控器响应标识一致时,执行所述控制指令对应的目标功能。
优选的,一种家用电器用离线语音遥控器,所述识别结果分析单元包括:
结果分析子单元,用于获取离线语音信号对应的控制目的,并基于所述控制目的确定所述离线语音信号的控制类型,其中,所述控制类型包括预约控制以及立即控制;
控制模式设定子单元,用于当所述控制类型为预约控制时,基于所述控制目的确定离线语音信号对应的预约时长以及待控制功能类型;
所述控制模式设定子单元,用于将所述预约时长以及待控制功能类型在预设控制列表中进行记录,并实时监测当前时刻信息,且当所述当前时刻信息达到预约时长时,基于所述待控制功能类型控制所述目标控制电器执行相应的功能。
优选的,一种家用电器用离线语音遥控器,所述控制单元包括:
执行结果获取子单元,用于获取基于离线语音遥控器对不同目标控制电器的控制参数,并确定不同控制参数的时间信息以及控制结果信息;
记录子单元,用于将所述控制参数以及对应的时间信息和控制结果信息进行记录,并基于记录结果评估基于离线语音遥控器对不同目标控制电器的控制效果,且将评估结果传输至用户智能终端。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种家用电器用离线语音遥控器的结构图;
图2为本发明实施例中一种家用电器用离线语音遥控器中语音采集模块的结构图;
图3为本发明实施例中一种家用电器用离线语音遥控器中语音识别模块的结构图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例1:
本实施例提供了一种家用电器用离线语音遥控器,如图1所示,包括:
语音采集模块,用于采集用户输入的离线语音信号;
语音识别模块,用于对所述离线语音信号进行降噪处理,并对降噪处理后的离线语音信号进行识别;
控制模块,用于基于识别结果确定目标控制电器,并向所述目标控制电器发送离线语音信号对应的目标红外码,完成对目标控制电器的控制。
该实施例中,离线语音信号指的是用户向离线语音遥控器发送的语音指令,且该语音信号与离线语音遥控器中设定的语音信号相一致,即控制不同电器的语音指令在离线语音遥控器中屎设定好的。
该实施例中,降噪处理指的是对采集到的离线语音信号中的噪声进行清除,从而便于得到干净的语音信号。
该实施例中,对降噪处理后的离线语音信号进行识别指的是确定降噪处理后的离线语音信号是否存在口音,且在存在口音时根据口音将识别得到的离线语音转换为标准的语音信号,从而确定语音信号对应的具体内容。
该实施例中,目标控制电器指的是用户发送的离线语音信号对应的遥控的电器,具体可以是空调以及电视等。
该实施例中,目标红外码指的是用于控制目标空气电器的红外信号,目的是控制目标控制电器执行相应的功能,不同目标控制电器的红外码是不同的。
上述技术方案的有益效果是:通过采集用户的离线语音信号,实现通过一个遥控器对不同的电器进行控制,增加了遥控器的智能性,其次,通过对语音信号进行分析,保障了对电器控制的准确率,提升了对不同电器的控制效果,同时,也便于满足使用者的使用需求,为用户提供了极大的便利。
实施例2:
在实施例1的基础上,本实施例提供了一种家用电器用离线语音遥控器,所述语音采集模块包括:
转换单元,用于实时获取用户的语音信号,并将所述语音信号转换为对应的脚本文件,其中,所述脚本文件内容与所述语音信号内容一致;
内容分析单元,用于基于预设语法规则对所述脚本文件进行词汇分割,得到词汇集合,并提取所述词汇集合中各词汇的词汇标识;
唤醒单元,用于将所述词汇标识与预设唤醒关键词库中各预设唤醒关键词的目标标识进行匹配,且基于匹配结果判定存储预设唤醒关键词的目标标识与所述词汇标识相匹配时,向预设控制器发送唤醒指令,并基于预设控制器控制离线语音遥控器切换至工作状态。
该实施例中,脚本文件指的是用户的语音信号对应的文本内容。
该实施例中,预设语法规则是提前设定好的,用于表征对脚本文件进行划分的方式方法。
该实施例中,词汇集合指的是对语音信号对应的脚本文件进行划分后,得到的多个词汇。
该实施例中,词汇标识是用于标记词汇类型以及词汇主旨的标记标签。
该实施例中,预设唤醒关键词库是提前设定好的,用于存储不同的预设唤醒关键词。
该实施例中,预设唤醒关键词是提前设定好的,是用于控制离线语音遥控器执行相应功能的词汇。
该实施例中,目标标识是用于标记预设唤醒关键词的词汇类型以及词汇主旨的标记标签。
该实施例中,预设控制器是提前设定好的,用于控制离线语音遥控器切换工作状态以及控制离线语音遥控器执行相应的语音指令。
上述技术方案的有益效果是:通过获取用户的语音信号,并将语音信号转换为对应的脚本文件,实现对语音信号中的唤醒关键词进行准确有效的识别,从而便于控制离线语音遥控器在听到唤醒关键词后进行工作状态,从而提高了对离线语音采集的准确性以及可靠性。
实施例3:
在实施例1的基础上,本实施例提供了一种家用电器用离线语音遥控器,如图2所示,所述语音采集模块包括:
语音信号预采集单元,用于实时监测用户发送的语音信号,并对所述语音信号进行分析,确定所述语音信号的信号强度以及目标信号来源方向;
配置单元,用于当所述信号强度满足预设条件时,确定所述信号强度与预设基准信号强度的目标差值,并基于所述目标差值确定信号放大倍数;
语音采集单元,还用于基于目标来源方向调整离线语音遥控器中的预设麦克风阵列,并基于调整结果采集目标信号来源方向上用户发送的离线语音信号;
所述语音采集单元,还用于基于所述信号放大倍数对所述离线语音信号的信号强度进行调整,并将调整后的离线语音信号进行输出。
该实施例中,目标信号来源方向指的是用户与离线语音遥控器的相对方向。
该实施例中,预设条件是提前设定好的,用于衡量接收到的语音信号的强度是否满足分析需求,是可以进行调整的。
该实施例中,预设基准信号强度指的是离线语音遥控器能够准确识别的语音信号的信号强度值。
该实施例中,目标产值指的是当前接收到的语音信号的信号强度值与预设基准信号强度的差值大小情况。
该实施例中,预设麦克风阵列是用于表征离线语音控制器对外部语音信号采集的主要方向,通过对预设麦克风阵列进行调整,可有效采集目标信号来源方向上的离线语音信号。
上述技术方案的有益效果是:通过对用户输出的语音信号进行预采集,实现对用户预离线语音控制器的相对方向进行准确判断,其次,确定接收到的语音信号与预设基准信号强度的目标差值,实现对语音信号的放大倍数进行准确分析,最终通过调整离线语音遥控器中的预设麦克风阵列,实现对目标信号来源方向上用户的语音信号进行准确有效的采集,为实现对电器进行准确的控制提供了保障。
实施例4:
在实施例3的基础上,本实施例提供了一种家用电器用离线语音遥控器,所述语音采集单元包括:
语音信号获取子单元,用于获取采集到的离线语音信号,并对所述离线语音信号进行端点检测,得到所述离线语音信号对应的有声数据;
数据校验子单元,用于提取所述有声数据的数据特征,并基于所述数据特征确定有声数据的声音图谱,且基于所述声音图谱确定所述有声数据是否为有效语音信号;
执行子单元,用于当所述有声数据为有效语音信号时,判定接收到的离线语音信号合格,否则,重新采集用户输入的离线语音信号。
该实施例中,端点检测指的是对语音和非语音的区域进行区分。
该实施例中,有声数据指的是采集到的离线语音信号中存在声音的信号片段,其中,有声可以是用户的语音信号也可以是环境中的噪音。
该实施例中,数据特征可以是有声数据在不同时间点时刻的音频振幅值。
该实施例中,基于所述声音图谱确定所述有声数据是否为有效语音信号可以是将得到的声音图谱与标准话语对应的声音图谱进行比较,从而确定声音图谱中是否存在用户的话语信号。
该实施例中,有效语音信号指的是采集到的离线语音信号中包含用户的语音信号。
上述技术方案的有益效果是:通过对采集到的离线语音信号的有效性进行校验,从而便于确定采集到离线语音信号的准确性,为提高对电器的控制准确率以及控制效果提供了便利。
实施例5:
在实施例1的基础上,本实施例提供了一种家用电器用离线语音遥控器,如图3所示,所述语音识别模块包括:
语音信号获取单元,用于获取采集到的离线语音信号,并将所述离线语音信号进行分帧处理,得到N帧待降噪语音信号,且将所述N帧待降噪语音信号进行短时傅里叶变换,得到N帧待降噪语音信号对应的信号谱;
降噪单元,用于基于所述信号谱确定不同帧待降噪语音信号的信号分量,并基于预设降噪规则对所述信号分量进行降噪处理,并将降噪后的每一帧待降噪语音信号进行短时傅里叶逆变换以及重组,得到目标离线语音信号;
模型构建单元,用于获取预设训练数据,并提取所述预设训练数据的声学标签,且基于所述声学标签构建声学识别模型;
第一语音识别单元,用于基于所述声学识别模型对所述目标离线语音信号进行第一语音识别,得到所述目标离线语音信号的声学特征,并基于所述声学特征判定所述目标离线语音信号是否为方言口音,且当为方言口音时,基于所述声学特征确定目标离线语音信号的语调信息以及特征信息,并基于所述语调信息以及特征信息确定所述目标离线语音信号对应的音素序列,且基于所述音素序列对所述目标离线语音信号进行转换,得到标准离线语音信号;
第二语音识别单元,用于构建语义识别模型,并基于所述语义识别模型对所述标准离线语音信号进行第二语音识别,得到所述标准离线语音信号对应的目标语义,且基于所述目标语义完成对离线语音信号的识别。
该实施例中,分帧处理指的是将离线语音信号拆分成以帧为单位的语音信号,目的是为了更准确的对离线语音信号进行去噪处理。
该实施例中,待降噪语音信号指的是将离线语音信号进行分帧处理后得到的语音信号。
该实施例中,短时傅里叶变换是用于确定待降噪语音信号其局部区域正弦波的频率与相位。
该实施例中,信号谱是用于表征待降噪语音信号的正弦波的频率以及相位的二维图。
该实施例中,信号分量指的是将待降噪语音信号进行拆分,从而得到多个部分,便于对待降噪语音信号进行降噪处理。
该实施例中,预设降噪规则是提前设定好的,用于对待降噪语音信号进行降噪处理。
该实施例中,目标离线语音信号指的是对待降噪语音信号进行降噪处理后得到的无噪声影响的语音信号。
该实施例中,预设训练数据是提前设定好的,用于构建声学识别模型。
该实施例中,声学标签指的是预设训练数据的声音特征,具体可以是预设训练数据的语调以及声色特点。
该实施例中,第一语音识别指的是对目标离线语音信号的声学特征进行识别。
该实施例中,特征信息指的是目标离线语音信号的数量以及目标离线语音信号的取值情况等。
该实施例中,音素序列指的是目标离线语音信号对应的字母发音集合。
该实施例中,标准离线语音信号指的是当目标离线语音信号为方言口音时,将目标离线语音信号转换为标准发音后对应的语音信号。
该实施例中,第二语音识别指的是对标准离线语音信号的语义进行识别,确定标准离线语音信号对应的具体内容。
该实施例中,目标语义指的是标准离线语音信号对应的话语内容。
该实施例中,基于所述目标语义完成对离线语音信号的识别,包括:
获取得到的标准离线语音信号,并将所述标准离线语音信号转换为对应的特征向量序列X={x1,x2,…,xn};
基于所述特征向量序列计算所述标准离线语音信号的词文本序列,并确定所述词文本序列中词文本的总个数,且基于所述词文本的总个数计算对标准离线语音信号的识别准确率,具体步骤包括:
根据如下公式计算所述标准离线语音信号的词文本序列:
Figure BDA0003788190320000121
其中,M表示所述标准离线语音信号的词文本序列;X={x1,x2,…,xn},表示的是标准离线语音信号转换为对应的特征向量序列;xn表示标准离线语音信号第n帧的特征向量;
Figure BDA0003788190320000131
表示特征向量序列X对应的词序列;/>
Figure BDA0003788190320000132
表示已知特征向量序列X的情况下输出词序列/>
Figure BDA0003788190320000133
的概率值;
基于计算得到的词文本序列确定词文本的总个数m,并基于词文本的总个数m计算对标准离线语音信号的识别准确率:
Figure BDA0003788190320000134
其中,η表示对标准离线语音信号的识别准确率,且取值范围为(0,1);μ表示误差系数,且取值范围为(0.02,0.05);m表示词文本的总个数m;k表示识别错误的词文本的个数,且取值小于m;s表示识别正确的词文本的个数,且取值大于k,小于m;g表示识别正确的词文本中的无效词文本的个数,且取值小于s;
将计算得到的识别准确率与预设阈值进行比较;
若所述识别准确率小于预设阈值,判定对所述标准离线语音信号的识别不合格,并重新对所述标准离线语音信号进行识别;
否则,判定对所述标准离线语音信号的识别合格。
上述argmax(·)是一种函数,指的是满足
Figure BDA0003788190320000135
条件时,标准离线语音信号对应的最大词文本序列集合。
上述技术方案的有益效果是:通过对离线语音进行分帧,并将分帧后语音信号进行降噪处理,得到目标离线语音信号,其次,根据预设训练数据构建声学识别模型,实现对目标离线语音信号的声学特征进行准确的识别,且在判定目标离线语音信号为方言口音时,对目标离线语音信号的格式进行转换,最后根据转换结果对目标离线语音信号的语义进行准确有效的识别,保障了对用于离线语音信号的识别效果,提高了识别的准确率,从而便于对相应的电器进行准确有效的控制。
实施例6:
在实施例5的基础上,本实施例提供了一种家用电器用离线语音遥控器,所述第二语音识别单元包括:
信号获取子单元,用于获取得到的标准离线语音信号,并基于预设检测方法确定所述标准离线语音信号的语音端点,且基于所述语音端点将所述标准离线语音信号进行断句,得到语句集合,其中,所述语句集合中至少包含一条语句;
模型构建子单元,用于获取历史训练数据,并确定所述历史训练数据的语义标签,且基于所述语义标签构建语义识别模型;
语义识别子单元,用于基于所述语义识别模型对所述语句集合中每一语句进行解码,得到每一语句的目标语义。
该实施例中,预设检测方法是提前设定好的,用于确定标准离线语音信号的有声信号和无声信号的分界点。
该实施例中,语音端点指的是标准离线语音信号中有声数据和无声数据的边界。
该实施例中,语句集合指的是将标准离线语音信号进行断句后得到的多条单个语句。
该实施例中,历史训练数据是提前设定好的,用于构建语义识别模型。
该实施例中,语义标签是用于表征不同历史训练数据对应的具体语义信息。
上述技术方案的有益效果是:通过对得到的标准离线语音信号进行断句,并对断句后的每一条语句进行语义识别,从而保障了对标准离线语音信号的识别准确率,从而实现对电器进行准确的控制。
实施例7:
在实施例5的基础上,本实施例提供了一种家用电器用离线语音遥控器,所述第二语音识别单元包括:
识别结果获取子单元,用于获取所述标准离线语音信号对应的目标语义,并提取所述目标语义的第一语义特征;
识别结果筛选子单元,用于确定第一语义特征的置信度,并基于所述置信度对所述第一语义特征对应的目标语义进行第一筛选;
所述识别结果筛选子单元,还用于获取离线语音遥控器中预设离线语音的第二语义特征,并将所述第二语义特征与第一筛选处理后的目标语义的第一语义特征进行匹配,且基于匹配结果对所述第一语义特征对应的目标语义进行第二筛选,得到标准目标语义,并将所述标准目标语义作为最终的识别结果。
该实施例中,第一语义特征指的是目标语义对应的内容特点,具体可以是语义的长短以及语义的类型等。
该实施例中,置信度是用于表征目标语义为标准离线语音信号正确语义的概率大小。
该实施例中,第一筛选指的是根据目标语义为标准离线语音信号正确语义的概率大小对得到的目标语义进行筛选。
该实施例中,预设离线语音是提前设定好的,是能够被离线语音遥控器准确识别的离线语音。
该实施例中,第二语义特征是预设离线语音的目标语义。
该实施例中,第二筛选指的是根据预设离线语义的语义特征对目标语义进行二次筛选。
该实施例中,标准目标语义指的是对得到目标语义进行两次筛选后得到的能够代表标准离线语音信号的话语内容。
上述技术方案的有益效果是:通过对得到目标语义进行两次筛选,确保最后得到的目标语义的准确性,且保障了标准离线语音信号能够被离线语音遥控器进行准确有效的识别,提高了对离线语音信号的识别准确率,从而实现对电器进行准确有效的控制。
实施例8:
在实施例1的基础上,本实施例提供了一种家用电器用离线语音遥控器,所述控制模块包括:
识别结果获取单元,用于获取对降噪处理后的离线语音信号进行识别后得到的识别结果,并确定所述识别结果对应的目标识别数据;
识别结果分析单元,用于提取所述目标识别数据的数据属性,并基于所述数据属性确定离线语音信号对应的控制目的;
电器种类确定单元,用于基于所述控制目的确定目标控制电器,同时,基于所述控制目的确定对所述目标控制电器的待控制功能;
分析单元,用于提取所述目标识别数据的目标参数值,并基于所述目标参数值以及所述待控制功能生成对所述目标控制电器的控制指令;
控制单元,用于确定所述目标控制电器的电器类型,并基于所述电器类型确定对所述目标控制电器的目标控制频段,且基于所述控制指令控制离线语音遥控器在所述目标控制频段向所述目标控制电器发送目标红外码,其中,所述目标红外码中携带有离线语音遥控器的身份标识;
执行单元,用于当所述目标控制电器接收到所述目标红外码时,提取所述目标红外码中携带的身份标识,并将所述身份标识与自身内部存储的遥控器响应标识进行比较,且当所述身份标识与所述遥控器响应标识一致时,执行所述控制指令对应的目标功能。
该实施例中,目标识别数据指的是识别结果对应的文本数据。
该实施例中,数据属性可以是目标识别数据的数据类型以及对应的主旨内容等。
该实施例中,控制目的指的是用户输出的离线语音信号最终要实现的控制结果,具体可以是调节声音或是调节温度等。
该实施例中,目标控制电器指的是用户需要通过语音进行控制的电器,具体可以是电视或是空调等。
该实施例中,待控制功能指的是通过语音信号要对目标控制电器控制的功能类型,具体可以是增加温度、降低温度或是调亮声音等。
该实施例中,目标参数指指的是目标识别数据对应的具体取值情况,目的是为了确定控制的具体参数。
该实施例中,目标控制频段指的是向目标控制电器发送红外码的频率范围,不同电器对应的频段不同。
该实施例中,目标红外码指的是用于控制目标控制电器执行相应功能的红外信号。
该实施例中,身份标识是用于标记遥控器身份的一种标记符号。
该实施例中,遥控器响应标识是在目标控制电器内部提前设定好的,用于和遥控器的身份标识尽心配对,从而实现相应的控制。
上述技术方案的有益效果是:通过对得到的识别结果进行分析,实现对离线语音信号表达的控制目的以及控制功能进行准确有效的分析,其次,通过根据识别结果对控制电器的电器类型进行准确有效的获取,最终实现对目标控制电器的目标控制频段进行有效的确认,并根据控制目的以及控制功能生成对应的控制指令,从而实现通过控制指令向目标控制电器发送相应的目标红外码,实现对目标控制设备的准确控制,为人们提供了极大的便利,提高了控制效果。
实施例9:
在实施例8的基础上,本实施例提供了一种家用电器用离线语音遥控器,所述识别结果分析单元包括:
结果分析子单元,用于获取离线语音信号对应的控制目的,并基于所述控制目的确定所述离线语音信号的控制类型,其中,所述控制类型包括预约控制以及立即控制;
控制模式设定子单元,用于当所述控制类型为预约控制时,基于所述控制目的确定离线语音信号对应的预约时长以及待控制功能类型;
所述控制模式设定子单元,用于将所述预约时长以及待控制功能类型在预设控制列表中进行记录,并实时监测当前时刻信息,且当所述当前时刻信息达到预约时长时,基于所述待控制功能类型控制所述目标控制电器执行相应的功能。
该实施例中,预约控制指的是需要在一定时间段后才执行的控制类型,具体可以是“三个小时后关闭空调”等。
该实施例中,立即控制指的是当下需要即刻执行的控制,具体可以是“调高音量”等。
该实施例中,预约时长指的是离线语音对应的待执行命令的时间跨度,具体可以是两个小时或是三个小时等。
该实施例中,预设控制列表是提前设定好的,用于记录待执行的命令。
上述技术方案的有益效果是:通过对控制目的进行分析,实现当控制类型为预约控制时,及时确定预约时长以及对应的待控制功能,并实时监测当前时刻信息与预约时长的关系,实现在到达预约时长时对目标控制电器进行准确有效的控制,提高了对目标控制电器的控制准确率以及控制效果,为用户在控制电器时提供了极大的便利。
实施例10:
在实施例8的基础上,本实施例提供了一种家用电器用离线语音遥控器,所述控制单元包括:
执行结果获取子单元,用于获取基于离线语音遥控器对不同目标控制电器的控制参数,并确定不同控制参数的时间信息以及控制结果信息;
记录子单元,用于将所述控制参数以及对应的时间信息和控制结果信息进行记录,并基于记录结果评估基于离线语音遥控器对不同目标控制电器的控制效果,且将评估结果传输至用户智能终端。
该实施例中,控制参数指的是通过离线语音遥控器对不同目标控制电器的控制类型以及控制的次数等。
该实施例中,基于记录结果评估基于离线语音遥控器对不同目标控制电器的控制效果可以是根据控制结果确定成功识别以及成功控制的次数占总控制次数的比例,从而实现对控制效果评估。
上述技术方案的有益效果是:通过对离线语音遥控器对不同目标控制电器的控制参数进行记录,实现对线语音遥控器对不同目标控制电器的控制效果进行有效评估,便于及时发现离线语音遥控器的缺陷,从而便于及时进行完善,保障了通过离线语音遥控器对用户离线语音的识别效果,提高了对不同家用电器的控制准确率。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (8)

1.一种家用电器用离线语音遥控器,其特征在于,包括:
语音采集模块,用于采集用户输入的离线语音信号;
语音识别模块,用于对所述离线语音信号进行降噪处理,并对降噪处理后的离线语音信号进行识别;
控制模块,用于基于识别结果确定目标控制电器,并向所述目标控制电器发送离线语音信号对应的目标红外码,完成对目标控制电器的控制;
所述语音识别模块包括:
语音信号获取单元,用于获取采集到的离线语音信号,并将所述离线语音信号进行分帧处理,得到N帧待降噪语音信号,且将所述N帧待降噪语音信号进行短时傅里叶变换,得到N帧待降噪语音信号对应的信号谱;
降噪单元,用于基于所述信号谱确定不同帧待降噪语音信号的信号分量,并基于预设降噪规则对所述信号分量进行降噪处理,并将降噪后的每一帧待降噪语音信号进行短时傅里叶逆变换以及重组,得到目标离线语音信号;
模型构建单元,用于获取预设训练数据,并提取所述预设训练数据的声学标签,且基于所述声学标签构建声学识别模型;
第一语音识别单元,用于基于所述声学识别模型对所述目标离线语音信号进行第一语音识别,得到所述目标离线语音信号的声学特征,并基于所述声学特征判定所述目标离线语音信号是否为方言口音,且当为方言口音时,基于所述声学特征确定目标离线语音信号的语调信息以及特征信息,并基于所述语调信息以及特征信息确定所述目标离线语音信号对应的音素序列,且基于所述音素序列对所述目标离线语音信号进行转换,得到标准离线语音信号;
第二语音识别单元,用于构建语义识别模型,并基于所述语义识别模型对所述标准离线语音信号进行第二语音识别,得到所述标准离线语音信号对应的目标语义,且基于所述目标语义完成对离线语音信号的识别;
其中,基于所述目标语义完成对离线语音信号的识别,包括:
获取得到的标准离线语音信号,并将所述标准离线语音信号转换为对应的特征向量序列X={x1,x2,…,xn};
基于所述特征向量序列计算所述标准离线语音信号的词文本序列,并确定所述词文本序列中词文本的总个数,且基于所述词文本的总个数计算对标准离线语音信号的识别准确率,具体步骤包括:
根据如下公式计算所述标准离线语音信号的词文本序列:
Figure FDA0004094313590000021
其中,M表示所述标准离线语音信号的词文本序列;X={x1,x2,…,xn},表示的是标准离线语音信号转换为对应的特征向量序列;xn表示标准离线语音信号第n帧的特征向量;
Figure FDA0004094313590000022
表示特征向量序列X对应的词序列;/>
Figure FDA0004094313590000023
表示已知特征向量序列X的情况下输出词序列/>
Figure FDA0004094313590000025
的概率值;
基于计算得到的词文本序列确定词文本的总个数m,并基于词文本的总个数m计算对标准离线语音信号的识别准确率:
Figure FDA0004094313590000024
其中,η表示对标准离线语音信号的识别准确率,且取值范围为(0,1);μ表示误差系数,且取值范围为(0.02,0.05);m表示词文本的总个数m;k表示识别错误的词文本的个数,且取值小于m;s表示识别正确的词文本的个数,且取值大于k,小于m;g表示识别正确的词文本中的无效词文本的个数,且取值小于s;
将计算得到的识别准确率与预设阈值进行比较;
若所述识别准确率小于预设阈值,判定对所述标准离线语音信号的识别不合格,并重新对所述标准离线语音信号进行识别;
否则,判定对所述标准离线语音信号的识别合格;
其中,所述控制模块包括:
识别结果获取单元,用于获取对降噪处理后的离线语音信号进行识别后得到的识别结果,并确定所述识别结果对应的目标识别数据;
识别结果分析单元,用于提取所述目标识别数据的数据属性,并基于所述数据属性确定离线语音信号对应的控制目的;
电器种类确定单元,用于基于所述控制目的确定目标控制电器,同时,基于所述控制目的确定对所述目标控制电器的待控制功能;
分析单元,用于提取所述目标识别数据的目标参数值,并基于所述目标参数值以及所述待控制功能生成对所述目标控制电器的控制指令;
控制单元,用于确定所述目标控制电器的电器类型,并基于所述电器类型确定对所述目标控制电器的目标控制频段,且基于所述控制指令控制离线语音遥控器在所述目标控制频段向所述目标控制电器发送目标红外码,其中,所述目标红外码中携带有离线语音遥控器的身份标识;
执行单元,用于当所述目标控制电器接收到所述目标红外码时,提取所述目标红外码中携带的身份标识,并将所述身份标识与自身内部存储的遥控器响应标识进行比较,且当所述身份标识与所述遥控器响应标识一致时,执行所述控制指令对应的目标功能。
2.根据权利要求1所述的一种家用电器用离线语音遥控器,其特征在于,所述语音采集模块包括:
转换单元,用于实时获取用户的语音信号,并将所述语音信号转换为对应的脚本文件,其中,所述脚本文件内容与所述语音信号内容一致;
内容分析单元,用于基于预设语法规则对所述脚本文件进行词汇分割,得到词汇集合,并提取所述词汇集合中各词汇的词汇标识;
唤醒单元,用于将所述词汇标识与预设唤醒关键词库中各预设唤醒关键词的目标标识进行匹配,且基于匹配结果判定存储预设唤醒关键词的目标标识与所述词汇标识相匹配时,向预设控制器发送唤醒指令,并基于预设控制器控制离线语音遥控器切换至工作状态。
3.根据权利要求1所述的一种家用电器用离线语音遥控器,其特征在于,所述语音采集模块包括:
语音信号预采集单元,用于实时监测用户发送的语音信号,并对所述语音信号进行分析,确定所述语音信号的信号强度以及目标信号来源方向;
配置单元,用于当所述信号强度满足预设条件时,确定所述信号强度与预设基准信号强度的目标差值,并基于所述目标差值确定信号放大倍数;
语音采集单元,还用于基于目标来源方向调整离线语音遥控器中的预设麦克风阵列,并基于调整结果采集目标信号来源方向上用户发送的离线语音信号;
所述语音采集单元,还用于基于所述信号放大倍数对所述离线语音信号的信号强度进行调整,并将调整后的离线语音信号进行输出。
4.根据权利要求3所述的一种家用电器用离线语音遥控器,其特征在于,所述语音采集单元包括:
语音信号获取子单元,用于获取采集到的离线语音信号,并对所述离线语音信号进行端点检测,得到所述离线语音信号对应的有声数据;
数据校验子单元,用于提取所述有声数据的数据特征,并基于所述数据特征确定有声数据的声音图谱,且基于所述声音图谱确定所述有声数据是否为有效语音信号;
执行子单元,用于当所述有声数据为有效语音信号时,判定接收到的离线语音信号合格,否则,重新采集用户输入的离线语音信号。
5.根据权利要求1所述的一种家用电器用离线语音遥控器,其特征在于,所述第二语音识别单元包括:
信号获取子单元,用于获取得到的标准离线语音信号,并基于预设检测方法确定所述标准离线语音信号的语音端点,且基于所述语音端点将所述标准离线语音信号进行断句,得到语句集合,其中,所述语句集合中至少包含一条语句;
模型构建子单元,用于获取历史训练数据,并确定所述历史训练数据的语义标签,且基于所述语义标签构建语义识别模型;
语义识别子单元,用于基于所述语义识别模型对所述语句集合中每一语句进行解码,得到每一语句的目标语义。
6.根据权利要求1所述的一种家用电器用离线语音遥控器,其特征在于,所述第二语音识别单元包括:
识别结果获取子单元,用于获取所述标准离线语音信号对应的目标语义,并提取所述目标语义的第一语义特征;
识别结果筛选子单元,用于确定第一语义特征的置信度,并基于所述置信度对所述第一语义特征对应的目标语义进行第一筛选;
所述识别结果筛选子单元,还用于获取离线语音遥控器中预设离线语音的第二语义特征,并将所述第二语义特征与第一筛选处理后的目标语义的第一语义特征进行匹配,且基于匹配结果对所述第一语义特征对应的目标语义进行第二筛选,得到标准目标语义,并将所述标准目标语义作为最终的识别结果。
7.根据权利要求1所述的一种家用电器用离线语音遥控器,其特征在于,所述识别结果分析单元包括:
结果分析子单元,用于获取离线语音信号对应的控制目的,并基于所述控制目的确定所述离线语音信号的控制类型,其中,所述控制类型包括预约控制以及立即控制;
控制模式设定子单元,用于当所述控制类型为预约控制时,基于所述控制目的确定离线语音信号对应的预约时长以及待控制功能类型;
所述控制模式设定子单元,用于将所述预约时长以及待控制功能类型在预设控制列表中进行记录,并实时监测当前时刻信息,且当所述当前时刻信息达到预约时长时,基于所述待控制功能类型控制所述目标控制电器执行相应的功能。
8.根据权利要求1所述的一种家用电器用离线语音遥控器,其特征在于,所述控制单元包括:
执行结果获取子单元,用于获取基于离线语音遥控器对不同目标控制电器的控制参数,并确定不同控制参数的时间信息以及控制结果信息;
记录子单元,用于将所述控制参数以及对应的时间信息和控制结果信息进行记录,并基于记录结果评估基于离线语音遥控器对不同目标控制电器的控制效果,且将评估结果传输至用户智能终端。
CN202210948521.4A 2022-08-09 2022-08-09 一种家用电器用离线语音遥控器 Active CN115331670B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210948521.4A CN115331670B (zh) 2022-08-09 2022-08-09 一种家用电器用离线语音遥控器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210948521.4A CN115331670B (zh) 2022-08-09 2022-08-09 一种家用电器用离线语音遥控器

Publications (2)

Publication Number Publication Date
CN115331670A CN115331670A (zh) 2022-11-11
CN115331670B true CN115331670B (zh) 2023-06-23

Family

ID=83921376

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210948521.4A Active CN115331670B (zh) 2022-08-09 2022-08-09 一种家用电器用离线语音遥控器

Country Status (1)

Country Link
CN (1) CN115331670B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117784632B (zh) * 2024-02-28 2024-05-14 深圳市轻生活科技有限公司 一种基于离线语音识别的智能家居控制系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106847276A (zh) * 2015-12-30 2017-06-13 昶洧新能源汽车发展有限公司 一种带方言识别的话音控制系统
CN110493092A (zh) * 2019-08-28 2019-11-22 深圳市云之尚网络科技有限公司 基于远场语音和iot的万能遥控以及家电遥控方法
CN113205810A (zh) * 2021-05-06 2021-08-03 北京汇钧科技有限公司 语音信号处理方法、装置、介质、遥控器及服务器

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050043948A1 (en) * 2001-12-17 2005-02-24 Seiichi Kashihara Speech recognition method remote controller, information terminal, telephone communication terminal and speech recognizer
CN105654943A (zh) * 2015-10-26 2016-06-08 乐视致新电子科技(天津)有限公司 一种语音唤醒方法、装置及系统
US10347244B2 (en) * 2017-04-21 2019-07-09 Go-Vivace Inc. Dialogue system incorporating unique speech to text conversion method for meaningful dialogue response
CN209642689U (zh) * 2018-12-20 2019-11-15 深圳市朗强科技有限公司 一种基于声控的红外遥控器及电器控制系统
CN109561003A (zh) * 2018-12-20 2019-04-02 深圳市朗强科技有限公司 一种基于声控的红外遥控器及电器控制系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106847276A (zh) * 2015-12-30 2017-06-13 昶洧新能源汽车发展有限公司 一种带方言识别的话音控制系统
CN110493092A (zh) * 2019-08-28 2019-11-22 深圳市云之尚网络科技有限公司 基于远场语音和iot的万能遥控以及家电遥控方法
CN113205810A (zh) * 2021-05-06 2021-08-03 北京汇钧科技有限公司 语音信号处理方法、装置、介质、遥控器及服务器

Also Published As

Publication number Publication date
CN115331670A (zh) 2022-11-11

Similar Documents

Publication Publication Date Title
CN108962255B (zh) 语音会话的情绪识别方法、装置、服务器和存储介质
US5794196A (en) Speech recognition system distinguishing dictation from commands by arbitration between continuous speech and isolated word modules
EP1199708B1 (en) Noise robust pattern recognition
KR100826875B1 (ko) 온라인 방식에 의한 화자 인식 방법 및 이를 위한 장치
WO2017084360A1 (zh) 一种用于语音识别方法及系统
CN111294258A (zh) 一种控制智能家居设备的语音交互系统及方法
US7373301B2 (en) Method for detecting emotions from speech using speaker identification
TW201830377A (zh) 一種語音端點檢測方法及語音辨識方法
CN104575504A (zh) 采用声纹和语音识别进行个性化电视语音唤醒的方法
CN105206271A (zh) 智能设备的语音唤醒方法及实现所述方法的系统
JPH0968994A (ja) パターンマッチングによる単語音声認識方法及びその方法を実施する装置
US11100932B2 (en) Robust start-end point detection algorithm using neural network
CN112614514B (zh) 有效语音片段检测方法、相关设备及可读存储介质
CN108091340B (zh) 声纹识别方法、声纹识别系统和计算机可读存储介质
CN115331670B (zh) 一种家用电器用离线语音遥控器
CN110827853A (zh) 语音特征信息提取方法、终端及可读存储介质
US20230206924A1 (en) Voice wakeup method and voice wakeup device
Dave et al. Speech recognition: A review
Ghosal et al. Automatic male-female voice discrimination
US11961510B2 (en) Information processing apparatus, keyword detecting apparatus, and information processing method
Noh et al. Smart home with biometric system recognition
CN115691478A (zh) 语音唤醒方法、装置、人机交互设备和存储介质
CN111128127A (zh) 一种语音识别处理方法及装置
CN111048068A (zh) 语音唤醒方法、装置、系统及电子设备
CN110808050A (zh) 语音识别方法及智能设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240326

Address after: 518000 2201 and 2301, building 1, Chongwen Park, Nanshan Zhiyuan, No. 3370 Liuxian Avenue, Fuguang community, Taoyuan Street, Nanshan District, Shenzhen, Guangdong

Patentee after: SHENZHEN MICHOI IOT CO.,LTD.

Country or region after: China

Address before: 518000 2203, building 1, Chongwen Park, Nanshan Zhiyuan, No. 3370 Liuxian Avenue, Fuguang community, Taoyuan Street, Nanshan District, Shenzhen, Guangdong

Patentee before: Shenzhen Macchi Information Technology Co.,Ltd.

Country or region before: China

TR01 Transfer of patent right