CN107039041A - 语音扩展的方法与语音助手 - Google Patents

语音扩展的方法与语音助手 Download PDF

Info

Publication number
CN107039041A
CN107039041A CN201710187756.5A CN201710187756A CN107039041A CN 107039041 A CN107039041 A CN 107039041A CN 201710187756 A CN201710187756 A CN 201710187756A CN 107039041 A CN107039041 A CN 107039041A
Authority
CN
China
Prior art keywords
voice
accessory
main frame
chip
voice signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710187756.5A
Other languages
English (en)
Other versions
CN107039041B (zh
Inventor
李开
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GD Midea Air Conditioning Equipment Co Ltd
Original Assignee
Guangdong Midea Refrigeration Equipment Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Midea Refrigeration Equipment Co Ltd filed Critical Guangdong Midea Refrigeration Equipment Co Ltd
Priority to CN201710187756.5A priority Critical patent/CN107039041B/zh
Publication of CN107039041A publication Critical patent/CN107039041A/zh
Application granted granted Critical
Publication of CN107039041B publication Critical patent/CN107039041B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/54Systems for transmission via power distribution lines

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Power Engineering (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种语音扩展的方法,语音扩展的方法应用于接入交流电的语音设备,语音设备包括主机和多个配件,主机上装有语音识别芯片;语音扩展的方法包括以下步骤:当语音设备采集到语音信号时,判断采集到语音信号的语音设备是否为配件,若采集到语音信号的语音设备为配件,则将语音信号通过电力线传输至主机,控制语音识别芯片对接收的语音信号进行识别,以生成对应的反馈语音数据,将反馈语音数据通过电力线传输至对应配件,以供配件播报反馈语音数据。本发明还公开了语音扩展的方法对应的语音助手。本发明通过电力线载波实现了语音信号的传输,增加了语音设备的适用范围。

Description

语音扩展的方法与语音助手
技术领域
本发明涉及人工智能领域,尤其涉及语音扩展的方法与语音助手。
背景技术
随着语音识别技术和人工智能的发展,语音交互主要应用到具有语音播报功能的产品上。
具有语音播报功能的产品主要是通过麦克风采集人的声音信号,并对采集到的声音信号进行语音识别和语义理解,然后根据对应的语境来生成对应的回答,然后转化为声音数据传回到用户端,通过扬声器播报出来,实现与人实时交互的目的。现有具有语音播报功能的产品基本都是一个整体,如果用户把具有语音播报功能的产品放在客厅,那么用户在卧室、厨房、厕所等地方进行语音对话的时候,由于距离比较远语音识别效果很差,导致具有语音播报功能的产品基本无法识别语音信号,无法实现人机交互,限制了具有语音播报功能的产品的适用范围。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种语音扩展的方法与语音助手,扩大了语音设备的适用范围。
为实现上述目的,本发明提供的一种语音扩展的方法,语音扩展的方法应用于接入交流电的语音设备,语音设备包括主机和多个配件,主机上装有语音识别芯片;语音扩展的方法包括以下步骤:
当语音设备采集到语音信号时,判断采集到语音信号的语音设备是否为配件;
若采集到语音信号的语音设备为配件,则将语音信号通过电力线传输至主机;
控制语音识别芯片对接收的语音信号进行识别,以生成对应的反馈语音数据;
将反馈语音数据通过电力线传输至对应配件,以供配件播报反馈语音数据。
可选地,语音设备的主机与配件上分别安装有电力线载波芯片;当语音设备采集到语音信号时,判断采集到语音信号的语音设备是否为配件的步骤之前包括:
当主机和配件检测到配对指令时,第一芯片通过电力线发送配对信息至第二芯片;以供第二芯片基于配对信息进行主机和配件的配对,其中,将主机安装的电力线载波芯片作为第一芯片,配件安装的电力线载波芯片作为第二芯片。
可选地,当语音设备采集到语音信号时,判断采集到语音信号的语音设备是否为配件的步骤之后包括:
若采集到语音信号的语音设备不是配件,则控制语音识别芯片对语音信号识别,并生成信号回复数据;
将语音识别芯片生成的信号回复数据发送至主机播报芯片,以利用主机播报。
可选地,控制语音识别芯片对接收的语音信号进行识别,以生成对应的反馈语音数据的步骤包括:
若采集到语音信号的语音设备为配件,且有多个配件或主机同时采集到语音信号;
控制语音识别芯片对接收的多个语音信号进行识别,判断多个语音信号的相似度;
根据多个语音信号的相似度,选择处理的语音信号并生成对应的反馈语音数据。
可选地,语音信号强度与语音设备到人的距离成正比,将反馈语音数据通过电力线传输至对应配件,以供配件播报反馈语音数据包括:
控制语音识别芯片识别多个语音信号的语义,判断多个语音信号的相似度并生成对应的反馈语音数据;
若识别多个语音信号的语义相同,则选择选择一个语音信号处理生成反馈语音数据并通过语音信号较强的配件或主机播报;
若识别多个语音信号的语义不同,则分别处理多个语音信号并生成反馈语音数据,并将反馈语音数据通过电力线传输至对应配件播报。
此外,为实现上述目的,本发明还提供一种语音助手,语音助手为接入交流电的语音设备,语音助手包括主机和多个配件,主机上装有语音识别芯片;语音助手包括:
语音采集模块,用于当语音设备采集到语音信号时,判断采集到语音信号的语音设备是否为配件;
语音传输模块,用于若采集到语音信号的语音设备为配件,则将语音信号通过电力线传输至主机;
识别生成模块,用于控制语音识别芯片对接收的语音信号进行识别,以生成对应的反馈语音数据;
语音播报模块,用于将反馈语音数据通过电力线传输至对应配件,以供配件播报反馈语音数据。
可选地,语音助手的主机与配件上分别安装有电力线载波芯片;语音助手包括装置配对模块,装置配对模块,用于:
当主机和配件检测到配对指令时,第一芯片通过电力线发送配对信息至第二芯片;以供第二芯片基于配对信息进行主机和配件的配对,其中,将主机安装的电力线载波芯片作为第一芯片,配件安装的电力线载波芯片作为第二芯片。
可选地,语音助手还包括主机采集模块,主机采集模块,用于:
若采集到语音信号的语音设备不是配件,则控制语音识别芯片对语音信号识别,并生成信号回复数据;
将语音识别芯片生成的信号回复数据发送至主机播报芯片,以利用主机播报。
可选地,若采集到语音信号的语音设备为配件,且有多个配件或主机同时采集到语音信号;
识别生成模块包括:
语音识别单元,用于控制语音识别芯片对接收的多个语音信号进行识别,判断多个语音信号的相似度;
信号选择单元,用于根据多个语音信号的相似度,选择处理的语音信号并生成对应的反馈语音数据。
可选地,语音信号强度与语音设备到人的距离成正比,语音设备语义判断确定说话的内容是否相同,语音判断确定说话人是否相同;控制语音识别芯片识别多个语音信号的语义,判断多个语音信号的相似度并生成对应的反馈语音数据;
语音播报模块包括:
选择播报单元,用于若识别多个语音信号的语义相同,则选择选择一个语音信号处理生成反馈语音数据并通过语音信号较强的配件或主机播报;
识别播报单元,用于若识别多个语音信号的语义不同,则分别处理多个语音信号并生成反馈语音数据,并将反馈语音数据通过电力线传输至对应配件播报。
本发明提供的一种语音扩展的方法,语音扩展的方法应用于接入交流电的语音设备,语音设备包括主机和多个配件,主机上装有语音识别芯片;语音扩展的方法包括以下步骤:当语音设备采集到语音信号时,判断采集到语音信号的语音设备是否为配件,若采集到语音信号的语音设备为配件,则将语音信号通过电力线传输至主机,控制语音识别芯片对接收的语音信号进行识别,以生成对应的反馈语音数据,将反馈语音数据通过电力线传输至对应配件,以供配件播报反馈语音数据;本发明将电力载波应用到语音设备的语音拓展上,将语音设备的主机放置到一个房间,其他房间安装语音设备配件,当用户在其他房间说话时,配件接收语音信号,通过电力线发送至主机,增加了语音设备的适用范围,以此同时,当多个配件或者语音设备的主机与配件同时接收到语音信号时,可以针对多个语音信号进行识别,实现多用户的语音识别,增加了语音设备适用的便捷性。
附图说明
图1为本发明语音拓展的方法与语音助手的具体场景示意图;
图2为本发明语音拓展的方法第一实施例的流程示意图;
图3为本发明语音拓展的方法第二实施例的流程示意图;
图4为图2中语音拓展的方法的步骤S30的细化流程示意图;
图5为图2中语音拓展的方法的步骤S40的细化流程示意图;
图6为本发明语音助手第一实施例的功能模块示意图;
图7为本发明语音助手第二实施例的功能模块示意图;
图8为图6中语音助手中识别生成模块30的细化功能模块示意图;
图9为图6中语音助手中语音播报模块40的细化功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
语音识别技术,也被称为自动语音识别(英语:Automatic Speech Recognition,ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容;语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译。
需要说明的是电力线载波Power Line Carrier-PLC(PLC)是电力系统特有的通信方式,电力线载波通讯是指利用现有电力线,通过载波方式将模拟或数字信号进行高速传输的技术;不需要重新架设网络,只要有电线,就能进行数据传递;电力线在电力载波领域一般分为高中低3类,通常高压电力线指35kV及以上电压等级、中压电力线指10kV电压等级或低压配电线380/220V用户线;电力线载波是需要利用到电力线载波芯片,电力线载波芯片是通过电力线实现调制解调功能的专用芯片,其基础功能是使得在电力线上的用电器能够实现双向通信(在本发明中所涉及到的电力线载波芯片具有双向通信的功能,可将本发明中涉及到的电力线载波芯片理解为向电力线发送信号,或者接收电力线中信号的模块,其功能不限于发送和接收电力线中的信息),以达到用电器的测量、传感、控制等智能化目标,是各类终端产品进行PLC通信的核心部件之一,电力载波通信芯片集成于载波电能表、采集器、集中器中,用于自动抄读电能量数据,是电网公司用电信息采集系统的核心部件,而用电信息采集系统是智能电网建设的重要组成部分。
本发明提供一种语音扩展的方法。
参照图1,图1为本发明的应用具体应用场景示意图,将语音设备接入交流电源,通过电力线载波来扩展语音输入和输出的功能,保留现有语音设备的功能,本发明所述语音设备(即,语音助手)包括主机和多个配件,每个配件直接接入到交流电源进行工作,配件中都带有麦克风模块和扬声器模块,用户在使用前期需要将配件和主机进行配对,配件采集到用户的声音,将发给主机进行识别,如果识别完成后,主机将回复播报的语音通过电力线发送至配件,由配件来进行播报,这样即使配件放在卧室主机放在客厅,也能够通过卧室的配件进行语音交流。
参考图2,在本发明一种语音扩展的方法第一实施例中,语音扩展的方法应用于接入交流电的语音设备,语音设备包括主机和多个配件,主机上装有语音识别芯片;语音扩展的方法包括以下步骤:
步骤S10,当语音设备采集到语音信号时,判断采集到语音信号的语音设备是否为配件。
具体地,用户讲话的声音形成对应的语音信号,语音设备的主机和配件均安装有声音采集装置(声音采集装置:麦克风或者其他具有声音采集功能的芯片),当主机和配件采集到语音信号时,将语音信号传输至语音识别芯片,对语音信号进行识别输出,这里需要对采集到语音信号的组件进行判断,不同的组件采集到语音信号传输的方式不同,主机采集到语音信息号可直接处理语音信号,而将语音信号传输至配件,配件采集到语音信号时需要将语音信号传输至主机,主机实现语音信号的处理
需要补充说明的是可能出现,主机和设备同时接收到语音信号的情况,所以在语音设备主机采集到语音信号时,可结合主机到配件的距离等待一段时间(即,确定是否有配件采集到语音信号,并通过电力线传输至主机),若没有接收到配件传输的语音信号则直接处理主机接收到的语音信号,若接收到配件传输的语音信号,则比较多个语音信号的内容是否相同,在语音内容相同时,比较多个语音信号的强弱进行语音信号的选择处理。
步骤S20,若采集到语音信号的语音设备为配件,则将语音信号通过电力线传输至主机。
在语音设备配件采集到语音信号时(即,可能出现多个配件采集到语音信号,或主机和配件采集到语音信号,在本实施例中围绕配件采集到语音信号),由于配件具有语音采集、语音传输和语音播报功能,但是不具有语音处理功能,配件需要将采集到的语音信号通过电力线传输至主机,主机进行语音信号的处理识别。
步骤S30,控制语音识别芯片对接收的语音信号进行识别,以生成对应的反馈语音数据。
语音设备主机接收经电力线传输语音信号,并控制语音识别芯片对接收的语音信号进行识别,语音识别芯片将接收到的语音信号利用本地数据库,或者发送至云端数据库,主机语音识别芯片将语音信号生成对应的反馈语音数据。
步骤S40,将反馈语音数据通过电力线传输至对应配件,以供配件播报反馈语音数据。
主机将语音识别芯片产生的将反馈语音数据通过电力线传输至对应配件,这里需要补充说明的是,本发明提出的语音拓展方法,可以将主机和多个配件接收到的语音信号同时处理,并将处理得到的反馈语音数据通过电力线传输至对应的配件,配件接收反馈语音数据并进行播报。
在本实施例中本发明将语音拓展方法,是基于现有的语音设备做了改进,将具有语音处理识别功能的语音设备作为主机,将具有语音播报功能和语音采集功能的作为配件,通过电力线载波将配件接收到的语音信号传输至主机,主机接收处理后生成反馈信息并回传至配件播报,克服了现有的语音设备小范围处理语音信号的弊端,用户可以在不同的地方讲话,被语音设备识别并回复,使用户使用更加便捷,增加了语音设备的使用范围。
在本发明的第二实施例中,语音设备的主机与配件上分别安装有电力线载波芯片;步骤S10之前包括:
当主机和配件检测到配对指令时,第一芯片通过电力线发送配对信息至第二芯片;以供第二芯片基于配对信息进行主机和配件的配对,其中,将主机安装的电力线载波芯片作为第一芯片,配件安装的电力线载波芯片作为第二芯片。
具体地,将语音设备的主机与配件进行配对,使主机接收到多个配件发送的语音信息,而配件可发送语音信号至主机,并接收主机发送的反馈语音数据,即,在语音设备的主机和配件上都安装电力线载波芯片,将主机安装的电力线载波芯片作为第一芯片,配件安装的电力线载波芯片作为第二芯片,在用户触发语音设备配对指令时,主机和配件同时检测到配对指令,主机的第一芯片通过电力线发送配对信息(配对信息:包含主机和配件配对所需信息,和主机和配件的加密信息,基于配对信息主机和配件可以实现语音信号的传输和接收)至第二芯片,配件的第二芯片基于配对信息进行主机和配件的配对。
在本实施例中语音设备的主机与配件上分别安装有电力线载波芯片,通过电力线载波芯片将主机和配件进行配对,使配件与主机信息通过电力线稳定的传输至对应的语音设备,不会出现传输接收错误的问题,以实现语音设备的语音拓展的功能。
参考图3,在本发明语音扩展的方法第三实施例中,步骤S10之后包括:
步骤S50,若采集到语音信号的语音设备不是配件,则控制语音识别芯片对语音信号识别,并生成信号回复数据。
当采集到语音信号的语音设备不是配件,即,语音设备的主机采集到语音信号,与配件采集到语音信号不同,语音信号不需要经过电力线传输,而直接将语音信号从语音采集芯片传输至语音识别芯片,控制语音识别芯片对语音信号识别,并基于采集到的语音信息生成信号回复数据(信号回复数据:主机语音识别芯片针对语音信号进行识别产生的语音回复数据,与反馈语音数据相同,为了区别主机与配件采集到的语音信号发送传输的过程不同,而做的名词区分)。
步骤S60,将语音识别芯片生成的信号回复数据发送至主机播报芯片,以利用主机播报。
将语音识别芯片生成的信号回复数据发送至主机播报芯片(播报芯片:具有语音播报功能的芯片,如,扬声器等),利用主机播报。
在本实施例中若采集到语音信号的语音设备不是配件,则控制语音识别芯片对语音信号识别,并生成信号回复数据,将语音识别芯片生成的信号回复数据发送至主机播报芯片,以利用主机播报;说明了主机采集到语音信号时,将语音信号从采集芯片传输至语音识别芯片,语音识别芯片将语音信号处理后传输至语音播报芯片进行播报语音,最终实现了语音信号的处理,实现了多条路径处理语音信息。
参考图4,在本实施例中若采集到语音信号的语音设备为配件,且有多个配件或主机同时采集到语音信号;步骤S30包括:
步骤S31,控制语音识别芯片对接收的多个语音信号进行识别,判断多个语音信号的相似度。
语音设备的主机根据用户的使用习惯安装在不同位置,由于人语音的强度(语音的强度:可理解为语音的分贝,由于语音是声波形式的会受到距离的影响,距离较远时语音衰减较大)不同出现:多个配件、主机和配件、配件单独接收到语音信号的情况,本实施例中用多个配件采集到语音信号为例说明语音设备信号处理的规则。
语音识别芯片接收到多个语音信号时,对多个语音信号进行识别,判断多个语音信号的相似度(相似度:即语音识别芯片将接收到的语音信号生成相应的数据,从而判断语音的内容是否一致,说话的人是否是同一个),以选择需要处理的语音信号。
步骤S32,根据多个语音信号的相似度,选择处理的语音信号并生成对应的反馈语音数据。
利用语音识别芯片根据多个语音信号的相似度,确定语音内容是否一致,说话的人是否为一个,最终选择处理的语音信号,并生成对应的反馈语音数据;如,语音设备可能出现两个人同时询问语音设备:今天天气如何?不同的语音设备配件检测到,可能只需要处理一次语音信号,但是需要将处理后的反馈信号同时发送至不同配件,进行信号的播报回复。
在本实施例中若采集到语音信号的语音设备为配件,且有多个配件或主机同时采集到语音信号,控制语音识别芯片对接收的多个语音信号进行识别,判断多个语音信号的相似度;根据多个语音信号的相似度,选择处理的语音信号并生成对应的反馈语音数据;本实施例中针对多配件采集到语音信号做分析识别,语音设备可针对多个用户发送的语音信号做处理,或者仅处理一个语音信号在不同的配件进行播报,实现了语音设备多语音信号的分析处理,拓展了语音设备的功能。
参考图5,在本实施例中,语音信号强度与语音设备到人的距离成正比,语音设备语义判断确定说话的内容是否相同,语音判断确定说话人是否相同;控制语音识别芯片识别多个语音信号的语义,判断多个语音信号的相似度并生成对应的反馈语音数据;步骤S40包括:
步骤S41,若识别多个语音信号的语义相同,则选择选择一个语音信号处理生成反馈语音数据并通过语音信号较强的配件或主机播报。
根据语音识别芯片对语音信号的分析,识别语音信号的语音和语义,语义识别得到语音的内容是否一致,语音识别可判断说话的人是否为同一人,若识别多个语音信号的语义相同(如,多个语音信号的语义相同可能出现几种情况:1、一个说话人,声音被语音设备多个配件采集到,则只要处理一个语音信号,并将得到的反馈信息通过语音信号较强的配件或主机播报;2、多个说话人同时说相同的话,声音被语音设备多个配件采集到,还可能出现:2a、多个说话人在同一房间,将处理一个语音信号,并将得到的反馈信息通过语音信号较强的配件或主机播报,2b、多个说话人在不同房间,将处理一个语音信号,并将得到的反馈信息通过电力线传输至对应的配件进行语音播报),则选择选择一个语音信号处理生成反馈语音数据,是为防止语音播报混乱,利用采集到语音信号较强的配件进行播报。
步骤S42,若识别多个语音信号的语义不同,则分别处理多个语音信号并生成反馈语音数据,并将反馈语音数据通过电力线传输至对应配件播报。
若识别多个语音信号的语义不同(即,多个配件检测得到的语音信号中说话的内容不同,需要对多个语音信号进行分析,在进一步检测语音是否相同,是否是同一个人的声音,是为了更加精确的得到语音信息,避免配件接收到两个叠加的语音信号处理困难,如,配件A接收到甲说的话,配件B接收到乙说的话,且甲乙说话的内容不同,则分别处理两个语音信号),分别处理多个语音信号并生成反馈语音数据,并将反馈语音数据通过电力线传输至对应配件播报(需要补充说明的是,语音设备可针对语音信号的语音进行分析确定说话人,并根据说话人的选择语音配件进行语音回复,或者将语音信号的语义与语音结合分析,以实现语音设备的语音播报)。
在本实施例中,语音设备将接收到的语音信号通过语音和语义的识别确定需要处理的语音信号,并将处理得到的语音信号发送至对应的配件进行播报,本实施例中具体讲解了语音拓展过程中接收到多条语音信号时,语音处理的流程,通过多个语音的处理最终实现语音设备的语音拓展,实现多用户同时语音信号的分析。
参考图6,在本发明一种语音助手第一实施例中,语音助手接入交流电的语音助手,语音助手包括主机和多个配件,主机上装有语音识别芯片;语音助手包括:
语音采集模块10,用于当语音助手采集到语音信号时,判断采集到语音信号的语音助手是否为配件。
具体地,用户讲话的声音形成对应的语音信号,语音助手的主机和配件均安装有声音采集装置(声音采集装置:麦克风或者其他具有声音采集功能的芯片),当主机和配件采集到语音信号时,语音采集模块10将语音信号传输至语音识别芯片,对语音信号进行识别输出,这里需要对采集到语音信号的组件进行判断,不同的组件采集到语音信号传输的方式不同,主机采集到语音信息号可直接处理语音信号,而将语音信号传输至配件,配件采集到语音信号时需要将语音信号传输至主机,主机实现语音信号的处理。
需要补充说明的是可能出现,主机和设备同时接收到语音信号的情况,所以在语音设备主机采集到语音信号时,可结合主机到配件的距离等待一段时间(即,确定是否有配件采集到语音信号,并通过电力线传输至主机),若没有接收到配件传输的语音信号则直接处理主机接收到的语音信号,若接收到配件传输的语音信号,则比较多个语音信号的内容是否相同,在语音内容相同时,比较多个语音信号的强弱进行语音信号的选择处理。
语音传输模块20,用于若采集到语音信号的语音助手为配件,则将语音信号通过电力线传输至主机。
在语音助手配件采集到语音信号时(即,可能出现多个配件采集到语音信号,或主机和配件采集到语音信号,在本实施例中围绕配件采集到语音信号),由于配件具有语音采集、语音传输和语音播报功能,但是不具有语音处理功能,配件需要将采集到的语音信号通过语音传输模块20电力线传输至主机,主机进行语音信号的处理识别。
识别生成模块30,用于控制语音识别芯片对接收的语音信号进行识别,以生成对应的反馈语音数据。
语音助手主机接收经电力线传输语音信号,识别生成模块30并控制语音识别芯片对接收的语音信号进行识别,语音识别芯片将接收到的语音信号利用本地数据库,或者发送至云端数据库,主机语音识别芯片将语音信号生成对应的反馈语音数据。
语音播报模块40,用于将反馈语音数据通过电力线传输至对应配件,以供配件播报反馈语音数据。
主机语音播报模块40将语音识别芯片产生的将反馈语音数据通过电力线传输至对应配件,这里需要补充说明的是,本发明提出的语音拓展方法,可以将主机和多个配件接收到的语音信号同时处理,并将处理得到的反馈语音数据通过电力线传输至对应的配件,配件接收反馈语音数据并进行播报。
在本实施例中本发明基于现有的语音助手做了改进,将具有语音处理识别功能的语音助手作为主机,将具有语音播报功能和语音采集功能的作为配件,通过电力线载波将配件接收到的语音信号传输至主机,主机接收处理后生成反馈信息并回传至配件播报,克服了现有的语音助手小范围处理语音信号的弊端,用户可以在不同的地方讲话,被语音助手识别并回复,使用户使用更加便捷,增加了语音助手的使用范围。
参考图7,在本发明的第二实施例中,语音助手的主机与配件上分别安装有电力线载波芯片;语音助手包括装置配对模块50,装置配对模块50,用于:
当主机和配件检测到配对指令时,第一芯片通过电力线发送配对信息至第二芯片;以供第二芯片基于配对信息进行主机和配件的配对,其中,将主机安装的电力线载波芯片作为第一芯片,配件安装的电力线载波芯片作为第二芯片。
具体地,将语音助手装置配对模块50的主机与配件进行配对,使主机接收到多个配件发送的语音信息,而配件可发送语音信号至主机,并接收主机发送的反馈语音数据,即,在语音助手的主机和配件上都安装电力线载波芯片,将主机安装的电力线载波芯片作为第一芯片,配件安装的电力线载波芯片作为第二芯片,在用户触发语音助手配对指令时,主机和配件同时检测到配对指令,装置配对模块50主机的第一芯片通过电力线发送配对信息(配对信息:包含主机和配件配对所需信息,和主机和配件的加密信息,基于配对信息主机和配件可以实现语音信号的传输和接收)至第二芯片,配件的第二芯片基于配对信息进行主机和配件的配对。
在本实施例中语音助手的主机与配件上分别安装有电力线载波芯片,通过电力线载波芯片将主机和配件进行配对,使配件与主机信息通过电力线稳定的传输至对应的语音助手,不会出现传输接收错误的问题,以实现语音助手的语音拓展的功能。
参考图7,在本实施例中语音助手还包括主机采集模块60,主机采集模块60,用于:
若采集到语音信号的语音助手不是配件,则控制语音识别芯片对语音信号识别,并生成信号回复数据。
当采集到语音信号的语音助手不是配件,即,语音助手的主机采集到语音信号,与配件采集到语音信号不同,语音信号不需要经过电力线传输,主机采集模块60直接将语音信号从语音采集芯片传输至语音识别芯片,控制语音识别芯片对语音信号识别,并基于采集到的语音信息生成信号回复数据(信号回复数据:主机语音识别芯片针对语音信号进行识别产生的语音回复数据,与反馈语音数据相同,为了区别主机与配件采集到的语音信号发送传输的过程不同,而做的名词区分)。
将语音识别芯片生成的信号回复数据发送至主机播报芯片,以利用主机播报。
将语音识别芯片主机采集模块60生成的信号回复数据发送至主机播报芯片(播报芯片:具有语音播报功能的芯片,如,扬声器等),利用主机播报。
在本实施例中若采集到语音信号的语音助手不是配件,则控制语音识别芯片对语音信号识别,并生成信号回复数据,将语音识别芯片生成的信号回复数据发送至主机播报芯片,以利用主机播报;说明了主机采集到语音信号时,将语音信号从采集芯片传输至语音识别芯片,语音识别芯片将语音信号处理后传输至语音播报芯片进行播报语音,最终实现了语音信号的处理,实现了多条路径处理语音信息。
参考图8,在本实施例中若采集到语音信号的语音助手为配件,且有多个配件或主机同时采集到语音信号;识别生成模块30包括:
语音识别单元31,用于控制语音识别芯片对接收的多个语音信号进行识别,判断多个语音信号的相似度。
语音助手的主机根据用户的使用习惯安装在不同位置,由于人语音的强度(语音的强度:可理解为语音的分贝,由于语音是声波形式的会受到距离的影响,距离较远时语音衰减较大)不同出现:多个配件、主机和配件、配件单独接收到语音信号的情况,本实施例中用多个配件采集到语音信号为例说明语音助手信号处理的规则。
语音识别芯片接收到多个语音信号时,语音识别单元31对多个语音信号进行识别,判断多个语音信号的相似度(相似度:即语音识别芯片将接收到的语音信号生成相应的数据,从而判断语音的内容是否一致,说话的人是否是同一个),以选择需要处理的语音信号。
信号选择单元32,用于根据多个语音信号的相似度,选择处理的语音信号并生成对应的反馈语音数据。
利用语音识别芯片根据多个语音信号的相似度,信号选择单元32确定语音内容是否一致,说话的人是否为一个,最终选择处理的语音信号,并生成对应的反馈语音数据;如,语音助手可能出现两个人同时询问语音助手:今天天气如何?不同的语音助手配件检测到,可能只需要处理一次语音信号,但是需要将处理后的反馈信号同时发送至不同配件,进行信号的播报回复。
在本实施例中若采集到语音信号的语音助手为配件,且有多个配件或主机同时采集到语音信号,控制语音识别芯片对接收的多个语音信号进行识别,判断多个语音信号的相似度;根据多个语音信号的相似度,选择处理的语音信号并生成对应的反馈语音数据;本实施例中针对多配件采集到语音信号做分析识别,语音助手可针对多个用户发送的语音信号做处理,或者仅处理一个语音信号在不同的配件进行播报,实现了语音助手多语音信号的分析处理,拓展了语音助手的功能。
参考图9,在本实施例中,语音信号强度与语音助手到人的距离成正比,语音设备语义判断确定说话的内容是否相同,语音判断确定说话人是否相同;控制语音识别芯片识别多个语音信号的语义,判断多个语音信号的相似度并生成对应的反馈语音数据;语音播报模块40包括:
选择播报单元41,用于若识别多个语音信号的语义相同,则选择选择一个语音信号处理生成反馈语音数据并通过语音信号较强的配件或主机播报。
根据语音识别芯片对语音信号的分析,识别语音信号的语音和语义,语义识别得到语音的内容是否一致,语音识别可判断说话的人是否为同一人,若识别多个语音信号的语义相同(如,多个语音信号的语义相同可能出现几种情况:1、一个说话人,声音被语音助手多个配件采集到,则只要处理一个语音信号,并将得到的反馈信息通过语音信号较强的配件或主机播报;2、多个说话人同时说相同的话,声音被语音助手多个配件采集到,还可能出现:2a、多个说话人在同一房间,将处理一个语音信号,并将得到的反馈信息通过语音信号较强的配件或主机播报,2b、多个说话人在不同房间,将处理一个语音信号,并将得到的反馈信息通过电力线传输至对应的配件进行语音播报),则选择播报单元41选择一个语音信号处理生成反馈语音数据,是为防止语音播报混乱,利用采集到语音信号较强的配件进行播报。
识别播报单元42,用于若识别多个语音信号的语义不同,则分别处理多个语音信号并生成反馈语音数据,并将反馈语音数据通过电力线传输至对应配件播报。
若识别多个语音信号的语义不同(即,多个配件检测得到的语音信号中说话的内容不同,需要对多个语音信号进行分析,在进一步检测语音是否相同,是否是同一个人的声音,是为了更加精确的得到语音信息,避免配件接收到两个叠加的语音信号处理困难,如,配件A接收到甲说的话,配件B接收到乙说的话,且甲乙说话的内容不同,则分别处理两个语音信号),分别处理多个语音信号并生成反馈语音数据,识别播报单元42并将反馈语音数据通过电力线传输至对应配件播报(需要补充说明的是,语音助手可针对语音信号的语音进行分析确定说话人,并根据说话人的选择语音配件进行语音回复,或者将语音信号的语义与语音结合分析,以实现语音助手的语音播报)。
在本实施例中,语音助手将接收到的语音信号通过语音和语义的识别确定需要处理的语音信号,并将处理得到的语音信号发送至对应的配件进行播报,本实施例中具体讲解了语音拓展过程中接收到多条语音信号时,语音处理的流程,通过多个语音的处理最终实现语音助手的语音拓展,实现多用户同时语音信号的分析。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种语音扩展的方法,其特征在于,所述语音扩展的方法应用于接入交流电的语音设备,所述语音设备包括主机和多个配件,所述主机上装有语音识别芯片;所述语音扩展的方法包括以下步骤:
当语音设备采集到语音信号时,判断采集到语音信号的语音设备是否为配件;
若采集到语音信号的语音设备为配件,则将语音信号通过电力线传输至主机;
控制语音识别芯片对接收的语音信号进行识别,以生成对应的反馈语音数据;
将反馈语音数据通过电力线传输至对应配件,以供配件播报反馈语音数据。
2.如权利要求1所述的语音扩展的方法,其特征在于,所述语音设备的主机与配件上分别安装有电力线载波芯片;所述当语音设备采集到语音信号时,判断采集到语音信号的语音设备是否为配件的步骤之前包括:
当主机和配件检测到配对指令时,第一芯片通过电力线发送配对信息至第二芯片,以供第二芯片基于配对信息进行主机和配件的配对,其中,将主机安装的电力线载波芯片作为第一芯片,配件安装的电力线载波芯片作为第二芯片。
3.如权利要求1所述的语音扩展的方法,其特征在于,所述当语音设备采集到语音信号时,判断采集到语音信号的语音设备是否为配件的步骤之后包括:
若采集到语音信号的语音设备不是配件,则控制语音识别芯片对语音信号识别,并生成信号回复数据;
将语音识别芯片生成的信号回复数据发送至主机播报芯片,以利用主机播报。
4.如权利要求1所述的语音扩展的方法,其特征在于,所述控制语音识别芯片对接收的语音信号进行识别,以生成对应的反馈语音数据的步骤包括:
所述若采集到语音信号的语音设备为配件,且有多个配件或主机同时采集到语音信号;
控制语音识别芯片对接收的多个语音信号进行识别,判断多个语音信号的相似度;
根据多个语音信号的相似度,选择处理的语音信号并生成对应的反馈语音数据。
5.如权利要求4所述的语音扩展的方法,其特征在于,所述语音信号强度与语音设备到人的距离成正比,所述语音设备语义判断确定说话的内容是否相同,语音判断确定说话人是否相同;所述将反馈语音数据通过电力线传输至对应配件,以供配件播报反馈语音数据包括:
所述控制语音识别芯片识别多个语音信号的语义,判断多个语音信号的相似度并生成对应的反馈语音数据;
若识别多个语音信号的语义相同,则选择选择一个语音信号处理生成反馈语音数据并通过语音信号较强的配件或主机播报;
若识别多个语音信号的语义不同,则分别处理多个语音信号并生成反馈语音数据,并将反馈语音数据通过电力线传输至对应配件播报。
6.一种语音助手,其特征在于,所述语音助手为接入交流电的语音设备,所述语音助手包括主机和多个配件,所述主机上装有语音识别芯片;所述语音助手包括:
语音采集模块,用于当语音设备采集到语音信号时,判断采集到语音信号的语音设备是否为配件;
语音传输模块,用于若采集到语音信号的语音设备为配件,则将语音信号通过电力线传输至主机;
识别生成模块,用于控制语音识别芯片对接收的语音信号进行识别,以生成对应的反馈语音数据;
语音播报模块,用于将反馈语音数据通过电力线传输至对应配件,以供配件播报反馈语音数据。
7.如权利要求6所述的语音助手,其特征在于,所述语音助手的主机与配件上分别安装有电力线载波芯片;所述语音助手包括装置配对模块,装置配对模块,用于:
当主机和配件检测到配对指令时,第一芯片通过电力线发送配对信息至第二芯片;以供第二芯片基于配对信息进行主机和配件的配对,其中,将主机安装的电力线载波芯片作为第一芯片,配件安装的电力线载波芯片作为第二芯片。
8.如权利要求6所述的语音助手,其特征在于,所述语音助手还包括主机采集模块,主机采集模块,用于:
若采集到语音信号的语音设备不是配件,则控制语音识别芯片对语音信号识别,并生成信号回复数据;
将语音识别芯片生成的信号回复数据发送至主机播报芯片,以利用主机播报。
9.如权利要求6所述的语音助手,其特征在于,所述若采集到语音信号的语音设备为配件,且有多个配件和主机同时采集到语音信号;
所述识别生成模块包括:
语音识别单元,用于控制语音识别芯片对接收的多个语音信号进行识别,判断多个语音信号的相似度;
信号选择单元,用于根据多个语音信号的相似度,选择处理的语音信号并生成对应的反馈语音数据。
10.如权利要求9所述的语音助手,其特征在于,所述语音信号强度与语音设备到人的距离成正比,所述语音设备语义判断确定说话的内容是否相同,语音判断确定说话人是否相同;所述控制语音识别芯片识别多个语音信号的语义,判断多个语音信号的相似度并生成对应的反馈语音数据;
所述语音播报模块包括:
选择播报单元,用于若识别多个语音信号的语义相同,则选择选择一个语音信号处理生成反馈语音数据并通过语音信号较强的配件或主机播报;
识别播报单元,用于若识别多个语音信号的语义不同,则分别处理多个语音信号并生成反馈语音数据,并将反馈语音数据通过电力线传输至对应配件播报。
CN201710187756.5A 2017-03-24 2017-03-24 语音扩展的方法与语音助手 Active CN107039041B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710187756.5A CN107039041B (zh) 2017-03-24 2017-03-24 语音扩展的方法与语音助手

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710187756.5A CN107039041B (zh) 2017-03-24 2017-03-24 语音扩展的方法与语音助手

Publications (2)

Publication Number Publication Date
CN107039041A true CN107039041A (zh) 2017-08-11
CN107039041B CN107039041B (zh) 2020-10-20

Family

ID=59534365

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710187756.5A Active CN107039041B (zh) 2017-03-24 2017-03-24 语音扩展的方法与语音助手

Country Status (1)

Country Link
CN (1) CN107039041B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108062956A (zh) * 2018-02-09 2018-05-22 上海物麒科技有限公司 一种单主机多终端的语音识别方法及系统

Citations (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS49123209A (zh) * 1973-03-29 1974-11-26
US5359695A (en) * 1984-01-30 1994-10-25 Canon Kabushiki Kaisha Speech perception apparatus
EP0892541A2 (de) * 1997-07-19 1999-01-20 Deutsche Telekom AG Büro- oder Haushaltsgerät
US20020077826A1 (en) * 2000-11-25 2002-06-20 Hinde Stephen John Voice communication concerning a local entity
US20030002590A1 (en) * 2001-06-20 2003-01-02 Takashi Kaku Noise canceling method and apparatus
CN101188109A (zh) * 2006-11-20 2008-05-28 富士通株式会社 语音识别装置、方法和记录有语音识别软件程序的记录介质
KR100910056B1 (ko) * 2008-06-24 2009-07-30 (주)나노스토리지 음성인식을 통한 위험지역 내 범죄예방 시스템.
US20090268752A1 (en) * 2005-09-07 2009-10-29 Matsushita Electric Industrial Co., Ltd Method, apparatus and integrated circuit for controlling transmission rate
CN201715793U (zh) * 2010-05-18 2011-01-19 刘瑜 一种基于电力线的网络电冰箱
CN102255780A (zh) * 2010-05-20 2011-11-23 株式会社曙飞电子 家庭网络系统及其控制方法
CN102779509A (zh) * 2011-05-11 2012-11-14 联想(北京)有限公司 语音处理设备和语音处理方法
CN102831894A (zh) * 2012-08-09 2012-12-19 华为终端有限公司 指令处理方法、装置和系统
CN102902253A (zh) * 2012-10-09 2013-01-30 鸿富锦精密工业(深圳)有限公司 具有语音控制功能的智能开关及智能控制系统
CN102945029A (zh) * 2012-10-31 2013-02-27 鸿富锦精密工业(深圳)有限公司 智能网关、智能家居系统及家电设备的智能控制方法
CN202975727U (zh) * 2012-10-09 2013-06-05 鸿富锦精密工业(深圳)有限公司 具有语音控制功能的智能开关及智能控制系统
CN203849854U (zh) * 2014-05-21 2014-09-24 国家电网公司 基于电力载波通信的变电站语音监控装置
CN104484151A (zh) * 2014-12-30 2015-04-01 江苏惠通集团有限责任公司 声控系统、设备及方法
CN105337818A (zh) * 2014-08-13 2016-02-17 中兴通讯股份有限公司 一种基于电力网络的家庭组网方法、系统及设备
CN105429834A (zh) * 2015-11-09 2016-03-23 浙江大学 基于24v直流电源线载波通信的防排烟监控系统
CN105765650A (zh) * 2013-09-27 2016-07-13 亚马逊技术公司 带有多向解码的语音辨识器
JP3209363U (ja) * 2015-12-31 2017-03-09 ウー、 ジンシャオWu, JinXiao 補助装置およびファミリ・スマート・システム

Patent Citations (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS49123209A (zh) * 1973-03-29 1974-11-26
US5359695A (en) * 1984-01-30 1994-10-25 Canon Kabushiki Kaisha Speech perception apparatus
EP0892541A2 (de) * 1997-07-19 1999-01-20 Deutsche Telekom AG Büro- oder Haushaltsgerät
US20020077826A1 (en) * 2000-11-25 2002-06-20 Hinde Stephen John Voice communication concerning a local entity
US20030002590A1 (en) * 2001-06-20 2003-01-02 Takashi Kaku Noise canceling method and apparatus
US20090268752A1 (en) * 2005-09-07 2009-10-29 Matsushita Electric Industrial Co., Ltd Method, apparatus and integrated circuit for controlling transmission rate
CN101188109A (zh) * 2006-11-20 2008-05-28 富士通株式会社 语音识别装置、方法和记录有语音识别软件程序的记录介质
KR100910056B1 (ko) * 2008-06-24 2009-07-30 (주)나노스토리지 음성인식을 통한 위험지역 내 범죄예방 시스템.
CN201715793U (zh) * 2010-05-18 2011-01-19 刘瑜 一种基于电力线的网络电冰箱
CN102255780A (zh) * 2010-05-20 2011-11-23 株式会社曙飞电子 家庭网络系统及其控制方法
CN102779509A (zh) * 2011-05-11 2012-11-14 联想(北京)有限公司 语音处理设备和语音处理方法
CN102831894A (zh) * 2012-08-09 2012-12-19 华为终端有限公司 指令处理方法、装置和系统
CN102902253A (zh) * 2012-10-09 2013-01-30 鸿富锦精密工业(深圳)有限公司 具有语音控制功能的智能开关及智能控制系统
CN202975727U (zh) * 2012-10-09 2013-06-05 鸿富锦精密工业(深圳)有限公司 具有语音控制功能的智能开关及智能控制系统
CN102945029A (zh) * 2012-10-31 2013-02-27 鸿富锦精密工业(深圳)有限公司 智能网关、智能家居系统及家电设备的智能控制方法
CN105765650A (zh) * 2013-09-27 2016-07-13 亚马逊技术公司 带有多向解码的语音辨识器
CN203849854U (zh) * 2014-05-21 2014-09-24 国家电网公司 基于电力载波通信的变电站语音监控装置
CN105337818A (zh) * 2014-08-13 2016-02-17 中兴通讯股份有限公司 一种基于电力网络的家庭组网方法、系统及设备
CN104484151A (zh) * 2014-12-30 2015-04-01 江苏惠通集团有限责任公司 声控系统、设备及方法
CN105429834A (zh) * 2015-11-09 2016-03-23 浙江大学 基于24v直流电源线载波通信的防排烟监控系统
JP3209363U (ja) * 2015-12-31 2017-03-09 ウー、 ジンシャオWu, JinXiao 補助装置およびファミリ・スマート・システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108062956A (zh) * 2018-02-09 2018-05-22 上海物麒科技有限公司 一种单主机多终端的语音识别方法及系统

Also Published As

Publication number Publication date
CN107039041B (zh) 2020-10-20

Similar Documents

Publication Publication Date Title
CN103730116B (zh) 在智能手表上实现智能家居设备控制的系统及其方法
CN102111314B (zh) 一种基于蓝牙传输的智能家居语音控制系统及方法
CN105388772A (zh) 一种基于语音识别的室内智能控制系统及方法
CN107862060A (zh) 一种追踪目标人的语义识别装置及识别方法
CN107369447A (zh) 一种基于语音识别的室内智能控制系统
CN107195305A (zh) 一种信息处理方法及电子设备
CN106249614A (zh) 智能终端、智能家居系统、语音识别方法及下单方法
US20100211389A1 (en) System of communication employing both voice and text
CN110956965A (zh) 一种基于声纹识别的个性化智能家居安全控制系统及方法
CN109561003A (zh) 一种基于声控的红外遥控器及电器控制系统
CN106896933A (zh) 将语音输入转换成文本输入的方法、装置和语音输入设备
CN108538290A (zh) 一种基于音频信号检测的智能家居控制方法
CN209017333U (zh) 蓝牙语音控制设备
CN206057845U (zh) 智能终端、智能家居系统
CN106603669A (zh) 分布式主从设备的控制方法及系统
CN107039041A (zh) 语音扩展的方法与语音助手
US20170221481A1 (en) Data structure, interactive voice response device, and electronic device
CN105407445B (zh) 一种连接方法及第一电子设备
CN103730117A (zh) 一种自适应智能语音装置及方法
CN110688473A (zh) 一种机器人动态获取信息的方法
JP2000349865A (ja) 音声通信装置
CN207603830U (zh) 一种家用电器智能语音系统
CN107135445A (zh) 一种信息处理方法及电子设备
KR100747689B1 (ko) 통신기기 음성인식 문자변환시스템
CN105225661B (zh) 语音控制方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant