CN111161742A - 一种定向人员沟通方法、系统、存储介质及智能语音设备 - Google Patents

一种定向人员沟通方法、系统、存储介质及智能语音设备 Download PDF

Info

Publication number
CN111161742A
CN111161742A CN201911393428.6A CN201911393428A CN111161742A CN 111161742 A CN111161742 A CN 111161742A CN 201911393428 A CN201911393428 A CN 201911393428A CN 111161742 A CN111161742 A CN 111161742A
Authority
CN
China
Prior art keywords
user
message
voice
identity
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911393428.6A
Other languages
English (en)
Inventor
葛有功
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Huiju Construction Technology Co ltd
Original Assignee
Jiangsu Huiju Construction Technology Co ltd
Landsea Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Huiju Construction Technology Co ltd, Landsea Group Co Ltd filed Critical Jiangsu Huiju Construction Technology Co ltd
Priority to CN201911393428.6A priority Critical patent/CN111161742A/zh
Publication of CN111161742A publication Critical patent/CN111161742A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • G10L17/14Use of phonemic categorisation or speech recognition prior to speaker recognition or verification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • G10L17/24Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

本发明提供了一种定向人员沟通方法、系统、存储介质及智能语音设备,涉及智能家居技术领域,包括步骤:获取并保存用户留言,提取所述用户留言中的身份关键词;根据唤醒语音的声纹特征信息及声纹分类库,识别所述唤醒语音对应的用户身份,根据所述用户留言中的所述身份关键词,判断是否存在符合所述用户身份的所述用户留言;当存在符合所述用户身份的所述用户留言时,则播放所述用户留言。本发明在播放留言时,能够根据声纹识别判断出语音音箱唤醒者的身份,然后仅针对该特定身份所记录的留言进行播放,让家庭成员之间的互动交互更针对性,更个性化和高效。

Description

一种定向人员沟通方法、系统、存储介质及智能语音设备
技术领域
本发明涉及智能家居技术领域,尤指一种定向人员沟通方法、系统、存储介质及智能语音设备。
背景技术
随着智能家居的不断普及,语音音箱的作用越发明显,市场上已经出现了众多可以接受语音指令的智能单品,未来家居场景下语音的作用会越来越重要。当前智能音箱除了具有接受语音指令功能外,也逐渐开发了语音留言功能,用户可以通过手机APP输入语音,然后对应的智能音箱在被唤醒后就可以自动完成留言播放,比如妈妈给小孩子留言要记得回家后做好作业然后吃饭,然后给老人留言记得吃药,给爸爸留言要回家做某个东西的维修,在当前技术下留言会全部被播放。
目前市场上的播放语音系统不够个性化,做不到针对不同的人的留言能够被对应的人员唤醒后听到。
发明内容
本发明的目的是提供一种定向人员沟通方法、系统、存储介质及智能语音设备,基于声纹识别技术来实现家居场景针对多留言对象的个性化收听的效果。
本发明提供的技术方案如下:
本发明提供一种定向人员沟通方法,包括步骤:
获取并保存用户留言,提取所述用户留言中的身份关键词。
根据唤醒语音的声纹特征信息及声纹分类库,识别所述唤醒语音对应的用户身份,根据所述用户留言中的所述身份关键词,判断是否存在符合所述用户身份的所述用户留言。
当存在符合所述用户身份的所述用户留言时,则播放所述用户留言。
进一步,在所述的获取并保存用户留言,提取所述用户留言中的身份关键词之前包括步骤:
录入至少一用户语音,识别所述用户语音的声纹特征信息,根据用户身份和所述用户语音的所述声纹特征信息建立所述声纹分类库。
进一步,在所述的根据唤醒语音的声纹特征信息及声纹分类库,识别所述唤醒语音对应的用户身份,根据所述用户留言中的所述身份关键词,判断是否存在符合所述用户身份的所述用户留言之前包括步骤:
预设唤醒命令,获取所述唤醒语音,判断所述唤醒语音与所述唤醒命令是否匹配。
当所述唤醒语音与所述唤醒命令匹配时,判断是否存在符合所述用户身份的所述用户留言。
进一步,在所述的预设唤醒命令,获取所述唤醒语音,判断所述唤醒语音与所述唤醒命令是否匹配之后包括步骤:
当所述唤醒语音与所述唤醒命令不匹配时,则不进行是否存在符合所述用户身份的所述留言的判断。
进一步,所述的当存在符合所述用户身份的所述用户留言时,则播放所述用户留言具体包括步骤:
当存在符合所述用户身份的所述用户留言时,发出询问信息,询问用户是否播放所述留言。
当所述用户同意播放所述留言时,则播放所述用户留言。
本发明提供一种沟通系统,包括:
获取模块,用于获取用户留言。
保存模块,与所述获取模块连接,用于保存所述用户留言。
提取模块,与所述保存模块连接,用于提取所述用户留言中的身份关键词。
识别模块,用于根据唤醒语音的声纹特征信息及声纹分类库,识别所述唤醒语音对应的用户身份。
判断模块,分别与所述识别模块和所述提取模块连接,用于根据所述用户留言中的所述身份关键词,判断是否存在符合所述用户身份的所述用户留言。
进一步,还包括:
录入模块,用于录入至少一用户语音。
预设模块,与所述录入模块连接,用于根据用户身份和所述用户语音的所述声纹特征信息建立所述声纹分类库。
询问模块,与所述判断模块连接,用于当存在符合所述用户身份的所述用户留言时,发出询问信息,询问用户是否播放所述留言。
播放模块,与所述询问模块连接,用于当所述用户同意播放所述留言时,则播放所述用户留言。
本发明提供一种计算机可读存储介质,该存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述任一项沟通方法。
本发明提供一种智能语音设备,包括存储器和处理器,存储器上储存有在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述任一项沟通方法。
通过本发明提供的一种定向人员沟通方法、系统、存储介质及智能语音设备,具有以下有益效果:
1)在播放留言时,能够根据声纹识别判断出语音音箱唤醒者的身份,然后仅针对该特定身份所记录的留言进行播放,让家庭成员之间的互动交互更具针对性,更个性化和高效。
2)在通过智能音箱留言时,能够根据声纹识别判断出语音音箱唤醒者的身份自动记录留言发起人的信息。
3)在家庭成员通过手机APP或语音音箱留言时,自动根据关键词提取,获得留言所针对的家庭成员名字并将留言与其关联,以用于后续的针对性播放等操作。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对一种定向人员沟通方法、系统、存储介质及智能语音设备的上述特性、技术特征、优点及其实现方式予以进一步说明。
图1是本发明一种定向人员沟通方法的一个实施例的流程图;
图2是本发明一种定向人员沟通方法的又一个实施例的流程图;
图3是本发明一种定向人员沟通方法的再一个实施例的流程图;
图4是本发明一种定向人员沟通方法的另一个实施例的流程图;
图5是本发明一种定向人员沟通方法的一个实施例的流程图;
图6是本发明一种沟通系统的一个实施例的结构示意图;
图7是本发明一种智能语音设备的一个实施例的结构示意图。
附图标号说明:10、存储器;11、计算机程序;12、处理器;20、获取模块;21、保存模块;22、提取模块;23、识别模块;24、判断模块;25、录入模块;26、预设模块;27、询问模块;28、播放模块。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
为使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
本发明的一个实施例,如图1所示,一种定向人员沟通方法,包括步骤:
S100获取并保存用户留言,提取所述用户留言中的身份关键词。
优选的,获取并保存用户的留言信息,用户如家庭成员中的爸爸、妈妈、爷爷、奶奶等,可以根据使用需求设定留言信息的格式,例如“我要给家里的某某(接收留言的家庭成员的名称或称呼)留言,请......(具体留言信息)”。提取留言信息中的身份关键词,即提取留言中的接收留言的家庭成员的名称或称呼。身份关键词可以是家庭成员的称呼、名称等。
S200根据唤醒语音的声纹特征信息及声纹分类库,识别所述唤醒语音对应的用户身份,根据所述用户留言中的所述身份关键词,判断是否存在符合所述用户身份的所述用户留言。
具体的,声纹是用电声学仪器显示的携带言语信息的声波频谱,现代科学研究表明,声纹不仅具有特定性,而且有相对稳定性的特点,成年以后,人的声音可保持长期相对稳定不变,实验证明,无论讲话者是故意模仿他人声音和语气,还是耳语轻声讲话,即使模仿得惟妙惟肖,其声纹却始终不相同。
唤醒用户如家庭成员中的孩子,向智能语音设备如智能音箱发出唤醒语音,例如“XXXX(唤醒命令),我要给家里的YYYY(家庭成员)留言,ZZZZZZZ…(具体留言信息)等”。智能语音设备获取唤醒语音,将唤醒语音的声纹特征信息与声纹分类库中的录音用户的声纹特征信息进行对比,找到与唤醒语音的声纹特征信息相符合的录音用户身份信息,即确认唤醒用户的身份信息。查找用户留言中是否有该唤醒用户身份信息所对应的身份关键词,例如,查找用户留言中是否含有“孩子”这一关键词。
唤醒用户包括孩子、妈妈、爸爸、奶奶等家庭成员。唤醒用户可以为任意用户。
S300当存在符合所述用户身份的所述用户留言时,则播放所述用户留言。
具体的,当存在符合唤醒用户身份的留言时,即留言中含有“孩子”这一关键词时,智能语音设备对留言进行播放。
优选的,本实施例中,可以通过智能终端获取并保存用户的留言信息。使用时,家庭成员例如妈妈在智能终端例如手机的APP上进行留言。智能终端与智能语音设备通过有线网络或WIFI连接。在智能语音设备内设置微处理器,微处理器电性连接音频处理模块、数据存储模块、接口电路模块。接口电路模块设置有RJ45网线接口,智能音箱通过RJ45网线接口有线连接网络节点设备,网络节点设备通过互联网的云端服务器与智能终端连接,将智能终端上的语音数据进行下载并存储与数据存储模块,通过音频处理模块处理进行播放。实现智能语音设备通过有线网络远程连接智能终端,将智能终端内语音留言进行下载播报的功能。智能语音设备内还设置有WIFI模块,微处理器与WIFI模块电性连接,智能语音设备通过WIFI模块无线连接智能终端,将智能终端上的语音数据传送至音频处理电路模块进行播放。实现智能音箱通过WIFI在一定范围内与智能终端连接,将智能终端内语音留言进行下载播报的功能。
优选的,可以通过在智能语音设备上进行留言。通过智能语音设备例如智能音箱内置的获取模块20,获取用户留言,并通过保存模块21保存用户留言。当唤醒用户唤醒智能语音设备时,智能语音设备自行播放器留言。
具体的,智能终端包括智能手机、计算机、平板电脑或智能穿戴设备。
本实施例中,根据用户留言中的身份关键词、唤醒用户的声纹特征信息及声纹分类库,实现特定的唤醒用户播放专属该唤醒用户的留言的功能。
本发明的又一个实施例,如图2所示,一种定向人员沟通方法,包括步骤:
S001录入至少一用户语音,识别所述用户语音的声纹特征信息,根据用户身份和所述用户语音的所述声纹特征信息建立所述声纹分类库。
具体的,在智能终端或智能语音设备中录入至少一个用户的语音信息,例如录入家庭成员中爸爸、妈妈、爷爷、奶奶、孩子的语音,识别所录入的语音的声纹特征信息,并根据录入该录音的用户的身份对声纹特征信息进行分类存储,如根据爸爸的声纹特征信息,爸爸所录入的语音命名为“爸爸”或其姓名或其它代码等进行保存。以身份为维度对所录入的语音的声纹特征信息建立声纹分类库。
录入语音的用户包括爸爸、妈妈、爷爷、奶奶、孩子等。录入语音的用户可以为任意用户。
S100获取并保存用户留言,提取所述用户留言中的身份关键词。
优选的,获取并保存用户的留言信息,用户如家庭成员中的爸爸、妈妈、爷爷、奶奶等,可以根据使用需求设定留言信息的格式,例如“我要给家里的某某(接收留言的家庭成员的名称或称呼)留言,请......(具体留言信息)”。提取留言信息中的身份关键词,即提取留言中的接收留言的家庭成员的名称或称呼。身份关键词可以是家庭成员的称呼、名称等。智能终端包括智能手机、计算机、平板电脑或智能穿戴设备。本实施例中,可以通过智能终端获取并保存用户的留言信息,也可以通过智能音箱等智能语音设备获取并保存用户的留言信息。
S200根据唤醒语音的声纹特征信息及声纹分类库,识别所述唤醒语音对应的用户身份,根据所述用户留言中的所述身份关键词,判断是否存在符合所述用户身份的所述用户留言。
具体的,声纹是用电声学仪器显示的携带言语信息的声波频谱,现代科学研究表明,声纹不仅具有特定性,而且有相对稳定性的特点,成年以后,人的声音可保持长期相对稳定不变,实验证明,无论讲话者是故意模仿他人声音和语气,还是耳语轻声讲话,即使模仿得惟妙惟肖,其声纹却始终不相同。智能终端与智能语音设备通过云端服务器连接当在智能终端中的APP中进行留言时,智能终端将留言传输至云端服务器。唤醒用户如家庭成员中的孩子,向智能语音设备如智能音箱发出唤醒语音,例如“XXXX(唤醒命令),我要给家里的YYYY(家庭成员)留言,ZZZZZZZ…(具体留言信息)等”。智能语音设备获取唤醒语音,将唤醒语音的声纹特征信息与声纹分类库中的录音用户的声纹特征信息进行对比,找到与唤醒语音的声纹特征信息相符合的录音用户身份信息,即确认唤醒用户的身份信息。在云端服务器中查找用户留言中是否有该唤醒用户身份信息所对应的身份关键词,例如,查找用户留言中是否含有“孩子”这一关键词。
S300当存在符合所述用户身份的所述用户留言时,则播放所述用户留言。
具体的,当云端服务器中存在符合唤醒用户身份的留言时,即留言中含有“孩子”这一关键词时,则云端服务器将留言传输至智能语音设备,智能语音设备接收该留言并播放。
本实施例中,在智能终端或智能语音设备中提前将家庭成员的语音录入,并以家庭成员的身份信息如名称为维度对所录入的语音的声纹特征信息进行存储,建立声纹分类库。当在智能终端中录入语音时,智能终端将语音发送至云端服务器,在智能音箱被唤醒时,智能音箱识别唤醒用户的声纹特征信息,并获取云端服务器的信息,根据云端服务器中所存储的声纹分类库,识别该唤醒人的身份。当在智能语音设备中录入语音,建立声纹分类库时,在智能音箱被唤醒时,智能音箱识别唤醒用户的声纹特征信息,根据智能音箱中所存储的声纹分类库,识别该唤醒人的身份。使用时,家庭成员可在智能终端或只能语音设备中录入语音,建立声纹分类库,使用多样、智能化。
本发明的再一个实施例,如图3所示,一种定向人员沟通方法,包括步骤:
S001录入至少一用户语音,识别所述用户语音的声纹特征信息,根据用户身份和所述用户语音的所述声纹特征信息建立所述声纹分类库。
具体的,在智能终端或智能语音设备中录入至少一个用户的语音信息,例如录入家庭成员中爸爸、妈妈、爷爷、奶奶、孩子的语音,识别所录入的语音的声纹特征信息,并根据录入该录音的用户的身份对声纹特征信息进行分类存储,如根据爸爸的声纹特征信息,爸爸所录入的语音命名为“爸爸”或其姓名或其它代码等进行保存。以身份为维度对所录入的语音的声纹特征信息建立声纹分类库。
S100获取并保存用户留言,提取所述用户留言中的身份关键词。
优选的,获取并保存用户的留言信息,用户如家庭成员中的爸爸、妈妈、爷爷、奶奶等,可以根据使用需求设定留言信息的格式,例如“我要给家里的某某(接收留言的家庭成员的名称或称呼)留言,请......(具体留言信息)”。提取留言信息中的身份关键词,即提取留言中的接收留言的家庭成员的名称或称呼。身份关键词可以是家庭成员的称呼、名称等。
S110预设唤醒命令,获取所述唤醒语音,判断所述唤醒语音与所述唤醒命令是否匹配。
具体的,在智能语音设备上预先设定唤醒命令,例如“Hi”、“请问”等。该唤醒命令可以在出厂时工程师进行设置,也可以根据用户使用需求自行设置。智能语音设备获取唤醒语音,将该唤醒语音与预先设置的唤醒命令进行对比,判断该唤醒语音中是否有与唤醒命令匹配的关键词。
S111当所述唤醒语音与所述唤醒命令匹配时,判断是否存在符合所述用户身份的所述用户留言。
具体的,当前获取的唤醒语音中存在与唤醒命令匹配的关键词时,识别该唤醒语音的声纹特征信息,进一步判断是否存在与该唤醒语音的声纹特征信息相符合的留言。
S112当所述唤醒语音与所述唤醒命令不匹配时,则不进行是否存在符合所述用户身份的所述留言的判断。
具体的,当前获取的唤醒语音中不存在与唤醒命令匹配的关键词时,即唤醒语音与所述唤醒命令不匹配时,则不进行是否存在符合所述用户身份的所述留言的判断。
S200根据唤醒语音的声纹特征信息及声纹分类库,识别所述唤醒语音对应的用户身份,根据所述用户留言中的所述身份关键词,判断是否存在符合所述用户身份的所述用户留言。
具体的,声纹是用电声学仪器显示的携带言语信息的声波频谱,现代科学研究表明,声纹不仅具有特定性,而且有相对稳定性的特点,成年以后,人的声音可保持长期相对稳定不变,实验证明,无论讲话者是故意模仿他人声音和语气,还是耳语轻声讲话,即使模仿得惟妙惟肖,其声纹却始终不相同。
唤醒用户如家庭成员中的孩子,向智能语音设备如智能音箱发出唤醒语音,例如“XXXX(唤醒命令),我要给家里的YYYY(家庭成员)留言,ZZZZZZZ…(具体留言信息)等”。智能语音设备获取唤醒语音,将唤醒语音的声纹特征信息与声纹分类库中的录音用户的声纹特征信息进行对比,找到与唤醒语音的声纹特征信息相符合的录音用户身份信息,即确认唤醒用户的身份信息。查找用户留言中是否有该唤醒用户身份信息所对应的身份关键词,例如,查找用户留言中是否含有“孩子”这一关键词。
唤醒用户包括孩子、妈妈、爸爸、奶奶等家庭成员。唤醒用户可以为任意用户。
S300当存在符合所述用户身份的所述用户留言时,则播放所述用户留言。
具体的,当存在符合唤醒用户身份的留言时,即留言中含有“孩子”这一关键词时,智能语音设备对留言进行播放。
优选的,本实施例中,可以通过智能终端获取并保存用户的留言信息。使用时,家庭成员例如妈妈在智能终端例如手机的APP上进行留言。智能终端与智能语音设备通过有线网络或WIFI连接。在智能语音设备内设置微处理器,微处理器电性连接音频处理模块、数据存储模块、接口电路模块。接口电路模块设置有RJ45网线接口,智能音箱通过RJ45网线接口有线连接网络节点设备,网络节点设备通过互联网的云端服务器与智能终端连接,将智能终端上的语音数据进行下载并存储与数据存储模块,通过音频处理模块处理进行播放。实现智能语音设备通过有线网络远程连接智能终端,将智能终端内语音留言进行下载播报的功能。智能语音设备内还设置有WIFI模块,微处理器与WIFI模块电性连接,智能语音设备通过WIFI模块无线连接智能终端,将智能终端上的语音数据传送至音频处理电路模块进行播放。实现智能音箱通过WIFI在一定范围内与智能终端连接,将智能终端内语音留言进行下载播报的功能。
优选的,可以通过在智能语音设备上进行留言。通过智能语音设备例如智能音箱内置的获取模块20,获取用户留言,并通过保存模块21保存用户留言。当唤醒用户唤醒智能语音设备时,智能语音设备自行播放器留言。
具体的,智能终端包括智能手机、计算机、平板电脑或智能穿戴设备。
本实施例中,预先设定唤醒命令,在获取到唤醒语音时,判断该唤醒语音与唤醒命令是否匹配,匹配时,进一步识别唤醒用户的声纹特征信息,确认该声纹特征信息对应的用户身份,即确定唤醒用户的身份,并查询是否存在与该唤醒用户符合的留言以进行播放。
本发明的另一个实施例,如图4所示,一种定向人员沟通方法,包括步骤:
S100获取并保存用户留言,提取所述用户留言中的身份关键词。
优选的,获取并保存用户的留言信息,用户如家庭成员中的爸爸、妈妈、爷爷、奶奶等,可以根据使用需求设定留言信息的格式,例如“我要给家里的某某(接收留言的家庭成员的名称或称呼)留言,请......(具体留言信息)”。提取留言信息中的身份关键词,即提取留言中的接收留言的家庭成员的名称或称呼。身份关键词可以是家庭成员的称呼、名称等。
S200根据唤醒语音的声纹特征信息及声纹分类库,识别所述唤醒语音对应的用户身份,根据所述用户留言中的所述身份关键词,判断是否存在符合所述用户身份的所述用户留言。
具体的,声纹是用电声学仪器显示的携带言语信息的声波频谱,现代科学研究表明,声纹不仅具有特定性,而且有相对稳定性的特点,成年以后,人的声音可保持长期相对稳定不变,实验证明,无论讲话者是故意模仿他人声音和语气,还是耳语轻声讲话,即使模仿得惟妙惟肖,其声纹却始终不相同。
唤醒用户如家庭成员中的孩子,向智能语音设备如智能音箱发出唤醒语音,例如“XXXX(唤醒命令),我要给家里的YYYY(家庭成员)留言,ZZZZZZZ…(具体留言信息)等”。智能语音设备获取唤醒语音,将唤醒语音的声纹特征信息与声纹分类库中的录音用户的声纹特征信息进行对比,找到与唤醒语音的声纹特征信息相符合的录音用户身份信息,即确认唤醒用户的身份信息。查找用户留言中是否有该唤醒用户身份信息所对应的身份关键词,例如,查找用户留言中是否含有“孩子”这一关键词。
唤醒用户包括孩子、妈妈、爸爸、奶奶等家庭成员。唤醒用户可以为任意用户。
S310当存在符合所述用户身份的所述用户留言时,发出询问信息,询问用户是否播放所述留言。
S311当所述用户同意播放所述留言时,则播放所述用户留言。
优选的,本实施例中,可以通过智能终端获取并保存用户的留言信息。使用时,家庭成员例如妈妈在智能终端例如手机的APP上进行留言。智能终端与智能语音设备通过有线网络或WIFI连接。在智能语音设备内设置微处理器,微处理器电性连接音频处理模块、数据存储模块、接口电路模块。接口电路模块设置有RJ45网线接口,智能音箱通过RJ45网线接口有线连接网络节点设备,网络节点设备通过互联网的云端服务器与智能终端连接,将智能终端上的语音数据进行下载并存储与数据存储模块,通过音频处理模块处理进行播放。实现智能语音设备通过有线网络远程连接智能终端,将智能终端内语音留言进行下载播报的功能。智能语音设备内还设置有WIFI模块,微处理器与WIFI模块电性连接,智能语音设备通过WIFI模块无线连接智能终端,将智能终端上的语音数据传送至音频处理电路模块进行播放。实现智能音箱通过WIFI在一定范围内与智能终端连接,将智能终端内语音留言进行下载播报的功能。
优选的,可以通过在智能语音设备上进行留言。通过智能语音设备例如智能音箱内置的获取模块20,获取用户留言,并通过保存模块21保存用户留言。当唤醒用户唤醒智能语音设备时,智能语音设备自行播放器留言。
智能终端包括智能手机、计算机、平板电脑或智能穿戴设备。
当存在符合唤醒用户身份的留言时,例如留言中含有“孩子”这一关键词时,智能语音设备发出询问信息,询问用户是否播放该留言,当用户同意播放该留言时,智能语音设备对留言进行播放,当用户不同意播放该留言时,则不进行播放。询问信息可以通过屏幕以文字的方式进行显示,也可以通过语音的方式进行询问。用户同意或不同意播放留言,可以通过按键、触屏等方式进行操作,也可以通过语音的方式进行确认。
本实施例中,在查询到有符合唤醒用户身份的留言时,询问用户是否进行播放,进一步保护了播放留言的隐私性。
本发明的一个实施例,如图5所示,一种定向人员沟通方法,包括步骤:
S1家庭成员先通过手机端APP完成家庭中每一个成员的语音录入,用于声纹识别使用。
S2某个家庭成员,比如说妈妈,通过手机APP用语音给家里不同的成员进行留言。
S3智能语音云服务平台能够自动识别留言中家庭成员的名字并记录。
S4智能语音云服务平台在保存好留言人信息的同时,能够将发送给不同的家庭成员的留言进行保存,以成员为维度做好留言分类。
S5家庭成员回到家中时,可以通过两种可选方式获取留言。
S51通过唤醒语音音箱,并主动询问自己是否有留言,或询问XX成员是否给自己留言,智能语音音箱根据声纹识别出操作者身份,然后系统查找针对该操作者是否有相应符合条件的留言记录,并进行播放。
S52在唤醒语音信箱后,音箱根据声纹识别出操作者身份,然后系统查找针对改操作者是否有留言记录,自动提示该家庭成员是否需要播放。如果同意,则播放。
上述方案也可以进行扩展,比如家庭成员不仅可以通过APP留言,也可以通过智能音箱进行留言且智能音箱可根据声纹识别自动标定是哪位家庭成员发起了留言。
在本方案中,前提是家庭中已经在每一个房间或特定地点部署了智能语音设备(形态包括语音面板/语音音箱等),语音设备具备声纹识别能力。
留言可以允许事先设定特定的命令格式,比如“XXXX(唤醒词),我要给家里的YYYY(家庭成员)留言,ZZZZZZZ…(具体留言信息)”等。
本发明的一个实施例,如图6所示,一种沟通系统,包括:
获取模块20,用于获取用户留言。
保存模块21,与获取模块20连接,用于保存所述用户留言。
提取模块22,与保存模块21连接,用于提取所述用户留言中的身份关键词。
识别模块23,用于根据唤醒语音的声纹特征信息及声纹分类库,识别所述唤醒语音对应的用户身份。
判断模块24,分别与识别模块23和提取模块22连接,用于根据所述用户留言中的所述身份关键词,判断是否存在符合所述用户身份的所述用户留言。
具体的,还包括:
录入模块25,用于录入至少一用户语音。
预设模块26,与录入模块25连接,用于根据用户身份和所述用户语音的所述声纹特征信息建立所述声纹分类库。
询问模块27,与判断模块24连接,用于当存在符合所述用户身份的所述用户留言时,发出询问信息,询问用户是否播放所述留言。
播放模块28,与询问模块27连接,用于当所述用户同意播放所述留言时,则播放所述用户留言。
识别模块23,与录入模块25连接,还用于识别所述用户语音的声纹特征信息。
预设模块26,还用于预设唤醒命令。
获取模块20,还用于获取所述唤醒语音。
判断模块24,分别与预设模块26和获取模块20连接,还用于判断所述唤醒语音与所述唤醒命令是否匹配。
本发明的一个实施例提供了一种计算机可读存储介质,其上存储有计算机程序11,计算机程序11被处理器12执行时实现上述实施例中的所有方法步骤或部分方法步骤。
本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序11来指令相关的硬件来完成,所述的计算机程序11可存储于一计算机可读存储介质中,该计算机程序11在被处理器12执行时,可实现上述各个方法实施例的步骤。其中,计算机程序11包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
本发明的一个实施例还提供一种智能语音设备,如图7所述示,包括存储器10和处理器12,存储器10上储存有在处理器12上运行的计算机程序11,处理器12执行计算机程序11时实现第一实施例中的所有方法步骤或部分方法步骤。
所称处理器12可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器12也可以是任何常规的处理器等,处理器12是所述计算机装置的控制中心,利用各种接口和线路连接整个计算机装置的各个部分。
存储器10可以用于存储计算机程序和/或模块,处理器12通过运行或执行存储在存储器10内的计算机程序和/或模块,以及调用存储在存储器10内的数据,实现所述计算机装置的各种功能。存储器10可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、视频数据等)等。此外,存储器10可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(FlashCard)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
本发明有益效果是:在播放留言时,能够根据声纹识别判断出语音音箱唤醒者的身份,然后仅针对该特定身份所记录的留言进行播放,让家庭成员之间的互动交互更针对性,更个性化和高效;在通过智能音箱留言时,能够根据声纹识别判断出语音音箱唤醒者的身份自动记录留言发起人的信息;在家庭成员通过手机APP或语音音箱留言时,自动根据关键词提取,获得留言所针对的家庭成员名字并将留言与其关联,以用于后续的针对性播放等操作。
应当说明的是,上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (9)

1.一种定向人员沟通方法,其特征在于,包括步骤:
获取并保存用户留言,提取所述用户留言中的身份关键词;
根据唤醒语音的声纹特征信息及声纹分类库,识别所述唤醒语音对应的用户身份,根据所述用户留言中的所述身份关键词,判断是否存在符合所述用户身份的所述用户留言;
当存在符合所述用户身份的所述用户留言时,则播放所述用户留言。
2.根据权利要求1所述的一种定向人员沟通方法,其特征在于,在所述的获取并保存用户留言,提取所述用户留言中的身份关键词之前包括步骤:
录入至少一用户语音,识别所述用户语音的所述声纹特征信息,根据所述用户身份和所述用户语音的所述声纹特征信息建立所述声纹分类库。
3.根据权利要求1所述的一种定向人员沟通方法,其特征在于,在所述的根据唤醒语音的声纹特征信息及声纹分类库,识别所述唤醒语音对应的用户身份,根据所述用户留言中的所述身份关键词,判断是否存在符合所述用户身份的所述用户留言之前包括步骤:
预设唤醒命令,获取所述唤醒语音,判断所述唤醒语音与所述唤醒命令是否匹配;
当所述唤醒语音与所述唤醒命令匹配时,判断是否存在符合所述用户身份的所述用户留言。
4.根据权利要求3所述的一种定向人员沟通方法,其特征在于,在所述的预设唤醒命令,获取所述唤醒语音,判断所述唤醒语音与所述唤醒命令是否匹配之后包括步骤:
当所述唤醒语音与所述唤醒命令不匹配时,则不进行是否存在符合所述用户身份的所述用户留言的判断。
5.根据权利要求1所述的一种定向人员沟通方法,其特征在于,所述的当存在符合所述用户身份的所述用户留言时,则播放所述用户留言具体包括步骤:
当存在符合所述用户身份的所述用户留言时,发出询问信息,询问所述用户是否播放所述用户留言;
当所述用户同意播放所述用户留言时,则播放所述用户留言。
6.一种沟通系统,其特征在于,包括:
获取模块,用于获取用户留言;
保存模块,与所述获取模块连接,用于保存所述用户留言;
提取模块,与所述保存模块连接,用于提取所述用户留言中的身份关键词;
识别模块,与获取模块连接,用于根据唤醒语音的声纹特征信息及声纹分类库,识别所述唤醒语音对应的用户身份;
判断模块,分别与所述识别模块和所述提取模块连接,用于根据所述用户留言中的所述身份关键词,判断是否存在符合所述用户身份的所述用户留言。
7.根据权利要求6所述的一种沟通系统,其特征在于,还包括:
录入模块,用于录入至少一用户语音;
预设模块,与所述录入模块连接,用于根据所述用户身份和所述用户语音的所述声纹特征信息建立所述声纹分类库;
询问模块,与所述判断模块连接,用于当存在符合所述用户身份的所述用户留言时,发出询问信息,询问用户是否播放所述用户留言;
播放模块,与所述询问模块连接,用于当所述用户同意播放所述用户留言时,则播放所述用户留言。
8.一种计算机可读存储介质,该存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5任一项所述的方法。
9.一种智能语音设备,包括存储器和处理器,存储器上储存有在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5任一项所述的方法。
CN201911393428.6A 2019-12-30 2019-12-30 一种定向人员沟通方法、系统、存储介质及智能语音设备 Pending CN111161742A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911393428.6A CN111161742A (zh) 2019-12-30 2019-12-30 一种定向人员沟通方法、系统、存储介质及智能语音设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911393428.6A CN111161742A (zh) 2019-12-30 2019-12-30 一种定向人员沟通方法、系统、存储介质及智能语音设备

Publications (1)

Publication Number Publication Date
CN111161742A true CN111161742A (zh) 2020-05-15

Family

ID=70559071

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911393428.6A Pending CN111161742A (zh) 2019-12-30 2019-12-30 一种定向人员沟通方法、系统、存储介质及智能语音设备

Country Status (1)

Country Link
CN (1) CN111161742A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111816191A (zh) * 2020-07-08 2020-10-23 珠海格力电器股份有限公司 语音处理方法、装置、系统及存储介质
CN112907789A (zh) * 2021-02-04 2021-06-04 深圳创维-Rgb电子有限公司 留言信息推送方法、智能门锁及可读存储介质
CN113470656A (zh) * 2020-07-09 2021-10-01 青岛海信电子产业控股股份有限公司 智能语音交互设备及目标场景下的语音留言方法
CN113643691A (zh) * 2021-08-16 2021-11-12 思必驰科技股份有限公司 远场语音留言交互方法及系统
CN114745349A (zh) * 2021-01-08 2022-07-12 上海博泰悦臻网络技术服务有限公司 一种点评方法、电子设备及计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001125871A (ja) * 1999-10-28 2001-05-11 Minolta Co Ltd 電子伝言板および電子伝言板システム
CN107515914A (zh) * 2017-08-17 2017-12-26 广州视源电子科技股份有限公司 一种留言方法、装置、设备及存储介质
CN108958810A (zh) * 2018-02-09 2018-12-07 北京猎户星空科技有限公司 一种基于声纹的用户识别方法、装置及设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001125871A (ja) * 1999-10-28 2001-05-11 Minolta Co Ltd 電子伝言板および電子伝言板システム
CN107515914A (zh) * 2017-08-17 2017-12-26 广州视源电子科技股份有限公司 一种留言方法、装置、设备及存储介质
CN108958810A (zh) * 2018-02-09 2018-12-07 北京猎户星空科技有限公司 一种基于声纹的用户识别方法、装置及设备

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111816191A (zh) * 2020-07-08 2020-10-23 珠海格力电器股份有限公司 语音处理方法、装置、系统及存储介质
WO2022007497A1 (zh) * 2020-07-08 2022-01-13 珠海格力电器股份有限公司 语音处理方法、装置、系统及存储介质
CN113470656A (zh) * 2020-07-09 2021-10-01 青岛海信电子产业控股股份有限公司 智能语音交互设备及目标场景下的语音留言方法
CN114745349A (zh) * 2021-01-08 2022-07-12 上海博泰悦臻网络技术服务有限公司 一种点评方法、电子设备及计算机可读存储介质
CN114745349B (zh) * 2021-01-08 2023-12-26 上海博泰悦臻网络技术服务有限公司 一种点评方法、电子设备及计算机可读存储介质
CN112907789A (zh) * 2021-02-04 2021-06-04 深圳创维-Rgb电子有限公司 留言信息推送方法、智能门锁及可读存储介质
CN113643691A (zh) * 2021-08-16 2021-11-12 思必驰科技股份有限公司 远场语音留言交互方法及系统

Similar Documents

Publication Publication Date Title
CN111161742A (zh) 一种定向人员沟通方法、系统、存储介质及智能语音设备
US10832686B2 (en) Method and apparatus for pushing information
US11386905B2 (en) Information processing method and device, multimedia device and storage medium
US10062304B1 (en) Apparatus and method for wireless sound recognition to notify users of detected sounds
CN102779509B (zh) 语音处理设备和语音处理方法
CN109147802B (zh) 一种播放语速调节方法及装置
CN106941619A (zh) 基于人工智能的节目提醒方法、装置以及系统
CN109660767A (zh) 一种智能门铃的访客响应方法、智能门铃及系统
CN110473555B (zh) 一种基于分布式语音设备的交互方法及装置
CN109961786A (zh) 基于语音分析的产品推荐方法、装置、设备和存储介质
CN109151366B (zh) 一种视频通话的声音处理方法、存储介质和服务器
CN111429917B (zh) 一种设备唤醒方法及终端设备
CN111508491A (zh) 一种基于深度学习的智能语音交互设备
CN106453005A (zh) 一种具备个性化语音播报功能的智能空调系统
CN110730330B (zh) 声音处理方法与装置、门铃和计算机可读存储介质
CN111339881A (zh) 基于情绪识别的宝宝成长监护方法及系统
CN107483993B (zh) 电视的语音输入方法、电视和计算机可读存储介质
CN103888617B (zh) 输出通知消息的方法及装置
CN202289477U (zh) 一种通过无线网络进行语音播放的语音玩具终端设备
WO2023040658A1 (zh) 语音交互方法及电子设备
CN111506743A (zh) 一种媒体资源存储方法、媒体资源播放方法及相关设备
CN113314115A (zh) 终端设备的语音处理方法、终端设备及可读存储介质
CN115050375A (zh) 一种设备的语音操作方法、装置和电子设备
CN110635976A (zh) 一种陪护设备控制方法、陪护设备控制系统及存储介质
CN113468368A (zh) 一种语音记事方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
TA01 Transfer of patent application right

Effective date of registration: 20200520

Address after: 210046 5th floor, building A4, No.2, Zidong Road, Maqun street, Qixia District, Nanjing City, Jiangsu Province

Applicant after: JIANGSU HUIJU CONSTRUCTION TECHNOLOGY Co.,Ltd.

Address before: Room 328, building 28, Nanjing high tech Development Zone, Jiangsu Province

Applicant before: Landsea Group Co.,Ltd.

Applicant before: JIANGSU HUIJU CONSTRUCTION TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200515

RJ01 Rejection of invention patent application after publication