CN106782569A - 一种基于声纹注册的增强现实方法及装置 - Google Patents

一种基于声纹注册的增强现实方法及装置 Download PDF

Info

Publication number
CN106782569A
CN106782569A CN201611106579.5A CN201611106579A CN106782569A CN 106782569 A CN106782569 A CN 106782569A CN 201611106579 A CN201611106579 A CN 201611106579A CN 106782569 A CN106782569 A CN 106782569A
Authority
CN
China
Prior art keywords
speech data
user
word
default
augmented reality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611106579.5A
Other languages
English (en)
Inventor
谢柯
徐泽明
苏波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Augmented Reality Technology Co Ltd
Original Assignee
Shenzhen Augmented Reality Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Augmented Reality Technology Co Ltd filed Critical Shenzhen Augmented Reality Technology Co Ltd
Priority to CN201611106579.5A priority Critical patent/CN106782569A/zh
Publication of CN106782569A publication Critical patent/CN106782569A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

本发明适用于增强现实技术领域,提供了一种基于声纹注册的增强现实方法及装置,所述方法包括:获取拾音装置采集的现场使用者语音数据,并从所述使用者语音数据中提取使用者声纹特征信息;将所述用者声纹特征信息与预先保存的管理者声纹特征信息进行匹配,判断所述使用者是否为终端设备管理者;当所述使用者为终端设备管理者时,将所述使用者语音数据与声音数据库中的预设语音数据进行匹配,匹配成功时获取与所述预设语音数据对应的情景信息;将所述情景信息通过增强现实技术进行展示。本发明实施例解决了现有的AR语音识别并不限定人员,任何人说出相同的话都能触发AR场景的问题。

Description

一种基于声纹注册的增强现实方法及装置
技术领域
本发明属于增强现实技术领域,尤其涉及一种基于声纹注册的增强现实方法及装置。
背景技术
目前增强现实技术(AR)的应用逐渐广泛,比如在AR游戏中,为了提高AR游戏的可玩性,在游戏场景中加入语音识别技术,使用语音指令来触发不同的AR游戏场景。
对于某些时候,我们希望仅有指定权限的人说出某些话时才触发相应的AR场景。不同的人使用语音指令操作不同的游戏对象,并在在其对应的现实场景中叠加炫酷的游戏效果,这样就使得游戏的娱乐性大大增强。
但是现有的AR语音识别并不限定人员,任何人说出相同的话都能触发AR场景。
因此,现有技术还有待发展。
发明内容
本发明实施例提供一种基于声纹注册的增强现实方法及装置,旨在解决现有的AR语音识别并不限定人员,任何人说出相同的话都能触发AR场景的问题。
本发明实施例是这样实现的,一种基于声纹注册的增强现实方法,其中,所述方法包括下述步骤:
获取拾音装置采集的现场使用者语音数据,并从所述使用者语音数据中提取使用者声纹特征信息;
将所述用者声纹特征信息与预先保存的管理者声纹特征信息进行匹配,判断所述使用者是否为终端设备管理者;
当所述使用者为终端设备管理者时,将所述使用者语音数据与声音数据库中的预设语音数据进行匹配,匹配成功时获取与所述预设语音数据对应的情景信息;
将所述情景信息通过增强现实技术进行展示;
所述情景信息包括文字、图片、语音、视频中任一种或多种组合。
进一步的,将所述使用者语音数据与声音数据库中的预设语音数据进行匹配包括下述步骤:
获取使用者语音数据中的唤醒词;
将所述唤醒词与声音数据库中的预设唤醒词进行匹配;
匹配成功则对所述唤醒词之后的使用者语音数据与声音数据库中的预设语音数据进行匹配;
当所述使用者语音数据与所述预设语音数据匹配成功时,获取与所述预设语音数据对应的情景信息;
所述唤醒词为预设于声音数据库中的固定词语。
进一步的,对所述唤醒词之后的使用者语音数据与声音数据库中的预设语音数据进行匹配包括下述步骤:
依次获取使用者语音数据中单个字的波形图;
将所述单个字的波形图和预存于声音数据库中语音数据的单字波形图的横轴纵轴归一化,得到含有多个直方的两个直方图;
计算所述两个直方图中的所有对应直方的均方误差,并进行匹配判断;
当所述均方误差小于预设的阈值,则认定两个字匹配;
重复上述步骤,直到所述使用者语音数据中最后一个字也匹配;
所述均方误差公式为:
其中Dn为使用者语音数据单个字直方图中的单个直方值,
dn为预存于声音数据库中语音数据单字直方图中的单个直方值,
n为直方个数。
进一步的,所述声纹特征信息提取采用线性预侧系数或者梅尔频率倒谱系数方式提取。
本发明实施还提供一种基于声纹注册的增强现实装置,其中,所述装置包括:
声纹特征获取模块,用于获取拾音装置采集的现场使用者语音数据,并从所述使用者语音数据中提取使用者声纹特征信息;
声纹特征匹配模块,用于将所述用者声纹特征信息与预先保存的管理者声纹特征信息进行匹配,判断所述使用者是否为终端设备管理者;
语音匹配与情景获取模块,用于当所述使用者为终端设备管理者时,将所述使用者语音数据与声音数据库中的预设语音数据进行匹配,匹配成功时获取与所述预设语音数据对应的情景信息;
展示模块,用于将所述情景信息通过增强现实技术进行展示;
所述情景信息包括文字、图片、语音、视频中任一种或多种组合。
进一步的,所述语音匹配与场景获取模块包括:
唤醒词获取模块,用于获取使用者语音数据中的唤醒词;
唤醒词匹配模块,用于将所述唤醒词与声音数据库中的预设唤醒词进行匹配;
语音匹配模块,用于当匹配成功时则对所述唤醒词之后的使用者语音数据与声音数据库中的预设语音数据进行匹配;
语音情景信息获取模块,用于当所述使用者语音数据与所述预设语音数据匹配成功时,获取与所述预设语音数据对应的情景信息;
所述唤醒词为预设于声音数据库中的固定词语。
进一步的,所述语音匹配模板包括:
波形图获取模块,用于依次获取使用者语音数据中单个字的波形图;
直方图生成模块,用于将所述单个字的波形图和预存于声音数据库中语音数据的单字波形图的横轴纵轴归一化,得到含有多个直方的两个直方图;
均方误差生成模块,用于计算所述两个直方图中的所有对应直方的均方误差,并进行匹配判断;
匹配判断模块,用于当所述均方误差小于预设的阈值,则认定两个字匹配;
循环模块,用于重复上述步骤,直到所述使用者语音数据中最后一个字也匹配;
所述均方误差公式为:
其中Dn为使用者语音数据单个字直方图中的单个直方值,
dn为预存于声音数据库中语音数据单字直方图中的单个直方值,
n为直方个数。
进一步的,所述声纹特征信息提取采用线性预侧系数或者梅尔频率倒谱系数方式提取。
本发明实施例的基于声纹注册的增强现实方法,将拾音装置采集的现场使用者语音数据提取使用者声纹特征信息,并与预先保存的管理者声纹特征信息进行匹配,当所述使用者为终端设备管理者时将所述使用者语音数据与声音数据库中的预设语音数据进行匹配,匹配成功时获取与所述预设语音数据对应的情景信息并通过增强现实技术进行展示,使得AR语音识别能够限定于特定的人员进行语音控制,仅有指定权限的人说出某些话时才触发相应的AR场景,不同的人使用语音指令操作不同的游戏对象,并在在其对应的现实场景中叠加炫酷的游戏效果,大大增强了AR游戏的娱乐性和体验感。
附图说明
图1是本发明实施例提供的基于声纹注册的增强现实方法的流程图;
图2是本发明实施例提供的使用者语音数据与预设语音数据进行匹配的流程图;
图3是本发明实施例提供的唤醒词之后的使用者语音数据与声音数据库中的预设语音数据进行匹配的流程图;
图4是本发明实施例提供的基于声纹注册的增强现实装置的结构图;
图5是本发明实施例提供的语音匹配与场景获取模块的结构图;
图6是本发明实施例提供的语音匹配模块的结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1示出了本发明实施例提供的基于声纹注册的增强现实方法的实现流程,
在步骤S101中,获取拾音装置采集的现场使用者语音数据,并从所述使用者语音数据中提取使用者声纹特征信息;
本发明实施例中的拾音装置可以是与AR设备连接的独立语音采集设备如专用的MIC,也可以是集成于AR设备上的语音采集模块,采集到AR设备使用者的语音数据后,传输给AR设备进行声纹特征信息的提取。
在本发明实施例中,所述声纹特征信息提取采用线性预侧系数或者梅尔频率倒谱系数方式提取。
在步骤S102中,将所述用者声纹特征信息与预先保存的管理者声纹特征信息进行匹配,判断所述使用者是否为终端设备管理者;
在提取使用者的声纹特征信息后,与预先存储的管理者声纹特征信息进行匹配,进行AR设备使用者身份的识别,使用者身份包括该设备的管理者和非管理者,管理者才有权使用该AR设备进行语音控制,一台AR设备的管理者可以有多个,管理者的身份为预先设置并保存,管理者声纹特征信息以及身份识别数据可以存储于本地的AR设备,也可以存储于与AR设备网络连接的服务器端。
在步骤S103中,当所述使用者为终端设备管理者时,将所述使用者语音数据与声音数据库中的预设语音数据进行匹配,匹配成功时获取与所述预设语音数据对应的情景信息;
只有当使用者的声纹特征信息与AR设备管理者的声纹特征信息匹配成功时,才会对使用者的全部语音数据继续进行语音的识别,与声音数据库中预先保存的语音数据进行匹配,如果声音数据库中保存有该段语音,则获取该语音对应的情景信息,在本发明实施例中,所述情景信息包括文字、图片、语音、视频中任一种或多种组合。在本发明的其他实施例中,声音数据库中预先保存的语音数据的对应数据也可以是执行指令用以控制AR设备的操作。
在步骤S104中,将所述情景信息通过增强现实技术进行展示;
将步骤S103中获取的情景信息通过AR技术在AR设备终端进行展示。
图2示出了本发明实施例提供的使用者语音数据与声音数据库中的预设语音数据进行匹配的实现流程,
在步骤S201中,获取使用者语音数据中的唤醒词;
本发明实施例中,会首先识别使用者语音数据中是否存在唤醒词,所述唤醒词为预设于声音数据库中的固定词语,如一段AR游戏的语音起始控制语音指令“开始”,只有存在“开始”这个唤醒词时,才对使用者语音数据中的后续语音进行识别匹配。
在步骤S202中,将所述唤醒词与声音数据库中的预设唤醒词进行匹配;
在步骤S203中,匹配成功则对所述唤醒词之后的使用者语音数据与声音数据库中的预设语音数据进行匹配;
在步骤S204中,当所述使用者语音数据与所述预设语音数据匹配成功时,获取与所述预设语音数据对应的情景信息;
图3示出了本发明实施例提供的唤醒词之后的使用者语音数据与声音数据库中的预设语音数据进行匹配的实现流程,
在步骤S301中,依次获取使用者语音数据中单个字的波形图;
在对使用者语音数据中唤醒词之后的语音数据进行逐字的识别。
在步骤S302中,将所述单个字的波形图和预存于声音数据库中语音数据的单字波形图的横轴纵轴归一化,得到含有多个直方的两个直方图;
在步骤S303中,计算所述两个直方图中的所有对应直方的均方误差,并进行匹配判断;
所述均方误差公式为:
其中Dn为使用者语音数据单个字直方图中的单个直方值,
dn为预存于声音数据库中语音数据单字直方图中的单个直方值,
n为直方个数。
在步骤S304中,当所述均方误差小于预设的阈值,则认定两个字匹配;
在本发明实施例中,如果识别计算过程中存在多个小于预设阈值的值,则取均方误差最小的值为匹配的字。
在步骤S305中,重复上述步骤,直到所述使用者语音数据中最后一个字也匹配。
图4示出了本发明实施例提供的基于声纹注册的增强现实装置的结构,包括:
声纹特征获取模块41,用于获取拾音装置采集的现场使用者语音数据,并从所述使用者语音数据中提取使用者声纹特征信息;
声纹特征匹配模块42,用于将所述用者声纹特征信息与预先保存的管理者声纹特征信息进行匹配,判断所述使用者是否为终端设备管理者;
语音匹配与情景获取模块43,用于当所述使用者为终端设备管理者时,将所述使用者语音数据与声音数据库中的预设语音数据进行匹配,匹配成功时获取与所述预设语音数据对应的情景信息;
展示模块44,用于将所述情景信息通过增强现实技术进行展示;
所述情景信息包括文字、图片、语音、视频中任一种或多种组合。
图5示出了本发明实施例提供的语音匹配与场景获取模块的结构,包括:
唤醒词获取模块51,用于获取使用者语音数据中的唤醒词;
唤醒词匹配模块52,用于将所述唤醒词与声音数据库中的预设唤醒词进行匹配;
语音匹配模块53,用于当匹配成功时则对所述唤醒词之后的使用者语音数据与声音数据库中的预设语音数据进行匹配;
语音情景信息获取模块54,用于当所述使用者语音数据与所述预设语音数据匹配成功时,获取与所述预设语音数据对应的情景信息;
所述唤醒词为预设于声音数据库中的固定词语。
图6示出了本发明实施例提供的语音匹配模块的结构,包括:
波形图获取模块531,用于依次获取使用者语音数据中单个字的波形图;
直方图生成模块532,用于将所述单个字的波形图和预存于声音数据库中语音数据的单字波形图的横轴纵轴归一化,得到含有多个直方的两个直方图;
均方误差生成模块533,用于计算所述两个直方图中的所有对应直方的均方误差,并进行匹配判断;
匹配判断模块534,用于当所述均方误差小于预设的阈值,则认定两个字匹配;
循环模块535,用于重复上述步骤,直到所述使用者语音数据中最后一个字也匹配;
所述均方误差公式为:
其中Dn为使用者语音数据单个字直方图中的单个直方值,
dn为预存于声音数据库中语音数据单字直方图中的单个直方值,
n为直方个数。
本发明实施例提供的基于声纹注册的增强现实方法及装置,将拾音装置采集的现场使用者语音数据提取使用者声纹特征信息,并与预先保存的管理者声纹特征信息进行匹配,当所述使用者为终端设备管理者时将所述使用者语音数据与声音数据库中的预设语音数据进行匹配,匹配成功时获取与所述预设语音数据对应的情景信息并通过增强现实技术进行展示,使得AR语音识别能够限定于特定的人员进行语音控制,仅有指定权限的人说出某些话时才触发相应的AR场景,不同的人使用语音指令操作不同的游戏对象,并在在其对应的现实场景中叠加炫酷的游戏效果,大大增强了AR游戏的娱乐性和体验感。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于声纹注册的增强现实方法,其特征在于,所述方法包括下述步骤:
获取拾音装置采集的现场使用者语音数据,并从所述使用者语音数据中提取使用者声纹特征信息;
将所述用者声纹特征信息与预先保存的管理者声纹特征信息进行匹配,判断所述使用者是否为终端设备管理者;
当所述使用者为终端设备管理者时,将所述使用者语音数据与声音数据库中的预设语音数据进行匹配,匹配成功时获取与所述预设语音数据对应的情景信息;
将所述情景信息通过增强现实技术进行展示;
所述情景信息包括文字、图片、语音、视频中任一种或多种组合。
2.根据权利要求1所述的基于声纹注册的增强现实方法,其特征在于,将所述使用者语音数据与声音数据库中的预设语音数据进行匹配包括下述步骤:
获取使用者语音数据中的唤醒词;
将所述唤醒词与声音数据库中的预设唤醒词进行匹配;
匹配成功则对所述唤醒词之后的使用者语音数据与声音数据库中的预设语音数据进行匹配;
当所述使用者语音数据与所述预设语音数据匹配成功时,获取与所述预设语音数据对应的情景信息;
所述唤醒词为预设于声音数据库中的固定词语。
3.根据权利要求2所述的基于声纹注册的增强现实方法,其特征在于,对所述唤醒词之后的使用者语音数据与声音数据库中的预设语音数据进行匹配包括下述步骤:
依次获取使用者语音数据中单个字的波形图;
将所述单个字的波形图和预存于声音数据库中语音数据的单字波形图的横轴纵轴归一化,得到含有多个直方的两个直方图;
计算所述两个直方图中的所有对应直方的均方误差,并进行匹配判断;
当所述均方误差小于预设的阈值,则认定两个字匹配;
重复上述步骤,直到所述使用者语音数据中最后一个字也匹配;
所述均方误差公式为:
其中Dn为使用者语音数据单个字直方图中的单个直方值,
dn为预存于声音数据库中语音数据单字直方图中的单个直方值,
n为直方个数。
4.根据权利要求1所述的基于声纹注册的增强现实方法,其特征在于,所述声纹特征信息提取采用线性预侧系数或者梅尔频率倒谱系数方式提取。
5.一种基于声纹注册的增强现实装置,其特征在于,所述装置包括:
声纹特征获取模块,用于获取拾音装置采集的现场使用者语音数据,并从所述使用者语音数据中提取使用者声纹特征信息;
声纹特征匹配模块,用于将所述用者声纹特征信息与预先保存的管理者声纹特征信息进行匹配,判断所述使用者是否为终端设备管理者;
语音匹配与情景获取模块,用于当所述使用者为终端设备管理者时,将所述使用者语音数据与声音数据库中的预设语音数据进行匹配,匹配成功时获取与所述预设语音数据对应的情景信息;
展示模块,用于将所述情景信息通过增强现实技术进行展示;
所述情景信息包括文字、图片、语音、视频中任一种或多种组合。
6.根据权利要求5所述的基于声纹注册的增强现实装置,其特征在于,所述语音匹配与场景获取模块包括:
唤醒词获取模块,用于获取使用者语音数据中的唤醒词;
唤醒词匹配模块,用于将所述唤醒词与声音数据库中的预设唤醒词进行匹配;
语音匹配模块,用于当匹配成功时则对所述唤醒词之后的使用者语音数据与声音数据库中的预设语音数据进行匹配;
语音情景信息获取模块,用于当所述使用者语音数据与所述预设语音数据匹配成功时,获取与所述预设语音数据对应的情景信息;
所述唤醒词为预设于声音数据库中的固定词语。
7.根据权利要求6所述的基于声纹注册的增强现实装置,其特征在于,所述语音匹配模板包括:
波形图获取模块,用于依次获取使用者语音数据中单个字的波形图;
直方图生成模块,用于将所述单个字的波形图和预存于声音数据库中语音数据的单字波形图的横轴纵轴归一化,得到含有多个直方的两个直方图;
均方误差生成模块,用于计算所述两个直方图中的所有对应直方的均方误差,并进行匹配判断;
匹配判断模块,用于当所述均方误差小于预设的阈值,则认定两个字匹配;
循环模块,用于重复上述步骤,直到所述使用者语音数据中最后一个字也匹配;
所述均方误差公式为:
其中Dn为使用者语音数据单个字直方图中的单个直方值,
dn为预存于声音数据库中语音数据单字直方图中的单个直方值,
n为直方个数。
8.根据权利要求5所述的基于声纹注册的增强现实装置,其特征在于,所述声纹特征信息提取采用线性预侧系数或者梅尔频率倒谱系数方式提取。
CN201611106579.5A 2016-12-06 2016-12-06 一种基于声纹注册的增强现实方法及装置 Pending CN106782569A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611106579.5A CN106782569A (zh) 2016-12-06 2016-12-06 一种基于声纹注册的增强现实方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611106579.5A CN106782569A (zh) 2016-12-06 2016-12-06 一种基于声纹注册的增强现实方法及装置

Publications (1)

Publication Number Publication Date
CN106782569A true CN106782569A (zh) 2017-05-31

Family

ID=58874258

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611106579.5A Pending CN106782569A (zh) 2016-12-06 2016-12-06 一种基于声纹注册的增强现实方法及装置

Country Status (1)

Country Link
CN (1) CN106782569A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107437272A (zh) * 2017-08-31 2017-12-05 深圳锐取信息技术股份有限公司 基于增强现实的互动娱乐方法、装置及终端设备
CN107978311A (zh) * 2017-11-24 2018-05-01 腾讯科技(深圳)有限公司 一种语音数据处理方法、装置以及语音交互设备
CN108335695A (zh) * 2017-06-27 2018-07-27 腾讯科技(深圳)有限公司 语音控制方法、装置、计算机设备和存储介质
CN108608180A (zh) * 2018-03-14 2018-10-02 斑马网络技术有限公司 零件装配方法及其装配系统
CN109166090A (zh) * 2018-08-28 2019-01-08 百度在线网络技术(北京)有限公司 基于声纹的增强现实处理方法、装置和存储介质
WO2019140823A1 (zh) * 2018-01-16 2019-07-25 平安科技(深圳)有限公司 语音验证方法、装置、计算机设备和计算机可读存储介质
CN110674482A (zh) * 2019-08-13 2020-01-10 武汉攀升鼎承科技有限公司 一种多场景应用计算机
CN110895941A (zh) * 2018-08-23 2020-03-20 深圳市优必选科技有限公司 声纹识别方法、装置及存储装置
CN113448975A (zh) * 2021-05-26 2021-09-28 科大讯飞股份有限公司 一种人物画像库的更新方法、装置、系统和存储介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103035135A (zh) * 2012-11-27 2013-04-10 北京航空航天大学 基于增强现实技术的儿童认知系统及认知方法
CN103729193A (zh) * 2014-01-11 2014-04-16 苏州思必驰信息科技有限公司 一种人机交互方法及装置
CN103811003A (zh) * 2012-11-13 2014-05-21 联想(北京)有限公司 一种语音识别方法以及电子设备
CN103810478A (zh) * 2014-02-21 2014-05-21 广东小天才科技有限公司 一种坐姿检测方法和装置
CN104216351A (zh) * 2014-02-10 2014-12-17 美的集团股份有限公司 家用电器语音控制方法及系统
CN104219628A (zh) * 2014-08-29 2014-12-17 南京信息职业技术学院 一种基于增强现实与智能手机的盲人信息服务方法及系统
CN104575504A (zh) * 2014-12-24 2015-04-29 上海师范大学 采用声纹和语音识别进行个性化电视语音唤醒的方法
CN105575395A (zh) * 2014-10-14 2016-05-11 中兴通讯股份有限公司 语音唤醒方法及装置、终端及其处理方法
CN105812573A (zh) * 2016-04-28 2016-07-27 努比亚技术有限公司 一种语音处理方法及移动终端
CN205451551U (zh) * 2016-01-05 2016-08-10 肖锦栋 一种语音识别驱动的增强现实人机交互视频语言学习系统
CN105957527A (zh) * 2016-05-16 2016-09-21 珠海格力电器股份有限公司 一种语音控制电器的方法、装置及语音控制空调
CN105957525A (zh) * 2016-04-26 2016-09-21 珠海市魅族科技有限公司 一种语音助手的交互方法以及用户设备
CN106020449A (zh) * 2016-05-06 2016-10-12 广东欧珀移动通信有限公司 一种虚拟现实的交互方法及装置
CN106023983A (zh) * 2016-04-27 2016-10-12 广东欧珀移动通信有限公司 基于虚拟现实vr场景的多用户语音交互方法以及装置

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103811003A (zh) * 2012-11-13 2014-05-21 联想(北京)有限公司 一种语音识别方法以及电子设备
CN103035135A (zh) * 2012-11-27 2013-04-10 北京航空航天大学 基于增强现实技术的儿童认知系统及认知方法
CN103729193A (zh) * 2014-01-11 2014-04-16 苏州思必驰信息科技有限公司 一种人机交互方法及装置
CN104216351A (zh) * 2014-02-10 2014-12-17 美的集团股份有限公司 家用电器语音控制方法及系统
CN103810478A (zh) * 2014-02-21 2014-05-21 广东小天才科技有限公司 一种坐姿检测方法和装置
CN104219628A (zh) * 2014-08-29 2014-12-17 南京信息职业技术学院 一种基于增强现实与智能手机的盲人信息服务方法及系统
CN105575395A (zh) * 2014-10-14 2016-05-11 中兴通讯股份有限公司 语音唤醒方法及装置、终端及其处理方法
CN104575504A (zh) * 2014-12-24 2015-04-29 上海师范大学 采用声纹和语音识别进行个性化电视语音唤醒的方法
CN205451551U (zh) * 2016-01-05 2016-08-10 肖锦栋 一种语音识别驱动的增强现实人机交互视频语言学习系统
CN105957525A (zh) * 2016-04-26 2016-09-21 珠海市魅族科技有限公司 一种语音助手的交互方法以及用户设备
CN106023983A (zh) * 2016-04-27 2016-10-12 广东欧珀移动通信有限公司 基于虚拟现实vr场景的多用户语音交互方法以及装置
CN105812573A (zh) * 2016-04-28 2016-07-27 努比亚技术有限公司 一种语音处理方法及移动终端
CN106020449A (zh) * 2016-05-06 2016-10-12 广东欧珀移动通信有限公司 一种虚拟现实的交互方法及装置
CN105957527A (zh) * 2016-05-16 2016-09-21 珠海格力电器股份有限公司 一种语音控制电器的方法、装置及语音控制空调

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108335695A (zh) * 2017-06-27 2018-07-27 腾讯科技(深圳)有限公司 语音控制方法、装置、计算机设备和存储介质
CN107437272A (zh) * 2017-08-31 2017-12-05 深圳锐取信息技术股份有限公司 基于增强现实的互动娱乐方法、装置及终端设备
CN107437272B (zh) * 2017-08-31 2021-03-12 深圳锐取信息技术股份有限公司 基于增强现实的互动娱乐方法、装置及终端设备
CN107978311A (zh) * 2017-11-24 2018-05-01 腾讯科技(深圳)有限公司 一种语音数据处理方法、装置以及语音交互设备
CN107978311B (zh) * 2017-11-24 2020-08-25 腾讯科技(深圳)有限公司 一种语音数据处理方法、装置以及语音交互设备
WO2019140823A1 (zh) * 2018-01-16 2019-07-25 平安科技(深圳)有限公司 语音验证方法、装置、计算机设备和计算机可读存储介质
CN108608180A (zh) * 2018-03-14 2018-10-02 斑马网络技术有限公司 零件装配方法及其装配系统
CN110895941A (zh) * 2018-08-23 2020-03-20 深圳市优必选科技有限公司 声纹识别方法、装置及存储装置
CN109166090A (zh) * 2018-08-28 2019-01-08 百度在线网络技术(北京)有限公司 基于声纹的增强现实处理方法、装置和存储介质
CN110674482A (zh) * 2019-08-13 2020-01-10 武汉攀升鼎承科技有限公司 一种多场景应用计算机
CN113448975A (zh) * 2021-05-26 2021-09-28 科大讯飞股份有限公司 一种人物画像库的更新方法、装置、系统和存储介质
CN113448975B (zh) * 2021-05-26 2023-01-17 科大讯飞股份有限公司 一种人物画像库的更新方法、装置、系统和存储介质

Similar Documents

Publication Publication Date Title
CN106782569A (zh) 一种基于声纹注册的增强现实方法及装置
RU2738325C2 (ru) Способ и устройство аутентификации личности
CN107464568B (zh) 基于三维卷积神经网络文本无关的说话人识别方法及系统
CN107767861B (zh) 语音唤醒方法、系统及智能终端
CN108399395A (zh) 基于端到端深度神经网络的语音和人脸复合身份认证方法
CN111524527B (zh) 话者分离方法、装置、电子设备和存储介质
CN103700371B (zh) 一种基于声纹识别的来电身份识别系统及其识别方法
WO2017162017A1 (zh) 语音数据处理方法、装置和存储介质
CN106599866A (zh) 一种多维度用户身份识别方法
CN108986826A (zh) 自动生成会议记录的方法、电子装置及可读存储介质
CN108597525B (zh) 语音声纹建模方法及装置
CN106294774A (zh) 基于对话服务的用户个性化数据处理方法及装置
CN104485103B (zh) 一种基于矢量泰勒级数的多环境模型孤立词识别方法
CN109493847B (zh) 声音识别系统以及声音识别装置
CN104575504A (zh) 采用声纹和语音识别进行个性化电视语音唤醒的方法
CN206209795U (zh) 一种基于生物特征识别的智能系统及移动设备
CN106898355B (zh) 一种基于二次建模的说话人识别方法
CN102404278A (zh) 一种基于声纹识别的点歌系统及其应用方法
CN107424614A (zh) 一种声纹模型更新方法
CN109817211A (zh) 一种电器控制方法、装置、存储介质及电器
CN109346084A (zh) 基于深度堆栈自编码网络的说话人识别方法
CN108831484A (zh) 一种离线的且与语言种类无关的声纹识别方法及装置
CN111462758A (zh) 智能会议角色分类的方法、装置、设备及存储介质
CN109074809B (zh) 信息处理设备、信息处理方法和计算机可读存储介质
CN101324919A (zh) 一种照片视频比对方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170531

RJ01 Rejection of invention patent application after publication