CN110858841A - 通过已注册用户的认证来注册新用户的电子设备和方法 - Google Patents
通过已注册用户的认证来注册新用户的电子设备和方法 Download PDFInfo
- Publication number
- CN110858841A CN110858841A CN201910727938.6A CN201910727938A CN110858841A CN 110858841 A CN110858841 A CN 110858841A CN 201910727938 A CN201910727938 A CN 201910727938A CN 110858841 A CN110858841 A CN 110858841A
- Authority
- CN
- China
- Prior art keywords
- user
- server
- electronic device
- registered
- voice signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000015654 memory Effects 0.000 claims abstract description 18
- 230000004044 response Effects 0.000 claims description 56
- 238000004891 communication Methods 0.000 claims description 30
- 230000005540 biological transmission Effects 0.000 claims 3
- 238000013473 artificial intelligence Methods 0.000 description 495
- 230000006870 function Effects 0.000 description 20
- 230000008569 process Effects 0.000 description 18
- 230000005236 sound signal Effects 0.000 description 14
- 230000009471 action Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000001815 facial effect Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/08—Network architectures or network communication protocols for network security for authentication of entities
- H04L63/0861—Network architectures or network communication protocols for network security for authentication of entities using biometrical features, e.g. fingerprint, retina-scan
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/45—Structures or tools for the administration of authentication
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
- G10L17/24—Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/08—Network architectures or network communication protocols for network security for authentication of entities
- H04L63/0884—Network architectures or network communication protocols for network security for authentication of entities by delegation of authentication, e.g. a proxy authenticates an entity to be authenticated on behalf of this entity vis-à-vis an authentication entity
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2221/00—Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/21—Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/2117—User registration
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/12—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Computer Hardware Design (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Telephonic Communication Services (AREA)
Abstract
本文公开了一种电子设备和一种方法。该电子设备包括扬声器、麦克风、处理器和存储指令的存储器,其中指令实现所述方法,包括:基于通过电子设备的麦克风获取的第一语音信号来确定是否需要注册第一用户;当需要注册第一用户时,请求在电子设备处预先注册的第二用户对第一用户进行认证;以及当接收到第二用户认证第一用户的信息时,基于所接收的信息注册第一用户。
Description
技术领域
特定实施例涉及用于通过已注册用户的认证来注册新用户的方法和电子设备。
背景技术
随着数字技术的增强,能够基于语音识别技术提供各种语音识别服务的电子设备在复杂性和实用性方面有了很大的提高。得益于语音识别技术的发展,电子设备可以提供语音识别服务,允许用户基于“自然语言理解”(NLU)为电子设备制定输入和命令。语音识别服务可与例如语音识别、人工智能(AI)和物联网(IoT)等相关技术相关。
上述信息作为背景信息提供,仅用于协助理解本公开。关于上述任何一项是否适合作为关于本公开的现有技术,未作出任何决定,也未作出任何断言。
发明内容
当用户为其自己注册拥有关于提供语音识别服务的电子设备的权限时,用户应遵循通过使用用户终端生成帐户或注册帐户的程序。在这种情况下,要求用户通过用户终端输入账户必需的信息,这可能导致不方便。此外,当用户没有用户终端时,出现了用户不能注册使用提供语音识别服务的电子设备的问题。
本公开的一些实施例提供一种用于通过经由已注册用户的认证来注册新用户的电子设备和方法。
根据本公开的一些实施例,一种电子设备包括:扬声器;麦克风;至少一个处理器;以及存储程序指令的存储器,程序指令可由该至少一个处理器执行以使得电子设备:基于通过麦克风获取的第一语音信号来确定是否需要注册第一用户,当需要注册第一用户时,请求在电子设备处预先注册的第二用户对第一用户进行认证,以及当接收到第二用户认证第一用户的信息时,基于所接收的信息注册第一用户。
此外,根据本公开的一些实施例,一种电子设备的操作方法包括:基于通过电子设备的麦克风获取的第一语音信号来确定是否需要注册第一用户;当需要注册第一用户时,请求在电子设备处预先注册的第二用户对第一用户进行认证;以及当接收到第二用户认证第一用户的信息时,基于所接收的信息注册第一用户。
附图说明
从下文结合附图的描述中,本公开一些实施例的上述和其他方面、特征和优势将更加明显,附图中:
图1是示出根据一些实施例的包括AI设备、AI服务器、账户服务器和用户设备的网络环境示例的视图;
图2是示出根据一些实施例的AI设备的功能配置示例的视图;
图3是示出根据一些实施例的在AI设备、AI服务器和账户服务器之间的信号流示例的视图;
图4是示出根据一些实施例的AI设备的操作示例的视图;
图5是示出根据一些实施例的在AI设备、AI服务器和账户服务器之间用于通过使用第二用户的设备来认证第一用户的信号流示例的视图;
图6是示出根据一些实施例的用于在AI设备中根据第二用户和第一用户是否处于相同空间来请求第二用户认证第一用户的操作示例的视图;
图7是示出根据一些实施例的在AI设备、AI服务器和账户服务器之间用于执行与第一用户的注册有关的附加操作的信号流示例的视图;
图8是示出根据一些实施例的与存储在第二用户设备的地址簿中的第一用户的联系方式有关的屏幕示例的视图;
图9是示出根据一些实施例的在AI设备、AI服务器和账户服务器之间用于执行与第一用户的注册有关的其他附加操作的信号流示例的视图;以及
图10是示出根据一些实施例的在AI设备、AI服务器、IoT设备和IoT服务器之间用于注册IoT设备的信号流示例的视图。
具体实施方式
根据一些实施例的电子设备(例如,用户设备、人工智能(AI)设备、物联网(IoT)设备)可以是各种类型的电子设备之一。电子设备可以包括例如便携式通信设备(例如,智能电话)、计算机设备、便携式多媒体设备、便携式医疗设备、照相机、可穿戴设备或家用电器。根据本公开的实施例,电子设备不限于上述那些。
应当理解,本公开的一些实施例和其中所使用的术语不旨在将本文所阐述的技术特征限制到特定实施例,而是包括对应实施例的各种变化、等效物或替换。关于附图的描述,可以使用类似的参考标号来指代类似或相关的元素。应当理解,对应于某一项的名词的单数形式可以包括一个或多个事物,除非相关上下文以其他方式明确地指出。如本文所使用的,诸如“A或B”、“A和B中至少一个”、“A或B中至少一个”、“A、B或C”、“A、B和C中至少一个”和“A、B或C中至少一个”之类的这种短语中的每一个可以包括在这些短语的对应一个中一起列举的项中的任一项或所有可能组合。如本文所使用的,诸如“第一”和“第二”这样的术语可以用于简单地相互区分对应的组件,而不是在其他方面(例如,重要性或次序)对组件进行限制。应当理解,如果在带有或不带有术语“操作性地”或“通信式地”的情况下提及一个元素(例如,第一元素)与另一元素(例如,第二元素)“耦合”、“耦合到”另一元素(例如,第二元素)、与另一元素(例如,第二元素)“连接”或“连接到”另一元素(例如,第二元素),则意味着该元素可以与该另一元素直接地(例如,有线地)、无线地或经由第三元素而耦合。
如本文所使用的,术语“模块”可以包括以硬件、软件或固件实现的单元,并且可以与其他术语互换使用,例如“逻辑”、“逻辑块”、“部分”或“电路”。模块可以是适合于执行一个或多个功能的单个集成组件或其最小单元或部分。例如,根据一个实施例,模块可以以专用集成电路(ASIC)的形式实现。
本文阐述的一些实施例可以实现为包括一个或多个指令的软件(例如,程序),这些指令存储在机器(例如,电子设备、用户设备、AI设备、IoT设备、服务器)可读的存储介质(例如,内部存储器或外部存储器)中。例如,机器(例如,电子设备或AI设备101)的处理器可以调用存储在存储介质中的一个或多个指令中的至少一个,并且在处理器的控制下使用或者不使用一个或多个其他组件来执行该指令。这允许机器操作为根据所调用的至少一个指令执行至少一个功能。一个或多个指令可以包括编译器所生成的代码或解译器可执行的代码。机器可读存储介质可以以非瞬态存储介质的形式提供。其中,术语“非瞬态”仅意味着存储介质是有形设备,不包括信号(例如,电磁波),但是该术语并不在数据半永久地存储在存储介质中和数据临时地存储在存储介质中之间进行区分。
根据一个实施例,根据本公开一些实施例的方法可以被包括并被提供在计算机程序产品中。计算机程序产品可以作为产品在买卖双方之间进行交易。计算机程序产品可以以机器可读存储介质(例如,紧致盘只读存储器(CD-ROM))的形式分发,或者经由应用商店(例如,PlayStoreTM)在线分发(例如,下载或上传),或者直接在两个用户设备(例如,智能电话)之间分发。如果在线分发,则计算机程序产品的至少一部分可以临时生成或至少临时存储在机器可读存储介质中,诸如制造商的服务器、应用商店的服务器或中继服务器的存储器中。
根据一些实施例,上述组件中的每个组件(例如,模块或程序)可以包括单个实体或多个实体。根据一些实施例,上述组件中的一个或多个可以省略,或者可以添加一个或多个其他组件。备选地或附加地,多个组件(例如,模块或程序)可以集成为单个组件。在这种情况下,根据一些实施例,所集成的组件仍然可以以与该多个组件中的对应一个在集成前执行功能时相同或类似的方式来执行该多个组件中每一个的一个或多个功能。根据一些实施例,由模块、程序或另一组件所执行的操作可以顺序地、并行地、重复地、或启发式地执行,或者一个或多个操作可以以不同顺序执行或省略,或可以添加一个或多个其他操作。
图1示出根据一些实施例的包括AI设备、AI服务器、账户服务器和用户设备的网络环境示例。
参考图1,网络环境100包括AI设备101、AI服务器102、账户服务器103和用户设备105。
AI设备101可以执行AI代理或AI助手的功能。AI设备101可以包括例如AI扬声器,但是不限于此。AI设备101可以实现为能够执行AI代理功能的各种类型的设备。例如,家中的AI设备101可以通过家用电器之一来实现,或者可以实现为家庭中枢站(hub)。
AI设备101可以安装在家中以充当家庭的AI助手,或者可以安装在公共场所以用作多个用户的共享设备。AI设备的功能或目的不受限制。例如,AI设备101可以安装在私用空间,诸如旅店房间,在这种情况下,使用AI设备101的用户可能持续地变化。
AI设备101可以注册希望使用AI设备101的用户。AI设备101可以通过注册用户来给予已注册用户使用AI设备101的权限。例如,通过AI设备101注册用户的动作可以包括生成用户账户的动作。通过AI设备101注册用户的动作可以基于根据语音信号与用户的交谈对话以及基于与服务器(例如,AI服务器102或账户服务器103中至少一个)的通信来执行。AI设备101可以在与AI设备101连接的服务器(例如,AI服务器102或账户服务器103中至少一个)中存储关于已注册用户账户的信息(例如,简档)。然而,这不应当认为是限制,AI设备101可以在AI设备101的存储器中直接存储关于已注册用户账户的信息。
已注册使用AI设备101的用户可以具有针对AI设备101的指定级别或更高级别的权限。例如,AI设备101可以通过使用关于已注册用户账户的信息(例如,简档、声纹信息、昵称、称呼等)向已注册用户提供定制功能。AI设备101能够向已注册用户提供的功能可以不同于AI设备101向未注册用户提供的功能。例如,AI设备101可以向所有已注册用户和未注册用户提供天气信息或时间信息。然而,AI设备101可以向已注册用户额外提供以下功能中的至少一个:通知已注册用户的个人日程表的功能,呼叫另一已注册用户的功能,向另一已注册用户发送消息的功能,或者控制与AI设备101关联的IoT设备的功能。AI设备101可以不向未注册用户提供上述向已注册用户额外提供的功能。
AI设备101可以注册多个用户并且可以分别向已注册用户提供定制服务。例如,与AI设备101连接的AI服务器102(或账户服务器103)可以存储用户的声纹信息以注册用户。AI设备101(或AI服务器102)可以通过使用声纹信息来识别(或辨别)多个用户。因此,AI设备101可以接收诸如“让我知道今天‘我的’日程表”之类的语音输入,并且可以从已注册用户中识别对应于该语音输入的用户,以及可以向该用户提供定制服务。
在本公开中将描述的用户可以包括第一用户和第二用户。第一用户可以是未注册使用AI设备101的新用户。在一些实施例中,AI设备101可以执行识别未注册的第一用户的动作,以及注册第一用户的动作。例如,AI设备101可以执行生成第一用户的账户以便使用AI设备101的动作。
第二用户可以是已经注册使用AI设备101的用户。例如,可以生成和/或注册第二用户的账户以便使用AI设备101。关于第二用户账户的信息可以存储在与AI设备101连接的服务器(例如,AI服务器102或账户服务器103中至少一个)中。可以通过第二用户的用户设备105来生成和/或注册第二用户用于使用AI设备101的账户。第二用户的用户设备105可以包括例如第二用户所拥有的智能电话、可穿戴设备、平板PC、计算机设备或便携式多媒体设备,但是不限于此。
在一些实施例中,AI设备101可以请求已注册第二用户认证第一用户以注册第一用户。AI设备101可以基于第一用户被第二用户认证,来生成第一用户的账户以注册第一用户。通过第二用户认证第一用户的动作可以包括以下至少一个动作:通过使用经由AI设备101(例如,AI扬声器)的麦克风获取的第二用户的语音输入来认证第一用户的动作,或者通过第二用户的用户设备105从第二用户获取认证信息的动作。
AI服务器102可以通过通信网络与AI设备101连接,并且可以识别(辨别)用户话语或者可以识别(生成或选择)对应于用户话语的响应以允许AI设备101与用户进行交谈对话。
例如,AI服务器102可以通过通信网络从AI设备101接收用户语音输入,并且可以将用户语音输入转变成文本数据。AI服务器102可以识别(生成或选择)与用于基于文本数据执行功能的动作(或操作)有关的信息,或者与执行该动作所需的参数有关的信息。AI服务器102可以生成用于执行用户所请求任务的状态序列。任务可以是可由AI软件(或应用)提供的任何动作。任务可以包括:例如,搜索日程表,提供天气信息,控制与AI设备101关联的外部电子设备(例如,IoT设备),或呼叫在AI设备101处注册的电子设备(例如,用户设备105)。上文描述的AI服务器102的动作可以由AI系统来提供。AI系统可以是基于规则的系统或基于神经网络的系统(例如,前馈神经网络(FNN)、递归神经网络(RNN))。备选地,AI系统可以是上述系统或其他AI系统的组合。根据一个实施例,任务或动作或用于执行动作的参数可以从预定义集合中选择,或者可以响应于用户请求而实时生成。
AI服务器102可以包括例如自动语音识别(ASR)模块、自然语言理解(NLU)模块、自然语言生成器(NLG)模块、或文本到语音(TTS)模块。AI服务器102可以包括通信电路、存储器和处理器。处理器可以通过执行存储在存储器中的命令来驱动ASR模块、NLU模块、NLG模块和TTS模块。AI服务器102可以通过通信电路与外部电子设备(例如,AI设备101、账户服务器103、用户设备105)交换数据(或信息)。
根据一个实施例,AI服务器102可以通过使用ASR模块,将从AI设备101接收的用户输入转换成文本数据。例如,ASR模块可以包括话语识别模块。话语识别模块可以包括声学模型和语言模型。例如,声学模型可以包括关于发音的信息,语言模型可以包括单位音素信息和与单位音素信息的组合有关的信息。话语识别模块可以通过使用关于发音的信息和关于单位音素信息的信息,将用户话语转换成文本数据。关于声学模型和语言模型的信息可以存储在例如自动语音识别数据库(ASR DB)中。
根据一个实施例,AI服务器102可以通过使用NLU模块执行句法分析或语义分析,来理解用户意图。句法分析可以按如下执行:将用户输入划分成语法单元(例如,词、短语、语素等),并理解每个划分单元所具有的语法要素。语义分析可以通过使用语义匹配、规则匹配、公式匹配等来执行。相应地,NLU模块可以获取与用户输入对应的域和意图,或者表示意图所需的参数(或槽(slot))。
根据一个实施例,NLU模块可以通过使用语素、短语等的语言特征(例如,语法元素),来理解从用户输入提取的词的含义,并且可以通过将所理解的词的含义与域和意图进行匹配,来确定用户的意图。
根据一个实施例,NLU模块可以通过使用存储有用于理解用户输入的意图的语言特征的自然语言识别数据库,来确定用户的意图。根据另一实施例,NLU模块可以通过使用个人语言模型(PLM),来确定用户的意图。例如,NLU模块可以通过使用个人信息(例如,关于用户账户、联系人列表、音乐列表的信息),来确定用户的意图。PLM可以存储在自然语言识别数据库中。
根据一个实施例,NLU模块可以基于用户输入的意图和参数,来确定用于执行对应于用户输入的功能的动作,或者执行该动作所需的参数。AI服务器102可以向AI设备101或另一外部设备(例如,IoT服务器)发送关于该动作的信息。例如,IoT服务器可以基于接收到关于该动作的信息来控制IoT设备。
根据一个实施例,AI服务器102可以通过使用NLG模块将指定信息转变成文本形式。转变成文本形式的信息可以是自然语言话语的形式。指定信息可以是例如关于额外输入的信息、通知对应于用户输入的动作完成的信息、或指导用户额外输入的信息(例如,关于用户输入的反馈信息)。转变成文本形式的信息可以发送到AI设备101或者可以发送到TTS模块并且可以转变成语音形式。
根据一个实施例,AI服务器102可以通过使用TTS模块将文本形式的信息转变成语音形式的信息。TTS模块可以从NLG模块接收文本形式的信息,可以将文本形式的信息转变成语音形式的信息,并且可以将该信息发送给AI设备101。AI设备101可以向扬声器输出语音形式的信息。
根据一个实施例,ASR模块、NLU模块、NLG模块或TTS模块中的一个或多个可以实现为AI服务器102中的一个模块。备选地,ASR模块、NLU模块、NLG模块或TTS模块中的一个或多个可以实现在AI设备101中。相应地,AI服务器102的至少一些功能可以在AI设备101中执行。
AI服务器102可以针对从AI设备101接收的用户语音信号执行声纹识别。AI服务器102可以从用户的语音信号提取声纹信息。AI服务器102可以将声纹信息存储在AI服务器102的数据库中,或者可以临时存储声纹信息。例如,AI服务器102可以与用户账户相关联地存储已注册使用AI设备101的用户的声纹信息。AI服务器102可以基于声纹信息的数据库,从一个或多个已注册用户中识别发出语音信号的用户。例如,当AI服务器102将发出语音信号的用户识别为未注册的新用户时,AI服务器102可以临时存储该语音信号的声纹信息。
AI服务器102可以存储与已注册AI设备101的用户账户有关的信息(例如,简档)的至少一部分。例如,AI服务器102可以存储已注册用户的声纹信息、已注册用户之间的关系和已注册用户相互呼叫的称呼(例如,昵称),作为与已注册用户的账户有关的信息(例如,简档)。例如,当AI设备101安装在家中时,家庭成员可以注册为AI设备101的用户,并且AI服务器102可以存储家庭成员的关系或称呼(例如,母亲、儿子,昵称诸如“gwiyomi”,其为韩语“小可爱”)。
账户服务器103可以存储与用户设备105相关的账户。例如,账户服务器103可以存储用户设备105的用户的姓氏、名字、生日和电子邮箱。账户服务器103可以向AI服务器102提供关于与用户设备105相关的账户的信息。
关于已注册AI设备101的用户账户的信息可以存储在AI服务器102中,或者可以存储在账户服务器103中。例如,关于已注册用户账户的信息(例如,简档)的一部分可以存储在AI服务器102中,而其他部分可以存储在账户服务器103中。根据一个实施例,AI服务器102和账户服务器103可以实现为一个设备(例如,服务器104)。根据另一实施例,AI服务器102和账户服务器103可以集成在AI设备101中。例如,关于已注册AI设备101的用户账户的信息可以存储在AI设备101中。在一些实施例中,AI服务器102和账户服务器103的功能的至少一部分可以通过AI设备101来实现。
图2示出根据一些实施例的AI设备101的功能配置示例。AI设备101可以是执行AI代理功能的设备,并且例如可以包括AI扬声器。
参考图2,AI设备101可以包括处理器220、通信模块290、存储器230和音频模块270。然而,这不应当认为是限制,可以从AI设备101中省略上述组件中的至少一个,或者可以添加一个或多个其他组件。
音频模块270可以将声音转换成电信号,以及相反地,可以将电信号转换成声音。音频模块270可以包括作为输入设备的麦克风271,并且可以包括作为输出设备的扬声器272。音频模块270可以通过麦克风271从外部获取声音。在一些实施例中,音频模块270可以通过麦克风271获取第一用户的语音信号和第二用户的语音信号。音频模块270可以将对应于所获取声音的模拟音频信号转换成数字音频信号。音频模块270可以对数字音频信号执行各种处理操作。例如,音频模块270可以对一个或多个数字音频信号执行噪声处理操作(例如,噪声或回声衰减)或与提取特征点有关的处理操作。在另一示例中,音频模块270可以向处理器220发送数字音频信号,使得处理器220可以执行上述处理操作。在又一示例中,上述处理操作的至少一部分可以由AI服务器102执行。在这种情况下,音频模块270或处理器220可以通过通信模块290向AI服务器102发送数字音频信号,使得AI服务器102可以执行上述处理操作。
音频模块270可以将数字音频信号转换成模拟音频信号。例如,音频模块270可以将从AI服务器102接收的数字音频信号(例如,由处理器220处理的数字音频信号)转换成模拟音频信号。在一些实施例中,从AI服务器102接收的数字音频信号可以对应于与第一用户或第二用户进行交谈对话的AI设备101的响应。音频模块270可以将转换的模拟音频信号通过扬声器272向外部输出。
基于如上所述的通过麦克风217输入并通过扬声器272输出的语音,AI设备101可以与未注册的第一用户或已注册的第二用户进行交谈对话。
通信模块290可以建立AI设备101和外部电子设备(例如,AI服务器102、账户服务器103或用户设备105)之间的通信链路,并且可以通过建立的通信链路执行通信。例如,通信模块290可以向AI服务器102发送与通过麦克风271获取的用户语音信号对应的数据。通信模块290可以从AI服务器102接收与对用户语音信号做出响应的语音信号对应的数据。
处理器220可以控制AI设备101的总体操作。处理器220可以接收其他组件(例如,音频模块270、通信模块290、存储器230等)的命令,可以解译接收的命令,并且可以根据解译的命令执行计算或处理数据。处理器220可以通过软件实现,可以通过诸如芯片、电路等的硬件实现,或者可以通过软件和硬件的组合来实现。处理器220可以是一个处理器,或者可以是多个处理器的组合。根据一些实施例的处理器220(或AI设备101)的详细操作将在下文参考图3到图10进行详细描述。
存储器230可以表示一个或多个存储器的集合。存储器230可以基于与处理器220的信令来执行存储在存储器230中的命令。存储器230可以存储从其他组件(例如,处理器220、通信模块290、音频模块270)接收或生成的数据和/或命令。根据特定实施例,存储器230可以存储与注册使用AI设备101的用户账户有关的信息(例如,简档)的至少一部分。例如,当AI服务器102(或账户服务器103)集成在AI设备101中并且通过AI设备101实现时,存储器230可以以数据库的形式存储与注册使用AI设备101的用户账户有关的信息(例如,简档)。
图3示出根据一些实施例的在AI设备101、AI服务器102和账户服务器103之间的信号流示例。根据一个实施例,AI服务器102和账户服务器103可以集成在一个服务器104中。
参考图3,在操作301中,AI设备101可以通过麦克风271获取语音信号。语音信号可以是某个用户(例如,第一用户)说出的语音。根据一个实施例,第一用户的语音信号也可以是从另一电子设备(例如,另一AI扬声器)输出的话语或语音。
在操作302中,AI设备101可以通过通信模块290向AI服务器102发送对应于语音信号的数据(例如,数字音频信号)。AI服务器102可以接收与AI设备101从用户获取的语音信号对应的数据。
在操作303中,AI服务器102可以通过使用接收的数据来执行声纹识别。声纹识别可以包括识别对应于语音信号的语音。AI服务器102可以存储已经注册使用AI设备101的用户的声纹信息。AI服务器102可以基于尝试将语音信号与存储的声纹信息进行匹配,来识别发出语音信号的用户是已注册用户还是未注册用户。
在操作304中,AI服务器102可以基于声纹识别而识别出对应于语音信号的声纹是未注册声纹。换言之,AI服务器102可以识别出发出语音信号的第一用户是未注册用户。AI服务器102可以响应于识别出对应于语音信号的声纹是未注册声纹,存储(或临时存储)声纹信息。
在操作305中,基于识别出对应于语音信号的声纹是未注册声纹,AI服务器102可以向AI设备101发送账户生成信号,使得AI设备101前进到针对第一用户(发出该语音信号的人)的账户生成处理。
在一些实施例中,AI设备101可以是安装在家中的AI扬声器。AI服务器102可以在指定时段(例如,1周)内累积对应于语音信号的数据或声纹信息,以识别发出语音信号的第一用户是家庭成员还是临时访客。响应于第一用户的声纹被识别为在指定时段内具有指定频率或指定次数或更多次,AI服务器102可以识别出第一用户是家庭成员。响应于第一用户的声纹被识别为在指定时段内具有指定频率或指定次数或更多次,AI服务器102可以向AI设备101发送用于生成第一用户账户的账户生成信号。
根据一个实施例,账户生成信号可以对应于音频数据(例如,语句)以通过AI设备101中的扬声器272输出。例如,账户生成信号可以是音频数据,诸如“你是新来的。你是谁?”或“你想要我注册吗?”。此后,AI设备101可以基于从AI服务器102接收的音频数据来执行第一用户的注册处理。
根据另一实施例,账户生成信号可以是用于使得AI设备101开始第一用户的账户生成处理的控制信号。AI设备101可以响应于接收到账户生成信号(也即,控制信号),输出指定的语音信号以生成第一用户的账户。例如,将从AI设备101输出的语音信号可以是“你是新来的。你是谁?”或“你想要我开始注册吗?”,并且可以在AI设备101处生成,或者可以被预先指定和存储。
在操作306中,响应于从AI服务器102接收到账户生成信号,AI设备101可以输出提示生成第一用户账户的语音。从AI设备101输出的语音可以是例如引导生成第一用户账户的语句(例如,“你想要我注册吗?”),或询问生成第一用户账户所需信息的语句(例如,“你叫什么名字?”),但是这不应当认为是限制。
在操作307中,AI设备101可以接收对为生成用户账户而输出的语音做出响应的第一用户的语音。然而,这不应当认为是限制。AI设备101可以接收第二用户的语音信号作为对为生成第一用户账户而输出的语音的响应。例如,响应于AI设备101的问题“你想要我开始注册吗?”,第一用户可以说出“是的”,或已注册的第二用户(例如,另一家庭成员)可以说出“是的”。
在操作308中,AI设备101可以识别是否存在生成第一用户账户所需的信息。生成第一用户账户所需的信息可以包括用于生成第一用户帐户(或临时账户)所需的最低程度的信息,诸如第一用户的姓氏、名字。当不存在生成第一用户账户所需的信息时(例如,未能获取该信息),AI设备101可以返回到操作306以将请求生成第一用户账户所需的信息的语音作为用于生成第一用户账户的语音信号进行输出。例如,AI设备101可以在操作306中输出诸如“你叫什么名字?”之类的语音,并且可以在操作307中从第一用户或第二用户接收说出第一用户的姓名的语音。
在操作306到308中,可以显示在AI设备101和用户(例如,第一用户或第二用户)之间交换的交谈语句。根据一个实施例,在操作306到308中,AI设备101可以通过基于预先存储在AI设备101中的数据输出指定语音信号而与用户进行对话。根据另一实施例,在操作306到308中,AI设备101可以基于与AI服务器102的通信而与用户进行对话。在这种情况下,AI设备101可以通过向AI服务器102发送用户的语音信号并从AI服务器102接收对用户的语音信号做出响应的音频数据并且通过扬声器272输出该音频数据,来与用户进行对话。
在一些实施例中,在操作306到308中AI设备101与用户(例如,第一用户或第二用户)之间的交谈语句可以包括AI设备101询问未注册的第一用户与已注册的第二用户之间的关系。基于用户对该问题的回答,AI设备101可以获取关于未注册的第一用户与已注册的第二用户之间的关系(例如,儿子、母亲)的信息。
此外,当在操作306到308期间接收到已注册第二用户的语音信号时,AI设备101可以识别与第一用户存在于相同空间中的第二用户。例如,AI服务器102可以从AI设备101接收与第二用户的语音信号对应的数据,可以通过声纹识别来识别已注册的第二用户,并且可以识别出第二用户与第一用户在相同空间中。
当在操作308中识别出存在(例如,获得)生成第一用户账户所需的信息(例如,姓氏、名字)时,AI设备101可以前进到操作309以向AI服务器102发送生成第一用户账户所需的信息。AI服务器102可以从AI设备101接收生成第一用户账户所需的信息。AI服务器102可以向账户服务器103发送接收的信息(例如,第一用户的姓名)以生成第一用户的账户。例如,AI服务器102可以向账户服务器103发送指示第一用户姓名的数据和存储(或临时存储)在AI服务器102中的第一用户的声纹信息,使得账户服务器103生成第一用户的账户(或临时账户)。账户服务器103可以从AI服务器102接收指示第一用户姓名的数据和第一用户的声纹信息。根据一个实施例,AI服务器102和账户服务器103可以集成在一个服务器104中。
在操作310中,账户服务器103可以存储从AI服务器102接收(或从AI设备101接收)的与第一用户有关的信息。例如,账户服务器103可以存储第一用户的姓名和第一用户的声纹信息以生成第一用户的账户。当第一用户通过操作311到318得以认证时,可以完成第一用户的账户生成处理。
在操作311中,账户服务器103可以请求对第一用户的认证以完成第一用户账户的生成。账户服务器103可以通过AI服务器102向AI设备101发送请求对第一用户的认证的信号,使得AI设备101输出请求对第一用户的认证的语音信号。例如,响应于从AI服务器102接收到生成第一用户账户所需的信息(例如,第一用户的姓名、第一用户的声纹信息),账户服务器103可以向AI服务器102发送请求对第一用户的认证的信号。AI服务器102可以从账户服务器103接收请求对第一用户的认证的信号。响应于接收到该信号,AI服务器102可以向AI设备101发送请求对第一用户的认证的信号。AI设备101可以从AI服务器102接收请求对第一用户的认证的信号。
根据一个实施例,AI设备101从AI服务器102所接收的请求对第一用户的认证的信号可以对应于用于在AI设备101处通过扬声器272输出的音频数据(例如,语句)。例如,AI设备101可以输出与从AI服务器102接收的请求对第一用户的认证的音频数据对应的语音信号。
根据另一实施例,请求对第一用户的认证的信号可以是使得AI设备101请求对第一用户的认证的控制信号。响应于接收到认证请求信号(也即,控制信号),AI设备101可以输出指定的语音信号以请求对第一用户的认证。
在操作312中,响应于从AI服务器102接收到请求对第一用户的认证的信号,AI设备101可以输出用于认证第一用户的语音信号。从AI设备101输出的用于认证第一用户的语音信号可以包括使得已注册第二用户认证第一用户的请求。
从AI设备101输出的用于认证第一用户的语音信号可以是引导对第一用户的认证的语句(例如,“请认证!”)。然而,本公开不限于此示例,AI设备101可以输出指定语句以认证第一用户。例如,AI设备101可以输出询问与已注册第二用户的关系的指定语句,作为第一用户认证过程的一部分。AI设备101可以基于针对该指定语句接收到已注册第二用户的回答,来执行第一用户的认证过程的至少一部分。例如,当识别出对指定语句做出响应的声纹是已注册第二用户的声纹时,可以执行第一用户的认证过程的至少一部分。
在一些实施例中,AI设备101可以请求已注册第二用户认证第一用户以注册第一用户。AI设备101可以输出用于请求已注册第二用户认证第一用户的语音或语句,以认证第一用户。
在一些实施例中,AI设备101可以输出指导已注册第二用户说出指定句子的语音信号以认证第一用户。例如,指定句子可以是第二用户预先设置的口令。在另一示例中,指定句子可以是AI设备101所建议的句子。
在一些其他实施例中,AI设备101可以输出指导已注册第二用户通过第二用户的用户设备105执行认证的语音信号,以认证第一用户。通过第二用户的用户设备105进行的认证可以包括使用生物特征识别(例如,面部识别、指纹识别、虹膜识别)的认证、使用图案的认证、使用PIN的认证、使用密码的认证、使用消息或电子邮件的认证、或者由证书机构或通信运营商提供的认证。下面将参考图5来描述通过第二用户的用户设备105进行的认证的详细操作。
在操作313中,响应于用于认证第一用户的语音信号,AI设备101可以获取已注册第二用户的语音信号。例如,第二用户可以说出预先设置的口令或者可以说出在操作312中AI设备101所建议的句子。然而,这不应当认为是限制。例如,当作为第一用户的认证过程的一部分,AI设备101输出询问与已注册第二用户的关系的指定语句时,第二用户可以回答与第一用户的关系(例如,“这是我儿子”或“他叫我妈妈”)。AI设备101(或AI服务器102)可以至少基于获得第一用户与第二用户之间的关系来认证或注册第一用户。
在操作314中,AI设备101可以通过通信模块290向AI服务器102发送所获取的与第二用户的语音信号对应的数据。AI服务器102可以从AI设备101接收与第二用户的语音信号对应的数据。
在操作315中,AI服务器102可以通过使用接收的数据来执行声纹识别。AI服务器102可以存储已经注册使用AI设备101的用户的声纹信息。
在操作316中,AI服务器102可以基于预先存储的声纹信息识别出发出语音信号的用户是已经注册的。此外,AI服务器102可以识别出第二用户的语音信号指示第二用户已经认证第一用户。例如,AI服务器102可以识别出第二用户的语音信号匹配指定短语的话语(例如,口令或AI设备101所建议的句子)。基于识别出发出语音信号的用户与已注册的第二用户匹配并且语音信号与指定短语的话语匹配,AI服务器102可以认证第一用户。然而,这不应当认为是限制。简单地通过识别出与AI设备101进行对话期间所获取的声纹是已注册第二用户的声纹,AI服务器102可以无缝地认证第一用户。
在AI服务器102和账户服务器103集成到一个服务器104中的一些实施例中,服务器104可以在操作316中完成对第一用户的认证。例如,基于在操作314中从AI设备101接收到第二用户的语音信号,服务器104可以完成对第一用户的认证,可以生成第一用户的账户,并且可以存储第一用户的账户的信息(例如,姓名、声纹、与第二用户的关系,等等)。
在AI服务器102和账户服务器103相互分离的一些其他实施例中,基于通过声纹识别而识别出声纹是已注册第二用户的声纹,AI服务器102可以向账户服务器103发送指示已注册第二用户的信息。账户服务器103可以从AI服务器102接收指示已注册第二用户的信息。
在操作318中,基于指示第二用户的信息,账户服务器103可以完成对第一用户的认证。例如,账户服务器103可以存储关于已注册用户账户的信息。账户服务器103可以基于关于已注册用户账户的信息来识别已注册的第二用户,并且可以基于该识别来完成对第一用户的认证。
在操作319中,基于确定对第一用户的认证完成,账户服务器103可以生成第一用户的账户。账户服务器103可以存储关于第一用户账户的信息(例如,第一用户的简档)。账户服务器103可以将通过在操作306到308中AI设备101与第一用户(或第二用户)之间的对话所获取的关于第一用户的信息(例如,名字、姓氏、声纹信息、与已注册第二用户的关系)存储为第一用户的简档。
在一些实施例中,即使当第一用户是没有个人设备的儿童或老人时,也可以通过由已注册第二用户对新的第一用户进行认证,来通过与AI设备101的对话容易地注册第一用户。根据一个实施例,至少响应于获得已注册的第二用户与未注册的第一用户之间的关系,AI设备101(或AI服务器102)可以基于已注册第二用户的账户来认证第一用户。例如,AI设备101(或AI服务器102)可以基于识别出第一用户是已注册第二用户的儿子而对第一用户进行认证和注册。
在一些实施例中,账户可以有各种方面、形式或范围。例如,可以存在正式账户,其具有账户所需的所有信息。账户所需的信息可以包括用户的性别、姓名、生日或电子邮箱。已注册第二用户的账户可以是上述正式账户。已注册第二用户的账户可以通过第二用户的用户设备105与账户服务器103之间的通信而生成。
在另一示例中,对于没有电子邮箱的用户,可以存在具有账户所需信息的最少信息的临时账户。临时账户可以针对没有电子邮箱的用户临时(例如,随机地)生成和存储电子邮箱。此外,账户所需信息的最少信息可以是用户的性别、姓名或生日中的至少一项。例如,当第一用户是没有电子邮箱的儿童或老人时,第一用户的账户可以是上述临时账户。例如,账户服务器103可以临时(例如,随机地)生成第一用户的电子邮箱,并且可以通过使用所生成的临时电子邮箱和第一用户的最少信息(例如,第一用户的姓名)来生成第一用户的账户(也即,临时账户)。
在又一示例中,可以存在简档概念的账户。可以仅为特定设备(例如,AI设备101、AI扬声器、家庭中枢站、IoT设备等)注册简档概念的账户,使得该账户通常不被使用并且仅被用于该特定设备。例如,可以将第一用户的账户生成为上述简档概念。
在再一示例中,可以存在与特定账户关联的子账户。子账户可以与已注册的正式账户相关联(例如,作为子结构)。例如,第一用户的账户可以被生成为已注册第二用户的账户的子账户。
如上所述,账户的各种方面可以包括正式账户、临时账户、简档概念的账户或子账户中的至少一项,但是不限于此。例如,第一用户的账户可以以临时账户、简档概念的账户或子账户中的至少一项的形式来生成,使得没有电子邮箱的第一用户可以被注册使用AI设备101。
图4示出根据一些实施例的AI设备101的操作示例。根据一些实施例,图3的AI服务器102和账户服务器103的至少部分操作可以由AI设备101来执行。
参考图4,在操作401中,AI设备101可以通过麦克风271获取语音信号。语音信号可以是某个用户(例如,第一用户)发出的语音信号。例如,用户发出的语音信号可以对应于第一用户的语句451。用户发出的语音信号可以是包括语句451的多个语句。
在操作402中,AI设备101可以基于所获取的语音信号识别出需要对第一用户进行注册。
在一些实施例中,基于识别出发出所获取的语音信号的第一用户是未注册用户,AI设备101可以识别出需要对第一用户进行注册。基于识别出发出语音信号的第一用户不同于已注册的第二用户,AI设备101可以识别出需要对第一用户进行注册。例如,当未注册第一用户的语音信号被获取(或累积)了指定次数或更多次时,AI设备101可以识别出需要对第一用户进行注册。当在指定时段或更长时间内获取到未注册第一用户的语音信号时,AI设备101可以识别出需要对第一用户进行注册。当未注册第一用户的语音信号在指定时段内被获取了指定次数或更多次(也即,具有指定频率或更高频率)时,AI设备101可以识别出需要对第一用户进行注册。基于在指定时段内、以指定频率和/或指定次数或更多次获取到未注册第一用户的语音信号,AI设备101可以识别出第一用户是安装了AI设备101的家中的家庭成员。
在一些其他实施例中,响应于获取到第一用户的语音信号或第二用户请求注册第一用户的语音信号(例如,“请注册!”),AI设备101可以识别出需要对第一用户进行注册。
在操作403中,响应于识别出需要对第一用户进行注册,AI设备101可以通过扬声器272输出用于注册第一用户的语音信号。该语音信号可以是引导开始第一用户的注册过程的语音信号(例如,“你想要我注册吗?”)。该语音信号可以是询问生成第一用户账户所需信息(例如,姓名、与已注册第二用户的关系)的语音信号。例如,AI设备101可以输出询问第一用户姓名的语音信号。AI设备101可以输出询问第一用户与已注册第二用户之间的关系的语音信号。
在操作404中,AI设备101可以通过麦克风271从第一用户或第二用户获取语音信号。该语音信号可以是第一用户或第二用户回答AI设备101的问题的语音信号。
操作403和404可以被执行多次。例如,AI设备101可以重复操作403和404,直到获取了生成第一用户账户所需的最少信息。生成第一用户账户所需的最少信息可以包括以下至少一项:第一用户的姓名或第一用户与已注册第二用户之间的关系。例如,操作403和404可以对应于语句452。
当获取了生成第一用户账户所需的信息时,在操作405中,AI设备101可以请求已注册第二用户来认证第一用户。例如,基于在操作403和404中获取到第二用户的语音信号,AI设备101可以识别出已注册第二用户与第一用户存在于相同空间中。基于在操作403和404中获取到已注册第二用户的语音信号,AI设备101可以无缝地识别第二用户。基于关于第二用户的语音信号的声纹识别,AI设备101可以识别第二用户的姓名(例如,“Lee Young-hee”)。基于该识别,AI设备101可以请求第二用户认证第一用户。
AI设备101请求第二用户对第一用户进行认证的操作可以包括引导第二用户进行认证的语音信号的输出操作。例如,引导第二用户进行认证的语音信号可以对应于语句453。
在一些实施例中,第二用户对第一用户进行认证的方法可以包括:例如,使用第二用户预先设置的口令进行认证。例如,在操作405中,AI设备101可以输出说出“Lee Young-hee,请通过口令进行认证”的语音信号。AI设备101可以在操作406-1中接收第二用户说出指定口令的语音信号。
在一些其他实施例中,第二用户对第一用户进行认证的方法可以包括:例如,通过使用AI设备101所建议的句子进行认证。例如,在操作405中,AI设备101可以输出说出“LeeYoung-hee,请说‘你好bixby,我同意’”的语音信号。AI设备101可以在操作406-1中接收第二用户说出AI设备101所建议的句子的语音信号。
在一些其他实施例中,第二用户对第一用户进行认证的方法可以包括:通过第二用户的用户设备105进行认证。根据情况,通过第二用户的用户设备105进行的认证可以在通过第二用户的语音信号的认证(操作406-1)失败时被执行。备选地,通过第二用户的用户设备105进行的认证可以在针对AI设备101请求第二用户进行认证的操作(405)未获得指定次数或更多次数的第二用户的语音信号时被执行。通过第二用户的用户设备105进行的认证可以包括使用生物特征识别(例如,面部识别、指纹识别、虹膜识别)的认证、使用图案的认证、使用PIN的认证、使用密码的认证、使用消息或电子邮件的认证、或者由证书机构或通信运营商提供的认证。例如,在操作405中,AI设备101可以输出说出“Lee Young-hee,请检查你的智能电话”的语音信号。AI设备101可以在操作406-2中从第二用户的用户设备105接收认证信息。下文将参考图5来描述通过第二用户的用户设备105进行认证的具体操作。
在操作407中,AI设备101可以响应于以下至少一项对第一用户进行认证:在操作406-1中接收到第二用户的语音信号,或者在操作406-2中从第二用户的用户设备105接收到认证信息。新的第一用户通过已注册第二用户被认证,使得即使第一用户是没有个人设备的儿童或老人,也可以通过与AI设备101的交谈对话容易地注册第一用户。
在操作408中,AI设备101可以注册第一用户以使用AI设备101。AI设备101可以生成第一用户的账户。AI设备101可以将通过与第一用户或第二用户的交谈对话所获取的关于第一用户的信息存储为第一用户账户的信息(例如,简档)。通过与第一用户或第二用户的交谈对话所获取的关于第一用户的信息可以包括第一用户的姓名、第一用户的声纹信息、第一用户与第二用户之间的关系、或第一用户和第二用户相互呼叫的称呼。
图4所示的AI设备101的至少部分操作可以由AI服务器102或账户服务器103执行。
图5示出根据一些实施例的在AI设备101、AI服务器102和账户服务器103之间用于通过使用第二用户的设备105来认证第一用户的信号流示例。
图5所示的操作可以对应于图3或图4中在获取生成第一用户账户所需信息之后对第一用户进行认证的操作。图5所示的操作可以对应于通过第二用户对第一用户进行认证的各种方法之中的通过第二用户的用户设备105对第一用户进行认证的方法。
参考图5,在操作501中,AI设备101可以获取第二用户的语音信号。第二用户的语音信号可以从与AI设备101的、用于注册第一用户的交谈对话中获取。例如,第二用户的语音信号可以通过用于注册第一用户的语句中第二用户的回答来获取。操作501可以对应于图3的操作307或图4的操作404。
在操作502中,AI设备101可以向AI服务器102发送与第二用户的语音信号对应的数据。AI服务器102可以接收与第二用户的语音信号对应的数据。
在操作503中,AI服务器102可以对与所接收的语音信号对应的数据执行声纹识别。基于声纹识别,AI服务器102可以识别出发出语音信号的用户是已注册的第二用户。
在操作504中,AI服务器102可以向账户服务器103发送关于识别出的第二用户的信息。账户服务器103可以从AI服务器102接收关于第二用户的信息。基于该接收,账户服务器103可以识别第二用户的账户,并且可以识别第二用户的用户设备105。
在操作505中,账户服务器103可以发送请求识别出的第二用户的用户设备105进行认证的信号,作为请求第二用户进行认证的操作。
在操作506中,账户服务器103可以向AI服务器102发送请求第二用户进行认证的信号,使得AI设备101输出用于认证第一用户的语音信号。例如,账户服务器103可以向AI服务器102发送请求第二用户进行认证的信号,并且AI服务器102可以向AI设备101发送音频数据以请求第二用户进行认证。
在操作507中,响应于从AI服务器102(或账户服务器103)接收到认证请求信号,AI设备101可以输出用于认证第一用户的语音信号。例如,AI设备101可以输出说出“LeeYoung-hee,请检查你的智能电话”的语音信号。
在操作508中,响应于从账户服务器103接收到认证请求信号,第二用户设备105可以提供用于认证第一用户的用户界面(UI)。例如,第二用户设备105可以通过第二用户设备105的显示器来显示用于认证第一用户的UI。
在操作509中,第二用户设备105可以通过第二用户来认证第一用户。例如,第二用户设备105可以执行对第二用户的生物特征识别(例如,面部识别、指纹识别、虹膜识别),可以接收第二用户预先指定的图案,可以通过使用第二用户的PIN来执行认证,可以接收第二用户预先指定的密码,可以通过使用第二用户的消息或电子邮件来执行认证,或者可以执行由证书机构或通信运营商提供的认证。然而,这不应当认为是限制。
在操作510中,第二用户设备105可以向账户服务器103发送指示通过第二用户进行的认证结果的信息。账户服务器103可以从第二用户设备105接收指示通过第二用户进行的认证结果的信息。
在操作511中,基于该接收,账户服务器103可以完成对第一用户的认证处理。
在操作512中,基于第一用户被第二用户正常认证,账户服务器103可以生成第一用户的账户。操作512可以对应于图3的操作319或图4的操作408。
根据一些实施例,AI服务器102和账户服务器103可以集成在一个服务器104中。根据一些实施例,AI服务器102和账户服务器103的至少部分操作可以由AI设备101执行。
图6示出根据一些实施例的用于在AI设备101中根据第二用户和第一用户是否处于相同空间来请求第二用户认证第一用户的操作示例。图6的操作可以由AI设备101的处理器220执行。图6的至少部分操作可以由AI服务器102或账户服务器103执行。
参考图6,在操作601中,AI设备101可以输出用于注册第一用户的语音信号,并且可以接收对该语音信号的响应。输出和接收语音信号可以指示用于注册第一用户而在AI设备101和某个用户(例如,第一用户或第二用户)之间说出或输出的语句。操作601可以对应于图3的操作306到308。操作601可以对应于图4的操作403和404。操作601可以对应于图4的语句451和452。
在操作602中,AI设备101可以识别在指定时段内是否接收到已注册第二用户的语音信号。例如,AI设备101可以识别在指定数量的语句期间或针对指定时间(例如,几分钟)是否接收到已注册第二用户的语音信号。该识别可以基于与AI服务器102的通信来执行。例如,AI设备101可以向AI服务器102发送所获取的语音信号,并且AI服务器102可以通过声纹识别来识别该语音信号是否是已注册第二用户的语音信号。
基于识别出在指定时段内接收到已注册第二用户的语音信号,AI设备101可以识别出已注册第二用户与第一用户在相同空间中。相应地,基于识别出在指定时段内接收到已注册第二用户的语音信号,AI设备101可以在操作603中,基于第二用户的语音信号的至少一部分来认证第一用户。基于第二用户的语音信号的至少一部分对第一用户进行认证的操作可以对应于图3到图5描述的认证方法。基于第二用户的语音信号的至少一部分对第一用户进行认证的操作可以是至少部分地基于与第二用户的交谈语句来认证第一用户。
基于识别出在指定时段内未接收到第二用户的语音信号,AI设备101可以识别出已注册第二用户与第一用户不在相同空间中。相应地,AI设备101可以前进到操作604以输出用于指定第二用户来请求认证的语音信号。例如,AI设备101可以输出说出“我要让谁来认证?”的语音信号。AI设备101可以接收对该语音信号的响应。例如,AI设备101可以从第一用户获取说出“请让我妈妈Lee Young-hee来认证”的语音信号。基于获取到语音信号,AI设备101可以指定第二用户来请求认证。例如,AI服务器102或账户服务器103可以从针对AI设备101注册的用户中识别出名为“Lee Young-hee”的第二用户以及第二用户设备105。
在操作605中,AI设备101(或AI服务器102或账户服务器103)可以请求指定的第二用户设备105进行认证。例如,AI设备101可以向基于所获取的第一用户的语音信号而识别出的第二用户设备105发送用于请求对第一用户认证的信号。例如,操作605可以对应于图5的操作505。
在操作606中,AI设备101可以从第二用户设备105接收认证信息。AI设备(或AI服务器102或账户服务器103)可以从第二用户设备105接收指示通过第二用户进行的认证结果的信息。例如,从第二用户设备105接收的认证结果可以包括基于对第二用户的生物特征识别(例如,面部识别、指纹识别、虹膜识别)的认证结果、基于图案的认证结果、基于PIN的认证结果、基于密码的认证结果、或基于第二用户的消息或电子邮件的认证结果。例如,操作606可以对应于图5的操作510。AI设备101(或AI服务器102或账户服务器103)可以基于从第二用户设备105接收的认证结果来认证第一用户。
在操作607中,响应于第一用户在操作603或606中被认证,AI设备101可以生成第一用户的账户。
图7示出根据一些实施例的在AI设备101、AI服务器102和账户服务器103之间用于执行与第一用户的注册有关的附加操作的信号流示例。在图7中,AI服务器102和账户服务器103可以集成在一个服务器104中。图7所示的操作可以在图3到图6中生成第一用户账户之后执行。
参考图7,在操作701中,服务器104(例如,账户服务器103)可以生成第一用户的账户。操作701可以对应于图3的操作319、图4的操作408、图5的操作512或图6的操作607。
在操作702中,服务器104可以通知AI设备101已完成第一用户账户的生成。例如,账户服务器103可以通过AI服务器102向AI设备101发送指示第一用户账户生成已完成的信号。AI设备101可以从服务器104接收指示第一用户账户生成已完成的信号。
在操作703中,AI设备101可以输出用于在第二用户设备105的地址簿中存储关于第一用户账户的联系方式的语音信号。例如,AI设备101可以输出与从AI服务器102接收的音频数据对应的语音信号。在另一示例中,AI设备101可以响应于接收到第一用户的账户生成完成信号而输出指定的语音信号。该语音信号可以是AI设备101说出“要我在家庭地址簿中存储吗?”的语音信号,其作为语句753。在一些实施例中,第一用户可能没有个人设备(例如,智能电话)。在这种情况下,关于第一用户账户的联系方式可以指示用于呼叫AI设备101的标识信息。在一些其他实施例中,当第一用户拥有个人设备(例如,智能电话)时,关于第一用户账户的联系方式可以是个人设备的电话号码。
在操作704中,响应于该语音信号,AI设备101可以获取第二用户的语音信号。例如,AI设备101可以获取第二用户说出“是的,谢谢!”的语音信号,其作为语句754。
在操作705中,AI设备101可以向服务器104发送与所获取的语音信号对应的数据。例如,AI设备101可以向AI服务器102发送对应于语音信号的数据。基于对该语音信号的识别,AI服务器102可以向账户服务器103发送用于在第二用户设备105的地址簿中存储关于第一用户账户的联系方式的信号。
在操作706中,服务器104(例如,账户服务器103)可以在第二用户设备105的地址簿中存储关于第一用户账户的联系方式。例如,参考数据库770,第一用户(即,Kim Cheol-soo)的联系方式可以存储在第二用户(即,Lee Young-hee)的地址簿中。此外,第二用户(即,Lee Young-hee)的联系方式可以存储在第一用户(即,Kim Cheol-soo)的地址簿中。
在一些实施例中,当第一用户没有个人设备或者关于第一用户的个人设备的信息未被注册时,服务器104可以将用于呼叫AI设备101的标识信息存储为第一用户的联系方式。
在一些其他实施例中,当关于第一用户的个人设备的信息被注册时,服务器104可以将第一用户的联系方式自动添加到第二用户的地址簿。
在操作707中,服务器104可以向第二用户设备105发送用于与第二用户设备105同步关于第一用户账户的联系方式的信号。接收到该同步信号的第二用户设备105可以在第二用户设备105的地址簿中自动存储(更新)关于第一用户账户的联系方式。
图8示出根据一些实施例的与存储在第二用户设备105的地址簿中的第一用户的联系方式有关的屏幕示例。图8所示的屏幕可以是在第二用户的用户设备105上显示的屏幕。
参考图8,响应于第一用户的联系方式被注册在第二用户设备105处(例如,图7的操作707),第二用户设备105可以显示屏幕810。屏幕810可以包括指示第一用户(即,KimCheol-soo)的账户被注册在第二用户设备105的地址簿中的通知。例如,响应于在屏幕810上接收到对用于显示地址簿的图标811的用户输入,第二用户设备105可以显示从屏幕810转换来的屏幕820。
屏幕820可以是显示与AI设备101有关的地址簿的屏幕。屏幕820可以包括指示在AI设备101处注册的用户的联系方式的条目。第二用户设备105可以显示屏幕820,其示出在AI设备101处新注册的第一用户(即,Kim Cheol-soo)的联系方式被更新。响应于在屏幕820上接收到对指示在AI设备101处新注册的第一用户的联系方式的条目821的用户输入,第二用户设备105可以显示从屏幕820转换来的屏幕830。
屏幕830可以是关于第一用户的联系方式的屏幕。屏幕830可以包括用于呼叫第一用户的图标831和用于与第一用户交换基于文本的消息的图标832。响应于接收到对图标831的用户输入,第二用户设备105可以呼叫与第一用户的联系方式对应的设备。与第一用户的联系方式对应的设备可以包括例如AI设备101或第一用户的个人设备(例如,智能电话)。
在一些实施例中,当第一用户没有个人设备或关于第一用户的个人设备的信息未被注册时,用于呼叫AI设备101的标识信息可以存储为第一用户的联系方式。在这种情况下,响应于接收到对图标831的用户输入,第二用户设备105可以呼叫AI设备101。相应地,第二用户可以同与AI设备101存在于相同空间中的第一用户对话。
在一些其他实施例中,第一用户的个人设备的电话号码可以存储为第一用户的联系方式。在这种情况下,响应于接收到对图标831的用户输入,第二用户设备105可以呼叫第一用户的个人设备。
响应于在屏幕830上接收到对用于与第一用户交换消息的图标832的用户输入,第二用户设备105可以显示第二用户与第一用户在其上交换消息的屏幕840。
在一些实施例中,当AI设备101的标识信息被存储为第一用户的联系方式时,第二用户设备105可以基于第二用户通过屏幕840的消息输入来向AI设备101发送消息。AI设备101可以输出与从第二用户设备105接收的消息对应的语音信号。AI设备101可以获取第一用户对该语音信号做出响应的语音信号。例如,第一用户的语音信号可以由AI服务器102转换成文本数据。文本数据可以被发送给第二用户设备105并且可以通过屏幕840进行显示。通过上述处理,第二用户可以通过AI设备101与第一用户交换消息。
图9示出根据一些实施例的在AI设备101、AI服务器102和账户服务器103之间用于执行与第一用户的注册有关的其他附加操作的信号流示例。在图9中,AI服务器102和账户服务器103可以集成在一个服务器104中。图9所示的操作可以在图3到图6中生成第一用户账户之后执行。
参考图9,在操作901中,AI设备101可以获取新注册的第一用户的语音信号。该语音信号例如可以是第一用户说出“Bixby,明天是我的生日。你知道吗?”的语音信号,其作为语句951。
在操作902中,AI设备101可以向服务器104发送与第一用户的语音信号对应的数据。
在操作903中,服务器104可以识别对应于该语音信号的用户。例如,基于声纹识别,AI服务器102可以识别出发出该语音信号的用户是第一用户。
在操作904中,基于对语音信号的语义分析,服务器104(例如,AI服务器102)可以识别要添加到所识别出的第一用户的简档的信息。例如,AI服务器102可以从语句951中识别出第一用户的生日以添加到第一用户的简档。
在操作905中,服务器104(例如,账户服务器103)可以在所识别出的第一用户的简档中存储识别出的信息。例如,AI服务器102可以向账户服务器103发送指示第一用户的生日的数据。账户服务器103可以从AI服务器102接收指示第一用户的生日的数据。基于该接收,账户服务器103可以在第一用户的账户中存储第一用户的生日。
在操作906中,服务器104(例如,AI服务器102)可以向AI设备101发送对第一用户的语音信号(例如,语句951)做出响应的指定响应数据。AI设备101可以从AI服务器102接收指定响应数据(例如,音频数据)。
在操作907中,响应于从AI服务器102接收到响应数据,AI设备101可以输出对应于响应数据的语音信号。例如,作为对用户语音信号的响应,AI设备101可以输出说出“Cheol-soo,生日快乐!”的语音信号,其作为语句957。
如在图9所示的操作中,通过已注册用户与AI设备101之间的对话,可以向已注册用户的简档添加信息。备选地,AI设备101可以通过识别多个注册用户之间的交谈语句,向已注册用户的简档添加信息。例如,添加到用户简档的信息可以包括已注册用户的生日、已注册用户想看的TV内容、已注册用户想看的YouTube内容、或者多个已注册用户相互呼叫的昵称(或称呼)。例如,当TV(其为IoT设备)与AI设备101相关联地操作时,可以使用诸如用户想看的TV内容之类的信息来通过AI设备101控制TV。
一些实施例不限于此。例如,当AI设备101安装在旅店房间中时,住在旅店房间中的客人可以被注册为使用AI设备101的用户。在这种情况下,AI设备101可以输出向已注册用户询问使用期限的语音信号(例如,“你打算在这儿待多久?”)。基于作为对该语音信号的响应而接收的用户的语音信号(例如,“我会在这儿待3天”),AI设备101可以设置已注册用户的使用期限。在设置的使用期限内,AI设备101可以给予用户使用AI设备101的权限。
图10示出根据一些实施例的在AI设备101、AI服务器102、IoT设备1000和IoT服务器1050之间用于注册IoT设备1000的信号流示例。
在一些实施例中,IoT设备(例如,空气净化器、空调、TV等等)可以与AI设备101相关联地注册。当IoT设备在AI设备101处注册时,用户可以基于语音信号通过AI设备101控制注册的IoT设备。在图10中,示出了用于通过与AI设备101的语句来注册IoT设备的操作示例。
参考图10,在操作1001中,可以激活IoT设备1000。例如,激活IoT设备1000的操作可以包括IoT设备1000在安装在家中后初次开启的操作。
在操作1002中,IoT设备1000可以广播其自己的标识信息。AI设备101可以接收IoT设备1000所广播的标识信息。例如,AI设备101可以执行IoT设备1000的中枢站功能。
在操作1003中,AI设备101可以识别IoT设备1000。例如,AI设备101可以将IoT设备1000识别为用于IoT设备1000的中枢站。
在操作1004中,AI设备101可以向IoT服务器1050发送IoT设备1000的标识信息。例如,AI设备101可以通过AI服务器102向IoT服务器1050发送IoT设备1000的标识信息。然而,这不应当认为是限制,并且AI设备101可以直接向IoT服务器1050发送IoT设备1000的标识信息。
在操作1005中,IoT服务器1050可以识别出IoT设备1000是未注册的设备。
在操作1006中,基于该识别,IoT服务器1050可以向AI设备101发送用于注册IoT设备1000的信号。例如,IoT服务器1050可以向AI服务器102发送用于启动IoT设备1000的注册处理的控制信号。AI服务器102可以从IoT服务器1050接收用于启动IoT设备1000的注册处理的控制信号。响应于接收到该控制信号,AI服务器102可以向AI设备101发送用于启动IoT设备1000的注册处理的控制信号,或可以向AI设备101发送用于注册IoT设备1000的音频数据。
在操作1007中,响应于从AI服务器102(或IoT服务器1050)接收到用于注册IoT设备1000的信号,AI设备101可以输出语音信号。在一些实施例中,响应于从AI服务器102接收到用于启动IoT设备1000的注册处理的控制信号,AI设备101可以输出预先指定的语音信号。在一些其他实施例中,响应于从AI服务器102接收到用于注册IoT设备1000的音频数据,AI设备101可以输出对应于该音频数据的语音信号。例如,从AI设备101输出的语音信号可以是说出“搜索到新设备。你想要我注册吗?”的语音信号。
在操作1008中,AI设备101可以从已注册用户获取语音信号。例如,该语音信号可以是指示同意注册IoT设备1000的语音信号。该语音信号可以是已注册用户的语音信号“是的,请注册!”。
在操作1009中,AI设备101可以向AI服务器102发送与已注册用户的语音信号对应的数据。基于对该语音信号的语义分析,AI服务器102可以向IoT服务器1050发送指示意图注册IoT设备1000的数据。响应于接收到该数据,IoT服务器1050可以启动IoT设备1000的注册处理。IoT设备1000的注册处理可以包括请求已注册用户进行认证并从已注册用户接收认证的操作。
然而,这不应当认为是限制。根据一些实施例,IoT设备1000的注册处理可以通过已注册用户的语音信号来启动。例如,响应于已注册用户说出作为语句1058的“这是我的TV,请注册!”的语音信号,可以启动IoT设备1000的注册处理。
在操作1010中,IoT服务器1050可以向IoT设备1000发送用于认证IoT设备1000的信息。该信息可以是例如密码或口令,并且可以通过IoT设备1000输出或显示。
在操作1011中,IoT服务器1050可以向AI设备101发送请求对IoT设备1000认证的信号。例如,IoT服务器1050可以向AI服务器102发送请求对IoT设备1000认证的信号。AI服务器102可以从IoT服务器1050接收请求对IoT设备1000认证的信号。响应于接收到该信号,AI服务器102可以向AI设备101发送请求对IoT设备1000认证的控制信号,或者可以向AI设备101发送请求对IoT设备1000认证的音频数据。AI设备101可以从AI服务器102接收控制信号或音频数据。
在操作1012中,响应于该接收,AI设备101可以输出用于认证IoT设备1000的语音信号。例如,该语音信号可以是AI设备101说出作为语句1062的“请读出TV上出现的密码”的语音信号。
在操作1013中,响应于从IoT服务器1050接收到用于认证IoT设备1000的信息,IoT设备1000可以显示用于认证IoT设备1000的信息。例如,IoT设备1000可以显示或输出从IoT服务器1050接收的密码或口令。
在操作1014中,AI设备101可以接收已注册用户的语音信号。例如,该语音信号可以是说出IoT设备1000上显示的密码的语音信号。该语音信号可以对应于语句1064。
在操作1015中,AI设备101可以向AI服务器102发送对应于该语音信号的数据。基于接收到对应于该语音信号的数据(例如,具有密码的话语),AI服务器102可以识别出已注册用户认证了IoT设备1000。AI服务器102可以向IoT服务器1050发送指示IoT设备1000被认证的数据。IoT服务器1050可以从AI服务器102接收指示IoT设备1000被认证的数据。
在操作1016中,基于该接收,IoT服务器1050可以认证IoT设备1000,并且可以注册IoT设备1000。此后,可以执行获取关于IoT设备1000的附加信息的操作。
在操作1017中,IoT服务器1050可以通过AI服务器102向AI设备101请求关于IoT设备1000的信息。关于IoT设备1000的信息可以包括例如IoT设备1000安装的位置、IoT服务器1050将给予使用IoT设备1000的权限的用户、或IoT设备1000的所有者。
在操作1018中,AI设备101可以输出用于收集关于IoT设备1000的信息的指定语音信号。该语音信号可以包括问题“TV安装在哪里?”或“你打算与家人一起使用它吗?”
在操作1019中,响应于该语音信号,AI设备101可以获取已注册用户的语音信号。在操作1020中,AI设备101可以通过AI服务器102向IoT服务器1050发送对应于语音信号的数据。在操作1021中,IoT服务器1050可以存储关于IoT设备1000的信息。例如,IoT服务器1050可以存储IoT服务器1050将给予关于IoT设备1000的权限的用户,作为关于IoT设备1000的信息,并且可以专门向所存储的用户给予控制IoT设备1000的权限。
操作1017到1021可以重复,并且例如可以对应于语句1068。
根据上述一些实施例,电子设备(例如,AI设备101)可以包括:扬声器(例如,扬声器272);麦克风(例如,麦克风271);以及至少一个处理器(例如,处理器220),配置用于:基于通过麦克风获取的语音信号来确定是否需要注册第一用户;基于识别出需要注册第一用户,请求在该电子设备处已注册的第二用户对第一用户进行认证;以及基于第一用户被第二用户认证,注册第一用户。
在一些实施例中,通过麦克风获取的语音信号可以包括第一用户的语音信号,并且该至少一个处理器可以基于识别出通过麦克风获取的语音信号不同于在电子设备处已注册的第二用户的语音信号,而识别出需要注册第一用户。
在一些实施例中,该至少一个处理器可以通过扬声器输出请求第二用户进行认证的语音信号,以便请求第二用户对第一用户进行认证。
在一些实施例中,该至少一个处理器可以基于通过麦克风从第二用户获取到指示指定短语的语音信号,来对第一用户进行认证。
在一些实施例中,该至少一个处理器可以基于从第二用户的设备(例如,用户设备105)接收到认证信息,来对第一用户进行认证。
在一些实施例中,该至少一个处理器可以至少部分地基于获取到关于第一用户与第二用户之间的关系的语音信号,来认证第一用户,可以生成第一用户的账户以注册第一用户,并且可以将关于第一用户与第二用户之间的关系的信息与第一用户的账户相关联地存储。
在一些实施例中,该至少一个处理器可以基于识别出在从通过麦克风获取语音信号的时间开始的指定时间内未获取到第二用户的语音信号,向第二用户的设备发送用于请求第二用户认证第一用户的信号。
在一些实施例中,该至少一个处理器可以基于第一用户被注册,将用于访问电子设备的标识信息存储为第一用户的联系方式。
在一些实施例中,该至少一个处理器可以响应于识别到未注册的外部设备(例如,IoT设备1000),通过扬声器输出用于注册外部设备的语音信号,并且可以至少部分地基于响应于该语音信号而接收到在电子设备处注册的用户的语音信号,在电子设备处注册外部设备。例如,该至少一个处理器可以向外部设备发送供认证外部设备使用的信息,并且可以基于通过麦克风从电子设备处注册的用户接收到对应于该信息的语音信号,在电子设备处注册外部设备。
根据本公开的一些实施例,通过由已注册用户进行的认证来注册新用户,可以简单地注册新用户。
尽管在本公开的详细描述中描述了特定实施例,但是本领域技术人员将会理解,其中可以做出各种变化而不偏离本公开。因此,本公开的范围不应当由上述实施例限定,而是由所附权利要求或权利要求的等效物限定。
Claims (15)
1.一种电子设备,包括:
扬声器;
麦克风;
至少一个处理器;以及
存储程序指令的存储器,所述程序指令能够由所述至少一个处理器执行以使得所述电子设备:
基于通过所述麦克风获取的第一语音信号来确定是否需要注册第一用户;
当需要注册第一用户时,请求在所述电子设备处预先注册的第二用户对第一用户进行认证;以及
当接收到第二用户认证第一用户的信息时,基于所接收的信息注册第一用户。
2.根据权利要求1所述的电子设备,其中第一语音信号包括第一用户说出的语音,并且其中所述程序指令还能够由所述至少一个处理器执行以使得所述电子设备:
当检测到第一语音信号不同于与在所述电子设备处预先注册的第二用户对应的第二语音信号时,识别出需要注册第一用户。
3.根据权利要求1所述的电子设备,其中所述程序指令还能够由所述至少一个处理器执行以使得所述电子设备:
在请求第二用户对第一用户进行认证之前,通过所述扬声器输出请求对第二用户的认证的第二语音信号。
4.根据权利要求1所述的电子设备,
其中所接收的认证第一用户的信息包括指示预先指定的短语的第二语音信号。
5.根据权利要求1所述的电子设备,还包括通信电路,其中所接收的认证第一用户的信息包括来自与第二用户关联的外部电子设备的传输,所述传输经由所述通信电路被接收。
6.根据权利要求1所述的电子设备,
其中所接收的认证第一用户的信息至少包括指示第一用户与第二用户之间的关系的第二语音信号;以及
其中注册第一用户包括:生成第一用户的账户,并且与所生成的账户相关联地存储所指示的第一用户与第二用户之间的关系。
7.根据权利要求1所述的电子设备,还包括通信电路,其中所述程序指令还能够由所述至少一个处理器执行以使得所述电子设备:
当在获取第一语音信号的预先指定时段内未接收到认证第一用户的信息时,通过所述通信电路向与第二用户关联的外部电子设备发送请求对第一用户认证的信号。
8.根据权利要求1所述的电子设备,其中注册第一用户还包括:将用于访问所述电子设备的标识信息存储为第一用户的联系方式。
9.根据权利要求1所述的电子设备,其中所述程序指令还能够由所述至少一个处理器执行以使得所述电子设备:
响应于检测到未注册的外部设备,通过所述扬声器输出提示注册所述未注册的外部设备的第二语音信号;以及
至少基于接收到在所述电子设备处预先注册的任何用户的第三语音信号,在所述电子设备处注册所述未注册的外部设备。
10.根据权利要求9所述的电子设备,其中所述程序指令还能够由所述至少一个处理器执行以使得所述电子设备:
向所注册的外部设备发送用于认证所注册的外部设备的信息;以及
其中在所述电子设备处注册所述未注册的外部设备进一步基于通过所述麦克风接收到的第三语音信号,所述第三语音信号对应于从在所述电子设备处注册的任何用户接收的信息。
11.一种电子设备中的方法,所述方法包括:
基于通过所述电子设备的麦克风获取的第一语音信号来确定是否需要注册第一用户;
当需要注册第一用户时,请求在所述电子设备处预先注册的第二用户对第一用户进行认证;以及
当接收到第二用户认证第一用户的信息时,基于所接收的信息注册第一用户。
12.根据权利要求11所述的方法,
其中当第一用户的第一语音信号不同于在所述电子设备处预先注册的第二用户的第二语音信号时,需要注册第一用户。
13.根据权利要求11所述的方法,其中认证第一用户的信息包括以下至少一项:
通过所述麦克风从第二用户接收的指示预先指定的短语的第二语音信号;以及
通过来自与第二用户关联的外部电子设备的传输而接收的认证信息,所述认证信息通过所述电子设备的通信电路被接收。
14.根据权利要求11所述的方法,
其中认证第一用户的信息包括指示第一用户与第二用户之间的关系的第二语音信号;以及
其中注册第一用户包括:生成第一用户的账户,并且与所生成的账户相关联地存储指示第一用户与第二用户之间的关系的信息。
15.根据权利要求11所述的方法,其中请求第二用户对第一用户进行认证进一步包括:
当在获取第一语音信号的预先指定时段内未接收到认证第一用户的信息时,通过所述电子设备的通信电路向与第二用户关联的外部电子设备发送信号,所述信号请求对第一用户的认证。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180091772A KR102483833B1 (ko) | 2018-08-07 | 2018-08-07 | 등록된 사용자에 의한 인증을 통해 새로운 사용자를 등록하기 위한 전자 장치 및 방법 |
KR10-2018-0091772 | 2018-08-07 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110858841A true CN110858841A (zh) | 2020-03-03 |
CN110858841B CN110858841B (zh) | 2023-04-07 |
Family
ID=67551298
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910727938.6A Active CN110858841B (zh) | 2018-08-07 | 2019-08-07 | 通过已注册用户的认证来注册新用户的电子设备和方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11189294B2 (zh) |
EP (1) | EP3608811B1 (zh) |
KR (1) | KR102483833B1 (zh) |
CN (1) | CN110858841B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112383468A (zh) * | 2020-11-12 | 2021-02-19 | 火生旭 | 一种昵称命名方法 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10958758B1 (en) * | 2019-11-22 | 2021-03-23 | International Business Machines Corporation | Using data analytics for consumer-focused autonomous data delivery in telecommunications networks |
US20230116125A1 (en) * | 2021-10-08 | 2023-04-13 | Arris Enterprises Llc | Method and system for smart assistant voice command requestor authentication |
KR20230058990A (ko) * | 2021-10-25 | 2023-05-03 | 삼성전자주식회사 | 전자 장치 및 그의 동작 방법 |
US12056731B1 (en) | 2023-01-11 | 2024-08-06 | Wells Fargo Bank, N.A. | Self-disclosed identity on a network |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140150071A1 (en) * | 2012-11-29 | 2014-05-29 | International Business Machines Corporation | Social authentication of users |
CN105306320A (zh) * | 2015-11-20 | 2016-02-03 | 青岛海信移动通信技术股份有限公司 | 一种为智能设备绑定客户端的方法及装置 |
CN105610786A (zh) * | 2014-11-14 | 2016-05-25 | 三星电子株式会社 | 注册要使用的装置的方法和设备 |
CN106774225A (zh) * | 2017-02-27 | 2017-05-31 | 联想(北京)有限公司 | 一种智能家居设备的控制方法和智能中控设备 |
CN106782564A (zh) * | 2016-11-18 | 2017-05-31 | 百度在线网络技术(北京)有限公司 | 用于处理语音数据的方法和装置 |
EP3211555A1 (en) * | 2016-02-25 | 2017-08-30 | Nokia Technologies Oy | An apparatus and associated methods |
CN107360157A (zh) * | 2017-07-10 | 2017-11-17 | 绵阳美菱软件技术有限公司 | 一种用户注册方法、装置及智能空调器 |
CN107609034A (zh) * | 2017-08-09 | 2018-01-19 | 深圳市汉普电子技术开发有限公司 | 一种智能音箱的音频播放方法、音频播放装置及存储介质 |
US9876788B1 (en) * | 2014-01-24 | 2018-01-23 | Microstrategy Incorporated | User enrollment and authentication |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5563168B2 (ja) | 2011-01-05 | 2014-07-30 | ネクスステップ, インコーポレイテッド | 消費者向け電子装置を登録し、制御し、及びサポートするコンシェルジュデバイス及び方法 |
GB2489527B (en) * | 2011-04-01 | 2014-01-01 | Voicevault Ltd | Voice verification system |
KR101480031B1 (ko) * | 2012-01-31 | 2015-01-07 | 한국정보통신주식회사 | 본인 인증 처리 시스템 및 방법 |
US9491123B2 (en) * | 2012-04-24 | 2016-11-08 | Biscom Inc. | Streamlined messaging client provisioning system |
JP2016099469A (ja) | 2014-11-20 | 2016-05-30 | シャープ株式会社 | 音声認識動作機器、音声認識動作機器の制御装置、音声認識動作機器の動作方法、プログラム、および、音声認識動作機器の制御システム |
KR102417682B1 (ko) * | 2015-09-09 | 2022-07-07 | 삼성전자주식회사 | 음성 인식을 이용한 닉네임 관리 장치 및 방법 |
KR102436509B1 (ko) | 2015-12-07 | 2022-08-25 | 삼성전자주식회사 | 임시 계정 정보를 제공하는 방법, 장치 및 시스템 |
WO2017210368A1 (en) * | 2016-06-01 | 2017-12-07 | Onvocal, Inc. | System and method for voice authentication |
US20170364868A1 (en) * | 2016-06-17 | 2017-12-21 | Thumbtag India Private Limited | System of attendance and time tracking with reporting |
KR102397812B1 (ko) * | 2016-08-23 | 2022-05-13 | 비자 인터네셔널 서비스 어소시에이션 | 로컬 저장된 생체인식 인증 데이터의 원격 사용 |
US10278023B2 (en) * | 2016-09-20 | 2019-04-30 | Qualcomm Incorporated | Wireless device locating |
US10360916B2 (en) * | 2017-02-22 | 2019-07-23 | Plantronics, Inc. | Enhanced voiceprint authentication |
KR20170024603A (ko) | 2017-02-24 | 2017-03-07 | 주식회사 비즈모델라인 | 무선 환경의 대화형 메시지 처리 방법 |
US10789959B2 (en) * | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
-
2018
- 2018-08-07 KR KR1020180091772A patent/KR102483833B1/ko active IP Right Grant
-
2019
- 2019-08-07 US US16/533,940 patent/US11189294B2/en active Active
- 2019-08-07 CN CN201910727938.6A patent/CN110858841B/zh active Active
- 2019-08-07 EP EP19190539.7A patent/EP3608811B1/en active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140150071A1 (en) * | 2012-11-29 | 2014-05-29 | International Business Machines Corporation | Social authentication of users |
US9876788B1 (en) * | 2014-01-24 | 2018-01-23 | Microstrategy Incorporated | User enrollment and authentication |
CN105610786A (zh) * | 2014-11-14 | 2016-05-25 | 三星电子株式会社 | 注册要使用的装置的方法和设备 |
CN105306320A (zh) * | 2015-11-20 | 2016-02-03 | 青岛海信移动通信技术股份有限公司 | 一种为智能设备绑定客户端的方法及装置 |
EP3211555A1 (en) * | 2016-02-25 | 2017-08-30 | Nokia Technologies Oy | An apparatus and associated methods |
CN106782564A (zh) * | 2016-11-18 | 2017-05-31 | 百度在线网络技术(北京)有限公司 | 用于处理语音数据的方法和装置 |
CN106774225A (zh) * | 2017-02-27 | 2017-05-31 | 联想(北京)有限公司 | 一种智能家居设备的控制方法和智能中控设备 |
CN107360157A (zh) * | 2017-07-10 | 2017-11-17 | 绵阳美菱软件技术有限公司 | 一种用户注册方法、装置及智能空调器 |
CN107609034A (zh) * | 2017-08-09 | 2018-01-19 | 深圳市汉普电子技术开发有限公司 | 一种智能音箱的音频播放方法、音频播放装置及存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112383468A (zh) * | 2020-11-12 | 2021-02-19 | 火生旭 | 一种昵称命名方法 |
Also Published As
Publication number | Publication date |
---|---|
KR102483833B1 (ko) | 2023-01-04 |
US11189294B2 (en) | 2021-11-30 |
EP3608811A1 (en) | 2020-02-12 |
CN110858841B (zh) | 2023-04-07 |
US20200051572A1 (en) | 2020-02-13 |
KR20200016547A (ko) | 2020-02-17 |
EP3608811B1 (en) | 2022-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110858841B (zh) | 通过已注册用户的认证来注册新用户的电子设备和方法 | |
US10832686B2 (en) | Method and apparatus for pushing information | |
US10891952B2 (en) | Speech recognition | |
CN110998720A (zh) | 话音数据处理方法及支持该方法的电子设备 | |
KR20190100512A (ko) | 챗봇과 대화하기 위한 전자 장치 및 그의 동작 방법 | |
KR20190096618A (ko) | 전자 장치 및 전자 장치의 기능 실행 방법 | |
US10192550B2 (en) | Conversational software agent | |
CN106558307A (zh) | 智能对话处理设备、方法和系统 | |
CN111937028A (zh) | 通过使用聊天机器人提供服务的方法及其设备 | |
US10140988B2 (en) | Speech recognition | |
CN104462069A (zh) | 语音翻译装置和语音翻译方法 | |
CN110033774A (zh) | 用于隐私保护型语音交互的设备和方法 | |
KR20190031167A (ko) | 전자 장치 및 이의 제어 방법 | |
US20170256259A1 (en) | Speech Recognition | |
JP2017003611A (ja) | 音声認識装置、音声認識システム、当該音声認識システムで使用される端末、および、話者識別モデルを生成するための方法 | |
KR102563817B1 (ko) | 사용자 음성 입력 처리 방법 및 이를 지원하는 전자 장치 | |
CN111258529B (zh) | 电子设备及其控制方法 | |
KR102087202B1 (ko) | 인공 지능 비서 서비스 제공 방법, 및 이에 사용되는 음성 인식 장비 | |
ES2950974T3 (es) | Dispositivo electrónico para realizar una tarea que incluye una llamada en respuesta al pronunciamiento de un usuario y procedimiento de operación del mismo | |
KR20210036527A (ko) | 사용자 발화를 처리하는 전자 장치 및 그 작동 방법 | |
KR20190001435A (ko) | 음성 입력에 대응하는 동작을 수행하는 전자 장치 | |
KR101993827B1 (ko) | 문맥 종속 화자 식별 및 문맥 독립 화자 식별이 융합된 인공 지능 비서 서비스에서의 화자 식별 방법, 및 이에 사용되는 음성 인식 장비 | |
JP6700531B1 (ja) | 認証方法、認証システム、スマートスピーカ及びプログラム | |
JP7495220B2 (ja) | 音声認識装置、音声認識方法、および、音声認識プログラム | |
CN114179083A (zh) | 一种引领机器人语音信息的生成方法、装置和引领机器人 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |