CN111128145A - 电子设备、控制方法和存储介质 - Google Patents

电子设备、控制方法和存储介质 Download PDF

Info

Publication number
CN111128145A
CN111128145A CN201911042671.3A CN201911042671A CN111128145A CN 111128145 A CN111128145 A CN 111128145A CN 201911042671 A CN201911042671 A CN 201911042671A CN 111128145 A CN111128145 A CN 111128145A
Authority
CN
China
Prior art keywords
voice
voice input
unit
electronic device
communication unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911042671.3A
Other languages
English (en)
Other versions
CN111128145B (zh
Inventor
藤田俊司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of CN111128145A publication Critical patent/CN111128145A/zh
Application granted granted Critical
Publication of CN111128145B publication Critical patent/CN111128145B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • H04L67/025Protocols based on web technology, e.g. hypertext transfer protocol [HTTP] for remote control or remote monitoring of applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Selective Calling Equipment (AREA)
  • Power Sources (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Abstract

本发明涉及电子设备、控制方法和存储介质。电子设备包括:语音接收单元,其被构造为接收语音输入;第一通信单元,其被构造为与具有语音识别功能的外部设备进行通信;以及控制单元。控制单元经由第一通信单元接收指示外部设备是否准备好识别语音输入的通知。在所述通知指示外部设备尚未准备好识别语音输入的情况下,当通过语音接收单元接收到包括与外部设备相对应的短语的预定语音输入时,控制单元经由第一通信单元控制外部设备以准备好识别语音输入。

Description

电子设备、控制方法和存储介质
技术领域
本公开涉及一种能够识别语音输入的电子设备。
背景技术
近年来,随着语音识别技术的改进,已知一种使用户能够通过语音输入来操作电子设备的称为语音控制功能的技术。例如,日本特开第2015-013351号公报讨论了一种通信机器人,该通信机器人处理通过麦克风接收的网络上的语音输入,并对该语音输入进行语音响应。
然而,现在已经确定,关于常规语音识别,为了防止设备以用户在无意向设备输入指令的情况下发出的语音来操作,存在如下使用情况:用户仅在要使用语音控制功能时才开启语音控制功能,并在其余时间关闭语音控制功能。在上述使用情况下,如果设备的语音控制功能为关闭,则除非用户手动开启语音控制功能,否则用户将无法使用语音控制功能。
发明内容
考虑到上述问题,根据本公开的一方面,一种电子设备,其包括:语音接收单元,其被构造为接收语音输入;第一通信单元,其被构造为与具有语音识别功能的外部设备进行通信;以及控制单元,其中,控制单元经由第一通信单元接收指示外部设备是否准备好识别语音输入的通知,并且其中,在所述通知指示外部设备尚未准备好识别语音输入的情况下,当通过语音接收单元接收到包括与外部设备相对应的短语的预定语音输入时,控制单元经由第一通信单元控制外部设备以准备好识别语音输入。
通过以下参照附图对示例性实施例的描述,本公开的其他特征将变得清楚。
附图说明
图1是示出根据第一示例性实施例的系统构造的图。
图2是示出根据第一示例性实施例的智能扬声器的构造的示例的框图。
图3是示出根据第一示例性实施例的数字照相机的构造的示例的框图。
图4是示出根据第一示例性实施例的数字照相机的供电状态的示例的表。
图5是示出根据第一示例性实施例的用于设置智能扬声器的远程控制功能的处理的示例的序列图。
图6A、图6B和图6C是示出根据第一示例性实施例的设备管理数据库(DB)的示例的表。
图7是示出允许根据第一示例性实施例的智能扬声器在供电状态PS2获取与数字照相机的语音控制功能的操作状态有关的信息的处理的示例的序列图。
图8是示出允许根据第一示例性实施例的智能扬声器在供电状态PS1获取与数字照相机的语音控制功能的操作状态有关的信息的处理的示例的序列图。
图9是示出当根据第一示例性实施例的数字照相机的语音控制功能为关闭时执行的远程控制功能的处理的示例的序列图。
图10是示出当根据第一示例性实施例的数字照相机的语音控制功能为开启时执行的远程控制功能的处理的示例的序列图。
图11是示出根据第一示例性实施例的智能扬声器的远程控制功能的处理的示例的流程图。
图12是示出根据第一示例性实施例的数字照相机的远程控制功能的处理的示例的流程图。
具体实施方式
在下文中,将参照附图详细描述本公开的示例性实施例。
<系统构造>
图1是示出根据第一示例性实施例的系统构造的图。在本示例性实施例中描述的系统由智能扬声器100、数字照相机200、无线局域网(LAN)路由器300、服务器400和智能手机500构造。
智能扬声器100是具有语音控制功能的电子设备。语音控制功能是用于通过基于语音输入确定命令来执行用户命令的功能。通常,具有语音控制功能的电子设备首先识别在接收到的语音输入中包括的预定单词(所谓的“唤醒词”),并确定跟随在唤醒词之后的语音输入。在本示例性实施例中,智能扬声器100将所接收的语音输入发送到经由无线LAN网络与其连接的服务器400,并通过使用服务器400来确定基于语音输入的命令。本示例性实施例的智能扬声器100和下述数字照相机200在内部识别唤醒词,并通过使用服务器400来确定跟随该唤醒词的语音输入。
智能扬声器100通过从诸如商用电源的外部电源接收电力进行操作。智能扬声器100连接到无线LAN路由器300和服务器400。此外,智能扬声器100可以根据与低电力消耗蓝牙(BLE,
Figure BDA0002253281640000031
Low Energy)兼容的通信标准与数字照相机200通信。智能扬声器100获取与数字照相机200的语音控制功能的操作状态有关的信息。
数字照相机200是具有语音控制功能的设备。数字照相机200包括诸如锂离子电池或蓄电池的电池,并且操作以从电池接收电力。由于电池可存储的电量是有限的,所以用户希望尽可能节省数字照相机200的电力消耗。因此,通常关闭数字照相机200的语音控制功能和无线LAN功能,并且用户根据需要启用这些功能。本示例性实施例的数字照相机200的构造也可应用于诸如智能手机和平板终端的设备。
无线LAN路由器300形成无线LAN网络。智能扬声器100、数字照相机200和下述智能手机500可以经由通过无线LAN路由器300形成的无线LAN网络执行无线LAN通信。此外,智能扬声器100和数字照相机200可以经由无线LAN路由器300与服务器400进行通信。
服务器400提供用于识别基于语音输入的命令的服务。例如,服务器400向数字照相机200提供用于将语音数据转换为字符或句子的服务,以及用于分析字符或句子以将字符或句子转换为指令的服务。通过使用服务器400提供的服务,用户可以轻松地执行对于诸如智能手机500或数字照相机200的便携式电子设备而言相当繁重的处理。智能扬声器100和数字照相机200使用由服务器400提供的服务来分析输入语音。
智能手机500经由无线LAN通信执行智能扬声器100的各种设置。具体地,用于执行智能扬声器100的各种设置的应用被安装在智能手机500中。
在图1所示的系统构造中,本示例性实施例的智能扬声器100具有用于远程控制数字照相机200的语音控制功能的一部分的功能。如果用户在语音控制功能未运行的情况下对数字照相机200讲话,则智能扬声器100接收用户的语音输入并启用数字照相机200的语音控制功能。此外,智能扬声器100可以将接收到的语音数据发送到数字照相机200,并且远程控制数字照相机200执行与接收到的语音数据相对应的功能。下面将参照图9和图10描述远程控制的细节。
<智能扬声器100的构造示例>
图2是示出智能扬声器100的构造的示例的框图。
控制单元101根据存储在只读存储器(ROM)102中的输入信号或程序来控制智能扬声器100的各单元。例如,控制单元101由一个或更多个处理器(例如中央处理器(CPU)或微处理器(MPU))构造。另外,可以通过共享处理由多个硬件来控制整个设备,而不是由控制单元101来控制。
ROM 102是电可擦除/可记录的非易失性存储器,并且在其中存储由控制单元101执行的下述程序。
随机存取存储器(RAM)103是易失性存储器,其用作用于控制单元101执行程序的工作存储器或各种类型的数据的临时存储区域。
记录介质104是用于记录的介质。例如,记录介质104由存储卡、闪存或硬盘构造。记录介质104可以附装到智能扬声器100且可从智能扬声器100拆卸下来,或者可以内置在智能扬声器100中。因此,智能扬声器100仅必须至少包括用于访问记录介质104的单元。
操作单元105是用于接收用户操作并将接收到的信息通知给控制单元101的处理单元。例如,操作单元105由触摸面板、按钮开关和十字键构造。操作单元105还包括电源开关,该电源开关允许用户输入用于开启或关闭智能扬声器100的电源的指令。
显示单元106是用于显示图像数据和设备的操作状态的处理单元。显示单元106由液晶面板或发光二极管(LED)面板构造。另外,智能扬声器100并不总是必须包括显示单元106。智能扬声器100仅必须可连接到显示单元106并且至少包括用于控制显示单元106的显示的显示控制功能。
语音接收单元107是将用户的语音转换为数字数据并将该数字数据存储在RAM103中的处理单元。例如,语音接收单元107包括麦克风。
语音输出单元108是将存储在RAM 103中的数据转换为语音并通过扬声器将语音输出到外部的处理单元。
无线LAN通信单元109是用于执行符合电气和电子工程师协会(IEEE)802.11标准的无线通信的处理单元。无线LAN通信单元109作为无线LAN的站(STA)进行操作,以通过连接到由无线LAN路由器300形成的无线LAN网络来执行无线通信。
BT通信单元110是用于执行符合蓝牙标准的无线通信的处理单元。在本示例性实施例中,在蓝牙通信(BT通信)中采用在蓝牙4.0版或更高版本中指定的低功耗蓝牙(以下称为“BLE”)模式。BLE通信的可通信范围比无线LAN通信的通信范围更窄(即,其可通信距离更短),并且其通信速度比无线LAN通信的通信速度更慢。另一方面,BLE通信的电力消耗低于无线LAN通信的电力消耗。在本示例性实施例中,BT通信单元110作为“中央设备”操作,并且与数字照相机200执行无线数据通信。
内部总线120将各处理单元相互连接。
在此,将描述通信设备在BLE通信中的作用。通过BLE通信连接的两个通信设备分别作为“中央设备”和“外围设备”操作。BLE通信标准的连接模式是主从星型网络。作为“中央设备”操作的通信设备(以下称为“中央设备”)充当主设备,而作为“外围设备”操作的通信设备(以下称为“外围设备”)充当从设备。中央设备管理外围设备对网络的参与并执行用于无线连接到外围设备的各种参数的设置。尽管中央设备可以同时连接到多个外围设备,但是外围设备不能一次与多于一个的中央设备建立无线连接。此外,不能在用作中央设备的设备之间建立无线连接,因此当要建立无线连接时,一个设备应当用作中央设备,而另一设备应当用作外围设备。以上已经描述了通信设备在BLE通信中的作用。
在本示例性实施例中,由无线LAN通信单元109实现的通信的通信速度比由BT通信单元110实现的通信的通信速度更快。此外,由无线LAN通信单元109实现的通信的可通信范围比由BT通信单元110实现的通信的可通信范围更宽。
这里,智能扬声器100不断地从诸如商用电源的外部电源接收电力。
<数字照相机200的构造示例>
图3是示出数字照相机200的构造的示例的框图。
控制单元201根据存储在ROM 202中的输入信号或程序来控制数字照相机200的各单元。例如,控制单元201由一个或更多个处理器(例如CPU或MPU)构造。另外,可以通过共享处理由多个硬件来控制整个设备,而不是由控制单元201来控制。
ROM 202是电可擦除/可记录的非易失性存储器,并且在其中存储由控制单元201执行的下述程序。
RAM 203是易失性存储器,并且用作控制单元201用于执行程序的工作存储器或各种类型的数据的临时存储区域。
记录介质204是用于记录的介质。例如,记录介质204由存储卡、闪存或硬盘构造。记录介质204可以附装到数字照相机200或从数字照相机200拆卸下来,或者可以内置在数字照相机200中。换句话说,数字照相机200仅必须至少包括用于访问记录介质204的单元。
操作单元205是用于接收用户操作并将接收到的信息通知给控制单元201的处理单元。例如,操作单元205由触摸面板、按钮开关和十字键构造。操作单元205还包括电源开关,该电源开关允许用户输入用于开启或关闭数字照相机200的电源的指令。
显示单元206是用于显示图像数据和设备的操作状态的处理单元。显示单元206由液晶面板或LED面板构造。另外,数字照相机200并不总是必须包括显示单元206。数字照相机200仅必须可连接至显示单元206,并且至少包括用于控制显示单元206的显示的显示控制功能。
语音接收单元207是将用户的语音转换为数字数据并将该数字数据存储在RAM203中的处理单元。例如,语音接收单元207通过麦克风检测用户的语音。
语音输出单元208是将存储在RAM 203中的数据转换为语音并通过扬声器将语音输出到外部的处理单元。
无线LAN通信单元209是用于执行符合IEEE 802.11标准的无线通信的处理单元。无线LAN通信单元209作为无线LAN的站(STA)操作,以通过连接到由无线LAN路由器300形成的无线LAN网络来执行无线通信。
BT通信单元210是用于执行符合蓝牙标准的无线通信的处理单元。BT通信单元210作为“外围设备”操作,并执行与智能扬声器100的BLE通信。
电源控制单元211是用于控制要从电源单元212供应给各处理单元的电力的处理单元。
电源单元212可以向数字照相机200的各元件供电。例如,电源单元212是锂离子电池或蓄电池。
内部总线220将各处理单元相互连接。
这里,将参照图4描述由电源控制单元211执行的数字照相机200的电力控制。如上所述,数字照相机200是由电池驱动的设备,并且包括电源控制单元211,以实现低电力消耗。
图4是示出数字照相机200的供电状态的示例的表。在供电状态PS0中,没有向数字照相机200的任何处理单元供电,因此,数字照相机200的电源开关关闭。在供电状态PS1中,电源控制单元211不向语音接收单元207、语音输出单元208和无线LAN通信单元209分配电力。供电状态PS1是电力消耗被抑制的仅次于供电状态PS0的状态。在供电状态PS2中,至少向图3所示的所有单元供电。当通过用户操作开启电源开关时,数字照相机200从供电状态PS0切换到供电状态PS2。当通过用户操作关闭电源开关时,数字照相机200从供电状态PS2或PS1切换到供电状态PS0。此外,当电源控制单元211从控制单元201接收到指令时,数字照相机200从供电状态PS1切换到供电状态PS2,或者从供电状态PS2切换到供电状态PS1。例如,在供电状态PS1中,如果经由BT通信单元210从智能扬声器100接收到用于启用语音控制功能的请求包,则控制单元201指示电源控制单元211将供电状态切换到供电状态PS2。电源控制单元接收指令,并向语音接收单元207、语音输出单元208和无线LAN通信单元209供电。另一方面,如果控制单元201指示电源控制单元211将供电状态PS2切换到供电状态PS1,则电源控制单元211停止向语音接收单元207、语音输出单元208和无线LAN通信单元209供电。
<用于设置智能扬声器100的远程控制功能的处理序列>
图5是示出用于设置智能扬声器100的远程控制功能的处理的示例的序列图。下面将参照图9和图10描述远程控制功能的细节。通过执行该处理,智能扬声器100可以代替数字照相机200接收应该输入到数字照相机200的用户语音。此外,如果智能扬声器100在数字照相机200的语音控制功能开启之后向数字照相机200发送接收到的语音的语音数据,则数字照相机200可以基于语音数据执行处理。
当用户操作用于在智能手机500上设置智能扬声器100的应用时执行该处理。该应用安装在智能手机500中。智能手机500根据用户操作通过无线LAN通信与智能扬声器100和数字照相机200进行通信,以执行上述处理。
另外,智能手机500、智能扬声器100和数字照相机200连接到相同的无线LAN网络。此外,智能手机500已经在无线LAN网络中检测到智能扬声器100和数字照相机200,并且可以访问各个设备100和200。
在步骤S501中,智能手机500经由无线LAN通信将用于请求获取关于数字照相机200的信息的消息发送到数字照相机200。例如,关于数字照相机的信息包括数字照相机200的设备名称,唤醒词和蓝牙设备(BD)地址。在此,设备名称是用户已经设置为数字照相机200的名称的字符串。唤醒词是用于执行数字照相机200的语音控制功能的词。BD地址是用于在BLE通信中将设备标识为通信伙伴的48位地址信息。各个设备的BD地址都不同。
在步骤S502中,响应于在步骤S501中接收到的消息,数字照相机200经由无线LAN通信将关于数字照相机200的信息发送到智能手机500。
在步骤S503中,智能手机500经由无线LAN通信向智能扬声器100发送用于请求智能扬声器100开始设置远程控制功能的消息。在步骤S503中,智能手机500将与在步骤S502中接收到的数字照相机200的设备名称、唤醒词和BD地址有关的信息发送到智能扬声器100。
在步骤S504中,智能扬声器100将在步骤S503中接收到的关于数字照相机200的信息登记在设备管理数据库(DB)中。设备管理DB是用于管理各个设备的与设备名称、唤醒词、BD地址以及语音控制功能的操作状态有关的信息的数据库信息。设备管理DB被存储在ROM202中。在此,图6A是示出在步骤S504中的处理结束之后的设备管理DB的表。标识(ID)1表示关于智能扬声器100的信息,而ID 2表示关于数字照相机200的信息。在步骤S504中,登记关于数字照相机200的信息。
在步骤S505中,智能扬声器100建立用于与数字照相机200进行BLE通信的连接。具体而言,对于从用作外围设备的数字照相机200周期性地发送的广告消息,智能扬声器100的BT通信单元210发送用于请求BLE通信的连接以建立BLE通信的连接的消息。
在步骤S506中,智能扬声器100通过属性(ATT)协议经由BLE通信检测由数字照相机200提供的状态通知服务。状态通知服务是用于向通信伙伴周期性地通知语音控制功能的操作状态是开启还是关闭的服务。
在步骤S507中,智能扬声器100经由BLE通信请求数字照相机200开始提供在步骤S506中检测到的状态通知服务。
在步骤S508中,数字照相机200开始向智能扬声器100提供状态通知服务。
在步骤S509中,数字照相机200经由BLE通信向智能扬声器100发送指示状态通知服务开始的通知。
在步骤S510中,智能扬声器100经由无线LAN通信向智能手机500发送指示远程控制功能的设置完成的通知。
已经参照图5描述了用于设置智能扬声器100的远程控制功能的处理序列。
在本示例性实施例中,用于执行用于对智能扬声器100设置远程控制功能的处理的应用安装在智能手机500中。但是,该应用不一定总是必须安装在智能手机500中。例如,在智能扬声器100执行Web应用的状态下,用户可以通过使用Web应用编程接口(API)经由智能手机500的Web客户端功能(例如,Web浏览器)执行处理。
此外,在本示例性实施例中,用户通过使用智能手机500执行智能扬声器100的处理。然而,用户可以使智能扬声器100通过使用数字照相机200执行上述处理。例如,用户在数字照相机200中安装用于执行处理的应用,并通过使用数字照相机200使智能扬声器100执行该处理。
<获取关于语音控制功能的操作状态的信息的处理序列>
图7和图8是示出允许智能扬声器100获取与数字照相机200的语音控制功能的操作状态有关的信息的处理的示例的序列图。
数字照相机200经由BLE通信将指示语音控制功能的操作状态的信息周期性地发送到智能扬声器100。例如,数字照相机200以100毫秒的间隔将指示语音控制功能的操作状态的信息发送到智能扬声器100。智能扬声器100基于从数字照相机200接收到的信息,更新在设备管理DB中登记的数字照相机200的语音控制功能的操作状态。
该序列图中的数字照相机200的操作对应于图5中描述的状态通知服务。图7和图8是分别示出当数字照相机200正在执行状态通知服务时,在语音控制功能为开启或关闭的情况下执行的处理的序列图。
首先,将描述图7。当数字照相机200的电源开启时执行该处理。图7是当数字照相机200处于供电状态PS2时执行的处理的序列图。
在步骤S701中,数字照相机200将语音控制功能从开启状态改变为关闭状态。此时,数字照相机200的供电状态从供电状态PS2切换到供电状态PS1。当用户在预定时间段内未操作数字照相机200时,或者当用户经由操作单元205手动禁用语音控制功能时,执行步骤S701的处理。
在步骤S702中,数字照相机200经由BLE通信将指示语音控制功能的关闭状态的状态通知消息发送到智能扬声器100。即使在步骤S702之后,数字照相机200也周期性地且反复地发送状态通知消息。
在步骤S703中,智能扬声器100将在设备管理DB中登记的数字照相机200的语音控制功能的操作状态改变为“关闭”。通过步骤S703中的处理,设备管理DB被更新为图6B所示的状态。
接下来,将描述图8。图8是当数字照相机200处于供电状态PS1时执行的处理的序列图。
在步骤S801中,数字照相机200将语音控制功能从关闭状态改变为开启状态。此时,数字照相机200的供电状态从供电状态PS1切换到供电状态PS2。例如,当用户经由操作单元205手动启用语音控制功能时,执行步骤S701的处理。
在步骤S802中,数字照相机200经由BLE通信将指示语音控制功能的开启状态的状态通知消息发送到智能扬声器100。即使在步骤S802之后,数字照相机200也周期性地且反复地发送状态通知消息。
在步骤S803中,智能扬声器100将在设备管理DB中登记的数字照相机200的语音控制功能的操作状态改变为“开启”。通过步骤S803中的处理,设备管理DB被更新为图6C所示的状态。
已经参照图7和图8描述了允许智能扬声器100获取与数字照相机200的语音控制功能的操作状态有关的信息的处理序列。
<智能扬声器100的远程控制功能的处理序列>
图9和图10是示出智能扬声器100的远程控制功能的处理的示例的序列图。图9中的序列图示出了当数字照相机200的语音控制功能关闭时,在用户对数字照相机200讲话的情况下要执行的处理的示例。图10中的序列图示出了当数字照相机200的语音控制功能为开启时,在用户对数字照相机200讲话的情况下要执行的处理的示例。另外,在执行图9或图10中的处理之前已经执行了参照图5描述的用于设置智能扬声器100的远程控制功能的处理。
首先,将描述图9。当要开始处理时,数字照相机200的语音控制功能为关闭,并且供电状态为供电状态PS1。此外,智能扬声器100的设备管理DB的状态是图6B所示的状态。
例如,当用户对数字照相机200说“嘿,托马斯(Thomas),给我看上次拍摄的照片”时,开始该处理序列。此时,假定在用户的语音可足以到达智能扬声器100和数字照相机200的范围内存在用户。
在步骤S901中,智能扬声器100检测在接收到的语音输入中包括的唤醒词。例如,智能扬声器100从接收到的语音输入中检测唤醒词“托马斯”。智能扬声器100将输入的语音的语音数据存储在RAM 203中。
在步骤S902中,智能扬声器100参照设备管理DB并确定是否存在与在步骤S901中检测到的唤醒词相对应的条目。智能扬声器100确定例如是否存在与唤醒词“托马斯”相对应的条目。如果不存在与检测到的唤醒词相对应的条目,则智能扬声器100结束处理。如果存在与检测到的唤醒词相对应的条目,则智能扬声器100使处理进入步骤S903。
在步骤S903中,智能扬声器100确定与在步骤S901中检测到的唤醒词相对应的设备是自身设备(智能扬声器100)还是外部设备。如果智能扬声器100确定自身设备与其相对应,则智能扬声器100使用自身的语音控制功能来分析接收到的语音输入并执行与该语音输入相对应的处理。如果智能扬声器100确定外部设备与其相对应,则处理进入步骤S904。
在步骤S904中,智能扬声器100确定外部设备的语音控制功能的操作状态是开启还是关闭。在该处理中,因为设备管理DB处于图6B所示的状态,所以智能扬声器100确定ID2(数字照相机)对应于唤醒词“托马斯”,并确定语音控制功能的操作状态为关闭。
在步骤S905中,智能扬声器100经由BLE通信将用于请求数字照相机200启用语音控制功能的消息发送到数字照相机200。智能扬声器100将关于服务集标识符(SSID)和密码密钥的信息,作为连接到与智能扬声器100连接的无线LAN网络所需的信息,与该消息一起发送。数字照相机200接收该消息,并开始用于启用语音控制功能的处理。该无线LAN网络是由图1所示的无线LAN路由器300形成的无线LAN网络。
在步骤S906中,数字照相机200将供电状态从供电状态PS1切换到供电状态PS2。
在步骤S907中,数字照相机200通过使用在步骤S905中接收到的关于SSID和密码密钥的信息连接到无线LAN网络。此外,数字照相机200经由无线LAN网络检测服务器400,并使语音控制功能进入可用状态。
在步骤S908中,数字照相机200经由BLE通信向智能扬声器100发送,通知步骤S905中接收到的请求完成的消息。除了关于完成通知的信息之外,该消息还包括指示数字照相机200的语音控制功能的开启状态的信息和经由无线LAN通信访问照相机200所需的诸如数字照相机200的互联网协议(IP)地址的信息。
在步骤S909中,智能扬声器100将在设备管理DB中登记的ID2(数字照相机200)的语音控制功能的操作状态改变为“开启”。通过步骤S909中的处理,使设备管理DB进入图6C所示的状态。
在步骤S910中,智能扬声器100经由无线LAN通信将请求数字照相机200执行与在步骤S901中检测到的语音输入相对应的语音控制功能的消息发送到数字照相机200。该消息包括在步骤S901中由智能扬声器100接收的语音输入的数据。
在步骤S911中,数字照相机200根据在步骤S910中接收到的消息来执行语音控制功能。具体地,通过使用服务器400,数字照相机200解释在步骤S910中接收到的语音数据的一部分“给我看上次拍摄的照片”以确定必要的处理。数字照相机200响应于用户的请求在显示单元206上显示在记录介质204中记录的最后的静止图像数据,并输出语音消息“这里,请看照片”。
在步骤S912中,数字照相机200经由无线LAN通信将指示在步骤S910中接收到的消息中所请求的处理完成的消息发送给智能扬声器100。
步骤S901至S911中的处理对应于针对用户的语音输入“嘿,托马斯,给我看上次拍摄的照片”执行的语音控制功能的过程。
随后,将描述图10。当要开始处理时,数字照相机200的语音控制功能为开启,并且供电状态为供电状态PS2。此外,智能扬声器100的设备管理DB处于图6C所示的状态。例如,当在图9中的处理之后用户对数字照相机200说“嘿,托马斯,给我看倒数第二张照片”时,开始该处理序列。
在步骤S1001中,智能扬声器100从接收到的用户的语音输入中检测唤醒词。例如,智能扬声器100从接收到的语音输入中检测唤醒词“托马斯”。
在步骤S1002中,智能扬声器100参照设备管理DB,并确定是否存在与在步骤S1001中检测到的唤醒词相对应的条目。例如,智能扬声器100确定是否存在与唤醒词“托马斯”相对应的条目。如果不存在与检测到的唤醒词相对应的条目,则智能扬声器100结束处理。
如果在步骤S1002中智能扬声器100确定存在对应的条目,则在步骤S1003中,智能扬声器100确定与唤醒词相对应的设备的语音控制功能的操作状态是开启还是关闭。在步骤S1003中,例如,由于设备管理DB处于图6C所示的状态,因此智能扬声器100确定ID2(数字照相机200)对应于唤醒词“托马斯”,并且确定语音控制功能的操作状态为开启。在这种情况下,智能扬声器100不必远程控制数字照相机200。因此,智能扬声器100结束处理。
在步骤S1004中,数字照相机200检测经由语音接收单元207输入的语音。为方便起见,将步骤编号“S1004”应用于上述处理。然而,当用户对数字照相机200讲话时,该处理独立于由智能扬声器100执行的处理而执行。
在步骤S1005中,数字照相机200根据在步骤S1004中接收到的语音输入来执行语音控制功能。例如,数字照相机200确定在步骤S1004中接收的语音数据的一部分“给我看倒数第二张照片”,以确定必要的处理,并且在显示单元206上显示倒数第二个记录的静止图像数据。数字照相机200还响应于用户的语音输入而输出语音消息“这里,请看照片”。
已经参照图9和图10描述了智能扬声器100的远程控制功能的处理序列。
已经描述了经由无线LAN通信从智能扬声器100向数字照相机200发送语音数据的方法,作为执行与在步骤S901中接收的语音输入相对应的语音控制功能的方法。但是,也可以使用另一种方法。
可以执行使用Web API的方法,作为另一种方法。在提供了使智能扬声器100能够经由网络远程控制数字照相机200的各种功能的Web API功能的情况下,智能扬声器100分析在步骤S901中接收到的语音输入。利用该构造,可以通过服务器将语音数据转换为WebAPI,并且智能扬声器100可以针对数字照相机200执行转换后的Web API。此外,用于将语音数据转换为Web API的功能可以由网络上的服务器提供,以便智能扬声器100使用该服务器。
此外,作为另一示例性实施例,智能扬声器100可以经由代替用户的语音输出单元108输出在步骤S901中接收到的语音数据。
<智能扬声器100的远程控制功能的处理序列>
图11是示出智能扬声器100的远程控制功能的处理的示例的流程图。
在步骤S1101中,控制单元101检测在由语音接收单元107接收的语音输入中包括的唤醒词。控制单元101将接收到的语音输入的语音数据存储在RAM 203中。该处理对应于图9的步骤S901中的处理。
在步骤S1102中,控制单元101确定在ROM 202中存储的设备管理DB中是否登记了在步骤S1101中检测到的唤醒词。如果控制单元101确定登记了唤醒词(步骤S1102中为“是”),则处理进入步骤S1103。如果控制单元101确定未登记唤醒词(步骤S1102中为“否”),则处理结束。步骤S1102中的处理对应于图9的步骤S902中的处理。
在步骤S1103中,控制单元101识别与在步骤S1102中确定为要在设备管理DB中登记的唤醒词相对应的设备,并确定该设备是否是外部设备。如果控制单元101确定该设备是外部设备(即,数字照相机200)(步骤S1103中为“是”),则处理进入步骤S1104。如果控制单元101确定该设备是自身设备(步骤S1103中为“否”),则处理进入步骤S1112。步骤S1103中的该处理对应于图9的步骤S903中的处理。
在步骤S1104中,控制单元101确定在步骤S1103中识别出的数字照相机200的语音控制功能的操作状态是开启还是关闭。如果控制单元101确定语音控制功能的操作状态为关闭(步骤S1104中为“关闭”),则处理进入步骤S1105。如果控制单元101确定语音控制功能的操作状态为开启(步骤S1104中为“开启”),则处理结束。步骤S1104中的该处理对应于图9的步骤S904中的处理。
在步骤S1105中,控制单元101通过BT通信单元110发送请求数字照相机200启用语音控制功能的消息。步骤S1105中的该处理对应于图9的步骤S905中的处理。
在步骤S1106中,控制单元101响应于在步骤S1105中发送的消息,确定是否在预定时间段内从数字照相机200接收到完成的通知。如果在预定时间段内从数字照相机200接收到通知(步骤S1106中为“是”),则处理进入步骤S1108。如果在预定时间段内没有从数字照相机200接收到通知(步骤S1106中为“否”),则处理进入步骤S1107。步骤S1106中的该处理对应于图9的步骤S908中的处理。
在步骤S1107中,控制单元101通知用户不能启用数字照相机200的语音控制功能,并结束处理。作为错误处理,例如,通过语音输出单元108或显示单元106向用户通知诸如“数字相机200不能通信”或“在附近未找到数字相机200”的消息。
在步骤S1108中,控制单元101更新设备管理DB。控制单元101将数字照相机200的语音控制功能的操作状态改变为“开启”。步骤S1108中的该处理对应于图9的步骤S909中的处理。
在步骤S1109中,控制单元101经由无线LAN通信单元109向数字相机200发送请求数字相机200执行与在步骤S1101中接收的语音输入相对应的语音控制功能的消息。步骤S1109中的该处理对应于图9的步骤S910中的处理。
在步骤S1110中,控制单元101确定是否在预定时间段内从数字照相机200接收到完成的通知。如果在预定时间段内接收到完成通知(步骤S1110中为“是”),则处理结束。如果即使经过预定时间也没有从数字照相机200接收到完成通知,或者接收到错误响应(步骤S1110中为“否”),则处理进入步骤S1111。步骤S1110中的该处理对应于图9的步骤S912中的处理。
在步骤S1111中,控制单元101向用户通知由用户的语音提供的指令未被数字相机200执行,并且结束处理。在错误处理中,例如,通过语音输出单元108或显示单元106向用户通知诸如“数字照相机200不能通信”,“在附近未找到数字照相机200”或“请再说一次”的消息。
在步骤S1112中,控制单元101执行与在步骤S1101中接收的语音输入相对应的语音控制功能。具体地,控制单元通过经由无线LAN通信单元209使用服务器400来确定基于接收到的语音输入的命令,并且执行由语音输入指示的处理。
如上所述,已经描述了智能扬声器100的远程控制功能的处理序列。
<数字照相机200的远程控制功能的处理序列>
图12是示出数字照相机200的远程控制功能的处理的示例的流程图。当启动数字照相机200时,开始该流程图。
在步骤S1201中,控制单元201确定语音控制功能是开启还是关闭。如果语音控制功能为开启(步骤S1201中为“开启”),则处理进入步骤S1209。如果语音控制功能为关闭(步骤S1201中为“关闭”),则处理进入步骤S1202。
在步骤S1202中,控制单元201确定是否经由BT通信单元210从智能扬声器100接收到请求数字照相机200启用语音控制功能的消息。如果接收到该消息(步骤S1202中为“是”),则处理进入步骤S1203。如果未接收到消息(步骤S1202中为“否”),则处理返回至步骤S1201,并且控制单元201确定语音控制功能的操作状态。
在步骤S1203中,控制单元201控制电源控制单元211以将供电状态从供电状态PS1切换到供电状态PS2。
在步骤S1204中,控制单元201使用在步骤S1202中接收到的消息中所包括的SSID和密码密钥,以经由无线LAN通信单元209连接到无线LAN网络。此外,控制单元201经由无线LAN通信单元209检测服务器400,并使语音控制功能进入可用状态。
在步骤S1205中,控制单元201经由BT通信单元210向智能扬声器100发送指示语音控制功能的启用状态的完成通知。
在步骤S1206中,控制单元201确定是否经由无线LAN通信单元209从智能扬声器100接收了语音数据。如果未接收到语音数据(步骤S1206中为“否”),则控制单元201结束处理并在启用语音控制功能的状态下准备就绪。如果接收到语音数据(步骤S1206为“是”),则处理进入步骤S1207。
在步骤S1207中,控制单元201分析接收到的语音数据并基于分析结果执行处理。
在步骤S1208中,控制单元201经由无线LAN通信单元209将指示基于接收到的语音数据已经完成处理的消息发送给智能扬声器100。
已经描述了当数字照相机200的语音控制功能为关闭时要执行的处理。接下来,将针对控制单元201在步骤S1201中确定语音控制功能为开启的情况来描述处理。
在步骤S1209中,控制单元201确定是否接收到语音输入。如果接收到语音输入(步骤S1209为“是”),则处理进入步骤S1210。如果未接收到语音输入(步骤S1209中为“否”),则控制单元201结束处理并准备就绪,直到用户给出指令。
在步骤S1210中,控制单元201基于接收到的语音输入来执行语音控制功能。控制单元201分析接收到的语音输入的语音数据,并基于分析结果执行处理。
已经描述了数字照相机200的远程控制功能的处理序列。
在上述示例性实施例中,即使数字照相机200的语音控制功能为关闭,智能扬声器100也可以代替数字照相机200接收语音输入,使得用户可以使用语音控制功能。此外,通过上述构造,用户可以在降低数字照相机200的电力消耗的同时使用语音控制功能。
可以以这样的方式来实现本公开:将用于实现根据上述示例性实施例的一个或更多个功能的程序经由网络或存储介质提供给系统或装置,使得系统或设备中的一个或更多个处理器读取并执行程序。此外,本公开还可以利用实现一个或更多个功能的电路(例如,专用集成电路(ASIC))来实现。
此外,本公开不限于上述示例性实施例。因此,在实施阶段,可以通过在不脱离本发明的技术精神的范围内修改组成元件来实施本公开。此外,通过适当地组合上述示例性实施例中描述的多个构成元件,可以实现各种实施例。例如,可以从上述示例性实施例中描述的所有构成元件中删除一些构成元件。
其他实施例
还可以通过读出并执行记录在存储介质(也可更完整地称为“非临时性计算机可读存储介质”)上的计算机可执行指令(例如,一个或更多个程序)以进行上述实施例中的一个或更多个的功能、并且/或者包括用于进行上述实施例中的一个或更多个的功能的一个或更多个电路(例如,专用集成电路(ASIC))的系统或装置的计算机,来实现本发明的实施例,并且,可以利用通过由所述系统或装置的所述计算机例如读出并执行来自所述存储介质的所述计算机可执行指令以进行上述实施例中的一个或更多个的功能、并且/或者控制所述一个或更多个电路进行上述实施例中的一个或更多个的功能的方法,来实现本发明的实施例。所述计算机可以包括一个或更多个处理器(例如,中央处理单元(CPU),微处理单元(MPU)),并且可以包括分开的计算机或分开的处理器的网络,以读出并执行所述计算机可执行指令。所述计算机可执行指令可以例如从网络或所述存储介质被提供应计算机。所述存储介质可以包括例如硬盘、随机存取存储器(RAM)、只读存储器(ROM)、分布式计算系统的存储器、光盘(诸如压缩光盘(CD)、数字通用光盘(DVD)或蓝光光盘(BD)TM)、闪存设备以及存储卡等中的一个或更多个。
本发明的实施例还可以通过以下的方法来实现,即,通过网络或各种存储介质将执行上述实施例的功能的软件(程序)提供给系统或装置,该系统或装置的计算机或是中央的处理单元(CPU),微处理单元(MPU)纠正并执行程序的方法。
尽管已经参照示例性实施例描述了本公开,但是应当理解,本发明不限于所公开的示例性实施例。所附权利要求的范围应被赋予最宽泛的解释,以涵盖所有这样的修改以及等同的结构和功能。

Claims (27)

1.一种电子设备,其包括:
语音接收单元,其被构造为接收语音输入;
第一通信单元,其被构造为与具有语音识别功能的外部设备进行通信;以及
控制单元,
其中,控制单元经由第一通信单元接收,指示外部设备是否准备好识别语音输入的通知,并且
其中,在所述通知指示外部设备尚未准备好识别语音输入的情况下,当通过语音接收单元接收到包括与外部设备相对应的短语的预定语音输入时,控制单元经由第一通信单元控制外部设备以准备好识别语音输入。
2.根据权利要求1所述的电子设备,其中,在所述通知指示所述外部设备准备好识别语音输入的情况下,即使当通过语音接收单元接收到包括指示所述外部设备的短语的预定语音输入时,控制单元也阻止经由第一通信单元控制所述外部设备。
3.根据权利要求1所述的电子设备,所述电子设备还包括第二通信单元,
其中,经由第一通信单元执行的通信的电力消耗比经由第二通信单元执行的通信的电力消耗更低,并且
其中,经由第二通信单元执行的通信的通信速度比经由第一通信单元执行的通信的通信速度更快。
4.根据权利要求3所述的电子设备,其中,在所述控制单元将尚未准备好识别语音输入的外部设备经由所述第一通信单元控制为准备好接收语音输入之后,所述控制单元经由第二通信单元向外部设备发送,与向预定语音输入中包括的外部设备给予的指令有关的信息。
5.根据权利要求4所述的电子设备,其中,所述信息是由语音接收单元接收的语音数据。
6.根据权利要求4所述的电子设备,
其中,所述控制单元将语音接收单元接收的语音数据转换为用于控制电子设备的指令,并且
其中,所述信息是指令。
7.根据权利要求1所述的电子设备,
其中,所述控制单元确定接收到的语音输入中包括的电子设备的唤醒词和外部设备的唤醒词,并且
其中,在接收到电子设备的唤醒词的情况下,所述控制单元控制电子设备识别接收到的语音输入。
8.根据权利要求1所述的电子设备,其中,在所述控制单元将尚未准备好识别语音输入的外部设备经由第一通信单元控制为准备好识别语音输入之后,所述控制单元通知用户,外部设备准备好识别语音输入。
9.根据权利要求1所述的电子设备,其中,所述控制单元经由第一通信单元以预定间隔接收,指示所述外部设备是否准备好识别语音输入的通知。
10.根据权利要求1所述的电子设备,其中,在所述控制单元不能接收到指示外部设备是否准备好识别来自外部设备的语音输入的通知的情况下,所述控制单元通知用户所述外部设备不能通信。
11.根据权利要求1所述的电子设备,所述电子设备还包括:
输出单元,其被构造为输出语音;
其中,在控制单元将尚未准备好识别语音输入的外部设备经由第一通信单元控制为准备好识别语音输入之后,控制单元通过输出单元输出预定语音输入。
12.根据权利要求1所述的电子设备,其中,所述第一通信单元符合蓝牙标准。
13.根据权利要求1所述的电子设备,其中,所述预定语音输入包括指示所述外部设备的短语和用于控制所述外部设备的指示符。
14.根据权利要求1所述的电子设备,其中,所述外部设备准备好识别语音输入的状态对应于至少语音接收单元和用于识别语音输入的识别单元被开启的状态。
15.根据权利要求1所述的电子设备,其中,所述电子设备是连接到外部电源以从所述外部电源接收电力的设备。
16.一种电子设备的控制方法,所述电子设备包括用于与具有语音识别功能的外部设备进行通信的通信单元,所述控制方法包括:
第一接收步骤,接收语音输入;
第二接收步骤,经由通信单元接收指示外部设备是否准备好识别语音输入的通知,以及
控制步骤,在所述通知指示外部设备尚未准备好识别语音输入的情况下,当通过第一接收步骤接收到包括与外部设备相对应的短语的预定语音输入时,经由通信单元控制外部设备以准备好识别语音输入。
17.一种非暂时性计算机可读存储介质,其存储有用于使电子设备执行控制方法的程序,所述电子设备包括用于与具有语音识别功能的外部设备进行通信的通信单元,所述控制方法包括:
第一接收步骤,接收语音输入;
第二接收步骤,经由通信单元接收指示外部设备是否准备好识别语音输入的通知,以及
控制步骤,在所述通知指示外部设备尚未准备好识别语音输入的情况下,当通过第一接收步骤接收到包括与外部设备相对应的短语的预定语音输入时,经由通信单元控制外部设备以准备好识别语音输入。
18.一种电子设备,其包括:
语音接收单元,其被构造为接收语音输入;
第一通信单元,其被构造为与外部设备进行通信;以及
控制单元,
其中,控制单元包括用于识别由语音接收单元接收的预定语音输入的语音识别功能,
其中,在语音识别功能为开启的情况下,控制单元基于由语音接收单元接收到的预定语音输入来控制电子设备,
其中,在语音识别功能为关闭的情况下,控制单元经由第一通信单元向外部设备反复发送指示语音识别功能为关闭的通知,并且
其中,在经由第一通信单元从外部设备接收到指示开启语音识别功能的通知的情况下,控制单元执行控制以开启语音识别功能。
19.根据权利要求18所述的电子设备,其中,在所述语音识别功能为开启的情况下,所述控制单元经由所述第一通信单元向所述外部设备反复发送指示语音识别功能为开启的通知。
20.根据权利要求18所述的电子设备,其中,所述控制单元经由所述第一通信单元向所述外部设备周期性地发送指示语音识别功能是否开启的通知。
21.根据权利要求18所述的电子设备,所述电子设备还包括第二通信单元,
其中,经由第一通信单元执行的通信的电力消耗比经由第二通信单元执行的通信的电力消耗更低,并且
其中,经由第二通信单元执行的通信的通信速度比经由第一通信单元执行的通信的通信速度更快。
22.根据权利要求21所述的电子设备,其中,在所述控制单元经由所述第一通信单元接收到指示从所述外部设备接收到预定语音输入的通知的情况下,所述控制单元经由第二通信单元从外部设备接收与所述预定语音输入有关的数据,并基于所述数据控制电子设备。
23.根据权利要求18所述的电子设备,其中,所述预定语音输入包括指示所述电子设备的短语和用于控制所述电子设备的指示符。
24.根据权利要求18所述的电子设备,其中,所述第一通信单元符合蓝牙标准。
25.根据权利要求18所述的电子设备,还包括电池,
其中,电子设备是从电池接收电力的设备。
26.一种电子设备的控制方法,所述电子设备包括:用于接收语音输入的语音接收单元;用于与外部设备进行通信的第一通信单元;以及用于识别由所述语音接收单元接收的预定语音输入的语音识别功能,所述控制方法包括:
在语音识别功能为开启的情况下,基于由语音接收单元接收到的预定语音输入来控制电子设备;
在语音识别功能为关闭的情况下,经由第一通信单元向外部设备反复发送指示语音识别功能为关闭的通知,以及
在经由第一通信单元从外部设备接收到指示开启语音识别功能的通知的情况下,进行控制以开启语音识别功能。
27.一种非暂时性计算机可读存储介质,其存储用于使电子设备执行控制方法的程序,所述电子设备包括:用于接收语音输入的语音接收单元;用于与外部设备进行通信的第一通信单元;以及用于识别由所述语音接收单元接收的预定语音输入的语音识别功能,所述控制方法包括:
在语音识别功能为开启的情况下,基于由语音接收单元接收到的预定语音输入来控制电子设备;
在语音识别功能为关闭的情况下,经由第一通信单元向外部设备反复发送指示语音识别功能为关闭的通知,以及
在经由第一通信单元从外部设备接收到指示开启语音识别功能的通知的情况下,进行控制以开启语音识别功能。
CN201911042671.3A 2018-10-31 2019-10-30 电子设备、控制方法和存储介质 Active CN111128145B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018-205868 2018-10-31
JP2018205868A JP7242248B2 (ja) 2018-10-31 2018-10-31 電子機器、その制御方法、およびそのプログラム

Publications (2)

Publication Number Publication Date
CN111128145A true CN111128145A (zh) 2020-05-08
CN111128145B CN111128145B (zh) 2024-05-21

Family

ID=70327094

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911042671.3A Active CN111128145B (zh) 2018-10-31 2019-10-30 电子设备、控制方法和存储介质

Country Status (3)

Country Link
US (1) US11393467B2 (zh)
JP (1) JP7242248B2 (zh)
CN (1) CN111128145B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11289078B2 (en) * 2019-06-28 2022-03-29 Intel Corporation Voice controlled camera with AI scene detection for precise focusing
KR20220083199A (ko) * 2020-12-11 2022-06-20 삼성전자주식회사 전자장치 및 그 제어방법

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020069063A1 (en) * 1997-10-23 2002-06-06 Peter Buchner Speech recognition control of remotely controllable devices in a home network evironment
US20030069733A1 (en) * 2001-10-02 2003-04-10 Ryan Chang Voice control method utilizing a single-key pushbutton to control voice commands and a device thereof
CN101068430A (zh) * 2006-05-05 2007-11-07 联发科技股份有限公司 远程控制移动装置的方法以及监视一对象的电子装置
WO2015096747A1 (zh) * 2013-12-24 2015-07-02 腾讯科技(深圳)有限公司 操作响应方法、客户端、浏览器及系统
US20150235642A1 (en) * 2013-09-03 2015-08-20 Panasonic Intellectual Property Corporation Of America Speech dialogue control method
CN105874405A (zh) * 2013-12-11 2016-08-17 Lg电子株式会社 智能家用电器、其操作方法及使用智能家用电器的语音识别系统
US20160240196A1 (en) * 2015-02-16 2016-08-18 Alpine Electronics, Inc. Electronic Device, Information Terminal System, and Method of Starting Sound Recognition Function
CN105913847A (zh) * 2016-06-01 2016-08-31 北京灵隆科技有限公司 语音控制系统、用户端设备、服务器和中央控制单元
US9691378B1 (en) * 2015-11-05 2017-06-27 Amazon Technologies, Inc. Methods and devices for selectively ignoring captured audio data
CN107180632A (zh) * 2017-06-19 2017-09-19 微鲸科技有限公司 语音控制方法、装置及可读存储介质
WO2018033160A1 (zh) * 2016-08-19 2018-02-22 深圳市轻生活科技有限公司 一种智能语音监护系统和方法
CN107872371A (zh) * 2016-09-23 2018-04-03 深圳市轻生活科技有限公司 与智能无线路由器配合使用的语音控制及其语音控制方法
WO2018135753A1 (ko) * 2017-01-17 2018-07-26 삼성전자주식회사 전자 장치 및 그의 동작 방법
CN108419108A (zh) * 2018-03-06 2018-08-17 深圳创维数字技术有限公司 语音控制方法、装置、遥控器和计算机存储介质
CN108574515A (zh) * 2017-03-07 2018-09-25 中移(杭州)信息技术有限公司 一种基于智能音箱设备的数据分享方法、装置和系统

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5975947B2 (ja) 2013-07-08 2016-08-23 ユニロボット株式会社 ロボットを制御するためのプログラム、及びロボットシステム
BR112017021673B1 (pt) 2015-04-10 2023-02-14 Honor Device Co., Ltd Método de controle de voz, meio não-transitório legível por computador e terminal
US9787887B2 (en) 2015-07-16 2017-10-10 Gopro, Inc. Camera peripheral device for supplemental audio capture and remote control of camera
US10271093B1 (en) * 2016-06-27 2019-04-23 Amazon Technologies, Inc. Systems and methods for routing content to an associated output device
US10672387B2 (en) * 2017-01-11 2020-06-02 Google Llc Systems and methods for recognizing user speech

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020069063A1 (en) * 1997-10-23 2002-06-06 Peter Buchner Speech recognition control of remotely controllable devices in a home network evironment
US20030069733A1 (en) * 2001-10-02 2003-04-10 Ryan Chang Voice control method utilizing a single-key pushbutton to control voice commands and a device thereof
CN101068430A (zh) * 2006-05-05 2007-11-07 联发科技股份有限公司 远程控制移动装置的方法以及监视一对象的电子装置
US20150235642A1 (en) * 2013-09-03 2015-08-20 Panasonic Intellectual Property Corporation Of America Speech dialogue control method
CN105874405A (zh) * 2013-12-11 2016-08-17 Lg电子株式会社 智能家用电器、其操作方法及使用智能家用电器的语音识别系统
WO2015096747A1 (zh) * 2013-12-24 2015-07-02 腾讯科技(深圳)有限公司 操作响应方法、客户端、浏览器及系统
US20160240196A1 (en) * 2015-02-16 2016-08-18 Alpine Electronics, Inc. Electronic Device, Information Terminal System, and Method of Starting Sound Recognition Function
US9691378B1 (en) * 2015-11-05 2017-06-27 Amazon Technologies, Inc. Methods and devices for selectively ignoring captured audio data
CN105913847A (zh) * 2016-06-01 2016-08-31 北京灵隆科技有限公司 语音控制系统、用户端设备、服务器和中央控制单元
WO2018033160A1 (zh) * 2016-08-19 2018-02-22 深圳市轻生活科技有限公司 一种智能语音监护系统和方法
CN107872371A (zh) * 2016-09-23 2018-04-03 深圳市轻生活科技有限公司 与智能无线路由器配合使用的语音控制及其语音控制方法
WO2018135753A1 (ko) * 2017-01-17 2018-07-26 삼성전자주식회사 전자 장치 및 그의 동작 방법
CN108574515A (zh) * 2017-03-07 2018-09-25 中移(杭州)信息技术有限公司 一种基于智能音箱设备的数据分享方法、装置和系统
CN107180632A (zh) * 2017-06-19 2017-09-19 微鲸科技有限公司 语音控制方法、装置及可读存储介质
CN108419108A (zh) * 2018-03-06 2018-08-17 深圳创维数字技术有限公司 语音控制方法、装置、遥控器和计算机存储介质

Also Published As

Publication number Publication date
JP7242248B2 (ja) 2023-03-20
US11393467B2 (en) 2022-07-19
CN111128145B (zh) 2024-05-21
US20200135196A1 (en) 2020-04-30
JP2020071721A (ja) 2020-05-07

Similar Documents

Publication Publication Date Title
US20210203793A1 (en) Voice control device, printing apparatus, control methods thereof, and storage medium
EP3101867B1 (en) Wireless audio output devices
CN105681969B (zh) 电子装置、音频装置、控制电子装置和音频装置电源的方法
JP6704881B2 (ja) システム
JP2019095520A (ja) 音声制御システム、制御方法およびプログラム
EP3193518A1 (en) Wireless communication terminal, wireless communication system, and wireless communication program
US20190102116A1 (en) Printing method, sound control system, and program
KR102533074B1 (ko) 인쇄 시스템, 제어 방법, 및 서버
US10484842B2 (en) Communication system
JP6488547B2 (ja) 会議端末制御システム及び会議端末制御方法
JPWO2005103623A1 (ja) ナビゲーションシステム及びナビゲーション装置
US10489515B2 (en) Method and apparatus for providing automatic speech translation service in face-to-face situation
JP2014175822A (ja) 無線通信装置、無線通信端末、再接続プログラム、無線通信方法および無線通信システム
JP2019096295A (ja) 音声制御システム、制御方法及びプログラム
CN111128145B (zh) 电子设备、控制方法和存储介质
CN110875993A (zh) 带交互代理功能的图像形成系统及其控制方法和存储介质
KR102629796B1 (ko) 음성 인식의 향상을 지원하는 전자 장치
US20170118586A1 (en) Voice data transmission processing method, terminal and computer storage medium
US20210045073A1 (en) Electronic device for performing device-to-device communication and method therefor
WO2017061081A1 (en) Communication apparatus and control method for the same
KR20210061091A (ko) 인텔리전트 어시스턴스 서비스를 제공하기 위한 전자 장치 및 그의 동작 방법
JP2019194861A (ja) 伝送システム、伝送端末、方法、および、プログラム
CN112640476B (zh) 电子装置及其控制方法
JP2014060479A (ja) 携帯端末、その制御方法、および、その制御プログラム
CN112835377A (zh) 无人机控制方法、装置、存储介质以及车辆

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant