CN113301247B - 一种摄像设备、其控制方法以及存储介质 - Google Patents

一种摄像设备、其控制方法以及存储介质 Download PDF

Info

Publication number
CN113301247B
CN113301247B CN202110136847.2A CN202110136847A CN113301247B CN 113301247 B CN113301247 B CN 113301247B CN 202110136847 A CN202110136847 A CN 202110136847A CN 113301247 B CN113301247 B CN 113301247B
Authority
CN
China
Prior art keywords
voice
unit
line
proximity
sight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110136847.2A
Other languages
English (en)
Other versions
CN113301247A (zh
Inventor
植野大优
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of CN113301247A publication Critical patent/CN113301247A/zh
Application granted granted Critical
Publication of CN113301247B publication Critical patent/CN113301247B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/50Constructional details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/62Control of parameters via user interfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Studio Devices (AREA)
  • Exposure Control For Cameras (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

一种语音输入设备、其控制方法以及存储介质。该语音输入设备输入语音,并检测向该语音输入设备的接近。该语音输入设备进行控制,以在输入用于对语音输入设备启用利用语音的操作的第一语音指令之后的固定时间段内输入用于操作语音输入设备的第二语音指令的情况下,执行与第二语音指令相对应的处理。在检测到向该语音输入设备的接近的情况下,当输入第二语音指令时,即使未输入第一语音指令,该语音输入设备也执行与第二语音指令相对应的处理。

Description

一种摄像设备、其控制方法以及存储介质
技术领域
本发明涉及用于执行与语音指令相对应的处理的语音输入设备、其控制方法以及存储介质。
背景技术
近年来,设置有能够识别口语语音输入并进行与语音输入相对应的操作的语音操作功能的设备是已知的。例如,通过语音操作功能使用语音可以进行用于显示期望页面以供查看的操作、用于改变设备的当前设置值的操作、以及用于呼叫特定人员或输入电子邮件消息的文本的操作。虽然语音操作功能具有能够利用自然讲话进行操作的优点,但是这些设备也可能对非预期语音做出反应,从而导致错误操作。
日本特开2019-86535提出了一种技术,该技术通过能够进行语音操作的设备接收称为唤醒词的特定语音命令启用语音操作,并且仅在唤醒词之后的预定时间段内接收语音操作,来减少错误操作的发生。此外,日本特开H2-131300提出了一种技术,在该技术中,组合了接近传感器与语音操作的设备在接近传感器做出反应时开始语音输入接收。
日本特开2019-86535提出的技术存在一个问题,即为了执行语音操作,需要总是输入唤醒词而费时费力。当操作摄像设备时,有时期望快速设置改变以避免错过拍照机会。在总是输入唤醒词而需要时间和精力的情况下,不仅简单的操作会变得繁琐,而且在给出唤醒词之后进行语音操作时,有可能错过期望的拍照机会。
此外,利用日本特开H2-131300中提出的技术,存在以下问题:在接近传感器做出反应的情况下,首次开始语音输入接收,因此,如果距离使得接近传感器未做出反应,则无法进行语音操作。也就是说,例如,在诸如从远离摄像设备的位置拍摄集体照的情况下,想要进行语音操作(例如,拍摄指令)的用户需要在最初移动到接近传感器会做出反应的位置之后输入语音。
发明内容
本发明是考虑到上述问题而做出的,并且实现了一种技术,该技术在设置有接近传感器的语音输入设备中,能够实现容易的语音操作以及在进行语音操作时实现快速操作。
为了解决上述问题,本发明的一个方面提供一种语音输入设备,包括:语音输入单元,其被配置为输入语音;接近检测单元,其配置为检测向所述语音输入设备的接近;以及控制单元,其被配置为进行控制,以在输入用于对所述语音输入设备启用利用语音的操作的第一语音指令之后的固定时间段内输入用于操作所述语音输入设备的第二语音指令的情况下,执行与所述第二语音指令相对应的处理,其中,在所述接近检测单元检测到向所述语音输入设备的接近的情况下,当输入所述第二语音指令时,即使未输入所述第一语音指令,所述控制单元也执行与所述第二语音指令相对应的处理。
本发明的另一方面提供一种语音输入设备的控制方法,所述语音输入设备包括:语音输入装置,其被配置为输入语音;以及接近检测装置,其被配置为检测向所述语音输入设备的接近,所述控制方法包括:进行控制,以在输入用于对所述语音输入设备启用利用语音的操作的第一语音指令之后的固定时间段内输入用于操作所述语音输入设备的第二语音指令的情况下,执行与所述第二语音指令相对应的处理,其中,在进行控制中,在所述接近检测装置检测到向所述语音输入设备的接近的情况下,当输入所述第二语音指令时,即使未输入所述第一语音指令,也执行与所述第二语音指令相对应的处理。
本发明的又一方面提供一种非暂时性计算机可读存储介质,其包括用于进行语音输入设备的控制方法的指令,所述语音输入设备包括:语音输入装置,其被配置为输入语音;以及接近检测装置,其被配置为检测向所述语音输入设备的接近,所述控制方法包括:进行控制,以在输入用于对所述语音输入设备启用利用语音的操作的第一语音指令之后的固定时间段内输入用于操作所述语音输入设备的第二语音指令的情况下,执行与所述第二语音指令相对应的处理,其中,在进行控制中,在所述接近检测装置检测到向所述语音输入设备的接近的情况下,当输入所述第二语音指令时,即使未输入所述第一语音指令,也执行与所述第二语音指令相对应的处理。
根据本发明,在设置有接近传感器的语音输入设备中,变得能够实现容易的语音操作以及在进行语音操作时实现快速操作。
根据以下(参照附图)对典型实施例的描述,本发明的其它特征将变得明显。
附图说明
图1A和图1B是示出了根据本实施例的用作语音输入设备示例的数字照相机的外观的图。
图2是示出了根据本实施例的数字照相机的示例性功能结构的框图。
图3A和图3B是示出了根据本实施例的主要处理的一系列操作的流程图。
图4A至图4C是示出了本实施例中照片回放画面的示例的图。
具体实施方式
下文中,将参照附图对实施例进行详细的描述。注意,以下实施例并非旨在限制所要求保护的发明的范围。实施例中描述了多个特征,但是并不限于需要所有此类特征的发明,并且可以适当地组合多个此类特征。此外,在附图中,相同或相似的结构被给予相同的附图标记,并且省略其冗余描述。
下文中,将对使用能够利用语音识别进行操作的数字照相机作为语音输入设备示例的示例进行描述。然而,本实施例不仅适用于数字照相机,而且适用于能够使用语音识别进行操作的其它装置。这些装置可包括例如智能手机、个人计算机、游戏机、平板终端、音乐播放器、VR或AR头戴式受话器以及医疗设备。
数字照相机的结构
图1A和图1B示出了根据本实施例的用作语音输入设备的示例的数字照相机100的外部视图。图1A是数字照相机100的正面透视图,以及图1B是数字照相机100的背面透视图。显示单元28是设置在照相机背面上并显示图像及各种信息的显示单元。触摸面板70a能够检测在显示单元28的显示面(操作面)上的触摸操作。取景器外显示单元43是设置在照相机上面上的显示单元,并且显示照相机的各种设置值(包括快门速度和光圈)。快门按钮61是用于给出拍摄指令的操作单元。模式转换开关60是用于在各种模式之间切换的操作单元。端子盖40是保护用于将外部装置的连接线缆与数字照相机100连接的连接器(未示出)的盖。
主电子拨盘71是操作单元70中所包括的旋转操作构件,并且通过转动该主电子拨盘71可以进行诸如改变快门速度、光圈和其它设置值的处理。电源开关72是用于在数字照相机100的打开(ON)电源和关闭(OFF)电源之间切换的操作构件。副电子拨盘73是操作单元70中所包括的旋转操作构件,并且能够移动所选框、以及进行图像跳转等。十字键74是操作单元70中所包括的操作构件,并且具有能够在四个方向上按下的按压按钮。可以根据十字键74按下的方向进行操作。设置(SET)按钮75是操作单元70中所包括的按压按钮,并且主要用于设置所选项等。运动图像按钮76用于指示运动图像拍摄(记录)的开始和停止。语音输入按钮77是能够限制仅在按下该按钮时启用利用语音的操作的按钮。然而,在以下描述中,将示出以下情况作为示例:设置无论是否按下语音输入按钮77都使得能够输入语音的设置值,以及各种类型的处理响应于语音操作而操作。变焦按钮78是操作单元70中所包括的操作按钮,并且用于在拍摄模式的实时取景显示中切换打开和关闭变焦模式。通过在将变焦模式设置为打开后操作主电子拨盘71,可以进行实时取景图像的放大和缩小。在回放模式下,变焦按钮78用作用于放大回放图像并增加放大率的变焦按钮。播放按钮79是操作单元70中所包括的操作按钮,并且用于在拍摄模式和回放模式之间切换。通过在拍摄模式期间按下播放按钮79,可以将模式转变为回放模式,并且可以将记录在记录介质200上的图像中的最新图像显示在显示单元28上。菜单按钮81包括在操作单元70中,并且通过按下菜单按钮81,显示单元28上显示可进行各种设置的菜单画面。用户能够使用显示单元28上显示的菜单画面以及十字键74和设置(SET)按钮75来配置各种设置。
通信端子10是用于使数字照相机100与稍后描述的镜头单元150(可拆卸)通信的通信端子。目镜单元16是目镜取景器(用户窥视型的取景器)的目镜单元,并且用户通过目镜单元16可看到内部EVF(电子取景器)29上显示的视频。眼睛接近检测单元57是用于检测图像拍摄者的眼睛是否已经接近目镜单元16的眼睛接近检测传感器。
盖202是容纳记录介质200的槽的盖。握持部90是成形为在用户保持数字照相机100准备拍摄时可以容易用右手握持的保持部。快门按钮61和主电子拨盘71布置在用右手的小指、无名指和中指围绕握持部90而保持数字照相机100的状态下用右手食指可操作的位置。此外,副电子拨盘73布置在相同状态下用右手拇指可操作的位置。
接着,将参照图2描述根据本实施例的数字照相机100的示例功能结构。在图2中,镜头单元150是设置有可更换拍摄镜头的镜头单元。透镜103通常由多个透镜组成,但是在此为简化起见,仅示出了一个透镜。通信端子6是用于使镜头单元150与数字照相机100通信的通信端子。镜头单元150经由该通信端子6和上述通信端子10与系统控制单元50通信,并且利用内部的镜头系统控制电路4经由光圈驱动电路2控制光圈1。之后,通过经由AF驱动电路3使透镜103移位来进行调焦。
快门101是能够通过系统控制单元50的控制而自由地控制摄像单元22的曝光时间的焦平面快门。
摄像单元22是由将光学图像转换成电信号的CCD或CMOS装置等组成的图像传感器。使用A/D转换器23以将由摄像单元22输出的模拟信号转换成数字信号。
图像处理单元24对来自A/D转换器23的数据或来自稍后描述的存储器控制单元15的数据进行颜色转换处理以及预定的诸如像素插值和缩小等的大小调整处理。此外,图像处理单元24使用拍摄图像数据进行预定计算处理。系统控制单元50基于由图像处理单元24获得的计算结果进行曝光控制和测距控制。由此进行TTL(通过镜头)AF(自动调焦)处理、AE(自动曝光)处理和EF(电子闪光灯)处理。图像处理单元24还使用拍摄图像数据进行预定计算处理,并基于所获得的计算结果进行TTL AWB(自动白平衡)处理。
存储器控制单元15控制A/D转换器23、图像处理单元24和存储器32之间的数据发送和接收。将来自A/D转换器23的输出数据经由图像处理单元24和存储器控制单元15、或者直接经由存储器控制单元15写入存储器32。存储器32存储由摄像单元22获得并由A/D转换器23转换为数字数据的图像数据,以及用于显示在显示单元28和EVF 29上的图像数据。存储器32设置有足够的存储容量以存储预定数量的静止图像或者预定时间长度的运动图像和音频。
此外,存储器32还兼作用于图像显示的存储器(视频存储器)。经由存储器控制单元15,由显示单元28或EVF 29显示写入存储器32的用于显示的图像数据。显示单元28和EVF29在诸如LCD或有机电致发光显示器等的显示装置上,进行取决于来自存储器控制单元15的信号的显示。可以通过将由A/D转换器23进行A/D转换并存储在存储器32中的数据顺序地传输到显示单元28或EVF 29上并显示该数据来进行实时取景显示(LV显示)。在下文中,将实时取景中显示的图像称为实时取景图像(LV图像)。
红外发光二极管166是用于检测在取景器画面上的用户的视线位置的发光元件,并用红外光照射眼睛已经接近目镜单元16的用户的眼球(眼睛)161。由红外发光二极管166发射的红外光被眼球(眼睛)161反射,并且该红外反射光到达二向色镜162。二向色镜162仅反射红外光,并透射可见光。光路已改变的红外反射光经由成像透镜163在视线检测传感器164的摄像面上形成图像。成像透镜163是构成视线检测光学系统的光学构件。视线检测传感器164由诸如CCD图像传感器等的摄像装置构成。
视线检测传感器164将入射的红外反射光光电转换为电信号,并将电信号输出至视线检测电路165。视线检测电路165包括至少一个处理器,并且基于视线检测传感器164的输出信号根据用户的眼球(眼睛)161的图像或移动来检测用户的视线位置,并将检测信息输出至系统控制单元50。以这种方式,视线检测块160由二向色镜162、成像透镜163、视线检测传感器164、红外发光二极管166和视线检测电路165构成。视线检测块160例如通过所谓的角膜反射法来检测视线。角膜反射法是涉及如下的方法:根据眼球(眼睛)161的瞳孔与由于红外发光二极管166所发射的红外光特别地被眼球(眼睛)161的角膜反射而产生的反射光之间的位置关系,来检测视线的取向和位置。还存在用于检测视线的取向和位置的各种其它方法,诸如所谓的巩膜反射法,其利用虹膜和眼白之间的光反射差异。注意,视线检测单元可以使用除上述之外的可以检测视线取向和位置的任何其它方法。
经由取景器外显示单元驱动电路44在取景器外显示单元43上显示数字照相机100的各种设置值(包括快门速度和光圈)。
非易失性存储器56是电可擦除/可记录存储器,并且例如使用闪速ROM。非易失性存储器56中存储用于系统控制单元50的操作的常数、和程序等。这里所指的程序是用于执行本实施例中稍后描述的各种流程图的计算机程序。
系统控制单元50包括例如一个或多个处理器,并控制整个数字照相机100。通过将记录在非易失性存储器56上的程序提取到系统存储器52并利用系统控制单元50执行,来实现稍后描述的本实施例的各个处理。例如,针对系统存储器52使用RAM,并且将系统控制单元50的操作中使用的从非易失性存储器56中读出的常数、变量、和程序等提取到RAM。系统控制单元50还通过控制存储器32、和显示单元28等进行显示控制。
系统计时器53是用于测量各种控制中所使用的时间以及内置时钟的时间的计时单元。模式转换开关60、第一快门开关62、第二快门开关64以及操作单元70是用于向系统控制单元50输入各种操作指令的操作单元。模式转换开关60将系统控制单元50的操作模式切换为静止图像拍摄模式、和运动图像拍摄模式等中的一种。静止图像拍摄模式中的模式包括自动拍摄模式、自动场景判别模式、手动模式、光圈优先模式(Av模式)、快门速度优先模式(Tv模式)和程序AE模式(P模式)。此外,存在被配置为拍摄特定场景拍摄设置的各种场景模式、和自定义模式等。使用模式转换开关60,用户能够直接切换到这些模式中的任何一个。可选地,可以采用以下结构:在利用模式转换开关60最初切换到拍摄模式列表画面之后,选择多个所显示的模式中的一个,并且使用另一操作构件进行切换。同样地,运动图像拍摄模式也可包括多个模式。
第一快门开关62在数字照相机100中所设置的快门按钮61被部分操作时以所谓的半按下(拍摄准备指令)打开,并生成第一快门开关信号SW1。利用第一快门开关信号SW1开始诸如AF(自动调焦)处理、AE(自动曝光)处理、AWB(自动白平衡)处理和EF(电子闪光灯)处理等的拍摄准备操作。
第二快门开关64在快门按钮61被完全操作时以所谓的完全按下(拍摄指令)打开,并生成第二快门开关信号SW2。系统控制单元50利用第二快门开关信号SW2开始从自摄像单元22读出信号到将拍摄图像作为图像文件写入记录介质200的一系列拍摄处理的操作。
操作单元70是用作接收来自用户的操作的输入单元的各种类型的操作构件。如上所述,操作单元70包括快门按钮61、触摸面板70a、主电子拨盘71、副电子拨盘73、十字键74以及设置按钮75。操作单元70还包括运动图像按钮76、语音输入按钮77、变焦按钮78、播放按钮79以及菜单按钮81。
电源控制单元80由电池检测电路、DC-DC转换器、以及用于切换通电块的开关电路等组成,并检测电池是否安装、电池的类型以及剩余电池。此外,电源控制单元80基于检测结果和系统控制单元50的指令控制DC-DC转换器,并在所需时间段内向包括记录介质200的各种组件供应所需电压。电源单元30包括诸如碱性电池或锂电池等的一次电池、诸如NiCd电池、NiMH电池或Li电池等的二次电池以及AC适配器。
记录介质I/F 18是与记录介质200(其为存储卡或硬盘等)的接口。记录介质200是用于记录所拍摄图像的诸如存储卡等的记录介质,并由半导体存储器、或磁盘等构成。
通信单元54包括例如通信电路或通信模块,其无线地或利用线缆连接,并进行视频信号和音频信号的发送和接收。通信单元54还能够连接至用于移动电话的无线通信、无线LAN(局域网)和互联网。此外,通信单元54甚至能够利用Bluetooth(注册商标)和低功耗Bluetooth(注册商标)与外部装置通信。通信单元54能够发送由摄像单元22拍摄的图像(包括实时取景图像)和记录在记录介质200上的图像,并且能够从外部装置接收图像和各种其它信息。
姿态检测单元55检测数字照相机100相对于重力方向的姿态。基于由姿态检测单元55检测到的姿态,可以将利用摄像单元22拍摄的图像区分为利用水平保持的数字照相机100拍摄的图像或者利用垂直保持的照相机拍摄的图像。对于系统控制单元50,可以将取决于姿态检测单元55检测到的姿态的取向信息添加至由摄像单元22拍摄的图像的图像文件,并且可以旋转并记录图像。至于姿态检测单元55,可以使用加速度传感器、或陀螺仪传感器等。还可以使用加速度传感器、或陀螺仪传感器等用作姿态检测单元55,来检测数字照相机100的移动(平摇、俯仰、升起、是否静止等)。
眼睛接近检测单元57是用于检测眼睛(物体)161已移动更靠近(接近)或已移动离开(移开)取景器的目镜单元16(接近检测)的眼睛接近检测传感器。系统控制单元50根据眼睛接近检测单元57检测到的状态,在显示单元28和EVF 29的显示(显示状态)/非显示(非显示状态)之间切换。更具体地,至少在数字照相机100处于拍摄待机状态、并且用于切换由摄像单元22拍摄的实时取景图像的显示目的地的设置被设置为自动切换的情况下,当眼睛尚未接近目镜单元16时,以显示单元28作为显示目的地而将显示设置为打开,并且将EVF 29设置为非显示。此外,当眼睛已经接近目镜单元16时,以EVF 29作为显示目的地而将显示设置为打开,并且将显示单元28设置为非显示。例如,红外接近传感器可用于眼睛接近检测单元57,并且眼睛接近检测单元57能够检测某种物体与包括EVF29的取景器的目镜单元16的接近。在物体已经接近目镜单元16的情况下,从眼睛接近检测单元57的投影单元(未示出)投射的红外光被反射,并由红外接近传感器的光接收单元(未示出)接收。根据所接收的红外光的量,眼睛接近检测单元57还能够区分物体已接近目镜单元16的程度(眼睛接近距离)。以这种方式,眼睛接近检测单元57进行用于检测物体到目镜单元16的接近距离的眼睛接近检测。注意,在本实施例中,眼睛接近检测单元57的投影单元和光接收单元是与上述红外发光二极管166和视线检测传感器164分离的装置。然而,红外发光二极管166也可用作眼睛接近检测单元57的投影单元。此外,视线检测传感器164也可用作光接收单元。从非眼睛接近状态(非接近状态)检测到物体在预定距离内接近目镜单元16的情况将被视为检测到用户的眼睛已经接近目镜单元16。从眼睛接近状态(接近状态)起被检测到接近的物体移动离开预定距离或更远距离的情况将被视为检测到用户的眼睛已经从目镜单元16移开。例如,由于设置滞后,因此用于检测用户的眼睛接近的阈值和用于检测用户的眼睛移开的阈值可能不同。此外,从检测到用户的眼睛已经接近之后直到检测到用户的眼睛已经移开,将被视为眼睛接近状态。从检测到用户的眼睛已经移开之后直到检测到用户的眼睛已经接近,将被视为非眼睛接近状态。注意,给出红外接近传感器作为示例,并且能够检测眼睛或视为用户的眼睛的物体已接近目镜单元16的任何传感器都可用于眼睛接近检测单元57。
系统控制单元50能够基于视线检测块160的输出检测以下操作或状态。
-眼睛已接近目镜单元16的用户的视线被新输入(检测到)。即,视线输入的开始。
-存在眼睛已接近目镜单元16的用户的视线输入的状态。
-眼睛已接近目镜单元16的用户正在稳定地注视的状态。
-眼睛已接近目镜单元16的用户的视线已经偏移。即,视线输入的结束。
-不存在眼睛已接近目镜单元16的用户的视线输入的状态。
这里描述的稳定注视是指用户的视线位置在预定时间内没有超过预定移动量的情况。
触摸面板70a和显示单元28可以一体地构成。例如,触摸面板70a被构成为使得光的透射率不会干扰显示单元28上的显示,并且触摸面板70a被附接至显示单元28的显示面的上层。触摸面板70a的输入坐标与显示单元28的显示画面上的显示坐标相关联。因此可以提供看起来就像用户直接操作显示单元28上显示的画面一样的GUI(图形用户界面)。系统控制单元50能够检测触摸面板70a上的以下操作或触摸面板70a的状态。
-未触摸触摸面板70a的手指或笔新触摸触摸面板70a。即,触摸的开始(下文中称为触及)。
-手指或笔正触摸触摸面板70a的状态(下文中称为触摸持续)。
-手指或笔在触摸触摸面板70a时移开(下文中称为触摸移动)。
-正在触摸触摸面板70a的手指或笔抬起。即,触摸的结束(下文中称为触摸停止)。
-没有任何东西触摸触摸面板70a的状态(下文中称为未触摸)。
当检测到触及时,也同时检测到触摸持续。只要未检测到触摸停止,在触及之后通常继续检测到触摸持续。在检测到触摸持续的状态下也检测到触摸移动。即使在检测到触摸持续时,除非触摸位置移动,否则不会检测到触摸移动。未触摸在已检测到正在触摸的所有手指和笔的触摸停止之后。
这些操作和状态以及手指或笔正在触摸触摸面板70a时的位置坐标通过内部总线通知至系统控制单元50。系统控制单元50基于所通知的信息判断在触摸面板70a上进行了何种操作(触摸操作)。关于触摸移动,还可以基于位置坐标的变化,针对触摸面板70a上的每个垂直分量和水平分量判断在触摸面板70a上移动的手指或笔的移动方向。检测到进行预定距离或更长距离的触摸移动的情况将被视为判断为已进行了滑动操作。涉及在手指触摸触摸面板的状态下快速移动一定距离然后直接抬起手指的操作称为轻拂。换句话说,轻拂是涉及在触摸面板70a上快速追踪就好像利用手指轻拂触摸面板70a一样的操作。当检测到以预定速度或更大速度进行预定距离或更大距离的触摸移动,紧接着检测到触摸停止时,可以判断为进行了轻拂(可以判断为在滑动操作之后存在轻拂)。此外,涉及同时触摸多个位置(例如,两个点)并且将触摸位置移动得更靠近一起的触摸操作称为捏合,而将涉及将多个触摸位置移动得更分离的触摸操作称为分开。分开和捏合统称为捏分操作(或简称为捏分)。采用各种方法的任何触摸面板均可用于触摸面板70a,诸如电阻式触摸面板、电容式触摸面板、表面声波触摸面板、红外触摸面板、电磁感应式触摸面板、图像识别触摸面板和光学传感器触摸面板等。依赖于该方法,与触摸面板的接触被检测为触摸,或者手指或笔接近触摸面板被检测为触摸,并且可以使用任一方法。
语音输入单元85包括未示出的麦克风,并且进行用于获取数字照相机周围的环境声音以及稍后描述的来自用户的语音指令的处理。此外,本发明不仅适用于数字照相机本身,而且还适用于经由有线或无线通信与数字照相机(包括网络照相机)通信并远程控制数字照相机的控制装置。至于远程控制数字照相机的装置,例如,存在诸如智能手机、平板PC和台式PC等的装置。通过基于在控制装置侧进行的操作和在控制装置侧进行的处理来从控制装置侧通知使数字照相机进行各种操作和配置各种设置的命令,可以从远程位置控制数字照相机。此外,可以采用这样的结构:在该结构中,利用数字照相机拍摄的实时取景图像可以经由有线或无线通信被接收,并显示在控制装置侧上。
主要处理的一系列操作
接着,将参照图3A和图3B对根据本实施例的主要处理进行描述。主要处理的操作是从检测向包括EVF 29的取景器的接近到完成语音操作的操作。注意,主要处理中的各个处理通过将存储在非易失性存储器56中的程序提取至系统存储器52并通过系统控制单元50执行而实现。此外,唤醒词是用于对数字照相机100启用利用语音的操作的特定语音指令。
在步骤S301中,系统控制单元50判断是否检测到向包括EVF 29的取景器的接近。例如,基于来自眼睛接近检测单元57的信号,如果判断为检测到物体向包括EVF 29的取景器的接近,则系统控制单元50行进至步骤S302,如果判断为未检测到向取景器的接近,则行进至步骤S303。
在步骤S302中,系统控制单元50判断视线检测块160是否检测到用户的视线。基于来自视线检测块160的信号,如果判断为检测到用户的视线,则系统控制单元50行进至步骤S306,如果判断为未检测到用户的视线,则行进至步骤S303。
在步骤S303中,系统控制单元50将图像信息的显示输出目的地切换至显示单元28。注意,系统控制单元50可以执行用于打开显示单元28的处理(即,控制显示单元28的打开状态),而不是将显示输出目的地切换至显示单元28。如果采用这样的结构,则当在观看不包括EVF 29的光学取景器的同时进行拍摄时,用户将其眼睛远离就可以容易地检查监视器上的信息。
在步骤S304中,系统控制单元50将数字照相机100的状态改变为唤醒词非省略状态,并且将数字照相机的状态信息存储在存储器32中(可以存储在系统存储器52中;这在下文中同样适用)。系统控制单元50基于数字照相机100的状态信息来判断数字照相机100是否处于唤醒词省略状态。如下所述,通常,在输入语音指令是唤醒词的情况下,数字照相机100进入语音指令启用状态,并且进行与此后接收的语音指令相对应的处理。然而,在唤醒词省略状态下,数字照相机100能够在不接收唤醒词的情况下(即,通过省略唤醒词的接收)由于最初接收到的语音指令而执行与语音指令相对应的处理。换句话说,通过提供唤醒词省略状态,可以在进行语音操作时进行快速操作。
此外,唤醒词非省略状态是直到用户输入唤醒词之后才能通过语音指令进行语音操作的状态。唤醒词非省略状态具有在接收到唤醒词之后启用语音操作的语音指令启用状态以及由于未接收到唤醒词而禁用语音操作的语音指令禁用状态的子状态。
在步骤S305中,系统控制单元50将数字照相机100的状态改变为高级语音模式,并将数字照相机100的状态信息存储在存储器32中。高级语音模式是用于处理处理时间长的语音的操作模式,诸如利用支持多种语音指令的语音处理引擎或在高精度云端服务器上进行语音处理等。
在步骤S306(当步骤S302中检测到用户的视线时)中,系统控制单元50将图像信息的显示输出目的地切换成包括EVF 29的取景器上的显示。注意,系统控制单元50可以执行用于关闭监视器画面而不是切换成取景器显示的处理。这具有能够解决当在观看不包括EVF 29的光学取景器的同时进行拍摄时被照明的显示单元28闪耀的问题的效果。
在步骤S307中,系统控制单元50将数字照相机100的状态改变为唤醒词省略状态,并且将数字照相机100的状态信息存储在存储器32中。在步骤S308中,系统控制单元50在包括EVF 29的取景器上显示指示数字照相机处于唤醒词省略状态的画面。例如,图4A示出了指示数字照相机处于唤醒词省略状态的语音可操作画面的示例,并且导引401是指示唤醒词省略状态的导引。注意,在该示例中,导引显示为指示唤醒词省略状态的示例显示的情况示出为示例,但是可以显示图标。
通过这种方式,系统控制单元50进行显示控制,以在取景器上进行指示数字照相机100处于以下状态的显示:即使在未输入唤醒词的情况下,也在输入语音指令时执行与语音指令相对应的处理。
在步骤S309中,系统控制单元50将数字照相机100的状态改变为简单语音模式,并且将数字照相机100的状态信息存储在存储器32中。简单语音模式是用于处理处理时间短的语音的操作模式,诸如利用支持有限种语音指令的语音处理引擎或在与云端相比精度低的装置中进行语音处理等。
在步骤S310中,系统控制单元50降低构成语音输入单元85的麦克风的灵敏度(降低至小于在用户未接近的状态下的灵敏度)。在该操作中,即使由于麦克风的灵敏度降低而通常变得更难拾取语音,但是在该步骤的状态下,用户正观看取景器并因此接近数字照相机100本身。因此,即使麦克风的灵敏度降低,输入用户的语音指令也不可能产生问题。另一方面,可以通过降低麦克风的灵敏度来减少由用户以外的人发出的非预期语音引起的错误操作。通过这种方式,在根据本实施例的主要处理中,根据是否通过针对取景器的接近检测而检测到向数字照相机100接近,而使显示输出目的地在监视器显示和取景器显示之间切换。
在步骤S311中,系统控制单元50判断语音输入单元85是否接收到来自用户的语音指令。如果基于来自语音输入单元85的信号,判断为语音输入单元85接收到来自用户的语音指令,则系统控制单元50行进至步骤S312,并且如果判断为尚未接收到来自用户的语音指令,则行进至步骤S320。
在步骤S312中,系统控制单元50判断数字照相机100是否处于唤醒词省略状态。例如,系统控制单元50基于存储在存储器32中的数字照相机100的状态信息,判断数字照相机100是否处于唤醒词省略状态。如果判断为数字照相机100的状态是唤醒词省略状态,则系统控制单元50行进至步骤S313,如果判断为数字照相机100的状态不是唤醒词省略状态,则行进至步骤S316。
在步骤S313中,系统控制单元50获取语音输入按钮77的按下状态,并将数字照相机100的状态信息存储在存储器32中。在步骤S314中,系统控制单元50基于存储在存储器32中的数字照相机100的状态信息,判断语音输入按钮77是否处于被按下状态。语音输入按钮77使得可以通过语音输入单元85输入语音。如果判断为语音输入按钮77处于被按下状态,则系统控制单元50行进至步骤S315,并且如果语音输入按钮77没有被按下,则行进至步骤S323。
在步骤S315中,系统控制单元50根据用户输入的语音指令执行语音指令处理。语音指令处理包括例如用于根据来自用户的语音指令进行静止图像和运动图像的拍摄的处理。可选地,语音指令处理可包括根据语音指令显示与语音指令相对应的“确认快门速度(Tv值)或光圈值(Av值)的设置值”或与语音指令相对应的“通过帮助/导引或照片进行分页”的画面的处理。
在步骤S316中,系统控制单元50判断是否启用利用语音指令的操作(语音指令启用状态)。例如,如果基于存储在存储器32中的数字照相机100的状态信息判断为数字照相机100的状态是唤醒词非省略状态的语音指令启用状态,则系统控制单元50行进至步骤S313。另一方面,如果数字照相机100的状态不是唤醒词非省略状态的语音指令启用状态,则系统控制单元50行进至步骤S317。
在步骤S317中,系统控制单元50判断所接收到的语音指令是否是预先确定的唤醒词。如果例如由于语音指令与唤醒词一致而判断为所接收到的语音指令是预先确定的唤醒词(即,用于启用语音操作的特定语音指令),则系统控制单元50行进至步骤S318。另一方面,如果判断为所接收到的语音指令不是唤醒词,则系统控制单元50行进至步骤S323。
在步骤S318中,系统控制单元50将数字照相机100设置为在固定时间段内启用利用语音指令的操作的状态(即,语音指令启用状态)。此时,系统控制单元50将该状态存储在存储器32中的数字照相机100的状态信息中,并利用计时器测量语音指令启用状态的持续时间。
在步骤S319中,例如,系统控制单元50在显示单元28上显示图4B所示的语音指令启用状态画面。在图4B所示的示例中,在语音可操作画面上显示指示数字照相机100的状态为语音指令启用状态的导引402。注意,在图4B所示的示例中,显示导引的情况示出为示例,但是可以利用预定图标指示同样的状态。
在步骤S320中,系统控制单元50判断在数字照相机100的状态改变为语音指令启用状态之后是否经过了固定时间段。基于由计时器测量的时间,如果判断为在改变为语音指令启用状态之后经过了固定时间段,则系统控制单元50行进至步骤S321,并且如果判断为在改变为语音指令启用状态之后未经过固定时间段,则行进至步骤S323。
在步骤S321中,系统控制单元50将数字照相机100的状态设置为禁用利用语音指令的操作的状态(语音指令禁用状态),并且将该状态存储在存储器32中的数字照相机100的状态信息中。在步骤S322中,系统控制单元50例如在显示单元28上显示图4C所示的语音指令禁用状态画面。在图4C所示的示例中,在语音可操作画面上显示指示数字照相机100的状态为语音指令禁用状态的导引403。注意,在图4C所示的示例中,示出导引的情况示出为示例,但是可以利用预定图标指示同样的状态。
以这种方式,在将数字照相机100的状态改变为语音指令启用状态之后的固定时间段内接收到语音指令的情况下,系统控制单元50执行与语音指令相对应的处理。另一方面,在将数字照相机100的状态改变为语音指令启用状态之后的固定时间段内未接收到语音指令的情况下,系统控制单元50使数字照相机100的状态再次返回至语音指令禁用状态,并且不处理语音指令,从而避免基于语音指令的错误操作。
在步骤S323中,系统控制单元50判断是否已给出主要处理结束指令(诸如关闭电源开关72等)。如果判断为已经给出了主要处理结束指令,则系统控制单元50结束主要处理,以及如果判断为没有给出主要处理结束指令,则将处理返回至步骤S301。注意,在上述操作期间进行诸如转动模式拨盘等的异常操作的情况下,系统控制单元50可以中断正在进行的主要处理的一系列操作。
如上所述,根据本发明,在接近传感器尚未检测到(用户)向数字照相机接近的情况下,通过传送唤醒词来开始语音操作。因此,由于用户即使在不接近数字照相机100的情况下,也能够在远处进行操作,因而可以实现容易的语音操作。另一方面,在接近传感器检测到向数字照相机接近的情况下,通过省略唤醒词,可以立即开始语音操作,并且可以在进行语音操作时启用快速操作。
其它实施例
本发明的实施例还可以通过如下的方法来实现,即,通过网络或者各种存储介质将执行上述实施例的功能的软件(程序)提供给系统或设备,该系统或设备的计算机或是中央处理单元(CPU)、微处理单元(MPU)读出并执行程序的方法。
尽管已经参照典型实施例描述了本发明,但是应当理解,本发明不限于所公开的典型实施例。所附权利要求书的范围应符合最广义的解释,以涵盖所有此类修改以及等同的结构和功能。

Claims (9)

1.一种摄像设备,其具有用于显示图像的显示单元和取景器单元,所述摄像设备还包括:
语音输入单元,其被配置为输入语音;
视线检测单元,其被配置为检测用户的视线;
接近检测单元,其配置为检测向所述摄像设备的接近;
摄像单元,其被配置为拍摄图像;
显示控制单元,其被配置为在所述视线检测单元没有检测到用户的视线并且所述接近检测单元检测到向所述摄像设备的接近的情况下,在所述显示单元显示与拍摄的图像有关的信息,以及,在所述视线检测单元检测到用户的视线并且所述接近检测单元检测到向所述摄像设备的接近的情况下,在所述取景器单元显示与拍摄的图像有关的信息;以及
控制单元,其被配置为进行控制,以在所述视线检测单元没有检测到用户的视线并且所述接近检测单元检测到向所述摄像设备的接近的情况下,在所述显示单元上显示表示第一语音操作模式的信息和表示语音指令禁用模式的信息,所述第一语音操作模式是在输入用于对所述摄像设备启用利用语音的操作的第一语音指令之后的固定时间段内输入用于操作所述摄像设备的第二语音指令,并执行与所述第二语音指令相对应的处理,所述语音指令禁用模式是在固定时间段内没有输入所述第一语音指令时不处理语音指令,以及,在所述视线检测单元检测到用户的视线并且所述接近检测单元检测到向所述摄像设备的接近的情况下,在所述取景器单元上显示第二语音操作模式的信息,所述第二语音操作模式是当输入所述第二语音指令时,即使未输入所述第一语音指令,所述控制单元也执行与所述第二语音指令相对应的处理。
2.根据权利要求1所述的摄像设备,还包括:
启用单元,其被配置为启用通过所述语音输入单元的语音的输入,
其中,在通过所述启用单元启用语音的输入的情况下,所述控制单元执行与所述第二语音指令相对应的处理。
3.根据权利要求1所述的摄像设备,其中,所述显示控制单元在所述显示单元上进行显示,该显示指示:所述摄像设备处于在未输入所述第一语音指令的情况下,当输入所述第二语音指令时,执行与所述第二语音指令相对应的处理的第一状态。
4.根据权利要求3所述的摄像设备,
其中,所述显示控制单元在所述取景器单元上进行指示所述摄像设备处于非所述第一状态的第二状态的显示。
5.根据权利要求1所述的摄像设备,
其中,所述显示控制单元打开用于显示图像信息的显示单元,
其中,所述显示控制单元根据所述接近检测单元是否检测到向所述语音输入单元的接近而对所述显示单元的打开状态即ON状态进行切换。
6.根据权利要求1所述的摄像设备,
其中,在所述接近检测单元检测到向所述摄像设备的接近的情况下,所述控制单元将所述语音输入单元的灵敏度降低至小于未检测到向所述摄像设备的接近的情况。
7.根据权利要求1所述的摄像设备,
其中,所述控制单元根据所述接近检测单元是否检测到向所述语音输入单元的接近来设置对输入语音的处理时间不同的操作模式。
8.一种摄像设备的控制方法,所述摄像设备具有用于显示图像的显示单元和取景器单元,所述摄像设备还包括:语音输入装置,其被配置为输入语音;视线检测装置,其被配置为检测用户的视线;接近检测装置,其被配置为检测向所述摄像设备的接近;以及摄像装置,其被配置为拍摄图像,所述控制方法包括:
在所述视线检测装置没有检测到用户的视线并且所述接近检测装置检测到向所述摄像设备的接近的情况下,在所述显示单元显示与拍摄的图像有关的信息,以及,在所述视线检测装置检测到用户的视线并且所述接近检测装置检测到向所述摄像设备的接近的情况下,在所述取景器单元显示与拍摄的图像有关的信息;
进行控制,以在所述视线检测装置没有检测到用户的视线并且所述接近检测装置检测到向所述摄像设备的接近的情况下,在所述显示单元上显示表示第一语音操作模式的信息和表示语音指令禁用模式的信息,所述第一语音操作模式是在输入用于对所述摄像设备启用利用语音的操作的第一语音指令之后的固定时间段内输入用于操作所述摄像设备的第二语音指令,并执行与所述第二语音指令相对应的处理,所述语音指令禁用模式是在固定时间段内没有输入所述第一语音指令时不处理语音指令,以及,在所述视线检测装置检测到用户的视线并且所述接近检测装置检测到向所述摄像设备的接近的情况下,在所述取景器单元上显示第二语音操作模式的信息,所述第二语音操作模式是当输入所述第二语音指令时,即使未输入所述第一语音指令,也执行与所述第二语音指令相对应的处理。
9.一种非暂时性计算机可读存储介质,其包括用于进行摄像设备的控制方法的指令,所述摄像设备具有用于显示图像的显示单元和取景器单元,所述摄像设备还包括:语音输入装置,其被配置为输入语音;视线检测装置,其被配置为检测用户的视线;接近检测装置,其被配置为检测向所述摄像设备的接近;以及摄像装置,其被配置为拍摄图像,所述控制方法包括:
在所述视线检测装置没有检测到用户的视线并且所述接近检测装置检测到向所述摄像设备的接近的情况下,在所述显示单元显示与拍摄的图像有关的信息,以及,在所述视线检测装置检测到用户的视线并且所述接近检测装置检测到向所述摄像设备的接近的情况下,在所述取景器单元显示与拍摄的图像有关的信息;
进行控制,以在所述视线检测装置没有检测到用户的视线并且所述接近检测装置检测到向所述摄像设备的接近的情况下,在所述显示单元上显示表示第一语音操作模式的信息和表示语音指令禁用模式的信息,所述第一语音操作模式是在输入用于对所述摄像设备启用利用语音的操作的第一语音指令之后的固定时间段内输入用于操作所述摄像设备的第二语音指令,并执行与所述第二语音指令相对应的处理,所述语音指令禁用模式是在固定时间段内没有输入所述第一语音指令时不处理语音指令,以及,在所述视线检测装置检测到用户的视线并且所述接近检测装置检测到向所述摄像设备的接近的情况下,在所述取景器单元上显示第二语音操作模式的信息,所述第二语音操作模式是当输入所述第二语音指令时,即使未输入所述第一语音指令,也执行与所述第二语音指令相对应的处理。
CN202110136847.2A 2020-02-05 2021-02-01 一种摄像设备、其控制方法以及存储介质 Active CN113301247B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020-018212 2020-02-05
JP2020018212A JP7442331B2 (ja) 2020-02-05 2020-02-05 音声入力装置およびその制御方法ならびにプログラム

Publications (2)

Publication Number Publication Date
CN113301247A CN113301247A (zh) 2021-08-24
CN113301247B true CN113301247B (zh) 2023-12-05

Family

ID=77062131

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110136847.2A Active CN113301247B (zh) 2020-02-05 2021-02-01 一种摄像设备、其控制方法以及存储介质

Country Status (3)

Country Link
US (1) US11600277B2 (zh)
JP (1) JP7442331B2 (zh)
CN (1) CN113301247B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7253988B2 (ja) * 2019-07-03 2023-04-07 キヤノン株式会社 表示制御装置およびその制御方法、表示制御システム、並びにプログラム
JP7482640B2 (ja) * 2020-02-05 2024-05-14 キヤノン株式会社 音声入力装置およびその制御方法ならびにプログラム
JP7442330B2 (ja) 2020-02-05 2024-03-04 キヤノン株式会社 音声入力装置およびその制御方法ならびにプログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105589555A (zh) * 2014-11-12 2016-05-18 联想(新加坡)私人有限公司 视线触发语音识别
CN107643921A (zh) * 2016-07-22 2018-01-30 联想(新加坡)私人有限公司 用于激活语音助手的设备、方法和计算机可读存储介质
CN109410952A (zh) * 2018-10-26 2019-03-01 北京蓦然认知科技有限公司 一种语音唤醒方法、装置及系统
CN109584878A (zh) * 2019-01-14 2019-04-05 广东小天才科技有限公司 一种语音唤醒方法及系统
CN109992237A (zh) * 2018-01-03 2019-07-09 腾讯科技(深圳)有限公司 智能语音设备控制方法、装置、计算机设备和存储介质
CN110428806A (zh) * 2019-06-03 2019-11-08 清华大学 基于麦克风信号的语音交互唤醒电子设备、方法和介质

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2807241B2 (ja) 1988-11-11 1998-10-08 株式会社東芝 音声認識装置
JP2004201104A (ja) 2002-12-19 2004-07-15 Minolta Co Ltd 撮像装置
JP5247384B2 (ja) 2008-11-28 2013-07-24 キヤノン株式会社 撮像装置、情報処理方法、プログラムおよび記憶媒体
US9201511B1 (en) * 2010-04-23 2015-12-01 Cypress Semiconductor Corporation Optical navigation sensor and method
JP5809891B2 (ja) 2011-09-09 2015-11-11 オリンパス株式会社 撮影装置
US9423870B2 (en) * 2012-05-08 2016-08-23 Google Inc. Input determination method
DE102013001219B4 (de) 2013-01-25 2019-08-29 Inodyn Newmedia Gmbh Verfahren und System zur Sprachaktivierung eines Software-Agenten aus einem Standby-Modus
JP6122355B2 (ja) 2013-06-26 2017-04-26 京セラ株式会社 携帯端末装置
US9510094B2 (en) 2014-04-09 2016-11-29 Apple Inc. Noise estimation in a mobile device using an external acoustic microphone signal
JP6440513B2 (ja) 2014-05-13 2018-12-19 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声認識機能を用いた情報提供方法および機器の制御方法
JP6504808B2 (ja) 2014-12-22 2019-04-24 キヤノン株式会社 撮像装置、音声コマンド機能の設定方法、コンピュータプログラム、及び記憶媒体
JP6562790B2 (ja) 2015-09-11 2019-08-21 株式会社Nttドコモ 対話装置および対話プログラム
US20180293221A1 (en) 2017-02-14 2018-10-11 Microsoft Technology Licensing, Llc Speech parsing with intelligent assistant
EP3588491A4 (en) 2017-02-24 2020-07-22 Sony Mobile Communications Inc. INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING PROCESS AND COMPUTER PROGRAM
JP6543676B2 (ja) 2017-11-01 2019-07-10 ソフトバンク株式会社 送信制御装置及びプログラム
US11145315B2 (en) * 2019-10-16 2021-10-12 Motorola Mobility Llc Electronic device with trigger phrase bypass and corresponding systems and methods
JP7442330B2 (ja) 2020-02-05 2024-03-04 キヤノン株式会社 音声入力装置およびその制御方法ならびにプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105589555A (zh) * 2014-11-12 2016-05-18 联想(新加坡)私人有限公司 视线触发语音识别
CN107643921A (zh) * 2016-07-22 2018-01-30 联想(新加坡)私人有限公司 用于激活语音助手的设备、方法和计算机可读存储介质
CN109992237A (zh) * 2018-01-03 2019-07-09 腾讯科技(深圳)有限公司 智能语音设备控制方法、装置、计算机设备和存储介质
CN109410952A (zh) * 2018-10-26 2019-03-01 北京蓦然认知科技有限公司 一种语音唤醒方法、装置及系统
CN109584878A (zh) * 2019-01-14 2019-04-05 广东小天才科技有限公司 一种语音唤醒方法及系统
CN110428806A (zh) * 2019-06-03 2019-11-08 清华大学 基于麦克风信号的语音交互唤醒电子设备、方法和介质

Also Published As

Publication number Publication date
US11600277B2 (en) 2023-03-07
JP2021124976A (ja) 2021-08-30
US20210241766A1 (en) 2021-08-05
JP7442331B2 (ja) 2024-03-04
CN113301247A (zh) 2021-08-24

Similar Documents

Publication Publication Date Title
CN113301247B (zh) 一种摄像设备、其控制方法以及存储介质
JP7321786B2 (ja) 電子機器およびその制御方法
US11394862B2 (en) Voice input apparatus, control method thereof, and storage medium for executing processing corresponding to voice instruction
CN112714247B (zh) 摄像设备和摄像设备的控制方法
JP2020204915A (ja) 電子機器およびその制御方法
JP2024050779A (ja) 電子機器およびその制御方法、プログラム、並びに記憶媒体
CN112702507B (zh) 电子装置、电子装置的控制方法及存储介质
CN113364945A (zh) 电子装置、控制方法和计算机可读介质
JP2022018244A (ja) 電子機器およびその制御方法
US20230018866A1 (en) Electronic device that displays a plurality of display items on a display and method for controlling electronic device
US11735181B2 (en) Voice input apparatus, control method thereof, and storage medium for executing processing corresponding to voice instruction
US11526208B2 (en) Electronic device and method for controlling electronic device
CN112040095B (zh) 电子装置、电子装置的控制方法及存储介质
CN112188080B (zh) 显示控制装置及其控制方法和存储介质
JP7451255B2 (ja) 電子機器及びその制御方法
US20220272277A1 (en) Display control apparatus, control method for controlling the same, and storage medium
JP2024079943A (ja) 電子機器、電子機器の制御方法、プログラム、および記憶媒体
JP2023160103A (ja) 電子機器
JP2023048009A (ja) 撮像装置、制御方法及びプログラム
JP2021012238A (ja) 電子機器およびその制御方法、プログラム、並びに記憶媒体
JP2021018634A (ja) 電子機器およびその制御方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant