CN106030700A - 至少部分地基于空间音频属性来确定操作指令 - Google Patents

至少部分地基于空间音频属性来确定操作指令 Download PDF

Info

Publication number
CN106030700A
CN106030700A CN201580008797.2A CN201580008797A CN106030700A CN 106030700 A CN106030700 A CN 106030700A CN 201580008797 A CN201580008797 A CN 201580008797A CN 106030700 A CN106030700 A CN 106030700A
Authority
CN
China
Prior art keywords
audio
space
operational order
frequency information
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580008797.2A
Other languages
English (en)
Other versions
CN106030700B (zh
Inventor
M·维勒尔莫
A·莱蒂尼米
L·拉克索宁
M·塔米
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Technologies Oy
Original Assignee
Nokia Technologies Oy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Technologies Oy filed Critical Nokia Technologies Oy
Publication of CN106030700A publication Critical patent/CN106030700A/zh
Application granted granted Critical
Publication of CN106030700B publication Critical patent/CN106030700B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics

Abstract

公开了一种方法,其包括:经由装置所包括的多个扩音器接收音频信息;确定与所述装置相关的所述音频信息的至少一个空间音频属性;至少部分地基于所述空间音频属性来确定操作指令;以及根据所述操作指令来实施一个或多个操作。

Description

至少部分地基于空间音频属性来确定操作指令
技术领域
本申请一般地涉及确定操作指令。
背景技术
诸如移动通信装置这样的电子装置正变得越来越功能多样。装置可以实施大量功能,并且用户可以提供输入,所述输入将导致装置基于该输入采取期望的动作或者改变其行为。与装置相关联的用户输入对于用户来说是方便的,这可能是值得期望的。将装置设计成使得装置响应于来自用户的输入而做用户想要它做的事,这可能也是值得期望的。在所述情况下,允许用户以简单和直观的方式调用装置上的操作可能是值得期望的。
发明内容
在权利要求中阐述了本发明的示例的各种方面。
一个或多个实施例可以提供用于实施以下各项的装置、计算机可读介质、非瞬态计算机可读介质、计算机程序产品和方法:经由装置所包括的多个扩音器来接收音频信息;确定与所述装置相关的所述音频信息的至少一个空间音频属性;至少部分地基于所述空间音频属性来确定操作指令;以及根据所述操作指令来实施一个或多个操作。
一个或多个实施例可以提供具有以下各项的装置、计算机可读介质、计算机程序产品和非瞬态计算机可读介质:用于经由装置所包括的多个扩音器来接收音频信息的构件;用于确定与所述装置相关的所述音频信息的至少一个空间音频属性的构件;用于至少部分地基于所述空间音频属性来确定操作指令的构件;以及用于根据所述操作指令来实施一个或多个操作的构件。
一个或多个实施例可以提供包括至少一个处理器和至少一个存储器的装置,所述存储器包括机器可读指令,所述机器可读指令当被执行时导致所述装置实施:经由装置所包括的多个扩音器来接收音频信息;确定与所述装置相关的所述音频信息的至少一个空间音频属性;至少部分地基于所述空间音频属性来确定操作指令;以及根据所述操作指令来实施一个或多个操作。
在至少一个示例实施例中,所述音频信息是语音信息。
在至少一个示例实施例中,所述语音信息是包括语声的音频表示的音频信息。
一个或多个示例实施例进一步实施:确定所述音频信息是语音信息。
在至少一个示例实施例中,经由所述多个扩音器来接收所述音频信息包括:经由第一扩音器接收第一音频信息;以及经由第二扩音器接收第二音频信息,从而使得由所述第一音频信息和所述第二音频信息这二者来指示所述音频信息。
在至少一个示例实施例中,至少部分地基于对所述第一音频信息和所述第二音频信息的比较来确定所述空间音频属性。
在至少一个示例实施例中,所述比较包括:标识所述第一音频信息与所述第二音频信息之间的信号时间差。
在至少一个示例实施例中,所述比较包括:标识所述第一音频信息与所述第二音频信息之间的信号衰减差。
在至少一个示例实施例中,所述空间音频属性是以下中的至少一项:相对于所述装置的音频方向,或者与所述装置的音频距离。
在至少一个示例实施例中,所述音频方向是所述装置与所述音频信息的源之间的音频路径的方向。
在至少一个示例实施例中,所述音频距离是沿所述装置与所述音频信息的源之间的音频路径的距离。
在至少一个示例实施例中,确定所述操作指令包括:确定所述空间音频属性处在空间音频属性操作门限内,其中,至少部分地基于确定所述空间音频属性处在所述空间音频属性操作门限内来确定所述操作指令。
在至少一个示例实施例中,所述空间音频属性操作门限是空间音频属性的预定范围,从而使得处在所述预定范围内的空间音频属性允许确定一个或多个操作指令。
在至少一个示例实施例中,所述空间音频属性操作门限是空间音频属性的预定范围,从而使得超过所述预定范围的空间音频属性阻止确定一个或多个操作指令。
在至少一个示例实施例中,所述音频信息包括语音命令音频信息,确定所述操作指令包括至少部分地基于所述语音命令音频信息来标识语音命令,并且至少部分地基于所述语音命令来确定所述操作指令。
在至少一个示例实施例中,所述语音命令音频信息缺乏指示语音命令提示的信息,并且至少部分地基于确定所述空间音频属性处在所述空间音频属性操作门限内来标识所述语音命令。
一个或多个示例实施例进一步实施:经由所述多个扩音器来接收不同的音频信息;确定与所述装置相关的所述不同的音频信息的至少一个不同的空间音频属性;确定所述空间音频属性超过空间音频属性操作门限;以及至少部分地基于确定所述空间音频属性超过所述空间音频属性操作门限,阻止确定另一操作指令。
在至少一个示例实施例中,所述空间音频属性操作门限是与被定向为朝向所述装置的音频源相对应的方向的预定范围。
在至少一个示例实施例中,所述空间音频属性操作门限是与接近于所述装置的音频源相对应的距离的预定范围。
在至少一个示例实施例中,所述空间音频属性操作门限是以下中的至少一个:方向性音频属性操作门限或者距离音频属性操作门限。
在至少一个示例实施例中,所述操作指令是指导所述装置实施以下内容的指令:与所述指令相关联的特定操作集合。
在至少一个示例实施例中,所述操作指令标识所述操作集合中的至少一个操作。
在至少一个示例实施例中,所述音频信息包括语音命令音频信息,确定所述操作指令包括至少部分地基于所述语音命令音频信息来标识语音命令,并且至少部分地基于所述语音命令来确定所述操作指令。
一个或多个示例实施例进一步实施:经由所述多个扩音器来接收包括其它语音命令音频信息的不同音频信息;确定与所述装置相关的所述不同音频信息的至少一个不同空间音频属性,所述不同空间音频属性与所述空间音频属性不同;至少部分地基于所述其它语音命令音频信息来标识所述语音命令;至少部分地基于所述不同空间音频属性和所述语音命令来确定不同的操作指令;以及根据所述不同的操作指令来实施一个或多个不同的操作。
一个或多个示例实施例进一步实施:导致显示空间音频操作指示符,所述空间音频操作指示符是多个空间音频属性范围与多个操作指令候选项之间的相关性的视觉表示。
在至少一个示例实施例中,所述多个空间音频属性范围包括所述空间音频属性,并且所述多个操作指令候选项包括所述操作指令。
在至少一个示例实施例中,所述视觉表示指示多个方向,从而使得与关联于所述操作指令候选项的相应方向相对应地表示所述多个操作指令候选项。
在至少一个示例实施例中,所述视觉表示指示多个距离,从而使得与关联于所述操作指示候选项的相应距离相对应地表示所述多个操作指示候选项。
在至少一个示例实施例中,所述操作指令指示独立于所述音频信息的处理的操作。
在至少一个示例实施例中,所述操作指令对应于与以下内容相关联的操作:将所述音频信息传输至单独的装置。
在至少一个示例实施例中,所述操作指令对应于与以下内容相关联的操作:阻止将所述音频信息传输至单独的装置。
附图说明
为了更完整地理解本发明的实施例,现在参考下面结合附图进行的描述,其中:
图1是示出了根据示例实施例的装置的框图;
图2A-2B是示出了根据至少一个示例实施例的装置所包括的扩音器的示图;
图3A-3D是示出了根据至少一个示例实施例的指示空间音频属性的环境的示图;
图4A-4C是示出了根据至少一个示例实施例的空间音频属性与操作指令之间的相关性的示图;
图5是示出了根据至少一个示例实施例与至少部分地基于空间音频属性来确定操作指令相关联的活动的流程图;
图6是示出了根据至少一个示例实施例与至少部分地基于空间音频属性来确定操作指令相关联的活动的流程图;
图7是示出了根据至少一个示例实施例与至少部分地基于空间音频属性来确定操作指令相关联的活动的流程图;以及
图8A-8B是示出了根据至少一个示例实施例的空间音频操作指示符的示图。
具体实施方式
通过参考附图中的图1至图8B来理解本发明的实施例及其潜在优点。
现在将在下文中参考附图更详尽地描述一些实施例,在附图中示出了一些而非全部实施例。本发明的各种实施例可以以许多不同的形式被体现,并且不应当理解为限于本文中阐明的实施例;相反,提供这些实施例以使本公开将满足适用的法律要求。相似标号贯穿全文指相似元素。如在本文中使用的,术语“数据”、“内容”、“信息”和相似的术语可以可互换地被用于指代能够根据本发明的实施例被发送、接收和/或存储的数据。因此,对任何所述术语的使用不应当理解为限制本发明的实施例的精神和范围。
附加地,如在本文中使用的,术语‘电路’指代:(a)仅硬件电路实现(例如,采用模拟电路和/或数字电路的实现);(b)电路和包括被存储在一个或多个计算机可读存储器上的软件和/或固件指令的计算机程序产品的组合,它们一起工作以便导致装置实施本文中描述的一个或多个功能;以及(c)诸如微处理器或者微处理器的一部分的电路,其针对操作而需要软件或者固件(即使所述软件或者固件不在物理上出现)。“电路”的该定义适用于在本文中(包括在任何权利要求中)对该术语的所有使用。作为进一步的示例,如在本文中使用的,术语“电路”还包括这样的实现,所述实现包括一个或多个处理器和/或其部分以及随附的软件和/或固件。作为另一示例,如在本文中使用的术语“电路”还例如包括:用于移动电话的基带集成电路或者应用处理器集成电路;或者服务器、蜂窝网络装置、其它网络装置和/或其它计算装置中类似的集成电路。
如在本文中定义的,可以将指代物理介质(例如,易失性或者非易失性存储设备)的“非瞬态计算机可读介质”与指代电磁信号的“瞬态计算机可读介质”进行区别。
图1是示出了根据至少一个示例实施例的装置(诸如电子装置10)的框图。然而应当理解,如图所示和在下文中描述的电子装置仅示出了可以从本发明的实施例获益的电子装置,并且因此,不应当理解为限制本发明的范围。尽管出于示例目的图示了并且将在下文中描述电子装置10,但其它类型的电子装置可以轻松地采用本发明的实施例。电子装置10可以是个人数字助理(PDA)、寻呼机、移动计算机、桌上型计算机、电视机、游戏装置、膝上型计算机、平板型计算机、媒体播放器、照相机、录像机、可穿戴装置、头戴式装置、透视显示装置、移动电话、全球定位系统(GPS)装置、汽车、一体机、电子桌和/或任何其它类型的电子系统。此外,至少一个示例实施例的装置不需要是整个电子装置,而可以是其它示例实施例中的电子装置的一个或多个组件。例如,所述装置可以是集成电路和/或集成电路的集合等。
此外,装置不论它们是否意欲提供移动性都可以轻松采用本发明的实施例。就此而言,即使可以结合移动应用来描述本发明的实施例,也应当理解可以结合在移动通信产业中和在移动通信产业外这二者内的多种其它应用来使用本发明的实施例。例如,所述装置可以是非可携带装置(诸如大屏幕电视机、电子桌、一体机和/或汽车等)的至少一部分。
在至少一个示例实施例中,电子装置10包括处理器11和存储器12。处理器11可以是任何类型的处理器、控制器、嵌入式控制器和/或处理器核等。在至少一个示例实施例中,处理器11利用计算机程序代码来导致装置实施一个或多个动作。存储器12可以包括易失性存储器(诸如包括例如用于临时存储数据的高速缓存区域的易失性随机访问存储器(RAM)和/或其它存储器)和非易失性存储器(其可以是嵌入式的和/或可以是可装卸式的)。非易失性存储器可以包括EEPROM和/或闪存等。存储器12可以存储任意多条信息和数据。所述信息和数据可以被电子装置10用于实现电子装置10的一个或多个功能,诸如本文中描述的功能。在至少一个示例实施例中,存储器12包括计算机程序代码,从而使得存储器和计算机程序代码被配置为与处理器一起工作来导致所述装置实施本文中描述的一个或多个动作。
电子装置10可以进一步包括通信设备15。在至少一个示例实施例中,通信设备15包括与发射机和/或接收机可操作地通信的天线(或者多个天线)和/或有线连接器等。在至少一个示例实施例中,处理器11向发射机提供信号,和/或从接收机接收信号。信号可以包括根据通信接口标准的信令信息、用户语声、所接收的数据和/或用户生成的数据等。通信设备15可以与一个或多个空中接口标准、通信协议、调制类型和接入类型一起操作。作为图示,电子通信设备15可以根据以下各项操作:第二代(2G)无线通信协议IS-136(时分多址(TDMA))、全球移动通信系统(GSM)和IS-95(码分多址(CDMA));诸如通用移动电信系统(UMTS)、CDMA2000、宽带CDMA(WCDMA)和时分同步CDMA(TD-SCDMA)这样的第三代(3G)无线通信协议;和/或第四代(4G)无线通信协议,诸如802.11这样的无线连网协议和/或诸如蓝牙这样的短距离无线协议等。通信设备15可以根据诸如以太网、数字用户线(DSL)和/或异步传输模式(ATM)等这样的有线协议进行操作。
处理器11可以包括诸如电路这样的用于实现音频、视频、通信、导航和/或逻辑功能等以及用于实现例如包括一个或多个在本文中描述的功能的本发明实施例的构件。例如,处理器11可以包括诸如数字信号处理器设备、微处理器设备、各种模数转换器、数模转换器、处理电路和其它支持电路这样的用于实施例如包括一个或多个在本文中描述的功能的各种功能的构件。所述装置可以在这些设备之间根据它们各自的能力来实施电子装置10的控制和信号处理功能。处理器11因此可以包括用于在调制和传输之前对消息和数据进行编码和交织的功能。处理器11可以附加地包括内部语音编码器,并且可以包括内部数据调制解调器。进一步地,处理器11可以包括用于操作一个或多个软件程序的功能,所述一个或多个软件程序可被存储在存储器中,并且特别可以导致处理器11实现例如包括一个或多个在本文中描述的功能的至少一个实施例。例如,处理器11可以操作诸如常规因特网浏览器这样的连接程序。该连接程序可以允许电子装置10例如根据传输控制协议(TCP)、因特网协议(IP)、用户数据报协议(UDP)、因特网消息访问协议(IMAP)、邮局协议(POP)、简单邮件传输协议(SMTP)、无线应用协议(WAP)和/或超文本传输协议(HTTP)等来发送和接收因特网内容,诸如基于位置的内容和/或其它web页面内容。
电子装置10可以包括用于提供输出和/或接收输入的用户接口。电子装置10可以包括输出设备14。输出设备14可以包括诸如振铃器、耳机和/或扬声器等的音频输出设备。输出设备14可以包括诸如振动换能器、可电子变形表面和/或可电子变形结构等的触觉输出设备。输出设备14可以包括诸如显示器和/或灯等的视觉输出设备。在至少一个示例实施例中,所述装置导致显示信息,所述导致显示可以包括在所述装置所包括的显示器上显示信息和/或将信息发送到包括显示器的单独的装置等。电子装置可以包括输入设备13。输入设备13可以包括光传感器、接近性传感器、扩音器、触摸传感器、力传感器、按钮、键板、运动传感器、磁场传感器和/或照相机等。触摸传感器和显示器的特性可以被刻画为触摸显示器。在包括触摸显示器的实施例中,触摸显示器可被配置为从单个接触点和/或多个接触点等接收输入。在这样的实施例中,触摸显示器和/或处理器可以至少部分地基于位置、运动、速度和/或接触区域等来确定输入。在至少一个示例实施例中,所述装置接收对输入的指示。所述装置可以从传感器、驱动器和/或单独的装置等接收指示。指示所述输入的信息可以包括这样的信息,即所述信息传达了指示输入、指示输入的一方面和/或指示输入的出现等的信息。
电子装置10可以包括多种触摸显示器中的任一种触摸显示器,所述多种触摸显示器包括被配置为执行以下各项的那些触摸显示器:实现经由电阻、电容、红外、应变仪、表面波、光学成像、色散信号技术、声学脉冲识别或者其它技术中的任一种技术进行触摸识别;以及然后提供指示与触摸相关联的位置和其它参数的信号。附加地,触摸显示器可被配置为接收具有触摸事件的形式的输入的指示,所述触摸事件可被定义为选择物体(例如,手指、手写笔、钢笔、铅笔或者其它指点设备)与触摸显示器之间的实际物理接触。可选地,触摸事件可被定义为将选择物体带到接近触摸显示器的地方、悬停在被显示的物体上或者在预定义的距离内靠近物体(即使未作出与触摸显示器的物理接触)。如此,触摸输入可以包括任何被触摸显示器检测到的输入,所述输入包括:涉及实际物理接触的触摸事件;以及不涉及物理接触但以别的方式(例如由于选择物体接近触摸显示器)被触摸显示器检测到的触摸事件。触摸显示器能够接收关联于被施加到与触摸输入相关的触摸屏的力量的信息。例如,触摸屏可以在重压触摸输入和轻压触摸输入之间进行区分。在至少一个示例实施例中,显示器可以显示二维信息和/或三维信息等。
在包括键板的实施例中,键板可以包括用于操作电子装置10的数字(例如,0-9)键、符号键(例如,#、*)和/或字母键等。例如,键板可以包括常规的QWERTY键板布置。键板还可以包括各种与功能相关联的软键。附加地或者可选地,电子装置10可以包括诸如操纵杆或其它用户输入接口这样的接口设备。
输入设备13可以包括媒体捕获元件。媒体捕获元件可以是任何用于捕获图像、视频和/或音频以便进行存储、显示或者传输的构件。例如,在至少一个其中媒体捕获元件是照相机模块的示例实施例中,照相机模块可以包括数字照相机,所述数字照相机可以根据所捕获的图像形成数字图像文件。如此,照相机模块可以包括诸如镜头或其它光学组件的硬件和/或对于根据所捕获的图像创建数字图像文件来说必要的软件。可选地,照相机模块可以仅包括用于查看图像的硬件,而电子装置10的存储设备存储具有用于根据所捕获的图像创建数字图像文件的软件形式的用于被处理器11执行的指令。在至少一个示例实施例中,照相机模块可以进一步包括诸如以下的处理元件:在处理图像数据时对处理器11进行辅助的协处理器,以及用于对图像数据进行压缩和/或解压缩的编码器和/或解码器。编码器和/或解码器可以根据例如联合图像专家组(JPEG)标准格式这样的标准格式进行编码和/或解码。
图2A-2B是示出了根据至少一个示例实施例的装置所包括的扩音器的示图。图2A-2B的示例仅是示例,并且不限制权利要求的范围。例如,装置的配置可以变化、装置的尺寸可以变化、扩音器的数量可以变化、扩音器的位置可以变化和/或扩音器的朝向可以变化等。
在某些情况下,对于装置来说包括多个扩音器可能是值得期望的。例如,装置可以经由一个或多个所述扩音器来接收音频信息,以便实施诸如记录音频信息、分析音频信息和/或传送音频信息等的各种动作。在某些情况下,对于扩音器来说被放置在装置上的不同位置处可能是值得期望的。例如,值得期望的可能是:在入射到装置的特定部分的音频信息与入射到装置的不同部分的其它音频信息之间进行区分。这样,存在于装置的周围环境中的音频可由所述装置所包括的不同扩音器有区别地进行感知。例如,装置可以至少部分地基于跨不同扩音器被接收的不同音频信息来确定音频信息。这样,装置可以评估音频信息的各种实例,以便确定特定的音频信号。这样,装置可以至少部分地基于多个扩音器音频信息来确定音频信息。
在至少一个示例实施例中,装置经由所述装置所包括的多个扩音器来接收音频信息。所述多个扩音器可位于装置上的各种位置处。这样,各种扩音器指示了在与单个扩音器相对应的位置处入射到装置的音频信息。
图2A是示出了根据至少一个示例实施例的装置200所包括的扩音器的示图。图2A的示例示出了装置200的前面。可以看出,装置200包括前置扩音器201和202以及底置扩音器203。图2B是示出了根据至少一个示例实施例的装置200所包括的扩音器的示图。图2B的示例示出了装置200的后面。可以看出,装置200包括后置扩音器211和212。
在某些情况下,与彼此相结合地使用所述扩音器中的一个或多个扩音器可能是值得期望的。例如,值得期望的可能是:确定出至少部分地基于经由多个扩音器接收的多个音频信息的音频信息的特定集合。在至少一个示例实施例中,接收音频信息包括:经由第一扩音器接收第一音频信息和经由第二扩音器接收第二音频信息。在这样的示例中,可以由第一音频信息和第二音频信息这二者来指示音频信息的特定集合。例如,可能存在出现在装置200的周围环境中的声音,从而使得扩音器201接收第一音频信息并且扩音器203接收第二音频信息。在这样的示例中,第一音频信息可以包括声音的一种表示,并且第二音频信息可以包括声音的一种不同的表示。在这样的示例中,装置可以至少部分地基于第一音频信息和第二音频信息来确定指示声音的音频信息。这样,所确定的音频信息、第一音频信息和第二音频信息分别指示相同的音频内容,虽然所确定的音频信息、第一音频信息和第二音频信息分别包括的音频内容的表示可能互不相同。
在至少一个示例实施例中,音频信息的内容指的是由音频信息传达的信息。例如,如果音频信息包括语声,则音频信息的内容可以包括指示语声的语音信息。在另一示例中,如果音频信息包括音频提示(诸如打响指、拍手和/或曲调等),则音频信息的内容可以是该音频提示。
在某些情况下,即使与不同扩音器相对应的不同音频信息的内容可以指示相同的内容,但是一个或多个这样的不同音频信息也可以就音频属性而言有所变化。例如,指示音频内容的频谱可以变化,音频内容的衰减可以变化和/或音频内容的接收时间可以变化等。例如,经由第一扩音器接收的第一音频信息所指示的音频内容可以与指示经由第二扩音器接收的音频内容的第二音频信息不同。在这样的示例中,第一音频信息和第二音频信息可以通过频谱、衰减和/或接收时间等而不同。例如,第一音频信息可以是展现了与第二音频信息的时间偏差的音频内容的表示。这样,装置可以至少部分地基于对于在指示了相同音频内容的多个音频信息之间的差别的确定来对音频内容进行评估。
图3A-3D是示出了根据至少一个示例实施例的指示空间音频属性的环境的示图。图3A-3D的示例仅是示例,并且不限制权利要求的范围。例如,装置的朝向可以变化、语音源的数目可以变化和/或语音源的朝向可以变化等。
在某些情况下,确定被装置接收的音频信息的一个或多个空间音频属性可能是值得期望的。例如,在来自具有相对于装置的不同距离和/或相对于装置的不同角度等的音频源的音频信息之间进行区分可能是值得期望的。
在至少一个示例实施例中,装置确定与该装置相关的音频信息的至少一个空间音频属性。经由对指示了从装置上的各种位置处的各种扩音器接收的音频信号的音频信息进行评估,装置可以确定与该装置相关的空间属性。这样,空间属性可以是相对于装置的方向和/或距离等,其指示了装置与音频信号的源之间的空间关系。在至少一个示例实施例中,音频源是导致音频信号出现的物理主体,诸如人、物体和/或音频换能器等。
在至少一个示例实施例中,装置经由对从不同扩音器接收的不同音频信息中的差别进行评估来确定音频信息的空间属性。在至少一个示例实施例中,装置至少部分地基于对不同音频信息进行比较来确定空间音频属性。例如,如果装置从第一扩音器接收第一音频信息,并且从第二扩音器接收第二音频信息,则装置可以至少部分地基于对第一音频信息和第二音频信息进行比较来确定空间音频属性。
在至少一个示例实施例中,空间属性是音频距离和/或音频方向等。在至少一个示例实施例中,音频方向是装置与音频信息的源之间的音频路径的方向。在至少一个示例实施例中,音频距离是沿装置与音频信息的源之间的音频路径的距离。在至少一个示例实施例中,音频路径是音频源与扩音器之间的轮廓勾画(delineation),音频信号沿该轮廓勾画从音频源传播到扩音器。例如,装置可以确定指示了从以下音频源接收的音频信号的音频信息的空间属性:该音频源与该装置相距特定距离和/或处在相对于该装置的特定方向上,等等。在至少一个示例实施例中,空间属性是音频距离和音频方向这二者。例如,装置可以确定指示了从以下音频源接收的音频信号的音频信息的空间属性:该音频源与该装置相距特定距离,并且处在相对于该装置的特定方向上。
在至少一个示例实施例中,所述比较包括标识第一音频信息与第二音频信息之间的信号时间差。在至少一个示例实施例中,信号时间差指的是特定音频内容在第一音频信息和第二音频信息中被表示出的时间上的差别。在至少一个示例实施例中,所述比较包括标识第一音频信息与第二音频信息之间的信号衰减差。在至少一个示例实施例中,信号衰减差指的是特定音频内容在第一音频信息和第二音频信息中被表示出的音频强度上的差别。应当理解,当前存在许多用于确定音频信息的空间属性的方式,诸如多点定位、到达时间差(TDOA)、到达频率差(FDOA)、三角测量、三边测量等。另外,可能存在许多在未来被开发的用于确定音频信息的空间属性的方式。因此,确定空间属性的方式完全不必限制权利要求。
图3A是示出了根据至少一个示例实施例的指示空间音频属性的环境的示图。在图3A的示例中,用户302正在朝向装置301说话。这样,用户302的嘴巴是被装置301接收的音频信息(诸如语音信息)的音频源。可以看出,用户302的嘴巴与装置301的接近度少于10厘米。在图3A的示例中,装置301接收指示了用户302的语音的音频信息,并且确定该音频信息的空间属性。空间属性可以指示用户302与装置301的距离和/或用户302相对于装置301的方向等。例如,装置可以确定用户302正在朝向装置301的前面说话和/或正在接近于装置301说话等。
图3B是示出了根据至少一个示例实施例的指示空间音频属性的环境的示图。在图3B的示例中,用户312正在朝向装置311说话。这样,用户312的嘴巴是被装置311接收的音频信息(诸如语音信息)的音频源。可以看出,用户312的嘴巴与装置311的接近度近似于30厘米。在图3B的示例中,装置311接收指示了用户312的语音的音频信息,并且确定该音频信息的空间属性。空间属性可以指示用户312与装置311的距离和/或用户312相对于装置311的方向等。例如,装置可以确定用户312正在朝向装置311的前面说话和/或正在接近于装置311说话等。可以看出,用户312与装置311之间的距离大于图3A中用户302与装置301之间的距离。在至少一个示例实施例中,装置确定出在由图3B指示的环境下比在由图3A指示的环境下的更大音频距离。
图3C是示出了根据至少一个示例实施例的指示空间音频属性的环境的示图。在图3C的示例中,人322和人323正在向彼此说话,而装置321处在与人322和人323相距大约2米的远处的桌子上。这样,人322的嘴巴是被装置321接收的音频信息(诸如语音信息)的音频源。类似地,人323的嘴巴是被装置321接收的音频信息(诸如语音信息)的音频源。可以看出,人322的嘴巴处在装置321的远端,并且人323的嘴巴处在装置321的远端。在图3C的示例中,装置321接收指示了人322的语音的音频信息,并且确定该音频信息的空间属性。空间属性可以指示人322与装置321相距的距离和/或人322相对于装置321的方向等。例如,装置可以确定人322正在朝向装置321的侧面说话和/或正在装置321的远端说话等。在图3C的示例中,装置321接收指示了人323的语音的音频信息,并且确定该音频信息的空间属性。空间属性可以指示人323与装置321相距的距离和/或人323相对于装置321的方向等。例如,装置可以确定人323正在朝向装置321的侧面说话和/或正在装置321的远端说话等。可以看出,人322与装置321之间的距离大于图3B中人312与装置311之间的距离。可以看出,人323与装置321之间的距离大于图3B中人312与装置311之间的距离。在至少一个示例实施例中,装置确定出在由图3C指示的环境下比在由图3B指示的环境下的更大音频距离。
图3D是示出了根据至少一个示例实施例的指示空间音频属性的环境的示图。如先前描述的,音频信息可以是语音信息。在这样的示例中,装置可以确定语音信息是否是从朝向该装置和/或背离该装置等的音频源接收的。例如,可能值得期望的是能够在从面向装置的用户接收的语音信息与从背对装置的用户接收的语音信息之间进行区分。
在至少一个示例实施例中,装置确定指示以下内容的空间音频属性:音频源是否朝向装置和/或背离装置等。人类语音特性可以基于音频源和扩音器的朝向而发生改变。相比于其中音频源朝向扩音器的环境,如果音频源背离扩音器,则高频可出现衰减。在至少一个示例实施例中,装置存储与特定用户相关联的历史语音信息,并且将历史语音信息与所接收到的语音信息进行比较以便确定空间音频属性。装置可以通过持续地或者偶尔地记录用户语音的短片段来生成与用户相关联的历史语音信息。这些片段的高频与低频比率可被表示在历史语音信息中。这样,当装置从用户接收语音信息时,可以将该语音信息的高频与低频比率与所存储的比率进行比较,以便确定用户是否正在朝向装置或者背离装置说话。
在图3D的示例中,用户332正在手持装置331并且同时向一个人说话。这样,用户332的嘴巴是被装置331接收的音频信息(诸如语音信息)的音频源。可以看出,用户332的嘴巴背离装置331。在图3D的示例中,装置331接收指示了用户332的语音的音频信息,并且确定该音频信息的空间属性。空间属性可以指示用户332的语音背离装置331。在至少一个示例实施例中,装置确定用户的语音在由图3B指示的环境下比在由图3D指示的环境下按照更大音频程度来朝向装置。
图4A-4C是示出了根据至少一个示例实施例的空间音频属性与操作指令之间的相关性的示图。图4A-4C的示例仅是示例,并且不限制权利要求的范围。例如,实现相关性的方式可以变化、空间属性的数目可以变化和/或操作指令的数目可以变化等。
在某些情况下,装置可以至少部分地基于所接收的音频信息来实施一个或多个操作。例如,装置可以标识由音频信号表示的特定音频内容,诸如语音、拍手、打响指、叮当作响的钥匙、嚎叫、跺脚、狂吠的狗、汽车门/轮胎/刹车和/或冰箱门关闭/打开等。例如,装置可以响应于接收到特定音频信息而调用特定的功能集合。这样,音频信息可以充当导致装置实施操作集合的命令。
在至少一个示例实施例中,装置至少基于从多个扩音器接收的音频信息来确定操作指令。在至少一个示例实施例中,操作指令是指导装置实施与指令相关联的特定的操作集合的指令。例如,操作指令可以指示特定的消息、功能调用、数据结构、类别和/或存储位置等以便装置使用。例如,操作指令可以是这样的指令,该指令导致装置分支转移到实施动作的计算机程序指令的特定集合。这样,操作指令导致装置实施操作的特定集合。在至少一个示例实施例中,装置根据操作指令来实施一个或多个操作。在至少一个示例实施例中,根据操作指令实施操作包括实施与操作指令相关联的一个或多个计算机程序指令,诸如操作指令经由存储地址、函数名、数据结构名和/或类别名等来指定的计算机程序指令。例如,操作指令可以是呼叫发起操作指令,该呼叫发起操作指令标识出包括导致装置发起电话呼叫的操作的功能调用。在这样的示例中,装置根据呼叫发起操作指令实施发起电话呼叫的操作。在另一示例中,操作指令可以是标识出与音频处理相关联的功能调用的音频处理操作指令,诸如对语声识别程序和/或记录程序等的调用。
操作指令可以支配装置被配置来实施的一个或多个功能。例如,操作指令可以指示与向单独的装置传输音频信息相关联的一个或多个操作。在这样的示例中,操作指令可以与导致特定音频信息被传送到单独的装置(诸如取消静音功能)、阻止特定音频信息被传送到单独的装置(诸如静音功能)和/或调用语音识别等的操作相对应。在至少一个示例实施例中,操作指令指示独立于音频信息的处理的操作。例如,操作指令可以指示程序启动操作、发送消息操作、状态改变操作和/或打开文件操作等。
在某些情况下,至少部分地基于空间音频属性来支配影响用户可用性的操作可能是值得期望的。在至少一个示例实施例中,装置至少部分地基于空间音频信息来确定用户可用性状态操作指令。用户可用性状态可以是对用户可用性的任何指示,诸如针对社交媒体服务、即时消息收发服务和/或工作跟踪服务等的存在性信息和/或活动性信息等。例如,当装置接收到具有空间属性的语音信息(该空间属性指示该语音信息的说话者朝向装置)时,装置可以确定导致对用户可用性进行指示的用户可用状态操作指令。类似地,当装置接收到具有空间属性(该空间属性指示该语音信息的说话者背离装置)的语音信息时,装置可以确定导致对用户不可用性进行指示的用户不可用状态操作指令。这样,装置可以在用户正在朝向装置说话的情况下确定用户是活跃的,可以在用户正在背离装置说话的情况下确定用户是非活跃的,和/或诸如此类。在另一示例中,当装置接收到具有空间属性(该空间属性指示该语音信息的说话者处在与装置相距的特定距离内)的语音信息时,装置可以确定导致对用户可用性进行指示的用户可用状态操作指令。类似地,当装置接收到指示语音信息的说话者超出与装置相距的特定距离的语音信息时,装置可以确定导致对用户不可用性进行指示的用户不可用状态操作指令。这样,装置可以在用户正在接近于装置说话的情况下确定用户是活跃的,可以在用户正在装置远端说话的情况下确定用户是非活跃的,和/或诸如此类。
在某些情况下,例如在呼叫期间,对于变得更加远离的音频信息来说,被过滤掉并且不被发送到单独的装置可能是值得期望的。这样,可以从传输中过滤掉可能是背景噪声的音频信息。这样,这种遥远的音频信息可以被静音并且不被发送到单独的装置。
在至少一个示例实施例中,装置至少部分地基于空间音频信息来确定静音/取消静音操作指令。例如,当装置接收到具有这样的空间属性的音频信息时,其中,该空间属性指示音频信息的源处在与装置相距的特定距离内,装置可以确定避免将音频信息静音,和/或将音频信息取消静音,等等。类似地,当装置接收到指示音频信息的源超出与装置相距的特定距离的音频信息时,装置可以确定将音频信息静音。
在至少一个示例实施例中,装置至少部分地基于音频方向来确定安全性级别。例如,装置可以至少部分地基于音频方向来禁用对私有信息的显示。例如,用户可以从位于装置的显示器侧的音频方向上说话。在这样的示例中,装置可以至少部分地基于语音方向是来自装置的显示器侧而禁用对私有信息的显示。
在至少一个示例实施例中,装置至少部分地基于音频方向来调整音频渲染设置。例如,装置可以至少部分地基于音频方向来调整音量、环绕声和/或均衡等。例如,装置可以至少部分地基于确定语声从多个音频方向被接收而增大音量和/或启用环绕声等。这样,装置可以将音频渲染设置自动调整为更适合于人群。
在至少一个示例实施例中,装置至少部分地基于空间音频属性来确定操作指令。例如,装置可以至少部分地基于指示特定距离、指示特定方向、被定向为朝向装置和/或被定向为背离装置等的空间音频属性来确定操作指令。例如,装置可以至少部分地基于由图3A的环境所指示的音频空间属性来确定一操作指令,并且至少部分地基于由图3C的环境所指示的空间音频属性来确定不同的操作指令。
应当理解,可以通过诸如查找表和/或比较等各种方式来实施对操作指令的确定。例如,装置可以经由将一个或多个空间音频属性与关联于操作指令的空间音频属性的范围进行相关来确定操作指令。在这样的示例中,当装置接收到具有与空间音频属性的范围相对应的空间音频属性的音频信息时,特定操作指令可以被调用。在至少一个示例实施例中,装置至少部分地基于空间音频属性与关联于操作指令的预定的音频空间属性之间的相关性来确定操作指令。预定的空间音频属性可以指示特定的空间音频属性、空间音频属性的范围,和/或诸如此类。例如,10厘米的音频距离可以与听写操作指令相关联。在另一示例中,少于10厘米的音频距离可以与听写操作指令相关联。
图4A是示出了根据至少一个示例实施例的空间音频属性与操作指令之间的相关性的示图。在图4A的示例中,距离401与操作指令403相对应,距离404与操作指令406相对应,并且距离407与操作指令409相对应。在图4A的示例中,装置当空间音频属性与距离401相对应时确定操作指令403,当空间音频属性与距离404相对应时确定操作指令406,并且当空间音频属性与距离407相对应时确定操作指令409。
图4B是示出了根据至少一个示例实施例的空间音频属性与操作指令之间的相关性的示图。在图4B的示例中,方向411与操作指令413相对应,方向414与操作指令416相对应,并且方向417与操作指令419相对应。在图4B的示例中,装置当空间音频属性与方向411相对应时确定操作指令413,当空间音频属性与方向414相对应时确定操作指令416,并且当空间音频属性与方向417相对应时确定操作指令419。
在某些情况下,装置将操作指令建立在由空间音频属性所指示的多个属性的基础上。例如,装置可以至少部分地基于指示了特定音频距离、特定音频方向和/或被定向为朝向装置等中的至少两项的音频属性来确定操作指令。
图4C是示出了根据至少一个示例实施例的空间音频属性与操作指令之间的相关性的示图。
在图4C的示例中,距离421和方向422与操作指令423相对应,距离421和方向424与操作指令425相对应,并且距离426和方向422与操作指令427相对应。可以看出,在图4C的示例中,装置可以至少部分地基于距离和方向来确定特定操作指令,并且至少部分地基于相同距离和不同方向来确定不同的操作指令。类似地可以看出,在图4C的示例中,装置可以至少部分地基于距离和方向来确定特定操作指令,并且至少部分地基于不同距离和相同方向来确定不同的操作指令。在图4C的示例中,装置当空间音频属性与距离421和方向422相对应时确定操作指令423,当空间音频属性与距离421和方向424相对应时确定操作指令425,并且当空间音频属性与距离426和方向422相对应时确定操作指令427。
如前面描述的,在某些环境中,音频信息可以是语音信息。在至少一个示例实施例中,语音信息是包括语声的音频表示的音频信息。在至少一个示例实施例中,装置确定音频信息是语音信息。例如,装置可以确定音频信息展现出与音频信息是语音信息这一情况相一致的属性。应当理解,存在装置可以确定音频信息是语音信息的许多方式。类似地,可能存在许多在未来被开发的用于装置确定音频信息是语音信息的方式。因此,装置确定音频信息是语音信息的方式完全不必限制权利要求。
在某些环境中,语音信息可以包括语音命令。例如,语音命令可以是具有调用特定接口命令的内容的语声。例如,语音命令可以包括与调用操作指令相关联的词语的口头表达。
在至少一个示例实施例中,装置接收包括语音命令音频信息的语音信息。在至少一个示例实施例中,语音命令音频信息是含有语音命令的表示(诸如说出语音命令)的音频信息。在这样的示例中,装置可以至少部分地基于语音命令信息来标识语音命令,并且可以至少部分地基于语音命令音频信息来确定操作指令。例如,装置可以经由与说话者相关的语音识别和/或与说话者无关的语音识别等来确定语音命令。应当理解,存在装置可以标识语音命令的许多方式。类似地,可能存在许多在未来被开发的用于装置标识语音命令的方式。因此,装置标识语音命令的方式完全不必限制权利要求。在至少一个示例实施例中,装置至少部分地基于语音命令来确定操作指令。例如,装置可以接收表示呼叫应答语音命令的语音信息。在这样的示例中,装置可以至少部分地基于呼叫应答语音命令来确定导致装置对到来的呼叫进行应答的操作指令。
在至少一个示例实施例中,装置至少部分地基于空间音频属性和语音命令来确定操作指令。例如,装置可以接收表示语音命令并且具有特定空间音频质量的语音信息。在这样的示例中,装置可以至少部分地基于空间音频属性和语音命令这二者来确定操作指令。
在某些环境中,至少部分地基于表示语音命令的语音信息的空间音频属性来改变与语音命令相关联的操作指令可能是值得期望的。例如,经由音频方向来控制不同的应用功能可能是值得期望的。例如,就针对图像捕获程序的语音命令而言,装置可以将对自拍捕获功能的控制限于具有近的音频距离的语音信息。在这样的示例中,装置可以允许经由具有较远音频距离的语音信息来调用其它语音命令。
在某些环境中,至少部分地基于空间音频属性来标识将被操作指令支配的程序可能是值得期望的。例如,以下可能是值得期望的:对于操作指令来说,当音频信息被定向为朝向装置时支配活跃的程序,以及对于操作指令来说,当音频信息被定向为背离装置时支配不同的程序。这样,当用户正在朝向装置说话时,语音命令可被传递给活跃的程序。同样地,当用户正在背离装置说话时,语音命令可被传递给不同的程序。
图5是示出了根据至少一个示例实施例与至少部分地基于空间音频属性来确定操作指令相关联的活动的流程图。在至少一个示例实施例中,存在与图5的活动相对应的操作集合。装置(例如图1的电子装置10或者其一部分)可以利用该操作集合。装置可以包括用于实施所述操作的构件(例如包括图1的处理器11)。在示例实施例中,装置(例如图1的电子装置10)通过具有包括计算机代码的存储器(例如图1的存储器12)而进行转换,所述计算机代码被配置为与处理器(例如图1的处理器11)一起工作来导致所述装置实施图5的操作集合。
在方框502处,装置经由装置所包括的多个扩音器接收音频信息。所述接收、音频信息和扩音器可以与相对于图2A-2B所描述的那些类似。
在方框504处,装置确定与装置相关的音频信息的至少一个空间音频属性。所述确定和空间音频属性可以与相对于图3A-3D所描述的那些类似。
在方框506处,装置至少部分地基于空间音频属性来确定操作指令。所述确定和操作指令可以与相对于图4A-4C所描述的那些类似。
在方框508处,装置根据操作指令实施一个或多个操作。所述实施和操作可以与相对于图4A-4C所描述的那些类似。
图6是示出了根据至少一个示例实施例与至少部分地基于空间音频属性来确定操作指令相关联的活动的流程图。在至少一个示例实施例中,存在与图6的活动相对应的操作集合。装置(例如图1的电子装置10或者其一部分)可以利用该操作集合。装置可以包括用于实施所述操作的构件(例如包括图1的处理器11)。在示例实施例中,装置(例如图1的电子装置10)通过具有包括计算机代码的存储器(例如图1的存储器12)而进行转换,所述计算机代码被配置为与处理器(例如图1的处理器11)一起工作来导致所述装置实施图6的操作集合。
在某些环境中,确定空间音频信息是否处在特定范围内可能是值得期望的。例如,如果空间音频属性与特定范围不同,则至少部分地基于音频信息来阻止确定操作指令可能是值得期望的。例如,特定范围可以限制装置在其中确定操作指令的环境。
在至少一个示例实施例中,确定操作指令包括确定空间音频属性处在空间音频属性操作门限内。在这样的示例中,对操作指令的确定可以至少部分地基于确定空间音频属性处在空间音频属性操作门限内。在至少一个示例实施例中,空间音频属性操作门限是空间音频属性的预定范围,从而使得处在该预定范围内的空间音频属性允许确定一个或多个操作指令。这样,空间音频属性操作门限可以是空间音频属性的预定范围,从而使得超出该预定范围的空间音频属性阻止确定一个或多个操作指令。例如,预定范围可以是音频距离的范围,在该音频距离的范围内,装置将确定操作指令,而超出该音频距离的范围,装置则阻止确定操作指令。
在至少一个示例实施例中,空间音频属性操作门限是方向性音频属性操作门限。在至少一个示例实施例中,所述方向性音频属性操作门限是预定方向范围。这样的方向范围可以与以下情况相对应:音频源被定向为朝向装置、音频源被定向为背离装置和/或音频源处在相对于装置的特定方向范围内等。在这样的示例中,与音频源被定向为背离装置这一情况相对应的音频方向可以导致阻止确定一个或多个操作指令。
在至少一个示例实施例中,空间音频属性操作门限是距离音频属性操作门限。在至少一个示例实施例中,距离音频属性操作门限是预定距离范围。这样的距离范围可以与音频源接近装置这一情况相对应。在至少一个示例实施例中,接近装置可以是在5厘米内、10厘米内、100厘米内和/或1米内等。在至少一个示例实施例中,如果音频距离超出指示接近性的预定距离范围,则音频距离可被看作在装置的远端。在这样的示例中,与音频源在装置的远端这一情况相对应的音频距离可以导致阻止确定一个或多个操作指令。例如,当装置通知用户到来的呼叫时,用户可以通过接近于设备而说出“hello”来调用用于应答到来的电话呼叫的操作指令。在这样的示例中,装置可以至少部分地基于用户接近于装置来将“hello”标识为语音命令。在另一示例中,装置可以确定如图3A的示例中所指示的空间音频属性处在针对听写操作指令的空间音频属性操作门限内。在这样的示例中,当用户超出由空间音频属性操作门限标识的预定距离范围时,装置可以避免实施听写程序的操作。
在某些环境中,对于装置来说,在说出语音命令之前利用语音命令提示可能是值得期望的。在至少一个示例实施例中,语音命令提示是将随后的语音信息标识为语音命令的语音信息。例如,装置可以经由语音命令提示来区分非命令音频信息,从而使得装置标识出在装置识别了音频信息包括语音命令提示之后的语音命令。例如,语音命令提示可以是“计算机”,从而使得说出“计算机、发送消息”允许装置将跟随在语音命令提示“计算机”之后的说出“发送消息”标识为语音命令说出。
在某些环境中,保留用户的这样的能力可能是值得期望的,所述能力用于向装置指示语音信息意欲是语音命令。这样,空间音频属性可以指示用户意欲说出的将是语音命令。例如,用户可以当说出语音命令时如图3A-3B中所指示的那样握持装置。在这样的示例中,装置可以利用空间音频属性操作门限来确定何时标识语音命令、基于语音命令来确定操作指令,和/或诸如此类。
在至少一个示例实施例中,音频信息包括语音命令音频信息。在这样的示例中,装置可以当确定空间音频属性处在空间音频属性操作门限内时断定对语音命令的标识。在这样的示例中,用户可以避免被强迫说出语音命令提示。在这样的示例中,语音命令音频信息可以缺乏指示语音命令提示的信息。
例如,对于用户来说,能够在不必单独发起语声识别的情况下轻松控制程序的特征可能是值得期望的。在这样的示例中,装置可以识别何时用户紧密接近设备并且说话。在此情况下,语音信息可以用于控制程序功能。
在某些环境中,当装置确定空间语音属性处在空间语音属性操作门限内时,装置可以导致激励以下各项:对语音输入可用性的指示,诸如在执行命令之前的音频“哔哔声”、对命令被识别的视觉指示,和/或诸如此类。
在某些环境中,装置基于空间音频属性确定操作指令的方式至少部分地基于将受到操作参数影响的程序的一个或多个方面。例如,图像捕获程序可以被自动对焦到特定深度。在这样的示例中,装置可以避免标识这样的语音信息,所述语音信息关联于指示与该特定深度不同的音频距离的空间音频信息。在这样的示例中,处在该特定深度处的人能够向装置提供语音命令。
在方框602处,与关于图5的方框502所描述的类似,装置经由装置所包括的多个扩音器接收音频信息。在方框604处,与关于图5的方框504所描述的类似,装置确定与装置相关的音频信息的至少一个空间音频属性。
在方框606处,装置确定空间音频属性是否处在空间音频属性操作门限内。如果装置确定空间音频属性处在空间音频属性操作门限内,则流程前进到方框608。如果装置确定空间音频属性没有处在空间音频属性操作门限内,则流程前进到方框612。
在方框608处,与关于图5的方框506所描述的类似,装置至少部分地基于空间音频属性来确定操作指令。这样,对操作指令的确定可以至少部分地基于确定空间音频属性处在空间音频属性操作门限内。
在方框610处,如关于图5的方框508所描述的类似,装置根据操作指令来实施一个或多个操作。这样,根据操作指令来实施一个或多个操作可以至少部分地基于确定空间音频属性处在空间音频属性操作门限内。
在方框612处,装置至少部分地基于确定空间音频属性超出空间音频属性操作门限来阻止确定另一操作指令。这样,阻止确定另一操作指令可以至少部分地基于确定空间音频属性超出空间音频属性操作门限。
图7是示出了根据至少一个示例实施例与至少部分地基于空间音频属性来确定操作指令相关联的活动的流程图。在至少一个示例实施例中,存在与图7的活动相对应的操作集合。装置(例如图1的电子装置10或者其一部分)可以利用该操作集合。装置可以包括用于实施所述操作的构件(例如包括图1的处理器11)。在示例实施例中,装置(例如图1的电子装置10)通过具有包括计算机代码的存储器(例如图1的存储器12)而进行转换,所述计算机代码被配置为与处理器(例如图1的处理器11)一起工作来导致所述装置实施图7的操作集合。。
如之前描述的,将操作指令建立在空间音频属性和语音命令这二者的基础上可能是值得期望的。
在方框702处,装置经由装置所包括的多个扩音器接收包括语音命令音频信息的音频信息。所述接收、音频信息、语音命令信息和扩音器可以与关于图2A-2B和图4A-4C所描述的类似。
在方框704处,与关于图5的方框504所描述的类似,装置确定与装置相关的音频信息的至少一个空间音频属性。
在方框706处,装置至少部分地基于语音命令音频信息来标识语音命令。所述标识可以与关于图4A-4C所描述的类似。
在方框708处,装置至少部分地基于空间音频属性和语音命令来确定操作指令。所述确定和操作指令可以与关于图4A-4C所描述的类似。
在方框710处,与关于图5的方框508所描述的类似,装置根据操作指令来实施一个或多个操作。
这样,装置可以至少部分地基于不同的空间音频属性来确定不同的操作指令。可以在语音命令是相同的这样的环境中确定关于操作指令的所述不同。例如,装置可以经由装置所包括的多个扩音器接收音频信息;确定与装置相关的音频信息的至少一个空间音频属性;至少部分地基于空间音频属性来确定操作指令;以及根据操作指令来实施一个或多个操作。在这样的示例中,装置可以经由多个扩音器接收不同的音频信息(包括其它语音命令音频信息);确定与装置相关的不同音频信息的至少一个不同的空间音频属性,所述不同的空间音频属性与所述空间音频属性不同;至少部分地基于其它语音命令音频信息来标识语音命令;至少部分地基于所述不同的空间音频属性和语音命令来确定不同的操作指令;以及根据不同的操作指令来实施一个或多个不同的操作。
图8A-8B是示出了根据至少一个示例实施例的空间音频操作指示符的示图。图8A-8B的示例仅是示例,并且不限制权利要求的范围。例如,装置的配置可以发生变化、装置的尺寸可以发生变化、扩音器的数目可以发生变化、扩音器的位置可以发生变化和/或扩音器的朝向可以发生变化等。
在某些环境中,对于用户来说,能够看到可从特定方向或者特定距离来控制哪个程序可能是值得期望的。在这样的示例中,对于装置来说,导致显示空间音频操作指示符可能是值得期望的。在至少一个示例实施例中,空间音频操作指示符是多个空间音频属性范围与多个操作指令候选项之间的相关性的视觉表示。例如,空间音频操作指示符可以在视觉上将显示器的区域指示为是与特定操作指令相关联的。在这样的示例中,操作指令可被指示为操作指令候选项。在至少一个示例实施例中,操作指令候选项是对可能的操作指令的视觉指示,可以至少部分地基于与操作指示符相对应的空间音频属性来确定所述可能的操作指令。
在至少一个示例实施例中,视觉表示指示了多个方向。在这样的示例中,多个操作指令候选项可以与各自的方向相对应地被表示。这样,与操作指令候选项相关联的方向可以对应于与由操作指令候选项指示的操作指令相关联的音频方向。
在至少一个示例实施例中,视觉表示指示多个距离。在这样的示例中,多个操作指令候选项与各自的距离相对应地被表示。这样,与操作指令候选项相关联的距离可以对应于与由操作指令候选项指示的操作指令相关联的音频距离。
图8A是示出了根据至少一个示例实施例的空间音频操作指示符的示图。在图8A的示例中,空间音频操作指示符801指示操作指令候选项802、803、804和805。可以看出,操作指令候选项802与一个或多个照相机程序操作指令相对应,操作指令候选项803与一个或多个浏览器程序操作指令相对应,操作指令候选项804与一个或多个音乐程序操作指令相对应,并且操作指令候选项805与一个或多个听写程序操作指令相对应。可以看出,相对于装置的顶部对操作指令候选项802的安排指示音频方向810与照相机程序操作指令相对应,相对于装置的左边对操作指令候选项803的安排指示音频方向811与浏览器程序操作指令相对应,相对于装置的底部对操作指令候选项804的安排指示音频方向812与音乐程序操作指令相对应,并且相对于装置的右边对操作指令候选项805的安排指示音频方向813与听写程序操作指令相对应。
图8B是示出了根据至少一个示例实施例的空间音频操作指示符的示图。在图8B的示例中,空间音频操作指示符821指示操作指令候选项822、823和824。可以看出,操作指令候选项822与一个或多个电话程序操作指令相对应,操作指令候选项823与一个或多个照相机程序操作指令相对应,并且操作指令候选项824与照相机程序捕获操作指令相对应。可以看出,相对于装置的底部对操作指令候选项822的安排指示音频方向831与一个或多个电话程序操作指令相对应,并且相对于装置的上部对操作指令候选项823的安排指示音频方向832和833可以与一个或多个照相机程序操作指令相对应。这样,装置可以指示与操作候选项相关联的接近性。在图8B的示例中,可以看出,操作指示符821的底部标识出可以从靠近装置的地方调用的操作指令候选项。在图8B的示例中,音频方向831指示了靠近装置的语音方向。这样,操作指令候选项822可以经由音频方向831被调用。类似地,可以看出,操作指示符821的顶部标识出可以从远离装置的地方调用的操作指令候选项。在图8B的示例中,音频方向832和音频方向833指示了远离装置的语音方向。这样,操作指令候选项823可以经由音频方向832和/或音频方向833被调用。
可以看出,操作指令候选项824指示了沿操作指令候选项的边缘的特定方向。这样,操作指令候选项824与音频方向832之间的对应性指示了音频方向832与照相机程序捕获操作指令相对应。类似地,操作指令候选项823与音频方向832之间缺乏对应性指示了音频方向833没有与照相机程序捕获操作指令相对应。这样,空间音频操作指示符821指示:根据音频方向833阻止了照相机程序捕获操作指令。然而,可以根据音频方向833允许至少一个其它照相机程序操作指令。
可以用软件、硬件、应用逻辑或者软件、硬件和应用逻辑的组合实现本发明的实施例。所述软件、应用逻辑和/或硬件可以驻留在所述装置、单独的设备或者多个单独的设备上。如果期望的话,所述软件、应用逻辑和/或硬件的部分可以驻留在所述装置上,所述软件、应用逻辑和/或硬件的部分可以驻留在单独的设备上,并且所述软件、应用逻辑和/或硬件的部分可以驻留在多个单独的设备上。在示例实施例中,在各种常规计算机可读介质中的任一种计算机可读介质上维护所述应用逻辑、软件或者指令集。
如果期望的话,可以按照不同的次序和/或与彼此并发地来实施本文中讨论的不同功能。例如,可以在图7的方框706之后实施图7的方框704。此外,如果期望的话,上面描述的功能中的一个或多个功能可以是可选的,或者可以被合并。例如,图5的方框502可以是可选的,和/或可以将其与图5的方框504合并。
尽管在独立权利要求中阐述了本发明的各种方面,但是本发明的其它方面包括来自所描述的实施例和/或具有独立权利要求的特征的从属权利要求的特征的其它组合,而不仅是在权利要求中明确阐述的组合。
在本文中还应当指出,尽管以上内容描述了本发明的示例实施例,但是这些描述不应当在限制性的意义上被看待。相反,存在可以在不脱离如在所附权利要求中定义的本发明范围的情况下作出的改变和修改。

Claims (15)

1.一种方法,其包括:
经由装置所包括的多个扩音器接收音频信息;
确定与所述装置相关的所述音频信息的至少一个空间音频属性;
至少部分地基于所述空间音频属性来确定操作指令;以及
根据所述操作指令来实施一个或多个操作。
2.根据权利要求1所述的方法,其中,所述空间音频属性是以下中的至少一项:相对于所述装置的音频方向,或者与所述装置的音频距离。
3.根据权利要求2所述的方法,其中,所述音频方向是所述装置与所述音频信息的源之间的音频路径的方向。
4.根据权利要求2-3中任一项所述的方法,其中,所述音频距离是沿所述装置与所述音频信息的源之间的音频路径的距离。
5.根据权利要求1-4中任一项所述的方法,其中,确定所述操作指令包括:确定所述空间音频属性处在空间音频属性操作门限内,其中,至少部分地基于确定所述空间音频属性处在所述空间音频属性操作门限内来确定所述操作指令。
6.根据权利要求5所述的方法,其进一步包括:
经由所述多个扩音器接收不同的音频信息;
确定与所述装置相关的所述不同的音频信息的至少一个不同的空间音频属性;
确定所述空间音频属性超出空间音频属性操作门限;以及
至少部分地基于确定所述空间音频属性超出所述空间音频属性操作门限来阻止确定另一操作指令。
7.根据权利要求1-6中任一项所述的方法,其中,所述音频信息包括语音命令音频信息,确定所述操作指令包括至少部分地基于所述语音命令音频信息来标识语音命令,并且至少部分地基于所述语音命令来确定所述操作指令。
8.根据权利要求7所述的方法,其进一步包括:
经由所述多个扩音器接收包括其它语音命令音频信息的不同的音频信息;
确定与所述装置相关的所述不同的音频信息的至少一个不同的空间音频属性,所述不同的空间音频属性与所述空间音频属性不同;
至少部分地基于所述其它语音命令音频信息来标识所述语音命令;
至少部分地基于所述不同的空间音频属性和所述语音命令来确定不同的操作指令;以及
根据所述不同的操作指令来实施一个或多个不同的操作。
9.根据权利要求7-8中任一项所述的方法,其中,所述空间音频属性操作门限是空间音频属性的预定范围,从而使得处在所述预定范围内的空间音频属性允许确定一个或多个操作指令。
10.根据权利要求7-9中任一项所述的方法,其中,所述空间音频属性操作门限是空间音频属性的预定范围,从而使得超出所述预定范围的空间音频属性阻止确定一个或多个操作指令。
11.根据权利要求7-10中任一项所述的方法,其中,所述音频信息包括语音命令音频信息,确定所述操作指令包括至少部分地基于所述语音命令音频信息来标识语音命令,并且至少部分地基于所述语音命令来确定所述操作指令。
12.根据权利要求1-11中任一项所述的方法,其进一步包括导致显示空间音频操作指示符,所述空间音频操作指示符是多个空间音频属性范围与多个操作指令候选项之间的相关性的视觉表示。
13.一种装置,其包括用于实施根据前述权利要求中任一项所述的方法的构件。
14.根据权利要求13所述的装置,其中,用于实施所述方法的所述构件包括至少一个处理器和至少一个存储器,所述存储器包括机器可读指令,所述机器可读指令当被执行时导致所述装置实施根据权利要求1-12中任一项所述的方法。
15.至少一个包括指令的计算机可读介质,所述指令当被执行时实施根据权利要求1-12中任一项所述的方法。
CN201580008797.2A 2014-02-19 2015-02-12 至少部分地基于空间音频属性来确定操作指令 Active CN106030700B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14155674.6A EP2911149B1 (en) 2014-02-19 2014-02-19 Determination of an operational directive based at least in part on a spatial audio property
EP14155674.6 2014-02-19
PCT/FI2015/050086 WO2015124831A1 (en) 2014-02-19 2015-02-12 Determination of an operational directive based at least in part on a spatial audio property

Publications (2)

Publication Number Publication Date
CN106030700A true CN106030700A (zh) 2016-10-12
CN106030700B CN106030700B (zh) 2019-12-06

Family

ID=50151139

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580008797.2A Active CN106030700B (zh) 2014-02-19 2015-02-12 至少部分地基于空间音频属性来确定操作指令

Country Status (5)

Country Link
US (1) US10152967B2 (zh)
EP (1) EP2911149B1 (zh)
JP (1) JP6514225B2 (zh)
CN (1) CN106030700B (zh)
WO (1) WO2015124831A1 (zh)

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110874204A (zh) * 2017-05-16 2020-03-10 苹果公司 用于家庭媒体控制的方法和界面
US10904029B2 (en) 2019-05-31 2021-01-26 Apple Inc. User interfaces for managing controllable external devices
US10928980B2 (en) 2017-05-12 2021-02-23 Apple Inc. User interfaces for playing and managing audio items
US10992795B2 (en) 2017-05-16 2021-04-27 Apple Inc. Methods and interfaces for home media control
US10996917B2 (en) 2019-05-31 2021-05-04 Apple Inc. User interfaces for audio media control
US11037150B2 (en) 2016-06-12 2021-06-15 Apple Inc. User interfaces for transactions
US11080004B2 (en) 2019-05-31 2021-08-03 Apple Inc. Methods and user interfaces for sharing audio
US11079913B1 (en) 2020-05-11 2021-08-03 Apple Inc. User interface for status indicators
US11126704B2 (en) 2014-08-15 2021-09-21 Apple Inc. Authenticated device used to unlock another device
CN113450823A (zh) * 2020-03-24 2021-09-28 海信视像科技股份有限公司 基于音频的场景识别方法、装置、设备及存储介质
US11157143B2 (en) 2014-09-02 2021-10-26 Apple Inc. Music user interface
US11200309B2 (en) 2011-09-29 2021-12-14 Apple Inc. Authentication with secondary approver
US11206309B2 (en) 2016-05-19 2021-12-21 Apple Inc. User interface for remote authorization
US11237794B2 (en) 2016-02-18 2022-02-01 Sony Corporation Information processing device and information processing method
US11283916B2 (en) 2017-05-16 2022-03-22 Apple Inc. Methods and interfaces for configuring a device in accordance with an audio tone signal
US11281711B2 (en) 2011-08-18 2022-03-22 Apple Inc. Management of local and remote media items
US11316966B2 (en) 2017-05-16 2022-04-26 Apple Inc. Methods and interfaces for detecting a proximity between devices and initiating playback of media
US11392291B2 (en) 2020-09-25 2022-07-19 Apple Inc. Methods and interfaces for media control with dynamic feedback
US11431836B2 (en) 2017-05-02 2022-08-30 Apple Inc. Methods and interfaces for initiating media playback
US11539831B2 (en) 2013-03-15 2022-12-27 Apple Inc. Providing remote interactions with host device using a wireless device
US11567648B2 (en) 2009-03-16 2023-01-31 Apple Inc. Device, method, and graphical user interface for moving a current position in content at a variable scrubbing rate
US11620103B2 (en) 2019-05-31 2023-04-04 Apple Inc. User interfaces for audio media control
US11683408B2 (en) 2017-05-16 2023-06-20 Apple Inc. Methods and interfaces for home media control
US11847378B2 (en) 2021-06-06 2023-12-19 Apple Inc. User interfaces for audio routing
US11907013B2 (en) 2014-05-30 2024-02-20 Apple Inc. Continuity of applications across devices

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2911149B1 (en) * 2014-02-19 2019-04-17 Nokia Technologies OY Determination of an operational directive based at least in part on a spatial audio property
US10262655B2 (en) * 2014-11-03 2019-04-16 Microsoft Technology Licensing, Llc Augmentation of key phrase user recognition
US9911416B2 (en) 2015-03-27 2018-03-06 Qualcomm Incorporated Controlling electronic device based on direction of speech
CN104902070A (zh) * 2015-04-13 2015-09-09 青岛海信移动通信技术股份有限公司 一种移动终端语音控制的方法及移动终端
US10733989B2 (en) * 2016-11-30 2020-08-04 Dsp Group Ltd. Proximity based voice activation
US11114115B2 (en) * 2017-02-15 2021-09-07 Hewlett-Packard Deveopment Company, L.P. Microphone operations based on voice characteristics
JP6298558B1 (ja) * 2017-05-11 2018-03-20 株式会社コロプラ 仮想空間を提供するための方法、および当該方法をコンピュータに実行させるためのプログラム、および当該プログラムを実行するための情報処理装置
EP3952317A1 (en) * 2017-05-16 2022-02-09 Apple Inc. Methods and interfaces for home media control
US10403288B2 (en) 2017-10-17 2019-09-03 Google Llc Speaker diarization
JP2021139920A (ja) * 2018-05-31 2021-09-16 ソニーグループ株式会社 音声処理装置および音声処理方法
US11741951B2 (en) * 2019-02-22 2023-08-29 Lenovo (Singapore) Pte. Ltd. Context enabled voice commands
CN111354360A (zh) * 2020-03-17 2020-06-30 北京百度网讯科技有限公司 语音交互处理方法、装置和电子设备
DK202100097U3 (da) * 2021-10-23 2023-01-26 Sens Vue Aps Elektronisk apparat, der omfatter et nærfelt stemmekontrol til detektions-, diagnose- og behandlingsudstyr

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2394589A (en) * 2002-10-25 2004-04-28 Motorola Inc Speech recognition device
JP2009020423A (ja) * 2007-07-13 2009-01-29 Fujitsu Ten Ltd 音声認識装置および音声認識方法
CN101796853A (zh) * 2007-09-04 2010-08-04 雅马哈株式会社 声音拾取设备
JP2010217754A (ja) * 2009-03-18 2010-09-30 Toshiba Corp 音声入力装置、音声認識システム及び音声認識方法
CN103024629A (zh) * 2011-09-30 2013-04-03 斯凯普公司 处理信号
CN103077714A (zh) * 2013-01-29 2013-05-01 华为终端有限公司 信息的识别方法和装置
CN103201790A (zh) * 2010-11-22 2013-07-10 Lg电子株式会社 多媒体设备中使用语音和姿势的控制方法及其多媒体设备
CN103208283A (zh) * 2012-01-11 2013-07-17 三星电子株式会社 使用语音识别执行用户功能的方法及装置

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI114422B (fi) * 1997-09-04 2004-10-15 Nokia Corp Lähteen puheaktiviteetin tunnistus
JP2002091491A (ja) * 2000-09-20 2002-03-27 Sanyo Electric Co Ltd 複数機器の音声制御システム
GB0030918D0 (en) * 2000-12-19 2001-01-31 Hewlett Packard Co Activation of voice-controlled apparatus
DE10133126A1 (de) * 2001-07-07 2003-01-16 Philips Corp Intellectual Pty Richtungssensitives Audioaufnahmesystem mit Anzeige von Aufnahmegebiet und/oder Störquelle
JP3715584B2 (ja) * 2002-03-28 2005-11-09 富士通株式会社 機器制御装置および機器制御方法
US7803050B2 (en) * 2002-07-27 2010-09-28 Sony Computer Entertainment Inc. Tracking device with sound emitter for use in obtaining information for controlling game program execution
JP3827317B2 (ja) * 2004-06-03 2006-09-27 任天堂株式会社 コマンド処理装置
US7747446B2 (en) * 2006-12-12 2010-06-29 Nuance Communications, Inc. Voice recognition interactive system with a confirmation capability
US9203533B2 (en) * 2008-07-24 2015-12-01 Line 6, Inc. System and method for real-time wireless transmission of digital audio at multiple radio frequencies
JP2010197727A (ja) * 2009-02-25 2010-09-09 Nec Corp 音声認識装置、ロボット、音声認識方法、プログラム及び記録媒体
JP5402089B2 (ja) 2009-03-02 2014-01-29 富士通株式会社 音響信号変換装置、方法、及びプログラム
US8744065B2 (en) * 2010-09-22 2014-06-03 Avaya Inc. Method and system for monitoring contact center transactions
US20120259638A1 (en) * 2011-04-08 2012-10-11 Sony Computer Entertainment Inc. Apparatus and method for determining relevance of input speech
JP5333559B2 (ja) * 2011-10-07 2013-11-06 株式会社デンソー 車両用装置
US9285452B2 (en) 2011-11-17 2016-03-15 Nokia Technologies Oy Spatial visual effect creation and display such as for a screensaver
EP2786243B1 (en) 2011-11-30 2021-05-19 Nokia Technologies Oy Apparatus and method for audio reactive ui information and display
WO2013079782A1 (en) 2011-11-30 2013-06-06 Nokia Corporation An audio driver user interface
EP2812785B1 (en) * 2012-02-07 2020-11-25 Nokia Technologies Oy Visual spatial audio
US20140309872A1 (en) * 2013-04-15 2014-10-16 Flextronics Ap, Llc Customization of vehicle user interfaces based on user intelligence
KR101946364B1 (ko) * 2012-05-01 2019-02-11 엘지전자 주식회사 적어도 하나의 마이크 센서를 갖는 모바일 디바이스 및 그 제어방법
US20150186109A1 (en) 2012-08-10 2015-07-02 Nokia Corporation Spatial audio user interface apparatus
US9251787B1 (en) * 2012-09-26 2016-02-02 Amazon Technologies, Inc. Altering audio to improve automatic speech recognition
EP2911149B1 (en) * 2014-02-19 2019-04-17 Nokia Technologies OY Determination of an operational directive based at least in part on a spatial audio property
US9338761B2 (en) * 2014-02-26 2016-05-10 Empire Technology Development Llc Presence-based device mode modification
US9431021B1 (en) * 2014-03-27 2016-08-30 Amazon Technologies, Inc. Device grouping for audio based interactivity
US9769552B2 (en) * 2014-08-19 2017-09-19 Apple Inc. Method and apparatus for estimating talker distance
US9929817B2 (en) * 2014-11-19 2018-03-27 Oath Inc. System and method for 3D tracking for ad-hoc cross-device interaction
US9903938B2 (en) * 2015-02-03 2018-02-27 Nokia Technologies Oy Radio and audio localization
US9911416B2 (en) * 2015-03-27 2018-03-06 Qualcomm Incorporated Controlling electronic device based on direction of speech

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2394589A (en) * 2002-10-25 2004-04-28 Motorola Inc Speech recognition device
JP2009020423A (ja) * 2007-07-13 2009-01-29 Fujitsu Ten Ltd 音声認識装置および音声認識方法
CN101796853A (zh) * 2007-09-04 2010-08-04 雅马哈株式会社 声音拾取设备
JP2010217754A (ja) * 2009-03-18 2010-09-30 Toshiba Corp 音声入力装置、音声認識システム及び音声認識方法
CN103201790A (zh) * 2010-11-22 2013-07-10 Lg电子株式会社 多媒体设备中使用语音和姿势的控制方法及其多媒体设备
CN103024629A (zh) * 2011-09-30 2013-04-03 斯凯普公司 处理信号
CN103208283A (zh) * 2012-01-11 2013-07-17 三星电子株式会社 使用语音识别执行用户功能的方法及装置
CN103077714A (zh) * 2013-01-29 2013-05-01 华为终端有限公司 信息的识别方法和装置

Cited By (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11907519B2 (en) 2009-03-16 2024-02-20 Apple Inc. Device, method, and graphical user interface for moving a current position in content at a variable scrubbing rate
US11567648B2 (en) 2009-03-16 2023-01-31 Apple Inc. Device, method, and graphical user interface for moving a current position in content at a variable scrubbing rate
US11893052B2 (en) 2011-08-18 2024-02-06 Apple Inc. Management of local and remote media items
US11281711B2 (en) 2011-08-18 2022-03-22 Apple Inc. Management of local and remote media items
US11755712B2 (en) 2011-09-29 2023-09-12 Apple Inc. Authentication with secondary approver
US11200309B2 (en) 2011-09-29 2021-12-14 Apple Inc. Authentication with secondary approver
US11539831B2 (en) 2013-03-15 2022-12-27 Apple Inc. Providing remote interactions with host device using a wireless device
US11907013B2 (en) 2014-05-30 2024-02-20 Apple Inc. Continuity of applications across devices
US11126704B2 (en) 2014-08-15 2021-09-21 Apple Inc. Authenticated device used to unlock another device
US11157143B2 (en) 2014-09-02 2021-10-26 Apple Inc. Music user interface
US11237794B2 (en) 2016-02-18 2022-02-01 Sony Corporation Information processing device and information processing method
US11206309B2 (en) 2016-05-19 2021-12-21 Apple Inc. User interface for remote authorization
US11037150B2 (en) 2016-06-12 2021-06-15 Apple Inc. User interfaces for transactions
US11900372B2 (en) 2016-06-12 2024-02-13 Apple Inc. User interfaces for transactions
US11431836B2 (en) 2017-05-02 2022-08-30 Apple Inc. Methods and interfaces for initiating media playback
US10928980B2 (en) 2017-05-12 2021-02-23 Apple Inc. User interfaces for playing and managing audio items
US11316966B2 (en) 2017-05-16 2022-04-26 Apple Inc. Methods and interfaces for detecting a proximity between devices and initiating playback of media
US11683408B2 (en) 2017-05-16 2023-06-20 Apple Inc. Methods and interfaces for home media control
CN111857643A (zh) * 2017-05-16 2020-10-30 苹果公司 用于家庭媒体控制的方法和界面
CN111857644A (zh) * 2017-05-16 2020-10-30 苹果公司 用于家庭媒体控制的方法和界面
US11283916B2 (en) 2017-05-16 2022-03-22 Apple Inc. Methods and interfaces for configuring a device in accordance with an audio tone signal
US11095766B2 (en) 2017-05-16 2021-08-17 Apple Inc. Methods and interfaces for adjusting an audible signal based on a spatial position of a voice command source
CN110874204A (zh) * 2017-05-16 2020-03-10 苹果公司 用于家庭媒体控制的方法和界面
US10992795B2 (en) 2017-05-16 2021-04-27 Apple Inc. Methods and interfaces for home media control
US11412081B2 (en) 2017-05-16 2022-08-09 Apple Inc. Methods and interfaces for configuring an electronic device to initiate playback of media
US11201961B2 (en) 2017-05-16 2021-12-14 Apple Inc. Methods and interfaces for adjusting the volume of media
US11750734B2 (en) 2017-05-16 2023-09-05 Apple Inc. Methods for initiating output of at least a component of a signal representative of media currently being played back by another device
US10996917B2 (en) 2019-05-31 2021-05-04 Apple Inc. User interfaces for audio media control
US11785387B2 (en) 2019-05-31 2023-10-10 Apple Inc. User interfaces for managing controllable external devices
US11010121B2 (en) 2019-05-31 2021-05-18 Apple Inc. User interfaces for audio media control
US11620103B2 (en) 2019-05-31 2023-04-04 Apple Inc. User interfaces for audio media control
US11157234B2 (en) 2019-05-31 2021-10-26 Apple Inc. Methods and user interfaces for sharing audio
US11714597B2 (en) 2019-05-31 2023-08-01 Apple Inc. Methods and user interfaces for sharing audio
US10904029B2 (en) 2019-05-31 2021-01-26 Apple Inc. User interfaces for managing controllable external devices
US11755273B2 (en) 2019-05-31 2023-09-12 Apple Inc. User interfaces for audio media control
US11853646B2 (en) 2019-05-31 2023-12-26 Apple Inc. User interfaces for audio media control
US11080004B2 (en) 2019-05-31 2021-08-03 Apple Inc. Methods and user interfaces for sharing audio
CN113450823B (zh) * 2020-03-24 2022-10-28 海信视像科技股份有限公司 基于音频的场景识别方法、装置、设备及存储介质
CN113450823A (zh) * 2020-03-24 2021-09-28 海信视像科技股份有限公司 基于音频的场景识别方法、装置、设备及存储介质
US11079913B1 (en) 2020-05-11 2021-08-03 Apple Inc. User interface for status indicators
US11513667B2 (en) 2020-05-11 2022-11-29 Apple Inc. User interface for audio message
US11782598B2 (en) 2020-09-25 2023-10-10 Apple Inc. Methods and interfaces for media control with dynamic feedback
US11392291B2 (en) 2020-09-25 2022-07-19 Apple Inc. Methods and interfaces for media control with dynamic feedback
US11847378B2 (en) 2021-06-06 2023-12-19 Apple Inc. User interfaces for audio routing

Also Published As

Publication number Publication date
JP2017509917A (ja) 2017-04-06
US20160351191A1 (en) 2016-12-01
WO2015124831A1 (en) 2015-08-27
EP2911149A1 (en) 2015-08-26
EP2911149B1 (en) 2019-04-17
US10152967B2 (en) 2018-12-11
JP6514225B2 (ja) 2019-05-15
CN106030700B (zh) 2019-12-06

Similar Documents

Publication Publication Date Title
CN106030700A (zh) 至少部分地基于空间音频属性来确定操作指令
KR102127640B1 (ko) 휴대 단말 및 보청기와 휴대 단말에서 음원의 위치를 제공하는 방법
CA2376374C (en) Wearable computer system and modes of operating the system
KR102052153B1 (ko) 보청기를 제어하는 휴대 단말 및 방법
CN105162693B (zh) 消息显示方法及装置
EP2961195B1 (en) Do-not-disturb system and apparatus
US20130190041A1 (en) Smartphone Speakerphone Mode With Beam Steering Isolation
CN105900042A (zh) 基于手势定向音频输出
CN103795850A (zh) 电子设备和语音识别方法
KR20150099156A (ko) 무선 리시버 및 그 제어 방법
CN107644646A (zh) 语音处理方法、装置以及用于语音处理的装置
WO2018036392A1 (zh) 基于语音分享信息的方法、装置与移动终端
CN105706427B (zh) 提供环境声处理的音频信息的方法和装置
CN105095366B (zh) 文字消息处理方法和装置
CN104935729B (zh) 音频输出方法和装置
CN108076204A (zh) 一种呼叫处理的方法及终端
CN109412932A (zh) 一种截屏方法和终端
CN105607738B (zh) 确定单手模式的方法及装置
CN107770356A (zh) 一种通信建立方法、设备和计算机可读存储介质
CN107171938A (zh) 屏蔽社交好友的方法和装置
JP2016189121A (ja) 情報処理装置、情報処理方法およびプログラム
CN107124679A (zh) 多媒体文件播放的方法和装置
CN108206884A (zh) 终端、终端发射通信信号的调整方法和电子设备
CN106775646A (zh) 闹钟控制方法及装置
CN106330686A (zh) 消息发送方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant