CN117480471A - 使用射频(rf)感测来实现语音助理的手势接口 - Google Patents
使用射频(rf)感测来实现语音助理的手势接口 Download PDFInfo
- Publication number
- CN117480471A CN117480471A CN202280041756.3A CN202280041756A CN117480471A CN 117480471 A CN117480471 A CN 117480471A CN 202280041756 A CN202280041756 A CN 202280041756A CN 117480471 A CN117480471 A CN 117480471A
- Authority
- CN
- China
- Prior art keywords
- gesture
- determining
- user
- utterance
- motion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000009471 action Effects 0.000 claims abstract description 40
- 238000000034 method Methods 0.000 claims description 47
- 230000033001 locomotion Effects 0.000 claims description 44
- 239000004020 conductor Substances 0.000 claims description 38
- 230000015654 memory Effects 0.000 claims description 31
- 238000003860 storage Methods 0.000 claims description 17
- 238000004519 manufacturing process Methods 0.000 claims description 12
- 230000003247 decreasing effect Effects 0.000 claims description 11
- 238000004378 air conditioning Methods 0.000 claims description 8
- 238000010438 heat treatment Methods 0.000 claims description 8
- 238000009423 ventilation Methods 0.000 claims description 6
- 210000003811 finger Anatomy 0.000 claims description 5
- 210000003813 thumb Anatomy 0.000 claims description 5
- 238000005282 brightening Methods 0.000 claims description 4
- 238000004891 communication Methods 0.000 description 59
- 230000006870 function Effects 0.000 description 38
- 238000012545 processing Methods 0.000 description 17
- 230000005540 biological transmission Effects 0.000 description 16
- 238000007726 management method Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 14
- 238000001228 spectrum Methods 0.000 description 11
- 230000001413 cellular effect Effects 0.000 description 10
- 230000000875 corresponding effect Effects 0.000 description 10
- 239000000969 carrier Substances 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 8
- 230000011664 signaling Effects 0.000 description 8
- 238000005259 measurement Methods 0.000 description 7
- 230000003416 augmentation Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 6
- 238000012937 correction Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 238000013507 mapping Methods 0.000 description 5
- 230000006837 decompression Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 239000002245 particle Substances 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 230000003190 augmentative effect Effects 0.000 description 3
- 230000004888 barrier function Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000006735 deficit Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000010363 phase shift Effects 0.000 description 2
- 238000012913 prioritisation Methods 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000027311 M phase Effects 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000012212 insulator Substances 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/24—Speech recognition using non-acoustical features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/017—Gesture based interaction, e.g. based on a set of recognized hand gestures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- Mobile Radio Communication Systems (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
在一方面,用户装备经由话筒接收来自用户的发声并使用射频感测来确定该用户在进行发声之时执行了手势。该用户装备确定与该手势相关联的对象并向智能助理设备的应用编程接口(API)传送增强型指挥。该增强型指挥是基于该对象、该手势和该发声来确定的。该增强型指挥使得该智能助理设备执行动作。
Description
公开背景
1.公开领域
本公开的各方面一般涉及扩增语音助理设备。
2.相关技术描述
无线通信系统已经过了数代的发展,包括第一代模拟无线电话服务(1G)、第二代(2G)数字无线电话服务(包括过渡的2.5G和2.75G网络)、第三代(3G)具有因特网能力的高速数据无线服务和第四代(4G)服务(例如,长期演进(LTE)或WiMax)。目前在用的有许多不同类型的无线通信系统,包括蜂窝以及个人通信服务(PCS)系统。已知蜂窝系统的示例包括蜂窝模拟高级移动电话系统(AMPS),以及基于码分多址(CDMA)、频分多址(FDMA)、时分多址(TDMA)、全球移动通信系统(GSM)等的数字蜂窝系统。第五代(5G)无线标准(被称为新无线电(NR))要求更高的数据传输速度、更大数目的连接和更好的覆盖、以及其他改进。
语音助理接收用于控制对象的语音命令。另外,语音助理需要用户口头指定该用户期望控制的对象。
概述
以下给出了与本文所公开的一个或多个方面相关的简化概述。由此,以下概述既不应被认为是与所有构想的方面相关的详尽纵览,以下概述也不应被认为标识与所有构想的方面相关的关键性或决定性要素或描绘与任何特定方面相关联的范围。相应地,以下概述的唯一目的是在以下给出的详细描述之前以简化形式呈现与关于本文所公开的机制的一个或多个方面相关的某些概念。
在一方面,一种指令智能助理设备执行动作的方法包括:通过话筒接收来自用户的发声。该方法包括:使用射频感测来确定该用户在进行该发声之时执行了手势;确定与该手势相关联的对象;以及向智能助理设备的应用编程接口(API)传送增强型指挥。该增强型指挥基于该对象、该手势和该发声。该增强型指挥使得该智能助理设备执行动作。
在一方面,一种设备包括:存储器;至少一个收发机;以及通信地耦合到该存储器和该至少一个收发机的至少一个处理器。该至少一个处理器被配置成:通过话筒接收来自用户的发声。该至少一个处理器被配置成:使用射频感测来确定该用户在进行该发声之时执行了手势;确定与该手势相关联的对象;以及向智能助理设备的应用编程接口(API)传送增强型指挥。该增强型指挥基于该对象、该手势和该发声。该增强型指挥使得该智能助理设备执行动作。
在一方面,一种装备包括:用于接收来自用户的发声的装置;用于确定该用户在进行该发声之时执行了手势的装置;用于确定与该手势相关联的对象的装置;以及用于向智能助理设备的应用编程接口(API)传送增强型指挥的装置。该增强型指挥基于该对象、该手势和该发声。该增强型指挥使得该智能助理设备执行动作。
在一方面,一种用于存储指令的非瞬态计算机可读存储介质,这些指令能由一个或多个处理器以:通过话筒接收来自用户的发声。这些指令能由该一个或多个处理器执行以:使用射频感测来确定该用户在进行该发声之时执行了手势;这些指令能由该一个或多个处理器执行以:确定与该手势相关联的对象。这些指令能由该一个或多个处理器执行以:向智能助理设备的应用编程接口(API)传送增强型指挥。该增强型指挥基于该对象、该手势和该发声。该增强型指挥使得该智能助理设备执行动作。
基于附图和详细描述,与本文所公开的各方面相关联的其他目标和优点对本领域技术人员而言将是显而易见的。
附图简述
给出附图以帮助对本公开的各方面进行描述,且提供附图仅用于解说各方面而非对其进行限定。
图1解说了根据本公开的各方面的示例无线通信系统。
图2A和2B解说了根据本公开的各方面的示例无线网络结构。
图3A、3B和3C是可分别在用户装备(UE)、基站和网络实体中采用并被配置成支持如本文中所教导的通信的组件的若干范例方面的简化框图。
图4是解说根据本公开的各方面的用于检测用户手势的系统的框图。
图5解说了根据本公开的各方面的包括向语音助理设备的应用编程接口(API)传送增强型指挥的过程。
图6解说了根据本公开的各方面的包括Wi-Fi设备与语音助理设备之间的交互的过程。
详细描述
本公开的各方面在以下针对出于解说目的提供的各种示例的描述和相关附图中提供。可设计替换方面而不脱离本公开的范围。另外,本公开中众所周知的元素将不被详细描述或将被省去以免湮没本公开的相关细节。
措辞“示例性”和/或“示例”在本文中用于意指“用作示例、实例或解说”。本文中描述为“示例性”和/或“示例”的任何方面不必被解释为优于或胜过其他方面。同样地,术语“本公开的各方面”不要求本公开的所有方面都包括所讨论的特征、优点或操作模式。
本文所描述的系统和技术解说了Wi-Fi设备可以如何使用射频(RF)感测来检测用户何时执行了手势并链接到语音助理设备以确定用户是否在与该用户执行手势基本上同时进行了发声(例如,一个或多个词)。RF感测可包括Wi-Fi感测、毫米(mm)波感测、5G NR感测、或另一类型的基于RF的感测。如果发声包括触发词(例如,“这”、“那”、“这里”、“那里”等等),则Wi-Fi设备可确定手势的方向并基于该方向来确定对象。对象可以是(i)物理对象,诸如光源、媒体回放设备、百叶帘/百叶窗、加热通风空调(HVAC)控制器(诸如恒温器),或(ii)更抽象类型的对象,诸如进程、软件等。例如,用户可朝向光源做手势并发声“打开这盏灯”。作为另一示例,用户可以朝向恒温器做手势并发声“将温度调低”。作为又一示例,用户可以朝向一组百叶帘做手势并发声“打开这些百叶帘”。
Wi-Fi设备可使用手势和发声来创建增强型指挥并将该增强型指挥发送给语音助理设备。在接收到增强型指挥之后,语音助理设备使得对象执行动作,诸如打开或关闭光源、发起或停止媒体回放、调整与媒体回放相关联的音频流、调整与媒体回放相关联的视频流、调整恒温器的温度等。调整音频流可包括增大或减小音量、调整频率均衡、将音频流路由到一个或多个输出等等。以此方式,用户可以使用手势连同发声以直观的方式来控制对象。
本领域技术人员将领会,以下描述的信息和信号可使用各种不同技术和技艺中的任何一种来表示。例如,贯穿以下描述可能被述及的数据、指令、命令、信息、信号、位(比特)、码元以及码片可部分地取决于具体应用、部分地取决于所预期的设计、部分地取决于对应技术等而由电压、电流、电磁波、磁场或磁粒子、光场或光粒子、或其任何组合表示。
此外,许多方面以由例如计算设备的元件执行的动作序列的形式来描述。将认识到,本文中所描述的各种动作能由专用电路(例如,专用集成电路(ASIC))、由正被一个或多个处理器执行的程序指令、或由这两者的组合来执行。另外,本文中所描述的动作序列可被认为是完全体现在任何形式的非瞬态计算机可读存储介质内,该非瞬态计算机可读存储介质中存储有一经执行就将使得或指令设备的相关联处理器执行本文中所描述的功能性的相应计算机指令集。由此,本公开的各个方面可以数种不同形式体现,所有这些形式都已被构想为落在所要求保护的主题内容的范围内。另外,对于本文中所描述的每一方面,任何此类方面的对应形式可在本文中被描述为例如“被配置成执行所描述的动作的逻辑”。
如本文中所使用的,术语“用户装备”(UE)和“基站”并非旨在专用于或以其他方式被限定于任何特定的无线电接入技术(RAT),除非另有说明。一般而言,UE可以是被用户用来在无线通信网络上进行通信的任何无线通信设备(例如,移动电话、路由器、平板计算机、膝上型计算机、消费者资产定位设备、可穿戴设备(例如,智能手表、眼镜、增强现实(AR)/虚拟现实(VR)头戴式设备等)、交通工具(例如,汽车、摩托车、自行车等)、物联网(IoT)设备等)。UE可以是移动的或者可以(例如,在某些时间)是驻定的,并且可与无线电接入网(RAN)进行通信。如本文中所使用的,术语“UE”可以互换地被称为“接入终端”或“AT”、“客户端设备”、“无线设备”、“订户设备”、“订户终端”、“订户站”、“用户终端”或“UT”、“移动设备”、“移动终端”、“移动站”、或其变型。一般而言,UE可以经由RAN与核心网进行通信,并且通过核心网,UE可与外部网络(诸如因特网)以及与其他UE连接。当然,连接到核心网和/或因特网的其他机制对于UE而言也是可能的,诸如通过有线接入网、无线局域网(WLAN)网络(例如,基于电气与电子工程师协会(IEEE)802.11规范等)等等。
基站可取决于该基站被部署在其中的网络而根据若干RAT之一进行操作来与UE通信,并且可以替换地被称为接入点(AP)、网络节点、B节点、演进型B节点(eNB)、下一代eNB(ng-eNB)、新无线电(NR)B节点(也被称为gNB或gNodeB)等等。基站可主要被用于支持由UE进行的无线接入,包括支持关于所支持UE的数据、语音、和/或信令连接。在一些系统中,基站可提供纯边缘节点信令功能,而在其他系统中,基站可提供附加的控制和/或网络管理功能。UE可籍以向基站发送信号的通信链路被称为上行链路(UL)信道(例如,反向话务信道、反向控制信道、接入信道等)。基站可籍以向UE发送信号的通信链路被称为下行链路(DL)或前向链路信道(例如,寻呼信道、控制信道、广播信道、前向话务信道等)。如本文所使用的,术语话务信道(TCH)可以指上行链路/反向话务信道或下行链路/前向话务信道。
术语“基站”可以指单个物理传送接收点(TRP)或者可以指可能或可能不共置的多个物理TRP。例如,在术语“基站”指单个物理TRP的情况下,该物理TRP可以是与基站的蜂窝小区(或若干个蜂窝小区扇区)相对应的基站天线。在术语“基站”指多个共置的物理TRP的情况下,该物理TRP可以是基站的天线阵列(例如,如在多输入多输出(MIMO)系统中或在基站采用波束成形的情况下)。在术语“基站”指多个非共置的物理TRP的情况下,该物理TRP可以是分布式天线系统(DAS)(经由传输介质来连接到共用源的在空间上分离的天线的网络)或远程无线电头端(RRH)(连接到服务基站的远程基站)。替换地,非共置的物理TRP可以是从UE接收测量报告的服务基站和该UE正在测量其参考射频(RF)信号的邻居基站。由于TRP是基站从其传送和接收无线信号的点,如本文中所使用的,因此对来自基站的传输或在基站处的接收的引用应被理解为引用该基站的特定TRP。
在支持UE定位的一些实现中,基站可能不支持UE的无线接入(例如,可能不支持关于UE的数据、语音、和/或信令连接),但是可以替代地向UE传送要被UE测量的参考信号、和/或可以接收和测量由UE传送的信号。此类基站可被称为定位塔台(例如,在向UE传送信号的情况下)和/或被称为位置测量单元(例如,在接收和测量来自UE的信号的情况下)。
“RF信号”包括通过传送方与接收方之间的空间来传输信息的给定频率的电磁波。如本文中所使用的,传送方可向接收方传送单个“RF信号”或多个“RF信号”。然而,由于RF信号通过多径信道的传播特性,接收方可接收到与每个所传送RF信号相对应的多个“RF信号”。传送方与接收方之间的不同路径上所传送的相同RF信号可被称为“多径”RF信号。如本文中所使用的,RF信号还可被称为“无线信号”或简称为“信号”,其中从上下文能清楚地看出术语“信号”指的是无线信号或RF信号。
图1解说了根据本公开的各方面的示例无线通信系统100。无线通信系统100(其也可被称为无线广域网(WWAN))可包括各个基站102(被标记为“BS”)和各个UE 104。基站102可包括宏蜂窝小区基站(高功率蜂窝基站)和/或小型蜂窝小区基站(低功率蜂窝基站)。在一方面,宏蜂窝小区基站可包括eNB和/或ng-eNB(其中无线通信系统100对应于LTE网络)、或者gNB(其中无线通信系统100对应于NR网络)、或两者的组合,并且小型蜂窝小区基站可包括毫微微蜂窝小区、微微蜂窝小区、微蜂窝小区等等。
各基站102可共同地形成RAN并且通过回程链路122来与核心网170(例如,演进型分组核心(EPC)或5G核心(5GC))对接,以及通过核心网170去往一个或多个位置服务器172(例如,位置管理功能(LMF)或安全用户面定位(SUPL)位置平台(SLP))。(诸)位置服务器172可以是核心网170的一部分或者可在核心网170外部。除了其他功能,基站102还可执行与传递用户数据、无线电信道暗码化和暗码解译、完整性保护、报头压缩、移动性控制功能(例如,切换、双连通性)、蜂窝小区间干扰协调、连接设立和释放、负载平衡、非接入阶层(NAS)消息的分发、NAS节点选择、同步、RAN共享、多媒体广播多播服务(MBMS)、订户和装备追踪、RAN信息管理(RIM)、寻呼、定位、以及警报消息的递送中的一者或多者相关的功能。基站102可通过回程链路134(其可以是有线的或无线的)直接或间接地(例如,通过EPC/5GC)彼此通信。
基站102可与UE 104进行无线通信。每个基站102可为相应的地理覆盖区域110提供通信覆盖。在一方面,一个或多个蜂窝小区可由每个地理覆盖区域110中的基站102支持。“蜂窝小区”是用于与基站(例如,在某个频率资源上,其被称为载波频率、分量载波、载波、频带等等)进行通信的逻辑通信实体,并且可与标识符(例如,物理蜂窝小区标识符(PCI)、增强型蜂窝小区标识符(ECI)、虚拟蜂窝小区标识符(VCI)、蜂窝小区全局标识符(CGI)等)相关联以区分经由相同或不同载波频率来操作的蜂窝小区。在一些情形中,可根据可为不同类型的UE提供接入的不同协议类型(例如,机器类型通信(MTC)、窄带IoT(NB-IoT)、增强型移动宽带(eMBB)或其他)来配置不同蜂窝小区。由于蜂窝小区由特定的基站支持,因此术语“蜂窝小区”可取决于上下文而指逻辑通信实体和支持该逻辑通信实体的基站中的任一者或两者。另外,因为TRP通常是蜂窝小区的物理传送点,所以术语“蜂窝小区”和“TRP”可以互换地使用。在一些情形中,在载波频率可被检测到并且被用于地理覆盖区域110的某个部分内的通信的意义上,术语“蜂窝小区”还可以指基站的地理覆盖区域(例如,扇区)。
虽然相邻宏蜂窝小区基站102的各地理覆盖区域110可部分地交叠(例如,在切换区域中),但是一些地理覆盖区域110可能基本上被较大的地理覆盖区域110交叠。例如,小型蜂窝小区基站102'(被标记为“小型蜂窝小区”的“SC”)可具有基本上与一个或多个宏蜂窝小区基站102的地理覆盖区域110交叠的地理覆盖区域110'。包括小型蜂窝小区和宏蜂窝小区基站两者的网络可被称为异构网络。异构网络还可包括家用eNB(HeNB),该HeNB可向被称为封闭订户群(CSG)的受限群提供服务。
基站102与UE 104之间的通信链路120可包括从UE 104到基站102的上行链路(亦称为反向链路)传输和/或从基站102到UE 104的下行链路(DL)(亦称为前向链路)传输。通信链路120可使用MIMO天线技术,包括空间复用、波束成形、和/或发射分集。通信链路120可通过一个或多个载波频率。载波的分配可以关于下行链路和上行链路是非对称的(例如,与上行链路相比可将更多或更少载波分配给下行链路)。
无线通信系统100可进一步包括在无执照频谱(例如,5GHz)中经由通信链路154与WLAN站(STA)152处于通信的无线局域网(WLAN)接入点(AP)150。当在无执照频谱中进行通信时,WLAN STA 152和/或WLAN AP 150可在进行通信之前执行畅通信道评估(CCA)或先听后讲(LBT)规程以确定信道是否可用。
小型蜂窝小区基站102'可在有执照和/或无执照频谱中操作。当在无执照频谱中操作时,小型蜂窝小区基站102'可采用LTE或NR技术并且使用与由WLAN AP150使用的频谱相同的5GHz无执照频谱。在无执照频谱中采用LTE/5G的小型蜂窝小区基站102'可推升对接入网的覆盖和/或增加接入网的容量。无执照频谱中的NR可被称为NR-U。无执照频谱中的LTE可被称为LTE-U、有执照辅助式接入(LAA)或MulteFire。
无线通信系统100可进一步包括毫米波(mmW)基站180,该mmW基站180可在mmW频率和/或近mmW频率中操作以与UE 182处于通信。极高频(EHF)是电磁频谱中的RF的一部分。EHF具有30GHz到300GHz的范围以及1毫米到10毫米之间的波长。该频带中的无线电波可被称为毫米波。近mmW可向下扩展至具有100毫米波长的3GHz频率。超高频(SHF)频带在3GHz到30GHz之间扩展,其还被称为厘米波。使用mmW/近mmW射频频带的通信具有高路径损耗和相对短的射程。mmW基站180和UE 182可利用mmW通信链路184上的波束成形(发射和/或接收)来补偿极高路径损耗和短射程。此外,将领会,在替换配置中,一个或多个基站102还可使用mmW或近mmW以及波束成形来进行传送。相应地,将领会,前述解说仅仅是示例,并且不应当被解读成限定本文中所公开的各个方面。
发射波束成形是一种用于将RF信号聚焦在特定方向上的技术。常规地,当网络节点(例如,基站)广播RF信号时,该网络节点在所有方向上(全向地)广播该信号。利用发射波束成形,网络节点确定给定目标设备(例如,UE)(相对于传送方网络节点)位于哪里,并在该特定方向上投射较强下行链路RF信号,从而为接收方设备提供较快(就数据率而言)且较强的RF信号。为了在发射时改变RF信号的方向性,网络节点可在正在广播该RF信号的一个或多个发射机中的每个发射机处控制该RF信号的相位和相对振幅。例如,网络节点可使用产生RF波的波束的天线阵列(被称为“相控阵”或“天线阵列”),RF波的波束能够被“引导”指向不同的方向,而无需实际地移动这些天线。具体地,来自发射机的RF电流以正确的相位关系被馈送到个体天线,以使得来自分开的天线的无线电波在期望方向上相加在一起以增大辐射,而同时在不期望方向上抵消以抑制辐射。
发射波束可以是准共置的,这意味着它们在接收方(例如,UE)看来具有相同的参数,而不论该网络节点的发射天线本身是否在物理上是共置的。在NR中,存在四种类型的准共置(QCL)关系。具体地,给定类型的QCL关系意味着:关于第二波束上的第二参考RF信号的某些参数可以从关于源波束上的源参考RF信号的信息推导出。由此,若源参考RF信号是QCL类型A,则接收方可使用源参考RF信号来估计在相同信道上传送的第二参考RF信号的多普勒频移、多普勒扩展、平均延迟、以及延迟扩展。若源参考RF信号是QCL类型B,则接收方可使用源参考RF信号来估计在相同信道上传送的第二参考RF信号的多普勒频移和多普勒扩展。若源参考RF信号是QCL类型C,则接收方可使用源参考RF信号来估计在相同信道上传送的第二参考RF信号的多普勒频移和平均延迟。若源参考RF信号是QCL类型D,则接收方可使用源参考RF信号来估计在相同信道上传送的第二参考RF信号的空间接收参数。
在接收波束成形中,接收机使用接收波束来放大在给定信道上检测到的RF信号。例如,接收机可在特定方向上增大天线阵列的增益设置和/或调整天线阵列的相位设置,以放大从该方向接收到的RF信号(例如,增大其增益水平)。由此,当接收机被称为在某个方向上进行波束成形时,这意味着该方向上的波束增益相对于沿其他方向的波束增益而言是较高的,或者该方向上的波束增益相比于对该接收机可用的所有其他接收波束在该方向上的波束增益而言是最高的。这导致从该方向接收的RF信号有较强的收到信号强度(例如,参考信号收到功率(RSRP)、参考信号收到质量(RSRQ)、信号与干扰加噪声比(SINR)等等)。
发射波束和接收波束可以是空间相关的。空间关系意味着用于第二参考信号的第二波束(例如,发射或接收波束)的参数可以从关于第一参考信号的第一波束(例如,接收波束或发射波束)的信息推导出。例如,UE可使用特定的接收波束来从基站接收参考下行链路参考信号(例如,同步信号块(SSB))。UE随后可基于接收波束的参数来形成发射波束以用于向该基站发送上行链路参考信号(例如,探通参考信号(SRS))。
注意,取决于形成“下行链路”波束的实体,该波束可以是发射波束或接收波束。例如,若基站正形成下行链路波束以向UE传送参考信号,则该下行链路波束是发射波束。然而,若UE正形成下行链路波束,则该下行链路波束是用于接收下行链路参考信号的接收波束。类似地,取决于形成“上行链路”波束的实体,该波束可以是发射波束或接收波束。例如,若基站正形成上行链路波束,则该上行链路波束是上行链路接收波束,而若UE正形成上行链路波束,则该上行链路波束是上行链路发射波束。
在5G中,无线节点(例如,基站102/180、UE 104/182)在其中操作的频谱被划分成多个频率范围:FR1(从450到6000MHz)、FR2(从24250到52600MHz)、FR3(高于52600MHz)、以及FR4(在FR1与FR2之间)。mmW频带一般包括FR2、FR3和FR4频率范围。如此,术语“mmW”和“FR2”或“FR3”或“FR4”一般可以可互换地使用。
在多载波系统(诸如5G)中,载波频率之一被称为“主载波”或“锚载波”或“主服务蜂窝小区”或“PCell”,并且其余载波频率被称为“辅载波”或“副服务蜂窝小区”或“SCell”。在载波聚集中,锚载波是在由UE 104/182利用的主频率(例如,FR1)上并且在UE 104/182在其中执行初始无线电资源控制(RRC)连接建立规程或发起RRC连接重建规程的蜂窝小区上操作的载波。主载波携带所有共用控制信道以及因UE而异的控制信道,并且可以是有执照频率中的载波(然而,并不总是这种情形)。辅载波是在第二频率(例如,FR2)上操作的载波,一旦在UE 104与锚载波之间建立了RRC连接就可以配置该载波,并且该载波可被用于提供附加无线电资源。在一些情形中,辅载波可以是无执照频率中的载波。辅载波可仅包含必要的信令信息和信号,例如,因UE而异的信令信息和信号可能不存在于辅载波中,因为主上行链路和下行链路载波两者通常都是因UE而异的。这意味着蜂窝小区中的不同UE 104/182可具有不同下行链路主载波。这对于上行链路主载波而言同样成立。网络能够在任何时间改变任何UE 104/182的主载波。例如,这样做是为了平衡不同载波上的负载。由于“服务蜂窝小区”(无论是PCell还是SCell)对应于某个基站正用于进行通信的载波频率/分量载波,因此术语“蜂窝小区”、“服务蜂窝小区”、“分量载波”、“载波频率”等等可被可互换地使用。
例如,仍然参照图1,由宏蜂窝小区基站102利用的频率之一可以是锚载波(或“PCell”),并且由该宏蜂窝小区基站102和/或mmW基站180利用的其他频率可以是辅载波(“SCell”)。对多个载波之时传送和/或接收使得UE 104/182能够显著增大其数据传输和/或接收速率。例如,多载波系统中的两个20MHz聚集载波与由单个20MHz载波获得的数据率相比较而言理论上将导致数据率的两倍增加(即,40MHz)。
无线通信系统100可进一步包括UE 164,该UE 164可在通信链路120上与宏蜂窝小区基站102进行通信和/或在mmW通信链路184上与mmW基站180进行通信。例如,宏蜂窝小区基站102可支持PCell和一个或多个SCell以用于UE 164,并且mmW基站180可支持一个或多个SCell以用于UE 164。
在图1的示例中,所解说UE中的任一者(为简单起见在图1中示为单个UE 104)可以从一个或多个地球轨道航天器(SV)112(例如,卫星)接收信号124。在一方面,SV 112可以是UE 104可用作位置信息的独立源的卫星定位系统的一部分。卫星定位系统通常包括发射机系统(例如,SV 112),这些发射机被定位成使得接收机(例如,UE 104)能够至少部分地基于从这些发射机接收到的定位信号(例如,信号124)来确定接收机在地球上或上方的位置。此类发射机通常传送用设定数目个码片的重复伪随机噪声(PN)码来标记的信号。虽然发射机通常位于SV 112中,但是有时也可位于基于地面的控制站、基站102、和/或其他UE 104上。UE 104可包括一个或多个专用接收机,这些专用接收机专门设计成从SV 112接收信号124以推导地理位置信息。
在卫星定位系统中,信号124的使用能通过各种基于卫星的扩增系统(SBAS)来扩增,该SBAS可与一个或多个全球性和/或区域性导航卫星系统相关联或者以其他方式被启用以与一个或多个全球性和/或区域性导航卫星系统联用。例如,SBAS可包括提供完整性信息、差分校正等的扩增系统,诸如广域扩增系统(WAAS)、欧洲对地静止导航覆盖服务(EGNOS)、多功能卫星扩增系统(MSAS)、全球定位系统(GPS)辅助地理扩增导航或GPS和地理扩增导航系统(GAGAN)等等。因此,如本文中所使用的,卫星定位系统可包括与此类一个或多个卫星定位系统相关联的一个或多个全球性和/或区域性导航卫星的任何组合。
在一方面,SV 112可以附加地或替换地是一个或多个非地面网络(NTN)的一部分。在NTN中,SV 112被连接到地球站(也被称为地面站、NTN网关、或网关),该地球站进而被连接到5G网络中的元件,诸如经修改的基站102(无地面天线)或5GC中的网络节点。该元件进而将提供对5G网络中其他元件的接入,并且最终提供对5G网络外部实体(诸如因特网web服务器和其他用户设备)的接入。以此方式,UE 104可以作为从地面基站102接收通信信号的替换或补充而从SV 112接收通信信号(例如,信号124)。
无线通信系统100可进一步包括一个或多个UE(诸如UE 190),该一个或多个UE经由一个或多个设备到设备(D2D)对等(P2P)链路(被称为“侧链路”)间接地连接到一个或多个通信网络。在图1的示例中,UE 190具有与连接到一个基站102的一个UE 104的D2D P2P链路192(例如,UE 190可通过其间接地获得蜂窝连通性),以及与连接到WLAN AP 150的WLANSTA 152的D2D P2P链路194(UE 190可通过其间接地获得基于WLAN的因特网连通性)。在一示例中,D2D P2P链路192和194可以使用任何公知的D2D RAT(诸如LTE直连(LTE-D)、WiFi直连(WiFi-D)、等)来支持。
图2A解说了示例无线网络结构200。例如,5GC 210(亦称为下一代核心(NGC))可在功能上被视为控制面(C-plane)功能214(例如,UE注册、认证、网络接入、网关选择等)和用户面(U-plane)功能212(例如,UE网关功能、对数据网络的接入、IP路由等),它们协同地操作以形成核心网。用户面接口(NG-U)213和控制面接口(NG-C)215将gNB 222连接到5GC210,尤其分别连接到用户面功能212和控制面功能214。在附加配置中,ng-eNB 224也可经由至控制面功能214的NG-C 215以及至用户面功能212的NG-U 213来连接到5GC 210。此外,ng-eNB 224可经由回程连接223直接与gNB 222进行通信。在一些配置中,下一代RAN(NG-RAN)220可具有一个或多个gNB 222,而其他配置包括一个或多个ng-eNB 224和一个或多个gNB 222。gNB 222或ng-eNB 224(或两者)可与一个或多个UE 204(例如,本文中所描述的任何UE)进行通信。
另一可任选方面可包括位置服务器230,该位置服务器230可与5GC 210处于通信以为UE 204提供位置辅助。位置服务器230可被实现为多个分开的服务器(例如,物理上分开的服务器、单个服务器上的不同软件模块、跨越多个物理服务器扩展的不同软件模块等等),或者替换地可各自对应于单个服务器。位置服务器230可被配置成支持用于UE 204的一个或多个位置服务,UE 204能够经由核心网、5GC 210和/或经由因特网(未解说)连接到位置服务器230。此外,位置服务器230可被集成到核心网的组件中,或者替换地可在核心网的外部(例如,第三方服务器,诸如原始装备制造商(OEM)服务器或业务服务器)。
图2B解说了另一示例无线网络结构250。5GC 260(其可对应于图2A中的5GC 210)可在功能上被视为控制面功能(由接入和移动性管理功能(AMF)264提供)以及用户面功能(由用户面功能(UPF)262提供),它们协同地操作以形成核心网(即,5GC 260)。AMF 264的功能包括注册管理、连接管理、可达性管理、移动性管理、合法拦截、一个或多个UE 204(例如,本文中所描述的任何UE)与会话管理功能(SMF)266之间的会话管理(SM)消息传输、用于路由SM消息的透明代理服务、接入认证和接入授权、UE 204与短消息服务功能(SMSF)(未示出)之间的短消息服务(SMS)消息传输、以及安全锚功能性(SEAF)。AMF 264还与认证服务器功能(AUSF)(未示出)和UE 204交互,并接收作为UE 204认证过程的结果而确立的中间密钥。在基于UMTS(通用移动电信系统)订户身份模块(USIM)来认证的情形中,AMF 264从AUSF中检索安全材料。AMF 264的功能还包括安全上下文管理(SCM)。SCM从SEAF接收密钥,该密钥被SCM用来推导因接入网而异的密钥。AMF 264的功能性还包括:用于监管服务的位置服务管理、UE 204与位置管理功能(LMF)270(其充当位置服务器230)之间的位置服务消息传输、NG-RAN 220与LMF 270之间的位置服务消息传输、用于与演进分组系统(EPS)互通的EPS承载标识符分配、以及UE 204移动性事件通知。另外,AMF 264还支持非3GPP(第三代伙伴项目)接入网的功能性。
UPF 262的功能包括:充当RAT内/RAT间移动性的锚点(在适用时)、充当互连至数据网络(未示出)的外部协议数据单元(PDU)会话点、提供分组路由和转发、分组检视、用户面策略规则实施(例如,选通、重定向、话务引导)、合法拦截(用户面收集)、话务使用报告、用于用户面的服务质量(QoS)处置(例如,上行链路/下行链路速率实施、下行链路中的反射性QoS标记)、上行链路话务验证(服务数据流(SDF)到QoS流映射)、上行链路和下行链路中的传输级分组标记、下行链路分组缓冲和下行链路数据通知触发、以及向源RAN节点发送和转发一个或多个“结束标记”。UPF 262还可支持在用户面上在UE 204与位置服务器(诸如SLP 272)之间传输位置服务消息。
SMF 266的功能包括会话管理、UE网际协议(IP)地址分配和管理、用户面功能的选择和控制、在UPF 262处用于将话务路由到正确目的地的话务引导配置、对策略实施和QoS的部分控制、以及下行链路数据通知。SMF 266用于与AMF 264进行通信的接口被称为N11接口。
另一可任选方面可包括LMF 270,LMF 270可与5GC 260处于通信以为UE204提供位置辅助。LMF 270可被实现为多个分开的服务器(例如,物理上分开的服务器、单个服务器上的不同软件模块、跨越多个物理服务器扩展的不同软件模块等等),或者替换地可各自对应于单个服务器。LMF 270可被配置成支持用于UE 204的一个或多个位置服务,UE 204能够经由核心网、5GC 260和/或经由因特网(未解说)连接到LMF 270。SLP 272可支持与LMF 270类似的功能,但是LMF 270可在控制面上(例如,使用旨在传达信令消息而不传达语音或数据的接口和协议)与AMF 264、NG-RAN 220、以及UE 204通信,SLP 272可在用户面上(例如,使用旨在携带语音和/或数据的协议,如传输控制协议(TCP)和/或IP)与UE 204和外部客户端(图2B中未示出)通信。
用户面接口263和控制面接口265将5GC 260(并且尤其分别是UPF 262和AMF 264)连接到NG-RAN 220中的一个或多个gNB 222和/或ng-eNB 224。gNB 222和/或ng-eNB 224与AMF 264之间的接口被称为“N2”接口,而gNB 222和/或ng-eNB 224与UPF 262之间的接口被称为“N3”接口。NG-RAN 220的(诸)gNB 222和/或(诸)ng-eNB 224可经由回程连接223彼此直接通信,回程连接223被称为“Xn-C”接口。gNB 222和/或ng-eNB 224中的一者或多者可在无线接口上与一个或多个UE 204通信,该无线接口被称为“Uu”接口。
gNB 222的功能性在gNB中央单元(gNB-CU)226与一个或多个gNB分布式单元(gNB-DU)228之间划分。gNB-CU 226与一个或多个gNB-DU 228之间的接口232被称为“F1”接口。gNB-CU 226是逻辑节点,其包括传递用户数据、移动性控制、无线电接入网共享、定位、会话管理等的基站功能,除了那些专门分配给(诸)gNB-DU 228的功能。更具体地,gNB-CU 226主管gNB 222的无线电资源控制(RRC)、服务数据适配协议(SDAP)和分组数据汇聚协议(PDCP)协议。gNB-DU 228是主管gNB 222的无线电链路控制(RLC)、媒体接入控制(MAC)和物理(PHY)层的逻辑节点。其操作由gNB-CU 226来控制。一个gNB-DU 228可支持一个或多个蜂窝小区,而一个蜂窝小区仅由一个gNB-DU 228来支持。因此,UE 204经由RRC、SDAP和PDCP层与gNB-CU 226通信,并且经由RLC、MAC和PHY层与gNB-DU 228通信。
图3A、图3B和图3C解说了可被纳入UE 302(其可对应于本文所描述的任何UE)、基站304(其可对应于本文所描述的任何基站)、以及网络实体306(其可对应于或体现本文所描述的任何网络功能,包括位置服务器230和LMF 270,或替换地可独立于图2A和2B中所描绘的NG-RAN 220和/或5GC 210/260基础设施,诸如专用网络)中的若干示例组件(由对应的框来表示)以支持如本文所教导的文件传输操作。将领会,这些组件在不同实现中可在不同类型的装置中(例如,在ASIC中、在片上系统(SoC)中等)实现。所解说的组件也可被纳入到通信系统中的其他装置中。例如,系统中的其他装置可包括与所描述的那些组件类似的组件以提供类似的功能性。此外,给定装置可包含这些组件中的一个或多个组件。例如,装置可包括使得该装置能够在多个载波上操作和/或经由不同技术进行通信的多个收发机组件。
UE 302和基站304各自分别包括一个或多个无线广域网(WWAN)收发机310和350,从而提供用于经由一个或多个无线通信网络(未示出)(诸如NR网络、LTE网络、GSM网络等)进行通信的装置(例如,用于传送的装置、用于接收的装置、用于测量的装置、用于调谐的装置、用于抑制传送的装置等)。WWAN收发机310和350可各自分别连接到一个或多个天线316和356,以用于经由至少一个指定RAT(例如,NR、LTE、GSM等)在感兴趣的无线通信介质(例如,特定频谱中的某个时间/频率资源集)上与其他网络节点(诸如其他UE、接入点、基站(例如,eNB、gNB)等)进行通信。WWAN收发机310和350可根据指定RAT以各种方式分别被配置成用于传送和编码信号318和358(例如,消息、指示、信息等),以及反之分别被配置成用于接收和解码信号318和358(例如,消息、指示、信息、导频等)。具体地,WWAN收发机310和350分别包括一个或多个发射机314和354以分别用于传送和编码信号318和358,并分别包括一个或多个接收机312和352以分别用于接收和解码信号318和358。
至少在一些情形中,UE 302和基站304各自还分别包括一个或多个短程无线收发机320和360。短程无线收发机320和360可分别连接到一个或多个天线326和366,并且提供用于经由至少一个指定RAT(例如,WiFi、LTE-D、 PC5、专用短程通信(DSRC)、车载环境无线接入(WAVE)、近场通信(NFC)等)在感兴趣的无线通信介质上与其他网络节点(诸如其他UE、接入点、基站等)进行通信的装置(例如,用于传送的装置、用于接收的装置、用于测量的装置、用于调谐的装置、用于抑制进行传送的装置等)。短程无线收发机320和360可根据指定RAT以各种方式分别被配置成用于传送和编码信号328和368(例如,消息、指示、信息等),以及反之分别被配置成用于接收和解码信号328和368(例如,消息、指示、信息、导频等)。具体地,短程无线收发机320和360分别包括一个或多个发射机324和364以分别用于传送和编码信号328和368,并分别包括一个或多个接收机322和362以分别用于接收和解码信号328和368。作为特定示例,短程无线收发机320和360可以是WiFi收发机、/>收发机、/>和/或/>收发机、NFC收发机、或交通工具到交通工具(V2V)和/或车联网(V2X)收发机。
至少在一些情形中,UE 302和基站304还包括卫星信号接收机330和370。卫星信号接收机330和370可分别连接到一个或多个天线336和376,并且可分别提供用于接收和/或测量卫星定位/通信信号338和378的装置。在卫星信号接收机330和370是卫星定位系统接收机的情况下,卫星定位/通信信号338和378可以是全球定位系统(GPS)信号、全球导航卫星系统(GLONASS)信号、伽利略信号、北斗信号、印度区域性导航卫星系统(NAVIC)、准天顶卫星系统(QZSS)等。在卫星信号接收机330和370是非地面网络(NTN)接收机的情况下,卫星定位/通信信号338和378可以是源自5G网络的通信信号(例如,携带控制和/或用户数据)。卫星信号接收机330和370可分别包括用于接收和处理卫星定位/通信信号338和378的任何合适的硬件和/或软件。卫星信号接收机330和370在适当时向其他系统请求信息和操作,并且至少在一些情形中执行计算以使用由任何合适的卫星定位系统算法获得的测量来确定UE 302和基站304各自的位置。
基站304和网络实体306各自分别包括一个或多个网络收发机380和390,从而提供用于与其他网络实体(例如,其他基站304、其他网络实体306)进行通信的装置(例如,用于传送的装置、用于接收的装置等)。例如,基站304可采用一个或多个网络收发机380在一个或多个有线或无线回程链路上与其他基站304或网络实体306进行通信。作为另一示例,网络实体306可采用一个或多个网络收发机390来在一个或多个有线或无线回程链路上与一个或多个基站304通信,或者在一个或多个有线或无线核心网接口上与其他网络实体306进行通信。
收发机可被配置成在有线或无线链路上进行通信。收发机(无论是有线收发机还是无线收发机)包括发射机电路系统(例如,发射机314、324、354、364)和接收机电路系统(例如,接收机312、322、352、362)。收发机在一些实现中可以是集成设备(例如,在单个设备中实施发射机电路系统和接收机电路系统),在一些实现中可包括单独的发射机电路系统和单独的接收机电路系统,或者在其他实现中可以按其他方式来实施。有线收发机(例如,在一些实现中,网络收发机380和390)的发射机电路系统和接收机电路系统可被耦合到一个或多个有线网络接口端口。无线发射机电路系统(例如,发射机314、324、354、364)可包括或被耦合到多个天线(例如,天线316、326、356、366),诸如天线阵列,其准许该相应装置(例如,UE 302、基站304)执行发射“波束成形”,如本文中所描述的。类似地,无线接收机电路系统(例如,接收机312、322、352、362)可包括或被耦合到多个天线(例如,天线316、326、356、366),诸如天线阵列,其准许该相应装置(例如,UE 302、基站304)执行接收波束成形,如本文中所描述的。在一方面,发射机电路系统和接收机电路系统可共享相同的多个天线(例如,天线316、326、356、366),以使得该相应装置在给定时间只能进行接收或传送,而不是同时进行两者。无线收发机(例如,WWAN收发机310和350、短程无线收发机320和360)还可包括用于执行各种测量的网络监听模块(NLM)等。
如本文中所使用的,各种无线收发机(例如,收发机310、320、350和360,以及一些实现中的网络收发机380和390)和有线收发机(例如,一些实现中的网络收发机380和390)通常可被表征为“收发机”、“至少一个收发机”或“一个或多个收发机”。如此,可从所执行的通信类型推断特定收发机是有线收发机还是无线收发机。例如,网络设备或服务器之间的回程通信一般涉及经由有线收发机的信令,而UE(例如,UE 302)与基站(例如,基站304)之间的无线通信一般涉及经由无线收发机的信令。
UE 302、基站304和网络实体306还包括可结合如本文中所公开的操作来使用的其他组件。UE 302、基站304和网络实体306分别包括一个或多个处理器332、384和394,以用于提供与例如无线通信相关的功能性以及用于提供其他处理功能性。处理器332、384和394因此可提供用于处理的装置,诸如用于确定的装置、用于计算的装置、用于接收的装置、用于传送的装置、用于指示的装置等。在一方面,处理器332、384和394可包括例如一个或多个通用处理器、多核处理器、中央处理单元(CPU)、ASIC、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、其他可编程逻辑器件或处理电路系统、或其各种组合。
UE 302、基站304和网络实体306包括存储器电路系统,其分别实现用于维持信息(例如,指示所保留资源、阈值、参数等等的信息)的存储器340、386和396(例如,各自包括存储器设备)。因此,存储器340、386和396可提供用于存储的装置、用于检索的装置、用于维持的装置等。在一些情形中,UE 302、基站304和网络实体306可分别包括RF感测模块342、388和398。RF感测模块342、388和398分别可以是作为处理器332、384和394的一部分或与其耦合的硬件电路,这些硬件电路在被执行时使UE 302、基站304和网络实体306执行本文中所描述的功能性。在其他方面,RF感测模块342、388和398可以在处理器332、384和394的外部(例如,调制解调器处理系统的一部分、与另一处理系统集成等等)。替换地,RF感测模块342、388和398分别可以是存储在存储器340、386和396中的存储器模块,这些存储器模块在由处理器332、384和394(或调制解调器处理系统、另一处理系统等)执行时使UE 302、基站304和网络实体306执行本文中所描述的功能性。图3A解说了RF感测模块342的可能位置,该RF感测模块342可以是例如一个或多个WWAN收发机310、存储器340、一个或多个处理器332、或其任何组合的一部分,或者可以是自立组件。图3B解说了RF感测模块388的可能位置,该RF感测模块388可以是例如一个或多个WWAN收发机350、存储器386、一个或多个处理器384、或其任何组合的一部分,或者可以是自立组件。图3C解说了RF感测模块398的可能位置,该RF感测模块398可以是例如一个或多个网络收发机390、存储器396、一个或多个处理器394、或其任何组合的一部分,或者可以是自立组件。
UE 302可包括耦合到一个或多个处理器332的一个或多个传感器344,以提供用于感测或检测移动和/或取向信息的装置,该移动和/或取向信息独立于从由一个或多个WWAN收发机310、一个或多个短程无线收发机320、和/或卫星接收机330所接收到的信号推导出的运动数据。作为示例,(诸)传感器344可包括加速度计(例如,微机电系统(MEMS)设备)、陀螺仪、地磁传感器(例如,罗盘)、高度计(例如,气压高度计)和/或任何其他类型的移动检测传感器。此外,传感器344可包括多个不同类型的设备并将它们的输出进行组合以提供运动信息。例如,(诸)传感器344可使用多轴加速度计和取向传感器的组合来提供计算二维(2D)和/或三维(3D)坐标系中的位置的能力。
另外,UE 302包括用户接口346,用户接口346提供用于向用户提供指示(例如,可听和/或视觉指示)和/或用于(例如,在用户致动感测设备(诸如按键板、触摸屏、话筒等)之际)接收用户输入的装置。尽管未示出,但基站304和网络实体306也可包括用户接口。
更详细地参照一个或多个处理器384,在下行链路中,来自网络实体306的IP分组可被提供给处理器384。一个或多个处理器384可以实现用于RRC层、分组数据汇聚协议(PDCP)层、无线电链路控制(RLC)层和媒体接入控制(MAC)层的功能性。一个或多个处理器384可提供与系统信息(例如,主信息块(MIB)、系统信息块(SIB))广播、RRC连接控制(例如,RRC连接寻呼、RRC连接建立、RRC连接修改、以及RRC连接释放)、RAT间移动性、以及用于UE测量报告的测量配置相关联的RRC层功能性;与报头压缩/解压缩、安全性(暗码化、暗码解译、完整性保护、完整性验证)、以及切换支持功能相关联的PDCP层功能性;与上层PDU的传递、通过自动重复请求(ARQ)的纠错、RLC服务数据单元(SDU)的级联、分段和重组、RLC数据PDU的重新分段、以及RLC数据PDU的重新排序相关联的RLC层功能性;以及与逻辑信道与传输信道之间的映射、调度信息报告、纠错、优先级处置、以及逻辑信道优先级排序相关联的MAC层功能性。
发射机354和接收机352可实现与各种信号处理功能相关联的层1(L1)功能性。包括物理(PHY)层的层1可包括传输信道上的检错、传输信道的前向纠错(FEC)编码/解码、交织、速率匹配、映射到物理信道上、物理信道的调制/解调、以及MIMO天线处理。发射机354基于各种调制方案(例如,二进制相移键控(BPSK)、正交相移键控(QPSK)、M相移键控(M-PSK)、M正交振幅调制(M-QAM))来处置至信号星座的映射。经译码和经调制的码元可随后被拆分成并行流。每个流随后可被映射到正交频分复用(OFDM)副载波,在时域和/或频域中与参考信号(例如,导频)复用,并且随后使用快速傅里叶逆变换(IFFT)组合到一起以产生携带时域OFDM码元流的物理信道。OFDM码元流被空间预编码以产生多个空间流。来自信道估计器的信道估计可被用来确定编码和调制方案以及用于空间处理。信道估计可从由UE 302传送的参考信号和/或信道状况反馈推导出。每个空间流随后可被提供给一个或多个不同的天线356。发射机354可用相应空间流来调制RF载波以供传输。
在UE 302,接收机312通过其相应的天线316来接收信号。接收机312恢复调制到RF载波上的信息并将该信息提供给一个或多个处理器332。发射机314和接收机312实现与各种信号处理功能相关联的层1功能性。接收机312可对该信息执行空间处理以恢复出以UE302为目的地的任何空间流。若有多个空间流以UE 302为目的地,则它们可由接收机312组合成单个OFDM码元流。接收机312随后使用快速傅里叶变换(FFT)将该OFDM码元流从时域转换到频域。频域信号对OFDM信号的每个副载波包括单独的OFDM码元流。通过确定最有可能由基站304传送的信号星座点来恢复和解调每个副载波上的码元、以及参考信号。这些软判决可基于由信道估计器计算出的信道估计。这些软判决随后被解码和解交织以恢复出原始由基站304在物理信道上传送的数据和控制信号。这些数据和控制信号随后被提供给实现层3(L3)和层2(L2)功能性的一个或多个处理器332。
在上行链路中,一个或多个处理器332提供传输信道与逻辑信道之间的解复用、分组重组、暗码解译、报头解压缩以及控制信号处理以恢复出来自核心网的IP分组。一个或多个处理器332还负责检错。
类似于结合由基站304进行的下行链路传输所描述的功能性,一个或多个处理器332提供与系统信息(例如,MIB、SIB)捕获、RRC连接、以及测量报告相关联的RRC层功能性;与报头压缩/解压缩和安全性(暗码化、暗码解译、完整性保护、完整性验证)相关联的PDCP层功能性;与上层PDU的传递、通过ARQ的纠错、RLC SDU的级联、分段和重组、RLC数据PDU的重新分段、以及RLC数据PDU的重新排序相关联的RLC层功能性;以及与逻辑信道与传输信道之间的映射、将MAC SDU复用到传输块(TB)上、从TB解复用MAC SDU、调度信息报告、通过混合自动重复请求(HARQ)的纠错、优先级处置、以及逻辑信道优先级排序相关联的MAC层功能性。
由信道估计器从由基站304传送的参考信号或反馈中推导出的信道估计可由发射机314用来选择恰适的编码和调制方案、以及促成空间处理。由发射机314生成的空间流可被提供给不同天线316。发射机314可用相应空间流来调制RF载波以供传输。
在基站304处以与结合UE 302处的接收机功能所描述的方式相类似的方式来处理上行链路传输。接收机352通过其相应的天线356来接收信号。接收机352恢复调制到RF载波上的信息并将该信息提供给一个或多个处理器384。
在上行链路中,一个或多个处理器384提供传输信道与逻辑信道之间的解复用、分组重组、暗码解译、报头解压缩、控制信号处理以恢复出来自UE 302的IP分组。来自一个或多个处理器384的IP分组可被提供给核心网。一个或多个处理器384还负责检错。
为方便起见,UE 302、基站304和/或网络实体306在图3A、图3B和图3C中被示为包括可根据本文中所描述的各种示例来配置的各种组件。然而将领会,所解说的组件在不同设计中可具有不同功能性。具体而言,图3A至3C中的各个组件在替换配置中是可任选的,并且各个方面包括可由于设计选择、成本、设备的使用、或其他考虑而变化的配置。例如,在图3A的情形中,UE 302的特定实现可以省略(诸)WWAN收发机310(例如,可穿戴设备或平板计算机或PC或膝上型设备可以具有Wi-Fi和/或蓝牙能力而没有蜂窝能力)、或者可以省略(诸)短程无线收发机320(例如,仅蜂窝等)、或者可以省略卫星接收机330、或者可以省略(诸)传感器344等等。在另一示例中,在图3B的情形中,基站304的特定实现可省略WWAN收发机350(例如,没有蜂窝能力的Wi-Fi“热点”接入点)、或者可省略短程无线收发机360(例如,仅蜂窝等)、或者可省略卫星接收机370等等。为简洁起见,各种替换配置的解说未在本文中提供,但对于本领域技术人员而言将是容易理解的。
UE 302、基站304和网络实体306的各种组件可分别在数据总线334、382和392上彼此通信地耦合。在一方面,数据总线334、382和392可分别形成UE 302、基站304和网络实体306的通信接口或作为其一部分。例如,在不同的逻辑实体被实施在相同设备中的情况下(例如,gNB和位置服务器功能性被纳入到相同基站304中),数据总线334、382和392可提供它们之间的通信。
图3A、图3B和图3C的各组件可按各种方式来实现。在一些实现中,图3A、3B和3C的组件可实现在一个或多个电路(举例而言,诸如一个或多个处理器和/或一个或多个ASIC(其可包括一个或多个处理器))中。此处,每个电路可使用和/或纳入用于存储由该电路用来提供这一功能性的信息或可执行代码的至少一个存储器组件。例如,由框310至346表示的功能性中的一些或全部功能性可由UE302的处理器和存储器组件来实现(例如,通过执行恰适的代码和/或通过恰适地配置处理器组件)。类似地,由框350至388表示的功能性中的一些或全部功能性可由基站304的处理器和存储器组件来实现(例如,通过执行恰适的代码和/或通过恰适地配置处理器组件)。此外,由框390至398表示的功能性中的一些或全部功能性可由网络实体306的处理器和存储器组件来实现(例如,通过执行恰适的代码和/或通过恰适地配置处理器组件)。为了简单起见,各种操作、动作和/或功能在本文中被描述为“由UE”、“由基站”、“由网络实体”等来执行。然而,如将领会的,此类操作、动作、和/或功能实际上可由UE 302、基站304、网络实体306等等的特定组件或组件组合(诸如处理器332、384、394、收发机310、320、350和360、存储器340、386和396、RF感测模块342、388和398等)来执行。
在一些设计中,网络实体306可被实现为核心网组件。在其他设计中,网络实体306可以不同于蜂窝网络基础设施(例如,NG RAN 220和/或5GC 210/260)的网络运营商或操作。例如,网络实体306可以是专用网络的组件,其可被配置成经由基站304或独立于基站304(例如,在非蜂窝通信链路上,诸如Wi-Fi)与UE 302进行通信。
图4是解说根据本公开的各方面的用于检测用户手势的系统400的框图。系统400包括Wi-Fi设备402(例如,启用Wi-Fi的设备)、某种类型的用户装备(UE)。Wi-Fi设备402可包括话筒404(例如,某种类型的换能器)、射频(RF)感测模块342、以及发射接收阵列408。RF感测模块342可使用Wi-Fi感测、毫米(mm)波感测、5G NR感测、另一类型的基于RF的感测、或其任何组合。RF感测模块342可以能够确定区域410(例如,房间或房间的一部分)内的移动。
用户412可以(i)进行包括一个或多个词的发声414,并且大致同时(ii)执行手势416。在该上下文中,大致同时意味着用户可在进行发声414之前大约500毫秒(ms)或更短时间或者在进行发声414之后500ms执行手势416。在一些方面,发声414的长度可长于用户执行手势416所花费的时间。发声414可包括触发词415,诸如“这”、“那”、“这里”、“那里”、或另一些触发词。在一些情形中,Wi-Fi设备402可使得用户412能够定义一个或多个触发词。如果Wi-Fi设备402确定发声414包括触发词415,则Wi-Fi设备402可创建与语音助理设备426(例如,一种类型的UE)的链路424(例如,使用Wi-Fi、蓝牙、ZigBee、或另一近场无线通信协议)。
用户412的手势416可具有相关联的运动418和相关联的方向420。方向420可与对象422相关联。对象422可以是任何类型的可控对象,包括(i)物理对象,诸如光源、媒体回放设备、百叶帘/百叶窗、加热通风空调(HVAC)控制器,诸如恒温器,或(ii)更抽象类型的对象,诸如进程、软件应用等等。对象422可包括启用Wi-Fi的控制器434以经由Wi-Fi从语音助理426接收命令433。控制器434能够基于从语音助理设备426接收的命令433来控制对象422的各种功能(例如,打开、关闭、增大、减小等等)。控制器434能够控制的功能可取决于对象422。例如,当对象422是光源时,命令433可包括打开、关闭、调亮、调暗等等。作为另一示例,当对象422是一组百叶帘或百叶窗时,命令433可包括打开或关闭。作为进一步示例,当对象422是HVAC控制器时,命令433可包括打开供暖、关闭供暖、打开空调、关闭空调、特定温度设置(例如,将温度设置为20摄氏度)、将温度增加X度、将温度减小X度等等。当对象422是媒体回放设备时,命令433可包括发起回放、暂停回放、停止回放、增大音量、减小音量、增大亮度、减小亮度、增大对比度、减小对比度、将输入源设置为Y(例如,空中或有线频道、光碟播放器、流送服务、因特网站点等等)、将音频输出发送到Z、将第一语言输出发送到A并将第二语言输出发送到B等等。
Wi-Fi设备402可使用RF感测模块342来确定与手势416相关联的运动418。为了创建增强型指挥428,Wi-Fi设备402可使用RF感测模块342来确定运动418的相对量并将该相对量转换成对象422理解的量。由此,增强型指挥428可包括与运动418相关联的相对量。例如,运动418的相对量可包括用户的手的拇指与食指之间的距离、用户的左手掌与右手掌之间的距离、或手势416的起始位置与手势416的结束位置之间的距离。
Wi-Fi设备402可使用RF感测模块342来检测手势416并使用话筒404来确定是否在与执行手势416大致同时进行了发声414。如果Wi-Fi设备402缺少话筒404,则Wi-Fi设备402可在检测到手势416之后创建链路424并向语音助理设备426发送请求429以确定是否在与执行手势416大致同时进行了发声414。例如,Wi-Fi设备402可在至语音助理设备426的请求429中包括检测到手势416的时间。语音助理设备426可将来自话筒431的音频(诸如发声414)存储在存储设备438(例如,一种类型的先入先出(FIFO)缓冲器)中。音频可与相关联的时间戳一起存储,从而使得语音助理设备426能够确定发声414是否时在与手势416大致同时进行。语音助理设备426可确定是否在与手势416大致同时进行了发声414,并(例如,经由链路424)向Wi-Fi设备402指示是否在与手势416大致同时进行了发声414。
如果Wi-Fi设备402确定执行了手势416而大致同时没有执行发声414,则Wi-Fi设备402可忽略手势416。如果Wi-Fi设备402确定在与发声414大致同时执行了手势416,则Wi-Fi设备402可确定发声414中的触发词415。Wi-Fi设备402可确定与手势416相关联的方向420并确定与方向420相关联的对象422。Wi-Fi设备402可确定与手势416相关联的运动418。在一些情形中,Wi-Fi设备402可基于发声414(包括触发词415)、对象422、手势416、运动418或其任何组合来创建增强型指挥428并将该增强型指挥428发送给语音助理设备426的技能应用编程接口(API)430。在其他情形中,Wi-Fi设备402可向基于云的服务436发送发声414(包括触发词415)、对象422、手势416、运动418或其任何组合,并且基于云的服务436可创建增强型指挥428以供Wi-Fi设备402发送给语音助理设备426的技能API 430。
语音助理设备426可经由技能API 430来接收增强型指挥428。作为响应,语音助理设备426可执行动作432。例如,动作432可包括向对象422发送命令433。对象422可在接收到命令433之后执行该命令433(例如,打开、关闭、增加X、减小X等等)。
由此,Wi-Fi设备可使用RF感测来确定用户是否在区域(例如,房间或房间的一部分)内执行了手势。当Wi-Fi设备检测到用户已执行手势之后,Wi-Fi设备可确定用户是否在与该用户执行手势大致同时进行了发声。如果Wi-Fi设备具有话筒,则Wi-Fi设备自身可确定用户是否在与该用户执行手势大致同时进行了发声。如果Wi-Fi设备缺少话筒,则Wi-Fi设备可建立至语音助理设备的链路并发送具有用户执行手势的时间的请求并要求语音助理设备确定用户是否在与该用户执行手势大致同时发出了发声。如果Wi-Fi设备确定用户在与该用户执行手势大致同时发出了发声,则Wi-Fi设备可确定该发声是否包括触发词。如果该发声包括触发词,则Wi-Fi设备可确定与手势相关联的运动和与手势相关联的方向。Wi-Fi设备可基于手势和方向并且在一些情形中基于发声来确定用户期望控制的对象。在一些情形中,Wi-Fi设备可基于发声、手势、手势的方向、与手势相关联的运动、以及对象的类型来创建增强型指挥。在其他情形中,Wi-Fi设备可向基于云的服务发送发声、手势、手势的方向、与手势相关联的运动以及对象的类型以创建增强型指挥。Wi-Fi设备可将该增强型指挥发送给语音助理设备的技能API并且该语音助理设备可执行动作,诸如向对象的控制器发送命令。该命令可使得控制器促使对象执行该命令(例如,打开、关闭、减小X、增加X等等)。以此方式,用户可以使用手势和发声两者来直观地控制语音可控对象,其中手势指示对象并且发声指示用户期望对象执行的动作。本文所描述的系统的技术优势包括用户指向对象而不是口头指定对象(例如,在客厅东北角的灯)的能力。此类系统可向具有语言障碍(或语言损伤)的用户或词汇量有限的用户提供优势,因为他们可以使用手势和简短的发声而不是长的发声来控制对象。
在图5和图6的流程图中,每个框表示可在硬件、软件或其组合中实现的一个或多个操作。在软件的上下文中,这些框表示当由一个或多个处理器执行时使处理器执行所述操作的计算机可执行指令。一般而言,计算机可执行指令包括执行特定功能或实现特定抽象数据类型的例程、程序、对象、模块、组件、数据结构等。描述各框的顺序并不旨在被理解为是限制,并且任何数目的所描述的操作可以按任何顺序被组合和/或并行进行以实现各过程。出于讨论目的,参照如上所述的图1、2、3和4来描述过程500和600,尽管可使用其他模型、框架、系统和环境来实现该过程。
图5解说了根据本公开的各方面的包括向语音助理设备的应用编程接口(API)传送增强型指挥的过程500。过程500可由图4的Wi-Fi设备402(例如,一种类型的UE)执行。
在502,该Wi-Fi设备可通过设备的话筒接收来自用户的发声。例如,在图4中,Wi-Fi设备402可从话筒404或从语音助理设备426的话筒431(例如,经由链路424)接收发声414。在一方面,502可由收发机310、320、处理器332、存储器340和传感器344执行,其中任何或全部组件可被认为是用于执行该操作的装置。
在504,该Wi-Fi设备可使用射频感测来确定用户在进行发声之时执行了手势。例如,在图4中,Wi-Fi设备402可使用RF感测模块342来确定用户412执行了手势416,并确定用户412是否在与该用户进行发声414大致同时(例如,在其之前或之后500ms内)执行了手势416。在一方面,504可由收发机310、320、处理器332、存储器340和RF感测模块342来执行,其中任何或全部组件可被认为是用于执行该操作的装置。
在506,该Wi-Fi设备可确定与手势相关联的对象。例如,在图4中,Wi-Fi设备402可确定与手势416相关联的对象422(例如,基于运动418、方向420、发声414、或其任何组合)。在一方面,506可由收发机310、320、处理器332、存储器340和RF感测模块342来执行,其中任何或全部组件可被认为是用于执行该操作的装置。
在508,该Wi-Fi设备可向语音助理设备的应用编程接口(API)传送增强型指挥。该增强型指挥基于对象、手势和发声并使得智能助理设备执行动作。例如,在图4中,Wi-Fi设备402可向语音助理设备426的技能API 430传送增强型指挥428。增强型指挥428可基于对象422、手势416、发声414、或其任何组合。增强型指挥428可使得语音助理设备426执行动作432,诸如向对象422发送命令433。在一方面,508可由收发机310、320、处理器332、存储器340和RF感测模块342来执行,其中任何或全部组件可被认为是用于执行该操作的装置。
由此,Wi-Fi设备可(经由话筒)接收来自用户的发声,(使用RF感测)确定用户在进行发声之时执行了手势,确定与手势相关联的对象,并向语音助理设备的API传送增强型指挥。增强型指挥是基于对象、手势和发声来确定的并使得智能助理设备执行动作,诸如打开对象、关闭对象、增加或减小与对象相关联的参数(例如,温度、音量等等)、或对象能够执行的另一类型的动作。
如将领会的,过程500的技术优势包括使得用户能够使用手势和简短的发声来控制对象。例如,用户可以对对象做手势(例如,指向对象)而不是口头指定对象的位置,从而使得具有语言障碍、语言损伤或词汇量有限的用户能够使用手势和简短的发声(而不是长的发声)来控制对象。用户使用手势来标识对象并使用发声来指定要对该对象执行(或由该对象执行)的动作。
图6解说了根据本公开的各方面的包括Wi-Fi设备(一种类型的UE)与语音助理设备(一种类型的UE)之间的交互的过程600。在一些情形中,过程600的一部分可由Wi-Fi设备402执行并且过程600的一部分可由语音助理设备426执行。
在602,Wi-Fi设备402使用射频感测来确定用户执行了手势。例如,在图4中,Wi-Fi设备402使用RF感测模块342来监视区域410并确定用户412何时执行了手势416。在一方面,602可由收发机310、320、处理器332、存储器340和RF感测模块342来执行,其中任何或全部组件可被认为是用于执行该操作的装置。
在604,Wi-Fi设备402进入手势模式并创建至语音助理设备的链路。例如,在图4中,Wi-Fi设备402可进入手势模式并建立Wi-Fi设备402与语音助理设备426之间的链路424。在一方面,604可由收发机310、320、处理器332和存储器340来执行,其中任何或全部组件可被认为是用于执行该操作的装置。
在606,语音助理设备426可使用话筒来捕获用户的发声。例如,在图4中,语音助理设备426可使用话筒431来捕获发声414。在一方面,606可由收发机310、320、处理器332、传感器344和存储器340来执行,其中任何或全部组件可被认为是用于执行该操作的装置。
在608,Wi-Fi设备402可(使用话筒)捕获用户的发声或者可(例如,经由链路)从语音助理设备接收发声。例如,在图4中,Wi-Fi设备402可经由话筒404捕获发声414,或者Wi-Fi设备402可(例如,经由链路424)从语音助理设备426接收发声414。在一方面,608可由收发机310、320、处理器332、传感器344和存储器340来执行,其中任何或全部组件可被认为是用于执行该操作的装置。
在610,语音助理设备426基于发声来确定语音命令。例如,在图4中,语音助理设备426可基于发声414来确定语音命令(例如,动作432)或使用基于云的服务436来确定语音命令。在一方面,610可由收发机310、320、处理器332和存储器340来执行,其中任何或全部组件可被认为是用于执行该操作的装置。
在612,Wi-Fi设备402确定与手势相关联的对象,将手势解读为(例如,与对象相关联的)技能,并创建增强型指挥。例如,在图4中,Wi-Fi设备402确定与手势416相关联的对象422,将手势416解读为与对象422相关联的技能,并创建(或使用基于云的服务436来确定)增强型指挥428。在一方面,612可由收发机310、320、处理器332、存储器340和RF感测模块342来执行,其中任何或全部组件可被认为是用于执行该操作的装置。
在614,Wi-Fi设备402向语音助理设备的应用编程接口(API)传送增强型指挥。例如,在图4中,Wi-Fi设备402(例如,经由链路424)向语音助理设备426的技能API 430发送增强型指挥428。在一方面,614可由收发机310、320、处理器332和存储器340来执行,其中任何或全部组件可被认为是用于执行该操作的装置。
在616,语音助理设备426经由API来接收增强型指挥并执行动作。例如,在图4中,语音助理设备426经由技能API 430来接收增强型指挥428。增强型指挥428使得语音助理设备426执行动作432。例如,动作432可包括向对象422发送命令433。在一方面,616可由收发机310、320、处理器332和存储器340来执行,其中任何或全部组件可被认为是用于执行该操作的装置。
由此,Wi-Fi设备可使用射频感测来确定用户执行了手势,进入手势模式,并创建至语音助理设备的链路。语音助理设备可(经由话筒)接收来自用户的发声。Wi-Fi设备可从语音助理设备接收发声。Wi-Fi设备可确定与手势相关联的对象,将手势解读为(与对象相关联的)技能,并创建增强型指挥。Wi-Fi设备向语音助理设备的技能API发送增强型指挥。增强型指挥使得智能助理设备执行动作,诸如打开对象、关闭对象、增加或减小与对象相关联的参数(例如,温度、音量等等),或使得对象执行该对象能够执行的另一类型的动作。
如将领会的,过程600的技术优势包括使得用户能够使用标识对象的手势和指定要对对象执行(或由对象执行)的动作的发声来控制该对象。例如,用户可以对对象做手势(例如,指向对象)而不是口头指定对象的位置,从而使得具有语言障碍、语言损伤或词汇量有限的用户能够使用手势和简短的发声(而不是长的发声)来控制对象。
在以上详细描述中,可以看到在各示例中不同的特征被分组在一起。这种公开方式不应被理解为示例条款具有比每一条款中所明确提及的特征更多的特征的意图。相反,本公开的各个方面可包括少于所公开的个体示例条款的所有特征。因此,所附条款由此应该被认为是被纳入到本描述中,其中每一条款自身可为单独的示例。尽管每个从属条款在各条款中可以引用与其他条款之一的特定组合,但该从属条款的(诸)方面不限于该特定组合。将领会,其他示例条款还可包括从属条款(诸)方面与任何其它从属条款或独立条款的主题内容的组合或者任何特征与其他从属和独立条款的组合。本文所公开的各个方面明确包括这些组合,除非显式地表达或可以容易地推断出并不旨在特定的组合(例如,矛盾的方面,诸如将元件同时定义为绝缘体和导体)。此外,还旨在使条款的各方面可被包括在任何其他独立条款中,即使该条款不直接从属于该独立条款。在以下经编号条款中描述了各实现示例:
条款1.一种用于指令智能助理设备执行动作的方法,该方法包括:通过话筒接收来自用户的发声;使用射频感测来确定该用户在进行该发声之时执行了手势;确定与该手势相关联的对象;以及向智能助理设备的应用编程接口(API)传送增强型指挥,该增强型指挥基于该对象、该手势和该发声,其中该增强型指挥使得该智能助理设备执行动作。
条款2.如条款1的方法,进一步包括:确定该发声包括触发词。
条款3.如条款1至2中任一者的方法,进一步包括:确定与该手势相关联的运动;确定该运动的方向;以及基于该运动的方向来标识与该手势相关联的该对象。
条款4.如条款1至3中任一者的方法,进一步包括:确定与该手势相关联的运动;确定与该运动相关联的相对量;将该相对量转换成该对象理解的量;以及在该增强型指挥中包括该量。
条款5.如条款4的方法,确定与该运动相关联的该相对量包括以下一者:确定该用户的手的拇指与食指之间的第一距离;确定该用户的左手掌与右手掌之间的第二距离;或者确定该手势的起始位置与该手势的结束位置之间的第三距离。
条款6.如条款1至5中任一者的方法,进一步包括:创建设备与该智能助理设备之间的链路。
条款7.如条款1至6中任一者的方法,其中:该手势包括指向该对象或朝向该对象做手势;以及该发声包括与该对象相关联的动作。
条款8.如条款6至7中任一者的方法,其中,该动作包括打开、关闭、调暗、调亮、增大、减小、播放、停止、暂停、定位音频对象、或其任何组合。
条款9.如条款1至8中的任一者的方法,其中该对象包括:光源、媒体回放设备、一组百叶帘或百叶窗、可控对象、加热通风空调(HVAC)控制器、或其任何组合。
本领域技术人员将领会,信息和信号可使用各种不同技术和技艺中的任何一种来表示。例如,贯穿上面说明始终可能被述及的数据、指令、命令、信息、信号、比特、码元和码片可由电压、电流、电磁波、磁场或磁粒子、光场或光粒子、或其任何组合来表示。
此外,本领域技术人员将领会,结合本文中所公开的方面描述的各种解说性逻辑块、模块、电路、和算法步骤可被实现为电子硬件、计算机软件、或两者的组合。为清楚地解说硬件与软件的这一可互换性,各种解说性组件、块、模块、电路、以及步骤在上面是以其功能性的形式作一般化描述的。此类功能性是被实现为硬件还是软件取决于具体应用和施加于整体系统的设计约束。技术人员可针对每种特定应用以不同方式来实现所描述的功能性,但此类实现决策不应被解读为致使脱离本公开的范围。
结合本文所公开的各方面描述的各种解说性逻辑块、模块、以及电路可以用设计成执行本文所描述的功能的通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其他可编程逻辑器件、分立的门或晶体管逻辑、分立的硬件组件、或其任何组合来实现或执行。通用处理器可以是微处理器,但在替换方案中,处理器可以是任何常规的处理器、控制器、微控制器、或状态机。处理器还可被实现为计算设备的组合,例如数字信号处理器(DSP)与微处理器的组合、多个微处理器、与DSP核心协作的一个或多个微处理器、或任何其他此类配置。
结合本文所公开的各方面描述的方法、序列和/或算法可直接在硬件中、在由处理器执行的软件模块中、或在这两者的组合中体现。软件模块可驻留在随机存取存储器(RAM)、闪存、只读存储器(ROM)、可擦式可编程ROM(EPROM)、电可擦式可编程ROM(EEPROM)、寄存器、硬盘、可移动盘、压缩碟(CD)-ROM、光碟、或本领域已知的任何其他形式的存储介质中。示例存储介质被耦合到处理器,以使得处理器能从/向该存储介质读取/写入信息。在替换方案中,存储介质可被整合到处理器。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端(例如,UE)中。在替换方案中,处理器和存储介质可作为分立组件驻留在用户终端中。
在一个或多个示例方面,所描述的功能可在硬件、软件、固件或其任何组合中实现。若在软件中实现,则各功能可作为一条或多条指令或代码存储在计算机可读介质上或藉其进行传送。计算机可读介质包括计算机存储介质和通信介质两者,包括促成计算机程序从一地向另一地转移的任何介质。存储介质可以是能被计算机访问的任何可用介质。作为示例而非限定,此类计算机可读介质可包括RAM、ROM、EEPROM、CD-ROM或其他光盘存储、磁盘存储或其他磁存储设备、或能用于携带或存储指令或数据结构形式的期望程序代码且能被计算机访问的任何其他介质。同样,任何连接也被正当地称为计算机可读介质。例如,如果软件是使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)、或诸如红外、无线电、以及微波之类的无线技术从网站、服务器、或其他远程源传送的,则该同轴电缆、光纤电缆、双绞线、DSL、或诸如红外、无线电、以及微波之类的无线技术就被包括在介质的定义之中。如本文所使用的盘(disk)和碟(disc)包括压缩碟(CD)、激光碟、光碟、数字多用碟(DVD)、软盘和蓝光碟,其中盘(disk)往往以磁的方式再现数据,而碟(disc)用激光以光学方式再现数据。以上的组合应当也被包括在计算机可读介质的范围内。
虽然前面的公开示出了本公开的解说性方面,但是应当注意,在其中可作出各种变更和修改而不会脱离如所附权利要求定义的本公开的范围。根据本文中所描述的本公开的各方面的方法权利要求中的功能、步骤和/或动作不必按任何特定次序来执行。此外,尽管本公开的要素可能是以单数来描述或主张权利的,但是复数也是已料想了的,除非显式地声明了限定于单数。
Claims (30)
1.一种用于指令智能助理设备执行动作的方法,所述方法包括:
通过话筒接收来自用户的发声;
使用射频感测来确定所述用户在进行所述发声之时执行了手势;
确定与所述手势相关联的对象;以及
向智能助理设备的应用编程接口(API)传送增强型指挥,所述增强型指挥基于所述对象、所述手势和所述发声,其中所述增强型指挥使得所述智能助理设备执行动作。
2.如权利要求1所述的方法,进一步包括:
确定所述发声包括触发词。
3.如权利要求1所述的方法,进一步包括:
确定与所述手势相关联的运动;
确定所述运动的方向;以及
基于所述运动的方向来标识与所述手势相关联的所述对象。
4.如权利要求1所述的方法,进一步包括:
确定与所述手势相关联的运动;
确定与所述运动相关联的相对量;
将所述相对量转换成所述对象理解的量;以及
在所述增强型指挥中包括所述量。
5.如权利要求4所述的方法,确定与所述运动相关联的所述相对量包括以下一者:
确定所述用户的手的拇指与食指之间的第一距离;
确定所述用户的左手掌与右手掌之间的第二距离;或者
确定所述手势的起始位置与所述手势的结束位置之间的第三距离。
6.如权利要求1所述的方法,进一步包括:
创建设备与所述智能助理设备之间的链路。
7.如权利要求1所述的方法,其中:
所述手势包括指向所述对象或朝向所述对象做手势;以及
所述发声包括与所述对象相关联的动作。
8.如权利要求6所述的方法,其中,所述动作包括打开、关闭、调暗、调亮、增大、减小、播放、停止、暂停、定位音频对象、或其任何组合。
9.如权利要求1所述的方法,其中,所述对象包括:
光源、媒体回放设备、一组百叶帘或百叶窗、可控对象、加热通风空调(HVAC)控制器、或其任何组合。
10.一种设备,包括:
存储器;
至少一个收发机;以及
通信地耦合到所述存储器和所述至少一个收发机的至少一个处理器,所述至少一个处理器被配置成:
通过话筒接收来自用户的发声;
使用射频感测来确定所述用户在进行所述发声之时执行了手势;
确定与所述手势相关联的对象;以及
向智能助理设备的应用编程接口(API)传送增强型指挥,所述增强型指挥基于所述对象、所述手势和所述发声,其中所述增强型指挥使得所述智能助理设备执行动作。
11.如权利要求10所述的设备,进一步包括:
确定所述发声包括触发词。
12.如权利要求10所述的设备,进一步包括:
确定与所述手势相关联的运动;
确定所述运动的方向;以及
基于所述运动的方向来标识与所述手势相关联的所述对象。
13.如权利要求10所述的设备,进一步包括:
确定与所述手势相关联的运动;
确定与所述运动相关联的相对量;
将所述相对量转换成所述对象理解的量;以及
在所述增强型指挥中包括所述量。
14.如权利要求13所述的设备,确定与所述运动相关联的所述相对量包括以下一者:
确定所述用户的手的拇指与食指之间的第一距离;
确定所述用户的左手掌与右手掌之间的第二距离;或者
确定所述手势的起始位置与所述手势的结束位置之间的第三距离。
15.如权利要求10所述的设备,进一步包括:
创建所述设备与所述智能助理设备之间的链路。
16.如权利要求10所述的设备,其中:
所述手势包括指向所述对象或朝向所述对象做手势;以及
所述发声包括与所述对象相关联的动作。
17.如权利要求16所述的设备,其中,所述动作包括打开、关闭、调暗、调亮、增大、减小、播放、停止、暂停、定位音频对象、或其任何组合。
18.如权利要求10所述的设备,其中,所述对象包括:
光源、媒体回放设备、一组百叶帘或百叶窗、可控对象、加热通风空调(HVAC)控制器、或其任何组合。
19.一种装备,包括:
用于接收来自用户的发声的装置;
用于确定所述用户在进行所述发声之时执行了手势的装置;
用于确定与所述手势相关联的对象的装置;以及
用于向智能助理设备的应用编程接口(API)传送增强型指挥的装置,所述增强型指挥基于所述对象、所述手势和所述发声,其中所述增强型指挥使得所述智能助理设备执行动作。
20.如权利要求19所述的装备,进一步包括:
用于确定所述发声包括触发词的装置。
21.如权利要求19所述的装备,进一步包括:
用于确定与所述手势相关联的运动的装置;
用于确定所述运动的方向的装置;以及
用于基于所述运动的方向来标识与所述手势相关联的所述对象的装置。
22.如权利要求19所述的装备,进一步包括:
用于确定与所述手势相关联的运动的装置;
用于确定与所述运动相关联的相对量的装置;
用于将所述相对量转换成所述对象理解的量的装置;以及
用于在所述增强型指挥中包括所述量的装置。
23.如权利要求22所述的装备,用于确定与所述运动相关联的所述相对量的装置包括以下一者:
用于确定所述用户的手的拇指与食指之间的第一距离的装置;
用于确定所述用户的左手掌与右手掌之间的第二距离的装置;或者
用于确定所述手势的起始位置与所述手势的结束位置之间的第三距离的装置。
24.如权利要求19所述的装备,进一步包括:
用于创建设备与所述智能助理设备之间的链路的装置。
25.如权利要求19所述的装备,其中:
所述手势包括指向所述对象或朝向所述对象做手势;以及
所述发声包括与所述对象相关联的动作。
26.如权利要求25所述的装备,其中,所述动作包括打开、关闭、调暗、调亮、增大、减小、播放、停止、暂停、定位音频对象、或其任何组合。
27.如权利要求19所述的装备,其中所述对象包括:
光源、媒体回放设备、一组百叶帘或百叶窗、可控对象、加热通风空调(HVAC)控制器、或其任何组合。
28.一种用于存储指令的非瞬态计算机可读存储介质,所述指令能由一个或多个处理器执行以:
通过话筒接收来自用户的发声;
使用射频感测来确定所述用户在进行所述发声之时执行了手势;
确定与所述手势相关联的对象;以及
向智能助理设备的应用编程接口(API)传送增强型指挥,所述增强型指挥基于所述对象、所述手势和所述发声,其中所述增强型指挥使得所述智能助理设备执行动作。
29.如权利要求28所述的非瞬态计算机可读存储介质,进一步包括:
确定与所述手势相关联的运动;
确定所述运动的方向;以及
基于所述运动的方向来标识与所述手势相关联的所述对象。
30.如权利要求28所述的非瞬态计算机可读存储介质,其中:
所述手势包括指向所述对象或朝向所述对象做手势;以及
所述发声包括与所述对象相关联的动作。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GR20210100393 | 2021-06-16 | ||
GR20210100393 | 2021-06-16 | ||
PCT/US2022/072131 WO2022266565A1 (en) | 2021-06-16 | 2022-05-05 | Enabling a gesture interface for voice assistants using radio frequency (re) sensing |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117480471A true CN117480471A (zh) | 2024-01-30 |
Family
ID=82019336
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280041756.3A Pending CN117480471A (zh) | 2021-06-16 | 2022-05-05 | 使用射频(rf)感测来实现语音助理的手势接口 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20240221752A1 (zh) |
EP (1) | EP4356223A1 (zh) |
KR (1) | KR20240019140A (zh) |
CN (1) | CN117480471A (zh) |
BR (1) | BR112023025440A2 (zh) |
TW (1) | TW202303351A (zh) |
WO (1) | WO2022266565A1 (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140033045A1 (en) * | 2012-07-24 | 2014-01-30 | Global Quality Corp. | Gestures coupled with voice as input method |
KR20160071732A (ko) * | 2014-12-12 | 2016-06-22 | 삼성전자주식회사 | 음성 입력을 처리하는 방법 및 장치 |
CN107801413B (zh) * | 2016-06-28 | 2020-01-31 | 华为技术有限公司 | 对电子设备进行控制的终端及其处理方法 |
KR20190106939A (ko) * | 2019-08-30 | 2019-09-18 | 엘지전자 주식회사 | 증강현실기기 및 이의 제스쳐 인식 캘리브레이션 방법 |
-
2022
- 2022-05-05 EP EP22730020.9A patent/EP4356223A1/en active Pending
- 2022-05-05 WO PCT/US2022/072131 patent/WO2022266565A1/en active Application Filing
- 2022-05-05 CN CN202280041756.3A patent/CN117480471A/zh active Pending
- 2022-05-05 BR BR112023025440A patent/BR112023025440A2/pt unknown
- 2022-05-05 KR KR1020237042843A patent/KR20240019140A/ko unknown
- 2022-05-05 US US18/558,991 patent/US20240221752A1/en active Pending
- 2022-05-06 TW TW111117217A patent/TW202303351A/zh unknown
Also Published As
Publication number | Publication date |
---|---|
TW202303351A (zh) | 2023-01-16 |
WO2022266565A8 (en) | 2023-11-09 |
WO2022266565A1 (en) | 2022-12-22 |
EP4356223A1 (en) | 2024-04-24 |
US20240221752A1 (en) | 2024-07-04 |
BR112023025440A2 (pt) | 2024-02-27 |
KR20240019140A (ko) | 2024-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116325985A (zh) | 侧链路定位 | |
CN115777208A (zh) | 测量间隙的动态配置 | |
CN115698760A (zh) | 用于位置检测的基于无线通信的跨载波感测 | |
CN115803649A (zh) | 基于用例特定无线通信的雷达参考信号 | |
KR20240065242A (ko) | 밀리미터파 (mmw) 통신들을 위한 다중-센서 보조 최대 전력 노출 (mpe) 동작들 | |
KR20240031295A (ko) | 단거리 레이더를 사용한 인간 근접 센서 | |
US11974176B2 (en) | Inter-radio access technology handoff procedure | |
US11546396B1 (en) | Prioritization of frames associated with recovery for video streaming session | |
CN117356158A (zh) | 集成接入和骨干(iab)网络中的有条件授权 | |
CN117480825A (zh) | 用户设备发起的侧链路定位资源配置的选择 | |
CN116075736A (zh) | 增强型定位测量报告和增强型测量时段 | |
US20240221752A1 (en) | Enabling a gesture interface for voice assistants using radio frequency (rf) sensing | |
US12032083B2 (en) | Reconfigurable intelligent surface assisted radio frequency fingerprinting for positioning | |
US11711772B2 (en) | Power control scheme for active bandwidth part transition | |
US20230243915A1 (en) | Reconfigurable intelligent surface assisted radio frequency fingerprinting for positioning | |
US11683761B2 (en) | At least partial disablement of transmission port based on thermal condition and associated capability indication | |
US20240064689A1 (en) | Signaling of measurement prioritization criteria in user equipment based radio frequency fingerprinting positioning | |
US20220322072A1 (en) | Quasi co-location source reference signal capability for transmission configuration indication state | |
CN117769865A (zh) | 交叠定位方法请求的优先级排序和执行 | |
TW202349995A (zh) | 蜂巢式系統中的機會rf感測 | |
KR20240064640A (ko) | 업링크 전력-제한 사용자 장비를 위한 포지셔닝 방법 | |
CN117546551A (zh) | 经由对用于定位的辅助数据的请求的侧链路用户装备报告及其用途 | |
CN117044291A (zh) | 演进分组系统回退呼叫过程期间的频率间测量的打孔 | |
CN117157908A (zh) | 针对定位的动态精度要求和优选子阵列指示 | |
CN117769829A (zh) | 具有数据部分和尾部部分的基于保护间隔的波形 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |