CN110555295A - 用于运载工具中的可靠命令的系统和方法 - Google Patents
用于运载工具中的可靠命令的系统和方法 Download PDFInfo
- Publication number
- CN110555295A CN110555295A CN201910476771.0A CN201910476771A CN110555295A CN 110555295 A CN110555295 A CN 110555295A CN 201910476771 A CN201910476771 A CN 201910476771A CN 110555295 A CN110555295 A CN 110555295A
- Authority
- CN
- China
- Prior art keywords
- voice
- data
- vehicle
- aircraft
- processing system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 124
- 238000012545 processing Methods 0.000 claims abstract description 140
- 238000010276 construction Methods 0.000 claims abstract description 82
- 230000004044 response Effects 0.000 claims abstract description 27
- 238000004891 communication Methods 0.000 claims description 33
- 230000008569 process Effects 0.000 description 50
- 238000005516 engineering process Methods 0.000 description 22
- 238000013475 authorization Methods 0.000 description 17
- 230000005540 biological transmission Effects 0.000 description 17
- 230000006870 function Effects 0.000 description 16
- 238000007726 management method Methods 0.000 description 13
- 230000015654 memory Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 230000008901 benefit Effects 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- 230000000007 visual effect Effects 0.000 description 7
- RZVHIXYEVGDQDX-UHFFFAOYSA-N 9,10-anthraquinone Chemical compound C1=CC=C2C(=O)C3=CC=CC=C3C(=O)C2=C1 RZVHIXYEVGDQDX-UHFFFAOYSA-N 0.000 description 6
- 239000000446 fuel Substances 0.000 description 6
- 230000009471 action Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 230000001815 facial effect Effects 0.000 description 3
- 230000033001 locomotion Effects 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000002207 retinal effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- 210000003462 vein Anatomy 0.000 description 2
- 235000015842 Hesperis Nutrition 0.000 description 1
- 235000012633 Iberis amara Nutrition 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/08—Network architectures or network communication protocols for network security for authentication of entities
- H04L63/0861—Network architectures or network communication protocols for network security for authentication of entities using biometrical features, e.g. fingerprint, retina-scan
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B64—AIRCRAFT; AVIATION; COSMONAUTICS
- B64D—EQUIPMENT FOR FITTING IN OR TO AIRCRAFT; FLIGHT SUITS; PARACHUTES; ARRANGEMENT OR MOUNTING OF POWER PLANTS OR PROPULSION TRANSMISSIONS IN AIRCRAFT
- B64D45/00—Aircraft indicators or protectors not otherwise provided for
- B64D45/0015—Devices specially adapted for the protection against criminal attack, e.g. anti-hijacking systems
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B64—AIRCRAFT; AVIATION; COSMONAUTICS
- B64D—EQUIPMENT FOR FITTING IN OR TO AIRCRAFT; FLIGHT SUITS; PARACHUTES; ARRANGEMENT OR MOUNTING OF POWER PLANTS OR PROPULSION TRANSMISSIONS IN AIRCRAFT
- B64D45/00—Aircraft indicators or protectors not otherwise provided for
- B64D45/0015—Devices specially adapted for the protection against criminal attack, e.g. anti-hijacking systems
- B64D45/0051—Devices specially adapted for the protection against criminal attack, e.g. anti-hijacking systems by monitoring passengers or crew on aircraft
- B64D45/0056—Devices specially adapted for the protection against criminal attack, e.g. anti-hijacking systems by monitoring passengers or crew on aircraft detecting passenger or crew behavior by sensors, e.g. biometrics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2221/00—Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/21—Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F2221/2111—Location-sensitive, e.g. geographical location, GPS
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/10—Network architectures or network communication protocols for network security for controlling access to devices or network resources
- H04L63/105—Multiple levels of security
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/10—Network architectures or network communication protocols for network security for controlling access to devices or network resources
- H04L63/108—Network architectures or network communication protocols for network security for controlling access to devices or network resources when the policy decisions are valid for a limited amount of time
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Acoustics & Sound (AREA)
- Computer Security & Cryptography (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- General Health & Medical Sciences (AREA)
- Aviation & Aerospace Engineering (AREA)
- Software Systems (AREA)
- Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Lock And Its Accessories (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
- Selective Calling Equipment (AREA)
Abstract
提供了用于运载工具控制的系统和方法。示例实施例中的计算机实施的方法可以包括:(502)在包括位于运载工具中的一个或多个处理器的计算系统处,接收来自位于运载工具中的一个或多个音频传感器的语音数据。系统可以(504)至少部分地基于与运载工具相关联的性能数据来确定用于运载工具的语音处理系统的参考声纹的构造是否被授权。响应于确定参考声纹的构造被授权,(508)可以存储基于参考语音数据的第一参考声纹,并且语音处理系统构造成(510)基于参考声纹认证用于第一组语音命令的输入语音数据。
Description
技术领域
本公开大体涉及运载工具(vehicle),并且更具体地涉及用于运载工具的控制系统。
背景技术
运载工具(诸如飞行器)可以依赖于一个或多个推力装置,例如用于推进运载工具和移动控制的喷气涡轮发动机,涡轮风扇发动机和涡轮喷气发动机,以及用于控制运载工具的推进和移动的一个或多个控制表面。控制表面包括升降舵,方向舵,副翼,扰流板,襟翼,板条,空气制动器或配平装置等。各种致动器,伺服电动机和其他装置可用于操纵控制表面和推力装置。除了用于推进和运动控制的系统之外,飞行器通常包括许多与任务相关的系统,例如通信系统,包括惯性和卫星导航系统的导航系统,飞行管理系统和各种航空电子系统。通常,运载工具包括多个控制系统,以允许操作员(诸如飞行员,机组成员和其他授权人员)与各种运载工具系统交互。通常提供许多用户接口以允许授权人员操作各种运载工具系统。
发明内容
所公开的技术的方面和优点将部分地在以下描述中阐述,或者可以从描述中显而易见,或者可以通过实践本公开来学习。
根据本公开的示例方面,提供了一种计算机实施的方法,该方法包括:在包括位于运载工具中的一个或多个处理器的计算系统处接收来自位于运载工具中的一个或多个音频传感器的语音数据;通过计算系统,至少部分地基于与运载工具相关联的性能数据来确定用于运载工具的语音处理系统的参考声纹的构造是否被授权;响应于确定参考声纹的构造被授权,通过计算系统存储基于语音数据的第一参考声纹;通过计算系统,将语音处理系统构造成基于第一参考声纹来认证用于第一组语音命令的语音数据。
根据本公开的其他示例方面,提供了一种系统,该系统包括位于运载工具中并且被构造为生成语音数据的一个或多个传感器,以及一个或多个处理器。一个或多个处理器被构造为:从位于运载工具中的一个或多个音频传感器接收语音数据;至少部分地基于与运载工具相关联的性能数据来确定用于运载工具的语音处理系统的参考声纹的构造是否被授权;响应于确定参考声纹的构造被授权,存储基于语音数据的第一参考声纹;并且将语音处理系统构造成基于参考声纹认证用于第一组语音命令的语音数据。
根据本公开的其他示例方面,提供了一种存储计算机指令的非暂时性计算机可读介质,所述计算机指令在由一个或多个处理器执行时使得一个或多个处理器执行操作。操作包括:从运载工具的一个或多个传感器接收包括本地生成的语音命令的第一语音数据;将本地生成的语音命令与第一组授权命令进行比较;将第一语音数据与一个或多个参考声纹进行比较;至少部分地基于与一个或多个参考声纹中的至少一个相对应的第一语音数据和与第一组授权命令相对应的本地生成的语音命令,授权本地生成的语音命令用于执行;利用运载工具的无线接口接收包括远程生成的语音命令的第二语音数据;将远程生成的语音命令与第二组授权命令进行比较;以及至少部分地基于与第二组授权命令相对应的远程生成的语音命令来授权远程生成的语音命令。
根据本公开的其他示例方面,提供了一种计算机实施的方法,包括:在包括位于运载工具中的一个或多个处理器的计算系统处,从位于运载工具中的一个或多个传感器接收传感器数据;在计算系统处至少部分地基于与运载工具相关联的性能数据来确定用于运载工具的控制处理系统的参考生物特征的构造是否被授权;响应于确定参考生物特征的构造被授权,存储基于参考生物特征数据的第一参考生物特征;以及将控制处理系统构造成基于参考生物特征来认证第一组控制命令的输入。
参考以下描述和所附权利要求,将更好地理解所公开技术的这些和其他特征,方面和优点。包含在本说明书中并构成其一部分的附图示出了所公开技术的各方面,并且与说明书一起用于解释所公开技术的原理。
附图说明
在说明书中阐述了针对本领域普通技术人员的本公开的完整且可行的公开,包括其最佳模式,其参考附图,其中:
图1是描绘其中可以实践本公开的实施例的飞行器和驾驶舱的示例的框图;
图2是描绘根据本公开的示例实施例的飞行器的机载计算系统的框图;
图3是描绘根据本公开的示例实施例的语音处理系统的框图;
图4是根据本公开示例实施例的语音处理系统的认证单元的框图;
图5是根据本公开示例实施例的语音处理系统的声纹构造单元的框图;
图6是描述根据本公开示例实施例的构造用于飞行器的语音处理系统的参考声纹的处理的流程图;
图7是描述根据本公开示例实施例的授权用于飞行器的语音处理系统的参考声纹的构造的处理的流程图;
图8是描述根据本公开示例实施例的授权用于飞行器的语音处理系统的检测到的语音命令的处理的流程图;
图9是描述根据本公开示例实施例的使用语音处理系统控制飞行器的驾驶舱门的门锁机构的处理的流程图;
图10是描述使用多组参考语音命令授权检测到的语音命令的处理的流程图;和
图11描绘了其中可以实施本公开的示例方面的计算系统的示例的框图。
具体实施方式
现在将详细参考本公开的实施例,其一个或多个示例在附图中示出。通过解释而非限制所公开的实施例的方式来提供每个示例。实际上,对于本领域技术人员显而易见的是,在不脱离权利要求的范围或精神的情况下,可以在本公开中进行各种修改和变化。例如,作为示例实施例的一部分示出或描述的特征可以与另一实施例一起使用以产生又一实施例。因此,本公开旨在覆盖落入所附权利要求及其等同物的范围内的这些修改和变化。
如说明书和所附权利要求中所使用的,单数形式“一”,“一种”和“该”包括复数指示物,除非上下文另有明确说明。术语“约”与数值的结合使用是指所述量的25%以内。
本公开的示例方面指向用于提供用于控制运载工具的用户接口的系统和方法,更具体地,涉及用于运载工具(诸如飞行器)的语音或语音启用控制系统的系统和方法。根据示例实施例,提供了一种用于运载工具的语音处理系统,其使得飞行员或其他操作员能够安全且可靠地提供用于控制各种运载工具系统的语音命令。语音处理系统可在多用户环境中操作,例如在商业航空公司应用中,其中许多飞行员和机组成员可操作飞行器队。可以通过使用临时参考声纹来可靠地认证用户来解决多用户环境,该临时参考声纹是实时生成的并且在有限的时间段内被授权。可以响应于参考声纹构造的授权来生成临时参考声纹,以提供语音处理系统的可靠操作。在示例实施例中,参考声纹构造的授权可以至少部分地基于运载工具性能数据。在一些示例中,临时声纹的使用使得能够认证而无需长期存储用户生物特征信息(biometric information)。
用于飞行器控制的传统语音命令系统通常依赖复杂的生物特征数据库或其他类似技术,以便认证系统的用户。例如,传统系统可以为系统的授权用户存储指纹数据库。当机组成员试图使用该系统时,机组成员提供输入生物特征信息,然后该生物特征信息被与数据库进行比较。这些数据库可以存储在飞行器上,需要大量的本地存储,或者可以在认证过程中远程存储和访问。在某些情况下,这样的系统可能会引起隐私担忧。另外,在用户数量大且不断改变的情况下,这样的系统可能难以实施。
根据所公开技术的示例实施例,提供了一种语音处理系统,其能够实现用于控制飞行器的安全且可靠的语音命令。在一些示例中,系统能够实现输入语音命令的源的认证,以限制将语音命令用于预授权人员的能力。此外,为飞行员或其他机组成员经常改变的环境提供认证,例如在商业航空公司应用中。另外,在一些示例中可以提供认证,而不需要长期存储用户生物特征信息。以这种方式,系统可以解决限制存储个人生物特征信息的能力的特定地区的法律或规定。此外,该系统适用于通过实时生成临时参考声纹来改变用户,然后在此后有限的时间段内授权这些声纹。
在一些实施方式中,系统从位于飞行器中(例如飞行器的驾驶舱中)的一个或多个音频传感器接收音频数据。系统可以确定用于飞行器的语音处理系统的参考声纹的构造是否被授权。可以至少部分地基于与飞行器相关联的性能数据来做出确定。在各种实施例中,性能数据可以基于从飞行器的一个或多个传感器接收的传感器数据。例如,性能数据可以指示位置,速度,高度或到飞行器的外部连接的状态。系统可以分析性能数据以确定运载工具是否处于安全或可靠的操作状态。如果系统确定参考声纹的构造被授权,则可以基于音频数据生成并存储参考声纹。然后,系统可以将语音处理系统构造成基于参考声纹认证与一组或多组语音命令相关联的附加语音数据。一组或多组语音命令可以与控制飞行器相关联。
在存储参考声纹并构造语音处理系统之后,系统可以接收用于控制飞行器的附加语音数据。系统可以基于将附加语音数据与参考声纹进行比较来选择性地授权语音命令中的一个或多个的执行。可以授权参考声纹用于在有限或预定的时间量内认证语音数据。例如,参考声纹可以在飞行开始之前或飞行开始时生成。系统可以在相关联的飞行期间授权参考声纹用于语音认证,并且在后续飞行期间禁用基于参考声纹的语音数据的认证。这可以在没有预定或存储的用户生物特征信息的情况下完成。然而,在其他示例中,可以使用这样的生物特征信息来提供附加认证以提供附加可靠性。
使用所描述的技术,当系统确定运载工具处于可靠操作状态时,系统可以使飞行员或其他用户能够构造参考声纹。例如,在从门到跑道的飞行的推出阶段(rollout phase)期间,系统可以确定运载工具处于可靠操作状态。系统也可以确定在附加飞行阶段期间飞行器处于可靠操作状态。这样,当飞行器处于已知的可靠状态时,驾驶舱中从飞行员或其他机组成员接收的音频可用于生成参考声纹。在推出阶段期间第一语音数据可以与来自飞行器的空中交通控制通信相关联。在相关的飞行期间可以授权该参考声纹来认证输入语音数据。在飞行结束时,可以丢弃(例如从系统中删除)参考声纹。以这种方式,可以满足禁止或限制存储生物特征信息的法律或其他规定。然而,可以以安全且可靠的方式生成在飞行期间用于认证的参考声纹。因此,可以在飞行期间使用参考声纹以禁止未授权的用户使用语音命令引起运载工具操作。同时,飞行员或其他机组成员不需要提供长期存储的生物特征信息。
在一些示例中,语音处理系统利用多组授权语音命令。各组授权语音命令可以与从其接收语音数据的不同用户,用户组,装置或源(例如,接口)相关联。这允许不同的人员访问不同的语音命令,并且提供用于使用远程语音命令的独特能力。例如,在一些示例中,语音处理系统可以被构造为通过与空中交通控制系统的无线通信接口检测语音命令。某些命令(例如用于改变飞行器的通信系统的操作频率的命令)可以被授权用于通过远程音频链路控制。另一方面,其他语音命令可能未被授权远程使用。
根据所公开技术的实施例的包括语音处理系统的授权的语音命令可以提供用于控制飞行器的各种可靠系统的独特能力。例如,许多飞行器包括驾驶舱门,其可以从驾驶舱侧锁定以防止未授权人员从飞行器的其他部分进入。根据所公开技术的实施例,语音命令可用于以可靠的方式锁定和/或解锁驾驶舱门。例如,可以从驾驶舱外部接收语音命令以解锁驾驶舱门。可以将语音数据与临时参考声纹进行比较。如果语音数据与临时参考声纹匹配,则可以解锁门。在各种实施例中,可以提供附加的可靠性措施,例如语音数据中的压力(stress)的检测,以及覆盖驾驶舱内部的输入的能力。
所公开技术的实施例提供了许多技术益处和优点,特别是在飞行器领域。作为一个示例,本文描述的技术使得能够以安全且可靠的方式使用语音命令来控制飞行器。更具体地,飞行器性能数据可用于授权生成临时参考声纹。这种用于使用飞行器的语音命令的技术可以克服依赖永久生物特征数据存储和访问的传统技术的缺点。而且,这种技术可以解决由多个用户操作的飞行器队的独特需求。飞行器性能数据可用于授权生成临时参考声纹,以使飞行员或其他机组成员能够以可靠的方式控制飞行器。
所公开技术的实施例还在计算技术领域中提供了许多技术益处和优点。例如,所公开的系统可以获得性能数据以生成临时参考声纹。这种技术可以避免永久生物特征数据存储的高资源需求。另外,这种技术可以通过计算系统提供更有效的处理以认证语音。更有效的处理可以用于构造语音处理系统,并且此后操作语音处理系统以授权用于控制飞行器的语音命令。
图1描绘了根据本公开的示例实施例的飞行器100。如图所示,飞行器100可包括机身120,一个或多个发动机130和驾驶舱140。发动机130可用于飞行器100的推进和/或机载动力生成。发动机130可以是燃气涡轮发动机(例如喷气涡轮发动机),涡轮螺旋桨发动机,涡轮风扇发动机,涡轮轴发动机,或任何其他合适的发动机(包括活塞发动机螺旋桨,电驱动风扇或螺旋桨),或任何以上的混合。尽管飞行器100被描绘为固定翼飞行器,但是在其他示例实施例中,飞行器可以是旋翼飞行器,小型固定翼飞行器,陆空混合飞行器,无人驾驶飞行器,或一些其他类型的飞行器。此外,本公开的主题可以应用于其他类型的运载工具,包括但不限于陆基运载工具(例如客车,货车和装备车),水陆两用运载工具(例如水陆组合工具),水上运载工具(例如船只和潜艇),航天器(例如卫星和火箭),其他运载工具,或其某些组合等。在示例实施例中,驾驶舱140可包括具有各种仪器144和飞行显示器146的驾驶舱142。应当理解,仪器144可以包括但不限于刻度盘,仪表或任何其他合适的模拟装置。
飞行器100可另外包括一个或多个传感器116。一个或多个传感器116可用于检测与发动机130,飞行器100,和/或飞行器外部和/或内部的大气相关的一个或多个参数。一个或多个传感器116可以将一个或多个检测到的参数通信到各种系统,例如飞行管理系统(FMS)和/或运载工具控制系统(VCS)。在一些实施方式中,一个或多个传感器可将参数通信到一个或多个外部部件。
第一用户(例如,飞行员)可以存在于座位148中,并且第二用户(例如,副飞行员)可以存在于座位150中。飞行甲板142可以位于飞行员和副飞行员的前方,并且可以为机组成员(例如,飞行员和副飞行员)提供信息以帮助操作飞行器100。飞行显示器146可包括主飞行显示器(PFD),多功能控制显示单元(MCDU),导航显示器(ND)或任何合适的组合。在飞行器100的操作期间,仪器144和飞行显示器146都可以显示用于飞行器100的操作和控制的运载工具,飞行,导航和其他信息中的众多信息。
仪器144和飞行显示器146可以以任何方式(包括具有更少或更多的仪器或显示器)布置。此外,飞行显示器146不需要是共面的并且不需要具有相同的尺寸。触摸屏显示器或触摸屏表面(未示出)可以包括在飞行显示器146中,并且可以由一个或多个飞行机组成员(包括飞行员和副飞行员)使用以与飞行器100交互。触摸屏表面可以采用任何合适的形式(包括液晶显示器(LCD)),并且可以使用各种物理或电气属性来感测来自飞行机组成员的输入。可以预期飞行显示器146可以是动态的,并且一个或多个光标控制装置(未示出)和/或一个或多个多功能键盘152可以包括在驾驶舱140中并且可以由一个或多个飞行机组成员使用,以与飞行器100的系统交互。以这种方式,飞行甲板142可以被认为是飞行机组成员和飞行器100之间的用户接口。
另外,驾驶舱140可包括操作者操纵的输入装置160,其允许飞行机组成员控制飞行器100的操作。在一个示例实施例中,操作者操纵的输入装置160可用于控制一个或多个发动机130的发动机动力。更具体地,操作者操纵的输入装置160可包括具有手柄的杆,并且杆可在第一位置和第二位置之间移动。这样,飞行机组成员可以在第一和第二位置之间移动杆以控制一个或多个发动机130的发动机动力。应当理解,飞行员可以将杆移动到设置在第一位置和第二位置之间的多个中间第三位置中的一个。
在一些示例中,特别是关于直升机,飞行员可以坐在右侧,副飞行员坐在左侧,而在固定翼飞行器中,飞行员通常坐在左侧。在某些情况下,例如某些官方的或特定应用的飞行器,飞行器可能具有彼此对齐的多个飞行员和/或导航员,例如前方的飞行员和后方的副飞行员/导航员。对于一些直升机,飞行员可以位于后方并且操作构件位于前方,或反之亦然。
示例飞行器100的部件的数量,位置和/或取向是出于说明和讨论的目的,而不是旨在限制。因此,使用本文提供的公开内容,本领域普通技术人员将理解,在不脱离本公开的范围的情况下,可以调节飞行器100的部件的数量,位置和/或取向。
现在参考图2,飞行器100可以包括机载计算系统200,该机载计算系统200包括一个或多个通信网络220,该通信网络220包括例如一个或多个数据总线,和/或有线和/或无线通信链路的组合。通信网络220将一个或多个机载计算装置202联接到飞行器100上的各种系统。在图2中,例如,机载计算系统200包括一个或多个机载计算装置202,显示系统204,通信系统206,语音处理系统208,航空电子系统210,飞行管理系统212,运载工具控制系统214和传感器116。在示例实施例中,机载计算装置202可以包括或实施图2中描绘的系统中的任何一个或组合。该飞行器可以包括用于通过卫星,甚高频(VHF)无线电,和/或高频(HF)无线电进行通信的数据链路协议,例如飞行器通信寻址和报告系统(ACARS)。
显示系统204可以包括飞行器100的图1中描绘的飞行显示器146。更具体地,显示系统204可以包括一个或多个显示装置,其被构造为显示或以其他方式提供由机载计算系统200生成或接收的信息。在示例实施例中,由机载计算系统200生成或接收的信息可以显示在一个或多个显示装置上,以供飞行器100的飞行机组成员查看。显示系统204可包括主飞行显示器,多功能控制显示单元,或通常包括在飞行器100的驾驶舱140(图1)内的其他合适的飞行显示器146。
在一些实施方式中,飞行管理系统212可包括飞行控制系统和导航系统。在其他实施方式中,飞行控制系统和导航系统可以与飞行管理系统212分离。在示例实施例中,飞行控制系统可以控制或自动执行飞行任务,并且飞行管理系统可以根据飞行器100的飞行计划来控制或自动执行导航和引导的任务。飞行控制系统可以包括任何合适数量的单独微处理器,电源,存储装置,接口卡,自动飞行系统,飞行管理计算机和其他标准部件,或与之相关联。飞行控制系统可以包括或配合任何数量的软件程序(例如,飞行管理程序)或指令,其被设计执行用于飞行器100的操作所需的各种方法,处理任务,计算和控制/显示功能。飞行控制系统可以与机载计算装置202分离,或者可以包括在机载计算装置中或由机载计算装置实施。
飞行器控制系统214可以被构造为执行各种飞行器操作并控制与飞行器100相关联的各种设置和参数。例如,飞行器控制系统214可以与一个或多个发动机130和/或飞行器100的其他部件相关联。飞行器控制系统214可包括例如数字控制系统,节流系统,惯性参考系统,飞行仪器系统,发动机控制系统,辅助动力系统,燃料监测系统,发动机振动监测系统,通信系统,襟翼控制系统,飞行数据采集系统,飞行管理系统,着陆系统和其他系统。
在一些实施方式中,运载工具控制系统214包括一个或多个发动机控制器。例如,在一些实施例中,运载工具控制系统214可以包括用于每个发动机130的电子发动机控制器(EEC)。在其他示例中,运载工具控制系统214可以包括全权限数字引擎控制(FADEC)系统。FADEC系统通常用于具有两个或多个发动机的飞行器,因为FADEC系统动态地控制每个燃气涡轮发动机的操作并且需要飞行员的最小(如果有的话)监督。运载工具控制系统可以包括其他控制系统,例如燃料控制系统,其包括一个或多个构造成控制一个或多个发动机130的燃料流动的燃料控制器。
航空电子系统210表示飞行器的一个或多个电子系统,其被构造为执行一个或多个单独的飞行器功能。航空电子系统的示例包括通信系统,导航系统,天气系统,雷达系统,空中交通系统,地面接近警告系统等。例如,在一些实施方式中,航空电子系统可以包括位置系统或与位置系统通信。位置系统可以包括全球定位系统(GPS),惯性参考系统等。
图2的各种系统可以确定来自从一个或多个传感器116接收的传感器数据的飞行器性能数据。在一些实施方式中,传感器数据包括与发动机130,飞行器100和/或飞行器外部的大气相关的一个或多个参数。在一些示例中,一个或多个传感器116可以将一个或多个检测到的参数通信到各种系统。运载工具参数可以直接包括在传感器数据内,或者可以从传感器数据中导出。举例来说,运载工具参数可包括位置(例如,GPS坐标),速度,运载工具姿态和/或取向,爬升和/或下降速率,前进方向,各种压力,温度,燃料流速,和/或有关飞行器的当前操作条件的任何其他信息。可以使用所描述的任何合适的存储技术在本地存储性能数据。在一些示例中,性能数据从飞行器传感器数据中导出。例如,可以分析多个位置坐标以便确定飞行器的预计轨迹(projected trajectory)。在其他示例中,性能数据可以直接包括飞行器传感器数据。例如,飞行器传感器中的一个或多个可以直接提供飞行器速度的测量。
根据所公开技术的实施例,机载计算系统200包括语音处理系统208。语音处理系统208被构造为在机组成员或与飞行器相关联的其他授权人员和各种飞行器系统之间提供用户接口。在一些示例中,语音处理系统208可以基于在由一个或多个传感器116检测到的音频中检测到的语音命令来发起或以其他方式引起系统响应。例如,语音处理系统208可以通过向机载计算系统200的一个或多个其他系统发出控制信号来响应检测到的语音命令。语音处理系统208可以识别语音命令并且作为响应,将适当的控制信号发出到机载计算系统200的适当的部件。以这种方式,语音处理系统208在机组成员(包括飞行员)和飞行器的系统中的一个或多个之间提供语音启用的接口。
语音处理系统208附加地提供可靠性功能以禁止在飞行器上未授权使用语音命令。可以提供可靠功能而无需长期存储用户生物特征信息。然而,一些实施方式可以利用附加的生物特征信息来提供附加的可靠功能。语音处理系统208可以启用临时参考声纹的生成和使用,以限制系统对来自授权用户的语音命令的响应。在一些示例中,语音处理系统208确定用于语音处理系统的参考声纹的构造是否被授权。在一些实施例中,该确定可以至少部分地基于与飞行器相关联的性能数据。语音处理系统208可以被构造为将参考声纹构造限制到飞行器处于可靠操作状态的时间。以这种方式,系统可以禁止未授权用户生成参考声纹。
为了提供增强的可靠性,语音处理系统208可以被构造为在生成参考声纹之前确定是否已经接收到确认飞行器的可靠操作状态的多个输入。识别可靠操作状态的输入可包括识别飞行器飞行的阶段的输入,识别与语音数据相关联的传感器的输入,识别语音数据的定位(localization)的输入,识别附加的生物特征信息是否被认证的输入,和/或识别飞行器的状况或与飞行器有关的环境的其他输入。
机载计算系统200(包括机载计算装置202和图2中描绘的各种其他系统)通常可以包括一个或多个处理器和相关联的存储器,其被构造为执行各种计算机实施的功能,例如本文公开的各种方法,步骤,计算等。在一些示例中,控制系统(诸如发动机控制系统和/或燃料控制系统)可以是可编程逻辑装置(诸如现场可编程门阵列(FPGA)),然而它们可以使用任何合适的硬件和/或软件来实施。
术语处理器通常可以指集成电路,并且还可以指控制器,微控制器,微计算机,可编程逻辑控制器(PLC),专用集成电路(ASIC),现场可编程门阵列(FPGA),以及其他可编程电路。另外,本文描述的存储器通常可以包括存储器元件,该存储器元件包括但不限于计算机可读介质(例如,随机存取存储器(RAM)),计算机可读非易失性介质(例如,闪存),压缩光盘只读存储器(CD-ROM),磁光盘(MOD),数字通用光盘(DVD)和/或其他合适的存储元件,或其组合。
机载计算系统200的系统中的任何一个或组合还可以包括通信接口。通信接口可以包括用于发送和接收数据的相关电子电路。更具体地,通信接口可用于在各种控制系统中的任何系统之间发送和接收数据。类似地,在控制器中的任何一个处的通信接口可用于与外部部件(诸如另一个飞行器和/或地面控制)通信。通信接口可以是合适的有线或无线通信接口的任何组合。
机载计算系统200的图2中描绘的不同系统可以实施为硬件,软件或硬件和软件的组合。软件可以存储为处理器可读代码并且在处理器中实施,例如作为用于编程处理器的处理器可读代码。例如,在一些实施方式中,部件中的一个或多个可以单独实施或与一个或多个其他部件组合实施,作为被设计用于与其他单元一起使用的封装功能硬件单元(例如,一个或多个电子电路),可由通常执行相关功能的特定功能的处理器执行的程序代码(例如,软件或固件)的一部分,或者与更大系统接口的独立硬件或软件部件。例如,每个单元可以包括专用集成电路(ASIC),现场可编程门阵列(FPGA),电路,数字逻辑电路,模拟电路,分立电路的组合,门,或任何其他类型的硬件,或其组合。替代地或附加地,这些部件可以包括存储在处理器可读装置(例如,存储器)中的软件,以对处理器进行编程以执行本文描述的功能。图2中描绘的架构是一个示例实施方式。这些各种基于计算的元件可以在单个计算装置处构造,或者可以在多个计算装置上分布。
图3是描绘根据所公开技术的示例实施例的语音处理系统208的附加细节的框图。语音处理系统208包括一个或多个音频接口,其被构造为从一个或多个源接收和传输模拟和/或数字通信信号。在该示例中,音频接口252与飞行器100上的一个或多个音频传感器270通信。音频传感器270是传感器116(图2)的一个示例。音频传感器270可以包括驾驶舱或飞行器的其他位置内的麦克风或其他音频输入装置。音频接口252附加地与空中交通控制系统280通信。音频接口252可以包括无线接口。音频接口252可以包括用于通过卫星,甚高频(VHF)无线电和/或高频(HF)无线电通信的数据链路协议,例如飞行器通信寻址和报告系统(ACARS)。飞行器可包括一个或多个构造成发送和接收空中交通控制命令的传输器。传输器可以构造为在多个频带上传输消息。用于空中交通控制通信的频带或信道可能在飞行期间改变。例如,当控制从一个空中交通控制塔移交到另一个空中交通控制塔时,飞行器可以改变通信频率。
语音处理系统208附加地包括认证单元256,语音识别单元258,声纹构造单元260,语音命令系统262和一个或多个可选的生物特征接口254。生物特征接口254可以与飞行器100上的一个或多个生物特征传感器272通信。生物特征传感器272可以被构造为从一个或多个人员(例如飞行器的飞行员和/或副飞行员)接收输入生物特征信息(例如指纹,视网膜扫描,静脉图案,视觉面部信息或其他个人识别信息)。虽然未示出,但语音处理系统208可包括生物特征数据存储器,或与之通信。生物特征数据存储器可用于存储识别标志(signature),例如参考声纹,指纹或授权用户的其他参考生物特征信息。
语音识别单元258被构造为从音频输入识别单词,短语或其他信息。在一个实施例中,语音识别单元258被构造为在不利用训练数据的情况下操作。以这种方式,语音识别单元258可以被构造为可操作以检测来自多个输入源的语音的通用识别单元。在其他示例中,语音识别单元258可以使用训练数据来辅助语音识别。
认证单元256被构造为认证输入语音数据,以便基于输入语音数据中包括的语音命令来确定是否执行或以其他方式引起系统响应。例如,认证单元256可以访问一个或多个参考声纹,以确定是否授权执行包括在输入语音数据中的语音命令。可以将输入语音数据与参考声纹进行比较。如果输入语音数据包括与参考声纹匹配的识别标志或声纹,则可以执行检测到的语音命令。然而,如果输入语音数据不与参考声纹中的一个或多个匹配,则可以拒绝或以其他方式忽略检测到的语音命令。注意,认证单元256可以包括附加输入,以便确定是否执行语音命令。例如,除了参考声纹之外,认证单元256还可以将经由生物特征接口254接收的输入生物特征信息与参考生物特征识别标志进行比较,以便确定是否执行语音命令。
在一些示例中,认证单元256可以认证各个语音命令。例如,特定的参考声纹可以与一个或多个语音命令组264相关联,该一个或多个语音命令组264被授权以引起系统响应。认证单元256可以确定检测到的语音命令是否在参考声纹被授权用于的一组预定的语音命令中。在图3中,语音命令组264被示出为语音命令系统262的一部分。在其他示例中,语音命令可以被包括作为认证单元256的一部分,或者可以被单独存储但是两个单元都可访问。
声纹构造单元260被构造为生成并存储参考声纹以用于认证输入语音数据。声纹构造单元260可以至少部分地基于与飞行器相关联的性能数据来确定声纹构造是否被授权。例如,声纹构造单元260可以在授权参考声纹构造之前确定飞行器100是否处于可靠操作状态。以这种方式,语音处理系统208可以提供用于确保授权的语音命令使用的可靠方法,而不需要对于各个用户的先前存储的或可访问的生物特征信息。然而,应注意,声纹构造单元260可以在确定是否授权声纹构造中利用附加的生物特征信息(诸如认证单元256的结果)。
语音命令系统262被构造为在语音处理系统208和飞行器100的一个或多个部件之间提供接口。在该示例中,语音命令系统262被示出与运载工具控制系统214,飞行管理系统212和航空电子系统210接口。语音命令系统262可以响应于来自输入语音数据的检测到的语音命令,通过系统中的一个或多个引起系统响应。例如,语音识别单元258可以检测输入语音数据中的第一语音命令。认证单元256可以基于参考声纹来认证输入语音数据。这可以包括认证参考声纹被授权用于检测到的语音命令。语音命令系统262可以基于输入语音命令来确定适当的系统响应。例如,语音命令系统262可以基于检测到的语音命令向适当的系统(诸如运载工具控制系统214)发出控制信号。在一个示例中,控制信号可以是用于适当的系统的输入命令。控制信号可以通过飞行器的适当的系统引起系统响应。
语音命令系统262可以存储一个或多个语音命令组264。语音命令组可以识别一个或多个授权的语音命令。每个语音命令可以与一个或多个用户或用户组相关联。例如,语音命令组可以与第一组授权用户相关联,并且第二语音命令组可以与第二组授权用户相关联。如下文将更详细描述的,第一命令组可用于授权本地生成的语音命令,并且第二命令组可识别授权的远程生成的语音命令。语音命令系统262可以将检测到的语音命令与一个或多个语音命令组进行比较,以确定是否授权检测到的语音命令。另外,语音命令组264可以将语音命令的翻译存储到适当的系统响应或控制信号中。尽管示出为语音命令系统262的一部分,但是语音命令组264可以由其他单元和系统存储或访问。例如,认证单元256可以利用语音命令组264作为认证语音命令或输入语音数据的一部分。
图4是描绘根据所公开技术的示例实施例的认证单元256的附加细节的框图。认证单元256包括飞行器(AV)状态认证单元354,语音认证单元352,指纹认证单元356,视觉认证单元358和生物特征数据存储器360。
认证单元256可以执行认证操作以确定参考声纹构造是否被授权用于飞行器。另外,认证单元256可以执行认证操作,用于确定检测到的语音命令是否被认证以通过语音处理系统执行。在声纹构造操作期间,认证单元256可用于确定声纹构造是否被授权。例如,认证单元256可以认证各种信息和/或信息源以确定是否应该进行声纹构造。在一些示例中,认证单元256可用于在不访问生物特征信息的情况下确定是否授权声纹构造。在其他示例中,生物特征信息可以用作声纹构造操作的授权的一部分。在语音命令处理操作期间,认证单元256可以用于确定是否应该执行检测到的语音命令。
生物特征数据存储器360可以存储本地生成的参考识别标志362和/或预先验证的参考识别标志364。本地生成的参考识别标志362可以包括由声纹构造单元260生成的参考声纹。这样,本地生成的参考识别标志362的存储可以是临时的。预先验证的参考识别标志364可以包括语音处理系统的授权用户的参考识别标志(例如,指纹,声纹,视网膜扫描,静脉识别标志等)。预先验证的参考识别标志364可以用作声纹构造的授权处理和/或语音命令检测的认证处理的一部分。生物特征数据存储器360可以包括用于存储本地生成的参考识别标志362和/或预先验证的参考识别标志364的任何合适的数据存储器。生物特征数据存储器360可以包括任何合适的数据存储技术,例如被构造为存储相关信息的数据库,文件,数据结构等。在一些实施例中,数据存储器可以包括硬盘驱动器,RAM(随机存取存储器),ROM(只读存储器),闪存等中的一个或多个的任何组合。数据存储器可以存储由语音处理系统访问的信息,和/或由语音处理系统生成的数据。
语音认证单元352被构造为基于一个或多个参考声纹来认证语音数据。语音认证单元352可以用作声纹构造操作的授权处理的一部分,以及在正常操作期间的检测到的语音命令的认证处理期间使用。通常,语音认证单元352可以将语音数据与一个或多个参考声纹进行比较。如果在参考声纹与输入语音数据之间检测到阈值相似性,则语音认证单元352可以认证语音数据。
在参考声纹构造操作期间,语音认证单元352可用于基于预先验证的参考识别标志364来认证语音数据的源。如其他地方所述,这不是必需的。例如,系统可以使用不需要生物特征信息的其他技术来确定声纹构造是否被授权。
在正常操作期间,语音认证单元352将输入语音数据与一个或多个本地生成的参考识别标志362进行比较。如所述的,本地生成的参考识别标志362可以包括在声纹构造操作期间生成的临时参考声纹。语音认证单元352可以用于确定检测到的语音命令和输入语音数据是否应该由系统执行。在一些示例中,语音认证单元352可以从输入语音数据生成声纹以与参考声纹进行比较。
AV状态认证单元354被构造为认证飞行器的操作状态。在示例实施例中,AV状态认证单元354至少部分地基于与飞行器的一个或多个传感器相关联的性能数据来认证飞行器的操作状态。作为示例,AV状态认证单元354可以使用位置信息,速度信息,高度信息,外部连接信息(例如,飞行器是否连接到诸如HVAC,动力,加油系统等的外部系统),以及根据性能数据确定的任何其他信息,以认证飞行器的操作状态。
指纹认证单元356被构造为基于预先验证的参考识别标志364中包括的一个或多个参考指纹来认证输入指纹信息。类似地,视觉认证单元358被构造为基于预先验证的参考识别标志364中包括的一个或多个参考视觉识别标志来认证输入视觉信息。例如,视觉认证单元358可以使用面部识别技术来执行认证。如前所述,指纹认证单元356和视觉认证单元358是可选的。
图5是描绘根据所公开技术的示例实施例的声纹构造单元260的附加细节的框图。声纹构造单元260包括构造授权单元382和参考声纹生成器384。构造授权单元382可操作以确定参考声纹构造是否被授权。更具体地,在一个示例中,构造授权单元382可以确定是否已经接收到确认飞行器的可靠操作状态的多个输入。例如,多个输入可用于确定运载工具是否处于飞行的推出阶段。推出阶段是指其中飞行器在门和跑道之间移动的飞行阶段。在推出阶段期间,可以认为飞行器处于可靠操作状态。AV状态认证单元354可基于这些输入中的一个或多个来确定飞行器是否处于推出阶段。例如,AV状态认证单元354可以确定飞行器速度,高度和位置是否指示飞行器在机场处处于推出阶段。构造授权单元382可附加地使用认证单元256的一个或多个输出来确定参考声纹的构造是否被授权。例如,构造授权单元382可以确定语音数据是否与一个或多个预先验证的参考声纹匹配,和/或其他生物特征输入信息是否与其他预先验证的参考识别标志匹配。
参考声纹生成器384被构造为基于语音数据生成一个或多个参考声纹。在一些示例中,参考声纹生成器384可以从授权的语音数据生成参考声纹。参考声纹可以是可操作以唯一地识别音频源的任何合适的音频识别标志。
在一些示例中,可以在飞行中授予附加声纹的授权。可靠认证可用于飞行中在人员之间添加或传输语音控制。例如,切换命令可以由已经授权的语音发出,例如由座位中的飞行员说出预定短语。在理解该短语时,系统可以进入构造模式以允许在构造时间段内从座位的位置提供来自下一个语音的语音命令。在另一个例子中,可以使用生物特征。例如,当在特定传感器(例如,控制杆传感器)上提供授权指纹时,来自传感器位置的语音将被授权。
图6是描述根据所公开技术的示例实施例的用于飞行器的语音处理系统的构造参考声纹的示例处理500的流程图。在一些实施方式中,例如,处理500可以由图3的语音处理系统208实施。图6描绘了出于说明和讨论的目的以特定顺序执行的步骤。使用本文提供的公开内容,本领域普通技术人员将理解,在不脱离本公开的范围的情况下,可以以各种方式调整,修改,重新布置,同时执行或修改本文公开的任何方法或处理的各个步骤。
在(502)处,获得与飞行器的一个或多个音频传感器相关联的第一语音数据。第一语音数据可以被称为参考语音数据,因为它将有条件地用于生成参考声纹。第一语音数据可以从飞行器内的特定音频传感器接收,例如位于驾驶舱或飞行器的其他预定位置内的麦克风。第一语音数据可以直接从一个或多个音频传感器获得,或者可以从临时存储位置获得。
在(504)处,确定用于飞行器的语音处理系统的参考声纹的构造是否被授权。在一些示例中,在(504)处确定构造是否被授权是至少部分地基于飞行器的性能数据。例如,系统可以使用性能数据来确定飞行器的操作状态。系统可以基于性能数据确定飞行器是否处于推出阶段或者处于可靠操作状态。生物特征信息也可用于确定构造是否被授权。另外,可以认证参考语音数据的源以确定构造是否被授权。例如,系统可以仅基于从飞行器上的预定传感器组(例如从特定的麦克风或位于驾驶舱中的麦克风)接收的音频数据来允许参考声纹构造。
如果参考声纹的构造被授权,则在(506)处基于参考语音数据生成一个或多个参考声纹。在(508)处,存储一个或多个参考声纹以由语音处理系统使用。在(510)处,语音处理系统被构造为基于参考声纹认证附加语音数据。系统可以基于参考声纹实现认证以及语音命令授权。
如果参考声纹的构造未被授权,如在(504)处确定的,则在(512)处可以将任何当前参考声纹应用于语音处理系统。
图7是描绘根据所公开技术的示例实施例的用于确定参考声纹的构造是否被授权用于飞行器的语音处理系统的处理550的流程图。在一些示例中,处理550可以在图6中描绘的处理500的(504)处执行。在一些实施方式中,处理550可以由语音处理系统208的构造授权单元382执行。
在(552)处,为要构造语音处理系统的飞行器获得飞行器性能数据。在(552)处可以获得各种性能数据。性能数据可以包括或者来自与飞行器的一个或多个传感器相关联的传感器数据。传感器数据可以包括或表示飞行器的一个或多个测量参数,例如速度,加速度,高度,温度或与飞行器相关的任何其他参数。在示例实施例中,认证单元256可以直接从一个或多个传感器接收传感器数据,或者可以从存储器或其他存储位置接收传感器数据。
在(554)处,至少部分地基于性能数据确定飞行器的操作状态。系统可以分析指示速度,高度,位置或其他性能数据的性能数据,以确定飞行器的操作状态。举例来说,在一些实施例中,操作状态可对应于特定飞行阶段。系统可以确定飞行器是否处于预出发阶段,推出阶段,起飞阶段,爬升阶段,巡航阶段,下降阶段,着陆阶段,滑行阶段或到达阶段等。
在(556)处,确定飞行器是否处于可靠操作状态。例如,在示例实施例中,参考声纹构造可以限于飞行的一个特定阶段或多个特定阶段。这些一个或多个飞行阶段可以对应于可靠操作状态。在(556)处,系统可以确定飞行器是否处于被确定为参考声纹构造的可靠操作状态的一个或多个阶段。举例来说,系统可以确定飞行器是否处于对应于机场门和起飞跑道之间的位置的推出阶段。在其他示例中,可以确定其他飞行阶段对应于可靠操作状态。
如果系统确定飞行器未处于可靠操作状态,则处理550继续到(572)处。在(572)处,系统拒绝或否定试图的参考声纹构造。
如果确定飞行器处于可靠操作状态,则处理550继续到(558)处。在(558)处,识别与输入语音数据相关联的一个或多个传感器。在(560)处,系统确定所识别的传感器是否被授权用于参考声纹构造。以这种方式,系统可以将参考声纹构造限制到飞行器内的特定音频传感器。例如,系统可以将参考声纹构造限制到位于飞行器的驾驶舱中的一个或多个麦克风。在一些示例中,麦克风可以是与飞行器的特定驾驶舱座椅相关联的悬挂式麦克风。在另一示例中,麦克风可以是与飞行器的特定耳机相关联的麦克风。如果系统确定语音数据不与授权传感器相关联,则处理550继续到(572)处。
如果系统确定语音数据与授权传感器相关联,则处理550继续到(562)处。在(562)处,语音数据的源定位在飞行器内。系统可以确定语音数据在飞行器内的来源位置。在(564)处,确定该位置是否是参考声纹构造的授权位置。举例来说,系统可以将参考声纹构造限制到特定的驾驶舱座椅或飞行器的驾驶舱内的驾驶舱座椅。在其他示例中,可以将其他位置指定为用于参考声纹构造的授权位置。如果系统确定语音数据来源的位置未授权,则处理550继续到(572)处。
如果系统确定位置被授权,则处理550继续到(566)处。在(566)处,可以获得附加的生物特征数据以认证语音数据的源。例如,系统可以获得指纹,声纹,面部识别数据或任何其他自识别信息,以进一步认证语音数据的源。
在(568)处,确定附加的生物特征数据是否被认证。例如,系统可以将附加的生物特征数据与本地存储的或从远程位置检索的参考生物特征数据进行比较,以认证附加生物特征数据的源。块(566)和(568)是可选的。如果附加生物特征数据未被认证,则处理550继续到(572)处。
如果附加生物特征数据被认证,则处理550继续到(570)处。在(570)处,参考声纹构造被授权用于飞行器的语音处理系统。系统可以继续从所接收的作为语音处理系统的输入的参考语音数据生成参考声纹。
注意,在处理550中执行的特定认证操作仅作为示例提供。在其他实施例中可以执行附加认证。类似地,在其他实施例中可以执行更少的认证。特别注意,在(566)处和(558)处使用附加生物特征数据执行的认证是可选的,但是可以提供附加的可靠级别。
图8是描述根据所公开技术的示例实施例的用于基于参考声纹认证与一个或多个语音命令相关联的输入语音数据的处理600的流程图。在一些示例中,处理600可以由语音识别系统执行。在一个实施例中,处理600由认证单元256执行。
在(602)处,从飞行器上的一个或多个音频传感器接收输入语音数据。例如,输入语音数据可以由位于飞行器的驾驶舱中的一个或多个麦克风接收,以捕获飞行器的飞行员或其他操作者的语音命令。
在(604)处,对输入语音数据执行语音识别。可以使用任何合适的语音识别技术来检测音频信号中的单词,短语或其他有意义的符号。在(606)处,系统从输入语音数据识别一个或多个运载工具语音命令。在一个实施例中,运载工具语音命令可以是存储在认证单元可访问的存储器中的预定语音命令。语音命令可以与一个或多个飞行器功能相关联或以其他方式控制一个或多个飞行器功能。这些功能可以是例如但不限于发动机控制功能,导航功能,飞行管理功能和/或飞行器的任何其他期望的功能。
在(608)处,确定检测到的语音命令是否需要认证。确定是否需要认证可以在如下实施方式中执行,其中希望在没有认证的情况下允许一些运载工具语音命令执行并且在有认证的情况下允许其他运载工具语音命令执行。另外,可以执行(608)以允许不同的用户访问不同的语音命令。在(608)处的确定是可选的。在一些示例中,可能需要对所有运载工具语音命令进行认证。如果需要认证,则处理600继续到(610)处。在(610)处,输入语音数据被认证。可以使用由认证单元存储的一个或多个参考声纹来认证输入语音数据。如果检测到的语音命令的源未被认证,则处理600继续到(616)处。在(616)处,系统拒绝检测到的语音命令。在拒绝检测到的语音命令之后,处理600可以继续到(602)处,以接收附加的输入语音数据。
在(612)处,如果认证了检测到的语音命令的源,则处理600继续到(614)处。在(614)处,检测到的语音命令被授权用于由语音处理系统执行。在(614)处,系统可以基于检测到的语音命令启用系统响应。在一些示例中,系统可以向飞行器的另一系统(例如飞行管理系统,导航系统,运载工具控制系统或其他系统)发出一个或多个控制信号,以便基于检测到的语音命令来呼叫系统响应。在一些示例中,系统可以维护语音命令和系统响应之间的翻译数据库。
如前所述,语音处理系统可以使用语音命令来控制飞行器的多个系统。使用语音命令的一些特定示例可能特别适合于飞行器的独特要求,特别是用于商业应用的那些,其中安全性和限制访问将被提供给飞行器的部分。举例来说,现代飞行器通常配备有锁定驾驶舱门以限制对授权用户的访问。销,密码或钥匙可用于解锁门并允许授权人员进入。虽然这些技术可能是有益的,但是可以进行改进。例如,利用如本文所述的语音命令和认证技术可以为商业航空的飞行器的独特需求提供附加的安全性和可靠性以及灵活性。
图9是描述根据本公开技术的示例实施例的用于控制飞行器的驾驶舱门的自动门锁定机构的处理650的流程图。可以结合根据所公开技术的示例实施例的语音处理系统来执行处理650。在(652)处,在键盘或适于提供数字,文本和/或其他输入的其他输入机构处接收授权码(诸如pin,密码或其他可靠符号)。键盘定位在飞行器的驾驶舱外部,以允许用户通过解锁驾驶舱门来尝试进入到驾驶舱中。然而,系统不仅仅基于键盘输入来解锁驾驶舱门。相反,系统等待解锁门的语音命令,以便在解锁门之前进行进一步认证。
在(654)处,系统识别运载工具语音命令以解锁驾驶舱门。在(656)处,输入语音数据被认证用于解锁命令。例如,认证单元256可以确定输入语音数据的语音识别标志是否与认证单元存储的一个或多个参考声纹匹配。参考声纹可以与被授权的各组运载工具语音命令相关联。在(658)处,确定输入语音数据是否被认证用于解锁语音命令。在(658)处,系统可以确定对应于输入语音数据的参考声纹是否被授权用于特定语音命令。如果源未被认证用于语音命令,则拒绝或忽略尝试解锁门。注意,即使在(652)处接收到用于解锁门的适当授权码,门也可能不被解锁。
如果输入语音数据的源被认证用于语音命令,则在(660)处确定输入语音数据是否与压力条件(stress condition)相关联。认证单元可以将输入语音数据的语音识别标志与指示压力语音的一个或多个参考声纹进行比较,以确定输入语音数据是否与压力发言者相关联。可以使用其他技术来确定输入语音数据是否指示压力条件。可以执行(660)处的处理,以便拒绝可能处于苦恼状态(distressed state)的发言者的进入。这可以帮助避免试图劫持或其他未授权的进入飞行器的驾驶舱。例如,未授权的用户可以强制授权用户说出语音命令来解锁门。通过检测语音中的压力条件,系统可以拒绝语音命令。
如果在(660)处在语音中检测到压力,则在(668)处拒绝解锁门的尝试。如果在语音中未检测到压力,则处理650继续到(662)处。在(662)处,系统确定内部驾驶舱控制信号是否指示驾驶舱门应该被锁定。飞行器的许多驾驶舱门在驾驶舱内具有输入,其控制驾驶舱门的锁定。例如,输入可以控制内部控制信号。在(662)处,系统可以确定内部控制信号是否指示驾驶舱门应该被锁定。如果信号没有肯定门应该被锁定,则处理650继续到(666)处。在(666)处,发出命令以解锁驾驶舱门。如果内部驾驶舱控制信号指示门应该被锁定,则可以在(664)处发出第一命令以覆盖(override)内部驾驶舱控制信号。可以使用用于覆盖驾驶舱内部和输入的其他技术。在(664)处的覆盖在驾驶舱中的授权用户拒绝打开门的情况下可能是有用的。在(664)处的处理可以确保即使驾驶舱内的用户拒绝这样的进入,也允许其他授权用户进入驾驶舱。在重写内部信号之后,在(666)处发出解锁驾驶舱门的命令。
图10是描述使用多个授权命令组授权飞行器上的语音命令的处理700的流程图。在该示例中,第一组授权语音命令用于本地生成的语音命令,第二组授权语音命令用于远程生成的语音命令。本地生成的语音命令是从本地音频装置或传感器检测到的语音命令。例如,本地生成的语音命令可以是从驾驶舱麦克风或飞行器上的其他麦克风接收的语音命令。远程生成的语音命令是从远程音频装置或传感器检测到的语音命令。例如,远程生成的语音命令可以是通过经由通信接口与空中交通控制系统或与飞行器通信的其他远程系统通信的无线连接接收的语音命令。在一些示例中,处理700可以由语音处理系统208执行,并且更具体地,由认证单元256和/或语音命令系统262执行。
在(702)处,语音处理系统接收语音命令。语音命令可以是从包括语音数据的输入音频源检测到的语音命令。在一些示例中,可以在认证单元256处从语音识别单元258接收语音命令。在(704)处,分析语音命令以确定它是来自远程还是本地音频源。例如,系统可以确定语音命令是源自本地音频传感器(270)的本地生成的语音命令还是源自空中交通控制系统280的远程生成的语音命令。
如果语音命令是远程生成的语音命令,则处理700继续到(706)处。在(706)处,访问一组授权的远程语音命令。例如,可以访问包括授权的远程语音命令的语音命令组264。在(708)处,将接收的语音命令与该组授权的远程语音命令进行比较。
如果接收的语音命令在该组授权的远程语音命令内,则处理700继续到(710)。在(710)处,认证包括远程语音命令的音频数据。在(712)处,系统确定音频数据是否被认证用于语音命令。注意,块(710)和(712)是可选的。在一些示例中,不对远程生成的语音命令(例如通过与空中交通控制系统的无线连接接收的那些语音命令)执行认证。如果使用认证,则在(710)处可以应用各种技术来认证远程语音命令的音频数据。在一个示例中,可以如先前描述的使用参考声纹来执行语音数据的认证。然而,可以使用其他技术来认证不需要使用声纹的远程生成的语音命令。这在可以使用多个远程语音命令源从而实际上维持准确的一组声纹是有问题的情形下可能是有用的。在一个示例中,信号可以嵌入在远程生成的语音命令的音频数据中。认证单元可以确定语音数据是否包括嵌入信号,以便认证远程生成的语音命令。在一个示例中,嵌入信号可以是可由语音处理系统检测的可听见信号,但不能被人耳检测到。在其他示例中,可以使用不同类型的嵌入信号。
在(712)处,如果用于语音命令的音频数据被认证,则处理700继续到(714)处。在(714)处,检测到的语音命令被授权执行。在一些示例中,认证单元256可以向语音命令系统262提供授权语音命令的指示。语音命令系统262可以基于语音命令生成系统响应。在一些示例中,语音命令系统262可以基于检测到的语音命令生成到飞行器的一个或多个附加系统的控制信号。如果在(712)处未认证用于语音命令的音频数据,则处理700继续到(716)处。在(716)处,检测到的语音命令被拒绝并且不由飞行器的语音处理系统或另一系统执行。
如果语音命令是本地生成的语音命令,则处理700继续到(718)处。在(718)处,访问一组授权的本地语音命令。在(720)处,将检测到的语音命令与该组授权的本地语音命令进行比较。如果检测到的语音命令不在该组授权的本地语音命令内,则处理700继续到(716)处,在(716)处检测到的语音命令被拒绝。
如果检测到的语音命令在该组授权的本地语音命令内,则处理700继续到(722)处。在(722)处,使用如前所述的临时参考声纹来认证包括本地生成的语音命令的语音数据。在(724)处,系统确定语音数据是否被成功认证。如果语音数据被成功认证,则处理700继续到(714)处,在714)处检测到的语音命令被授权执行。如果语音数据未被成功认证,则处理700继续到(716)处,在(716)处检测到的语音命令被拒绝。
虽然已经关于远程生成的语音命令和本地生成的语音命令描述了处理700,但是根据所公开技术的实施例可以利用替代或附加的命令组。例如,特定的参考声纹可以与单独的命令或命令组相关联,使得语音识别系统的不同用户可以被授权用于不同组的语音命令。作为特定示例,飞行员的参考声纹可以与第一组语音命令相关联,并且机组成员的参考声纹可以与第二组语音命令相关联。第一组语音命令和第二组语音命令可以是不同的,使得第二组中不存在第一组中的至少一个语音命令,或者第一组中不存在第二组中的至少一个语音命令。
在一些示例中,在710处,识别源的控制数据可用于认证远程传输。例如,识别源的控制数据可用于认证由飞行器接收的数据传输,并且可用于认证由与源相关联的传输装置发送的数据传输。在这样的实施方式中,指示数据传输的源的控制数据可以嵌入或以其他方式引入发送到飞行器的数据传输中。控制数据可以包括识别数据传输的源或以其他方式与数据传输的源相关联的源标识符。例如,控制数据可以被包括作为标头(header),标脚(footer),元数据,或者作为被包括在数据传输内或以其他方式与数据传输相关联的任何其他信息。数据传输还可以包括有效载荷,或数据传输的消息或指令。在从与源相关联的传输装置接收到数据传输时,飞行器的计算系统的处理单元至少部分地基于数据传输的源标识符来确定源是否被授权。然后,计算系统可以至少部分地基于源是否被授权来生成控制动作。在一些实施方式中,例如,生成控制动作包括如果源被授权则将有效载荷呈现给飞行器的机组成员。在一些实施方式中可以自动呈现有效载荷。作为另一示例,如果确定源未被授权,则控制动作包括丢弃或忽略数据传输而不将有效载荷呈现给机组成员。
在一些实施方式中,数据传输的控制数据可以包括与数据传输的源相关联的源标识符的密码标识。在这样的实施方式中,至少部分地基于数据传输的源标识符来确定源是否被授权可以包括:解密密码标识以确定与数据传输的源相关联的源标识符;访问包括与多个授权源相关联的多个源标识符的数据库;确定数据传输的源标识符是否和与多个授权源相关联的多个源标识符中的至少一个匹配。
可以使用各种技术来认证远程数据传输的源。例如,可以使用与数据传输相关联的源标识符,时间,位置和其他信息。更具体地,时间戳,三边测量,三角测量,语音失真,听不见的成分等可以用于认证数据传输的源。
图11描绘了可以用于实施根据本公开的示例实施例的方法和系统的示例计算系统1000的框图。计算系统1000是机载计算装置202的一个示例,然而可以使用任何合适的计算系统。计算系统1000可用于实施显示系统204,通信系统206,语音处理系统208,航空电子系统210,飞行管理系统212和/或运载工具控制系统214。然而,应当理解,计算系统1000是用于实施本文描述的计算元件的合适计算系统的一个示例。
如图所示,计算系统1000可以包括一个或多个计算装置1002。一个或多个计算装置1002可以包括一个或多个处理器1004和一个或多个存储器装置1006。一个或多个处理器1004可以包括任何合适的处理装置,例如微处理器,微控制器,集成电路,逻辑装置或其他合适的处理装置。一个或多个存储器装置1006可以包括一个或多个计算机可读介质,包括但不限于非暂时性计算机可读介质,RAM,ROM,硬盘驱动器,闪存驱动器或其他存储器装置。
一个或多个存储器装置1006可以存储可由一个或多个处理器1004访问的信息,包括可以由一个或多个处理器1004执行的计算机可读指令1008。指令1008可以是任何指令集,当其由一个或多个处理器1004执行时,使得一个或多个处理器1004执行操作。指令1008可以是以任何合适的编程语言写入的或者可以用硬件实施的软件。在一些实施例中,指令1008可以由一个或多个处理器1004执行以使得一个或多个处理器1004执行操作,诸如用于控制ADT装置的传输速率的操作,和/或一个或多个计算装置1002的任何其他操作或功能。
存储器装置1006还可以存储可以由处理器1004访问的数据1010。例如,数据1010可以包括传感器数据,例如,如本文所述的发动机参数,模型数据,逻辑数据等。根据本公开的示例实施例,数据1010可以包括一个或多个表格,函数,算法,模型,方程式等。
一个或多个计算装置1002还可以包括用于通信(例如与系统的其他部件通信)的通信接口1012。通信接口1012可以包括用于与一个或多个网络接口的任何合适的部件,包括例如传输器,接收器,端口,控制器,天线或其他合适的部件。
这里讨论的技术参考基于计算机的系统和由基于计算机的系统采取的动作,以及发送到基于计算机的系统的信息和来自基于计算机的系统的信息。本领域普通技术人员将认识到,基于计算机的系统的固有灵活性允许部件之间和部件内的各种可能的构造,组合以及任务和功能的划分。例如,这里讨论的处理可以使用单个计算装置或组合工作的多个计算装置来实施。数据库,存储器,指令和应用程序可以在单个系统上实施,也可以跨多个系统分布。分布式部件可以顺序操作或并行操作。
尽管各种实施例的特定的特征可能在一些附图中示出而在其他附图中未示出,但这仅是为了方便。根据本公开的原理,可以结合任何其他附图的任何特征来参考和/或要求保护附图的任何特征。
该书面描述使用示例来公开所要求保护的主题,包括最佳模式,并且还使本领域任何技术人员能够实践所要求保护的主题,包括制造和使用任何装置或系统以及执行任何结合的方法。所公开技术的可专利范围由权利要求限定,并且可包括本领域技术人员想到的其他示例。如果这些其他示例包括与权利要求的字面语言没有不同的结构元件,或者如果它们包括与权利要求的字面语言无实质差别的等效结构元件,则这些其他示例意图落入权利要求的范围内。
本发明的各个方面和实施例由以下编号的条项限定:
1.一种计算机实施的方法,包括:
在包括位于运载工具中的一个或多个处理器的计算系统处,接收来自位于运载工具中的一个或多个音频传感器的语音数据;
通过计算系统,至少部分地基于与运载工具相关联的性能数据来确定用于运载工具的语音处理系统的参考声纹的构造是否被授权;
响应于确定参考声纹的构造被授权,通过计算系统,存储基于语音数据的第一参考声纹;和
通过计算系统,构造语音处理系统,以基于第一参考声纹认证用于第一组语音命令的语音数据。
2.根据条项1所述的计算机实施的方法,其中第一组语音命令与运载工具的一个或多个控制相关联。
3.根据任何前述条项所述的计算机实施的方法,其中:
语音处理系统包括语音认证单元;和
构造语音处理系统包括将语音认证单元构造成认证用于第一组语音命令的语音数据。
4.根据任何前述条项所述的计算机实施的方法,其中确定用于语音处理系统的参考声纹的构造是否被授权包括至少部分地基于性能数据确定运载工具是否处于可靠操作状态。
5.根据任何前述条项所述的计算机实施的方法,其中通过计算系统,确定用于运载工具的语音认证单元的参考声纹的构造是否被授权包括确定是否已接收到确认运载工具的可靠操作状态的多个输入。
6.根据任何前述条项所述的计算机实施的方法,其中:
性能数据包括位置数据;和
确定用于运载工具的语音处理系统的参考声纹的构造是否被授权包括确定运载工具的位置是否对应于一个或多个位置,该一个或多个位置被授权用于用于语音处理系统的参考声纹的构造。
7.根据任何前述条项所述的计算机实施的方法,其中:
运载工具是飞行器
确定用于飞行器的语音处理系统的参考声纹的构造是否被授权包括确定飞行器是否处于第一飞行的推出阶段;
接收语音数据包括从一个或多个音频传感器接收语音数据,用于在推出阶段期间从飞行器进行空中交通控制通信;
参考声纹是临时参考声纹;和
构造语音处理系统包括将语音处理系统构造成在第一飞行期间基于参考声纹认证语音数据,以及将语音处理系统构造成在至少一次后续飞行期间禁用基于参考声纹的语音数据的认证。
8.根据任何前述条项所述的计算机实施的方法,其中确定用于运载工具的语音处理系统的参考声纹的构造是否被授权包括:
使用一个或多个音频传感器定位运载工具内的参考语音数据的源;和
确定源是否与运载工具的一个或多个授权的位置相关联。
9.根据任何前述条项所述的计算机实施的方法,还包括:
在基于第一参考声纹构造语音处理系统之后,响应于与第一参考声纹或附加的生物特征输入相关联的切换命令来构造语音处理系统。
10.根据任何前述条项所述的计算机实施的方法,其中确定用于运载工具的语音处理系统的参考声纹的构造是否被授权包括:
基于与生物特征数据的比较来认证来自一个或多个音频传感器的语音数据,该认证基于生物特征数据的源和参考语音数据的源的接近度。
11.根据任何前述条项所述的计算机实施的方法,还包括:
通过计算系统,接收第一输入语音数据;和
通过计算系统,基于将第一输入语音数据与参考声纹进行比较,选择性地授权由运载工具的语音处理系统执行该组语音命令中的一个或多个语音命令。
12.根据任何前述条项所述的计算机实施的方法,还包括:
通过计算系统,经由无线连接接收第二输入语音数据;
识别第二输入语音数据中的一个或多个语音命令;
确定第二输入语音数据中的一个或多个语音命令是否包括在一组预授权的远程语音命令中;和
至少部分地基于在该组预授权的远程语音命令中包括一个或多个语音命令,授权由语音处理系统执行一个或多个语音命令。
13.根据任何前述条项所述的计算机实施的方法,还包括:
响应于确定参考声纹的构造被授权,通过计算系统,基于参考语音数据生成参考声纹。
14.根据任何前述条项所述的计算机实施的方法,其中运载工具是飞行器,计算机实施的方法还包括:
接收包括与解锁飞行器的驾驶舱门相关联的第一语音命令的第一语音数据,该第一语音数据从飞行器的驾驶舱外部的第一传感器接收;
基于参考声纹认证第一语音数据;
确定驾驶舱内部的输入与锁定驾驶舱门相关联;和
如果第一语音数据被认证用于第一语音命令,则基于第一语音数据覆盖驾驶舱内部的输入。
15.一种系统,包括:
一个或多个音频传感器,其位于运载工具中并构造为生成语音数据;和
一个或多个处理器,其构造为:
从位于运载工具中的一个或多个音频传感器接收语音数据;
至少部分地基于与运载工具相关联的性能数据来确定用于运载工具的语音处理系统的参考声纹的构造是否被授权;
响应于确定参考声纹的构造被授权,存储基于语音数据的第一参考声纹;和
将语音处理系统构造成基于参考声纹认证用于第一组语音命令的语音数据。
16.根据任何前述条项所述的系统,其中确定用于运载工具的语音处理系统的参考声纹的构造是否被授权包括:
确定飞行器的位置是否对应于一个或多个位置,该一个或多个位置被授权用于用于语音处理系统的参考声纹的构造。
17.根据任何前述条项所述的系统,其中:
运载工具是飞行器;
确定用于飞行器的语音处理系统的参考声纹的构造是否被授权包括确定飞行器是否处于第一飞行的推出阶段;
接收语音数据包括在推出阶段期间从一个或多个音频传感器接收语音数据,该语音数据与从飞行器进行的空中交通控制通信相关联;
参考声纹是临时参考声纹;并且
构造语音处理系统包括将语音处理系统构造成在第一飞行期间基于参考声纹认证语音数据,以及将语音处理系统构造成在至少一次后续飞行期间禁用基于参考声纹的语音数据的认证。
18.根据任何前述条项所述的系统,其中确定用于运载工具的语音处理系统的参考声纹的构造是否被授权包括:
使用一个或多个传感器定位运载工具内的语音数据的源;和
确定源是否与运载工具内的一个或多个授权的位置相关联。
19.一种存储计算机指令的非暂时性计算机可读介质,当该指令由一个或多个处理器执行时,使得一个或多个处理器执行操作,该操作包括:
从运载工具的一个或多个传感器接收包括本地生成的语音命令的第一语音数据;
将本地生成的语音命令与第一组授权命令进行比较;
将第一语音数据与一个或多个参考声纹进行比较;
至少部分地基于与一个或多个参考声纹中的至少一个相对应的第一语音数据和与第一组授权命令相对应的本地生成的语音命令,来授权本地生成的语音命令用于执行;
利用运载工具的无线接口接收包括远程生成的语音命令的第二语音数据;
将远程生成的语音命令与第二组授权命令进行比较;和
至少部分地基于与第二组授权命令相对应的远程生成的语音命令来授权远程生成的语音命令。
20.根据任何前述条项所述的非暂时性计算机可读介质,其中:
基于预授权声纹的数据库或者认证远程生成的语音命令的源中的至少一个来认证远程生成的语音命令。
21.一种计算机实施的方法,包括:
在包括位于运载工具中的一个或多个处理器的计算系统处,接收来自位于运载工具中的一个或多个传感器的传感器数据;
在计算系统处,至少部分地基于与运载工具相关联的性能数据来确定用于运载工具的控制处理系统的参考生物特征的构造是否被授权;
响应于确定参考生物特征的构造被授权,基于参考生物特征数据存储第一参考生物特征;和
将控制处理系统构造成基于参考生物特征来认证第一组控制命令的输入。
本发明的各种特征,方面和优点也可以体现在以下条项中描述的各种技术方案中,这些方案可以以任何组合方式组合:
1.一种计算机实施方法,其特征在于,包括:
(502)在包括位于运载工具中的一个或多个处理器的计算系统处,接收来自位于运载工具中的一个或多个音频传感器的语音数据;
(504)通过所述计算系统,至少部分地基于与所述运载工具相关联的性能数据,来确定用于所述运载工具的语音处理系统的参考声纹的构造是否被授权;
(508)响应于确定所述参考声纹的构造被授权,通过所述计算系统,存储基于所述语音数据的第一参考声纹;和
(510)通过所述计算系统,将所述语音处理系统构造成基于所述第一参考声纹来认证用于第一组语音命令的语音数据。
2.根据条项1所述的计算机实施方法,其特征在于,其中,所述第一组语音命令与所述运载工具的一个或多个控制相关联。
3.根据任何前述条项所述的计算机实施方法,其特征在于,其中:
所述语音处理系统包括语音认证单元(256);并且
构造所述语音处理系统包括:将所述语音认证单元构造成认证用于所述第一组语音命令的所述语音数据。
4.根据任何前述条项所述的计算机实施方法,其特征在于,其中,确定用于所述语音处理系统的参考声纹的构造是否被授权包括:(554)至少部分地基于所述性能数据来确定所述运载工具是否处于可靠操作状态。
5.根据条项4所述的计算机实施方法,其特征在于,其中,通过所述计算系统,确定用于所述运载工具的语音认证单元的参考声纹的构造是否被授权包括:确定是否已经接收到确认所述运载工具的所述可靠操作状态的多个输入。
6.根据任何前述条项所述的计算机实施方法,其特征在于,其中:
所述性能数据包括位置数据;和
确定用于所述运载工具的所语音处理系统的参考声纹的构造是否被授权包括:确定所述运载工具的位置是否对应于一个或多个位置,所述一个或多个位置被授权用于所述语音处理系统的参考声纹的构造。
7.根据任何前述条项所述的计算机实施方法,其特征在于,其中:
所述运载工具是飞行器;
确定用于所述飞行器的所述语音处理系统的参考声纹的构造是否被授权包括:确定所述飞行器是否处于第一飞行的推出阶段;
接收语音数据包括从所述一个或多个音频传感器接收语音数据,用于在所述推出阶段期间从所述飞行器进行空中交通控制通信;
所述参考声纹是临时参考声纹;并且
构造所述语音处理系统包括:将所述语音处理系统构造成在所述第一飞行期间基于所述参考声纹认证语音数据,以及将所述语音处理系统构造成在至少一次后续飞行期间禁用基于所述参考声纹的语音数据的认证。
8.根据任何前述条项所述的计算机实施方法,其特征在于,其中,确定用于所述运载工具的所述语音处理系统的所述参考声纹的构造是否被授权包括:
(562)使用所述一个或多个音频传感器定位所述运载工具内的所述参考语音数据的源;和
(564)确定所述源是否与所述运载工具的一个或多个授权位置相关联。
9.根据任何前述条项所述的计算机实施方法,其特征在于,进一步包括:
在基于所述第一参考声纹构造所述语音处理系统之后,响应于与所述第一参考声纹或附加的生物特征输入相关联的切换命令来构造所述语音处理系统。
10.根据任何前述条项所述的计算机实施方法,其特征在于,其中确定用于所述运载工具的所述语音处理系统的所述参考声纹的构造是否被授权包括:
基于与生物特征数据的比较来认证来自所述一个或多个音频传感器的语音数据,所述认证基于所述生物特征数据的源和所述参考语音数据的源的接近度。
11.根据任何前述条项所述的计算机实施方法,其特征在于,进一步包括:
(602)通过所述计算系统,接收第一输入语音数据;和
(610)通过所述计算系统,基于将所述第一输入语音数据与所述参考声纹进行比较,选择性地授权由所述运载工具的所述语音处理系统执行所述一组语音命令中的一个或多个所述语音命令。
12.根据条项11所述的计算机实施方法,其特征在于,进一步包括:
通过所述计算系统,经由无线连接接收第二输入语音数据;
识别所述第二输入语音数据中的一个或多个语音命令;
(708)确定所述第二输入语音数据中的所述一个或多个语音命令是否被包括在一组预授权的远程语音命令中;和
(714)至少部分地基于在所述一组预授权的远程语音命令中包括所述一个或多个语音命令,来授权由所述语音处理系统执行的所述一个或多个语音命令。
13.根据任何前述条项所述的计算机实施方法,其特征在于,进一步包括:
响应于确定所述参考声纹的构造被授权,通过所述计算系统,基于所述参考语音数据来生成所述参考声纹。
14.根据任何前述条项所述的计算机实施方法,其特征在于,其中所述运载工具是飞行器,所述计算机实施方法进一步包括:
(654)接收第一语音数据,所述第一语音数据包括与解锁所述飞行器的驾驶舱门相关联的第一语音命令,所述第一语音数据从所述飞行器的驾驶舱外部的第一传感器接收;
(656)基于所述参考声纹认证所述第一语音数据;
(662)确定所述驾驶舱内部的输入与锁定所述驾驶舱门相关联;和
(664)如果所述第一语音数据被认证用于所述第一语音命令,则基于所述第一语音数据覆盖所述驾驶舱内部的所述输入。
15.一种系统,其特征在于,包括:
一个或多个音频传感器,所述一个或多个音频传感器位于运载工具中,并且被构造为生成语音数据;和
一个或多个处理器,所述一个或多个处理器被构造为:
(502)从位于所述运载工具中的所述一个或多个音频传感器接收语音数据;
(504)至少部分地基于与所述运载工具相关联的性能数据来确定用于所述运载工具的语音处理系统的参考声纹的构造是否被授权;
(508)响应于确定所述参考声纹的构造被授权,存储基于所述语音数据的第一参考声纹;和
(510)将所述语音处理系统构造成基于所述参考声纹来认证用于第一组语音命令的语音数据。
Claims (10)
1.一种计算机实施方法,其特征在于,包括:
(502)在包括位于运载工具中的一个或多个处理器的计算系统处,接收来自位于运载工具中的一个或多个音频传感器的语音数据;
(504)通过所述计算系统,至少部分地基于与所述运载工具相关联的性能数据,来确定用于所述运载工具的语音处理系统的参考声纹的构造是否被授权;
(508)响应于确定所述参考声纹的构造被授权,通过所述计算系统,存储基于所述语音数据的第一参考声纹;和
(510)通过所述计算系统,将所述语音处理系统构造成基于所述第一参考声纹来认证用于第一组语音命令的语音数据。
2.根据权利要求1所述的计算机实施方法,其特征在于,其中,所述第一组语音命令与所述运载工具的一个或多个控制相关联。
3.根据任何前述权利要求所述的计算机实施方法,其特征在于,其中:
所述语音处理系统包括语音认证单元(256);并且
构造所述语音处理系统包括:将所述语音认证单元构造成认证用于所述第一组语音命令的所述语音数据。
4.根据任何前述权利要求所述的计算机实施方法,其特征在于,其中,确定用于所述语音处理系统的参考声纹的构造是否被授权包括:(554)至少部分地基于所述性能数据来确定所述运载工具是否处于可靠操作状态。
5.根据权利要求4所述的计算机实施方法,其特征在于,其中,通过所述计算系统,确定用于所述运载工具的语音认证单元的参考声纹的构造是否被授权包括:确定是否已经接收到确认所述运载工具的所述可靠操作状态的多个输入。
6.根据任何前述权利要求所述的计算机实施方法,其特征在于,其中:
所述性能数据包括位置数据;和
确定用于所述运载工具的所语音处理系统的参考声纹的构造是否被授权包括:确定所述运载工具的位置是否对应于一个或多个位置,所述一个或多个位置被授权用于所述语音处理系统的参考声纹的构造。
7.根据任何前述权利要求所述的计算机实施方法,其特征在于,其中:
所述运载工具是飞行器;
确定用于所述飞行器的所述语音处理系统的参考声纹的构造是否被授权包括:确定所述飞行器是否处于第一飞行的推出阶段;
接收语音数据包括从所述一个或多个音频传感器接收语音数据,用于在所述推出阶段期间从所述飞行器进行空中交通控制通信;
所述参考声纹是临时参考声纹;并且
构造所述语音处理系统包括:将所述语音处理系统构造成在所述第一飞行期间基于所述参考声纹认证语音数据,以及将所述语音处理系统构造成在至少一次后续飞行期间禁用基于所述参考声纹的语音数据的认证。
8.根据任何前述权利要求所述的计算机实施方法,其特征在于,其中,确定用于所述运载工具的所述语音处理系统的所述参考声纹的构造是否被授权包括:
(562)使用所述一个或多个音频传感器定位所述运载工具内的所述参考语音数据的源;和
(564)确定所述源是否与所述运载工具的一个或多个授权位置相关联。
9.根据任何前述权利要求所述的计算机实施方法,其特征在于,进一步包括:
在基于所述第一参考声纹构造所述语音处理系统之后,响应于与所述第一参考声纹或附加的生物特征输入相关联的切换命令来构造所述语音处理系统。
10.根据任何前述权利要求所述的计算机实施方法,其特征在于,其中确定用于所述运载工具的所述语音处理系统的所述参考声纹的构造是否被授权包括:
基于与生物特征数据的比较来认证来自所述一个或多个音频传感器的语音数据,所述认证基于所述生物特征数据的源和所述参考语音数据的源的接近度。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP18175563.8 | 2018-06-01 | ||
EP18175563.8A EP3575202A1 (en) | 2018-06-01 | 2018-06-01 | Systems and methods for secure commands in vehicles |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110555295A true CN110555295A (zh) | 2019-12-10 |
CN110555295B CN110555295B (zh) | 2022-06-07 |
Family
ID=62630927
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910476771.0A Active CN110555295B (zh) | 2018-06-01 | 2019-06-03 | 用于运载工具中的可靠命令的系统和方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10957330B2 (zh) |
EP (1) | EP3575202A1 (zh) |
CN (1) | CN110555295B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114120980A (zh) * | 2021-10-21 | 2022-03-01 | 北京电子工程总体研究所 | 一种显控台操控系统和方法 |
CN115933501A (zh) * | 2023-01-05 | 2023-04-07 | 东方空间技术(山东)有限公司 | 一种火箭控制软件的操作控制方法、装置及设备 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11079757B1 (en) * | 2017-11-20 | 2021-08-03 | Amazon Technologies, Inc. | Unmanned aerial vehicles to survey locations and collect data about different signal sources |
US11267555B2 (en) * | 2018-01-08 | 2022-03-08 | GEOSAT Aerospace & Technology | Methods and unmanned aerial vehicles for longer duration flights |
EP3576367A1 (en) * | 2018-06-01 | 2019-12-04 | GE Aviation Systems Limited | Systems and methods for authenticating data transmissions to vehicles |
US10929097B2 (en) * | 2018-06-26 | 2021-02-23 | ROVl GUIDES, INC. | Systems and methods for switching operational modes based on audio triggers |
JP7017643B2 (ja) * | 2018-12-03 | 2022-02-08 | グーグル エルエルシー | テキスト非依存話者認識 |
US11393349B2 (en) * | 2020-03-17 | 2022-07-19 | The Boeing Company | Air traffic control (ATC) radio communications authentication |
CN113393836B (zh) * | 2021-06-08 | 2023-09-12 | 成都傅立叶电子科技有限公司 | 一种机载电台语音识别控制方法及系统 |
US11919622B1 (en) | 2022-08-22 | 2024-03-05 | BETA Technologies, Inc. | Cockpit assembly and a method for adjusting a cockpit |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030191639A1 (en) * | 2002-04-05 | 2003-10-09 | Sam Mazza | Dynamic and adaptive selection of vocabulary and acoustic models based on a call context for speech recognition |
US20030193409A1 (en) * | 2001-10-10 | 2003-10-16 | Crank Kelly C. | Method and apparatus for tracking aircraft and securing against unauthorized access |
US20040078118A1 (en) * | 2000-12-15 | 2004-04-22 | Jurgen Binder | Method and device for monitoring equipment |
EP2405422A1 (en) * | 2010-07-08 | 2012-01-11 | Honeywell International, Inc. | Speech recognition and voice training data storage and access method and apparatus |
US20130195285A1 (en) * | 2012-01-30 | 2013-08-01 | International Business Machines Corporation | Zone based presence determination via voiceprint location awareness |
CN106463116A (zh) * | 2014-06-11 | 2017-02-22 | 霍尼韦尔国际公司 | 使用语音作为控制机制的工厂控制系统 |
US20170053645A1 (en) * | 2015-08-22 | 2017-02-23 | Toyota Motor Engineering & Manufacturing North America, Inc. | Speech recognition system with abbreviated training |
CN106919657A (zh) * | 2017-02-07 | 2017-07-04 | 上海斐讯数据通信技术有限公司 | 一种在线值机自动推选座位的方法及装置 |
CN107004079A (zh) * | 2014-12-12 | 2017-08-01 | 高通股份有限公司 | 共享声学空间中的识别和验证 |
CN107615358A (zh) * | 2015-03-31 | 2018-01-19 | 深圳市大疆创新科技有限公司 | 用于标识经授权的参与者的认证系统和方法 |
CN107850894A (zh) * | 2015-07-14 | 2018-03-27 | 高通股份有限公司 | 用于无人驾驶自主式系统的控制规范化 |
CN107901915A (zh) * | 2017-11-24 | 2018-04-13 | 重庆长安汽车股份有限公司 | 基于语音控制的车辆驾驶自动化系统及方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6882288B2 (en) | 2001-09-19 | 2005-04-19 | Adolf Weigl | Aircraft security system to prevent manual flight operation by unauthorized individuals |
WO2003029048A2 (en) | 2001-10-03 | 2003-04-10 | Snyder Douglas D | Pilot authentication using voice biometric |
US20030068044A1 (en) | 2001-10-06 | 2003-04-10 | Nikolsky Mark E. | Pilot authentication system |
US7024023B2 (en) | 2003-06-26 | 2006-04-04 | Michael Arnouse | Apparatus, system and method for aircraft security |
US7783081B2 (en) | 2005-03-29 | 2010-08-24 | Airbus | Method and device for verification of identity aboard an aircraft |
US7912592B2 (en) | 2006-06-09 | 2011-03-22 | Garmin International, Inc. | Automatic speech recognition system and method for aircraft |
US20140309876A1 (en) * | 2013-04-15 | 2014-10-16 | Flextronics Ap, Llc | Universal vehicle voice command system |
US9550578B2 (en) | 2014-02-04 | 2017-01-24 | Honeywell International Inc. | Systems and methods for utilizing voice commands onboard an aircraft |
US9824689B1 (en) | 2015-12-07 | 2017-11-21 | Rockwell Collins Inc. | Speech recognition for avionic systems |
CN107458383B (zh) * | 2016-06-03 | 2020-07-10 | 法拉第未来公司 | 使用音频信号的车辆故障自动检测 |
-
2018
- 2018-06-01 EP EP18175563.8A patent/EP3575202A1/en active Pending
-
2019
- 2019-05-31 US US16/428,597 patent/US10957330B2/en active Active
- 2019-06-03 CN CN201910476771.0A patent/CN110555295B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040078118A1 (en) * | 2000-12-15 | 2004-04-22 | Jurgen Binder | Method and device for monitoring equipment |
US20030193409A1 (en) * | 2001-10-10 | 2003-10-16 | Crank Kelly C. | Method and apparatus for tracking aircraft and securing against unauthorized access |
US20030191639A1 (en) * | 2002-04-05 | 2003-10-09 | Sam Mazza | Dynamic and adaptive selection of vocabulary and acoustic models based on a call context for speech recognition |
EP2405422A1 (en) * | 2010-07-08 | 2012-01-11 | Honeywell International, Inc. | Speech recognition and voice training data storage and access method and apparatus |
US20130195285A1 (en) * | 2012-01-30 | 2013-08-01 | International Business Machines Corporation | Zone based presence determination via voiceprint location awareness |
CN106463116A (zh) * | 2014-06-11 | 2017-02-22 | 霍尼韦尔国际公司 | 使用语音作为控制机制的工厂控制系统 |
CN107004079A (zh) * | 2014-12-12 | 2017-08-01 | 高通股份有限公司 | 共享声学空间中的识别和验证 |
CN107615358A (zh) * | 2015-03-31 | 2018-01-19 | 深圳市大疆创新科技有限公司 | 用于标识经授权的参与者的认证系统和方法 |
CN107850894A (zh) * | 2015-07-14 | 2018-03-27 | 高通股份有限公司 | 用于无人驾驶自主式系统的控制规范化 |
US20170053645A1 (en) * | 2015-08-22 | 2017-02-23 | Toyota Motor Engineering & Manufacturing North America, Inc. | Speech recognition system with abbreviated training |
CN106919657A (zh) * | 2017-02-07 | 2017-07-04 | 上海斐讯数据通信技术有限公司 | 一种在线值机自动推选座位的方法及装置 |
CN107901915A (zh) * | 2017-11-24 | 2018-04-13 | 重庆长安汽车股份有限公司 | 基于语音控制的车辆驾驶自动化系统及方法 |
Non-Patent Citations (2)
Title |
---|
于娴: "声纹识别在微信中的模式匹配研究", 《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》 * |
王冲: "无人机语音指令控制系统技术研究", 《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114120980A (zh) * | 2021-10-21 | 2022-03-01 | 北京电子工程总体研究所 | 一种显控台操控系统和方法 |
CN115933501A (zh) * | 2023-01-05 | 2023-04-07 | 东方空间技术(山东)有限公司 | 一种火箭控制软件的操作控制方法、装置及设备 |
Also Published As
Publication number | Publication date |
---|---|
US10957330B2 (en) | 2021-03-23 |
US20190371341A1 (en) | 2019-12-05 |
CN110555295B (zh) | 2022-06-07 |
EP3575202A1 (en) | 2019-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110555295B (zh) | 用于运载工具中的可靠命令的系统和方法 | |
US20190188508A1 (en) | Different levels of access to aircraft based on biometric input data | |
EP3323027B1 (en) | Control normalization for unmanned autonomous systems | |
US20240291817A1 (en) | Systems and methods for authenticating data transmissions to vehicles | |
US7568662B1 (en) | Emergency flight control system | |
US8370157B2 (en) | Aircraft speech recognition and voice training data storage and retrieval methods and apparatus | |
EP3196814A1 (en) | Virtual aircraft operations checklist | |
CN107444621A (zh) | 短中断起飞系统和方法 | |
WO2006068962A2 (en) | Apparatus, system and method for aircraft security and anti-hijacking intervention | |
EP3079137A2 (en) | Voice router | |
US10040573B2 (en) | System and method for aircraft incident mitigation | |
US20240199224A1 (en) | Movable vehicle control interface | |
EP3343518B1 (en) | Method to activate avionics functions remotely | |
CN117897667A (zh) | 先进的飞行处理系统和/或方法 | |
EP4098566B1 (en) | System and method to detect authorized user | |
CN105955296A (zh) | 飞行器一键返航的方法 | |
WO2003045782A1 (en) | Emergency flight control system | |
CN110620756A (zh) | 用于飞行器的通信系统和方法 | |
US11584544B2 (en) | Cockpit access security system | |
US10589873B1 (en) | Stratified aircraft access | |
US20240248481A1 (en) | System and method for aircraft configuration checking | |
GB2383431A (en) | Method of and security means for operating an aircraft | |
Miller et al. | Shipboard mission training effectiveness of the Naval Air Warfare Center's V-22 Government Test Pilot Trainer | |
GB2568719A (en) | Method and system for selecting and displaying an operating protocol for an aerial vehicle | |
UA62506A (en) | Method for air navigation with prevention of non-authorized access to operational control in extreme cases |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |